Map과 FlatMap은 문자열과 같은 것들을 분리하는 역할을 한다. 각 차이점에 대해서 알아보자.


Map Function

split 하면 list of list로 반환한다. 그래서 접근하기가 까다롭다.




flatMap

split시에 list로 반환 하기때문에 접근하기 쉽다.


text = sc.textFile("short")

wc = text.flatMap(lambda line : line.split()).map(lambda word : (word.1)).reduceByKey(lamdba c1, c2 : c1+c2)

wc.collect()



'Hadoop ecosystem > Spark' 카테고리의 다른 글

Actions function  (0) 2017.05.11
Transformations function  (0) 2017.05.11
ReduceByKey vs. GroupByKey  (0) 2017.05.11
RDD(Resilient Distributed DataSet)  (0) 2017.05.10

+ Recent posts