Hadoop ecosystem/Spark

Map vs. flatMap

snoohey 2017. 5. 11. 10:17

Map과 FlatMap은 문자열과 같은 것들을 분리하는 역할을 한다. 각 차이점에 대해서 알아보자.


Map Function

split 하면 list of list로 반환한다. 그래서 접근하기가 까다롭다.




flatMap

split시에 list로 반환 하기때문에 접근하기 쉽다.


text = sc.textFile("short")

wc = text.flatMap(lambda line : line.split()).map(lambda word : (word.1)).reduceByKey(lamdba c1, c2 : c1+c2)

wc.collect()