※ 引述《iwantstronge (...)》之銘言:
: 版友們好~
: 最近剛學Scala, 有個問題卡了很久
: 當我把檔案用RDD讀進來:
: val input = sc.textfile("myfile.txt")
: 接著逐行讀取這個檔案(RDD),
: 在裡面用一個容器(HashMap, Array, List之類的)儲存每一行的一些資訊
input.map(line => (line, 1)).reduceByKey(_ + _).collect
回傳是一個tuple array 自己再轉回HashMap
更簡單的是
input.distinct().collect