pyspark.RDD.foldByKey¶
-
抽樣。
foldByKey
( zeroValue: V, func:調用[V, V, V], numPartitions:可選(int) = None, partitionFunc:可調用的[[K], int] = <函數portable_hash > )→pyspark.rdd.RDD(元組(K,V] ] ¶ -
合並每個鍵使用一個關聯函數的值函數和一個中立的“zeroValue”,可以添加到任意數量的時候,結果並不能改變結果(例如,0,或者1乘法。)。
例子
> > >抽樣=sc。並行化(((“一個”,1),(“b”,1),(“一個”,1)))> > >從操作符進口添加> > >排序(抽樣。foldByKey(0,添加)。收集())[(' a ', 2), (' b ', 1))