pyspark.RDD.fold

抽樣。 褶皺 ( zeroValue:T,人事處:可調用的((T,T],T] )→T

聚合每個分區的元素,然後所有的分區結果,使用給定的關聯函數和一個中立的“零價值。”

這個函數op (t1,t2)允許修改t1並返回它的結果值,以避免對象分配;然而,它不應該修改t2

這行為有點不同折疊操作實現運作在函數語言像Scala集合。這種折疊操作可能適用於單獨分區,然後折疊這些結果為最終結果,而不是對每個元素應用折疊在一些定義的排序順序。函數不交換,結果可能不同於褶皺應用於運作的集合。

例子

> > >操作符進口添加> > >sc並行化([1,2,3,4,5])褶皺(0,添加)15