抽樣。
mapPartitionsWithSplit
返回一個新的抽樣的抽樣函數應用到每個分區,同時跟蹤原始分區的索引。
使用RDD.mapPartitionsWithIndex ()代替。
RDD.mapPartitionsWithIndex ()
例子
> > >抽樣=sc。並行化([1,2,3,4),4)> > >deff(splitIndex,迭代器):收益率splitIndex> > >抽樣。mapPartitionsWithSplit(f)。總和()6
以前的
pyspark.RDD.mapPartitionsWithIndex
下一個
pyspark.RDD.mapValues