pyspark.RDD.coalesce¶

抽樣。 合並 ( numPartitions:int,洗牌:bool=假 )→pyspark.rdd.RDD(T] ¶

返回一個新的抽樣降低numPartitions分區。

例子

           > > >sc。並行化([1,2,3,4,5),3)。偷()。收集()[[1],[2、3],[4,5]]> > >sc。並行化([1,2,3,4,5),3)。合並(1)。偷()。收集()[[1、2、3、4、5]]
          

以前的

pyspark.RDD.cleanShuffleDependencies

下一個

pyspark.RDD.cogroup