pyspark.RDD.coalesce

抽樣。 合並 ( numPartitions:int,洗牌:bool= )→pyspark.rdd.RDD(T]

返回一個新的抽樣降低numPartitions分區。

例子

> > >sc並行化([1,2,3,4,5),3)()收集()[[1],[2、3],[4,5]]> > >sc並行化([1,2,3,4,5),3)合並(1)()收集()[[1、2、3、4、5]]