pyspark.RDD.partitionBy

抽樣。 partitionBy ( partitionFunc numPartitions:可選(int):可調用的[[K], int] = <函數portable_hash > )→pyspark.rdd.RDD(元組(K,V] ]

返回一個抽樣分區使用指定的分區的副本。

例子

> > >=sc並行化([1,2,3,4,2,4,1])地圖(λx:(x,x))> > >=partitionBy(2)()收集()> > >len(((0])十字路口(((1))))0