pyspark.RDD.distinct

抽樣。 截然不同的 ( numPartitions:可選(int]=沒有一個 )→pyspark.rdd.RDD(T]

返回一個新的包含不同的元素在這個抽樣的抽樣。

例子

> > >排序(sc並行化([1,1,2,3])截然不同的()收集())(1、2、3)