pyspark.RDD.countByValue

抽樣。 countByValue ( )→Dict類型(K,int]

返回每個獨特的計算值在這個抽樣的字典(價值,計數)對。

例子

> > >排序(sc並行化([1,2,1,2,2),2)countByValue()項目())[(1、2),(2,3)]