pyspark.RDD.countByKey

抽樣。 countByKey ( )→Dict類型(K,int]

計數為每個關鍵元素的個數,並將結果返回給主作為一個字典。

例子

> > >抽樣=sc並行化(((“一個”,1),(“b”,1),(“一個”,1)))> > >排序(抽樣countByKey()項目())[(' a ', 2), (' b ', 1))