pyspark.RDD.mapValues

抽樣。 mapValues ( f:可調用的((V],U] )→pyspark.rdd.RDD(元組(K,U] ]

通過每個值的鍵-值對抽樣通過映射函數不改變的關鍵;這也保留原抽樣的分區。

例子

> > >x=sc並行化(((“一個”,(“蘋果”,“香蕉”,“檸檬”]),(“b”,(“葡萄”))))> > >deff(x):返回len(x)> > >xmapValues(f)收集()[(a, 3), (' b ', 1))