抽樣。
mapValues
通過每個值的鍵-值對抽樣通過映射函數不改變的關鍵;這也保留原抽樣的分區。
例子
> > >x=sc。並行化(((“一個”,(“蘋果”,“香蕉”,“檸檬”]),(“b”,(“葡萄”))))> > >deff(x):返回len(x)> > >x。mapValues(f)。收集()[(a, 3), (' b ', 1))
以前的
pyspark.RDD.mapPartitionsWithSplit
下一個
pyspark.RDD.max