pyspark.RDD.map

抽樣。 地圖 ( f:可調用的((T],U],preservesPartitioning:bool= )→pyspark.rdd.RDD(U]

通過應用一個函數返回一個新的抽樣,抽樣的每個元素。

例子

> > >抽樣=sc並行化([“b”,“一個”,“c”])> > >排序(抽樣地圖(λx:(x,1))收集())[(' a ', 1), (' b ', 1), (' c ', 1)]