pyspark.RDD.flatMap

抽樣。 flatMap ( f:可調用的((T],Iterable(U]],preservesPartitioning:bool= )→pyspark.rdd.RDD(U]

返回一個新的抽樣,首先將一個函數應用於所有元素的抽樣,然後壓扁的結果。

例子

> > >抽樣=sc並行化([2,3,4])> > >排序(抽樣flatMap(λx:範圍(1,x))收集())(1,1,1,2,2,3]> > >排序(抽樣flatMap(λx:((x,x),(x,x)))收集())[(2,2),(2,2),(3),(3),(4,4),(4,4)]