抽樣。
zipWithIndex
拉鏈這抽樣元素指標。
首先基於分區索引排序,然後每個分區內商品的訂購。第一項在第一個分區索引0,和在過去的最後一項分區收到最大的指數。
這種方法需要觸發火花工作當這個抽樣包含不止一個分區。
例子
> > >sc。並行化([“一個”,“b”,“c”,“d”),3)。zipWithIndex()。收集()[(' a ', 0)、(' b ', 1), (' c ', 2), (' d ', 3)]
以前的
pyspark.RDD.zip
下一個
pyspark.RDD.zipWithUniqueId