pyspark.RDD.keyBy

抽樣。 keyBy ( f:可調用的((T],K] )→pyspark.rdd.RDD(元組(K,T] ]

創建元組元素在這個抽樣的應用f

例子

> > >x=sc並行化(範圍(0,3))keyBy(λx:x*x)> > >y=sc並行化(郵政編碼(範圍(0,5),範圍(0,5)))> > >((x,列表(地圖(列表,y)))x,y排序(xcogroup(y)收集()))((0,[[0],[0]]),(1,[[1],[1]]),(2,[[],[2]]),(3)[[],[3]]),(4)[[2]、[4]]))