pyspark.RDD.groupWith¶
-
抽樣。
groupWith
( 其他:pyspark.rdd.RDD(元組(任何,任何]],*其他人:pyspark.rdd.RDD(元組(任何,任何]] )→pyspark.rdd。抽樣(元組(Tuple (pyspark.resultiterable。ResultIterable(任何)…]]]¶ -
別名cogroup但支持多種抽樣。
例子
> > >w=sc。並行化(((“一個”,5),(“b”,6)))> > >x=sc。並行化(((“一個”,1),(“b”,4)))> > >y=sc。並行化(((“一個”,2)))> > >z=sc。並行化(((“b”,42)))> > >((x,元組(地圖(列表,y)))為x,y在排序(列表(w。groupWith(x,y,z)。收集())))[(a, ([5], [1], [2], [])), (“b”, ([6]、[4]、[], [42])))