pyspark.RDD.rightOuterJoin¶
-
抽樣。
rightOuterJoin
( 其他:pyspark.rdd.RDD(元組(K,U]],numPartitions:可選(int]=沒有一個 )→pyspark.rdd.RDD(元組(K,元組(可選(V] ,U] ] ] ¶ -
執行一個右外連接自我和其他。
為每個元素(k, w)其他,由此產生的抽樣要麼包含所有雙(k, v, w) v在這方麵,或者是對(k, w)如果沒有元素自我有關鍵的k。
Hash-partitions結果抽樣為給定數量的分區。
例子
> > >x=sc。並行化(((“一個”,1),(“b”,4)))> > >y=sc。並行化(((“一個”,2)))> > >排序(y。rightOuterJoin(x)。收集())[(a, (2, 1)), (" b ",(沒有,4)))