pyspark.RDD.leftOuterJoin

抽樣。 leftOuterJoin ( 其他:pyspark.rdd.RDD(元組(K,U]],numPartitions:可選(int]=沒有一個 )→pyspark.rdd.RDD(元組(K,元組(V,可選(U] ] ] ]

執行左外連接自我其他

為每個元素(k、v)自我,由此產生的抽樣要麼包含所有雙(k, v, w) w其他或兩人(k, (v,)如果沒有元素其他有關鍵的k。

Hash-partitions結果抽樣為給定數量的分區。

例子

> > >x=sc並行化(((“一個”,1),(“b”,4)))> > >y=sc並行化(((“一個”,2)))> > >排序(xleftOuterJoin(y)收集())[(a (1、2)), (“b”,(沒有)))