pyspark.RDD.leftOuterJoin¶
-
抽樣。
leftOuterJoin
( 其他:pyspark.rdd.RDD(元組(K,U]],numPartitions:可選(int]=沒有一個 )→pyspark.rdd.RDD(元組(K,元組(V,可選(U] ] ] ] ¶ -
執行左外連接自我和其他。
為每個元素(k、v)自我,由此產生的抽樣要麼包含所有雙(k, v, w) w其他或兩人(k, (v,)如果沒有元素其他有關鍵的k。
Hash-partitions結果抽樣為給定數量的分區。
例子
> > >x=sc。並行化(((“一個”,1),(“b”,4)))> > >y=sc。並行化(((“一個”,2)))> > >排序(x。leftOuterJoin(y)。收集())[(a (1、2)), (“b”,(沒有)))