pyspark.RDD.subtract

抽樣。 減去 ( 其他:pyspark.rdd.RDD(T],numPartitions:可選(int]=沒有一個 )→pyspark.rdd.RDD(T]

返回每個值自我這不是包含在其他

例子

> > >x=sc並行化(((“一個”,1),(“b”,4),(“b”,5),(“一個”,3)))> > >y=sc並行化(((“一個”,3),(“c”,沒有一個)))> > >排序(x減去(y)收集())[(' a ', 1), (" b ", 4), (' b ', 5)]