pyspark.pandas.MultiIndex.symmetric_difference

MultiIndex。 symmetric_difference ( 其他:pyspark.pandas.indexes.base.Index,result_name:可選(列表(聯盟(任何元組[,…]]]]=沒有一個,排序:可選(bool]=沒有一個 )→pyspark.pandas.indexes.multi.MultiIndex

計算兩個MultiIndex對象的對稱差分。

參數
其他 指數或類數組
result_name 列表
排序 真正的或沒有,默認沒有

是否生成的指數。*真實:試圖對結果進行排序。*沒有:不排序結果。

返回
symmetric_difference MiltiIndex

筆記

symmetric_difference包含的元素出現在idx1idx2但不能兩者兼得。相當於創建的索引idx1.difference (idx2)|idx2.difference (idx1)重複了。

例子

> > >midx1=pdMultiIndex([[“喇嘛”,“牛”,“獵鷹”),(“速度”,“重量”,“長度”]],[[0,0,0,1,1,1,2,2,2),(0,0,0,0,1,2,0,1,2]])> > >midx2=pdMultiIndex([[“pandas-on-Spark”,“牛”,“獵鷹”),(“速度”,“重量”,“長度”]],[[0,0,0,1,1,1,2,2,2),(0,0,0,0,1,2,0,1,2]])> > >s1=ps係列([45,200年,1.2,30.,250年,1.5,320年,1,0.3),指數=midx1)> > >s2=ps係列([45,200年,1.2,30.,250年,1.5,320年,1,0.3),指數=midx2)
> > >s1指數symmetric_difference(s2指數)MultiIndex ([(“pandas-on-Spark”、“速度”),(“喇嘛”、“速度”),)

你可以設置結果索引的名稱。

> > >s1指數symmetric_difference(s2指數,result_name=(“一個”,“b”])MultiIndex ([(“pandas-on-Spark”、“速度”),(“喇嘛”、“速度”),名稱= [a, b])

你可以設置真正的,如果你想產生的索引。

> > >s1指數symmetric_difference(s2指數,排序=真正的)MultiIndex ([(“pandas-on-Spark”、“速度”),(“喇嘛”、“速度”),)

您還可以使用^接線員:

> > >s1指數^s2指數MultiIndex ([(“pandas-on-Spark”、“速度”),(“喇嘛”、“速度”),)