pyspark.pandas.DataFrame.unstack

DataFrame。 unstack ( )→聯盟(DataFrame,係列]

主(一定層次)索引標簽。

返回一個DataFrame擁有一個新級別的列標簽最隱秘的級別由轉動的索引標簽。

如果該指數不是MultiIndex,輸出將會是一個係列。

請注意

如果索引是MultiIndex,輸出DataFrame可能非常寬,它可能導致嚴重的性能下降以來引發基於分區就行。

返回
係列或DataFrame

另請參閱

DataFrame.pivot

Pivot表基於列值。

DataFrame.stack

主的水平列標簽(從unstack逆操作)。

例子

> > >df=psDataFrame({“一個”:{“0”:“一個”,“1”:“b”,“2”:“c”},“B”:{“0”:“1”,“1”:“3”,“2”:“5”},“C”:{“0”:“2”,“1”:“4”,“2”:“6”}},=(“一個”,“B”,“C”])> > >dfA B C0 1 21 b 3 42 c 5 6
> > >dfunstack()sort_index()一個01 b2攝氏度B 0 11 32個5C 0 21 - 42 - 6dtype:對象
> > >df=pdMultiIndexfrom_tuples(((“X”,“一個”),(“X”,“B”),(“Y”,“C”)))> > >dfunstack()sort_index()X 01 b2攝氏度B 0 11 32個5Y C 0 21 - 42 - 6dtype:對象

對於MultiIndex情況:

> > >df=psDataFrame({“一個”:(“一個”,“b”,“c”),“B”:(1,3,5),“C”:(2,4,6)},=(“一個”,“B”,“C”])> > >df=dfset_index(“一個”,附加=真正的)> > >dfB C一個0 1 21 b 3 42 c 5 6> > >dfunstack()sort_index()B CA b c A b c0 1.0 2.0南南南南1南南南南的3.0升至4.0南南南南5.0至6.0點