pyspark.pandas.DataFrame.unstack¶
-
DataFrame。
unstack
( )→聯盟(DataFrame,係列] ¶ -
主(一定層次)索引標簽。
返回一個DataFrame擁有一個新級別的列標簽最隱秘的級別由轉動的索引標簽。
如果該指數不是MultiIndex,輸出將會是一個係列。
請注意
如果索引是MultiIndex,輸出DataFrame可能非常寬,它可能導致嚴重的性能下降以來引發基於分區就行。
- 返回
-
- 係列或DataFrame
另請參閱
-
DataFrame.pivot
-
Pivot表基於列值。
-
DataFrame.stack
-
主的水平列標簽(從unstack逆操作)。
例子
> > >df=ps。DataFrame({“一個”:{“0”:“一個”,“1”:“b”,“2”:“c”},…“B”:{“0”:“1”,“1”:“3”,“2”:“5”},…“C”:{“0”:“2”,“1”:“4”,“2”:“6”}},…列=(“一個”,“B”,“C”])> > >dfA B C0 1 21 b 3 42 c 5 6
> > >df。unstack()。sort_index()一個01 b2攝氏度B 0 11 32個5C 0 21 - 42 - 6dtype:對象
> > >df。列=pd。MultiIndex。from_tuples(((“X”,“一個”),(“X”,“B”),(“Y”,“C”)))> > >df。unstack()。sort_index()X 01 b2攝氏度B 0 11 32個5Y C 0 21 - 42 - 6dtype:對象
對於MultiIndex情況:
> > >df=ps。DataFrame({“一個”:(“一個”,“b”,“c”),…“B”:(1,3,5),…“C”:(2,4,6)},…列=(“一個”,“B”,“C”])> > >df=df。set_index(“一個”,附加=真正的)> > >dfB C一個0 1 21 b 3 42 c 5 6> > >df。unstack()。sort_index()B CA b c A b c0 1.0 2.0南南南南1南南南南的3.0升至4.0南南南南5.0至6.0點