pyspark.pandas.DataFrame.set_index¶
-
DataFrame。
set_index
( 鍵:聯盟(任何元組(,…),列表(聯盟[任何元組[,…]]]],下降:bool=真正的,附加:bool=假,原地:bool=假 )→可選(pyspark.pandas.frame.DataFrame] ¶ -
設置DataFrame指數(行標簽)使用一個或多個現有的列。
設置DataFrame指數(行標簽)使用一個或多個現有的列或數組(正確的長度)。該指數可以取代現有的索引或擴大。
- 參數
- 返回
-
- DataFrame
-
改變行標簽。
另請參閱
-
DataFrame.reset_index
-
set_index相反。
例子
> > >df=ps。DataFrame({“月”:(1,4,7,10),…“年”:(2012年,2014年,2013年,2014年),…“銷售”:(55,40,84年,31日)},…列=(“月”,“年”,“銷售”])> > >df月年銷售0 1 2012 551 4 2014 402 7 2013 843 2014 31
設置索引成為“月”專欄:
> > >df。set_index(“月”)年銷售月2012 554 2014年407 2013 842014 31
使用列創建一個MultiIndex“年”和“月”:
> > >df。set_index([“年”,“月”])出售年月2012 1 552014 4 402013 7 842014 10 31