pyspark.pandas.DataFrame.set_index

DataFrame。 set_index ( :聯盟(任何元組(,…),列表(聯盟[任何元組[,…]]]],下降:bool=真正的,附加:bool=,原地:bool= )→可選(pyspark.pandas.frame.DataFrame]

設置DataFrame指數(行標簽)使用一個或多個現有的列。

設置DataFrame指數(行標簽)使用一個或多個現有的列或數組(正確的長度)。該指數可以取代現有的索引或擴大。

參數
類數組或列表的標簽或標簽/數組

這個參數可以是單個列鍵,一個數組長度相同的調用DataFrame,或列的列表包含任意組合鍵和數組。在這裏,包括“數組”係列,指數np.ndarray

下降 bool,默認的真

刪除列作為新指數。

附加 bool,默認的錯誤

是否列附加到現有的索引。

原地 bool,默認的錯誤

修改DataFrame到位(不創建一個新的對象)。

返回
DataFrame

改變行標簽。

另請參閱

DataFrame.reset_index

set_index相反。

例子

> > >df=psDataFrame({“月”:(1,4,7,10),“年”:(2012年,2014年,2013年,2014年),“銷售”:(55,40,84年,31日)},=(“月”,“年”,“銷售”])> > >df月年銷售0 1 2012 551 4 2014 402 7 2013 843 2014 31

設置索引成為“月”專欄:

> > >dfset_index(“月”)年銷售2012 554 2014年407 2013 842014 31

使用列創建一個MultiIndex“年”和“月”:

> > >dfset_index([“年”,“月”])出售年月2012 1 552014 4 402013 7 842014 10 31