pyspark.pandas.DataFrame.set_index¶

DataFrame。 set_index ( 鍵:聯盟(任何元組(,…),列表(聯盟[任何元組[,…]]]],下降:bool=真正的,附加:bool=假,原地:bool=假 )→可選(pyspark.pandas.frame.DataFrame] ¶

設置DataFrame指數(行標簽)使用一個或多個現有的列。

設置DataFrame指數(行標簽)使用一個或多個現有的列或數組(正確的長度)。該指數可以取代現有的索引或擴大。

參數

鍵類數組或列表的標簽或標簽/數組: 這個參數可以是單個列鍵,一個數組長度相同的調用DataFrame,或列的列表包含任意組合鍵和數組。在這裏,包括“數組”係列,指數和np.ndarray。
下降 bool,默認的真: 刪除列作為新指數。
附加 bool,默認的錯誤: 是否列附加到現有的索引。
原地 bool,默認的錯誤: 修改DataFrame到位(不創建一個新的對象)。

返回

DataFrame: 改變行標簽。

另請參閱

DataFrame.reset_index: set_index相反。

例子

           > > >df=ps。DataFrame({“月”:(1,4,7,10),…“年”:(2012年,2014年,2013年,2014年),…“銷售”:(55,40,84年,31日)},…列=(“月”,“年”,“銷售”])> > >df月年銷售0 1 2012 551 4 2014 402 7 2013 843 2014 31
          

設置索引成為“月”專欄:

           > > >df。set_index(“月”)年銷售月2012 554 2014年407 2013 842014 31
          

使用列創建一個MultiIndex“年”和“月”:

           > > >df。set_index([“年”,“月”])出售年月2012 1 552014 4 402013 7 842014 10 31
          

以前的

pyspark.pandas.DataFrame.reset_index

下一個

pyspark.pandas.DataFrame.swapaxes