pyspark.pandas.DataFrame.reset_index¶
-
DataFrame。
reset_index
( 水平:聯盟[int,任何元組,…,序列[聯盟(int,任何元組[,…]]],沒有)=沒有一個,下降:bool=假,原地:bool=假,col_level:int=0,col_fill:str=” )→可選(pyspark.pandas.frame.DataFrame] ¶ -
重置指數水平。
為DataFrame多級索引,返回新DataFrame標簽信息指數下的列名稱,違約“level_0”,“level_1”等等,如果有任何人。標準索引,索引名稱將使用(如果設置),否則一個默認的“指數”或“level_0”(如果已經采取“指數”)將被使用。
- 參數
-
- 水平 int, str, tuple或列表,默認沒有
-
隻有從索引中刪除給定的水平。默認刪除所有級別。
- 下降 bool,默認的錯誤
-
不要試圖插入索引dataframe列。這個索引重置為默認的整數索引。
- 原地 bool,默認的錯誤
-
修改DataFrame到位(不創建一個新的對象)。
- col_level int或str,默認為0
-
如果列有多個水平,確定哪些標簽插入。默認情況下它是插入到第一層。
- col_fill 對象,默認”
-
如果列有多個水平,決定了其他級別是如何命名的。如果沒有索引名稱重複。
- 返回
-
- DataFrame
-
DataFrame新索引。
另請參閱
-
DataFrame.set_index
-
reset_index相反。
例子
> > >df=ps。DataFrame(((“鳥”,389.0),…(“鳥”,24.0),…(“哺乳動物”,80.5),…(“哺乳動物”,np。南)),…指數=(“獵鷹”,“鸚鵡”,“獅子”,“猴子”),…列=(“類”,“max_speed”))> > >df類max_speed隼鳥389.0鸚鵡鳥24.0獅子哺乳動物80.5猴子哺乳動物南
當我們重置指數,舊的索引添加一列。不像熊貓,pandas-on-Spark並不會自動添加一個連續的指數。以下0,1,2,3是隻有當我們顯示DataFrame。
> > >df。reset_index()指數類max_speed389.0 0隼鳥1鸚鵡鳥24.02獅子哺乳動物80.53隻猴子哺乳動物南
我們可以使用下降參數,以避免舊的索引添加一列:
> > >df。reset_index(下降=真正的)類max_speed0鳥389.01隻24.02哺乳動物80.53哺乳動物南
您還可以使用reset_index與MultiIndex。
> > >指數=pd。MultiIndex。from_tuples(((“鳥”,“獵鷹”),…(“鳥”,“鸚鵡”),…(“哺乳動物”,“獅子”),…(“哺乳動物”,“猴子”)),…的名字=(“類”,“名字”])> > >列=pd。MultiIndex。from_tuples(((“速度”,“馬克斯”),…(“物種”,“類型”)))> > >df=ps。DataFrame(((389.0,“飛”),…(24.0,“飛”),…(80.5,“運行”),…(np。南,“跳”)),…指數=指數,…列=列)> > >df速度的物種馬克斯類型類名鳥389.0獵鷹飛24.0鸚鵡飛哺乳動物獅子80.5運行猴子南跳
如果該指數有多個層次,我們可以複位的一個子集:
> > >df。reset_index(水平=“類”)物種類速度馬克斯類型的名字隼鳥389.0飛鸚鵡鳥24.0飛獅子哺乳動物80.5運行猴子南跳的哺乳類動物
如果我們不是索引的刪除,默認情況下,它是放在頂層。我們可以把它放在另一個層麵:
> > >df。reset_index(水平=“類”,col_level=1)速度的物種類馬克斯類型的名字隼鳥389.0飛鸚鵡鳥24.0飛獅子哺乳動物80.5運行猴子南跳的哺乳類動物
當插入索引在另一個層麵上,我們可以指定下一個參數col_fill:
> > >df。reset_index(水平=“類”,col_level=1,…col_fill=“物種”)物種加速物種類馬克斯類型的名字隼鳥389.0飛鸚鵡鳥24.0飛獅子哺乳動物80.5運行猴子南跳的哺乳類動物
如果我們指定一個不存在的水平col_fill,它創建:
> > >df。reset_index(水平=“類”,col_level=1,…col_fill=“屬”)屬物種速度類馬克斯類型的名字隼鳥389.0飛鸚鵡鳥24.0飛獅子哺乳動物80.5運行猴子南跳的哺乳類動物