pyspark.pandas.DataFrame.reset_index

DataFrame。 reset_index ( 水平:聯盟[int,任何元組,…,序列[聯盟(int,任何元組[,…]]],沒有)=沒有一個,下降:bool=,原地:bool=,col_level:int=0,col_fill:str= )→可選(pyspark.pandas.frame.DataFrame]

重置指數水平。

為DataFrame多級索引,返回新DataFrame標簽信息指數下的列名稱,違約“level_0”,“level_1”等等,如果有任何人。標準索引,索引名稱將使用(如果設置),否則一個默認的“指數”或“level_0”(如果已經采取“指數”)將被使用。

參數
水平 int, str, tuple或列表,默認沒有

隻有從索引中刪除給定的水平。默認刪除所有級別。

下降 bool,默認的錯誤

不要試圖插入索引dataframe列。這個索引重置為默認的整數索引。

原地 bool,默認的錯誤

修改DataFrame到位(不創建一個新的對象)。

col_level int或str,默認為0

如果列有多個水平,確定哪些標簽插入。默認情況下它是插入到第一層。

col_fill 對象,默認”

如果列有多個水平,決定了其他級別是如何命名的。如果沒有索引名稱重複。

返回
DataFrame

DataFrame新索引。

另請參閱

DataFrame.set_index

reset_index相反。

例子

> > >df=psDataFrame(((“鳥”,389.0),(“鳥”,24.0),(“哺乳動物”,80.5),(“哺乳動物”,np)),指數=(“獵鷹”,“鸚鵡”,“獅子”,“猴子”),=(“類”,“max_speed”))> > >df類max_speed隼鳥389.0鸚鵡鳥24.0獅子哺乳動物80.5猴子哺乳動物南

當我們重置指數,舊的索引添加一列。不像熊貓,pandas-on-Spark並不會自動添加一個連續的指數。以下0,1,2,3是隻有當我們顯示DataFrame。

> > >dfreset_index()指數類max_speed389.0 0隼鳥1鸚鵡鳥24.02獅子哺乳動物80.53隻猴子哺乳動物南

我們可以使用下降參數,以避免舊的索引添加一列:

> > >dfreset_index(下降=真正的)類max_speed0鳥389.01隻24.02哺乳動物80.53哺乳動物南

您還可以使用reset_indexMultiIndex

> > >指數=pdMultiIndexfrom_tuples(((“鳥”,“獵鷹”),(“鳥”,“鸚鵡”),(“哺乳動物”,“獅子”),(“哺乳動物”,“猴子”)),的名字=(“類”,“名字”])> > >=pdMultiIndexfrom_tuples(((“速度”,“馬克斯”),(“物種”,“類型”)))> > >df=psDataFrame(((389.0,“飛”),(24.0,“飛”),(80.5,“運行”),(np,“跳”)),指數=指數,=)> > >df速度的物種馬克斯類型類名鳥389.0獵鷹飛24.0鸚鵡飛哺乳動物獅子80.5運行猴子南跳

如果該指數有多個層次,我們可以複位的一個子集:

> > >dfreset_index(水平=“類”)物種類速度馬克斯類型的名字隼鳥389.0飛鸚鵡鳥24.0飛獅子哺乳動物80.5運行猴子南跳的哺乳類動物

如果我們不是索引的刪除,默認情況下,它是放在頂層。我們可以把它放在另一個層麵:

> > >dfreset_index(水平=“類”,col_level=1)速度的物種類馬克斯類型的名字隼鳥389.0飛鸚鵡鳥24.0飛獅子哺乳動物80.5運行猴子南跳的哺乳類動物

當插入索引在另一個層麵上,我們可以指定下一個參數col_fill:

> > >dfreset_index(水平=“類”,col_level=1,col_fill=“物種”)物種加速物種類馬克斯類型的名字隼鳥389.0飛鸚鵡鳥24.0飛獅子哺乳動物80.5運行猴子南跳的哺乳類動物

如果我們指定一個不存在的水平col_fill,它創建:

> > >dfreset_index(水平=“類”,col_level=1,col_fill=“屬”)屬物種速度類馬克斯類型的名字隼鳥389.0飛鸚鵡鳥24.0飛獅子哺乳動物80.5運行猴子南跳的哺乳類動物