pyspark.pandas.DataFrame.take

DataFrame。 ( 指數:列表(int],:聯盟(int,str]=0,* *kwargs:任何 )→pyspark.pandas.frame.DataFrame

返回給定的元素位置指數沿著一個軸。

這意味著我們不根據實際值索引的索引屬性對象。我們是根據實際位置索引的元素對象。

參數
指數 類數組

整數的數組表示何種立場。

{0或“指數”,或“列”,沒有},默認為0

的軸來選擇元素。0意味著我們選擇行,1意味著我們選擇列。

* * kwargs

為兼容numpy.take ()。沒有對輸出的影響。

返回
采取 相同類型作為調用者

類似數組包含元素的對象。

另請參閱

DataFrame.loc

選擇一個子集DataFrame的標簽。

DataFrame.iloc

選擇一個子集DataFrame的職位。

numpy.take

從一個數組元素沿著一個軸。

例子

> > >df=psDataFrame(((“獵鷹”,“鳥”,389.0),(“鸚鵡”,“鳥”,24.0),(“獅子”,“哺乳動物”,80.5),(“猴子”,“哺乳動物”,np)),=(“名字”,“類”,“max_speed”),指數=(0,2,3,1])> > >df名字類max_speed389.0 0隼鳥2隻鸚鵡鳥24.03獅子哺乳動物80.51隻猴子哺乳動物南

在位置0和3元素沿軸0(默認)。

注意實際的選擇指數(0和1)不符合我們選擇指數0和3。這是因為我們選擇第0個和第三行,行其指數為0和3。

> > >df([0,3])sort_index()名字類max_speed389.0 0隼鳥1隻猴子哺乳動物南

在指標元素1和2沿軸1(列選擇)。

> > >df([1,2),=1)類max_speed0鳥389.02鳥24.03哺乳動物80.51)哺乳動物南

我們可能需要元素使用負整數為正指標,從結束的對象,就像Python列表。

> > >df([- - - - - -1,- - - - - -2])sort_index()名字類max_speed1隻猴子哺乳動物南3獅子哺乳動物80.5