pyspark.pandas.DataFrame.take¶
-
DataFrame。
取
( 指數:列表(int],軸:聯盟(int,str]=0,* *kwargs:任何 )→pyspark.pandas.frame.DataFrame¶ -
返回給定的元素位置指數沿著一個軸。
這意味著我們不根據實際值索引的索引屬性對象。我們是根據實際位置索引的元素對象。
- 參數
-
- 指數 類數組
-
整數的數組表示何種立場。
- 軸 {0或“指數”,或“列”,沒有},默認為0
-
的軸來選擇元素。
0
意味著我們選擇行,1
意味著我們選擇列。 - * * kwargs
-
為兼容
numpy.take ()
。沒有對輸出的影響。
- 返回
-
- 采取 相同類型作為調用者
-
類似數組包含元素的對象。
另請參閱
-
DataFrame.loc
-
選擇一個子集DataFrame的標簽。
-
DataFrame.iloc
-
選擇一個子集DataFrame的職位。
-
numpy.take
-
從一個數組元素沿著一個軸。
例子
> > >df=ps。DataFrame(((“獵鷹”,“鳥”,389.0),…(“鸚鵡”,“鳥”,24.0),…(“獅子”,“哺乳動物”,80.5),…(“猴子”,“哺乳動物”,np。南)),…列=(“名字”,“類”,“max_speed”),…指數=(0,2,3,1])> > >df名字類max_speed389.0 0隼鳥2隻鸚鵡鳥24.03獅子哺乳動物80.51隻猴子哺乳動物南
在位置0和3元素沿軸0(默認)。
注意實際的選擇指數(0和1)不符合我們選擇指數0和3。這是因為我們選擇第0個和第三行,行其指數為0和3。
> > >df。取([0,3])。sort_index()名字類max_speed389.0 0隼鳥1隻猴子哺乳動物南
在指標元素1和2沿軸1(列選擇)。
> > >df。取([1,2),軸=1)類max_speed0鳥389.02鳥24.03哺乳動物80.51)哺乳動物南
我們可能需要元素使用負整數為正指標,從結束的對象,就像Python列表。
> > >df。取([- - - - - -1,- - - - - -2])。sort_index()名字類max_speed1隻猴子哺乳動物南3獅子哺乳動物80.5