pyspark.pandas.DataFrame.sort_values

DataFrame。 sort_values ( 通過:聯盟(任何元組(,…),列表(聯盟[任何元組[,…]]]],提升:聯盟(bool,列表(bool]]=真正的,原地:bool=,na_position:str=“最後一次”,ignore_index:bool= )→可選(pyspark.pandas.frame.DataFrame]

通過值沿軸。

參數
通過 str和str的列表
提升 bool或布爾值的列表,默認正確

升序和降序排序。指定多個排序訂單列表。如果這是一個布爾值列表,必須匹配的長度。

原地 bool,默認的錯誤

如果這是真的,就地執行操作

na_position {“第一”,“去年”},違約的最後的

第一個在一開始,將nan去年最後將nan

ignore_index bool,默認的錯誤

如果情況屬實,由此產生的軸將被標記為0,1,…,n - 1。

返回
sorted_obj DataFrame

例子

> > >df=psDataFrame({“col1”:(“一個”,“B”,沒有一個,' D ',“C”),“col2”:(2,9,8,7,4),“col3”:(0,9,4,2,3),},=(“col1”,“col2”,“col3”),指數=(“一個”,“b”,“c”,' d ',“e”])> > >dfcol1 col2 col3一個2 0b b 9 9c沒有8 4d d 7 2e C 4 3

按col1排序

> > >dfsort_values(通過=(“col1”])col1 col2 col3一個2 0b b 9 9e C 4 3d d 7 2c沒有8 4

忽略指數產生的軸

> > >dfsort_values(通過=(“col1”),ignore_index=真正的)col1 col2 col30 2 01 B 9 92 C 4 33 D 7 24沒有8 4

降序

> > >dfsort_values(通過=“col1”,提升=)col1 col2 col3d d 7 2e C 4 3b b 9 9一個2 0c沒有8 4

按多個列排序

> > >df=psDataFrame({“col1”:(“一個”,“一個”,“B”,沒有一個,' D ',“C”),“col2”:(2,1,9,8,7,4),“col3”:(0,1,9,4,2,3),},=(“col1”,“col2”,“col3”])> > >dfsort_values(通過=(“col1”,“col2”])col1 col2 col31 1 10 2 02 B 9 95 C 4 34 D 7 23沒有8 4