pyspark.sql.DataFrame.sortWithinPartitions

DataFrame。 sortWithinPartitions ( *關口:聯盟(str,pyspark.sql.column.Column,列表(聯盟(str,pyspark.sql.column.Column]]],* *kwargs:任何 )→pyspark.sql.dataframe.DataFrame

返回一個新的DataFrame與每個分區按指定的列(s)。

參數
關口 str,列表或、可選

的列表或列名排序。

其他參數
提升 bool或列表,可選的

布爾或布爾值(默認的列表真正的)。升序和降序排序。指定多個排序訂單列表。如果指定一個列表,列表的長度必須等於長度關口

例子

> > >dfsortWithinPartitions(“年齡”,提升=)顯示()+ - - - + - - - +| | |年齡的名字+ - - - + - - - +| | 2 |愛麗絲鮑勃| 5 | |+ - - - + - - - +