pyspark.sql.DataFrameWriter.sortBy

DataFrameWriter。 sortBy ( 上校:聯盟(str、列表(str)元組(str,…)),*關口:可選(str] )→pyspark.sql.readwriter.DataFrameWriter

在每個桶排序輸出給定的列在文件係統。

參數
上校 str, tuple或列表

一個列的名稱,或名稱的列表。

關口 str

額外的名稱(可選)。如果上校是一個列表應該是空的。

例子

> > >(df格式(“鋪”)bucketBy(One hundred.,“年”,“月”)sortBy(“天”)模式(“覆蓋”)saveAsTable(“sorted_bucketed_table”))