pyspark.sql.DataFrameWriter.sortBy¶
-
DataFrameWriter。
sortBy
( 上校:聯盟(str、列表(str)元組(str,…)),*關口:可選(str] )→pyspark.sql.readwriter.DataFrameWriter¶ -
在每個桶排序輸出給定的列在文件係統。
- 參數
-
- 上校 str, tuple或列表
-
一個列的名稱,或名稱的列表。
- 關口 str
-
額外的名稱(可選)。如果上校是一個列表應該是空的。
例子
> > >(df。寫。格式(“鋪”)…。bucketBy(One hundred.,“年”,“月”)…。sortBy(“天”)…。模式(“覆蓋”)…。saveAsTable(“sorted_bucketed_table”))