pyspark.sql.DataFrameWriter.partitionBy

DataFrameWriter。 partitionBy ( *關口:聯盟(str,列表(str]] )→pyspark.sql.readwriter.DataFrameWriter

分區文件係統上的輸出通過給定的列。

如果指定的,輸出是攤在文件係統類似於蜂巢的分區方案。

參數
關口 str或列表

列的名稱

例子

> > >dfpartitionBy(“年”,“月”)拚花(操作係統路徑加入(tempfilemkdtemp(),“數據”))