pyspark.pandas.DataFrame.to_excel

DataFrame。 to_excel ( excel_writer:聯盟(str,pandas.io.excel._base.ExcelWriter],sheet_name:str=“Sheet1”,na_rep:str=,float_format:可選(str]=沒有一個,:聯盟(str,列表(str),沒有一個)=沒有一個,:bool=真正的,指數:bool=真正的,index_label:聯盟(str,列表(str),沒有一個)=沒有一個,startrow:int=0,startcol:int=0,引擎:可選(str]=沒有一個,merge_cells:bool=真正的,編碼:可選(str]=沒有一個,inf_rep:str=“正”,詳細的:bool=真正的,freeze_panes:可選(元組(int,int]]=沒有一個 )→沒有

對象寫入一個Excel表。

請注意

這種方法應該隻用於如果結果DataFrame預計將小,因為所有數據加載到司機的記憶。

寫一個對象一個Excel .xlsx文件隻需要指定一個目標文件的名字。寫信給多個表需要創建一個ExcelWriter對象與目標文件名稱,並指定一個表文件中寫。

通過指定獨特的多個表可能被寫入sheet_name。所有數據寫入文件需要保存更改。請注意,創建一個ExcelWriter對象的文件名已經存在將導致現有的文件的內容被刪除。

參數
excel_writer str或ExcelWriter對象

文件路徑或現有ExcelWriter。

sheet_name str,默認“Sheet1”

名稱的表將包含DataFrame。

na_rep str,默認”

缺失的數據表示。

float_format str,可選

浮點數的格式字符串。例如float_format = " % % .2f "將格式0.1234到0.12。

序列或str列表,可選的

列寫。

bool或str列表,默認正確

寫出列名。如果給出一個字符串列表被認為是列名稱的別名。

指數 bool,默認的真

寫行名稱(索引)。

index_label str或序列,可選的

列標簽索引列(s)(如果需要的話)。如果沒有指定,指數是真的,然後使用索引名稱。一個序列如果DataFrame使用MultiIndex應給予。

startrow int,默認0

左上角單元格行轉儲數據幀。

startcol int,默認0

左上角單元格列轉儲數據幀。

引擎 str,可選

寫引擎使用,“openpyxl”或“xlsxwriter”。你也可以通過選項設置io.excel.xlsx.writer,io.excel.xls.writer,io.excel.xlsm.writer

merge_cells bool,默認的真

寫MultiIndex和分層行作為合並單元格。

編碼 str,可選

編碼產生的excel文件。xlwt的必要條件,其他作家本身支持unicode。

inf_rep str,默認“正”

無窮(沒有原生的代表,表示無限的Excel)。

詳細的 bool,默認的真

錯誤日誌顯示更多的信息。

freeze_panes int的元組(2)長度,可選的

指定從最低的行和最右邊的列也被凍結。

另請參閱

read_excel

讀取Excel文件。

筆記

一旦工作簿保存是不可能寫進一步數據沒有重寫整個工作簿。

例子

創建、寫入和保存工作簿:

> > >df1=psDataFrame([[“一個”,“b”),(“c”,' d ']],指數=(的第一行,“第2行”),=(“上校1”,《col 2》])> > >df1to_excel(“output.xlsx”)

指定表名:

> > >df1to_excel(“output.xlsx”)> > >df1to_excel(“output.xlsx”,sheet_name=“Sheet_name_1”)

如果你想寫工作簿中一個以上的表,有必要指定一個ExcelWriter對象:

> > >pdExcelWriter(“output.xlsx”)作為作家:df1to_excel(作家,sheet_name=“Sheet_name_1”)df2to_excel(作家,sheet_name=“Sheet_name_2”)

設置庫,用於編寫Excel文件,你可以通過引擎關鍵字(默認引擎自動選擇根據文件擴展名):

> > >df1to_excel(“output1.xlsx”,引擎=“xlsxwriter”)