pyspark.pandas.DataFrame.to_excel¶
-
DataFrame。
to_excel
( excel_writer:聯盟(str,pandas.io.excel._base.ExcelWriter],sheet_name:str=“Sheet1”,na_rep:str=”,float_format:可選(str]=沒有一個,列:聯盟(str,列表(str),沒有一個)=沒有一個,頭:bool=真正的,指數:bool=真正的,index_label:聯盟(str,列表(str),沒有一個)=沒有一個,startrow:int=0,startcol:int=0,引擎:可選(str]=沒有一個,merge_cells:bool=真正的,編碼:可選(str]=沒有一個,inf_rep:str=“正”,詳細的:bool=真正的,freeze_panes:可選(元組(int,int]]=沒有一個 )→沒有¶ -
對象寫入一個Excel表。
請注意
這種方法應該隻用於如果結果DataFrame預計將小,因為所有數據加載到司機的記憶。
寫一個對象一個Excel .xlsx文件隻需要指定一個目標文件的名字。寫信給多個表需要創建一個ExcelWriter對象與目標文件名稱,並指定一個表文件中寫。
通過指定獨特的多個表可能被寫入sheet_name。所有數據寫入文件需要保存更改。請注意,創建一個ExcelWriter對象的文件名已經存在將導致現有的文件的內容被刪除。
- 參數
-
- excel_writer str或ExcelWriter對象
-
文件路徑或現有ExcelWriter。
- sheet_name str,默認“Sheet1”
-
名稱的表將包含DataFrame。
- na_rep str,默認”
-
缺失的數據表示。
- float_format str,可選
-
浮點數的格式字符串。例如
float_format = " % % .2f "
將格式0.1234到0.12。 - 列 序列或str列表,可選的
-
列寫。
- 頭 bool或str列表,默認正確
-
寫出列名。如果給出一個字符串列表被認為是列名稱的別名。
- 指數 bool,默認的真
-
寫行名稱(索引)。
- index_label str或序列,可選的
-
列標簽索引列(s)(如果需要的話)。如果沒有指定,頭和指數是真的,然後使用索引名稱。一個序列如果DataFrame使用MultiIndex應給予。
- startrow int,默認0
-
左上角單元格行轉儲數據幀。
- startcol int,默認0
-
左上角單元格列轉儲數據幀。
- 引擎 str,可選
-
寫引擎使用,“openpyxl”或“xlsxwriter”。你也可以通過選項設置
io.excel.xlsx.writer
,io.excel.xls.writer
,io.excel.xlsm.writer
。 - merge_cells bool,默認的真
-
寫MultiIndex和分層行作為合並單元格。
- 編碼 str,可選
-
編碼產生的excel文件。xlwt的必要條件,其他作家本身支持unicode。
- inf_rep str,默認“正”
-
無窮(沒有原生的代表,表示無限的Excel)。
- 詳細的 bool,默認的真
-
錯誤日誌顯示更多的信息。
- freeze_panes int的元組(2)長度,可選的
-
指定從最低的行和最右邊的列也被凍結。
另請參閱
-
read_excel
-
讀取Excel文件。
筆記
一旦工作簿保存是不可能寫進一步數據沒有重寫整個工作簿。
例子
創建、寫入和保存工作簿:
> > >df1=ps。DataFrame([[“一個”,“b”),(“c”,' d ']],…指數=(的第一行,“第2行”),…列=(“上校1”,《col 2》])> > >df1。to_excel(“output.xlsx”)
指定表名:
> > >df1。to_excel(“output.xlsx”)> > >df1。to_excel(“output.xlsx”,…sheet_name=“Sheet_name_1”)
如果你想寫工作簿中一個以上的表,有必要指定一個ExcelWriter對象:
> > >與pd。ExcelWriter(“output.xlsx”)作為作家:…df1。to_excel(作家,sheet_name=“Sheet_name_1”)…df2。to_excel(作家,sheet_name=“Sheet_name_2”)
設置庫,用於編寫Excel文件,你可以通過引擎關鍵字(默認引擎自動選擇根據文件擴展名):
> > >df1。to_excel(“output1.xlsx”,引擎=“xlsxwriter”)