pyspark.pandas.DataFrame.to_string

DataFrame。 to_string ( 緩衝區:可選(IO(str]]=沒有一個,:可選(序列[聯盟[任何元組[,…]]]]=沒有一個,col_space:聯盟(str, int, Dict[聯盟[任何元組[,…]],聯盟[str, int]],沒有)=沒有一個,:bool=真正的,指數:bool=真正的,na_rep:str=“南”,格式器:聯盟(列表(可調用的[[任何],str]], Dict[聯盟[任何元組[,…]],可調用的[[任何],str]],沒有)=沒有一個,float_format:可選(可調用的((浮動],str]]=沒有一個,sparsify:可選(bool]=沒有一個,index_names:bool=真正的,證明:可選(str]=沒有一個,max_rows:可選(int]=沒有一個,max_cols:可選(int]=沒有一個,show_dimensions:bool=,小數:str=“。”,line_width:可選(int]=沒有一個 )→可選(str]

呈現一個友好的控製台DataFrame表格輸出。

請注意

這種方法應該隻用於如果結果熊貓對象預計比較小,因為所有數據加載到司機的記憶。如果輸入是大,max_rows參數設置。

參數
緩衝區 StringIO-like,可選

緩衝區寫入。

序列,可選的,默認沒有

列寫的子集。寫默認所有列。

col_space int,可選

每一列的最小寬度。

bool,可選

寫出列名。如果一個字符串列表,那麼它將被認為是列名稱的別名

指數 bool,可選的,默認正確

是否打印指數(行)標簽。

na_rep str,可選的,默認“NaN”

南使用的字符串表示。

格式器 列表或dict one-param。功能,可選

格式化程序功能適用於列的元素位置或名稱。每個函數的結果必須是一個unicode字符串。列表長度必須等於列數。

float_format 單參數的函數,可選的,默認沒有

格式化程序函數適用於列如果浮動的元素。這個函數的結果必須是一個unicode字符串。

sparsify bool,可選的,默認正確

設置為False的DataFrame分層索引在每一行每multiindex打印鍵。

index_names bool,可選的,默認正確

打印索引的名稱。

證明 str,默認沒有

如何證明列標簽。如果沒有使用打印的選項配置(由set_option控製),“正確”的開箱即用的。有效的值

  • 正確的

  • 中心

  • 證明

  • 證明如此

  • 開始

  • 結束

  • 繼承

  • match-parent

  • 最初的

  • 未設置的。

max_rows int,可選

最大數量的行顯示在控製台中。

max_cols int,可選

最大數量的列顯示在控製台中。

show_dimensions bool,默認的錯誤

顯示DataFrame維度(的行數,列數)。

小數 str,違約”。

字符作為小數分隔符,例如”、“在歐洲。

line_width int,可選

寬度來包裝一行字符。

返回
str(或者unicode,取決於數據和選項)

dataframe的字符串表示。

另請參閱

to_html

DataFrame轉換為HTML。

例子

> > >df=psDataFrame({“col1”:(1,2,3),“col2”:(4,5,6)},=(“col1”,“col2”])> > >打印(dfto_string())col1 col20 1 41 2 52 3 6
> > >打印(dfto_string(max_rows=2))col1 col20 1 41 2 5