pyspark.sql.DataFrame.pandas_api

DataFrame。 pandas_api ( index_col:聯盟(str,列表(str),沒有一個)=沒有一個 )→PandasOnSparkDataFrame

現有DataFrame轉換成pandas-on-Spark DataFrame。

如果pandas-on-Spark DataFrame轉化為火花DataFrame然後回到pandas-on-Spark,它將失去索引信息和原始指數將會變成一個正常的列。

這隻是如果大熊貓安裝和可用。

參數
index_col: str或str列表,可選的,默認值:沒有

表的索引列火花。

另請參閱

pyspark.pandas.frame.DataFrame.to_spark

例子

> > >df顯示()+ - - - + - - - +| Col1 | Col2 |+ - - - + - - - +| | 1 || | 2 |c | | 3 |+ - - - + - - - +
> > >dfpandas_api()Col1 Col20 11 b 22 c 3

我們可以指定索引的列。

> > >dfpandas_api(index_col=“Col1”):Col2Col1一個1b 2c 3