pyspark.pandas.read_orc

pyspark.pandas。 read_orc ( 路徑:str,:可選(列表(str]]=沒有一個,index_col:聯盟(str,列表(str),沒有一個)=沒有一個,* *選項:任何 )→pyspark.pandas.frame.DataFrame

從文件路徑加載一個獸人對象,返回一個DataFrame。

參數
路徑 str

路徑字符串存儲獸人文件閱讀。

列表,默認沒有

如果不是沒有,隻有這些列將從文件讀取。

index_col str和str列表,可選的,默認值:沒有

表的索引列火花。

選項 dict

所有其他選項直接傳遞到火花的數據源。

返回
DataFrame

例子

> > >ps範圍(1)to_orc(% s/ read_spark_io data.orc”%路徑)> > >psread_orc(% s/ read_spark_io data.orc”%路徑,=(“id”])id0 0

你可以保留指數往返如下。

> > >ps範圍(1)to_orc(% s/ read_spark_io data.orc”%路徑,index_col=“指數”)> > >psread_orc(% s/ read_spark_io data.orc”%路徑,=(“id”),index_col=“指數”)id指數0 0