pyspark.pandas.read_orc¶
-
pyspark.pandas。
read_orc
( 路徑:str,列:可選(列表(str]]=沒有一個,index_col:聯盟(str,列表(str),沒有一個)=沒有一個,* *選項:任何 )→pyspark.pandas.frame.DataFrame¶ -
從文件路徑加載一個獸人對象,返回一個DataFrame。
- 參數
-
- 路徑 str
-
路徑字符串存儲獸人文件閱讀。
- 列 列表,默認沒有
-
如果不是沒有,隻有這些列將從文件讀取。
- index_col str和str列表,可選的,默認值:沒有
-
表的索引列火花。
- 選項 dict
-
所有其他選項直接傳遞到火花的數據源。
- 返回
-
- DataFrame
例子
> > >ps。範圍(1)。to_orc(”% s/ read_spark_io data.orc”%路徑)> > >ps。read_orc(”% s/ read_spark_io data.orc”%路徑,列=(“id”])id0 0
你可以保留指數往返如下。
> > >ps。範圍(1)。to_orc(”% s/ read_spark_io data.orc”%路徑,index_col=“指數”)> > >ps。read_orc(”% s/ read_spark_io data.orc”%路徑,列=(“id”),index_col=“指數”)…id指數0 0