pyspark.pandas.read_orc¶

pyspark.pandas。 read_orc ( 路徑:str,列:可選(列表(str]]=沒有一個,index_col:聯盟(str,列表(str),沒有一個)=沒有一個,* *選項:任何 )→pyspark.pandas.frame.DataFrame¶

從文件路徑加載一個獸人對象,返回一個DataFrame。

參數

路徑 str: 路徑字符串存儲獸人文件閱讀。
列列表,默認沒有: 如果不是沒有,隻有這些列將從文件讀取。
index_col str和str列表,可選的,默認值:沒有: 表的索引列火花。
選項 dict: 所有其他選項直接傳遞到火花的數據源。

返回

DataFrame

例子

           > > >ps。範圍(1)。to_orc(”% s/ read_spark_io data.orc”%路徑)> > >ps。read_orc(”% s/ read_spark_io data.orc”%路徑,列=(“id”])id0 0
          

你可以保留指數往返如下。

           > > >ps。範圍(1)。to_orc(”% s/ read_spark_io data.orc”%路徑,index_col=“指數”)> > >ps。read_orc(”% s/ read_spark_io data.orc”%路徑,列=(“id”),index_col=“指數”)…id指數0 0
          

以前的

pyspark.pandas.DataFrame.to_parquet

下一個

pyspark.pandas.DataFrame.to_orc