pyspark.sql.DataFrameReader.load¶

DataFrameReader。 負載 ( 路徑:聯盟(str,列表(str),沒有一個)=沒有一個,格式:可選(str]=沒有一個,模式:(pyspark.sql.types聯盟。StructType str,沒有)=沒有一個,* *選項:OptionalPrimitiveType )→DataFrame¶

從一個數據源加載數據並返回它DataFrame。

參數

路徑 str或列表,可選的: 可選的字符串或字符串數據源支持的文件係統的列表。
格式 str,可選: 可選的字符串格式數據源。默認為“鋪”。
模式 pyspark.sql.types.StructType或str,可選: 可選pyspark.sql.types.StructType輸入模式或DDL-formatted字符串(例如col0INT,col1雙)。
* *選項 dict: 所有其他選項字符串

例子

           > > >df=火花。讀。格式(“鋪”)。負載(“python / test_support / sql / parquet_partitioned”,…opt1=真正的,opt2=1,opt3=str的)> > >df。dtypes((“名字”,“字符串”)(“年”、“int”)(“月”,“int”)(“天”、“int”)]
          

           > > >df=火花。讀。格式(json的)。負載([“python / test_support / sql / people.json”,…“python / test_support / sql / people1.json”])> > >df。dtypes((“年齡”、“長整型數字”)(“即”、“字符串”)(“名字”,“字符串”)]
          

以前的

pyspark.sql.DataFrameReader.json

下一個

pyspark.sql.DataFrameReader.option