pyspark.sql.DataFrameReader.load

DataFrameReader。 負載 ( 路徑:聯盟(str,列表(str),沒有一個)=沒有一個,格式:可選(str]=沒有一個,模式:(pyspark.sql.types聯盟。StructType str,沒有)=沒有一個,* *選項:OptionalPrimitiveType )→DataFrame

從一個數據源加載數據並返回它DataFrame

參數
路徑 str或列表,可選的

可選的字符串或字符串數據源支持的文件係統的列表。

格式 str,可選

可選的字符串格式數據源。默認為“鋪”。

模式 pyspark.sql.types.StructType或str,可選

可選pyspark.sql.types.StructType輸入模式或DDL-formatted字符串(例如col0INT,col1)。

* *選項 dict

所有其他選項字符串

例子

> > >df=火花格式(“鋪”)負載(“python / test_support / sql / parquet_partitioned”,opt1=真正的,opt2=1,opt3=str的)> > >dfdtypes((“名字”,“字符串”)(“年”、“int”)(“月”,“int”)(“天”、“int”)]
> > >df=火花格式(json的)負載([“python / test_support / sql / people.json”,“python / test_support / sql / people1.json”])> > >dfdtypes((“年齡”、“長整型數字”)(“即”、“字符串”)(“名字”,“字符串”)]