pyspark.sql.DataFrameReader.load¶
-
DataFrameReader。
負載
( 路徑:聯盟(str,列表(str),沒有一個)=沒有一個,格式:可選(str]=沒有一個,模式:(pyspark.sql.types聯盟。StructType str,沒有)=沒有一個,* *選項:OptionalPrimitiveType )→DataFrame¶ -
從一個數據源加載數據並返回它
DataFrame
。- 參數
-
- 路徑 str或列表,可選的
-
可選的字符串或字符串數據源支持的文件係統的列表。
- 格式 str,可選
-
可選的字符串格式數據源。默認為“鋪”。
-
模式
pyspark.sql.types.StructType
或str,可選 -
可選
pyspark.sql.types.StructType
輸入模式或DDL-formatted字符串(例如col0INT,col1雙
)。 - * *選項 dict
-
所有其他選項字符串
例子
> > >df=火花。讀。格式(“鋪”)。負載(“python / test_support / sql / parquet_partitioned”,…opt1=真正的,opt2=1,opt3=str的)> > >df。dtypes((“名字”,“字符串”)(“年”、“int”)(“月”,“int”)(“天”、“int”)]
> > >df=火花。讀。格式(json的)。負載([“python / test_support / sql / people.json”,…“python / test_support / sql / people1.json”])> > >df。dtypes((“年齡”、“長整型數字”)(“即”、“字符串”)(“名字”,“字符串”)]