pyspark.sql.DataFrameReader.schema

DataFrameReader。 模式 ( 模式:聯盟(pyspark.sql.types.StructType,str] )→pyspark.sql.readwriter.DataFrameReader

指定輸入模式。

一些數據源(例如JSON)可以推斷出從數據自動輸入模式。通過指定模式,底層數據源可以跳過模式推理步驟,從而加快數據加載。

參數
模式 pyspark.sql.types.StructType或str

一個pyspark.sql.types.StructType對象或DDL-formatted字符串(例如col0INT,col1)。

> > > s = spark.read。模式(“col0 INT, col1 DOUBLE”)