pyspark.sql.streaming.DataStreamReader.schema

DataStreamReader。 模式 ( 模式:聯盟(pyspark.sql.types.StructType,str] )→pyspark.sql.streaming.readwriter.DataStreamReader

指定輸入模式。

一些數據源(例如JSON)可以推斷出從數據自動輸入模式。通過指定模式,底層數據源可以跳過模式推理步驟,從而加快數據加載。

參數
模式 pyspark.sql.types.StructType或str

一個pyspark.sql.types.StructType對象或DDL-formatted字符串(例如col0INT,col1)。

筆記

這個API是不斷發展的。

例子

> > >年代=火花readStream模式(sdf_schema)> > >年代=火花readStream模式(“col0 INT, col1雙”)