pyspark.sql.streaming.DataStreamReader.text¶

DataStreamReader。 文本 ( 路徑:str,wholetext:bool=假,lineSep:可選(str]=沒有一個,pathGlobFilter:聯盟(bool, str,沒有)=沒有一個,recursiveFileLookup:聯盟(bool, str,沒有)=沒有一個 )→DataFrame¶

加載一個文本文件,並返回一個流DataFrame的模式從一個字符串列命名為“價值”,和緊隨其後的是如果有任何分區的列。文本文件必須編碼為utf - 8。

默認情況下,文本文件中的每一行是一個新行結果DataFrame。

參數

路徑 str或列表: 字符串或字符串列表,輸入路徑(s)。

其他參數

額外的選項: 額外的選項,請參考數據源的選擇在你使用的版本。

筆記

這個API是不斷發展的。

例子

           > > >text_sdf=火花。readStream。文本(tempfile。mkdtemp())> > >text_sdf。isStreaming真正的> > >“價值”在str(text_sdf。模式)真正的
          

以前的

pyspark.sql.streaming.DataStreamReader.schema

下一個

pyspark.sql.streaming.DataStreamWriter.foreach