pyspark.sql.streaming.DataStreamReader.text

DataStreamReader。 文本 ( 路徑:str,wholetext:bool=,lineSep:可選(str]=沒有一個,pathGlobFilter:聯盟(bool, str,沒有)=沒有一個,recursiveFileLookup:聯盟(bool, str,沒有)=沒有一個 )→DataFrame

加載一個文本文件,並返回一個流DataFrame的模式從一個字符串列命名為“價值”,和緊隨其後的是如果有任何分區的列。文本文件必須編碼為utf - 8。

默認情況下,文本文件中的每一行是一個新行結果DataFrame。

參數
路徑 str或列表

字符串或字符串列表,輸入路徑(s)。

其他參數
額外的選項

額外的選項,請參考數據源的選擇在你使用的版本。

筆記

這個API是不斷發展的。

例子

> > >text_sdf=火花readStream文本(tempfilemkdtemp())> > >text_sdfisStreaming真正的> > >“價值”str(text_sdf模式)真正的