pyspark.sql.streaming.DataStreamReader.text¶
-
DataStreamReader。
文本
( 路徑:str,wholetext:bool=假,lineSep:可選(str]=沒有一個,pathGlobFilter:聯盟(bool, str,沒有)=沒有一個,recursiveFileLookup:聯盟(bool, str,沒有)=沒有一個 )→DataFrame¶ -
加載一個文本文件,並返回一個流
DataFrame
的模式從一個字符串列命名為“價值”,和緊隨其後的是如果有任何分區的列。文本文件必須編碼為utf - 8。默認情況下,文本文件中的每一行是一個新行結果DataFrame。
- 參數
-
- 路徑 str或列表
-
字符串或字符串列表,輸入路徑(s)。
- 其他參數
-
- 額外的選項
-
額外的選項,請參考數據源的選擇在你使用的版本。
筆記
這個API是不斷發展的。
例子
> > >text_sdf=火花。readStream。文本(tempfile。mkdtemp())> > >text_sdf。isStreaming真正的> > >“價值”在str(text_sdf。模式)真正的