pyspark.sql.DataFrameReader.text¶
-
DataFrameReader。
文本
( 路徑:聯盟(str,列表(str]],wholetext:bool=假,lineSep:可選(str]=沒有一個,pathGlobFilter:聯盟(bool, str,沒有)=沒有一個,recursiveFileLookup:聯盟(bool, str,沒有)=沒有一個,modifiedBefore:聯盟(bool, str,沒有)=沒有一個,modifiedAfter:聯盟(bool, str,沒有)=沒有一個 )→DataFrame¶ -
加載文本文件並返回
DataFrame
的模式從一個字符串列命名為“價值”,和緊隨其後的是如果有任何分區的列。文本文件必須編碼為utf - 8。默認情況下,文本文件中的每一行是一個新行結果DataFrame。
- 參數
-
- 路徑 str或列表
-
字符串或字符串列表,輸入路徑(s)。
- 其他參數
-
- 額外的選項
-
額外的選項,請參考數據源的選擇在你使用的版本。
例子
> > >df=火花。讀。文本(“python / test_support / sql / text-test.txt”)> > >df。收集()(行(value = '你好')、行(value = '這'))> > >df=火花。讀。文本(“python / test_support / sql / text-test.txt”,wholetext=真正的)> > >df。收集()行(value = '你好\服裝'))