pyspark.sql.DataFrameReader.text¶

DataFrameReader。 文本 ( 路徑:聯盟(str,列表(str]],wholetext:bool=假,lineSep:可選(str]=沒有一個,pathGlobFilter:聯盟(bool, str,沒有)=沒有一個,recursiveFileLookup:聯盟(bool, str,沒有)=沒有一個,modifiedBefore:聯盟(bool, str,沒有)=沒有一個,modifiedAfter:聯盟(bool, str,沒有)=沒有一個 )→DataFrame¶

加載文本文件並返回DataFrame的模式從一個字符串列命名為“價值”,和緊隨其後的是如果有任何分區的列。文本文件必須編碼為utf - 8。

默認情況下,文本文件中的每一行是一個新行結果DataFrame。

參數

路徑 str或列表: 字符串或字符串列表,輸入路徑(s)。

其他參數

額外的選項: 額外的選項,請參考數據源的選擇在你使用的版本。

例子

           > > >df=火花。讀。文本(“python / test_support / sql / text-test.txt”)> > >df。收集()(行(value = '你好')、行(value = '這'))> > >df=火花。讀。文本(“python / test_support / sql / text-test.txt”,wholetext=真正的)> > >df。收集()行(value = '你好\服裝'))
          

以前的

pyspark.sql.DataFrameReader.table

下一個

pyspark.sql.DataFrameWriter.bucketBy