pyspark.sql.functions.sentences

pyspark.sql.functions。 句子 ( 字符串:ColumnOrName,語言:可選(ColumnOrName]=沒有一個,國家:可選(ColumnOrName]=沒有一個 )→pyspark.sql.column.Column

將一個字符串數組的句子,每個句子單詞是一個數組。“語言”和“國家”參數是可選的,如果省略,默認語言環境。

參數
字符串 或str

一個字符串分割

語言 或str,可選

一種語言的語言環境

國家 或str,可選

一個地區的國家

例子

> > >df=火花createDataFrame([[“這是一個例句。”]],(“字符串”])> > >df選擇(句子(df字符串,點燃(“en”),點燃(“我們”)))顯示(截斷=)+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +|句子(字符串,恩,我們)|+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +|[[這一點,一個是例子,句子]]|+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +