pyspark.sql.functions.sentences¶
-
pyspark.sql.functions。
句子
( 字符串:ColumnOrName,語言:可選(ColumnOrName]=沒有一個,國家:可選(ColumnOrName]=沒有一個 )→pyspark.sql.column.Column¶ -
將一個字符串數組的句子,每個句子單詞是一個數組。“語言”和“國家”參數是可選的,如果省略,默認語言環境。
例子
> > >df=火花。createDataFrame([[“這是一個例句。”]],(“字符串”])> > >df。選擇(句子(df。字符串,點燃(“en”),點燃(“我們”)))。顯示(截斷=假)+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +|句子(字符串,恩,我們)|+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +|[[這一點,一個是例子,句子]]|+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +