pyspark.sql.functions.split

pyspark.sql.functions。 分裂 ( str:ColumnOrName,模式:str,限製:int=- 1 )→pyspark.sql.column.Column

分裂str在給定模式的匹配。

參數
str 或str

一個字符串表達式

模式 str

一個字符串代表一個正則表達式。正則表達式的字符串應該是一個Java正則表達式。

限製 int,可選

一個整數控製的次數模式應用。

  • 限製>0:結果數組的長度不會超過限製,

    結果數組的最後一個條目將包含所有輸入超出了最後的匹配模式。

  • 限製< =0:模式將盡可能多地應用,以及由此產生的嗎

    數組可以是任何大小。

    分裂現在需要一個可選的限製字段。如果沒有提供,默認限製值是1。

例子

> > >df=火花createDataFrame(((“oneAtwoBthreeC”),(“年代”,)> > >df選擇(分裂(df年代,“(美國廣播公司)”,2)別名(“年代”))收集()行(s =['一',' twoBthreeC ']))> > >df選擇(分裂(df年代,“(美國廣播公司)”,- - - - - -1)別名(“年代”))收集()行(s =['一',' 2 ',' 3 ',"])