pyspark.sql.functions.substring_index

pyspark.sql.functions。 substring_index ( str:ColumnOrName,delim:str,:int )→pyspark.sql.column.Column

返回字符串的子字符串str之前delim計數的分隔符。如果數量是正的,一切的左邊最後返回分隔符(左)計數。如果計數是負的,每一個最後的分隔符的右邊(從右邊數)返回。當尋找delim substring_index執行區分大小寫的匹配。

例子

> > >df=火花createDataFrame(((“a.b.c.d”),(“年代”])> > >df選擇(substring_index(df年代,“。”,2)別名(“年代”))收集()(行(s = ' a.b '))> > >df選擇(substring_index(df年代,“。”,- - - - - -3)別名(“年代”))收集()(行(s = ' b.c.d '))