pyspark.sql.functions.substring_index¶
-
pyspark.sql.functions。
substring_index
( str:ColumnOrName,delim:str,數:int )→pyspark.sql.column.Column¶ -
返回字符串的子字符串str之前delim計數的分隔符。如果數量是正的,一切的左邊最後返回分隔符(左)計數。如果計數是負的,每一個最後的分隔符的右邊(從右邊數)返回。當尋找delim substring_index執行區分大小寫的匹配。
例子
> > >df=火花。createDataFrame(((“a.b.c.d”),(“年代”])> > >df。選擇(substring_index(df。年代,“。”,2)。別名(“年代”))。收集()(行(s = ' a.b '))> > >df。選擇(substring_index(df。年代,“。”,- - - - - -3)。別名(“年代”))。收集()(行(s = ' b.c.d '))