pyspark.sql.functions.regexp_extract¶

pyspark.sql.functions。 regexp_extract ( str:ColumnOrName,模式:str,idx:int )→pyspark.sql.column.Column¶

提取一個特定群體由一個Java正則表達式匹配,從指定字符串列。如果正則表達式不匹配,或指定的組不匹配,返回一個空字符串。

例子

           > > >df=火花。createDataFrame(((“100 - 200”),(str的])> > >df。選擇(regexp_extract(str的,r”(\ d +) - (\ d +) ',1)。別名(' d '))。收集()(行(d = ' 100 '))> > >df=火花。createDataFrame(((“foo”),(str的])> > >df。選擇(regexp_extract(str的,r“(\ d +)”,1)。別名(' d '))。收集()(行(d = "))> > >df=火花。createDataFrame(((“aaaac”),(str的])> > >df。選擇(regexp_extract(str的,“(+)(b) ? (c)的,2)。別名(' d '))。收集()(行(d = "))
          

以前的

pyspark.sql.functions.octet_length

下一個

pyspark.sql.functions.regexp_replace