pyspark.pandas.Series.str.findall

str。 findall ( 帕特:str,旗幟:int=0 )→pyspark.pandas.series.Series

發現出現的所有模式或正則表達式的係列。

相當於應用re.findall ()所有元素的係列。

參數
帕特 str

模式或正則表達式。

旗幟 int,默認0(沒有旗幟)

再保險模塊的旗幟。re.IGNORECASE

返回
一係列的對象

所有重疊模式的匹配在本係列的每個字符串或正則表達式。

例子

> > >年代=ps係列([“獅子”,“猴子”,“兔子”])

搜索模式“猴子”返回一個匹配:

> > >年代strfindall(“猴子”)0 []1(猴子)2 []dtype:對象

另一方麵,尋找‘猴子’不返回任何模式匹配:

> > >年代strfindall(“猴子”)0 []1 []2 []dtype:對象

標誌可以被添加到模式或正則表達式。例如,找到“猴子”的模式忽略了案例:

> > >進口再保險> > >年代strfindall(“猴子”,旗幟=再保險IGNORECASE)0 []1(猴子)2 []dtype:對象

當本係列的模式匹配多個字符串,返回所有匹配:

> > >年代strfindall(“上”)0(上)1(上)2 []dtype:對象

支持正則表達式。例如,搜索所有的字符串結束詞”在“顯示下一個:

> > >年代strfindall(“美元”)0(上)1 []2 []dtype:對象

如果模式是發現不止一次在相同的字符串,然後返回多個字符串的列表:

> > >年代strfindall(“b”)0 []1 []2 (b, b)dtype:對象