pyspark.pandas.Series.str.replace

str。 取代 ( 帕特:str,repl:聯盟(str,可調用的((str],str]],n:int=- 1,情況下:可選(bool]=沒有一個,旗幟:int=0,正則表達式:bool=真正的 )→pyspark.pandas.series.Series

替換模式/ regex係列的出現與其他字符串。相當於str.replace ()re.sub ()

參數
帕特 str或編譯正則表達式

字符串可以是一個字符序列或正則表達式。

repl str或可調用的

替換字符串或一個可調用的。可調用的是通過正則表達式匹配對象,必須返回一個使用替換字符串。看到re.sub ()

n int,默認1(全部)

替代品的數量從開始。

情況下 布爾,默認沒有

如果這是真的,區分大小寫如果帕特是一個字符串(默認)。設置為False,不分大小寫。不能設置如果帕特是一個編譯正則表達式。

國旗:int,默認0(沒有旗幟)

re模塊旗幟,例如re.IGNORECASE。不能設置如果帕特是一個編譯正則表達式。

正則表達式 布爾,默認的真

如果這是真的,假設傳入模式是一個正則表達式。如果錯誤,將模式作為文字字符串。不能設置為False如果帕特是一個編譯正則表達式或repl是可調用的。

返回
一係列的對象

與所有匹配字符串的一個副本出現的帕特repl所取代。

例子

當帕特是一個字符串和正則表達式是正確的(默認),給定的帕特編譯正則表達式。當repl是一個字符串,它取代與匹配正則表達式模式re.sub ()。NaN值(s)係列中沒有改變:

> > >ps係列([“foo”,“fuz”,np])str取代(“f”。,“ba”,正則表達式=真正的)0保1巴茲2沒有dtype:對象

當帕特是一個字符串和正則表達式是錯誤的,每一拍都是repl與所取代str.replace ():

> > >ps係列([“f.o”,“fuz”,np])str取代(“f”。,“ba”,正則表達式=)0保1 fuz2沒有dtype:對象

repl是一個可調用的時候,呼籲每一個帕特re.sub ()。可調用應該期望一個位置參數(regex對象)並返回一個字符串。

反向所有小寫字母詞:

> > >repl=λ:集團(0)[::- - - - - -1]> > >ps係列([“foo 123”,“酒吧巴茲”,np])str取代(r“[a - z] +”,repl)0現鈔1231 rab zab2沒有dtype:對象

使用正則表達式組(提取第二組和交換的情況):

> > >帕特=r" (? P <一> \ w +) (? P < 2 > \ w +) (? P <三> \ w +)”> > >repl=λ:集團(“兩個”)swapcase()> > >ps係列([“一二三”,“巴茲Foo酒吧”])str取代(帕特,repl)0兩個1條dtype:對象

使用一個正則表達式編譯標誌:

> > >進口再保險> > >regex_pat=再保險編譯(r“FUZ”,旗幟=再保險IGNORECASE)> > >ps係列([“foo”,“fuz”,np])str取代(regex_pat,“酒吧”)0 foo1條2沒有dtype:對象