pyspark.pandas.Series.str.contains¶
-
str。
包含
( 帕特:str,情況下:bool=真正的,旗幟:int=0,na:任何=沒有一個,正則表達式:bool=真正的 )→pyspark.pandas.series.Series¶ -
測試模式或正則表達式包含在一個字符串的一個係列。
返回布爾係列基於給定的模式或正則表達式是否包含在一個字符串的一個係列。
類似於
匹配()
,但沒有那麼嚴格,依賴re.search ()
而不是re.match ()
。- 參數
-
- 帕特 str
-
字符序列或正則表達式。
- 情況下 bool,默認的真
-
如果這是真的,區分大小寫的。
- 旗幟 int,默認0(沒有旗幟)
-
國旗通過re模塊,例如re.IGNORECASE。
- na 默認沒有
-
為缺失值填補價值。南轉化為沒有。
- 正則表達式 bool,默認的真
-
如果這是真的,假設帕特是一個正則表達式。如果錯誤,將帕特作為一個文本字符串。
- 返回
-
- 一係列的布爾值或對象
-
一係列的布爾值指示給定的模式是否包含在字符串的每個元素係列。
例子
返回一係列的布爾值隻使用一個文本模式。
> > >s1=ps。係列([“鼠標”,“狗”,“房子和鸚鵡”,“23”,np。南])> > >s1。str。包含(的噩,正則表達式=假)0錯誤1真正的2錯誤3錯誤4沒有dtype:對象
指定使用敏感案件。
> > >s1。str。包含(的噩,情況下=真正的,正則表達式=真正的)0錯誤1假2錯誤3錯誤4沒有dtype:對象
指定na是假的而不是南取代NaN值和錯誤的。如果係列不包含NaN值結果dtype bool,否則,一個dtype對象。
> > >s1。str。包含(的噩,na=假,正則表達式=真正的)0錯誤1真正的2錯誤3錯誤4錯誤dtype: bool
返回“房子”或“狗”發生在一個字符串表達式。
> > >s1。str。包含(“房子|狗”,正則表達式=真正的)0錯誤1真正的2真3錯誤4沒有dtype:對象
忽略大小寫敏感性使用正則表達式的旗幟。
> > >進口再保險> > >s1。str。包含(“鸚鵡”,旗幟=再保險。IGNORECASE,正則表達式=真正的)0錯誤1假2真3錯誤4沒有dtype:對象
使用正則表達式返回的任何數字。
> > >s1。str。包含(“[0 - 9]”,正則表達式=真正的)0錯誤1假2錯誤3真正的4沒有dtype:對象
確保帕特不是一個文字當正則表達式模式設置為True。注意下麵的例子我們可以預計到的隻有s2[1]和s2[3],返回True。然而,”。0’ as a regex matches any character followed by a 0.
> > >s2=ps。係列([“40”,“40.0”,“41”,“41.0”,“35”])> > >s2。str。包含(“0”,正則表達式=真正的)0真實1真正的2錯誤3真正的4錯誤dtype: bool