pyspark.pandas.Series.map¶
-
係列。
地圖
( 參數:聯盟(Dict,可調用的((任何],任何],pandas.core.series.Series],na_action:可選(str]=沒有一個 )→pyspark.pandas.series.Series¶ -
映射的值根據輸入對應係列。
用於替換在一係列與另一個值,每個值可能來自一個函數,一個
dict
。請注意
確保字典的大小並不大,因為它可能降低性能或拋出OutOfMemoryError由於巨大的表達式在火花。考慮輸入作為一個函數作為替代而不是在這種情況下。
- 參數
-
- 參數 功能、dict或pd.Series
-
對應的映射。
- na_action:
-
如果忽略、傳播NA值沒有通過他們對應的映射。
- 返回
-
- 係列
-
指數一樣調用者。
另請參閱
-
Series.apply
-
申請一係列更複雜的功能。
-
DataFrame.applymap
-
應用一個函數在整個DataFrame elementwise。
筆記
當
參數
是一個字典,值串聯在字典裏沒有(鍵)轉換為沒有一個
。但是,如果是一個字典dict
子類定義__missing__
(即為默認值提供了一個方法),那麼這個違約而不是使用沒有一個
。例子
> > >年代=ps。係列([“貓”,“狗”,沒有一個,“兔子”])> > >年代0的貓1隻狗2沒有3隻兔子dtype:對象
地圖
接受一個dict
。值中沒有發現dict
被轉換成沒有一個
,除非dict類型默認值(如。defaultdict
):> > >年代。地圖({“貓”:“小貓”,“狗”:“小狗”})0的小貓1隻小狗2沒有3沒有dtype:對象
它還接受一個熊貓係列:
> > >ps=pd。係列([“小貓”,“小狗”),指數=(“貓”,“狗”])> > >年代。地圖(ps)0的小貓1隻小狗2沒有3沒有dtype:對象
它還接受一個函數:
> > >def格式(x)- >str:…返回“我是一個{}”。格式(x)
> > >年代。地圖(格式)0我是一隻貓1我是一隻狗2我是一個沒有3我是一隻兔子dtype:對象
為了避免應用功能缺失值(和讓他們NaN) na_action =“忽略”可以使用:
> > >年代。地圖(“我是一個{}”。格式,na_action=“忽略”)0我是一隻貓1我是一隻狗2沒有3我是一隻兔子dtype:對象