pyspark.pandas.Series.map

係列。 地圖 ( 參數:聯盟(Dict,可調用的((任何],任何],pandas.core.series.Series],na_action:可選(str]=沒有一個 )→pyspark.pandas.series.Series

映射的值根據輸入對應係列。

用於替換在一係列與另一個值,每個值可能來自一個函數,一個dict

請注意

確保字典的大小並不大,因為它可能降低性能或拋出OutOfMemoryError由於巨大的表達式在火花。考慮輸入作為一個函數作為替代而不是在這種情況下。

參數
參數 功能、dict或pd.Series

對應的映射。

na_action:

如果忽略、傳播NA值沒有通過他們對應的映射。

返回
係列

指數一樣調用者。

另請參閱

Series.apply

申請一係列更複雜的功能。

DataFrame.applymap

應用一個函數在整個DataFrame elementwise。

筆記

參數是一個字典,值串聯在字典裏沒有(鍵)轉換為沒有一個。但是,如果是一個字典dict子類定義__missing__(即為默認值提供了一個方法),那麼這個違約而不是使用沒有一個

例子

> > >年代=ps係列([“貓”,“狗”,沒有一個,“兔子”])> > >年代0的貓1隻狗2沒有3隻兔子dtype:對象

地圖接受一個dict。值中沒有發現dict被轉換成沒有一個,除非dict類型默認值(如。defaultdict):

> > >年代地圖({“貓”:“小貓”,“狗”:“小狗”})0的小貓1隻小狗2沒有3沒有dtype:對象

它還接受一個熊貓係列:

> > >ps=pd係列([“小貓”,“小狗”),指數=(“貓”,“狗”])> > >年代地圖(ps)0的小貓1隻小狗2沒有3沒有dtype:對象

它還接受一個函數:

> > >def格式(x)- >str:返回“我是一個{}格式(x)
> > >年代地圖(格式)0我是一隻貓1我是一隻狗2我是一個沒有3我是一隻兔子dtype:對象

為了避免應用功能缺失值(和讓他們NaN) na_action =“忽略”可以使用:

> > >年代地圖(“我是一個{}格式,na_action=“忽略”)0我是一隻貓1我是一隻狗2沒有3我是一隻兔子dtype:對象