pyspark.pandas.groupby.GroupBy.fillna

GroupBy。 fillna ( 價值:可選(任何]=沒有一個,方法:可選(str]=沒有一個,:聯盟(int, str,沒有)=沒有一個,原地:bool=,限製:可選(int]=沒有一個 )→FrameLike

填補NA / NaN值組。

參數
價值 標量、dict係列

值用來填補。時而dict /一係列值為每一列指定使用哪一個值。不支持DataFrame。

方法 {“回填”、“bfill”,“墊”,“ffill”,沒有},默認沒有

方法用於填補重建索引係列墊/ ffill:傳播持續有效的觀察期待明年有效回填/ bfill:使用下一個有效的觀察來填補缺口

{0或指數}

1,不受支持。

原地 布爾,默認的錯誤

填寫的地方(不創建一個新的對象)

限製 int,默認沒有

如果指定方法,這是最大數量的連續向前/向後填補NaN值。換句話說,如果有差距超過這個數字的連續nan,隻有部分填滿。如果沒有指定方法,這是沿著整個軸的最大條目數,nan將填滿。必須大於0如果不是沒有

返回
DataFrame

DataFrame NA條目了。

例子

> > >df=psDataFrame({“一個”:(1,1,2,2),“B”:(2,4,沒有一個,3),“C”:(沒有一個,沒有一個,沒有一個,1),' D ':(0,1,5,4]},=(“一個”,“B”,“C”,' D '])> > >dfA B C D南0 0 1 2.01 1 4.0南12 2南南53 2 3.0 - 1.0 4

我們也可以傳播中向前或向後非空值組。

> > >dfgroupby([“一個”))(“B”]fillna(方法=“ffill”)sort_index()0 2.01 4.02南3 3.0名稱:B, dtype: float64
> > >dfgroupby([“一個”])fillna(方法=“bfill”)sort_index()B C D2.0南01 4.0南12 3.0 - 1.0 53 3.0 - 1.0 4