pyspark.pandas.Series.fillna¶
-
係列。
fillna
( 價值:可選(任何]=沒有一個,方法:可選(str]=沒有一個,軸:聯盟(int, str,沒有)=沒有一個,原地:bool=假,限製:可選(int]=沒有一個 )→可選(pyspark.pandas.series.Series] ¶ -
填補NA / NaN值。
請注意
當前的實現方法的參數在fillna使用火花的窗口沒有指定分區規範。這導致所有數據進入單一分區在單一機器,可能會導致嚴重的性能下降。避免這種方法對非常大的數據集。
- 參數
-
- 價值 標量、dict係列
-
值用來填補。時而dict /一係列值為每一列指定使用哪一個值。不支持DataFrame。
- 方法 {“回填”、“bfill”,“墊”,“ffill”,沒有},默認沒有
-
方法用於填補重建索引係列墊/ ffill:傳播持續有效的觀察期待明年有效回填/ bfill:使用下一個有效的觀察來填補缺口
- 軸 {0或指數}
-
1,列不受支持。
- 原地 布爾,默認的錯誤
-
填寫的地方(不創建一個新的對象)
- 限製 int,默認沒有
-
如果指定方法,這是最大數量的連續向前/向後填補NaN值。換句話說,如果有差距超過這個數字的連續nan,隻有部分填滿。如果沒有指定方法,這是沿著整個軸的最大條目數,nan將填滿。必須大於0如果不是沒有
- 返回
-
- 係列
-
係列NA條目了。
例子
> > >年代=ps。係列([np。南,2,3,4,np。南,6),的名字=“x”)> > >年代0南1 2.02 3.03 4.04南5 6.0名稱:x, dtype: float64
南所有元素替換為0。
> > >年代。fillna(0)0 0.01 2.02 3.03 4.04 0.05 6.0名稱:x, dtype: float64
我們也可以向前或向後傳播非空值。
> > >年代。fillna(方法=“ffill”)0南1 2.02 3.03 4.04 4.05 6.0名稱:x, dtype: float64
> > >年代=ps。係列([np。南,“一個”,“b”,“c”,np。南),的名字=“x”)> > >年代。fillna(方法=“ffill”)0沒有12 b3 c4攝氏度名稱:x, dtype:對象