pyspark.pandas.DataFrame.backfill¶
-
DataFrame。
回填
( 軸:聯盟(int, str,沒有)=沒有一個,原地:bool=假,限製:可選(int]=沒有一個 )→FrameLike¶ -
的同義詞DataFrame.fillna ()或Series.fillna ()與
方法= ' bfill '
。請注意
當前實現“bfill”使用火花的窗口沒有指定分區規範。這導致所有數據進入單一分區在單一機器,可能會導致嚴重的性能下降。避免這種方法對非常大的數據集。
- 參數
-
- 軸 {0或指數}
-
1,列不受支持。
- 原地 布爾,默認的錯誤
-
填寫的地方(不創建一個新的對象)
- 限製 int,默認沒有
-
如果指定方法,這是最大數量的連續向前/向後填補NaN值。換句話說,如果有差距超過這個數字的連續nan,隻有部分填滿。如果沒有指定方法,這是沿著整個軸的最大條目數,nan將填滿。必須大於0如果不是沒有
- 返回
-
- DataFrame或係列
-
DataFrame或係列NA條目填滿。
例子
> > >psdf=ps。DataFrame({…“一個”:(沒有一個,3,沒有一個,沒有一個),…“B”:(2,4,沒有一個,3),…“C”:(沒有一個,沒有一個,沒有一個,1),…' D ':(0,1,5,4]…},…列=(“一個”,“B”,“C”,' D '])> > >psdfA B C D0南南2.0 01 3.0 - 4.0南12南南南53南3.0 - 1.0 4
向後傳播非空值。
> > >psdf。bfill()A B C D0 3.0 2.0 1.0 01 3.0 4.0 1.0 12南3.0 - 1.0 53南3.0 - 1.0 4
對係列
> > >ps=ps。係列([沒有一個,沒有一個,沒有一個,1])> > >ps0南1南2南3 1.0dtype: float64
> > >ps。bfill()0 1.01 1.02 1.03 1.0dtype: float64