pyspark.pandas.DataFrame.pad

DataFrame。 ( :聯盟(int, str,沒有)=沒有一個,原地:bool=,限製:可選(int]=沒有一個 )→FrameLike

的同義詞DataFrame.fillna ()Series.fillna ()方法= ' ffill '

請注意

當前實現“ffill”使用火花的窗口沒有指定分區規範。這導致所有數據進入單一分區在單一機器,可能會導致嚴重的性能下降。避免這種方法對非常大的數據集。

參數
{0或指數}

1,不受支持。

原地 布爾,默認的錯誤

填寫的地方(不創建一個新的對象)

限製 int,默認沒有

如果指定方法,這是最大數量的連續向前/向後填補NaN值。換句話說,如果有差距超過這個數字的連續nan,隻有部分填滿。如果沒有指定方法,這是沿著整個軸的最大條目數,nan將填滿。必須大於0如果不是沒有

返回
DataFrame或係列

DataFrame或係列NA條目填滿。

例子

> > >psdf=psDataFrame({“一個”:(沒有一個,3,沒有一個,沒有一個),“B”:(2,4,沒有一個,3),“C”:(沒有一個,沒有一個,沒有一個,1),' D ':(0,1,5,4]},=(“一個”,“B”,“C”,' D '])> > >psdfA B C D0南南2.0 01 3.0 - 4.0南12南南南53南3.0 - 1.0 4

傳播非空值。

> > >psdfffill()A B C D0南南2.0 01 3.0 - 4.0南12 3.0 - 4.0南53 3.0 3.0 1.0 4

對係列

> > >ps=ps係列([2,4,沒有一個,3])> > >ps0 2.01 4.02南3 3.0dtype: float64
> > >psffill()0 2.01 4.02 4.03 3.0dtype: float64