pyspark.pandas.DataFrame.cumsum¶
-
DataFrame。
cumsum
( skipna:bool=真正的 )→FrameLike¶ -
返回累積求和DataFrame或係列軸。
返回一個DataFrame或一係列包含累計總和的大小相同。
請注意
當前實現cumsum使用火花的窗口沒有指定分區規範。這導致所有數據進入單一分區在單一機器,可能會導致嚴重的性能下降。避免這種方法對非常大的數據集。
- 參數
-
- skipna 布爾,默認的真
-
排除NA / null值。如果整個行/列NA,結果將是NA。
- 返回
-
- DataFrame或係列
另請參閱
-
DataFrame.sum
-
返回DataFrame軸求和。
-
DataFrame.cummax
-
返回累積最大DataFrame軸。
-
DataFrame.cummin
-
返回累計最低DataFrame軸。
-
DataFrame.cumsum
-
返回累積求和DataFrame軸。
-
DataFrame.cumprod
-
返回累積產品DataFrame軸。
-
Series.sum
-
返回級數求和的軸。
-
Series.cummax
-
返回累積最大係列軸。
-
Series.cummin
-
返回累計最低係列軸。
-
Series.cumsum
-
返回累積求和係列軸。
-
Series.cumprod
-
返回累積產品係列軸。
例子
> > >df=ps。DataFrame([[2.0,1.0),(3.0,沒有一個),(1.0,0.0]],列=列表(“AB”))> > >df一個B0 2.0 1.01 3.0南2 1.0 - 0.0
默認情況下,遍曆行和每一列的總和。
> > >df。cumsum()一個B0 2.0 1.01 5.0南2 6.0 - 1.0
它的工作原理完全相同的串聯。
> > >df。一個。cumsum()0 2.01 5.02 6.0名稱:dtype: float64