pyspark.pandas.DataFrame.cumsum¶

DataFrame。 cumsum ( skipna:bool=真正的 )→FrameLike¶

返回累積求和DataFrame或係列軸。

返回一個DataFrame或一係列包含累計總和的大小相同。

請注意

當前實現cumsum使用火花的窗口沒有指定分區規範。這導致所有數據進入單一分區在單一機器,可能會導致嚴重的性能下降。避免這種方法對非常大的數據集。

參數

返回

另請參閱

例子

           > > >df=ps。DataFrame([[2.0,1.0),(3.0,沒有一個),(1.0,0.0]],列=列表(“AB”))> > >df一個B0 2.0 1.01 3.0南2 1.0 - 0.0
          

默認情況下,遍曆行和每一列的總和。

           > > >df。cumsum()一個B0 2.0 1.01 5.0南2 6.0 - 1.0
          

它的工作原理完全相同的串聯。

           > > >df。一個。cumsum()0 2.01 5.02 6.0名稱:dtype: float64
          

以前的

pyspark.pandas.DataFrame.cummax

下一個

pyspark.pandas.DataFrame.cumprod