pyspark.pandas.DataFrame.pct_change

DataFrame。 pct_change ( :int=1 )→pyspark.pandas.frame.DataFrame

當前和前一個元素之間的百分比變化。

請注意

這個API使用火花的窗口的當前實現不指定分區規範。這導致所有數據進入單一分區在單一機器,可能會導致嚴重的性能下降。避免這種方法對非常大的數據集。

參數
int,默認1

時間將形成變化百分比。

返回
DataFrame

例子

百分比變化在法國法郎、德國馬克、意大利裏拉從1980-01-01到1980-03-01。

> > >df=psDataFrame({“FR”:(4.0405,4.0963,4.3149),“GR”:(1.7246,1.7482,1.8519),“它”:(804.74,810.01,860.13)},指數=(“1980-01-01”,“1980-02-01”,“1980-03-01”])> > >dfFR GR它1980-01-01 4.0405 1.7246 804.741980-02-01 4.0963 1.7482 810.011980-03-01 4.3149 1.8519 860.13
> > >dfpct_change()FR GR它1980-01-01南南南1980-02-01 0.013810 0.013684 0.0065491980-03-01 0.053365 0.059318 0.061876

你可以設置時間轉移形成變化百分比

> > >dfpct_change(2)FR GR它1980-01-01南南南1980-02-01南南南1980-03-01 0.067912 0.073814 0.06883