pyspark.pandas.DataFrame.pct_change¶
-
DataFrame。
pct_change
( 期:int=1 )→pyspark.pandas.frame.DataFrame¶ -
當前和前一個元素之間的百分比變化。
請注意
這個API使用火花的窗口的當前實現不指定分區規範。這導致所有數據進入單一分區在單一機器,可能會導致嚴重的性能下降。避免這種方法對非常大的數據集。
- 參數
-
- 期 int,默認1
-
時間將形成變化百分比。
- 返回
-
- DataFrame
例子
百分比變化在法國法郎、德國馬克、意大利裏拉從1980-01-01到1980-03-01。
> > >df=ps。DataFrame({…“FR”:(4.0405,4.0963,4.3149),…“GR”:(1.7246,1.7482,1.8519),…“它”:(804.74,810.01,860.13)},…指數=(“1980-01-01”,“1980-02-01”,“1980-03-01”])> > >dfFR GR它1980-01-01 4.0405 1.7246 804.741980-02-01 4.0963 1.7482 810.011980-03-01 4.3149 1.8519 860.13
> > >df。pct_change()FR GR它1980-01-01南南南1980-02-01 0.013810 0.013684 0.0065491980-03-01 0.053365 0.059318 0.061876
你可以設置時間轉移形成變化百分比
> > >df。pct_change(2)FR GR它1980-01-01南南南1980-02-01南南南1980-03-01 0.067912 0.073814 0.06883