pyspark.pandas.DataFrame.shift¶
-
DataFrame。
轉變
( 期:int=1,fill_value:可選(任何]=沒有一個 )→pyspark.pandas.frame.DataFrame¶ -
轉變DataFrame所需數量的時期。
請注意
當前實現的轉變沒有指定分區規範使用火花的窗口。這導致所有數據進入單一分區在單一機器,可能會導致嚴重的性能下降。避免這種方法對非常大的數據集。
- 參數
-
- 期 int
-
時期的轉變。可以積極或消極的。
- fill_value 對象,可選
-
新引入的標量值用缺失值。默認的dtype取決於自己。對於數值型數據,np。使用nan。
- 返回
-
- 複製輸入DataFrame,發生了變化。
例子
> > >df=ps。DataFrame({“Col1”:(10,20.,15,30.,45),…“Col2”:(13,23,18,33,48),…“Col3”:(17,27,22,37,52)},…列=(“Col1”,“Col2”,“Col3”])
> > >df。轉變(期=3)Col1 Col2 Col30南南南1南南南2南南南3 10.0 13.0 17.04 20.0 23.0 27.0
> > >df。轉變(期=3,fill_value=0)Col1 Col2 Col30 0 0 01 0 0 02 0 0 03 10 13日174二十23 27