pyspark.pandas.Series.autocorr¶
-
係列。
autocorr
( 期:int=1 )→浮動¶ -
計算lag-N自相關。
這種方法計算之間的皮爾遜相關係列及其改變自我。
請注意
排名使用火花的窗口的當前實現不指定分區規範。這導致所有數據進入單一分區在單一機器,可能會導致嚴重的性能下降。避免這種方法對非常大的數據集。
- 參數
-
- 期 int,默認1
-
滯後的申請之前執行自相關。
- 返回
-
- 浮動
-
和自我之間的皮爾遜相關self.shift(滯後)。
另請參閱
-
Series.corr
-
計算兩個係列之間的相關性。
-
Series.shift
-
變換指數所需數量的時期。
-
DataFrame.corr
-
計算兩兩相關的列。
筆記
如果沒有定義良好的皮爾森相關返回“南”。
例子
> > >年代=ps。係列([2,比上年,6,2,np。南,5,6])> > >年代。autocorr()-0.141219……> > >年代。autocorr(0)1.0……> > >年代。autocorr(2)0.970725……> > >年代。autocorr(- - - - - -3)0.277350……> > >年代。autocorr(5)-1.000000……> > >年代。autocorr(6)南
如果沒有定義良好的皮爾森相關,那麼將返回“南”。
> > >年代=ps。係列([1,0,0,0])> > >年代。autocorr()南