pyspark.pandas.Series.autocorr

係列。 autocorr ( :int=1 )→浮動

計算lag-N自相關。

這種方法計算之間的皮爾遜相關係列及其改變自我。

請注意

排名使用火花的窗口的當前實現不指定分區規範。這導致所有數據進入單一分區在單一機器,可能會導致嚴重的性能下降。避免這種方法對非常大的數據集。

參數
int,默認1

滯後的申請之前執行自相關。

返回
浮動

和自我之間的皮爾遜相關self.shift(滯後)。

另請參閱

Series.corr

計算兩個係列之間的相關性。

Series.shift

變換指數所需數量的時期。

DataFrame.corr

計算兩兩相關的列。

筆記

如果沒有定義良好的皮爾森相關返回“南”。

例子

> > >年代=ps係列([2,比上年,6,2,np,5,6])> > >年代autocorr()-0.141219……> > >年代autocorr(0)1.0……> > >年代autocorr(2)0.970725……> > >年代autocorr(- - - - - -3)0.277350……> > >年代autocorr(5)-1.000000……> > >年代autocorr(6)

如果沒有定義良好的皮爾森相關,那麼將返回“南”。

> > >年代=ps係列([1,0,0,0])> > >年代autocorr()