pyspark.pandas.DataFrame.spark.cache¶
-
火花。
緩存
( )→CachedDataFrame¶ -
當前DataFrame收益率和緩存。
的pandas-on-Spark DataFrame作為一個受保護的資源,其相應的數據緩存後就未執行的上下文。
如果你想手動指定StorageLevel,使用
DataFrame.spark.persist ()
另請參閱
-
DataFrame.spark.persist
例子
> > >df=ps。DataFrame(((2,3),(比上年,6),(6,比上年),(2,1。)),…列=(“狗”,“貓”])> > >df狗貓0 0.2 0.31)0.0 - 0.62 0.6 - 0.03 0.2 - 0.1
> > >與df。火花。緩存()作為cached_df:…打印(cached_df。數())…狗4貓4dtype: int64
> > >df=df。火花。緩存()> > >df。to_pandas()。的意思是(軸=1)0 0.251 0.302 0.303 0.15dtype: float64
uncache dataframe,使用unpersist函數
> > >df。火花。unpersist()
-