pyspark.pandas.DataFrame.spark.cache

火花。 緩存 ( )→CachedDataFrame

當前DataFrame收益率和緩存。

的pandas-on-Spark DataFrame作為一個受保護的資源,其相應的數據緩存後就未執行的上下文。

如果你想手動指定StorageLevel,使用DataFrame.spark.persist ()

另請參閱

DataFrame.spark.persist

例子

> > >df=psDataFrame(((2,3),(比上年,6),(6,比上年),(2,1。)),=(“狗”,“貓”])> > >df狗貓0 0.2 0.31)0.0 - 0.62 0.6 - 0.03 0.2 - 0.1
> > >df火花緩存()作為cached_df:打印(cached_df())狗4貓4dtype: int64
> > >df=df火花緩存()> > >dfto_pandas()的意思是(=1)0 0.251 0.302 0.303 0.15dtype: float64

uncache dataframe,使用unpersist函數

> > >df火花unpersist()