pyspark.pandas.DataFrame.spark.cache¶

火花。 緩存 ( )→CachedDataFrame¶

當前DataFrame收益率和緩存。

的pandas-on-Spark DataFrame作為一個受保護的資源,其相應的數據緩存後就未執行的上下文。

如果你想手動指定StorageLevel,使用DataFrame.spark.persist ()

另請參閱

例子

           > > >df=ps。DataFrame(((2,3),(比上年,6),(6,比上年),(2,1。)),…列=(“狗”,“貓”])> > >df狗貓0 0.2 0.31)0.0 - 0.62 0.6 - 0.03 0.2 - 0.1
          

           > > >與df。火花。緩存()作為cached_df:…打印(cached_df。數())…狗4貓4dtype: int64
          

           > > >df=df。火花。緩存()> > >df。to_pandas()。的意思是(軸=1)0 0.251 0.302 0.303 0.15dtype: float64
          

uncache dataframe,使用unpersist函數

           > > >df。火花。unpersist()
          

以前的

pyspark.pandas.DataFrame.spark.frame

下一個

pyspark.pandas.DataFrame.spark.persist