pyspark.sql.DataFrame.persist

DataFrame。 堅持 ( storageLevel:pyspark.storagelevel.StorageLevel=StorageLevel(真的,真的,假的,真的,1) )→pyspark.sql.dataframe.DataFrame

設置存儲水平持續的內容DataFrame在操作後第一次計算。這隻能用於分配一個新的存儲如果水平DataFrame沒有存儲水平集。如果沒有指定存儲級別默認值(MEMORY_AND_DISK_DESER)

筆記

默認的存儲水平發生了變化MEMORY_AND_DISK_DESERScala 3.0。