pyspark.sql.DataFrame.checkpoint

DataFrame。 檢查點 ( 急切的:bool=真正的 )→pyspark.sql.dataframe.DataFrame

返回一個檢查點的版本DataFrame。檢查點可以用於截斷的邏輯計劃DataFrame在迭代算法,這是特別有用,這個計劃可能呈現指數級增長。它將被保存到文件目錄設置檢查站內SparkContext.setCheckpointDir ()

參數
急切的 bool,可選

是否這個檢查站DataFrame立即

筆記

這個API是實驗性的。