pyspark.sql.DataFrame.localCheckpoint

DataFrame。 localCheckpoint ( 急切的:bool=真正的 )→pyspark.sql.dataframe.DataFrame

返回一個局部檢查點的版本DataFrame。檢查點可以用於截斷的邏輯計劃DataFrame在迭代算法,這是特別有用,這個計劃可能呈現指數級增長。當地檢查站存儲在使用緩存的執行人子係統,因此他們不可靠。

參數
急切的 bool,可選

是否這個檢查站DataFrame立即

筆記

這個API是實驗性的。