理想情況下7天建議,但與數據討論利益相關者識別合適的是什麼?7/14/28天。
使用真空,首次運行一些對行為的分析你的數據。
識別%的操作執行更新和刪除和插入操作。這將告訴你有多少文件不再被引用了,需要清理。
了解真空之前和之後運行查詢的效率真空操作。提高性能的時間嗎?也許做真空在不同間隔7/14/28天。
和絕對使用真空如果有要求消滅特定場景的數據係統。
因此沒有腳本。但是,你可以試試這個:
% python # table_list =引發所有表的列表。sql(從<數據庫名稱>“顯示表”).select .rdd(“表”)。地圖(λx: x [0]) .collect table_name(表):火花。sql (f“真空{}”.format(表)
理想情況下7天建議,但與數據討論利益相關者識別合適的是什麼?7/14/28天。
使用真空,首次運行一些對行為的分析你的數據。
識別%的操作執行更新和刪除和插入操作。這將告訴你有多少文件不再被引用了,需要清理。
了解真空之前和之後運行查詢的效率真空操作。提高性能的時間嗎?也許做真空在不同間隔7/14/28天。
和絕對使用真空如果有要求消滅特定場景的數據係統。
因此沒有腳本。但是,你可以試試這個:
% python # table_list =引發所有表的列表。sql(從<數據庫名稱>“顯示表”).select .rdd(“表”)。地圖(λx: x [0]) .collect table_name(表):火花。sql (f“真空{}”.format(表)