06-23-2021下午09:19
06-23-2021下午09:22
默認情況下一個增量表有數據收集前32列。這個設置可以使用以下配置。
設置spark.databricks.delta.properties.defaults.dataSkippingNumIndexedCols = 3
不過有時間權衡大量的列集進行數據收集。您通常想要收集統計數據列用於過濾器,where子句的連接和你傾向於聚合性能。
在原帖子查看解決方案
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。