取消
顯示的結果
而不是尋找
你的意思是:

多少列δ引擎為三角洲表收集數據

Anand_Ladda
尊敬的貢獻者二世
1接受解決方案

接受的解決方案

Anand_Ladda
尊敬的貢獻者二世

默認情況下一個增量表有數據收集前32列。這個設置可以使用以下配置。

設置spark.databricks.delta.properties.defaults.dataSkippingNumIndexedCols = 3

不過有時間權衡大量的列集進行數據收集。您通常想要收集統計數據列用於過濾器,where子句的連接和你傾向於聚合性能。

在原帖子查看解決方案

1回複1

Anand_Ladda
尊敬的貢獻者二世

默認情況下一個增量表有數據收集前32列。這個設置可以使用以下配置。

設置spark.databricks.delta.properties.defaults.dataSkippingNumIndexedCols = 3

不過有時間權衡大量的列集進行數據收集。您通常想要收集統計數據列用於過濾器,where子句的連接和你傾向於聚合性能。

Baidu
map