解決:Re:多少列三角洲引擎收集sta……-磚- 20914

Anand_Ladda · ‎06-23-2021

默認情況下一個增量表有數據收集前32列。這個設置可以使用以下配置。

設置spark.databricks.delta.properties.defaults.dataSkippingNumIndexedCols = 3

不過有時間權衡大量的列集進行數據收集。您通常想要收集統計數據列用於過濾器,where子句的連接和你傾向於聚合性能。

Anand_Ladda · ‎06-23-2021

默認情況下一個增量表有數據收集前32列。這個設置可以使用以下配置。

設置spark.databricks.delta.properties.defaults.dataSkippingNumIndexedCols = 3

不過有時間權衡大量的列集進行數據收集。您通常想要收集統計數據列用於過濾器,where子句的連接和你傾向於聚合性能。

磚