性能問題:創建增量表2 TB P…-磚- 10402

KuldeepChitraka · ‎01-31-2023

我們試圖創建一個增量表(cta語句)2 TB鋪文件及其花大量的時間大約12小時。

這是正常的。嗎?選擇調整/優化這是什麼?我們做錯了什麼嗎

集群:互動/ 30核心/ 320 GB內存/ 4工人

shan_chandra · ‎01-31-2023

@Kuldeep Chitrakar——請評估(解釋計劃)物理計劃cta查詢在創建表之前。下麵是幾件事可以驗證之前把集群規模。

卡米 · ‎01-31-2023

我沒有經驗2 tb的數據集,但我建議你檢查一下:

你能與我們分享一個屏幕從火花UI cta聲明(火花UI - >選擇cta - > - >階段總結指標和聚合度量)?

你能檢查下鑲花的大小文件創建δ表。?

Hubert_Dudek1 · ‎01-31-2023

請使用複製到三角洲(首先創建一個空表)或轉換為三角洲代替cta要快得多,而且過程將自動最優化。

磚