它是模擬考試的數據工程師助理
問題是:
數據工程團隊創造了一係列的表使用鑲花的數據存儲在外部係統。添加新行後的團隊注意到外部係統中的數據,查詢在磚不返回的新行。他們確定前麵的緩存數據,這個問題的原因。下列哪個方法將確保查詢返回的數據總是最新的?
選項是
答:表應該轉化為δ的格式
b表應該存儲在一個基於雲計算的外部係統
c寫的表應該刷新集群在下次查詢運行d表應該改變不包括元數據緩存
大腸的表應該更新在下次運行查詢
正確的答案是將一段時間我選擇D。
我的理解是,外部數據源不能保證酸和第一次從緩存中獲取數據。我們的選項是禁用緩存,或移動數據。隻是把表格格式不能幫助。
誰能幫助解釋為什麼轉換格式能解決問題嗎?
我認為所有包含在這部分的問題“將確保查詢返回的數據總是最新的“拚花外部表作為唯一的解決方案來解決這個問題我使用REFRESH table,這裏沒有提到的。不過,即便這並不是保證它總是最新的可以忘記刷新表的數據源。