取消
顯示的結果
而不是尋找
你的意思是:

數據沿襲視圖上

亨瑞克
新的貢獻者二世

我不知道這是故意行為的數據沿襲,但對我來說,這是奇怪的。
當我創建一個視圖基於兩個表的數據沿襲上遊看起來是正確的。但是當我替換的視圖隻使用一個表,然後數據沿襲上遊仍然告訴我的觀點是基於兩個表。
當我閱讀文檔時,它看起來像數據沿襲為視圖是基於曆史過去30天,但一個視圖並不與曆史表一樣,所以對我來說,這是奇怪的。
誰能給一些更多關於這種奇怪的行為?
這是我的腳本進行測試:

/ *創建2表* /
如果不存在test.test.table_1創建表
(int id不是零
、名稱字符串);

插入test.test.table_1
值(1,“測試1”);

如果不存在test.test.table_2創建表
(int id不是零
、名稱字符串);

插入test.test.table_2
值(1,“測試2”);

/ *創建一個視圖根據表* /

創建或替換test.test視圖。view_1作為
選擇
a.id
,b.name

test.test。table_1作為
內連接test.test。table_2 b
在a.id = b.id;

/ *
數據沿襲的觀點是正確的為視圖上遊table_1 table_2
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
* /

/ *現在變化隻取決於table_1 * /
test.test改變視圖。view_1作為
選擇
a.id
,a.name

test.test。table_1作為;

/ *
數據沿襲沒有改變!在上遊——我們仍然有兩個表視圖
* /

3回複3

Kaniz
社區經理
社區經理

@Henrik,

根據文檔,血統是計算一個30天的滾動窗口,所以血統收集了超過30天前不顯示。如果一個工作或查詢數據從表中讀取數據,並將其寫入表B, B表一和表之間的聯係是顯示隻有30天。此外,如果一個表重命名,血統不是捕獲的重命名表。因此,它是可能的數據沿襲上遊仍然隻顯示了兩個表即使視圖使用一個因為其他的血統信息表仍在30天的窗口。也有可能認為沒有充分取代,仍然是使用兩個表。

Vinay_M_R
重視貢獻二世
重視貢獻二世

@Henrik美好的一天!

我試圖重現這個問題在內部、我能夠繁殖,這似乎限製:

  • 統一目錄捕捉盡可能多的列級血統。然而,有些情況下,列級血統不能捕獲。

當我檢查下視圖定義細節後隻取決於table_1改變視圖。我發現視圖更新最新定義視圖但這不是反映在譜係圖。

https://docs.www.eheci.com/data-governance/unity-catalog/data-lineage.html的局限性

問候,

Vinay M R

亨瑞克
新的貢獻者二世

一些想法之後,我得出這個結論:

數據沿襲視圖上的工作應該期待。我強烈建議此功能重新設計它顯示最新的結果視圖。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map