嗨,夥計們,
你的建議關於如何創建一個medalion archeterure嗎?多少datalake區,存儲數據,數據庫用於存儲,如何anuthing嗎
我認為區域:
1。著陸區,文件存儲在數據庫/ landing_zone -磚。青銅存儲在/ bronze_container
2。轉換區,文件存儲在數據庫/ transformation_zone -磚。銀/ silver_container存儲
3所示。洞察力,文件存儲在數據庫/ insight_zone -磚。存儲在/ gold_container黃金
但是我有一個問題,從轉變區數據複製(/ transformed_zone和/ silver_container)
你認為,最佳實踐是什麼?
謝謝大家
湖泊和蜂巢metastore(外部表)我做了同樣的方式。
但現在在我看來:
你已經在使用統一目錄嗎?這個問題仍然在嗎?你越來越有被迫使用管理表。你不關心你的湖/ lakehouse結構。它仍然是越來越多的數據像DWH的DDL表示。你創建結構Metastore * * *加州大學管理位置(它使用id表存儲在一個存儲不是人類可讀的路徑)。
現在的問題是如何組織你的Metastore(目錄、數據庫表)遵循這個獎章拱門。那麼如何構建你的湖容器/目錄. .在我看來。
嗨@William Scardua,
我強烈建議你使用三角洲住表(DLT)為你的用例。請檢查這裏的文檔與示例筆記本https://docs.www.eheci.com/workflows/delta-live-tables/index.html