取消
顯示的結果
而不是尋找
你的意思是:

Deltalkake vs三角洲表

Krish1
新的貢獻者二世

有人能給我湖和δ定義表好嗎?每個用例,是什麼相同點和不同點?抱歉我新磚ans的努力學習。

2回答2

Rishabh264
尊敬的貢獻者二世

三角洲湖是一個開源存儲層,旨在使可靠性數據湖泊。是基於Apache火花和提供的功能,如酸事務,模式執行,時間旅行。三角洲湖本質上是一個存儲格式,提供了一組功能用於管理數據在數據湖環境。

δ表,另一方麵,是使用三角洲湖創建的表存儲格式。湖三角洲表優化用於數據環境和提供ACID事務等特性,模式執行,時間旅行。δ表本質上是一種特定類型的表是建立在三角洲湖存儲格式。

總之,三角洲湖是一個存儲層,它提供了功能用於管理數據在數據湖環境,而三角洲表的表之上的三角洲湖為處理數據存儲格式,並提供優化的特性在數據湖環境。

Annapurna_Hiriy
新的貢獻者三世

湖和δ表在Apache三角洲湖項目相關的概念。延伸Apache火花與ACID(原子性、一致性、隔離、耐久性)湖泊功能數據。

三角洲湖提供了一個存儲層,使事務和可伸縮的數據處理上的雲存儲係統,如Hadoop分布式文件係統(HDFS) / Amazon S3 / ADLS。

參考:https://docs.delta.io/latest/delta-intro.html

δ表是一個數據收集表格的格式組織在三角洲湖。它代表一個表結構模式和相關數據存儲在一個三角洲湖格式。有兩種類型的三角洲表

  1. 管理表
  2. 非托管表

更多信息請參考以下文檔托管和非托管三角洲表:

https://docs.www.eheci.com/lakehouse/data-objects.html管理的表

湖和δ表的關鍵特性是相同的,它們包括:

ACID事務

模式的實施和發展

時間旅行

數據的可靠性

元數據管理

總之,三角洲湖是底層存儲層,提供事務性和可靠性的特性,而三角洲表代表了三角洲湖內板狀結構,提供ACID屬性,模式執行,版本控製等三角洲湖功能。三角洲表處理結構化數據的主要手段是在三角洲湖。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map