跳轉到主要內容

研究

Lakehouse:新一代的開放式平台,統一數據倉庫和先進的分析Beplay体育安卓版本

作者:邁克爾Armbrust Ali Ghodsi雷諾新馬泰Zaharia

文摘

本文認為,數據倉庫架構正如今天我們所知道的那樣將在未來幾年枯萎,取而代之的是一個新的體係結構模式,Lakehouse,將(i)是基於開放直接訪問數據格式,例如Apache拚花,(ii)一流的對機器學習和數據科學的支持,和(3)提供先進的性能。Lakehouses可以幫助解決幾個重大挑戰與數據倉庫,包括數據過時、可靠性、所有權的總成本、數據鎖定,用例支持有限。我們將討論如何行業已經朝著Lakehouses以及這種轉變如何可能影響數據管理工作。我們也從Lakehouse係統報告結果使用拚花與流行的雲數據倉庫在TPC-DS具有競爭力。

Baidu
map