研究

Lakehouse:統一數據倉庫和高級分析的新一代開放平台Beplay体育安卓版本

作者:Michael Armbrust, Ali Ghodsi, reynolds Xin, Matei Zaharia

下載論文

摘要

本文認為,我們今天所知道的數據倉庫架構將在未來幾年內消亡,並被一種新的架構模式Lakehouse所取代,Lakehouse將(i)基於開放的直接訪問數據格式,如Apache Parquet, (ii)對機器學習和數據科學有一流的支持,(iii)提供最先進的性能。lakehouse可以幫助解決數據倉庫的幾個主要挑戰,包括數據陳舊、可靠性、總擁有成本、數據鎖定和有限的用例支持。我們將討論該行業是如何向lakehouse轉移的,以及這種轉變將如何影響數據管理工作。我們還報告了使用Parquet的Lakehouse係統的結果,該係統與TPC-DS上流行的雲數據倉庫具有競爭力。

相關內容

作者:Michael Armbrust, Tathagata Das,孫立文,Burak Yavuz,朱世雄,Mukul Murthy, Joseph Torres, Herman van Hovell, Adrian Ionescu, Alicja Łuszczak, michaola [Switakowski], michaola Szafra [nski], Xiao Li, Takuya Ueshin, Mostafa Mokhtar, Peter Boncz, Ali Ghodsi, Sameer Paranjpye, Pieter Senster, Reynold Xin, Matei Zaharia

作者:Michael Armbrust, Tathagata Das, Joseph Torres, Burak Yavuz,朱世雄,Reynold Xin, Ali Ghodsi, Ion Stoica, Matei Zaharia

作者:Shoumik Palkar, Firas Abuzaid, Peter Bailis, Matei Zaharia

作者:Michael Armbrust, reynolds S. Xin,程蓮,殷懷,Davies Liu, Joseph K. Bradley, Xiangrui孟,Tomer Kaftan, Michael J. Franklin, Ali Ghodsi, Matei Zaharia

作者:reynolds S. Xin, Josh Rosen, Matei Zaharia, Michael J. Franklin, Scott Shenker, Ion Stoica

Baidu
map