Lakehouse:統一數據倉庫和高級分析的新一代開放平台Beplay体育安卓版本
摘要
本文認為,我們今天所知道的數據倉庫架構將在未來幾年內消亡,並被一種新的架構模式Lakehouse所取代,Lakehouse將(i)基於開放的直接訪問數據格式,如Apache Parquet, (ii)對機器學習和數據科學有一流的支持,(iii)提供最先進的性能。lakehouse可以幫助解決數據倉庫的幾個主要挑戰,包括數據陳舊、可靠性、總擁有成本、數據鎖定和有限的用例支持。我們將討論該行業是如何向lakehouse轉移的,以及這種轉變將如何影響數據管理工作。我們還報告了使用Parquet的Lakehouse係統的結果,該係統與TPC-DS上流行的雲數據倉庫具有競爭力。