Lakehouse肯定答案。確保您的數據是開放的,所以,任何人都可以進去讀它給予任何奇怪的格式可能在(JSON、拚花、csv、消息隊列、protobuf,等等),無論它可能存在(紅移,S3, Gen2 Teradata,卡夫卡,等等)是真正改變遊戲規則。你永遠不需要導入的數據到Lakehouse。這隻是自然會,像在S3。得到這些數據的好處湖泊,但結合數據倉庫的性能(然後)以及能力實施RDBMS-style模式和做符合acid表將操作(連接、合並、更新等),然後用光子組成低延遲儀表板使其成為一個全麵的端到端解決方案在未來幾年將會更快和更容易使用low-code /沒有代碼的用戶。
所有這一切放在一邊,73%的數據是未使用的,因為現在,對於大多數公司來說,這是艱苦的工作經曆和理解所有的數據,剔除它,格式,結合,實驗運行,列車模型等。它需要一個非常受歡迎的技能和時間/ $ $。我相信Lakehouse會讓你更聰明的人,他可能不會訓練數據工程師或科學家,能夠去處理數據來解決問題。# 1號計劃在磚是讓Lakehouse簡單處理,這樣每個公司可以完全數據驅動的。
< /咆哮>
Lakehouse肯定答案。確保您的數據是開放的,所以,任何人都可以進去讀它給予任何奇怪的格式可能在(JSON、拚花、csv、消息隊列、protobuf,等等),無論它可能存在(紅移,S3, Gen2 Teradata,卡夫卡,等等)是真正改變遊戲規則。你永遠不需要導入的數據到Lakehouse。這隻是自然會,像在S3。得到這些數據的好處湖泊,但結合數據倉庫的性能(然後)以及能力實施RDBMS-style模式和做符合acid表將操作(連接、合並、更新等),然後用光子組成低延遲儀表板使其成為一個全麵的端到端解決方案在未來幾年將會更快和更容易使用low-code /沒有代碼的用戶。
所有這一切放在一邊,73%的數據是未使用的,因為現在,對於大多數公司來說,這是艱苦的工作經曆和理解所有的數據,剔除它,格式,結合,實驗運行,列車模型等。它需要一個非常受歡迎的技能和時間/ $ $。我相信Lakehouse會讓你更聰明的人,他可能不會訓練數據工程師或科學家,能夠去處理數據來解決問題。# 1號計劃在磚是讓Lakehouse簡單處理,這樣每個公司可以完全數據驅動的。
< /咆哮>