取消
顯示的結果
而不是尋找
你的意思是:

數據湖的承諾僅僅是關於數據的科學,數據分析和數據質量還可以的一個組成部分核心事務處理也?

MarcJustice
新的因素

前期,我想讓你知道,我不是一個資深數據騎師,所以我很抱歉如果這一主題已經覆蓋或僅僅是太簡單了還是狹窄的社區。說,我確實需要幫助的請隨時告訴我如果這是適當的在另一個方向。

為了實現數據科學的好處,數據分析,促進數據質量,我公司決定投資在建設數據湖。幾乎立刻我們的應用程序解決方案工程師發現可以/應該能夠獲得多域和/或掌握單一域數據通過數據API之上的,而不是依賴於多個應用程序API或消耗的API基於unmastered /認證的數據在源係統。假設數據湖的主要目標之一是提高數據質量,如何引入數據質量規則在規模沒有創建一個版本控製問題在您的API目錄中,你的應用程序所有者最終不能跟上,隻是變成了技術債務?湖的承諾不能僅僅是關於科學和分析,可以嗎?

3回複3

Aashita
貢獻者三世
貢獻者三世

@Marc巴內特,磚Lakehouse架構是理想的數據架構數據驅動的組織。最好結合了數據倉庫和數據質量湖泊為所有主要的數據提供一個單一的解決方案工作負載和支持用例從流媒體BI分析,數據科學和人工智能。理解什麼是Lakehouse架構從這開始//www.eheci.com/blog/2020/01/30/what-is-a-data-lakehouse.html?itm_data=lakehouse-link-lakehou..。

  1. 數據質量可以照顧磚的三角洲的生活表。這是一個比較傳統ETL和數據磚//www.eheci.com/blog/2021/09/08/5-steps-to-implementing-intelligent-data-pipelines-with-delta..。
  2. 版本控製:https://docs.www.eheci.com/notebooks/github-version-control.html

讓我知道如果你想了解一些具體的細節。我們來這裏是為了幫助!

Kaniz
社區經理
社區經理

嗨@Marc巴內特,隻是一個友好的後續。你還需要幫助,或@Aashita Ramteke’s響應幫助你找到解決方案了嗎?請讓我們知道。

嗨@Marc巴內特,

隻是一個友好的後續。做任何反應幫助你解決你的問題嗎?

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map