數據集市

免費試著磚

什麼是數據集市?

一個數據集市是一個策劃設計的數據庫包括一組表為單個數據團隊的具體需求,社區,或業務部門,如市場營銷或工程部門。它通常是更小、更專注數據倉庫,以及普遍存在一個組織的大型企業數據倉庫的一個子集。數據集市通常用於分析、商業智能和報告。數據集市是進化的第一步在中央數據倉庫和數據的物理現實湖泊。尼爾森提供他們的客戶第一個數據集市在1970年代初為他們提供一種方式來存儲信息數字化和提高他們的銷售工作。

數據集市的特點

  • 通常構建和企業數據管理的團隊,盡管他們可以由業務單位建立和維護中小企業有機地結合起來。
  • 業務集團數據維護數據集市,管家和最終用戶隻讀訪問——他們可以查詢並查看表,但不能修改它們,為了阻止不需要的用戶不小心刪除或修改關鍵業務數據。
  • 通常使用一個維度模型和星型模式。
  • 包含一個策劃的數據子集從大的數據倉庫。數據是高度結構化的,潔淨的,符合企業數據團隊使其容易理解和查詢。
  • 設計獨特的一個特定的業務需要或用例。
  • 用戶通常使用查詢數據SQL命令

類型的數據集市:獨立的數據集市,從屬數據集市和混合數據集市

今天,有三種基本類型的數據集市:

  • 獨立的數據集市不屬於數據倉庫,非常類似於尼爾森提供的原始數據集市。他們通常專注於一個領域的業務或主題領域。數據來源可以包括內部和外部來源。然後翻譯,加工,加載到數據集市,它存儲到需要的地方。
  • 依賴的數據集市是建在一個現有的數據倉庫。使用自頂向下方法,支持所有數據的存儲在一個集中的位置。然後一個明確定義的部分數據被選中為目的的研究。
  • 混合數據集市把數據從數據倉庫和“其他”的數據源。這可能是有用的在各種情況下,包括提供臨時集成一個新組,或產品,它已被添加到一個組織。混合數據集市非常適合多個數據庫環境和提供快速實現轉變。這些係統使數據清理容易,與較小的以數據為中心的應用程序工作得很好。

數據集市的好處

  • 單一來源的真理——數據集市可以作為單一來源的真理為特定業務,所以每個人都相同的事實和數據。
  • 簡單——業務用戶尋找可以訪問策劃數據集市的數據容易獲得他們關心的數據,而不是通過遍曆整個數據倉庫和表聯接在一起,從而得到所需的數據。

挑戰與數據集市

企業數據倉庫的創建與善意為所有企業的數據管理需求。但總是,你不能讓每個人都滿意,不同的業務單位有不同的數據需求和目標。所以部門複製和創造他們自己的數據集市(有時在企業IT的幫助下),目的是增加一個特定的數據倉庫的主題領域,滿足他們的自助分析、部門報告的需要。結果,隨著時間的推移,數據集市可以成為數據倉庫和影子拷貝數據,從企業的角度來看,但他們所做的服務部門的需要。當許多部門這樣做——沒有單一版本的真相。

和數據集市Lakehouse如何解決的挑戰嗎

Lakehouse解決上麵提到的挑戰將所有企業數據倉庫和數據集市的一個平台,統一的安全性和治理,同時仍然提供不同的團隊有自己的沙箱的靈活性。Beplay体育安卓版本因為任何數據集市或“增強複製”是由在同一Lakehouse平台所有的其他人——Lakehouse的數據目錄發現,鑒於數據治理規則標簽和使用數Beplay体育安卓版本據字典等,確保增強複製為發現,防止類似的副本。

構建您的下一個數據集市上磚SQL

免費試磚SQL

資源

    回到術語表
    Glossary-Overview-Sidebar

    了解驅動Lakehouse模式。

    現在注冊
    Baidu
    map