跳轉到主要內容
Beplay体育安卓版本平台的博客

宣布與統一編目數據沿襲的可用性

分享這篇文章

更新:數據沿襲現在一般可用在AWS和Azure。

我們興奮地宣布數據沿襲統一目錄,所有數據和人工智能的統一治理解決方案資產lakehouse,現在可以在預覽。

這個博客將討論數據沿襲的重要性,一些常見的用例,我們的願景為更好的數據透明度和數據與數據沿襲和先睹為快的一些數據出處和我們建立治理功能。

數據沿襲和為什麼它是重要的是什麼?

數據沿襲了轉換和細化的數據從源洞察力。家族包括捕捉所有相關的元數據和事件相關的數據在其生命周期,包括數據集的來源,其他數據集被用來創建它,誰創造了它,當轉換進行了什麼,哪些數據集利用它,和許多其他事件和屬性。數據沿襲的解決方案,數據團隊得到一個端到端視圖的數據轉換,以及它如何流經他們的數據。

隨著越來越多的組織接受數據驅動的文化,建立過程和工具和艾城的民主化和規模數據,數據沿襲正在成為一個務實的數據管理的一個重要支柱和治理策略。

理解數據沿襲的重要性,強調了一些常見的用例我們聽到了下麵的我們的客戶。beplay体育app下载地址

影響分析

經過多個更新或修改的數據在其生命周期,和理解任何數據變化的潛在影響下遊消費者成為重要的從風險管理的角度來看。數據與數據沿襲,團隊可以看到所有下遊消費者——應用程序,儀表板,機器學習模型或數據集,等等——數據變化的影響,理解影響的嚴重程度,並通知相關的利益相關者。血統也幫助IT團隊積極溝通數據遷移到合適的團隊,確保業務連續性。

數據理解和透明度

組織處理來自多個數據源的數據的大量湧入,以及建立一個更好地理解周圍環境的數據是至關重要的,以確保數據的可信度。數據沿襲領導人是一個強大的工具,使數據驅動更好的透明度和理解數據的組織。數據血統也使消費者如數據科學家,工程師和數據分析師是環境敏感,因為他們執行分析,導致質量更好的結果。最後,數據管理員可以看到哪些數據集不再訪問或已經過時的退休不必要的數據,確保數據質量對最終業務用戶。

調試和診斷

你可以擁有所有的製衡,但最終將打破。數據沿襲幫助數據團隊執行任何錯誤的根源分析他們的數據管道、應用程序、儀表板、機器學習模型等,通過跟蹤誤差的來源。這大大減少了調試時間,保存幾天,或者在許多情況下,幾個月的手工工作。

合規和審計準備

許多合規規定,如一般的數據保護監管(GDPR),加州消費者隱私法案》(CCPA),健康保險流通與責任法案(hipaa),巴塞爾銀行監管委員會(BCBS) 239年,薩班斯-奧克斯利法案(SOX),要求組織有清晰的理解和可見性的數據流。結果,數據可追溯性成為一個關鍵需求為了他們的數據架構,以滿足法律法規。數據沿襲幫助組織兼容audit-ready,從而減輕了操作的開銷手動創建數據流的跟蹤審計報告的目的。

毫不費力的透明度和主動控製與數據沿襲

lakehouse提供了一種實用的數據管理體係結構,大大簡化了企業數據通過統一的數據倉庫基礎設施和加速創新和AI用例在單一平台。Beplay体育安卓版本我們相信數據沿襲是更好的透明度和數據理解的關鍵推動者lakehouse,出現數據之間的關係,工作,和消費者,幫助組織朝著積極的數據管理實踐。例如:

  • 儀表板的主人,你下次要通知表儀表板取決於不是正確加載?
  • 作為機器學習的醫生開發一個模型,你要提醒你的模型的一個關鍵特性很快就會過時嗎?
  • 作為一個治理管理,你想自動控製對數據的訪問基於它的出處?

所有的這些功能依賴自動收集數據沿襲所有用例和角色——這就是為什麼lakehouse和數據沿襲一個強大的組合。

這裏有一些特性我們航運的預覽:

數據沿襲表

表列數據沿襲

數據沿襲了筆記本、工作流、儀表板

  • 內置的安全:譜係圖在統一目錄privilege-aware和共享相同的權限模型統一目錄。如果用戶沒有訪問一個表,他們將無法探索相關的血統表,添加一個額外的安全層隱私方麵的考慮。
  • 通過REST API很容易出口:可以可視化的血統數據瀏覽在接近實時檢索通過REST API來支持集成合作夥伴與我們的目錄。

開始使用在統一編目數據沿襲

數據沿襲可用磚溢價和企業層沒有額外的成本。如果你已經是一個磚客戶,按照數據沿襲指南(AWS|Azure)開始。如果你沒有一個現有的磚客戶,注冊一個免費試用溢價或企業工作空間。

免費試著磚

相關的帖子

看到所有Beplay体育安卓版本平台的博客的帖子
Baidu
map