減少計算成本
降低出口成本數據
數據管理和治理
在追求他們的數據策略提高上市時間,開始積極遷移的數據塊處理到雲上。一個重大障礙他們麵對的是大量的數據的高效管理的關鍵graph-related用例。這包含處理圖形數據庫,利用各種機器學習工具和優化性能pb的數據。此外,運營效率和可伸縮性問題源於跨不同業務單位的分散性質數據。麻煩這些係統之間的數據傳輸結合數據治理策略的孤立性質進一步複雜化,造成審計和策略實施的挑戰。
為應對這些挑戰,加快圖形分析,特別是在聯機分析處理(OLAP)模式下,塊選擇遷移到火花和選擇磚lakehouse平台。Beplay体育安卓版本這個決定讓他們鞏固所有數據和人工智能工作負載在一個統一的平台,授權數據科學家,工程師和AI從業者利用數據有效地從一個集中位置。Beplay体育安卓版本
作為約瑟夫*塊,軟件工程師解釋說,“采用磚作為一個集中的存儲和共享數據的平台跨業務單位授權建立一個蓬勃發展的數據塊市場。Beplay体育安卓版本這種獨特的設置使各個業務單元施加自己的控製,同時受益於企業集團的資源,從不同單位不同數據集的訪問權。”
目前,管理2 pb的數據塊的磚Lakehouse平台,預計在年底前達到4 pb。Beplay体育安卓版本大約70個不同的團隊跨業務單位,比如潮汐,現金應用,廣場和TBD 300活躍用戶積極利用這個平台。Beplay体育安卓版本
塊的一個關鍵需求是適當的實現和統一的數據治理策略,確保遵守隱私法GDPR和CCPA在客戶和內部團隊。beplay体育app下载地址目標是使安全和兼容的個人身份信息(PII)數據的訪問。為應對這些挑戰,塊采用統一目錄進行集中治理。
凱斯說,“介紹磚恰逢推出統一的目錄,消除評估替代數據治理工具的必要性。磚的無縫集成平台是統一編目的主要因素駕駛我們的選擇。”Beplay体育安卓版本
統一目錄,實現統一的視圖的數據塊房地產跨不同業務單元,簡化訪問權限管理。它也提供了靈活性分發成本歸因團隊間通過允許每個團隊的目錄存儲單元的分配和模式。這種方法使不同業務單位保持分布式數據治理策略,同時保證一個簡化的過程。
“統一目錄在促進安全發揮了關鍵作用和控製為不同的業務單位PII訪問敏感數據。它允許數據通過專用的訪問限製工作區,確保符合原始數據收集服務條款。這不僅是執行的業務單位收集數據,也對其他單位訪問,”凱斯說。塊計劃來增強這種能力通過實現潔淨室解決方案使用三角洲共享統一目錄,使安全和privacy-safe跨業務單位和合作夥伴生態係統。
塊還打算利用數據沿襲遵守right-to-forget場景。PII這涉及到跟蹤的使用數據在整個塊的生態係統,確保遵守數據隱私法規。
遷徙圖磚平台用例被證明是一個改變遊戲規則,提供實質性的提高計算性能和成本優化。Beplay体育安卓版本通過利用數據磚、塊設法降低計算成本時被一個令人印象深刻的12 x解鎖之前無法實現的用例由於比例限製。凱斯說,“消除這些限製與磚Lakehouse創新開辟了新的可能性和分析。”
統一目錄內的數據塊的實現生態係統帶來變革的好處。它幫助建立一個動態的“市場”不同業務部門之間的數據交換,促進協作和知識共享。這起到了至關重要的作用在減少數據出口相關費用跨雲提供者數據傳輸20%。
統一目錄也提高了我的緩解策略管理塊。以前,他們不得不在一個複雜的兩步審批過程,涉及附加我的政策角色然後S3 bucket。這往往導致桶政策限製和重構所需的權限。然而,統一編目,他們簡化這個過程通過配置亞群體級別訪問權限在單一位置。數據共享的操作效率明顯改善,減少所需的時間從幾天到秒。此外,采用統一的目錄推廣數據的收集到S3 bucket,從而提高員工的延遲和協同定位的計算和存儲。
此外,統一目錄授權塊屬性數據所有權和分散決策更容易。數據集可以與各自的主人,讓他們來決定如何共享數據。這種轉變從一個集中的團隊實施數據治理實際數據所有者決策改善遵從性和審計報告,提高整體數據治理和問責製。
展望未來,有很大的關注利用生成AI和llm的總體數據塊和人工智能策略,統一編目將扮演重要的角色在實現這一戰略的執政能力毫升模型以及數據從單一位置將加速AI和分析計劃。