客戶的故事

建立一個運作高效的全渠道業務

R 390萬美元

由於生產力的提高而節省

25%

降低計算成本

英雄
Beplay体育安卓版本平台用例Lakehouse三角洲湖機器學習磚的SQLETL
Azure

Databricks Lakehouse讓我們能夠釋放分析和機器學習的力量。現在我們可以利用我們所有的數據來提供行業領先的購物體驗,同時提高運營效率。”

——Cezar Steinz (Via MLOps經理

巴西消費者依靠Viabeplay体育app下载地址(以前的Via Varejo)購買廣泛的商品和服務——從消費電子產品和家用電器到家具和信用卡。但由於數十年的筒倉數據影響著不同的業務決策,而且Hadoop數據倉庫非常複雜,無法促進機器學習創新,因此Via很難準確預測需求,這影響了他們的整個供應鏈。通過在Databricks Lakehouse平台上統一數據和分析,Via能夠開發一個可擴展的架構,使整個組織都能訪問Beplay体育安卓版本數據。這使得機器學習能夠更快地投入市場,並提供洞察,揭示關鍵的消費者趨勢,以優化業務運營,防止欺詐活動,並在接觸點上創建更有針對性的零售體驗。

將幾十年不相關的數據整合在一起

消費者在Via購物已有60多年的曆史,Via是一家擁有近1億客戶的巴西主要零售商。beplay体育app下载地址但由於數十年的數據錯位和孤立的渠道影響了整個組織的決策方式,Via的數據團隊努力拚湊出消費者需求的完整圖景,以塑造業務運營和供應鏈考慮因素。

由於業務的持久性和性質,Via擁有許多傳統的事務環境,包括一個構建在Hadoop上的大型機。多年來,他們將其與Teradata數據倉庫進行了整合,該數據倉庫管理複雜,無法支持數據科學家的需求,迫使他們在個人筆記本電腦上構建和訓練模型。如果沒有能力針對整個數據集進行協作和擴展訓練,數據科學家就無法在相關信息的背景下全麵評估見解。

Via MLOps經理Cezar Steinz表示:“協作是一大痛點,可擴展性也是一大痛點。“我們需要用完整的數據來訓練我們的模型。這可能超過240億行信息。在筆記本電腦上訓練這些模型是不可能的。”

這導致分析的準確性下降,從而破壞了從客戶旅程到欺詐預防的一切,最終降低了收入並減緩了增長。Via意識到,為了充分授權他們的數據科學家和分析師,他們不僅需要一個公共的數據層,還需要有效地協作操作數據的能力,以幫助供應鏈優化、需求預測等。beplay娱乐ios為了構建統一的數據結構並簡化分析和ML, Via轉向了Databricks。

數據治理、欺詐預防和消費者需求

Azure上的Databricks LakehouBeplay体育安卓版本se平台使Via能夠獲得有助於做出更好商業決策的見解,包括計算客戶流失、確定下一個最佳報價或行動(NBO/NBA)、檢測和減少欺詐,以及開發推動轉換和金融服務(信用個性化和其他支付方式)的定價模型。

通過lakehouse方法,Via現在對他們的數據有了一個用於分析和ML的共同視圖。Delta Lake用於提供數據一致性和可靠性,因為該公司構建ETL管道,通過與Power BI集成來提供BI儀表板,並支持ML模型的訓練。更重要的是,他們能夠以優異的表現和自信交付,這對滿足他們日常決策需求至關重要。

“Databricks為我們提供了更好的數據治理,”Steinz說。“通過Delta Lake,分析師可以訪問解決手頭特定用例所需的確切數據——例如,如果我們談論的是物流運營商,我們隻訪問相關的物流數據表。我們可以與合適的人分享特定的數據,這是最理想的。”Delta Lake還為Via提供了更好的可追溯性,這樣他們就可以更好地了解他們的數據是如何被使用的,以及他們是否可以在不同的ML模型中重用一些數據。

Feature Store是一個集中的功能存儲庫,為Via的數據科學家和分析師提供了輕鬆共享和發現功能的能力。這使得他們不僅能夠真正統一他們的數據,而且能夠真正統一訪問和使用數據的團隊,從而為業務做出更好、更明智的決策。“Databricks Feature Store使我們能夠創建一個健壯而穩定的環境來創建和重用模型所消耗的特性,”Steinz說。“這使得我們的數據科學家和分析師的工作效率更高,因為他們不再需要浪費時間每次都從頭開始將數據轉換為特征。”

由於他們的數據集中在湖屋,他們的分析師使用Databricks SQL快速分析數據,並通過Power BI儀表板和報告與其他業務共享見解。通過MLflow, Via的數據科學家能夠輕鬆地管理ML的整個生命周期——從跟蹤模型版本到運行實驗和審查結果。Steinz解釋說:“使用MLflow創建一個項目是至關重要的,因為它使得我們可以在任何平台上運行一個模型。”Beplay体育安卓版本“這意味著我們不再局限於如何部署ML來影響我們的業務。”

數據民主化和簡化ML模型

隨著數據性能的提高和數據科學對所有數據的處理,Via已經能夠快速開發和部署ML模型,幫助進行流失預測、產品推薦、欺詐和信用分析以及客戶行為分析。這些不同的用例使Via能夠提供安全的、高度針對性的購物體驗,以滿足變化無常的客戶的需求,從而提高轉化率和客戶終身價值。beplay体育app下载地址在分析方麵,對數據的統一視圖使他們能夠提取洞察,幫助指導戰略,從簡化供應鏈運營到新產品創新機會,讓客戶滿意。beplay体育app下载地址

從操作的角度來看,Databricks幫助降低了計算成本並促進了跨團隊協作。在整個數據組織中,Via實現了30%的生產力提高,估計總共節省了390萬雷亞爾。在Feature Store和自動化集群管理的幫助下,他們還發現數據處理成本下降了25%。

Steinz表示:“我們的數據部門以指數級增長,我們以快速、一致和高價值的交付滿足業務期望。“多虧了Databricks Lakehouse平台及其背後的專家,這才有可能實現。”Beplay体育安卓版本

展望未來,隨著數據民主化在他們的文化中根深蒂固,威盛已做好充分準備,通過利用數據和人工智能提供盡可能好的購買體驗,實現他們的使命,讓客戶的夢想成真。beplay体育app下载地址

    Baidu
    map