“Databricks是我們數據業務的核心,是我們獲取洞察的地方。”
- Errol Koolmeister, H&M人工智能技術和架構負責人
作為時尚和零售行業的主要顛覆者和創新者,H&M所做的一切都以數據為核心。隨著全球門店的快速開設,他們需要改善供應鏈和預測操作,以簡化成本,實現收入最大化。但他們的內置Hadoop係統削弱了他們吸收和分析數百萬客戶生成的數據的能力,這些數據是預測模型所需的。beplay体育app下载地址了解到他們已經達到了可伸縮性的上限,H&M轉向Databricks平台,以簡化基礎設施管理,實現大規模的性能數據管道,並簡化機器學習生命周期-允許他們做出數據驅動的決策,加Beplay体育安卓版本速業務增長。
遺留架構無法支持公司的發展
為了提高供應鏈效率,他們選擇利用數據和人工智能來改善決策和運營。然而,他們遺留的基於Hadoop的架構效率很低,無法擴展以滿足快速的業務需求。
- 來自70多個市場的5000多家商店的海量數據,每天有數百萬客戶。beplay体育app下载地址
- 數據工程麵臨的挑戰包括固定規模的集群、資源密集且擴展成本高的複雜基礎設施以及數據安全問題。
- 努力擴大業務規模,以支持數據科學工作,對抗來自各種孤立數據源的所有數據。
- 由於嚴重的DevOps延遲,導致上市時間受到影響,這影響了數據科學家快速構建、訓練和部署模型的能力。從構思到生產需要整整一年的時間。
簡化數據操作促進機器學習創新
Databricks為H&M提供了一個跨數據科學和工程的可擴展Beplay体育安卓版本和協作環境的平台,允許數據工程師和科學家專注於整個數據生命周期,而不是管理集群,以加beplay娱乐ios速業務供應鏈決策為目標快速訓練和操作模型。
- 具有自動化集群管理的完全托管Beplay体育安卓版本平台簡化了基礎設施管理和大規模操作。
- beplay娱乐ios支持多種語言(SQL, Scala, Python, R)的協作筆記本環境使不同的用戶團隊能夠以他們喜歡的語言一起工作-創建統一的跨團隊環境以提高生產力。
- 將Databricks平台與Azure以及ABeplay体育安卓版本pache Airflow和Kubernetes等技術集成,從而實現大規模彈性模型訓練。
更明智的決策,大幅節省成本
在H&M,即使單個模型精度提高0.1%,也會對業務產生巨大影響。通過Databricks, H&M讓每一位決策者都能更方便地訪問數據,使業務增長更快、更有針對性。
- 提高運營效率:自動伸縮集群等功能改善了從數據攝取到管理整個機器學習生命周期的操作,將運營成本降低了70%。
- 更好的跨團隊協作:為數據科學家和工程師提供的統一分析環境極大地減少了生產所需的組件數量,並且易於設置和管理。
- 巨大的業務影響,更快的洞察時間:在決策製定中更加細粒度的能力使他們能夠改善戰略決策和業務預測。