跳轉到主要內容
工程的博客

大規模按需網絡研討會:細粒度的需求預測

分享這篇文章

我們最近舉辦了一個研討會——生活星巴克如何預測需求規模與Facebook先知和磚嗎——在這個網絡研討會我們學到了為什麼需求預測是至關重要的零售/ CPG公司以及它如何使其他22個用例。數據科學經理Brendan O ' shaughnessy星巴克走我們通過星巴克如何大規模需求預測。我們也做了一個逐步演示如何執行細粒度的需求預測一天/存儲/ SKU水平磚和Facebook的先知

民主化與磚的金融時間序列分析。

幻燈片的研討會可以在這裏

為什麼細粒度的需求預測和星巴克如何嗎?

執行細粒度預測day-store-SKU超出傳統的能力,基於數據倉庫的預測工具。對產品不同的產品的需求,存儲和天,然而傳統的需求預測解決方案執行他們的預測綜合市場,周和推廣組水平。

通過引入磚統一數據分析平台,零售商們能夠看到兩位數的改進預測精度。Beplay体育安卓版本他們可以執行細粒度預測SKU,存儲和天以及包括數以百計的附加功能來提高模型的準確性。他們可以進一步加強他們的預測與定位和簡單的包含額外的數據集。他們這些預測的日常運行,為他們的規劃者和零售業務團隊提供及時的數據更好的執行。

在這個網絡研討會,我們回顧:

  • 如何執行細粒度的需求預測一天/商店/ SKU與磚嗎
  • 如何準確地預測時間序列數據,使用Facebook的先知
  • 同時,如何星巴克相對輕鬆地定製的預測嗎
  • 如何培養大量的使用事實上的分布式數據處理引擎模型,Apache火花™
  • 最後,我們提出了這個數據分析師和管理人員使用BI工具使驅動所需的決策所需的業務成果

在研討會結束後,我們舉行了問答。下麵是問題和答案:

問:你什麼模型版本控製技術應用於展示模型隨著時間的推移被提高?

我們的許多客戶使用beplay体育app下载地址MLflow跟蹤他們的實驗。他們可以使用MLflow跟蹤各種參數與這些模型和比較各模型的性能指標。這有助於跟蹤改進以及圖書館他們使用畫的見解。MLflow幫助把這些模型從實驗到生產速度更快。

問:為什麼使用udf來代替MLlib嗎?這是為了訪問嗎SciKit學模型?

我們使用的是udf所以我們可以靈活地利用任意數量的圖書館。Facebook的先知現在很流行,但有許多圖書館我們可以用時間序列。有些人比其他人更合適的在某些場景中。我們通過使用udf,得到最終的靈活性,同時利用並行化。

問:如何三角洲湖幫需求預測嗎?

周圍有很多問題如果我要大,這要花我多少錢?我們顯然想做的一件事就是利用雲計算和利用這些資源,運行我們的預測大規模盡可能快速和積極。當我們想要釋放這些資源雲提供商,我們不支付。當我這樣做,我和我的預測是什麼呢?我不想失去我畫的見解運行模型。這些結果是在一個數據幀最終,這意味著它們駐留在內存中。所以我們要做的是,我們堅持這些數據並存儲它。我們的首選格式是三角洲湖三角洲湖會讓我很快就與這個數據交互和打開一個表。通過持久化數據,我現在可以選擇把縮小集群數據,允許交互式查詢。我可以使用BI工具使這些模型可用於儲存或銷售經理。

問:Facebook的先知季節性時間序列是一個很好的解決方案。長期時間序列呢?預測的準確性是如何被確定的?

我同意Facebook的先知能夠很好地與季節的數據。與udf您可以使用華宇電腦和其他公共庫。你也可以嚐試RMSE和其他技術來找出哪些工作更適合你。先知有自己的工具來確定精度。

在我們的博客,Bilal演示仔細記錄的信息。的帖子,我們創建第二個UDF,計算評價指標。您可以使用任意數量的方法來評估這個並且考慮當你帶回來看看你的預測結果。

額外的零售/ CPG和需求預測資源

免費試著磚
看到所有工程的博客的帖子
Baidu
map