加速器在這個解決方案中,我們將演示如何使用Apache火花™和Facebook先知™構建許多時間序列預測模型在並行數據磚Lakehouse平台。Beplay体育安卓版本
視頻記錄
需求預測是一個重要的實踐在大多數組織中。我們的目標是預測我們需要多少個人產品在特定的地點,和在什麼時候,這樣我們就可以最大化我們的銷售和最小化成本。最準確的預測要考慮具體地點的模式與產品相關聯的。但這需要我們生產大量的位置和特定於產品的預測。遺留方法與這個鬥爭——他們通常產生這些預測一次。很難度過所有的預測,需要時間來影響我們的操作。所以,很多組織做的是他們將聚集他們的商店,他們會聚集他們的產品,他們會預測總體層麵,然後分配它回去。這個過程是過度簡化和快速轉身,但大幅犧牲準確性。
單擊擴大→記錄
單擊崩潰記錄→
磚,我們可以采取不同的方法。我們可以利用的資源提供給我們在雲中,和分發工作。我們可以把它做的非常快。快速供應我們需要的資源,他們很快在不再需要時釋放。這是一個非常具有成本效益的方式,現在很多組織都以最準確的方式處理他們的預測需求。關鍵是理解模式實現預測。我們一起把這個解決方案加速器來幫助你準確預測。
這是我們的解決方案加速器大規模細粒度的預測。在這個演示中,我們使用一個公開的數據集生成一個預測500年一係列存儲和項目組合。我們花時間來審查數據在這個公開的數據集,理解其中的基本時態模式作為任何好的預測運動的一部分。然後我們開始工作在構建預測。在這裏你看到我們如何建立一個預測一個商店和一個產品組合。我們使用Facebook的先知,但我們絕不說這是唯一的方法。重點理解這是基本方法中,你可以用它來建立一個預測。如果你是一個數據科學家,看看這個,你應該快速了解我們如何接近這個問題使用標準的開源庫和熊貓DataFrames等功能。一旦你熟悉了,你生成的預測,我們可以研究如何規模這個,很簡單。
這是我們要做的:我們將用同樣的邏輯,我們之前看到的,我們要把它裏麵的一個函數,你看到函數定義。一旦它被封裝在一個函數,我們可以利用磚平台閱讀我們所有的曆史數據,由每個存儲和組織數據和項目組合。Beplay体育安卓版本實際上,每個存儲和項變成自己的單個分區的數據現在分布在我們的集群。如果我們想要解決這些500年存儲和項目組合使用四個工人,然後500年存儲項目組合分布在四個工人計算機集群內部的。如果我們想要更積極,處理10或20工人,或100名工人,這相同的代碼自動分配這個工作在這些工人,使他們能夠並行工作。
工作的應用,實際預測,發生在這裏。使用“applyInPandas”方法,然後簡單地使用這個函數之前,我們定義為每個商店然後建立一個預測和項目組合。所有這些預測的結果返回在一個單一的結果集,我們可以堅持,讓我們的分析師審查。這背後的細節被捕獲的筆記本底部這裏訪問。在這裏,您將看到所需的詳細的代碼來實現這項工作。你還會發現鏈接的數據集允許您創建在您的環境中,這是如何工作的和執行。你會發現代碼示例和解釋我們所做的,這樣您就可以更好地理解這個過程,然後將自己的需要。
對於很多組織不得不妥協他們的預測,這將是一個巨大的節省時間和資產業務。我們今天組織使用磚規模成百上千,甚至多個每天數以百萬計的product-location-specific預測。我們鼓勵你去試一試,看看它如何影響你的生意。
準備好開始了嗎?