你機器學習項目磚AutoML——現在一般可用!
2022年4月18日 在Beplay体育安卓版本平台的博客
機器學習(ML)的核心創新在產業,創造新的增值和降低成本的機會。同時,毫升是很難做到的,它需要大量的技巧和時間來構建和部署可靠的ML模式。磚AutoML——現在通常與磚(GA)運行時可用毫升10.4 -自動列車模型在一個數據集和生成可定製的源代碼,顯著減少了——毫升項目的價值。這個玻璃盒子的方法來自動化毫升提供了一個現實的生產較低的道路沒有代碼,同時也給毫升專家通過創建基線模型,他們可以引進繁殖,調整和改善。
磚AutoML能為你做什麼?
無論你的背景數據科學、AutoML可以幫助你生產機器學習很快。所有你需要的是一個訓練數據集和AutoML是否休息。AutoML準備訓練的數據、運行數據探索、試驗多個模型候選人,並生成一個Python筆記本與源代碼定製為每個試驗提供的數據集。它還會自動分配hyperparameter調優和記錄所有實驗在MLflow工件和結果。它是非常容易的開始AutoML,今天數以百計的客戶使用這個工具來解決各種各樣beplay体育app下载地址的問題。
Fabletics例如,利用AutoML——從數據準備部署——預測客戶流失模型。Allscripts領導者在電子醫療係統,應用AutoML改善客戶服務經驗通過預測中斷。客戶選擇Abeplay体育app下载地址utoML不僅簡單,而且其透明度和開放性。雖然大多數自動化機器學習解決方案在市場上現在不透明的盒子沒有能見度下罩,磚AutoML生成模型的源代碼編輯筆記,輸入數據的可視化和總結,和解釋功能重要性和模型的行為。
我們的客beplay体育app下载地址戶用例也意味著AutoML的廣泛的相關性。數據科學家的團隊Fabletics使用AutoML快速生成基線模型,他們可以調整和改進。Allscripts,另一方麵,前3客戶成功的工程師沒有背景數據科學能夠訓練和部署在幾周內分類模型。在這兩種情況下,結果是令人印象深刻——Fabletics能夠在30分鍾內生成和優化模型(之前已經數天),和Allscripts大規模改善客戶服務操作時把AutoML模型投入生產。AutoML現在新的ML行動的起點在兩家公司,以及他們的部署是多任務工作流的一部分在磚Lakehouse建造。
AutoML現在普遍可用,這是如何開始
磚AutoML現在一般可用(GA);這是如何與AutoML可以快速步驟-
步驟1:攝取數據到lakehouse。對於這個示例,我們想要一個預測基於服務器日誌的故障診斷模型,我們產生一些訓練數據。我們做這個在我們的筆記本,你可以進口,並在短短幾秒,攝取這些數據lakehouse
在本例中,有500萬行網絡日誌生成一些數據是偏向導致網絡故障和其他隨機數據用來模擬噪聲或不相關的數據。每一行的數據與一個分類標簽聲明如果係統沒有最近。
第二步:讓AutoML自動列車模型。我們可以簡單地為數據轉換成磚AutoML,告訴它,我們想讓它預測領域,和AutoML將培訓和跟蹤許多不同的方法創建最好的模型提供數據。即使作為一個經驗豐富的ML從業者,保存的時間通過自動遍曆許多模型和路麵產生的指標是驚人的。
步驟3:選擇最適合您的需求和優化模型。隻有幾分鍾AutoML能夠訓練幾個模型和生產性能指標模型。對於這個特定的數據,最好的模型是一個決策樹,但也有一個邏輯回歸模型,表現良好。兩種模型有滿意的f1分數,顯示了模型的驗證數據。但這還不是全部——每個模型由AutoML附帶可定製的源代碼筆記本特定的數據集和模型。這意味著一旦一個訓練有素的模型顯示承諾,它特別容易開始裁剪以滿足所需的閾值或規範。
步驟4:用MLflow部署。選擇最好的模型——正如你所定義的指標和MLflow模型注冊中心注冊它。在這裏,您可以使用服務模型MLflow模型服務磚作為REST端點。
準備好開始了嗎?兜風,或深入研究AutoML以下資源。