介紹磚AutoML:玻璃盒自動化機器學習方法的發展
2021年5月27日 在公告
今天,我們宣布磚AutoML,一個工具,使數據團隊快速構建和部署的機器學習模型通過自動化的重任預處理,特征工程和模型訓練/調優。這次的發布,團隊可以選擇一個數據集,數據配置培訓,完全通過UI和部署模型。我們還提供一個先進經驗數據科學家可以訪問生成的筆記本與每個訓練模型的源代碼為productionization定製培訓或與專家合作。磚AutoML集成了磚毫升的生態係統,包括自動跟蹤試驗指標和參數MLflow和容易使團隊注冊和版本控製的模型磚模型注冊為部署。
一個玻璃盒子AutoML方法
今天,許多現有的AutoML工具是不透明的盒子裏,這意味著用戶不知道如何訓練模型。數據科學家碰壁時,用這些工具需要進行特定於域的修改或當他們從事這一行業需要審核原因監管。數據團隊然後必須投入的時間和資源來反向工程這些模型進行定製,這抵消了許多他們應該獲得的生產率增長。
這就是為什麼我們很興奮將客戶數據磚AutoML,一個玻璃盒子AutoMbeplay体育app下载地址L方法提供Python筆記本為每個模型訓練增加開發人員的工作流程。
數據科學家可以利用他們的專業領域和輕鬆地添加或修改細胞這些生成的筆記本。數據科學家還可以使用磚AutoML生成的筆記本安裝ML發展繞過需要編寫樣板代碼。
快速洞察數據集
除了模型訓練和選擇,磚AutoML創建一個數據探索筆記本給基本總結統計一個數據集。通過自動化數據探索階段,許多找到乏味,磚AutoML保存數據科學家的時間和允許他們很快腸道檢查,適合訓練數據集。數據探索筆記本使用熊貓剖析為用戶提供警告——基數高、相關性和null值,以及變量的分布信息。
學習毫升的最佳實踐
AutoML體驗集成了MLflow——我們的API跟蹤指標/參數在試驗,利用毫升最佳實踐來幫助提高生產力數據科學團隊:
- 從實驗頁麵,數據科學家可以比較試驗和登記服務模型在磚模型注冊。
- 我們生成的訓練筆記提供的所有代碼用來訓練一個給定的模型——從加載數據分割測試/列車優化hyperparameters顯示世鵬科技電子explainability情節。
AutoML公共預覽功能
磚AutoML公共預覽版截然不同的培訓結束了sklearn和xgboost模型(二進製和多級)分類和回歸問題。我們支持數據集與數值分類和時間戳的特性和自動處理一個炎熱的編碼和空汙名。訓練模型sklearn管道這樣所有的數據預處理是用推理的模型。
此外,磚AutoML有幾個高級選項。許多團隊正試圖從AutoML快速回答,所以客戶可以通過配置控製AutoML訓練能持續多久停止條件:牆上時鍾超時或試驗運beplay体育app下载地址行的最大數量。他們還可以配置評價指標排名模型性能。
開始使用磚AutoML公共預覽
磚AutoML現在公共預覽和磚機的學習經曆的一部分。開始:
- 使用左邊欄切換到“機器學習”的經曆來訪問數據磚AutoML通過UI。點擊“(+)創建“左邊導航欄,然後單擊“AutoML實驗”或導航到實驗頁麵,然後單擊“創建AutoML實驗”開始。
- 使用AutoML API,單行的調用,可以看到在我們的文檔。
準備開始或在試用磚AutoML嗎?閱讀更多關於磚AutoML以及如何使用它AWS,Azure,GCP。