建立在一個開放的lakehouseDatabricks Machine Learning使ML團隊能夠準備和處理數據,簡化跨團隊協作,並標準化從實驗到生產的整個ML生命周期。
自動化實驗跟蹤和管理
Managed MLflow自動跟蹤您的實驗並記錄參數、指標、數據和代碼的版本,以及每次訓練運行的模型工件。您可以根據需要快速查看以前的運行,比較結果並重現過去的結果。一旦您確定了用於生產的模型的最佳版本,將其注冊到model Registry以簡化部署生命周期中的交接。
管理從數據到生產的整個模型生命周期
一旦訓練好的模型被注冊,您就可以通過Model Registry在它們的生命周期中協作地beplay娱乐ios管理它們。模型可以通過不同的階段進行版本控製和移動,比如實驗、分期、生產和存檔。生命周期管理根據基於角色的訪問控製與審批和治理工作流集成。評論和電子郵件通知為數據團隊提供了豐富的協作環境。beplay娱乐ios
大規模和低延遲部署ML模型
隻需單擊就可以部署模型,而不必擔心服務器管理或規模限製。使用Databricks,您可以將模型部署為具有企業級可用性的任何地方的REST API端點。
產品組件
beplay娱乐ios協作筆記本
Databricks筆記本本機支持Python、R、SQL和Scala,因此從業者可以與他們選擇的語言和庫一起工作,以發現、可視化和分享見解。
機器學習運行時
一鍵訪問預先配置的ML優化集群,由最流行的ML框架(如PyTorch, TensorFlow和scikit-learn)的可伸縮和可靠分發提供支持,並具有內置優化,可大規模提供無與倫比的性能。
特色商店
利用基於數據譜係的特性搜索,利用自動記錄的數據源,促進特性的重用。通過簡化的模型部署(不需要對客戶端應用程序進行更改)使功能可用於培訓和服務。
AutoML
通過AutoML的“玻璃盒”方法為從ML專家到公民數據科學家的每個人提供支持,該方法不僅提供性能最高的模型,而且還生成代碼供專家進一步優化。
管理MLflow
托管MLflow構建在MLflow(世界領先的ML生命周期開源平台)之上,幫助ML模型快速從實驗轉向生產,具有企業Beplay体育安卓版本安全性、可靠性和可擴展性。
生產級模型服務
一鍵式簡單地為任何規模的模型提供服務,並可選擇利用無服務器計算。
模型的監控
實時監控模型性能以及它如何影響業務指標。Databricks提供從生產模型到源數據係統的端到端可見性和沿襲,幫助分析整個ML生命周期的模型和數據質量,並在問題產生破壞性影響之前查明問題。
回購
Repos允許工程師在Databricks中遵循Git工作流,使數據團隊能夠利用自動化的CI/CD工作流和代碼可移植性。