2019年4月
這些功能和Databricks平台改進於2019年4月發布。Beplay体育安卓版本
請注意
發布是分階段的。您的Databricks帳戶可能要到最初發布日期後一周才會更新。
數據塊上的MLflow (GA)
2019年4月25日
Databricks上的托管MLflow現在普遍可用。Databricks上的MLflow提供了與Databricks安全模型和交互式工作空間完全集成的MLflow的托管版本。看到MLflow指南。
Delta Lake on Databricks
2019年4月24日
Databricks已經開源了三角洲湖項目。Delta Lake是一個存儲層,通過樂觀的寫並發控製和快照隔離來提供ACID事務,從而為建立在HDFS和雲存儲上的數據湖帶來可靠性。Delta Lake還提供內置的數據版本控製,以便於回滾和重現報告。
請注意
以前被稱為Databricks Delta的項目現在是Delta Lake開源項目,加上Databricks上可用的優化。看到什麼是三角洲湖?。
MLflow運行側欄
2019年4月9日至16日:2.95版本
現在,您可以在筆記本旁邊的側欄中查看MLflow運行和生成這些運行的筆記本修訂。在筆記本的右側工具欄中,單擊實驗圖標。
看到創建筆記本實驗。
Databricks Runtime 5.3 (GA)
2019年4月3日
Databricks Runtime 5.3現在普遍可用。Databricks Runtime 5.3包含新的Delta Lake特性和升級,以及升級的Python、R、Java和Scala庫。
主要升級包括:
Databricks Delta時間旅行GA
MySQL表複製到Delta,公開預覽
筆記本範圍的庫改進
新的Databricks Advisor提示
有關詳情,請參閱Databricks Runtime 5.3(不支持)。
Databricks Runtime 5.3 ML (GA)
2019年4月3日
使用Databricks Runtime 5.3用於機器學習,我們已經實現了Databricks Runtime ML的第一個GA !Databricks Runtime ML為機器學習和數據科學提供了一個現成的環境。它建立在Databricks Runtime之上,並添加了許多流行的機器學習庫,包括TensorFlow, PyTorch, Keras和XGBoost。它還支持使用Horovod進行分布式訓練。
這個版本建立在Databricks Runtime 5.3之上,帶有額外的庫,一些不同的庫版本,以及Conda包管理Python庫。Databricks Runtime 5.2 ML Beta版以來的主要新功能包括:
MLlib與MLflow的集成(私有預覽版),它為使用PySpark調優算法匹配的模型提供MLflow運行的自動日誌記錄
CrossValidator
和TrainValidationSplit
。如果您想參加預覽,請聯係您的Databricks帳戶代表。
PyArrow, Horovod和TensorboardX庫的升級。
PyArrow的更新增加了使用的能力
BinaryType
當您執行基於箭頭的轉換並使其在pandas UDF中可用時。
有關更多信息,請參見Databricks Runtime 5.3 ML(不支持)。有關創建Databricks Runtime ML集群的說明,請參見介紹Databricks運行時機器學習。