2019年4月

這些功能和Databricks平台改進於2019年4月發布。Beplay体育安卓版本

請注意

發布是分階段的。您的Databricks帳戶可能要到最初發布日期後一周才會更新。

數據塊上的MLflow (GA)

2019年4月25日

Databricks上的托管MLflow現在普遍可用。Databricks上的MLflow提供了與Databricks安全模型和交互式工作空間完全集成的MLflow的托管版本。看到MLflow指南

Delta Lake on Databricks

2019年4月24日

Databricks已經開源了三角洲湖項目。Delta Lake是一個存儲層,通過樂觀的寫並發控製和快照隔離來提供ACID事務,從而為建立在HDFS和雲存儲上的數據湖帶來可靠性。Delta Lake還提供內置的數據版本控製,以便於回滾和重現報告。

請注意

以前被稱為Databricks Delta的項目現在是Delta Lake開源項目,加上Databricks上可用的優化。看到什麼是三角洲湖?

MLflow運行側欄

2019年4月9日至16日:2.95版本

現在,您可以在筆記本旁邊的側欄中查看MLflow運行和生成這些運行的筆記本修訂。在筆記本的右側工具欄中,單擊實驗圖標實驗的圖標

看到創建筆記本實驗

C5d係列Amazon EC2實例類型(測試版)

2019年4月9日至16日:2.95版本

的Beta版支持亞馬遜EC2 C5d係列

Databricks Runtime 5.3 (GA)

2019年4月3日

Databricks Runtime 5.3現在普遍可用。Databricks Runtime 5.3包含新的Delta Lake特性和升級,以及升級的Python、R、Java和Scala庫。

主要升級包括:

  • Databricks Delta時間旅行GA

  • MySQL表複製到Delta,公開預覽

  • 筆記本範圍的庫改進

  • 新的Databricks Advisor提示

有關詳情,請參閱Databricks Runtime 5.3(不支持)

Databricks Runtime 5.3 ML (GA)

2019年4月3日

使用Databricks Runtime 5.3用於機器學習,我們已經實現了Databricks Runtime ML的第一個GA !Databricks Runtime ML為機器學習和數據科學提供了一個現成的環境。它建立在Databricks Runtime之上,並添加了許多流行的機器學習庫,包括TensorFlow, PyTorch, Keras和XGBoost。它還支持使用Horovod進行分布式訓練。

這個版本建立在Databricks Runtime 5.3之上,帶有額外的庫,一些不同的庫版本,以及Conda包管理Python庫。Databricks Runtime 5.2 ML Beta版以來的主要新功能包括:

  • MLlib與MLflow的集成(私有預覽版),它為使用PySpark調優算法匹配的模型提供MLflow運行的自動日誌記錄CrossValidatorTrainValidationSplit

    如果您想參加預覽,請聯係您的Databricks帳戶代表。

  • PyArrow, Horovod和TensorboardX庫的升級。

    PyArrow的更新增加了使用的能力BinaryType當您執行基於箭頭的轉換並使其在pandas UDF中可用時。

有關更多信息,請參見Databricks Runtime 5.3 ML(不支持)。有關創建Databricks Runtime ML集群的說明,請參見介紹Databricks運行時機器學習