2019年7月

這些功能和Databricks平台的改進於2019年7月發布Beplay体育安卓版本。

請注意

發布是階段性的。您的Databricks帳戶最多在初始發布日期後一周才能更新。

即將發布:Databricks 6.0將不支持Python 2

由於預計Python 2即將在2020年結束生命,Databricks Runtime 6.0將不支持Python 2。Databricks Runtime的早期版本將繼續支持Python 2。我們預計在2019年晚些時候發布Databricks Runtime 6.0。

思想門戶

2019年7月30日

我們的新思想門戶,由Aha!,可以讓您直接向Databricks產品團隊提供反饋,在決策者進行產品規劃和開發過程時,將您的功能請求放在他們麵前。使用創意門戶網站:

  • 輸入特性請求。

  • 查看、評論和投票給其他用戶的請求。

  • 監視你最喜歡的想法的進展,看著它們變成功能。

要開始,隻需單擊幫助圖標幫助在Databricks工作區的左下角,選擇反饋,並按照提示操作。

添加的想法

在池空閑實例上預加載Databricks Runtime版本

2019年7月30日至8月6日:2.103版本

現在,您可以通過選擇Databricks Runtime版本來加載池中的空閑實例,從而加快池支持的集群啟動速度。Pool UI上的字段被調用預加載Spark版本

預加載Spark版本

自定義集群標記和池標記一起使用效果更好

2019年7月30日至8月6日:2.103版本

本月早些時候,Databricks介紹了池,這是一組空閑實例,可以幫助您快速啟動集群。在最初的版本中,池支持的集群從池配置中繼承了默認和自定義標記,並且您不能在集群級別上修改這些標記。現在可以配置特定於池支持的集群的自定義標記,該集群將應用所有自定義標記,無論是從池繼承的還是專門分配給該集群的。不能添加與從池繼承的自定義標記具有相同鍵名的特定於集群的自定義標記(也就是說,不能覆蓋從池繼承的自定義標記)。詳細信息請參見池標簽

MLflow 1.1帶來了一些UI和API改進

2019年7月30日至8月6日:2.103版本

MLflow 1.1引入了幾個新特性來提高UI和API的可用性:

  • 如果運行次數超過100次,運行概述UI現在允許您瀏覽多個運行頁麵。運行100次後,單擊加載更多按鈕加載接下來的100次運行。

    分頁的運行
  • 比較運行UI現在提供了一個平行坐標圖。該圖表允許您觀察n維參數集和度量之間的關係。它將所有運行可視化為基於度量值(例如精度)的顏色編碼的行,並顯示每次運行所采用的參數值。

    平行坐標圖
  • 現在您可以在實驗搜索視圖中的運行概述UI和視圖標記中添加和編輯標記。

  • MLflowContext API允許您以類似於Python API的方式創建和記錄運行。這個API與現有的低級API形成對比MlflowClientAPI,它簡單地包裝了REST API。

  • 方法從MLflow運行中刪除標記DeleteTag API

詳細信息請參見MLflow 1.1博客文章.有關功能和修複程序的完整列表,請參見MLflow更新日誌

pandas數據幀顯示呈現就像它在Jupyter

2019年7月30日至8月6日:2.103版本

現在,當你調用pandas DataFrame時,它會像在Jupyter中一樣渲染。

顯示熊貓數據框架

新區域

2019年7月30日

Databricks現在可以在eu-west-3(巴黎)的特定工作空間使用。

Databricks運行時5.5 with Conda (Beta)

2019年7月23日

β

Databricks運行時與Conda是在β.在即將發布的Beta版本中,受支持環境的內容可能會發生變化。更改可以包括包的列表或已安裝包的版本。Databricks Runtime 5.5 with Conda是在此基礎上構建的Databricks Runtime 5.5 LTS(不支持)

Databricks Runtime 5.5 with Conda發行版添加了一個新的筆記本範圍的庫API,以支持使用YAML規範更新筆記本的Conda環境(參見Conda文檔).

參見完整的發行說明Databricks運行時5.5 with Conda (Beta)

設置池的權限(公開預覽)

2019年7月16日至23日:2.102版本

池UI現在支持設置誰可以管理池以及誰可以將集群附加到池的權限。

詳細信息請參見池訪問控製

Databricks運行時5.5機器學習

2019年7月15日

Databricks運行時5.5 ML是建立在Databricks Runtime 5.5 LTS(不支持).它包含許多流行的機器學習庫,包括TensorFlow、PyTorch、Keras和XGBoost,並使用Horovod提供分布式TensorFlow訓練。

此版本包括以下新功能和改進:

  • 添加了MLflow1.0 Python包

  • 升級的機器學習庫

    • TensorFlow從1.12.0升級到1.13.1

    • PyTorch從0.4.1升級到1.1.0

    • Scikit-learn從0.19.1升級到0.20.3

  • 單節點操作HorovodRunner

詳細信息請參見Databricks Runtime 5.5 LTS for ML(不支持)

Databricks運行時5.5

2019年7月15日

Databricks Runtime 5.5現已可用。Databricks運行時5.5包含Apache Spark 2.4.3,升級的Python、R、Java和Scala庫,以及以下新特性:

  • 三角洲湖在Databricks自動優化GA

  • Delta Lake在Databricks上改進了最小值、最大值和計數聚合查詢性能

  • AWS S3上對Delta表的Presto和Athena支持(公開預覽)

  • 膠水目錄為Databricks metastore

  • 具有改進的二進製文件數據源和標量迭代器pandas UDF(公開預覽)的更快的模型推斷管道

  • R筆記本中的秘密API

詳細信息請參見Databricks Runtime 5.5 LTS(不支持)

保持一個實例池處於備用狀態,以便快速啟動集群(公開預覽)

2019年7月9日至11日:2.101版本

為了減少集群啟動時間,Databricks現在支持將集群附加到預定義的空閑實例池。當連接到一個池時,集群從池中分配它的驅動程序和工作節點。如果池沒有足夠的空閑資源來滿足集群的請求,則通過從雲提供商分配新實例來擴展池。當附加的集群終止時,它使用的實例將返回到池中,並可由不同的集群重用。

當實例在池中空閑時,Databricks不向DBUs收費。實例提供程序計費不適用。看到定價

詳細信息請參見創建池

全球係列顏色

2019年7月9日至11日:2.101版本

現在,您可以指定一個係列的顏色應該在筆記本中的所有圖表中保持一致。看到各圖表的顏色一致性

全球係列顏色