2019年7月
這些功能和Databricks平台的改進於2019年7月發布Beplay体育安卓版本。
請注意
發布是階段性的。您的Databricks帳戶最多在初始發布日期後一周才能更新。
即將發布:Databricks 6.0將不支持Python 2
由於預計Python 2即將在2020年結束生命,Databricks Runtime 6.0將不支持Python 2。Databricks Runtime的早期版本將繼續支持Python 2。我們預計在2019年晚些時候發布Databricks Runtime 6.0。
思想門戶
2019年7月30日
我們的新思想門戶,由Aha!,可以讓您直接向Databricks產品團隊提供反饋,在決策者進行產品規劃和開發過程時,將您的功能請求放在他們麵前。使用創意門戶網站:
輸入特性請求。
查看、評論和投票給其他用戶的請求。
監視你最喜歡的想法的進展,看著它們變成功能。
要開始,隻需單擊幫助在Databricks工作區的左下角,選擇反饋,並按照提示操作。
在池空閑實例上預加載Databricks Runtime版本
2019年7月30日至8月6日:2.103版本
現在,您可以通過選擇Databricks Runtime版本來加載池中的空閑實例,從而加快池支持的集群啟動速度。Pool UI上的字段被調用預加載Spark版本.
自定義集群標記和池標記一起使用效果更好
2019年7月30日至8月6日:2.103版本
本月早些時候,Databricks介紹了池,這是一組空閑實例,可以幫助您快速啟動集群。在最初的版本中,池支持的集群從池配置中繼承了默認和自定義標記,並且您不能在集群級別上修改這些標記。現在可以配置特定於池支持的集群的自定義標記,該集群將應用所有自定義標記,無論是從池繼承的還是專門分配給該集群的。不能添加與從池繼承的自定義標記具有相同鍵名的特定於集群的自定義標記(也就是說,不能覆蓋從池繼承的自定義標記)。詳細信息請參見池標簽.
MLflow 1.1帶來了一些UI和API改進
2019年7月30日至8月6日:2.103版本
MLflow 1.1引入了幾個新特性來提高UI和API的可用性:
如果運行次數超過100次,運行概述UI現在允許您瀏覽多個運行頁麵。運行100次後,單擊加載更多按鈕加載接下來的100次運行。
比較運行UI現在提供了一個平行坐標圖。該圖表允許您觀察n維參數集和度量之間的關係。它將所有運行可視化為基於度量值(例如精度)的顏色編碼的行,並顯示每次運行所采用的參數值。
現在您可以在實驗搜索視圖中的運行概述UI和視圖標記中添加和編輯標記。
新MLflowContext API允許您以類似於Python API的方式創建和記錄運行。這個API與現有的低級API形成對比
MlflowClient
API,它簡單地包裝了REST API。方法從MLflow運行中刪除標記DeleteTag API.
詳細信息請參見MLflow 1.1博客文章.有關功能和修複程序的完整列表,請參見MLflow更新日誌.
Databricks運行時5.5 with Conda (Beta)
2019年7月23日
β
Databricks運行時與Conda是在β.在即將發布的Beta版本中,受支持環境的內容可能會發生變化。更改可以包括包的列表或已安裝包的版本。Databricks Runtime 5.5 with Conda是在此基礎上構建的Databricks Runtime 5.5 LTS(不支持).
Databricks Runtime 5.5 with Conda發行版添加了一個新的筆記本範圍的庫API,以支持使用YAML規範更新筆記本的Conda環境(參見Conda文檔).
參見完整的發行說明Databricks運行時5.5 with Conda (Beta).
Databricks運行時5.5機器學習
2019年7月15日
Databricks運行時5.5 ML是建立在Databricks Runtime 5.5 LTS(不支持).它包含許多流行的機器學習庫,包括TensorFlow、PyTorch、Keras和XGBoost,並使用Horovod提供分布式TensorFlow訓練。
此版本包括以下新功能和改進:
添加了MLflow1.0 Python包
升級的機器學習庫
TensorFlow從1.12.0升級到1.13.1
PyTorch從0.4.1升級到1.1.0
Scikit-learn從0.19.1升級到0.20.3
單節點操作HorovodRunner
Databricks運行時5.5
2019年7月15日
Databricks Runtime 5.5現已可用。Databricks運行時5.5包含Apache Spark 2.4.3,升級的Python、R、Java和Scala庫,以及以下新特性:
三角洲湖在Databricks自動優化GA
Delta Lake在Databricks上改進了最小值、最大值和計數聚合查詢性能
AWS S3上對Delta表的Presto和Athena支持(公開預覽)
膠水目錄為Databricks metastore
具有改進的二進製文件數據源和標量迭代器pandas UDF(公開預覽)的更快的模型推斷管道
R筆記本中的秘密API
詳細信息請參見Databricks Runtime 5.5 LTS(不支持).