數據庫運行時5.3 ML(不支持)

Databricks在2019年4月發布了這張圖片。

Databricks Runtime 5.3 ML為機器學習和數據科學提供了一個現成的環境Databricks Runtime 5.3(不支持).Databricks Runtime for ML包含許多流行的機器學習庫,包括TensorFlow、PyTorch、Keras和XGBoost。它還支持使用Horovod進行分布式深度學習訓練。

有關更多信息,包括創建Databricks Runtime ML集群的說明,請參見用於機器學習的Databricks運行時

新功能

Databricks Runtime 5.3 ML構建在Databricks Runtime 5.3之上。有關Databricks Runtime 5.3中新增內容的信息,請參見Databricks Runtime 5.3(不支持)發行說明。除了庫更新, Databricks Runtime 5.3 ML引入了以下新特性:

  • MLflow+Apache火花MLlibDatabricks Runtime 5.3 ML支持自動日誌記錄MLflow運行為模型擬合使用PySpark調優算法CrossValidator而且TrainValidationSplit

    預覽

    此功能已在私人預覽.聯係您的Databricks銷售代表了解如何啟用它。

  • 將以下庫升級到最新版本:

    • PyArrow從0.8.0到0.12.1:BinaryType是由基於arrow的轉換支持的,可以在PandasUDF

    • 從0.15.2到0.16.0。

    • TensorboardX從1.4到1.6。

Databricks ML模型導出API已棄用。Databricks建議使用MLeap,它提供了更廣泛的MLlib模型類型的覆蓋範圍。欲知詳情,請瀏覽MLeap ML模型導出

係統環境

Databricks Runtime 5.3 ML的係統環境與Databricks Runtime 5.3的不同之處如下:

  • PythonPython 2集群為2.7.15,Python 3集群為3.6.5。

  • DBUtils: Databricks Runtime 5.3 ML中不包含庫工具(dbutils.library)

  • 對於GPU集群,NVIDIA GPU庫如下:

    • 396.44特斯拉的司機

    • CUDA 9.2

    • CUDNN 7.2.1

以下部分列出了Databricks Runtime 5.3 ML中包含的與Databricks Runtime 5.3中包含的不同的庫。

頂級庫

Databricks Runtime 5.3 ML包含以下頂層

Python庫

Databricks Runtime 5.3 ML使用Conda進行Python包管理。因此,與Databricks Runtime相比,預安裝的Python庫有很大的不同。下麵是使用Conda包管理器安裝的Python包和版本的完整列表。

圖書館

版本

圖書館

版本

圖書館

版本

absl-py

0.7.0

argparse

1.4.0

asn1crypto

0.24.0

阿斯特

是0.7.1

backports-abc

0.5

backports.functools-lru-cache

1.5

backports.weakref

1.0.post1

bcrypt

3.1.6

漂白劑

2.1.3

寶途

2.48.0

boto3

1.7.62

botocore

1.10.62

certifi

2018.04.16

cffi

1.11.5

chardet

3.0.4

cloudpickle

0.5.3

彩色光

0.3.9

configparser

3.5.0

密碼學

2.2.2

周期計

0.10.0

Cython

0.28.2

裝飾

4.3.0

docutils

0.14

entrypoints

0.2.3

enum34

1.1.6

et-xmlfile

1.0.1

funcsigs

1.0.2中

functools32

3.2.3-2

fusepy

2.0.4

期貨

3.2.0

使驚訝

0.2.2

grpcio

1.12.1

h5py

2.8.0

horovod

0.16.0

html5lib

1.0.1

idna

2.6

ipaddress

1.0.22

ipython

5.7.0

ipython_genutils

0.2.0

jdcal

1.4

Jinja2

2.10

jmespath

0.9.3

jsonschema

2.6.0

jupyter-client

5.2.3

jupyter-core

4.4.0

Keras

2.2.4

Keras-Applications

1.0.6

Keras-Preprocessing

1.0.5

kiwisolver

1.0.1

linecache2

1.0.0

llvmlite

0.23.1

lxml

4.2.1

減價

3.0.1

MarkupSafe

1.0

matplotlib

2.2.2

使走調

0.8.3

mleap

0.8.1

模擬

2.0.0

msgpack

0.5.6

nbconvert

5.3.1

nbformat

4.4.0

鼻子

1.3.7

nose-exclude

0.5.0

numba

0.38.0 + 0. g2a2b772fc.dirty

numpy

1.14.3

olefile

0.45.1

openpyxl

2.5.3

熊貓

0.23.0

pandocfilters

1.4.2

paramiko

2.4.1

pathlib2

2.3.2

容易受騙的人

0.5.0

pbr

5.1.1

pexpect

4.5.0

pickleshare

0.7.4

枕頭

5.1.0

皮普

10.0.1

厚度

3.11

prompt-toolkit

1.0.15

protobuf

3.6.1

psutil

5.6.0

psycopg2

2.7.5

ptyprocess

0.5.2

pyarrow

0.12.1

pyasn1

0.4.5

pycparser

2.18

Pygments

2.2.0

PyNaCl

1.3.0

pyOpenSSL

18.0.0

pyparsing

2.2.0

PySocks

1.6.8

Python

2.7.15

python-dateutil

2.7.3

pytz

2018.4

PyYAML

3.12

pyzmq

17.0.0

請求

2.18.4

s3transfer

0.1.13

scandir

1.7

scikit-learn

0.19.1

scipy

1.1.0

seaborn

0.8.1

setuptools

39.1.0

simplegeneric

0.8.1

singledispatch

3.4.0.3

六個

1.11.0

statsmodels

0.9.0

subprocess32

3.5.3

tensorboard

1.12.2

tensorboardX

1.6

tensorflow

1.12.0

termcolor

1.1.0

testpath

0.3.1

火炬

0.4.1

torchvision

0.2.1

龍卷風

正式

traceback2

1.4.0

traitlets

4.3.2

unittest2

1.1.0

urllib3

1.22

virtualenv

16.0.0

wcwidth

0.1.7

webencodings

0.5.1

Werkzeug

0.14.1

0.31.1

打包

1.10.11

wsgiref

0.1.2

此外,以下Spark包還包含Python模塊:

火花包

Python模塊

版本

graphframes

graphframes

0.7.0-db1-spark2.4

spark-deep-learning

sparkdl

1.5.0-db1-spark2.4

tensorframes

tensorframes

0.6.0-s_2.11

Java和Scala庫(Scala 2.11集群)

除了Databricks Runtime 5.3中的Java和Scala庫之外,Databricks Runtime 5.3 ML還包含以下jar:

組ID

工件ID

版本

com.databricks

spark-deep-learning

1.5.0-db1-spark2.4

com.typesafe.akka

akka-actor_2.11

2.3.11

ml.combust.mleap

mleap-databricks-runtime_2.11

0.13.0

ml.dmlc

xgboost4j

0.81

ml.dmlc

xgboost4j-spark

0.81

org.graphframes

graphframes_2.11

0.7.0-db1-spark2.4

org.tensorflow

libtensorflow

1.12.0

org.tensorflow

libtensorflow_jni

1.12.0

org.tensorflow

spark-tensorflow-connector_2.11

1.12.0

org.tensorflow

tensorflow

1.12.0

org.tensorframes

tensorframes

0.6.0-s_2.11