Databricks Runtime 5.0 ML(測試版)
Databricks於2018年11月發布了這張照片。
Databricks Runtime 5.0 ML為機器學習和數據科學提供了一個現成的環境。它包含許多流行的庫,包括TensorFlow、Keras和XGBoost。它還支持使用Horovod進行分布式TensorFlow訓練。
有關詳細信息,包括創建Databricks運行時ML集群的說明,請參見介紹Databricks運行時機器學習.
新功能
Databricks Runtime 5.0 ML是建立在Databricks Runtime 5.0之上的。有關Databricks Runtime 5.0中新增功能的信息,請參閱Databricks Runtime 5.0(不支持)發行說明。除了Databricks Runtime 5.0中的新功能外,Databricks Runtime 5.0 ML還包括以下新功能:
HorovodRunner使用Horovod運行分布式深度學習訓練作業。
Conda支持包管理。
MLeap集成。
GraphFrames集成。
請注意
Databricks運行時ML版本將對基礎Databricks運行時版本進行所有維護更新。有關所有維護更新的列表,請參見Databricks運行時維護更新.
係統環境
Databricks Runtime 5.0與Databricks Runtime 5.0 ML的係統環境差異如下:
Python: Python 2集群2.7.15,Python 3集群3.6.5。
對於GPU集群,以下NVIDIA GPU庫:
特斯拉司機396.44
CUDA 9.2
CUDNN 7.2.1
庫
本節列出了Databricks Runtime 5.0中包含的庫與Databricks Runtime 5.0 ML中包含的庫之間的差異。
Python庫
Databricks Runtime 5.0 ML使用Conda進行Python包管理。以下是使用Conda包管理器安裝的Python包和版本的完整列表。
圖書館 |
版本 |
圖書館 |
版本 |
圖書館 |
版本 |
---|---|---|---|---|---|
absl-py |
0.6.1 |
argparse |
1.4.0 |
asn1crypto |
0.24.0 |
阿斯特 |
是0.7.1 |
backports-abc |
0.5 |
backports.functools-lru-cache |
1.5 |
backports.weakref |
1.0.post1 |
bcrypt |
3.1.4 |
漂白劑 |
2.1.3 |
寶途 |
2.48.0 |
boto3 |
1.7.62 |
botocore |
1.10.62 |
certifi |
2018.04.16 |
cffi |
1.11.5 |
chardet |
3.0.4 |
cloudpickle |
0.5.3 |
彩色光 |
0.3.9 |
configparser |
3.5.0 |
密碼學 |
2.2.2 |
周期計 |
0.10.0 |
Cython |
0.28.2 |
裝飾 |
4.3.0 |
docutils |
0.14 |
entrypoints |
0.2.3 |
enum34 |
1.1.6 |
et-xmlfile |
1.0.1 |
funcsigs |
1.0.2中 |
functools32 |
3.2.3-2 |
fusepy |
2.0.4 |
期貨 |
3.2.0 |
使驚訝 |
0.2.0 |
grpcio |
1.12.1 |
h5py |
2.8.0 |
horovod |
0.15.0 |
html5lib |
1.0.1 |
idna |
2.6 |
ipaddress |
1.0.22 |
ipython |
5.7.0 |
ipython_genutils |
0.2.0 |
jdcal |
1.4 |
Jinja2 |
2.10 |
jmespath |
0.9.3 |
jsonschema |
2.6.0 |
jupyter-client |
5.2.3 |
jupyter-core |
4.4.0 |
Keras |
2.2.4 |
Keras-Applications |
1.0.6 |
Keras-Preprocessing |
1.0.5 |
kiwisolver |
1.0.1 |
linecache2 |
1.0.0 |
llvmlite |
0.23.1 |
lxml |
4.2.1 |
減價 |
3.0.1 |
MarkupSafe |
1.0 |
matplotlib |
2.2.2 |
使走調 |
0.8.3 |
mleap |
0.8.1 |
模擬 |
2.0.0 |
msgpack |
0.5.6 |
nbconvert |
5.3.1 |
nbformat |
4.4.0 |
鼻子 |
1.3.7 |
nose-exclude |
0.5.0 |
numba |
0.38.0 + 0. g2a2b772fc.dirty |
numpy |
1.14.3 |
olefile |
0.45.1 |
openpyxl |
2.5.3 |
熊貓 |
0.23.0 |
pandocfilters |
1.4.2 |
paramiko |
2.4.1 |
pathlib2 |
2.3.2 |
容易受騙的人 |
0.5.0 |
pbr |
5.1.0 |
pexpect |
4.5.0 |
pickleshare |
0.7.4 |
枕頭 |
5.1.0 |
皮普 |
10.0.1 |
厚度 |
3.11 |
prompt-toolkit |
1.0.15 |
protobuf |
3.6.1 |
psycopg2 |
2.7.5 |
ptyprocess |
0.5.2 |
pyarrow |
0.8.0 |
pyasn1 |
0.4.4 |
pycparser |
2.18 |
Pygments |
2.2.0 |
PyNaCl |
1.3.0 |
pyOpenSSL |
18.0.0 |
pyparsing |
2.2.0 |
PySocks |
1.6.8 |
Python |
2.7.15 |
python-dateutil |
2.7.3 |
pytz |
2018.4 |
PyYAML |
3.12 |
pyzmq |
17.0.0 |
請求 |
2.18.4 |
s3transfer |
0.1.13 |
scandir |
1.7 |
scikit-learn |
0.19.1 |
scipy |
1.1.0 |
seaborn |
0.8.1 |
setuptools |
39.1.0 |
simplegeneric |
0.8.1 |
singledispatch |
3.4.0.3 |
六個 |
1.11.0 |
statsmodels |
0.9.0 |
subprocess32 |
3.5.3 |
tensorboard |
1.10.0 |
tensorflow |
1.10.0 |
termcolor |
1.1.0 |
testpath |
0.3.1 |
龍卷風 |
正式 |
traceback2 |
1.4.0 |
traitlets |
4.3.2 |
unittest2 |
1.1.0 |
urllib3 |
1.22 |
virtualenv |
16.0.0 |
wcwidth |
0.1.7 |
webencodings |
0.5.1 |
Werkzeug |
0.14.1 |
輪 |
0.31.1 |
打包 |
1.10.11 |
wsgiref |
0.1.2 |
此外,以下Spark包還包含Python模塊:
火花包 |
Python模塊 |
版本 |
---|---|---|
tensorframes |
tensorframes |
0.5.0-s_2.11 |
graphframes |
graphframes |
0.6.0-db3-spark2.4 |
spark-deep-learning |
sparkdl |
1.3.0-db2-spark2.4 |
R庫
R庫是相同的Databricks Runtime 5.0上的R庫.
Java和Scala庫(Scala 2.11集群)
除了Databricks Runtime 5.0中的Java和Scala庫之外,Databricks Runtime 5.0 ML還包含以下jar:
組ID |
工件ID |
版本 |
---|---|---|
com.databricks |
spark-deep-learning |
1.3.0-db2-spark2.4 |
org.tensorframes |
tensorframes |
0.5.0-s_2.11 |
org.graphframes |
graphframes_2.11 |
0.6.0-db3-spark2.4 |
org.tensorflow |
libtensorflow |
1.10.0 |
org.tensorflow |
libtensorflow_jni |
1.10.0 |
org.tensorflow |
spark-tensorflow-connector_2.11 |
1.10.0-spark2.4-001 |
org.tensorflow |
tensorflow |
1.10.0 |
ml.dmlc |
xgboost4j |
0.80 |
ml.dmlc |
xgboost4j-spark |
0.80 |
ml.combust.mleap |
mleap-databricks-runtime_2.11 |
0.13.0-SNAPSHOT |