Databricks運行時11.1用於機器學習

Databricks運行時11.1 for機器學習為機器學習和數據科學提供了一個現成的環境數據庫運行時11.1.Databricks Runtime ML包含許多流行的機器學習庫,包括TensorFlow、PyTorch和XGBoost。Databricks Runtime ML包含AutoML,一個自動訓練機器學習管道的工具。Databricks Runtime ML還支持使用Horovod進行分布式深度學習訓練。

有關更多信息,包括創建Databricks Runtime ML集群的說明,請參見用於機器學習的Databricks運行時

新功能和改進

Databricks Runtime 11.1 ML構建在Databricks Runtime 11.1之上。有關Databricks Runtime 11.1中新增內容(包括Apache Spark MLlib和SparkR)的信息,請參見數據庫運行時11.1發行說明。

對Databricks AutoML的增強

對以下方麵進行了增強磚AutoML

  • 當AutoML檢測到一個分類問題是二進製的時,它計算二進製分類度量並推斷出問題的正類。類型也可以指定正類pos_label參數。詳情請參見分類和回歸參數

  • 對於預測問題,AutoML現在可以處理相對於訓練數據的時間跨度較長的情況。

對Databricks功能商店的增強

對以下方麵進行了增強Databricks特性商店

係統環境

“Databricks Runtime 11.1 ML”的係統環境與“Databricks Runtime 11.1 ML”的區別如下:

以下部分列出了Databricks Runtime 11.1 ML中包含的與Databricks Runtime 11.1中包含的不同的庫。

Python庫

Databricks Runtime 11.1 ML使用Virtualenv進行Python包管理,並包含許多流行的ML包。

除以下章節中指定的包外,Databricks Runtime 11.1 ML還包含以下包:

  • hyperopt 0.2.7.db1

  • sparkdl 2.2.0-db6

  • feature_store 0.5.0

  • automl 1.11.0

CPU集群上的Python庫

圖書館

版本

圖書館

版本

圖書館

版本

absl-py

1.0.0

Antergos Linux

2015.10 (ISO-Rolling)

argon2-cffi

20.1.0

阿斯特

0.8.1

astunparse

1.6.3

async-generator

1.10

attrs

21.2.0

azure-core

1.22.1

azure-cosmos

4.2.0

backcall

0.2.0

backports.entry-points-selectable

1.1.1

bcrypt

3.2.2

漂白劑

4.0.0

bli

0.7.8

boto3

1.21.18

botocore

1.24.18

cachetools

5.2.0

目錄

2.0.7

certifi

2021.10.8

cffi

1.14.6

chardet

4.0.0

charset-normalizer

2.0.4

點擊

8.0.3

cloudpickle

2.0.0

cmdstanpy

0.9.68

configparser

5.2.0

convertdate

測試盒框

密碼學

3.4.8

周期計

0.10.0

cymem

2.0.6

Cython

0.29.24

databricks-automl-runtime

0.2.9.1

databricks-cli

0.16.8

dbl-tempo

0.1.12

dbus-python

1.2.16

debugpy

1.4.1

裝飾

5.1.0

defusedxml

是0.7.1

蒔蘿

0.3.4

diskcache

5.4.0

distlib

0.3.4

distro-info

0.23 ubuntu1

entrypoints

0.3

ephem

4.1.3

facets-overview

1.0.0

fasttext

0.9.2

filelock

3.3.1

1.1.2

flatbuffers

1.12

fsspec

2021.8.1

未來

0.18.2

使驚訝

0.4.0

gitdb

4.0.9

GitPython

3.1.27

google-auth

2.6.0

google-auth-oauthlib

0.4.6

google-pasta

0.2.0

grpcio

1.44.0

gunicorn

20.1.0

gviz-api

1.10.0

h5py

3.3.0

hijri-converter

2.2.4

假期

0.14.2

horovod

0.24.3

htmlmin

0.1.12

huggingface-hub

0.8.1

idna

3.2

ImageHash

4.2.1

imbalanced-learn

0.8.1

importlib-metadata

4.8.1

ipykernel

6.12.1

ipython

7.32.0

ipython-genutils

0.2.0

ipywidgets

7.7.0

isodate

0.6.1

itsdangerous

2.0.1

絕地武士

0.18.0

Jinja2

14

jmespath

0.10.0

joblib

1.0.1

joblibspark

0.5.0

jsonschema

3.2.0

jupyter-client

6.1.12

jupyter-core

4.8.1

jupyterlab-pygments

0.1.2

jupyterlab-widgets

1.0.0

keras

2.9.0

Keras-Preprocessing

1.1.2

kiwisolver

1.3.1

korean-lunar-calendar

0.2.1

langcodes

3.3.0

libclang

14.0.1

lightgbm

3.3.2

llvmlite

0.38.1

LunarCalendar

0.0.9

尖吻鯖鯊

1.2.0

減價

3.3.6

MarkupSafe

2.0.1

matplotlib

3.4.3

matplotlib-inline

0.1.2

missingno

0.5.1

使走調

0.8.4

mleap

0.20.0

mlflow-skinny

1.27.0

多重方法

1.8

murmurhash

1.0.7

nbclient

0.5.3

nbconvert

6.1.0

nbformat

5.1.3

nest-asyncio

1.5.1

networkx

2.6.3

nltk

3.6.5

筆記本

6.4.5

numba

0.55.2

numpy

1.20.3

oauthlib

3.2.0

opt-einsum

3.3.0

包裝

21.0

熊貓

1.3.4

pandas-profiling

3.1.0

pandocfilters

3

paramiko

2.9.2

parso

0.8.2

表“感覺”

0.6.2

容易受騙的人

0.5.2

petastorm

0.11.4

pexpect

4.8.0

phik

0.12.2

pickleshare

0.7.5

枕頭

8.4.0

皮普

21.2.4

Beplay体育安卓版本platformdirs

2.5.2

情節

5.8.2

pmdarima

1.8.5

3.0.6

prometheus-client

0.11.0

prompt-toolkit

3.0.20

先知

1.0.1

protobuf

3.19.4

psutil

5.8.0

psycopg2

2.9.3

ptyprocess

0.7.0

pyarrow

7.0.0

pyasn1

0.4.8

pyasn1-modules

0.2.8

pybind11

2.9.2

pycparser

2.20

pydantic

1.8.2

Pygments

2.10.0

PyGObject

3.36.0

PyJWT

測試盒框

PyMeeus

0.5.11

PyNaCl

1.5.0

pyodbc

4.0.31

pyparsing

3.0.4

pyrsistent

0.18.0

pystan

2.19.1.1

python-apt

2.0.0 + ubuntu0.20.4.7

python-dateutil

2.8.2

python編輯器

1.0.4

pytz

2021.3

PyWavelets

1.1.1

PyYAML

6.0

pyzmq

22.2.1

正則表達式

2021.8.3

請求

2.26.0

requests-oauthlib

1.3.1

requests-unixsocket

0.2.0

rsa

4.8

s3transfer

0.5.2

scikit-learn

0.24.2

scipy

1.7.1上

seaborn

0.11.2

Send2Trash

1.8.0

setuptools

58.0.4

setuptools-git

1.2

世鵬科技電子

0.40.0

simplejson

3.17.6

六個

1.16.0

切片機

0.0.7

smart-open

5.2.1

smmap

5.0.0

寬大的

3.3.1

spacy-legacy

3.0.9

spacy-loggers

1.0.2中

spark-tensorflow-distributor

1.0.0

sqlparse

0.4.2

srs

2.4.3

ssh-import-id

5.10

statsmodels

0.12.2

彙總

0.8.9

tangled-up-in-unicode

0.1.0

韌性

8.0.1

tensorboard

2.9.1

tensorboard-data-server

0.6.1

tensorboard-plugin-profile

2.8.0

tensorboard-plugin-wit

1.8.1

tensorflow-cpu

2.9.1

tensorflow-estimator

2.9.0

tensorflow-io-gcs-filesystem

0.26.0

termcolor

1.1.0

terminado

0.9.4

testpath

0.5.0

thinc

8.0.17

threadpoolctl

2.2.0

分詞器

0.12.1

火炬

1.11.0 + cpu

torchvision

0.12.0 + cpu

龍卷風

6.1

tqdm

4.62.3

traitlets

5.1.0

變形金剛

4.20.0

打字機

0.4.2

typing-extensions

3.10.0.2

ujson

4.0.2

unattended-upgrades

0.1

urllib3

1.26.7

virtualenv

20.8.0

願景

0.7.4

芥末醬

0.9.1

wcwidth

0.2.5

webencodings

0.5.1

websocket-client

1.3.1

Werkzeug

2.0.2

0.37.0

widgetsnbextension

3.6.0

打包

1.12.1

xgboost

1.5.2

氧化鋅碘仿糊

3.6.0

GPU集群上的Python庫

圖書館

版本

圖書館

版本

圖書館

版本

absl-py

1.0.0

Antergos Linux

2015.10 (ISO-Rolling)

argon2-cffi

20.1.0

阿斯特

0.8.1

astunparse

1.6.3

async-generator

1.10

attrs

21.2.0

azure-core

1.22.1

azure-cosmos

4.2.0

backcall

0.2.0

backports.entry-points-selectable

1.1.1

bcrypt

3.2.2

漂白劑

4.0.0

bli

0.7.8

boto3

1.21.18

botocore

1.24.18

cachetools

5.2.0

目錄

2.0.7

certifi

2021.10.8

cffi

1.14.6

chardet

4.0.0

charset-normalizer

2.0.4

點擊

8.0.3

cloudpickle

2.0.0

cmdstanpy

0.9.68

configparser

5.2.0

convertdate

測試盒框

密碼學

3.4.8

周期計

0.10.0

cymem

2.0.6

Cython

0.29.24

databricks-automl-runtime

0.2.9.1

databricks-cli

0.16.8

dbl-tempo

0.1.12

dbus-python

1.2.16

debugpy

1.4.1

裝飾

5.1.0

defusedxml

是0.7.1

蒔蘿

0.3.4

diskcache

5.4.0

distlib

0.3.4

distro-info

0.23 ubuntu1

entrypoints

0.3

ephem

4.1.3

facets-overview

1.0.0

fasttext

0.9.2

filelock

3.3.1

1.1.2

flatbuffers

1.12

fsspec

2021.8.1

未來

0.18.2

使驚訝

0.4.0

gitdb

4.0.9

GitPython

3.1.27

google-auth

2.6.0

google-auth-oauthlib

0.4.6

google-pasta

0.2.0

grpcio

1.44.0

gunicorn

20.1.0

gviz-api

1.10.0

h5py

3.3.0

hijri-converter

2.2.4

假期

0.14.2

horovod

0.24.3

htmlmin

0.1.12

huggingface-hub

0.8.1

idna

3.2

ImageHash

4.2.1

imbalanced-learn

0.8.1

importlib-metadata

4.8.1

ipykernel

6.12.1

ipython

7.32.0

ipython-genutils

0.2.0

ipywidgets

7.7.0

isodate

0.6.1

itsdangerous

2.0.1

絕地武士

0.18.0

Jinja2

14

jmespath

0.10.0

joblib

1.0.1

joblibspark

0.5.0

jsonschema

3.2.0

jupyter-client

6.1.12

jupyter-core

4.8.1

jupyterlab-pygments

0.1.2

jupyterlab-widgets

1.0.0

keras

2.9.0

Keras-Preprocessing

1.1.2

kiwisolver

1.3.1

korean-lunar-calendar

0.2.1

langcodes

3.3.0

libclang

14.0.1

lightgbm

3.3.2

llvmlite

0.38.1

LunarCalendar

0.0.9

尖吻鯖鯊

1.2.0

減價

3.3.6

MarkupSafe

2.0.1

matplotlib

3.4.3

matplotlib-inline

0.1.2

missingno

0.5.1

使走調

0.8.4

mleap

0.20.0

mlflow-skinny

1.27.0

多重方法

1.8

murmurhash

1.0.7

nbclient

0.5.3

nbconvert

6.1.0

nbformat

5.1.3

nest-asyncio

1.5.1

networkx

2.6.3

nltk

3.6.5

筆記本

6.4.5

numba

0.55.2

numpy

1.20.3

oauthlib

3.2.0

opt-einsum

3.3.0

包裝

21.0

熊貓

1.3.4

pandas-profiling

3.1.0

pandocfilters

3

paramiko

2.9.2

parso

0.8.2

表“感覺”

0.6.2

容易受騙的人

0.5.2

petastorm

0.11.4

pexpect

4.8.0

phik

0.12.2

pickleshare

0.7.5

枕頭

8.4.0

皮普

21.2.4

Beplay体育安卓版本platformdirs

2.5.2

情節

5.8.2

pmdarima

1.8.5

3.0.6

prompt-toolkit

3.0.20

先知

1.0.1

protobuf

3.19.4

psutil

5.8.0

psycopg2

2.9.3

ptyprocess

0.7.0

pyarrow

7.0.0

pyasn1

0.4.8

pyasn1-modules

0.2.8

pybind11

2.9.2

pycparser

2.20

pydantic

1.8.2

Pygments

2.10.0

PyGObject

3.36.0

PyJWT

測試盒框

PyMeeus

0.5.11

PyNaCl

1.5.0

pyodbc

4.0.31

pyparsing

3.0.4

pyrsistent

0.18.0

pystan

2.19.1.1

python-apt

2.0.0 + ubuntu0.20.4.7

python-dateutil

2.8.2

python編輯器

1.0.4

pytz

2021.3

PyWavelets

1.1.1

PyYAML

6.0

pyzmq

22.2.1

正則表達式

2021.8.3

請求

2.26.0

requests-oauthlib

1.3.1

requests-unixsocket

0.2.0

rsa

4.8

s3transfer

0.5.2

scikit-learn

0.24.2

scipy

1.7.1上

seaborn

0.11.2

Send2Trash

1.8.0

setuptools

58.0.4

setuptools-git

1.2

世鵬科技電子

0.40.0

simplejson

3.17.6

六個

1.16.0

切片機

0.0.7

smart-open

5.2.1

smmap

5.0.0

寬大的

3.3.1

spacy-legacy

3.0.9

spacy-loggers

1.0.2中

spark-tensorflow-distributor

1.0.0

sqlparse

0.4.2

srs

2.4.3

ssh-import-id

5.10

statsmodels

0.12.2

彙總

0.8.9

tangled-up-in-unicode

0.1.0

韌性

8.0.1

tensorboard

2.9.1

tensorboard-data-server

0.6.1

tensorboard-plugin-profile

2.8.0

tensorboard-plugin-wit

1.8.1

tensorflow

2.9.1

tensorflow-estimator

2.9.0

tensorflow-io-gcs-filesystem

0.26.0

termcolor

1.1.0

terminado

0.9.4

testpath

0.5.0

thinc

8.0.17

threadpoolctl

2.2.0

分詞器

0.12.1

火炬

1.11.0 + cu113

torchvision

0.12.0 + cu113

龍卷風

6.1

tqdm

4.62.3

traitlets

5.1.0

變形金剛

4.20.0

打字機

0.4.2

typing-extensions

3.10.0.2

ujson

4.0.2

unattended-upgrades

0.1

urllib3

1.26.7

virtualenv

20.8.0

願景

0.7.4

芥末醬

0.9.1

wcwidth

0.2.5

webencodings

0.5.1

websocket-client

1.3.1

Werkzeug

2.0.2

0.37.0

widgetsnbextension

3.6.0

打包

1.12.1

xgboost

1.5.2

氧化鋅碘仿糊

3.6.0

包含Python模塊的Spark包

火花包

Python模塊

版本

graphframes

graphframes

0.8.2-db1-spark3.2

R庫

R庫與R庫在Databricks運行時11.1。

Java和Scala庫(Scala 2.12集群)

除了Databricks Runtime 11.1中的Java和Scala庫之外,Databricks Runtime 11.1 ML還包含以下jar:

CPU集群

組ID

工件ID

版本

com.typesafe.akka

akka-actor_2.12

2.5.23

ml.combust.mleap

mleap-databricks-runtime_2.12

0.20.0-db1

ml.dmlc

xgboost4j-spark_2.12

1.5.2

ml.dmlc

xgboost4j_2.12

1.5.2

org.graphframes

graphframes_2.12

0.8.2-db1-spark3.2

org.mlflow

mlflow-client

1.27.0

org.mlflow

mlflow-spark

1.27.0

org.scala-lang.modules

scala-java8-compat_2.12

0.8.0

org.tensorflow

spark-tensorflow-connector_2.12

1.15.0

GPU集群

組ID

工件ID

版本

com.typesafe.akka

akka-actor_2.12

2.5.23

ml.combust.mleap

mleap-databricks-runtime_2.12

0.20.0-db1

ml.dmlc

xgboost4j-spark_2.12

1.5.2

ml.dmlc

xgboost4j_2.12

1.5.2

org.graphframes

graphframes_2.12

0.8.2-db1-spark3.2

org.mlflow

mlflow-client

1.27.0

org.mlflow

mlflow-spark

1.27.0

org.scala-lang.modules

scala-java8-compat_2.12

0.8.0

org.tensorflow

spark-tensorflow-connector_2.12

1.15.0