Databricks工作負載類型:功能比較

Databricks提供了三種“計算”類型,每種類型都為不同類型的工作負載設計:

  • 工作燈計算:在Databricks平台上使用開源Spark Runtime在作業燈簇上運行Databricks作業。Beplay体育安卓版本

  • 工作計算:通過Databricks的優化運行時運行Databricks作業,以提高性能和可伸縮性。

  • 通用計算:在全功能群集上運行任何工作負載,包括交互式數據科學和分析,通過JDBC/ODBC進行BI工作負載,MLFLOW實驗,Databricks作業等。

該表顯示了每種計算類型的可用功能。

特征

工作燈計算

工作計算

通用計算

托管的Apache Spark

X

X

X

Apache Spark群集用於在Databricks平台上運行生產作業,並進行警報和重試。Beplay体育安卓版本

圖書館的工作安排

X

X

X

易於運行的生產作業,包括帶有監視的流媒體和用於運行庫的調度程序。

筆記本的工作安排

X

X

能夠使用Scala,Python,R和SQL筆記本和筆記本工作流程安排作業。

自動駕駛群

X

X

易於管理和具有成本效益的群集,並自動對計算和實例存儲,簇的自動啟動和終止。

ML的Databricks運行時

X

X

開箱即用的ML框架,包括Spark/Horovod集成;XGBOOST,TENSORFLOW,PYTORCH和KERAS支持。

托管的MLFlow

X

X

在Databricks平台上運行MLFLOW,以簡化端到端Beplay体育安卓版本ML生命周期,並使用MLFlow遠程執行和托管跟蹤服務器。您甚至可以從Databricks外部運行MLFLOW(使用可能受到限製)。

Delta Lake帶有三角洲引擎

X

X

強大的管道可提供幹淨,高質量的數據支持高性能批次和流媒體分析。Databricks上的Delta Lake提供酸性交易,模式管理,批處理/流讀/寫支持以及數據版本以及Delta Engine的性能優化。

交互式簇

X

用於多個用戶的高頻率模式和分析的持續群集。

筆記本和協作

X

使用Scala,Pythonbeplay娱乐ios,SQL和R Notebooks在分析師和其他同事之間啟用高度協作和生產的工作,這些筆記本可提供一單擊可視化,交互式儀表板,修訂曆史記錄和版本控製集成(Github,Bitbucket)。

生態係統整合

X

RSTUDIO®集成以及通過JDBC/ODBC的一係列第三方BI工具。

有關按計算類型定價的信息,請參閱AWS定價