Databricks工作負載類型:功能比較
Databricks提供了三種“計算”類型,每種類型都為不同類型的工作負載設計:
工作燈計算:在Databricks平台上使用開源Spark Runtime在作業燈簇上運行Databricks作業。Beplay体育安卓版本
工作計算:通過Databricks的優化運行時運行Databricks作業,以提高性能和可伸縮性。
通用計算:在全功能群集上運行任何工作負載,包括交互式數據科學和分析,通過JDBC/ODBC進行BI工作負載,MLFLOW實驗,Databricks作業等。
該表顯示了每種計算類型的可用功能。
特征 |
工作燈計算 |
工作計算 |
通用計算 |
---|---|---|---|
托管的Apache Spark |
X |
X |
X |
Apache Spark群集用於在Databricks平台上運行生產作業,並進行警報和重試。Beplay体育安卓版本 |
|||
圖書館的工作安排 |
X |
X |
X |
易於運行的生產作業,包括帶有監視的流媒體和用於運行庫的調度程序。 |
|||
筆記本的工作安排 |
X |
X |
|
能夠使用Scala,Python,R和SQL筆記本和筆記本工作流程安排作業。 |
|||
自動駕駛群 |
X |
X |
|
易於管理和具有成本效益的群集,並自動對計算和實例存儲,簇的自動啟動和終止。 |
|||
ML的Databricks運行時 |
X |
X |
|
開箱即用的ML框架,包括Spark/Horovod集成;XGBOOST,TENSORFLOW,PYTORCH和KERAS支持。 |
|||
托管的MLFlow |
X |
X |
|
在Databricks平台上運行MLFLOW,以簡化端到端Beplay体育安卓版本ML生命周期,並使用MLFlow遠程執行和托管跟蹤服務器。您甚至可以從Databricks外部運行MLFLOW(使用可能受到限製)。 |
|||
Delta Lake帶有三角洲引擎 |
X |
X |
|
強大的管道可提供幹淨,高質量的數據支持高性能批次和流媒體分析。Databricks上的Delta Lake提供酸性交易,模式管理,批處理/流讀/寫支持以及數據版本以及Delta Engine的性能優化。 |
|||
交互式簇 |
X |
||
用於多個用戶的高頻率模式和分析的持續群集。 |
|||
筆記本和協作 |
X |
||
使用Scala,Pythonbeplay娱乐ios,SQL和R Notebooks在分析師和其他同事之間啟用高度協作和生產的工作,這些筆記本可提供一單擊可視化,交互式儀表板,修訂曆史記錄和版本控製集成(Github,Bitbucket)。 |
|||
生態係統整合 |
X |
||
RSTUDIO®集成以及通過JDBC/ODBC的一係列第三方BI工具。 |
有關按計算類型定價的信息,請參閱AWS定價。