開源

數據工程師是世界上一些最流行的開源數據技術的最初創造者

參加聚會
背景圖像

我們最受歡迎的開源項目

icon-title
Apache火花TM
Apache Spark是用於執行數據工程、數據科學和ML工作負載的統一引擎。

什麼是Apache Spark?→

比較Spark和Databricks→

訪問spark.apache.org→

icon-title
三角洲湖
Delta Lake允許您在AWS S3、ADLS、GCS和HDFS等存儲係統上構建湖屋架構。

了解更多關於三角洲湖→

訪問三角洲。io→

技術講座:從Delta Lake開始→

icon-title
MLflow
MLflow管理ML生命周期,包括實驗、再現性、部署和中央模型注冊表。

Managed MLflow on Databricks→

訪問mlflow.org→

技術講座:管理機器學習生命周期→

icon-title
Redash
Redash允許任何人利用SQL來探索、查詢、可視化和共享來自大小數據源的數據。

訪問Redash在GitHub→

icon-title
三角洲分享
Delta Sharing是業界首個用於安全數據共享的開放協議,使與其他組織共享數據變得簡單。

訪問德爾塔共享→

Databricks支持這些額外的流行開源技術

icon-title
TensorFlow
Databricks支持TensorFlow,這是一個用於集群深度學習和通用計算的庫

TensorFlow on Databricks→

icon-title
PyTorchTM
PyTorch的創建者Facebook和Databricks在集成方麵進行了合作

PyTorch on Databricks→

icon-title
KerasTM
用Python編寫的深度學習API,運行在TensorFlow之上。可在Databricks運行時的ML。

Keras on Databricks→

icon-title
RStudio
一個使用R進行協作數據科學的開源工具套件beplay娱乐ios

大數據R編程→

icon-title
scikit-learn
廣泛使用的機器學習Python包構建在NumPy, SciPy和Matplotlib之上

Scikit-learn on Databricks→

icon-title
XGBoost
一個分布式梯度增強庫,具有Python、R和c++等語言的綁定

XGBoost on Databricks→

icon-title
起程拓殖
HashiCorp Terraform是一個流行的開源工具,用於跨多個雲提供商創建安全且可預測的雲基礎設施。Databricks Terraform提供商允許客戶使用一個靈活、強大的beplay体育app下载地址工具管理他們的整個Databricks工作空間以及其餘的基礎設施。使用Terraform還鼓勵客戶采用基礎設施即代碼(IaC)的最beplay体育app下载地址佳實踐。

terrraform on Databricks→

準備好了
開始了嗎?

Baidu
map