比較Apache SparkTM值和Databricks


Apache Spark功能可提供速度,易用性和用途優勢,包括支持各種用例的API:
  • 數據集成和ETL
  • 交互式分析
  • 機器學習和高級分析
  • 實時數據處理

v


Databricks建立在Spark上並添加:
  • 高度可靠和性能的數據管道
  • 大規模生產數據科學

想了解更多嗎?訪問我們的Beplay体育安卓版本平台頁麵

기능비교

數據映

자세히알아보기

是的
運行多個版本的火花 是的
用於雲存儲訪問的內置文件係統(AWS S3,RedShift,Azure Blob) 是的
無服務器池提供SQL和Python工作負載的自動配置資源 是的
最佳利用率的火花本地細粒資源共享 是的
計算資源的故障隔離 是的
更快地寫給S3 是的
在連接和過濾器期間計算優化 是的
快速釋放周期 是的
自動縮放計算 是的
自動縮放本地存儲 是的
集群的高可用性 是的
多用戶群集共享 是的
點和按需實例之間的自動遷移 是的
二級計費 是的

是的

酸交易 是的
模式管理 是的
批次/流讀/寫支持 是的
數據版本 是的
性能優化 是的

是的
交互式筆記本,並支持多種語言(SQL,Python,R和Scala) 是的
實時合作 是的
筆記本修訂曆史記錄和GitHub集成 是的
一點擊的可視化 是的
將筆記本發布為互動儀表板 是的

是的
火花工作監控警報 是的
一單擊從筆記本上部署以引發作業 是的
在筆記本中構建工作流程的API 是的
通過監控進行生產流 是的

자세히알아보기

是的
訪問筆記本,集群,作業和結構化數據的控製 是的
審核日誌 是的
帶有SAML 2.0支持的SSO 是的
數據加密(在休息和運動中) 是的
合規性(HIPAA,SOC 2類型2) 是的

是的
通過身份驗證的ODBC/JDBC(Tableau,Looker等)連接其他BI工具 是的
REST API 是的
數據源連接器 是的

是的
工程師火花的承諾者的幫助和支持 是的
SQL支持 是的

기타리소스

基準在雲中為大數據SQL平台進行基準測試Beplay体育安卓版本

블로그

Hotels.com如何增加20倍分析的數據而沒有性能問題

고객사례

托管三角洲湖:最好的數據湖,倉庫和流媒體係統。

데모