Apache Spark™
自發布以來Apache Spark,統一分析引擎已經在各種行業中迅速采用了企業。Netflix,Yahoo和eBay等互聯網電力室已大規模地部署了火花,共同處理了超過8,000個節點的群集的多個數據。它很快已成為大數據中最大的開源社區,擁有來自250多個組織的1000多名貢獻者。
Apache Spark是100%開源,托管在供應商無關的Apache Software Foundation。在Databricks,我們完全致力於維護這種開放開發模型。與Spark社區一起,Databricks通過發展和社區福音派繼續為Apache Spark項目做出重大貢獻。
從自下而上的表演中設計,火花可能是大規模數據處理的速度比Hadoop快100倍通過在內存計算和其他優化中利用。當數據存儲在磁盤上時,Spark也很快,並且目前持有大規模盤中分類的世界紀錄。
Spark具有易於使用的API,用於在大型數據集上操作。這包括100多個運營商的集合,用於轉換數據和熟悉的數據框架API,以操縱半結構化數據。
Spark包含高級庫,包括對SQL查詢,流數據,機器學習和圖形處理的支持。這些標準庫提高了開發人員的生產率,並且可以無縫組合以創建複雜的工作流程。
Databricks Unified Analytics平台在開源Beplay体育安卓版本Spark,協作筆記本,集成工作流程和企業安全性上提供5倍性能 - 都在完全管理的雲平台中。beplay娱乐ios
Prova Databricks開源Apache Spark項目可以是在這裏下載