Apache Spark^™

Apache Spark是閃電統一分析引擎用於大數據和機器學習。它最初是在2009年在加州大學伯克利分校開發的。

數據處理中最大的開源項目。

自發布以來Apache Spark，統一分析引擎已經在各種行業中迅速采用了企業。Netflix，Yahoo和eBay等互聯網電力室已大規模地部署了火花，共同處理了超過8,000個節點的群集的多個數據。它很快已成為大數據中最大的開源社區，擁有來自250多個組織的1000多名貢獻者。
火花 - 阿帕奇火花

在加州大學伯克利分校（UC Berkeley）啟動Spark Research項目的團隊於2013年創立了Databricks。

Apache Spark是100％開源，托管在供應商無關的Apache Software Foundation。在Databricks，我們完全致力於維護這種開放開發模型。與Spark社區一起，Databricks通過發展和社區福音派繼續為Apache Spark項目做出重大貢獻。

Apache Spark生態係統

SPARK SQL + DATAFRAMES

流

mllib機器學習

GraphX圖計算

火花核心API

r

SQL

Python

Scala

爪哇

什麼是Apache Spark- Apache Spark的好處

速度

從自下而上的表演中設計，火花可能是大規模數據處理的速度比Hadoop快100倍通過在內存計算和其他優化中利用。當數據存儲在磁盤上時，Spark也很快，並且目前持有大規模盤中分類的世界紀錄。

使用方便

Spark具有易於使用的API，用於在大型數據集上操作。這包括100多個運營商的集合，用於轉換數據和熟悉的數據框架API，以操縱半結構化數據。

統一引擎

Spark包含高級庫，包括對SQL查詢，流數據，機器學習和圖形處理的支持。這些標準庫提高了開發人員的生產率，並且可以無縫組合以創建複雜的工作流程。

免費在Databricks Cloud上嚐試Apache Spark

Databricks Unified Analytics平台在開源Beplay体育安卓版本Spark，協作筆記本，集成工作流程和企業安全性上提供5倍性能 - 都在完全管理的雲平台中。beplay娱乐ios

Prova Databricks

開源Apache Spark項目可以是在這裏下載

Apache Spark^™

Apache Spark是閃電統一分析引擎用於大數據和機器學習。它最初是在2009年在加州大學伯克利分校開發的。

數據處理中最大的開源項目。

在加州大學伯克利分校（UC Berkeley）啟動Spark Research項目的團隊於2013年創立了Databricks。

Apache Spark生態係統

結構化數據：Spark SQL

流分析：火花流

機器學習：mllib

圖計算：Graphx

一般執行：火花核心

什麼是Apache Spark- Apache Spark的好處

速度

使用方便

統一引擎

免費在Databricks Cloud上嚐試Apache Spark

Apache Spark™

Apache Spark是閃電統一分析引擎用於大數據和機器學習。它最初是在2009年在加州大學伯克利分校開發的。

數據處理中最大的開源項目。

在加州大學伯克利分校（UC Berkeley）啟動Spark Research項目的團隊於2013年創立了Databricks。

Apache Spark生態係統

結構化數據：Spark SQL

流分析：火花流

機器學習：mllib

圖計算：Graphx

一般執行：火花核心

什麼是Apache Spark- Apache Spark的好處

速度

使用方便

統一引擎

免費在Databricks Cloud上嚐試Apache Spark

Apache Spark^™