阿帕奇火花™
自發布以來,阿帕奇火花統一分析引擎,在廣泛的行業中,企業迅速采用。Netflix,Yahoo和eBay等互聯網動力館在大規模規模上部署了火花,統稱在8,000多個節點的集群上處理多個Petabytes。它迅速成為大數據中最大的開源社區,來自250多個組織的1000多個貢獻者。
Apache Spark是100%開源,托管在供應商獨立的Apache軟件基礎上。在Databricks,我們完全致力於維護這個開放的開發模式。通過開發和社區傳道,Databricks與Spark社區一起繼續向Apache Spark項目貢獻。
從自下而上的性能設計,火花可以是對於大規模數據處理的Hadoop速度快100倍通過利用內存計算和其他優化。當數據存儲在磁盤上時,Spark也很快,當前持有世界紀錄,用於大規模的磁盤排序。
Spark具有易於使用的API,用於在大型數據集上運行。這包括用於轉換數據和熟悉的數據幀API的100多個運算符的集合,用於操縱半結構化數據。
Spark通過更高級別的庫包裝,包括支持SQL查詢,流數據,機器學習和圖形處理。這些標準庫增加了開發人員的生產力,可以無縫組合以創建複雜的工作流程。
Databricks統一分析平台提供了5倍於開源Spark、協作筆Beplay体育安卓版本記本、集成工作流和企業安全的性能,所有這些都在一個完全托管的雲平台中。beplay娱乐ios
嚐試databricks.開源Apache Spark項目可以是下載了這裏