Apache火花™
代理代理,Apache火花, le moteur d’analyses unifiées,一個不同部門的企業的迅速發展。Des actor essentiels du monde de l'internet telels que Netflix, Yahoo et eBay ont déployé Spark à très grande échelle, traant ensemble plusieurs peta-octets de données sur Des clusters de plus de 8 000 neure。Cette communauté開源est rapidement devenue la + important du monde du big data avec + 1 000個貢獻者+ 250個組織。
Apache Spark est 100%開源,hébergé par la Fondation Apache, indépendante de tout fournisseur。Chez Databricks, nous nous engagement pleinement dans l'entretien de ce modèle de développement ouvert。主要丹斯拉主要avec la communauté Spark, Databricks繼續à貢獻者大規模au projet Apache Spark, à la fois par le développement et en faisant la promotion de la communauté。
Conçu de bout en bout dans une optique de performance, Spark peut s'avérer100 fois加上rapide que Hadoop pour le traitement de données à grande échelleEn explotant le calculation En mémoire et d'autres optimization。火花est également rapide sur les données stockées sur disque;Il détient à世界上真實的生命記錄à大échelle de données sur disque。
Spark possède des API simples d'utilisation pour travailler sur de grands ensembles de données。cell -ci成分符號un ensemble de plus de 100 opérateurs pour la transformation de données et des API familières pour DataFrames permettant la manipulation de données semi-structurées。
Spark est livré avec des bibliothèques haut niveau qui prenent en charge les requêtes SQL, les données en flux, le機器學習et le tritement de。Ces bibliothèques標準滲透劑aux développeurs de gagner en productivité et peuvent se合成器設施pour créer des flux de travail complex。
Databricks Unified Analytics Beplay体育安卓版本Platform offre une performance 5 fois + élevée que la solution Spark開源,des notebooks collaboratifs, des workflow intégrés et et de la sécurité pour l' enterprise - le tout en une seule Platform de cloud entièrement managée。
嚐試磚Le項目Apache Spark開源esttelechargeable ici.