Apache火花™
ビッグデ,タ分析に最適なオ,プンソ,スの分散処理システムであるApache火花はそのリリ,ス以來,さまざまな業種の企業に採用され,急速な拡大を遂げています。Netflix、雅虎、eBayなどのインターネット大手も,火花を大規模にデプロイし,8000を超えるノードのクラスターで,複數のペタバイトデータをまとめて処理しています。Apache火花は現在250を超える組織から1000名以上が參加する,ビッグデータの最大のオープンソースコミュニティへと急速に成長しています。
Apache火花は100%オープンソースで,ベンダーに依存しないApache軟件基金會によってホストされています。數據庫では,このオ,プンな開発モデルを維持することに全力で取り組んでいます。磚は Spark コミュニティと協力し、開発とコミュニティの活動の両方を通じて Apache Spark プロジェクトに大きく貢獻しています。
ボトムアップでパフォーマンスを向上させるように設計された引發は,メモリコンピューティングやその他の最適化を活用することで,Hadoopの100倍の速度で大規模デ,タを処理できます。また,Sparkはデ,タがディスクに格納されている場合にも高速処理が可能です。現在、大規模なディスク上のソ、トに、いて、世界記録を保持しています。
Sparkは大規模なデタセットを操作するための使いやすいAPIを備えています。これには,データを変換するための100以上の演算子と,半構造化データを操作するための使い慣れたデータフレームAPIが含まれています。
火花は、SQLクエリ,ストリーミングデータ,機械學習,グラフ処理のサポートといった,高レベルのライブラリと一緒にパッケージ化されています。これらの標準ラ@ @ブラリは開発者の生産性を向上させます。また,シ,ムレスに組み合わせることで複雑なワ,クフロ,を作成することができます。
磚の統合分析プラットフォームは,分散処理システムの火花,対話型ノートブック,統合されたワークフロー,およびエンタープライズセキュリティについて,5倍のパフォーマンスを提供します。これらは全て,フルマネ,ジド型のクラウドプラットフォ,ムで実行されます。
數據庫無料トラ電子詞典アルオ,プンソ,スのApache Sparkプロジェクトはこらからダウンロド可能です。