Apache火花™已迅速成為大數據處理的事實上的標準在所有行業和用例提供建議基於用戶行為分析數以百萬計的基因組序列數據加速藥物創新和發展個性化醫療。
本電子書,第二個係列,提供了一個技術博客文章最受歡迎的集合,提供一個介紹機器學習在Apache火花,並強調了許多火花MLlib和GraphX周圍的主要發展。
不管你是剛剛開始與火花或已經引發電力用戶,這個電子書將用知識武裝你成功在你的下一個火花項目包括:
- 介紹機器學習在Apache火花
- 使用火花等高級主題聚類,樹,圖的處理
- 如何使用SparkR在規模與R語言分析數據