跳轉到主要內容
工程的博客

Apache 2.0火花:文選的技術資產

2016年6月1日 工程的博客

分享這篇文章

老選集整理一批來自不同作者theme-bounded然後雜誌或期刊。新選集包含多個expressions-digitized情態動詞現在電子書或者一個博客。兩者都提供一個博覽會主題任何事他們的形式。

在這個選集,我總結了一組視頻,技術博客,筆記本,網絡研討會,播客,和關注的新聞文章Apache 2.0現在火花一般可用。

你可以試試Apache 2.0版本火花從兩個地方:


火花峰會東主旨:Apache 2.0火花
磚的CTO馬泰Zaharia感謝社區的貢獻和預覽Apache火花2.0的三個主題:簡單,速度和統一。

構建火花:DataFrames、數據集和流
Apache火花提交者和磚的工程師邁克爾Armbrust為什麼結構奠定了基礎,應用數據,是相關的,以及它如何影響DataFrame的設計和數據集的api和流在Apache 2.0火花。

做事投入在結構化流在Apache 2.0火花
磚的火花提交者如來佛Das技術討論了結構化流是如何工作的,。

Apache 2.0:火花更容易、更快和更聰明
Apache火花提交者和磚雷諾的首席建築師鑫和火花社區傳道者朱爾斯s Damji預覽Apache 2.0和火花展示在磚筆記本的運行特征2.0預發布的火花

介紹Apache火花2.0現在通常用於磚
更深入版本的網絡研討會,馬泰Zaharia雷諾新,和邁克爾三thrusts-speed時常要闡述,簡單的結構化streaming-behind Apache 2.0火花,筆記本上運行數據磚。

近似算法在Apache火花:HyperLogLog分位數
磚的工程師蒂姆•亨特·侯賽因·Falaki,約瑟夫·布拉德利展示兩個近似算法來近似計算分位數不同的元素和在一個大數據使用Apache 2.0火花的預發布預覽數據磚。

Apache火花作為編譯器:在你的筆記本上加入十億行
Apache火花已經很快,但我們可以讓它快10倍嗎?雷諾鑫,Sameer Agarwal,戴維斯劉解釋鎢的舞台代碼生成。

現代硬件有效編製高效的查詢計劃
艾德裏安•科伊爾SpringSource前CTO,探討影響和重要的主題在計算機科學的世界晨報

與鎢更加明亮火花
佩奇羅伯茨(Syncort)冠癭堿鎢是一個巨大的飛躍,Apache火花,特別是在性能的麵積,和寫它是如何工作的,以及為什麼它提高火花的性能。

結構化流到Apache 2.0火花
O ' reilly的首席數據科學家Ben Lorica坐下來和邁克爾Armbrust談論生活和結構化流。

火花的結構化流到底是什麼意思
離子指針(信息世界的貢獻者)提倡DataFrames為什麼在火花引發流的最佳選擇2.0,為什麼結構化流是有意義的。

Apache火花2.0預覽版:機器學習模型持久性
磚的工程師約瑟夫·布拉德利股票的好處持久性火花2.0預覽版機器學習模型,以及如何保存和加載毫升管道跨多個語言火花。

如何使用數據集處理物聯網數據api
磚Community Edition的筆記本展示Apache火花2.0數據api。

SQL子查詢在Apache 2.0火花
磚的劉工程師戴維斯和範龍佩(Herman van Hovell提供實踐標量和謂詞類型子查詢的例子

一個故事三個Apache火花api:抽樣、DataFrames和數據集
磚的火花社區傳道者朱爾斯s Damji告訴的故事三個火花api:何時以及為什麼使用它們

火花2.0 -數據集和case類
丹尼爾•佩普分析工程師codecentric探索和解釋了數據集的類型安全特性api通過一些代碼示例使用Scala case類

連續應用:發展流在Apache 2.0火花
磚的聯合創始人兼首席技術官馬泰Zaharia股他的願景的端到端流媒體應用程序稱為連續應用程序使用結構化流api在Apache 2.0火花

結構化流在Apache火花2.0:一個新的流媒體的高級API。
Messrs馬泰Zaharia如來佛Das,雷諾鑫和邁克爾Armbrust解釋寫端到端的流媒體應用程序稱為連續應用程序的挑戰和複雜的結構化流為什麼以及如何使它簡單。

如何使用SparkSessions在Apache 2.0火花
磚的火花社區傳道者朱爾斯s Damji探索SparkSession火花2.0功能。

接下來是什麼?

在未來的幾周內,我們將發布一係列的帖子引發2.0版本,將會更新這個選集。您可能想要收藏本頁!

免費試著磚
看到所有工程的博客的帖子
Baidu
map