Apache火花2.0發布了今年夏天,已經被廣泛采用。我將討論如何API的變化使得它更容易寫批處理,流媒體和實時應用程序。數據API,它現在與DataFrames集成,可以受益於強大的優化等推動查詢數據源,而結構化流擴展這個API可以運行許多相同的自動計算以流媒體的方式。
馬泰Zaharia是斯坦福大學計算機科學係的助理教授在磚和首席技術專家。他開始Apache火花項目在他的博士2009年在加州大學伯克利分校,並在數據中心係統,廣泛co-starting Apache便項目和貢獻作為Apache Hadoop的提交者。今天,馬泰技術領導者MLflow開發工作在磚除了其他方麵的平台。Beplay体育安卓版本馬泰的研究工作被認為在2014 ACM博士論文獎的最佳博士論文在計算機科學中,一個NSF事業獎,美國總統早期職業科學家和工程師(PECASE)獎。(daisna21-speakers)