數據分析研討會係列
介紹Apache火花
車間細節
這個車間是我們介紹的最後一部分為有抱負的數據科學家工作室係列數據分析。
本研討會討論Apache火花的基本麵,最受歡迎的大數據處理引擎。在這個車間,您將學習如何攝取數據與火花,分析引發的UI,並更好地了解分布式計算。我們將使用由《紐約時報》發布的數據(https://github.com/nytimes/covid-19-data)。不需要先驗知識的火花,但Python經驗是強烈推薦。
你需要什麼:報名參加Community Edition在這裏和訪問車間演示材料和樣本的筆記本在這裏。
雖然不需要準備工作,我們所做的推薦基本的python知識。看第一部分,介紹了Python學習Python。
教練:凱利奧馬利,解決方案工程師磚
凱利奧馬利是一個磚方案工程師,她幫助初創企業架構師和實現大數據管道。加入磚之前她做過軟件工程師在國防工業編寫網絡代碼。她在加州大學洛杉磯分校計算機科學完成了她的廢話。外的科技世界,凱利喜歡烹飪,diy項目,和花時間在海灘上。
視頻記錄
這是我們四車間係列的第四部分,介紹數據分析為有抱負的數據科學家。今天的研討會是介紹Apache火花。