講師主導的培訓
帶有數據鏈球手的Apache Spark™編程(2天)
本課程使用案例研究驅動的方法來探索使用Databricks的Spark編程的基礎,包括Spark Architecture,DataFrame API,查詢優化,結構化流和Delta。
數據分析使用Databricks SQL(1天)
本課程提供了Databricks SQL的全麵介紹。學習者將攝入數據,編寫查詢,產生可視化和儀表板,並學習如何將Databricks SQL連接到Databricks合作夥伴工具。
數據工程使用數據映(2天)
本課程會教您通過講座和動手實驗室使用數據鏈芯來構建數據管道的最佳實踐。在課程結束時,您將擁有數據工程師需要的所有知識和技能,以構建用於流和批處理數據的端到端Delta Lake Pipeline。
使用數據映(2天)深入學習
本課程涵蓋了具有張力流的神經網絡的基礎知識,以及如何用Apache Spark對深度學習模型進行訓練,推理和超參數調整。
Apache Spark™(1天)足夠的Python
本課程旨在幫助沒有編程背景的人在Python方麵發展足夠的經驗,以開始使用Apache Spark編程API。
生產中的機器學習(1天)
本課程涵蓋了從實驗和模型管理中管理完整的機器學習生命周期的最佳實踐。學生將探索各種部署範例和CI/CD框架,並學習如何解決生產問題。
優化Databricks上的Apache Spark™(2天)
本課程旨在加深對Apache Spark中關鍵優化領域的了解,以及如何利用它們來提高性能。
使用Apache Spark™可擴展的機器學習(2天)
本課程教授完整的數據科學工作流程,包括數據探索,功能工程,模型構建和超參數調整。在本課程結束時,您將建立了一條端到端的分布式機器學習管道,準備生產。
帶有數據映的高級數據工程(2天)
2022年7月
Python數據科學與數據工程簡介(2天)
2022年7月
本課程將取代Apache Spark™(1天)課程的足夠的Python。
如果您有任何疑問,請參考我們經常問的問題頁。