2022年7月
描述
在本課程中,學生將建立在現有的Apache Spark,結構化流媒體和Delta Lake的知識的基礎上,以通過使用Databricks提供的一套工具來釋放Data Lakehouse的全部潛力。本課程非常重視設計有利於增量數據處理的設計,從而使已優化的係統能夠連續攝入和分析不斷增長的數據。通過設計利用內置平台優化的工作負載,數據工程師可以減輕代碼維護和現有緊急情況的負擔,並通過最Beplay体育安卓版本少的重構或停機時間快速將生產代碼適應新需求。
本課程中的主題應在嚐試之前掌握Databricks認證數據工程師專業考試。
期間
2整天或4個半天
目標
- 設計數據庫和管道針對Databricks Lakehouse平台進行了優化。Beplay体育安卓版本
- 實施有效的增量數據處理,以驗證和豐富數據驅動業務決策和應用程序。
- 利用數據快速核心本地功能,用於管理訪問敏感數據並履行被遺忘的請求的訪問。
- 使用Databricks工具管理錯誤故障排除,代碼促進,任務編排和生產工作監視。
即將舉行的公共課程
如果您有任何疑問,請參考我們經常問的問題頁。