數據ricks認證和標記
湖屋培訓與認證新標準
聯係|專業
Databricks認證機器學習助理
Databricks Certified Machine Learning Associate認證考試評估個人使用Databricks執行基本機器學習任務的能力。這包括理解和使用Databricks機器學習及其功能,如AutoML、Feature Store和MLflow的選擇功能。它還評估了在機器學習工作流中做出正確決策的能力,並使用Spark ML實現這些工作流。最後,評估了理解縮放機器學習模型高級特性的能力。通過這個認證考試的個人可以使用Databricks及其相關工具完成基本的機器學習任務。
登記
為了獲得該認證,收入者必須通過認證考試。為了獲得這個認證,請登錄或創建一個帳戶在我們認證平台Beplay体育安卓版本.
學習途徑
這個認證是機器學習學習途徑的一部分。
考試的細節
該認證考試將於近期公布。關於認證考試的細節如下所示。請注意,這些細節可能會更改。
最低限度合格的候選人
最低限度合格的候選人應該能夠:
- 在機器學習工作流程中使用Databricks機器學習及其功能,包括:
- 機器學習(集群,Repos, Jobs)
- 機器學習的Databricks運行時(基礎知識,庫)
- AutoML(分類、回歸、預測)
- 功能存儲(基礎知識)
- MLflow(跟蹤、模型、模型注冊)
- 在機器學習工作流程中執行正確的決策,包括:
- 探索性數據分析(彙總統計,異常值去除)
- 特征工程(缺失值imputation,一熱編碼)
- 調優(超參數基礎,超參數並行化)
- 評估和選擇(交叉驗證,評估指標)
- 使用Spark ML和其他工具大規模實施機器學習解決方案,包括:
- 分布式毫升概念
- Spark ML建模api(數據分割、訓練、評估、評估器vs.變壓器、管道)
- Hyperopt
- Pandas API on Spark
- Pandas udf和Pandas函數api
- 理解經典機器學習模型的高級尺度特征,包括:
- 分布式線性回歸
- 分布式決策樹
- 合奏方法(套袋、助推)
持續時間
測試人員將有90分鍾的時間完成認證考試。
問題
認證考試有45道選擇題。這些問題將以下列方式按高級別專題分發:
- 機器學習- 29% (13/45)
- ML工作流- 29% (13/45)
- 火花毫升- 33% (15/45)
- 縮放ML模型- 9% (4/45)
成本
每次參加認證考試的費用為200美元。測試人員可能要根據他們的位置繳納稅款。測試者可以想重考多少次就重考多少次,但每次需要支付200美元。
測試艾滋病
本次考試沒有考試輔助工具。
編程語言
本次考試中的所有機器學習代碼都將使用Python。對於不特定於機器學習任務的工作流或代碼,可以用SQL提供數據操作代碼。
過期
由於機器學習實踐者的職責和Databricks lakakehouse平台的能力的變化速度,該認證自每個測試人員通過認證考試之日起2年內有效。Beplay体育安卓版本
準備
為了學習認證考試評估的內容,考生應參加下列Databricks Academy課程之一:
- 教師指導:使用Apache Spark進行可擴展的機器學習
- 自定步調(可在Databricks Academy中獲得):使用Apache Spark進行可擴展的機器學習
考生還可以通過參加認證考試概述課程(即將推出)來了解更多關於認證考試的信息。
常見問題
如需查看常見問題(FAQs)的答案,請參閱Databricks AcademyFAQ文檔.