Feature Store工作流程概述

本頁概述了如何在在線和批處理用例的機器學習工作流中使用Databricks Feature Store。

使用Feature Store的典型機器學習工作流遵循以下路徑:

  1. 編寫代碼將原始數據轉換為功能,並創建一個包含所需功能的Spark DataFrame。

  2. 將DataFrame寫入一個特征表在功能商店。

  3. 使用特征庫中的特征訓練模型。當您這樣做時,模型將存儲用於訓練的特征的規格。當模型用於推理時,它會自動地從適當的特征表中連接特征。

  4. 模型注冊

您現在可以使用該模型對新數據進行預測。

對於批處理用例,模型自動從Feature Store中檢索所需的特性。

用於批處理機器學習用例的特征存儲工作流。

對於實時服務用例,將特性發布到在線商店

在推斷時,模型從在線特征存儲中讀取預先計算的特征,並將它們與客戶端請求中提供的數據連接到模型服務端點。

所服務的機器學習模型的特征存儲流程。

例如筆記本電腦

基本特征存儲示例筆記本引導您創建特征存儲表,使用它訓練模型,然後使用自動特征查找執行批量評分。它還向您介紹了Feature Store UI,並展示了如何使用它來搜索特性以及了解如何創建和使用特性。

基本功能商店示例筆記本

在新標簽頁打開筆記本

Feature Store出租車示例筆記本演示了創建特征、更新特征以及使用特征進行模型訓練和批量推斷的過程。

功能商店出租車示例筆記本

在新標簽頁打開筆記本