工作流程概述
本頁麵概述如何使用磚特性存儲在機器學習在線和批處理用例的工作流。
機器學習的典型工作流使用特性存儲遵循這條道路:
編寫代碼將原始數據轉化為功能和創建一個火花DataFrame包含所需的特性。
支持統一的工作區目錄,寫DataFrame特性表<大學>。如果沒有啟用您的工作區目錄,統一寫DataFrame特性表存儲在工作區中功能。
火車模型使用從功能存儲特性。當你這樣做時,使用的模型存儲規範的功能訓練。模型用於推理時,它會自動連接功能從適當的功能表。
注冊模式模型注冊。
請注意
統一目錄中的任何三角洲表有一個主鍵自動表,您可以使用一個特性模型訓練和推理。這個特性是在公共預覽。
您現在可以使用新數據模型進行預測。
批量使用的情況下,模型自動檢索功能需要從特色商店。
實時服務用例,發布的特性在線商店。
在推理時,模型從在線存儲和讀取的預先計算功能連接的客戶機請求中提供的數據到模型服務端點。
筆記本例子:統一目錄
磚運行時13.2及以上,任何δ在統一目錄表主鍵可以用作功能表。當你使用一個注冊表統一目錄特性表,統一編目功能都可用自動功能表。特性工程統一目錄公共預覽。