磚特性的商店

這一頁解釋了什麼是特性商店,它提供了什麼好處,以及Databricks特性商店的具體優點。

Databricks Feature Store庫僅在Databricks機器學習運行時可用,並可通過Databricks筆記本和工作流訪問。

請注意

現在,Feature Store不支持寫入Unity Catalog轉移庫。在支持Unity catalog的工作空間中,你隻能將特性表寫入默認的Hive metastore。

什麼是特色商店?

特征存儲是一個集中的存儲庫,它使數據科學家能夠查找和共享特征,並確保用於計算特征值的相同代碼用於模型訓練和推斷。

機器學習使用現有數據建立模型來預測未來的結果。在幾乎所有情況下,原始數據在用於構建模型之前都需要預處理和轉換。這個過程被稱為特征化或特征工程,這個過程的輸出被稱為特征——模型的構建模塊。

開發功能是複雜和耗時的。另外一個複雜的問題是,對於機器學習,需要在模型訓練時進行特征化計算,然後在使用模型進行預測時再次進行特征化計算。這些實現可能不是由同一個團隊或使用相同的代碼環境完成的,這可能導致延遲和錯誤。另外,組織中的不同團隊通常有相似的特性需求,但可能不知道其他團隊所做的工作。特性商店就是為解決這些問題而設計的。

為什麼使用Databricks特性商店?

Databricks Feature Store與Databricks的其他組件完全集成。

  • 可發現性。從Databricks工作空間訪問的Feature Store UI允許您瀏覽和搜索現有的特性。

  • 血統。當您使用feature Store創建特性表時,用於創建特性表的數據源將被保存並可訪問。對於特性表中的每個特性,您還可以訪問使用該特性的模型、筆記本、作業和端點。

  • 集成模型評分和服務。當您使用Feature Store中的特性來訓練模型時,模型會與特性元數據打包在一起。當您使用該模型進行批量評分或在線推理時,它會自動從Feature Store中檢索特性。調用者不需要了解它們,也不需要包含查找或連接特性以獲取新數據的邏輯。這使得模型的部署和更新更加容易。

  • 時間點查找。Feature Store支持需要時間點正確性的時間序列和基於事件的用例。

開始使用功能商店

請參閱以下文章來開始使用Feature Store:

更多的信息

有關使用Feature Store最佳實踐的更多信息,請下載特色商店綜合指南