使用API創建監視器

預覽

這個特性是在公共預覽

本頁麵描述了如何創建一個監控在磚和描述所有的API調用中使用的參數。

您可以創建一個監視在任何管理或外部三角洲統一注冊表目錄。隻有一個顯示器可以在統一目錄創建metastore表。

Lakehouse監測API的細節,請參閱API參考

概要文件類型參數

profile_type參數確定的指標,監測計算表。有三種類型:快照,TimeSeries, InferenceLog。本節簡要描述了參數。詳情,請參閱API參考

TimeSeries配置文件

一個TimeSeries概要文件比較數據分布跨越時間窗口。對於一個TimeSeries概要文件,您必須提供時間戳列(timestamp_col)和一組粒度在計算指標。可用的粒度“5分鍾”,“30分鍾”,“1小時”,“一天”,“n周(s)”,“一個月”,“1年”。

進口lakehouse_monitoring作為lmlmcreate_monitor(table_name=f{目錄}{模式}{table_name},profile_type=lmTimeSeries(timestamp_col=“t”,粒度=(“30分鍾”]),output_schema_name=f{目錄}{模式})

快照配置文件

相比TimeSeries,一個快照概要文件監控表的完整內容如何隨時間變化。指標計算表中所有數據,並監控表在每次刷新監控狀態。

進口lakehouse_monitoring作為lmlmcreate_monitor(table_name=f{目錄}{模式}{table_name},profile_type=lm快照(),output_schema_name=f{目錄}{模式})

InferenceLog配置文件

一個InferenceLog概要文件是類似的TimeSeries配置文件還包括質量度量模型。對於一個InferenceLog配置文件,需要以下參數:

參數

描述

problem_type

“分類”或“回歸”。

prediction_col

列包含模型的預測值。

timestamp_col

包含推理請求的時間戳列。

model_id_col

包含的id列模型用於預測。

粒度

決定如何在windows分區數據在時間。可能的值:“5分鍾”,“30分鍾”,“1小時”,“一天”,“n周(s)”,“一個月”,“1年”。

還有一個可選參數:

可選參數

描述

label_col

列包含地麵真值預測模型。

進口lakehouse_monitoring作為lmlmcreate_monitor(table_name=f{目錄}{模式}{table_name},profile_type=lmInferenceLog(problem_type=“分類”,prediction_col=“僅僅”,timestamp_col=“t”,粒度=(“30分鍾”,“一天”),model_id_col=“model_ver”,label_col=“標簽”,#可選),output_schema_name=f{目錄}{模式})

InferenceLog概要,片自動創建基於不同值的model_id_col

刷新和查看監控結果

刷新指標表,使用run_refresh。例如:

進口lakehouse_monitoring作為lmlmrun_refresh(table_name=f{目錄}{模式}{table_name})

當你打電話run_refresh從一個筆記本,監測指標表創建或更新。這個計算serverless計算上運行,而不是在集群上的筆記本相連。您可以繼續在筆記本上運行命令而監控統計數據更新。

中存儲的信息統計指標表,看看監控指標表指標表統一目錄表。你可以查詢他們在筆記本或SQL查詢的探險家,在數據瀏覽和查看它們。

顯示所有刷新與監測相關的曆史,使用list_refreshes

進口lakehouse_monitoring作為lmlmlist_refreshes(table_name=f{目錄}{模式}{table_name})

具體運行的狀態,一直在排隊,跑步,或者完成時,使用get_refresh

進口lakehouse_monitoring作為lmrun_info=lmrun_refresh(table_name=f{目錄}{模式}{table_name})lmget_refresh(table_name=f{目錄}{模式}{table_name},refresh_id=run_inforefresh_id)

查看監視設置

您可以檢查監控設置使用APIget_monitor

進口lakehouse_monitoring作為lmlmget_monitor(table_name=TABLE_NAME)

時間表

建立一個監控計劃的基礎上運行,使用時間表參數的create_monitor:

lmcreate_monitor(table_name=f{目錄}{模式}{table_name},profile_type=lmTimeSeries(timestamp_col=“t”,粒度=(“30分鍾”]),時間表=lmMonitorCronSchedule(quartz_cron_expression=“0 0 12 * * ?”,#安排每天在中午12點刷新timezone_id=“太平洋標準時間”,),output_schema_name=f{目錄}{模式})

看到cron表達式為更多的信息。

訪問控製矩陣表

創建的表和儀表板監測的指標都屬於用戶創建監視器。您可以使用統一的目錄權限訪問控製指標表。分享儀表板在一個工作區,使用分享按鈕在右上角的儀表板。

刪除一個監控

刪除一個監控:

lmdelete_monitor(table_name=TABLE_NAME)

這個命令不會刪除創建的配置文件表和儀表板的班長。你必須刪除這些資產在一個單獨的步驟,也可以保存在不同的位置。

例如筆記本電腦

下麵的例子筆記本演示如何創建一個監視器,刷新監控,並檢查它創建的指標表。

筆記本的例子:時間序列資料

這個筆記本演示了如何創建一個TimeSeries監控類型。

TimeSeries Lakehouse監視示例的筆記本

筆記本的例子:快照

這個筆記本演示了如何創建一個快照監控類型。

快照Lakehouse監控例子筆記本

筆記本的例子:推理概要(回歸)

這個筆記本演示了如何創建一個InferenceLog類型監控一個回歸的問題。

推理Lakehouse監控回歸的例子的筆記本