使用群集和池標簽監視使用情況

為了監視成本並準確地將Databricks使用歸因於您組織的業務部門和團隊(例如,用於退款),您可以標記群集和池。這些標簽將兩者都傳播到詳細DBU用法報告以及AWS EC2和AWS EBS實例進行成本分析。

標記的對象和資源

您可以為Databricks管理的以下對象添加自定義標簽:

目的

標記接口(UI)

標記接口(API)

水池

池UI在Databricks工作區

實例池API

群集UI在Databricks工作區

簇API

警告

不要用密鑰分配自定義標簽姓名到一個集群。每個集群都有一個標簽姓名其價值由Databricks設置。如果更改與密鑰關聯的值姓名,群集不能再通過數據映。結果,群集在閑置之後可能不會終止,並將繼續產生使用成本。

Databricks將以下默認標簽添加到所有池和群集:

池標簽鑰匙名

價值

小販

恒定的“數據映”

DataBrickSinstancePoolCreatorId

創建池的用戶的內部標識符

databricksinstancepoolid

池的內部標識符

群集標簽鑰匙名

價值

小販

恒定的“數據映”

聚類

群集的內部標識符

clustername

集群的名稱

創造者

創建群集的用戶的用戶名(電子郵件地址)

在作業群集上,數據鏈球鏈接還應用以下默認標簽:

群集標簽鑰匙名

價值

runname

工作名稱

喬布斯

工作ID

在Databricks SQL使用的資源上,Databricks還應用了以下默認標簽:

群集標簽鑰匙名

價值

SQLWareHouseID

SQL倉庫的DataBricks內部標識符

標簽傳播

根據是否從池創建了一個集群,標簽會以不同的方式傳播到AWS EC2實例。

集群和池標簽繁殖

如果從池創建群集,則其EC2實例僅繼承自定義和默認池標簽,而不是群集標簽。因此,如果要從池創建簇,請確保將所有需要的自定義群集標簽分配到池中。

如果不是從池中創建群集,則其標簽會像EC2實例那樣傳播。

集群和泳池標簽都傳播到DBU用法報告,無論是否從池創建集群。

如果存在標簽名稱衝突,則數據標記默認標簽優先於自定義標簽,池標簽優先於群集標簽。

限製

  • 標記鍵和值隻能包含來自ISO 8859-1(LATIN1)集中的字符。包含其他字符的標簽被忽略。

  • 如果更改標簽鍵的名稱或值,則僅在群集重新啟動或池擴展後才適用這些更改。