價格總是與計算集群運行。如果在雲上而異。azure的海岸和AWS成本+雲成本。
核心,職業,和先進與額外的企業特性,比如安全性和ml流。你可能想要溢價如果你做數據科學項目。
最重要的事情你可以做,以避免高成本是關閉集群,當你不使用它們。有一個autoturnoff可以設置關閉集群靜止10分鍾後,默認是120分鍾。
工作和所有目的與交互性。工作計劃/自動工作,目的是為更多的互動筆記本使用。
DLT數據工程的管道,所以可能超出了您的項目的範圍。
這可能不是一個確切的回答你的問題,但是當我把我們的Azure發票,成本總是分成兩部分:
《計算成本相當困難。遠東使用光子顯然是更昂貴的比經典的引擎,但可以是便宜,因為你工作完成得更快。
我不是v清楚問題但當我們提供DLT工作流可以調整什麼類型的集群和服務器等
{
“集群”:【
{
“標簽”:“默認”,
“node_type_id”:“c5.4xlarge”,
“driver_node_type_id”:“c5.4xlarge”,
“num_workers”:20,
“spark_conf”:{
“spark.databricks.io.parquet.nativeReader.enabled”:“假”
},
“aws_attributes”:{
“instance_profile_arn”:“在攻擊:aws:……”
}
},
{
“標簽”:“維護”,
“aws_attributes”:{
“instance_profile_arn”:“在攻擊:aws:……”
}
}
]
}
然後,它將提供這些服務器在您的雲提供商
所以總成本將DBU成本和你的EC2實例的成本