嗨磚社區,
我喜歡的我有一些真實的用例實現就可能的原因,我為了你實施指南/想法/文件/最佳實踐。
假設我是一個經理,我在生產磚環境許多多功能集群以及工作的集群。磚生產環境的經理我喜歡監控使用、狀態、錯誤從儀表板和電子郵件通知以盡可能簡單的方法。儀表板,充滿了所有關鍵信息利用狀態,快速故障探測和降低成本等。
我希望我不是問什麼不現實的。如果可能,請給你的輸入。
我喜歡封麵的主要觀點:
1 >是我的磚集群很少使用或利用?
2 >如果我的磚在使用集群,這過程或設置的查詢或特定用戶或高資源消耗的時間框架是什麼?
2。一組>任何特定的查詢創建任何問題?
3 >假設如果我的一個集群' 1 '為最小節點和“20”最大節點,然後呆多少時間節點利用率在70%以上(或任何其他%)或利用趨勢?
4 >通知喜歡集群重新啟動或終止或一個特定的工作連續失敗的頂峰時期,等等。
5 >任何這樣的事情應該監視或控製。