
Zabbix Logo
Zabbix 是一個監控套件
可監控網路上的devices
主要利用的監控方法有 Zabbix Agent, SNMP, SNMP trap, IPMI, SSH,TELNET,WEB,Database,JMX 跟自訂的scripts(Zabbix 稱External check)
Zabbix Agent 又可分主動(Active)跟被動(Passive)
Passive Agent : 由zabbix server 定期訪問Client device 上的 zabbix agent, 取得的讀值
Active Agent : Client device 上的 zabbix agent 定期主動回報自己的讀值
Zabbix Agent 內建有多種對OS層的監控項目
https://www.zabbix.com/documentation/2.0/manual/config/items/itemtypes/zabbix_agent
可自訂自己的方法到Zabbix Agent來加強想要監控的項目。Zabbix 稱 UserParameterm。如get ipmi sdr from KCS。只要OS能拿到的都能監控。
Zabbix 主要的監控觀念 : Host, Item , Trigger , Action
Host : 要被監控的Device
Item : 監控的方法或是資料蒐集的方法
Trigger : 邏輯判斷蒐集到的值是否在定義的範圍內
Action : 若不是就行動。
如Email 給誰 or IM 給走XMPP標準的的IM or SMS 給誰orv執行scripts等~
Zabbix 主要的設定項目有 : Host , item, trigger, template
Host : 設定哪個device要被監控
item : 對這個host要監控些什麼,要蒐集什麼讀值,要如何蒐集
trigger : 當蒐集到的值超出定義的範圍就 …
template : Template 包含以上辛苦設定好的三項,可export 成xml,再import到其他台zabbix上重複使用。import時可選擇不要Host, 使得template能通用。所有動作在Web UI完成,非常容易方變。
跟Nagios不一樣的地方 :
1. Zabbix不需特別安裝RRD來達到繪圖功能,Zabbix內建簡單的繪圖功能,每個搜集的值都有簡易趨勢圖。
2. Nagios NRPE plugin(perl script) 在Client 端上判斷是否為問題後回傳,
Zabbix卻是在 Server端做邏輯判斷,非常彈性的可設定/改變判斷值
如 :
Problem: If cpu1 temperature over 60 °C for last 10 minutes,
then define it as a warning event.
Recovery: If cpu1 temperature is within 20~60 °C for last 10 minutes,
then define it as a recovery event.
3. 所有監控設定都是在WEB UI用滑鼠鍵盤完成。
4. 有內建對IPMI Device的監控,2.2版已加強到能監控descrete sensor
5. 前端用php
6. Zabbix 綁DB,Nagios 不用DB。
一些截圖:
-
-
一些監控的截圖
-
-
對IPMI的監控(Out of Band)
-
-
OS層的監控,黃色讀值為warning
-
-
問題發生了
-
-
Severity的顏色可自訂