check_ganglia_metric

軟件截圖:
check_ganglia_metric
軟件詳細信息:
版本: 2012.02.28
上傳日期: 15 Apr 15
許可: 免費
人氣: 1

Rating: 3.0/5 (Total Votes: 1)

check_ganglia_metric是Nagios的插件,它允許你觸發警報的任何神經節的度量。
check_ganglia_metric沉重弗拉基米爾Vuksan的check_ganglia_metric.php的啟發,但它配備了多項改進。

安裝

#畫中畫安裝check_ganglia_metric
...或者:
#easy_install的check_ganglia_metric
神經節的配置
除非你的Nagios服務器和神經節元守護在同一主機上運行,你可能需要編輯gmetad.conf允許來自Nagios服務器的遠程連接。
允許從nagios-server.example.com連接:
trusted_hosts nagios-server.example.com
要允許所有主機(可能是安全風險)連接:
all_trusted上
測試在命令行
首先,讓我們看看check_ganglia_metric可以與神經節元守護通信:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
  - metric_host = host.example.com --metric_name = cpu_idle
狀態好,CPU空閒= 99.3%| cpu_idle = 99.3%;;;;
“狀態好”的消息表明,check_ganglia_metric正在工作。如果你遇到了麻煩這項工作,有詳細記錄再試一次啟用(--verbose)為了更加深入地了解正在發生的事情是錯誤的。
現在讓我們來嘗試設置警告閾值:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
  - metric_host = host.example.com --metric_name = cpu_idle --critical = 99
狀態嚴重,CPU空閒= 99.6%| cpu_idle = 99.6%;; ;; 99
我們告訴check_ganglia_metric返回一個“關鍵”的狀態,如果空閒CPU大於99.“臨界狀態”的消息表明,它的工作。注意:根據官方的Nagios插件開發指導方針,check_ganglia_metric解析的範圍和閾值。
要查看簡短的解釋命令行選項,運行check_ganglia_metric用--help選項的完整列表。
Nagios的配置
首先,創建一個命令定義:
定義命令{
  COMMAND_NAME check_ganglia_metric
  COMMAND_LINE /u​​sr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ HOSTADDRESS $ --metric_name = $ ARG1 $ --warning = $ ARG2 $ --critical = $ ARG3 $
}
現在你可以在你的服務定義使用上面的命令:
定義服務{
  SERVICE_DESCRIPTION CPU空閒 - 神經節
 使用some_template
!  check_command check_ganglia_metric cpu_idle 0:0 20:0!
  HOST_NAME host.example.com
}
這將很好地工作,直到出現問題,check_ganglia_metric(如緩存文件不能被讀取/寫入,神經節元守護進程無法達到,等等)。在這一點上,每一個依賴於check_ganglia_metric服務會失敗,可能會淹沒你的警報。我們可以防止這種通過使用服務的依賴關係。
我們需要做的第一件事是檢查文件的年齡命令定義:
定義命令{
  COMMAND_NAME check_file_age
  COMMAND_LINE / usr / lib中/的nagios /插件/ check_file_age -f $ ARG1 $ -w $ ARG2 $ -c $ ARG3 $
}
接下來,我們定義它檢查check_ganglia_metric的緩存文件年齡的服務。需要注意的是,為了真正有效,這種服務需要被檢查至少為(優選更多)經常比所有依賴check_ganglia_metric另一檢查:
定義服務{
  SERVICE_DESCRIPTION緩存check_ganglia_metric
 使用some_template
 !!!check_command check_file_age /var/lib/nagios/.check_ganglia_metric.cache 60 120
  HOST_NAME本地主機
  check_interval 1
  max_check_attempts 1
}
最後,我們建立了實際的服務的依賴。請注意,我已經啟用use_regexp_matching在Nagios的,這讓我使用正則表達式在我的指令。通過堅持“ - 神經節”在每一個依賴於check_ganglia_metric服務結束後,我能救自己很多的努力:
定義servicedependency {
  HOST_NAME本地主機
  SERVICE_DESCRIPTION緩存check_ganglia_metric
  dependent_host_name *。
  dependent_service_description * - 神經節$
  execution_failure_criteria C,P
}
現在,如果出現錯誤與check_ganglia_metric,只有一個警報將被發送了關於緩存文件,以及所有相關的服務檢查將暫停,直到你解決引起check_ganglia_metric失敗的問題。一旦問題是固定的,你需要更新緩存文件的時間戳,以把“緩存check_ganglia_metric”的服務回一個OK狀態(這將使相關服務的檢查,以繼續):
 觸摸/var/lib/nagios/.check_ganglia_metric.cache
提示和技巧
這是可能通過啟用以獲取可用的主機和度量的完整列表“更詳細”記錄(-vv)。由於metric_host和METRIC_NAME選項是必需的,你有一個“雞和蛋”的問題在這裡一點點,不過沒關係。只是提供一些虛擬數據。該插件將錯誤出在結尾加上一個“主機/公噸未找到”它轉儲其高速緩存錯誤,而不是之前:
  check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
  - metric_host =假--metric_name =假-vv

什麼是此版本中的新

  • 添加 - -metrics_max_age選項
  • 在合併CHANGELOG.rst到README.rst

要求

  • 在Python中
  • 的Nagios

限制

  • 在不使用Python 2.4正常工作

類似的軟件

check_filemaker
check_filemaker

20 Feb 15

nfsstats.pl
nfsstats.pl

3 Jun 15

Recon
Recon

3 Jun 15

意見 check_ganglia_metric

評論沒有發現
添加評論
打開圖片!