Nagios问题处理如下所述:" a) w# S, r8 H" K
1、监控状态不正常怎么办?( x, \7 P, p; S* X, K
答、建议从本机手动check看看结果,检查防火墙等防止端口被阻止访问,造成监控失误。
9 T' Q8 c/ i! l: l8 r2、nrpe在 ./configure时提示:
6 W9 v7 l& ~& Qchecking for SSL... configure: error: Cannot find ssl libraries2 s# V, y+ ^- D
答、把openssl-devel装上就可以了.
. z. r K- i4 i p3 K1 }4 {: ^" C3、nagios web界面提示:4 w' t! d( j h4 ?( @! p8 H4 D
It appears as though you do not have permission to view information for any of the services you requested...
' K- R& J" @7 c# P1 W1 P" U答、打开cgi.cfg配置文件, use_authentication=1+ ~2 u# a; h5 z
为了保障系统的安全性,nagios设置了这个参数,默认为1,改为0即可。
6 f# m3 }! l: [! y, y- O% H# t! s4、如果NSClient设置了连接需要密码或者改变了端口,哪么服务器应该怎么连接?/ w4 k @* |$ b: ?' z% H K9 J- J
答、$USER1$/check_nt -H $HOSTADDRESS$ -p 12489 -s PASSWORD -v $ARG1$ $ARG2$
1 j/ f0 I) J5 B/ n4 I-p 指定 port -s 指定 password( g8 v6 c1 `4 m# i+ g6 b
5、Service Commands 中Enable notifications for this service时报错:
3 `9 m! d' a: `0 W J7 KSorry Dave, I can't let you do that...
" O# L4 g1 q( u- K' u. [6 CIt seems that you have chosen to not use the authentication functionality of the CGIs.' P0 j# y- j3 b( b" M; O5 ]) B
答、修改cgi.cfg文件
6 ~: A! R' z3 W/ \2 e# k% O0 {修改use_authentication=1 (默认) ,如果没有添加,重启nagios服务。* w- Q% ~. W4 J! D& A
6、监控mysql的时候提示错误:is not allowed to connect to this MySQL server3 t9 n% N% @: h. D( g5 C% J' i
Server (nagios服务端192.168.0.132)
& n$ q7 s# m' X+ d#/usr/local/nagios/libexec/check_mysql -H 192.168.0.207 -u root -p xukixu, b0 @0 o+ V ~
此时可能会出现错误:Host '192.168.0.132' is not allowed to connect to this MySQL server/ E9 D% U/ e* |& f6 q
答、在客户端client(192.168.0.207)做个mysql授权用户访问即可:
( r: S u$ j; }: Lmysql>grant all privileges on *.* to root@192.168.0.132 identified by '123456';7 M" j- M) z: c; H$ _! L6 r1 U4 M
mysql>flush privileges;- l8 k- w9 D$ p/ d$ i+ j
7、如何添加一台监控 38101 端口的Linux服务器?
6 z5 J, e: ] w) l2 w5 O答、首先需要在 command.cfg 里边定义 check_tcp (默认已经定义)
; q o+ u4 x9 b9 }* b1 i9 b然后在拷贝 localhost 配置文件,修改主机名,ip,别名等信息,添加服务项,check_tcp!38101
6 y0 {9 z: ?' J3 D然后在 nagios.cfg 主配置文档里添加该主机配置文件路径;
6 c+ g! i2 r- u, n3 E检查配置文件正确性,并重启 nagios 使配置生效。
$ E" P9 d( ^' s$ N6 }! g8、怎么样比较清晰的管理尽千台主机?1 x$ M+ _3 [ F5 _& Q7 Z
答、建议每个配置文件单独管理一台主机,然后将所有主机的配置文件单独放在通一个目录底下,做好定期备份,这样,可以方便修改不同主机上的不同服务,而且可以很方便的临时增加和删除一个主机节点。
& M' I8 `9 ~3 A3 y9 y9、如何添加一个管理插件的配置?
4 _/ _6 m1 U/ [+ o答、在 command.cfg 配置文件里可以添加插件,要添加的插件必须存在于主机的 libexec/* 目录下,否则,在检测配置文件的时候会报错!
$ S9 E* b6 t# E; \1 X10、我装了nagios-plugin没有check_mysql check_snmp 等插件都没有,为什么? c& a+ ]8 K a) g" ?. p6 H0 k
答、check_mysql在nagios-plugin的高版本中(nagios-plugins-1.4.13.tar)已经带了check_mysql插件,如果需要check_snmp,请安装 net-snmp-devel 之后再重新编译nagios来实现!% E) r/ G, j* T" ]2 ^6 |. Q
11、能举例说明一下配置文件参数的意义么?
0 g/ U0 c6 d. {8 {* }% w6 h* ^监控windows服务器运行的时间:$ i8 e+ h4 \# R/ O
check_command check_nt!UPTIME' s7 ?) M% A9 @/ U8 i4 O
监控Windows服务器的CPU负载,如果5分钟超过80%则是warning,如果5分钟超过90%则是critical
% g4 E) O1 I9 } E+ _check_command check_nt!CPULOAD!-l 5,80,904 \5 o# X7 W' O; h
监控Windows服务器的内存使用情况,如果超过了80%则是warning,如果超过90%则是critical
/ ~0 A# g" x. U3 w; g3 Ccheck_command check_nt!MEMUSE!-w 80 -c 90
, I3 E& I" Q3 R& R1 b4 D7 j" E监控Windows服务器C:\盘的使用情况,如果超过80%已经使用则是warning,超过90%则是critical, -l 后面接的参数用来指定盘符. k1 _7 A6 w1 r2 }2 f x
check_command check_nt!USEDDISKSPACE!-l c -w 80 -c 90
: c2 m/ t. |! f# T监控Windows服务器D:\盘的使用情况,如果超过80%已经使用则是warning,超过90%则是critical0 |5 q! ]6 O) O* H
check_command check_nt!USEDDISKSPACE!-l d -w 80 -c 90
. g) u% S, j, c# G# i& a0 s4 N监控Windows服务器的W3SVC服务的状态,如果服务停止了,则是critical2 b6 K) y$ f4 l x# K5 p
check_command check_nt!SERVICESTATE!-d SHOWALL -l W3SVC" j3 s% t/ `6 u# G( b2 \
监控Windows服务器的Explorer.exe进程的状态,如果进程停止了,则是critical
- G" h' h% |. }6 {) fcheck_command check_nt!PROCSTATE!-d SHOWALL -l Explorer.exe
* X0 T. }0 r: P( Y- i. wcommand.cfg 里 command_line $USER1$/check_tcp -H $HOSTADDRESS$ -p $ARG1$ $ARG2$ 中,-p 后$ARG1$ $ARG2$ 表示在 host.cfg 配置文件中 check_tcp 可以跟两个端口参数,比如:check_tcp!20!21
0 a* c, f+ f$ |5 Onagios问题解决办法就为读者介绍完了,如果读者有不明白的地方可以阅读:安装配置nagios、修改Apache配置?、监控Linux服务器?、Nagios 3.0初步安装配置和监控Windows服务器1 S, V1 `! s/ U8 o# \7 W1 U- D
|