Nagios问题处理如下所述:0 `" C# {9 \! t* X
1、监控状态不正常怎么办?
. t! C ]4 j* t5 ]& q答、建议从本机手动check看看结果,检查防火墙等防止端口被阻止访问,造成监控失误。8 @3 U- n q# S! y
2、nrpe在 ./configure时提示:
+ e6 D5 P, f5 Achecking for SSL... configure: error: Cannot find ssl libraries* I( v3 K1 A- n: ~
答、把openssl-devel装上就可以了.
0 u5 j. P3 p8 s3 ^% B( |3、nagios web界面提示:' q" E! I* d8 J* P4 c- L
It appears as though you do not have permission to view information for any of the services you requested...- `# p4 F3 U# y1 k! ]* H
答、打开cgi.cfg配置文件, use_authentication=1
% F4 G4 M, q5 ^1 ^( Z. h4 ^5 \* a为了保障系统的安全性,nagios设置了这个参数,默认为1,改为0即可。2 F8 c: T3 ~ h
4、如果NSClient设置了连接需要密码或者改变了端口,哪么服务器应该怎么连接?
7 X) V6 D# Z E- ~答、$USER1$/check_nt -H $HOSTADDRESS$ -p 12489 -s PASSWORD -v $ARG1$ $ARG2$
- h2 I4 G4 B2 C/ ?-p 指定 port -s 指定 password/ E; C: L4 e! }" F9 O( F
5、Service Commands 中Enable notifications for this service时报错:3 R$ D" s& C/ _+ B, S
Sorry Dave, I can't let you do that...6 ^" z. z# q5 f. o" I. ~3 f% P
It seems that you have chosen to not use the authentication functionality of the CGIs.9 V: r4 Y7 V! ~& @' r
答、修改cgi.cfg文件) z3 S+ `1 q, M7 S/ T0 k
修改use_authentication=1 (默认) ,如果没有添加,重启nagios服务。) h* Z' f# c+ b( d, w( X* @" b S
6、监控mysql的时候提示错误:is not allowed to connect to this MySQL server
1 \; M9 \+ m, k/ M& M' |Server (nagios服务端192.168.0.132)
) F7 G+ N9 o8 b+ T: _4 T8 ?#/usr/local/nagios/libexec/check_mysql -H 192.168.0.207 -u root -p xukixu
' v% r8 b! a, o+ Z( }4 ], C此时可能会出现错误:Host '192.168.0.132' is not allowed to connect to this MySQL server
4 u9 |% E4 C# D) w) U8 E3 B答、在客户端client(192.168.0.207)做个mysql授权用户访问即可:' K0 b6 k! B5 r+ J
mysql>grant all privileges on *.* to root@192.168.0.132 identified by '123456';
' g+ ^' j8 y% Amysql>flush privileges;
1 X" G4 Y+ c9 V' ?) w/ ?5 y7、如何添加一台监控 38101 端口的Linux服务器?
, w2 q5 o) q5 }5 g$ z答、首先需要在 command.cfg 里边定义 check_tcp (默认已经定义)! H+ q9 r) q, Z2 k+ a% K. C
然后在拷贝 localhost 配置文件,修改主机名,ip,别名等信息,添加服务项,check_tcp!38101
! {9 P' o/ K0 D# ?- f" o/ d然后在 nagios.cfg 主配置文档里添加该主机配置文件路径;
7 |% n+ _8 e: d6 p$ X0 X6 y检查配置文件正确性,并重启 nagios 使配置生效。+ q9 J; k: i' F4 S4 I) f9 K/ L
8、怎么样比较清晰的管理尽千台主机?6 J+ U. O+ ~ w. X! J( L4 _
答、建议每个配置文件单独管理一台主机,然后将所有主机的配置文件单独放在通一个目录底下,做好定期备份,这样,可以方便修改不同主机上的不同服务,而且可以很方便的临时增加和删除一个主机节点。 p: b% T; [6 m/ x5 c
9、如何添加一个管理插件的配置? Y, q5 o1 m7 P3 R# u+ T
答、在 command.cfg 配置文件里可以添加插件,要添加的插件必须存在于主机的 libexec/* 目录下,否则,在检测配置文件的时候会报错!* e. A" E5 f( X/ Z' p
10、我装了nagios-plugin没有check_mysql check_snmp 等插件都没有,为什么?
, w- J0 s; A/ _5 p4 h答、check_mysql在nagios-plugin的高版本中(nagios-plugins-1.4.13.tar)已经带了check_mysql插件,如果需要check_snmp,请安装 net-snmp-devel 之后再重新编译nagios来实现!
0 ?) V) S$ e1 G11、能举例说明一下配置文件参数的意义么?
3 v; }8 W) Q; I! ?( p/ u7 V0 q监控windows服务器运行的时间:' j3 s# B1 F; ^- E
check_command check_nt!UPTIME. Y5 b9 g$ s4 L- ^6 ]# A! c
监控Windows服务器的CPU负载,如果5分钟超过80%则是warning,如果5分钟超过90%则是critical
5 u# z0 x0 \" _check_command check_nt!CPULOAD!-l 5,80,90( Z8 q; a) q7 N- R# ]; X# Y
监控Windows服务器的内存使用情况,如果超过了80%则是warning,如果超过90%则是critical1 u% R. a* E- [, x7 ^
check_command check_nt!MEMUSE!-w 80 -c 90
. i4 j: v3 B$ [2 s监控Windows服务器C:\盘的使用情况,如果超过80%已经使用则是warning,超过90%则是critical, -l 后面接的参数用来指定盘符
2 @$ x% U2 |. f# U, w5 g$ W+ Gcheck_command check_nt!USEDDISKSPACE!-l c -w 80 -c 90
: a( b# |" x1 f* V监控Windows服务器D:\盘的使用情况,如果超过80%已经使用则是warning,超过90%则是critical- N; O, n, M: Q; E3 W) [+ b
check_command check_nt!USEDDISKSPACE!-l d -w 80 -c 90
# S, w+ z( u& v8 j+ ^& a3 S" V监控Windows服务器的W3SVC服务的状态,如果服务停止了,则是critical" s8 \# R1 p5 y# _) J! x
check_command check_nt!SERVICESTATE!-d SHOWALL -l W3SVC, p! J6 Q: L7 \% I, N7 m/ T
监控Windows服务器的Explorer.exe进程的状态,如果进程停止了,则是critical
9 A1 J/ ?, R& } Icheck_command check_nt!PROCSTATE!-d SHOWALL -l Explorer.exe4 W9 }. W% [7 g
command.cfg 里 command_line $USER1$/check_tcp -H $HOSTADDRESS$ -p $ARG1$ $ARG2$ 中,-p 后$ARG1$ $ARG2$ 表示在 host.cfg 配置文件中 check_tcp 可以跟两个端口参数,比如:check_tcp!20!213 i1 h; }+ b+ r" w# [2 ]! i0 w) k
nagios问题解决办法就为读者介绍完了,如果读者有不明白的地方可以阅读:安装配置nagios、修改Apache配置?、监控Linux服务器?、Nagios 3.0初步安装配置和监控Windows服务器
* ]" N0 A5 p/ j; v |