Nagios问题处理如下所述:
. b W+ L2 g, V: B8 _' \/ T: O1、监控状态不正常怎么办?
9 p/ l+ v3 S. ~$ j5 {) X答、建议从本机手动check看看结果,检查防火墙等防止端口被阻止访问,造成监控失误。/ e6 ?# ~! |9 _: G P
2、nrpe在 ./configure时提示:
, c& B/ {& \3 _$ S7 r% u. F' d achecking for SSL... configure: error: Cannot find ssl libraries
- X+ _! t+ e8 G" V答、把openssl-devel装上就可以了.2 w# N2 t) h$ @9 x' l" _0 H
3、nagios web界面提示:" i. Y3 V4 X, n0 w. w) `3 ?
It appears as though you do not have permission to view information for any of the services you requested...' |; i) f- P' Z* H/ [
答、打开cgi.cfg配置文件, use_authentication=1
! u+ i7 s3 F3 B2 b为了保障系统的安全性,nagios设置了这个参数,默认为1,改为0即可。
: s1 w2 {1 _' U) N4 W. i- i3 ^/ { _4、如果NSClient设置了连接需要密码或者改变了端口,哪么服务器应该怎么连接?/ u- W2 h9 M0 N( Z1 P9 a0 |9 f, R
答、$USER1$/check_nt -H $HOSTADDRESS$ -p 12489 -s PASSWORD -v $ARG1$ $ARG2$
( @. C3 m, E& C* f. }-p 指定 port -s 指定 password
" J1 a& h/ f }5、Service Commands 中Enable notifications for this service时报错:
5 \1 i2 d+ ? v8 D$ F1 g% _Sorry Dave, I can't let you do that...* }/ k+ z% D7 h" c
It seems that you have chosen to not use the authentication functionality of the CGIs.
, {- k7 c: q5 R$ \; [, c答、修改cgi.cfg文件
0 }9 h3 W$ q6 @3 K/ G4 b修改use_authentication=1 (默认) ,如果没有添加,重启nagios服务。
2 @1 f$ f8 K. x. Q6 z, z; Y' I; |5 [ A4 I% {6、监控mysql的时候提示错误:is not allowed to connect to this MySQL server/ c& N; N: j6 t ^" @
Server (nagios服务端192.168.0.132)) u' k" N7 q2 x
#/usr/local/nagios/libexec/check_mysql -H 192.168.0.207 -u root -p xukixu
7 h# K' Y9 @9 ~; M9 |此时可能会出现错误:Host '192.168.0.132' is not allowed to connect to this MySQL server4 P- A/ p. u! K( b% F
答、在客户端client(192.168.0.207)做个mysql授权用户访问即可:
+ ^$ Y/ |! @' U% u( b- D/ b! gmysql>grant all privileges on *.* to root@192.168.0.132 identified by '123456';
4 A7 Z2 w9 a3 F- P7 C5 Zmysql>flush privileges;
& R( l f" D2 G3 M7、如何添加一台监控 38101 端口的Linux服务器?0 D- D6 B2 x/ U+ s- d6 F8 D
答、首先需要在 command.cfg 里边定义 check_tcp (默认已经定义); j2 {. p% C0 [/ a% ?
然后在拷贝 localhost 配置文件,修改主机名,ip,别名等信息,添加服务项,check_tcp!38101( n' u* `5 @! ^1 z( p m# E& ?
然后在 nagios.cfg 主配置文档里添加该主机配置文件路径;
& d$ N: S3 l# m' J检查配置文件正确性,并重启 nagios 使配置生效。
$ C+ l& y |4 f9 O. n# \$ H1 ~8、怎么样比较清晰的管理尽千台主机?
- u' l& ?. Q7 f& J+ }9 t答、建议每个配置文件单独管理一台主机,然后将所有主机的配置文件单独放在通一个目录底下,做好定期备份,这样,可以方便修改不同主机上的不同服务,而且可以很方便的临时增加和删除一个主机节点。) g0 l+ X0 \* e; Y
9、如何添加一个管理插件的配置?
8 N! O* r C `! ^! ~" p答、在 command.cfg 配置文件里可以添加插件,要添加的插件必须存在于主机的 libexec/* 目录下,否则,在检测配置文件的时候会报错!: T% ^' t( K, Y+ X& U0 |: B) h
10、我装了nagios-plugin没有check_mysql check_snmp 等插件都没有,为什么?
, ~0 w! O* v$ T' C答、check_mysql在nagios-plugin的高版本中(nagios-plugins-1.4.13.tar)已经带了check_mysql插件,如果需要check_snmp,请安装 net-snmp-devel 之后再重新编译nagios来实现!! V8 ~8 @: |" c0 r
11、能举例说明一下配置文件参数的意义么?
2 D6 |, Q4 y$ Q: }监控windows服务器运行的时间:
$ B/ e3 X( a' T0 ucheck_command check_nt!UPTIME
2 q: h6 E, ?2 G5 S2 `8 a, x监控Windows服务器的CPU负载,如果5分钟超过80%则是warning,如果5分钟超过90%则是critical
& k8 q9 B# ]+ }9 X. X* Ncheck_command check_nt!CPULOAD!-l 5,80,90
4 z: o+ B7 K& O, N; D/ k( Z2 j监控Windows服务器的内存使用情况,如果超过了80%则是warning,如果超过90%则是critical0 K, f& M, O! `7 L) N& i
check_command check_nt!MEMUSE!-w 80 -c 90+ b3 N7 @3 {& t3 [
监控Windows服务器C:\盘的使用情况,如果超过80%已经使用则是warning,超过90%则是critical, -l 后面接的参数用来指定盘符
% W( H1 |! M: k6 A! B: x u! j y! lcheck_command check_nt!USEDDISKSPACE!-l c -w 80 -c 90
; y) t1 \$ N" e% [监控Windows服务器D:\盘的使用情况,如果超过80%已经使用则是warning,超过90%则是critical& Z7 u* d" q! A2 c
check_command check_nt!USEDDISKSPACE!-l d -w 80 -c 90% }9 J& D4 Q) R$ M( ^3 Y. U6 ? ?6 {1 P
监控Windows服务器的W3SVC服务的状态,如果服务停止了,则是critical, `5 d8 { M2 q. c- @
check_command check_nt!SERVICESTATE!-d SHOWALL -l W3SVC
5 r! d+ b$ d5 O& D9 t4 \/ K监控Windows服务器的Explorer.exe进程的状态,如果进程停止了,则是critical' f* C& n. O' |) ~4 v' [. P7 o# s* S
check_command check_nt!PROCSTATE!-d SHOWALL -l Explorer.exe2 M6 z5 [% |4 K" ?5 X
command.cfg 里 command_line $USER1$/check_tcp -H $HOSTADDRESS$ -p $ARG1$ $ARG2$ 中,-p 后$ARG1$ $ARG2$ 表示在 host.cfg 配置文件中 check_tcp 可以跟两个端口参数,比如:check_tcp!20!21
1 q' P7 h d- Bnagios问题解决办法就为读者介绍完了,如果读者有不明白的地方可以阅读:安装配置nagios、修改Apache配置?、监控Linux服务器?、Nagios 3.0初步安装配置和监控Windows服务器4 E% v2 U# z# @6 k; _# C5 y
|