Nagios (据说)是业内一流的系统监控软件框架. 但我这样一个非一流的 Linux 系统管理员, 之前由于管理的系统实在是少. 加上 Linux 自身的强壮, 于是似乎不怎么管也不会出事. 进而, 我之前一直都没有应用 Nagios 的良好动机.
最近, 负载我这小 blog 的VPS有些小小的情绪化行为. 可能是大环境不好吧. 于是我打算用 Nagios 监控一下.
在2009年我买了一本<Linux Networking Cookbook>, 上面对 Nagios 的讲解倒是蛮详细的, 但也有些吓人: 从编译开始的… 我在 Ubuntu Server 上测试了一下, 貌似很简单的. 首先:
$sudo apt-cache search nagios
发现当前的版本是 nagios3 了, 于是:
$sudo apt-get install nagios3
过程中会要求输入一个 password, 其实就是教程里使用 httpasswd 生成的用于保护 nagios 的口令. 之后使用浏览器查看:
http://localhost/nagios3
就能看到基本的监测界面了. 相当简单吧. 下一步如果要添加额外的需要监控的网站, 仅需要利用现有的 generic-host 模板设置新站点信息即可, 例如:
define host{
use generic-host
host_name raynix
alias raynix
address 184.82.236.44
}
然后, 记得要把上面的配置存到一个.cfg文件, 并复制或者链接到 /etc/nagios3/conf.d 文件夹. 定义了 host, 然后需要把 host 添加到需要检测的主机群(host group)里就完成了. 例如要将 raynix 添加到 http-servers, 这样就可以让 nagios 检测主机 raynix 上的 httpd 服务了.
打开: /etc/nagios3/conf.d/hostgroups_nagios2.cfg (为什么是 nagios2 呢?)
define hostgroup {
hostgroup_name http-servers
alias HTTP servers
members localhost,raynix
}
然后重新启动 nagios3 服务, 就可以以缺省的设置对主机 raynix 的 http 服务进行监测了. 另外如果要接收提示邮件的话, 需要修改 /etc/nagios3/conf.d/contacts_nagios2.cfg. 🙂