TranslateProject/published/201609/20160914 Server Monitoring with Shinken on Ubuntu 16.04.md

365 lines
8.7 KiB
Markdown
Raw Normal View History

在 Ubuntu 16.04 上安装和使用服务器监控报警系统 Shinken
2016-09-27 21:58:58 +08:00
=====
Shinken 是一个用 Python 实现的开源的主机和网络监控框架,并与 Nagios like 兼容,它可以运行在所有支持 Python 程序的操作系统上,比如说 Linux、Unix 和 WindowsShinken 是 Jean Gabes 为了验证一个新的 Nagios 架构思路而编写,但是这个想法被 Nagios 的作者拒绝后成为了一个独立的网络系统监视软件,并保持了与 Nagios 的兼容。
2016-09-27 21:58:58 +08:00
在这篇教程中,我将会描述如何从源代码编译安装 Shinken 和向监视系统中添加一台 Linux 主机。我将会以 Ubuntu 16.04 Xenial Xerus 操作系统来作为 Shinken 服务器和所监控的主机。
2016-09-27 21:58:58 +08:00
### 第一步 安装 Shinken 服务器
2016-09-27 21:58:58 +08:00
Shinken 是一个 Python 框架,我们可以通过 `pip` 安装或者从源码来安装它,在这一步中,我们将用源代码编译安装 Shinken。
2016-09-27 21:58:58 +08:00
2016-09-27 22:06:55 +08:00
在我们开始安装 Shinken 之前还需要完成几个步骤。
2016-09-27 21:58:58 +08:00
安装一些新的 Python 软件包并创建一个名为 `shinken` 的系统用户:
2016-09-27 21:58:58 +08:00
```
sudo apt-get install python-setuptools python-pip python-pycurl
useradd -m -s /bin/bash shinken
```
2016-09-27 22:06:55 +08:00
从 GitHub 仓库下载 Shinken 源代码:
2016-09-27 21:58:58 +08:00
```
git clone https://github.com/naparuba/shinken.git
cd shinken/
```
2016-09-27 22:06:55 +08:00
然后用以下命令安装 Shinken
2016-09-27 21:58:58 +08:00
```
git checkout 2.4.3
python setup.py install
```
然后,为了得到更好的效果,我们还需要从 Ubuntu 软件库中安装 `python-cherrypy3` 软件包:
2016-09-27 21:58:58 +08:00
```
sudo apt-get install python-cherrypy3
```
到这里Shinken 已经成功安装,接下来我们将 Shinken 添加到系统启动项并且启动它:
2016-09-27 21:58:58 +08:00
```
update-rc.d shinken defaults
systemctl start shinken
```
### 第二步 安装 Shinken Webui2
2016-09-27 21:58:58 +08:00
Webui2 是 Shinken 的 Web 界面(在 shinken.io 可以找到)。最简单的安装 Shinken webui2 的方法是使用shinken CLI 命令(必须作为 `shinken` 用户执行)。
2016-09-27 21:58:58 +08:00
2016-09-27 22:06:55 +08:00
切换到 shinken 用户:
2016-09-27 21:58:58 +08:00
```
su - shinken
```
初始化 shiken 配置文件,下面的命令将会创建一个新的配置文件 `.shinken.ini`
2016-09-27 21:58:58 +08:00
```
shinken --init
```
接下来用 shinken CLI 命令来安装 `webui2`
2016-09-27 21:58:58 +08:00
```
shinken install webui2
```
![](https://www.howtoforge.com/images/server-monitoring-with-shinken-on-ubuntu-16-04/6.png)
至此 webui2 已经安装好,但是我们还需要安装 MongoDB 和用 `pip` 来安装另一个 Python 软件包。在 root 下运行如下命令:
2016-09-27 21:58:58 +08:00
```
sudo apt-get install mongodb
pip install pymongo>=3.0.3 requests arrow bottle==0.12.8
```
接下来,切换到 shinken 目录下并且通过编辑 `broker-master.cfg` 文件来添加这个新的 webui2 模块:
2016-09-27 21:58:58 +08:00
```
cd /etc/shinken/brokers/
vim broker-master.cfg
```
2016-09-27 22:06:55 +08:00
在第 40 行添加一个模块选项:
2016-09-27 21:58:58 +08:00
```
modules webui2
```
保存文件并且退出编辑器。
2016-09-27 21:58:58 +08:00
现在进入 `contacts` 目录下编辑 `admin.cfg` 来进行管理配置。
2016-09-27 21:58:58 +08:00
```
cd /etc/shinken/contacts/
vim admin.cfg
```
按照如下修改:
```
contact_name admin # Username 'admin'
password yourpass # Pass 'mypass'
```
保存和退出。
### 第三步 安装 Nagios 插件和 Shinken 软件包
2016-09-27 21:58:58 +08:00
在这一步中,我们将安装 Nagios 插件和一些 Perl 模块。然后从 shinken.io 安装其他的软件包来实现监视。
2016-09-27 22:06:55 +08:00
安装 Nagios 插件和安装 Perl 模块所需要的 `cpanminus`
2016-09-27 21:58:58 +08:00
```
sudo apt-get install nagios-plugins* cpanminus
```
`cpanm` 命令来安装 Perl 模块。
2016-09-27 21:58:58 +08:00
```
cpanm Net::SNMP
cpanm Time::HiRes
cpanm DBI
```
现在我们创建一个 `utils.pm` 文件的链接到 shinken 的目录,并且为 `Log_File_Health` 创建了一个新的日志目录 。
2016-09-27 21:58:58 +08:00
```
chmod u+s /usr/lib/nagios/plugins/check_icmp
ln -s /usr/lib/nagios/plugins/utils.pm /var/lib/shinken/libexec/
mkdir -p /var/log/rhosts/
touch /var/log/rhosts/remote-hosts.log
```
然后,从 shinken.io 安装 shinken 软件包 `ssh``linux-snmp` 来监视 SSH 和 SNMP
2016-09-27 21:58:58 +08:00
```
su - shinken
shinken install ssh
shinken install linux-snmp
```
### 第四步 添加一个 Linux 主机 host-one
我们将添加一个新的将被监控的 Linux 主机IP 地址为 192.168.1.121,主机名为 host-one 的 Ubuntu 16.04。
2016-09-27 21:58:58 +08:00
2016-09-27 22:06:55 +08:00
连接到 host-one 主机:
2016-09-27 21:58:58 +08:00
```
ssh host1@192.168.1.121
```
2016-09-27 22:06:55 +08:00
从 Ubuntu 软件库中安装 snmp 和snmpd 软件包:
2016-09-27 21:58:58 +08:00
```
sudo apt-get install snmp snmpd
```
然后,用 `vim` 编辑 `snmpd.conf` 配置文件:
2016-09-27 21:58:58 +08:00
```
vim /etc/snmp/snmpd.conf
```
注释掉第 15 行并取消注释第 17 行:
2016-09-27 21:58:58 +08:00
```
#agentAddress udp:127.0.0.1:161
agentAddress udp:161,udp6:[::1]:161
```
注释掉第 51 和 53 行,然后加一行新的配置,如下:
2016-09-27 21:58:58 +08:00
```
#rocommunity mypass default -V systemonly
#rocommunity6 mypass default -V systemonly
rocommunity mypass
```
保存并退出。
现在用 `systemctl` 命令来启动 `snmpd` 服务:
2016-09-27 21:58:58 +08:00
```
systemctl start snmpd
```
在 shinken 服务器上通过在 `hosts` 文件夹下创建新的文件来定义一个新的主机:
2016-09-27 21:58:58 +08:00
```
cd /etc/shinken/hosts/
vim host-one.cfg
```
粘贴如下配置信息:
```
define host{
use generic-host,linux-snmp,ssh
contact_groups admins
host_name host-one
address 192.168.1.121
_SNMPCOMMUNITY mypass # SNMP Pass Config on snmpd.conf
}
```
保存并退出。
2016-09-27 21:58:58 +08:00
2016-09-27 22:06:55 +08:00
在 shinken 服务器上编辑 SNMP 配置文件。
2016-09-27 21:58:58 +08:00
```
vim /etc/shinken/resource.d/snmp.cfg
```
`public` 改为 `mypass` -必须和你在客户端 `snmpd` 配置文件中使用的密码相同:
2016-09-27 21:58:58 +08:00
```
$SNMPCOMMUNITYREAD$=mypass
```
保存并退出。
2016-09-27 21:58:58 +08:00
现在将服务端和客户端都重启:
```
reboot
```
2016-09-27 22:06:55 +08:00
现在 Linux 主机已经被成功地添加到 shinken 服务器中了。
2016-09-27 21:58:58 +08:00
### 第五步 访问 Shinken Webui2
2016-09-27 21:58:58 +08:00
在端口 7677 访问 Shinken webui2 (将 URL 中的 IP 替换成你自己的 IP 地址):
2016-09-27 21:58:58 +08:00
```
http://192.168.1.120:7767
```
用管理员用户和密码登录(你在 admin.cfg 文件中设置的)
2016-09-27 21:58:58 +08:00
![](https://www.howtoforge.com/images/server-monitoring-with-shinken-on-ubuntu-16-04/1.png)
Webui2 中的 Shinken 面板:
2016-09-27 21:58:58 +08:00
![](https://www.howtoforge.com/images/server-monitoring-with-shinken-on-ubuntu-16-04/2.png)
我们的两个服务器正在被 Shinken 监控:
2016-09-27 21:58:58 +08:00
![](https://www.howtoforge.com/images/server-monitoring-with-shinken-on-ubuntu-16-04/3.png)
列出所有被 linux-snmp 监控的服务:
2016-09-27 21:58:58 +08:00
![](https://www.howtoforge.com/images/server-monitoring-with-shinken-on-ubuntu-16-04/4.png)
所有主机和服务的状态信息:
2016-09-27 21:58:58 +08:00
![](https://www.howtoforge.com/images/server-monitoring-with-shinken-on-ubuntu-16-04/5.png)
### 第6步 Shinken 的常见问题
2016-09-27 21:58:58 +08:00
#### NTP 服务器相关的问题
2016-09-27 21:58:58 +08:00
2016-09-27 22:06:55 +08:00
当你得到如下的 NTP 错误提示
2016-09-27 21:58:58 +08:00
```
TimeSync - CRITICAL ( NTP CRITICAL: No response from the NTP server)
TimeSync - CRITICAL ( NTP CRITICAL: Offset unknown )
```
为了解决这个问题,在所有 Linux 主机上安装 ntp。
2016-09-27 21:58:58 +08:00
```
sudo apt-get install ntp ntpdate
```
2016-09-27 22:06:55 +08:00
编辑 ntp 配置文件:
2016-09-27 21:58:58 +08:00
```
vim /etc/ntp.conf
```
2016-09-27 22:06:55 +08:00
注释掉所有 pools 并替换为:
2016-09-27 21:58:58 +08:00
```
#pool 0.ubuntu.pool.ntp.org iburst
#pool 1.ubuntu.pool.ntp.org iburst
#pool 2.ubuntu.pool.ntp.org iburst
#pool 3.ubuntu.pool.ntp.org iburst
pool 0.id.pool.ntp.org
pool 1.asia.pool.ntp.org
pool 0.asia.pool.ntp.org
```
然后,在新的一行添加如下限制规则:
```
# Local users may interrogate the ntp server more closely.
restrict 127.0.0.1
restrict 192.168.1.120 #shinken server IP address
restrict ::1
NOTE: 192.168.1.120 is the Shinken server IP address.
```
保存并退出。
2016-09-27 21:58:58 +08:00
2016-09-27 22:06:55 +08:00
启动 ntp 并且检查 Shinken 面板。
2016-09-27 21:58:58 +08:00
```
ntpd
```
#### check_netint.pl Not Found 问题
2016-09-27 21:58:58 +08:00
2016-09-27 22:06:55 +08:00
从 github 仓库下载源代码到 shinken 的库目录下:
2016-09-27 21:58:58 +08:00
```
cd /var/lib/shinken/libexec/
wget https://raw.githubusercontent.com/Sysnove/shinken-plugins/master/check_netint.pl
chmod +x check_netint.pl
chown shinken:shinken check_netint.pl
```
#### 网络占用的问题
2016-09-27 21:58:58 +08:00
这是错误信息:
```
ERROR : Unknown interface eth\d+
```
检查你的网络接口并且编辑 `linux-snmp` 模版。
2016-09-27 21:58:58 +08:00
2016-09-27 22:06:55 +08:00
在我的 Ununtu 服务器,网卡是 “enp0s8”而不是 eth0所以我遇到了这个错误。
2016-09-27 21:58:58 +08:00
`vim` 编辑 `linux-snmp` 模版:
2016-09-27 21:58:58 +08:00
```
vim /etc/shinken/packs/linux-snmp/templates.cfg
```
2016-09-27 22:06:55 +08:00
在第 24 行添加网络接口信息:
2016-09-27 21:58:58 +08:00
```
_NET_IFACES eth\d+|em\d+|enp0s8
```
保存并退出。
2016-09-27 21:58:58 +08:00
--------------------------------------------------------------------------------
via: https://www.howtoforge.com/tutorial/server-monitoring-with-shinken-on-ubuntu-16-04/
作者:[Muhammad Arul][a]
译者:[LinuxBars](https://github.com/LinuxBars)
校对:[wxy](https://github.com/wxy)
2016-09-27 21:58:58 +08:00
本文由 [LCTT](https://github.com/LCTT/TranslateProject) 原创编译,[Linux中国](https://linux.cn/) 荣誉推出
[a]: https://www.howtoforge.com/tutorial/server-monitoring-with-shinken-on-ubuntu-16-04/
Save and exit.