校对完毕

校对完毕
This commit is contained in:
jasminepeng 2017-01-23 11:31:51 +08:00 committed by GitHub
parent 118a8efc05
commit 4995c670a9

View File

@ -1,49 +1,52 @@
使用Ganglia来监控linux类型的网格和集群服务器 使用 Ganglia 设置对 linux 网格和集群服务器的实时监控
=========== ===========
自从SA接手服务和主机管理以后监控类的工具就成了他们的好帮手。其中比较有名的有[Nagios][11], [Zabbix][10], [Icinga][9], 和 Centreon.以上这些重量级的监控工具让一个新手SA来设置并使用其中的高级特性是非常困难的。
本文将向你介绍Ganglia它是一个容易扩展配置的监控系统。它可以查看服务器中的各项性能指标也可以实时图形化的展示集群配置。 自从系统管理员接手服务器和主机管理以后,像应用监控这样的工具就成了他们的好帮手。其中比较有名的有 [Nagios][11], [Zabbix][10], [Icinga][9], 和 Centreon。以上这些是重量级的监控工具让一个新手管理员来设置并使用其中的高级特性是有些困难的。
本文将向你介绍 Ganglia它是一个容易扩展配置的监控系统。使用它可以实时查看 Linux 服务器和集群(图形化展示)中的各项性能指标。
[![Install Gangila Monitoring in Linux](http://www.tecmint.com/wp-content/uploads/2016/06/Install-Gangila-Monitoring-in-Linux.png)][8] [![Install Gangila Monitoring in Linux](http://www.tecmint.com/wp-content/uploads/2016/06/Install-Gangila-Monitoring-in-Linux.png)][8]
在Linux上安装Ganglia *在Linux上安装Ganglia*
Ganglia能够让集群和网格服务器更加容易管理。
我们可以远程创建一个包含所有主机的网格配置,其中的成员主机可以使用模板设置。
此外Ganglia对移动设备进行过页面优化排版非常人性化。当然你还可以导出`csv`和 `.json`格式的数据 **Ganglia** 能够让**集群**和**网格**服务器更加容易管理。
我们的测试环境包括一个安装Ganglia的主节点服务器CentOS7(IP 地址 192.168.0.29)和一个作为被监控端的Ubuntu 14.04主机 (192.168.0.32)。我们将通过Ganglia Web的页面来监控这台Ubuntu主机 我们可以远程创建一个包含所有主机的网格,然后将那些机器按照标准分组成小的集合
下面的例子可以给大家提供参考CentOS7作为主节点Ubuntu作为被监控对象。 此外, Ganglia 的 web 页面对移动设备进行过优化,你还可以导出 `csv` 和 `.json` 格式的数据。
我们的测试环境包括一个安装 Ganglia 的主节点服务器 CentOS 7 (IP 地址 192.168.0.29),和一个作为被监控端的 Ubuntu 14.04 主机 (192.168.0.32)。我们将通过 Ganglia 的 Web 页面来监控这台 Ubuntu 主机。
下面的例子可以给大家提供参考CentOS7 作为主节点Ubuntu 作为被监控对象。
### 安装和配置 Ganglia ### 安装和配置 Ganglia
请遵循以下步骤在主节点服务器安装监控工具。 请遵循以下步骤在主节点服务器安装监控工具。
#### 1. 1. 使用yum源 [EPEL repository][7] ,然后安装 Ganglia和相关工具: #### 1. 启用 [EPEL repository][7] ,然后安装 Ganglia 和相关工具:
命令如下
``` ```
# yum update && yum install epel-release # yum update && yum install epel-release
# yum install ganglia rrdtool ganglia-gmetad ganglia-gmond ganglia-web # yum install ganglia rrdtool ganglia-gmetad ganglia-gmond ganglia-web
``` ```
Ganglia将附加安装一些应用,它们的功能如下: Ganglia 将安装一些应用,它们的功能如下:
1. `rrdtool`, 轮询数据库,它是一个储存以及用图形化显示变化数据的工具  - `rrdtool`, Round-Robin 数据库,它是一个储存并图形化显示数据变化的工具;
2. `ganglia-gmetad` 一个守护进程用来收集被监控主机的数据。被监控主机与主节点主机都要安装Ganglia-gmond监控守护进程自己  -  `ganglia-gmetad` 一个守护进程,用来收集被监控主机的数据。被监控主机与主节点主机都要安装 Ganglia-gmond监控守护进程本身
3. `ganglia-web` 提供Web前端用于显示监控系统的历史数据  -  `ganglia-web` 提供 Web 前端,用于显示监控系统的历史数据和图形。
 
#### 2. 使用 Apache 提供的基本认证功能,为 Ganglia Web 界面(/usr/share/ganglia配置身份认证
#### 2. 使用Apache为Ganglia配置Web身份认证 如果你想了解更多高级安全机制,请参阅 Apache 文档的 [Authorization and Authentication][6]部分。
如果你想了解更多的高级认证机制,请参阅[Authorization and Authentication][6]选择Apache部分。 为完成这个目标,我们需要创建一个用户名并设定一个密码,以访问被 Apache 保护的资源。在本例中,我们先来创建一个叫 `adminganglia` 的用户名,然后给他分配一个密码,它将被储存在 **/etc/httpd/auth.basic**(随意选择另一个目录 和/或 文件名, 只要 Apache 对此有读取权限就可以。) 
为完成这部分的任务我们需要用Apache来创建一个用户名和对应的密码下面的例子我们先来创建一个叫`adminganglia`的用户名,然后给他分配一个密码,它将被储存在 /etc/httpd/auth.basic如果随便选择根目录或其他Apache没有权限读取的目录这项配置最终将会以失败告终。 
``` ```
# htpasswd -c /etc/httpd/auth.basic adminganglia # htpasswd -c /etc/httpd/auth.basic adminganglia
``` ```
adminganglia添加密码需要经过2次确认 adminganglia 输入两次密码完成密码设置。
#### 3. 修改配置文件 /etc/httpd/conf.d/ganglia.conf  #### 3. 修改配置文件 /etc/httpd/conf.d/ganglia.conf 
@ -61,14 +64,14 @@ Require user adminganglia
#### 4. 编辑 /etc/ganglia/gmetad.conf: #### 4. 编辑 /etc/ganglia/gmetad.conf:
首先, 使用gridname命令来设置集群的名称。 首先, 使用 gridname 命令来设置网格的名称。
``` ```
gridname "Home office" gridname "Home office"
``` ```
然后, 使用data_source命令根据集群的名称来设置主节点主机和被监控节点的轮询时间 然后, 使用 **data_source** 命令,后面跟集群(服务器组)名、轮询时间间隔(秒)、主节点主机和被监控节点的 IP 地址:
``` ```
data_source "Labs" 60 192.168.0.29:8649 # Master node data_source "Labs" 60 192.168.0.29:8649 # Master node
@ -78,7 +81,7 @@ data_source "Labs" 60 192.168.0.32 # Monitored node
#### 5. 编辑 /etc/ganglia/gmond.conf. #### 5. 编辑 /etc/ganglia/gmond.conf.
a)确保集群的配置和下面的一样。 a) 确保集群的配置和下面的一样。
``` ```
cluster { cluster {
@ -90,7 +93,7 @@ url = "unspecified"
``` ```
b) 在udp_send_chanel 注释掉 mcast_join directive: b) 在 **udp_send_chanel** 中,注释掉 **mcast_join**:
``` ```
udp_send_channel { udp_send_channel {
@ -102,7 +105,7 @@ ttl = 1
``` ```
c)在udp_recv_channel 中:注释掉mcast_join 和bind部分 c) **udp_recv_channel** 中:注释掉 mcast_join  bind 部分
``` ```
udp_recv_channel { udp_recv_channel {
@ -112,9 +115,9 @@ port = 8649
} }
``` ```
保存并退出 保存并退出
#### 6.打开8649/udp端口更改SELinux确保php脚本能够连接 #### 6.打开 8649/udp 端口,使用 SELinux 确保 php 脚本(通过 Apache 运行)能够连接到网络
``` ```
# firewall-cmd --add-port=8649/udp # firewall-cmd --add-port=8649/udp
@ -123,7 +126,7 @@ port = 8649
``` ```
#### 7.重启Apachegmetadgmond并确保他们在开机启动里面 #### 7.重启 Apachegmetadgmond 并确保他们启用了“开机启动”
``` ```
# systemctl restart httpd gmetad gmond # systemctl restart httpd gmetad gmond
@ -131,20 +134,20 @@ port = 8649
``` ```
至此,我们现在能够打开并登录Ganglia的Web页面 `http://192.168.0.29/ganglia`  至此,我们现在能够打开 Ganglia 的 Web 页面 `http://192.168.0.29/ganglia` 并用步骤 2 中设置的证书登录。
[![Gangila Web Interface](http://www.tecmint.com/wp-content/uploads/2016/06/Gangila-Web-Interface.png)][5] [![Gangila Web Interface](http://www.tecmint.com/wp-content/uploads/2016/06/Gangila-Web-Interface.png)][5]
Gangila Web Interface *Gangila Web 页面*
#### 8. 在Ubuntu上安装Ganglia-monitor #### 8. 在 **Ubuntu** 主机,只需安装 Ganglia-monitor,等同于 CentOS 上的 ganglia-gmond
``` ```
$ sudo aptitude update && aptitude install ganglia-monitor $ sudo aptitude update && aptitude install ganglia-monitor
``` ```
#### 9. 编辑被监控主机的配置文件/etc/ganglia/gmond.conf在主节点主机上也是相同的文件注释掉网格里面不在线的主机。需要编辑udp_send_channel和udp_recv_channelshould这两项 #### 9. 编辑被监控主机的 /etc/ganglia/gmond.conf 文件。主节点主机上应是相同的文件,除了 在 cluster, udp_send_channel, 和 udp_recv_channel 注释掉的行应启用:
``` ```
cluster { cluster {
@ -167,39 +170,42 @@ bind = 239.2.11.71 ## comment out
``` ```
Then, restart the service: 之后重启服务。
之后重启服务
``` ```
$ sudo service ganglia-monitor restart $ sudo service ganglia-monitor restart
``` ```
#### 10. 刷新页面你将看到各种状态以及图形化的展示集群或网格的配置情况(用下拉菜单选择我们想查看的集群或网格): #### 10. 刷新页面,你将在 Home office grid / Labs cluster 中看到两台主机的各种统计及图形化的展示(用下拉菜单选择集群,本例中为 Labs
[![Ganglia Home Office Grid Report](http://www.tecmint.com/wp-content/uploads/2016/06/Ganglia-Home-Office-Grid-Report.png)][4] [![Ganglia Home Office Grid Report](http://www.tecmint.com/wp-content/uploads/2016/06/Ganglia-Home-Office-Grid-Report.png)][4]
Ganglia中网格报告 *Ganglia Home office 网格报告*
使用菜单按钮你可以选择组里面的节点主机,这将非常容易的获取到你感兴趣的信息。可以使用对比选项来查看集群中所有主机的信息 使用菜单按钮,你可以获取到每台服务器和集群的信息。还可以使用 <ruby>对比主机</ruby>Compare Hosts<rt></rt>选项来比较集群中所有服务器的状态
当然你也可以使用正则表达式来快速对比一组主机 可以使用正则表达式选择一组服务器,立刻就可以看到它们性能的对比:
[![Ganglia Host Server Information](http://www.tecmint.com/wp-content/uploads/2016/06/Ganglia-Server-Information.png)][3] [![Ganglia Host Server Information](http://www.tecmint.com/wp-content/uploads/2016/06/Ganglia-Server-Information.png)][3]
Ganglia Host Server Information *Ganglia 服务器信息*
One of the features I personally find most appealing is the mobile-friendly summary, which you can access using the Mobile tab. Choose the cluster youre interested in and then the individual host: 我最喜欢的一个特点是对移动端有友好的总结界面,可以通过 Mobile 选项来访问。选择你感兴趣的集群,然后选中一个主机。
能够使用移动设备管理,对于移动端有友好界面,这是一个非常吸引人的特点。在集群中选中一个主机,点击它。
[![Ganglia Mobile Friendly Summary View](http://www.tecmint.com/wp-content/uploads/2016/06/Ganglia-Mobile-View.png)][2] [![Ganglia Mobile Friendly Summary View](http://www.tecmint.com/wp-content/uploads/2016/06/Ganglia-Mobile-View.png)][2]
Ganglia 移动端截图 *Ganglia 移动端总结截图*
### 总结 ### 总结
本篇文章向大家介绍了Ganglia他是一个功能强大扩展性很好的监控工具主要用来监控集群和网格。它可以随意安装便捷的组合各种功能你甚至可以尝试一下官方提供的demo网站[official website][1])。 本篇文章向大家介绍了 Ganglia它是一个功能强大扩展性很好的监控工具主要用来监控集群和网格。它可以随意安装便捷的组合各种功能你甚至可以尝试一下官方网站 [official website][1] 提供的 Demo
此时你可能会发现许多知名的it企业或许并不使用Ganglia来监控作为监控工具。他们有自己更好的工具去实现除了那些工具以外我们这篇文章里面提到的Ganglia可能是最方便的图形化在图示主机上显示对应的名字工具。
但是请不要拘泥于本篇文章,尝试一下自己去做,不必犹豫不敢尝试。如果你有任何问题也欢迎给我留言。 此时,你可能会发现许多知名的 IT 或非 IT 的企业在使用 Ganglia。除了我们在文章中提及的之外还有很多理由这样做其中易用性统计的图形化在名字旁附上脸部照片更清晰不是吗可能是最重要的原因。
但是请不要拘泥于本篇文章,尝试一下自己去做。如果你有任何问题,欢迎给我留言。
-------------------------------------------------------------------------------- --------------------------------------------------------------------------------
via: http://www.tecmint.com/install-configure-ganglia-monitoring-centos-linux/ via: http://www.tecmint.com/install-configure-ganglia-monitoring-centos-linux/