TranslateProject/translated/tech/20170531 Understand Linux Load Averages and Monitor Performance of Linux.md

208 lines
11 KiB
Markdown
Raw Normal View History

理解Linux平均负载和性能监控
============================================================
在本文中,我们将解释Linux系统中最关键的管理任务之一——关于系统/CPU的负载和平均负载的性能监控。
首先来看类UNIX系统中两个重要的表述:
* 系统负载/CPU负载  衡量Linux系统的CPU过载或利用率低;处于运算状态或等待状态的CPU核心数。
* 平均负载 – 通过固定周期如1515分钟计算出的平均系统负载。
Linux中平均负载一般指在内核运行队列中被标记为运行或不可打断状态的平均进程数。
注意:
* 多数Linux或类Unix系统会为用户展示平均负载的值。
* 完全空闲的Linux系统平均负载为0不包括空闲进程。
* 绝大多数类Unix系统只统计运行和等待状态的进程。但是在Linux中平均负载包括不可打断的睡眠状态进程等待其它系统资源如磁盘I/O的进程等。
### 如何监测Linux系统平均负载
有诸多方式监测系统平均负载如uptime展示系统运行时间用户数量及平均负载:
```
$ uptime
07:13:53 up 8 days, 19 min, 1 user, load average: 1.98, 2.15, 2.21
```
平均负载的数字从左到右的含义依次为:
* 最近1分钟的平均负载为 1.98
* 最近5分钟的平均负载为 2.15
* 最近15分钟的平均负载为 2.21
高平均负载意味着系统是过载的许多进程在等待CPU时间。
下一节将介绍平均负载和CPU核数的关系。此外常用的工具[top][5] 和 [glances][6] 可以实时显示Linux系统的运行状态
#### Top命令
```
$ top
```
显示运行中的Linux进程
```
top - 12:51:42 up 2:11, 1 user, load average: 1.22, 1.12, 1.26
Tasks: 243 total, 1 running, 242 sleeping, 0 stopped, 0 zombie
%Cpu(s): 17.4 us, 2.9 sy, 0.3 ni, 74.8 id, 4.6 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 8069036 total, 388060 free, 4381184 used, 3299792 buff/cache
KiB Swap: 3906556 total, 3901876 free, 4680 used. 2807464 avail Mem
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
6265 tecmint 20 0 1244348 170680 83616 S 13.3 2.1 6:47.72 Headset
2301 tecmint 9 -11 640332 13344 9932 S 6.7 0.2 2:18.96 pulseaudio
2459 tecmint 20 0 1707692 315628 62992 S 6.7 3.9 6:55.45 cinnamon
2957 tecmint 20 0 2644644 1.035g 137968 S 6.7 13.5 50:11.13 firefox
3208 tecmint 20 0 507060 52136 33152 S 6.7 0.6 0:04.34 gnome-terminal-
3272 tecmint 20 0 1521380 391324 178348 S 6.7 4.8 6:21.01 chrome
6220 tecmint 20 0 1595392 106964 76836 S 6.7 1.3 3:31.94 Headset
1 root 20 0 120056 6204 3964 S 0.0 0.1 0:01.83 systemd
2 root 20 0 0 0 0 S 0.0 0.0 0:00.00 kthreadd
3 root 20 0 0 0 0 S 0.0 0.0 0:00.10 ksoftirqd/0
5 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 kworker/0:0H
....
```
#### Glances工具
```
$ glances
```
Glances Linux系统监测工具
```
TecMint (LinuxMint 18 64bit / Linux 4.4.0-21-generic) Uptime: 2:16:06
CPU 16.4% nice: 0.1% LOAD 4-core MEM 60.5% active: 4.90G SWAP 0.1%
user: 10.2% irq: 0.0% 1 min: 1.20 total: 7.70G inactive: 2.07G total: 3.73G
system: 3.4% iowait: 2.7% 5 min: 1.16 used: 4.66G buffers: 242M used: 4.57M
idle: 83.6% steal: 0.0% 15 min: 1.24 free: 3.04G cached: 2.58G free: 3.72G
NETWORK Rx/s Tx/s TASKS 253 (883 thr), 1 run, 252 slp, 0 oth sorted automatically by cpu_percent, flat view
enp1s0 525Kb 31Kb
lo 2Kb 2Kb CPU% MEM% VIRT RES PID USER NI S TIME+ IOR/s IOW/s Command
wlp2s0 0b 0b 14.6 13.3 2.53G 1.03G 2957 tecmint 0 S 51:49.10 0 40K /usr/lib/firefox/firefox
7.4 2.2 1.16G 176M 6265 tecmint 0 S 7:08.18 0 0 /usr/lib/Headset/Headset --type=renderer --no-sandbox --primordial-pipe-token=879B36514C6BEDB183D3E4142774D1DF --lan
DISK I/O R/s W/s 4.9 3.9 1.63G 310M 2459 tecmint 0 R 7:12.18 0 0 cinnamon --replace
ram0 0 0 4.2 0.2 625M 13.0M 2301 tecmint -11 S 2:29.72 0 0 /usr/bin/pulseaudio --start --log-target=syslog
ram1 0 0 4.2 1.3 1.52G 105M 6220 tecmint 0 S 3:42.64 0 0 /usr/lib/Headset/Headset
ram10 0 0 2.9 0.8 409M 66.7M 6240 tecmint 0 S 2:40.44 0 0 /usr/lib/Headset/Headset --type=gpu-process --no-sandbox --supports-dual-gpus=false --gpu-driver-bug-workarounds=7,2
ram11 0 0 2.9 1.8 531M 142M 1690 root 0 S 6:03.79 0 0 /usr/lib/xorg/Xorg :0 -audit 0 -auth /var/lib/mdm/:0.Xauth -nolisten tcp vt8
ram12 0 0 2.6 0.3 79.3M 23.8M 9651 tecmint 0 R 0:00.71 0 0 /usr/bin/python3 /usr/bin/glances
ram13 0 0 1.6 4.8 1.45G 382M 3272 tecmint 0 S 6:25.30 0 4K /opt/google/chrome/chrome
...
```
这些工具中的平均负载是从/proc/loadavg文件中读取的可以直接使用[cat 命令][7]查看:
```
$ cat /proc/loadavg
2.48 1.69 1.42 5/889 10570
```
想要图形样式监测平均负载,请戳:[ttyload 终端中颜色编码图形显示Linux平均负载][8]
在PC中可以使用用户图形接口工具查看系统平均负载。
### 理解系统平均负载和CPU核心数的关系
考虑了CPU核心数的影响才能解释系统负载。
#### 多处理器 Vs 多核处理器
* 多处理器 – 一个计算机系统中集成两个或多个物理CPU
* 多核处理器 – 单个物理CPU有两个或多个单独的核并行工作也叫处理单元。双核意味着有两个处理单元4核有4个处理单元以此类推。
此外Intel引入了超线程技术用来提高并行计算能力。
通过超线程技术在操作系统中单物理CPU表现的和双逻辑CPU一样。实际在硬件上只有一个CPU
单CPU核同一时间只能执行一个任务于是产生了多CPU/处理器多核CPU以及多线程技术。
多CPU时多个程序可以同时执行。如今的Intel CPU使用了多核心和超线程技术。
可以使用 [nproc or lscpu 命令][9]查看系统中的处理器单元数量。
```
$ nproc
4
或者
lscpu
```
也可以使用 [grep 命令][10] 
```
$ grep 'model name' /proc/cpuinfo | wc -l
4
```
为了进一步理解系统负载,需要做一些假设。假设系统负载如下:
```
23:16:49 up 10:49, 5 user, load average: 1.00, 0.40, 3.35
```
######单核系统中意味着:
* CPU被充分利用(100%)最近的1分钟平均有1个进程在运行。
* CPU有60%处于空闲状态在最近的5分钟平均没有进程等待CPU时间。
* CPU平均过载了235%最近的15分钟平均有2.35个进程在等待CPU时间。
###### 双核系统中意味着:
* 有一个CPU处于完全空闲状态另一个CPU被使用最近的1分钟平均没有进程等待CPU时间。
* CPU平均160%处于空闲状态最近的5分钟平均没有进程等待CPU时间。
* CPU平均过载了135%最近的15分钟平均有1.35个进程等到CPU时间。
也许你还会喜欢:
1. [20 Command Line Tools to Monitor Linux Performance Part 1][1]
2. [13 Linux Performance Monitoring Tools Part 2][2]
3. [Perf- A Performance Monitoring and Analysis Tool for Linux][3]
4. [Nmon: Analyze and Monitor Linux System Performance][4]
总而言之如果你是系统管理员你应该关注高平均负载。平均负载高于CPU核心数意味着需要增加CPU反之则意味着CPU未被充分利用。
--------------------------------------------------------------------------------
作者简介:
Aaron Kili是Linux和自由软件的热心者热衷于分享知识现在是TecMint网站的内容创作者不久之后将成为Linux系统管理员web开发者。
-----
via: https://www.tecmint.com/understand-linux-load-averages-and-monitor-performance/
作者:[Aaron Kili ][a]
译者:[kylecao](https://github.com/kylecao)
校对:[校对者ID](https://github.com/校对者ID)
本文由 [LCTT](https://github.com/LCTT/TranslateProject) 原创编译,[Linux中国](https://linux.cn/) 荣誉推出
[a]:https://www.tecmint.com/author/aaronkili/
[1]:https://www.tecmint.com/command-line-tools-to-monitor-linux-performance/
[2]:https://www.tecmint.com/linux-performance-monitoring-tools/
[3]:https://www.tecmint.com/perf-performance-monitoring-and-analysis-tool-for-linux/
[4]:https://www.tecmint.com/nmon-analyze-and-monitor-linux-system-performance/
[5]:https://www.tecmint.com/12-top-command-examples-in-linux/
[6]:https://www.tecmint.com/glances-an-advanced-real-time-system-monitoring-tool-for-linux/
[7]:https://www.tecmint.com/13-basic-cat-command-examples-in-linux/
[8]:https://www.tecmint.com/ttyload-shows-color-coded-graph-of-linux-load-average/
[9]:https://www.tecmint.com/check-linux-cpu-information/
[10]:https://www.tecmint.com/12-practical-examples-of-linux-grep-command/
[11]:https://www.tecmint.com/author/aaronkili/
[12]:https://www.tecmint.com/10-useful-free-linux-ebooks-for-newbies-and-administrators/
[13]:https://www.tecmint.com/free-linux-shell-scripting-books/