使用nice、cpulimit和cgroups限制cpu占用率 ================================================================================ 注:本文中的图片似乎都需要翻墙后才能看到,发布的时候注意 ![](https://dl.dropboxusercontent.com/u/468982/blog/cpu_usage_blog/juggle.jpg) Linux内核是一名了不起的马戏表演者,它在进程和系统资源间小心地玩着杂耍,并保持系统的能够正常运转。 同时,内核也很公正:它将资源公平地分配给各个进程。 但是,如果你需要给一个重要进程提高优先级时,该怎么做呢? 或者是,如何降低一个进程的优先级? 又或者,如何限制一组进程所使用的资源呢? **答案是需要由用户来为内核指定进程的优先级** 大部分进程启动时的优先级时相同的,因此Linux内核会公平地进行调度。 如果想让一个CPU密集型的进程运行在低优先级,那么你就得事先配置好调度器。 下面介绍3种控制进程运行时间的方法: - 使用nice命令手动减低任务的优先级。 - 使用cpulimit命令控制进程的运行时间上限。 - 使用linux内建的**control groups**功能,它提供了限制进程资源消耗的机制。 我们来看一下这3个工具的工作原理和各自的优缺点。 ### 模拟高cpu占用率 ### 在分析这3种技术前,我们要先安装一个工具来模拟高CPU占用率的场景。我们会用到CentOS作为测试系统,并使用[Mathomatic toolkit][1]中的质数生成器来模拟CPU负载。 很不幸,在CentOS上这个工具没有预编译好的版本,所以必须要从源码进行安装。先从http://mathomatic.orgserve.de/mathomatic-16.0.5.tar.bz2这个链接下载源码包并解压。然后进入**mathomatic-16.0.5/primes**文件夹,运行**make** 和 **sudo make install**进行编译和安装。这样,就把**matho-primes**程序安装到了**/usr/local/bin**目录中。 接下来,通过命令行运行: /usr/local/bin/matho-primes 0 9999999999 > /dev/null & 程序运行后,将输出从0到9999999999之间的质数。因为我们并不需要这些输出结果,直接将输出重定向到/dev/null就好。 现在,使用top命令就可以看到matho-primes进程榨干了你所有的cpu资源。 ![](https://dl.dropboxusercontent.com/u/468982/blog/cpu_usage_blog/image00.jpg) 好了,接下来退出top(按q键)并杀掉matho-primes进程(使用fg命令将进程切换到前台,再按CTRL+C) ### nice命令 ### 下来介绍一下nice命令的使用方法,nice命令可以修改进程的优先级,这样就可以让进程运行得不那么频繁。 **这个功能在运行cpu密集型的后台进程或批处理作业时尤为有用。** nice值的取值范围是[-20,19],-20表示最高优先级,而19表示最低优先级。 Linux进程的默认nice值为0。使用nice命令(不带任何参数时)可以将进程的nice值设置为10。这样调度器就会将此进程视为低优先级的进程,从而减少cpu资源的分配。 下面来看一个例子,我们同时运行两个**matho-primes**进程,一个使用nice命令来启动运行,而另一个正常启动运行: nice matho-primes 0 9999999999 > /dev/null & matho-primes 0 9999999999 > /dev/null & 再运行top命令。 ![](https://dl.dropboxusercontent.com/u/468982/blog/cpu_usage_blog/image05.jpg) 看到没,正常运行的进程(nice值为0)获得了更多的cpu运行时间,相反的,用nice命令运行的进程占用的cpu时间会较少(nice值为10)。 在实际使用中,如果你要运行一个CPU密集型的程序,那么最好用nice命令来启动它,这样就可以保证其他进程获得更高的优先级。 也就是说,即使你的服务器或者台式机在重载的情况下,也可以快速响应。 nice还有一个关联命令叫做renice,它可以在运行时调整进程的nice值。使用renice命令时,要先找出进程的PID。下面是一个例子: renice +10 1234 其中,1234是进程的PID。 测试完**nice** 和 **renice**命令后,记得要将**matho-primes**进程全部杀掉。 ### cpulimit命令 ### 接下来介绍 **cpulimit** 命令的用法。 **cpulimit** 命令的工作原理是为进程预设一个cpu占用率门限,并实时监控进程是否超出此门限,若超出则让该进程暂停运行一段时间。cpulimit使用 SIGSTOP和SIGCONT这两个信号来控制进程。它不会修改进程的nice值,而是通过监控进程的cpu占用率来做出动态调整。 cpulimit的优势是可以控制进程的cpu使用率的上限值。但与nice相比也有缺点,那就是即使cpu是空闲的,进程也不能完全使用整个cpu资源。 在CentOS上,可以用下面的方法来安装: wget -O cpulimit.zip https://github.com/opsengine/cpulimit/archive/master.zip unzip cpulimit.zip cd cpulimit-master make sudo cp src/cpulimit /usr/bin 上面的命令行,会先从从GitHub上将源码下载到本地,然后再解压、编译、并安装到/usr/bin目录下。 cpulimit的使用方式和nice命令类似,但是需要用户使用-l选项显式地定义进程的cpu使用率上限值。举例说明: cpulimit -l 50 matho-primes 0 9999999999 > /dev/null & ![](https://dl.dropboxusercontent.com/u/468982/blog/cpu_usage_blog/image03.jpg) 从上面的例子可以看出matho-primes只使用了50%的cpu资源,剩余的cpu时间都为idle。 You can also limit a currently running process by specifying its PID using the ‘-p’ parameter. For example cpulimit还可以在运行时对进程进行动态限制,使用-p选项来指定进程的PID,下面是一个实例: cpulimit -l 50 -p 1234 其中,1234是进程的PID。 ### cgroups命令集 ### 最后介绍,功能最为强大的控制组(cgroups)的用法。cgroups是Linux内核提供的一种机制,利用它可以指定一组进程的资源分配。 具体来说,使用cgroups,用户能够限定一组进程的cpu占用率、系统内存消耗、网络带宽,以及这几种资源的组合。 对比nice和cpulimit,**cgroups的优势**在于它可以控制一组进程,不像前者仅能控制单进程。同时,nice和cpulimit只能限制cpu使用率,而cgroups可以限制其他进程资源的使用。 对cgroups善加利用就可以控制好整个子系统的资源消耗。就拿CoreOS作为例子,这是一个专为大规模服务器部署而设计的最简化的Linux发行版本,它的upgrade进程就是使用cgroups来管控。这样,系统在下载和安装升级版本时也不会影响到系统的性能。 下面做一下演示,我们将创建两个控制组(cgroups),并对其分配不同的cpu资源。这两个控制组分别命名为“cpulimited”和“lesscpulimited”。 使用cgcreate命令来创建控制组,如下所示: sudo cgcreate -g cpu:/cpulimited sudo cgcreate -g cpu:/lesscpulimited 其中“-g cpu”选项用于设定cpu的使用上限。除此cpu外,cgroups还提供cpuset、memory、blkio等控制器。cpuset控制器与cpu控制器的不同在于,cpu控制器只能限制一个cpu核的使用率,而cpuset可以控制多个cpu核。 cpu控制器中的cpu.shares属性用于控制cpu使用率。它的默认值是1024,我们将lesscpulimited控制组的cpu.shares设为1024(默认值),而cpulimited设为512,配置后内核就会按照2:1的比例为这两个控制组分配资源。 To set the cpu.shares to 512 in the cpulimited group, type: sudo cgset -r cpu.shares=512 cpulimited 使用cgexec命令来启动控制组的运行,为了测试这两个控制组,我们先用cpulimited控制组来启动matho-primes进程,命令行如下: sudo cgexec -g cpu:cpulimited /usr/local/bin/matho-primes 0 9999999999 > /dev/null & 打开top可以看到,matho-primes进程占用了所有的cpu资源。 ![](https://dl.dropboxusercontent.com/u/468982/blog/cpu_usage_blog/image01.jpg) 因为只有一个进程在系统中运行,不管将其放到哪个控制组中启动,它都会尽可能多的使用cpu资源。cpu资源限制只有在两个进程争夺cpu资源时才会生效。 那么,现在我们就启动第二个matho-primes进程,这一次我们在lesscpulimited控制组中来启动它: sudo cgexec -g cpu:lesscpulimited /usr/local/bin/matho-primes 0 9999999999 > /dev/null & 再打开top就可以看到,cpu.shares值大的控制组会得到更多的cpu运行时间。 ![](https://dl.dropboxusercontent.com/u/468982/blog/cpu_usage_blog/image02.jpg) 现在,我们再在cpulimited控制组中增加一个matho-primes进程: sudo cgexec -g cpu:cpulimited /usr/local/bin/matho-primes 0 9999999999 > /dev/null & ![](https://dl.dropboxusercontent.com/u/468982/blog/cpu_usage_blog/image04.jpg) 看到没,两个控制组的cpu的占用率比例仍然为2:1。其中,cpulimited控制组中的两个matho-primes进程获得的cpu时间基本相当,而另一组中的matho-primes进程显然获得了更多的运行时间。 更多的使用方法,可以在Red Hat上查看详细的cgroups使用[说明][2]。(当然CentOS 7也有) ### 使用Scout来监控cpu占用率 ### 监控cpu占用率最为简单的方法是什么?[Scout][3]工具能够监控能够自动监控进程的cpu使用率和内存使用情况。 ![](https://dl.dropboxusercontent.com/u/468982/blog/server_view/processes.png) [Scout][3]的触发器(trigger)功能还可以设定cpu和内存的使用门限,超出门限时会自动产生报警。 从这里可以获取[Scout][4]的试用版。 ### 总结 ### ![](https://dl.dropboxusercontent.com/u/468982/blog/cpu_usage_blog/overview.png) 计算机的系统资源是非常宝贵的。上面介绍的这3个工具能够帮助大家有效地管理系统资源,特别是cpu资源: - **nice**可以一次性调整进程的优先级。 - **cpulimit**在运行cpu密集型任务且要保持系统的响应性时会很有用。 - **cgroups**是资源管理的瑞士军刀,同时在使用上也很灵活。 -------------------------------------------------------------------------------- via: http://blog.scoutapp.com/articles/2014/11/04/restricting-process-cpu-usage-using-nice-cpulimit-and-cgroups 译者:[coloka](https://github.com/coloka) 校对:[校对者ID](https://github.com/校对者ID) 本文由 [LCTT](https://github.com/LCTT/TranslateProject) 原创翻译,[Linux中国](http://linux.cn/) 荣誉推出 [1]:http://www.mathomatic.org/ [2]:https://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux/7/html/Resource_Management_and_Linux_Containers_Guide/chap-Introduction_to_Control_Groups.html [3]:https://scoutapp.com/ [4]:https://scoutapp.com/ [5]: [6]: [7]: [8]: [9]: [10]: [11]: [12]: [13]: [14]: [15]: [16]: [17]: [18]: [19]: [20]: