mirror of
https://github.com/LCTT/TranslateProject.git
synced 2025-01-28 23:20:10 +08:00
Merge pull request #8146 from wxy/20171102-What-is-huge-pages-in-Linux
PRF&PUB:20171102 What is huge pages in Linux
This commit is contained in:
commit
1e31146003
140
published/20171102 What is huge pages in Linux.md
Normal file
140
published/20171102 What is huge pages in Linux.md
Normal file
@ -0,0 +1,140 @@
|
|||||||
|
Linux 中的“大内存页”(hugepage)是个什么?
|
||||||
|
======
|
||||||
|
|
||||||
|
> 学习 Linux 中的<ruby>大内存页<rt>hugepage</rt></ruby>。理解什么是“大内存页”,如何进行配置,如何查看当前状态以及如何禁用它。
|
||||||
|
|
||||||
|
![Huge Pages in Linux][1]
|
||||||
|
|
||||||
|
本文中我们会详细介绍<ruby>大内存页<rt>huge page</rt></ruby>,让你能够回答:Linux 中的“大内存页”是什么?在 RHEL6、RHEL7、Ubuntu 等 Linux 中,如何启用/禁用“大内存页”?如何查看“大内存页”的当前值?
|
||||||
|
|
||||||
|
首先让我们从“大内存页”的基础知识开始讲起。
|
||||||
|
|
||||||
|
### Linux 中的“大内存页”是个什么玩意?
|
||||||
|
|
||||||
|
“大内存页”有助于 Linux 系统进行虚拟内存管理。顾名思义,除了标准的 4KB 大小的页面外,它们还能帮助管理内存中的巨大的页面。使用“大内存页”,你最大可以定义 1GB 的页面大小。
|
||||||
|
|
||||||
|
在系统启动期间,你能用“大内存页”为应用程序预留一部分内存。这部分内存,即被“大内存页”占用的这些存储器永远不会被交换出内存。它会一直保留其中,除非你修改了配置。这会极大地提高像 Oracle 数据库这样的需要海量内存的应用程序的性能。
|
||||||
|
|
||||||
|
### 为什么使用“大内存页”?
|
||||||
|
|
||||||
|
在虚拟内存管理中,内核维护一个将虚拟内存地址映射到物理地址的表,对于每个页面操作,内核都需要加载相关的映射。如果你的内存页很小,那么你需要加载的页就会很多,导致内核会加载更多的映射表。而这会降低性能。
|
||||||
|
|
||||||
|
使用“大内存页”,意味着所需要的页变少了。从而大大减少由内核加载的映射表的数量。这提高了内核级别的性能最终有利于应用程序的性能。
|
||||||
|
|
||||||
|
简而言之,通过启用“大内存页”,系统具只需要处理较少的页面映射表,从而减少访问/维护它们的开销!
|
||||||
|
|
||||||
|
### 如何配置“大内存页”?
|
||||||
|
|
||||||
|
运行下面命令来查看当前“大内存页”的详细内容。
|
||||||
|
|
||||||
|
```
|
||||||
|
root@kerneltalks # grep Huge /proc/meminfo
|
||||||
|
AnonHugePages: 0 kB
|
||||||
|
HugePages_Total: 0
|
||||||
|
HugePages_Free: 0
|
||||||
|
HugePages_Rsvd: 0
|
||||||
|
HugePages_Surp: 0
|
||||||
|
Hugepagesize: 2048 kB
|
||||||
|
```
|
||||||
|
|
||||||
|
从上面输出可以看到,每个页的大小为 2MB(`Hugepagesize`),并且系统中目前有 `0` 个“大内存页”(`HugePages_Total`)。这里“大内存页”的大小可以从 `2MB` 增加到 `1GB`。
|
||||||
|
|
||||||
|
运行下面的脚本可以知道系统当前需要多少个巨大页。该脚本取之于 Oracle。
|
||||||
|
|
||||||
|
```
|
||||||
|
#!/bin/bash
|
||||||
|
#
|
||||||
|
# hugepages_settings.sh
|
||||||
|
#
|
||||||
|
# Linux bash script to compute values for the
|
||||||
|
# recommended HugePages/HugeTLB configuration
|
||||||
|
#
|
||||||
|
# Note: This script does calculation for all shared memory
|
||||||
|
# segments available when the script is run, no matter it
|
||||||
|
# is an Oracle RDBMS shared memory segment or not.
|
||||||
|
# Check for the kernel version
|
||||||
|
KERN=`uname -r | awk -F. '{ printf("%d.%d\n",$1,$2); }'`
|
||||||
|
# Find out the HugePage size
|
||||||
|
HPG_SZ=`grep Hugepagesize /proc/meminfo | awk {'print $2'}`
|
||||||
|
# Start from 1 pages to be on the safe side and guarantee 1 free HugePage
|
||||||
|
NUM_PG=1
|
||||||
|
# Cumulative number of pages required to handle the running shared memory segments
|
||||||
|
for SEG_BYTES in `ipcs -m | awk {'print $5'} | grep "[0-9][0-9]*"`
|
||||||
|
do
|
||||||
|
MIN_PG=`echo "$SEG_BYTES/($HPG_SZ*1024)" | bc -q`
|
||||||
|
if [ $MIN_PG -gt 0 ]; then
|
||||||
|
NUM_PG=`echo "$NUM_PG+$MIN_PG+1" | bc -q`
|
||||||
|
fi
|
||||||
|
done
|
||||||
|
# Finish with results
|
||||||
|
case $KERN in
|
||||||
|
'2.4') HUGETLB_POOL=`echo "$NUM_PG*$HPG_SZ/1024" | bc -q`;
|
||||||
|
echo "Recommended setting: vm.hugetlb_pool = $HUGETLB_POOL" ;;
|
||||||
|
'2.6' | '3.8' | '3.10' | '4.1' ) echo "Recommended setting: vm.nr_hugepages = $NUM_PG" ;;
|
||||||
|
*) echo "Unrecognized kernel version $KERN. Exiting." ;;
|
||||||
|
esac
|
||||||
|
# End
|
||||||
|
```
|
||||||
|
|
||||||
|
将它以 `hugepages_settings.sh` 为名保存到 `/tmp` 中,然后运行之:
|
||||||
|
|
||||||
|
```
|
||||||
|
root@kerneltalks # sh /tmp/hugepages_settings.sh
|
||||||
|
Recommended setting: vm.nr_hugepages = 124
|
||||||
|
```
|
||||||
|
|
||||||
|
你的输出类似如上结果,只是数字会有一些出入。
|
||||||
|
|
||||||
|
这意味着,你系统需要 124 个每个 2MB 的“大内存页”!若你设置页面大小为 4MB,则结果就变成了 62。你明白了吧?
|
||||||
|
|
||||||
|
### 配置内核中的“大内存页”
|
||||||
|
|
||||||
|
本文最后一部分内容是配置上面提到的 [内核参数 ][2] ,然后重新加载。将下面内容添加到 `/etc/sysctl.conf` 中,然后输入 `sysctl -p` 命令重新加载配置。
|
||||||
|
|
||||||
|
```
|
||||||
|
vm.nr_hugepages=126
|
||||||
|
```
|
||||||
|
|
||||||
|
注意我们这里多加了两个额外的页,因为我们希望在实际需要的页面数量之外多一些额外的空闲页。
|
||||||
|
|
||||||
|
现在,内核已经配置好了,但是要让应用能够使用这些“大内存页”还需要提高内存的使用阀值。新的内存阀值应该为 126 个页 x 每个页 2 MB = 252 MB,也就是 258048 KB。
|
||||||
|
|
||||||
|
你需要编辑 `/etc/security/limits.conf` 中的如下配置:
|
||||||
|
|
||||||
|
```
|
||||||
|
soft memlock 258048
|
||||||
|
hard memlock 258048
|
||||||
|
```
|
||||||
|
|
||||||
|
某些情况下,这些设置是在指定应用的文件中配置的,比如 Oracle DB 就是在 `/etc/security/limits.d/99-grid-oracle-limits.conf` 中配置的。
|
||||||
|
|
||||||
|
这就完成了!你可能还需要重启应用来让应用来使用这些新的巨大页。
|
||||||
|
|
||||||
|
### 如何禁用“大内存页”?
|
||||||
|
|
||||||
|
“大内存页”默认是开启的。使用下面命令来查看“大内存页”的当前状态。
|
||||||
|
|
||||||
|
```
|
||||||
|
root@kerneltalks# cat /sys/kernel/mm/transparent_hugepage/enabled
|
||||||
|
[always] madvise never
|
||||||
|
```
|
||||||
|
|
||||||
|
输出中的 `[always]` 标志说明系统启用了“大内存页”。
|
||||||
|
|
||||||
|
若使用的是基于 RedHat 的系统,则应该要查看的文件路径为 `/sys/kernel/mm/redhat_transparent_hugepage/enabled`。
|
||||||
|
|
||||||
|
若想禁用“大内存页”,则在 `/etc/grub.conf` 中的 `kernel` 行后面加上 `transparent_hugepage=never`,然后重启系统。
|
||||||
|
|
||||||
|
--------------------------------------------------------------------------------
|
||||||
|
|
||||||
|
via: https://kerneltalks.com/services/what-is-huge-pages-in-linux/
|
||||||
|
|
||||||
|
作者:[Shrikant Lavhate][a]
|
||||||
|
译者:[lujun9972](https://github.com/lujun9972)
|
||||||
|
校对:[wxy](https://github.com/wxy)
|
||||||
|
|
||||||
|
本文由 [LCTT](https://github.com/LCTT/TranslateProject) 原创编译,[Linux中国](https://linux.cn/) 荣誉推出
|
||||||
|
|
||||||
|
[a]:https://kerneltalks.com
|
||||||
|
[1]:https://a1.kerneltalks.com/wp-content/uploads/2017/11/hugepages-in-linux.png
|
||||||
|
[2]:https://kerneltalks.com/linux/how-to-tune-kernel-parameters-in-linux/
|
@ -1,137 +0,0 @@
|
|||||||
Linux 中的 huge pages 是个什么玩意?
|
|
||||||
======
|
|
||||||
学习 Linux 中的 huge pages( 巨大页)。理解什么是 hugepages,如何进行配置,如何查看当前状态以及如何禁用它。
|
|
||||||
|
|
||||||
![Huge Pages in Linux][1]
|
|
||||||
|
|
||||||
本文,我们会详细介绍 huge page,让你能够回答:Linux 中的 huge page 是什么玩意?在 RHEL6,RHEL7,Ubuntu 等 Linux 中,如何启用/禁用 huge pages?如何查看 huge page 的当前值?
|
|
||||||
|
|
||||||
首先让我们从 Huge page 的基础知识开始讲起。
|
|
||||||
|
|
||||||
### Linux 中的 Huge page 是个什么玩意?
|
|
||||||
|
|
||||||
Huge pages 有助于 Linux 系统进行虚拟内存管理。顾名思义,除了标准的 4KB 大小的页面外,他们还能帮助管理内存中的巨大页面。使用 huge pages,你最大可以定义 1GB 的页面大小。
|
|
||||||
|
|
||||||
在系统启动期间,huge pages 会为应用程序预留一部分内存。这部分内存,即被 huge pages 占用的这些存储器永远不会被交换出内存。它会一直保留其中除非你修改了配置。这会极大地提高像 Orcle 数据库这样的需要海量内存的应用程序的性能。
|
|
||||||
|
|
||||||
### 为什么使用巨大的页?
|
|
||||||
|
|
||||||
在虚拟内存管理中,内核维护一个将虚拟内存地址映射到物理地址的表,对于每个页面操作,内核都需要加载相关的映射标。如果你的内存页很小,那么你需要加载的页就会很多,导致内核加载更多的映射表。而这会降低性能。
|
|
||||||
|
|
||||||
使用巨大的页,意味着所需要的页变少了。从而大大减少由内核加载的映射表的数量。这提高了内核级别的性能最终有利于应用程序的性能。
|
|
||||||
|
|
||||||
简而言之,通过启用 huge pages,系统具只需要处理较少的页面映射表,从而减少访问/维护它们的开销!
|
|
||||||
|
|
||||||
### 如何配置 huge pages?
|
|
||||||
|
|
||||||
运行下面命令来查看当前 huge pages 的详细内容。
|
|
||||||
|
|
||||||
```
|
|
||||||
root@kerneltalks # grep Huge /proc/meminfo
|
|
||||||
AnonHugePages: 0 kB
|
|
||||||
HugePages_Total: 0
|
|
||||||
HugePages_Free: 0
|
|
||||||
HugePages_Rsvd: 0
|
|
||||||
HugePages_Surp: 0
|
|
||||||
Hugepagesize: 2048 kB
|
|
||||||
```
|
|
||||||
|
|
||||||
从上面输出可以看到,每个页的大小为 2MB(`Hugepagesize`) 并且系统中目前有 0 个页 (`HugePages_Total`)。这里巨大页的大小可以从 2MB 增加到 1GB。
|
|
||||||
|
|
||||||
运行下面的脚本可以获取系统当前需要多少个巨大页。该脚本取之于 Oracle。
|
|
||||||
|
|
||||||
```
|
|
||||||
#!/bin/bash
|
|
||||||
#
|
|
||||||
# hugepages_settings.sh
|
|
||||||
#
|
|
||||||
# Linux bash script to compute values for the
|
|
||||||
# recommended HugePages/HugeTLB configuration
|
|
||||||
#
|
|
||||||
# Note: This script does calculation for all shared memory
|
|
||||||
# segments available when the script is run, no matter it
|
|
||||||
# is an Oracle RDBMS shared memory segment or not.
|
|
||||||
# Check for the kernel version
|
|
||||||
KERN=`uname -r | awk -F. '{ printf("%d.%d\n",$1,$2); }'`
|
|
||||||
# Find out the HugePage size
|
|
||||||
HPG_SZ=`grep Hugepagesize /proc/meminfo | awk {'print $2'}`
|
|
||||||
# Start from 1 pages to be on the safe side and guarantee 1 free HugePage
|
|
||||||
NUM_PG=1
|
|
||||||
# Cumulative number of pages required to handle the running shared memory segments
|
|
||||||
for SEG_BYTES in `ipcs -m | awk {'print $5'} | grep "[0-9][0-9]*"`
|
|
||||||
do
|
|
||||||
MIN_PG=`echo "$SEG_BYTES/($HPG_SZ*1024)" | bc -q`
|
|
||||||
if [ $MIN_PG -gt 0 ]; then
|
|
||||||
NUM_PG=`echo "$NUM_PG+$MIN_PG+1" | bc -q`
|
|
||||||
fi
|
|
||||||
done
|
|
||||||
# Finish with results
|
|
||||||
case $KERN in
|
|
||||||
'2.4') HUGETLB_POOL=`echo "$NUM_PG*$HPG_SZ/1024" | bc -q`;
|
|
||||||
echo "Recommended setting: vm.hugetlb_pool = $HUGETLB_POOL" ;;
|
|
||||||
'2.6' | '3.8' | '3.10' | '4.1' ) echo "Recommended setting: vm.nr_hugepages = $NUM_PG" ;;
|
|
||||||
*) echo "Unrecognized kernel version $KERN. Exiting." ;;
|
|
||||||
esac
|
|
||||||
# End
|
|
||||||
```
|
|
||||||
将它以 `hugepages_settings.sh` 为名保存到 `/tmp` 中,然后运行之:
|
|
||||||
```
|
|
||||||
root@kerneltalks # sh /tmp/hugepages_settings.sh
|
|
||||||
Recommended setting: vm.nr_hugepages = 124
|
|
||||||
```
|
|
||||||
|
|
||||||
输出如上结果,只是数字会有一些出入。
|
|
||||||
|
|
||||||
这意味着,你系统需要 124 个每个 2MB 的巨大页!若你设置页面大小为 4MB,则结果就变成了 62。你明白了吧?
|
|
||||||
|
|
||||||
### 配置内核中的 hugepages
|
|
||||||
|
|
||||||
本文最后一部分内容是配置上面提到的 [内核参数 ][2] 然后重新加载。将下面内容添加到 `/etc/sysctl.conf` 中,然后输入 `sysctl -p` 命令重新加载配置。
|
|
||||||
|
|
||||||
```
|
|
||||||
vm .nr_hugepages=126
|
|
||||||
```
|
|
||||||
|
|
||||||
注意我们这里多加了两个额外的页,因为我们希望在实际需要的页面数量外多一些额外的空闲页。
|
|
||||||
|
|
||||||
现在,内核已经配置好了,但是要让应用能够使用这些巨大页还需要提高内存的使用阀值。新的内存阀值应该为 126 个页 x 每个页 2 MB = 252 MB,也就是 258048 KB。
|
|
||||||
|
|
||||||
你需要编辑 `/etc/security/limits.conf` 中的如下配置
|
|
||||||
|
|
||||||
```
|
|
||||||
soft memlock 258048
|
|
||||||
hard memlock 258048
|
|
||||||
```
|
|
||||||
|
|
||||||
某些情况下,这些设置是在指定应用的文件中配置的,比如 Oracle DB 就是在 `/etc/security/limits.d/99-grid-oracle-limits.conf` 中配置的。
|
|
||||||
|
|
||||||
这就完成了!你可能还需要重启应用来让应用来使用这些新的巨大页。
|
|
||||||
|
|
||||||
### 如何禁用 hugepages?
|
|
||||||
|
|
||||||
HugePages 默认是开启的。使用下面命令来查看 hugepages 的当前状态。
|
|
||||||
|
|
||||||
```
|
|
||||||
root@kerneltalks# cat /sys/kernel/mm/transparent_hugepage/enabled
|
|
||||||
[always] madvise never
|
|
||||||
```
|
|
||||||
|
|
||||||
输出中的 `[always]` 标志说明系统启用了 hugepages。
|
|
||||||
|
|
||||||
若使用的是基于 RedHat 的系统,则应该要查看的文件路径为 `/sys/kernel/mm/redhat_transparent_hugepage/enabled`。
|
|
||||||
|
|
||||||
若想禁用巨大页,则在 `/etc/grub.conf` 中的 `kernel` 行后面加上 `transparent_hugepage=never`,然后重启系统。
|
|
||||||
|
|
||||||
--------------------------------------------------------------------------------
|
|
||||||
|
|
||||||
via: https://kerneltalks.com/services/what-is-huge-pages-in-linux/
|
|
||||||
|
|
||||||
作者:[Shrikant Lavhate][a]
|
|
||||||
译者:[lujun9972](https://github.com/lujun9972)
|
|
||||||
校对:[校对者ID](https://github.com/校对者ID)
|
|
||||||
|
|
||||||
本文由 [LCTT](https://github.com/LCTT/TranslateProject) 原创编译,[Linux中国](https://linux.cn/) 荣誉推出
|
|
||||||
|
|
||||||
[a]:https://kerneltalks.com
|
|
||||||
[1]:https://c1.kerneltalks.com/wp-content/uploads/2017/11/hugepages-in-linux.png
|
|
||||||
[2]:https://kerneltalks.com/linux/how-to-tune-kernel-parameters-in-linux/
|
|
Loading…
Reference in New Issue
Block a user