图解|透明大页原理与实现

Linux内核那些事

共 1217字,需浏览 3分钟

 · 2022-12-30

在《图解|Linux大内存页原理》一文中,我们介绍过 标准大页 的原理与其优点,现在我们回顾一下标准大页有哪些优点:

  • 减少 转译后备缓冲区(Translation Lookaside Buffer,TLB) 的失效情况,TLB 是 CPU 为了加速虚拟内存地址转换成物理内存地址而增加的缓冲区。
  • 减少 页表 的内存消耗。
  • 减少 缺页异常(page fault) 发生的次数,缺页异常处理例程需要对虚拟内存地址进行映射,而这个映射过程也是一个耗时的过程。

可以看出,使用 大页 能够加速系统的运行效率。

但是 标准大页 使用起来比较麻烦,需要挂载 Hugetlb 文件系统,并且需要使用 mmap 系统调用来对大页进行映射。为了解决标准大页使用麻烦的问题,红帽子(Red Hat)公司开发出 透明大页(Transparent Huge Pages,THP) 功能。

要使用透明大页功能,只需要使用以下命令开启即可:

echo always > /sys/kernel/mm/transparent_hugepage/enabled

开启了透明大页功能后,内核将会创建一个名为 khugepaged 的内核线程。

khugepaged 内核线程会不断扫描进程的虚拟内存空间(vma,virtual memory area),如果发现存在 2MB 地址连续的虚拟地址空间,那么判断其是否满足转换成大页的条件,如果满足则将这些物理内存合并成一个大页。如下图所示:

相对于使用繁琐的标准大页,透明大页显得更加友好。

透明大页原理

操作系统管理内存时,是以页作为单位的,常用的页大小有 4KB2MB 和 1GB。4KB 的内存页被称为普通内存页,而 2MB 和 1GB 的内存页被称为大页。

通常来说,4KB 的内存页使用频率最多,但有时候为了减少缺页异常发生的次数(提升程序的性能),所以会使用 2MB 或者 1GB 的内存页来代替 4KB 的内存页。

透明大页核心思想

透明大页的核心思想很简单:不断扫描进程的虚拟内存区间(vma),如果发现大小超过 2MB 的内存区间,将会判断其是否满足转换成大页的条件,如果满足则将这些物理内存合并成一个大页。

我们知道每个进程都有一个 mm_struct 结构,用来管理进程的虚拟内存空间和映射物理地址的页表等信息,而虚拟内存的区间是通过 vm_area_struct 结构(vma)来管理的。

透明大页的核心逻辑步骤:

  • 查找满足转换成大页的内存区间

khugepaged 内核线程会扫描进程的虚拟内存空间,如果发现内存区间大于等于 2MB,并且满足转换成大页的条件,那么将会进入下面的步骤。

浏览 193
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报