linux内核内存分配（三、虚拟内存管理）

时间：2017-08-01 12:43:34 阅读：265 评论：0 收藏：0 [点我收藏+]

标签：att tac 额外 kmalloc 注意 bsp 标识 sig nmap

在分析虚拟内存管理前要先看下linux内核内存的具体分配我開始就是困在这个地方。对内核内存的分类不是非常清晰。我摘录当中的一段：

内核内存地址

===========================================================================================================

在linux的内存管理中，用户使用0～3GB的地址空间。而内核仅仅是用了3GB～4GB区间的地址空间。共1GB。非连
续空间的物理映射就位于3GB~4GB之间。例如以下图示

0GB 3GB 4GB
而关于内核空间中这1GB是怎样分配的呢，详细请看下图:

一般会把内核空间中大于896M的空间称作内核空间中的高端内存。内核能够用三种不同的机制将页框映射到高端
内存：永久内核映射、暂时内核映射和非连续内存分配。本文中将要谈论的是非连续内存分配。
从上图能够知道，在物理内存的末尾和非连续内存区之间插入了一个大小为8MB的区间，这是一个安全区，
目的是“捕获”对非连续区的非法訪问。出于相同的理由。在其他非连续区间也插入了大小为4KB的安全区。而每一个
非连续区的大小都是4KB的倍数。例如以下图:

非连续内存的线性地址空间是从VMALLOC_START~VMALLOC_END,共128MB大小。

当内核须要用vmalloc类的函数
进行非连续内存分配时，就会申请一个vm_struct结构来描写叙述相应的vmalloc区，若分配多个vmalloc的内存区，那
么相邻两个vmalloc区之间的间隔大小至少为4KB，即至少是一个页框大小PAGE——SIZE。如上图。

===============================================================================================================

这里强调下：上面的图示表示的不过虚拟地址，而实际的物理地址是分DMA和常规地址及高端地址的；

linux内核内存大概的就是上面的图示了。当中8MB说是为了安全。防止越界訪问（看了非常多书，都这么说），就是这8MB虚拟地址不做不论什么映射（这样不过虚拟地址。没有实际的物理地址浪费）

由上面的图示能够知道，前面896MB（其它架构能够能不是以896MB切割的）就是我们说的内核逻辑地址（记住是内核逻辑地址。假设就说逻辑地址的话应该是指x86架构中虚拟地址中不包含段地址部分，也就是段内偏移部分）；这部分内存地址已经在系统初始化的时候和物理页做好了映射，并且是一一映射，我们一般使用的时候就是用该部分的内存地址（kmalloc函数使用就是该部分）。这段内存是很高效的，由于不须要做其它的映射和改动页表就能够直接使用。本blog是分析下虚拟内存地址的映射，主要是vmalloc函数和ioremap函数；

vmalloc函数

vmalloc函数是驱动模块常常使用的内存分配函数。该函数返回的虚拟地址连续的（事实上这也有疑问。由于上面vmalloc的虚拟地址区有4k切割地址，假设vmalloc分配的虚拟地址非常大。那么中间是否有4kb的切割地址？），可是不保证所映射的物理地址也是连续的。

它主要对上面的vmalloc_start到vmalloc_end这段内存操作，返回的虚拟地址就是这一部分的。

在大多数情况下，不鼓舞使用vmalloc来申请内存，原因： 1、通过vmalloc函数获取的内存使用效率不高（由于要自己做映射，要推断哪些是空暇页等操作）。2、有些架构上给vmalloc使用的内存地址很小。对vmalloc调用可能会由于没有空暇地址而失败；3、不能保证物理地址是连续的，对一些驱动程序来说这是硬伤；综上所述。最好不要用包括vmalloc的代码作为内核的主线代码。

以下大概来说下vmalloc函数的原型：

void *vmalloc(unsigned long size);

该函数的实现有3个步骤：1、在vmalloc区域分配一段连续的虚拟内存地址；2、通过伙伴系统获取物理页；3、通过对页表的操作。把1中获取到的虚拟地址映射到2中分配到物理页上；

注意：

1、上面的图示我们能够看出每一个vmalloc虚拟地址之间都有4kb的切割区域（其作用就是防止越界。形成一个空洞，越界时产生异常），所以vmalloc函数实现时，会在size对齐后再添加4kb大小（一个页的大小）。

2、在分配物理页时，会从高端地址（上面的图示表示的不过虚拟地址而已，物理内存分配能够看 linux内核内存分配（一、基本概念）中物理页和虚拟地址的映射图）分配。gfp为：GFB_KERNEL | _GFP_HIGHMEM;表示该函数可能睡眠，分配的物理地址来自高端物理页。

常规物理页给kmalloc使用；vmalloc函数分配高端物理页时使用alloc_page函数或者alloc_pages_node函数来分配一个整页，多次调用分配函数来完毕全部的物理页的分配，这样就不能保证全部的物理页一定连续了。

3、对虚拟地址映射时不会对额外的4k的切割地址进行映射，第2步中也不会对这4k的虚拟切割地址进行分配映射的物理页。

以下是vmalloc的映射图。图来自《深入linux设备驱动程序内核机制》

技术分享

上图中：从vmalloc区域分配的两个虚拟页地址映射到物理地址的高端页面。当中高端内存是不连续的，虚拟地址最后一个页没有进行映射，那就是额外的4k切割页面。

用vmalloc分配得到的地址是不能在微处理器之外使用的。由于它们仅仅在处理器的内存管理单元上才有意义。

使用vmalloc函数的正确场合是在分配一大块连续的、仅仅在软件中存在的、用于缓冲的内存区域的时候。

ioremap函数

函数原型：void __iomem *ioremap(unsigned long phys_addr, size_t size);此处的__iomem仅仅是标识返回的地址是io类型的地址；该函数用来把vmalloc区域之间的内存映射到设备I/O地址空间，这个函数和vmalloc函数的实现很相似，不同的地方就是vmalloc是通过伙伴系统分配到物理页。而ioremap函数却是利用设备的I/O空间，而不是系统物理页；至于其它操作能够看：訪问I/O内存和I/Oport设备

ioremap函数很多其它用于映射（物理的）PCI缓冲区地址到（虚拟的）内核空间。ioremap函数映射的内存须要用iounmap函数来释放；