Linux 内核开发 - 进程空间

浏览数：21 / 时间：2015年06月20日

1.1 虚拟内存

Linux 是一个多任务的系统，如果每个任务都独立的占用内存，则实际的物理内存将很快消耗殆尽，实际上对于前台正在运行的任务来说，所需要要的内存并不多，很多任务基本不需要运行，也就没有必要一直占用内存，虚拟内存技术采用硬盘来充当一部分内存，当内存不足时就将不需要在内存中使用的数据搬移到硬盘中去，当任务需要运行时又将硬盘中的数据搬回物理内存。

虚拟内存技术不仅起到了保护操作系统的作用，而且使得用户程序可以使用到比实际物理内存更大的地址空间，屏蔽了实际物理内存对用户地址空间的影响。

1.2 地址空间的划分

对于一个进程而言，Linux 系统将虚拟地址空间划分为用户空间与内核空间，用户空间占用3G（0x0~0xBFFFFFFF），而内核空间占用1G（0xC0000000 ~ 0xFFFFFFFF）。

Linux 是一个多用户的系统，每个用户就是一个进程，享有独立的地址空间，但是它们是共享内核空间，不同的进程之间进行切换的时候，内核空间的是不变的。

1.3 用户空间

Linux 应用程序时在用户空间运行，只有当产生中断或者当出现系统调用的时候进程才会从用户态切换到内核态。完成中断操作或者系统调用后又回到用户态。

1.4 内核空间

Linux 的核心程序运行在内核空间，这是为了保护核心程序不受劣质应用程序的影响而崩溃，而且能起到保护数据的作用。因为应用程序不具有直接控制硬件的权限，只有内核程序才能拥有系统的最高权限。

1.5 内核内存的分配与释放

在创建进程fork()、动态非配内存malloc()时分配的内存都只是虚拟内存，而不是物理内存，之后在实际访问分配的虚拟地址时，才会由“请页机制”产生“缺页”异常，进入实际分配页框的程序。

“缺页”异常是是虚拟内存赖以生存的基础，他会告诉内核为进程分配物理页，并建立页表，这时虚拟地址才映射到实际的物理地址。

在应用程序中，使用的是malloc来动态分配内存，而在内核中使用的是kmalloc来分配内存，kmalloc的原型是

#include<linux/slab.h>

#include<linux/gfp.h>

void *kmalloc(size_t size , int flags);

参数：

size：需要分配内存的大小

flags：分配标志，控制kmalloc的行为

以下是flages 可能的标志。

最常用的GFP_KERNEL,他表示内存分配（最终总是调用get_free_pages来实现实际的分配，这就是，这就是GFP前缀的由来）是代表运行在内核空间的进程执行的。使用GFP_KERNEL容许kmalloc在分配空闲内存时候如果内存不足容许把当前进程睡眠以等待。因此这时分配函数必须是可重入的。如果在进程上下文之外如：中断处理程序、tasklet以及内核定时器中这种情况下current进程不该睡眠，驱动程序该使用GFP_ATOMIC。

lGFP_ATOMIC

用来从中断处理和进程上下文之外的其他代码中分配内存. 从不睡眠.

GFP_KERNEL

内核内存的正常分配. 可能睡眠.

GFP_USER

用来为用户空间页来分配内存; 它可能睡眠.

GFP_HIGHUSER

如同 GFP_USER, 但是从高端内存分配, 如果有. 高端内存在下一个子节描述.

GFP_NOIO

类似 GFP_KERNEL，但禁止任何 I/O 初始化

GFP_NOFS

类似 GFP_KERNEL，但不允许执行任何文件系统调用

__GFP_DMA

这个标志要求分配在能够 DMA 的内存区. 确切的含义是平台依赖的并且在下面章节来解释.

__GFP_HIGHMEM

这个标志指示分配的内存可以位于高端内存.

__GFP_HIGH

这个标志标识了一个高优先级请求, 它被允许来消耗甚至被内核保留给紧急状况的最后的内存页.

__GFP_REPEAT

当它有困难满足一个分配. __GFP_REPEAT 意思是" 更尽力些尝试" 通过重复尝试 -- 但是分配可能仍然失败

__GFP_NOFAIL

告诉分配器不要失败; 它尽最大努力来满足要求. 使用 __GFP_NOFAIL 是强烈不推荐的

__GFP_NORETRY

告知分配器立即放弃如果得不到请求的内存.

1.6 按页分配与释放

如果内核模块需要分配大块内存，使用面向页的分配技术会更好。

#include<linux/gfp.h>

get_zeroed_page(unsigned int flags)

返回新页面的指针，并将页面清零。

__get_free_page(unsigned int flags);

申请一个页面，返回新页面的指针，但不清零页面。

__get_free_pages(unsigned int flags ,unsigned int order)

分配并返回一个纸箱内存区第一个字节的指针，内存区可能是一个或者多个页长，但是没有清零（物理上连续）。

order 是你在请求的或释放的页数的以 2 为底的对数(即, log2N). 例如, 如果你要一个页 order 为 0, 如果你请求 8 页就是 3. 如果 order 太大(没有那个大小的连续区可用), 页分配失败. get_order 函数, 它使用一个整数参数, 可以用来从一个 size 中提取 order(它必须是 2 的幂)给主机平台. order 允许的最大值是 10 或者 11 (对应于 1024 或者 2048 页), 依赖于体系. 但是, 一个 order-10 的分配在除了一个刚刚启动的有很多内存的系统中成功的机会是小的。