Linux下sched.h文件分析
#ifndef _SCHED_H
#define
_SCHED_H
#define NR_TASKS 64 //
系统中同时最多任务(进程)数。
#define HZ 100 // 定义系统时钟滴答频率(1
百赫兹,每个滴答10ms)
#define FIRST_TASK task[0] // 任务0
比较特殊,所以特意给它单独定义一个符号。
#define LAST_TASK task[NR_TASKS-1] //
任务数组中的最后一项任务。
#include <linux/head.h> // head
头文件,定义了段描述符的简单结构,和几个选择符常量。
#include <linux/fs.h> //
文件系统头文件。定义文件表结构(file,buffer_head,m_inode 等)。
#include
<linux/mm.h> //
内存管理头文件。含有页面大小定义和一些页面释放函数原型。
#include <signal.h> //
信号头文件。定义信号符号常量,信号结构以及信号操作函数原型。
#if (NR_OPEN >
32)
#error "Currently the close-on-exec-flags are in one word,
max 32 files/proc"
#endif
//
这里定义了进程运行可能处的状态。
#define TASK_RUNNING 0 //
进程正在运行或已准备就绪。
#define TASK_INTERRUPTIBLE 1 //
进程处于可中断等待状态。
#define TASK_UNINTERRUPTIBLE 2 //
进程处于不可中断等待状态,主要用于I/O 操作等待。
#define TASK_ZOMBIE 3 //
进程处于僵死状态,已经停止运行,但父进程还没发信号。
#define TASK_STOPPED 4 //
进程已停止。
#ifndef NULL
#define NULL ((void *) 0)
// 定义NULL 为空指针。
#endif
// 复制进程的页目录页表。Linus
认为这是内核中最复杂的函数之一。( mm/memory.c, 105 )
extern int copy_page_tables
(unsigned long from, unsigned long to, long size);
//
释放页表所指定的内存块及页表本身。( mm/memory.c, 150 )
extern int
free_page_tables (unsigned long from, unsigned long size);
//
调度程序的初始化函数。( kernel/sched.c, 385 )
extern void sched_init
(void);
// 进程调度函数。( kernel/sched.c, 104 )
extern
void schedule (void);
// 异常(陷阱)中断处理初始化函数,设置中断调用门并允许中断请求信号。(
kernel/traps.c, 181 )
extern void trap_init
(void);
// 显示内核出错信息,然后进入死循环。( kernel/panic.c, 16
)。
extern void panic (const char *str);
// 往tty
上写指定长度的字符串。( kernel/chr_drv/tty_io.c, 290 )。
extern int
tty_write (unsigned minor, char *buf, int count);
typedef int
(*fn_ptr) (); // 定义函数指针类型。
// 下面是数学协处理器使用的结构,主要用于保存进程切换时i387
的执行状态信息。
struct
i387_struct
{
long cwd;
// 控制字(Control word)。
long swd; //
状态字(Status word)。
long twd; // 标记字(Tag
word)。
long fip; //
协处理器代码指针。
long fcs; //
协处理器代码段寄存器。
long
foo;
long fos;
long
st_space[20]; /* 8*10 bytes for each FP-reg = 80 bytes
*/
};
//
任务状态段数据结构(参见列表后的信息)。
struct
tss_struct
{
long back_link;
/* 16 high bits zero */
long
esp0;
long ss0; /* 16 high bits zero
*/
long esp1;
long ss1;
/* 16 high bits zero */
long
esp2;
long ss2; /* 16 high bits zero
*/
long cr3;
long
eip;
long eflags;
long
eax, ecx, edx, ebx;
long
esp;
long ebp;
long
esi;
long edi;
long es;
/* 16 high bits zero */
long cs;
/* 16 high bits zero */
long ss; /* 16
high bits zero */
long ds; /* 16 high
bits zero */
long fs; /* 16 high bits
zero */
long gs; /* 16 high bits zero
*/
long ldt; /* 16 high bits zero
*/
long trace_bitmap; /* bits: trace 0,
bitmap 16-31 */
struct i387_struct
i387;
};
//
这里是任务(进程)数据结构,或称为进程描述符。
//
==========================
// long state 任务的运行状态(-1 不可运行,0
可运行(就绪),>0 已停止)。
// long counter
任务运行时间计数(递减)(滴答数),运行时间片。
// long priority 运行优先数。任务开始运行时counter =
priority,越大运行越长。
// long signal
信号。是位图,每个比特位代表一种信号,信号值=位偏移值+1。
// struct sigaction sigaction[32]
信号执行属性结构,对应信号将要执行的操作和标志信息。
// long blocked
进程信号屏蔽码(对应信号位图)。
//
--------------------------
// int exit_code
任务执行停止的退出码,其父进程会取。
// unsigned long start_code
代码段地址。
// unsigned long end_code 代码长度(字节数)。
//
unsigned long end_data 代码长度 + 数据长度(字节数)。
// unsigned long brk
总长度(字节数)。
// unsigned long start_stack 堆栈段地址。
//
long pid 进程标识号(进程号)。
// long father 父进程号。
//
long pgrp 父进程组号。
// long session 会话号。
// long
leader 会话首领。
// unsigned short uid
用户标识号(用户id)。
// unsigned short euid 有效用户id。
//
unsigned short suid 保存的用户id。
// unsigned short gid
组标识号(组id)。
// unsigned short egid 有效组id。
//
unsigned short sgid 保存的组id。
// long alarm
报警定时值(滴答数)。
// long utime 用户态运行时间(滴答数)。
// long
stime 系统态运行时间(滴答数)。
// long cutime
子进程用户态运行时间。
// long cstime 子进程系统态运行时间。
// long
start_time 进程开始运行时刻。
// unsigned short used_math
标志:是否使用了协处理器。
// --------------------------
//
int tty 进程使用tty 的子设备号。-1 表示没有使用。
// unsigned short umask
文件创建属性屏蔽位。
// struct m_inode * pwd 当前工作目录i
节点结构。
// struct m_inode * root 根目录i 节点结构。
//
struct m_inode * executable 执行文件i 节点结构。
// unsigned long
close_on_exec 执行时关闭文件句柄位图标志。(参见include/fcntl.h)
// struct file *
filp[NR_OPEN] 进程使用的文件表结构。
//
--------------------------
// struct desc_struct ldt[3]
本任务的局部表描述符。0-空,1-代码段cs,2-数据和堆栈段ds&ss。
//
--------------------------
// struct tss_struct tss
本进程的任务状态段信息结构。
//
==========================
struct
task_struct
{
/* these are hardcoded - don‘t
touch */
long state; /* -1 unrunnable, 0
runnable, >0 stopped */
long
counter;
long
priority;
long
signal;
struct sigaction
sigaction[32];
long blocked; /* bitmap of
masked signals */
/* various fields
*/
int
exit_code;
unsigned long start_code, end_code,
end_data, brk, start_stack;
long pid, father, pgrp,
session, leader;
unsigned short uid, euid,
suid;
unsigned short gid, egid,
sgid;
long alarm;
long
utime, stime, cutime, cstime, start_time;
unsigned
short used_math;
/* file system info
*/
int tty; /* -1 if no tty, so it must
be signed */
unsigned short
umask;
struct m_inode
*pwd;
struct m_inode
*root;
struct m_inode
*executable;
unsigned long
close_on_exec;
struct file
*filp[NR_OPEN];
/* ldt for this task 0 - zero 1 - cs 2 -
ds&ss */
struct desc_struct
ldt[3];
/* tss for this task
*/
struct tss_struct
tss;
};
/*
* INIT_TASK is used
to set up the first task table, touch at
* your own risk!.
Base=0, limit=0x9ffff
(=640kB)
*/
/*
* INIT_TASK
用于设置第1 个任务表,若想修改,责任自负?!
* 基址Base = 0,段长limit =
0x9ffff(=640kB)。
*/
// 对应上面任务结构的第1
个任务的信息。
#define INIT_TASK \
/* state etc */ {
0,15,15, \ // state, counter, priority
/* signals */
0,
{
{
}
,}
,
0, \ // signal, sigaction[32],
blocked
/*
ec,brk... */ 0, 0, 0, 0, 0, 0,
\
//
exit_code,start_code,end_code,end_data,brk,start_stack
/*
pid etc.. */ 0, -1, 0, 0, 0,
\
//
pid, father, pgrp, session,
leader
/*
uid etc */ 0, 0, 0, 0, 0, 0,
\
//
uid, euid, suid, gid, egid,
sgid
/*
alarm */ 0, 0, 0, 0, 0, 0,
\
//
alarm, utime, stime, cutime, cstime,
start_time
/*
math */ 0,
\
//
used_math
/*
fs info */ -1, 0022, NULL, NULL, NULL, 0,
\
//
tty,umask,pwd,root,executable,close_on_exec
/* filp
*/
{
NULL,}
, \
// filp[20]
{
\ //
ldt[3]
{
0,
0}
,
/* ldt
*/
{
0x9f,
0xc0fa00}
, \ //
代码长640K,基址0x0,G=1,D=1,DPL=3,P=1
TYPE=0x0a
{
0x9f,
0xc0f200}
, \ //
数据长640K,基址0x0,G=1,D=1,DPL=3,P=1
TYPE=0x02
}
,
/*tss*/
{
0,
PAGE_SIZE + (long) &init_task, 0x10, 0, 0, 0, 0, (long) &pg_dir, \ //
tss
0, 0, 0, 0, 0, 0, 0,
0,
0, 0, 0x17, 0x17, 0x17, 0x17, 0x17,
0x17, _LDT (0),
0x80000000,
{
}
}
,}
extern
struct task_struct *task[NR_TASKS]; // 任务数组。
extern struct
task_struct *last_task_used_math; // 上一个使用过协处理器的进程。
extern
struct task_struct *current; // 当前进程结构指针变量。
extern long
volatile jiffies; // 从开机开始算起的滴答数(10ms/滴答)。
extern long
startup_time; // 开机时间。从1970:0:0:0 开始计时的秒数。
#define
CURRENT_TIME (startup_time+jiffies/HZ) // 当前时间(秒数)。
//
添加定时器函数(定时时间jiffies 滴答数,定时到时调用函数*fn())。(
kernel/sched.c,272)
extern void add_timer (long jiffies, void
(*fn) (void));
// 不可中断的等待睡眠。( kernel/sched.c, 151
)
extern void sleep_on (struct task_struct
**p);
// 可中断的等待睡眠。( kernel/sched.c, 167 )
extern
void interruptible_sleep_on (struct task_struct **p);
//
明确唤醒睡眠的进程。( kernel/sched.c, 188 )
extern void wake_up (struct
task_struct **p);
/*
* Entry into gdt where to
find first TSS. 0-nul, 1-cs, 2-ds, 3-syscall
* 4-TSS0, 5-LDT0,
6-TSS1 etc ...
*/
/*
* 寻找第1 个TSS
在全局表中的入口。0-没有用nul,1-代码段cs,2-数据段ds,3-系统段syscall
*
4-任务状态段TSS0,5-局部表LTD0,6-任务状态段TSS1,等。
*/
//
全局表中第1 个任务状态段(TSS)描述符的选择符索引号。
#define FIRST_TSS_ENTRY
4
// 全局表中第1 个局部描述符表(LDT)描述符的选择符索引号。
#define
FIRST_LDT_ENTRY (FIRST_TSS_ENTRY+1)
// 宏定义,计算在全局表中第n 个任务的TSS
描述符的索引号(选择符)。
#define _TSS(n) ((((unsigned long)
n)<<4)+(FIRST_TSS_ENTRY<<3))
// 宏定义,计算在全局表中第n
个任务的LDT 描述符的索引号。
#define _LDT(n) ((((unsigned long)
n)<<4)+(FIRST_LDT_ENTRY<<3))
// 宏定义,加载第n
个任务的任务寄存器tr。
#define ltr(n) __asm__( "ltr %%ax":: "a"
(_TSS(n)))
// 宏定义,加载第n
个任务的局部描述符表寄存器ldtr。
#define lldt(n) __asm__( "lldt %%ax":: "a"
(_LDT(n)))
// 取当前运行任务的任务号(是任务数组中的索引值,与进程号pid
不同)。
// 返回:n - 当前任务号。用于( kernel/traps.c,
79)。
#define str(n) \
__asm__( "str %%ax\n\t" \
// 将任务寄存器中TSS 段的有效地址??ax
"subl %2,%%eax\n\t" \ // (eax
- FIRST_TSS_ENTRY*8)??eax
"shrl $4,%%eax" \
// (eax/16)??eax = 当前任务号。
: "=a" (n):"a" (0), "i"
(FIRST_TSS_ENTRY << 3))
/*
* switch_to(n)
should switch tasks to task nr n, first
* checking that n isn‘t
the current task, in which case it does nothing.
* This also
clears the TS-flag if the task we switched to has used
* tha
math co-processor
latest.
*/
/*
*
switch_to(n)将切换当前任务到任务nr,即n。首先检测任务n 不是当前任务,
*
如果是则什么也不做退出。如果我们切换到的任务最近(上次运行)使用过数学
* 协处理器的话,则还需复位控制寄存器cr0 中的TS
标志。
*/
// 输入:%0 - 新TSS 的偏移地址(*&__tmp.a); %1
- 存放新TSS 的选择符值(*&__tmp.b);
// dx - 新任务n 的选择符;ecx -
新任务指针task[n]。
// 其中临时数据结构__tmp 中,a 的值是32 位偏移值,b 为新TSS
的选择符。在任务切换时,a 值
//
没有用(忽略)。在判断新任务上次执行是否使用过协处理器时,是通过将新任务状态段的地址与
//
保存在last_task_used_math 变量中的使用过协处理器的任务状态段的地址进行比较而作出的。
#define
switch_to(n) {\
struct {long a,b;} __tmp;
\
__asm__( "cmpl %%ecx,_current\n\t" \ // 任务n 是当前任务吗?(current
==task[n]?)
"je 1f\n\t" \ //
是,则什么都不做,退出。
"movw %%dx,%1\n\t" \ //
将新任务的选择符??*&__tmp.b。
"xchgl %%ecx,_current\n\t"
\ // current = task[n];ecx = 被切换出的任务。
"ljmp
%0\n\t" \ // 执行长跳转至*&__tmp,造成任务切换。
//
在任务切换回来后才会继续执行下面的语句。
"cmpl
%%ecx,_last_task_used_math\n\t" \ //
新任务上次使用过协处理器吗?
"jne 1f\n\t" \ //
没有则跳转,退出。
"clts\n" \ //
新任务上次使用过协处理器,则清cr0 的TS 标志。
"1:"::"m"
(*&__tmp.a), "m" (*&__tmp.b),
"d" (_TSS
(n)), "c" ((long) task[n]));
}
//
页面地址对准。(在内核代码中没有任何地方引用!!)
#define PAGE_ALIGN(n)
(((n)+0xfff)&0xfffff000)
// 设置位于地址addr
处描述符中的各基地址字段(基地址是base),参见列表后说明。
// %0 - 地址addr 偏移2;%1 - 地址addr
偏移4;%2 - 地址addr 偏移7;edx - 基地址base。
#define _set_base(addr,base)
\
__asm__( "movw %%dx,%0\n\t" \ // 基址base 低16
位(位15-0)??[addr+2]。
"rorl $16,%%edx\n\t" \ // edx 中基址高16
位(位31-16)??dx。
"movb %%dl,%1\n\t" \ // 基址高16
位中的低8 位(位23-16)??[addr+4]。
"movb %%dh,%2" \
// 基址高16 位中的高8 位(位31-24)??[addr+7]。
::"m" (*((addr) + 2)), "m"
(*((addr) + 4)), "m" (*((addr) + 7)), "d" (base):"dx")
//
设置位于地址addr 处描述符中的段限长字段(段长是limit)。
// %0 - 地址addr;%1 - 地址addr 偏移6
处;edx - 段长值limit。
#define _set_limit(addr,limit)
\
__asm__( "movw %%dx,%0\n\t" \ // 段长limit 低16
位(位15-0)??[addr]。
"rorl $16,%%edx\n\t" \ // edx
中的段长高4 位(位19-16)??dl。
"movb %1,%%dh\n\t" \ //
取原[addr+6]字节??dh,其中高4 位是些标志。
"andb $0xf0,%%dh\n\t" \
// 清dh 的低4 位(将存放段长的位19-16)。
"orb %%dh,%%dl\n\t" \
// 将原高4 位标志和段长的高4 位(位19-16)合成1 字节,
"movb
%%dl,%1" \ // 并放会[addr+6]处。
::"m" (*(addr)), "m"
(*((addr) + 6)), "d" (limit):"dx")
// 设置局部描述符表中ldt
描述符的基地址字段。
#define set_base(ldt,base) _set_base( ((char
*)&(ldt)) , base )
// 设置局部描述符表中ldt
描述符的段长字段。
#define set_limit(ldt,limit) _set_limit( ((char
*)&(ldt)) , (limit-1)>>12 )
// 从地址addr
处描述符中取段基地址。功能与_set_base()正好相反。
// edx - 存放基地址(__base);%1 -
地址addr 偏移2;%2 - 地址addr 偏移4;%3 - addr 偏移7。
#define
_get_base(addr) ({\
unsigned long __base;
\
__asm__( "movb %3,%%dh\n\t" \ // 取[addr+7]处基址高16 位的高8
位(位31-24)??dh。
"movb %2,%%dl\n\t" \ //
取[addr+4]处基址高16 位的低8 位(位23-16)??dl。
"shll
$16,%%edx\n\t" \ // 基地址高16 位移到edx 中高16 位处。
"movw
%1,%%dx" \ // 取[addr+2]处基址低16 位(位15-0)??dx。
:"=d"
(__base) \ // 从而edx 中含有32 位的段基地址。
:"m" (*((addr) + 2)),
"m" (*((addr) + 4)), "m" (*((addr) +
7)));
__base;
}
)
//
取局部描述符表中ldt 所指段描述符中的基地址。
#define get_base(ldt) _get_base( ((char
*)&(ldt)) )
// 取段选择符segment 的段长值。
// %0 -
存放段长值(字节数);%1 - 段选择符segment。
#define get_limit(segment) ({
\
unsigned long __limit; \
__asm__( "lsll
%1,%0\n\tincl %0": "=r" (__limit): "r" (segment));
\
__limit;})
郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。