天天看点

UNIX环境高级编程学习笔记(十)为何 fork 函数会有两个不同的返回值【转】

以下是基于 linux 0.11 内核的说明。

在init/main.c第138行, 

在move_to_user_mode()之后,进程0通过fork()产生子进程,实际就是进程1(init进程)。

在main.c第23行:

通过 _syscall0 调用 fork 。_syscall0 即不带参数的系统调用:type name(void),_syscall0 的定义在unistd.h中第133行:

在 kernel\sched.c 中的 sched_init 调用 system_call

system_call 位于 kernel\system_call.s 中。在该文件第94行:

1

调用地址为:_sys_call_table + %eax * 4,此时 exa 的值为2(根据__NR_fork的定义),由于是32位机,指针占4个字节。

sys_call_table 的定义在 include\linux\sys.h 中第74行:

即调用的是 sys_fork 。

sys_fork 的定义是一段汇编代码,位于 kernel\system_call.s 第208行:

在 sys_fork 中,有两个主要的函数调用:_find_empty_process 和 _copy_process 。

_find_empty_process 位于 kernel\fork.c 中第135行,其作用是找到一个空的进程号(对应于一个进程控制块PCB),在linux 0.11版本中最多支持64个进程(全局数组task定义在sched.h中,数组大小为64):

全局变量last_pid用来记录上次使用的进程号,其定义在 kernel\fork.c 第22行:

在find_empty_process中,不断递增last_pid,寻找第一个未被其它进程使用的进程号作为新进程的进程号。如果递增后的值超出正数表示范围,则重新从1开始,并将其返回值存放在 %eax 中。若没能找到可用进程号,则跳转。若找到可用进程号则进行相关压栈操作,然后调用_copy_process 开始复制进程内容。

_copy_process 的定义位于 kernel\fork.c 第63行:

进程控制块中还保存有进程的任务状态段数据结构tss,用于存储处理器管理进程的所有信息。也就是说,在任务切换过程中,首先将处理器中各寄存器的当前值被自动保存当前进程的tss中;然后,下一进程的tss被加载并从中提取出各个值送到处理器的寄存器中。由此可见,通过在tss中保存任务现场各寄存器状态的完整映象,实现任务的切换。

因此,一旦在task[]数组中找到空闲项和进程号,我们就可以为该进程的进程控制块结构申请一个页面的内存。这个工作是在copy_process() 函数中完成的。

当然copy_process()函数的最主要的任务是为子进程复制父进程信息,并设置子进程的任务状态段,其中最关键的两步是:

把子进程tss中的eip设置为父进程系统调用返回地址,这样当子进程被调度程序选中后,将从父进程的fork()返回处开始执行。

把子进程tss中的eax设置为0,而eax是存放函数返回值的地方,这样子进程中返回的是0。注意子进程并没有执行fork()函数,子进程的系统堆栈没有进行过操作,当然不会有像父进程那样的fork函数调用。但是当子进程开始运行时,就好像它从 fork 中返回一样。

<code>p-&gt;tss.eax = 0;</code>

本文转自张昺华-sky博客园博客,原文链接:http://www.cnblogs.com/sky-heaven/p/8080501.html,如需转载请自行联系原作者