fork() 背后的秘密：一次系统调用如何”变出”两个进程？

wangpeibao

2025-10-11

系统教程

大家好，我是小康。

你有没有想过，当你在Linux系统中运行一个程序时，计算机内部到底发生了什么？今天我们来聊聊一个看似简单却非常神奇的函数——fork()。

说它神奇，是因为它能做到一件让人匪夷所思的事情：一个进程调用它，却能"变出"两个进程！

一、先来个小实验，震撼一下

不多说，我们先来看个简单的例子：

复制

#include <stdio.h> #include <unistd.h> int main() { printf("调用fork()之前，我只有一个进程\n"); int pid = fork(); printf("调用fork()之后，我变成了两个进程！我的返回值是：%d\n", pid); return 0; }1.2.3.4.5.6.7.8.9.10.11.12.

运行这段代码，你会看到这样的输出：

复制

调用fork()之前，我只有一个进程调用fork()之后，我变成了两个进程！我的返回值是：4814 调用fork()之后，我变成了两个进程！我的返回值是：01.2.3.

看到了吗？第一行只打印了一次，但第二行竟然打印了两次！而且返回值还不一样！

这就是fork()的魔法所在。

二、fork()到底做了什么？

简单来说，fork()就像是给进程照了个镜子。调用fork()的那一刻，系统会创建一个和当前进程几乎完全一样的副本。

想象一下，你正在看一本书的第50页，突然有个魔法师对你施了分身术。现在有两个你，都在看同一本书的第50页，都有相同的记忆，连手里拿着的笔的颜色都一样。

这就是fork()做的事情。

三、父进程和子进程：一母同胞的兄弟

fork()创建出来的两个进程，我们称为父进程和子进程。

父进程：就是那个调用fork()的原始进程子进程：就是被创建出来的新进程

但是，系统怎么让这两个长得一模一样的进程知道自己是谁呢？答案就在fork()的返回值上：

在父进程中，fork()返回子进程的PID（进程ID）在子进程中，fork()返回0如果创建失败，返回-1

这就解释了为什么前面的例子中，同样的printf语句会打印出不同的返回值。

四、深入内核：fork()背后的完整流程

现在我们来揭开fork()的神秘面纱，看看Linux内核到底是怎么实现这个"魔法"的。

第一步：系统调用入口

当你在用户空间调用fork()时，实际上触发了一个系统调用。在x86_64架构下，这个调用会通过中断门进入内核空间。

复制

用户空间: fork() ↓ 系统调用: sys_fork() ↓ 内核空间: do_fork()1.2.3.4.5.

第二步：准备创建新进程

内核首先会做一些准备工作。我们来看看简化版的内核逻辑：

复制

// 简化版的内核逻辑 long do_fork(unsigned long clone_flags, ...) { struct task_struct *p;// 新进程的"身份证" // 1. 分配新的进程描述符 p = copy_process(clone_flags, ...); // 2. 分配新的PID pid = get_pid(p); // 3. 唤醒新进程 wake_up_new_task(p); return pid; // 返回给父进程 }1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.

这个过程分为几个关键步骤：

(1) 创建进程描述符（task_struct）

这个task_struct就是我们常说的PCB（进程控制块），它就像是新进程的"身份证档案"。里面记录了进程的所有重要信息：

进程状态（运行、睡眠、停止等）内存布局信息打开的文件列表信号处理方式调度信息

想象一下，这就像给新生儿办户口本，得把所有信息都登记清楚。

(2) 分配独一无二的PID

每个进程都需要一个身份证号，这个号码在整个系统中必须是唯一的。内核维护着一个PID分配器，确保不会重复。

(3) 准备调度

新进程创建好了，但还在"睡觉"。wake_up_new_task()就是叫醒它，告诉调度器："嘿，这里有个新进程可以运行了！"

第三步：复制进程的"基因"

这是最关键的一步，也就是前面代码中的copy_process()函数要做的事情：

复制

// copy_process()的核心工作 struct task_struct *copy_process(...) { //分配新的task_struct结构体（进程控制块） p = dup_task_struct(current); // current是当前进程（父进程） // 1. 复制内存空间 copy_mm(clone_flags, p); // 2. 复制文件描述符 copy_files(clone_flags, p); // 3. 复制信号处理 copy_sighand(clone_flags, p); return p; // 返回新进程 }1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.

让我们看看每一步都做了什么：

(1) 内存空间的复制（copy_mm）

这里有个很巧妙的设计叫做写时复制（Copy-on-Write，COW）。

想象一下，如果真的把父进程的所有内存都复制一遍，那得多浪费啊！

所以Linux采用了一个聪明的策略：

刚开始，父子进程共享同样的内存页面只有当其中一个进程要修改内存时，才真正复制那个页面这样既节省了内存，又提高了效率

复制

父进程内存: [Page1] [Page2] [Page3] ↓ fork()后共享子进程内存: [Page1] [Page2] [Page3] (实际指向同一物理内存) 当子进程要修改Page2时：父进程内存: [Page1] [Page2原] [Page3] 子进程内存: [Page1] [Page2新] [Page3] (Page2被真正复制了)1.2.3.4.5.6.7.

(2) 文件描述符的继承（copy_files）

所有打开的文件、网络连接等，子进程都会继承父进程的。

(3) 信号处理方式的复制（copy_sighand）

父进程怎么处理各种信号（比如Ctrl+C），子进程也会照样处理。

第四步：设置进程关系

内核会建立父子进程之间的关系：

子进程的父进程ID（PPID）指向父进程父进程的子进程列表中添加新的子进程第五步：调度新进程

一切准备就绪后，新的子进程就可以被CPU调度执行了。

五、来看一个例子

让我们用一个更实际的例子来理解这个过程：

复制

#include <stdio.h> #include <unistd.h> #include <sys/wait.h> int main() { int count = 0; printf("准备创建子进程...\n"); int pid = fork(); if (pid == 0) { // 子进程的代码 printf("我是子进程，我的PID是：%d，我的父进程PID是：%d\n", getpid(), getppid()); for (int i = 0; i < 3; i++) { printf("子进程正在工作：%d\n", ++count); sleep(1); } printf("子进程工作完成！\n"); } elseif (pid > 0) { // 父进程的代码 printf("我是父进程，我的PID是：%d，我创建了子进程：%d\n", getpid(), pid); for (int i = 0; i < 3; i++) { printf("父进程正在工作：%d\n", ++count); sleep(1); } printf("父进程等待子进程结束...\n"); wait(NULL); // 等待子进程结束 printf("父进程工作完成！\n"); } else { // fork失败 printf("创建子进程失败！\n"); return1; } return0; }1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.31.32.33.34.35.36.37.38.39.

运行这个程序，你会看到父子进程并行执行，各自维护着自己的count变量。

六、fork()的经典应用场景

1. Shell命令执行

当你在终端输入一个命令时，Shell就是用fork()+exec()来执行的：

复制

// 简化的Shell实现 int pid = fork(); if (pid == 0) { // 子进程执行命令 exec("/bin/ls", "ls", "-l", NULL); } else { // 父进程等待命令完成 wait(NULL); }1.2.3.4.5.6.7.8.9.

2. 服务器处理并发请求

复制

// 简化的服务器模型 while (1) { int client = accept(server_socket, ...); int pid = fork(); if (pid == 0) { // 子进程处理客户端请求 handle_client(client); exit(0); } else { // 父进程继续监听新连接 close(client); } }1.2.3.4.5.6.7.8.9.10.11.12.13.14.