malloc底层机制：brk与mmap如何选内存分配？

2025-10-11

brk 与 mmap 作为内存分配的「双引擎」，各自拥有独特的运行机制和适用场景。brk 通过线性扩展堆区，在小额内存分配场景中表现出轻快灵活的特点，能够高效地满足程序对小块内存的频繁需求。而 mmap 则凭借其独立映射的特性，在大块内存分配以及需要共享内存、文件映射的复杂场景中展现出强大的稳定性和灵活性。理解这两种内存分配方式的底层机制，是开发者优化程序性能、排查内存泄漏问题的关键。

在工程实践中，我们可以看到各种基于 brk 和 mmap 的优化策略和内存管理技术。内存池技术通过预先分配和复用内存，减少了系统调用的次数，提高了内存分配的效率，尤其适用于高频小额内存分配的场景。碎片整理技术则通过定期整理内存碎片，提高了内存的利用率，减少了内存碎片化对程序性能的影响。这些技术的应用，进一步展示了 brk 和 mmap 在实际开发中的重要性和实用性。

一、内存分配的「双引擎」：brk 与 mmap 核心原理

在深入探讨brk与mmap之前，我们先来明确一个概念：在 Linux 系统中，内存分配的核心系统调用主要就是brk和mmap ，它们是进程获取内存的两种关键方式，就像程序猿伸向内存的两只手，各自有着独特的分工和技巧。接下来，就让我们揭开它们神秘的面纱，看看它们是如何在内存的舞台上翩翩起舞的。

1.1 brk：堆区的线性扩展引擎

brk 系统调用是进程堆内存管理的重要工具，其核心机制在于通过移动进程堆顶指针（program break）来动态扩展内存空间。进程启动时，堆区位于数据段末端，随着程序运行，当需要更多内存时，brk 会将堆顶指针向高地址移动，新分配的内存便紧接在已有堆内存之后，形成连续的线性区域。这一过程就好比在现有土地上进行扩建，不断拓展可使用的空间。

图片

从内存分配的实际过程来看，brk 有着独特的优势和特性。首先，brk 在进行内存分配时，仅修改虚拟内存边界，并不会立即分配物理内存。只有当进程首次访问新分配的虚拟内存区域时，才会触发缺页中断，此时操作系统才会真正分配物理内存，并建立虚拟内存与物理内存之间的映射关系。这种按需分配的策略有效地避免了内存的提前浪费，提高了内存使用效率。

其次，brk 分配的内存是连续的，这在许多场景下都极为重要。例如，对于一些需要频繁读写大块连续数据的应用，如数据库缓存，连续的内存空间可以显著提高数据访问速度，减少缓存未命中的次数，因为连续内存有利于提高缓存命中率，使得数据能够更高效地在内存与缓存之间传输。此外，glibc 的 sbrk 函数对 brk 进行了封装，提供了更为便捷的增量分配接口。通过 sbrk，开发者可以直接指定增加或减少的内存大小，而无需手动计算新的堆顶地址，大大简化了内存操作流程。

不过，brk 也存在一些局限性。由于其分配的内存依赖堆顶指针的移动，释放内存时需按顺序进行，即高地址的内存先释放，低地址的内存后释放。这就导致如果中间部分的内存被释放，会形成内存空洞，而这些空洞在后续的内存分配中可能无法被充分利用，从而产生内存碎片化问题。随着程序不断地进行内存分配和释放操作，内存碎片化可能会越来越严重，最终导致即使堆区还有足够的空闲内存，但由于碎片的存在，无法满足较大内存块的分配需求，影响程序的正常运行。

这种分配方式有着自己独特的特点：

虚拟内存与物理内存的延迟绑定：brk仅修改虚拟内存边界，并不会立即分配物理内存。只有当程序首次访问这片新分配的虚拟内存时，才会触发缺页中断，操作系统这时才会真正分配物理内存给进程。这就像是你先规划好了新房间的位置（设置虚拟内存边界），但还没真正开始砌墙（分配物理内存），直到有人要住进去（首次访问）才开始动工。堆区内存的顺序释放：分配的内存属于进程堆区，在释放的时候需要按顺序来，后分配的先释放。就好比你扩建的房间，你要拆除的时候，得从最后建的那间开始拆。封装与增量分配：在 glibc 中，sbrk函数是brk的封装，它提供了增量分配接口。例如，sbrk(n)会将堆顶指针移动n个字节，实现增量式的内存分配。这就像是你每次可以一小部分一小部分地扩建你的房子，非常灵活。

brk这种方式特别适合小块内存的快速分配，比如几 KB 到几十 KB 的内存分配，因为它操作简单，只需要移动一下堆顶指针就可以完成内存分配的 “规划”，速度非常快。但它也有自己的局限性，比如容易产生内存碎片，就像你不断地在房子后面扩建小房间，拆了又建，建了又拆，最后可能会剩下很多不规则的小块空地（内存碎片），很难再利用起来。

1.2 mmap：虚拟空间的独立映射器

mmap 系统调用则开辟了另一种内存分配的途径，它在堆与栈之间的 “文件映射区” 创建独立的内存区域。当调用 mmap 时，进程可以指定映射的长度、权限（如设置为 MAP_ANONYMOUS 表示匿名映射，不与任何文件关联）等参数，内核会据此生成独立的内存管理单元（vm_area_struct）。这个内存管理单元就像是一个独立的 “小房间”，与堆区的内存管理相互独立，拥有自己的地址空间和权限设置。参考这篇《超硬核，基于mmap和零拷贝实现高效的内存共享》

图片

mmap 的独特优势使其在特定场景下表现出色。一方面，mmap 支持非连续内存分配，这对于需要分配大块内存的场景尤为重要。当程序需要申请一块较大的内存时，mmap 可以直接在文件映射区找到合适的空闲区域进行分配，而不受堆区连续内存的限制，避免了因堆区连续扩容导致的整体膨胀和内存碎片化问题。在大数据处理、图形渲染等需要大量内存的应用中，mmap 能够高效地满足内存需求，确保程序的稳定运行。

另一方面，mmap 具有零拷贝特性，特别是在文件映射场景中，它可以直接将文件内容映射到内存中，进程对文件的读写操作就如同对内存的读写一样，减少了数据在用户空间和内核空间之间的搬运开销。例如，在文件传输过程中，传统的 read/write 方式需要多次数据拷贝和系统调用，而 mmap 通过内存映射，让数据直接在内存中进行处理，大大提高了数据传输效率，减少了 CPU 的负载。此外，mmap 分配的内存释放时不依赖堆区顺序，通过 munmap 函数可以独立地将内存归还给系统，无论该内存块在映射区域中的位置如何，都能直接释放，这使得内存管理更加灵活，进一步减少了内存碎片化的风险。

mmap的特点也十分显著：

非连续内存分配与大块内存支持：它支持非连续内存分配，特别适合大块内存的分配，在大多数系统中，默认超过 128KB 的内存分配就会使用mmap。这就像你要建设一个大型工业园区，不需要在已有的城市区域里一点点拼凑，而是可以直接在郊区划出一大块独立的土地来建设。零拷贝特性提升效率：mmap具有零拷贝特性，尤其是在文件映射场景中，它减少了数据搬运开销。比如在读取大文件时，传统的read方式需要将数据从内核缓冲区拷贝到用户缓冲区，而mmap可以直接将文件映射到用户空间，进程直接访问映射内存，就像你可以直接在工业园区里工作，而不需要把工业园区的产品先搬到家里再进行处理，大大提高了效率。像 Kafka 在 Broker 读写 index 文件时就用了 mmap 零复制技术，大大提升了数据处理的效率。独立释放避免碎片化：mmap通过munmap可以独立释放内存，避免了内存碎片化问题。每个通过mmap分配的内存区域就像一个独立的小区，你可以随时拆除（释放）任何一个小区，而不会影响其他区域，不像brk分配的内存，释放时受到顺序限制，容易产生碎片。

1.3 brk与 mmap 二者之间区别

brk（及 sbrk）和 mmap 是操作系统提供的两种内存分配相关的系统调用，主要区别体现在作用范围、适用场景、内存管理方式等方面。

操作的内存区域不同。brk/sbrk 仅用于调整进程堆的边界，通过修改堆顶指针改变堆的大小；而 mmap 用于在虚拟地址空间中创建独立的内存区域，该区域与堆、栈等现有区域不连续。适用的内存大小场景不同。brk/sbrk 适合小块内存分配（如几 KB 到几十 KB），因堆内存连续，分配释放开销小，且释放后可被 malloc 缓存复用；mmap 更适合大块内存分配（通常超 128KB），能避免堆内存碎片，且释放后直接归还给操作系统。内存释放与回收机制不同。brk 分配的堆内存释放后，会进入 malloc 的空闲列表供后续复用，仅当堆顶连续空闲内存足够大时才归还给系统；mmap 分配的匿名内存释放时，通过 munmap 直接归还操作系统，不再被进程占用。内存地址连续性不同。brk 分配的内存属于堆的一部分，地址连续；mmap 分配的内存是独立区域，地址与堆、栈等不连续，各 mmap 区域间也可能离散。

二、核心区别：为什么 malloc 选择「大小有别」？

通过对brk和mmap原理的剖析，我们已经了解到它们各自的特点和工作方式。接下来，让我们深入探讨它们之间的核心区别，以及为什么malloc会根据内存大小来选择不同的底层实现机制。这就像是一个精密的仪器，不同的部件在不同的情况下发挥着最佳的作用，而malloc就像是这个仪器的智能控制系统，根据不同的 “任务”（内存分配需求）来选择最合适的 “工具”（brk或mmap）。

2.1 内存布局与碎片化对比

从内存布局的角度来看，brk和mmap有着显著的区别。brk分配的内存位于堆区，是在数据段末端进行线性扩展的，就像一条不断延伸的直线，所有分配的内存块紧密相连，依赖堆顶指针来管理内存的边界。这种方式在内存释放时，必须按照分配的顺序，从高地址的内存块开始释放。这就好比你在书架上依次摆放书籍，要拿走书籍时，也得从最后放上去的那本开始拿。如果中间释放了某个内存块，就会在堆区留下一个空洞，后续的内存分配如果大小不合适，就无法利用这个空洞，从而导致内存碎片化。就像书架上拿走了中间的几本书，留下了几个不规则的空位，很难再找到合适大小的书籍来填补。

而mmap则在文件映射区创建独立的内存映射区域，每个区域就像一个独立的小房间，它们之间可以是非连续的。在释放内存时，每个区域可以独立进行，不会受到其他区域的影响。这就好比你有多个独立的小仓库，你可以随时关闭（释放）任何一个仓库，而不会影响其他仓库的使用，大大降低了内存碎片化的风险。就像你在不同的地方有多个小书架，每个书架都可以独立管理，拿走某个书架上的书不会影响其他书架的布局，避免了出现像brk那样的整体布局混乱（内存碎片化）问题。

对比维度

堆区（brk）

文件映射区（mmap）

内存释放顺序

顺序释放（高地址优先）

独立释放（任意区域）

内存碎片化程度

高（中间释放形成空洞）

低（单区域释放无影响）

内存分配开销

低（仅修改指针）

中（创建映射结构）

2.2 系统调用开销与适用场景

在系统调用开销方面，brk和mmap也有着各自的特点。brk每次调用仅仅修改一个指针值，就像是你只需要在地图上移动一个标记来表示新的边界，这种操作非常简单快捷，系统调用开销极低，大约只需要 100 纳秒。这使得它非常适合高频、小块内存的分配场景，比如链表节点的创建，这些节点通常只需要很小的内存空间，而且可能会频繁地创建和销毁；还有临时缓冲区的分配，这些缓冲区在程序运行过程中临时使用，大小通常也不大，使用brk可以快速地分配和释放内存，提高程序的运行效率。

相比之下，mmap在创建内存映射时，需要创建vm_area_struct结构并建立复杂的映射关系，这就像是你要建立一个新的社区，需要进行详细的规划和建设。这种初始化过程的开销较高，大约需要 500 纳秒。但是，mmap的优势在于它的强大功能和稳定性。它支持灵活的内存释放方式，适合大块内存的分配，比如缓冲区的创建，当你需要一个较大的连续内存空间来存储大量数据时，mmap可以很好地满足需求；在动态库加载时，也通常会使用mmap，它可以将动态库文件映射到进程的虚拟地址空间，实现高效的共享和调用。此外，mmap在文件映射场景中表现出色，比如数据库索引的加载，通过mmap可以直接将索引文件映射到内存中，进程可以像访问内存一样快速访问索引数据，大大提高了数据库的查询效率。

2.3 malloc 的「策略选择」

在 glibc 的malloc实现中，内存分配大小与一个关键阈值（默认是 128KB）的比较决定了底层采用的内存分配机制。参考这篇《glibc堆内存管理：原理、机制与实战》

当分配的内存较小（小于 128KB）时，malloc会选择走brk扩展堆区的方式。这是因为小块内存的分配和释放操作可能会非常频繁，而brk的低系统调用开销可以很好地应对这种高频操作。同时，malloc利用空闲块链表来复用内存，比如 ptmalloc 的 fastbin 机制，它会将一些小块内存块组织成一个快速分配链表，当有新的小块内存分配请求时，优先从这个链表中查找合适的内存块进行分配，避免了频繁的系统调用，进一步提高了分配效率。这就像是你有一个小工具盒，里面有一些常用的小工具，每次需要使用小工具时，你可以直接从工具盒里快速找到，而不需要每次都去大仓库（系统内存）里寻找。

当分配的内存较大（大于等于 128KB）时，malloc会直接调用mmap来创建独立的内存映射。这是因为大块内存的分配如果使用brk，很容易导致堆区的碎片化，影响后续的内存分配效率。而mmap的独立内存管理方式可以避免这个问题，虽然它的初始化开销较高，但对于大块内存的一次性分配来说，这点开销是可以接受的。这就好比你要建造一座大型建筑，虽然前期的规划和准备工作（初始化开销）比较繁琐，但建成后可以独立使用，不会影响其他区域，也不会因为后续的一些小改动（内存释放和再分配）而导致整体结构的混乱（内存碎片化）。

三、实战指南：如何正确使用 brk 与 mmap？

在了解了brk和mmap的原理以及它们在malloc中的应用之后，接下来我们进入实战环节，看看在实际编程中如何正确地使用它们，以及在使用过程中有哪些性能优化技巧和常见陷阱需要注意。这就像是我们学会了理论知识之后，要亲自上手实践，在实践中掌握这些内存分配工具的使用技巧，让它们为我们的程序高效运行保驾护航。

3.1 基础 API 使用示例

（1）brk/sbrk 调用

在 C 语言中，brk和sbrk函数用于操作堆内存。brk函数直接设置堆顶指针，而sbrk函数则是在当前堆顶指针的基础上进行增量调整。下面是一个简单的示例，展示了如何使用sbrk来分配和释放内存：

复制

#include <stdio.h> #include <unistd.h> #include <stdlib.h> int main() { // 使用sbrk分配1024字节内存 char *p = (char *)sbrk(1024); if (p == (void *)-1) { perror("sbrk"); return 1; } // 使用分配的内存 for (int i = 0; i < 1024; i++) { p[i] = i; } // 输出内存中的前10个字节 for (int i = 0; i < 10; i++) { printf("%d ", p[i]); } printf("\n"); // 使用sbrk释放内存（将堆顶指针回退1024字节） if (sbrk(-1024) == (void *)-1) { perror("sbrk"); return 1; } return 0; }1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.31.

在这个示例中，我们首先使用sbrk(1024)分配了 1024 字节的内存，然后对这块内存进行了初始化操作，最后通过sbrk(-1024)将堆顶指针回退 1024 字节，实现了内存的释放。需要注意的是，在实际应用中，直接使用brk和sbrk进行内存管理的情况比较少见，因为它们的操作相对底层，容易出错，通常会使用更高级的内存分配函数，如malloc和free 。

（2）mmap/munmap 调用

mmap函数用于创建内存映射，munmap函数则用于取消内存映射。下面是一个使用mmap映射文件的示例：

复制

#include <stdio.h> #include <stdlib.h> #include <sys/mman.h> #include <sys/stat.h> #include <fcntl.h> #include <unistd.h> #include <string.h> int main() { int fd; char *file_content; struct stat file_stat; // 打开文件 fd = open("test.txt", O_RDWR); if (fd == -1) { perror("open"); return 1; } // 获取文件大小 if (fstat(fd, &file_stat) == -1) { perror("fstat"); close(fd); return 1; } // 使用mmap映射文件 file_content = (char *)mmap(0, file_stat.st_size, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0); if (file_content == MAP_FAILED) { perror("mmap"); close(fd); return 1; } // 输出文件内容 printf("File content:\n%s\n", file_content); // 修改文件内容 strcpy(file_content, "This is a modified content."); printf("Modified file content:\n%s\n", file_content); // 取消映射 if (munmap(file_content, file_stat.st_size) == -1) { perror("munmap"); } // 关闭文件 close(fd); return 0; }1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.31.32.33.34.35.36.37.38.39.40.41.42.43.44.45.46.47.48.49.50.51.52.

在这个示例中，我们首先打开一个文件，获取其大小，然后使用mmap将文件内容映射到内存中。通过返回的指针，我们可以像访问普通内存一样访问文件内容，对其进行读取和修改。最后，使用munmap取消内存映射，并关闭文件描述符。这个示例展示了mmap在文件映射场景中的基本用法，通过这种方式，可以大大提高文件的读写效率，尤其是在处理大文件时。

3.2 性能优化技巧

在实际使用brk和mmap时，合理的性能优化可以显著提升程序的运行效率。以下是一些常见的性能优化技巧：

小块内存复用：对于频繁分配释放的小块内存，如网络请求临时数据，直接调用brk会导致大量的系统调用开销。此时，改用内存池（如 tcmalloc 的 thread - local cache）是一个很好的选择。内存池通过预先分配一块较大的内存，然后在内部维护一个或多个链表，用于快速分配和回收小块内存。这样可以减少系统调用的次数，提高内存分配和释放的效率。例如，在一个高并发的网络服务器中，每个网络请求可能只需要几 KB 的内存来存储临时数据，如果每次都直接调用brk来分配内存，会导致大量的系统调用开销，影响服务器的性能。而使用内存池，就可以在内存池中快速分配和回收这些小块内存，避免了频繁的系统调用。

大块内存对齐：在使用mmap分配大块内存时，可以指定MAP_POPULATE标志来预分配物理内存。这样可以减少后续访问这些区域时触发缺页中断的可能性，提高访问速度。另外，利用大页（Huge Pages）也是一种优化方式。大页可以减少页表的大小，降低 TLB（Translation Lookaside Buffer）缺失的概率，从而提升内存访问效率。在一些对内存访问性能要求极高的应用中，如数据库系统，经常会使用大页来提高内存访问速度。例如，在 MySQL 数据库中，可以通过配置参数来启用大页，提高数据库的性能。

碎片整理：对于brk分配的内存，可以通过mallopt(M_TRIM_THRESHOLD, 0)强制brk释放超过阈值的空闲内存，减少内存碎片的产生。对于mmap分配的内存，可以使用madvise函数对内存区域进行预取 / 丢弃优化。例如，当应用程序知道将来会使用某些数据时，可以通过madvise建议操作系统提前加载这些数据到内存中，提高数据访问的效率；当应用程序不再需要某些数据时，可以通过madvise告知内核释放内存，优化内存使用。在一个视频播放应用中，在播放视频前，可以通过madvise预取视频数据，避免播放过程中出现卡顿；在视频播放结束后，可以通过madvise释放不再需要的内存，提高系统的内存利用率。

3.3 常见陷阱与避坑

在使用brk和mmap的过程中，也存在一些常见的陷阱，如果不注意，可能会导致程序出现内存泄漏、性能下降等问题。以下是一些常见的陷阱及避免方法：

brk 的「释放限制」：在使用brk释放堆内存时，只能回退到最近一次分配的高地址，若中间有未释放块则无法缩减。例如，先进行 A 分配，再进行 B 分配，然后释放 A，此时会导致内存空洞，只有等 B 释放后才能整体回收。这就像是你在书架上依次放书，先放了 A 书，再放了 B 书，当你想拿走 A 书时，如果 B 书还在，就无法直接拿走 A 书所在的那一层空间，必须先拿走 B 书，才能真正释放 A 书占用的空间。为了避免这种情况，在设计内存分配策略时，需要充分考虑内存的释放顺序，尽量避免出现中间有未释放块的情况。

mmap 的「泄漏风险」：如果忘记调用munmap取消内存映射，会导致虚拟内存泄漏。虽然这种泄漏不会占用物理内存，但会消耗地址空间，最终可能导致进程无法再分配新的内存。可以通过pmap pid命令查看进程的映射情况，排查是否存在未释放的内存映射。这就像是你租了一间房子，住完后却忘记退房，虽然房子里没有人住，但别人也无法再租用这间房子，造成了资源的浪费。在编写程序时，一定要确保在不再需要内存映射时，及时调用munmap进行释放。

权限控制：使用mmap时，可以设置PROT_NONE权限来创建一个保护区域，捕获非法访问，如缓冲区溢出。但是，这需要配合信号处理（SIGSEGV）使用，当发生非法访问时，系统会发送SIGSEGV信号，程序可以通过捕获这个信号来进行相应的处理，如记录错误日志、进行错误恢复等。这就像是你在房子周围设置了一圈警戒线，当有人非法闯入时，就会触发警报，你可以根据警报进行相应的处理。在使用mmap时，合理设置权限和信号处理，可以提高程序的安全性和稳定性。

四、内存分配之道

4.1 操作系统的「平衡之道」

brk与mmap的设计精妙地体现了操作系统在「效率」与「灵活」之间的权衡智慧。brk通过简单地移动堆顶指针来分配内存，这种方式虽然在灵活性上有所欠缺，例如它只能分配连续的内存空间，释放内存时也受到严格的顺序限制，但它却在高频内存分配操作中展现出了极高的效率。就像在一个小型工厂里，所有的生产流程都非常简单直接，虽然不能生产出非常复杂多样的产品，但是对于一些常规的、大量需求的简单产品，却能以最快的速度生产出来。这种特性使得brk特别适合那些对内存分配速度要求极高，且内存需求相对较小且连续的场景，比如在一个频繁创建和销毁小对象的程序中，brk能够快速地为这些小对象分配内存，保证程序的高效运行。

而mmap则走向了另一个方向，它放弃了单一连续空间的限制，允许创建独立的内存映射区域。这就好比一个大型的综合性工厂，它可以生产各种复杂的、多样化的产品，每个产品的生产流程都可以独立进行。mmap的这种特性赋予了它强大的灵活性，它可以实现内存的独立管理和共享，特别适合那些对内存管理灵活性要求较高，且内存需求较大的场景，比如在跨进程通信中，mmap可以创建共享内存区域，让多个进程能够高效地共享数据；在处理大文件时，mmap可以将文件直接映射到内存中，实现高效的文件读写操作。

这种在不同维度上的权衡与设计，不仅仅体现在内存分配领域，在整个操作系统的设计中都有着广泛的体现。以 TCP/IP 协议栈为例，BSD socket 和 raw socket 就是这种分层设计思想的典型体现。BSD socket 为应用层提供了一个相对高层、抽象的接口，它隐藏了底层网络协议的许多细节，使得应用程序可以方便快捷地进行网络通信，就像使用一个已经组装好的工具，只需要简单操作就能完成任务，这体现了对效率的追求。而 raw socket 则允许开发者直接访问底层的网络协议，能够对网络数据包进行更加精细的控制，虽然使用起来相对复杂，但却提供了极大的灵活性，适用于一些对网络通信有特殊需求的场景，比如网络协议分析工具的开发。

同样，在文件系统的设计中，ext4 和 f2fs 也展现了类似的分层设计思想。ext4 是一种广泛使用的文件系统，它在设计上注重兼容性和稳定性，采用了传统的文件系统结构，对于大多数常规的文件存储和访问需求，都能提供高效的支持，这体现了对效率的保障。而 f2fs 则是一种专门为闪存设备设计的文件系统，它针对闪存的特性进行了优化，采用了更加灵活的结构，能够更好地适应闪存的读写特点，提高闪存设备的使用寿命和性能，这体现了对特定场景下灵活性的追求。

4.2 现代内存分配器的「融合创新」

以 glibc 的 ptmalloc、Google 的 tcmalloc 为代表的现代内存分配器，巧妙地采用了「brk + mmap 混合策略」，将brk和mmap的优势发挥到了极致。

对于小对象（一般小于 64KB），这些分配器通常会利用线程本地缓存来进行分配。以 TCMalloc 的 thread cache 为例，每个线程都有自己独立的缓存，当线程需要分配小对象时，可以直接从自己的缓存中获取内存，避免了锁竞争。这就好比每个员工都有自己的小工具盒，当需要使用小工具时，直接从自己的工具盒里拿取，不需要和其他员工争抢大仓库里的工具，大大提高了分配的效率。

当面对中对象（64KB - 128KB）时，分配器会通过brk从堆区分配内存。在这个过程中，分配器会利用空闲块合并的技术，将相邻的空闲内存块合并成更大的内存块，减少内存碎片的产生。这就像是在整理仓库时，将相邻的小空位合并成一个大空位，以便更好地利用空间。例如，ptmalloc 会维护不同大小的空闲块链表，当有新的内存分配请求时，会首先在合适的链表中查找是否有可用的空闲块，如果有则直接分配，否则会尝试合并相邻的空闲块来满足请求。

而对于大对象（大于 128KB），分配器会直接使用mmap来分配内存。由于大对象的内存需求较大，如果使用brk分配，很容易导致堆区的碎片化，影响后续的内存分配效率。而mmap的独立内存管理方式可以避免这个问题，虽然它的初始化开销较高，但对于大对象的一次性分配来说，这点开销是可以接受的。这就好比建造大型建筑，虽然前期的规划和准备工作比较繁琐，但建成后可以独立使用，不会影响其他区域，也不会因为后续的一些小改动而导致整体结构的混乱。

这种混合策略的设计，不仅兼顾了性能与稳定性，还将底层系统调用的细节封装起来，向上层应用提供了统一的malloc/free接口。应用程序在进行内存分配时，不需要关心底层到底是使用brk还是mmap，只需要调用malloc函数即可，这大大简化了开发者的工作，同时也提高了程序的可移植性和可维护性。

4.3 开发者的「选择原则」

在实际的开发过程中，开发者需要根据不同的业务场景和需求，合理地选择内存分配方式。

优先使用标准库接口：在大多数情况下，开发者应该优先使用标准库提供的malloc/free接口。这些接口经过了大量的测试和优化，能够根据内存分配的大小自动选择合适的底层实现机制（brk或mmap）。除非开发者有特殊的需求，例如需要实现自定义的内存分配器，如在游戏引擎中，为了提高内存管理的效率和性能，常常会实现自己的内存池，否则直接使用标准库接口是最简便、最安全的选择。

关注业务场景：业务场景是选择内存分配方式的重要依据。对于高频小块内存的分配场景，例如在一个网络服务器中，每个网络请求可能只需要几 KB 的内存来存储临时数据，这种情况下应该尽量避免使用mmap，因为mmap的高开销会严重影响系统的性能，而brk则是更好的选择。相反，对于大块内存的分配或者需要共享内存的场景，比如在跨进程通信中，需要创建共享内存区域来实现数据的共享，这时就应该优先使用mmap，因为它能够提供独立的内存管理和共享能力，满足业务的需求。

性能 profiling：为了确保内存分配的效率，开发者可以通过性能分析工具来监控系统调用的频率。例如，可以使用perf trace -e mmap或strace -f -e brk,mmap命令来监控mmap和brk系统调用的频率，从而定位到内存分配的低效点。通过分析这些数据，开发者可以针对性地优化内存分配策略，提高程序的性能。比如，如果发现某个模块中频繁地调用mmap来分配小块内存，就可以考虑优化该模块的内存分配方式，改为使用brk或者内存池，以降低系统调用的开销，提高程序的运行效率。

THE END

量子计算和数据中心：量子计算对数据中心基础设施的潜在影响

<<上一篇

Linux 内核 ksmbd 漏洞允许远程攻击者执行任意代码（CVE-2025-38561）

下一篇>>