一条 INSERT 语句背后的秘密

wangpeibao

2025-10-10

数据库

你以为你写了一条 SQL，其实你是在和数据库的一整套存储机制打交道。

一、引言：懂记录结构，真的很重要！

💥 开篇三连击：

当你敲下INSERT时，数据是在磁盘「盖房子」还是「搭积木」？行格式里藏着哪些「加密代码」？一条“莫名其妙”的慢查询，根源可能是行格式选错？

这些问题的答案，就藏在 InnoDB 的记录结构里。

我们在写 SQL 的时候，经常只关注“写对了没”、“跑起来没报错”。但真正理解 MySQL 的底层行为，往往要从一句简单的 INSERT 开始。

二、从一条INSERT语句开始说起

当我们执行INSERT INTO users (name, age,address) VALUES (张三, 25,北京.海淀);这条语句时，数据并不会直接 “一股脑” 地塞进磁盘。InnoDB 会按照特定的规则，将数据 “搭建” 成特定的结构，然后再存储到磁盘上。

为了更好地理解这个过程，我们先来对比一下行数据以及行结构。

假设我们有一张users表，包含id、name、age、address四个字段。

复制

CREATE TABLEusers ( idINTUNSIGNEDNOTNULL AUTO_INCREMENT COMMENT主键ID, nameVARCHAR(100) NOTNULLCOMMENT用户姓名, age INTUNSIGNEDCOMMENT年龄, address VARCHAR(255) COMMENT地址, PRIMARY KEY (id) ) ENGINE=InnoDBDEFAULTCHARSET=utf8mb4 COMMENT=用户信息表;1.2.3.4.5.6.7.

当我们插入一条数据(1, 张三, 25,北京.海淀)时，从表面上看，我们看到的行数据是这样的：

name

age

address

张三

北京海淀

然而在 InnoDB 中，一条数据并非简单存储，而是拆分成多个部分：记录头信息保存元数据，变长字段列表记录变长字段及长度，NULL 值列表标记哪些字段为 NULL。

InnoDB目前支持四种行格式：

COMPACT（最常用）REDUNDANT（MySQL 5.0之前）DYNAMIC（MySQL 5.7默认）COMPRESSED（压缩格式）

COMPACT 行格式是最常用的“标准模板”，掌握它能帮助你理解 InnoDB 记录结构的核心。

三、COMPACT 行格式详细介绍：数据存储的 “标准模板”

废话不多说，直接看图：

在这里插入图片描述

3.1 记录头信息：数据的 “身份证”

记录头信息仅占5字节，却包含记录类型、删除标记、B+树位置等关键信息，是记录的重要标识。

在这里插入图片描述

当我们执行DELETE语句删除一条记录时，InnoDB 并不会立即从磁盘上删除这条记录，而是在记录头信息中设置删除标记，后续再通过专门的机制进行清理。

字段 (Field)

位数 (Bits)

描述 (Description)

预留位1

保留位，目前没有用到。

预留位2

保留位，目前没有用到。

delete_mask

标记该记录是否被删除,1-是，0-否

min_rec_mask

标记该记录是否是B+树叶子节点中最小的记录,1-是，0-否

record_type

标记记录的类型。000表示普通记录，001表示最小值记录，010表示目录记录，011表示最大值记录。

n_owned

表示当前记录拥有的记录数

heap_no

标记当前记录在当前页面（Page）中的相对位置（槽号）。

next_record

表示下一条记录的相对位置

预留位2

保留位，目前没有用到。

3.2 变长字段列表：应对 “变化多端” 的数据

在实际应用中，很多字段的数据长度是不固定的，比如VARCHAR、TEXT、BLOB等类型的字段。变长字段列表就是为了应对这些 “变化多端” 的数据而设计的。它会记录哪些字段是变长的，以及它们的长度。

变长字段列表采用倒排的方式存储，也就是说，它从右往左存储每个变长字段的长度。

3.2.1 变长字段列表如何存储实际数据？

当执行插入语句INSERT INTO users VALUES(1, 张三, 25, 北京.海淀);时，我们来分析一下变长字段列表的存储方式。

a)、字段分析

id：INT 类型，固定长度 4 字节，不属于变长字段name：VARCHAR (100)，实际存储张三，UTF-8 编码下每个汉字占 3 字节，共 6 字节age：INT 类型，固定长度 4 字节，不属于变长字段address：VARCHAR (255)，实际存储北京.海淀，共包含 5 个字符（2 个汉字、1 个点、2 个汉字），每个汉字 3 字节，点 1 字节，共 13 字节

b)、变长字段列表的倒排存储

上面的例子中，有两个变长字段：name和address。它们的长度分别是 6 字节和 13 字节。根据倒排存储规则，变长字段列表会按照从右到左的顺序记录这些长度。

表定义顺序是：name, address倒排后，存的时候顺序是：address, name

因此，变长字段列表的内容为：[13,6]。

在这里插入图片描述