如何“医治”一条慢SQL？

wangpeibao

2025-10-10

数据库

前言

"苏工，订单列表又崩了！"

接到电话时，我对着监控大屏上999ms的SQL响应时间哭笑不得。

几年来，我发现一个定律：所有SQL问题都是在凌晨三点爆发！

今天抽丝剥茧，教你用架构师的思维给慢SQL开刀手术。

希望对你会有所帮助。

1.术前检查：找准病灶

1.1 EXPLAIN 查看执行计划

使用EXPLAIN查看SQL语句的执行计划，相当于给SQL拍了张X光。

下面是一个典型的SQL问题，它是某电商平台历史订单查询的SQL语句：

复制

SELECT * FROM orders o LEFTJOINusers u ON o.user_id = u.id LEFTJOIN products p ON o.product_id = p.id WHERE o.create_time > 2023-01-01 AND u.vip_level > 3 AND p.category_id IN (5,8) ORDERBY o.amount DESC LIMIT1000,20;1.2.3.4.5.6.7.8.9.

使用EXPLAIN关键字查看执行计划的结果如下：

复制

+----+-------------+-------+------+---------------+------+---------+------+---------+---------------------------------+ | id | select_type | table | type | possible_keys | key | rows | Extra| key_len | +----+-------------+-------+------+---------------+------+---------+------+---------+---------------------------------+ | 1 | SIMPLE | o | ALL | idx_user_time | NULL | 1987400 | Using where; Using filesort | | 1 | SIMPLE | u | ALL | PRIMARY | NULL | 100000 | Using where | | 1 | SIMPLE | p | ALL | PRIMARY | NULL | 50000 | Using where | +----+-------------+-------+------+---------------+------+---------+------+---------+---------------------------------+1.2.3.4.5.6.7.

诊断报告：

全表扫描三连击（type=ALL）filesort暴力排序（内存警告）索引全军覆没

2.手术方案：精准打击

2.1 单表代谢手术

如果通过执行计划查到是索引有问题，我们就需要单独优化索引。

病根：JSON字段索引失效

错误用法：

复制

ALTER TABLE users ADD INDEX idx_extend ((extend_info->$.is_vip));1.

extend_info字段是JSON类型的字段，即使创建了索引，索引也会丢失。

正解姿势（MySQL 8.0+）：

复制

ALTER TABLE users ADD INDEX idx_vip_level (vip_level); ALTER TABLE orders ADD INDEX idx_create_user (create_time, user_id) COMMENT 组合索引覆盖查询;1.2.

创建组合索引覆盖查询。

2.2 血管疏通术

卡点分析：

原始join顺序是：

复制

orders → users → products1.

优化后的方案：

复制

(子查询过滤users) → products → orders1.

调整执行顺序，用小表驱动大表。

重写后的SQL：

复制

SELECT o.* FROM products p INNERJOIN ( SELECT o.id, o.amount, o.create_time FROM orders o WHERE o.create_time > 2023-01-01 ) o ON p.id = o.product_id INNERJOIN ( SELECTid FROMusers WHERE vip_level > 3 ) u ON o.user_id = u.id WHERE p.category_id IN (5,8) ORDERBY o.amount DESC LIMIT1000,20;1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.

术后效果：

先扫小表（users过滤后只有100条）消除冗余字段传输减少Join时临时表生成2.3 开颅手术

通过执行计划锁定了问题，走错索引了，该怎么处理呢？

可以通过FORCE INDEX强制指定索引：

复制

SELECT /*+ INDEX(o idx_create_user) */ o.id, o.amount FROM orders o FORCE INDEX (idx_create_user) WHERE o.create_time > 2023-01-01;1.2.3.4.

使用衍生表加速：

复制

SELECT * FROM ( SELECTid, amount FROM orders WHERE create_time > 2023-01-01 ORDERBY amount DESC LIMIT1020 ) tmp ORDERBY amount DESC LIMIT1000,20;1.2.3.4.5.6.7.8.9.10.

医嘱：

警惕OR导致的索引失效用覆盖索引避免回表查询CTE表达式谨慎使用2.4 生命体征监测

查看索引使用：

复制

SHOW INDEX FROM orders;1.

监控索引使用率：

复制

SELECT object_schema, object_name, index_name, count_read, count_fetch FROM performance_schema.table_io_waits_summary_by_index_usage WHERE index_name IS NOT NULL;1.2.3.4.

3.术后护理：体系化治理

3.1 SQL消毒中心

需要制定优秀的代码规范，否则可能会出现全表扫描的问题。

在日常工作中，我们要尽可能减少Java代码感染源。

MyBatis危险写法：

复制

@Select("SELECT * FROM orders WHERE #{condition}") List<Order> findByCondition(@Param("condition") String condition);1.2.

condition参数可以传入任何内容，如何传入了1=1，可能会导致查询所有的数据，走全表扫描，让查询效率变得非常低。

正确做法（参数化查询）：

复制

@Select("SELECT * FROM orders WHERE create_time > #{time}") List<Order> findByTime(@Param("time") Date time);1.2.

消毒方案：

SQL审核平台接入（如Yearning）MyBatis拦截器拦截全表更新自动化EXPLAIN分析流水线3.2 查杀大表癌症

如果遇到大表的癌症病例，可以用分库分表的方案解决。

病历案例：3亿订单表终极解决方案

复制

// Sharding-JDBC分片配置 spring.shardingsphere.rules.sharding.tables.orders.actual-data-nodes=ds$0..1.orders_$->{2020..2023} spring.shardingsphere.rules.sharding.tables.orders.table-strategy.standard.sharding-column=create_time spring.shardingsphere.rules.sharding.tables.orders.table-strategy.standard.sharding-algorithm-name=time_range1.2.3.4.

化疗方案：

时间维度分片（2020~2023年度表）用户ID取模分库冷热分离（OSS归档历史数据）

医嘱总结

优化三板斧：

定位：慢查询日志+执行计划分析切割：化繁为简拆分多步执行重建：符合业务场景的数据结构

避坑口诀：

索引不是银弹，覆盖才是王道Join水深，能拆就拆Order By+Limit≠分页优化

最后送上苏三的传秘方：当你优化SQL到怀疑人生时，不妨试试这三味药：

删业务逻辑加缓存换数据库

保证药到病除（老板打不打死你我就不管了，哈哈哈）！

阅读剩余

THE END

【夜莺监控】海王——Categraf

<<上一篇

运维：Windows常用的命令行客户端，你都用过吗？

下一篇>>