SQL 中的 DISTINCT 和 GROUP BY：你真的懂它们的区别吗？

2025-10-12

在 SQL 查询中，DISTINCT 和 GROUP BY 是两个常见的用于去重和分组的操作符。然而，尽管它们在某些情况下可以达到相同的效果，但它们在原理、适用场景和性能方面却有很大的不同。本文将详细介绍 DISTINCT 和 GROUP BY 的区别、适用场景以及它们对查询性能的影响。

DISTINCT 和 GROUP BY 的基本概念

1.DISTINCT 的基本概念

DISTINCT 是一种用于去除查询结果中重复行的关键字。它通常与 SELECT 语句一起使用，以确保返回的结果集中的每一行都是唯一的。

示例：

复制

SELECT DISTINCT column1, column2 FROM table_name;1.2.

上面的查询将返回 column1 和 column2 组合的唯一结果。

2.GROUP BY 的基本概念

GROUP BY 是一种用于将查询结果中的行分组的关键字。它通常与聚合函数（如 COUNT、SUM、AVG 等）一起使用，以对每个分组进行汇总操作。

示例：

复制

SELECT column1, COUNT(*) FROM table_name GROUP BY column1;1.2.3.

上面的查询将按 column1 分组，并返回每个分组中的行数。

DISTINCT 和 GROUP BY 的区别

1.语法层面的区别

DISTINCT 主要用于去除重复行，而 GROUP BY 主要用于分组汇总。虽然在某些情况下，这两个关键字可以产生相同的结果，但它们的语法和用途是不同的。

示例：

假设有一个名为 employees 的表，其中包含以下数据：

name

department

Alice

Sales

Bob

Sales

Carol

Dave

Eve

(1) 使用DISTINCT去除重复的部门：

复制

SELECT DISTINCT department FROM employees;1.2.

结果：

department

Sales

(2) 使用GROUP BY对部门进行分组：

复制

SELECT department FROM employees GROUP BY department;1.2.3.

结果：

department

Sales

在这种情况下，DISTINCT 和 GROUP BY 返回的结果是相同的。

2.聚合操作的支持

DISTINCT 只是去重，不支持聚合操作。而 GROUP BY 允许对分组后的结果进行聚合操作，例如计算每个部门的员工数量。

示例：

复制

SELECT department, COUNT(*) FROM employees GROUP BY department;1.2.3.

结果：

department

count

Sales

这种情况下，DISTINCT 无法实现同样的效果。

3.性能上的区别

在性能方面，DISTINCT 通常比 GROUP BY 更高效，尤其是在不涉及聚合操作的情况下。DISTINCT 只需要简单地去除重复行，而 GROUP BY 需要对数据进行分组，然后再执行可能的聚合操作。

然而，在数据量较大或需要进行复杂的分组和聚合时，GROUP BY 的效率可能更高，尤其是当数据库优化器能够对 GROUP BY 进行有效优化时。

DISTINCT 和 GROUP BY 的适用场景

1.适用场景

(1) 使用 DISTINCT：示例：查找所有不重复的部门名称：

复制

SELECT DISTINCT department FROM employees;1.2.

当你仅仅需要去除查询结果中的重复行时。当你不需要对结果进行分组或汇总时。

(2) 使用 GROUP BY：示例：查找每个部门的员工数量：

复制

SELECT department, COUNT(*) FROM employees GROUP BY department;1.2.3.

当你需要对结果进行分组，并对每个分组进行聚合操作时。当你需要生成分组的汇总数据时。2.选择 DISTINCT 或 GROUP BY 的依据如果你仅关心去重，且不涉及聚合操作，选择 DISTINCT。如果你需要分组和汇总数据，选择 GROUP BY。

结语

DISTINCT 和 GROUP BY 在 SQL 查询中具有不同的用途和适用场景。DISTINCT 主要用于去除重复行，而 GROUP BY 主要用于分组汇总。在选择使用哪种操作符时，应根据具体的需求进行选择。如果仅需要去重，建议使用 DISTINCT；如果需要进行分组和汇总操作，则应选择 GROUP BY。性能方面，DISTINCT 通常更高效，但在涉及复杂分组和聚合时，GROUP BY 可能更适合。

通过本文的讲解，希望你能更好地理解 DISTINCT 和 GROUP BY 的区别，并在实际开发中正确地应用这两个关键字，以编写出高效且优雅的 SQL 查询。

THE END