MySQL关联查询 COUNT数据不准确

2022-10-28 17:06:21 浏览数 (1)

前提

在业务开发中常遇到关联查询使用count()函数做统计的需求,同样在使用该函数时如果处理不当会导致统计出的数据是真实数据N倍的问题,出现重复问题导致统计不准确。出现该问题的原因是关联查询的主表与关联表关联关系不是一对一而是一对多的关系。

demo数据

以本demo为例,owners表表示车主,vehicle表表示车辆,以下为基础建表语句:

代码语言:javascript复制
DROP TABLE IF EXISTS `owners`;
CREATE TABLE `owners` (
  `id` int NOT NULL AUTO_INCREMENT,
  `name` varchar(32) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;

INSERT INTO `owners` VALUES (1, '张三');
INSERT INTO `owners` VALUES (2, '李四');
INSERT INTO `owners` VALUES (3, '王五');

DROP TABLE IF EXISTS `vehicle`;
CREATE TABLE `vehicle` (
  `id` int NOT NULL AUTO_INCREMENT,
  `brand` varchar(32) DEFAULT NULL,
  `owner_id` int DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;

INSERT INTO `vehicle` VALUES (1, '大众', 1);
INSERT INTO `vehicle` VALUES (2, '比亚迪', 2);
INSERT INTO `vehicle` VALUES (3, '奥迪', 1);
INSERT INTO `vehicle` VALUES (4, '大众', 2);
INSERT INTO `vehicle` VALUES (5, '比亚迪', 1);
表关系

车主和车辆的关系为1:N,两表通过own_id关联。

查询语句:

查询车主的姓名和统计功能。

代码语言:javascript复制
select o.name,count(o.id)
from owners o
         left join vehicle v on v.owner_id = o.id
group by o.id;

查询结果:

张三有三辆车,李四两辆,王五无车,可见统计方法出现了重复统计。

问题出现的原因

MySQL在进行关联查询时,首先扫描主表,以主表为基础数据通过on条件匹配关联表数据。on v.owner_id = o.id条件会匹配到张三的车辆表3条数据。

解决方案

使用count()函数同时使用去重DISTINCT方法去重。

代码语言:javascript复制
select o.name, count(distinct o.id)
from owners o
         left join vehicle v on v.owner_id = o.id
group by o.id;

0 人点赞