前提
在业务开发中常遇到关联查询使用count()
函数做统计的需求,同样在使用该函数时如果处理不当会导致统计出的数据是真实数据N倍的问题,出现重复问题导致统计不准确。出现该问题的原因是关联查询的主表与关联表关联关系不是一对一
而是一对多
的关系。
demo数据
以本demo为例,owners表表示车主,vehicle表表示车辆,以下为基础建表语句:
代码语言:javascript复制DROP TABLE IF EXISTS `owners`;
CREATE TABLE `owners` (
`id` int NOT NULL AUTO_INCREMENT,
`name` varchar(32) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;
INSERT INTO `owners` VALUES (1, '张三');
INSERT INTO `owners` VALUES (2, '李四');
INSERT INTO `owners` VALUES (3, '王五');
DROP TABLE IF EXISTS `vehicle`;
CREATE TABLE `vehicle` (
`id` int NOT NULL AUTO_INCREMENT,
`brand` varchar(32) DEFAULT NULL,
`owner_id` int DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;
INSERT INTO `vehicle` VALUES (1, '大众', 1);
INSERT INTO `vehicle` VALUES (2, '比亚迪', 2);
INSERT INTO `vehicle` VALUES (3, '奥迪', 1);
INSERT INTO `vehicle` VALUES (4, '大众', 2);
INSERT INTO `vehicle` VALUES (5, '比亚迪', 1);
表关系
车主和车辆的关系为1:N,两表通过own_id关联。
查询语句:
代码语言:javascript复制查询车主的姓名和统计功能。
select o.name,count(o.id)
from owners o
left join vehicle v on v.owner_id = o.id
group by o.id;
查询结果:
张三有三辆车,李四两辆,王五无车,可见统计方法出现了重复统计。
问题出现的原因
MySQL在进行关联查询时,首先扫描主表,以主表为基础数据通过on条件匹配关联表数据。on v.owner_id = o.id
条件会匹配到张三的车辆表3条数据。
解决方案
使用count()
函数同时使用去重DISTINCT
方法去重。
select o.name, count(distinct o.id)
from owners o
left join vehicle v on v.owner_id = o.id
group by o.id;