在写SQL时,经常灵活运用一些SQL语句编写的技巧,可以大大简化程序逻辑。减少程序与数据库的交互次数,有利于数据库高可用性,同时也能显得你的SQL很牛B,让同事们眼前一亮。
目录
实用的SQL
1.插入或替换
2.插入或更新
3.插入或忽略
4.SQL中的if-else判断语句
5.指定数据快照或备份
6.写入查询结果集
7.强制使用指定索引
心得体会:
(续)评论区问题反馈
@当年经理的SQL
@修改后最终版SQL
@最终版SQL原理
高能预警,这是一篇干货满满的MySQL技术文章,总有一天,你必然会用到,记得收藏! -- 来自一位被技术经理毒打多年的程序员的忠告
实用的SQL
1.插入或替换
如果我们想插入一条新记录(INSERT),但如果记录已经存在,就先删除原记录,再插入新记录。
- 情景示例:这张表存的每个客户最近一次交易订单信息,要求保证单个用户数据不重复录入,且执行效率最高,与数据库交互最少,支撑数据库的高可用。
此时,可以使用"REPLACE INTO"语句,这样就不必先查询,再决定是否先删除再插入。
"REPLACE INTO"语句是基于唯一索引或主键来判断唯一(是否存在)的。 "REPLACE INTO"语句是基于唯一索引或主键来判断唯一(是否存在)的。 "REPLACE INTO"语句是基于唯一索引或主键来判断唯一(是否存在)的。
注意事项:如下SQL所示,需要在username字段上建立唯一索引(Unique),transId设置自增即可。
代码语言:javascript复制-- 20点充值
REPLACE INTO last_transaction (transId,username,amount,trans_time,remark)
VALUES (null, 'chenhaha', 30, '2020-06-11 20:00:20', '会员充值');
-- 21点买皮肤
REPLACE INTO last_transaction (transId,username,amount,trans_time,remark)
VALUES (null, 'chenhaha', 100, '2020-06-11 21:00:00', '购买盲僧至高之拳皮肤');
若username='chenhaha'的记录不存在,REPLACE语句将插入新记录(首次充值),否则,当前username='chenhaha'的记录将被删除,然后再插入新记录。
id不要给具体值,不然会影响SQL执行,业务有特殊需求除外。
2.插入或更新
如果我们希望插入一条新记录(INSERT),但如果记录已经存在,就更新该记录,此时,可以使用"INSERT INTO ... ON DUPLICATE KEY UPDATE ..."语句:
- 情景示例:这张表存了用户历史充值金额,如果第一次充值就新增一条数据,如果该用户充值过就累加历史充值金额,需要保证单个用户数据不重复录入。
这时可以使用"INSERT INTO ... ON DUPLICATE KEY UPDATE ..."语句。
代码语言:javascript复制注意事项:同上,"INSERT INTO ... ON DUPLICATE KEY UPDATE ..."语句是基于唯一索引或主键来判断唯一(是否存在)的。如下SQL所示,需要在username字段上建立唯一索引(Unique),transId设置自增即可。
-- 用户陈哈哈充值了30元买会员
INSERT INTO total_transaction (t_transId,username,total_amount,last_transTime,last_remark)
VALUES (null, 'chenhaha', 30, '2020-06-11 20:00:20', '充会员')
ON DUPLICATE KEY UPDATE total_amount=total_amount 30, last_transTime='2020-06-11 20:00:20', last_remark ='充会员';
-- 用户陈哈哈充值了100元买瞎子至高之拳皮肤
INSERT INTO total_transaction (t_transId,username,total_amount,last_transTime,last_remark)
VALUES (null, 'chenhaha', 100, '2020-06-11 20:00:20', '购买盲僧至高之拳皮肤')
ON DUPLICATE KEY UPDATE total_amount=total_amount 100, last_transTime='2020-06-11 21:00:00', last_remark ='购买盲僧至高之拳皮肤';
若username='chenhaha'的记录不存在,INSERT语句将插入新记录,否则,当前username='chenhaha'的记录将被更新,更新的字段由UPDATE指定。
3.插入或忽略
如果我们希望插入一条新记录(INSERT),但如果记录已经存在,就啥事也不干直接忽略,此时,可以使用INSERT IGNORE INTO ...语句:情景很多,不再举例赘述。
代码语言:javascript复制注意事项:同上,"INSERT IGNORE INTO ..."语句是基于唯一索引或主键来判断唯一(是否存在)的,需要在username字段上建立唯一索引(Unique),transId设置自增即可。
-- 用户首次添加
INSERT IGNORE INTO users_info (id, username, sex, age ,balance, create_time)
VALUES (null, 'chenhaha', '男', 12, 0, '2020-06-11 20:00:20');
-- 二次添加,直接忽略
INSERT IGNORE INTO users_info (id, username, sex, age ,balance, create_time)
VALUES (null, 'chenhaha', '男', 12, 0, '2020-06-11 21:00:20');
若username='chenhaha'的记录不存在,INSERT语句将插入新记录,否则,不执行任何操作。
4.SQL中的if-else判断语句
众所周知,if-else判断在任何地方都很有用,在SQL语句中,"CASE WHEN ... THEN ... ELSE ... END"语句可以用在增删改查各类语句中。
- 给个情景:妇女节大回馈,2020年注册的新用户,所有成年女性账号送10元红包,其他用户送5元红包,自动充值。
示例语句如下:
代码语言:javascript复制-- 送红包语句
UPDATE users_info u
SET u.balance = CASE WHEN u.sex ='女' and u.age > 18 THEN u.balance 10
ELSE u.balance 5 end
WHERE u.create_time >= '2020-01-01'
- 情景2:有个学生高考分数表,需要将等级列出来,650分以上是重点大学,600-650是一本,500-600分是二本,400-500是三本,400以下大专;
原测试数据如下:
查询语句:
代码语言:javascript复制SELECT *,case when total_score >= 650 THEN '重点大学'
when total_score >= 600 and total_score <650 THEN '一本'
when total_score >= 500 and total_score <600 THEN '二本'
when total_score >= 400 and total_score <500 THEN '三本'
else '大专' end as status_student
from student_score;
5.指定数据快照或备份
如果想要对一个表进行快照,即复制一份当前表的数据到一个新表,可以结合CREATE TABLE和SELECT:
代码语言:javascript复制-- 对class_id=1(一班)的记录进行快照,并存储为新表students_of_class1:
CREATE TABLE students_of_class1 SELECT * FROM student WHERE class_id=1;
新创建的表结构和SELECT使用的表结构完全一致。
6.写入查询结果集
如果查询结果集需要写入到表中,可以结合INSERT和SELECT,将SELECT语句的结果集直接插入到指定表中。
例如,创建一个统计成绩的表statistics,记录各班的平均成绩:
代码语言:javascript复制CREATE TABLE statistics (
id BIGINT NOT NULL AUTO_INCREMENT,
class_id BIGINT NOT NULL,
average DOUBLE NOT NULL,
PRIMARY KEY (id)
);
然后,我们就可以用一条语句写入各班的平均成绩:
代码语言:javascript复制INSERT INTO statistics (class_id, average) SELECT class_id, AVG(score) FROM students GROUP BY class_id;
确保INSERT语句的列和SELECT语句的列能一一对应,就可以在statistics表中直接保存查询的结果:
代码语言:javascript复制SELECT * FROM statistics;
代码语言:javascript复制 ---- ---------- --------------
| id | class_id | average |
---- ---------- --------------
| 1 | 1 | 475.5 |
| 2 | 2 | 473.33333333 |
| 3 | 3 | 488.66666666 |
---- ---------- --------------
3 rows in set (0.00 sec)
7.强制使用指定索引
在查询的时候,数据库系统会自动分析查询语句,并选择一个最合适的索引。但是很多时候,数据库系统的查询优化器并不一定总是能使用最优索引。如果我们知道如何选择索引,可以使用FORCE INDEX强制查询使用指定的索引。例如:
代码语言:javascript复制SELECT * FROM students FORCE INDEX (idx_class_id) WHERE class_id = 1 ORDER BY id DESC;
指定索引的前提是索引idx_class_id必须存在。
心得体会:
记得那一年,我还是个孩子,记得第一个需求是做个统计接口,查询近两小时每隔5分钟为一时间段的网站访问量,JSONArray中一共返回24个值,当时菜啊,写了个接口循环二十四遍,发送24条SQL去查(捂脸),由于那个接口,被技术经理嘲讽~~表示他写的SQL比我吃的米都多。虽然我们山东人基本不吃米饭,但我还是羞愧不已。。
然后经理通过调用一个dateTime函数分组查询处理一下,就ok了,效率是我的几十倍吧。从那时起,我就定下目标,深入MySQL学习,日后争取嘲讽回去~~~
------------------------------------------------------------- 华丽的分割线 ---------------------------------------------------------
(续)评论区问题反馈
这一周有好几个朋友在评论区评论或私信我,问我当年那条SQL是咋写的,经理是咋写的。。看大家对知识的热情这么高,我必须得开源一下了,在这贴出来当时的SQL。有个点声明,项目数据库在内网不好测试,我就模拟了一张表来给大家统计一下吧。
需求回顾:时间就'2020-01-14 00:00:00' - '2020-01-15 00:00:00' 为准,统计当天以每10分钟为间隔的分组数据。
@当年经理的SQL
其中时间根据需求自行修改,由于我只生成了一天的测试数据,我就以此为例。
代码语言:javascript复制SELECT DATE_FORMAT(p.createTime, '%H') as date_str,count(*) as count
from data_timing p
where DATE_FORMAT(p.createTime, '%Y-%m-%d %H:%i:%S') >= DATE_FORMAT('2020-01-14 00:00:00', '%Y-%m-%d %H:%i:%S')
AND DATE_FORMAT(p.createTime, '%Y-%m-%d %H:%i:%S') < DATE_FORMAT('2020-01-15 00:00:00', '%Y-%m-%d %H:%i:%S')
GROUP BY HOUR(p.createTime)
经理这条SQL查询的结果如下,基本保留了当年原版~~这条的意思是取“2020-01-14”这天24小时每小时的count。当时我很有启发,也很有感觉,发现SQL还能这么玩儿。完事儿写完他说就要撤了,说要去接孩子。我说:“大佬,咱别吃饭吃一半儿啊,再给我来一下子呗”。
@修改后最终版SQL
然后经过我后续修改SQL如下:
代码语言:javascript复制SELECT concat( date_format( p.createTime, '%Y-%m-%d %H:' ) , floor( date_format( p.createTime, '%i' ) /10 )*10 ) as date_str
, count(*) as count from data_timing p
where DATE_FORMAT(p.createTime, '%Y-%m-%d %H:%i:%S') < DATE_FORMAT('2020-01-15 00:00:00', '%Y-%m-%d %H:%i:%S')
AND DATE_FORMAT(p.createTime, '%Y-%m-%d %H:%i:%S') >= DATE_FORMAT('2020-01-14 00:00:00', '%Y-%m-%d %H:%i:%S')
GROUP BY concat( date_format( p.createTime, '%Y-%m-%d %H:' ) , floor( date_format( p.createTime, '%i' ) /10 ))
乍一看是不是还挺复杂,并不是多复杂,只是其中几个函数内容比较多。。比如concat()里的那一堆,以及date_format那些。先看结果吧。后面跟各位说一下查询原理:
@最终版SQL原理
如上所述,是每隔10分钟为一个时间段,当时只能想到了以每分钟为时间段分组的SQL,如下。
代码语言:javascript复制SELECT concat( date_format( p.createTime, '%Y-%m-%d %H:' ) , floor( date_format( p.createTime, '%i' ) )) as date_str
, count(*) as count from data_timing p
where DATE_FORMAT(p.createTime, '%Y-%m-%d %H:%i:%S') < DATE_FORMAT('2020-01-15 00:00:00', '%Y-%m-%d %H:%i:%S')
AND DATE_FORMAT(p.createTime, '%Y-%m-%d %H:%i:%S') >= DATE_FORMAT('2020-01-14 00:00:00', '%Y-%m-%d %H:%i:%S')
GROUP BY MINUTE(p.createTime)
查询结果:
那我怎么以10分钟为单位呢??网上各种查,网上虚的太多。也没有找到真正有用的写法,这不是坑爹吗,后来我想了想。想到了个好主意,每10分钟的特征在于“yyyy-MM-dd HH:m”这里,如果我将“10分钟”级为单位的字符串切分出来,不管“1分钟”级的。不就能分组匹配了么,哎呀我tm真是有点佩服我自己。
因此,按每分钟分组的SQL和上面按10分钟分组的SQL不同之处就在这里:
group by concat( date_format( p.createTime, '%Y-%m-%d %H:' ) , floor( date_format( p.createTime, '%i' ) /10 ) )
我将分钟'%i'除以10然后向下取整,再进行group by 分组,最后展示的时候我可以在处理一下加“ *10 ”用于展示,当然,也可以不用“*10 ”,结果如下,有点畸形,看着难受,但不妨碍使用。
好了,答应各位的已经搞定啦。有细心的小伙伴会发现,咦,你这数据中,如果没查到为0的怎么不显示呢?比如凌晨1点多的,都没有显示。这样岂不是还得后台处理补全?这个问题留给大家,如果有好的方法可以在评论区留言,我会随时关注老铁们的动态的~~