一、背景
今天技术交流群里,段段同学提了一个不错的问题。
描述如下:
假设一条记录包含以下信息:(id,username,score,version),score每次变更,version就加1,对于username相同的数据,只有version最大的那一条是有效的,也就是Mysql按字段分组取最大值记录问题,怎么做才能使查询效率高呢
存在的问题:
加 version 之后查询最新的用子查询效率不高;
建个额外的表记录id 和 version 然后联查,这种做法怪怪的,显然效率也不够高。
二、 讨论出几个方案
2.1 加标记
方案1:加上标记字段,标记是否为最新记录,这样单独查历史还是查询所有最新记录都可以。
不符合单一职责原则,一个表表达两种含义,一个是订单记录,一个是订单历史。
2.2 方案2:加历史表
方案2:新增订单历史表,记录带版本号的记录,另外还是维护一张主表用于查询最新的记录。
这样两种含义的记录分开维护,逻辑更清晰。
数据有一定的冗余,但是思路清晰。
2.3 方案3 用 HBase
方案3:订单表存到 HBase里,默认查出最新的一条,可以根据版本号查询所有,而且数据量大也没压力(不需要去做分库分表)。
问题是引入了新的中间件。
采用第二种方案。
三、方法比结果更重要,授人以鱼不如授人以渔
我们知道了上面的方案还不够,通过这个讨论,我们学到了什么,对我们以后有啥帮助?
下面总结几点:
1 事出诡异必有妖,即如果发现一个方案很复杂,很奇怪,估计设计出了问题。
2 将未知问题转化为已知问题是常见解决问题的方法。可以将该问题转化为“标记删除”问题,就简单多了。
3 仅仅设计出实现功能的方案还不够,要考虑是否便于维护,便于拓展,方便测试等。
4 设计方案就是不断地取舍的过程,空间换时间也是常见的性能优化思路,适当的数据冗余有时候也很有必要。
最后欢迎大家探讨工作中遇到的难点,分享工作中遇到的坑,共同进步。
另外,如果大家有更好的方案和建议,欢迎留言讨论。
全面讲解性能优化的文章:https://cloud.tencent.com/developer/article/1870119
创作不易,如果本文对你有帮助,欢迎关注、点赞、评论,你的鼓励是我创作的最大动力。