【面试题】
有一张“电话费用表”,包含3个字段:电话号码(8位数)、月份、月消费。
其中,月消费为0表明该月没有产生费用。第一行数据含义:电话号码(64262631)在月份(2017年11月)产生的月消费(30.6元的话费)。
【问题一】查找2017年以来(截止到10月31日)所有四位尾数符合AABB或者ABAB或者AAAA的电话号码(A、B分别代表1-9中任意的一个数字)
【问题二】删除“电话费用表”中10月份出现的重复数据。
【解题步骤】
问题1:复杂查询
用逻辑树分析方法,把问题一拆解为下面的子问题,也就是我们要找到符合以下条件的电话号码:
1)条件一:电话费用表中201701至201710的电话号码;
2)条件二:电话号码四位尾数全部是1-9中任意的一个数字;
3)条件三:电话号码四位尾数符合AABB或ABAB或AAAA三种格式。
所以,先获取符合条件一的电话号码,同时分别取出电话号码的四位尾数,用于下一步判断。
这里会用到一个字符串截取的函数:substr(),用法如下:
运行SQL语句,获得查询结果(“中间结果一”):
在“中间结果一”的基础上(也就是把上面查询结果作为子查询),进行条件二(电话号码四位尾数全部是1-9中任意的一个数字)
条件三的判断(电话号码四位尾数符合AABB或ABAB或AAAA三种格式),也就是AABB格式是第5位数 = 第6位数 and 第7位数 = 第8位数,ABAB格式是第5位数 = 第7位数 and 第6位数 = 第8位数,AAAA格式是第5、6、7、8位数一样,这种情况包括在了前面两种格式中。
把条件三的判断加入上面SQL中
最终SQL如下:
运行SQL语句,获得“最终结果”:
问题2:删除重复数据
【问题二】的删除重复值是数据清洗中常用的技能。
1.查询出重复数据
可以看之前写过的《如何查找重复数据?》,本案例查询重复数据SQL如下
2.删除重复数据
删除数据用delete语句。
【本题考点】
1.考查对子查询的掌握程度
2.考查对分组汇总的掌握程度
3.考察删表、建表、从表中删除数据等技能的掌握程度