很多小知识点,我以为自己懂了,实际没搞透。
数据库字段允许空值(null)的问题,你遇到过吗?
在验证问题之前,我们先建一张测试表及测试数据。
构建的测试数据,如下图所示:
有了上面的表及数据之后,我们就来看当列中存在 NULL 值时,究竟会导致哪些问题?
1.count 数据丢失
我们都知道,count是用来计数的,当表中某个字段存在NULL 值时,就会造成count计算出来的数据丢失,如下 SQL 所示:
查询执行结果如下:
从上述结果可以看出,count(*)和count(name)的值不一样,即当使用的是 count(name) 查询时,就丢失了两条值为 NULL 的数据。
解决方案
如果某列存在 NULL 值时,就是用 count(*) 进行数据统计。
扩展知识:不要使用 count(常量)
说明:count(*) 会统计值为 NULL 的行,而 count(列名) 不会统计此列为 NULL 值的行。
2.distinct 数据丢失
当使用语句count(distinct column1,column2)时,如果有一个字段值为空,即使另一列有不同的值,那么查询的结果也会将数据丢失, SQL如下所示:
查询执行结果如下:
数据库的原始数据如下:
从上述图所示,mobile列的10条数据都是不一样,但是查询的结果却只有8条。
3.select 数据丢失
如果某列存在 NULL 值时,如果执行非等于查询(<>或者!=)会导致为 NULL 值的结果丢失,比如下面的这些数据:
当我们查询name不等于"Java"的所有数据时,预期结果应该是id从2到10的数据,但是执行以下sql查询时:
查询结果如下所示:
可以看出id=9和id=10的name为 NULL 的两条数据没有查询出来,这个结果并不符合我们的正常预期。
解决方案
要解决以上的问题,只要修改条件,将姓名不等于Java或者是空值的查出来即可,执行 SQL 如下:
执行结果如下:
可以看出10条数据都查询出来了,这个结果符合我们的正常预期。
4.导致空指针异常
当我们使用一些函数,比如求和函数sum(column) 或者平均值之类的函数,如果所求的字段中有空值,所求的值就会为空而非0。
如果 sum 查询的结果为 NULL 就可以能会导致程序执行时空指针异常(NPE),我们来演示一下这个问题。
为了演示这个问题,首先我们先构建一张表和一些测试数据:
表中原始数据如下:
接下来我们使用 sum 查询,执行以下 SQL:
查询执行结果如下:
当查询的结果为 NULL 而非 0 时,就可以导致空指针异常。
解决空指针异常
可以使用ifnull()对空值进行处理来避免空指针异常:
查询执行结果如下:
5.增加了查询难度
当字段中有了空值,对于null值或者非null值的查询难度就增加了,必须使用与null匹配的查询方法,比如IS NULL或者IS NOT NULL又或者是IFNULL(cloumn)这样的表达式进行查询,传统的 =、!=、<>...这些表达式就不能使用了,这就增加了查询的难度。
还是以 person 表为例,它的原始数据如下:
错误用法 1:
执行结果为空,并没有查询到任何数据,如下图所示:
错误用法 2:
执行结果也为空,没有查询到任何数据,如下图所示:
正确用法 1:
执行结果如下:
正确用法 2:
执行结果如下:
推荐用法
阿里巴巴《Java开发手册》推荐我们使用 ISNULL(cloumn) 来判断 NULL 值,原因是在 SQL 语句中,如果在 null 前换行,影响可读性;而 ISNULL(column) 是一个整体,简洁易懂。从性能数据上分析 ISNULL(column) 执行效率也更快一些。
总结
本文我们讲了当某列为 NULL 时可能会导致的 5 种问题:丢失查询结果、导致空指针异常和增加了查询的难度。因此在最后提倡大家在创建表的时候尽量设置 is not null的约束,如果某列确实没有值,可以设置空值('')或 0 作为其默认值。