MySQL8.0.18在上个月已经正式发布了,令人兴奋的是带来了Hash Join,今天体验一下Hash Join是否能带来性能上的提升。
我的测试比较简单,下载一个8.0.18版本的mysql到CentOS7上面,解压安装后直接导入样本数据库world_x。选择使用里面的city表来测试一下。首先看一下表定义:
接下来看一下表里面有多少数据:
稍微少了点,试试看。
接下来创建一个和city一摸一样的表city_clone
然后向里面插入数据:
知道为什么没有直接使用 create table city_clone as select * from city;吗?因为开启GTID不允许使用CREATE TABLE ... SELECT
语句。
好了,准备就绪,接下来准备执行:
select count(*) from city join city_clone on city.name=city_clone.name;
注意:目前hash join只能用于非索引列的 inner join 查询,因此选择使用name字段。
首先看一下执行计划:
看到了吗,使用format=tree可以看到是否使用hash join。实际执行一下:
结果出来的很快,数据太少了,有可能对比不出效果啊......,接下来看一下不使用hash join的效果,通过优化器提示,强制优化器不使用hash join
1.02秒,对比还是挺明显的。在没加索引的字段上进行 inner join 查询hash join 优势明显。
接下来给name字段加上索引,看看优化器会怎么执行
优化器在加上索引后依旧执行NLJ,执行的结果如下:
简单的体验到此结束,感兴趣的朋友可以在自己的真实场景下,体验一下巨大的差异,希望hash join能够解决一部分场景下的性能问题。
感谢关注MySQL!