Hash表与素数

2022-08-19 08:00:46 浏览数 (3)

最近看到mysql的hash表,发现一个特点。 当hash表满的时候,hash表size总是扩展成一个素数。 上网查了一下资料,素数可以有效的减少hash冲突。 想了一下,这个确实是有道理的。

假设hash表大小为size,这是一个合数,即有size=a*n。当有hash值为hashcode,且hashcode = b*n. 则hashcode取模之后为 hashcode = hashcode%size = hashcode - (hashcode / size) * size = hashcode - (b/a) * size 因为a是固定的,那么上面的hashcode的取值只有b种可能,这样显然会增加冲突的概率。

1 人点赞