不可忽视的PHP数据精度损失问题

2021-02-05 11:00:00 浏览数 (1)

我是架构精进之路,点击上方“关注”,坚持每天为你分享技术干货,私信我回复“01”,送你一份程序员成长进阶大礼包。

不知大家在开发过程中有没有常常会遇到数据精度问题呢,类似下面这样的:

代码语言:javascript复制
<?php
$a = 0.57;
echo intval(floatval($a) * 100);
预期输出结果57,实则56。结果可能有点出乎你的意外。


那就会有个疑问?为啥实际输出与预期会存在不同呢?这是PHP语言的bug么?

首先我们要知道浮点数的表示(IEEE 754):

浮点数, 以64位的长度(双精度)为例,会采用1位符号位(E),11指数位(Q),52位尾数(M)表示(一共64位)

  • 符号位:最高位表示数据的正负,0表示正数,1表示负数;
  • 指数位:表示数据以2为底的幂,指数采用偏移码表示;
  • 尾数:表示数据小数点后的有效数字。

看来问题的关键点就在于:小数的二进制表示可能是个无限循环小数

我们来看看小数用二进制怎么表示:

乘2取整,顺序排列,即将小数部分乘以2,然后取整数部分,剩下的小数部分继续乘以2,然后取整数部分,剩下的小数部分又乘以2,一直取到小数部分,但是像0.57这样的小数像这样一直乘下去,小数部分不可能为0.有效位的小数用二进制表示却是无穷的。

0.57的二进制表示基本上(52位)是: 0010001111010111000010100011110101110000101000111101

如果只有52位的话,0.57 =》 0.56999999999999995

那这样*100之后,再intval一下, 自然就是56了….

这样,就引出了另一个关键的问题:舍入

对于二进制,待处理部分有没有达到前一位的一半,达到就进位,没达到就舍去。(暂且当作 0 舍 1 入)

双精度浮点数能表示多少精度呢?

  • 半精度(16bit):11 位有效数字
  • 单精度(32bit):24 位有效数字
  • 双精度(64bit):53 位有效数字
  • 四精度(128bit):113 位有效数字

可见, 这个问题的关键点就是: 你看似有穷的小数, 在计算机的二进制表示里却是无穷的

那我们应该如何解决呢?

对于高精度数据操作,建议使用以下函数:

  • bcadd — 将两个高精度数字相加
  • bccomp — 比较两个高精度数字,返回-1, 0, 1
  • bcdiv — 将两个高精度数字相除
  • bcmod — 求高精度数字余数
  • bcmul — 将两个高精度数字相乘
  • bcpow — 求高精度数字乘方
  • bcpowmod — 求高精度数字乘方求模,数论里非常常用
  • bcscale — 配置默认小数点位数,相当于就是Linux bc中的”scale=”
  • bcsqrt — 求高精度数字平方根
  • bcsub — 将两个高精度数字相减

- END -


作者:架构精进之路,专注软件架构研究,技术学习与个人成长,关注并私信我回复“01”,送你一份程序员成长进阶大礼包。


0 人点赞