最近,业务方反馈有个别用户信息插入失败,报错提示类似"Incorrect string value:"xF0xA5 ..... " 看这个提示应该是字符集不支持某个生僻字造成的。
下面是在虚拟机里复现的场景:
step1、模拟原始表结构字符集环境:
use test;
CREATE TABLE `t1` (
`id` int(10) NOT NULL AUTO_INCREMENT,
`real_name` varchar(255) CHARACTER SET utf8 DEFAULT '' COMMENT '姓名',
`nick` varchar(100) COLLATE utf8mb4_unicode_ci DEFAULT '' COMMENT '昵称',
PRIMARY KEY (`id`)
) ENGINE=InnoDBAUTO_INCREMENT=10 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci COMMENT='会员卡';
step2、插入生僻字(使用sqlyog模拟):
1、先模拟线上环境,设置下字符集:
2、插入生僻字(生僻字可以参考:http://www.qqxiuzi.cn/zh/hanzi-unicode-bianma.php?zfj=kzb&ks=24E20&js=257E3)
我们尝试插入王(在word里面按住alt,输入152964)。可以看到插入失败了。
step3、修改real_name的字符集:
use test;
alter table t1 change real_name real_name varchar(255) CHARACTER SET utf8mb4 DEFAULT '' COMMENT '姓名' ;
如果是线上大表的话,可以使用pt-osc来处理,命令如下:
pt-online-schema-change -uroot -h localhost --alter=" change real_name real_name varchar(255) CHARACTER SET utf8mb4 DEFAULT '' COMMENT '姓名' " D=test, t=t1 --no-check-replication-filters --alter-foreign-keys-method=auto --recursion-method=none --quiet --charset=utf8mb4 --dry-run
pt-online-schema-change -uroot -h localhost --alter=" change real_name real_name varchar(255) CHARACTER SET utf8mb4 DEFAULT '' COMMENT '姓名' " D=test, t=t1 --no-check-replication-filters --alter-foreign-keys-method=auto --recursion-method=none --quiet --charset=utf8mb4 --execute
step4、再次插入实验:
1、先设置下字符集:
2、再次插入,可以看到插入成功了。
在命令行里面查询也是没有乱码了: