复工返学的过程中,学生/员工每天都需要上报健康码、行程码。通过问卷/小程序提交数据之后,管理员还需要单独对每天提交的图片进行一一检测,确认是否绿码/是否去过高风险地区等,费时费力。面对这种情况,AI究竟能够怎样帮助审核员高效快捷完成审核工作呢?
健康码行程码
人工审核耗时耗力
防疫工作正当时,为确保复工返学的员工、学校师生的健康安全,企业或学校都需要检查员工或学生及其共同居住人的健康码和行程码。而这一审查的流程相当复杂且消耗人力,我们以学校审核为例:
- 时间紧:8点-10点,家长提交健康码/行程码,10点-12点老师进行审查,且必须在12点前完成审查。
- 任务重:不仅需确认学生健康码,对同住人如父母、兄弟姐妹等人双码信息也需审核确认。一对多的审核机制也加重了审核人本身工作量;
- 数量多:针对上述情况,需要审核的健康码/行程码数量也是指数级上涨;
- 项目繁:需检查码的信息、个人信息、时间等要素
同时在数据采集方面,大多数通过微信管家或钉钉进行收集,对数据的整理工作同样耗时耗力。
那么,是否有一个高效快捷的检验方法来应对这样一个繁重的工作呢?
基于EasyDL的
健康码行程码智能识别
让我们来拆解一下究竟需要审查健康码/行程码哪些信息?
如下图所示(选取特定省份二维码为例),健康码需要审核姓名、身份证号、日期以及健康码颜色;行程码需要审核电话号码、日期、行程码颜色以及到过的城市。
日常审核中,有两类常见问题:
第一种:健康码没有把眼睛睁开,这意味着个人信息显示不全;
第二种:提交的并非当天的健康码,也是不符合审核规范的。
上述情况均需要重新提交审核
根据以上问题,我们可以应用飞桨EasyDL快速找到解决方案。
对于健康码或行程码里的姓名、日期、身份证号,可以使用飞桨EasyDL OCR能力对相关字符及数字进行识别。而关于绿码/黄码/红码颜色辨别则可以使用飞桨EasyDL物体检测模型进行处理。
但现实中会遇到另外一个问题,大家在提交中会将健康码行程码混合。针对双码的混合图像需要使用飞桨EasyDL图像分类进行区分。
综上所述,整体解决方案需要三个环节,如下图所示:
基于EasyDL的整体解决方案
对于支持整个项目而言,需要很长时间的上下游处理。总结整体流程的操作技巧:
- 图像分类方面,可以分类别上传图像,提高效率;
- 物体检测方面,框架与矩形框需要尽量贴合待检测目标;
- OCR识别方面,要充分利用平台的虚拟数据生成功能,同时注意调整数据类型,方便处理。
- 最后,如果使用的是离线数据,在标之后一定要注意格式匹配进行上传。
以上是操作上的几个技巧。
标注格式需要注意
值得提及的是,双码智能识别依赖于EasyDL多样化的功能
- 图像分类:可以将双码分类与颜色检测结合
- 物体检测:可以增加类别、以检测代替分类
- 文字识别:识别多种字体的文字和数字
在这一过程中可以发现飞桨EasyDL的定制功能和拓展性。方案的识别不是唯一的,可以根据目标物的特征进行定制化的模型创建。比如我们刚刚举例的图示为河南省的健康码,它具有「睁眼」「闭眼」的典型特征,所以我们标注出来作为检测的依据。即使换成其他地区、结构不一样的扫码识别都可以很好地处理,只要标注出关键检测点即可。