在多数组织的智能自动化流程业务中,OCR(光学字符识别)是目前应用最多的人工智能技术之一。OCR与RPA的结合可以将组织中超过70%的无纸化业务实现自动化,其效率将是人工的5倍以上。
OCR运行原理
OCR是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机数据的过程。
针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、产品的稳定性、易用性等。
OCR擅长对非结构化数据进行处理。非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、XML,HTML、各类报表、图像和音频/视频信息等等。
搭载OCR的RPA工作原理
1、用户收到一封带有图片的电子邮件;
2、RPA机器人自动阅读电子邮件;
3、对图片进行分类并选择模板;
4、通过OCR对分类的图片进行数据识别和提取;
5、RPA机器人接收OCR转化后的结构化数据;
6、进行数据校审确认;
7、自动将结构化数据放置或录入到指定位置;
8、存储所有结构化数据,并向用户发送一封通知邮件,确认所有工作完毕。
目前全球的RPA软件厂商正在通过与不同的人工智能技术相结合,来提升竞争力赢得市场。而OCR在频率、业务范围、以及对业务影响上都领先于其他技术。通过OCR来处理那些非结构化业务,也使得RPA机器人流程自动化应用的范围可以扩展到更多的领域中。
搭载OCR的RPA机器人主要用于简化纸质业务并将其转化成数字化业务,例如:PDF、扫描文件、传真和手写文档等。其适用的行业包括:金融业(员工入职、客户开户、贷款申请、数据校审等)、制造业(订单处理、汇款、仓库盘点等)、人力资源(员工入职、筛选简历、人力资源记录处理等)、供应链管理(订单和货运跟踪、提货单、货物订单等)。