工业常见PCB、数码管字符识别难?这个OCR工具你值得拥有!

2022-11-08 13:57:57 浏览数 (1)

背景

我国作为制造业大国,智能制造升级需求旺盛。近年,相关部委围绕智能制造接连推出政策,促进产业向强向优升级。以人工智能、5G、大数据为主的技术在制造升级的过程中扮演关键作用,例如,在智能装备制造的感知层面,以深度学习为基础的目标检测、文字识别、语义分割等技术在工业制造的各场景中应用广泛。

文字识别技术(OCR)在制造业中的应用场景大多分布在产品追溯、智能监控、仓储物流、缺陷检测等,通过算法自动批量完成图片信息中的文字提取,降低企业人力重复手动录入信息的人力成本,增加生产效率。

图1 OCR应用场景全景图

在这些场景中,图片的获取方式往往通过对真实场景拍照,属于自然场景下的文字识别技术,其特点在于文字形态和设备类型涉猎广泛,面临的问题包括:

这些场景属于自然场景下的文字识别技术的应用范畴,图片的获取方式往往通过对真实场景拍照,特点在于文字形态和设备类型涉猎广泛,面临的问题包括:

  • 自然场景下文字形态丰富多样,透视变换、模糊、光照、干扰问题多;
  • 一些场景中设备器材、文字排列类型丰富,对模型泛化性要求高
  • 实际采集数据受限于设备或场景,数据量有限
  • 垂类数据集中缺乏针对性的模型调优技巧

图2 电表场景下的数据出现遮挡、光照不足、类型多样、模糊等问题

解决方案:

飞桨文字识别开发套件PaddleOCR针对自然场景下的OCR任务提供面向产业级的超轻量通用OCR系统PP-OCRv3,经过海量数据训练,达到产业级SOTA效果,在垂类场景中泛化性好。同时,PaddleOCR配套数据合成、标注及22种训练部署方式,打造全流程开发体验,助力产业界快速落地OCR应用。

图3 PP-OCRv3效果动图

图4 PaddleOCR全景图

项目地址:

https://github.com/PaddlePaddle/PaddleOCR

场景1:

PCB质量监控中的小尺度文字识别

印刷电路板(PCB)是电子产品中的核心器件,对于板件质量的测试与监控是生产中必不可少的环节。在一些场景中,通过PCB中信号灯颜色和文字组合可以定位PCB局部模块质量问题,这其中裁剪出的PCB图片宽高比例较小,文字区域整体面积也较小。针对本场景,PaddleOCR基于全新 PP-OCRv3通过合成数据、微调以及其他场景适配方法完成小字符文本识别任务,满足企业上线要求

图5 PCB小尺度文本识别示意图

场景2:

光功率计数码管字符识别

光功率计是测量光纤系统中的光功率仪器,通信公司会留存大量光功率计图片并记录功率计数值。通常,光功率计的字符以数码管形式呈现,与一般文字的形态有所差异。PaddleOCR基于PP-OCRv3的识别模型 和顶会算法SVTR_Tiny分别在本场景数据上进行微调与对比训练,择其最优,最终实现针对数码管字符的识别模型,识别精度满足生产需求。

图6 手持光功率计(左)与OCR识别效果(右)

PaddleOCR项目地址:

Github:https://github.com/PaddlePaddle/PaddleOCR

Gitee:https://gitee.com/PaddlePaddle/PaddleOCR

注:上述图片均来源于网络

0 人点赞