腾讯云—腾讯倾力打造的云计算品牌,以卓越科技能力助力各行各业数字化转型,为全球客户提供领先的云计算、大数据、人工智能服务,以及定制化行业解决方案。具体包括云服务器、云存储、云数据库和弹性web引擎等基础云服务;腾讯云分析(MTA)、腾讯云推送(信鸽)等腾讯整体大数据能力;以及 QQ互联、QQ空间、微云、微社区等云端链接社交体系。
本期推文中使用到的是腾讯云的通用文字识别服务(OCR)
(General Optical Character Recognition,General OCR)
通用文字识别是基于行业前沿的深度学习技术,提供通用印刷体识别、通用印刷体识别(高精度版)、通用手写体识别、英文识别等多种服务,支持将图片上的文字内容,智能识别为可编辑的文本,可应用于随手拍扫描、纸质文档电子化、电商广告审核等多种场景,大幅提升信息处理效率。
使用API快速构建文字识别小工具(一)
实现唐诗识别脚本工具的开发背景
本文中利用的是[腾讯云]通用文字识别(OCR)的通用印刷识别服务。
通用印刷识别服务分为普通版,高精度版,精简版,高速版。不同版本对应的精确度,性能,价格也均不同,适用于不同行业的业务需求。
本文使用的是通用印刷识别服务的[高精度版]。
实现唐诗识别脚本工具
基本流程
1.电脑本地安装Python3和PiP环境。
2.安装腾讯云的tencentcloud-sdk-python。
3.API Explorer调试并拷贝Python代码。
4.格式化输出结果。
5.执行命令验证操作。
1
电脑本地确认安装Python3和PiP环境
Python3.7.3确认安装
一般安装了Python3后也会相应的配套安装PiP环境
PiP环境确认安装
2
安装腾讯云的tencentcloud-sdk-python
进入腾讯云官网,选择上方菜单栏中的文档
点击进入SDK中心
点击Python进入网页
根据安装步骤进行安装,建议选择通过源码包方式安装
tencentcloud-sdk-python确认完成安装
3
API Explorer调试并拷贝Python代码
腾讯云控制台->搜索访问管理->API密钥管理->生成并获取密钥
云产品->文字识别->通用文字识别
开通通用印刷体识别(高精度版)->开通之后选择接口文档
选择右侧的API Explorer
点击API 3.0 Explorer进入工作台
在个人密钥处填写之前获取的API密钥,Region选择为自己就近的一个区域
在ImageUrl处粘贴网上图片的地址
即可自动生成Python代码
复制代码至本地IDE中即可完美运行代码,但是有很多我们不需要的内容,我们需要对结果进行处理
4
格式化输出结果
添加json库
代码语言:javascript复制# 源代码 print(resp.to_json_string())
# 添加的代码
peom = json.loads(resp.to_json_string())
for peomLine in peom['TextDetections']:
print(peomLine['DetectedText'])
做如上的代码修改
5
执行代码运行
二者进行比较
从结果来看,图片中的文字已经完美识别出,虽然图片太过于模糊,但是[腾讯云]的通用文字识别服务仍然很准确无误的识别出来了图中的文字!
不得不感叹[腾讯云]的强大处理能力和与之散发出来的产品魅力!