【玩转腾讯云】使用API快速构建文字识别小工具之唐诗识别

2020-04-08 15:14:45 浏览数 (1)

腾讯云—腾讯倾力打造的云计算品牌,以卓越科技能力助力各行各业数字化转型,为全球客户提供领先的云计算、大数据、人工智能服务,以及定制化行业解决方案。具体包括云服务器、云存储、云数据库和弹性web引擎等基础云服务;腾讯云分析(MTA)、腾讯云推送(信鸽)等腾讯整体大数据能力;以及 QQ互联、QQ空间、微云、微社区等云端链接社交体系。

本期推文中使用到的是腾讯云的通用文字识别服务(OCR)

(General Optical Character Recognition,General OCR)

通用文字识别是基于行业前沿的深度学习技术,提供通用印刷体识别、通用印刷体识别(高精度版)、通用手写体识别、英文识别等多种服务,支持将图片上的文字内容,智能识别为可编辑的文本,可应用于随手拍扫描、纸质文档电子化、电商广告审核等多种场景,大幅提升信息处理效率。

使用API快速构建文字识别小工具(一)

实现唐诗识别脚本工具的开发背景

本文中利用的是[腾讯云]通用文字识别(OCR)的通用印刷识别服务。

通用印刷识别服务分为普通版,高精度版,精简版,高速版。不同版本对应的精确度,性能,价格也均不同,适用于不同行业的业务需求。

本文使用的是通用印刷识别服务的[高精度版]

实现唐诗识别脚本工具

基本流程

1.电脑本地安装Python3和PiP环境。

2.安装腾讯云的tencentcloud-sdk-python。

3.API Explorer调试并拷贝Python代码。

4.格式化输出结果。

5.执行命令验证操作。

1

电脑本地确认安装Python3和PiP环境

Python3.7.3确认安装

一般安装了Python3后也会相应的配套安装PiP环境

PiP环境确认安装

2

安装腾讯云的tencentcloud-sdk-python

进入腾讯云官网,选择上方菜单栏中的文档

点击进入SDK中心

点击Python进入网页

根据安装步骤进行安装,建议选择通过源码包方式安装

tencentcloud-sdk-python确认完成安装

3

API Explorer调试并拷贝Python代码

腾讯云控制台->搜索访问管理->API密钥管理->生成并获取密钥

云产品->文字识别->通用文字识别

开通通用印刷体识别(高精度版)->开通之后选择接口文档

选择右侧的API Explorer

点击API 3.0 Explorer进入工作台

在个人密钥处填写之前获取的API密钥,Region选择为自己就近的一个区域

在ImageUrl处粘贴网上图片的地址

即可自动生成Python代码

复制代码至本地IDE中即可完美运行代码,但是有很多我们不需要的内容,我们需要对结果进行处理

4

格式化输出结果

添加json库

代码语言:javascript复制
# 源代码 print(resp.to_json_string())

# 添加的代码

    peom = json.loads(resp.to_json_string())
    for peomLine in peom['TextDetections']:
        print(peomLine['DetectedText'])

做如上的代码修改

5

执行代码运行

二者进行比较

从结果来看,图片中的文字已经完美识别出,虽然图片太过于模糊,但是[腾讯云]的通用文字识别服务仍然很准确无误的识别出来了图中的文字!

不得不感叹[腾讯云]的强大处理能力和与之散发出来的产品魅力!

0 人点赞