昨天菜鸟小白的分享——将图片中的文字提取出来,有不少小伙伴也都私信我,对我表示肯定,更是有小伙伴希望我将昨天的代码做成和之前一样的可执行文件。本来我是以为将整个程序完善了之后再打包为可执行文件的,既然已经有小伙伴私信要求了,那我就直接将这个打包了。公众号上私信回复“文字识别可执行文件”即可获取。
粉丝问题解答
有小伙伴拿了我之前图片漫画的程序,执行后出现如下报错
菜鸟小白看到后其实只能分析出这个应该是权限问题,首先我会先去查API文档中关于错误码的部分
确实就是权限问题,但是这个还是没有给出我们解决方案,这个时候就需要我们去搜索了。我当时搜到这样一个文章,文章中是这样说的,遇到这样的问题是因为我们创建的应用API没有对应的权限,需要在应用中勾选上我们需要的API接口权限,然后向百度AI开放平台客服提工单开放对应权限即可。
最终通过这样的方式我解决了这个问题,那个私信我的小伙伴,你现在是否清楚了呢。
今日编码分析
今天我就将今天的代码改编做一下说明吧。首先我新增了参数获取函数,用于存放AK和SK信息(因为程序打包之后,这个信息就需要小伙伴申请后在程序外面保存,然后我们通过参数获取函数去读取)
代码语言:javascript复制def getconf():
config = {}
with open('config.txt', 'r') as f:
lines = f.read().splitlines()
for i in lines:
if i:
key, values = i.split(':')
config[key] = values
return config
然后我们将昨天写的内容中参数获取这一块做了变化,将读取的参数传递给文字识别函数和身份证读取函数
代码语言:javascript复制#通用文字识别
def general_word(config):
#通用文字识别接口url
general_word_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic"
access_token = get_access_token(config)
image_names = input("请输入需要解析的图片(多张图片用英文,隔开):").split(",")
for i in image_names:
# 二进制方式打开图片文件
f = open(i, 'rb')
img = base64.b64encode(f.read())
params = {"image":img,
"language_type":"CHN_ENG"}
request_url = general_word_url "?access_token=" access_token
headers = {'content-type': 'application/x-www-form-urlencoded'}
response = requests.post(request_url, data=params, headers=headers)
if response:
res = response.json()["words_result"]
file_name = "菜鸟小白的学习分享_图片" i.split(".")[0] ".txt"
with open(file_name, 'w', encoding='utf-8') as f:
for j in res:
f.write(j["words"] "n")
#身份证识别
def idcard(config):
idcard_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/idcard"
access_token = get_access_token(config)
image_names = input("请输入需要识别的身份证图片(多张图片用英文,隔开):").split(",")
for i in image_names:
# 二进制方式打开图片文件
f = open(i, 'rb')
img = base64.b64encode(f.read())
params = {"id_card_side":"front","image":img}
request_url = idcard_url "?access_token=" access_token
headers = {'content-type': 'application/x-www-form-urlencoded'}
response = requests.post(request_url, data=params, headers=headers)
if response:
res = response.json()["words_result"]
file_name = "菜鸟小白的学习分享_图片" i.split(".")[0] ".txt"
with open(file_name, 'w', encoding='utf-8') as f:
f.write("住址:" res["住址"]["words"] "n")
f.write("出生日期:" res["出生"]["words"] "n")
f.write("姓名:" res["姓名"]["words"] "n")
f.write("公民身份号码:" res["公民身份号码"]["words"] "n")
f.write("性别:" res["性别"]["words"] "n")
f.write("民族:" res["民族"]["words"] "n")
菜鸟小白还补充了一个银行卡的识别函数
代码语言:javascript复制#银行卡识别
def bankcard(config):
#银行卡识别接口url
general_word_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/bankcard"
access_token = get_access_token(config)
image_names = input("请输入需要识别的银行卡图片(多张图片用英文,隔开):").split(",")
for i in image_names:
# 二进制方式打开图片文件
f = open(i, 'rb')
img = base64.b64encode(f.read())
params = {"image":img,}
request_url = general_word_url "?access_token=" access_token
headers = {'content-type': 'application/x-www-form-urlencoded'}
response = requests.post(request_url, data=params, headers=headers)
if response:
res = response.json()["result"]
file_name = "菜鸟小白的学习分享_图片" i.split(".")[0] ".txt"
with open(file_name, 'w', encoding='utf-8') as f:
f.write("卡号:" res["bank_card_number"] "n")
f.write("有效期:" res["valid_date"] "n")
f.write("银行:" res["bank_name"] "n")
最后我们根据读取的参数完成主函数的编写
代码语言:javascript复制if __name__ == '__main__':
config = getconf()
if config["Action Type"] == "1":
general_word(config)
elif config["Action Type"] == "2":
idcard(config)
elif config["Action Type"] == "3":
bankcard(config)