太好用！图片转文字没有python环境也能运行了！！！

昨天菜鸟小白的分享——将图片中的文字提取出来，有不少小伙伴也都私信我，对我表示肯定，更是有小伙伴希望我将昨天的代码做成和之前一样的可执行文件。本来我是以为将整个程序完善了之后再打包为可执行文件的，既然已经有小伙伴私信要求了，那我就直接将这个打包了。公众号上私信回复“文字识别可执行文件”即可获取。

粉丝问题解答

有小伙伴拿了我之前图片漫画的程序，执行后出现如下报错

菜鸟小白看到后其实只能分析出这个应该是权限问题，首先我会先去查API文档中关于错误码的部分

确实就是权限问题，但是这个还是没有给出我们解决方案，这个时候就需要我们去搜索了。我当时搜到这样一个文章，文章中是这样说的，遇到这样的问题是因为我们创建的应用API没有对应的权限，需要在应用中勾选上我们需要的API接口权限，然后向百度AI开放平台客服提工单开放对应权限即可。

最终通过这样的方式我解决了这个问题，那个私信我的小伙伴，你现在是否清楚了呢。

今日编码分析

今天我就将今天的代码改编做一下说明吧。首先我新增了参数获取函数，用于存放AK和SK信息（因为程序打包之后，这个信息就需要小伙伴申请后在程序外面保存，然后我们通过参数获取函数去读取）

代码语言：javascript复制

def getconf():
    config = {}
    with open('config.txt', 'r') as f:
        lines = f.read().splitlines()
        for i in lines:
            if i:
                key, values = i.split(':')
                config[key] = values
    return config

然后我们将昨天写的内容中参数获取这一块做了变化，将读取的参数传递给文字识别函数和身份证读取函数

代码语言：javascript复制

#通用文字识别
def general_word(config):
    #通用文字识别接口url
    general_word_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic"
    access_token = get_access_token(config)
    image_names = input("请输入需要解析的图片（多张图片用英文,隔开）：").split(",")
    for i in image_names:
        # 二进制方式打开图片文件
        f = open(i, 'rb')
        img = base64.b64encode(f.read())
        params = {"image":img,
                  "language_type":"CHN_ENG"}

        request_url = general_word_url   "?access_token="   access_token
        headers = {'content-type': 'application/x-www-form-urlencoded'}
        response = requests.post(request_url, data=params, headers=headers)
        if response:
            res = response.json()["words_result"]
            file_name = "菜鸟小白的学习分享_图片" i.split(".")[0] ".txt"
            with open(file_name, 'w', encoding='utf-8') as f:
                for j in res:
                    f.write(j["words"] "n")

#身份证识别
def idcard(config):
    idcard_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/idcard"
    access_token = get_access_token(config)
    image_names = input("请输入需要识别的身份证图片（多张图片用英文,隔开）：").split(",")
    for i in image_names:
    # 二进制方式打开图片文件
        f = open(i, 'rb')
        img = base64.b64encode(f.read())

        params = {"id_card_side":"front","image":img}
        request_url = idcard_url   "?access_token="   access_token
        headers = {'content-type': 'application/x-www-form-urlencoded'}
        response = requests.post(request_url, data=params, headers=headers)
        if response:
            res = response.json()["words_result"]
            file_name = "菜鸟小白的学习分享_图片" i.split(".")[0] ".txt"
            with open(file_name, 'w', encoding='utf-8') as f:
                f.write("住址：" res["住址"]["words"] "n")
                f.write("出生日期："   res["出生"]["words"]   "n")
                f.write("姓名："   res["姓名"]["words"]   "n")
                f.write("公民身份号码："   res["公民身份号码"]["words"]   "n")
                f.write("性别："   res["性别"]["words"]   "n")
                f.write("民族："   res["民族"]["words"]   "n")

菜鸟小白还补充了一个银行卡的识别函数

代码语言：javascript复制

#银行卡识别
def bankcard(config):
    #银行卡识别接口url
    general_word_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/bankcard"
    access_token = get_access_token(config)
    image_names = input("请输入需要识别的银行卡图片（多张图片用英文,隔开）：").split(",")
    for i in image_names:
        # 二进制方式打开图片文件
        f = open(i, 'rb')
        img = base64.b64encode(f.read())
        params = {"image":img,}
        request_url = general_word_url   "?access_token="   access_token
        headers = {'content-type': 'application/x-www-form-urlencoded'}
        response = requests.post(request_url, data=params, headers=headers)
        if response:
            res = response.json()["result"]
            file_name = "菜鸟小白的学习分享_图片" i.split(".")[0] ".txt"
            with open(file_name, 'w', encoding='utf-8') as f:
                f.write("卡号："   res["bank_card_number"]   "n")
                f.write("有效期："   res["valid_date"]   "n")
                f.write("银行："   res["bank_name"]   "n")

最后我们根据读取的参数完成主函数的编写

代码语言：javascript复制

if __name__ == '__main__':
    config = getconf()
    if config["Action Type"] == "1":
        general_word(config)
    elif config["Action Type"] == "2":
        idcard(config)
    elif config["Action Type"] == "3":
        bankcard(config)

api 打包文字识别腾讯云开发者社区

0 人点赞