之前有个爬虫需求,但每次请求都需要进行验证码识别,故需要ocr识别,推荐一个Python免费的验证码识别-ddddocr(谐音带带弟弟OCR)
安装
代码语言:javascript复制pip install ddddocr -i https://pypi.tuna.tsinghua.edu.cn/simple
参数说明
验证
随便找了一个验证码图片,使用这个库来实战一下。
代码语言:javascript复制import ddddocr
ocr = ddddocr.DdddOcr()
with open('1.png', 'rb') as f:
img_bytes = f.read()
res = ocr.classification(img_bytes)
print(res)
成功识别出来了验证码文字!而且优点也非常明显:首先代码非常精简,不需要额外设置环境变量等等,5行代码即可轻松识别验证码图片。如果你需要进行验证码识别,且对精度要求不是过高。那么,带带弟弟OCR(ddddocr)这个库是一个不错的选择~