Python识别文字,实现看图说话

2019-10-23 20:12:45 浏览数 (1)

现在写文件很多网站都不让复制了,所以每次都是截图然后发到QQ上然后用手机QQ的文字识别再发回电脑。感觉有点小麻烦了,所以想自己写一个小软件方便方便自己,就有了这篇了:

首先语言是Python,要实现的功能主要为文字识别,所以需要调用OCR技术,要做到够方便,所以需要调用系统剪切板,还需要一个小窗口,使用的是pyqt5。

OCR是直接使用的Tesseract-OCR,具体使用可以去搜一下,网上有很多,这里给出下载地址:

Tesseract exe 下载地址:

https://digi.bib.uni-mannheim.de/tesseract/

训练data 下载地址:

https://github.com/tesseract-ocr/tessdata (chi_sim是简体中文)

识别方法为:

代码语言:javascript复制
pytesseract.image_to_string(now_image, lang='chi_sim')

调用剪切板用的是:

代码语言:javascript复制
clipboard = QApplication.clipboard()
##取出剪切板的图片
clipboard.pixmap().save('cut_img.jpg')

##文字存入剪切板
clipboard.setText(str

整体代码很简单,我就不上了,附上软件地址:

64和32版本:

链接:

https://pan.baidu.com/s/129cgx5-hcLFiLhhaCIgHlQ&shfl=sharepset

提取码:2425

单32位版本(在64位系统下也能运行,记得添加信任):

链接:

https://pan.baidu.com/s/1JiRBXzG2glr445VoXI1BXA&shfl=sharepset

提取码:l08b

或者:

链接:https://download.csdn.net/download/qq_21189053/11878342

打包之后不知道为啥64位的200多M,32位只有30M。

由于调用了系统的剪切板,所以可能会被安全软件隔离,解压后添加信任区,并右键以管理员运行。

请放心使用,保证无毒!

附上使用截图:

解压后根据个人系统位数运行:

然后直接微信或QQ截图,可以将缩放比调大一点,准确一些:

然后不用保存,直接点击识别:

0 人点赞