Python识别文字,实现看图说话 | CSDN博文精选

2019-10-24 15:44:14 浏览数 (1)

现在写文件很多网站都不让复制了,所以每次都是截图然后发到QQ上然后用手机QQ的文字识别再发回电脑。感觉有点小麻烦了,所以想自己写一个小软件方便方便自己,就有了这篇了:

首先语言是Python,要实现的功能主要为文字识别,所以需要调用OCR技术,要做到够方便,所以需要调用系统剪切板,还需要一个小窗口,使用的是pyqt5。

OCR是直接使用的Tesseract-OCR,具体使用可以去搜一下,网上有很多,这里给出下载地址:

Tesseract exe 下载地址:

https://digi.bib.uni-mannheim.de/tesseract/

训练data 下载地址:

https://github.com/tesseract-ocr/tessdata (chi_sim是简体中文)

识别方法为:

代码语言:javascript复制
pytesseract.image_to_string(now_image, lang='chi_sim')

调用剪切板用的是:

代码语言:javascript复制
clipboard = QApplication.clipboard()
##取出剪切板的图片
clipboard.pixmap().save('cut_img.jpg')

##文字存入剪切板
clipboard.setText(str)

整体代码很简单,我就不上了,附上软件地址:

0 人点赞