现在写文件很多网站都不让复制了,所以每次都是截图然后发到QQ上然后用手机QQ的文字识别再发回电脑。感觉有点小麻烦了,所以想自己写一个小软件方便方便自己,就有了这篇了:
首先语言是Python,要实现的功能主要为文字识别,所以需要调用OCR技术,要做到够方便,所以需要调用系统剪切板,还需要一个小窗口,使用的是pyqt5。
OCR是直接使用的Tesseract-OCR,具体使用可以去搜一下,网上有很多,这里给出下载地址:
Tesseract exe 下载地址:
https://digi.bib.uni-mannheim.de/tesseract/
训练data 下载地址:
https://github.com/tesseract-ocr/tessdata (chi_sim是简体中文)
识别方法为:
代码语言:javascript复制pytesseract.image_to_string(now_image, lang='chi_sim')
调用剪切板用的是:
代码语言:javascript复制clipboard = QApplication.clipboard()
##取出剪切板的图片
clipboard.pixmap().save('cut_img.jpg')
##文字存入剪切板
clipboard.setText(str)
整体代码很简单,我就不上了,附上软件地址: