iText for mac是一款OCR截图文字识别工具,通过截图、拖拽图片,即可以从扫描版的PDF等任意图片中识字,并且可以很好的解决摘抄和批注需求,帮助用户识别图片中文字,节约时间,提高效率。
立即下载:https://www.macw.com/mac/3518.html?id=MjU2NjEmXyYyNy4xODcuMjI2LjE1MQ==
功能特色
1.轻松选择图像
iText支持多种方式选择图像,操作非常方便。
2.捕获屏幕
iText内置屏幕捕获工具。只需按下快捷键⇧⌘1,捕获屏幕上的任何区域,即可提取其中的文本。提示:已识别的文本已复制到系统剪贴板。你可以直接粘贴。
3.将图像拖动到菜单栏图标
例如,当您在Twitter中看到图像并想要提取内部的文本或数字时,只需将图像拖动到iText的菜单栏图标,您就可以得到您想要的内容。
4.选择图像文件
当然,您也可以选择要识别的图片文件。但是,在这种情况下,优选上述拖动。
5.持续认可
例如,在PDF中截取不同位置的屏幕截图,iText将依次识别文本并自动连接结果。
6.由Google提供支持
- 首先,我排除了脱机识别库,因为离线库已经死了,无法自我改进。接下来,在许多在线OCR服务中,我比较了微软,谷歌等产品。最后,我选择了Google的服务,因为它非常强大,可以识别50多种语言。
- -对于普通的自然语言,例如书页,新闻稿,识别结果非常准确,甚至高达100%。
- 对于复杂排版,特别是对于特殊字符(例如,程序源代码),识别结果不是那么好,您可能需要在识别后手动修改结果。
- 例如,对于一条垂直线,机器无法区分小写字母l或大写字母I(顺便说一句,你能识别它们吗?); 相反,机器需要理解上下文以优化结果。但是现在机器很难理解程序源代码之类的非自然语言。
7.优化识别结果
- OCR服务可以准确地识别图像中的文本,但不能用于进一步识别,例如段落识别等。
- 因此,iText包含自己的算法来优化结果,例如,
- 自动识别段落。
- 删除英文单词和标点符号之间的额外空格。
- 将英文的第一个字母大写。
8.预览原始图像以进行校对
- 由于目前的OCR技术不能始终100%识别文本,因此有必要检查原始图像以修改结果。在iText中,您可以:
- 拖动图像附近的结果窗口。
- 在结果窗口的左侧显示图像。
9.自动翻译
识别图像中的文本后,iText可以自动将它们翻译成100多种语言,由Google提供支持。