OCR截图文字识别iText for mac

2022-08-23 11:24:14 浏览数 (1)

iText for mac是一款OCR截图文字识别工具,通过截图、拖拽图片,即可以从扫描版的PDF等任意图片中识字,并且可以很好的解决摘抄和批注需求,帮助用户识别图片中文字,节约时间,提高效率。

立即下载:https://www.macw.com/mac/3518.html?id=MjU2NjEmXyYyNy4xODcuMjI2LjE1MQ==

功能特色

1.轻松选择图像

iText支持多种方式选择图像,操作非常方便。

2.捕获屏幕

iText内置屏幕捕获工具。只需按下快捷键⇧⌘1,捕获屏幕上的任何区域,即可提取其中的文本。提示:已识别的文本已复制到系统剪贴板。你可以直接粘贴。

3.将图像拖动到菜单栏图标

例如,当您在Twitter中看到图像并想要提取内部的文本或数字时,只需将图像拖动到iText的菜单栏图标,您就可以得到您想要的内容。

4.选择图像文件

当然,您也可以选择要识别的图片文件。但是,在这种情况下,优选上述拖动。

5.持续认可

例如,在PDF中截取不同位置的屏幕截图,iText将依次识别文本并自动连接结果。

6.由Google提供支持

  • 首先,我排除了脱机识别库,因为离线库已经死了,无法自我改进。接下来,在许多在线OCR服务中,我比较了微软,谷歌等产品。最后,我选择了Google的服务,因为它非常强大,可以识别50多种语言。
  • -对于普通的自然语言,例如书页,新闻稿,识别结果非常准确,甚至高达100%。
  • 对于复杂排版,特别是对于特殊字符(例如,程序源代码),识别结果不是那么好,您可能需要在识别后手动修改结果。
  • 例如,对于一条垂直线,机器无法区分小写字母l或大写字母I(顺便说一句,你能识别它们吗?); 相反,机器需要理解上下文以优化结果。但是现在机器很难理解程序源代码之类的非自然语言。

7.优化识别结果

  • OCR服务可以准确地识别图像中的文本,但不能用于进一步识别,例如段落识别等。
  • 因此,iText包含自己的算法来优化结果,例如,
  • 自动识别段落。
  • 删除英文单词和标点符号之间的额外空格。
  • 将英文的第一个字母大写。

8.预览原始图像以进行校对

  • 由于目前的OCR技术不能始终100%识别文本,因此有必要检查原始图像以修改结果。在iText中,您可以:
  • 拖动图像附近的结果窗口。
  • 在结果窗口的左侧显示图像。

9.自动翻译

识别图像中的文本后,iText可以自动将它们翻译成100多种语言,由Google提供支持。

0 人点赞