开门见山
以《新冠肺炎诊疗方案(试行第七版)》为例。该pdf是图片形式的,文字不可直接复制。
法1:office word
这个应该是最好用的
用office word打开pdf文件(依次点击:文件、打开、浏览,然后选择该pdf )
office对可能的错误还会标记和纠正
法2:天若OCR文字识别
网址为:https://tianruoocr.cn/ (百度上的OCR类似工具体验都不好)
可以识别文本,表格和公式等等
有免费版和专业版两种,对比如下
安装包下载到本地,我们这里用免费版的展示
装好之后,需要进行账号注册登录
快捷键默认是F4 ,可修改
法3:网页版的OCR
类似网页工具谷歌上有很多,这里随便放个:https://www.newocr.com/
输入、输出格式多样,可识别多种文字。