PDF转word图片文字提取

2024-10-28 14:04:38

1、双击运行软件。点击“文件”-“打开”,弹出打开文件对话框,选择要打开的文件(准备提取文字的PDF文件)。

PDF转word图片文字提取

2、提取文字。一些PDF文件里面的文字是可以直接用PDF阅览器里面的文字抓取工具抓取的,比如用word直接转换成的PDF文件,当你用一般的PDF阅览器打开时,点击文字抓取按钮,就可以将文字复制到剪趋溉湮唤切板并粘贴到word里面编辑。这类不是这篇经验介绍的对象。我们今天要提取的是由图片转换过来的PDF文件,也就是有人说的扫描版的PDF文件里面的文字抓取,这类文件用阅览器是不能提取里面的文字的。用CAJViewer 7.0打开PDF文档后,如果图片转换的PDF文件,当你选择“文字抓取工具”以外的其他任何工具,就会自动在文档窗口左上角显示快捷工具栏。点击快捷工具栏最左边的“文字识别”按钮,当前页的文字就会被识别到剪切板上,然后在把它粘贴到word里面就行了。

3、将文字粘贴到word里面编辑。点击文字识别按钮以后,会弹出“文字识别结果”对话框,该页的文字就会显示在对话框里面,点击“复制到剪切板”按钮,就会将整页文字内容复制到剪切板,然后在到word里面,右键-粘贴,就完成了该页的文字提取工作。

4、说明事项:识别准确率:该软件的文字识别准确率跟图片清晰度关系很大,图片越清晰,分辨率越高,杂色越少,识别率越高。照片文件:该软件不能打开.jpj等格式的照片文件,如果你的材料是用手机、相机等照的照片,需要将照片转换成PDF格式,方法有很多。其他:该软件只能一页一页识别提取文字,不支持将整改文档里面的文字批量识别转换。另外,不能识别表格和文档内的图片。

猜你喜欢