有的pdf文件本来就是图文格式的,所以转换成word后还是会以图片形式呈现。
要将上面的文字信息提取出来,就要借助第三方工具,以前用过捷速扫描图片文字识别软件,挺好用的。
双击打开软件,直接进入到操作界面,“读取”按钮可以选择到需要识别的文件,添加进去之后会在操作界面的窗口显示出文件内容;
然后,直接点击“识别”按钮,软件会自动进入到识别程序,不需要进行任何操作,一会就会出现识别结果在原文件的右手边;
最后,将得到的识别结果根据自身的需求选择保存格式,这里需要保存为word就直接点击word就可以了。