有什么软件能把书用照相机拍下来并转换成WORD文档

2020-06-14 科技 81阅读

把照相机拍照或扫描仪扫描获得图像中的文字,通过软件识别的办法,转换成Word或其它可编辑文档的方法,叫光学字符识别法(Optical CharacterRecognition),因此对应的应用软件就叫做OCR软件。

现在市场上主要的OCR软件有:方正ocr文字识别软件、汉王ocr文字识别软件、捷速ocr文字识别软件等国产软件,它们主要适用于中文的光学字符识别;如果文章中主要是英文文章或英文单词较多,则推荐购买或下载ABBYYFineReader这个对英文识别性能更好的软件使用,新版的ABBYYFineReader据说已经可以识别中文,但以个人经验看,识别中文最好还是中国人自己开发的软件更实用一些,除非主要以识别外文资料为主。

最早能用OCR软件来识别和转换文字的是扫描仪扫出的图像,因为扫描仪扫出的图片文字没有变形,清晰度好,识别转换率也很高,但是扫描的时间较长。按照这个思路,如果没有条件扫描书籍的,应该在使用数码相机拍摄并识别书籍时注意以下几点:

  1. 把书籍尽可能地放平整,特别是靠近书籍部分的几列更要注意,防止拍出的照片中四周变形较大影响识别;

  2. 用相机变形最小的镜头焦段,最好是标准镜头到人像镜头这一段焦距(即单反相机对应的50~85mm,更长的也可以,只是距离书本会更远,操作不方便)来拍摄要识别的书籍,同时注意使相机镜头的中轴线,尽可能地垂直于书本页面,并通过或靠近页面的几何中心,这样拍出的图片四周变形小,大批量拍摄时最使好用三脚架上拍摄,使工作效率更高,拍出图片质量好,今后识别率也更高,

  3. 把拍好的照片导入电脑,用PS等软件,把需要识别的图片分辩率批量地人工改为220~260dpi,尺寸大小也改为与所拍书箱的大小相近的如A5或A4或A3等尺寸——因为数码相机一般拍出的图片尺寸很大(2500px左右或更大),但清晰度较低(一般是72dpi)与OCR软件要求的差别较大;

  4. 打开OCR软件,按顺序调用、识别,识别时注意有的软件要求首先用OCR软件自带的水平较正较平后再进行光学识别,可以大大提高字符的识别率。

声明:你问我答网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系fangmu6661024@163.com