Board logo

标题: [技术文章] OCR图片文字识别软件图解教程 [打印本页]

作者: shillan    时间: 2009-8-12 22:31     标题: OCR图片文字识别软件图解教程

一、什么是ocr
很早之前就听说有提取图片中文字的工具和方法,这种文字识别技术称为ocr(optical character recognition)。ocr技术的出现,实现了将印刷文字扫描得到的图片转化为文本文字的功能,提供了一种全新的文字输入手段,大大提高了用户工作的效率。
二、ocr适合对象
  1.印刷行业、文印店:经常会遇到客户只给你一本厚厚的宣传册(因为客户不知道电子稿保存的重要意义,甚至压根就不知道什么是电子稿),要你明天之前,必须把那本几十页宣传册上的文字,原原本本打出来。生意还是要做,没有办法,你只能再当一回为了打字而打字的工具了,除非你使用ocr;
  2.办公室工作人员:老板某天拿了一张写满字的传单给你,要求你马上打成word文档,对于打字慢或是懒得打的你,为了完成工作任务,ocr就很适合你了;
  3.其他对象:工作中、网络中、现实生活中,ocr对很多人都是有用的,能帮你轻松提高效率。
三、准确选择ocr软件
  正常购买扫描仪的时候,配套软件就会附有ocr功能,在网络上搜索,也会有一系列的ocr软件可以下载,如:
  1.清华紫光ocr v7.5
  简介:清华紫光 ocr支持windows环境下的gb、big5、jis和shif。

  2.abbyy finereader ocr professional 7.0.0.963
  简介:一款ocr软件。为用户提供了现代ocr赤铜的全部功能,给予它们对信息管理的完全控制。
  3.扫描小精灵 v1.30 build 2003.03.21
  简介:针对ocr的图像增强、虚拟twain、批量扫描。
  4.mini ocr 汉字显示字体识别软件 1.0
  简介:本软件是飞涛软件工作室开发的一款免费ocr软件,主要用于识别图像文件之中出现的汉字。

  5.mini ocr 汉字显示字体识别软件 v1.0
  简介:本软件是飞涛软件工作室开发的一款免费ocr软件。

  6.奥普印刷体文字识别ocr系统 专业版
  笔者从事互联网行业也有三四年了,很早前就知道有ocr(文字识别技术),也曾花了好几天的时间研究了不下十种的ocr软件(包含以上6种),结果不是软件安装失败,就是提取文字的识别率太低。过了好久,笔者下载了"尚书七号",才发现它就是多年来一直寻找的ocr软件,并亲眼见证了ocr的成果,识别率达到90%以上。欣喜之余,写了这篇"图片文字提取(ocr)图解教程",首刊在私房博客(http://www.fz10000.com)上,为所有在寻找ocr或想体验ocr成果的人提供参考,欢迎各网站转载。
  "尚书七号ocr "下载地址:http://cz2.10gb.cn/down/shocr70.rar
四、图片文字提取(ocr)图解范例
  1.从扫描仪导入图片或截图生成

[图1] 截图后,打开photoshop,新建文件,分辨率设:300像素/英寸

[图2] 粘贴后,保存为.jpg格式

[图3] 保存后的.jpg图片
  图1、图2、图3是假设在浏览网页时,遇到含有文字的图片,利用腾讯tt截图功能,在photoshop粘贴生成.jpg文件;当然,也可以使用键盘上的printscan键截图后,打开附件里的画图,进行粘贴生成.jpg文件。
  2."尚书六号"的界面

  3.导入需要提取的图片

[图5] 点击"文件",选择"打开图象页"

[图6] 选择刚才保存的sample.jpg并点击"打开"

[图7] "尚书七号"自动识别的三个选框
  4.提取文字并保存文本

[图8] 不修改默认设置,直接点击"识别"后,弹出的界面

[图9] 将框内的文字选中,并复制到文本文件或word文档进行个别错字修正。




欢迎光临 逐梦论坛 (http://temp2023.zhumeng.org/) Powered by Discuz! 7.2