160 likes | 403 Views
USACO 5.4.3 -_-||. 陆嘉辉 7.17. 光学字符识别. 陆嘉辉 7.17. 将手写扫描图像或打印 / 印刷文本图像,通过机械或电子学 上 的方法,转换成 机器 编码的或是计算机可读的文本的技术 属于模式识别、人工智能和计算机视觉的一个领域 缩写 为 OCR. Optical Character Recognition. Gustav Tauschek , 1929 Emanuel Goldberg, 1931 Ray Kurzweil, 1974, Kurzweil Computer Products, Inc
E N D
USACO 5.4.3 -_-|| 陆嘉辉 7.17
光学字符识别 陆嘉辉 7.17
将手写扫描图像或打印/印刷文本图像,通过机械或电子学上的方法,转换成机器编码的或是计算机可读的文本的技术将手写扫描图像或打印/印刷文本图像,通过机械或电子学上的方法,转换成机器编码的或是计算机可读的文本的技术 • 属于模式识别、人工智能和计算机视觉的一个领域 • 缩写为OCR Optical Character Recognition
Gustav Tauschek, 1929 • Emanuel Goldberg, 1931 • Ray Kurzweil, 1974, Kurzweil Computer Products, Inc • WebOCR, 2000s 发展历史
OCR (光学字符识别) • OWR (光学单词识别) • ICR (智能字符识别) • IWR (智能单词识别) OCR的分类
纠偏 • 去噪点 • 二值化 • 去噪音线 • 版面分析 • 单词检测 • 字符分割 • 比例模式化 OCR预处理
R(x,y),G(x,y),B(x,y) • G = I = ( R + G + B )/ 3 (HSI) • G = Y = 0.299R + 0.587G + 0.114B (YIQ) • G = min { R , G , B } 灰度化
一般24位RGB图像的灰度图是8位256个灰度级的,如果把这个灰度级减少到1位2个灰度级,就得到一副二值图,二值图像中的数据全部是0或1。一般24位RGB图像的灰度图是8位256个灰度级的,如果把这个灰度级减少到1位2个灰度级,就得到一副二值图,二值图像中的数据全部是0或1。 二值化
等距分割 • 积分投影分割 • 提取连通分量 • 主要难题:字符粘连 字符分割
模式识别 • 特征提取 • 自适应字符识别(二次识别) • 字典改进 • “近邻”分析 • 语法 字符识别
早期估计为81%-99% • 一个字符微小的不准确率会大幅降低单词的正确识别率 准确率
校对与纠错 • 版面还原 后处理
定制的OCR • 牌照,身份证 • 盲人 • 读地图 • 验证码识别 OCR应用
汉王 紫光 • OmniPage • Tesseract • ExperVisionTypeReader & RTK • ABBYY FineReader • AnyDoc Software • LEADTOOLS • CuneiForm • Asprise OCR SDK • SimpleOCR • Dyanmsoft OCR SDK • Microsoft Office OneNote 2007 • MeOCR • Screenworm • en.wikipedia.org/wiki/Comparison_of_optical_character_recognition_software 现有软件
强制优化输入 • 外包 reCAPTCHA 改进算法之外……
http://www.cnblogs.com/chaosimple/archive/2013/07/18/3197720.htmlhttp://www.cnblogs.com/chaosimple/archive/2013/07/18/3197720.html • http://blog.damiles.com/2008/11/basic-ocr-in-opencv/ • 冯建强,刘文波,于盛林. 《基于灰度积分投影的人眼定位》 计算机仿真22.4 (2005): 75-76. • 荆涛,王仲. 《光学字符识别技术与展望》计算机工程 29.2 (2003): 1-2. • Eikvil, Line. "Optical Character Recognition." citeseer. ist. psu. edu/142042. html (1993). • 因华.《特殊印刷体粘连字符切分方法研究》2005 • Wikipedia Reference