1 / 23

Character Recognition

Character Recognition. 2003. 9. 6 MAI lab 박지윤. 패턴인식. 패턴인식 기계에 의하여 도형 , 문자 , 음성 , 이미지 등을 식별시키는 일 및 그 방법 외부자극에 자극의 내용을 대응시키는 것 응용분야 인간의 패턴인식 과정을 연구 : 심리학 , 생물학 , 생리학 인식이 가능한 응용 기계의 연구 : 공학 , 컴퓨터 , 정보과학. 문자인식. 문자인식의 대상 오프라인 문자인식 온라인 문자인식 문자인식의 어려움 양적인 문제 질적인 문제. 문자인식.

Download Presentation

Character Recognition

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Character Recognition 2003. 9. 6 MAI lab 박지윤

  2. 패턴인식 • 패턴인식 • 기계에 의하여 도형, 문자, 음성, 이미지 등을 식별시키는 일 및 그 방법 • 외부자극에 자극의 내용을 대응시키는 것 • 응용분야 • 인간의 패턴인식 과정을 연구 : 심리학, 생물학, 생리학 • 인식이 가능한 응용 기계의 연구 : 공학, 컴퓨터, 정보과학 MAI lab seminar

  3. 문자인식 • 문자인식의 대상 • 오프라인 문자인식 • 온라인 문자인식 • 문자인식의 어려움 • 양적인 문제 • 질적인 문제 문자인식 Off-line On-line 인쇄체 제약된 필기 단일글자체 자유로운필기 다중글자체 필기체 제약된 필기 자유로운 필기 MAI lab seminar

  4. Off-line Character recognition • Optical Character Reader(OCR) • 기계장치를 통한 문자의 인식. 입력의 자동화 • 이미 작성된 인쇄체, 필기체 문자를 인식하는 것. • 문자의 이미지로부터 윤곽선, 골격선을 추출하여 인식 MAI lab seminar

  5. On-line Character recognition • 기계장치에 직접 입력하는 문자를 인식 • 글자 입력시의 획의 방향, 획순 등의 정보를 얻을 수 있다. • 입력 속도, 각도, 글자 크기 등이 입력시의 제한이 될 수 있다. • 제약이 많을수록 인식이 용이해진다. MAI lab seminar

  6. 문자인식 과정 패턴입력 전처리 분할 정규화 특징추출 인식결과 후처리 MAI lab seminar

  7. 문자인식 과정 • 전처리 • 잡영제거 : 난폭점 제거, 평활화, 훅 제거, 여과, 도트감축 MAI lab seminar

  8. 문자인식 과정 • 정규화 : 위치, 크기, 기울기, 바닥선 정렬 MAI lab seminar

  9. 문자인식 과정 • 후처리 • 문자인식의 정확도를 높이기 위해 인식된 글자를 단어이상의 단위로 재검토 • 문맥적 지식의 구조적 표현 기초 / 확률통계적 표현에 기초 • Dictionary Look-up Algorithm • Markov 가정에 의한 Modified Viterbi(MV) Algorithm: 이전의 n개 문자에 대해 그 문자가 나타날 확률을 고려 • 상황에 따라 : 주소, 인명 등 한정된 상황 MAI lab seminar

  10. 문자인식 방법 • 패턴정합법(Pattern matching) • 표준 패턴과의 비교 : 일치도, 유사도 • 획 분석법 • 구조해석법 MAI lab seminar

  11. 문자인식 방법 • Fuzzy decision tree • 기존의 decision tree를 확장. 사건의 가능성을 tree 탐색에 이용 • Hidden Markov Model(HMM) • 음성인식 분야에 쓰이던 방법론. N개의 노드와 이들간의 관계로 이루어진 모델 • Learning vector Quantization(LVQ) • Nearest neighbor기법 중의 한가지. 패턴들의 분류에 가중치를 두어 집합을 설정. 참조모델을 각 부류의 분포에 근사시키는 접근법 MAI lab seminar

  12. Example • 주소, 우편번호 인식 : 규격봉투 사용시 • (비 규격봉투에도 확대 중) • 한글 인식 프로그램 : 아르미, 글꼴 등 • 오프라인 문자인식, 인쇄체 (기울기 변화에 민감, 사전식 후처리 사용) • PDA, 전자사전 등의 펜글씨 입력 • 온라인 문자인식, 제약된 필기체(획순, 글자 크기제한, 입력된 글자에 대하여 비슷한 대안 선택 가능 방식) MAI lab seminar

  13. Two-stage segmentation of unconstrained handwritten Chinese charactersShyuan Zhaoa,b Xheru Chia, Penfei Shib, Hong Yanc Pattern Recognition 36 (2003) 145-156 a : Center for Multimedia Signal Processing, Department of Electronic and Information Engineering, The Hong Kong Polytechnic University, Hung Hom, Kowloon, Hong Kong b : Institute of Image Processing and Pattern Recognition, Shanghai Jiao Tong University, Shanghai, China c : Department of Electronic Engineering, City University of Hong Kong, Hong Kong

  14. Segmentation • Segmentation 절차 MAI lab seminar

  15. Segmentation • Coarse segmentation • (a) : The paths identified by vertical projection • (b) : a path generated by tracing the background skeletons • (c) : vertical projection • (d) : background skeleton MAI lab seminar

  16. Segmentation • Fine segmentation • Identification of candidate strokes • Identification of segmentation points • Fuzzy decision rules MAI lab seminar

  17. Segmentation • Results MAI lab seminar

  18. Handwritten digit recognition : benchmarking of state-of-the-art techniquesCheng-Lin Liu, Kazuki Nakashima, Hiroshi Sako, Hiromichi Fujisawa Pattern Recognition 36 (2003) 2271-2285 Central Research Laboratory, Hitachi, Ltd. 1-280 Higashi-koigakubo, Kokubunji-shi, Tokyo 185-8601, Japan

  19. Benchmarking • CENPARMI, CEDAR, MNIST Database 이용 • Feature extraction을 거쳐 digit image를 분석 MAI lab seminar

  20. Benchmarking • 10 feature vector • 8 Classification algorithms • Neural classifiers • LVQ and DLQDF classifiers • Support vector classifiers • Binary Image, Grayscale Image MAI lab seminar

  21. Benchmarking MAI lab seminar

  22. Benchmarking • SVC-rbf 방식(SVC with RBF kernel)이 가장 에러율이 낮으나, 인식시간이 길게 걸린다. 또한 비용이 많이 드는 방식이다. MAI lab seminar

  23. Conclusion • System과 알고리즘의 구현에서 사람의 직관의 역할 • 한정된 상황에서의 실제 이용방법의 확장 MAI lab seminar

More Related