230 likes | 439 Views
Character Recognition. 2003. 9. 6 MAI lab 박지윤. 패턴인식. 패턴인식 기계에 의하여 도형 , 문자 , 음성 , 이미지 등을 식별시키는 일 및 그 방법 외부자극에 자극의 내용을 대응시키는 것 응용분야 인간의 패턴인식 과정을 연구 : 심리학 , 생물학 , 생리학 인식이 가능한 응용 기계의 연구 : 공학 , 컴퓨터 , 정보과학. 문자인식. 문자인식의 대상 오프라인 문자인식 온라인 문자인식 문자인식의 어려움 양적인 문제 질적인 문제. 문자인식.
E N D
Character Recognition 2003. 9. 6 MAI lab 박지윤
패턴인식 • 패턴인식 • 기계에 의하여 도형, 문자, 음성, 이미지 등을 식별시키는 일 및 그 방법 • 외부자극에 자극의 내용을 대응시키는 것 • 응용분야 • 인간의 패턴인식 과정을 연구 : 심리학, 생물학, 생리학 • 인식이 가능한 응용 기계의 연구 : 공학, 컴퓨터, 정보과학 MAI lab seminar
문자인식 • 문자인식의 대상 • 오프라인 문자인식 • 온라인 문자인식 • 문자인식의 어려움 • 양적인 문제 • 질적인 문제 문자인식 Off-line On-line 인쇄체 제약된 필기 단일글자체 자유로운필기 다중글자체 필기체 제약된 필기 자유로운 필기 MAI lab seminar
Off-line Character recognition • Optical Character Reader(OCR) • 기계장치를 통한 문자의 인식. 입력의 자동화 • 이미 작성된 인쇄체, 필기체 문자를 인식하는 것. • 문자의 이미지로부터 윤곽선, 골격선을 추출하여 인식 MAI lab seminar
On-line Character recognition • 기계장치에 직접 입력하는 문자를 인식 • 글자 입력시의 획의 방향, 획순 등의 정보를 얻을 수 있다. • 입력 속도, 각도, 글자 크기 등이 입력시의 제한이 될 수 있다. • 제약이 많을수록 인식이 용이해진다. MAI lab seminar
문자인식 과정 패턴입력 전처리 분할 정규화 특징추출 인식결과 후처리 MAI lab seminar
문자인식 과정 • 전처리 • 잡영제거 : 난폭점 제거, 평활화, 훅 제거, 여과, 도트감축 MAI lab seminar
문자인식 과정 • 정규화 : 위치, 크기, 기울기, 바닥선 정렬 MAI lab seminar
문자인식 과정 • 후처리 • 문자인식의 정확도를 높이기 위해 인식된 글자를 단어이상의 단위로 재검토 • 문맥적 지식의 구조적 표현 기초 / 확률통계적 표현에 기초 • Dictionary Look-up Algorithm • Markov 가정에 의한 Modified Viterbi(MV) Algorithm: 이전의 n개 문자에 대해 그 문자가 나타날 확률을 고려 • 상황에 따라 : 주소, 인명 등 한정된 상황 MAI lab seminar
문자인식 방법 • 패턴정합법(Pattern matching) • 표준 패턴과의 비교 : 일치도, 유사도 • 획 분석법 • 구조해석법 MAI lab seminar
문자인식 방법 • Fuzzy decision tree • 기존의 decision tree를 확장. 사건의 가능성을 tree 탐색에 이용 • Hidden Markov Model(HMM) • 음성인식 분야에 쓰이던 방법론. N개의 노드와 이들간의 관계로 이루어진 모델 • Learning vector Quantization(LVQ) • Nearest neighbor기법 중의 한가지. 패턴들의 분류에 가중치를 두어 집합을 설정. 참조모델을 각 부류의 분포에 근사시키는 접근법 MAI lab seminar
Example • 주소, 우편번호 인식 : 규격봉투 사용시 • (비 규격봉투에도 확대 중) • 한글 인식 프로그램 : 아르미, 글꼴 등 • 오프라인 문자인식, 인쇄체 (기울기 변화에 민감, 사전식 후처리 사용) • PDA, 전자사전 등의 펜글씨 입력 • 온라인 문자인식, 제약된 필기체(획순, 글자 크기제한, 입력된 글자에 대하여 비슷한 대안 선택 가능 방식) MAI lab seminar
Two-stage segmentation of unconstrained handwritten Chinese charactersShyuan Zhaoa,b Xheru Chia, Penfei Shib, Hong Yanc Pattern Recognition 36 (2003) 145-156 a : Center for Multimedia Signal Processing, Department of Electronic and Information Engineering, The Hong Kong Polytechnic University, Hung Hom, Kowloon, Hong Kong b : Institute of Image Processing and Pattern Recognition, Shanghai Jiao Tong University, Shanghai, China c : Department of Electronic Engineering, City University of Hong Kong, Hong Kong
Segmentation • Segmentation 절차 MAI lab seminar
Segmentation • Coarse segmentation • (a) : The paths identified by vertical projection • (b) : a path generated by tracing the background skeletons • (c) : vertical projection • (d) : background skeleton MAI lab seminar
Segmentation • Fine segmentation • Identification of candidate strokes • Identification of segmentation points • Fuzzy decision rules MAI lab seminar
Segmentation • Results MAI lab seminar
Handwritten digit recognition : benchmarking of state-of-the-art techniquesCheng-Lin Liu, Kazuki Nakashima, Hiroshi Sako, Hiromichi Fujisawa Pattern Recognition 36 (2003) 2271-2285 Central Research Laboratory, Hitachi, Ltd. 1-280 Higashi-koigakubo, Kokubunji-shi, Tokyo 185-8601, Japan
Benchmarking • CENPARMI, CEDAR, MNIST Database 이용 • Feature extraction을 거쳐 digit image를 분석 MAI lab seminar
Benchmarking • 10 feature vector • 8 Classification algorithms • Neural classifiers • LVQ and DLQDF classifiers • Support vector classifiers • Binary Image, Grayscale Image MAI lab seminar
Benchmarking MAI lab seminar
Benchmarking • SVC-rbf 방식(SVC with RBF kernel)이 가장 에러율이 낮으나, 인식시간이 길게 걸린다. 또한 비용이 많이 드는 방식이다. MAI lab seminar
Conclusion • System과 알고리즘의 구현에서 사람의 직관의 역할 • 한정된 상황에서의 실제 이용방법의 확장 MAI lab seminar