60 likes | 245 Views
ICCKL 1999 Yenji China. 유니코드에서 한글 부호계의 개선 방향 A Study on Improving Hangul Codes in Uncode. 1999. 8. 13. 동국대학교 컴퓨터학과 변 정 용. Unicode 에서 문제점. KS X 1005-1 : 3 종류의 한글 부호계 완성 음절형, 자모형, 자소형 11172자 완성 음절형이 기본 부호계 자연어 처리 및 옛글 표현의 어려움 넓은 공간 점유 11172자는 240자 자소형의 부분 집합 240자 자소형의 음절 표현의 불완전성
E N D
ICCKL 1999 Yenji China 유니코드에서 한글 부호계의 개선 방향A Study on Improving Hangul Codes in Uncode 1999. 8. 13. 동국대학교 컴퓨터학과 변 정 용
Unicode에서 문제점 • KS X 1005-1 : 3 종류의 한글 부호계 • 완성 음절형, 자모형, 자소형 • 11172자 완성 음절형이 기본 부호계 • 자연어 처리 및 옛글 표현의 어려움 • 넓은 공간 점유 • 11172자는 240자 자소형의 부분 집합 • 240자 자소형의 음절 표현의 불완전성 • 훈민정음 원리의 부분 적용 ICCKL '99-동국대-변정용
훈민정음의 문자 생성 원리도 有天地自然之聲 卽必有天地自然之文 부서법, 성음법 초5219,중1463,종5220 연서법,합용병서법 28+17 자 약 399억 음절 ICCKL '99-동국대-변정용
한자를 위한 공간 배려 • 훈민정음 원리 적용 • 정음형 부호계 사용 • 완성 음절형 및 자모형, 자소형의 대체 • 11250 여 글자의 반환 • 한자 공간의 확대 • 大漢韓辭典, 敎學社 : 37823 자 • 유니코드 3.0 : CJK 27786 자 ICCKL '99-동국대-변정용
Unicode의 문자 배치 현황 Category V2.1 V3.0 Alphabetics,Symbols 6511 10236 CJK Ideographs 21204 27786 Hangul Syllables 11172 11172 Total assigned characters 38887 49194 Private Use 6400 6400 Surrogates 2048 2048 Controls 65 65 Not Characters 2 2 Total assigned 16-bit code values 47402 77709 Unassigned 16-bit code values 18134 7827 ICCKL '99-동국대-변정용
결론 • 유니코드 및 ISO 10646에 반영된 3 가지 한글 부호계의 공학적 타당성 검증 필요 • 훈민정음 원리에 기반한 정음형 대체 • 훈민정음의 과학으로 국제 문자 공간을 절약해야 한다. • 훈민정음의 과학성과 컴퓨터 과학을 일치시켜야 한다. ICCKL '99-동국대-변정용