120 likes | 197 Views
Character Set Standards. Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards. Nicht kodierte Charset Standards. Existierten meistens schon lange bevor kodierte Charsets entstehen (oder sogar deren Konzept)
E N D
Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards
Nicht kodierte Charset Standards • Existierten meistens schon lange bevor kodierte Charsets entstehen (oder sogar deren Konzept) • Dienen der Beschränkung und Standardisierung der Zahl der sich in Gebrauch befindlichen chinesischen Zeichen • Didaktische Intention
Hanzi in China • Standardliste 现代汉语通用字表 (7000) • Darunter: • Grundschule 现代汉语常用字表 (2500) • Mittelschule 现代汉语次常用字表 (1000) • Zusätzlich: • Liste vereinfachter Zeichen 简化字总表 (2249)
Hanzi in Taiwan • Grundliste (4808) • Ergänzungsliste (6341) • Liste seltener Hanzi (18480) • Liste mit Hanzi-Varianten (18609)
Kanji in Japan • Standardliste 常用漢字 (1945) • Darunter wichtig: • Schulliste 学習漢字 (1006) • Zusätzlich: • Liste für Namen 人名用漢字 (285)
Hanja in Korea • Gesamtliste 상용한자/常用漢字 enthält: • Mittelschule (900) • Oberschule (900) • Zusätzlich Liste für Namen 인명용한자/人名用漢字 (2964)
Kodierte Charset Standards • Durch Computersysteme Notwendigkeit von kodierten Charset Standards • Zuerst proprietäre Standards von Unternehmen später nationale Standards • Erster CJKV Standard: JIS C 6226-1978 • Methoden zum Arrangieren und Enkodieren werden von China, Taiwan und Korea übernommen
Chinesische Charset Standards • Nationaler Standard GB (国标) • Grundstandard: GB 2312-80 • Wesentliche Kennzeichen: • Enthält verschiedene Zeichen anderer Sprachen (nicht nur ASCII-Zeichen) • Level 1 Hanzi (Anordnung nach Lesung) • Level 2 Hanzi (Anordnung nach Radikal und Strichzahl) • Folgestandards mit Ergänzungen und Korrekturen
Taiwanesische Charset Standards • Big Five (大五) , CNS 11643-1986, CCCII • CNS zwar offizieller Standard aber Big Five gebräuchlicher (de-facto Standard) • Merkmale: • Big Five anfangs stark an JIS angelehnt und kleiner als CNS • Hanzi nach Strichzahl und Radikal geordnet • CNS mit Abstand größtes CJKV-Charset • Folgestandards bei beiden mit Ergänzungen
Japanische Charset Standards • Fünf verbreitete Charsets in Japan: • ASCII • JIS-Roman • JIS X 0201-1997 (half-width Katakana) • JIS X 0208:1997 (und seine Vorgänger) • JIS X 0212-1990 (zusätzliche Zeichen) • Anmerkung: JIS X 0208:1997 und JIS X 0212-1990 ergänzen sich
Koreanische Charset Standards • Meistverbreiteter Standard: KS X 1001:1993 • Wesentliche Merkmale: • Enthält ebenfalls Zeichen anderer Sprachen • Hangul und Hanja • KS X 1001:1991 mit zusätzlichen Hangul-Zeichen • KPS 9566-97 von Nordkorea verwendet • GB 12052-89 in China verwendet
Internationale Charset Standards • Versuch, die meisten geschriebenen Sprachen der Welt in einem Charset zusammenzufassen • Unicode-Konsortium als bekanntester Vertreter • Start mit Unicode 1.0: 20902 chin. Zeichen, 2350 Hangul 5049 andere Zeichen etc. • In Folgeversionen Steigerung der Zeichenzahl (aber nicht der chin. Zeichen) • Nationale Standards ordnen sich in den Unicode ein wie z.B. GB 13000.1-93, JIS X 0221-1995, KS X 1005-1:1995 bzw. Kooperation mit ISO (ISO 10646-1:1993)