1 / 13

汉字与纵横输入法

汉字与纵横输入法. 汉字与拼音文字. 汉字是从象形文字演化而来,目前世界上有中国、日本、韩国等国家使用 世界上几乎所有其它流行语言都是拼音文字 两相比较: 拼音文字有其优点: 字母少,基本上会说就会写 汉字也有优点: 单字信息量大,字字有含义,美观. 符号少的好处. 西文编码简单,打字机,电脑都是西方人发明,键盘上游戏文字母,常用符号,电脑输入不必编码 活字印刷,是我们的祖先伟大的四大发明之一,对于人类文明的发展,活字印刷居功至伟。帮了西方文明发展的大忙。 电报码, 5bit 就够了

elmo
Download Presentation

汉字与纵横输入法

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 汉字与纵横输入法

  2. 汉字与拼音文字 • 汉字是从象形文字演化而来,目前世界上有中国、日本、韩国等国家使用 • 世界上几乎所有其它流行语言都是拼音文字 • 两相比较: 拼音文字有其优点: 字母少,基本上会说就会写 汉字也有优点: 单字信息量大,字字有含义,美观

  3. 符号少的好处 • 西文编码简单,打字机,电脑都是西方人发明,键盘上游戏文字母,常用符号,电脑输入不必编码 • 活字印刷,是我们的祖先伟大的四大发明之一,对于人类文明的发展,活字印刷居功至伟。帮了西方文明发展的大忙。 • 电报码,5bit 就够了 • Ascii 一百多个,囊括了所有可打印西文符号

  4. 汉字 • 活字印刷 印刷车间的铅字字库,稍好一点要占数十平方米。 • 打字员不能直接用键盘,需要检字,打字员是一种职业,非职业印刷要刻蜡板 • 电报码 0000-9999 • 国标 GB2312收入汉字6000多 GB18030 收入汉字 18000

  5. 汉字是中华灿烂文化的载体 • 可以用拼音替代吗? • 试试 • 邻邦的尝试,最终还是离不开,在计算机问世之后,由于计算机处理能力强,汉字的应用反而更加广泛 • 方言、口音,彼此口音不同,大部分情况下不影响交流,山东话、四川话、山西话,拼音? • 口语交流困难时,书面交流

  6. 汉字是表意文字 • 是形、音、义的统一体 • 只有音是不够的 • 同音字、词太多 • 方言、口音问题 • 汉语中文的美 • 书法 • 诗词

  7. 计算机时代 • 汉字印刷基本上告别了铅字 • 问题是怎样输入 • 对汉字输入法的要求 • 易学 • 易记 • 码短 • 无重码,退而求其次,重码率低

  8. 输入法实际上就是编码方法 • 汉字、词组映射到符号串 • 怎样选择映射方法可以达到前述要求 • 怎样达到目标 • 单一目标不难实现 例如无重码 汉字与西文字母串、数字串1—1对应, 区位码也就是国标码 电报码 三键无重码(输入法之一,只用字母健,三个字母出一个汉字) 每个字母有26种可能,总共有13576中可能

  9. 万码奔腾 • 要做到易学、易记、重码率低、输入快速 绝非易事,从七十年代末至今,很多人尝试设计 • 不完全统计,汉字输入法有近千种 • 从计算机科学的角度 • 人们在寻找、设计一种 hash 函数 • 汉字、词组到字符串的一种对应关系,允许多对一,也就是重码 • 要在各个目标之间找平衡

  10. 音码、形码、音形码 • 全拼、双拼、智能ABC、微软拼音 • 不可缺少 • 固有的缺陷,汉字本身不是拼音文字 • 高重码率无法避免 • 发音不准很难使用 • 不认识字无法输入 • 五笔字型、纵横码 • 五笔字型把汉字分解为字根 是一种成功的输入法

  11. 五笔字型字根、口诀 35 金勺缺点无尾鱼, (指“勹、”) 犬旁留叉儿一点夕, ( 指“”、儿、”) 氏无七(妻)。 (“氏”去掉“七”为“”) 41 言文方广在四一, 高头一捺谁人去。(高头“”,“谁”去“亻” 为“讠、”) 42 立辛两点六门疒, 43 水旁兴头小倒立。 (指“氵、、、”) 44 火业头,四点米, (“业头”即“”) 45 之字军盖建道底, (即“之、宀、冖、廴、辶”) 摘礻(示)衤(衣)。 (“礻、衤”摘除末笔画即“”) 51 已半巳满不出己, 左框折尸心和羽。 (“左框”即“”) 52 子耳了也框向上。 (“框向上”即“凵”) 53 女刀九臼山朝西。 (“山朝西”即“彐”) 54 又巴马,丢矢矣, (“矣”去“矢”为“厶”) 55 慈母无心弓和匕, (“母无心”即“”) 幼无力。     (“幼”去“力”为“幺”) 阿 11王旁青头戋(兼)五一,(“兼”与“戋”同音) 12 土士二干十寸雨。  13 大犬三羊古石厂, (“羊”指羊字底“”) 14 木丁西, 15 工戈草头右框七。 (“右框”即“匚”) 21 目具上止卜虎皮, (“具上”指具字的上部“”) 22 日早两竖与虫依。 23 口与川,码元稀, 24 田甲方框四车力。 (“方框”即“囗”) 25 山由贝,下框几。 31 禾竹一撇双人立, (“双人立”即“彳”) 反文条头共三一。 (“条头”即“夂”) 32 白手看头三二斤, 33 月彡(衫)乃用家衣底。 (“家衣底”即“豕、”) 34 人和八,三四里, (“人”和“八”在34里边)

  12. 纵横码的优点 • 取形自然 • 口诀简单、准确 一横二纵三点捺 叉四插五方块六 七角八八九是小 撇与左勾都是零 33 222 2112 21111 • 可以使用小键盘 • 词库庞大 • 词库覆盖率高 • 词组输入情形下重码率仍然低

  13. 纵横码的前景 • 无论简体繁体 • 无论方言口音 • 无论中文、韩文、日文 • 只要是汉字 • 小键盘 • 手机 • 固定电话 • 遥控器 • 无线键盘、无线鼠标

More Related