1 / 23

台灣中文數字化發展現況及 推動措施

台灣中文數字化發展現況及 推動措施. 缺字上網找 萬碼國標轉 傳播即時現 網網可通譯 (CMEX) 財團法人中文數位化技術推廣基金會 報告人:魏林梅 2004/2/23. 目錄. 中文現況 推動組織 中文資訊應用環境 推動措施. 中文碼 (Code). 註:本表未納入 IBM 、 NEC 、王安等主機碼。. 字形 (Font). 提供點陣字形 24*24 & 40*40 楷體向量字形 宋體向量字形 ( 預計於本年度完成 ) 註:教育部成立學者專家小組審查字形。. 文字整理. 台灣常用字字頻統計

russell
Download Presentation

台灣中文數字化發展現況及 推動措施

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 台灣中文數字化發展現況及推動措施 缺字上網找 萬碼國標轉 傳播即時現 網網可通譯 (CMEX)財團法人中文數位化技術推廣基金會 報告人:魏林梅 2004/2/23

  2. 目錄 • 中文現況 • 推動組織 • 中文資訊應用環境 • 推動措施

  3. 中文碼(Code) 註:本表未納入IBM、 NEC、王安等主機碼。

  4. 字形(Font) • 提供點陣字形 24*24 & 40*40 • 楷體向量字形 • 宋體向量字形(預計於本年度完成) • 註:教育部成立學者專家小組審查字形。

  5. 文字整理 • 台灣常用字字頻統計 • 中國時報、聯合報、國小教科書、國小課外閱讀套書等 • 常用字約8000字、期中3000字一年用不到5次。 • 中文字排序標準 • 包含字的排序、讀音(一字多音)、部首、筆畫。 • 異體字的整理 • 工作期間約十年。 • 蒐錄的字約十萬字。 • 整理工作已完成,目前正在造字。 • 整理台灣方言用字 • 台語 • 客語

  6. 術語名詞 • 目前完成 • 資訊 • 通訊 • 電機、電 子 • 化學 • 大氣科學 • 化工 • 其它學門的尚在進行中。

  7. 推動組織 • 標準局於八十一年成立「資訊及通信標準推行委員會」,下設「中文資訊標準分組」 • 為推動中文資訊共通環境之建置,院處電子中心於八十九年八月成立「中文環境建置工作小組」,並下設ISO10646(Unicode)等技術組。 成員:經濟部標檢局、教育部國語推行委員會、研究發展考核委員會資訊管理處、內政部戶役政資訊小組、文化建設委員會資訊小組、財政部財稅資料中心、國家圖書館資訊組、中央研究院計算中心、 中推會、 資策會。

  8. 中文資訊應用環境功能 • 提供字文字碼屬性:字碼(CNS11643、BIG-5、BIG-5E、EUC、Unicode 、GBK) 、部首、筆劃、一字多音、輸入法(倉頡、注音) 、聲音、 字義(2002/12)等屬性。 • 新增中文字碼作業程序 • 自造字整理及管理機制 • 各類字碼轉換表及工具 • 網頁自造字轉換工具 • 跨平台全字庫文書編輯軟體 • 中文資訊共通平台

  9. 中文資訊應用環境架構圖 查詢 一般使用者 http://www.cns11643.gov.tw/seeker(漢字庫網站) 全字庫應用工具4.0 新增字 全字庫應用工具4.0 • Linux 6.2 • 目前收集字數:76,067字 跨平台文書編輯軟體 機關團體使用者 網頁自造字轉換工具 http://www.cns11643.gov.tw (全字庫網站) 網頁設計者 中文資訊共通平台 大型資訊系統(如戶政、地政)

  10. 目前收集字數:76,067字 全字庫應用工具4.0 全字庫網站 ( http://www.cns11643.gov.tw) <<查詢自造字>> 自造字 自造字 自造字 ☆機關內部自造字管理者(未曾自行造字) ☆一般使用者 ☆機關內部自造字管理者(之前已自行造字) <<自造字彙總工具>> <<字形轉入工具>> <<字形轉入工具>> <<對照表匯入工具>> <<字形轉入工具>> <<對照表匯入工具>> 個人自造字對照表 <<自造字分享>> <<自造字分享>> <<舊文件改用共用字集工具>> <<原自造字對照表建立工具>> ☆機關內部使用者(無自行造字者) ☆機關內部使用者(有自行造字者) ☆機關內部使用者 ☆機關內部使用者 不同使用者間文件交換 <<轉碼工具>> 適用作業系統:Win95、Win98、Win NT、Win Me、Win2000 <<回中文資訊應用環境架構圖>>

  11. 網頁自造字顯示機制 瀏覽器 原始網頁內容 ☆網頁設計者 ☆一般使用者 造字法 游錫? 自行造字 拼湊法 游錫(方方土) 游錫(方方土) 全字庫工具法 <<網頁自造字轉換工具>> 自造字 網頁自造字即時轉換 全字庫文書編輯軟體法 自造字輸入及顯示介面 全字庫網站 ( http://www.cns11643.gov.tw) • 目前收集字數:76,067字 <<回中文資訊應用環境架構圖>>

  12. CNS11643國標碼全字庫 <<回中文資訊平台架構圖>> <<回全字庫應用工具架構圖>> <<回網頁自造字顯示機制>> <<回中文共通平台架構圖>>

  13. ISO10646漢字庫網站 <<回中文資訊平台架構圖>> <<回全字庫應用工具架構圖>> <<回網頁自造字顯示機制>> <<回中文共通平台架構圖>>

  14. 轉碼工具 提供純文字文件轉換為CNS碼,或CNS碼與BIG-5、EUC 、 Unicode 、 GBK等常用中文內碼互轉。 <<回全字庫應用工具架構圖>>

  15. 對照表匯入工具 提供自造字管理者保留機關內舊有自造字,並建立與CNS之對照表。 <<回全字庫應用工具架構圖>>

  16. 自造字彙整工具 提供單位自造字管理者整合內部個人電腦上原有的自造字。 <<回全字庫應用工具架構圖>>

  17. 字形轉入工具 將自造字字形安裝於個人電腦系統造字區中。 <<回全字庫應用工具架構圖>>

  18. 網頁自造字轉換工具 提供網頁自造字轉換工具,解決網頁缺字顯示。 <<回網頁自造字顯示機制>>

  19. 自造字網頁 <<回網頁自造字顯示機制>>

  20. 跨平台全字庫文書編輯軟體 <<回中文資訊應用環架構>>

  21. ISO10646漢字庫網頁

  22. 推動措施 • 擴增中文字集(如公司行號、化學名、動物學名、宗教用字) 、字形(製作明體與楷體向量字形)、及屬性(讀音、字義、相關詞、簡繁對照等),充實全字庫網站內容。 • 藉由全字庫文書編輯軟體之輸入及顯示模組,開發政府旗艦計畫下之中文資訊共通平台。 • 提供業界加值全字庫之機制,如字形、輸入法、 語音輸出等。 • 繼續參與國際漢字編碼會議(IS0/IEC JTC1/SC2/WG2委員會、UNICODE技術委員會),使台灣電腦中文標準與國際標準接軌。

  23. 中文相關標準 • 制定「中文資訊排序屬性標準」。(審查中) • 研擬「網域名稱專用繁簡字碼對照表」草案。 • 依CNS11643字面,制定「中文字集字形國家標準」。(預計於本年度完成)。 • 研擬基本部件和基本筆形標準。

More Related