230 likes | 388 Views
台灣中文數字化發展現況及 推動措施. 缺字上網找 萬碼國標轉 傳播即時現 網網可通譯 (CMEX) 財團法人中文數位化技術推廣基金會 報告人:魏林梅 2004/2/23. 目錄. 中文現況 推動組織 中文資訊應用環境 推動措施. 中文碼 (Code). 註:本表未納入 IBM 、 NEC 、王安等主機碼。. 字形 (Font). 提供點陣字形 24*24 & 40*40 楷體向量字形 宋體向量字形 ( 預計於本年度完成 ) 註:教育部成立學者專家小組審查字形。. 文字整理. 台灣常用字字頻統計
E N D
台灣中文數字化發展現況及推動措施 缺字上網找 萬碼國標轉 傳播即時現 網網可通譯 (CMEX)財團法人中文數位化技術推廣基金會 報告人:魏林梅 2004/2/23
目錄 • 中文現況 • 推動組織 • 中文資訊應用環境 • 推動措施
中文碼(Code) 註:本表未納入IBM、 NEC、王安等主機碼。
字形(Font) • 提供點陣字形 24*24 & 40*40 • 楷體向量字形 • 宋體向量字形(預計於本年度完成) • 註:教育部成立學者專家小組審查字形。
文字整理 • 台灣常用字字頻統計 • 中國時報、聯合報、國小教科書、國小課外閱讀套書等 • 常用字約8000字、期中3000字一年用不到5次。 • 中文字排序標準 • 包含字的排序、讀音(一字多音)、部首、筆畫。 • 異體字的整理 • 工作期間約十年。 • 蒐錄的字約十萬字。 • 整理工作已完成,目前正在造字。 • 整理台灣方言用字 • 台語 • 客語
術語名詞 • 目前完成 • 資訊 • 通訊 • 電機、電 子 • 化學 • 大氣科學 • 化工 • 其它學門的尚在進行中。
推動組織 • 標準局於八十一年成立「資訊及通信標準推行委員會」,下設「中文資訊標準分組」 • 為推動中文資訊共通環境之建置,院處電子中心於八十九年八月成立「中文環境建置工作小組」,並下設ISO10646(Unicode)等技術組。 成員:經濟部標檢局、教育部國語推行委員會、研究發展考核委員會資訊管理處、內政部戶役政資訊小組、文化建設委員會資訊小組、財政部財稅資料中心、國家圖書館資訊組、中央研究院計算中心、 中推會、 資策會。
中文資訊應用環境功能 • 提供字文字碼屬性:字碼(CNS11643、BIG-5、BIG-5E、EUC、Unicode 、GBK) 、部首、筆劃、一字多音、輸入法(倉頡、注音) 、聲音、 字義(2002/12)等屬性。 • 新增中文字碼作業程序 • 自造字整理及管理機制 • 各類字碼轉換表及工具 • 網頁自造字轉換工具 • 跨平台全字庫文書編輯軟體 • 中文資訊共通平台
中文資訊應用環境架構圖 查詢 一般使用者 http://www.cns11643.gov.tw/seeker(漢字庫網站) 全字庫應用工具4.0 新增字 全字庫應用工具4.0 • Linux 6.2 • 目前收集字數:76,067字 跨平台文書編輯軟體 機關團體使用者 網頁自造字轉換工具 http://www.cns11643.gov.tw (全字庫網站) 網頁設計者 中文資訊共通平台 大型資訊系統(如戶政、地政)
目前收集字數:76,067字 全字庫應用工具4.0 全字庫網站 ( http://www.cns11643.gov.tw) <<查詢自造字>> 自造字 自造字 自造字 ☆機關內部自造字管理者(未曾自行造字) ☆一般使用者 ☆機關內部自造字管理者(之前已自行造字) <<自造字彙總工具>> <<字形轉入工具>> <<字形轉入工具>> <<對照表匯入工具>> <<字形轉入工具>> <<對照表匯入工具>> 個人自造字對照表 <<自造字分享>> <<自造字分享>> <<舊文件改用共用字集工具>> <<原自造字對照表建立工具>> ☆機關內部使用者(無自行造字者) ☆機關內部使用者(有自行造字者) ☆機關內部使用者 ☆機關內部使用者 不同使用者間文件交換 <<轉碼工具>> 適用作業系統:Win95、Win98、Win NT、Win Me、Win2000 <<回中文資訊應用環境架構圖>>
網頁自造字顯示機制 瀏覽器 原始網頁內容 ☆網頁設計者 ☆一般使用者 造字法 游錫? 自行造字 拼湊法 游錫(方方土) 游錫(方方土) 全字庫工具法 <<網頁自造字轉換工具>> 自造字 網頁自造字即時轉換 全字庫文書編輯軟體法 自造字輸入及顯示介面 全字庫網站 ( http://www.cns11643.gov.tw) • 目前收集字數:76,067字 <<回中文資訊應用環境架構圖>>
CNS11643國標碼全字庫 <<回中文資訊平台架構圖>> <<回全字庫應用工具架構圖>> <<回網頁自造字顯示機制>> <<回中文共通平台架構圖>>
ISO10646漢字庫網站 <<回中文資訊平台架構圖>> <<回全字庫應用工具架構圖>> <<回網頁自造字顯示機制>> <<回中文共通平台架構圖>>
轉碼工具 提供純文字文件轉換為CNS碼,或CNS碼與BIG-5、EUC 、 Unicode 、 GBK等常用中文內碼互轉。 <<回全字庫應用工具架構圖>>
對照表匯入工具 提供自造字管理者保留機關內舊有自造字,並建立與CNS之對照表。 <<回全字庫應用工具架構圖>>
自造字彙整工具 提供單位自造字管理者整合內部個人電腦上原有的自造字。 <<回全字庫應用工具架構圖>>
字形轉入工具 將自造字字形安裝於個人電腦系統造字區中。 <<回全字庫應用工具架構圖>>
網頁自造字轉換工具 提供網頁自造字轉換工具,解決網頁缺字顯示。 <<回網頁自造字顯示機制>>
自造字網頁 <<回網頁自造字顯示機制>>
跨平台全字庫文書編輯軟體 <<回中文資訊應用環架構>>
推動措施 • 擴增中文字集(如公司行號、化學名、動物學名、宗教用字) 、字形(製作明體與楷體向量字形)、及屬性(讀音、字義、相關詞、簡繁對照等),充實全字庫網站內容。 • 藉由全字庫文書編輯軟體之輸入及顯示模組,開發政府旗艦計畫下之中文資訊共通平台。 • 提供業界加值全字庫之機制,如字形、輸入法、 語音輸出等。 • 繼續參與國際漢字編碼會議(IS0/IEC JTC1/SC2/WG2委員會、UNICODE技術委員會),使台灣電腦中文標準與國際標準接軌。
中文相關標準 • 制定「中文資訊排序屬性標準」。(審查中) • 研擬「網域名稱專用繁簡字碼對照表」草案。 • 依CNS11643字面,制定「中文字集字形國家標準」。(預計於本年度完成)。 • 研擬基本部件和基本筆形標準。