280 likes | 407 Views
中文資訊標準發展現況及推動措施. 缺字上網找 萬碼國標轉 傳播即時現 網網可通譯 潘城武 (Pan Cheng-Wu) Chengwu@dgbas.gov.tw,02-23823739 www.cns11643.gov.tw,www.cns11643.gov.tw/seeker 行政院主計處電子處理資料中心 EDP Center,DGBAS,EY 2002/8/3. 目錄. 中文現況 推動組織 中文資訊應用環境 推動措施. 中文碼 (Code). 註:本表未納入 IBM 、 NEC 、王安等主機碼。. 40*40 明 ( 宋 ) 體 點矩陣字型.
E N D
中文資訊標準發展現況及推動措施 缺字上網找 萬碼國標轉 傳播即時現 網網可通譯 潘城武(Pan Cheng-Wu) Chengwu@dgbas.gov.tw,02-23823739 www.cns11643.gov.tw,www.cns11643.gov.tw/seeker 行政院主計處電子處理資料中心 EDP Center,DGBAS,EY 2002/8/3
目錄 • 中文現況 • 推動組織 • 中文資訊應用環境 • 推動措施
中文碼(Code) 註:本表未納入IBM、 NEC、王安等主機碼。
40*40明(宋)體點矩陣字型 字面/字數 製作單位 1~2 (13,051字) 3 (6,148字) 4~7 (34,976字) 15 (6,831字) 12~14 (10,659字) 本中心 於1981年 完成 於1988年 完成 於1999年 完成 內政部 於1991年 完成 於2001年 完成 備 註 1~7字面:國家標準;12~15字面:使用者加字區(準國家標準) 已製作約4,000 ISO10646簡化字,預計2002年底完成約13,000字在CNS11643未含ISO10646他國用字 字型(Font)
楷體向量字型 字面/字數 製作單位 1~2 (13,067字) 3~4 (13,446字) 5 (8,603字) 6~7 (12,927字) 12~15 (17,490字) 本中心 於2000年完成(國語會協助審查) 於2001年完成(國語會協助審查) 預定2001年完成 國語會 1、1993年完成字稿。 2、預定2002年完成數位化。 預定2003年 下半年製作 預定2003年 下半年製作 預定2003年上半年製作 備 註 1~7字面:國家標準;12~15字面:使用者加字區(準國家標準) 已製作約4,000 ISO10646簡化字,預計2002年底完成約13,000字在CNS11643未含ISO10646他國用字 字型(Font)
明(宋)體向量字型 字面/字數 製作單位 1~2、部分3 (17,266字) 部分3、4~7 (約31,000字) 12~15 (17,490字) 國語會 1、82年完成字稿。 2、預定於1~7楷體製作完成後予以數位化。 預定於1~7楷體完成後開始製作 備 註 1~7字面:國家標準;12~15字面:使用者加字區(準國家標準) 字型(Font)
標準(Standard) • CNS11643「中文標準交換碼」 • CNS11643-1「中文標準交換碼使用方法」 • CNS14366「中文分詞處理原則」 • CNS14147-1「資訊技術-字型資訊交換碼-第一部:架構」 • CNS14147-2「資訊技術-字型資訊交換碼-第二部:交換格式」 • CNS14147-3「資訊技術-字型資訊交換碼-第三部:字符形狀表示」 • CNS14583「中文自造字字型傳輸交換格式」
推動組織 • 標準局於八十一年成立「資訊及通信標準推行委員會」,下設「中文資訊標準分組」 • 為推動中文資訊共通環境之建置,院處電子中心於八十九年八月成立「中文環境建置工作小組」,並下設ISO10646(Unicode)等技術組。 成員:經濟部標檢局、教育部國語推行委員會、研究發展考核委員會資訊管理處、內政部戶役政資訊小組、文化建設委員會資訊小組、財政部財稅資料中心、國家圖書館資訊組、中央研究院計算中心、 中推會、 資策會。
中文資訊應用環境功能 • 提供字文字碼屬性:字碼(CNS11643、BIG-5、BIG-5E、EUC、Unicode 、GBK) 、部首、筆劃、一字多音、輸入法(倉頡、注音) 、聲音(2002/12)、 字義(2002/12)等屬性。 • 新增中文字碼作業程序 • 自造字整理及管理機制 • 各類字碼轉換表及工具 • 網頁自造字轉換工具 • 跨平台全字庫文書編輯軟體(2002/9) • 中文資訊共通平台(2002/12)
中文資訊應用環境架構圖 查詢 • Linux 6.2 • ISO10646(Seeker) • 可查詢字數:70,205字 • C1暫編字:26,097字 一般使用者 http://www.cns11643.gov.tw/seeker(漢字庫網站) 全字庫應用工具4.0 新增字 全字庫應用工具4.0 • Linux 6.2 • 目前收集字數:76,067字 • 可下載字數:58,067字 • (1) 明體可下載字數:58,067字 • (2) 楷體可下載字數:13,446字 • 九月初預定完成:8,603字 • 公告字數:18,000字 • 符號下載:230字 跨平台文書編輯軟體 機關團體使用者 網頁自造字轉換工具 http://www.cns11643.gov.tw (全字庫網站) 網頁設計者 中文資訊共通平台 大型資訊系統(如戶政、地政)
目前收集字數:76,067字 • 可下載字數:58,067字 • (1) 明體可下載字數:58,067字 • (2) 楷體可下載字數:13,446字 • 九月初預定完成:8,603字 • 公告字數:18,000字 • 符號下載:230字 全字庫應用工具4.0 全字庫網站 ( http://www.cns11643.gov.tw) <<查詢自造字>> 自造字 自造字 自造字 ☆機關內部自造字管理者(未曾自行造字) ☆一般使用者 ☆機關內部自造字管理者(之前已自行造字) <<自造字彙總工具>> <<字形轉入工具>> <<字形轉入工具>> <<對照表匯入工具>> <<字形轉入工具>> <<對照表匯入工具>> 個人自造字對照表 <<自造字分享>> <<自造字分享>> <<舊文件改用共用字集工具>> <<原自造字對照表建立工具>> ☆機關內部使用者(無自行造字者) ☆機關內部使用者(有自行造字者) ☆機關內部使用者 ☆機關內部使用者 不同使用者間文件交換 <<轉碼工具>> 適用作業系統:Win95、Win98、Win NT、Win Me、Win2000 <<回中文資訊應用環境架構圖>>
網頁自造字顯示機制 瀏覽器 原始網頁內容 ☆網頁設計者 ☆一般使用者 造字法 游錫? 自行造字 拼湊法 游錫(方方土) 游錫(方方土) 全字庫工具法 <<網頁自造字轉換工具>> 自造字 網頁自造字即時轉換 全字庫文書編輯軟體法 自造字輸入及顯示介面 全字庫網站 ( http://www.cns11643.gov.tw) • 目前收集字數:76,067字 • 可下載字數:58,067字 • (1) 明體可下載字數:58,067字 • (2) 楷體可下載字數:13,446字 • 九月初預定完成:8,603字 • 公告字數:18,000字 • 符號下載:230字 <<回中文資訊應用環境架構圖>>
中文共通平台架構圖 • 可查詢字數:70,205字 • C1暫編字:26,097字 http://www.cns11643.gov.tw/seeker(漢字庫網站) 新增字 前端資料接收器 • 目前收集字數:76,067字 • 可下載字數:58,067字 • (1) 明體可下載字數:58,067字 • (2) 楷體可下載字數:13,446字 • 九月初預定完成:8,603字 • 公告字數:18,000字 • 符號下載:230字 【對照表轉換】 查詢、異動、列印資料 專屬系統 大型資訊系統資料庫(如戶政、地政) 承辦人員 http://www.cns11643.gov.tw (全字庫網站) 字型輸入機制 字型顯示機制 大型資訊系統WWW網站(如戶政、地政) 資料查詢 資料異動 瀏覽器 瀏覽器 一般使用者 承辦人員 <<回中文資訊應用環境架構圖>> 作業平台:Win95、Win98 、WinMe 、WinNT 、Win2000 、Linux 、Unix ......
CNS11643國標碼全字庫 <<回中文資訊平台架構圖>> <<回全字庫應用工具架構圖>> <<回網頁自造字顯示機制>> <<回中文共通平台架構圖>>
ISO10646漢字庫網站 <<回中文資訊平台架構圖>> <<回全字庫應用工具架構圖>> <<回網頁自造字顯示機制>> <<回中文共通平台架構圖>>
轉碼工具 提供純文字文件轉換為CNS碼,或CNS碼與BIG-5、EUC 、 Unicode 、 GBK等常用中文內碼互轉。 <<回全字庫應用工具架構圖>>
對照表匯入工具 提供自造字管理者保留機關內舊有自造字,並建立與CNS之對照表。 <<回全字庫應用工具架構圖>>
自造字彙整工具 提供單位自造字管理者整合內部個人電腦上原有的自造字。 <<回全字庫應用工具架構圖>>
字形轉入工具 將自造字字型安裝於個人電腦系統造字區中。 <<回全字庫應用工具架構圖>>
原自造字對照表建立工具 <<回全字庫應用工具架構圖>>
舊文件改共用字集工具 <<回全字庫應用工具架構圖>>
網頁自造字轉換工具 提供網頁自造字轉換工具,解決網頁缺字顯示。 <<回網頁自造字顯示機制>>
自造字網頁 <<回網頁自造字顯示機制>>
跨平台全字庫文書編輯軟體 <<回中文資訊應用環架構>>
對照表範例 BIG-5 CNS11643 Unicode EUC GBK ISO10646 A140 1-2121 3000 A141 1-2122 FF0C A142 1-2123 3001 A143 1-2124 3002 A149 1-212A FF01 A14A 1-212B FE30 <<回中文資訊應用環境架構圖>>
推動措施 • 擴增中文字集(如公司行號、化學名、動物學名、宗教用字) 、字型(製作明體與楷體向量字型)、及屬性(讀音、字義、相關詞、簡繁對照等),充實全字庫網站內容。 • 藉由全字庫文書編輯軟體之輸入及顯示模組,開發政府旗艦計畫下之中文資訊共通平台。 • 提供業界加值全字庫之機制,如字型、輸入法、 語音輸出等。 • 賡續參與國際漢字編碼會議(IS0/IEC JTC1/SC2/WG2委員會、UNICODE技術委員會),使國內電腦中文標準與國際標準接軌。
推動措施 • 制定CNS14649-1「資訊技術-廣用多八位元編碼字元集(UCS)-第1部:架構及基本多語文字面」(ISO10646-1)。 • 研擬「資訊技術-廣用多八位元編碼字元集(UCS)-第2部:輔助字面」(ISO10646-2)。 • 審查完成「中文資訊排序屬性標準」草案。 • 研擬「網域名稱專用繁簡字碼對照表」草案。 • 依CNS11643字面,制定「中文字集字型國家標準」。