180 likes | 338 Views
第 7 讲 资源共享与国际化平台建设. 一 资源共享的理念 网络生存方式给我们提出了关于 “ 共享 ” 的新理念。网络生存方式包括以下 10 个方面: (1) 廉价快捷的 Email 这是推动网络走向民间和大众的最初和最有力的杠杆。它一下子把物理空间的距离缩小了,而且把费用降低到人们难以想象的程度。它造成了传统邮政邮电系统的改革,书信交往的方式很快将成为历史。这是通讯革命的前驱者,它已成为一切信息革命保守派无法抗拒的诱惑。. (2) 无拘无束的聊天室
E N D
一 资源共享的理念 • 网络生存方式给我们提出了关于“共享”的新理念。网络生存方式包括以下10个方面: • (1)廉价快捷的Email • 这是推动网络走向民间和大众的最初和最有力的杠杆。它一下子把物理空间的距离缩小了,而且把费用降低到人们难以想象的程度。它造成了传统邮政邮电系统的改革,书信交往的方式很快将成为历史。这是通讯革命的前驱者,它已成为一切信息革命保守派无法抗拒的诱惑。
(2)无拘无束的聊天室 • 聊天室是网上青年人经常光顾的地方。因为那里自由、宽松的环境,加上略带神秘色彩的“隐形”的聊天对象,可以无拘无束地发表自己的言论,试探对方对自己任何一种大胆观点的反应。我们姑且不去做什么道德价值观念方面的评论,单是这种表达与交际的方式,就是对现实表达与交际方式的补充。在很新鲜很有趣之余,还会带给人们更多的哲学思考。
(3)超越时空的浏览 • 网上的信息资源应有尽有,一下子突破了物理空间的限制,通过一根电话线就可以把世界各个角落的信息收集到自己的屏幕中。报纸、杂志、书籍、文献都不必说,甚至旅游、观光、博物、览胜,可以说应有尽有。难怪现在有一个仿造的成语叫“一网打尽”,有的干脆写成“e网打尽”。 • (4)周到的在线服务 • 出门旅行前关于买票、问路、外地的天气、食宿条件等相关信息,都可以从网络上查询清楚。而关于人才招聘、求职、求学、交友、房屋租赁、求医问药等也可以利用网络进行。
(5)开放的信息发布 • 广告本是许多商家花钱最多的一项正常性支出。前几年某个酒厂在中国中央电视台黄金时间波段,用3000多万元人民币竞标,创下了广告史上的天价。为了产品信息的发布,竟然要花去利润的大部分,这是新的信息价值观刺激下的产物。它从一个侧面反映了信息时代的一个特点。网络上信息发布的便捷和廉价,无疑是所有的经营者们可以弹冠相贺的福音。 • 此外,个人信息的自由发布,也是创造平等、自由、和谐、开放的人文环境的土壤。是社会进一步走向文明的必要基础。
(6)丰富多彩的娱乐 • 游戏娱乐本来是人生的一种天性,但是,由于种种条件和观念的限制,多人尤其是绝大多数的成年人已经无法体会其中的真正乐趣。无形的网络在这方面把人从各种各样的束缚中解放出来,在某种意义上把任从层层包裹着的“社会人”还原为充满纯真天性的“自然人”。因此有人说“电脑笔浅赡耆说摹巴婢摺薄=粽藕涂旖谧嗟墓ぷ饔肷钚枰钡胤潘 • 此外,包括CD-ROM的单机版和网络版影视节目的欣赏以及MP3的各种音乐的欣赏也使网络日益深入家庭、深入人们的生活。
(7)多样化的学习与教育 • 我国教育部启动的“21世纪教育振兴行动计划”的核心工程就是“现代教育技术和网络课程”。目前已经有20所网络教育学院面向全国正式招收本科生。国外也有多所网络大学在中国招收留学生。现在,通过国际互联网进行课程补习、专业进修、攻读学位、网上留学,都是很平常而且很方便的事情。 • (8)周密可靠的金融交易 • 中国的股票电子结算系统应该是最大的金融交易系统。而各家银行的电子转账系统、各种各样的信用卡例如牡丹卡、长城卡、金穗卡、金龙卡、邮政储蓄卡等等,可以联网结算、转账、十分方便地办理存储支取业务。现在在外地读书的大学生,几乎人人都使用异地存储结算的信用卡。这种由“持币”到“持卡”的改变是悄悄地发生在我们的身边的生活方式的变化之一。
(9)遍布全球的电子商务 • 尽管我们绝大多数居民还不习惯网上购货的消费方式、尽管我们的现实生活中还不具备成龙配套的电子商务的充分条件,但是,电子商务已经在向我们走近。当我们习惯与“物理”超市的购物方时候,当我们不再愿意把时间浪费在拥挤嘈杂的超市货架之间的时候,我们可能会感到在网上的靶槟狻背挑选商品有更多的自由和便利]
(10)友好方便的文件下载 • 网上的工具软件、图形图像资料、文本等各种各样的信息都可以免费或者有偿地下载。因为在服务器的存储器中,并不会因为被人下载而造成信息的丢失,恰恰相反,常常因为信息资源的被利用而增加了网站的知名度、进而增加了网站的点击和访问次数。这些都将成为网站的无形资产给他们带来难以估量的社会效益和经济效益。这正如盗版软件现象具有两面性一样,“盗版”只要不是以盈利为目的,反而会在某种意义上起到产品广告宣传的作用。这些为了自己使用的“盗版者”无形中成了产品的义务宣传员。因此,在市场开拓阶段,刺激盗版也许是商家的一种走向成功的营销策略。
二、资源共享的载体 • 汉字是中文资源共享的要载体,汉字平台是中文资源共享的重要基础。 • 1、汉字文化源远流长 • 汉字作为渊远流长的书面信息符号系统,不但记载了中华民族五千年灿烂的传统文明,而且在历史上曾经被周边民族借用来作为记录各该民族的语言,在世界上形成了独具特色的“汉字式文字”系统,直到今天,日本、韩国、新加坡等国家仍然使用汉字。汉字成为当今世界上使用人数最多摹⒍酪晃薅耐夹挝淖址畔低。汉语言文字是联合国六种工作语言文字之一。汉字既是中华民族祖先的伟大创造,也是历史上曾经使用和现在仍在使用的民族和人民智慧的共同结晶。中华传统文明和儒家经典构成了中日韩以及亚洲文化传统的源头和基础。汇集儒家经典文献的汉字典籍成为东亚文化共享的基础。
2)中文资源堪称世界之最 • 汉字的历史发展遵循了一条扩大不断“共享”范围的道路。汉字在东亚的传播和使用范围的扩大,历史地形成了一个“汉字文化圈”或者叫“汉字文化区”。 • 用汉字纪录的文献典籍,历史之久、数量之多、门类之广、价值之大,堪称世界之最。 据不完全统计,现存中文古籍在8万种以上。其中收录在《中国善本书提要》中的数目将近5000种。一部《四库全书》就汇集有中文古籍文献3462种、79300余卷、将近8亿字符;而《永乐大典》、《资治通鉴》、著名佛教经典更是不胜枚举。一部《中华大藏经》就多达5000余万字,许多重要的文献传世的不止一种版本,例如著名的韩国《高丽大藏经》等。国外英、美、法、日等国家图书馆、博物馆所收藏的中文文献数量之多、价值之大,举世皆知。中国大陆馆藏方志8700种、110000卷,大约占古籍文献总量的10分之1。内容涉及地方的政治、经济、军事、社会、自然、地理、文化、科技、人物等各种信息,无不具有重大的文献价值和学术价值。至于各种族谱、简牍、帛书、敦煌卷子、碑刻、墓志、摩崖等文字资料,更是数不胜数。所有这些都理应成为信息时代乃至后世人类共享的中文资源。
)“汉字平台”是资源共享的基础 • 只是因为过去限于各种条件的制约,无法将资源共享的任务提到议事日程。今天,在计算机信息处理技术高度发达、多媒体技术和硬件性能价格比大幅度提高的情况下,应该及早思考从根本上解决这个问题。在“人际”和“人-机”两个交际系统中,为了共享这些宝贵的资源,就必须有一个共同的“汉字平台”。 • 在这方面,中国、日本、韩国以及台湾、香港等使用汉字的国家和地区,都曾经处理了规模数量不等的汉字文献资料。其中起步较早、用力较多、处理文献数量也较多的应属台湾中央研究院历史语言研究所以及台史所、国史所、咨讯所等单位。日本的电子化佛教文献、韩国的电子版《高丽大藏经》等方面也作了相当可观的工作。但是由于所采用的是各自研制的字符集标准,所以其它地方的电脑系统无法共怼
三、字符集标准的演进 • )各自为政的标准 • ●中国大陆 • 早期的汉字字符集都是使用汉字的国家和地区自行研制确定的。其中,使用范围最大、人数最多的应属中华人民共和国国家标准简化汉字的字符集GB2312-80。它的全称是《信息交换用汉字编码字符集——基本集》,由中华人民共和国国家标准局主持研制,于1981年5月1日正式开始实施。GB2312-80总共收录682个非汉字符号和6763个汉字符号(含有39个非汉字偏旁部首)共7445个图形字符。
●中国台湾 • 中国台湾、香港等地区一直使用繁体汉字,繁体汉字的编码字符集主要以台湾的BIG5码代表。这是台湾资讯工业策进会根据1983年10月台湾行政院主持研制的《通用汉字标准交换码》、并于1992年5月修订公布的《中文标准交换码》制定的一个行业标准,共收录408个非汉字符号和13051个繁体汉字(因为有两个字重复,实际占位13053个)合计13461个图形字符。
●日本标准 • 日本1983年公布执行“日本工业标准汉字编码字符集JIS X 0208-1983”。共收入524个非汉字符号和6353个汉字字符。 • ●韩国标准 • 韩国KSC 5601-1987:共收入韩国汉字4888个,按音排序。因此,有200多个多音汉字被分别根据读音安排了对应的码位。
(二)分别扩展的标准 • ●中国大陆 • 1984年“全国计算机与信息处理标准化技术委员会”根据繁体字和简体字对应编码的原则,在基本集基础上,研制简体和繁体对应的字符集国家标准,其中简体字的字符集分别是:“基本集、辅助二集和辅助四集”,对应的繁体字符集位“第一辅助集、第二辅助集、第三辅助集” • 辅二(GB 7589-87)和辅四(GB 7590-87)作为基本集的补充,分别收入通用规范的简化字7237个和7039个。辅四集中还收入了4200多个类推简化字。 • 辅一(GB 12345-90)发布于1990年,与基本集相对应,因为有103个一简对多繁的汉字,所以实际收入对应的繁体字6866个。 • 辅三和辅五分别是辅二和辅四对应的繁体字符集,分别收入了7237个和7039个。这样,大陆的5个辅助集加上基本集总共收入汉字4万2千多字。
●中国台湾 • 台湾还有一个CCCII(Chinese Character Code for Information Interchange)编码字符集,1979年年12月25日由台湾 “国字整理小组”提出。该编码系统采用94面(plane)x 94行(row) x 94 列(cell) 的三个8位编码规则,提供了 830,584字符空间。共收入4,808 和17,032两极备用字、20,583个罕用字以及11,517个异体字,总共收字53,940个。 • 日本 • 日本JISX 0212-1990作为日本汉字交换编码字符集的辅助集,共收入非汉字符号266个,日本汉字有5801个,总共6067个图形符号,同样按形序排列。
(三)国际兼容的标准 • 为了将世界各民族的文字进行统一编码,国际标准化组织制定了UCS标准。中国受国际标准化组织( ISO )和国际电工组织( IEC )的委托,从 1988 年起,成立了“通用中文代码国际联合会”( ACCC ),联合日本、韩国、台湾、香港、新加坡等中文信息处理专家共同研制ISO10646C.J.K 的国际标准汉字字符集。1992 年 1 月,提出的标准文本共有汉字 20902 个(包括日本汉字和韩国汉字), 5 月正式通过作为国际标准。 • 《CJK统一汉字编码字符集》,基本上兼容了中国(包括大陆和台湾)、日本、韩国各自的汉字字符集和扩展字符集,是“三国四方”电脑用字符集的“并集”。 • 我们应当看到: • )CJK 收入了大量的异体字; • CJK所收入的20902个汉字实际上并不是20902个“字种”。例如简化字和繁体字的“分立”就造成了2千多个冗余位。 • )CJK不以处理中文古籍为目标; • 当时研制CJK的时候,并不是考虑“全部”中文信息资源的共享,而只是从现实信息交流与交换的角度出发的。因此,即使收了大陆的辅助集、日本和韩国的扩展字符集,也都不是针对中文古籍文献信息处理为目标的。