1.36k likes | 2.05k Views
网上国际交流. 沈卫平 E-mail: shenwp@mater.ustb.edu.cn 科学网博客地址: http://www.sciencenet.cn/blog/ 沈卫平 .htm 电话: 62332472 (办) 62333451 (宅) 手机: 13693054652. 本课程主要内容. Internet 的过去和现在 网络信息搜索 网上信息交流 网页与网站制作 网上联系出国留学 请同学们及早提出教学要求和意见. 作 业. 在 Internet 网上进行如下工作之一: 关于网络的论文 检索所需的英文信息并下载(可只下载感兴趣的几页)
E N D
网上国际交流 沈卫平 E-mail: shenwp@mater.ustb.edu.cn • 科学网博客地址: • http://www.sciencenet.cn/blog/沈卫平.htm 电话:62332472(办)62333451(宅) 手机:13693054652
本课程主要内容 • Internet的过去和现在 • 网络信息搜索 • 网上信息交流 • 网页与网站制作 • 网上联系出国留学 请同学们及早提出教学要求和意见
作 业 在Internet网上进行如下工作之一: • 关于网络的论文 • 检索所需的英文信息并下载(可只下载感兴趣的几页) • 制作中英文网页、网站或博客 • 联系出国留学经历 • 并下载有关外文信息 • 要求自己写出至少一页完成作业的过程、心得感想,学期12周前,E-Mail给我。 • 网页或网站只要告诉我网址,不要传给我的信箱,太大了进不来。 • 作业文件名:学号-姓名-班级。 • 本学期12周前,E-Mail给我。
未来50年我国现代化要迈三道“坎” • 城镇化 大约从2000年到2010年,基本目标包括全国基本完成工业化和城镇化,沿海发达地区基本完成信息化和基本普及高等教育,民主化取得新进展,平均生活质量达到世界平均水平,基本实现第一次现代化。全国平均从第一次现代化的发展期进入成熟期,发达地区进入第二次现代化。
信息化 约为2010年至2020年。基本目标包括全国基本实现信息化,完成工业化和城镇化,发达地区普及高等教育,全国知识传播水平超过当时世界平均水平等,完成第一次现代化。全国平均进入第二次现代化的起步期,发达地区进入第二次现代化的发展期。
知识化 约为2020年至2050年。基本目标是知识创新、知识传播、生活质量、经济质量和现代化水平全面超过当时世界平均水平;发达地区完成知识化,达到或接近当时世界发达国家水平;全国完成信息化和普及高等教育,基本实现第二次现代化。
中国现代化战略研究课题组提出了九大重点: • 工业化和工业转移并重 • 城市化和城市扩散并举 • 大力促进民主化进程 • 继续推进信息化和网络化 • 大力促进知识化和发展高等教育 • 继续参与经济全球化 • 建设国家创新体系 • 实施生态现代化战略 • 积极推行按贡献分配
2001年我国加入WTO后,面对日益激烈的国际竞争形势,我们起码要具备三个方面的知识。2001年我国加入WTO后,面对日益激烈的国际竞争形势,我们起码要具备三个方面的知识。 • 本专业的知识 • 工商管理方面的知识 • 信息管理方面的知识 比如如何对情报进行收集和分析。在英文原文中,科技情报被称作information,而竞争情报则被称作intelligence,从字面上就可以看出竞争情报在内容分析上的智力成分要更多一些。要想在竞争中取得胜利,首先就要有情报的意识,掌握收集情报的技术。重要的公开情报来源之一就是Internet。
飞速发展的因特网正将全世界的丰富信息资源带到我们每个人面前,已成为知识经济时代不可或缺的基本工具。可以说,你所需要的绝大多数信息都在因特网上存在,而且它们中的多数都可以免费获得,关键在于你能否准确地找到它们。为了帮助你检索和获得网络上的丰富信息,一大批网上信息检索工具应运而生。但是,令你苦恼的是,即使使用这些检索工具,你往往得到的是成千上万条似是而非的网站名称,面对它们你不得不承认“因特网信息检索定律”:在因特网上你花了时间和金钱却总是找到(甚至只能找到)很多你不需要的信息。飞速发展的因特网正将全世界的丰富信息资源带到我们每个人面前,已成为知识经济时代不可或缺的基本工具。可以说,你所需要的绝大多数信息都在因特网上存在,而且它们中的多数都可以免费获得,关键在于你能否准确地找到它们。为了帮助你检索和获得网络上的丰富信息,一大批网上信息检索工具应运而生。但是,令你苦恼的是,即使使用这些检索工具,你往往得到的是成千上万条似是而非的网站名称,面对它们你不得不承认“因特网信息检索定律”:在因特网上你花了时间和金钱却总是找到(甚至只能找到)很多你不需要的信息。
Internet概况 • Internet是通过标准通信方式将世界各地的计算机网络连接起来的网络体系。Internet 起源于美国在20世纪60年代和70年代初所建立的军用实验通信网APPANET(阿帕网)。Internet是通过TCP(Transmission Control Protocol,传输控制协议)/IP(Internet Protocol,网际协议)协议连接起来的计算机网络的集合。
第一代是20世纪70~80年代,主要的成就是把分布在世界各地的计算机用TCP/IP协议连接起来,主要的应用是e-mail。第一代是20世纪70~80年代,主要的成就是把分布在世界各地的计算机用TCP/IP协议连接起来,主要的应用是e-mail。 • 第二代是20世纪90年代,主要成就是把成千上万个网站上的网页连接起来,主要的应用是Web信息浏览以及电子商务等信息服务。 • 目前正处于从第二代Internet向第三代Internet过渡的转型期。 • 第三代Internet可称为信息服务网格(Information Service Grid),其主要特点是不仅仅包括计算机和网页,网格试图实现互联网上所有资源的全面连通,包括计算资源、存储资源、通信资源、软件资源、信息资源、知识资源等,都连接成一个整体,整个网格如同一台巨大无比的计算机,向每个用户提供一体化的服务。
物质与能量原则上只能分享,一吨水、一度电甲使用了,乙就不能使用。而信息的最大特点是可以共享,不会因使用同一信息资源的用户多而耗尽。物质与能量原则上只能分享,一吨水、一度电甲使用了,乙就不能使用。而信息的最大特点是可以共享,不会因使用同一信息资源的用户多而耗尽。 • 第三代Internet要解决的信息共享不是一般的文件交换与信息浏览,而是要把所有个人与单位连接成一个虚拟的社会组织(Virtual Organization),实现在动态变化环境中有灵活控制的协作式信息资源共享。信息服务网格与Web最大的区别是一体化,即用户看到的不是数不清的门类繁多的网站,而是单一的入口和单一系统映象。比如一个用户打算出去旅游,只要向网格系统一次性输入出游人数、出游地点和时间以及其他特殊要求,不必分别与航空公司、铁路、旅行社、旅馆、气象部门、商店等单位联系,信息服务网格将自动与各有关部门协调,给用户完整的旅游方案并做好全部预订手续。
随着网格研究在学术界的加速,信息产业界的大公司也相继公布了与网格目标一致的研究开发计划。惠普、IBM、微软、Sun等公司最近取得共识,支持XML、SOAP、UDDI等万维网标准,从而更有利于开发新一代的网络应用,即万维网服务。其目的是将因特网上的资源和信息汇聚在一起,组合成企业和消费者所需要的服务。惠普推出了eSpeak万维网服务平台;IBM用它的WebSphere平台和一系列中间件实现万维网服务;微软的路线是通过其.Net计划和C#语言实现万维网服务;Sun则通过Open Network Environment(Sun ONE)计划和Java平台来实现它。另外,IBM最近宣布,将投资40亿美元,启动一个全公司的“网格计算创新计划”;Sun则在2000年9月公布了其网格引擎软件。
国际上的网格研究主要采用开放源码、公开合作的模式。全球网格论坛(Global Grid Forum)是目前主要的合作组织,感兴趣的读者可以从其网址www.gridforum.org找到关于网格研究现状的信息。 • 在国内,中国科学院计算技术研究所对网格技术的研究已较为深入。计算所的网格技术研究在尽量使用国际上已有的先进技术的同时,坚持自己的创新。有特色,才能参与国际标准的制订。计算所网格研究的最大特色是“服务网格”的思想,而国际上的网格研究目前主要面向科学计算。
Internet基本结构 IP地址 • 为了在分布于世界各地的计算机间准确地传输信息,Internet为连入的每一台主机确定了一个机器地址,称为IP地址。IP地址是一个32位二进制数字,往往将它按每8位换算成十进制数字(0-256)写成所谓“点分十进制”IP地址,例如可写为202.96.128.110。IP地址由网络管理机构分配给入网主机。 • 下一代互联网协议IPv6采用128位IP地址,“让每一粒沙子都有IP地址”。
域名 • IP地址的“点分十进制”方式对一般人没有逻辑意义,因此人们常用带有逻辑意义、容易记忆的域名(Domain Name)来表示IP地址。 • 美国域名由主机名、子网名、网络分类名从左到右构成,中间用“.”分隔成。 • 在其它国家,域名组成一般是从左到右“主机名.机构子网名.分类名或地区名.国家名”。 • Internet实际使用的只是IP地址,Internet主机需和相应的域名服务器相连,将用户输入的域名转换为IP地址。 • 分类名或地区名如:edu(教育和科研机构)、com(商业界)、gov(政府机构)、mil(军事机构)、net(网络管理机构)、org(非盈利机构)、bj(北京)、sh(上海)和sc(四川)等。
统一资源定位器 • 为了确定具体信息资源在网络中的位置,Internet用URL(Uniform Resource Locator,统一资源定位器)来描述具体资源及其位置。URL由三部分组成:应用协议、主机地址、目录路径和文件名,例如http://www.ustb.edu.cn/xxgl/students/xxx97.htm, http为超文本传输协议,www.ustb.edu.cn为主机域名,xxgl/students/和xxx97.htm分别为目录路径和文件名。htm为HTML文件类型,Hypertext Markup Language超文本文件标记语言。
万维网信息资源 • WWW(World-Wide Web,万维网或环球网)是Tim Berners-Lee等人为了利用超文本方式传递信息于20世纪90年代初期发明的,由于其能够方便迅速地浏览和传递分布于网络各处的文字、图像、声音和多媒体超文本信息,90年代中期以后得到迅速发展,Internet上WWW服务器以每年翻几翻的速度增加,WWW信息资源已成为Internet的主流。
万维网的结构和特点 • (1)超文本与WWW • WWW就是在Internet环境下实现分布式超文本检索的体系。它使用超文本标记语言HTML(Hypertext Markup Language)在文件中标记链源及相应的链宿。 • 其中链宿恰好是用URL来描述。 • 在浏览文件时,链源被特殊显示,例如加下划线,而链宿则隐藏着不予显示。用户如果对该链源所涉及的内容感兴趣,可用鼠标点击链源,系统将自动析取链宿URL中的信息,利用指定的应用协议、到指定的主机地址和路径中调出指定的文件、然后予以显示。在这一过程中,用户不知道也不必操心链宿文件在网络上什么位置、如何去连接相关主机和调用文件。
Web1.0、Web2.0和Web3.0 • Web1.0时代,Yahoo的成功是因为他们有一群编辑,把网上的文章或网址组合在一起,类似大杂烩,web1.0的本质是联合,网友是基本不参与内容建设的,当然也没有什么收入;3年前,以MySpace为代表的Web2.0来了,网友说“我的地盘我自己做主”,web2.0的本质就是互动,它让网民更多地参与信息的生产和传播。Web 2.0代表着Internet正在从由静态网页集合向提供软件服务载体的演进。 • 对于Web2.0,网络精英(如博客写手、维基百科自愿者)看到了久违的Internet精神:平等、开放、协作共享、张扬个性、对于创造的高度尊重。草根网民们看到的是更好的网络体验:可享受更加人性化、便利化的“技术与观念”,更加丰富、优质、可获得的网络信息服务,网络上的社区、互动、资源的自我组织……特别是大陆许多人有“指点江山”的习惯。但是web2.0的缺点还是没有体现出网民劳动的价值。 • Web1.0和Web2.0时代,中国没有巨型的网络公司出现。Web3.0时代,中国一定会出现和google、yahoo等齐名的大公司。为什么这么说? 这是由Web3.0的特点决定的:网民即使信息产品的生产者,又是信息产品的拥有者,他们参与产品的开发维护,最后分享产品的利润。
Web1.0、Web2.0和Web3.0 • Web1.0 网站是别人的 我只是看看/陌路人(精神和物质都没有的) (代表者:Yahoo.com) • Web2.0 网站是朋友的/劳动但是没有利益的/活雷锋(精神有的,物质没有的) (代表者:MySpace.com) • Web3.0 网站是自己的/自己生产自己得利/主人(精神和物质都有的) (代表者:HeyHot.com) 中国热线(HeyHot.com)是全球第一家Web3.0公司,以新媒体、新门户、新网民为定位,走国际化和专业化路线。中国热线(HeyHot.com)和网友(包括版主和博客等等)分享利润,是能够更好地体现网民的劳动价值,并且能够实现价值均衡分配的一种互联网方式。Web3.0跟Web2.0一样,不仅是技术的创新,更是商业思想的创新,进而推进技术的发展和应用。
从HTML到XML • XML(eXtensible Markup Language,可扩展标记语言),是当前最热门的网络技术之一,被称为“第二代Web语言”、“下一代网络应用的基石”。自它被提出以来,几乎得到了业界所有大公司的支持,丝毫不逊于当年HTML被提出时的热度(不过HTML 4.0后就没有了,取而代之的是依据XML定义的XHTML)。
HTML的缺点 • 只适合于人与计算机的交流,不适合计算机与计算机的交流。 • HTML是通过一大堆的标记来定义文档内容以什么样的形式显现在我们面前,也即,HTML是一种“显示描述”语言,它仅仅描述了Web浏览器应该如何在页面上布置文字、图形等,并没有对Internet上最重要的东西——信息的本身含义进行描述。 • 这些通过HTML表现出来的文字、图形内容很容易被人理解,而要计算机去理解这些标记内的文字的含义,就很困难了。
HTML的另一个问题就是它的标记的集合是固定的,用户不能增加自己的有意义的标记。而且各大浏览器的规格不尽相同,要使我们用HTML做的网页能够被所有浏览器正常显示,我们只能够使用W3C给我们定义好了的标记来创建网页。HTML的另一个问题就是它的标记的集合是固定的,用户不能增加自己的有意义的标记。而且各大浏览器的规格不尽相同,要使我们用HTML做的网页能够被所有浏览器正常显示,我们只能够使用W3C给我们定义好了的标记来创建网页。
在当今的网络世界里,随着电子商务的蓬勃发展和基于Web的应用日益广泛,大量的信息需要被快速地处理。实际上,在Internet上的大部分信息,在最初都是被存放在结构良好的数据库里面,信息按照它的意义被存放在相应的字段里,比如:员工档案,名称、性别、部门等。对于“张三”这个数据,计算机能够根据它所存放的位置,知道它代表一个员工的姓名。但是,一旦这些数据被调出来,经过CGI、ASP、JSP、PHP等转换成HTML后,原本有意义的数据就变成了一些无特定含义的HTML标记的组合。用户必须通过自己的“头脑”才能解析这些数据,进而“手动”将它们进行记录、处理,显然处理信息的速度会很慢。在当今的网络世界里,随着电子商务的蓬勃发展和基于Web的应用日益广泛,大量的信息需要被快速地处理。实际上,在Internet上的大部分信息,在最初都是被存放在结构良好的数据库里面,信息按照它的意义被存放在相应的字段里,比如:员工档案,名称、性别、部门等。对于“张三”这个数据,计算机能够根据它所存放的位置,知道它代表一个员工的姓名。但是,一旦这些数据被调出来,经过CGI、ASP、JSP、PHP等转换成HTML后,原本有意义的数据就变成了一些无特定含义的HTML标记的组合。用户必须通过自己的“头脑”才能解析这些数据,进而“手动”将它们进行记录、处理,显然处理信息的速度会很慢。
如果我们能够将最初保存在数据库中的原始结构的数据在计算机之间传递,那么肯定会加快信息处理的速度。如果我们能够将最初保存在数据库中的原始结构的数据在计算机之间传递,那么肯定会加快信息处理的速度。 • 显然利用HTML办不到,并且,由于计算机体系、操作系统以及所使用的数据库不同,不同的计算机之间要想互相理解对方的数据库格式是相当困难且非常麻烦的,为了使各种不同的计算机之间能够互相交换信息,似乎HTML又必不可少。怎样来解决这个难题呢?
使用XML可以解决上述的难题。 • W3C对XML作了如下描述:“XML描述了一类被称为XML文档的数据对象,并部分描述了处理它们的计算机程序的行为。XML是SGML的一个应用实例或一种受限形式。从结构上说,XML文档遵从SGML文档标准。” • 同HTML一样,XML也是一种基于文本的标记语言,都是从SGML (Standard Generalize Markup Language,标准通用标记语言,是一种老的标记语言,最初用于出版行业,非常复杂,依据SGML开发的应用非常昂贵,只在少数大公司和政府部门有应用) 发展而来的,XML保留了SGML 80%的功能,降低了20%的复杂程度,这样使得开发有关XML的应用变得很便宜,使XML能够进入“寻常百姓家”。
XML与HTML的不同之处 • XML可以让我们根据我们要表现的文档,自由地定义标记来表现具有实际意义的文档内容。 • 比如:我们可以定义〈文档名称〉〈/文档名称〉这样具有实际意义的标记(可以用中文)。 • 在XML中,我们只需要注意文档的内容,而文档的表现形式则交给CSS(层叠样式表)和XSL(eXtensible Stylesheet Language可扩展样式语言)来完成。 • 如果XML文件只用于计算机与计算机之间交流信息,仅仅需要一个XML文件即可。 • 如果要将XML文件中的信息以某种形式显示出来,如通过浏览器显示,则可引用一个样式表文件来定义浏览器怎样来显示XML文件中信息。
而且XML不像HTML那样具有固定的标记集合,它实际上是一种定义语言的语言,也就是说使用XML的用户可以定义无穷的标记来描述文档中的任何数据元素,突破了HTML固定标记集合的约束,将文档的内容组织成丰富复杂的完整的信息体系。而且XML不像HTML那样具有固定的标记集合,它实际上是一种定义语言的语言,也就是说使用XML的用户可以定义无穷的标记来描述文档中的任何数据元素,突破了HTML固定标记集合的约束,将文档的内容组织成丰富复杂的完整的信息体系。
XML主要有三个要素: • Schema(模式) Schema规定了XML文档的逻辑结构,定义了XML文档中的元素、元素的属性以及元素和元素的属性之间的关系,它能够帮助XML的解析器校验XML文档标记是否合法; • XSL(eXtensible Stylesheet Language可扩展样式语言) XSL是用来规定XML文档表现形式的语言,同CSS类似; • XLL(eXtensible Link Language可扩展链接语言)。 XLL则进一步地扩展了当前Web上已有的简单链接。
XML是一种定义语言的语言,现在已经有几个以XML规范为主所创建的标记语言,如:XML是一种定义语言的语言,现在已经有几个以XML规范为主所创建的标记语言,如: • Chemical Markup Language(CML:定义怎样描述化学分子式的结构,将它显示在网页上); • Mathematical Markup Language(MathML:将复杂的数学公式以网页的形式显示在浏览器中); • Synchronized同步Multimedia Integration合成Language(SMIL:如何将多媒体信息展现在WWW中)。
XML文件的解析器(一种检查XML文件是否有结构上的错误,将XML文件中的标记剥离,读出正确信息的工具)大多数是使用Java语言写成的,这样,只要计算机支持Java虚拟机,都可以支持XML(几乎所有的计算机都支持Java虚拟机)。所以,即使是异构系统,也不用担心读不懂对方的资料,大家都用XML文件作为传送资料的介质即可,因为只要对方计算机上有合适的XML解析器,就可以正确地读取信息。XML文件的解析器(一种检查XML文件是否有结构上的错误,将XML文件中的标记剥离,读出正确信息的工具)大多数是使用Java语言写成的,这样,只要计算机支持Java虚拟机,都可以支持XML(几乎所有的计算机都支持Java虚拟机)。所以,即使是异构系统,也不用担心读不懂对方的资料,大家都用XML文件作为传送资料的介质即可,因为只要对方计算机上有合适的XML解析器,就可以正确地读取信息。 • 现在,几大数据库厂商的数据库产品,如:Oracle 8i、Informix、IBM DB2等都开始支持XML,输入数据库的数据可以轻易地转化为XML,甚至可以直接以XML的形式输入数据。有预言称:将来的电子文档必将是XML的天下。
XML具有卓越的性能,它具有四大特点: • 优良的数据存储格式、 • 可扩展性、 • 高度结构化、 • 方便的网络传输。 因为XML能针对特定用户的应用定义自己的标记,这就使XML能够在多种行业的信息交换中一显身手,根据不同行业来提供具有各自特色的解决方案。
WWW体系结构 • WWW 采用分布式客户机/服务器体系。 • WWW 客户机 运行浏览器(例如Internet Explorer和Netscape )可以阅读HTML语言编写的超文本,激励它们包含的用URL表示的链点,析取URL中的链宿地址、协议、具体资源路径和名称,通过HTTP(Hypertext Transfer Protocol)协议和TCP/IP协议向URL对应的服务器发送调用特定资源的请求。 • WWW 服务器 运行服务器软件和存储各种信息资源,而且这些资源多用HTML语言编制成超文本文件,称为网页,而每个服务器的第一个网页成为这个服务器的主页。
WWW/CGI原理 • WWW 服务器可利用公共网关CGI(Common Gateway Interface)来实现对服务器上信息资源的动态检索。
Internet上的信息资源 • WWW信息资源 据统计,WWW(World-Wide Web ) 服务器数量近几年大概每6个月增长一倍。 • FTP信息资源 FTP(File Transfer Protocol)称为文件传送协议,它允许人们通过该协议连接到Internet的一个远程主机上读取所需的文件并下载到自己的计算机上,所传送的文件可以是文本、图像、声音、多媒体、数据库和可执行二进制代码文件。从某种意义上讲,FTP就相当于在网络上两个主机间拷贝文件。是发布、传递软件和长文件的主要方法。 http://download.com.com/ http://tile.net/ftp,检索型和目录型结合
Telnet信息资源 Telnet是Internet的远程登录协议,允许用户将自己的计算机作为某一个Internet主机的远程终端与该主机相连,从而使用该主机的硬件、软件和信息资源。 BBS就是Telnet远程登录服务的一种,全名叫做Bulletin Board System即电子布告牌系统,是一个由网虫们组织、建设、参与的网上交流用的系统。也可用WWW登录BBS。 公告牌(BBS)是用作特定兴趣小组的信息源和消息系统的计算机系统。用户拨号进入BBS后,查看消息并为其他用户留言,同时与系统上的其他用户进行通信。BBS被用作分配共享软件,并可以提供向其他应用程序的访问通路。许多BBS也允许用户联机聊天,发送电子邮件,下载或上载免费软件和共享软件以及访问Internet。但是,自从出现计算机病毒之后就需要谨慎从事了。目前,大多数BBS在将上载文件写入主机硬盘之前要对所有的文件进行扫描,如果你发现在某个BBS上未进行病毒检查,那么不要将它用作下载文件的信息源,而要另找其它软件源。bbs.tsinghua.edu.cn
公告牌(BBS)是用作特定兴趣小组的信息源和消息系统的计算机系统。用户拨号进入BBS后,查看消息并为其他用户留言,同时与系统上的其他用户进行通信。BBS被用作分配共享软件,并可以提供向其他应用程序的访问通路。许多BBS也允许用户联机聊天,发送电子邮件,下载或上载免费软件和共享软件以及访问Internet。但是,自从出现计算机病毒之后就需要谨慎从事了。目前,大多数BBS在将上载文件写入主机硬盘之前要对所有的文件进行扫描,如果你发现在某个BBS上未进行病毒检查,那么不要将它用作下载文件的信息源,而要另找其它软件源。公告牌(BBS)是用作特定兴趣小组的信息源和消息系统的计算机系统。用户拨号进入BBS后,查看消息并为其他用户留言,同时与系统上的其他用户进行通信。BBS被用作分配共享软件,并可以提供向其他应用程序的访问通路。许多BBS也允许用户联机聊天,发送电子邮件,下载或上载免费软件和共享软件以及访问Internet。但是,自从出现计算机病毒之后就需要谨慎从事了。目前,大多数BBS在将上载文件写入主机硬盘之前要对所有的文件进行扫描,如果你发现在某个BBS上未进行病毒检查,那么不要将它用作下载文件的信息源,而要另找其它软件源。 北科大BBS bbs.tsinghua.edu.cn
博客 • 博客不等于个人日记;博客不等于个人网站。但博客可以是个人媒体、个人网络导航和个人搜索引擎。 • 因为,Blog一词来源于“网络日志(Web Log)”,而不是“网络日记(Web Diary)”。两者的侧重点完全不同。 • 日记(Diary):指个人把每日发生的事、经历和观察的东西写下的记录。个人性、私密性,主要为自己而写。 • 日志(Log):航海记录,对船速、船程以及船上发生的所有对航海有意义的事件的记载。非个人、公开性。主要为别人而写。 • 因此,博客是个人性和公共性的结合体,其精髓不是主要表达个人思想,不是主要记录个人日常经历;而是以个人的视角,以整个互联网为视野,精选和记录自己互联网上看到的精彩内容,为他人提供帮助,使其具有更高的共享价值。
博客 • 博客精神的核心并不是自娱自乐,甚至不是个人表达自由,相反,是体现一种利他的共享精神。为他人提供帮助。个人日记和个人网站主要表现的还是“小我”,而博客表现的是“大我”。也许形式上很接近,但内在有着本质的差异。因此,所有优秀博客网站中,真正表达作者个人的内容非常有限,最多只是点缀,而不像个人网站那样是核心! • David Weinberger说:“互联网教给我们这样一个道理:我们既能够成为一个庞大公共群体的一部分,还能够保持我们的个性面孔。但是这又需要我们花更多时间在公共场所生活。在互联网上, 日记的概念已经被外化了:会有公共的日记出现。今后可能的情况是,在真实世界中曾经有的公众和私人自我之间的那条本来明显的界限会逐步被腐蚀掉,一点一滴地。”他认为,未来每一个人都会拥有至少15个崇拜者。而博客无疑是构建个人影响力的重要手段。 • 当然,博客是一种快速演变中的形式,而且是一种真正的草根力量,因此理解博客不必太拘泥于形式。
关于博客的形象比喻和定义 • 博客如生活,扮演您自己。(博客中国人) • 博客概念主要体现在三个方面:频繁更新(Frequency)、简洁明了(Brevity)和个性化。(Personality)(Evan Williams) • 博客是每周7天,每天24时运转的言论网站,这种网站以其率真、野性、无保留、富于思想而奇怪的方式提供无拘无束的言论。(佩姬•努南的解释) • 博客是互联网上最新的发展潮流,是继E-mail、BBS、ICQ(IM)之后,出现的第四种网络交流方式。 • 博客是用带着索引的文字进行对话的咖啡屋。(Rebecca Blood著《博客手册》。(The Weblog Handbook)) • 博客就是一个人未经编辑的声音(The unedited voice of a person)。(戴夫·温纳(Dave Winer))
关于博客的形象比喻和定义 • 博客(Weblog)是这样一个按照时间顺序摆列的集合,集合中的元素是被公开发布,并能够通过互联网被访问到的独立的思想泡泡(thought bubbles),博客中的每条内容是博客们当时在想什么的思想快照。(James Snell) • 博客之于知识,就像Napster之于音乐,Linux之于软件(博客中国) • 博客代表着“新闻媒体3.0”:旧媒体(old media)→新媒体(new media)→自媒体。(we media)(Dan Gillmor) • 博客是媒体的开放源代码运动。 • 博客是内容的开放源代码运动。 • 博客——知识经济2.0。(姜奇平) • 博客是一个“快捷易用的知识管理系统”。(Dylan Tweney) • 博客是“个人主页2.0”。(博客中国)
“网客”新时代 • 博客:自由表达和记录 • 播客:想唱就唱,想演就演 • 威客:好“点子”换回真“金子” • 闪客:做自己的快乐动漫 • 维权客:在网络上共同联合起来,拿起法律武器与损害其利益者对簿公堂。 • 换客:以交换、易物、交友为目的,变废为宝,享受资源互惠。 • 印客:出版印刷自己私人留存文字图片作品。
USENET/Newsgroup信息资源 • USENET是Internet的一种应用软件,用于提供新闻组(Newsgroup)服务。在这个服务体系中,有众多的新闻组服务组,它们作为Internet主机运行服务器(News Server)软件,接收和存储有关主题的消息,供自己用户查阅。用户可在自己主机上运行新闻组阅读器软件(News Reader),申请加入某个新闻组、从服务器中阅读新闻组消息、并将自己的意见发送到(称为“张贴”)新闻组中。用户可查阅别人的意见并予以回复,并由此反复而形成讨论,所以新闻组又被称为“电子论坛”。 http://groups.google.com/
在Internet上现有上万个新闻组,并有一套命名规则来区分各自的主题范围。常见大类包括:在Internet上现有上万个新闻组,并有一套命名规则来区分各自的主题范围。常见大类包括: biz商业类, comp计算机类, news网络新闻类, rec娱乐类, sci科学类, soc社会类,talk辩论类, misc杂类, alt其它类(有选择或争议的内容) • 用户使用新闻组时首先要“订阅”(subscribe)感兴趣的新闻组,选择感兴趣的消息,然后将它们调到自己计算机上阅读,并可针对所阅读的消息进行回复,这个回复可送给消息原始发送者或发送给新闻组所有成员,用户还可将自己新的消息“张贴”(post)到新闻组上。许多新闻组阅读器还允许用户根据新闻组中关于某个具体问题的讨论线索进行检索,例如,当看到一则感兴趣的意见后,去了解别人在以前或以后针对这个意见还说了什么。
LISTSERV/Mailing List信息资源 在Internet上进行交流和讨论的主要工具有三种: USENET/Newsgroups(新闻组) LISTSERV(电子邮件群) Mailing List(用户邮件组) http://www.lsoft.com/
三者的主要差别 • 新闻组和电子邮件群往往涉及较为广泛的内容,对参与的用户也没有限制,但用户邮件组通常涉及较专门、甚至有争议的议题,对参与的用户有一定限制。 • 新闻组的订阅主要是在技术上连接到新闻组服务器并予以登记,没有订阅限制,可以即时开通,但电子邮件群和用户邮件组均要求用户履行专门的订阅手续,用户需要在得到同意“订阅”的答复后才能加入。 • 新闻组的信息存储在服务器上,用户得通过专门客户软件(阅读器)来阅读所需信息,而另两者直接将信息传送到用户的电子邮件地址。 • 新闻组和电子邮件群都是自动管理,而用户邮件组往往由人工管理。
搜索问题 • 寻找某种位置不明对象的活动,称为搜索。 • 实现搜索目的将获得效益,进行搜索需付出代价。 • 完成同一搜索任务可以有不同搜索方案,不同方案在效益和代价上常常不同。 • 综合考虑效益与代价,从总体优化出发制定最佳搜索方案,是研究搜索问题的中心任务。
搜索引擎的作用 随着搜索引擎的发展,影响力将会转移到两类人手中: • 搜索引擎引导人们所去的最有声望的机构。 • 熟知如何在搜索系统中找到自己想要的东西的网络熟手和网络天才。 有声望的机构会有更高的点击率。 而网络高手们则不会再受众多排名靠前机构的干扰,找到想要的信息。
“搜索引擎”炙手可热-网民热衷个性化“搜索”2005年09月14日 10:08 • 越来越多的人习惯输入关键字来搜索各种所需信息,而眼下,互联网市场上炙手可热的一个关键词无疑就是“搜索引擎”。 • 中国互联网络信息中心(CNNIC)于近日发布的《中国互联网络发展状况统计报告》中数据显示:在网民经常使用的网络服务/功能中,搜索引擎以高达64.5%的选择比例位列第三,仅次于电子信箱和新闻浏览。