290 likes | 456 Views
Web2.0 与网络利用基础. nbwangjt@gmail.com. 目录. 基本术语与知识 网络信息资源及其评价 Web2.0 及其利用 微内容. 1 基本术语与知识. 1.1 因特网( Internet ) 1.2 万维网( WWW ) 1.3 IP 地址 1.4 域名地址 1.5 URL 1.6 域名与网络信息资源评价 1.7 网络浏览器 1.8 网站、网页、主页与首页. 1.1 因特网( Internet ). 因特网是一个网络的网络 (a network of network) 。
E N D
Web2.0与网络利用基础 nbwangjt@gmail.com
目录 • 基本术语与知识 • 网络信息资源及其评价 • Web2.0及其利用 • 微内容
1 基本术语与知识 • 1.1 因特网(Internet) • 1.2 万维网(WWW) • 1.3 IP地址 • 1.4 域名地址 • 1.5 URL • 1.6 域名与网络信息资源评价 • 1.7 网络浏览器 • 1.8 网站、网页、主页与首页
1.1 因特网(Internet) • 因特网是一个网络的网络(a network of network)。 • 因特网是目前世界上影响最大的国际性计算机网络。它以TCP/IP网络协议将各种不同类型、不同规模、位于不同地理位置的物理网络联接成一个整体。 • 集各个部门、领域的各种信息资源为一体,从而构成网上用户共享的信息资源网。 • 因特网是术语,网络是术语。 • 因特网包括较早的Gopher、WAIS,以及现在完全开放的万维网。 • 互联网与因特网辨析 • 互联网(internet,普通名词),泛指由计算机网络(包括局域网、城域网、广域网等)组成的网络; • 因特网(Internet,专用名词) ,特指由TCP/IP协议构建的互联网(internet)。因特网是互联网的一种。
1.2 万维网(WWW) • 其实万维网是靠着因特网运行的一项服务,它是因特网中的一种类型。维网也称为“网络”、“WWW”、“W3”,英文“Web”或“World Wide Web”,是一个资料空间。在这个空间中:一样有用的事物,称为一样“资源”;并且由一个全域“统一资源标识符”(URL)标识。这些资源通过超文本传输协议(Hypertext Transfer Protocol)传送给使用者,而后者通过点击链接来获得资源。可以将万维网理解为一个透过网络存取的互连超文件(interlinked hypertext document)系统。
1.3 IP地址 • 网络的所有功能都是通过最基本的通信来实现的,人们为了通信的方便给每一台计算机都事先分配一个类似我们日常生活中的电话号码一样的标识码,称作网络协议地址 • 如某网站IP地址:61.153.148.214
顶级域名 1.4 域名地址 • 域名(Domain Name),是由一串用点分隔的名字组成的英特网上某一台计算机或计算机组的名称 • 域名的目的是便于记忆和沟通的一组服务器的地址(网站,电子邮件,FTP等)。 • 通过域名访问网络资源的方式是域名服务器将域名解析成IP地址,再访问对应的网络资源。 • http://lib.nit.net.cn(域名地址) 通讯协议 二级域名
域名解析服务 • 谷歌公共DNS • IPV4 • 首选DNS服务器:8.8.8.8 • 备用DNS服务器:8.8.4.4 • IPV6 • 2001:4860:4860::8888 • 2001:4860:4860::8844
1.5 URL • URL就是统一资源定位符(Uniform Resource Locator : URL)即网络地址或网址。 • URL可以是IP形式的,也可以是域名形式的。IP地址如同你的手机号码,而域名地址如同你的姓名,IP地址(手机号)会变动(换号),但域名地址(你的姓名)一般不会变动。 • URL结构如下: • 协议名称://主机地址[:端口地址/存放目录/文件名称], • http://lib.nit.net.cn:80/dlib/help/book.php
1.6 域名与网络信息资源评价 • ac --- 科研机构 • com --- Commercial organizations, 工、商、金融等企业 • edu --- Educational institutions 教育机构 • gov --- Governmental entities政府部门 • mil --- Military ,军事机构 • arpa --- Come from ARPANet,由ARPANET(美国国防部高级研究计划局建立的计算机网)沿留的名称,被用于互联网内部功能 • net --- Network operations and service centers, 互联网络、接入网络的信息中心(NIC)和运行中心(NOC) • org --- Other organizations,各种非盈利性的组织 • biz --- web business guide网络商务向导,适用于商业公司(注:biz是business的习惯缩用) • info --- infomation,提供信息服务的企业 • pro --- professional,适用于医生、律师、会计师等专业人员的通用顶级域名 • name--- name, 适用于个人注册的通用顶级域名 • coop --- cooperation,适用于商业合作社的专用顶级域名 • aero --- aero,适用于航空运输业的专用顶级域名 • museum --- museum,适用于博物馆的专用顶级域名 • mobi --- 适用于手机网络的域名 • asia --- 适用于亚洲地区的域名 • tel --- 适用于电话方面的域名 • int --- International organizations,国际组织 • cc --- 可把它看成“Commercial Company简短,容易记忆,漂亮,容易输入,是新一代域名的新秀 • 迅播影院www.2tu.cc
信息资源的来源是信息资源评价的重要依据之一。通过域名的组成(后缀)能判断信息资源的发布者的性质(商业、政府、学术研究)、国别地区,这些对网络信息资源的获取与评价有参考作用。信息资源的来源是信息资源评价的重要依据之一。通过域名的组成(后缀)能判断信息资源的发布者的性质(商业、政府、学术研究)、国别地区,这些对网络信息资源的获取与评价有参考作用。 • 比如国内网站的可获取性要强于国外网站,学术研究单位、政府单位等部门发布的信息的权威性要高于一般商业性机构。
1.7 网络浏览器 • 是一种用于访问网络服务器的客户端工具软件. • 常见网络浏览器 • 微软IE浏览器 • 360浏览器 • 傲游Maxthon浏览器 • 腾讯TT浏览器 • 搜狗浏览器 • 世界之窗 • 百度浏览器 • Mozilla Firefox 火狐浏览器 • 网景Netscape浏览器 • 谷歌浏览器
1.8网站、网页、主页与首页 • 网站:网页和其它信息资源、程序的集合。类似如整本书。 • 网页:是指网站中的一个页面。类似如书中的一页。 • 所以说“图书馆网站”指的是整个网站,而说“图书馆网页”指的是网站中的一个页面。 • 首页:是打开网站的第一个页面,一般默认为index、default等文件名。 • 主页:是链接网站其它内容的主要页面,也是利用网站的入口网页。类似如书的目录页。 • 一般情况下首页就是主页。
2 网络信息资源 2.1 概念 网络信息资源是指信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络通信手段,在计算机等终端上再现的信息的总和。
2.2 网络信息资源的类型 按信息内容的表现形式和内容划分可分为 全文型信息:它指直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院的各类教材,政府出版物,标准全文等; 事实型信息:天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、IP地址等; 数值型信息:主要是指各种统计数据、实验数据; 数据库类信息:如DIALOG,万方等,是传统数据库的网络化; 微内容(web2.0特征):如博客、播客,BBS,聊天,邮件讨论组,网络新闻组等。 其它类型:投资行情和分析,图形图象,影视广告等。
按所采用的网络传输协议可分为 WWW网络资源:因特网信息资源的主流,它使用http协议,使用简单,功能强大,能方便迅速的浏览和传递分布于网络各处的文字、图象、声音和多媒体超文本信息。 FTP信息资源:它使用ftp协议,该协议主要用语连网计算机之间传输文件。FTP相当于在网络上两个主机之间复制文件。目前仍是发布、传递软件和长文件的主要方法。 TELNET信息资源:telnet是远程登陆协议。telnet信息资源包括硬件资源和软件资源。许多机构都提供远程登陆的信息系统,如图书馆的公共目录系统,信息服务机构的综合信息系统等。 用户服务组资源:包括新闻组,电子邮件组等。这些电子通信组形式所传递和交流的信息资源是网络上最自由、最具有开放性的资源。news
2.3 网络信息资源的特点 复杂性:网络信息资源具有大数量、多类型、多媒体、非规范、跨时间、跨地域、跨行业、多语种等特点。 在很大程度上网络的增长和信息资源的动态快速增加是由用户驱动的,但缺乏有效的统一管理机制,信息安全和信息质量的不均衡性。 信息分布和构成缺乏结构和组织,信息源不仅分散无序,而且其更跌和消亡也往往无法预测,因此增大了信息资源管理和利用的难度。 信息发布具有很大的自由性和任意性,隐私型信息进入了公共信息传播渠道;由于缺乏必要的过滤、质量控制和管理机制,不仅学术信息、商业信息,政府信息、个人信息、不合适(反动、黄色)的信息混为一体,质量良莠不齐。增加了信息识别和利用的难度。
续 正式出版物和非正式信息交流交织在一起,使传统的人类信息交流链的格局被打破,各方在网络上既可以是信息的生产者、发布者,也可以是传播者和使用者,对学术交流环境和信息利用产生了深刻的影响。 网络营造了“地球村”,既极大地促进了人类信息资源的共享,又带来了一些意想不到的问题,如文化冲突、信息侵略、信息威慑等。 使用成本低 共享程度高 是信息资源的宝库……
2.4 网络信息资源的评价与选择 相同内容的信息资源的载体形态或利用、获取的方式不同,可以根据需要选择。 网络信息资源的评价与选择主要是针对信息源。 内容因素。内容是评价与选择的核心和重点,从中可以反映网络信息资源的本质。评价网络信息资源的内容因素主要有:权威性、完备性、可靠性、原创性、新颖性、稳定性等。 形式因素。形式指标反映了外部特征以及操作使用等方面,是为提示内容服务的,主要包括:美观性、条理性、查检性、帮助性、快捷性、低耗性等。 定量的评价:Google的pagerank;星数评价等级。
权威性 在本学科领域具有一定的影响、具有较高的学术水平、具有较高的知名度;Google网页级别评价作为重要的指标,非独特性资源网页级别需3/10以上。 主要关注如下问题:所采集的网站(页)的主办者是否为有声誉的大学、学会/协会、实验室?网站是否通过权威评价机构评价过?所选的站点是否被多个internet站点链接?网站是由某公司、机构还是某领域的著名的权威或专家赞助?信息提供者的教育背景和职业背景及其研究方向?责任者有知名的出版物吗?信息是否经过过滤?信息是否经同行评议过?资源是否由相关的权威推荐?是否有与权威机构的页面的共同链接?出版社是否知名和有声望?出版社是否是公认的出版界的权威?出版社是否是大学的出版社?是否有任何原创作品?选择的资源与其它作品有相关性吗?
准确性 信息资源需严肃正规、准确无误、完整规范。一方面是内容的准确性,另一方面是格式和链接的准确性。对资源的导航需能正常访问。 主要考虑所选网站(页)提供的信息是否准确?是否提供了信息的来源和出处以备用户进一步核查;网页引证的书目或提供的参考能否证实信息的准确性?页面的句法和拼写是否准确?有否排印错误?提供的信息是否完整规范?
稳定性 信息资源需有较长的稳定期或有稳定运行的保障机制。 主要看所选网站(页)提供信息的时间、更新频率、最近的修改日期,链接速度,断线率等。是否能持续提供给用户使用?
可获得性 信息资源揭示信息的层次中,至少一个能无障碍地获得。 主要要考虑的是题名信息还是文摘信息或全文信息? 是否有对信息结论的阐述标准?是否给出了表明信息内容的关键词或主题词?希望在该网页上找到何种信息?主题的涵盖面是否全?索引或目次页是否隐含了综合性的内容?是否免费?是否注册?是否国际流量?是否符合标准?是否有其它格式或镜像? 某种类型的信息有使用期限制吗?访问资源的方式是否依赖用户使用的设备?是否需要专门软件(如浏览器)?是否有方便的导航?是否容易链接所需的信息?是否有清晰的链接标签?是否能分别打印页面和文献的某一部分?是否能发送到电子邮箱?是否提供多种检索方式?检索信息的效率如何?
附:人肉搜索 基于大信息环境观念的信息搜索、挖掘、选择、评价、分析、综合 请通过百度百科中的“人肉搜索引擎”词条了解人肉搜索http://baike.baidu.com/view/860941.htm 人肉搜索,其实是情报学中的信息分析和情报调研过程,是信息检索技能、信息分析方法和情报调研过程的集中应用。其最大的特点是应用web2.0的思路,网聚人力,虚拟与现实结合。
Web2.0 经典理论 • 长尾理论 :二八定律 • 150法则 :人际网络极限 • 六度分隔:6个人的人际关系网络可达人数为150的六次方(超过1万亿 !) • 弱连带 :人脉 • 并行生产 :wiki、热门推荐、合作翻译
Web2.0的典型应用 • RSS与RSS订阅 • 博文、动态、数据库和搜索引擎的定期跟踪 • 博客/微博(blog)【基于博客的学术交流、博客营销等;协同翻译、协同写作等】 • 播客【如视频分享youtube 、土豆】 • 威客【与知识搜索。与人肉搜索有差别】 • 维基 (zh.wikipedia.org) • 网摘 • 开放目录 • 即时通讯(IM) • 社会网络服务(SNS) • 标签与分众分类 • 文件分享 • OpenID
Web2.0网站分类 • http://odp.nit.net.cn/xxjs/index.php/Web2.0#.E7.BD.91.E7.AB.99.E5.88.86.E7.B1.BB
4 微内容 • 微内容(Microcontent)在web2.0环境中是指内容较短、由网民(草根)创建和传播,具备个人色彩的信息。如:论坛、贴吧、社区、即时通讯、博客(微博)等产生的内容。其特点如下: • 1.区别于传统出版和发行形式的网络信息资源; • 2.这类信息数量大、创建和消亡难以监控 • 3.经常见到信息重复、信息评价困难 • 4.组织管理和利用比较困难 • 5.信息形式多样,长短不一,而且大多比较短。 • 微内容的利用相对比较困难,可以通过专门的搜索引擎如:RSS搜索引擎、论坛搜索引擎等搜索获取。