520 likes | 654 Views
第四讲. 网络信息资源及其利用. 2009-9. 网络社会. 在现在的网络信息环境下,网络信息资源是我们学习、工作、生活中利用率最高的信息资源之一。对网络信息资源的利用是 终身学习 的需要,也是个人信息素养中的重要内容。 所以本章不仅仅介绍网络信息资源及其利用,还对网络学习与网络交流方面的内容进行介绍。. 主要内容. 1 网络信息资源概念、类型及其特点 2 网络信息资源的评价与选择 3 网络信息检索工具 4 开放获取信息资源及其利用 5 e_print 信息资源及其利用 6 博客与 RSS 信息资源利用.
E N D
第四讲 网络信息资源及其利用 2009-9
网络社会 在现在的网络信息环境下,网络信息资源是我们学习、工作、生活中利用率最高的信息资源之一。对网络信息资源的利用是终身学习的需要,也是个人信息素养中的重要内容。 所以本章不仅仅介绍网络信息资源及其利用,还对网络学习与网络交流方面的内容进行介绍。
主要内容 • 1 网络信息资源概念、类型及其特点 • 2 网络信息资源的评价与选择 • 3 网络信息检索工具 • 4 开放获取信息资源及其利用 • 5 e_print信息资源及其利用 • 6 博客与RSS信息资源利用
1 网络信息资源概念、类型、特点 1.1 概念: 网络信息资源是指信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络通信手段,在计算机等终端上再现的信息的总和。
1.2 网络信息资源的类型 按信息内容的表现形式和内容划分可分为 • 全文型信息:它指直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院的各类教材,政府出版物,标准全文等; • 事实型信息:天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、IP地址等; • 数值型信息:主要是指各种统计数据; • 数据库类信息:如DIALOG,万方等,是传统数据库的网络化; • 微信息(web2.0特征):如博客、播客,BBS,聊天,邮件讨论组,网络新闻组等。 • 其它类型:投资行情和分析,图形图象,影视广告等。
按所采用的网络传输协议可分为: • WWW网络资源:因特网信息资源的主流,它使用http协议,使用简单,功能强大,能方便迅速的浏览和传递分布于网络各处的文字、图象、声音和多媒体超文本信息。 • FTP信息资源:它使用ftp协议,该协议主要用语连网计算机之间传输文件。FTP相当于在网络上两个主机之间复制文件。目前仍是发布、传递软件和长文件的主要方法。 • TELNET信息资源:telnet是远程登陆协议。telnet信息资源包括硬件资源和软件资源。许多机构都提供远程登陆的信息系统,如图书馆的公共目录系统,信息服务机构的综合信息系统等。 • 用户服务组资源:包括新闻组,电子邮件组等。这些电子通信组形式所传递和交流的信息资源是网络上最自由、最具有开放性的资源。news
1.3 网络信息资源的特点 • 复杂性:网络信息资源具有大数量、多类型、多媒体、非规范、跨时间、跨地域、跨行业、多语种等特点。 • 在很大程度上网络的增长和信息资源的动态快速增加是由用户驱动的,但缺乏有效的统一管理机制,信息安全和信息质量的不均衡性。 • 信息分布和构成缺乏结构和组织,信息源不仅分散无序,而且其更跌和消亡也往往无法预测,因此增大了信息资源管理和利用的难度。 • 信息发布具有很大的自由性和任意性,隐私型信息进入了公共信息传播渠道;由于缺乏必要的过滤、质量控制和管理机制,不仅学术信息、商业信息,政府信息、个人信息、不合适(反动、黄色)的信息混为一体,质量良莠不齐。增加了信息识别和利用的难度。
续 • 正式出版物和非正式信息交流交织在一起,使传统的人类信息交流链的格局被打破,各方在网络上既可以是信息的生产者、发布者,也可以是传播者和使用者,对学术交流环境和信息利用产生了深刻的影响。 • 网络营造了“地球村”,既 极大地促进了人类信息资源的共享,又带来了一些意想不到的问题,如文化冲突、信息侵略、信息威慑等。 • 使用成本低 • 共享程度高 • 是信息资源的宝库……
2 网络信息资源的评价与选择 相同内容的信息资源的载体形态或利用、获取的方式不同,可以根据需要选择。 网络信息资源的评价与选择主要是针对信息源。 • 内容因素。内容是评价与选择的核心和重点,从中可以反映网络信息资源的本质。评价网络信息资源的内容因素主要有:权威性、完备性、可靠性、原创性、新颖性、稳定性等。 • 形式因素。形式指标反映了外部特征以及操作使用等方面,是为提示内容服务的,主要包括:美观性、条理性、查检性、帮助性、快捷性、低耗性等。 • 定量的评价:Google的pagerank,星数评价等级。
权威性 在本学科领域具有一定的影响、具有较高的学术水平、具有较高的知名度;Google网页级别评价作为重要的指标,非独特性资源网页级别需3/10以上。 主要关注如下方面:流量和用户群体、口碑
权威性 普通行业的权威性网站的判断标准: 一、网站运营历史; 看一 个网站运营的历史时间长短,也能够判断出这个网站的价值有多少. 二、网站的行业声誉; 三、内容的权威性; 内容的权威性,一般是指某站点上的内容,被同行之间,相互引用转载的很多.而且不是来自于 一些博客、留言本的低质量链接。 四、链接的权威性; 链接的权威性是指链接自己站点的导入链接。 大概有两类链接, 对自己的网站形成权威性网站有很大的帮助。 1、高质量、同是权威性站点的导入链接; 2、高质量、来源于同行的导入链接。
准确性 信息资源需严肃正规、准确无误、完整规范。一方面是内容的准确性,另一方面是格式和链接的准确性。对资源的导航需能正常访问。 主要考虑所选网站(页)提供的信息是否准确?是否提供了信息的来源和出处以备用户进一步核查;网页引证的书目或提供的参考能否证实信息的准确性?页面的句法和拼写是否准确?有否排印错误?提供的信息是否完整规范?
稳定性 信息资源需有较长的稳定期或有稳定运行的保障机制。 主要看所选网站(页)提供信息的时间、更新频率、最近的修改日期,链接速度,断线率等。是否能持续提供给用户使用?
可获得性 信息资源揭示信息的层次中,至少一个能无障碍地获得。 主要要考虑的是题名信息还是文摘信息或全文信息? 是否给出了表明信息内容的关键词或主题词?是否免费?是否注册?是否国际流量?是否符合标准?是否有其它格式或镜像? 某种类型的信息有使用期限制吗?访问资源的方式是否依赖用户使用的设备?是否有方便的导航?是否容易链接所需的信息?是否有清晰的链接标签?是否能分别打印页面和文献的某一部分?是否能发送到电子邮箱?是否提供多种检索方式?检索信息的效率如何?
3 网络信息检索工具 • 当已经知道地址时直接通过地址访问。 • 当不知道地址的时候,需要借助检索工具 • 3.1搜索引擎 • 3.2网络资源指南(门户) • 3.3专门数据库
3.1 搜索引擎 • 搜索引擎分类 • 分类目录型分类目录虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。如Yahoo雅虎、新浪。其他著名的还有Open Directory Project(DMOZ)、Look Smart、About等。现在许多搜索引擎在提供搜索服务的时候也同时提供这一类服务。 • 搜索(网页)型:最常见的。
分类目录型 • DMOZ-开放目录,名字来自:Directory.Mozilla.org也叫ODP(Open Directory Project开放目录工程) • 访问www.dmoz.org,了解如何提交网站(suggest URL)。
搜索(网页)型 • “机器人”工作机理 起始URL----分析页面----URL----新页面
更多…… • 中文搜索引擎指南网:http://www.sowang.com/ • 著名搜索引擎简介:http://www.se-express.com/about-se.htm • 搜索引擎观察[搜索引擎营销策略与搜索引擎新闻]http://searchenginewatch.com/
搜索引擎:水平门户_综合搜索引擎[中文] 中文常用搜索引擎 • 百度中文搜索引擎:http://www.baidu.com/ • Google中文搜索引擎:http://www.google.cn/ • 搜狐搜狗搜索:http://www.sogou.com/ • 奇虎 http://www.qihoo.com/(问答式搜索)
搜索引擎:水平门户_综合搜索引擎[英文] 国外英文常用搜索引擎 • Google — 以搜索精度高、速度快成为最受欢迎的搜索引擎,是目前搜索界的领军人物。 • Fast/AllTheWeb — 总部位于挪威的搜索引擎后起之秀,风头直逼google。 • AltaVista — 曾经的搜索引擎巨人,目前仍被认为是最好的搜索引擎之一。 • Overture — 最著名的搜索引擎广告商,竞价排名的始作俑者,也是全文搜索引擎。 • Lycos — 发源于西班牙的搜索引擎,网络遍布世界各地。 • HotBot — 隶属于Lycos Networks,搜索结果来自其他搜索引擎及目录索引。
搜索引擎:垂直搜索引擎 • 垂直搜索引擎:即专业或专用搜索引擎,它专门用来检索某一主题范围或某一类型信息,追求专业性与服务深度是它的特点。 • 垂直搜索引擎不但可保证此领域信息的收录齐全与更新及时,而且检索深度和分类细化远远优于综合搜索引擎。垂直搜索引擎的检出结果虽可能较综合搜索引擎少,但 检出结果重复率低、相关性强 、查准率高,适合于满足较具体的 、针对性强的检索要求 。目前已经涉及到购物,旅游,汽车,工作,房产,交友等行业。
垂直搜索引擎举例:1 google学术搜索:http://scholar.google.com/ google图书搜索:http://book.google.com/比价购物搜索引擎:http://www.askyaya.com/博客与RSS搜索引擎: http://www.starlogs.com/http://so.blogchinese.com/ [博客中国人]图像搜索引擎: http://images.google.com http://images.baidu.com
检索练习 • 假定要查找“中国房价浮动趋势”的文章,请利用google学术搜索的高级搜索完成。
综合搜索引擎的专门化趋势: • 搜狗(Sogou) [人物、音乐、购物、图片、地图] http://www.sogou.com/gengduo.htm • GOOGLE 学术搜索:http://scholar.google.com/ • GOOGLE 图书搜索http://book.google.com/
课堂练习 • 查网站Logo :用Google的图象搜索(images.google.com),在搜索框中输入“logo-网站名称”(如logo-sohu) • 利用高级搜索,搜索 • 在上海师范大学网站上发布的校园风景图片 • 哈佛大学的logo • 某人想了解Coach包的一些图片,请利用高级搜索功能完成对Coach包图片的搜索.
3.2 网络资源指南 是由人工采集网上信息,然后按照一定分类标准,比如学科类型、主题等,建立网站分类目录,并将筛选后的信息分门别类放入各类目中供用户进行浏览。 优点:1 .信息组织的专题性较强,满足族性检索要求;2.使用简单,只要选择相关类目,依照页面之间的超链接指引很快就能到达目的信息,适于检索不熟悉的领域或建议不熟悉网络的用户使用. 缺点:1.人工采集信息的收录范围小,更新慢;2.受主观因素影响,类目设置不够科学,缺少规范
主要有三种类型: • 学科信息门户 • 搜索引擎目录[目录索引]:新浪目录http://dir.iask.com/ • 开放目录[ODP] http://dmoz.org/ 什么情况下使用网络资源指南? • 当检索一个范围较广的题目,并希望了解与该题目相关的信息时。 • 当没有明确的信息需求,仅仅想在网络上“溜达”时。 • 仅仅想浏览某一方面的消息和动态信息时,并不严格限于某几个检索词的。 • 当信息需求更专一时。
4 开放获取信息资源及其利用 • 开放获取(Open Access)是国际学术界、出版界、图书情报界为了推动科研成果利用互联网自由传播而采取的运动。其目的是促进科学及人文信息的广泛交流,促进利用互联网进行科学交流与出版,提升科学研究的公共利用程度、保障科学信息的长期保存,提高科学研究的效率。 • 开放获取数字资源是网络上重要的共享学术信息资源,提供期刊论文全文的免费阅读,是获取学术信息的一种新模式。 • 国外的一些研究表明,在很多学科领域,开放获取的文章比非开放获取的文章具有更大的研究影响力。
4.1 信息资源开放获取的三个途径 • 开放获取仓储(Open Access Repository) a)对于有版权,但是出版社允许进行自存储(self-archiving)的作品,作者可以放到信息开放存取仓库中,例如论文、专著等; b)对于没有版权的作品,作者可以直接放到信息开放存取仓储中,例如讲义、PPT等。 • 开放获取期刊(Open Access Journals) a)出版提供信息开放获取的杂志,或者将原有杂志改造为信息开放获取的杂志;b)期刊运行经费来源:一种是主办者全部筹集资金,杂志对作者和读者都是免费的, • 个人网页 a)对于有版权,但是出版社允许进行自存储的作品,作者可以放到个人网页上;b)对于没有版权的作品,作者可以直接放到个人网页上
http://prep.istic.ac.cn/main.html?action=index中国预印本系统http://prep.istic.ac.cn/main.html?action=index中国预印本系统 • http://www.oalib.com/Index.html搜索5000多个Open Access(开放存取)资源,绝大部分文献可免费下载全文 • http://www.socolar.com/中国教育图书进出口公司开发的综合性开放获取资源平台
重点介绍部分国外开放获取数字资源: • 加州工学院的开放数字文档收集项目 • Directory of Open Access Journals • HighWire Press • The Open Access Publisher • Public Library of Science Journals • J-STAGE E-Journal • Scientific Electronic Library Online • FreeFullText
4.2 加州工学院的开放数字文档收集项目 • http://library.caltech.edu/digital/包括: • 战略加速计算机 • 计算机科技报告 • 图书馆工作人员编写的出版物 • 并行和分布式系统项目组的技术报告 • 航空流体力学实验室研究生的研究报告 • 地震工程研究实验室技术报告 • 控制与动力系统技术报告 • 口述历史文档在线
4.3 Directory of Open Access Journals http://www.doaj.org/ 是由然瑞典兰德大学图书馆整理的一份开放期刊目录。该项服务涵盖了免费的、可获取全文的、高质量的科学和学术期刊(This service covers free, full text, quality controlled scientific and scholarly journals)。他们的目标是涵盖所有学科和语言的开放期刊,目前一共有1332种开放期刊被收录到了该目录中,其中的708(去年是278)种可以进行文章检索。
4.4 HighWire Press http://www.highwire.org/lists/freeart.dtlHighWire Press是全球最大的提供免费全文的学术文献出版商,于1995年由美国斯坦福大学图书馆创立。目前已收录电子期刊710多种,文章总数已达368万多篇,其中超过144 (去年是77) 万篇文章可免费获得全文;这些数据仍在不断增加。通过该界面还可以检索Medline收录的4500种期刊中的1200多万篇文章,可看到文摘题录。 HighWire Press收录的期刊覆盖以下学科:生命科学、医学、物理学、社会科学。 部分全文可免费访问,并不是全部。
5 e_print信息资源及其利用 电子预印本信息资源是开放获取的另一种方式,对加快科学研究成果的交流与共享,帮助研究者追踪本学科的最新研究进展,避免研究工作的重复等方面都有重要作用,对科学研究者有很高的参考价值。 同行可以直接进行评论。
电子预印本特点 (1)作者自愿提交:作者按照一定的格式将论文进行排版后,通过网络、E-mail等方式,按学科类别上传至相应的目录或库中。 (2)文责自负:送入预印本库中的论文是不经过任何审核的,也没有任何先决条件决定某一论文能否送入库中。只要作者所投论文遵守国家相关法律,有一定学术水平,符合系统的基本投稿要求。 (3)共享性:任何人在尊重作者版权的基础上都可利合理用。 (4)交互性:有些系统允许对论文进行评论和交流。 (5)多载体性:作者可发表到正式的刊物或其它载体形式上。(6)交流速度快、利于学术争鸣、可靠性高的特。
5.1 中国科技论文在线 http://www.paper.edu.cn/ 是经教育部批准,由教育部科技发展中心创建的科技论文网站,每日更新,可为在本网站发表论文的作者提供该论文发表时间的证明,并允许作者同时向其它专业学术刊物投稿,以使科研人员新颖的学术观点、创新思想和技术成果能够尽快对外发布,并保护原创作者的知识产权。 目前已经有纸本期刊出版.文章的来源从网站中选择.
5.2 中国预印本服务系统 http://prep.istic.ac.cn/eprint/由中国科学技术信息研究所与国家科技图书文献中心联合建设的以提供预印本文献资源服务为主要目的的实时学术交流系统,是国家科学技术部科技条件基础平台面上项目的研究成果。该系统由国内预印本服务子系统和国外预印本门户(SINDAP)子系统构成。
国内预印本服务子系统主要收藏的是国内科技工作者自由提交的预印本文章,可以实现二次文献检索、浏览全文、发表评论等功能。 国外预印本门户(SINDAP)子系统是由中国科学技术信息研究所与丹麦技术知识中心合作开发完成的,它实现了全球预印本文献资源的一站式检索。通过SINDAP子系统,用户只需输入检索式一次即可对全球知名的16个预印本系统进行检索,并可获得相应系统提供的预印本全文。目前,SINDAP子系统含有预印本二次文献记录约80万条。
5.4 e-Print arXiv 预印本文献库 e-print arXiv是由美国国家科学基金会和美国能源部资助,在美国洛斯阿拉莫斯(Los Alamos)国家实验室建立的电子预印本文献库,始建于1991年8月。2001年后转由Cornell University进行维护和管理。该预印本资料库由Dr. Ginsparg发起,旨在促进科学研究成果的交流与共享。 目前包含物理学、数学、非线性科学、计算机科学四个学科共计28万篇预印本文献。 该站点的全文文献有多种格式(例如PS、PDF、DVI等),需要安装相应的全文浏览器才能阅读。
e-Print arXiv(来自cornell university library,中科院理论物理所镜像站点):http://cn.arxiv.org/ • e-Print arXiv(美国主站点):http://arxiv.org/
6 博客与RSS信息资源利用 • “博客”一词是从英文单词Blog翻译而来。Blog是Weblog的简称,Weblog就是在网络上发布和阅读的流水记录,通常称为“网络日志”,简称为“网志”。 • Blog就是一个网页,通常由简短且经常更新的帖子构成,这些帖子一般是按照年份和日期倒序排列的。而作为Blog的内容,它可以是你纯粹个人的想法和心得,包括你对时事新闻、国家大事的个人看法,或者你对一日三餐、服饰打扮的精心料理等,也可以是在基于某一主题的情况下或是在某一共同领域内由一群人集体创作的内容。它并不等同于“网络日记”。作为网络日记是带有很明显的私人性质的,而Blog则是私人性和公共性的有效结合,它绝不仅仅是纯粹个人思想的表达和日常琐事的记录,它所提供的内容可以用来进行交流和为他人提供帮助,是可以包容整个互联网的,具有极高的共享精神和价值。
RSS (Really Simple Syndication) 是一种用于发布和获取网络内容(例如头条新闻)的XML格式。使用RSS阅读器来阅读,你可以不用一个个去开页面,也能够很快地知道关注网络内容更新了没有... 1.来源多样的个性化“聚合”特性,省去了在各个网站之间的奔波之苦! 因为RSS是一种被广泛采用的内容包装定义格式,所以任何内容源都可以采用这种方式来发布信息,包括专业新闻站点、电子商务站点、企业站点、甚至个人站点等。而在用户端,RSS阅读器软件的作用就是按照用户的喜好,有选择性地将用户感兴趣的内容来源“聚合” 到该软件的界面中,为用户提供多来源信息的“一站式” 服务。
2.信息发布的时效、低成本特性 RSS技术秉承“推”信息的概念,当新内容在服务器数据库中出现时第一时间被“推”到用户端阅读器中,极大地提高了信息的时效性和价值。此外,服务器端内容的RSS包装在技术实现上极为简单,而且是一次性的工作,使长期的信息发布边际成本几乎降为零,完全是传统的电子邮件、卫星传输、互联网浏览等发布方式所无法比拟的。
3 无“垃圾”信息、便利的本地内容管理特性 RSS用户端阅读器软件的特点是完全由用户根据自身喜好以“频道”的形式订阅值得信任的内容来源,如“新华网国际新闻”、“中国汽车网市场行情”、“天极网IT产品资讯”等。RSS阅读器软件完全屏蔽掉其他所有用户没有订阅的内容以及弹出广告、垃圾邮件等令人困扰的噪音内容。此外,对下载到阅读器软件本地的订阅RSS内容,用户可以进行离线阅读、存档保留、搜索排序、相关分类等多种管理操作,使阅读器软件不仅是一个“阅读”器,更是一个用户随身的“资料库”。
RSS利用 • RSS的阅读工具(即RSS的阅读器),可设置更新时间 看天下、周博通等 另:ATOM 举例:http://lib.nit.net.cn/dlib/rss/(使用步骤、工具下载等)