450 likes | 1.1k Views
网上其他学术资源的利用. 廖三三 E-mail:liaoss@lib.pku.edu.cn . 主要内容. 搜索引擎 Web Search Engine( 万维网搜索引擎) Scholar Search Engine( 学术搜索引擎) FTP Search Engine( 文件服务搜索引擎) 其它 网络学术资源导航. 搜索引擎( Search Engine) 的定义. 搜索引擎是指通过网络搜索软件或网站登陆等方式,将互联网上大量网站的页面收集到本地,经过加工处理而建库,从而能够对用户提出的各种查询作出响应,提供用户所需的信息。
E N D
网上其他学术资源的利用 廖三三 E-mail:liaoss@lib.pku.edu.cn
主要内容 • 搜索引擎 • Web Search Engine(万维网搜索引擎) • Scholar Search Engine(学术搜索引擎) • FTP Search Engine(文件服务搜索引擎) • 其它 • 网络学术资源导航
搜索引擎(Search Engine)的定义 • 搜索引擎是指通过网络搜索软件或网站登陆等方式,将互联网上大量网站的页面收集到本地,经过加工处理而建库,从而能够对用户提出的各种查询作出响应,提供用户所需的信息。 • Search Engine,常常是用户利用网上资源的第一途径。
搜索引擎原理 • 搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。 • 搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。 • 搜索引擎也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。
搜索引擎分类 • 按照原理分:关键词搜索引擎,主题分类指南(directory search engine),元搜索引擎(meta-search engine):基于搜索引擎的搜索引擎。 • 按类型分:web搜索引擎,ftp搜索引擎,学术搜索引擎,blog搜索引擎,新闻搜索引擎。。。。。。
Web Search Engine举例 • Google(http://www.google.com) • Yahoo(http://www.yahoo.com) • AltaVista(http://www.altavista.com) • AskJeeves(http://www.askjeeves.com) • Excite(http://www.excite.com) • MetaCrawler(http://www.metacrawler.com)
Google简介 • 由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明。 • 约搜索30亿张网页,包括35个国家和地区的语言的资源。 • 已占有全球搜索市场的80%。Google 在中国的搜索市场的市场份额也已突破30%,并且增长速度迅猛,在中文搜索市场有举足轻重的作用。
Google特色 • 布尔逻辑:+,-,OR • 不支持通配符,如“*”、“?”等。 • 高级搜索:site,link,intitle,allintitle , inurl,allinurl 。 • 查找PDF文件,filetype:pdf • 智能化的“手气不错”功能,提供可能最符合要求的网站。 • “网页快照”功能,能从Google服务器里直接取出缓存的网页。
AltaVista • AltaVista是DEC公司1995年12月推出的万维网搜索引擎
Excite • Excite是由斯坦福大学1993年8月创建的
MetaCrawler(http://www.MetaCrawler.com/) • MetaCrawler是典型的元搜索引擎
国内WEB搜索引擎 • 百度中文搜索引擎 • 北大天网中英文搜索引擎 • 搜狐分类搜索引擎 (搜狗) • 新浪搜索引擎 • 网易分类目录引擎
总结 • 每种搜索引擎都有不同的特点,只有选择合适的搜索工具才能得到最佳的结果。 • 随着Web查询技术的发展,新的搜索引擎必将不断涌现,已有搜索引擎的功能也会不断改善,在优胜劣汰中进步。
学术搜索引擎 • http://scholar.google.com/ • http://www.scirus.com/ • http://www.live.com/ • http://www.oaister.org/ • http://www.worldcat.org/ (检索书)
FTP搜索引擎 • FTP Search Engine(文件服务搜索引擎)是具有查询FTP资源功能的WWW网页 • 北大天网的FTP搜索引擎 http://bingle.pku.edu.cn/ • FTP星空搜索 http://sheenk.com/ftpsearch/search.html
其它搜索引擎 • NEWS Search Engine • YellowPage Search Engine • WhitePage Search Engine
网络学术资源导航 • 建立: • 文献资源服务单位、教学或科学研究单位以及学术组织机构的导航网站; • 特点:与搜索引擎的区别 • 针对性 • 学术性 • 规范化
美国加州图书馆的LII导航系统 • 网址:http://lii.org/ • "Information You Can Trust." • 包括艺术人文、商业金融等14个大类上百个子类的学科导航,收集了超过 17,000 个internet站点 • 可以免费定购它的“New This Week from LII”
资源选择标准 • 收集的站点都经过严格的选择、评估 • 收集范围:收录高质量的,有学术意义内容独特的站点。 • 选择的5个标准:Availability, Credibility, Authorship,External links ,Legality • 评估的6个标准:Authority , Scope and Audience, Content, Design , Function , Shelf Life
Infomine • http://infomine.ucr.edu/ • INFOMINE是为大学教师、学生和研究人员建立的网络学术资源虚拟图书馆 。 • 它拥有电子期刊、电子图书、公告栏、邮件列表、图书馆在线目录、研究人员人名录,以及其他类型的信息资源11万多个 。 • INFOMINE对所有用户免费开放,但是它提供的资源站点并不都是免费的,能否免费使用,取决于用户所在的图书馆是否拥有该资源的使用权。
The Internet Public Library Reference Center • http://www.ipl.org/ • 由美国芝加哥大学信息学系(School of Information, University of Michigan) 建立,提供丰富网络资源的连结务,是广受好评的指南网站。除各类分类指南外,同时针对儿童与青少年需求,建置专属网页提供 不同年纪所需要的网络资源。
其它一些比较好的网络学术导航 • http://www.academicinfo.net/ • http://www.lib.berkeley.edu/Catalogs/list.html • http://www.sosig.ac.uk/ • http://www.hw.ac.uk/libWWW/irn/pinakes/pinakes.html
国内网络学术资源导航 • CALIS重点学科网络资源导航门户 • http://202.117.24.168/cm/main.jsp/ • 重点学科信息资源 • http://www.resource.edu.cn/index.htm • 中科院系统的学科导航 • http://www.las.ac.cn/subpage/subframe_detail.jsp?SubFrameID=1010
免费电子期刊(中文) 中国预印本服务系统 • http://prep.istic.ac.cn/eprint/index.jsp 奇迹文库 http://www.qiji.cn/ 中国科技论文在线 http://www.paper.edu.cn/index.html
免费电子期刊(英文) • HighWire电子期刊 • http://intl.highwire.org/lists/freeart.dtl • NASA电子网站 • http://adswww.harvard.edu • E-Print arXiv---美国洛斯阿拉莫斯(Los Alamos)国家实验室电子预印本文献库 • 预印本(Preprint)是指科研工作者的研究成果还未在正式刊物发表,而出于和同行交流的目的自愿通过邮寄或网络等方式传播的科研论文、科技报告等文章。与刊物发表的论文相比,预印本具有交流速度快、利于学术争鸣、可靠性高的特点。 • http://cn.arxiv.org/http://arxiv.org/ • Open J-Gate • http://www.openj-gate.com/
Directory of Open Access Journals ( http://www.doaj.org) • Lund University所建置,目前主题有农业及食品科学、生物及生命科学、化学、健康科学、语言及文学等17种学科主题。其目标是收录所有学科的公开取用期刊。 • PubMed Central ( http://pubmedcentral.nih.gov/ ) • 由美国国家医学图书馆建置,主要提供免费使用的生物医学相关期刊索引,其中收录89种免费全文期刊。 • BioMed Central ( http://www.biomedcentral.com/home ) • 收录英国伦敦生物医学中心的105种免费全文期刊,主题为生命科学领域的生物化学、微生物学、遗传学、免疫学、毒物学等相关资料。 • PLOS Biology ( http://www.plosbiology.org/ ) • 由科学公共图书馆(Public Library of Science)出版之公开查阅期刊,可公开阅读及下载,著作权归作者所有。