750 likes | 872 Views
个人博客: http://dlibwang.blogchina.com. 网络信息资源及其利用. 王建涛 QQ:47072005 dlibwang@hotmail.com 办公电话: 88229062 办公地点 : 图书馆 504( 五楼机房 ). 2006-10-08. 幻灯片下载:. 课程页面 http://lib.nit.net.cn/wxjs/ 务必阅读!. “ 闲话”开篇. 请先考虑以下问题: 你为什么上网(或上网干什么)? 你认为网络上有什么? 你希望通过这次课学到什么?. 信息环境的变化 ……. 科技文献检索. 信息检索 与利用.
E N D
个人博客:http://dlibwang.blogchina.com 网络信息资源及其利用 王建涛 QQ:47072005dlibwang@hotmail.com 办公电话:88229062 办公地点:图书馆504(五楼机房) 2006-10-08
幻灯片下载: • 课程页面 http://lib.nit.net.cn/wxjs/ 务必阅读!
“闲话”开篇 请先考虑以下问题: 你为什么上网(或上网干什么)? 你认为网络上有什么? 你希望通过这次课学到什么?
信息环境的变化…… 科技文献检索 信息检索与利用 文献信息检索与利用
小结:通过这门课程的名称变化的讲解,我们应该了解:小结:通过这门课程的名称变化的讲解,我们应该了解: 我们所处的信息环境是在不断变化的 信息技术条件对信息环境的变化是革命性的。 信息环境影响、催化或在一定程度上决定了人们的信息需求。 教材永远跟不上信息环境和人们信息需求的变化。
网络社会 在现在的网络信息环境下,网络信息资源是我们学习、工作、生活中利用率最高的信息资源之一。对网络信息资源的利用是终身学习的需要,也是个人信息素养中的重要内容。相对与本馆纸质文献信息资源和数字资源的检索利用,其对人的影响更为深远。 所以本节不仅仅介绍网络信息资源及其利,还对网络学习与网络交流方面的内容做了介绍。
学时分配 教学大纲中的学时安排: 2次理论课[4学时]:第五讲和第十六讲 1次实践课[2学时] 下次上课地点在图书馆5楼电子阅览室
“闲话”开篇 一个小调查: 你为什么上网(或上网干什么)? 你认为网络上有什么? 你希望通过这次课学到什么?
网络信息资源及其利用【目录】 0 网络基础 • 1 网络信息资源概念、类型及其特点 • 2 网络信息资源的评价与选择 • 3 网络信息检索工具 • 4 开放获取信息资源及其利用 • 5 e_print信息资源及其利用 • 6 博客与RSS信息资源利用 • 7 FTP资源及其利用 • 8 Maze、BT、eMule资源及其利用 • 9 网络交流与学习:电子邮件BBS新闻组的使用 • 10 咨询服务系统和答案搜索引擎 • 11 百科全书、字(词)典、辞典黄页白页 • 12 *学术与教学信息资源及其利用 • 13 因特网上的免费信息资源(P61~70)
0 网络基础 • 0.1 认识IP地址 • 0.2 认识网络地址和域名 • 0.3 域名与网络信息资源有什么关系? [教材P35~40]
0.1 认识IP地址 • 人们为了通信的方便给每一台计算机都事先分配一个类似我们日常生活中的电话号码一样的标识地址,称作网络协议地址,是分配给主机的一个32位地址,由4个字节组成。分为动态IP地址和静态IP地址两种。动态IP地址指的是每次连线所取得的地址不同,而静态IP地址是指每次连线均为同样固定的地址。如在图书馆无线上网就是动态IP地址,每次所取得的地址不同。 • 如学校网站的IP 10.80.96.202
0.2 网络地址和认识域名 虽然可以通过IP地址来访问每一台主机,但是要记住那么多枯燥的数字串显然是非常困难的,为此,Internet提供了域名(Domain Name)。 域名也由若干部分组成,各部分之间用小数点分开,例如我校主机的域名是 :“www.nit.net.cn”。 域名前加上传输协议信息及主机类型信息就构成了网址(URL),例如我校www主机的URL就是:“http:// www.nit.net.cn”。 通常,进行网络访问时,域名的www可以省略。如http://www.edu.cn/,可以直接输入http://edu.cn。不能省略的与域名服务器的配置有关。 域名一般不会变动。
网络地址---网址---URL 网络地址是URL(Uniform Resource Locator)的俗称,一般由三个部分构成,各个部分如下: 1. 服务器标识符 通过选择服务器标识符能够确定将要访问的服务器的类型,URL中的服务器标识符可以有HTTP://、FTP://、GOPHER://、TELNET://、NWES://等等类型,分别指定为采用超文本传输协议连接、采用文件传输协议连接、与GOPHER服务器连接、与TELNET会话连接、与USENET新闻组相连接。2. 信息资源地址 信息资源地址是由两部分构成的,一是机器名称,如www.edu.cn是用来指示资源所存在的机器,另一个是通信端口号,如HTTP的标准端口号为80,TELNET的标准端口号为23,FTP的标准端口号为21等等。3. 路径名 路径名是给出资源在所在机器上的完整文件名. 如:http://lib.nit.net.cn/index.php
0.3 域名与网络信息资源有什么关系? 由于Internet最初是在美国发源的,因此最早的域名并无国家标识,人们按用途把它们分为几个大类,它们分别以不同的后缀结尾: 随着Internet向全世界的发展,除了edu、gov、mil、一般只在美国专用外,另外三个大类com、org、net则成为全世界通用,因此这三大类域名通常称为国际域名。ac 代表科研机构 由于国际域名资源有限,各个国家、地区在域名最后加上了国家标识段,由此形成了各个国家、地区自己的国内域名,如: .com.cn 中国的商业.org.hk 香港的组织.net.jp 日本的网络 .com 商业公司 .org 组织、协会等 .net 网络服务 .edu 教育机构 .gov. 政府部门 .mil 军事领域 对网络信息资源的获取与评价有参考作用
全世界为美国打工 • 目前,全世界共有13台根服务器,其中10台在美国,而且2台由美军使用,1台由美国国家航空航天局使用。也就是说,每天世界各地的电子邮件有很多要先由美国人“过目”之后才能去它该去的地方。此外,美国私营公司掌握着全世界互联网域名的分配大权。假如美国与日本的关系急剧恶化,只要美国通过技术手段删去日本的域名“. jp”,日本马上就会成为“网上孤岛”,无法通过网络与外界联系。全世界的网络用户都要向美国支付费用,“全世界都在为美国打工”。 • 中国已经建成了世界第一个同时也是规模最大的纯IPv6网
更多…… • www指的是什么? 即是万维网(WWW-World Wide Web):是基于超文件的、方便用户在因特网上搜索和浏览信息的信息服务系统。它将位于全世界因特网上不同地点的相关数据信息有机地纺织在一起。媒体形式可以是文本、图片、动画、声音等,可以跳转,“网上冲浪”。 • 浏览web信息的网络浏览器有哪些? 微软IE (Internet Explorer )网景(Netscape)遨游(maxthon)腾讯TT浏览器MYIE
更多…… • 在以后的上机和课余时间,欢迎就更多的计算机基础知识和网络话题进行探讨,我很乐意同大家一起学习。 • 今后的社会,网络是一个基本要素,它将对社会经济、科技教育、国防乃至政治产生决定性的影响
1 网络信息资源概念、类型、特点 1.1 概念: 网络信息资源是指信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络通信手段,在计算机等终端上再现的信息的总和。
1.2 网络信息资源的类型 按信息内容的表现形式和内容划分可分为 • 全文型信息:它指直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院的各类教材,政府出版物,标准全文等; • 事实型信息:天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、IP地址等; • 数值型信息:主要是指各种统计数据; • 数据库类信息:如DIALOG,万方等,是传统数据库的网络化; • 微信息(web2.0特征):如博客、播客,BBS,聊天,邮件讨论组,网络新闻组等。 • 其它类型:投资行情和分析,图形图象,影视广告等。
按所采用的网络传输协议可分为: • WWW网络资源:因特网信息资源的主流,它使用http协议,使用简单,功能强大,能方便迅速的浏览和传递分布于网络各处的文字、图象、声音和多媒体超文本信息。 • FTP信息资源:它使用ftp协议,该协议主要用语连网计算机之间传输文件。FTP相当于在网络上两个主机之间复制文件。目前仍是发布、传递软件和长文件的主要方法。 • TELNET信息资源:telnet是远程登陆协议。telnet信息资源包括硬件资源和软件资源。许多机构都提供远程登陆的信息系统,如图书馆的公共目录系统,信息服务机构的综合信息系统等。 • 用户服务组资源:包括新闻组,电子邮件组等。这些电子通信组形式所传递和交流的信息资源是网络上最自由、最具有开放性的资源。news
1.3 网络信息资源的特点 • 复杂性:网络信息资源具有大数量、多类型、多媒体、非规范、跨时间、跨地域、跨行业、多语种等特点。 • 在很大程度上网络的增长和信息资源的动态快速增加是由用户驱动的,但缺乏有效的统一管理机制,信息安全和信息质量的不均衡性。 • 信息分布和构成缺乏结构和组织,信息源不仅分散无序,而且其更跌和消亡也往往无法预测,因此增大了信息资源管理和利用的难度。 • 信息发布具有很大的自由性和任意性,隐私型信息进入了公共信息传播渠道;由于缺乏必要的过滤、质量控制和管理机制,不仅学术信息、商业信息,政府信息、个人信息、不合适(反动、黄色)的信息混为一体,质量良莠不齐。增加了信息识别和利用的难度。
续 • 正式出版物和非正式信息交流交织在一起,使传统的人类信息交流链的格局被打破,各方在网络上既可以是信息的生产者、发布者,也可以是传播者和使用者,对学术交流环境和信息利用产生了深刻的影响。 • 网络营造了“地球村”,既 极大地促进了人类信息资源的共享,又带来了一些意想不到的问题,如文化冲突、信息侵略、信息威慑等。 • 使用成本低 • 共享程度高 • 是信息资源的宝库……
2.2 网络信息资源的评价与选择 相同内容的信息资源的载体形态或利用、获取的方式不同,可以根据需要选择。 网络信息资源的评价与选择主要是针对信息源。 • 内容因素。内容是评价与选择的核心和重点,从中可以反映网络信息资源的本质。评价网络信息资源的内容因素主要有:权威性、完备性、可靠性、原创性、新颖性、稳定性等。 • 形式因素。形式指标反映了外部特征以及操作使用等方面,是为提示内容服务的,主要包括:美观性、条理性、查检性、帮助性、快捷性、低耗性等。 • 定量的评价:Google的pagerank,星数评价等级。
权威性 在本学科领域具有一定的影响、具有较高的学术水平、具有较高的知名度;Google网页级别评价作为重要的指标,非独特性资源网页级别需3/10以上。 主要关注如下问题:所采集的网站(页)的主办者是否为有声誉的大学、学会/协会、实验室?网站是否通过权威评价机构评价过?所选的站点是否被多个internet站点链接?网站是由某公司、机构还是某领域的著名的权威或专家赞助?信息提供者的教育背景和职业背景及其研究方向?责任者有知名的出版物吗?信息是否经过过滤?信息是否经同行评议过?资源是否由相关的权威推荐?是否有与权威机构的页面的共同链接?出版社是否知名和有声望?出版社是否是公认的出版界的权威?出版社是否是大学的出版社?是否有任何原创作品?选择的资源与其它作品有相关性吗?
准确性 信息资源需严肃正规、准确无误、完整规范。一方面是内容的准确性,另一方面是格式和链接的准确性。对资源的导航需能正常访问。 主要考虑所选网站(页)提供的信息是否准确?是否提供了信息的来源和出处以备用户进一步核查;网页引证的书目或提供的参考能否证实信息的准确性?页面的句法和拼写是否准确?有否排印错误?提供的信息是否完整规范?
稳定性 信息资源需有较长的稳定期或有稳定运行的保障机制。 主要看所选网站(页)提供信息的时间、更新频率、最近的修改日期,链接速度,断线率等。是否能持续提供给用户使用?
可获得性 信息资源揭示信息的层次中,至少一个能无障碍地获得。 主要要考虑的是题名信息还是文摘信息或全文信息? 是否有对信息结论的阐述标准?是否给出了表明信息内容的关键词或主题词?希望在该网页上找到何种信息?主题的涵盖面是否全?索引或目次页是否隐含了综合性的内容?是否免费?是否注册?是否国际流量?是否符合标准?是否有其它格式或镜像? 某种类型的信息有使用期限制吗?访问资源的方式是否依赖用户使用的设备?是否需要专门软件(如浏览器)?是否有方便的导航?是否容易链接所需的信息?是否有清晰的链接标签?是否能分别打印页面和文献的某一部分?是否能发送到电子邮箱?是否提供多种检索方式?检索信息的效率如何?
3 网络信息检索工具 • 当已经知道地址时直接通过地址访问。 • 当不知道地址的时候,需要借助检索工具 • 3.1搜索引擎 • 3.2网络资源指南(门户) • 3.3专门数据库
3.1 搜索引擎[P41] • 搜索引擎分类 • 分类目录型分类目录虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。如Yahoo雅虎、新浪。其他著名的还有Open Directory Project(DMOZ)、Look Smart、About等。现在许多搜索引擎在提供搜索服务的时候也同时提供这一类服务。 • 搜索(网页)型:最常见的。
“机器人”工作机理 起始URL----分析页面----URL----新页面
更多…… • 中文搜索引擎指南网[搜网]:http://www.sowang.com/ • 搜索引擎观察[专业、元、多媒体、购物]http://searchenginewatch.com/ • 著名搜索引擎简介:http://www.se-express.com/about-se.htm
搜索引擎:水平门户_综合搜索引擎[中文] 中文常用搜索引擎 • 百度中文搜索引擎:http://www.baidu.com/ • Google中文搜索引擎:http://www.google.cn/ • 搜狐搜狗搜索:http://www.sogou.com/ • 雅虎:http://cn.yahoo.com/ • 新浪:http://cha.iask.com/ • 网易 :http://so.163.com/ • TOM搜索: http://i.tom.com/ • 北大天网搜索引擎:http://www.tianwang.com/ • 奇虎 http://www.qihoo.com/
搜索引擎:水平门户_综合搜索引擎[英文] 国外英文常用搜索引擎 • Google — 以搜索精度高、速度快成为最受欢迎的搜索引擎,是目前搜索界的领军人物。 • Fast/AllTheWeb — 总部位于挪威的搜索引擎后起之秀,风头直逼google。 • AltaVista — 曾经的搜索引擎巨人,目前仍被认为是最好的搜索引擎之一。 • Overture — 最著名的搜索引擎广告商,竞价排名的始作俑者,也是全文搜索引擎。 • Lycos — 发源于西班牙的搜索引擎,网络遍布世界各地。 • HotBot — 隶属于Lycos Networks,搜索结果来自其他搜索引擎及目录索引。
搜索引擎:垂直搜索引擎 • 垂直搜索引擎:即专业或专用搜索引擎,它专门用来检索某一主题范围或某一类型信息,追求专业性与服务深度是它的特点。 • 垂直搜索引擎不但可保证此领域信息的收录齐全与更新及时,而且检索深度和分类细化远远优于综合搜索引擎。垂直搜索引擎的检出结果虽可能较综合搜索引擎少,但 检出结果重复率低、相关性强 、查准率高,适合于满足较具体的 、针对性强的检索要求 。目前已经涉及到购物,旅游,汽车,工作,房产,交友等行业。
垂直搜索引擎举例:1 找工作的搜索引擎:http://www.deepdo.com/ google学术搜索:http://scholar.google.com/ google图书搜索:http://book.google.com/比价购物搜索引擎:http://go.8848.com/http://www.askyaya.com/博客与RSS搜索引擎:http://www.oao.cn/ [中客]http://so.blogchinese.com/ [博客中国人]http://www.feedsearch.net/http://www.8fang.net/ [八方 ]人脉搜索引擎: http://www.linkist.com/ [交友,找工作, 商机]https://www.linkedin.com/http://www.digdig.com.cn/ [人物、软件]论坛搜索引擎:http://www.teein.com/
垂直搜索引擎举例:2 The Music Finder http://www.music-finder.netSingingfish(只能搜寻声音和录像) http://www.singingfish.com旅行TripAdvisor http://www.tripadvisor.com计算机科学研究和文章 http://www.researchindex.com图像搜索引擎:http://cn.gograph.com/ [图像词典] 商业搜索引擎Business http://www.business.com生意定向搜索引擎。 DailyStocks http://www.dailystocks.com可以了解被查询公司存货的信息已经相关的新闻报导,研究, 引述和其他数据。 FMLX http://www.fmlx.com 英国定向的关于公司,存货数据,分析和研究的搜索引擎。 eBizSearch http://www.ebizsearch.org 关于电子商务的文章和报告。
综合搜索引擎的专门化趋势: • 搜狗(Sogou) [人物、音乐、购物、图片、地图] http://www.sogou.com/gengduo.htm • GOOGLE 学术搜索:http://scholar.google.com/ • GOOGLE 图书搜索http://book.google.com/ • AllTheWeb [能专门对图像、多媒体信息。] http://www.alltheweb.com
更多搜索引擎: • 参见“搜索引擎观察”之专门搜索引擎 • Answers Searching| Computer Search Engines • Domain Searching| Financial Search Engines • Government Search| Invisible Web • Legal Search Engines| Mailing Lists • Medical Search Engines| Newsgroup Search • Science Search Engines|Shopping Search • Travel Search Engines| WAP Search Engines
元搜索引擎 • 一次搜索多个搜索引擎,并将结果返回给用户。有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合。 优点:能同时搜索多个搜索引擎,能在一定程度上提高查询的广度。 缺点:因为有时后并不能对一个搜索引擎全部查完,有时后也会漏掉一些重要信息。
早期的中文元搜索引擎1、metaFisher中文元搜索引擎 http://www.hsfz.net.cn/fish/做的较早,核心功能较弱,没有现代主流搜索引擎的界面风格。2、万纬搜索 http://www.widewaysearch.com/ 功能上和第一个元搜索引擎一样,核心功能很弱,制作一般3、多元搜索 http://web.soaso.com/做得较早,虽然号称整合的搜索引擎最多,但实际使用效果很差,查询速度也慢,返回结果基本未作处理。 • 新近出现的元搜索引擎1、知识搜索 http://www.zhihere.com/search/主要用作学习工具,功能上尽量保证全面实用2、一家搜 http://www.ejear.com/对相似结果的处理有点特色3、bbmao http://www.bbmao.com是国内唯一具有自动聚类功能的元搜索引擎,技术和功能上都比较强4、狠搜 http://www.hensou.com/可以定制源搜索引擎,同时提供商业信息搜索,核心功能一般
搜索引擎举例:GOOGLE A.通用检索法则:关键词的选择是核心。Google的关键词检索,所使用的关键词可以是字、单词,也可以是短语、词组或句子。使用Google进行检索非常简单,只要在搜索框内输入一个关键字,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。单个关键字搜索得到的信息量巨大,会带出海量的不相关信息,通常检索多是使用词语作为关键词。 复杂课题检索,主题分析后就要进行正确选词。使用Google,不同关键词的选择,将决定检索结果排列不同,而且选词不准,无法发挥Google强大的检索功能,影响检索效率。 Google搜索技巧[2005] http://lib.nit.net.cn/wxjs/google.htm
如果检索专业或学术性信息,建议在选择关键词时应注意以下几点:如果检索专业或学术性信息,建议在选择关键词时应注意以下几点: (1)选择专指性强的词 关键词专指性强弱是影响查准率的重要因素之一,选用专指性强的关键词,则检出的网站针对性较强,查准率较高。专指性强弱是对选词表达主题的深度而言,要深入分析检索主题,选择研究的对象及其重要参数、概念等名词术语;选择所应用的对文章起关链作用的基础理论、方法、设备等名称;选择反映重要研究成果的词。例如,查找“网络检索工具的历史”有关的信息,选词时选用“搜索引擎”一词,比选用“检索工具”一词,查准率会更高。
(2)多角度选词 关键词的确定必须经过对检索主题正确分析得到。复杂主题的关键词,要将反映该主题的各个主要方面的词汇都提炼出来,以提高文献的查全率。例如,查找“搜索引擎发展的历史”,因为搜索引擎的历史,是与互联网早期的文件检索工具“Archie”相关的。此外,搜索引擎有个核心程序,叫“蜘蛛”,而最早成型的搜索引擎是“Lycos”,“Yahoo”是优秀搜索引擎的代表。因此,除了选择“搜索引擎”、“历史”外,还要选择“Archie”、“蜘蛛”、“Lycos”、“Yahoo”等词。这些词都是起关键作用的检索词。(2)多角度选词 关键词的确定必须经过对检索主题正确分析得到。复杂主题的关键词,要将反映该主题的各个主要方面的词汇都提炼出来,以提高文献的查全率。例如,查找“搜索引擎发展的历史”,因为搜索引擎的历史,是与互联网早期的文件检索工具“Archie”相关的。此外,搜索引擎有个核心程序,叫“蜘蛛”,而最早成型的搜索引擎是“Lycos”,“Yahoo”是优秀搜索引擎的代表。因此,除了选择“搜索引擎”、“历史”外,还要选择“Archie”、“蜘蛛”、“Lycos”、“Yahoo”等词。这些词都是起关键作用的检索词。
(3)选择限制主题的词 在关键词确定之后,运用检索技术并不能保证检索出来的信息都满意,有时查询的结果太多太泛。由于Google只搜索包含关键词的网页,除了增加表达主题的关键词,还可增加限制性的词语作为关键词,以排除多余的信息。例如:输入“红旗-汽车”,将会找到关于红旗但不含“汽车”的网页。(3)选择限制主题的词 在关键词确定之后,运用检索技术并不能保证检索出来的信息都满意,有时查询的结果太多太泛。由于Google只搜索包含关键词的网页,除了增加表达主题的关键词,还可增加限制性的词语作为关键词,以排除多余的信息。例如:输入“红旗-汽车”,将会找到关于红旗但不含“汽车”的网页。
B 检索式的构建及检索实例 为了完整准确地表达检索需求,提高检索的精确度,正确选择关键词后,还需要了解和运用Google各种检索语法与技巧,根据Google提供的操作、运算符和使用规则说明,设计出一个高质量的检索式。
(1)逻辑检索Google用空格表示逻辑“与”操作,用减号“-”表示逻辑“非”操作。“A-B”表示搜索包含A但不包含B的网页。Google用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。(2)通配符检索 很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。为提供最准确的资料,Google不使用“词干法”,也不支持“通配符”(*)搜索。也就是说,Google只搜索与输入的关键词完全一样的字词。例如:搜索“googl”或“googl*”,不会得到类似“googler”或“googlin”的结果。
(3)短语或者句子检索Google的关键词可以是单词,也可以是短语。用短语做关键字,必须加用英文双引号,否则空格会被当作“与”操作符。双引号中的词语(比如"自然与文化遗产" )在查询到的文档中将作为一个整体出现。这一方法在查找名言警句或专有名词时显得格外有用。
(4)搜索引擎忽略的字符以及强制搜索Google对无实义的词或一些网路上出现频率极高的英文单词,如“i”、“com”、“www”、“的”等,以及一些符号如“*”、“.”等,作忽略处理。如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。另一个强制搜索的方法是把上述的关键字用英文双引号引起来。例如,检索“internet上www的历史”,检索式为:+www+的历史internet。又如,“www的历史”中,“的”其实是忽略词,但因为被用英文双引号引起来,搜索引擎就强制搜索这一特定短语。注意:大部分常用英文符号(如问号、句号、逗号等)无法成为搜索关键字,强制也不行。(4)搜索引擎忽略的字符以及强制搜索Google对无实义的词或一些网路上出现频率极高的英文单词,如“i”、“com”、“www”、“的”等,以及一些符号如“*”、“.”等,作忽略处理。如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。另一个强制搜索的方法是把上述的关键字用英文双引号引起来。例如,检索“internet上www的历史”,检索式为:+www+的历史internet。又如,“www的历史”中,“的”其实是忽略词,但因为被用英文双引号引起来,搜索引擎就强制搜索这一特定短语。注意:大部分常用英文符号(如问号、句号、逗号等)无法成为搜索关键字,强制也不行。
(5)检索式的实现 检索式的实现可以在搜索框内一次输入,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。也可以一次添加一个词语在“在此搜寻结果的范围内查询”。还可以不用操作符和运算符,在高级搜索查询网页中,按提示在搜索框内输入关键词的实现,如以上检索式4可分解写为“可包含以下全部的字词:历史;包含以下的完整字句:搜索引擎;包含以下任何一个字词:archie蜘蛛lycos yahoo;不包括以下字词:文化中国历史”。 用操作符和运算符时,须注意操作符与作用的关键字之间有否空格。比如“-”的使用,“搜索引擎 -文化”,搜索引擎将视为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“-”被忽略。“与”操作必须用大写的“OR”,留有空格且不是小写的“or”。双引号用英文引号等。
(6)搜索定义define:blog (7)特定文档搜索 filetype:pdf filetype:doc