1 / 18

CHAP2 信息获取

CHAP2 信息获取. §2 因特网信息的查找. 教学要点: 1 、了解搜索引擎的不同分类。 2 、利用搜索引擎有效地获取信息。. 一、搜索引擎 1 .产生背景   最早的搜索引擎是 WEBCRAWLER (中文:网络八爪鱼),它出现于 1994 年 4 月,斯坦福大学的两名博士生,美籍华人杨致远和美国人 David Filo 共同创办了超级目录索引雅虎,并成功地使用权搜索引擎的概念深入人心。从此搜索引擎进入了高速发展时期。 1995 年,真正商业化的搜索引擎开始大规模地开发并投入使用,如 Yahoo 、 Infoseek 。.

Download Presentation

CHAP2 信息获取

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. CHAP2 信息获取 §2因特网信息的查找

  2. 教学要点: 1、了解搜索引擎的不同分类。 2、利用搜索引擎有效地获取信息。

  3. 一、搜索引擎1.产生背景  最早的搜索引擎是WEBCRAWLER(中文:网络八爪鱼),它出现于1994年4月,斯坦福大学的两名博士生,美籍华人杨致远和美国人David Filo共同创办了超级目录索引雅虎,并成功地使用权搜索引擎的概念深入人心。从此搜索引擎进入了高速发展时期。1995年,真正商业化的搜索引擎开始大规模地开发并投入使用,如Yahoo、Infoseek。

  4. 2.发展史  早期的搜索工具的缺陷:  ①信息缺乏有效的分类; ②信息的简单排序使得信息组织缺乏有序性和科学性;  ③信息无法实现实时更新,影响信息时效性; ④信息有用性评价缺乏有效机制

  5.  未来的搜索引擎的功能特性:①应具有元搜索引擎的搜索功能; ②发展多用途的搜索引擎;③提供基于大众的搜索分析; ④应实现多语种之间编码的自动转换和网页自动分类自动文摘;⑤从检索技术上讲应用全文检索技术与内容分析和链接分析相结合的文本处理方法相结合的方式;⑥实现多种媒体信息的统一管理、存储、检索、输出;⑦应具有网络的动态监控和数据库动态更新功能;⑧应考虑按时间、地域的顺序输出综合分析与评价;⑨具有跨平台工作和综合处理文档的能力

  6. 搜索引擎指用于因特网信息查找的网络工具。 真正意义上的搜索引擎,通常指的是收集了互联网上几千万到几十亿个网页并对网页中的每一个文字(即关键词)进行索引,建立索引数据库的全文搜索引擎。 搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。

  7. 一个搜索引擎由搜索器、索引器、检索器和用户接口等四个部分组成。一个搜索引擎由搜索器、索引器、检索器和用户接口等四个部分组成。 那么什么样的搜索工具才称得上恰当呢?一般来说,有以下几条判断标准。 (1)快速(2)准确(3)易用(4)强劲

  8. 搜索步骤: (1)、确定你的搜索概念或意图。 (2)、研究一下所选搜索引擎的主页。 (3)、建立搜索表达式,使用符合该搜索引擎语法的正确表达式,开始搜索。 (4)、查看搜索结果。 (5)、在其他搜索引擎中尝试同样的搜索。这一步也可以由多元搜索引擎来完成。

  9. ⑴按工作方式分  全文搜索引擎——用代表所需信息主题的关键词进行信息查询,如: google(www.google.com) 百度(www.baidu.com) 北大天网( e.pku.edu.cn)   特点:通过从因特网上提取的各个网站的信息(以网页文字为主)而建立的索引数据库。 

  10. 蜘蛛程序或机器人程序 租用其他引擎的数据库 特点 拥有自己的检索程序,并自建网页数据库,搜索结果直接从自身的数据库调用。 按自定的格式排列搜索结果 用途 图象搜索、新闻组搜索、网页快照、提供 Google工具条 代表 Google Lycos 全文搜索引擎的类型:

  11. 目录搜索引擎——将收取到的各个网站的信息按照目录分类,建立索引数据库供人们分类查找。如:雅虎、搜虎、新浪、网易。(采用罗列目录方式,引导搜索者依据分类目录查找需要的信息。)代表网站:搜狐(www.sohu.com)新浪(www.sina.com.cn)目录搜索引擎——将收取到的各个网站的信息按照目录分类,建立索引数据库供人们分类查找。如:雅虎、搜虎、新浪、网易。(采用罗列目录方式,引导搜索者依据分类目录查找需要的信息。)代表网站:搜狐(www.sohu.com)新浪(www.sina.com.cn) 网易(www.163.com)雅虎(www.yahoo.com) 搜网(www.sowang.com) 元搜索引擎(META-SEARCH ENGINE),这是一种搜索引擎之上的(强调逻辑关系、逻辑结构)搜索引擎,它可以同时检索多个成员搜索引擎的数据库。  代表:搜网(http://www.sowang.com)  工作原理:在接受用户查询请求时,可以同时在其他多外搜索引擎上进行搜索,并将结果返回给用户,给用户带来了极大的便利。

  12. 二、搜索技巧  我们在登录不同的网站时,发现有一个“搜索按钮”,这是方便网民查找网络上的资料。但是许多新手根本不懂得怎样利用这个搜索引擎,往往是在地址栏里输入熟悉的网址或者中名,有时有些资料无法查找到或者提示类似的网站不存在。前面我们了解了搜索的种类,现在我们通过上机操作,掌握两种方法的各自特点,以便今后学习的需要。二、搜索技巧  我们在登录不同的网站时,发现有一个“搜索按钮”,这是方便网民查找网络上的资料。但是许多新手根本不懂得怎样利用这个搜索引擎,往往是在地址栏里输入熟悉的网址或者中名,有时有些资料无法查找到或者提示类似的网站不存在。前面我们了解了搜索的种类,现在我们通过上机操作,掌握两种方法的各自特点,以便今后学习的需要。

  13. ⑴什么是关键词?  关键词:表达某种明确概念的词。关键词可以表达任何内容。如行业、理论、地区、人物、时间、产品、企业、网站、事件、行为……   ⑵填写准确的关键词,在点击之前要思考这个关键词有用的结果。

  14. ⑶在输入关键词时,可以输入一个关键词,也可以输入多个关键词,这就要求用好逻辑命令。逻辑命令有“与”(and、+)、 “或”(or、|)、“非”(not、-)。  ⑷不要输入无效的关键词,如“与”、“is”、“的”、“地”、“和”等搜索引擎不支持的过滤词。  ⑸在搜索短语词,最好添加双引号,这一方法在查找名言警句或专有名词时显得格外有用。

  15. [课堂练习] 1、不属于搜索引擎网址的有: ( )A、http://www.baidu.com B、http://www.yinsha.com C、http://www.google.com D、http://cn.yahoo.com2、小华想搜索网络上的所有关于桂林的风景画,应使用()搜索引擎,他找到这些风景画后,把其保存。他又想把这些图片制成一张张影片,这就要学习Flash制作工具,于是,他打开了( )搜索引擎,利用其中的“Flash搜索”特点进行查找。A.www.sina.com B.www.google.com C.e.pku.edu.cn D.www.baidu.com

  16. 3、搜索引擎具有独立搜索引擎和智能化搜索引擎的特点。 ( )A.Google B.新浪 C.百度 D.雅虎 E.网易 4、刘蕾第一次去桂林旅游,她身边没有导游,但有一台电脑,它通过上网,查找( )引擎就能了解该城市的旅游交通图。A.独立搜索引擎 B.专用型搜索引擎 C.个性化搜索引擎 D.元搜索引擎 E.智能化搜索引擎 5、一同学要搜索 “京剧脸谱”,他访问google搜索引擎,键入关键词( ),搜索范围更为有效。A、京剧脸谱 B、“京剧脸谱” C、“京剧+脸谱”D、"京剧"+"脸谱"

  17. 小 结: 在使用搜索时,有可能搜索不到你需要的信息,一原因可能是网络上的确没有你需要的信息,二原因可能是搜索没有对你需要的信息建立索引。因为搜索信息也是有一定限度的。

  18. 搜索主题 关键词 搜索引擎 相关网站个数 查找用时 最适用的网站 课后作业:搜索信息情况表

More Related