810 likes | 1.06k Views
学习 Google 百度人生. 主讲人:屈南. 中国互联网络发展概况: ( 数据来源:中国互联网络信息中心 CNNIC ,截至到 2007 年 6 月 30 日) 网民总人数: 1.62 亿人 大专及以上学历超过四成: 43.9% 中国网民平均每周上网 18.6 小时. 互联网的功能. 信息渠道功能是互联网的基本功能。 互联网已经成为寻找信息的一种主要方式。 互联网信息渠道的应用主要有网络新闻和搜索引擎。 搜索引擎的使用率: 74.8%. 两大搜索引擎. 中国互联网络信息中心数据显示(截至到 2007 年 6 月 30 日) 搜索引擎的使用首选 百度
E N D
学习Google百度人生 主讲人:屈南
中国互联网络发展概况: • (数据来源:中国互联网络信息中心CNNIC,截至到2007年6月30日) • 网民总人数:1.62亿人 • 大专及以上学历超过四成:43.9% • 中国网民平均每周上网18.6 小时
互联网的功能 • 信息渠道功能是互联网的基本功能。 • 互联网已经成为寻找信息的一种主要方式。 • 互联网信息渠道的应用主要有网络新闻和搜索引擎。 • 搜索引擎的使用率: 74.8%
两大搜索引擎 • 中国互联网络信息中心数据显示(截至到2007年6月30日) • 搜索引擎的使用首选 百度 • 其次是 Google
Questions • 什么是搜索引擎? • 如何使用搜索引擎? • 常用的搜索引擎有哪些? • 如何提高搜索引擎检索结果的准确性?
搜索引擎 (Search Engine)的定义 • 搜索引擎是一种用于帮助Internet用户在互联网上查询信息的搜索工具,它以一定的策略在Internet中发现、搜集信息,并对搜集的信息进行加工整理和组织存储,为用户提供检索服务,从而起到信息导航的作用。
通俗的讲搜索引擎是一种为帮助信息需求者快速、方便、准确地进行信息检索服务的专门站点。通俗的讲搜索引擎是一种为帮助信息需求者快速、方便、准确地进行信息检索服务的专门站点。 • 搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。 • 搜索引擎不能真正理解网页上的内容,它只能机械的匹配网页上的文字。
搜索引擎的发展 • 最早现代意义上的搜索引擎出现于1994年7月。Michael Mauldin 创建的Lycos。 • 同年四月,yahoo门户网站诞生,使网络搜索引擎的概念深入人心。 • 之后,不断有更新、更强的搜索引擎系统推出。
搜索引擎的分类 • 全文搜索引擎 • 目录索引类搜索引擎 • 元搜索引擎
全文搜索引擎 • Google(http://www.google.cn) • AltaVista(http://www.altavista.com) • Overture (http://searchmarketing.yahoo.com) • Lycos(http://www.lycos.com) • 百度(http://www.baidu.com)
目录索引 • Yahoo!(http://www.yahoo.com) • About (http://www.about.com/) • Looksmart (http://www.looksmart.com/) • 搜狐(http://www.sohu.com/)
元搜索引擎 • MetaCrawler(http://www.metacrawler.com) • Dogpile(http://www.dogpile.com) • Mamma(http://www.mamma.com) • 万纬(http://www.widewaysearch.com)
如何使用搜索引擎 • 第一步:打开搜索引擎 • 第二步:把关键词输入检索框内 • 第三步:检索
如何提高检索的准确性 • 选择正确的关键词 • 使用高级检索 • http://www.google.cn/advanced_search?hl=zh-CN • http://www.baidu.com/gaoji/advanced.html • 使用检索功能
检索功能 • 布尔逻辑检索 • 精确匹配——双引号 • 截词检索 • 限定词检索
布尔逻辑检索 • 逻辑“与”(and):“同时包含”关系 。 • 逻辑“或”(or) :“分别包含”关系。 • 逻辑“非”(not) :“排除其他”关系。 几乎所有的搜索引擎都具有布尔逻辑功能。
精确匹配——双引号 • 如果输入的检索词比较长,搜索引擎在经过分析后,给出的搜索结果中的检索词,可能是经过拆分的。 • 避免这种情况的办法,在一串词的前后加双引号(“ ”)。
截词检索 • 任意截断 • 在检索词的任意位置截断。 • eg. 中国 • 嵌入截断 • 在检索词的中间嵌入截断符号。 • eg. 柳堡?故事
限定词(+,-)检索 • +:放在检索词前,表示在检索结果中必须包含该词。 • -:放在检索词前,表示在检索结果中必须不包含该词。 • 大多数搜索引擎都具有该项功能。
两大搜索引擎介绍及使用 • Google(www.google.com) • 百度(www.baidu.com)
Google概述 • 网址:http:// www.google.com • 创办时间:1998年9月 • 界面可用语言:100多种 • 搜索结果所采用语言:35种 • 是世界上用户最多的搜索引擎。
Google的检索功能 • 逻辑运算 • 逻辑“与”:空格即可 • 逻辑“或”:大写“OR”表示,OR的前面必须有空格 • 逻辑“非”:用“-”表示,“-”前必须有空格
Google的检索功能 • 精确匹配——双引号 • Google不区分大小写 • Google支持通配符“ * ”
Google通配符的功能 • Google使用的通配符属于“全词通配符”(full-word wildcard)是指代替一个单词而不是单词中的某个或几个字母的键盘字符,google的全词通配符是*(星号),一次检索可以使用若干个*。
Google通配符的功能 • "take * of" 可以查到诸如Take Charge of、Take Control of、take advantage of、Take control of、take command of等等以Take...of组成的词组 • 通配符“*”也支持也中文搜索,一个“*”代替一个汉字,但在实际使用中其功能远不及英文搜索。
Google的检索特色 • “site”表示搜索结果局限于某个具体网站或者网站频道。 • “filetype”表示在某一类文件中查找信息。 • “intitle”把搜索范围限定在网页标题中。 • “link”可以搜索到所有链接到某个url地址的网页。 • “inurl”把搜索范围限定在URL链接中。
Intitle使用方法举例: 新闻 intitle:首都师范大学 Link使用方法举例: Link:www.cnu.edu.cn Innurl使用方法举例: Word inurl:jiqiao 以上限定语法,和后面的关键词之间不要有空格。
Google其它特色示例 • 计算器 • 类似网页 • 网页快照 • 查找定义
网页快照 • Google 在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。单击“网页快照”时,您将看到 Google 将该网页编入索引时的页面。Google 依据这些快照来分析网页是否符合您的需求。 • 在显示网页快照时,其顶部有一个标题,用来提醒您这不是实际的网页。符合搜索条件的词语在网页快照上突出显示,便于您快速查找所需的相关资料。
查找定义 • 要查看字词或词组的定义,只需键入“define”,接着键入一个空格,然后键入您需要其定义的词。如果 Google 在网络上找到了该字词或词组的定义,则会检索该信息并在搜索结果的顶部显示它们。
两大搜索引擎介绍及使用 • Google(www.google.com) • 百度(www.baidu.com)
百度概述 • 网址: http://www.baidu.com • 创办时间:2000年 • 特点:具有网页搜索、音乐搜索、图片搜索、硬盘搜索等功能。 • 全球最大的中文搜索引擎
百度的检索功能 • 逻辑运算: • 逻辑“与”:空格即可 • 逻辑“或”:| • 逻辑“非”:用“-”表示,“-”前必须有空格
百度的检索功能 • 逻辑运算 • 精确匹配——双引号 • 百度不区分大小写 • 在其他搜索引擎中书名号常被忽略,百度中的书名号可以查询。
百度检索特色 • 查询某一类文档: • 如:“基因 filetype:ppt” • 其他类型:doc、xls、pdf等 • 其它如: • “site:” 、“intitle:”、 “inurl:” 、“link:” 等
谷歌(Google)虽然在整体的首选市场份额中居第二位,却在高端用户群中绝对领先。谷歌(Google)虽然在整体的首选市场份额中居第二位,却在高端用户群中绝对领先。 数据显示像文化水平较高、购买力较大的白领用户群更青睐于谷歌(Google),企业用户占了谷歌(Google)总用户的48.5%。 相比之下,学生用户群则更倾向于百度,其所占比例几乎接近百度用户总数量的一半。 除此之外,调查结果还显示出北京人更爱百度,上海人更爱谷歌(Google)。
结果还显示大部分用户在使用搜索引擎时,单个搜索引擎无法满足其全部需要,用户还需要选择一个或多个其他搜索引擎来实现其搜索目的,而谷歌(Google)在二选市场上以37.8%的市场份额拔得头筹。结果还显示大部分用户在使用搜索引擎时,单个搜索引擎无法满足其全部需要,用户还需要选择一个或多个其他搜索引擎来实现其搜索目的,而谷歌(Google)在二选市场上以37.8%的市场份额拔得头筹。 由此可见,包括百度在内,目前还没有哪个搜索引擎能单独完全满足用户的信息需求,用户仍然需要使用其它搜索引擎来补充信息。
对搜索引擎的质疑 • 检索出的信息数量极大 • 重复过多 • 相关性差 • 利用率低 • 不适合专业化的信息检索需求 • 在满足用户的专业搜索提问时显得力不从心
Google Scholar简介 • 网址:http://scholar.google.com/ • 推出时间:2004年11月 • 定位:专门面向学术资源的免费搜索工具 • 2006年1月11日,Google公司宣布将(Google Scholar)扩展至中文学术文献领域,推出面向中文的Google学术搜索服务。
覆盖范围 • Google Scholar收录来自学术出版商、专业协会、预印本库和大学等方面的学术信息资源,内容覆盖同行评论的文章、论文、图书、预印本、摘要、技术报告等学术文献。