1.07k likes | 1.31k Views
网络信息检索工具 —— 搜索引擎 主讲人:刘进军. 你的搜商够高吗?. 成功 = 智商 + 情商 + 搜商 ?. 主要内容. 第一节 搜索引擎概述 第二节 常用搜索引擎技巧分析. 第一节 搜索引擎概述. 盲目. 网络信息资源. 信息用户. 更快、更准确. 搜索引擎. 一、搜索引擎的产生. 二、搜索引擎的概念. 搜索引擎是一种网络信息资源检索工具,是以各种网络信息资源为检索对象的查询系统。 它像一本书的目录, Internet 各个站点的网址就像是页码,可以通过关键词或主题分类的方式来查找感兴趣的信息所在的 WEB 页面 。.
E N D
网络信息检索工具 ——搜索引擎 主讲人:刘进军
你的搜商够高吗? 成功=智商+情商+搜商 ?
主要内容 第一节 搜索引擎概述 第二节 常用搜索引擎技巧分析
盲目 网络信息资源 信息用户 更快、更准确 搜索引擎 一、搜索引擎的产生
二、搜索引擎的概念 搜索引擎是一种网络信息资源检索工具,是以各种网络信息资源为检索对象的查询系统。 它像一本书的目录,Internet各个站点的网址就像是页码,可以通过关键词或主题分类的方式来查找感兴趣的信息所在的WEB页面。
三、搜索引擎的工作原理 挖掘 用户界面
从互联网上采集信息 利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。
建立索引数据库 由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。
在索引数据库中搜索排序 当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。 最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。
四、搜索引擎的分类 根据信息覆盖范围及适用用户群分类 (1)综合性搜索引擎 如:Baidu、Google、Yahoo、AltaViasta、Infoseek (2)专用性搜索引擎 如:Scirus科学搜索引擎、Softseek提供软件查找,MapBlast查找地图信息。
五、搜索引擎的作用 1.生活 查新闻 例子:2009 诺贝尔奖 2.学习 如:查字 例子:炅(日字下面一个火怎么读) 如:查论文 3.娱乐 下载歌曲、电影 ……
第二节 常用搜索引擎技巧分析 想一想:你用过哪些搜索引擎?
一、百度(http://www.baidu.com) 百度,全球最大的中文搜索引擎、最大的中文网站。2000年1月创立于北京中关村。百度搜索引擎具有高准确性、高查全率、更新快以及服务稳定的特点。 (一)概况
(二)检索方法与技巧 1、Baidu 的常用搜索技巧 (1)以空格表示逻辑“与” 在百度查询时不需要使用符号“AND”或“+”,百度会在多个以空格隔开的词语之间自动添加“+”。如:“云南 旱灾 图片” (2)以“-”表示逻辑“非” 百度支持“-”功能,用于有目的地删除某些无关网页,但减号之前必须留一空格。 例如:图书馆 -公共图书馆
(3)以“|”表示逻辑“或” 使用“A|B”来搜索“或者包含词语A,或者包含词语B”的网页。 如:毛泽东|毛主席
(4) intitle:在网页标题中搜索 在一个或几个关键词前加“intitle:”,可以限制只搜索网页标题中含有这些关键词的网页。 如:intitle:上海世博会
利用intitle查找论文 直接找特定论文 除了找论文网站,我们也可以直接搜索某个专题的论文。看过论文的都知道,一般的论文,都有一定的格式,除了标题、正文、附录,还需要有论文关键词,论文摘要等。其中, “关键词”和“摘要”是论文的特征词汇。而论文主题,通常会出现在网页标题中。 例:关键词 摘要 intitle:信息系统
用intitle语法查询别人的收藏夹 IE浏览器的收藏夹导出后,网页的标题(title)是bookmarks。百度的intitle语法可以把搜索范围限定在网页标题内。所以,用intitle语法可以查询别人的收藏夹,结果应该都是精品,没有哪个人会把垃圾放到自己收藏夹的。 实例: 小说 intitle:bookmarks查找小说的精彩站点
(5) Inurl url是Uniform Resource Locator(统一资源定位符)的缩写,简单地说,就是地址栏里的东西。 格式:关键词A inurl:关键词B(关键词A与inurl之间要用空格隔开) 意思是在url中含有关键词B的网页中,寻找关于关键词A的信息。 这句话说的好,“网页url中的某些信息,常常有某种有价值的含义”。只要善于观察,多多使用,你就会发现inurl语法非常有用。
例1:找关于photoshop的使用技巧,可以这样查询:photoshop inurl:jiqiao 上面这个查询串中的“photoshop”,是可以出现在网页的任何位置,而“jiqiao”则必须出现在网页url中。 注意,inurl:语法和后面所跟的关键词,不要有空格。
问情 inurl:mp3搜索《戏说乾隆》的主题曲 • inurl:liyuchun查找李宇春的信息 • 第一章 inurl:lianchengjue查询小说《连城诀》
(6)site的用法 有时候,您如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。 注意,“site:”后面跟的站点域名,不要带“http://”;另外,site:和站点名之间,不要带空格。
在著名的软件下载站找软件 由于网站质量参差不齐,下载速度也快慢不一。如果我们积累了一些好用的下载站(如天空网,华军网,电脑之家等),就可以用site语法把搜索范围局限在这些网站内,以提高搜索效率。 例: 网际快车 site:skycn.com
cnkikw site:edu.cn在教育网内搜索cnkikw • 摄影 site:hao123.com在hao123中找摄影的网站
(6) “开始连接”、“正在连接”搜索免费电影 • 网络上有很多热心人提供免费电影的下载地址。为了表明真实可靠,把下载过程也同时附上。现在最流行的下载工具是flashget和迅雷。 Flashget下载开始就是“正在连接”,迅雷则是“开始连接”。所以,可以用想找的电影名字,加上“开始连接”或者“正在连接”,来寻找免费电影。 • 检索式形式如:“电影名 开始连接”、电影名 正在连接”、“电影名 (开始连接 | 正在连接)” • 举几个例子: 哈利波特4 开始连接 阿育王 (正在连接 | 开始连接)
(7) 『』查找论坛版块 • 检索式形式如: 『论坛版块名称』 • 实例: 『知网免费帐号』
2.Baidu的特色搜索 (1)百度快照 百度搜索引擎已先预览各网站,拍下网页的快照,为用户贮存大量的应急网页。点击每条搜索结果后的“百度快照”,可查看该网页的快照内容。以搜索“甲型h1n1流感”为例。
(2)专业文档搜索(http://file.baidu.com) 百度支持对Office文档(包括Word、Excel、Powerpoint)、Adobe PDF文档、RTF文档进行了全文搜索。要搜索这类文档,在普通的查询词后面,加一个“filetype:” 。“Filetype:”后可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、ALL。其中,ALL表示搜索所有这些文件类型。
如: 查找关于网络技术的课件 格式: 网络技术 filetype:ppt 如:查找关于互联网的调查报告 互联网 调查报告 filetype:doc
(3) 精确匹配——双引号和书名号 如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的,给查询词加上双引号,就可以达到这种效果。例如,搜索京师范大学研究生院,加上双引号后,输入“北京师范大学研究生院”,获得的结果就全是符合要求的了。
书名号是百度独有的一个特殊查询语法。加上书名号的查询词,有两层特殊功能:书名号是百度独有的一个特殊查询语法。加上书名号的查询词,有两层特殊功能: 一是书名号会出现在搜索结果中; 二是被书名号扩起来的内容,不会被拆分。 例如;查电影“手机”,如果不加书名号,很多情况下出来的是通讯工具——手机,而加上书名号后,《手机》结果就都是关于电影方面的了。 查找图书的时候推荐使用,如《说服力:让你的PPT会说话》
(4)百度国学(http://guoxue.baidu.com) 百度国学是百度与国学公司合作推出的针对中国传统文化方面的专业搜索,提供了大量的丰富的古典名著、历史资料、人名书名等,所有在线资源都是免费的。 提供上起先秦,下至清末历代文化典籍的检索和阅读;包括经、史、子、 集、蒙学及其他。
百度更多功能 • 贴吧搜索 • MP3搜索 • 百度知道 • 百度百科 • 视频搜索 • 图片搜索 • 百度文库 ……
二、Google(http://www.google.com.hk/) (一)概况 特点:世界上第一大的网络搜索引擎;有庞大的数据库;用户界面相当好;并且具有一定的大写、名词识别能力的快速搜索引擎。 口号:确解用户之意,切返用户之需