920 likes | 1.06k Views
第 4 讲. 网络资源检索. 2013 年 9 月 18 日. 第 4 讲. 1. 2. 3. 第 4 讲. 网络资源概述. 网络资源概述. 第 4 讲. 网络资源概述. 1.Internet 的概念. Internet 因特网是将由 不同 类型的计算机、 不同 技术组成的 各种 计算机网络 ,按照一定的通讯协议相互连接在一起, 使网中的每一台计算机或终端在一个网络中工作,从而实现 网络资源和服务共享 。 Internet 是一个采用 TCP/IP 协议并且能够与网络中任何一台 主机进行通信的计算机网络。. 第 4 讲.
E N D
第 4 讲 网络资源检索 2013年9月18日
第 4 讲 1 2 3
第 4 讲 网络资源概述 网络资源概述
第 4 讲 网络资源概述 1.Internet的概念 Internet因特网是将由不同类型的计算机、不同技术组成的 各种计算机网络,按照一定的通讯协议相互连接在一起, 使网中的每一台计算机或终端在一个网络中工作,从而实现 网络资源和服务共享。 Internet是一个采用TCP/IP协议并且能够与网络中任何一台 主机进行通信的计算机网络。
第 4 讲 网络资源概述 2.Internet的相关名词术语 1)WWW是world Wide Web的缩略语,万维网,是通过互联网获取信息的一种应用。 以超文本为基础形成的信息网,用户通过它可以查阅Internet上的信息资源。 2)URL是Uniform Resources Locator的缩略语,译为统一资源定位地址,即网址。 URL是在Internet的WWW服务程序上用于指定信息位置的表示方法,它指定了如 HTTP、FTP等Internet协议,是唯一能识别Internet上具体的计算机、目录或文件 位置的命名约定。
第 4 讲 网络资源概述 照片的Url
第 4 讲 网络资源概述 2.Internet的相关名词术语 3)FTP是File Transfer Protocol 的缩略语,译为文件传输协议。它是Internet上使用 广泛的一种通信协议,是计算机网络上主机之间传送文件的一种服务协议。 4)HTTP 是HyperText Transfer Protocol 的缩略语,译为超文本传输协议。HTTP定义 了信息如何被格式化、如何被传输,以及在各种命令下服务器和浏览器所采取的响 应。
第 4 讲 网络资源概述 2.Internet的相关名词术语 5)IP地址IP是Internet Protocol 的缩写,译为互联网协议。连入Internet的计算机或 节点被赋予一个数字地址,称为IP地址。IP地址由四节数字组成,每节数字的取值 范围从0~255,每节数字之间用“.”隔开。 6)TPC/IP是Internet使用的一组协议,TCP是Transmission Control Protocol的缩写,译为传输控制协议。IP负责信息的实际传送, TCP保证所传送的信息是正确的。
第 4 讲 网络资源概述 2.Internet的相关名词术语 7)局域网(LAN) 是Local Area Network的缩写,一般由一个部门或公司组建, 地理范围是机构内部。 8)区域网(MAN) 是Metropolitan Area Network,覆盖一个城市或地区,地理范围在 100KM一下,也称城域网。
第 4 讲 网络资源概述 3.网络信息资源 网络信息资源又称虚拟资源、数字资源、联机信息资源,是以数字化 形式记录的,利用计算机技术、通信技术及多媒体技术在网络上发布、 查询与获取利用的信息资源的总和。
第 4 讲 网络资源概述 3.网络信息资源的类型 • 按发布机构分为 • 企业网站信息资源,一般以.com为一级或二级域名注册; • 学校、科研院所站点信息资源,一般以.edu或.ac为一级或二级域名注册; • 信息服务机构站点信息资源,一般以.net、.com、.gov为一级或二级域名 • 注册; • 按网络传输协议分为 • Web网络信息资源、Telnet(远程登录协议)信息资源、FTP信息资源、 • 用户服务组资源(新闻组、电子邮件等); • 按使用形式分为联机检索信息资源和互联网信息资源。 • 按信息内容表现形式和内容分为 • 全文型、事实性(天气预报、航班等)、 • 数值型(统计数据)、数据库型、微内容(博客、微博、BBS等)、 • 其他类型(图形、广告等)
第 4 讲 网络资源检索与利用 搜索引擎的利用
第 4 讲 网络资源检索与利用 什么是搜索引擎? 概念: 搜索引擎(Search Engine)利用网络自动搜索技术,通过Internet 接收用户的查询指令,对因特网各种资源进行收集和标引,建立网 页数据库,并为检索者提供网络信息检索的工具。
第 4 讲 网络资源检索与利用 什么是搜索引擎? 工作原理: 搜索引擎是利用网络自动搜索技术对互联网上的各种资源 进行标引,并为检索者提供检索服务的系统。具体来说,搜 索引擎是指互联网上专门提供查询服务的网站。这些网站通 过复杂的网络搜索系统,将互联网上大量网站的页面收集到 一起,经过分类处理并却保存起来,从而能够对用户提出的 各种查询做出响应,提供给用户所需要的信息。 第一步:爬行 → 第二步:抓取存储 → 第三步:预处理 → 第四步:排序显示
目录索引搜索引擎 Search Index 全文搜索引擎 Full Text Search Engine 元搜索引擎 Meta Search Engine 第 4 讲 网络资源检索与利用 搜索引擎分类: Google; AltaVista; Teoma; 百度 Open Directory Project (DMOZ); 雅虎; 搜狐; 新浪; 网易 Infospace; Dogpile; Vivisimo
第 4 讲 网络资源检索与利用 全文搜索引擎(Full Text Search Engine) • 通过从互联网各个网站提取信息(以网页文字为主)而建立的数据库 • 中,检索用户查询条件匹配的相关记录,然后按照一定得排列顺序将 • 结果返回给用户,因此它们是真正的搜索引擎。 • 拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人 • (Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用。 特点: 优点——信息量大、更新及时; 缺点——返回信息量多,需用户筛选。
第 4 讲 网络资源检索与利用 常用的中文搜索引擎 1)百度(http://www.baidu.com) 百度公司2000年1月1日创建。全球最大的中文搜索引擎, 每天完成上亿次搜索。
第 4 讲 网络资源检索与利用
第 4 讲 网络资源检索与利用
第 4 讲 网络资源检索与利用 简单检索 输入多个不同检索词,词和词之间用空格隔开。 百度支持布尔逻辑检索语法:“空格”= “AND” “ - “ = “NOT” “ ∣ ”= “OR”
第 4 讲 网络资源检索与利用 高级检索 a) Intitle 网页标题 在intitle语法后加上要查询的关键词,可以限定只搜索网页标题中含有这些关键词 的网页。 国际会议与“intitle”之间可以有空格; “intitle”与后面关键词不需要空格。 搜索北京大学相关网站发布的国际会议信息
第 4 讲 网络资源检索与利用 高级检索 • Intitle • 网页标题举例检索
第 4 讲 网络资源检索与利用 高级检索 b) Site 地点域名 知道某个站点中有自己需要找的信息,在查询内容后面加上 “site: 站点域名”, 可以把搜索范围限定在这个站点中,提高查询效率。 “site”后面跟的域名不要带“http://” 搜索哈尔滨工程大学网站所含有关信息
第 4 讲 网络资源检索与利用 高级检索 b) Site 地点域名检索举例
第 4 讲 网络资源检索与利用 高级检索 c) Inurl 网页 网页url中的某些拼写信息,常常有某种价值的含义,能够提示出网页的内容或类别。 “inurl”前的词可以出现在网页的任何位置; “inurl”后面的词必须出现在网页url中 搜索有关photoshop使用技巧
第 4 讲 网络资源检索与利用 高级检索 c) Inurl 网页检索举例
第 4 讲 网络资源检索与利用 高级检索 d) 双引号、书名号 双引号保证输入的关键词(词组、句子)不被拆分检索 书名号会出现在结果中,适用于直接搜索书籍,电影等。
第 4 讲 网络资源检索与利用 百度文库
第 4 讲 网络资源检索与利用 百度百科
第 4 讲 网络资源检索与利用 百度地图
第 4 讲 网络资源检索与利用 常用的英文搜索引擎 2)谷歌(http://google.cn/) 1998年,Google创始人美国斯坦福大学Larry Page(拉里-佩奇), 和Sergey Brin(谢尔盖-布林)共同创立了全新的在线搜索引擎。
第 4 讲 网络资源检索与利用
第 4 讲 网络资源检索与利用 简单检索 • “空格”、“-”、“∣”表示逻辑运算“AND、NOT、OR”; • “+”在必须使用的某一常见字词前输入“+”号,从而将其包含在查询 • 结果中; • “ “ “ ”号将两个或多个字词括住执行词组搜索。
第 4 讲 网络资源检索与利用 高级检索 • Site • 或搜索结果局限于某个具体网站或者网站频道。
第 4 讲 网络资源检索与利用 高级检索 b ) Filetype 对指定文献类型搜索。 搜索有关搜索引擎知识和技巧方面的PDF文件
第 4 讲 网络资源检索与利用 高级检索 c ) Intitle
第 4 讲 网络资源检索与利用 高级检索 d) Link 对于搜索某个网站的所有链接。
第 4 讲 网络资源检索与利用 高级检索 e) related 语法用于查找与某个页面结构内容相似的页面 搜索与我校主页相似的页面
第 4 讲 网络资源检索与利用 新词和生僻词定义服务功能 搜索“信息”的定义 Define后按空格,之后想定义的词语。
第 4 讲 网络资源检索与利用 翻译
第 4 讲 网络资源检索与利用 图书搜索
第 4 讲 网络资源检索与利用 谷歌学术搜索
第 4 讲 网络资源检索与利用 谷歌学术搜索
第 4 讲 网络资源检索与利用 谷歌学术搜索 submarine control robust adaptive
第 4 讲 网络资源检索与利用 谷歌学术搜索
第 4 讲 网络资源检索与利用 特色功能1:手气不错按钮
第 4 讲 网络资源检索与利用 特色功能1:手气不错按钮 输入搜索字词后,点击“手气不错”,可以直接进入针对查询词相关性最高的页面。
第 4 讲 网络资源检索与利用 特色功能2:计算器
第 4 讲 网络资源检索与利用 特色功能2:换算器
第 4 讲 网络资源检索与利用 特色功能3:归属地查询