450 likes | 712 Views
第三章 信息获取与可视化信息检索. Web1.0. 信息时代与 web 的发展与演变. Web2.0. Web3.0. Email 、 BBS IM…. ……. Blog 、 RSS Wiki 、 P2P. M-Blog SNS. ( 1 ) Web1.0. 表现形式: 一、 web1.0 采用的是技术创新主导模式; 二、 web1.0 的盈利都基于一个共通点,即巨大的点击流量; 三、 web1.0 的发展向综合门户合流现象; 技术特征: Email 、 IM 、 BBS 等. ( 2 ) Web2.0 的特点.
E N D
Web1.0 信息时代与web的发展与演变 Web2.0 Web3.0 Email、BBS IM… …… Blog、RSS Wiki 、P2P M-Blog SNS
(1)Web1.0 • 表现形式: • 一、web1.0采用的是技术创新主导模式; • 二、web1.0的盈利都基于一个共通点,即巨大的点击流量; • 三、web1.0的发展向综合门户合流现象; • 技术特征: Email、IM 、BBS等
(2)Web2.0的特点 • Web2.0模式下的显著特点: • (1)用户分享;(2)信息聚合;(3)以兴趣为聚合点的社群;(4)开放的平台,活跃的用户。 • 技术特征: Blog、RSS、Wiki、P2P、Tag等
Web2.0的技术特征 • Web2.0:Blog、RSS、Wiki、P2P、Tag • Blog:网络日志 • 独立运行的BSP:Blogchina-bokee、Blogcn、Blogbus; • 门户博客:新浪博客、网易博客; • 附属产品:qq空间,MSNspace。 • RSS:聚合内容,是一种在线共享内容的方式(周博通、鲜果、看天下、新浪点点通、 Google reader…)
P2P:P2P是英文Peer-to-Peer(对等)的简称,又被称为“点对点(Point to Point )”。如:BT(BitTorrent )、eMule、迅雷 • Wiki:一种多人协作的写作工具。它可以有多人(甚至任何访问者)维护,每个人都可以发表自己的意见,或者对共同的主题进行扩展或者探讨。(百度百科、 wikipedia……)。 • Tag:标签
(3)Web3.0的预演 • Web3.0的预演:Microblog、SNS、Group • Microblog:微博(诸多门户网站、twitter) • SNS:社会网络(开心网、人人网、Facebook、MySpace、Google+……) • Group:google group、yahoo group、豆瓣
未来web的发展方向---3.0 • Web3.0是基于用户行为、习惯和信息的聚合而构建的互联网平台,具有个性化、按照个人需求设置、人性化、友好界面、简单易用等核心元素,这种基于用户需求的信息聚合才是互联网的大趋势和大未来。 • 数据来源:郭涛 中国互联网协会新媒体专家
2. Web演变究竟是谁的时代来临? • web1.0解决了信息孤岛的联结问题,web2.0解决了网络发言权的解放问题,web3.0的目的就是解决海量信息在细化后的定向搜索与获利机制问题。 • web1.0是精英文化,开创了聚众时代;web2.0是草根文化,开创了分众时代;web3.0是个性文化,将开创一个全新的个性时代。
信息获取的方式及路径 • 电子公告版BBS • 订阅服务RSS • 网络兴趣组Groups • 文件传输协议FTP • 开放存取(OA)
1. BBS • BBS:Bulletin Board System,翻译为中文就是“电子公告板”。BBS最早是用来公布股市价格等类信息的。 • 类别:专业BBS网站(天涯、西祠胡同)、门户网站BBS、高校BBS
高校BBS • 水木清华:http://bbs.tsinghua.edu.cn/ • 北大未名:http://bbs.pku.edu.cn/ • 日月光华:http://bbs.fudan.edu.cn/ • 瀚海星云:http://bbs.ustc.edu.cn/ • 饮水思源:http://bbs.sjtu.edu.cn/ • 小百合:http://bbs.nju.edu.cn/
Next…… • 海纳百川:http://bbs.zju.edu.cn/ • 珞珈山水 :http://bbs.whu.edu.cn/ • 同舟共济:http://bbs.tongji.edu.cn/ • 兵马俑:http://bbs.xanet.edu.cn/ • 京师网事:http://202.204.7.234/ • 鼓浪听涛:http://bbs.xmu.edu.cn/ BBS是高校学生的精神家园
2. 订阅服务---RSS • RSS:也叫聚合RSS是在线共享内容的一种简易方式(也叫聚合内容,Really Simple Syndication)。通常在时效性比较强的内容上使用RSS订阅能更快速获取信息,网站提供RSS输出,有利于让用户获取网站内容的最新更新。 • 用途:订阅博客、订阅新闻
常用的RSS软件 • 国外:Google reader(于2013.7.1关闭)FeedDemon、RSSReader • 国内:抓虾、有道阅读、鲜果、新浪点点通、周博通
图书馆信息技术部 Information Department of Library 图书馆信息技术部
3. 兴趣组 • Groups 组: • 组是用户或用户帐户的集合。通过建立组,可以简化对大量用户进行管理和确定权限的任务。直接把消息发给组显然比把消息分发给组中每个用户容易。组有名字,并且能包括工作在类似项目、属于同一部门或属于公司内的一个俱乐部的用户。。
4. 文件传输协议FTP • FTP 是 TCP/IP 协议组中的协议之一(File Transfer Protocol)。该协议是Internet文件传送的基础,它由一系列规格说明文档组成,目标是提高文件的共享性,提供非直接使用远程计算机,使存储介质对用户透明和可靠高效地传送数据。简单的说,FTP就是完成两台计算机之间的拷贝,从远程计算机拷贝文件至自己的计算机上,称之为“下载(download)”文件。若将文件从自己计算机中拷贝至远程计算机上,则称之为“上载(upload)”文件。
精华FTP站点推荐 • 北京大学 • http://e.pku.edu.cn/(天网搜索) • 中国科学技术大学 • http://grid.ustc.edu.cn/
中国科技大学FTP:grid • 中科大的FTP搜索引擎http://grid.ustc.edu.cn • 搜索范围以包括科大校园网在内的全国高校FTP站点为主,覆盖了1800万文件,计有32T字节数据。其中,预约下载功能仅限在校内使用。 • FTP搜索引擎还包括以下功能:影视在线、 地址搜索、编码搜索 、还针对瀚海星云ID的数据分析与展示,可搜索37万余首歌曲等。
FTP软件 • FTP软件推荐:GlobalScape CuteFTP、Core FTP 、ChineseFTP等等 • 一些国外高校的账号密码: • 苏黎世 账号:gamma 密码:bisslonter • 斯坦福 帐号:delmar 密码:2pure4pech • 杜克 账号:chrisd 密码:melissa
可视化信息检索 • 1.什么是信息可视化:Visualization is more than a method of computing! It is a process of transforming information into a visual form enabling the viewer to observe,browse, make sense, and understand the information. It typically employs computers to process the information and computer screens to view it using methods of interactive graphics, imaging, and visual design. • 数据来源:http://www.infovis.org/
可视化信息检索 • 可视化信息检索是将可视化技术运用到信息检索中,并将信息资源、用户提问、信息检索模型、检索过程以及检索结果中各种语义关系转换成图形,显示在一个二维、三维或多维的可视化空间中,帮助用户理解检索结果、把握检索方向,以提高信息检索的效率与性能。
为什么要可视化? • 传统信息检索的特点: • 检索界面枯燥、单一; • 以关键词输入为主要检索方式; • 线性的检索结果显示; • 检索结果文档间无内在逻辑关系;
传统信息检索的不足之处 • 单一的文本关键词查询界面难以表达用户复杂的信息需求; • 单一的线性排列方式挑战检索用户的忍耐力; • 没有从面向用户的角度考虑,缺乏与检索用户的交互,缺少信息导航; • 没有对检索结果文档间关系进行揭示;
可视化信息检索的优点 • 人性化、个性化的检索界面; • 揭示检索结果文档之间的语义关系和内在联系; • 将复杂的信息可视化,解决了浏览过程中的信息迷航; • 将人的认知负担转变为感知任务;
可视化信息检索的意义 • 信息检索可视化为用户提供了一个良好的人机交互环境,能根据用户的需求,自动调整检索策略,并使检索过程变得透明,从而加大了人们对信息检索过程的控制能力。对于检索结果,可视化的信息检索环境则向用户提供了更为丰富的信息。除检索结果外,还能反映出文献之间的联系及文献与引文之间的联系等。 • 信息检索可视化将是改变人们信息检索行为的一次重要变革。
可视化技术与形式 • 从维度上分:二维、三维和多维; • 从具体表现形式上分:树形图(Treemap)、刷图(Brushing) 、双曲线浏览(Hyperbolic Browser)、表透镜( TableLens)、锥形树(Cone/ Cam Tree)、透视墙( Perspective Wall)、文档透镜(document lens)、场景图(scene graphs)、颗粒图(Bead)、主题地图( Theme scape ) 、鱼眼视图(Fisheye View)……
可视化与信息检索 • 检索界面可视化 • 检索过程可视化 • 检索结果可视化
检索界面可视化 • 可视化检索界面是一种新的检索界面,它设法提供新的检索方式,方便用户完成整个检索过程。用户可以不通过输入检索词来完成检索,比如,通过拖动图标或滑动杆才实现检索式的编排。
检索过程可视化 • 检索过程可视化是指用户在与检索系统交互时,采用可视化的图标进行操作,只需要点击按钮、选择菜单项就可以向系统传达命令。 • 它改变了传统的以文本输入框作为检索需求的表达方式,用户能够构造图形化的检索提问,例如通过拖拉、选择和绘图的方式输入检索词和进行逻辑组配。
检索结果可视化 • 检索结果可视化主要致力于设计一个接口显示所有检索结果,揭示检索结果与提问、结果与结果之间的关系,以便用户对检索结果进行浏览和操作。 • 检索结果的可视化能够充分发掘信息资源的价值,帮助用户更好地理解和利用信息。
可视化搜索引擎 • Searchme:http://www.searchme.com/ • Viewzi:http://www.viewzi.com/ • Cooliris:http://www.cooliris.com/ • Redzee:http://redz.com/ • Simploos:http://beta.simploos.com/ • Quintura:http://www.quintura.com/ • Oskope:http://www.oskope.com/