510 likes | 765 Views
从 Google 和 Facebook 的发展 看图书馆服务的集成与分布. 姜爱蓉 清华大学图书馆 2011 年 6 月 ● 北京. 大纲. Google 和 Facebook 的启示 图书馆集成服务的发展 图书馆分布服务的涌起. Google 和 Facebook 的启示. 互联网之战: Facebook PK Google 2010 年底 Hitwise 发布数据显示: Facebook 访问量已超过 Google (美国本土) 2010 年 1 月 ~ 11 月之间,站点访问量 Facebook.com 排第一(占 8.93% )
E N D
从Google和Facebook的发展 看图书馆服务的集成与分布 姜爱蓉 清华大学图书馆 2011年6月 ● 北京
大纲 • Google和Facebook的启示 • 图书馆集成服务的发展 • 图书馆分布服务的涌起
Google和Facebook的启示 • 互联网之战:Facebook PK Google • 2010年底Hitwise发布数据显示: • Facebook访问量已超过Google(美国本土) • 2010年1月~11月之间,站点访问量 • Facebook.com 排第一(占8.93%) • Google.com 排第二(占7.19%) • 雅虎邮箱 排第三(占3.52%) • Yahoo.com 排第四(占3.30%) • YouTube.com 排第五(占2.65%)
Google和Facebook的启示 2011年5月第一周,美国互联网访问总量前20网站。 Facebook占10.4% Google占8%
Google和Facebook的启示 Facebook用户数: 2008年为1.3亿 2009年为3.5亿 2011年初达4亿 5月超过6亿 Facebook按人口算已是全球第三大“国家”
Google和Facebook的启示 美国搜索引擎和社交网络发展趋势
Google和Facebook的启示 • 2005-2010, 信息环境的变化(美国) • 2.39亿互联网用户,占总人口77%,增长12% • Google占搜索引擎市场份额66%,增长84% • 每月1.52亿人访问Facebook,增长1300% • 每月2400万人访问Twitter,增长1100%(2007以来) • 电子书销售额为3.45亿,增长1544% • 能接入互联网的手机占11%,增长100% • 公共馆开通无线上网服务占82%,增长116%
Google和Facebook的启示 OCLC_2003年审视报告— 自2000年之后,Google竟变得无所不在 Google的诞生是整个Web的一种升级 检索信息经历了从迟缓、不可信的过程走向你能用它得到真实可信的东西。只要信息在网上某个地方,Google和它灵巧的PageRank系统就会找到你要找寻的东西—而且常常不是徒劳,信息会出现在Google头10条结果中。 Google正在架空图书馆—这些被调查者的感受和评价给图书馆员带来震撼与冲击!
Google和Facebook的启示 • 目前两种模式的网络正在成型— • 以 Google 为首的信息网络(information web) • 以Facebook为首的社交网络(social web) • (Twitter须渗入这两种模式并占据优势地位,才能打进主流) • Google搜索是抓取全世界的信息,并通过一套算法帮助人们更便捷地找到有用的信息。 • Facebook和Twitter则是让用户生产信息,并通过彼此的熟人关系来获取。 • Facebook不对搜索引擎开放,Twitter只是部分开放,这让搜索引擎的处境不禁尴尬。
Google和Facebook的启示 • Hitwise报告称,人们更喜欢直接登录到社交网站,而不是通过Google搜索等传统方式上网。 • 对比2009年和2010年的普及率,Google访问量的增长率为9%,而Facebook增长率为185%。 • 2010年8月,美国人停留在Facebook上的时间是4100万分钟,停留在Google上(包括YouTube)是4000万分钟。 • 由此可以看出,Google在互联网领域的领导地位正受到严峻挑战。 • Facebook 作为新潮的网络社交模式,似乎已经触到Google的软肋。
Google和Facebook的启示 20分钟内Facebook将发生什么? --100万条链接被共享 --130万张照片被标注(标签) --150万份邀请信被发出 --160万张壁纸被共享 --180万用户状态被更新 --270万张照片被上传 --1020万条评论被发表 --460万条信息被发出 --197万条好友请求被接受
Google和Facebook的启示 经过Web2.0的洗礼,互联网正转向一种新模式 ——基于人们的交流沟通方式和人们所关注的事情。 Facebook在2008年提出社交图谱(Social Graph)的概念,旨在建立将人们和不同事物联系起来的地图,呈现公众网络社交关系和在各个领域的应用。图谱易用、开放并兼容其他服务。通过建立开放图谱协议,任何网页都能轻松成为社交图谱的一部分。 Facebook正在绘出人的社交应用图谱,Yelp绘出商业应用图谱,Pandora则是音乐领域图谱。把各种社交图谱联结起来,将使网络更加社交和个性化,更加智能、更类似于语义网络。
Google和Facebook的启示 社交图谱包括用户基本资料、网络社交关系信息,以其最近在互联网上的活动信息。
Google和Facebook的启示 去年4月,Facebook研发大会提出组织网络的“开放图谱”概念。 “网络是由无固定结构的网页链接而成。“开放图谱”把人放在网络的中心,它给网络赋予了个人和语义上的意义。”
Google和Facebook的启示 • Facebook正在推出一系列易用、开放的社交插件构建开放图谱,推动用户在任和一个网站的社交体验。 • 最为典型的是“Like”按钮,通过添加一行HTML代码,就可立即加入到社交体验行列。 • 无论在Facebook还是在其他网站,“Like”按钮能使用户轻松、长时间与他人分享自己感兴趣的事情和主题。 • 通过“Like”按钮,外部网站可利用Facebook社交插件的优势,在各自的网站上向用户提供个性化服务。 • Facebook汇集来自“Like”按钮的活动数据,从而向世人展现一个全球互联网人群的社交分布图谱。 • “Like”按钮的个性化推荐机制被视为对传统搜索引擎的排名算法的挑战。
Google和Facebook的启示 2010年4月“Like”按钮推出之际,马克·扎克伯格宣称:未来24小时内,整个互联网上点击“Like”(喜爱)按钮的用户将超过10亿。其预测的基础是发布这个新功能时已拉拢了大约30多家重磅合作伙伴。 至2011年5月,全球有250万家网站整合了“Like”按钮,并以每天1万家的速度迅速增加。其中包括80%多的美国前100大网站。日益成为网站们的标配。 “Like”按钮的成功已引起了 竞争对手的重视,谷歌近期 提出的“Google+1”功能,正是 对Facebook “Like”的反击。
精准的信息推送 Google和Facebook的启示 Facebook的“野心”— 重新索引互联网
Google和Facebook的启示 • 虽简单但不能小看的“Like”按钮,其实是一个“人”对“网页”的投票器。如这个人用 Facebook ID登录了某领域网站,那么这个按钮就是“某个领域专家”(依问答网站的数据分辨)对网页的投票器。 • Pagerank让网页来投票,而Facebook通过用户注册的数据可让“人”,甚至“专家”来投票。实名网络下,某些领域专家的投票给予网页很大的加权,让网页排名更靠前。 • 最多“专家”投票的网页,通过Pagerank的投票也可能加权排名在前。但通过Facebook Like和Twitter RT的积累,远比引用要来得迅速。 • 在强调实时网络的今天,社交搜索得到的结果不但可能比Pagerank更好,而且更快。
Google和Facebook的启示 目前全球至少存在着50余家百万用户量级的社交网络,最具领先优势的Facebook是典型代表。 尽管并不是每个人都想投身毫无保留的社交网络之中,但整个互联网模式的变迁,无形中压迫着作为信息个体的每个人不得不响应社交网络带来的新升级。 从全球范围来看,从2009年的3.37亿用户到2011年的6亿用户,Facebook的增速让人瞠目结舌。且关键的是,Facebook使用者的高度参与黏度,每个网民平均上网时间花在Facebook上占11%,花在Google和雅虎上分别占4%。
Google和Facebook的启示 Facebook的崛起也许是互联网的一种进化。20世纪末开始的互联网新浪潮,一直在压迫式地推动着互联网的自我进化。 以“雅虎”作为代表的早期互联网模式,一直在恪守编辑者原则,由网络管理员为主体的编辑者输入和管理信息。 但人力无法满足互联网的机械化发展本性,于是坚持算法优先,以计算机优越的能力来管理网络内容的Google,成为雅虎的替代者。
Google和Facebook的启示 Google依靠独一无二的搜索算法,计算出数据网页之间的关联性,并以此作为筛选原则,成为当之无愧的搜索之王。 然而,面对未来网页和搜索关键点的持续爆炸性增长,梳理数据的架构很难再依靠单纯的机器算法解决,尤其是无法充分展现出每位用户的个性化信息。 这种大背景下,Web2.0浪潮涌起,经过2004年以来的诸多探索,Facebook以单独行为的个体人作为信息推荐/分类单位的模式,有望使网上信息交流和获取效率更高,并最大限度地控制社交信息噪音。 Facebook抓住了社交网络模式的要害,将自己变成了Web 2.0的关系入口,以开放API策略,迅速推进着平台工具化进程。
Google和Facebook的启示 Facebook引领的社交环境,催生着各个领域社交网络的应用如雨后春笋般涌现。
Google和Facebook的启示 2009年美国政府支持创建大型“科研脸谱网”--加强科学家之间的联系 美国康奈尔大学和其它六家机构将利用美国国家卫生研究院划拨的1220万美元联邦资金筹建一个脸谱网(Facebook)风格的专业社交网络-- VIVO网,旨在把全美各地的生物医学研究人员联系起来。新的社交网络(VIVO)将包括各机构、学术期刊和研究人员本人添加的信息。 通过VIVO网,科学家可以看到网络中的研究人员正在进行的其它科学研究,更便捷地找到其他人并建立联系,从而改进手中的研究,并与他人形成合作关系,由此可能会导致新的发现和创新。
http://vivoweb.org/ http://vivo.cornell.edu/ Google和Facebook的启示
Google和Facebook的启示 经过大量商业性数字资源的涌现和自建数字资源的产生,未来数字图书馆发展将聚焦:资源高度整合与发现、个性化推送服务、语义网环境下的信息获取。 Google给图书馆带来冲击也产生影响。图书馆系统/服务的提供商正在打造图书馆的Google —资源发现平台(DiscoverySystem),提供快速、易用、全面的数字资源发现和获取。 以Facebook为代表的社交网络迅速发展也必将给图书馆带来新一轮的冲击和影响,目前图书馆达成共识并孜孜不倦追求的个性化/学科化服务、语义网环境等借助于社交网络有望迈上一个新阶段。
大纲 • Google和Facebook的启示 • 图书馆集成服务的发展 • 图书馆分布服务的涌起
图书馆需要一个高度整合所有类型资源并提供发现服务的系统。图书馆需要一个高度整合所有类型资源并提供发现服务的系统。 数字图书馆需要管理数以百计的数据库,数以万计的电子期刊、数以百万计的电子图书、数以千万乃至几个亿的学术论文。揭示和管理这些分布、海量的数字资源对图书馆是一个严峻挑战,迫切需要得心应手的理想工具。 图书馆集成服务的发展 传统图书馆主要管理几十万或几百万件的纸本馆藏。经过几十年的发展,图书馆自动化系统担当起馆藏揭示和管理服务的重任。
ILS SpringerLink ProQuest 中国知网 读秀 实时查询和响应 图书馆集成服务的发展 初级阶段:分布环境下电子资源的逐一检索
本地 索引 元 搜 索 引 擎 实时查询和响应 图书馆集成服务的发展 中级阶段:电子资源的联邦检索
发现系统—预先收割数据并建索引 图书馆集成服务的发展 “高级阶段”:基于数据仓储的整合检索
发现系统的技术优势是预先对元数据及全文建立的高品质仓储和索引,由此产生的明显效果包括:发现系统的技术优势是预先对元数据及全文建立的高品质仓储和索引,由此产生的明显效果包括: • 扩大检索范围; • 提高检索效率; • 提升查全率和查准率; • 结果呈现的灵活多样; • 纸本和电子资源的强融合、强整合。 图书馆集成服务的发展
图书馆集成服务的发展 • 扩大检索范围 • 由于联邦检索依赖计算机的处理能力实时发送检索并获取结果,检索性能受到被检索资源平台的数量和性能影响,往往一次检索限制在20-30种资源内。 • 目前商家的预索引仓储数据量为2-5亿(包括10余万种期刊的上亿篇文章,上千万的电子书,上百万的学位论文等),用户的检索不再受资源平台和数量的限制。
图书馆集成服务的发展 • 提升检索效率 • 联邦检索的结果呈现受电子资源平台和网络传输的制约,跨20-30个资源库检索,首页结果呈现<3秒,但全部结果呈现有时需要几十秒。 • 发现系统在预建元数据和全文索引的支持下,大部分(80%以上)检索结果呈现<1秒。
预索引 仓储 图书馆集成服务的发展 • 保障查全率和查准率 • 发现系统在预收割并建立元数据和全文索引过程中,对索引数据进行规范化、丰富化处理,提高了检索结果的查全率和查准率。
图书馆集成服务的发展 • 结果呈现的灵活多样 • 检索结果可实现: • 去重、排序、分面、FRBR、可视化 • 全文链接、个人文献管理、外部数据聚合 • 用户行为的挖掘、学术经验的推荐与分享
图书馆集成服务的发展 • 纸本和电子资源的强融合、强整合 • 发现系统基于对图书馆ILS数据的全面收割和重新索引,将书目数据与电子资源数据无缝融合在一起,在发现系统界面上重新呈现,包括馆藏的实时在架/流通状态。 • 纸本和电子资源的真正融合在一起提供检索和服务。
大纲 • Google和Facebook的启示 • 图书馆集成服务的发展 • 图书馆分布服务的涌起
图书馆分布服务的涌起 以Facebook为代表的社交网络也给图书馆带来影响。在读者频繁光顾和长久停留的社交网络(Facebook、人人网、微博等)上,许多图书馆开始探索图书馆分布服务的途径。
图书馆分布服务的涌起 香港中文大学图书馆去年启用了Facebook上的服务
耶鲁大学科学图书馆在Facebook上提供服务 图书馆分布服务的涌起
图书馆分布服务的涌起 • 清华图书馆重视在读者熟悉的网络空间(社交网络)提供服务、加强互动。 • 在国内社交网站人人网上建立图书馆俱乐部 • ——“清华大学图书馆书友会” • 发布图书馆消息、构建图书馆相册、开发应用模块,方便读者在社交网络上体验图书馆服务。 • 书友会成立获得了广泛的关注,已吸纳2700多名会员,其中95%都是清华大学学生。 • 人人网--清华大学图书馆书友会: http://page.renren.com/600002731
图书馆分布服务的涌起 人人网—清华大学图书馆书友会
图书馆分布服务的涌起 • 在新浪网建立清华图书馆微博 • 提供服务公告、资源使用、培训讲座等信息,分享好的读书感受,分享好的电影,上传馆舍老照片,分享人文新馆建设情况,转发博友的帖子等,已吸引了近3500粉丝的关注,已发表微博近1300条。 • 清华大学图书馆新浪微博首页http://www.weibo.co/index.php?m=ta&id=1891371401 • 在新浪网建立新闻学科博客 • 提供每周上架专业新书,推荐有口碑的专业图书,探讨学科服务的新途径,等等。 • 清华大学图书馆学科博客首页http://blog.sina.com.cn/s/articlelist_1645974454_5_1.html
图书馆分布服务的涌起 新浪 —清华图书馆的微博
图书馆分布服务的涌起 新浪—建立新闻学科博客
图书馆分布服务的涌起 开发了虚拟咨询馆员“小图”,嵌入人人网,作为随时值班在线的虚拟咨询员,拓展了服务范围。 参考咨询:依据清华图书馆虚拟参考咨询系统的FAQ的咨询记录为基础语料库,每天24小时不间断地为读者提供全天候实时咨询服务; 图书搜索:搜索馆藏图书,呈现检索结果; 自我学习训练:经过在线学习训练,能够与读者进行日常对话,聊天气,聊时事等。具有很强的交互性,令人耳目一新。 清华图书馆虚拟咨询馆员小图http://166.111.120.164:8081/programd/
图书馆分布服务的涌起 提供23639种电子期刊的RSS订阅
图书馆分布服务的涌起 • 欢迎参加人人网“清华大学图书馆”俱乐部,开始体验 • 图书馆专题培训日程 • 新书通告 • 图书馆公告 • 图书搜索 • 智能聊天机器