560 likes | 720 Views
第三届数字图书馆前沿问题高级研讨班 清华大学 2006. 数字图书馆 2.0. <META NAME=“DC.Creator” CONTENT=“Keven"> <META NAME="DC.Date" SCHEME="ISO8601" CONTENT=“2006-08-15">. http://my.donews.com/keven/. DL2.0=DL+WEB2.0. 数字图书馆的 1.0 和 2.0 Web2.0 简述 Web2.0 与数字图书馆渊源: 微内容微结构与数字资源对象 (DO) Tagging 与元数据的普遍应用
E N D
第三届数字图书馆前沿问题高级研讨班 清华大学 2006 数字图书馆2.0 <META NAME=“DC.Creator” CONTENT=“Keven"> <META NAME="DC.Date" SCHEME="ISO8601" CONTENT=“2006-08-15">
DL2.0=DL+WEB2.0 • 数字图书馆的1.0和2.0 • Web2.0简述 • Web2.0与数字图书馆渊源: • 微内容微结构与数字资源对象(DO) • Tagging与元数据的普遍应用 • 从民俗分类到本体:信息资源的普遍联系 • SOA(面向服务的)体系架构与Web服务 • Mashup与开放API • Ajax技术与用户体验 • 图书馆2.0应用综述 • 以“上海年华”的设计为例
资源数字化 纸质资源 ILS 开放资源获取 租订数字资源 数字图书馆1.0 网站建设 用户 参考咨询 读者管理 人员培训
资源数字化 社区 用户 开放资源获取 租订数字资源 数字图书馆2.0 知识组织 门户建设 Web服务 资源整合
DL2.0 • 2.0只是表示一种版本升级,呈现出与以往的一些不同 • DL2.0:具有许多Web2.0特征的数字图书馆(以Web2.0作为技术和理念背景的DL) • 具有不同的问题域和不同的侧重点,例如 • 以用户为中心 • 更复杂(细粒度)的数字对象结构 • 更普遍的链接性 • 更多的多媒体而不是文本 • 更普遍的手持设备与p2p应用等
几个概念 Web 1.0: 静态HTML网页; Web 1.5: 内容基于数据库动态发布,三层结构,DHTML; Semantic Web: Web 2.0 的架构基础(有人认为是同一概念的另一种说法,学名和俗名的区别;但我认为Web2.0是一种前SW状态,利用了SW的许多思想,但是并不严格(在模型、编码语言方面) Internet2:高速因特网网络设施,通常指IPv6, IP Multicasting之类; Semantic Network:一种图示概念间语义关系的语义建模方法
关于Web 2.0 并没有严格的定义,并非指特定的事物。 描述了一种现象:因特网成为一个应用环境,而以前因特网只是“一种”应用。 带有许多广告和泡沫的成分。 各类描述不尽一致,从不同角度,甚至有矛盾之处。 并没有唯一的发明者,或者管理者确定Web 2.0的发展方向
Web2.0简史 “Web 2.0”一词由 O‘Reilly Media和MediaLive公司3年前作为一次会议名称而提出的概念。 1994召开第一次会议,去年第二届。 并非新的概念: Scott McNealy(CEO of Sun MicroSystems)曾广而告之: “...the network is the platform...” 微软也曾在1995 提到过 “The Web is the Next Platform.”
Web2.0的笼统界定 • Web2.0是与互联网有关的一系列技术发展到一定阶段、应用的门槛逐步降低、技术与需求得以很方便地结合、从而产生的一次大规模的应用普及。这种普及带来经济、文化、思想理念和社会生活等各方面的显著变化,被人们归纳统称为“Web2.0”。 • Web2.0是互联网上一系列新的技术和应用的总称,包括Blog,Wiki,RSS,SNS,Podcast,Ajax, Tag等等,他们都具有一些共同的特征,例如可写Web,用户参与并协同,社会关系网络,开放格式与协议,等等。
Web2.0概念 • Web2.0不是语义Web,但是具有语义Web的许多特征: • 描述语义但不用RDF • 资源标识基于URL • 半形式化本地标准领域应用并非为机器处理考虑
改变世界的15个网站 • eBay.com • Wikipedia.com • Napster. om • youtube.com • blogger.com • friendsreunited.com • drudgereport.com • myspace.com • amazon.com • slashdot.org • salon.com • craigslist.org • google.com • yahoo.com • easyjet.com
Web2.0 社会生物基因Meme http://www.oreilly.com.cn/news/whatisweb20.php?c=
Web 2.0主要“原则” • Web 作为平台 • 获得集体智慧Collective Intelligence • 以数据为核心Data is the next “Intel Inside” • 永远的测试版(由于定位于服务而非软件) • 轻型商务模式Lightweight business models • 软件独立于设备Software above the level of a single device • 丰富的用户体验RUE
Web/语义Web的结构 • HTTP • HTML • URL • URI • DO • RDF • OWL
XML:Web 2.0的语言 XML在 Web 2.0中普遍使用; XML是web服务的语言 (SOAP, XML-RPC, REST). XML是 web 协同 (RSS, ATOM)的语言 XML AJAX的数据交换格式的语言(via the XMLHttpRequest Object “responseXML” proprety). XML越来越多的Web应用的语言 – XHTML, VoiceXML, XSLT, 等等.
语义化程度 Modal Logic First Order Logic 人类语言 Logical Theory Description Logic DAML+OIL, OWL UML Conceptual Model 语义互操作 RDF/S Taxonomy XTM Extended ER Thesaurus ER DB Schemas, XML Schema 结构互操作 表达性 weak semantics 句法互操作 形式化程度 编码语言的发展 OWL+ SWRL, KIF Is Disjoint Subclass of with transitivity property Is Subclass of Has Narrower Meaning Than Relational Model, XML Is Sub-Classification of source: Leo Obrst, MITRE – Jan. 2004
资源创建者 创建 数据 包含 数字对象 由句柄(调度)系统创建 句柄/调度码 包含在 仓储 被存取 句柄注册于 句柄服务器 RAP(仓储存取协议) 数字图书馆微观结构:KWF 左图:Kahn/Wilensky结构 下图:Warwick 结构
Microformat微格式 • 为特殊应用而制定的特殊格式; • 可以插入网页或XML元数据中,被收割和索引; • 数据可被重用、与具体应用无关;也可自定义,完全取决于应用; • 例如:XFN, hcalendar, hcard, rel tags, rel license, lists and outlines, 等等…http://microformats.org/
微格式举例 • People and Organizations • hCard • Calendars and Events • hCalendar • Opinions, Ratings and Reviews • VoteLinks, hReview • Social Networks • XFN • Licenses: • rel-license • Tags, Keywords, Categories • rel-tag • Lists and Outlines • XOXO http://microformats.org/about/ http://microformats.org/wiki/Main_Page
微格式举例 <div class="vcard"> <img style="float:left; margin-right:4px" src="http://www.flickr.com/photos/kevenlw/" alt="photo" class="photo"/> <a class="url fn" href="http://my.donews.com/keven/">Keven Liu</a> <div class="org">Shanghai Library</div> <a class="email" href="mailto:kevenlw@gmail.com">kevenlw@gmail.com</a> <div class="adr"> <div class="street-address">Huai Hai Zhong Road</div> <span class="locality">Shanghai</span>, <span class="region">Shanghai</span>, <span class="postal-code">200031</span> <span class="country-name">China</span> </div> <div class="tel">64455555-8311</div> <a class="url" href="aim:goim?screenname=kevenlw">AIM</a> <a class="url" href="ymsgr:sendIM?kevenlw">YIM</a> <p style="font-size:smaller;">This <a href="http://microformats.org/wiki/hcard">hCard</a> created with the <a href="http://microformats.org/code/hcard/creator">hCard creator</a>.</p> </div> 显示形式: Keven Liu Shanghai Library kevenlw@gmail.com Huai Hai Zhong Road Shanghai , Shanghai , 200031 China 64455555-8311 AIMYIM
微内容Microcontent • ‘Microcontent’ 由Jakob Nielsen提出,指一小段包含元数据的文本,有特定的内容,与微格式的区别是不一定有特定的编码。 • microcontent is a finite collection of metadata and data that has at least one unique identity and at least one unique address on the network, and that encapsulates no more than a small number of central ideas, where the number of central ideas encapsulated is usually 1. http://novaspivack.typepad.com/nova_spivacks_weblog/2003/12/defining_microc.html
微资源的功能需求 • 微资源的产生(例如:做网络书签?); • 微资源需要标识(permanent id?); • 微资源需要描述(metadata); • 微资源需要重组(聚合); • 微资源的重用; • 微资源的呈现(tag cloud?); • 微资源的管理和利用需要工具(flickr/del.icio.us/blinklist/365key…)。
标签Tag的作用 • 标示,为了查找。专指度高好还是低好?每个人都回折中。 • 指代,索引中指代原件 • 聚类,为了关联。 • 分面标引 • 集体智慧。
民俗分类法Folksonomy • Folksonomy由tag组成。 • Tag在folksonomy中是微资源的指代物。 • 通过检出tag而检出微资源。 • Tag是平面的。 • Tag是随意的。 • Tag云图反映了tag的权重。
Tag可能的发展方向 • Tag可以排序(除了目前的字顺和权重,还有多种形式,包括动态形式,如结合相关反馈、合作过滤、点击次数、甚至类pagerank等); • Tag可以层级化(层次关系,例如del.icio.us目前支持的tag类目); • Tag可以聚类(反映了资源之间的关系;经常在一起的tag具有较为密切的关系,等等); • Tag可以规范化(同义词、反义词归并指代;用代属分参关系标注等)。
讨论 • 这些发展,与应用的成本/边际效用/方便性有关。 • 这些发展,到了一定程度,就不是folksonomy了。 • Folksonomy并非绝对“自由”,并非没有体系,只是做标注(tagging)的人没有意识到(自己的体系)而已。 • Folksonomy的一个极端形式是Topic Maps (ISO13250);
Topic Maps/Taxonomy/Folksonomy • Topic Maps可以看成一种Ontology。 • Taxonomy是一类概念体系分类方法的总称,不具有严格的规定。但也可以看成一种不完整的Ontology。 • 对应于极端自由的Folksonomy,极端规范的、形式化的概念体系是Ontology。
知识本体框架中元数据元素的关系图示 图片来自 IFLA “Functional Requirement for Bibliographic Records” http://www.ifla.org/VII/s13/frbr/frbr.pdf
Mashup融合/混搭/跨界合作 • 什么是Mashup • Mashup举例
什么是 "mashup"? • 一项网络应用其数据内容来自多个不同的站点 • 通过第三方提供的公共应用程序接口API动态组合提供服务 • 一般采用轻型的Web服务(基于REST或SOAP)
内容协同Mashup • 基于XML的多种内容格式和基于这些格式的互操作/通信协议。包括 RSS, RDF (RSS 1.1), Atom以及大量的微格式; • FOAFXFN等特别设计的格式和协议 (主要是基于社会型网络 social networking) 扩展了2.0网站的功能,允许用户分布式地交互。
Mashup举例 • http://upcoming.org/event/61489 • http://www.mashupcoming.com/upmap.htm • http://www.programmableweb.com • http://www.mashupfeed.com • http://googlemapsmania.blogspot.com/ • http://gpsvisualizer.com/examples/ • http://developer.yahoo.net/maps/applications.html • http://ace.engin.umich.edu/gmaps/pierpont_arrivals.php
地图Mashup应用十分普遍 • GPS 接收十分普遍且费用低廉 • 直观、新颖、实用 • 成熟技术,低技术门槛 • 数据免费(google maps) • 应用扩展性好 • 动态性好 • 直接用于手持设备 • 具有社会性应用前景 • ……
潜在问题 • 一致性问题 • 潜在的法律问题 • 盈利模式 • 竞争 • 可性度问题
未来发展 • 统一的Mashup应用程序接口注册服务(便于服务发现); • Mashup 工具的开发 • 桌面门户的出现消灭门户:在你的客户端Mashup • 杀手级应用的出现使得应用迅速普及 • RSS成为数据mashup 的标准格式 • 知识产权问题的合理妥善解决
利用现成的应用建立mashup • 寻找现成应用的 API (到2006年8月13日23:30共有251个) • http://www.programmableweb.com/apis • http://www.mashupfeed.com • 获得应用ID (API key) • 有时并不需要 • 通常都有免费许可,免费服务通常有一定约束 • 仔细阅读文档 • 服务限制 (次数/地点/使用等方面) • 关于提问式的特殊规定 • 编写简单代码(甚至不需要),开始Mashup!
unAPI • 在不同的Web应用之间拷贝/粘贴数据标准方式; • 实现一种简便的、普适的微格式应用的传输机制
Mashup的参考教程 • http://www.programmableweb.com/howto • http://www.theurer.cc/blog/2005/11/03/how-to-build-a-maps-mash-up/ • Jon Udell's screencast • Java for Google Maps Mashups • Charlottetown Transit Map explanation (php) • http://www.flickrmap.com/tutorials/google_earth.php
RUE (Rich User Experiences) • 从1992开始兴起的技术,包括Browser, Applets, Javascript, Java DHTML, Flash等技术。 • 我们正进入一个前所未有的人机界面创新时代,Web应用将与本地桌面应用具有一样的交互性。 • 又称为RIA----
富界面应用Rich Interface Applications RIA是具有更像桌面软件,具有丰富功能的Web应用 包含一些不同的技术 基本上都是老的技术(至少两三年前的) 浏览器更复杂,一些技术应用了agent代理技术 对于企业应用预示着新的机会和挑战
AJAX • Ajax实际上是几种技术的组合: • 基于标准的页面技术 XHTML and CSS; • 利用文件对象模型的动态显示与交互; • 利用XML和XSLT进行数据交换和操作; • 采用XMLHttpRequest进行异步数据检索,整合所有数据
AJAX的缺点 • 由于是多项技术的合成,比较复杂; • XMLHttpRequest Object标准的统一; • 具有JavaScript应用与生俱来的问题; • 调试困难; • 源程序难以保护。
Web 2.0技术特征 分布式架构——物理位置不同而共享资源与服务 松散耦合——高互操作性组建按需联络,统一的消息传递机制 平台独立性——不同应用平台(指操作系统、数据库平台)具有通用的机器界面和人机界面 开放API‘s ——服务的使用和通信等开放接口(或符合通用协议标准),技术文档齐全 支持Web服务——访问(共享/重用)Web2.0组件的 的趋势(例如采用SOA架构,但并非都这样)
2.0为什么会成功(Web2.0的核心竞争力) • 服务,而非软件。 • 通过使更多用户使用独特的、难以复制的数据而获得价值; • 把用户作为开发者; • 获得集体智能; • 通过用户的“自服务”而服务于“长尾”; • 轻型用户界面、开发模型以及商务模型(普及、普及、普及)
图书馆2.0主要技术 [1]参见:http://www.oclc.org/productworks/wcwiki.htm