540 likes | 707 Views
面向 21 世纪课程教材 数字图书馆原理及应用. 技术篇 ( 一 ). 赵亮 上海图书馆系统网络中心 lzhao@libnet.sh.cn. 内容. 第三章:数字图书馆的体系结构( p43-74 ) 第四章:数字图书馆的支撑技术( p75-113 ). 重点. 掌握: Web 概念、特点、体系结构 :p75-77 软件计算模式: p87-88 数据仓库、数据挖掘技术与数字图书馆关系: p98 数字图书馆系统集成 :p101-103 熟悉: 安全需求、常用方法、 PKI 技术; p104-106,p111. 重点. 了解: 体系结构; p43-52
E N D
面向21世纪课程教材 数字图书馆原理及应用 技术篇 (一) 赵亮 上海图书馆系统网络中心 lzhao@libnet.sh.cn
内容 • 第三章:数字图书馆的体系结构(p43-74) • 第四章:数字图书馆的支撑技术(p75-113)
重点 • 掌握: • Web概念、特点、体系结构:p75-77 • 软件计算模式:p87-88 • 数据仓库、数据挖掘技术与数字图书馆关系:p98 • 数字图书馆系统集成:p101-103 • 熟悉: • 安全需求、常用方法、PKI技术;p104-106,p111
重点 • 了解: • 体系结构;p43-52 • Web开发技术;p81-86 • 中间件、数据仓库、数据挖掘概念及其关系;p87, p94 • 系统集成概念;p100 • 系统安全理论;p103
数字图书馆的体系结构 • DL的信息体系结构(p.44-51) • DL的技术体系结构(p.52-58) • DL的体系结构比较研究(p.58-68) • DL系统的结构模型(p.68-74)
数字图书馆的信息体系结构 • 基本概念 (K-W结构) • 数字对象(Digital Object) • 键元数据、数字资料、调度码
数字图书馆的信息体系结构 • 基本概念 (K-W结构) • 数字对象仓库(Repositories) • 元对象(Meta Object)
数字图书馆的信息体系结构 • 数字信息特征 • 相关性 • 数字格式 • 数字对象的变化 • 权限与许可权 • 数字图书馆的信息体系结构图 • P.47 图3-1
Collection Services Name Service Persistent NAMES User Interface Gateway Index Services Repository Services p.47 图3-1 Digital Objects
数字图书馆的技术体系结构 • 网络基础设施 • 基础应用平台 • 数字资源采集加工平台 • 异构资源整合系统 • 数字资源的管理与存储系统 • 资源调度系统 • 资源发布与用户检索系统 • 联合编目和馆际互借系统 • 版权保护与安全认证系统 • 电子商务系统
客户端 资源发布与 用户检索系统 版权保护与安全认证系统 电子商务 联合编目与馆际互借系统 异构资源整合系统 基础应用平台 数字资源的管理与存储系统 资源采集 加工系统 资源 调度 系统 元数据 数字对象 仓库 数字对象 仓库 数字对象 仓库 网络基础设施
读者 图书馆管员 书刊资料库 (物理馆藏) 数字图书馆的结构 • 传统图书馆自动化的视角 图书馆 自动化 系统 人工获取 书目索引等 二次文献 索引与对象间无完整性保证
读者 IBM Digital Library 数字图书馆的结构 • IBM的三角结构 检索数据 (Search Data) 访问入口 客户端 (ACCESS Client) 存储(STORE) 查询(SEARCH) Library Server 对象内容 (Content Objects) 光盘库或磁带库
分布式的数字图书馆结构实例 • InfoBus p.63 图3-4 • 中国试验型数字式图书馆项目 p.64 图3-5 • 其他有关项目: • NCSTRL p.61 • NSDL p.62 • UMDL p.65 • Interspace p.66 • CSTR p.66
数字图书馆的结构 • 一个混合型的实例 (国家馆)
数字图书馆体系结构的评价标准 • 开放性 • 互操作性 • 扩展性 • 可伸缩性 P.67
数字图书馆结构模型的几个要素 • 用户界面 • 检索系统 • 调度系统 • 图书馆服务器 • 对象系统 • 加工系统 P.68
数字图书馆结构模型的几个要素 用户界面 客户服务器 资源 调度系统 检索系统 对象库 图书馆 服务器 资源 加工系统
Web概念、特点、体系结构 • 什么是Web? • World Wide Web, WWW, 万维网 • Web是建立在客户机/服务器结构之上,以HTML语言和HTTP协议为基础,能够提供面向各种Internet服务的、一致用户界面的信息系统 p.75
Web概念、特点、体系结构 • Web起源 • 1991年,WWW创始人,欧洲核物理实验室(CERN)的贝纳斯-李(Tim Berners-Lee)完成了世界上第一个Web的开发 • 1993年2月,美国国家超级计算应用中心(NCSA)推出了Mosaic软件,解决了文字显示、连接和图像显示问题,使WWW技术得到了空前的发展和应用
Web概念、特点、体系结构 • Web服务的特点: • 超文本、多媒体 • 与平台无关性 • 直观、易于使用的用户界面 • Web是分布式的 • Web是动态的、交互的 p.76
Web概念、特点、体系结构 • Web的体系结构 • 客户机/服务器结构 • 统一资源定位符—URL • HTTP协议 • Web与数据库技术 • CGI ASP PHP JSP • ODBC JDBC ADO p.79
统一资源定位器(URL) • 统一资源定位器(Uniform Resource Locator)是全球万维网系统服务器资源的标准寻址定位编码,用于确定资源相应的位置及所需要检索的文档(件) • URL的结构 • 所使用的因特网文档传送协议(如:http、ftp、telnet、file等) • 标识要检索的主机代号(域名或IP地址) • 检索文档在主机中的路径及文件名
统一资源定位器(URL) • 常见的URL • 网页,http://www.library.sh.cn • 网页,http://mycourse.126.com/index.htm • FTP,ftp://ftp.ecnu.edu.cn • 发送电子邮件,mailto:lzhao@libnet.sh.cn • 本地文件,file:///c:/lyyu/thesis.doc • 远程登录,telnet://202.120.88.70
域名与DNS • IP地址:166.111.4.100 • 域名:www.tsinghua.edu.cn
Web开发技术 • 客户端技术 • 脚本 script –JavaScript、VBScript • 组件 JavaBeans、ActiveX • DHTML • Java Applet • 服务器端技术 • CGI • 服务器端脚本 ASP、PHP、JSP • Servlet技术
软件计算模式 • 软件计算模式的变迁 • 软件计算模式 • B/S结构 p.87 • 两层客户/服务器结构 p.87 • 多层客户/服务器结构 p.88 • 几个要点 • 表示层、业务逻辑层与数据层 • 开放与标准 • 通用客户端与专用客户端 • 客户端管理与维护
应用分层体系架构 展现层 应用逻辑层 数据(资源)层
中间件 • 基本概念 • IDC:中间件是一种独立的系统软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源,中间件位于客户机服务器的操作系统之上,管理计算资源和网络通信。 • 分类及比较 • 分类 p.89-91 • 比较 p.91-92 • 特殊的中间件(应用服务器) • 功能与特点 p.92-93
数据仓库 • 概念(Inmon) • 支持管理决策过程的、面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合。 • 特征 • 主题与面向主题 • 数据的集成性 • 数据是随时间不断变化的 • 数据的相对稳定性 • 关键技术 • 数据抽取 • 存储和管理 • 数据表现
Date 2Qtr 1Qtr sum 3Qtr 4Qtr TV Product U.S.A PC VCR sum Canada Country Mexico sum All, All, All 数据仓库 • 数据方块 Overall sales of TV’s in the US in 3rd quarter
数据挖掘 • 数据挖掘的概念 • 从数据中抽取有价值的信息,其目的是帮助决策者寻找数据间潜在的关联,发现被忽略的要素,而这些信息对于预测趋势及决策行为是十分有用的 • 数据挖掘的模式 • 分类模式 • 回归模式 • 时间序列模式 • 聚类模式 • 关联模式 • 序列模式
数据仓库与数据挖掘之间的关系 p.98 • 数据仓库是数据挖掘的基础 • 数据挖掘促进并指导数据仓库的建设
数据仓库、数据挖掘技术与数字图书馆 • 数据仓库、数据挖掘技术对数字图书馆提供以下方面的支持: • 数据收集 • 存储和组织 • 数据分析和知识挖掘 • 决策支持
系统集成 • 概念 • 根据应用的需求,将硬件平台、网络设备、系统软件、工具软件及相应的应用软件等集成为具有优良性能价格比的计算机系统的全过程。 • 特点 • 接口是系统集成的技术关键 • 系统协调与优化是系统集成的技术难关
数字图书馆系统集成的内容 • 数据集成 • 业务过程集成 • 服务集成 p.101-102 (批判吸收)
数字图书馆应用集成的方式 • 点对点集成 • 结构集成 • 流程集成 • 外部集成 p.102-103
数字图书馆系统安全 • 概念 • 数字图书馆系统安全主要包括硬件安全、软件安全、运行安全、计算机系统安全立法等 • 相关概念 • 密码安全 • 计算机安全 • 网络安全 • 信息安全 p.103
数字图书馆系统的安全需求 • 信息的保密性 • 信息的完整性 • 信息的不可否认性 • 管理员与读者身份的认证性 • 系统的可靠性 • 可访问性 • 防御性 • 合法性 p.104-105
数字图书馆系统安全常用的方法 • 防火墙技术 • 密钥系统 • 消息摘要 • 数字签名 • 数字时间戳 • 数字证书 p.106-111
PKI (Public Key Infrastructure) 公钥基础设施 • 概念 • PKI为管理用户的数字证书、公钥以及安全政策的一系列安全服务的集合。 • 组成 • 证书机构 • 证书库 • 证书撤销 • 密钥备份与恢复 • 自动密钥更新 • 密钥文档管理 • 交叉认证 • 数字时间戳 • 客户端软件 p.112-113
PKI (Public Key Infrastructure) 公钥基础设施 • 基于公钥体制(非对称密钥算法)