1 / 21

CNKI 知识仓库建设与服务标准

CNKI 知识仓库建设与服务标准. 张振海 清华同方光盘股份有限公司 软件研发中心 2001-12-21 珠海. 什么知识仓库?. 是面向一类具有相同知识信息需求的机构,根据其需求的知识结构特征和层次范围,从指定的信息源中筛选、分类、编辑而成的,通过各种媒体进行动态更新的数据库。. 知识仓库的目标?. 实现知识资源共享 提高知识传播的速度 降低知识使用成本 支持知识创新 为开展规模化知识服务提供支持. 知识仓库的结构. 领域专家. 专业知识库. 教材专著库. 知识元库. 知识仓库结构图. 专业知识库. 专业知识库. 专业知识库. 知识元库.

danae
Download Presentation

CNKI 知识仓库建设与服务标准

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. CNKI知识仓库建设与服务标准 张振海 清华同方光盘股份有限公司 软件研发中心 2001-12-21 珠海

  2. 什么知识仓库? • 是面向一类具有相同知识信息需求的机构,根据其需求的知识结构特征和层次范围,从指定的信息源中筛选、分类、编辑而成的,通过各种媒体进行动态更新的数据库。

  3. 知识仓库的目标? • 实现知识资源共享 • 提高知识传播的速度 • 降低知识使用成本 • 支持知识创新 • 为开展规模化知识服务提供支持

  4. 知识仓库的结构 领域专家 专业知识库 教材专著库 知识元库

  5. 知识仓库结构图 专业知识库 专业知识库 专业知识库 知识元库 专著教材 知识元 知识元 工具书 专业知识库

  6. 知识库知识元关联 • 知识元 • 对某一知识的完整描述叫知识元,如概念、定理、定律、事实、历史人物、历史事件 • 相关知识元关联 • 知识元引用自动关联 • 通过知识元关联使知识仓库成为有机整体

  7. 知识仓库的优势 • 快速实现资源共享 • 提高资源开发利用层次 • 实现“沉浸式”学习与研究环境 • 加快资源开发速度 • 提高知识交流速度

  8. 元数据 • 元数据—描述数据的数据(strutured data about data) • 主要元数据标准: • CDWA(27), DC(15), EAD(TEI)(21),FGDC(460), GILS(22-43), TEI(20),VRA(17-38) • 元数据描述的层次 • 很简单:传统搜索引擎 • 中间:Dubin Core,15元素 • 复杂:Marc , FGDC

  9. CNKI元数据 • 国际接轨 • 简单和复杂兼顾 • 可扩展 • 以Dulin Core为基础的面向对象的CNKI元数据方案 • 简单 • 扩展性好 • 应用适应性好 • 在文献对象描述上可以和DC较好的对应

  10. XML:资源交换格式 XML XML是eXtensible Markup Language(可扩展的置标语言)的缩写,是W3C组织发布的标准。W3C组织制定XML标准的初衷是,定义一种互联网上交换数据的标准。W3C采取了简化SGML的策略。不仅可以通过XML 来创建标记语言,而且能够创建高度结构化的标记语言,其采用纯文本格式,具有很好的交换性,使其成为开展以内容为核心的 元数据应用的首选描述语言 DTD: Document Type Definition XML Schema 支持多种数据类型

  11. RDF的描述结构 • RDF的数据模型可以用有向图描述: • Ora Lassila is the creator of the resource http://www.w3.org/Home/Lassila. • 三元组(S(Subject),P(Predicate),O(Object)) • Subject :http://www.w3.org/Home/Lassila  • Predicate: Creator • Object :Ora Lassila

  12. RDF优势 • 资源发现:提供更好的搜索引擎性能 • 智能代理软件:可以促进知识共享和交换的自动化 • 内容分级 • 知识产权 • 电子商务 • 协同工作

  13. CNKI知识仓库服务平台目标 • 传统资源开发模式 • 一种资源 + 一种软件的模式 • CNKI 知识仓库开发模式 • 软件资源分离模式 • 统一软件平台 • 各种知识库 • 优点 • 降低开发成本,缩短开发周期 • 提供集成服务,方便用户使用 • 提高服务品质

  14. 服务平台结构—支持知识协作 Web Gate 内容创建管理 互连协议 网上交流:网络视频会议系统 内容挖掘 对象管理系统 知识元库 专业知识库 搜索引擎 自然语言处理 专著教材 用户管理 安全管理

  15. 服务平台功能 • 知识仓库管理:面向对象的知识库管理系统 • 知识库创建,知识元创建 • 多种类型对象支持:文本,音频,视频等 • 传统检索 • 精确检索 • 智能全文检索 • 支持相关度排序,多语言扩展。 • 面向对象的检索 • 自然语言检索接口

  16. 模式驱动的知识需求的描述—问题视图 • 研究背景 • 著名研究人员 • 资料出处:期刊,报纸,会议 • 行业重要活动 • 行业重要基金 • 活要研究人员 • 最近两年进展 • 相关知识准备

  17. 内容挖掘 • 动态聚类 • 对查询结果进行动态划分 • 自动分类 • 对文本对象进行归类 • 概念关联分析 • 分析概念间的关联关系,如共现关系 • 自动标引 • 自动文摘 • 为文本对象产生文摘

  18. 个性化服务 • 用户模式分析 • 分析用户在知识仓库中的行为模式 • 用户需求定制 • 用户提出自己的知识需求描述 • 内容推送服务 • 根据用户行为模式,以及用户定制的需求

  19. 工具服务 • 词典管理 • 汉语分词词典 • 自动分词 • 自动分词算法 • 自定义分词算法 • 主题词表管理 • 汉语主题词表 • 行业主题词表 • 多语言词典管理 • 中英自动翻译:单词,专业词汇,120万英汉字典支持

  20. 支持开放系统互连协议 • 目标:分布式异构数据库互连。提供集成知识服务 • ANSI/NISO Z39.50 • Information Retrieval Application Service Definition and Protocol Specification • OAI • The Open Archives Initiative Protocol for Metadata Harvesting • XML –Query • Open URL

  21. 感谢各位专家!

More Related