400 likes | 612 Views
研究知识科学、 发展知识工程、 推进知识产业. 陆汝钤. 一:发展知识工程. 知识工程怎么啦?. 新的问题和挑战. 封闭式知识库 开放式知识海洋 规范化知识非规范知识 抽象思维领域形象思维领域 技术产业. Feigenbaum 的三个挑战性问题. Feigenbaum 测试 通过让计算机阅读文献构造大型知识库,使知识工程工作量减少一个数量级 通过让计算机搜索 WWW 构造大型知识库,使知识工程工作量再减少一个数量级. 三个知识工程实例. 知识工程实验之一. 知识自动获取和 ICAI 系统自动生成:在 Feigenbaum 提出挑战性问题之前.
E N D
新的问题和挑战 • 封闭式知识库开放式知识海洋 • 规范化知识非规范知识 • 抽象思维领域形象思维领域 • 技术产业
Feigenbaum的三个挑战性问题 • Feigenbaum 测试 • 通过让计算机阅读文献构造大型知识库,使知识工程工作量减少一个数量级 • 通过让计算机搜索 WWW 构造大型知识库,使知识工程工作量再减少一个数量级
知识工程实验之一 知识自动获取和ICAI系统自动生成:在Feigenbaum提出挑战性问题之前
学习 书本 个性化ICAI系统 用户 生成 扫描 定做 个性化ICAI系统素材 文字资料 个性化需求 提取、组合 规范化 新知识库 EBKDL文本 融合 编译 新知识素材 原有知识库 《天蜂》 工作流程
基于PNLU的知识获取和利用 • 类自然语言--规范化的科技文献语言 • 接近自然语言,转换容易 • 无二义性,能被计算机识别和编译 • 知识的抽取,过滤,融合和建库 • 快速, 自动生成应用软件知识库 • 面向个人需要,生成个人专用知识库 • 根据需要,自动编辑出版各种辞书
目标 从软件复用走向知识复用
知识工程实验之二 基于知识的软件工程
狼与狈的合作:“快走啊,前面就到了” 瘸腿的用户骑在 瞎眼的软件工程师身上
企业情况描述 可运行MIS系统 类自然语言理解 信息管理需求分析 信息管理系统设计 领域知识库 软件知识库 MIS自动生成过程
目标 没有软件工程师的 软件工程
知识工程实验之三 计算机动画自动生成
中文儿童故事 知 “天鹅”工作流程 受限NLU 深层语义表示 常识检查 故事分析 加注深层语义表示 识 导演规划 情节规划 场景规划 摄像规划 光线规划 定性分镜头剧本 路径计算 动作计算 摄像计算 光线计算 定量分镜头剧本 库 动画生成
目标 用抽象思维来 逼近形象思维
第二部分 研究知识科学
从信息科学谈起 • 上世纪中叶:Shannon提出和回答了一个问题:从数学的观点看,信息是什么? • 信息是用来消除不确定性的(一个物理量) • 因此,他研究信息论的主要数学工具是概率论 • 在此基础上发展出了一整套信息理论
什么是知识? • Feigenbaum: • 知识与信息不一样。知识是信息经过加工整理、解释、挑选和改造而形成的 • 从信息科学到知识科学 • 不主张还原论
知识科学的数学基础 • 研究:从数学的观点看,知识是什么? • 知识是用来消除信息的无结构性的(一个物理量) • 知识是结构化的信息 • 是否存在一种数学理论,可以从结构性的角度概括一切知识和知识处理? • 有,这就是范畴论 • 在范畴论上建立起知识科学的大厦
知识科学的逻辑和认知基础 • 研究:思维逻辑和高级认知理论 • 特别考虑各种非经典逻辑 • 为什么Zadeh得不到图灵奖? • 让一直被逻辑学家不齿的“老鼠屎”、“害群之马”进入逻辑的殿堂
知识科学的系统论基础 • 研究:知识在人类社会中产生、传播和推动生产力的规律 • 知识能够量化吗? • 因特网上的知识数量能够估计吗? • 因特网知识和社会总知识之间有相关系数吗? • 知识的增加有摩尔定律吗? • 知识增长和生产力发展之间有相关系数吗? • 知识增长和生产力发展是鸡和蛋的关系吗? • 知识传播就像气体扩散那样遵守一定的微分方程吗? • 相反观点知识的传播就像粘体流动那样受摩察力方程的制约吗? • 知识进化就像生物遗传那样有各种杂交和变异现象吗?
重新审视传统观点 人类已不是创造知识的唯一主体 计算机可以在一夜之间创造大量知识
计算机 或 (计算机和人联手)以商品生产的机制创造知识 = 知识产业
软件是人类知识的浓缩和结晶 ----马希文
可以认为 知识是软件的灵魂
数十年来 知识和软件的开发 始终没有真正地分离
其不良后果是 • 软件工程师和领域专家都被迫成为“两栖专家” • 软件工程师甚至要成为“全能专家”
呼唤知识产业 • 把知识开发从软件开发中分离出来 • 把知识模块从软件平台中分离出来 • 把知识工程师从软件工程师中分离出来 • 建立起新的产业--知识产业
提供市场 提供开放结构 IBM公司 提供计算机 提供软件 知识产业 第三方软件商 最终用户
提供市场 提供开放结构 软件产业 提供软件开发平台 提供知识模块 知识产业 知识产业 最终用户
计算机科学发展的过程 是争取学科解放的过程
第一次解放 计算机科学从电子学中解放出来
第二次解放 计算机软件从附属于计算机硬件的地位中解放出来
我们呼唤第三次解放 知识件从附属于计算机软件的地位中解放出来