530 likes | 765 Views
第二章 标准化、分类和编码. 本章的主要内容. 1. 标准及标准化 2. 分类法 3. 分类简史 4. 分类和编码问题 5. 分类系统 6. 当前发展. 标准及标准化. 1) 标准化定义 ISO 及 IEC 组织定义 见 P32. 例 : 传统病历. 传统的病历数据只使用手写形式,主要是自然语言形式,但有时也用(数字)数据形式,如化验结果等。病历主要记录病人的就医情况,如诊断,治疗和愈后。若其他医生应用这种手写的病历来建立新的病历就会遇到这样的问题:许多医学术语使用不规范,甚至意义不明确,模棱两可。. 电子病历.
E N D
本章的主要内容 1. 标准及标准化 2. 分类法 3. 分类简史 4. 分类和编码问题 5. 分类系统 6. 当前发展
标准及标准化 1)标准化定义 ISO及IEC组织定义 见P32
例:传统病历 • 传统的病历数据只使用手写形式,主要是自然语言形式,但有时也用(数字)数据形式,如化验结果等。病历主要记录病人的就医情况,如诊断,治疗和愈后。若其他医生应用这种手写的病历来建立新的病历就会遇到这样的问题:许多医学术语使用不规范,甚至意义不明确,模棱两可。
电子病历 • 由于当前越来越多地使用了电子病历(CPR),医学数据的应用领域得到扩展,除了传统的数据获取和报告之外,CPR医学数据的其他优点也日渐显现。
决策支持系统 • 决策支持系统可根据CPR的数据,帮助医生决定如何采取措施。 例如:开药物处方(可运行决策支持系统以核查药物禁忌和药物交叉反应等情况)。 首要条件:病人的所有的疾病都使用标准和统一的记录格式,才能使决策系统正常运行。 现实状况:许多医疗卫生数据如诊断、病历、体检、X线检查报告都是使用自然语言形式,这就引起表达上的无限可能性,而统计和决策系统只能处理有限的类别。 对病历记录的各种表达归类的规则必须按照客观标准。这种对多种表达的归类必然意味着数据的减少(即信息的丢失)。
标准化遵循的原理 • 1.简化统一:在复杂多样化的表象内找出简单明确的本质,并促成统一性。 • 2.”一致同意”为基础 • 3.定期修改 • 4.实施价值 • 5.采取强制实行
医学信息的特点(难题): 1.面广量大,更新速度快; 2.种类繁多,表达形式不一、数据的标准不一、单位不一、难以标准化; 3.量化困难,概念不精确,难以用数学语言表达; 4.自然语言标准化的困难: 病史描述、医生水平、习惯
信息的结构化 编码和分类 医 学 信 息 标 准 化 名词和术语 信息标准化 报表格式 信息交换格式 硬件接口 计算机, 网络布线, 存储设备 软件接口 信息处理标准化 文档编制 医学信息标准化范畴
医学信息软件标准化: • 1997年颁布《医院信息系统软件基本功能规范》; • 2002年颁布《医院信息系统基本功能规范》,强调了标准化是信息化的基础,并将 HIS中数据,数据库,数据字典标准化作为一个独立章节予以阐述,突出了其重要地位。
分类: 分类是某一领域内概念的序化和原理的序化。 分类的准则取决于这些类别的应用目的。 例如: 按照一定规则将疾病分门别类,并对它们进行有序地排列。
分类的序化原理: 分类法实质上是一个序化系统,即将某一要素或特征作为分类的依据,并按其序化原理或内在规律进行排序. 1、单轴分类系统:采用一个序化标准 2、多轴分类系统:采用多个序化标准
具体分类: 依据特性中所包含的隶属关系再分类: 类目 亚目 细目 … … 亚目 细目 可取不同轴心 同一目 中只应 有一个 轴心(每 一个特 征). 若干 若干
分类方法: • 1.确立分类设计的目的。 • 2.找出最本质的一个或多个特性(每一个特性即是一个轴心) 。 • 3.围绕这个轴心进行具体分类: 按特性的属性关系分亚目->细目->编码。
某些传染病和寄生虫的分类:各个类目都是以病因为轴心进行分类.某些传染病和寄生虫的分类:各个类目都是以病因为轴心进行分类. • A00:霍乱 • A01:伤寒 • A02:沙门氏菌感染 • A03:志贺菌感染 • A04:大肠杆菌感染 • A06:阿米巴感染 • A06.0:急性阿米巴痢疾 • A06.1:慢性肠道阿米巴病 • A06.2阿米巴非痢疾性结肠炎
信息分类的基本方法 最常用的三种: 线分类法; 面分类法; 混合分类法。 线分类法: 也称层级分类法,它是将初始的分类对象,按选定的属性作为划分基础,逐级地分成相应的若干个层级类目,并排列成一个有层次的逐级展开的分类体系。
这种表现形式有大类、中类、小类等。将分类对象一层一层地具体进行划分,逐级展开。各个类之间构成并列或隶属关系,既不重复也不交叉。这种表现形式有大类、中类、小类等。将分类对象一层一层地具体进行划分,逐级展开。各个类之间构成并列或隶属关系,既不重复也不交叉。 目前按线分类法建立起来的国家标准已经不少。比较有代表性的有: 国标:GB2260-90《中华人民共和国行政区划代码》、GB 4754-84《国民经济行业分类和代码》、GB 6665-86《职业分类和代码》等。在制定野生生物种质资源数据库信息分类编码标准时,这些标准均可供参考。
面分类法 国家标准GB 12403-90《干部职务名称代码》,就是采用面分类法进行编制的。面分类法不经常单独使用,往往是同线分类法结合构成混合分类法使用。 混合分类法 混合分类法的出现是由客观事物的复杂性所决定的。在已有的分类目录中经常出现同时存在线分类和面分类两种方法结合的形式。
排序原理 在分类系统中一般使用多种序化标准,因而情况较为复杂。如在疾病的分类中,一般考虑如下几个方面: 1、解剖位置; 2、病因学; 3、形态学; 4、功能障碍。 以上每一项都可以作为一种分类的依据。 这种贯穿整个分类过程的序化标准称为轴。 多轴分类系统同时采用多种不同的序化标准。
术语与专业常用词汇 • 缺少统一的术语是在医疗卫生领域实行统一记录所遇到的问题之一。 • 1933年,纽约医学院就开始医学术语的数据库研究,即所谓标准疾病分类术语(the Standard Classified Nomenclature of Diseases)。
1961年美国医学协会继续这项工作; 1965年由美国病理学家协会(the American College of Pathologists)出版了病理学系统术语 (the Systematic Nomenclature of Pathology,SNOP)编码系统。 SNOP奠定了人类与兽类医学系统术语(the Systematic Nomenclature of Human and Veterinary Medicine,SNOMED)的基础,成为一种术语的样本。 术语系统在自动产生标准化报告如出院报告中是很有用的。
编码 编码的定义: 把对某一类信息赋予代码的过程称为编码(coding)。 信息编码(information coding)就是将表示信息的某种符号体系转换成便于计算机或人识别和处理的另一种符号体系;或在同一体系中,由一种信息表示形式改变为另一种信息表示形式的过程。 编码目的: 编码的目的在于提高信息处理的效率。
代码有两类: 一类是有意义的代码,即赋予代码一定的实际意义,便于分类处理; 一类是无意义的代码,仅仅是赋予信息元素唯一的代号,便于对信息的操作。
代码可以分为以下几种: 数字代码: 一般以顺序的形式来表示,也可 以用随机的方式分配。 记忆代码: 是由字符组成,方便用户记忆,不使用于分类很多的系统,通常用于有限数目的类型。 例:ECG,VCG,LD,LDL
分级代码:在已有代码的基础上在加一个或多个字符作为扩展的级代码,便于执行分级代码检索。分级代码:在已有代码的基础上在加一个或多个字符作为扩展的级代码,便于执行分级代码检索。 例:S82 小腿骨折 S82.0 髌骨骨折 S82.01 髌骨开放性骨折
双重代码(并列代码):是有几段代码组合而成,每段代码都有自己的含义和特征。双重代码(并列代码):是有几段代码组合而成,每段代码都有自己的含义和特征。 例:A18.0 H75.0*(结核性乳突炎) 复合代码: 适用于复杂庞大的分类。 数值相加代码:在数值相加代码中,只用2的乘方表示数据的项和类,与复合代码一样,几个特征能复合成一个代码。
医学信息的分类和编码 分类学(taxonomy)是分类法的理论研究,包括其基本原则、步骤和规则。 分类学这一术语也可用来表示分类设计过程的最终结果,因此常常被作为分类法的同义词。 分类学的第一定义:分类法的科学; 分类学感兴趣的是一般意义下的分类法。 例如所有的哺乳动物形成一个类,而人、猫和鲸都属于这一类。 一个类还可以根据其他特征进一步分成子类。如狮子、老虎和家猫都属于猫科动物类。 在疾病分类系统如ICD-9中,分类和再分类是根据疾病发生的器官系统和其病因学进行的。
医学信息的分类和编码原则:P38 科学性,标准化,准确性,唯一性, 冗余性,结构化,实用性,易操作性.
编码方法: • 根据每一种药品所属的类别,给予一个代码,用以标识这一特指的药品,并包含了它的诸多药理特性. • (1)代码位数(2)代码符号 西药字典的分类代码: X1X2X3X4X5X6X7 (项目)2位数字 (细目) 2位数字 (亚目) 2位数字 (类目) 2位数字
分 类 简 史 • 在医疗卫生领域,最常用的分类系统是ICD以及ICD派生出来的分类法。 • 1629年,London Bills首先尝试对死亡率进行统一登记。 • 1893年,Jacques Bertillon提出《国际化死亡原因编目》的第一版,1900年得到了正式认可。以后一直在ISI的监管下定期修订,直到1938年的第五版。 • 1990年,世界卫生组织的国际健康协会采纳了第十版(ICD-10)。 • 1933年,疾病的标准分类术语(SNDO)第一版在美国发行。 • 1965年,美国病理医学院出版了病理学的系统术语(SNOP)
编码问题 • 对病人的状况进行编码时,需要浏览大量的诊断和医学过程的医学分类系统。 • 无论谁为病人的状况编码,都存在着分类系统中的术语与对病人状况的全面表达有很大差异的困难。只有借助于合适计算机程序才能解决两者之间的差异。
有两种技术处理方法可为医生和编码者提供有效的帮助。有两种技术处理方法可为医生和编码者提供有效的帮助。 (1)有关分类系统的概念性索引 对输入语言进行形态-语义分析,提炼出所有的基本概念。这种分析方法是把所有的复合单词分解成几部分:前缀、词干和后缀。然后把类似的词干归类到更一般的种类中去。在此基础上,对所用分类系统中的语句进行分析,相应的索引就可估算出来。浏览过程中的进一步查询将在这一语境中处理。最终结果是有关分类系统的概念性索引,这比一般的词汇索引更有价值。
(2)常用词汇库+同义表达 把常用词汇库与指向分类法某一入口的同义表达结合起来。这样,对用户隐蔽的词汇库成为进行索引的词汇主体的一部分。通过大型词汇库,浏览内容可能就会大大增加,从而有可能建立包含其他语言或国家的特殊表达方式的医学词汇库。作为应用工具,医学分类法浏览器应能很方便地用于个人计算机上,通常还应有足够的反应次数。
分 类 系 统 • (一)ICD——国际疾病分类 • (二)ICPC——国际社区医疗分类 • (三)DSM——精神疾病的诊断和统计手册 • (四)SNOMED——人类与兽类医学系统术语 • (五)ICD-O——国际肿瘤学疾病分类 • (六)CPT——通用过程术语学 • (七)ICPM——国际医疗过程分类 • (八)RCC——Read临床分类 • (九)ATC——解剖-治疗-化学代码 • (十)MeSH——医学主题词表 • (十一)DRG——诊断分组
(一)ICD—国际疾病分类 • ICD是根据疾病的某些特征(病因,部位,病理,临床表现),按照规则将疾病分门别类,并用编码的方式来表示的系统 ,是一个多轴心的分类系统(ICD-10)。 • ICD是包含了三位核心代码的分类系统 类目:3位数 S80 亚目:4位数 S82.0 细目:5位数 S82.01 双重分类:A18.8+I32.0*
表4 ICD-9中的4位代码级和ICD-9-CM中扩展的5位代码级示例
表5 ICPC的二轴系统 代码 器官系统 代码 医学组件 第一轴 器官系统 第二轴 医学组件
(四)SNOMED—人类与兽类医学系统术语 • SNOMED支持疾病的多方面编码。SNOMED第一版于1975年发行,1979年修订。最新版称为国际SNOMED。SNOMED也是多轴系统。SNOMEDⅡ的代码有7个轴,国际SNOMED有11个轴或模块,每个轴形成一个完整的等级分类系统(表6)。 • 在SNOMED中的诊断包含局部解剖学代码、形态学代码、微生物代码和功能代码。确切定义一个诊断需这4种代码复合。 • 如疾病代码D-13510(球菌性肺炎)等价于下列代码的复合:①T-28000(肺部的解剖学代码,不表示其他情况);②M-4000(炎症的形态学代码,不表示其他情况);③L-25116(链球菌性肺炎,按微生物轴)。见P43
(八)RCC—Read临床分类 • Read临床分类(RCC),又称Read编码,是英国全科医生James Read于20世纪80年代初个人开发的。1990年为英国国家医疗保健服务部(NHS)采用。 • 临床术语工程(Clinical Terms Project)对RCC进行了进一步扩展。临床术语工程是由NHS首席执行官领导下的工作组,包括皇家医学院、联合顾问委员会、英国医学协会的总医疗服务委员会和NHS执行官的代表加以实施。RCC 打算覆盖医疗卫生领域的所有范围
(九)ATC—解剖-治疗-化学代码 • 解剖-治疗-化学代码(ATC)是一种药物系统分级分类法。在19世纪70年代初,挪威医学供应部(Norwegian Medicinal Depot)扩展了已有的欧洲制药市场研究协会解剖和治疗3级分类系统,并增加了2个化学级。 • 后来,WHO药物应用研究组认可了ATC分类这一标准。现在,在奥斯陆的WHO关于药物统计方法合作中心负责维护ATC代码。ATC的首写字母是A代表解剖,即药品作用的机体器官系统;T代表治疗,即药品的治疗作用;C代表化学品,即其化学类。
表9 以呋塞米(速尿)为例说明ATC代码的5级标准
UMLS元词汇 • 包含来自很多术语系统和词汇的生物医学概念和术语。元词汇存有源词汇编码 的信息,如术语的上下级关系、含义和其他属性。元词汇由概念构成,同一含义的多种名称(如同义词、词形变化、译名)都连接起来成为一个概念。元词汇把一些 信息增加到概念中,如语义类型、定义和概念的相互关系。元词汇有成千上万来自各种词汇汇编的概念,包括下列全部或部分术语:国际人类与兽类医学系统术语 (国际SNOMED)、Reed词汇汇编、国际疾病分类法临床修改版(ICD9-CM)、世界医疗设备术语系统、WHO药物副作用术语、护理性诊断分类法(NANDA)、护理性诊断和处理的家庭医疗保健分类法、通用过程术语学(CPT)、医学主题词表(MeSH)、精神疾病的诊断和统计手册(DSM-Ⅳ)、心理学索引术语汇编。另外,还包括被翻译成非英语其他语言的术语。
中国疾病分类CCD • 1921协和医院王星贤主编:《疾病病理情况和手术操作名称》 • 1980协和医院出版《疾病分类和手术分类名称》 包含:CCD-D现代医学诊断名称 CCD-T传统医学诊断名称 CCD-S麻醉手术名称 CCD-P检验,诊断治疗方法名称. 为了与国际接轨,我国已不再使用CCD了.