350 likes | 509 Views
《 计算机环境下 中文文献主题标引工作细则 》 的制订. 报告人:李凤侠 2004-1-6. 主要内容. 一 . 细则制订前关于主题标引技术、方法和主题检索的调查研究 二 . 计算机环境下主题标引的特点 三 . 特点在细则中的反映 四 . 关于细则中几个问题的探讨. 一、细则制定订前关于主题标引技术、方法和主题检索的调查研究. 调查研究的方法 文献阅读 问卷调查 调查研究的角度 主题标引工作(编目员工作角度) 主题检索(服务对象使用角度). 文献阅读. 通过阅读主题标引相关文献,了解主题标引工作和用户使用两方面的问题、建议和趋势:
E N D
《计算机环境下中文文献主题标引工作细则》的制订《计算机环境下中文文献主题标引工作细则》的制订 报告人:李凤侠 2004-1-6
主要内容 一.细则制订前关于主题标引技术、方法和主题检索的调查研究 二.计算机环境下主题标引的特点 三.特点在细则中的反映 四.关于细则中几个问题的探讨
一、细则制定订前关于主题标引技术、方法和主题检索的调查研究一、细则制定订前关于主题标引技术、方法和主题检索的调查研究 • 调查研究的方法 • 文献阅读 • 问卷调查 • 调查研究的角度 • 主题标引工作(编目员工作角度) • 主题检索(服务对象使用角度)
文献阅读 通过阅读主题标引相关文献,了解主题标引工作和用户使用两方面的问题、建议和趋势: • 组配公式:主体-方面-空间-时间-文献类型 • 标引工具:《汉语主题词表》、《中国分类主题词表》不能满足计算机环境下的主题标引需要 • 标引深度:浅,增加标引深度 • 自由词的使用:少,增加自由词的使用 • 用户:基本不了解主题标引的规则
编目员问卷调查 24个高等学校图书馆的编目员接受调查,调查的内容主要包括: • 主题词的轮排 • 610的使用 • 标引深度 • $x和“-”、“:”对读者检索有无影响 • 主要标引工具《汉语主题词表》、《中国分类主题词表》 • 编目数据源及数据质量
用户问卷调查 向清华、人大的用户发出问卷500份,反馈482份。被调查用户包括学生、教师和其他人员,既有本科生、硕士和博士研究生,还有个别从事编目工作的人员。调查内容主要包括: • 接受检索培训的用户:如表 比例不足20%;不了解检索工具;不了解主题标引规则;不了解主题词和关键词的含义和区别 • 各种检索入口的使用:如图 • 主题检索及其满意度:如表
使用频率排序 返回
两所高校的调查结果 20% 44.6% 47.7% 61.6% 10.7% 返回 1% 24.3%
专题性和交叉学科文献的检索 用主题词或关键词检索这两类文献时,他们选取检索入口(使用频率排序)的情况与上图极为类似。 检索结果及满意率: 能检索到的占70.5%(340/482)和64.3%(310/482) 但满意度更低,分别为12.4%(60/482)和3.7%(18/482)
当前主题标引方法的特点及局限性 当前书目数据库服务对象的特点 当前书目数据库在建立和使用两方面的偏差
当前主题标引方法的特点及局限性 • 主要是从标引工作的角度出发 • 采用叙词法受控标引 • 仅允许少量使用自由词标引 • 标引深度:浅标引 • 标引工具的更新和修订有一定的滞后 • 标引的规范控制: • 论题主题:缺少电子化词表 • 名称主题:缺少规范控制
当前书目数据库服务对象的特点 • 用户的构成 • 使用的时间和地点 • 用户主题检索相关知识 • 使用的检索入口
标引一致性高对用户的检索水平要求高;标引深度一般不超过10个,专指性低,深层揭示不足;《中国分类主题词表》越来越难以满足标引需求;受控标引+少量非受控标引,缺少主题规范控制;有的区分交叉组配和限定组配(分别用:和-表示),有的不区分(统一用“$x”);有的需要轮排,有的不需要标引一致性高对用户的检索水平要求高;标引深度一般不超过10个,专指性低,深层揭示不足;《中国分类主题词表》越来越难以满足标引需求;受控标引+少量非受控标引,缺少主题规范控制;有的区分交叉组配和限定组配(分别用:和-表示),有的不区分(统一用“$x”);有的需要轮排,有的不需要 用户本人,检索地点灵活,缺少工具书,检索理论和检索技能差;需要深层揭示;检索用词不规范,需要后控词表或主题规范控制;需要名称规范控制;不关心交叉组配和限定组配;绝大多数不清楚主题词和关键词的区别,一般选择关键词;检全率和检准率低。检索需求量大,要求高 当前书目数据库在建立和使用两方面的偏差
应充分体现“标引是手段,检索是目的” 应充分发挥计算机标引和检索的优越性 计算机环境下主题标引的特点
用户是主题标引工作中心 深标引 无需用符号区分概念交叉和限定,但强调概念组配 强调非受控标引的作用,扩大610的使用范围 强调各主题字段标目的规范化及规范控制 主题不需轮排 不使用倒置标题 标引工具 计算机环境下主题标引的特点
特点在细则中反映(1) • 主题标引中心:转向用户 主题标引工作的出发点和归宿:满足用户的检索需求 • 主题标引方式(全面标引、整体标引和补充标引) • 主题标引深度:深标引 • 非控主题词的使用范围(双重标引、自由词独立标引、词表中部分非正式主题词和未收录的正式主题词的入口词)
特点在细则中的反映(2) • 概念交叉和概念限定采用统一符号$x • 更强调标引的规范控制:计算机环境是更好地实现规范控制的坚实基础 • 首先是论题主题的规范控制:电子化的主题规范系统 • 再次是名称主题的规范控制:电子化的名称规范系统 实现论题主题和名称主题有效的规范控制,才能更好地满足用户的检索需求 • 原则上取消主题轮排 • 不使用倒置标题(可通过610反映)
细则中几个问题的探讨 • 几种复合主题的标引模式 • 作为语言读物的文学作品的深层揭示:文学作品本身 • 610的使用 • 历史地名的标引
1.几种复合主题的标引模式(1) 一般的标引规则: 应用关系、影响关系、比较关系、相互关系的复合主题词,首选词表中专指的表示各种关系的专指主题词;当词表中没有专指的表示各关系的主题词时,则选用“应用”、“影响”、“对比研究”、“关系”等词组配标引
几种复合主题的标引模式(2) 确定标引模式的参考点: • 取消主题轮排后,主标题与主类号尽量保持一致 • 组配次序:主体-方面-空间-时间-文献类型 • 清楚地表达复合主题概念
几种复合主题的标引模式(3) 细则中规定一般的标引模式: 应用关系:$aB$xA$x应用(A应用到B) 影响关系:$aB$xA$x影响(A影响B) 比较关系: $aA$xB$x对比研究(不同事物A、B) $aA$x对比研究$?(同一事物A,?表示不同地点、民族、语种等) 相互关系:$aA$xB$x关系(A与B的相互关系)
应用关系复合主题的标引模式 应用关系:$aB$xA$x应用(A应用到B) 例1:《生物医学工程的应用》 标引:606 0# $a生物医学工程$x应用 例2:《数字化博物馆的原理与方法》 标引:606 0# $a博物馆$x计算机应用 例3:《旷世之战-IBM深蓝夺冠之路》 标引:606 0# $a国际象棋$x对局(棋类运动) $x人工智能$x应用
影响关系的复合主题的标引模式 影响关系:$aB$xA$x影响(A影响B) 例1:《材料的环境影响评价》 标引:606 0# $a工程材料$x环境影响$x评价 例2:《植物对动物的影响》 标引:606 0# $a动物$x植物 $x影响
比较关系的复合主题的标引模式(1) 比较关系:$aA$xB$x对比研究(不同事物A、B) 例1:《汉法语言对比研究与应用》 标引:606 0# $a法语$x汉语$x对比研
比较关系的复合主题的标引模式(2) 比较关系:$aA$x对比研究$?(同一事物A,?表示不同地点、民族、语种等) 例1:《从儒家传统走向现代的反思―中日人才观的比较研究》 标引:606 0# $a人才学$x对比研究$y中国$y日本
相互关系的复合主题的标引模式 相互关系:$aA$xB$x关系(A与B的相互关系) 例1:《中国风水与建筑选址》 标引:606 0# $a风水$x建筑$x选址$x关系
2.作为语言读物的文学作品的深层揭示:文学作品本身(1)2.作为语言读物的文学作品的深层揭示:文学作品本身(1) 读者阅读此类文献的目的一般有两种: 语言学习 文学作品的研究、欣赏 需要从以上两个方面揭示: 语言读物的揭示 文学作品(体裁、题材、国别、时代)的揭示
作为语言读物的文学作品的深层揭示:文学作品本身(2)作为语言读物的文学作品的深层揭示:文学作品本身(2) 例1:《野性的呼唤:英语注释读物》 标引:606 0# $a中篇小说$y美国$z近代$x英语$j语言读物 例2:《小学生必背古诗词》 标引:606 0# $a古典诗歌$y中国$z古代$j课外读物 606 0# $a小学$x语文课$j课外读物
610的使用(1) 细则有3种情况需要使用610字段非控标引: 1.双重标引:原则上,组配标引、上位词标引、靠词标引都可以同时进行非控标引,即双重标引 例1:《中国市场经济学概论》--组配标引 标引:606 0# $a社会主义经济$x市场经济$x概论$y中国 610 0# $a社会主义市场经济 例2:《当代生命伦理的困惑》--靠词标引 标引:606 0# 医学伦理学 610 0# 生命伦理学
610的使用(2) 例3:《近代输液剂的制备》--上位词标引 标引:606 0# 输液疗法$x注射剂$x制备 610 0# 输液剂 2.自由词独立标引:当使用组配标引、上位词标引、靠词标引都不合适时,用自由词独立非控标引 例1:《生物计算机:日本的下一代计算机》 标引:606 0# 计算机 --外延太大,不合适 标引:610 0# 生物计算机
3.词表中部分非正式主题词和未收录的正式主题词的入口词3.词表中部分非正式主题词和未收录的正式主题词的入口词 “激光”正式主题词 “莱塞”非正式主题词 “镭射”同义词,但不是入口词 计算机检索系统没有机读词表,词表中的非正式主题词和未收录的正式主题词的入口词均可作610非控标引 标引:606 0# 激光 和 606 0# 激光 610 0# 莱塞 610 0# 镭射 610的使用(3)
610的使用(4) 计算机检索系统有机读词表,未收录的正式主题词的入口词可作610非控标引 例2:《镭射》 标引:606 0# 激光 610 0# 镭射
历史地名的标引(1) • 词表中已有专指词时,可按词表形式标引 • 词表中没有的历史地名,可直接标引历史上的名称,并在名称后加历史地名,所在省名或国名说明语(如不知该地区所属省名或国名,则可省略) • 如能考证出历史地名与现用地名的对应关系,加标现用地名作检索入口 • 古今地名完全一致时,照文献标引
历史地名的标引(2) 词表专有 例1:《西域史论集》 标引:606 0# $a地方史$y西域$j文集 例2:《松江府志》 标引:606 0# $a地方志$y松江府(历史地名,江苏省) 例3:《长安史迹研究》 标引:607 ## 长安(历史地名)$x文化遗迹$x研究 607 ## 西安 词表没有 可考证出对应关系