570 likes | 841 Views
PNX 格式及数据转换规则( NR ). 李珍 艾利贝斯有限公司北京代表处 CCEU 培训 6.25-27,2014. 内容提要. PNX 查看工具( PNX Viewer ) PNX 格式各部分组成 ( PNX Sections ) NR ( Normalization Rules )规则 NR 配置举例. PNX Viewer. PNX Viewer. PNX Viewer. PNX Viewer> 查看各字段. PNX 格式各部分组成. PNX (Primo Normalized XML) 格式 Sections. Control
E N D
PNX格式及数据转换规则(NR) 李珍 艾利贝斯有限公司北京代表处 CCEU 培训 6.25-27,2014
内容提要 • PNX查看工具(PNX Viewer) • PNX 格式各部分组成(PNX Sections) • NR(Normalization Rules)规则 • NR配置举例 Ex Libris Ltd., 2014 Internal and Confidential
PNX Viewer Ex Libris Ltd., 2014 Internal and Confidential
PNX Viewer Ex Libris Ltd., 2014 Internal and Confidential
PNX Viewer Ex Libris Ltd., 2014 Internal and Confidential
PNX Viewer>查看各字段 Ex Libris Ltd., 2014 Internal and Confidential
PNX 格式各部分组成 Ex Libris Ltd., 2014 Internal and Confidential
PNX (Primo Normalized XML)格式 Sections Control Display Links Search Facets Sort Dedup FRBR Delivery & Scoping Ranking Enrichment Additional Data
PNX与原始格式比较 • PNX与CNMARC格式 Ex Libris Ltd., 2013 Internal and Confidential
PNX与原始格式比较 • PNX与DC格式 Ex Libris Ltd., 2013 Internal and Confidential
PNX Sections > Control • Control section : Primo内部控制使用,包含数据源相关信息(原始格式、系统、记录号等)。包括: • SourceID • Source-RecordID • RecordID = SourceID + Source-RecordID • Source format • Original SourceID • Source System Ex Libris Ltd., 2014 Internal and Confidential
PNX Sections > Display • Display section:记录简略及完整显示字段,包括: • Type • Title • Creator • Contributor • Edition • Publisher • Creationdate • Format • Identifier • Subject • Language • Availlibrary • Source Ex Libris Ltd., 2014 Internal and Confidential
PNX Sections > Display: Type • Type 字段表示资源的不同类型格式 • 资源类型还可以用于条件过滤或限定检索范围 • 在检索结果列表,每个记录前面会显示一个相应的资源类型图标 • Video • Audio CD • Map • Score • Website • Other • Book • Journal • Article • Text Resource • Image • Database
PNX Sections > Links • Links section:包括记录的相关链接 • Delivery links (GetIt!), such as: • OpenURL • OpenURL_fulltext • LinktoResource–数字资源的全文链接 • LinktoHoldings–链接到OPAC馆藏记录 • LinktoRequest–链接到OPAC预约请求 • Additional links: • Thumbnail • Link to TOC – table of contents • Link to Abstract • Link to Item in Amazon / WorldCat • AdditionalLinks–记录的其他链接 dedupmrg787638
PNX Sections > Links • Advanced Configuration > All Mapping Tables > delivery • aleph_backlink • Advanced Configuration > Full Normalization Rule Configuration > cnmarc > Links • links:backlink {{ils_base}}?func=direct&local_base={{control/originalsourceid}} &doc_number={{control/sourcerecordid}} $$Taleph_backlink$$D查看书目记录
PNX Sections > Search • Search section:包括用于索引和检索的字段 • Creators/Contributors • Titles • Subjects • Creation Date • ISSN/ISBN • Full-text • Resource Type • Search Scope • RecordID • SourceID
PNX Sections > Facets • Facets section:分面字段,用于检索结果的进一步精简,一条记录可以包含多个分面字段,也可以有重复的分面。 • 例如: • Creator/Contributor • Creation date • Topic • Physical format • ClassificationLCC • Resource type • “Top-level” facets • Prefilter
PNX Sections > Sort • Sort section:用于记录的排序 例如: • Creation Date (newest first) • Author • Title
PNX Sections > Dedup • “Dedup” section:包含用于判断记录合并去重的字段。 • 每条记录生成一个“de-duplication” vector ,相同的记录将分配一个 “MatchID” 。 • C1…c4 candidate vector • F1…f11 matching vector
PNX Sections > FRBR • “FRBR” section:包含用于判断记录按题名作者归组聚合的字段 • 每条记录生成一到多个key值,有相同key值的记录会聚集到一组 • K1..kn for marching vector dedupmrg787638
FRBR example 记录1 K1 carrolllewis 1832‐1898 $$AA K3 alices adventures in wonderland $$AT K3 alice in wonderland $$AT 生成两个key: carrolllewis 1832‐1898 alices adventures in wonderland carrollewis 1832‐1898 alice in wonderland 记录2 K1 carrolllewis 1832‐1898 $$AA K3 alices adventures in wonderland $$AT K3 allibillilokamloamayikatha $$AT 生成两个key: carrolllewis 1832‐1898 alices adventures in wonderland carrolllewis 1832‐1898 allibillilokamloamayikatha
PNX Sections > Delivery • Delivery section:包含记录所属机构以及获取方式(GetIt!,查看全文/获取馆藏)的相关信息 • 包括: • Institution • Delivery category • Restricted Delivery Scope
PNX Sections > Additional PNX Sections • Ranking – 包含两个用于相关性排序加权字段 • Booster1 = can influence record position • Booster2 = not in use • Enrichment– 包含数据扩充和丰富处理阶段需要的字段 • Additional data – Primo所需的但在其他section里没有提取的字段– e.g. data elements for the OpenURL.
NR(Normalization Rules)规则 Ex Libris Ltd., 2014 Internal and Confidential
Input Records MARC Generic XML 数据转换 Dublin Core Digital Entity PNX 数据转换/ 标准化规则 NR(数据转换/标准化规则) • 数据转换/标准化规则将不同格式、类型的数据统一化,进而实现了统一、快速有效的检索
NR(数据转换/标准化规则) • Primo在默认安装中已带有若干预定义的数据转换/标准化规则模板,适用于一些常见的数据格式 • 每条数据转换/标准化规则定义了应该查找源数据中的哪些字段及如何将其转换为PNX • 每条规则可由多个条件以”与”、”或”条件组合起来 Normalization Rules
NR(数据转换/标准化规则) • 预定义的转换规则模板,可通过Web界面选择和复制。 Ex Libris Ltd., 2013 Internal and Confidential
NR(数据转换/标准化规则) • NR 包含三个内容: • Source ——转换之前的来源字段,通常来自原始记录。 • PNX field (or “target”) —— 转换之后的PNX section及字段 • Conversion —— 转换程序,例如删除不需要字符,提取某个字段的某一段数据,根据分隔符拆分字段等等。 Normalization Rules
NR(数据转换/标准化规则) • 定义单条规则 Rules Configuration
NR(数据转换/标准化规则) • 将多条转换操作以”或”连接起来 Rules Configuration
NR(数据转换/标准化规则) • 定义多重条件
NR(数据转换/标准化规则) • 定义多重条件
NR(数据转换/标准化规则) • 新建一条规则:
NR(数据转换/标准化规则) • 例如: 当原数据540字段包括THESIS时,定义其scope为 THESIS :
NR配置举例 Ex Libris Ltd., 2014 Internal and Confidential
国家书目中心:数据转换思路 • CNMARC数据:按几大类型(图书、期刊/报纸、音像电子资源、博士论文)分别拟定显示、检索、分面字段,以实现理想的统一展示效果。 • MARC21数据:在系统缺省模板的基础上做少量修改。 • 根据馆藏书目特点制定了特殊的FRBR规则,以实现理想的书目聚合效果。 Ex Libris Ltd., 2013 Internal and Confidential
国家书目中心:数据转换规则 • 显示部分(PNX/Display) Ex Libris Ltd., 2013 Internal and Confidential
国家书目中心:书目显示效果 PNX格式 书目详细信息显示 Ex Libris Ltd., 2013 Internal and Confidential
国家书目中心:书目显示实例 • 外文图书 Ex Libris Ltd., 2013 Internal and Confidential
期刊 Ex Libris Ltd., 2013 Internal and Confidential
音像电子资源 Ex Libris Ltd., 2013 Internal and Confidential
国家书目中心:数据转换规则 • 分面部分(PNX/Facet) Ex Libris Ltd., 2013 Internal and Confidential
国家书目中心:分面显示效果 PNX格式 Ex Libris Ltd., 2013 Internal and Confidential
国家书目中心:书目聚合规则 • 书目聚合部分(PNX/FRBR) • k1表示责任者(A),k3表示题名(T),k2表示只取题名(TO)。 • 系统会将记录的所有k1和k3进行组合生成多个key值,k2单独生成key值,用于FRBR处理。 • 根据不同书目类型定义其K1,K2,K3 的取值字段。 Ex Libris Ltd., 2013 Internal and Confidential
国家书目中心:书目聚合效果 Ex Libris Ltd., 2013 Internal and Confidential