1 / 56

PNX 格式及数据转换规则( NR )

PNX 格式及数据转换规则( NR ). 李珍 艾利贝斯有限公司北京代表处 CCEU 培训 6.25-27,2014. 内容提要. PNX 查看工具( PNX Viewer ) PNX 格式各部分组成 ( PNX Sections ) NR ( Normalization Rules )规则 NR 配置举例. PNX Viewer. PNX Viewer. PNX Viewer. PNX Viewer> 查看各字段. PNX 格式各部分组成. PNX (Primo Normalized XML) 格式 Sections. Control

xylia
Download Presentation

PNX 格式及数据转换规则( NR )

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. PNX格式及数据转换规则(NR) 李珍 艾利贝斯有限公司北京代表处 CCEU 培训 6.25-27,2014

  2. 内容提要 • PNX查看工具(PNX Viewer) • PNX 格式各部分组成(PNX Sections) • NR(Normalization Rules)规则 • NR配置举例  Ex Libris Ltd., 2014 Internal and Confidential

  3. PNX Viewer  Ex Libris Ltd., 2014 Internal and Confidential

  4. PNX Viewer  Ex Libris Ltd., 2014 Internal and Confidential

  5. PNX Viewer  Ex Libris Ltd., 2014 Internal and Confidential

  6. PNX Viewer>查看各字段  Ex Libris Ltd., 2014 Internal and Confidential

  7. PNX 格式各部分组成  Ex Libris Ltd., 2014 Internal and Confidential

  8. PNX (Primo Normalized XML)格式 Sections Control Display Links Search Facets Sort Dedup FRBR Delivery & Scoping Ranking Enrichment Additional Data

  9. PNX与原始格式比较 • PNX与CNMARC格式  Ex Libris Ltd., 2013 Internal and Confidential

  10. PNX与原始格式比较 • PNX与DC格式  Ex Libris Ltd., 2013 Internal and Confidential

  11. PNX Sections > Control • Control section : Primo内部控制使用,包含数据源相关信息(原始格式、系统、记录号等)。包括: • SourceID • Source-RecordID • RecordID = SourceID + Source-RecordID • Source format • Original SourceID • Source System  Ex Libris Ltd., 2014 Internal and Confidential

  12. PNX Sections > Display • Display section:记录简略及完整显示字段,包括: • Type  • Title  • Creator  • Contributor  • Edition  • Publisher  • Creationdate • Format  • Identifier  • Subject  • Language • Availlibrary • Source  Ex Libris Ltd., 2014 Internal and Confidential

  13. PNX Sections > Display: Type • Type 字段表示资源的不同类型格式 • 资源类型还可以用于条件过滤或限定检索范围 • 在检索结果列表,每个记录前面会显示一个相应的资源类型图标 • Video • Audio CD • Map • Score • Website • Other • Book • Journal • Article • Text Resource • Image • Database

  14. PNX Sections > Links • Links section:包括记录的相关链接 • Delivery links (GetIt!), such as: • OpenURL • OpenURL_fulltext • LinktoResource–数字资源的全文链接 • LinktoHoldings–链接到OPAC馆藏记录 • LinktoRequest–链接到OPAC预约请求 • Additional links: • Thumbnail • Link to TOC – table of contents • Link to Abstract • Link to Item in Amazon / WorldCat • AdditionalLinks–记录的其他链接 dedupmrg787638

  15. PNX Sections > Links • Advanced Configuration > All Mapping Tables > delivery • aleph_backlink • Advanced Configuration > Full Normalization Rule Configuration > cnmarc > Links • links:backlink {{ils_base}}?func=direct&local_base={{control/originalsourceid}} &doc_number={{control/sourcerecordid}} $$Taleph_backlink$$D查看书目记录

  16. PNX Sections > Search • Search section:包括用于索引和检索的字段 • Creators/Contributors • Titles • Subjects • Creation Date • ISSN/ISBN • Full-text • Resource Type • Search Scope • RecordID • SourceID

  17. PNX Sections > Facets • Facets section:分面字段,用于检索结果的进一步精简,一条记录可以包含多个分面字段,也可以有重复的分面。 • 例如: • Creator/Contributor • Creation date • Topic • Physical format • ClassificationLCC • Resource type • “Top-level” facets • Prefilter

  18. PNX Sections > Sort • Sort section:用于记录的排序 例如: • Creation Date (newest first) • Author • Title

  19. PNX Sections > Dedup • “Dedup” section:包含用于判断记录合并去重的字段。 • 每条记录生成一个“de-duplication” vector ,相同的记录将分配一个 “MatchID” 。 • C1…c4 candidate vector • F1…f11 matching vector

  20. PNX Sections > FRBR • “FRBR” section:包含用于判断记录按题名作者归组聚合的字段 • 每条记录生成一到多个key值,有相同key值的记录会聚集到一组 • K1..kn for marching vector dedupmrg787638

  21. FRBR example 记录1 K1  carrolllewis  1832‐1898 $$AA   K3  alices  adventures  in  wonderland $$AT  K3  alice  in  wonderland  $$AT 生成两个key: carrolllewis  1832‐1898  alices  adventures  in  wonderland   carrollewis  1832‐1898  alice  in  wonderland 记录2 K1  carrolllewis  1832‐1898 $$AA   K3  alices  adventures  in  wonderland $$AT   K3  allibillilokamloamayikatha   $$AT   生成两个key: carrolllewis  1832‐1898  alices  adventures  in  wonderland   carrolllewis  1832‐1898  allibillilokamloamayikatha

  22. PNX Sections > Delivery • Delivery section:包含记录所属机构以及获取方式(GetIt!,查看全文/获取馆藏)的相关信息 • 包括: • Institution • Delivery category • Restricted Delivery Scope

  23. PNX Sections > Additional PNX Sections • Ranking – 包含两个用于相关性排序加权字段 • Booster1 = can influence record position • Booster2 = not in use • Enrichment– 包含数据扩充和丰富处理阶段需要的字段 • Additional data – Primo所需的但在其他section里没有提取的字段– e.g. data elements for the OpenURL.

  24. NR(Normalization Rules)规则  Ex Libris Ltd., 2014 Internal and Confidential

  25. Input Records MARC Generic XML 数据转换 Dublin Core Digital Entity PNX 数据转换/ 标准化规则 NR(数据转换/标准化规则) • 数据转换/标准化规则将不同格式、类型的数据统一化,进而实现了统一、快速有效的检索

  26. NR(数据转换/标准化规则) • Primo在默认安装中已带有若干预定义的数据转换/标准化规则模板,适用于一些常见的数据格式 • 每条数据转换/标准化规则定义了应该查找源数据中的哪些字段及如何将其转换为PNX • 每条规则可由多个条件以”与”、”或”条件组合起来 Normalization Rules

  27. NR(数据转换/标准化规则) • 预定义的转换规则模板,可通过Web界面选择和复制。  Ex Libris Ltd., 2013 Internal and Confidential

  28. NR(数据转换/标准化规则) • NR 包含三个内容: • Source ——转换之前的来源字段,通常来自原始记录。 • PNX field (or “target”) —— 转换之后的PNX section及字段 • Conversion —— 转换程序,例如删除不需要字符,提取某个字段的某一段数据,根据分隔符拆分字段等等。 Normalization Rules

  29. NR(数据转换/标准化规则) • 定义单条规则 Rules Configuration

  30. NR(数据转换/标准化规则) • 将多条转换操作以”或”连接起来 Rules Configuration

  31. NR(数据转换/标准化规则) • 定义多重条件

  32. NR(数据转换/标准化规则) • 定义多重条件

  33. NR(数据转换/标准化规则) • 新建一条规则:

  34. NR(数据转换/标准化规则) • 例如: 当原数据540字段包括THESIS时,定义其scope为 THESIS :

  35. NR配置举例  Ex Libris Ltd., 2014 Internal and Confidential

  36. 国家书目中心:数据转换思路 • CNMARC数据:按几大类型(图书、期刊/报纸、音像电子资源、博士论文)分别拟定显示、检索、分面字段,以实现理想的统一展示效果。 • MARC21数据:在系统缺省模板的基础上做少量修改。 • 根据馆藏书目特点制定了特殊的FRBR规则,以实现理想的书目聚合效果。  Ex Libris Ltd., 2013 Internal and Confidential

  37. 国家书目中心:数据转换规则 • 显示部分(PNX/Display)  Ex Libris Ltd., 2013 Internal and Confidential

  38. 国家书目中心:书目显示效果 PNX格式 书目详细信息显示  Ex Libris Ltd., 2013 Internal and Confidential

  39. 国家书目中心:书目显示实例 • 外文图书  Ex Libris Ltd., 2013 Internal and Confidential

  40. 期刊  Ex Libris Ltd., 2013 Internal and Confidential

  41. 音像电子资源  Ex Libris Ltd., 2013 Internal and Confidential

  42. 国家书目中心:数据转换规则 • 分面部分(PNX/Facet)  Ex Libris Ltd., 2013 Internal and Confidential

  43. 国家书目中心:分面显示效果 PNX格式  Ex Libris Ltd., 2013 Internal and Confidential

  44. 国家书目中心:书目聚合规则 • 书目聚合部分(PNX/FRBR) • k1表示责任者(A),k3表示题名(T),k2表示只取题名(TO)。 • 系统会将记录的所有k1和k3进行组合生成多个key值,k2单独生成key值,用于FRBR处理。 • 根据不同书目类型定义其K1,K2,K3 的取值字段。  Ex Libris Ltd., 2013 Internal and Confidential

  45. 国家书目中心:书目聚合效果  Ex Libris Ltd., 2013 Internal and Confidential

  46. 国家书目中心:普通图书聚合

  47. 国家书目中心:图书与音像电子资源聚合

  48. 国家书目中心:多卷书聚合

  49. 国家书目中心:年鉴聚合

  50. 国家书目中心:期刊报纸聚合

More Related