110 likes | 303 Views
MARC21 による国内交換フォーマットの提案. 丸善株式会社 情報システム統括室 佐藤 康之 2002年11月. 国内交換のために求められることは?. 日本語書誌独特の並列記述に対応できること 漢字かな混じり ( 標準記述) カタカナ読み(配列) ローマ字読み(配列及び万国共通のアクセスポイント) 分かち書き(索引語抽出) 既存の目録レコードが流用できること 国内の各種 MARC からの機械的な変換 必要最低限の記述の追加 国際標準との互換性が維持されること UTF-8 対応 逐次変換( On the fly) を可能とする容易な変換ロジック
E N D
MARC21による国内交換フォーマットの提案 丸善株式会社 情報システム統括室 佐藤 康之 2002年11月 第5回ライブラリーシステム研究会
国内交換のために求められることは? • 日本語書誌独特の並列記述に対応できること • 漢字かな混じり(標準記述) • カタカナ読み(配列) • ローマ字読み(配列及び万国共通のアクセスポイント) • 分かち書き(索引語抽出) • 既存の目録レコードが流用できること • 国内の各種MARCからの機械的な変換 • 必要最低限の記述の追加 • 国際標準との互換性が維持されること • UTF-8対応 • 逐次変換(On the fly)を可能とする容易な変換ロジック • アクセスポイント(検索対象)の共通化 • 拡張への容易な対応 Ex)XML、デジタルコンテンツ、メタデータ • 著者、件名典拠などの国際標準化への寄与 第5回ライブラリーシステム研究会
MARC21 Multiscriptモデルの検討 • MARC21 Concise Bibliographic: Multiscript Records • http://lcweb.loc.gov/marc/bibliographic/ecbdmulti.html • モデル A • ラテンへの字訳・音訳による記述と母国語による記述の併記 • Field 880 Alternate Graphic Representation と Control Subfield $6 によるリンク • 例1、例2:ラテン(英語)への字訳・音訳による通常(Regular)フィールド記述 • 例3:非ラテン系言語による通常(Regular)フィールド記述 • モデル B • シンプルな多言語記述 • 880、$6 を使用しない(リンクを持たない) • 例1:英語の場合 • 例2:ロシア語の場合 第5回ライブラリーシステム研究会
Control Subfield $6 - LINKAGE • $6<linking tag>-<occurrence number>/<script identification code>/<field orientation code> • Linking tag • リンクする通常(Regular)フィールドのタグ • Occurrence number • 1レコード中の各リンク関係を識別する2桁の番号 • 00 は通常(Regular)フィールドなし • Script identification code • 記述の識別コード • (3 : Arabic • (B :Latin • $1 : Chinese, Japanese, Korean • (N : Cyrillic • (2 : Hebrew • (S : Greek • Field orientation code • 記述の向き • r : 右から左 第5回ライブラリーシステム研究会
モデル A : 例1 (画像出典:The Library Corporation http://www.tlcdelivers.com/tlc/crs/bib3277.htm) • ラテン(英語)への字訳・音訳による通常(Regular)フィールド記述 第5回ライブラリーシステム研究会
モデル A : 例2 (画像出典:The Library Corporation http://www.tlcdelivers.com/tlc/crs/bib3277.htm) • ラテン(英語)への字訳・音訳による通常(Regular)フィールド記述 • 右から左へ記述する言語の場合 – 880 の $6 に注目 第5回ライブラリーシステム研究会
モデル A : 例3 (画像出典:The Library Corporation http://www.tlcdelivers.com/tlc/crs/bib3277.htm) • 非ラテン系言語による通常(Regular)フィールド記述 第5回ライブラリーシステム研究会
モデル B : 例1、2 (画像出典:The Library Corporation http://www.tlcdelivers.com/tlc/crs/bib3278.htm) 第5回ライブラリーシステム研究会
日本語の記述を想定すると? • モデル B • シンプルな多言語記述 • リンクを持たないため、カタカナ読み・ローマ字読みが記述しにくい • インディケータ又はサブフィールドの拡張が必要? • モデル A : 例1、2 • ラテン(英語)への字訳・音訳による通常(Regular)フィールド記述 • 北米における CJK(中国、韓国、日本)レコードの標準 • カタカナ読みは記述しにくい • ローマ字読み、漢字かな混じりは記述できる • $6 の Script identification code の拡張が必要? • 通常(Regular)フィールドへのラテン以外の記述が制限される • 既存のレコードから変換する場合、ローマ字形の自動生成又は記述の追加が必要 第5回ライブラリーシステム研究会
国内交換のための提案 • MARC21 Multiscriptモデル A : 例3 • 日本語による通常(Regular)フィールド記述 • Field 880と Control Subfield $6による カタカナ読み・ローマ字読みの対応 • $6 Script identification code を拡張できれば、分かち書きも対応可能 第5回ライブラリーシステム研究会
実装例 第5回ライブラリーシステム研究会