150 likes | 381 Views
Z39.50 と ZING. 宮澤 彰 国立情報学研究所. 情報検索のためのプロトコル。主として北米の図書館環境で使われている。 標準として: ANSI Z39.50-1995 = ISO 23950:1998 = JIS X 0806-1999 Library of Congress ( LC ) 米国議会図書館が MA および RA セッションオリエント、検索集合の保持、抽象構文記法( ASN.1 ). Z39.50 (情報検索プロトコル). ZING (Z39.50 International Next Generation).
E N D
Z39.50とZING 宮澤 彰 国立情報学研究所
情報検索のためのプロトコル。主として北米の図書館環境で使われている。情報検索のためのプロトコル。主として北米の図書館環境で使われている。 標準として:ANSI Z39.50-1995 = ISO 23950:1998 = JIS X 0806-1999 LibraryofCongress (LC) 米国議会図書館がMA およびRA セッションオリエント、検索集合の保持、抽象構文記法(ASN.1) Z39.50(情報検索プロトコル) MIYAZAWA Akira
ZING (Z39.50 International Next Generation) • ZIG (Z39.50 Implementers Group)から提案されたZNG (Z39.50 Next Generation)がヨーロッパのいくつかのプロジェクトを加えて、MAのプログラムとして活動。2001- • 現在のプロジェクト: SRW (Search/Retrieve Web Service)、CQL (Common Query Language)、ZOOM (the Z39.50 Object-Orientation Model)、ez3950 (simple z39.50 implementation Z39.50 over SOAP using XER)、ZeeRex (The Explainable “Explain” Service) MIYAZAWA Akira
関連機関等 • LC (Library of Congress) 米国議会図書館:MA/RA • NISO (National Information Standard Organization) ANSI Z39:ISO/TC46 Information and Documentationに対応する米国の標準化機関 • ZIG (Z39.50 Implementers Group): Z39.50の実装を行っている企業、機関等のグループ MIYAZAWA Akira
Z39.50 沿革 • 1980年代後半、米国内の書誌ユーティリティであるOCLC (Online Computer Library Center)、RLG (Research Libraries Group)およびLCの間でデータを相互検索するプロジェクト Linked System Projectの成果を、ANSI Z39.50として標準化 • Z39.50-1988 (Version 1)、Z39.50-1992 (Version 2)、Z39.50-1995 (Version 3) MIYAZAWA Akira
Z39.50 概要 • 開始(init)サービス:セッションの開始 • 探索(search)サービス:サーチの指定 ― 検索集合の作成 • 表示(present)サービス:検索集合からのレコードの取出し • そのほかのサービス:完了、セグメント、削除、走査、並び替え、アクセス制御、資源制御、拡張サービス、説明機能(説明データベースの検索)など MIYAZAWA Akira
Z39.50 特徴(1) • 検索集合を介した対話的検索のサポート • フラットな(構造を持たない)アクセスポイント(探索条件に指定されるフィールド)と、レコード • 逆ポーランド記法による問い合わせ言語(標準) • 登録制の「属性集合」(アクセスポイントの集合) • ただし、実際にはBib-1と呼ばれる目録レコード用のもの以外は広くサポートされていない • Bib-1には、Personal name, Title, ISBN, ISSN などが定義されている MIYAZAWA Akira
Z39.50 特徴(2) • 登録制のレコード形式(「レコード構文」という) • 実際には、目録のデータ形式であるMARC (ISO 2709)とくに米国のMARC形式、またはSUTRS (Simple Unstructured Text Record Syntax) 以外をサポートするサーバは多くない。 • ASN1/BERによるメッセージのエンコーディング MIYAZAWA Akira
SRW • Z39.50の「現代版」軽量化 • HTTP POSTでやりとり • 検索集合、フラットなアクセスポイント、説明機能、などを継承 MIYAZAWA Akira
SRWとZ39.50の主な違い • セッション/ステートレス、Z39.50はOSIのセッションに依存しているが、SRWはリクエストとレスポンスの対だけからなる • 検索集合識別子は、レスポンス中で返されるが、それらの保持と同一性の保証はアプリケーションの責任 • Z39.50は、一つのサーバが複数のデータベースを保持していることを前提に、探索中でデータベース名を指定するが、SRWは1サーバー1DB MIYAZAWA Akira
SRWとZ39.50 • Z39.50のASN.1に対しSRWではXMLを使用 • SRWでは、文字列形式の探索言語CQL (Common Query Language)を使用 • 説明機能は、explainRequestメッセージと、それに対するexplainResponseメッセージのみ • URL形式でのサーチリクエストSRU (URL Access Mechanism) を用意 MIYAZAWA Akira
SRWのrequest query: CQLによるquery xQuery: XMLで書かれたCQL、queryと排他 sortKeys:結果のソート順 xSortKeys: XMLで書かれたソート順、sortKeyと排他 startRecord: 受け取る結果の先頭レコード番号 maximumRecords: 受け取る最大レコード数 recordSchema: 受け取るレコードのスキーマURI MIYAZAWA Akira
SRWのresponse numberofRecords: ヒットレコード数 resultSetId: 検索集合のID resultSetIdleTime: 検索集合の有効秒数 Records: 返されるレコード Diagnostics: 診断メッセージ nextRecordPosition: 返されたれ最終レコードの次のレコード番号 echoedRequest: リクエストパラメータのエコーバック MIYAZAWA Akira
CQL • ISO 8777 (JISX 0803)などの系統(しかし異なる) • 近接演算、若干のパターンマッチ可能 • 例 dc.author=(kern+ or ritchie) and (bath.title exact “the c programming language” or dc.title=elements prox///4 dc.title=programming) and subject any/relevant “style design analysis” MIYAZAWA Akira
SRWの実装例 • YAZtoolkit (Z39.50 toolkit)でサポート • OCLC/PICA (オランダの書誌ユーティリティ)のテストサービス • OCLCのメタデータにおける実験 など20ほどがZINGサイトに登録 MIYAZAWA Akira