240 likes | 652 Views
ネットワーク情報資源の保存と OAIS 参照モデル. 2005年6月22日(水) 大阪市立大学大学院創造都市研究科 情報メディア環境研究分野ワークショップ. 常磐大学人間科学部 栗山 正光. アウトライン. ネットワーク情報資源 ― 何が問題なのか 電子ジャーナルの保存 Webアーカイビング OAIS 参照モデルの概要 OAIS参照モデルの浸透状況 機関リポジトリと長期保存. ネットワーク情報資源 ― 何が問題なのか. インターネットは今や社会に不可欠のメディア 情報資源としての価値は、もはや疑問の余地がない しかし、非常に不安定
E N D
ネットワーク情報資源の保存とOAIS参照モデルネットワーク情報資源の保存とOAIS参照モデル 2005年6月22日(水) 大阪市立大学大学院創造都市研究科 情報メディア環境研究分野ワークショップ 常磐大学人間科学部 栗山 正光
アウトライン • ネットワーク情報資源―何が問題なのか • 電子ジャーナルの保存 • Webアーカイビング • OAIS参照モデルの概要 • OAIS参照モデルの浸透状況 • 機関リポジトリと長期保存
ネットワーク情報資源―何が問題なのか • インターネットは今や社会に不可欠のメディア • 情報資源としての価値は、もはや疑問の余地がない • しかし、非常に不安定 • 「HTTP 404 – Not Found」によく出会う • 将来に渡ってファイルを読める保証なし • ハードウェアもソフトウェアもどんどん時代遅れになり、消えて行く
電子ジャーナルの保存(1) • 電子ジャーナルは重要な学術コミュニケーションのツールとして定着 • しかしバックナンバーへのアクセスに対する懸念は当初から • 購入を中止した場合 • 出版社がつぶれた場合 • そもそも出版社は永続的なアクセスを保証するのか? • 図書館サイドの保存プロジェクトが始動
電子ジャーナルの保存(2) • JSTOR • 学術雑誌(紙)をスキャンして保存・提供 • 画像データのバックアップ体制には万全を期している cf. JSTOR Archiving Practices • LOCKSS (Lots of Copies Keep Stuff Safe) • 電子ジャーナルの内容ファイルを各図書館が保存 • 多数のコピーが存在することにより安全性が高まる • 他にもいくつかのプロジェクト • cf. Archiving Electronic Journals: Project Summary (DLF)
Webアーカイビング • ある時点のある範囲のWebページを自動収集ソフトウェアを利用して収集・保存 • 先駆例としてInternet Archiveが有名 • 各国の国立図書館によるプロジェクト • PANDRA(オーストラリア国立図書館) • Kulturarw3(スウェーデン国立図書館) • MINERVA(米国議会図書館) • 国立国会図書館WARP • 平成16年12月9日の納本制度審議会答申
OAIS参照モデル • Reference Model for an Open Archival Information System (OAIS) • 宇宙データシステム諮問委員会(Consultative Committee for Space Data Systems)が策定 • 1999年5月 Red Book, Issue 1 (R-1) • 2001年7月 Red Book, Issue 2 (R-2) • 2002年1月 Blue Book, Issue 1(B-1) = ISO 14721:2002 • cf. ISO “Reference Model For an Open Archival Information System (OAIS)” Tutorial Presentation
OAIS参照モデルの内容 • イントロダクション • OAISの諸概念 • OAISの責任 • モデルの詳細 • 機能モデル、情報モデル • 長期保存の展望 • 情報の保存、アクセス・サービスの保存 • アーカイブの相互運用性
OAIS参照モデルOAISとは? • 「OAISとは、人とシステムの組織で構成される、指定されたコミュニティのために情報を保存し、それを利用できるようにする責任を負ったアーカイブである」 • OAISの責任 • 情報生産者との交渉・情報入手 • 確実に長期保存できるよう情報をコントロール • 「指定コミュニティ」の確定 • 指定コミュニティだけで情報を理解できるようにする • 文書化された方針・手続きに従う • 指定コミュニティに保存された情報を提供
OAIS参照モデル情報パッケージ(1) データオブジェクト 表現情報 • 保存記述情報(PDI) 来 歴 内容情報の歴史(原資料、変更履歴、権利関係など) コンテクスト 内容情報とその周囲との関係(作成理由、他の資料との関係など) 参照 内容情報同定のための情報(ID番号、必要なら記述情報) 不変性 真正性認証の仕組み(CRCコードなど) パッケージ1 保存記述情報 内容情報 パッケージ情報 パッケージ1に関する記述情報 • Reference Model for an Open Archival Information System (OAIS) Blue Book, Issue 1. January 2002. p. 2-5. • の図に少し手を加えた。
OAIS参照モデル情報パッケージ(2) • 情報の流通段階に応じて3種類 • 提出(受入)用情報パッケージSubmission Information Package (SIP) • 保管用情報パッケージArchival Information Package (AIP) • 配布用情報パッケージDissemination Information Package (DIP)
OAIS参照モデル -- 機能モデル 保存計画 記述情報 記述情報 データ管理 問合せ 生 産 者 消 費 者 結果 アクセス 注文 受入 SIP 保管 AIP DIP AIP 運用統括 経営 Reference Model for an Open Archival Information System(OAIS) Blue Book, Issue 1. January 2002. p. 4-1. より SIP:提出用情報パッケージ AIP:保管用情報パッケージ DIP:配布用情報パッケージ
OAIS参照モデル長期保存の展望(1) • 情報のマイグレーション(移行)のタイプ • リフレッシュメント Refreshment • 同じタイプのメディアにコピー • 複製 Replication • パッケージ情報、内容情報、保存記述情報に変更のないコピー(メディアは別のタイプでもよい) • 再パッケージ Repackaging • パッケージ情報に変更があるコピー • 変換 Transformation • 内容情報または保存記述情報に変更があるコピー
OAIS参照モデル長期保存の展望(2) • アクセス・サービスの保存 • アクセス・ソフトウェアのためのアプリケーション・プログラミング・インターフェース(API)の維持・提供 • APIの利用者が多い場合は有効 • アクセス・ソフトウェアの”look and feel”の保存 • ソースコードときちんとしたドキュメントが維持されていれば可能 • 問題はコストパフォーマンス • エミュレーション • ハードウェア・エミュレーションの他に仮想機械によるものなどが研究されているが、未知数
マイグレーションとエミュレーション • マイグレーション migration • プログラムやデータの移行・変換作業。特に、OSなどの環境が異なるシステムへの移行を指すことが多い • エミュレーション emulation • あるハードウェア向けに開発されたソフトウェアを、設計の異なる他のハードウェア上で実行させること 「IT用語辞典 e-Words」 http://e-words.jp/より • エミュレーションの優位性を主張する人々も • cf. “Emulation: Context and Current Status”
OAIS参照モデルアーカイブの連携 • 独立 Independent • 協力関係なし。ただし標準の採用はあり得る • 協力 Cooperating • 共通の提出・配布標準 • 連合 Federated • 共通の検索手段(集中型あるいは分散型) • それぞれのローカル・コミュニティが優先 • 資源共有 Shared resources • 資源を共有してコスト削減 • さまざまな内部の標準化が必要
OAISとOAI • OAI (Open Archives Initiative) • 電子版学術論文(e-prints)を提供しているWebサイト(arXiv.org等)間の相互運用性を高め、学術情報の流通を促進しようという試み • 標準のメタデータ収集プロトコル(OAI-PMH)を策定 • OAISのように長期保存を特に考慮したシステムではない cf. Hirtle, Peter “OAI and OAIS: What's in a Name (Editorial)” D-Lib Magazine, 7(4), April 2001.
OAIS参照モデルの浸透状況(1) • OAIS参照モデル準拠のメタデータ要素規定の動き • CEDARS(2000年―OAISはまだ案の段階) • OCLC/RLGのWGによる保存メタデータ報告書 • コーネル大学図書館のDPO • METS、オーストラリア国立図書館、ニュージーランド国立図書館も言及はしているが、実際の構成はかなり異なる
OAIS参照モデルの浸透状況(2) • PREMISのアンケート調査(1) • 2003年11月~2004年3月に実施、9月に最終報告書 • 欧米13か国から48の機関が回答 • OAIS参照モデルに関する設問は二つ • OAIS参照モデルに準拠しているか?どの部分が準拠しているか? • OAIS参照モデルはどのように役立つか?役立たない部分があるか?
OAIS参照モデルの浸透状況(3) • PREMISのアンケート調査(2) • 8割以上がOAIS参照モデルに準拠と回答 • 完全に準拠と答えたのは4機関 • 準拠の意味を電話質問→回答はさまざま • アーカイブの計画段階で役立つという意見 • 一部用語が不適切との不満 • リポジトリを「受身」でとらえていることへの不満 • 別のモデルが必要か?という追加質問 →ほとんどが不要とする。補助資料への要求が強い
OAIS参照モデルの浸透状況(4) • CENDIとICSTIによる調査報告書 ” Digital Preservation and Permanent Access to Scientific Information: The State of the Practice” (2004.2, rev. 2004.4) • 主な知見の2番目として「OAIS参照モデルは広く採用されている」との記述 • あらゆるタイプのアーカイブがOAISの用語や概念モデルを使用 • ただし科学の世界では先行システムが多いせいかそれほど広まっていない→今後広まると思われる
機関リポジトリと長期保存(1) • 機関リポジトリとは • 単独あるいは複数の大学コミュニティの知的生産物を入手し保存する電子的コレクション • その情報内容は • 機関で範囲限定(専門分野別ではない) • 学術的 • 累積的かつ永続的 • オープンで相互運用可能 Craw, Raym ”The Case for Institutional Repositories: A SPARC Position Paper”(『機関リポジトリ擁護論』)
機関リポジトリと長期保存(2) • 定義の上では長期保存が機関リポジトリの重要な任務の一つ • ただし、保存よりオープンアクセスを重視 • “Forget about OAIS for now! The OAI-compliance of the Eprint Archives is enough for now.” スティーヴァン・ハーナッドの発言(2003.2) http://www.ecs.soton.ac.uk/~harnad/Hypermail/Amsci/2681.html • cf. OAISとOAI
まとめ • 不安定なネットワーク情報資源を長期保存するため、電子ジャーナルの保存プロジェクトやWebアーカイビング事業が実施されている • OAIS参照モデルは保存システム構想の基礎となる概念モデルを提供。アーカイブの責任、機能モデル、情報モデル、長期保存の展望、さらにはアーカイブ間の連携についても記述 • OAIS参照モデルの用語や概念は関係者に広く浸透しているが、実際のシステムはさまざま • 機関リポジトリは長期保存も重要な使命の一つだが、まずはオープンアクセスを重視