330 likes | 579 Views
「 Metadata 概論 」 單元 2. 中興大學數位典藏學程 九十六學年度第二學期 授課教師:張慧銖 上課日期: 97.03.11. Metadata在不同社群的應用及範例(一). Metadata 格式標準類型及其內容. Metadata 的應用 - 不同社群. 圖書館社群: MARC, MODS 博物館社群: CDWA, VRA, CIDOC 檔案館社群: EAD 政府社群: GILS 視覺資源社群: VRA Core Categories 植物標本館社群: HISPID, DarwinCore 教育社群: IEEE LOM 音樂社群: SMDL.
E N D
「Metadata概論 」單元2 中興大學數位典藏學程 九十六學年度第二學期 授課教師:張慧銖 上課日期:97.03.11 Metadata在不同社群的應用及範例(一)
Metadata的應用-不同社群 • 圖書館社群:MARC, MODS • 博物館社群:CDWA, VRA, CIDOC • 檔案館社群:EAD • 政府社群:GILS • 視覺資源社群:VRA Core Categories • 植物標本館社群:HISPID, DarwinCore • 教育社群:IEEE LOM • 音樂社群:SMDL
圖書館社群-MARC 標準1 • 機讀編目格式(Machine Readable Cataloguing Record ,簡稱MARC) • 背景及定位 • MARC是圖書館界編目格式的大家族,而非單一標準。 • 起源於1965~6美國國會圖書館發展的標準化資料記錄架構(LC MARC),以利圖書館間書目資料的交換。之後各國紛紛採用,並以國情加以修訂,如US MARC(美國)、UK MARC (英國)、CAN/MARC(加拿大)、AUS MARC(澳洲) 、CMARC(臺灣)。 • MARC 21為美國、加拿大以US MARC為基礎,並與CAN/MARC加以修訂整合的編目格式。 • 適用圖書、連續性出版品、電腦檔、地圖、音樂資源、視覺資源及混合型資源
圖書館社群-MARC 標準2 • 組成內涵 • 三大基本要素 • 三大組織結構 • 五大資料格式 • 其他事項
圖書館社群-MARC 標準3 • 三大基本要素 • 記錄結構:為了國際性書目資料的交換,需符合國際標準,如ANSI Z39.2 及ISO2709格式。 • 內容標示:用於識別及說明資料單元,包括欄號、指標及分欄識別,以快速識別機讀格式,描繪記錄中的資料元素,支援MARC格式資料的操作。 • 資料內容:即資料登錄欄,依據ISBD(International Standard Bibliographic Description)、AACRII、LCSH、LCC等規則標準著錄。
圖書館社群-MARC 標準4 • 三大組織結構 • 記錄標示(Leader) • 為紀錄之首,有24個固定長度的字元 • 用於定義書目記錄的參數,以作為系統載入或輸出依據 • 指引(Directory) • 於Leader 之後,用12字元指出變長欄的索引位置,分別記錄欄位 (3個字元)、資料欄長度 (4個字元)、起始字元位置 (5個字元) • 變長欄(Variable field):位於指引之後,著錄書目資訊及資料本身 • 控制欄:以00為首之欄位(00X)、資料及一個欄位終止符號(^) • 資料欄:包括欄(Tag) 、指標(Indicator) 、分欄代碼(Subfield Codes) 及欄位終止符號(Field terminator)
圖書館社群-MARC 標準5 三大組織結構 -MARC 紀錄格式
圖書館社群-MARC 標準6 • 五大資料格式 • 書目格式 • 包含描述、檢索和控制各類型書目資料格式 • 一種整合型分離式書目格式,可維持一致性的定義並充分描述各種資料類型的原貌 • 權威格式:包含確認、控制內容及內容標示和書目記錄中的主題及權威控制 • 分類格式:包含相關類號及標題,用來發展和維護分類綱目 • 館藏格式:包含所有資源適當的館藏地和所在地 • 社區共用資訊格式:包含有關事件、程式、服務等相關資訊,使資訊可在公用檢索目錄上整合其他的記錄型態
圖書館社群-CMARC 標準1 回目次頁 • 國家圖書館(國立中央圖書館)為了發展中文的機讀編目格式, 規劃圖書資料自動化作業系統, 於1980年與中華民國圖書館學會(中國圖書館學會)成立「圖書館自動化作業規劃委員會」, 研訂中文機讀編目格式。 • CMARC參考國際機讀編目格式(UNIMARC 1980)及美國國會圖書館書目機讀編目格式(MARC Formats for Bibliographic Data 1980)研訂,磁帶上之書目著錄採用ISO 2709的規定,界定書目記錄的結構,因此交換用的每筆書目記錄必須有記錄標示、指引、書目資料登錄欄等三個部分。 • CMARC係以欄號、指標、分欄識別、代碼等方式,說明磁帶上書目記錄之內容。其適用的範圍包括圖書、連續性出版品、投影資料、錄影資料、電影片、非投影性圖片、立體資料、地圖資料、樂譜資料、錄音資料、音樂演奏作品、拓片、微縮資料、電子資源、古籍等 。
圖書館社群-CMARC 標準2 回目次頁 • 1981年中國書機讀編目格式第一版正式刊行;同年第二版修訂出版。 • 1989年中國書機讀編目格式第三版研訂完成,為目前國內大多數圖書館使用。 • 1997年中國書機讀編目格式第四版研訂完成。 • 2001年國家圖書館編目組著手進行「中國機讀編目格式修訂計畫」,並於2002年1月8日經教育部圖書館委員會第廿六次委員會議討論通過,教育部於2002年12月 27日以令公布並自即日起生效。 • 此次中國機讀編目格式刪除4段及修訂包括Leader、0段、1段、8段全部欄位;2段、6 段、7段部分欄位等。
圖書館社群-CMARC 標準3 回目次頁 000 -- 識別段 100 -- 代碼資料段 200 -- 著錄段 300 -- 附註段 400 -- 連接款目段:第四版之後已刪除 500 -- 相關題名段 600 -- 主題分析段 700 -- 著者及輔助檢索段 800 -- 各館使用段
圖書館社群-CMARC 標準4 卡片目錄與CMARC
圖書館社群-CMARC 標準5 回目次頁 ISO 2709範例 BIG5字集
圖書館社群-MARC21標準1 類目列舉-Bibliographic format blocks(書目格式): 0XX = Control information, numbers, codes 1XX = Main entry 2XX = Titles, edition, imprint 3XX = Physical description, etc. 4XX = Series statements 5XX = Notes 6XX = Subject access fields 7XX = Name, etc. added entries or series; linking 8XX = Series added entries; holdings and locations 9XX = Reserved for local implementation
圖書館社群-MARC21標準5 • 國內相關發展 • MARC21書目紀錄格式中現已新增臺灣專用識別代碼,包含「中文圖書分類法」、「中文圖書標題表」、「中文主題詞表」、「臺灣國家書目」及「中華民國政府出版品號碼來源」等著錄項目。 • 國家圖書館編目組自94年10月開始編訂「CMARC3轉至MARC 21對照表」,已完成初稿。
圖書館社群-MARC21標準6 • 應用實例 • 中央研究院民族學研究所「臺灣原住民數位典藏計畫」 • 中央研究院歷史語言研究所「珍藏歷史文物數位典藏計畫」、「傅斯年圖書館善本古籍數位化」、「拓片與古文書數位典藏計畫」 • 故宮博物院「數位典藏系統」 • 國家型科技計畫「數位典藏聯合目錄-善本古籍主題」 • 真理大學「馬偕與牛津學堂數位典藏計畫」
圖書館社群-MODS標準1 • 後設資料物件描述綱要(Metadata Object Description Schema,簡稱MODS) • 發展者 • 由美國圖會圖書館網路發展部和MARC 標準辦公室 (Network Development and MARCStandards Office at LC) 所發展 • 發展年代 • 2002年6月
圖書館社群-MODS標準2 • 背景及定位 • 是一種由MARC所衍生的後設資料標準,原始的設計是為了圖書館的應用,但亦適合應用至其它的資源描述 • 目前最新版本為MODS 3.3版。 • 採用XML語法,較SGML精簡且比HTML更具彈性 • 使用Unicode,可容納各種不同語言的文字及符號 • 允許開發者自己定義標籤 • 小幅修正MARC,以便納入電子資源增加一些重要的資料元素
圖書館社群-MODS標準3 • 包括19個最上層的元素,包括: • 題名(titleInfo) 、名稱(name) 、資料類型(typeOfResource) 、題材(genre) 、來源資訊(originInfo) 、語言(language) 、物理特性描述(physicalDescription) 、摘要(abstract) 、目錄(tableOfContents) 、適用對象 (targetAudience) 、附註(note) 、主題(subject) 、分類號(classification) 、相關款目 (relatedItem) 、識別號(identifier) 、位置(location) 、取得條件(accessCondition) 、延伸資訊 (extension) 、紀錄資訊(recordInfo)
圖書館社群-MODS標準4 項目範例
圖書館社群-MODS標準5 • 應用實例 • 美國國會圖書館「MINERVA(“Mapping the INternet Electronic Resources Virtual Archive)計畫 」http://memory.loc.gov/cocoon/minerva/html/minerva-home.html • 澳洲國家圖書館「ANBDMP 計畫(ANBD, Australian National Bibliographic Database」 • 目前已有25個計畫,登記使用MODS, http://www.loc.gov/standards/mods/registry.php
MINERVA計畫1 • LC基於對現在與未來世代保存知識的使命,所進行的一項保存網站內容的計畫。 • 著眼於目前許多原生數位資源並未以其他資源形式存在,這些以數位形式產生的資料持續成長並以網站方式傳播。 • LC嘗試以MODS作為媒介,以原有的線上目錄為主體,將網站的後設資料轉入以MARC為基礎的線上目錄中。
MINERVA計畫2 MINERVA計畫典藏的網站數量統計表(截至2004年止)
ANBDMP 計畫1 • 澳洲圖書館界在1999年以Web-base的方式,建置了新的線上聯合目錄稱為Kinetica,其核心是澳洲國家書目資料庫(Australian National Bibliographic Database,簡稱AND)。 • 澳洲政府的出版品也逐漸以線上出版的方式以取代紙本 。
ANBDMP 計畫2 • 以政府出版品為例,各政府機構的出版單位扮演著資料供給者(Data Provider)的角色,而ANBD則扮演服務供給者(Service Provider)的角色,各出版單位的系統接收到指令後,會將本身的書目資料轉成MODS格式之後再傳回到ANBD之中,使用者透過ANBD,除了可以檢索原有MARC格式的書目資料外,也可以檢索到相關的政府出版品資訊。