530 likes | 1.44k Views
「 Metadata 概論 」 單元 4. 中興大學數位典藏學程 九十六學年度第二學期 授課教師:張慧銖 上課日期: 97.04.08. Dublin Core 內容與實作. 大 綱. Dublin Core 源起與目的 Dublin Core 的 發展沿革及現況 Dublin Core 重要的特色與制定原則 Dublin Core 的 基本欄位 範例與練習. Dublin Core 源起與目的. Dublin Core 源起. 1990 年代網際網路和 WWW 的結合,大幅降低資訊傳播的障礙,卻也造成資訊爆炸。進而延伸兩個問題: 如何有效率地 過濾 資料
E N D
「Metadata概論 」單元4 中興大學數位典藏學程 九十六學年度第二學期 授課教師:張慧銖 上課日期:97.04.08 Dublin Core內容與實作
大 綱 • Dublin Core源起與目的 • Dublin Core的發展沿革及現況 • Dublin Core重要的特色與制定原則 • Dublin Core的基本欄位 • 範例與練習
Dublin Core源起 • 1990年代網際網路和WWW的結合,大幅降低資訊傳播的障礙,卻也造成資訊爆炸。進而延伸兩個問題: • 如何有效率地過濾資料 • 如何來有效率地描述資料 • 「都柏林核心集」是1995年3月由國際圖書館電腦中心(OCLC)和National Center for Supercomputing Applications(NCSA)聯合贊助的研討會,並經由五十二位來自圖書館、電腦、網路方面的學者和專家,共同研討下的產物。
Dublin Core的目的 • 發展一個簡單有彈性,可輕易了解和使用的資料描述格式。 • 試圖提供簡易的資料描述格式,來滿足大多數非圖書館專業人員的需求。 • 希望建立一套描述網路上電子文件特色的方法,來協助資訊檢索。 • 符合「著者著錄」的趨勢。
Dublin Core的運用領域 • 人文與藝術方面 • 書目方面 • 商業方面 • 教育方面 • 環境方面 • 數學方面 • 醫學方面 • 科學與技術方面 • 其他 ~From陳雪華,「DublinCore發展及現況」, < http://catweb.ncl.edu.tw/datas/3-1-006-2.pdf> (2008/3/31)
Dublin Core的發展沿革 1 • 第一次研討會 (簡稱DC-1) • 1995年3月由OCLC與NCSA共同召開,召開地點位於美國俄亥俄州的Dublin。 • 研討會的中心問題:如何用一個簡單的元資料記錄來描述種類繁多的電子物件? • 在確定是否只需要一個簡單的metadata元素集就能對網上的各種主題資源進行描述,為進一步發展描述電子資料的metadata之元素集的定義打下基礎。 • 最後訂定了13個欄位的資料項。
Dublin Core的發展沿革 2 • 第二次研討會 (簡稱DC-2) 1996年4月由UKOLN (UK Office for Library and Information Networking) 及OCLC共同召開,召開地點位於英國的Warwick。 • 第三次研討會(簡稱DC-3) • 1996年9月由CNI (Coalition for Networked Information) 與OCLC共同召開,召開地點位於美國俄亥俄州的Dublin。 • 將原來的13 個欄位稍加修改及擴張成15個欄位,使其不至於只適用於文字性資源,如此即可用來描述影像資料。 • 第四次研討會 (簡稱DC-4) 1997年3月由OCLC, DSTC (the Distributed Systems Technology Centre ) 與澳洲國家圖書館共同召開,召開地點位於澳洲的坎培拉(Canberra)。與會者是65位包括電子圖書館研究者、網際網路專家、圖書館員等人士。
Dublin Core的發展沿革 3 • 第五次研討會 (簡稱DC-5) 1997年10月由OCLC與芬蘭國家圖書館共同召開,召開地點位於芬蘭的赫爾辛基(Helsinki)。 • 第六次研討會 (簡稱DC-6) 1998年11月由美國國會圖書館與OCLC共同召開,召開地點位於美國的華盛頓特區(Washington, D.C.)。 • 第七次研討會 (簡稱DC-7) 1999年10月由德國國家圖書館與OCLC共同召開,召開地點於德國法蘭克福(Frankfurt am Main)。
Dublin Core的發展沿革 4 • 新舊欄位比較
Dublin Core的發展沿革 5 • 第八次研討會 (簡稱DC-8) • 2000年10月由加拿大國家圖書館與OCLC共同召開,召開地點位於加拿大的渥太華(Ottawa)。 • 第九次研討會 (簡稱DC-9) • 2001年10月由日本NII (National Institute of Informatics )與OCLC共同召開,召開地點位於日本東京市。 • 同時為第一屆的Dublin Core與metadata應用國際會議(International Conference on Dublin Core and Metadata Applications) • 最近一次研討會是於2007年8月在新加坡舉辦。
Dublin Core的發展沿革 6 • 目前,DC已被翻譯成20多種語言 • 成為相關國際與國家標準 • NISO Standard Z39.85-2001 (2001年9月) • ISO Standard 15836-2003(2003年2月) • 都柏林核心集metadata計畫(Dublin Core Metadata Initiative, DCMI) • DC的後續發展及相關規格書,目前由DCMI組織管理.主要活動包括: • 標準發展與維護 (包括:舉辦國際會議,工作小組會議等) • 支援上述所需的相關工具,服務與基礎建設 (包括DCMI metadata註冊中心) • 教育活動與支援
Dublin Core基本概念 • 以簡要的15個元素描述網路為基礎的文件 • 推出後廣受各領域及各資料類型的應用,也衍生更複雜的需求。為此,DC制定修飾語(qualifier),並成立相關工作小組製訂應用檔案(application profile) • 元素使用的特徵: • 每個元素皆為選擇性(可以採用或不採用),及皆為可重複著錄。 • 每個元素可以任何排序呈現。 • 建議一些元素使用控制的值,但並非必備。 • 每個元素的內容著錄規則,由個別建置單位訂定。 • 鼓勵採用所屬特定領域的應用檔案,並遵守這些應用檔案規範的資料內容與資料值之規範或標準。
Dublin Core的特色 • 簡單 • 為一組描述網路資源之簡單欄位 • 希望使各項目欄位易懂易學 • 語意上的互相轉換 • 擴張性 • 欄位具可重覆性、可延申性、可檢索性 • 網路上的標準 • 科際整合 • 國際化 • 強調支援數位典藏品的資源探索(Resource Discovery)。
Dublin Core的優點 • 將鼓勵作者和出版者以自動資源發現工具能蒐集的形式來提供metadata。 • 將鼓勵包含有metadata元素模組的網路出版工具的創造,從而進一步簡化metadata紀錄的創建工作。 • DC的紀錄能做為更詳細的編目紀錄基礎。 • DC成為標準之後,metadata紀錄就能被各用戶團體所了解。
為何需要編碼? • 為了要儲存於線上資料庫中,代理物件必須被編碼成為機讀格式 • 提供紀錄的展現,如:MARC的不同欄位 • 提供資訊資源的檢索取用,如:MARC的不同 檢索點 • 可以辨識代理物件的欄位所記錄的資訊,即便 這些是不同語言文字,一樣可以展現與查尋
Dublin Core的編碼方式 • HTML (Metatag, 融入HTML 文件中) • XML或其他編碼方式 • 以標籤,號碼,字母,單字等方式將代理物件各個可分割的部分加以編碼,如: • MARC的正題名 245 $a A dirge • HTML文件的題名 <title> A Dirge </title> • HTML文件以Dublin Core語法表示的題名 <meta name = "DC.Title" content = "A Dirge"> ~From陳雪華,「DublinCore發展及現況」, < http://catweb.ncl.edu.tw/datas/3-1-006-2.pdf> (2008/3/31)
Dublin Core以 HTML 編碼之範例 <html> <head> <title> A Dirge </title> <link rel = "schema.DC" href = "http://purl.org/DC/elements/1.0/"> <meta name = "DC.Title" content = "A Dirge"> <meta name = "DC.Creator" content = "Shelley, Percy Bysshe"> <meta name = "DC.Type" content = "poem"> <meta name = "DC.Date" content = "1820"> <meta name = "DC.Format" content = "text/html"> <meta name = "DC.Language“ content = "en"> </head>
Dublin Core 以XML編碼之範例 <?xmlversion="1.0"encoding="big5"?> <dc-record xmlns:dc=“http://dublincore.org/documents/1999/07/02/dces/ “> <simpleDC> <type>石刻</type> <title>蘇州石刻天文圖</title> <creator>南宋王致遠</creator> <description>根據黃棠所繪製之天文圖摹刻</description> <subject>六經天文編</subject> <subject>黃棠</subject> <date>2000-07-11</date> <identifier>chart01-s.gif</identifier> <relation>蘇州南宋天文圖圖背的考釋與批評</relation> <coverage>南宋</coverage> <rights>蘇州市博物館</rights> </simpleDC>
題名(Title ) 主要作者(Creator) 其他作者(Contributor) 主題(Subject) 描述(Description) 出版者(Publisher) 日期(Date) 型式(Format) 類型(Type) 識別碼(Identifier) 來源(Source) 語言(Language ) 關聯性(Relation) 時空範圍(Coverage) 著作權(Rights) Dublin Core的基本欄位
Dublin Core的基本欄位1.題名 • 欄位名稱:Title • 標示:題名(Title) • 定義:資源所賦予的名稱。 • 說明:是資源的正式名稱,通常以最熟悉之 名稱為之。
Dublin Core的基本欄位2.創作者 • 欄位名稱:Creator • 標示:創作者(Creator) • 定義:資源之主要創作者。 • 說明:包括個人、團體機構或服務系統。
Dublin Core的基本欄位3.主題 • 欄位名稱:Subject • 標示:主題和關鍵詞(Subjectand Keywords) • 定義:有關資源內容之描述。 • 說明:可用關鍵詞或分類號來表示資源之內容, 建議使用控制詞彙或分類表。 • encoding-scheme: • LCSH:Library of Congress Subject Headings • MeSH:Medical Subject Headings • DDC:Dewey Decimal Classification • LCC: Library of Congress Classification • UDC:Universal Decimal Classification
Dublin Core的基本欄位4.描述 • 欄位名稱:Description • 標示:描述(Description) • 定義:對資源之相關說明。 • 說明:包括摘要、目次、圖示資料之來源說明、 或對於內容的文字敘述等。 • element-refinement: • Table of Contents (目次內容) • Abstract
Dublin Core的基本欄位5.出版者 • 欄位名稱:Publisher • 標示:出版者(Publisher) • 定義:使資源可供取用者。 • 說明:包括個人、團體機構或服務系統。
Dublin Core的基本欄位6.貢獻者 • 欄位名稱: Contributor • 標示:貢獻者(Contributor) • 定義:除創作者外,對於資源內容之創作 有貢獻者。 • 說明 :包括個人、團體機構或服務系統。
Dublin Core的基本欄位7.日期 • 欄位名稱:Date • 標示:日期(Date) • 定義:在資源生命週期中,某事件之期。 • 說明:日期通常可用來表示資源的創作或 可供使用的時間。 • 建議遵循ISO 8601 [W3CDTF]之規範著錄日期,即以YYYY-MM-DD的格式著錄。
Dublin Core的基本欄位8.資源類型 • 欄位名稱:Type • 標示:資源類型(Type) • 定義:資源之性質或類型。 • 說明:資源類型包括描述資源之性質、功能、 類別,以及描述之單位為單件或合集作品等。 • 建議使用控制詞彙,例如DCMI所定義的詞彙 (DCMIType Vocabulary, [DCMITYPE])。資源之 實體或是數位媒體之描述,則使用Format欄位著錄。
Dublin Core的基本欄位9.資料格式 • 欄位名稱:Format • 標示:資料格式(Format) • 定義:資源之實體或數位化媒體之描述。 • 說明:包括媒體類型或資源的度量資料,資料格式也可以用來表明呈現或操作資源時需用的軟硬體或其他設備。度量資料則包括高廣尺寸與放映時間。 • 建議使用控制詞彙,如網路媒體類型Internet MediaTypes [MIME] (Multipurpose Internet Mail Extensions)所定義的電腦媒體格式。
Dublin Core的基本欄位10.識別碼 • 欄位名稱:Identifier • 標示:識別碼(Resource Identifier) • 定義:資源在某環境中明確的辨識資料。 • 說明:建議利用字串或數字組成的識別系統來辨識資源,如:URI (Uniform Resource Identifier)(含URL),DOI (Digital Object Identifier),以及ISBN (International Standard Book Number)等。
Dublin Core的基本欄位11.來源 • 欄位名稱:Source • 標示:來源(Source) • 定義:說明衍生出本資源的原始資源。 • 說明:本資源可能完全或部分由原始資源衍生 而出。 • 建議利用字串或數字所組成的識別系統來表示其原始資源。
Dublin Core的基本欄位12.語言 • 欄位名稱:Language • 標示:語言(Language) • 定義:資源內容之語文。 • 說明:建議使用RFC1766並併用ISO639標準,該標準使用兩個與三個字母做為語文代碼。之後,可選擇再加上兩個字母的國家代碼。例如,'en'或'eng'代表英語,'akk'代表阿卡丁語(Akkadian),'en-GB' 代表在英國使用的英語。
Dublin Core的基本欄位13.關連 • 欄位名稱:Relation • 標示:關連(Relation) • 定義:相關資源之參照。 • 說明:建議使用字串或數字所組成的識別系統 來辨識參照資源。
Dublin Core的基本欄位14.時空涵蓋範圍 • 欄位名稱:Coverage • 標示:時空涵蓋範圍(Coverage) • 定義:資源內容所涵蓋之空間或時間。 • 說明:時空涵蓋範圍包括地點(地名或地理 座標)、時期(時期名稱、日期或期間) 或政治轄區(如某行政實體)。
Dublin Core的基本欄位15.權限管理 • 欄位名稱:Rights • 標示:權限管理(Rights Management) • 定義:有關權限的相關資訊,包括資源原有的或被賦 予的權限。 • 說明:包括資源的權限申明,或說明提供該資源的 服務機構。權限資訊通常包括智慧財產權、著 作權及其他產權。若此權限管理的欄位未著 錄,使用者亦不得擅自認定資源本身原有的或 被賦予的權限。
都柏林詮釋資料核心集範例 • 範例一
都柏林詮釋資料核心集範例 • 範例二
都柏林詮釋資料核心集範例 • 範例三
練習 1 • 書名:The Incas: New Perspectives • 叢書名: Understanding Ancient Civilizations Series • 作者: Gordon F. McEwan (Author), John Weeks (Editor) • 出版商: ABC-CLIO (January 30, 2006) • 語言: English • ISBN-10 : 1851095748 • ISBN-13 : 978-1851095742 • 規格: 10.1 x 7.2 x 1 inches • 頁數: 269 pages • 中興館藏之分類號:305.898323/M459
練習 2 • 中文名稱:鳳蝶( ID:66 )英文名稱:Swallowtails;Parnasians • 雄雌:不明 • 蟲齡:幼蟲 • 圖說:鳳蝶科的蝴蝶體型絕大多數為大型種。翅甚寬闊,色彩鮮豔,體態優雅,翅面有紅、黃、青、藍、黑和白渚色的各種斑紋,並常顯出閃爍的金屬光。其體態的風姿和色澤的美麗而論,在昆蟲類中首推第一。 • 所有者:國立臺灣大學昆蟲標本館 • 拍攝日期:2003/7/12 • 地理位置:臺灣高雄縣六龜鄉 • 資料類型:生態圖庫 • 媒體種類:數位影像檔 • 來源:臺灣大學昆蟲標本館典藏數位化計畫 • 所屬類別: • 門名:Arthropoda節肢動物門 • 綱名:Insecta昆蟲綱 • 亞綱名:Pterygota有翅亞綱 • 目名:Lepidoptera鱗翅目 • 亞目名:Glossata旋喙亞目 • 總科名:Papilionoidea鳳蝶總科 • 科名:Papilionidae鳳蝶科