360 likes | 521 Views
資訊組織與主題分析 - 詮釋資料. Unit-3 7/18/2001. 檢索資訊物件. 回收率 精確度. 詮釋 資料 (1/3). 詮釋資料 ( meta-data) 定義型式的資料 ,提供處理物件的相關資訊 詮釋資料可包括資訊物件本身的資訊,也可以囊括在物件管理方面所需要的資訊 詮釋資料記錄的資訊是其所詮釋物件的特質,這個特質包括資訊物件的敘述以及檢索點 詮釋資料在資訊搜尋上扮演篩選的角色,透過詮釋資料,檢索者可以獲取與其資訊需求相關的資訊. 顯示. 資訊物件. 檢索點. 檢索介面. 詮釋資料格式. 詮釋資料. 資訊檢索. 詮釋資料 (2/3).
E N D
資訊組織與主題分析- 詮釋資料 Unit-3 7/18/2001
檢索資訊物件 回收率 精確度
詮釋資料 (1/3) • 詮釋資料 (meta-data) • 定義型式的資料,提供處理物件的相關資訊 • 詮釋資料可包括資訊物件本身的資訊,也可以囊括在物件管理方面所需要的資訊 • 詮釋資料記錄的資訊是其所詮釋物件的特質,這個特質包括資訊物件的敘述以及檢索點 • 詮釋資料在資訊搜尋上扮演篩選的角色,透過詮釋資料,檢索者可以獲取與其資訊需求相關的資訊
顯示 資訊物件 檢索點 檢索介面 詮釋資料格式 詮釋資料 資訊檢索
詮釋資料 (2/3) • 詮釋資料中所記錄的資訊,均是由被著錄的資訊物件所截取或是衍生出的 • 提供查詢依據的檢索點是從所著錄的詮釋資料項目中,找出該資訊物件在檢索系統中能夠被賴以查詢的字串 • 對資訊物件的描述文字,或是檢索點的內容,可由資訊物件本身所有的資訊選擇出,或者是以其具有的資訊,按既定的系統選定適當的著錄詞彙
詮釋資料 (3/3) - 建立程序 • 建立需要被描述資訊物件的選擇條件 • 處理單位,多依照其外在型式的完整性做為詮釋資料的基本單位,例如書、期刊、光碟、微縮卷片、網站 • 需要被著錄的項目 • 定義資訊物件 • 表現資訊物件特色 • 著錄項目的組織與排列 • 依據不同需求訂定規範
圖書資訊詮釋資料編目規則與機讀編目格式 中國編目規則 AACR 2 中國機讀編目格式 MARC 21
圖書資訊的詮釋資料 – 編目規則 • 編目規則 • what and how,詮釋資料應記錄哪些項目、項目之間的組織方式及呈現格式 • 中國編目規則 • 著錄 – 如何著錄各類型資訊物件的書目資料 • 總則:基本通則 • 各類型資訊物件 • 多部分組合資訊物件的處理 • 標目 – 檢索款目選擇依據 • 各種款目選擇規則 • 參照的建立 • 助記性編號
機讀編目格式 機讀編目格式主要是希望透過著錄資訊的欄位化、指標運用、分欄結構 … 等方式組織書目記錄,讓書目資料格式化,以利電腦程式辨讀。
詮釋資料格式規範架構 - 編目規則 資訊物件記錄架構 資訊物件媒體的規範 標目規則
編目規則規範架構 - 記錄架構 (1/5) • 資訊物件記錄架構 • 題名及著者敘述 (Title and statement of responsibility) • 版本 (Edition) • 資訊物件細節 (Material specific details) • 出版資訊 (Publication, distribution information) • 實體描述 (Physical description) • 叢書 (Series) • 附註 (Notes) • 標準號 (Standard number)
編目規則規範架構 - 記錄架構 (2/5) • 題名及著者敘述 (Title and statement of responsibility) • 資訊物件的主要創作者,賦予資訊物件的主要名稱 (正題名 title proper) • 除主要名稱,資訊物件的創作者也可能賦予資訊物件其他題名,包括副名稱及不同語文的名稱,均記錄於此處 • 其他有助於辨識資訊物件的資訊,如與會議論文相關的會議地點及舉辦日期 • 資訊物件內容的創作者或負責單位
編目規則規範架構 - 記錄架構 (3/5) • 版本 (Edition) • 說明資訊物件的版本資訊 • 與描述資訊物件版本相關的個人或團體 • 資訊物件細節 (Material specific details) • 與資訊物件有關的特殊資訊,如期刊資料的卷期資訊或地圖資料的比例尺資訊 • 資料的著錄與否視資訊物件媒體而定
編目規則規範架構 - 記錄架構 (4/5) • 出版資訊 (Publication, distribution information) • 記錄與資訊物件呈現型式及發行有關個人或單位的資訊,如出版、印製等資訊 • 記錄資訊包括資訊物件製作出版地點、製作出版單位及日期 • 實體描述 (Physical description) • 說明資訊物件型式、資訊篇幅、實體尺寸大小以及與其實體相關資訊
編目規則規範架構 - 記錄架構 (5/5) • 叢書 (Series) • 在資訊物件出版模式上有時會就主題或是資訊物件型式將獨立的資訊物件編入同一物件群,如三民書局印行的圖書資訊學叢書 • 附註 (Notes) • 與著錄資訊物件相關的訊息 • 標準號 (Standard number) • 記錄資訊物件共同被認定的標準號碼
圖書 連續性出版品 善本圖書 地圖資料 樂譜 錄音資料 電影片及錄影資料 靜畫資料 立體資料 拓片 縮影資料 機讀資料檔 編目規則規範架構 - 物件媒體的規範 (1/4)
編目規則規範架構 - 物件媒體的規範 (2/4) 物件媒體定義 • 期刊 • 定期且持續出版的刊物,定期表示一定間隔的出刊,如週刊、半月刊、月刊、季刊 … 等、;持續則表示無時間的限制,試圖一直出刊 • 地圖 • 依某種投影法或是比例尺表現天體或地球表面的全貌或是部份面積及其相關位置圖片
編目規則規範架構 - 物件媒體的規範 (3/4) 物件媒體定義 • 樂譜 • 以各種符號或文字記載音樂的物件 • 錄音資料 • 將原始聲音紀錄下來,提供透過聽覺了解、學習、研究的資料 • 影片及錄影資料 • 影片 - 相連接的靜態畫面, 錄影資料 - 利用攝影技術將影象及聲音同時紀錄下來的資料
編目規則規範架構 - 物件媒體的規範 (4/4) • 著錄來源 - 資訊主要來源 • 圖書 - 書名頁、版權頁、封面、書背 … • 連續性出版品 - 書名頁、封面、卷端、刊頭 … • 善本圖書 - 各項並透過附註加以說明 • 地圖資料 - 地圖本身、地圖的包裝 • 樂譜 - 書名頁、卷端、封面、版權頁 … • 錄音資料 - 標籤、錄音資料本身 … • 電影及錄影資料 - 包裝、附隨資訊 • ...
編目規則規範架構 - 設計通則 • 具助記性的規則編號 • 記錄項目與標點符號 • 標點符號的前導作用 • 思考 - 目錄工具的發展與標點符號的必要性及說明性 • 著錄詳簡程度 • 簡略 - 著錄基本項目 • 標準 - 依照基本架構中所訂定的項目 • 詳細 - 包括各種可能的資訊
詮釋資料格式 - 著錄詳簡程度 Wireless personal communications / edited by Theodore S. Rappaport. -- Kluwer Academic Publishers, 1997. xii, 225 p. -- (The Kluwer international series in engineering and computer science; SECS 242). “Papers in this book were originally presented at the 7th Virginia Tech/MPRG Symposium on Wireless Personal Communications Held June 11-13, [10997], in Blacksburg, Virginia.” Includes bibliographic references and index. ISBN 0-7923-8017-7. 簡易
詮釋資料格式 - 著錄詳簡程度 Wireless personal communications : improving capacity, services, and reliability / edited by Theodore S. Rappaport. -- Boston : Kluwer Academic Publishers, 1997. xii, 225 p. : ill. ; 24 cm. -- (The Kluwer international series in engineering and computer science; SECS 242). “Papers in this book were originally presented at the 7th Virginia Tech/MPRG Symposium on Wireless Personal Communications Held June 11-13, [10997], in Blacksburg, Virginia.” Includes bibliographic references and index. ISBN 0-7923-8017-7. 標準
詮釋資料格式 - 著錄詳簡程度 Wireless personal communications : improving capacity, services, and reliability / edited by Theodore S. Rappaport. -- Boston : Kluwer Academic Publishers, 1997. xii, 225 p. : ill. ; 24 cm. -- (The Kluwer international series in engineering and computer science; SECS 242). “Papers in this book were originally presented at the 7th Virginia Tech/MPRG Symposium on Wireless Personal Communications Held June 11-13, [10997], in Blacksburg, Virginia.” Includes bibliographic references and index. ISBN 0-7923-8017-7.
機讀編目格式 - Machine Readable Catalog,MARC (發展 1/2) • 美國國會圖書館(Library Congress)於1965年設立一先導計畫,機讀編目格式 I (MARC I),主要研究目的是希望將編目資料以機器可讀的方式加以組織整理。 • 英國國家書目中心(British National Bibliography) 的 機讀編目格式計畫(BNB MARC)計畫。計畫的成果是發展出一套系統,以數字、字母與符號包裝書目記錄中的各項資訊,透過長度位址的控制與符號,資料被電腦所辨識。
機讀編目格式 - Machine Readable Catalog,MARC (發展 2/2) • 1968 年隨著英美編目規則的研訂,MARC II計畫將機讀編目格式由國會圖書館內部資料格式推廣為資料交換的標準格式。 • 1980 年代機讀編目格式由原來的圖書資料格式,陸續發展出期刊、視聽資料、電子檔案等多格式,以因應不同類型資訊的處理。 • 1999 年 MARC 21 • 中國機讀編目格式 (1981-1997)
機讀編目格式架構特色 (1/2) • 資料欄位化 • 書目記錄中一長串的文字記錄依照其特性加以切截,歸入相同欄位,每一欄位以 3 位數字標記代表欄位名稱(tag)。 • 指標定義 • 為了能更明確表達欄位資料內容的特質,或者是資料應被處理的方式,機讀編目格式中以2位的指標字元來達到控制的目的。 • 分欄結構與分隔符號 • 為了增加欄位資料的精確性,大多數的欄位均有分欄架構,欄位與分欄間為區分欄位層級與資料起始與結束,資料中加上分隔符號。
機讀編目格式架構特色 (2/2) • 標籤化的註記系統 • 機讀編目格式完整的註記系統包括欄位代碼、指標與分欄符號。 • 設計通則 • 記錄段落 • 機讀編目格式設計之初,在註記符號上以共通性來考量設計,包括以百位為單位,每一百代表不同的資料記錄段落,各具其特質、與查詢檢索相關的資料在各段落中以相同的十位數代表、註記 9 開放給圖書館資料註記用。 • 檢索點 • 延續欄位設計的特點,檢索段落1xx、4xx、6xx、7xx與8xx的十位數亦照一定的規則設計,也就是在檢索段中第二位數相同欄位所包括的資料屬性相同。
機讀編目格式 - 欄位資料屬性 (1/3) • 機讀編目格式是依編目規則中規定的資料項目,設計各個欄位。資料欄位具有不同的屬性,以表達被描述資訊的特性,同時提供查詢資料的檢索依據。按書目資料所應達到的特性,機讀編目格式欄位可分為幾種不同類型,識別資料、基本記錄、主題內容、檢索款目、相關作品 … 等。
機讀編目格式 - 欄位資料屬性 (2/3) • 識別資料 • 以1對1的方式代表資訊的辨識資料,如CMARC 010與USMARC 020所著錄的國際標準書號。 • 代碼資料 • 以代碼方式表達出資料形式上的特性,如CMARC 115-135與USMARC 008的資料類型。 • 基本記錄 • 著錄資訊物件的基本資料,如資料的名稱、負責內容的個人或單位、資料的出版事項說明及資料的實體狀況。
機讀編目格式 - 欄位資料屬性 (3/3) • 主題內容 • 以註記符號或字串表示著錄資料所表達或討論的內容主題。如CMARC 676 所記錄的分類號、CMARC 606與USMARC 650 所記錄的主題內容標題。 • 檢索款目 • 記錄可為檢索詞彙的訊息,如CMARC 700 與USMARC 100 記錄的主要個人作者。 • 相關作品 • 儲存與被著錄物件相關的作品且對掌握資料狀況有所幫助的訊息。 • 輔助說明 • 記載與被著錄物件相關且對辨識、了解該資料有幫助的訊息。
詮釋資料格式的建立 - 資訊物件處理的通則 - 資訊檢索及詮釋資訊物件所需要的著錄項目
詮釋資料格式規範架構- 檔案資訊 Archival APPM (Archives, Personal Papers, and Manuscripts) Records - AACR2r
詮釋資料格式規範架構- 文學作品及學術文件 TEI (Text Encoding Initiative) Headers
詮釋資料格式規範架構- 數位典藏 Dublin Core
詮釋資料格式規範架構- 政府資料 GILS (Government Information Locator Service) Records