310 likes | 481 Views
การประชุมวิชาการประจำปี ศสท.ครั้งที่ 5 ณ อุทยานวิทยาศาสตร์ประเทศไทย จังหวัดปทุมธานี 28 เมษายน 2546 การประยุกต์ดับลินคอร์เมทาดาเพื่อการสืบค้นสารสนเทศ โดย ประดิษฐา ศิริพันธ์. ห้องสมุดอเล็กซานเดรีย.
E N D
การประชุมวิชาการประจำปี ศสท.ครั้งที่ 5ณ อุทยานวิทยาศาสตร์ประเทศไทยจังหวัดปทุมธานี28 เมษายน 2546การประยุกต์ดับลินคอร์เมทาดาเพื่อการสืบค้นสารสนเทศโดย ประดิษฐา ศิริพันธ์
ห้องสมุดอเล็กซานเดรียห้องสมุดอเล็กซานเดรีย • ในยุคห้องสมุดอเล็กซานเดรีย“It is a symbol of man’s wrongful endeavor to control and understand what he cannot control or understand. By establishing a constructed,artificial and ultimately erroneous notion of truth, and vainly surrounding it with a myriad of treatises carefully guarded from profane use, the library and the librarians are contradicting the nature of things.” • คนโบราณเก็บรักษาคัมภีร์ทางศาสนา หวงแหนกีดกั้นคนสามัญที่ต้องการศึกษหาความรู้ แต่ห้องสมุดและบรรณารักษ์เท่านั้นกระทำสิ่งตรงข้าม
AACR2 • Sir Anthony Panizzi, Charles A. Cutter, Melvil Dewey, Seymour Lubetzkey etc. เจ้าตำหรับการทำรายการสื่อบันทึกความรู้ทุกรูปแบบ • บรรณารักษ์คือ ผู้กำหนดหลักเกณฑ์จัดหาความรู้ จัดเก็บอย่างเป็นระบบ ให้สามารถเข้าถึงความรู้ได้ทุกช่องทาง ไม่ว่าจะมีผู้แต่งหลายคน หนังสือหลายชื่อหลายภาษา สื่อทุกรูปแบบ ปีที่พิมพ์/ปรับปรุงแก้ไข สำนักพิมพ์ เนื้อเรื่องเดียวกันแต่เรียกชื่อด้วยภาษาต่างกัน ต้องสืบค้นได้ • AACR, LCC, DDC เป็นที่มาของเมทาดาทา
Marc 21 • Marc รับผิดชอบโดยหอสมุดรัฐสภาอเมริกัน - Marc 21 หอสมุดรัฐสภาอเมริกันร่วมกับหอสมุดแห่งชาติแคนาดา ปรับข้อกำหนดหน่วยข้อมูลย่อยให้ครอบคลุมการทำรายการสารสนเทศอิเล็กทรอนิกส์ และใช้งานประกอบกับ AACR 2 • Marc เป็นมาตรฐานแห่งชาติสหรัฐอเมริกา Z 39.2 • Marc เป็นมาตรฐานสากล ISO 2709 • Marc 21คือโครงสร้างข้อมูลที่ใช้เมทาดาทา ประกอบด้วยชุดหน่วยข้อมูลย่อย คำจำกัดความที่ทำให้ระบบห้องสมุดหรือฐานข้อมูลต่างกันสามารถใช้ข้อมูลร่วมกันได้
Dublin Core Metadata Initiative-DCMI • Dublin Core คือองค์กรผู้ริเริ่มการกำหนดมาตรฐานเมทาดาทา และส่งเสริมให้วงการสารสนเทศหันมาร่วมมือกัน ในการพัฒนามาตรฐานสากลสำหรับการสร้างสารสนเทศอิเล็กทรอนิกส์ โดยเน้นการพัฒนาศัพท์วิชาการสำหรับการพรรณนาสารสนเทศ นำไปสู่การทำรายการและการค้นสารสนเทศต่างระบบที่มีประสิทธิภาพ • dublincore.org
ความหมายของ Metadata • “data describing Web resources and e-documents” • ข้อมูลที่มีโครงสร้างสำหรับอธิบายรายละเอียดของข้อมูล(ดิจิทัลในเว็บ) ใช้หลักเกณฑ์การทำข้อมูลเช่นเดียวกับการกำหนดโครงสร้างฐานข้อมูลบรรณานุกรม และการทำรายการหนังสือ มีการระบุว่า ใคร/หน่วยงานใดเป็นเจ้าของงาน งานชิ้นนั้นชื่อเรื่องอะไร และมีคำสำคัญ/ดัชนีบอกเนื้อเรื่อง บอกประเภทว่าเป็นรายงานการประชุม (สิ่งพิมพ์ หรือ homepageหรือ computer file: HTMLหรือ PDF) หรือเป็นรายการบรรณานุกรม มีภาพประกอบ/มัลติมีเดีย และ URL ผลงานเผยแพร่ปีใด
เหตุจูงใจให้เกิดดับลินคอร์เหตุจูงใจให้เกิดดับลินคอร์ • สารสนเทศจำนวนมหาศาลในเวิลด์ไวด์เว็บ • มาตรฐานของห้องสมุดต้องลงทุนสูงและยากสำหรับผู้ที่ไม่ใช่บรรณารักษ์ • เจ้าของผลงานต้องการแบบกรอกข้อมูลที่เข้าใจง่ายใช้เพียงสัญชาตญาณของคนทั่วไปก็สามารถพรรณนาสารสนเทศในหน้าเว็บของตนได้ • การแสดงข้อมูลหน้าจอจากการสืบค้นในเวิลด์ไวด์เว็บที่แสดงรายการที่สื่อให้เข้าถึงสารสนเทศเช่นเดียวกับห้องสมุด ได้แก่ ชื่อสารสนเทศ เจ้าของงาน สำนักพิมพ์ ปีที่พิมพ์ รหัสหรือเลขหมู่ เพื่อให้ผู้ใช้เข้าถึงได้ง่าย
Dublin Core metadata / XML / RDF • การจัดการสารสนเทศดิจิทัลจำเป็นต้องใช้เมทาดาทาในการกำหนดโครงสร้างข้อมูล เพื่อให้การค้นคืนถูกต้องและให้ข้อมูลที่ส่งถ่ายข้อมูลต่างระบบ/ต่างฐานข้อมูลเป็นข้อมูลที่ตรงเรื่องกัน • ดับลินคอร์เมทาดาทาคือมาตรฐานในการจัดเก็บและพรรณนาสารสนเทศดิจิทัล เพื่อให้เจ้าของผลงานจัดทำเมทาดาทาด้วยตัวเอง และสามารถใช้งานเพื่อการจัดเก็บและค้นคืนต่างระบบได้ • XML/RDF คือมาตรฐานภาษากำกับเพิ่มสำหรับการสร้างเอกสารอิเล็กทรอนิกส์โดยพรรณนา อธิบายขอบเขตของข้อมูลและระบุพฤติกรรมการปฏิบัติการของข้อมูลที่จัดเก็บ เพื่อให้การสืบค้นเนื้อหาสารสนเทศได้อย่างถูกต้อง • XML - Extensible Markup Language • RDF - Resource Definition Framework
DC.ชื่อเรื่อง<Title> DC. เจ้าของงาน<Creator> DC. ลักษณะ <Description> DC. หัวเรื่อง <Subject> DC. สำนักพิมพ์ <Publisher> DC. ผู้ร่วมงาน <Contributor> DC. ปี <Date> DC. ประเภท <Type> DC. รูปแบบ <Format> DC. รหัส <Identifier> DC. ต้นฉบับ <Source> DC. ภาษา <Language> DC. เรื่องที่เกี่ยวข้อง <Relation> DC. ขอบเขต <Coverage> DC. สิทธิ <Rights> ชุดหน่วยข้อมูลย่อยดับลินคอร์ 1.1(ไทย-อังกฤษ)
ตัวขยาย- DC.Qualifiers • สำหรับระบบที่ต้องการรายละเอียดสำหรับพรรณนาข้อมูลมากกว่าดับลินคอร์พื้นฐานตัวขยาย(Qualifiers) ช่วยให้ผู้บันทึกข้อมูลเข้าใจรายละเอียดมากขึ้นว่า ควรจะบันทึกข้อมูลประเภทใด และควรใช้เกณฑ์หรือมาตรฐานใด ทั้งนี้เพื่อให้ผู้บันทึกข้อมูลที่ทำงานร่วมกัน สามารถผลิตรายการข้อมูลที่เป็นมาตรฐาน สามารถเพิ่มประสิทธิภาพในการสืบค้น • ในการบันทึกข้อมูล เจ้าของงาน (Creator) ควรใช้เกณฑ์มาตรฐานสำหรับตัวขยาย ตัวอย่างเช่น AACR 2 สำหรับบรรณารักษ์ หรือ เกณฑ์ ISO สำหรับงานประเภทอื่น ที่มิได้ใช้ระบบเดียวกันกับห้องสมุด • หัวเรื่อง หรือ คำสำคัญ(Subject or Keywords) ควร ใช้หัวเรื่องของสมาคมห้องสมุดแห่งประเทศไทยฯ หรือระบบหอสมุดรัฐสภาอเมริกัน หรือ หัวเรื่องของห้องสมุดแพทย์ หรือ Agrovoc สำหรับสารสนเทศเกษตร เป็นต้น • ตัวขยาย อาจจัดทำเป็นเมนูกำกับไว้ที่แต่ละหน่วยข้อมูลย่อยในแบบบันทึกข้อมูล เพื่อให้สะดวกเวลาบันทึกข้อมูล ดับลินคอร์ไม่บังคับว่าทุกคนต้องใช้ตัวขยาย
The Core - ground rules • ไม่ต้องใช้หน่วยข้อมูลย่อยทั้งหมด เลือกเฉพาะที่ต้องการ • ใช้หน่วยข้อมูลย่อยซ้ำได้ตามต้องการ • จัดลำดับการแสดงผลได้ตามต้องการ • เพิ่มขยายหน่วยข้อมูลย่อยได้ • ใช้งานระดับสากล
ดับลินคอร์เป็นมาตรฐานประกาศอย่างเป็นทางการดับลินคอร์เป็นมาตรฐานประกาศอย่างเป็นทางการ • CEN Workshop Agreement (EU) • - Dublin Core elements endorsed as CWA 13874 • - Usage guidelines for European industry • NISO Z39.85 (U.S.A.) • ISO 15836 (2003-04-08) http://www.niso.org/international/SC4/sc4docs.html
ความสำคัญของมาตรฐาน • ทำให้การสร้างฐานข้อมูลมีวิธีการจัดเก็บเป็นแนวทาง/โครงสร้างแบบเดียวกัน เพื่อให้แลกเปลี่ยนและรวมหลายฐานข้อมูลเป็นหนึ่งเดียวได้ • ทำให้การค้นคืนสารสนเทศร่วมกันเป็นไปได้สำหรับฐานข้อมูลต่างระบบ ต่างรูปแบบ และต่างภาษา • มาตรฐานคือปัจจัยสำคัญของการประกันคุณภาพของสารสนเทศ
หน่วยงานที่รับผิดชอบการมาตรฐานหน่วยงานที่รับผิดชอบการมาตรฐาน • 1. องค์การระหว่างประเทศว่าด้วยการมาตรฐาน (ISO-International Standard Organization) • 2. สถาบันแห่งชาติสหรัฐอเมริกาว่าด้วยการมาตรฐาน (ANSI-American National Standard Institute) • 3. องค์การแห่งชาติสหรัฐอเมริกาว่าด้วยการมาตรฐานสารสนเทศ (NISO-National Information Standards Organization) • 4. สำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรม (ส.ม.อ.) • 5. สหพันธ์ระหว่างประเทศว่าด้วยสมาคมและสถาบันห้องสมุด (IFLA-International Federation of Library and Information Associations) • 6. ภาคีเวิลไวด์เว็บ (W3C-World Wide Web Consortium) • 7. หอสมุดรัฐสภาอเมริกัน และหอสมุดแห่งชาติ +++
ตัวอย่างมาตรฐานสำหรับการจัดการสารสนเทศดิจิทัลตัวอย่างมาตรฐานสำหรับการจัดการสารสนเทศดิจิทัล • 1.มาตรฐานในการลงอักขระ ได้แก่ มาตรฐานการเข้ารหัสหลายภาษาโดย ISO และ UNICODE มาตรฐานการถอดอักษรต่างภาษา • 2. มาตรฐานสำหรับการพรรณนาสารสนเทศ ได้แก่ มาตรฐานการลงรายการบรรณานุกรม AACR มาตรฐานการลงรายการบรรณานุกรมที่เครื่องอ่านได้ Marc มาตรฐานในการจัดทำดรรชนีและสารสังเขป ดับลินคอร์เมทาดาทาสำหรับการจัดเก็บสารสนเทศดิจิทัล มาตรฐานสำหรับภาษาตัวกำกับ • 3. มาตรฐานในการค้นสารสนเทศจากฐานข้อมูลต่างระบบ ได้แก่ มาตรฐานการสื่อสารเชื่อมต่อระบบเปิด มาตรฐาน Z 39.50 ANSI/NISO Z39.50-1995 มาตรฐานสำหรับภาษาเชิงตรรกะ
ฐานข้อมูลงานวิจัยของประเทศไทยฐานข้อมูลงานวิจัยของประเทศไทย • ปัญหา ฐานข้อมูลใช้โครงสร้างหลายรูปแบบ การใช้ข้อมูลร่วมกันต้องเสียเวลาสืบค้นจากเว็บไซท์ของภาคีหลายครั้งจากแต่ละแห่ง (ศูนย์แห่งชาติภายใต้ สวทช. สกว. สวรส. วช.) • ทุกคนต้องการรูปแบบโครงสร้างฐานข้อมูลที่ใช้ร่วมกันทุกแห่ง • คำตอบ ชุดหน่วยข้อมูลย่อยดับลินคอร์เมทาดาทา คือกลไกเบื้องต้นสู่โครงสร้างมาตรฐานสากล ใช้เป็นเกณฑ์กำหนดคำจำกัดความหน่วยข้อมูลย่อยร่วมกัน เพื่อให้การรวมฐานข้อมูลมีประสิทธิภาพ โดยจับคู่หน่วยข้อมูลย่อยเดิมกับดับลินคอร์ ไม่ต้องพิมพ์ข้อมูลใหม่ บริการสืบค้นได้เสมือนเป็นฐานข้อมูลเดียว
ชื่อเรื่อง<DC.ชื่อเรื่อง>ชื่อเรื่อง<DC.ชื่อเรื่อง> ผู้วิจัย<DC.เจ้าของงาน> หน่วยงานวิจัย< DC.สำนักพิมพ์ > ผู้ให้ทุน< DC. ผู้ร่วมงาน> สถานภาพ<DC.ประเภท> ระยะเวลา< DC.ขอบเขต > ปีสิ้นสุด< DC.ปี > บทคัดย่อ< DCลักษณะ > ทะเบียนวิจัย<DC.รหัส >(ไม่บังคับ) คำสำคัญ< DC.หัวเรื่อง >(ไม่บังคับ) รูปแบบ< DC.รูปแบบ > (ไม่บังคับ) ต้นฉบับ< DC. ต้นฉบับ> (ไม่บังคับ) ภาษา< DC.ภาษา > สิ่งพิมพ์< DC.เรื่องที่เกี่ยวข้อง >(ไม่บังคับ) สิทธิ< DC.สิทธิ > (ไม่บังคับ) การประยุกต์ชุดหน่วยข้อมูลย่อย 1.1“ฐานข้อมูลงานวิจัยของประเทศไทย”
การประยุกต์ดับลินคอร์โดยใช้ XML • อ่านรายละเอียดที่ • Guidelines for implementing Dublin Core in XML • www.dublincore.org/documents/2003/04/02/dc-xml-guidelines/
สถานภาพและแนวโน้มของการใช้เมทาดาทาสถานภาพและแนวโน้มของการใช้เมทาดาทา • รัฐบาลอิเล็กทรอนิกส์ • พาณิชย์อิเล็กทรอนิกส์ • การเรียนออนไลน์ • ห้องสมุดดิจิทัล
รัฐบาลอิเล็กทรอนิกส์ • หน่วยราชการประเทศต่างๆที่ใช้ดับลินคอร์ในการจัดระบบเอกสารอิเล็กทรอนิกส์ จากการสำรวจปี 2001 ประเทศกลุ่มบุกเบิก ได้แก่ ออสเตรเลีย แคนาดา เดนมาร์ค ไอร์แลนด์ อังกฤษสหรัฐอเมริกา • รัฐบาลเหล่านี้บังคับว่าสิ่งพิมพ์รัฐบาลต้องมีฉบับอิเล็กทรอนิกส์เพื่อเผยแพร่ให้ประชาชนเข้าถึงได้ทางอินเทอร์เน็ต และใช้เมทาดาทาในการสร้างเอกสาร โดยให้ใช้หน่วยข้อมูลย่อยดับลินคอร์เป็นเมทาดาทาพื้นฐาน • จากการประชุมดับลินคอร์ ปี 2002 มีประเทศในยุโรปนำไปใช้เพิ่มขึ้นหลายประเทศ รวมทั้งหน่วยงานของสหประชาชาติ เช่น องค์การอาหารและเกษตร (FAO)
พาณิชย์อิเล็กทรอนิกส์พาณิชย์อิเล็กทรอนิกส์ • XML/RDF • INDECS • ในการประชุมดับลินคอร์ 2002 บริษัทข้ามชาติแสดงความต้องการจะนำชุดหน่วยข้อมูลย่อยดับลินคอร์ไปประยุกต์ สำหรับการสื่อสารข้อมูลระหว่างสาขาของบริษัทที่ตั้งอยู่ในหลายประเทศทั่วโลก ข้อดีของหน่วยข้อมูลย่อยดับลินคอร์ คือ การกำหนดศัพท์และคำอธิบายความหมายร่วมของหน่วยข้อมูลย่อยสำหรับใช้ ต่างระบบ ต่างสาขาอาชีพ ต่างภาษา ทำให้การแลกเปลี่ยนข้อมูลต่างระบบทำได้กว้างขวาง สามารถลดการทำข้อมูล ซ้ำซ้อน ประหยัดเวลาและใช้ข้อมูลร่วมกันในอินเทอร์เน็ตได้อัตโนมัติในหลายระดับ
การเรียนออนไลน์ • การทำรายการสหบรรณานุกรมสิ่งพิมพ์อิเล็กทรอนิกส์ออนไลน์ • ภาคีสมาชิกของเครือข่ายการศึกษาร่วมกันทำรายการบทเรียน เอกสารแบบ OPAC โดยเจ้าของงานเป็นผู้ทำรายการเอง พร้อมเชื่อมโยงไปยัง URL/URI หน้าที่มีข้อมูล • Article Union Cataloging System (AUCS) เกาหลีEdNA (Education Network Australia)Gateway to Educational Materials (GEM)สหรัฐอเมริกา
ห้องสมุดดิจิทัลคืออะไร?ห้องสมุดดิจิทัลคืออะไร? • จากการประชุมนานาชาติได้สรุปคำจำกัดความห้องสมุดดิจิทัลและการพิมพ์อิเล็กทรอนิกส์ เพื่อส่งเสริมการเข้าถึงสารสนเทศแบบเปิด (Open Access to Information) • ห้องสมุดดิจิทัล คือการรวมฐานข้อมูลสารสนเทศเพื่อให้บริการสืบค้นร่วมกันจากอินเทอร์เน็ตได้ทุกฐานข้อมูลในคราวเดียว • การรวมเว็บไซท์เพื่อสร้างดรรชนีสำหรับสืบค้นฐานข้อมูลหลากหลายและต่างภาษาร่วมกันได้อย่างมีประสิทธิภาพ การบริการเว็บพอร์ทัล และเว็บไซท์เฉพาะสาขาวิชา • การพิมพ์อิเล็กทรอนิกส์ คือการจัดทำวารสารอิเล็กทรอนิกส์
การรวมเครือข่ายสารสนเทศห้องสมุดเสมือนให้เป็นห้องสมุดแห่งเดียวการรวมเครือข่ายสารสนเทศห้องสมุดเสมือนให้เป็นห้องสมุดแห่งเดียว การรวมฐานข้อมูลวารสารอิเล็กทรอนิกส์ (ฉบับเต็ม)จากหลายฐานข้อมูลสู่ฐานข้อมูลเดียว Web technology and digital libraries initiatives ตัวอย่างNational Science Digital Library (U.S.A) Strategy: support eight standard formats collect all existing metadata in these formats provide crosswalks to Dublin Core assemble all metadata in a central depository expose all such records o harvesters focus limited human effort on metadata for collections generate metadata automatically when possible ห้องสมุดดิจิทัลและเวิลด์ไวด์เว็บ
Open Archives Initiatives • โครงการริเริ่มของสหรัฐอเมริกา เป็นงานวิจัยที่ได้รับทุนสนับสนุนจาก National Science Foundation ดำเนินงานโดยมหาวิทยาลัยคอร์แนล • OAI พัฒนามาตรฐานและส่งเสริมการใช้มาตรฐานสำหรับการทำงานเครือข่ายข้อมูลต่างระบบโดยมีจุดมุ่งหมายที่จะช่วยให้การเผยแพร่เนื้อหาความรู้เป็นไปได้ง่ายและสะดวก เริ่มมาจากการที่มีสิ่งพิมพ์วิชาการในรูปอิเล็กทรอนิกส์มากขึ้น และการสร้างสรรค์สารสนเทศวิชาการเหล่านี้ล้วนดำเนินไปอย่างอิสระโดยเจ้าของผลงานมีส่วนสร้างสรรค์ • OAI เสนอกลไกสำหรับเจ้าของสารสนเทศให้เปิดเผยเมทาดาทาที่ใช้ เพื่อให้ระบบสามารถใช้เทคโนโลยีในการค้นและเข้าถึงข้อมูลหรือเอกสารที่ใช้ดับลินคอร์ XMLทั้งหมดที่เผยแพร่ในเวิลด์ไวด์เว็บได้
กิจกรรมความร่วมมือด้านห้องสมุดดิจิทัลกิจกรรมความร่วมมือด้านห้องสมุดดิจิทัล • APEC Workshop on Resources Sharing in Digital Libraries Taiwan Institute of Information Science เป็นผู้ดำเนินการในการสร้างความร่วมมือด้านการพัฒนาเทคโนโลยีและการจัดทำเนื้อหาสารสนเทศสำหรับห้องสมุดดิจิทัลโดยการเรียนรู้ร่วมกัน จากประสบการณ์ของไต้หวันที่ประสบความสำเร็จ และได้ทำวิจัยมาเป็นเวลานาน • APIN Asia-Pacific Information Network โดยยูเนสโกเป็นแกนนำเพื่อเสนอแนวปฏิบัติต่อ WSIS- World Summit of Information Society สาระได้แก่การใช้เทคโนโลยีจากอินเทอร์เน็ตในการสร้างสารสนเทศที่เป็นความรู้ทางวิทยาศาสตร์ การศึกษาและวัฒนธรรมในรูปดิจิทัล เพื่อเปิดโอกาสให้มวลชนเข้าถึงความรู้ได้สะดวก ง่าย และทั่วถึง • INASP International Network for the Availability of Scientific Publications โดยยูเนสโกและ ICSU ทำหน้าที่ประสานงานระดับสากลให้มีความร่วมมือในการใช้ทรัพยากรสารสนเทศวิทยาศาสตร์และเทคโนโลยีร่วมกันด้วยความช่วยเหลือจากประเทศที่พัฒนาแล้วแก่ผู้ด้อยพัฒนาเพื่อลดช่องว่างทางดิจิทัล • ASEAN-India Science and Technology Digital Library
ความหวัง หอสมุดดิจิทัลแห่งชาติ • บรรณานุกรมแห่งชาติ-รวมทุกห้องสมุดเสมือนเป็นแห่งเดียว • ฐานข้อมูลงานวิจัยของประเทศไทย • ฐานข้อมูลวิทยานิพนธ์ไทย • ฐานข้อมูลสารบัญวารสารไทยพร้อมเรื่องเต็ม • ฐานข้อมูลคลังสมอง • คนไทยทุกคนสามารถเรียนรู้ เข้าถึงความรู้ ทรัพย์สินทางปัญญาของชาติได้ทั่วถึงจากอินเทอร์เน็ต
E-Library 2003- กระทรวงวิทยาศาสตร์ฯ