1 / 80

การจัดเก็บและค้นคืนสารสนเทศ

การจัดเก็บและค้นคืนสารสนเทศ. INFORMATION STORAGE and RETRIEVAL : ISR. review การใช้งานเมทาดาตา เพื่อแลกเปลี่ยนข้อมูล. ฐานข้อมูล A. การใช้งานเมทาดาตาเพื่อแลกเปลี่ยนข้อมูล. ฐานข้อมูล A. การใช้งานเมทาดาตาเพื่อแลกเปลี่ยนข้อมูล ( ต่อ). ฐานข้อมูล B. ฐานข้อมูล A. การใช้งานเมทาดาตา.

payton
Download Presentation

การจัดเก็บและค้นคืนสารสนเทศ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. การจัดเก็บและค้นคืนสารสนเทศการจัดเก็บและค้นคืนสารสนเทศ INFORMATION STORAGE and RETRIEVAL : ISR

  2. reviewการใช้งานเมทาดาตาเพื่อแลกเปลี่ยนข้อมูลreviewการใช้งานเมทาดาตาเพื่อแลกเปลี่ยนข้อมูล

  3. ฐานข้อมูล A การใช้งานเมทาดาตาเพื่อแลกเปลี่ยนข้อมูล

  4. ฐานข้อมูล A การใช้งานเมทาดาตาเพื่อแลกเปลี่ยนข้อมูล(ต่อ) ฐานข้อมูล B

  5. ฐานข้อมูล A การใช้งานเมทาดาตา Dublin Core ฐานข้อมูล B

  6. ฐานข้อมูล A การใช้งานเมทาดาตา ฐานข้อมูล B

  7. ปัญหาการแลกเปลี่ยนข้อมูลปัญหาการแลกเปลี่ยนข้อมูล ? ฐานข้อมูล A ฐานข้อมูล B

  8. XML ฐานข้อมูล B ฐานข้อมูล A PHP C++ แก้ปัญหาการแลกเปลี่ยนข้อมูลโดยใช้ XML

  9. XML ฐานข้อมูล B ฐานข้อมูล A PHP C++ แก้ปัญหาการแลกเปลี่ยนข้อมูลโดยใช้ XML

  10. reviewXML

  11. XML ( Extensible Markup Language )คือ ภาษาที่ได้รับการออกแบบมาเพื่อให้สามารถนิยามความหมายของข้อมูลได้ หรือที่เรียกว่า Data definition โดยอนุญาตให้ผู้ใช้นิยามแท็กขึ้นมาได้เอง เช่น <myTag> Data </myTag>

  12. 1. ภาษา HTML จะประกอบไปด้วยแท็กที่ถูกกำหนดไว้เรียบร้อยแล้ว ภาษา XML ไม่มีแท็กที่ถูกนิยามไว้ก่อน ผู้ใช้ต้องสร้างแท็กขึ้นมาเองเพื่อนำมาอธิบายข้อมูล HTML vs. XML

  13. 2. ภาษา HTML เป็นภาษาที่ถูกออกแบบมาเพื่อแสดงผลข้อมูล ในขณะที่ XML เป็นภาษาที่ใช้ในการขนส่งและจัดเก็บข้อมูล HTML vs. XML

  14. 1. ใช้สำหรับสร้างข้อมูลที่สามารถอธิบายความหมายของตัวเองได้ (self-describe data)จากความสามารถในการสร้างแท็กขึ้นมาเองได้ ทำให้การนิยามชื่อแท็กจะคำนึงถึงชื่อที่สื่อความหมายถึงข้อมูล ซึ่งทำให้ผู้ใช้งานสามารถอ่านและเข้าใจข้อมูลได้ง่าย ในขณะเดียวกันก็สามารถเขียนโปรแกรมให้เครื่องคอมพิวเตอร์สามารถดึงข้อมูลไปใช้ได้โดยง่าย ดังนั้นจึงอาจกล่าวได้ว่า เอกสาร XML มีคุณลักษณะครบทั้งแบบ Human readableและแบบ Machine readable ประโยชน์ของ XML

  15. <studentProfile> <id>0510001</id> <name>Sakon</name> <surname>Muangsun</surname></studentProfile><studentProfile> <id>0510001</id> <name>Sakon</name> <surname>Muangsun</surname></studentProfile> ตัวอย่าง

  16. 2. ใช้สำหรับการแลกเปลี่ยนข้อมูล (data exchange) เนื่องจาก XML เป็นเอกสารที่มีลักษณะเป็น text file จึงทำให้ XML เป็นภาษากลาง จึงใช้ได้กับทุกแพลตฟอร์ม (platform) ไม่ว่าจะเป็น Windows หรือ Unix หรืออื่นๆ จึงสามารถแลกเปลี่ยนข้อมูลที่อยู่ในรูปเอกสาร XML ข้ามแพลตฟอร์มได้ ประโยชน์ของ XML

  17. 3. เป็นรากฐานของภาษาใหม่ๆ ในการพัฒนาเว็บเพจภาษาใหม่ๆในที่นี้เช่น MathML, ChemML, VML, FBML, SVG และอื่นๆ ประโยชน์ของ XML

  18. ตัวอย่าง MathML

  19. reviewโครงสร้างของภาษาXML

  20. โครงสร้างของเอกสาร XML

  21. คือ ส่วนที่เนื้อเอกสารจริงๆ ซึ่งได้แก่ข้อความหรือข้อมูลในเอกสารและแท็กที่นิยามข้อความหรือข้อมูลเหล่านั้น ในส่วน Body นี้ยังมีส่วนประกอบย่อยดังต่อไปนี้ Body

  22. กฏเกณฑ์ของอิลิเมนต์ (element) 1. เอกสาร XML จะมี root element ได้เพียงหนึ่งเดียวเท่านั้น ซึ่งทำหน้าที่คุมอิลิเมนต์อื่นๆ ทั้งหมด<book><title>การใช้งาน XML</title><publisher> IDC</publisher></book>ในที่นี้ <book>…….</book> ทำหน้าที่เป็น root element

  23. กฏเกณฑ์ของอิลิเมนต์ (element) 2. แท็กเปิดและปิดต้องเหมือนกันต่างกันแต่เพียงในแท็กปิดต้องมีเครื่องหมาย / นำหน้าชื่อแท็กเท่านั้น

  24. 3. ห้ามระบุแท็กเหลื่อมซ้อนกัน (overlap) คือ แท็กที่เปิดก่อนต้องปิดหลังสุด เช่น<book><title>การใช้งาน XML</title></book>ในกรณีที่ผิด ยกตัวอย่างเช่น<book><title>การใช้งาน XML</book></title> กฏเกณฑ์ของอิลิเมนต์ (element)

  25. 4. ชื่อแท็กมีคุณสมบัติ case-sensitive คิอตัวอักษรพิมพ์เล็กพิมพ์ใหญ่ถือว่าแตกต่างกัน ดังนั้นแท็ก<city>,<City>,<CITY> เหล่านี้จึงเป็นคนละแท็กกัน กฏเกณฑ์ของอิลิเมนต์ (element)

  26. กฏเกณฑ์ของอิลิเมนต์ (element) 5. สำหรับแท็กที่ไม่มีข้อมูลอยู่ระหว่างแท็ก มีวิธีเขียนได้ 2 แบบ แบบที่หนึ่งคือ <title></title> แบบที่สองคือ <title/> แต่นิยมในแบบที่สองมากกว่า

  27. กฏเกณฑ์ของอิลิเมนต์ (element) 6. ค่าของแอตทิบิวต์ ต้องอยู่ในเครื่องหมายคำพูดแบบ double quote (“) หรือ single quote (‘) อย่างใดอย่างหนึ่ง เช่น <book isbn=“1234”/>

  28. กฏเกณฑ์ของอิลิเมนต์ (element) 7. ในภาษา XML มีอักขระซึ่งสงวนไว้ 5 ตัวเพราะต้องใช้เป็น < ใช้อักษร &lt; > ใช้อักษร &gt; & ใช้อักษร &amp; “ ใช้อักษร &quot; ‘ ใช้อักษร &apos;เช่น ต้องการใส่ข้อมูล ว่า x<5 เมื่อเขียนให้อยู่ในรูป XML จะสามารถเขียนได้ดังนี้ <equation> x&lt;5</equation>

  29. กฏเกณฑ์ของอิลิเมนต์ (element) 8. การตั้งชื่อแท็กมีหลักเกณฑ์ที่ควรจำดังนี้ 8.1 ชื่อแท็กต้องขึ้นต้นด้วยอักษรหรือเครื่องหมาย under_score ( _ ) เท่านั้น8.2 ตัวถัดไปต้องเป็นตัวอักษร ตัวเลข เครื่องหมายจุด เครื่องหมายยัติภังค์ ( - ) เครื่องหมาย under_score ( _ ) หรือเครื่อหมาย ( : ) เท่านั้น แต่ยังไม่แนะนำให้ใช้ : เพราะมีปัญหากับเรื่องของแนมสเปซ (namespace)

  30. กฏเกณฑ์ของอิลิเมนต์ (element) 8. การตั้งชื่อแท็กมีหลักเกณฑ์ที่ควรจำดังนี้8.3 ชื่อแท็กมีคุณสมบัติ Case-Sensitive 8.4 อักษร 3 ตัวแรกของชื่อแท็กห้ามเป็นคำว่า XML ไม่ว่าจะใช้ตัวเล็กหรือตัวใหญ่เพื่อเป็นการสงวนไว้ใช้ในอนาคต

  31. กฏเกณฑ์ของอิลิเมนต์ (element) 8. การตั้งชื่อแท็กมีหลักเกณฑ์ที่ควรจำดังนี้8.3 ชื่อแท็กมีคุณสมบัติ Case-Sensitive 8.4 อักษร 3 ตัวแรกของชื่อแท็กห้ามเป็นคำว่า XML ไม่ว่าจะใช้ตัวเล็กหรือตัวใหญ่เพื่อเป็นการสงวนไว้ใช้ในอนาคต

  32. ตัวอย่าง การใช้งานดับลินคอร์สำหรับ XML <?xml version="1.0" encoding= "UTF-8"?> <metadata > <dc:title> UKOLN </dc:title> <dc:description> UKOLN is a national focus of expertise in digital information management. It provides policy, research and awareness services to the UK library, information and cultural heritage communities. UKOLN is based at the University of Bath. </dc:description> <dc:publisher> UKOLN, University of Bath </dc:publisher> <dc:identifier> http://www.ukoln.ac.uk/ </dc:identifier> </metadata>

  33. การค้นคืนสารสนเทศ(Information Retrieval)

  34. การจัดเก็บสารสนเทศ - การจัดเก็บเพื่อประโยชน์ของการใช้และการเข้าถึงสารสนเทศ - การจัดเก็บ มุ่งจัดโครงสร้างในทางกายภาพและเนื้อหา เช่น รหัสหมวดหมู่ ดรรชนี สาระสังเขป เพื่อเชื่อมโยงไปยังที่จัดเก็บสารสนเทศ เป็นต้น ความเชื่อมโยงระหว่างการจัดเก็บและการค้นคืน

  35. การค้นคืนสารสนเทศ • การค้นคืน (retrieval) เป็นการค้นเพื่อให้ได้สารสนเทศทั้งหมดที่ตรงตามความต้องการ โดยมีเอกสารที่ไม่ตรงตามความต้องการปะปนออกมาน้อยที่สุด ความเชื่อมโยงระหว่างการจัดเก็บและการค้นคืน (ต่อ)

  36. ประกอบด้วยขั้นตอนหลักๆ 5 ขั้นตอน ได้แก่ กระบวนการค้นหาสารสนเทศ 1. การทำความเข้าใจกับความต้องการสารสนเทศของผู้ใช้ 2. การคัดเลือกระบบค้นคืนสารสนเทศที่เหมาะสม 3. การกำหนดความต้องการสารสนเทศในรูปแนวคิดและคำค้น 4. การกำหนดกลยุทธ์การค้น 5. การดำเนินการค้นและทบทวนผลการค้น

  37. ประกอบด้วยขั้นตอนหลักๆ 5 ขั้นตอน ได้แก่ กระบวนการค้นหาสารสนเทศ 1. การทำความเข้าใจกับความต้องการสารสนเทศของผู้ใช้ 2. การคัดเลือกระบบค้นคืนสารสนเทศที่เหมาะสม 3. การกำหนดความต้องการสารสนเทศในรูปแนวคิดและคำค้น 4. การกำหนดกลยุทธ์การค้น 5. การดำเนินการค้นและทบทวนผลการค้น

  38. ความต้องการโดยทั่วไป สามารถจำแนกได้ 2 ประเภทได้แก่ 1.1 ความต้องการสารสนเทศรายการใดรายการหนึ่ง (Know-item need) ผู้ใช้มักต้องการสารสนเทศที่เข้าเรื่องเพียง 1-2 รายการเท่านั้น เช่น “ต้องการค้นหาข้อมูลทางบรรณานุกรมของหนังสือชื่อ Information Retrieval Today ที่แต่งโดย Lancaster ” 1.2 ความต้องการสารสนเทศหัวข้อใดหัวข้อหนึ่ง (Subject need) ผู้ใช้มักต้องการสารสนเทศกว้างๆ ในหัวข้อใดหัวข้อหนึ่ง เช่น “ต้องการค้นหาสารสนเทศที่เกี่ยวกับการเมืองช่วงเดือนตุลา 2516” 1. การทำความเข้าใจกับความต้องการสารสนเทศของผู้ใช้

  39. ความต้องการของผู้ใช้โดยส่วนใหญ่เป็นประเภทที่สองความต้องการของผู้ใช้โดยส่วนใหญ่เป็นประเภทที่สอง ดังนั้น จำเป็นต้องทำความเข้าใจให้มากที่สุดเท่าที่จะทำได้ ความเข้าใจในเรื่องนี้เป็นสิ่งสำคัญและจำเป็นมากในค้นหาสารสนเทศ การทำความเข้าใจกับความต้องการสารสนเทศของผู้ใช้อาจกระทำได้โดยการสัมภาษณ์ผู้ใช้ก่อนค้นหา (Pre-search interview) 1. การทำความเข้าใจกับความต้องการสารสนเทศของผู้ใช้(ต่อ)

  40. 1.1 ประเภทของสารสนเทศที่ต้องการ ช่วยให้เข้าใจความต้องการสารสนเทศที่ผู้ใช้ต้องการนั้นเป็นประเภทใด และอยู่ในรูปแบบใด เช่น หนังสือ รายงาน บรรณานุกรม เอกสารฉบับเต็ม รูปภาพ มัลติมิเดีย หรืออื่นๆ 1.2 ลักษณะการนำสารสนเทศไปใช้ ช่วยให้ทราบวัตถุประสงค์ของการนำสารสนเทศที่ได้ไปใช้ เช่น เพื่อการเพิ่มพูนความรู้ เพื่อการทำรายงาน เพื่อการประกอบอาชีพ และอื่นๆ ทั้งนี้อาจขึ้นอยู่กับสถานภาพผู้ใช้ เช่น การศึกษา อายุ อาชีพ ฯลฯ การสัมภาษณ์ผู้ใช้ก่อนการค้นหา

  41. 1.3 ระดับความสุ่มลึกแบบปริมาณของสารสนเทศที่ต้องการ ช่วยให้สามารถคัดเลือกระบบค้นคืนสารสนเทศและกลยุทธ์การค้นที่เหมาะสม รวมทั้งช่วยในการกลั่นกรองสารสนเทศที่ค้นคืนได้อีกด้วย 1.4 เวลาที่ใช้ในการค้นหา ช่วยให้ทราบว่าผู้ใช้จะใช้เวลาในการค้นหาสารสนเทศมากน้อยเพียงใด ไม่ว่าจะเป็นเวลาของตนเองหรือเวลาของการค้นที่เป็นตัวกลาง ซึ่งช่วยในการประมาณค่าใช้จ่ายที่เกิดขึ้นจากการค้นได้ด้วย การสัมภาษณ์ผู้ใช้ก่อนการค้นหา(ต่อ)

  42. 1.5 ข้อจำกัดต่างๆ ช่วยให้เข้าใจข้อจำกัดของผู้ใช้ เพื่อให้สามารถคัดเลือกระบบค้นคืนสารสนเทศที่เหมาะสม ตัวอย่างข้อจำกัดที่มักพบเห็น ได้แก่ ภาษาที่ใช้ ระยะเวลาที่ครอบคลุม ฯลฯ ผู้สัมภาษณ์ควรมีความรู้และทักษะที่สำคัญ เช่น ทักษะการสื่อสารระหว่างบุคคล ทักษะการคิดเชิงสร้างสรรค์ มีความรู้เกี่ยวกับเนื้อหาสาระในศาสตร์ที่จะค้นหา และความรู้ความเข้าใจเกี่ยวกับระบบค้นคืนสารสนเทศที่จะใช้ การสัมภาษณ์ผู้ใช้ก่อนการค้นหา(ต่อ)

  43. ประกอบด้วยขั้นตอนหลักๆ 5 ขั้นตอน ได้แก่ กระบวนการค้นหาสารสนเทศ 1. การทำความเข้าใจกับความต้องการสารสนเทศของผู้ใช้ 2. การคัดเลือกระบบค้นคืนสารสนเทศที่เหมาะสม 3. การกำหนดความต้องการสารสนเทศในรูปแนวคิดและคำค้น 4. การกำหนดกลยุทธ์การค้น 5. การดำเนินการค้นและทบทวนผลการค้น

  44. เมื่อเข้าใจความต้องการของผู้ใช้แล้ว จึงนำความต้องการที่ได้มาพัฒนาหรือเลือกใช้ระบบค้นคืนสารสนเทศ ในกรณีที่เลือกระบบค้นคืนสารสนเทศ ต้องมีความเข้าใจเกี่ยวกับระบบค้นคืนสารสนเทศต่างๆ เป็นอย่างดี เพื่อให้แน่ใจว่า ระบบที่เลือกนั้นมีสารสนเทศที่ตรงตามความต้องการของผู้ใช้จริงๆ และ เหมาะสมที่จะเป็นแหล่งค้นหา 2. การคัดเลือกระบบค้นคืนสารสนเทศที่เหมาะสม

  45. เกณฑ์การคัดเลือกมีดังต่อไปนี้ (Large, Tedd and Hartley 1999: 240-244) 1. ขอบเขต เป็นการพิจารณาการให้บริการสารสนเทศว่าเป็นประเภทใด เช่น บรรณานุกรม เอกสารฉบับเต็ม มัลติมิเดีย รูปภาพ ฯลฯ และอาจพิจารณาเกี่ยวภาษาที่ใช้ด้วย 2. ความทันสมัย พิจารณาความถี่ในการปรับปรุงสารสนเทศให้เป็นปัจจุบันหรือไม่ มีการดำเนินการบ่อยครั้งเพียงใด เกณฑ์การคัดเลือกระบบค้นคืนสารสนเทศ

  46. 3. ระยะเวลาที่ครอบคลุม พิจารณาระยะเวลาที่ครอบคลุมของสารสนเทศทั้งหมดที่จัดเก็บไว้ เช่น ผู้ใช้ทางมนุษยศาสตร์และสังคมศาสตร์มักให้ความสำคัญกับสารสนเทศที่ย้อนหลังและเป็นปัจจุบันพอๆ กัน ในขณะที่ผู้ใช้ทางวิทยาศาสตร์จะเน้นที่สารสนเทศในปัจจุบันมากกว่า 4. เนื้อหาสาระของระเบียนข้อมูล พิจารณารายละเอียดของแต่ละระเบียนข้อมูล เช่น เขตข้อมูลใดบ้างที่สามารถค้นได้ มีเขตข้อมูลสาระสังเขปหรือไม่ และมีเอกสารฉบับเต็มหรือไม่ 5. วิธีการจัดทำศัพท์ดรรชนี 6. ค่าใช้จ่าย 7. 8. เกณฑ์การคัดเลือกระบบค้นคืนสารสนเทศ(ต่อ)

  47. 5. วิธีการจัดทำศัพท์ดรรชนี พิจารณาวิธีการจัดทำศัพท์ดรรชนีว่ามีวิธีการอย่างไร มีการใช้ศัพท์ควบคุมหรือไม่ หรือใช้ศัพท์ภาษาธรรมชาติ และคุณภาพของการจัดทำศัพท์ดรรชนีเป็นอย่างไร 6. ค่าใช้จ่าย พิจารณาค่าใช้จ่ายที่เกิดขึ้นจากการค้น เช่น ค่าใช้จ่ายเป็นรายครั้ง รายปี เกณฑ์การคัดเลือกระบบค้นคืนสารสนเทศ(ต่อ)

  48. 7. การอำนวยความสะดวกในการค้น เป็นการพิจารณาความยากง่ายในการใช้งานของซอฟต์แวร์ที่เกี่ยวข้อง ตลอดจนส่วนติดต่อผู้ใช้ (User Interface) 8. เกณฑ์อื่นๆ พิจารณาเรื่องอื่นๆ เช่น ความคุ้นเคย ความเชื่อมั่นในระบบ ความมีชื่อเสียงของระบบ และรูปแบบของผลการค้น เป็นต้น เกณฑ์การคัดเลือกระบบค้นคืนสารสนเทศ(ต่อ)

  49. ประกอบด้วยขั้นตอนหลักๆ 5 ขั้นตอน ได้แก่ กระบวนการค้นหาสารสนเทศ 1. การทำความเข้าใจกับความต้องการสารสนเทศของผู้ใช้ 2. การคัดเลือกระบบค้นคืนสารสนเทศที่เหมาะสม 3. การกำหนดความต้องการสารสนเทศในรูปแนวคิดและคำค้น 4. การกำหนดกลยุทธ์การค้น 5. การดำเนินการค้นและทบทวนผลการค้น

  50. 3. การกำหนดความต้องการสารสนเทศในรูปแนวคิดและ คำค้น เมื่อเข้าใจความต้องการที่ชัดเจนของผู้ใช้สารสนเทศแล้ว ขั้นต่อไปคือ การกำหนดความต้องการสารสนเทศของผู้ใช้ในรูปแนวคิดและคำค้น โดยมีเทคนิคดังนี้

More Related