260 likes | 502 Views
پايگاه داده ويژه XML. ارائه گزارش اول درس پايگاه داده پيشرفته ارائه کننده : تهمينه صنم راد، مرضيه حسينی نسب. مروري بر عناوين. مختصري بر XML پايگاه داده ويژه XML موارد کاربرد پايگاه داده ويژه XML. مختصري بر XML.
E N D
پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
پايگاه داده ويژه XML ارائه گزارش اول درس پايگاه داده پيشرفته ارائه کننده : تهمينه صنم راد، مرضيه حسينی نسب پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
مروري بر عناوين • مختصري بر XML • پايگاه داده ويژه XML • موارد کاربرد پايگاه داده ويژه XML پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
مختصري بر XML “The World Speaks XML”اين پيام Software AG در نمايشگاه CeBIT 2000 است. XML براي کاربردهاي زير طراحي شده است: 1- مبادله مستندات 2- export/inport داده هاي ساخت يافته ميان پايگاههاي داده 3- پايگاههاي داده مبتني بر متن (مستندات نيمه ساخت يافته و ساخت نيافته) به منظور بازيابي تمام متن پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
XML • Extendible Markup Language کاربران را قادر مي سازد داده هاي خود را به راحتي تعريف نمايند. • مبتني بر متن و قابل خواندن متون به کمک tag ها بيشتر قابل فهمند. • مبتني بر استانداردهاي باز <book> <title>Oracle XML Handbook</title> <author>Stefan Kiritzov</author> <isbn>0-07-212489-X</isbn> <price>33.44</price> </book> • مبتني بر Unicode • کمکي براي يکپارچگي کسب و کارها منبع: http://www.w3.org پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
عناصر با صفات ريشه عنصر يک مستند XML <bib> <book id=“a1”> <title>Algorithms in Java</title> <author>Robert Sedgewick</author> <isbn>0-201-51059-6</isbn> <price>46.25</price> </book> <book id=“jb”> <title>Java Beans Design</title> <author>Bjarne Stroustrup</author> <isbn>0-201-54330-3</isbn> <price>42.25</price> </book> </bib> <bib> <book id=“a1”> <title>Algorithms in Java</title> <author>Robert Sedgewick</author> <isbn>0-201-51059-6</isbn> <price>46.25</price> </book> <book id=“jb”> <title>Java Beans Design</title> <author>Bjarne Stroustrup</author> <isbn>0-201-54330-3</isbn> <price>42.25</price> </book> </bib> <bib> <book id=“a1”> <title>Algorithms in Java</title> <author>Robert Sedgewick</author> <isbn>0-201-51059-6</isbn> <price>46.25</price> </book> <book id=“jb”> <title>Java Beans Design</title> <author>Bjarne Stroustrup</author> <isbn>0-201-54330-3</isbn> <price>42.25</price> </book> </bib> <bib> <book id=“a1”> <title>Algorithms in Java</title> <author>Robert Sedgewick</author> <isbn>0-201-51059-6</isbn> <price>46.25</price> </book> <book id=“jb”> <title>Java Beans Design</title> <author>Bjarne Stroustrup</author> <isbn>0-201-54330-3</isbn> <price>42.25</price> </book> </bib> داده منبع: http://www.w3.org پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
<bib> <book id=“a”> <title>abc </title> </book> <!ELEMENT bib ( book* )> book* <!ELEMENT book ( title, author, isbn, price? )> <!ATTLIST book id ID #REQUIRED> title, author, isbn, price? id <!ELEMENT title ( #PCDATA )> </bib> يک مستندXML - DTD <bib> <book id=“a”> <title>abc </title> <author>abc</author> <isbn>abc </isbn> <price>abc </price> </book> <book id=“b”> <title>abc </title> <author>abc</author> <isbn>abc </isbn> <price>abc </price> </book> </bib> <!-- Document Type Definition --> <!ELEMENT bib ( book* )> <!ELEMENT book ( title, author, isbn, price? )> <!ATTLIST book id ID #REQUIRED> <!ELEMENT title ( #PCDATA )> <!ELEMENT author ( #PCDATA )> <!ELEMENT isbn ( #PCDATA )> <!ELEMENT price ( #PCDATA )> پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com منبع: http://www.w3.org
XML در مقابل داده هاي سنتي XML داده هاي سنتي ? پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
Data-Centric • داده هاي ظريف دانه بندي شده • ترتيب عناصر مهم نمي باشد. • مثال • سفارش خريد • برنامه پرواز • منوي رستوران • … • براي مصرف ماشين منبع : Bourret 2000 پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
Document-Centric • داده ها درشت دانه بندي شده اند • ترتيب عناصر مهم است • مثال • کتاب • نامه هاي الکترونيکي • تبليغات • … • به مصرف انسان مي رسد منبع : Bourret 2000 پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
تعريف مرسوم • يک پايگاه داده ويژه XML • به تعريف يک مدل داده اي XML مي پردازد. • واحد بنيادين ذخيره سازي منطقي آن مستند است. • مي تواند هر گونه ذخيره سازي فيزيکي داشته باشد. • جداول براي اشياء SAX در پايگاه هاي داده رابطه اي • اشياء DOM در پايگاه هاي داده شيء گرا • قالب فايل دودويي براي بهينه سازي مدل داده اي XPath • مستندات فشرده و شاخص بندي شده XML در سيستم فايل منبع : XML:DB Initiative پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
ويژگي هاي داده هاي از نوع XML • عناصر سلسله مراتبي تودرتو • اهميت ترتيب عناصر • شماي رسمي مورد نياز نمي باشد. • مستند به عنوان يک شي مجرد به نمايش درآمده، ذخيره شده و بازيابي مي شود. • زبان هاي پرس و جوي استاندارد: XPath و XQuery منبع : XML Data Management: Native XML and XML-Enabled Database Systems پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
مشکل پايگاه داده رابطه اي با XML • نگاشت پيچيده و درهم • در شماهاي پيچيده : نگاشت بسيار کند • نگاشت باعث از دست رفتن متاداده هاي ساختاري مي شود. • مستندات نمي توانند مبادله شوند. • داده ها بايد بسيار ساخت يافته باشند. • مستندات با محتويات درهم را نمي تواند پشتيباني کند. • انعطاف پذيري محدود منبع : XML Data Management: Native XML and XML-Enabled Database Systems پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
مورد کاربرد: مستندات • مديريت مستندات • جستجوي مستندات • بازيابي اطلاعات • استفاده مجدد از محتوا • مستندات • مثال : مستندات محصولات، کاتالوگ ها، صفحات وب ايستا، ارائهها، تبليغات، کتاب ها، ژورنال ها و مقالات منبع : Bourret 2002 پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
چرا پايگاه داده ويژه XML ؟ • ساختار بيش از حد نامنظم براي مدل رابطه اي • اطلاعات فيزيکي حائز اهميت اند. • نياز به پرس و جوي document-centric • کتاب هايي که در فصل اول خود از کلمه xml استفاده نموده اند: • سرفصل فصل هايي که شکل دارند: • حفظ ماهيت مستند منبع : Bourret 2002 پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
مورد کاربرد: يکپارچگي داده ها • مثل : داده هاي کسب و کار، تحليل سفارشات، توليد خبر، داده هاي مالي، اطلاعات پزشکي • معماري پرس و جو • معماري پرس و جوي محلي • معماري پرس و جوي توزيع شده • اداره نمودن شماهاي متفاوت منبع : Bourret 2002 پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
چرا پايگاه داده ويژه XML ؟ • مدل داده اي انعطاف پذير • پشتيباني انواع مدل هاي داده اي رابطه اي، شي گرا، سلسله مراتبي و ... • اداره نمودن داده هايي که شماي آنها هنگام طراحي نامعلوم است. • اداره نمودن داده هايي که شماي آنها دائماً در حال تغيير است. • XQuery : زبان مناسب يکپارچگي داده ها منبع : Bourret 2002 پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
مورد کاربرد: داده هاي نيمه ساخت يافته • فيلدهايي که در زمان طراحي شناخته نشده اند. • داده ها خود-تعريف هستند. • يک داده به طرق مختلفي نمايش داده شده • مثل: آدرس • داده هاي کم پشت • مثل: داده هاي يکپارچه شده، داده هاي زيستي، متاداده، شماهاي تکامل يافته منبع : XML Data Management: Native XML and XML-Enabled Database Systems منبع : Bourret 2002 پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
چرا پايگاه داده ويژه XML ؟ • لزوماً نياز به شما ندارند • خود تعريف هستند. • نمايش کاراي داده هاي کم پشت • تمام فيلدها شاخص بندي مي شوند ( حتي آنهايي که زمان طراحي مشخص نيستند) • پشتيباني زبان پرس و جوي xml • پشتيباني جستجوي تمام متن xml-aware • پشتيباني به روز رساني مبتني بر گره منبع : Bourret 2002 پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
اهميت درستي داده هاي پزشکي پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
مورد کاربرد: تکامل تدريجي شِما • شماها مي توانند بدوننياز به نقل وانتقال داده تغيير يابند • اداره کردن تغييرات شما حتي زماني که هيچ مسيري براي انتقال داده وجود ندارد. • داده حتي اگر به هيچ شماي خاصي متعلق نباشد هم قابل ذخيره سازي است. • بدين معنا که داده هرگزگم نمي شود منبع : Bourret 2002 پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
مورد کاربرد: قالب طبيعي XML است • تنها قالب xml است • XSLT stylesheets • داده موقتاً به صورت xml ذخيره مي شود. • تراکنش هاي طولاني مدت • يکپارچه سازي برنامه هاي کاربردي سازمان • مستندات واقع در صف پيغام • مستندات فاقدشِما • شِما نداشته يا ناشناخته است. منبع : Bourret 2002 پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
چرا پايگاه داده ويژه XML ؟ • دليلي براي استفاده از پايگاه داده xml-enabled نيست • قالب طبيعي فايل xml است • نگاشت مستندات زمان اجرا بسيار زمان گير و پرخطاست منبع : Bourret 2002 پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
ساير موارد کاربرد • اداره کردن مستندات حجيم • بايگاني مستندات • داده هاي سلسله مراتبي • صفحات وب • پنهان سازي داده ها در لايه هاي مياني • برخي NXD ها آن را پشتيباني کرده: • مثلاً براي يکپارچه سازي داده ها • براي بالابردن کارايي و مديريت داده ها با قالب يکسان (xml ) منبع : Bourret 2002 پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
معايب پايگاه داده ويژه XML • محصولات جا نيفتاده اند • بسياري از استانداردها هنوز در حال توسعه است • تکنيک ها براي مردم ناآشناست • نامناسب براي پردازش تراکنش ها • پشتيباني ابزاريحداقل • برخي ويژگي هاي اساسي پايگاه داده هنوز پشتيباني نمي شوند • توانايي هم عملياتي ميان آنها بسيار کم است منبع : Bourret 2001b XML Data Management: Native XML and XML-Enabled Database Systems پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com
منابع • Akmal B. Chaudhri, et al, "XML Data Management: Native XML and XML-Enabled Database Systems", Addison Wesley,1st Edition,2003. • Ronald Bourret, "XML and Databases", www.rpbourret.com/xml/XMLAndDatabases.htm, Spring 2005. • Bourret 2001a) Bourret, R. P. 2001. "XML Database Products," http://www.rpbourret.com/xml/XMLDatabaseProds.htm. • (Bourret 2002) Bourret, R. P. 2002. "XML and Databases", http://www.rpbourret.com/xml/XMLAndDatabases.htm. • (Bourret 2005) Going native: Use cases for native XML databases, http://www.rpbourret.com/xml/UseCases.htm. • Language," W3C Working Draft”, http://www.w3.org پوپول مرجع دانشگاه ومدرسه WWW.pupuol.com