220 likes | 493 Views
ارائه مدلي براي يكپارچهسازي داده بر اساس RDF. امينه اميني هادي صبوحي دكتر ناصر نعمتبخش. يكپارچهسازي داده. يكي از مهمترين مشكلات در پايگاهدادههاي توزيع شده مشكل تركيب دادهها منابع مختلف و تامين يك ديد يكپارچه انتخاب زبان مناسب براي تعريف منابع مختلف
E N D
ارائه مدلي براي يكپارچهسازي داده بر اساس RDF امينه اميني هادي صبوحي دكتر ناصر نعمتبخش
يكپارچهسازي داده • يكي از مهمترين مشكلات در پايگاهدادههاي توزيع شده • مشكل تركيب دادهها منابع مختلف و تامين يك ديد يكپارچه • انتخاب زبان مناسب براي تعريف منابع مختلف • مشكل پرسوجو بر روي اين ديد يكپارچه • انتخاب متد مناسب براي پرسوجو براي اين ديد يكپارچه NEEC 2008
چارچوبي براي يكپارچهسازي داده • امكان تعريف شماي يكپارچه براي دادههاي ناهمگن • تعريف داده به صورت معنيدار • امكان پرسوجو بر روي شماي يكپارچهشده • استفاده از روشهاي پرسوجو بر روي داده معنيدار NEEC 2008
وب معنايي • هدف اصلي وب معنايي • توليد مكانيزمي براي نمايش اطلاعات به گونهاي كه براي ماشينها قابل درك باشد • عوامل غير انساني بتوانند در تجزيه تحليل اطلاعات به انسانها كمك كنند • مجموعهاي از زبانها و ابزارهايي براي پردازش ماشيني اطلاعات را فراهم ميكند NEEC 2008
RDF • Resource Description Framework • زباني براي ايجاد مدل دادهاي براي منابع و روابط آنها • اين مدل سهتايي نيز گفته ميشود • سهتايي شامل<Subject, Predicate, Object> NEEC 2008
RDF • فاعل بعنوان منبع • مسند براي ويژگي يا خصوصيت • مفعول يك منبع يا مقدار ثابت • هر كدام URI منحصر به فرد دارد • عبارت RDF از سه بخش منبع، خصوصيت ومقدار • مدل RDF شامل عبارات RDF NEEC 2008
RDF • مثال : ”صفحه ايندكس در تاريخ 5 مارس 2008 ايجاد شده است“ • منبع :صفحه ويژگي:تاريخ ايجاد شدن مقدار: 5 مارس 2008 • اين عبارت به صورت گراف زير نشان داده ميشود http://www.example.org/index.html http://www.example.org/terms/creation-date 5 مارس 2008 NEEC 2008
RDQL • روش پرسوجو مشابه SQL • انجام پرسوجو بر روي سهتاييها SELECT ?FirstName WHERE (?x <http://somewhere/Student#LastName> “كريمي”), (?x <http://somewhere/Student#FirstName> ?FirstName), (?x <http://somewhere/Student#Age> ?Age) AND ?Age > 20 http://somewhere/Student/AliKarimi منبع http://somewhere/Student#FirstName http://somewhere/Student#Age خصوصيت http://somewhere/Student#LastName 25 علي كريمي مقدار NEEC 2008
پايگاه داده n پايگاه داده 1 ميان افزار سيستم نرم افزاري چارچوب كلي مدل پيشنهادي ميانافزار با امكانات زير: توليد شماي همگن نمايش شماي همگن ايجاد ارتباط بين لايه مياني و كاربردي پاسخگويي به پرسوجوها مدل پيشنهادي لايه فيزيكي لايه مياني لايه كاربردي NEEC 2008
بررسي مدل از دو ديد • ديد منابع: دراين ديد فرض شده، تعدادي منبع غير همگن داريم و چگونگي تشكيل شماي همگن را بررسي ميكنيم. • ديد پرسوجو: در اين ديد فرض شده،«شماي همگن شده» تشكيل شده است و چگونگي پرسوجو بر روي «شماي همگن شده»را بررسي ميكنيم. مدل پيشنهادي NEEC 2008
مدير پايگاه داده پايگاه دادهn پايگاهداده1 فايل توصيفكننده پوشاننده n پوشاننده 1 ميان افزار توليدكننده شماي همگنشده استخراجكننده داده شماي همگنشده پردازشگر پرسوجو رابط و پارسر پرسوجو نمايش دهنده شماي همگنشده SOAP Response SOAP Request سيستم نرم افزاري جديد برنامه نويسي مدل پيشنهادي مدل پيشنهادي KB RDQL SOAP SOAP NEEC 2008
فايل توصيفكننده شماي يكپارچه <definition> <schema> <table name=“Student"> <Field name="ID" database="db1" table="st"/> <Field name="FN" database="db1" table="st"/> <Field name=“Debt" database="db2" table=“Py"/> </table> </schema> <relation> <equal> <field1 name="ID" database="db1" table="st"/> <field2 name="SID" database="db2" table=“Py"/> </equal> </relation> </definition> مدل پيشنهادي NEEC 2008
نمايشدهنده شماي يكپارچه • ارايه به يكي از روشهاي • نمودار نهاد-رابطه • ساختار ساده جداول • ... مدل پيشنهادي NEEC 2008
ايجاد پرسوجو • تعيين پرسوجو به زباني شامل زيرمجموعهاي از دستورات SQL • تبديل به پيام درخواست SOAP • ارسال به ميانافزار مدل پيشنهادي NEEC 2008
رابط و پارسر پرسوجو • دريافت پيام SOAP • تبديل SQL موجود در پيام به RDQL • دريافت اطلاعات URIهاي خصوصيات مدل RDF • ارسال RDQL به پردازشگر پرسوجو • دريافت پاسخ از پردازشگر پرسوجو و ارسال به سيستم نرمافزاري مدل پيشنهادي NEEC 2008
پردازشگر پرسوجو • دريافت پرسوجو RDQL • درخواست پايگاه دانش از استخراج كننده داده • دريافت پايگاه دانش از استخراجكننده داده • اجراي پرسوجو بر روي پايگاه دانش و توليد پاسخها • ارسال پاسخ به رابط و پارسر پرسوجو مدل پيشنهادي NEEC 2008
استخراجكننده داده • دريافت شماي يكپارچه • دريافت ساختار و دادههاي منابع از پوشانندهها • يكپارچهسازي اطلاعات • ايجاد پايگاهدانش براي پردازشگر پرسوجو • ارسال پايگاه دانش براي پردازشگر پرسوجو NEEC 2008
الگوريتم يكپارچهسازي، فرضيات فرضيات الگوريتم: • تعداد منابع موجود، برابر n است (n>=2) • ساختار XML منابع • فايل توصيف كننده شماي كلي كه حاوي ساختار جداول مورد نياز و ارتباطات مورد نياز بين جداول مختلف در تمامي منابع هدف الگوريتم: ايجاد پايگاه دانش مدل پيشنهادي NEEC 2008
الگوريتم يكپارچهسازي، نحوه اجرا table1 table2 <row> <id>5</id> <name>Ali</name> </row> <row> <code>1</code> <debt>10</debt> </row> <row> <code>5</code> <debt>20</debt> </row> توصيفكننده <table name=“new”> <field name=“name” table=“1”/> <field name=“debt” table=“2”/> </table> <relation> <equal> <field1 name=“id” table=“1”/> <field2 name=“code” table=“2”/> </equal> </relation> <table name=“new”> </table> <row> </row> <name>Ali</name> <debt>20</debt> NEEC 2008
با تشكر NEEC 2008