230 likes | 328 Views
7/5/2004 The Effect of Metadata in Discovering Web Resources تأثير ما وراء البيانات على الوصول إلى مصادر المعلومات المتاحه على الشبكة العنكبوتية د.خالد عبد الفتاح محمد كلية الأداب – جامعة المنيا. موضوع الدراسة.
E N D
7/5/2004The Effect of Metadata in Discovering Web Resources تأثير ما وراء البيانات على الوصول إلى مصادر المعلومات المتاحه على الشبكة العنكبوتية د.خالد عبد الفتاح محمدكلية الأداب – جامعة المنيا
موضوع الدراسة إلى أى مدى يِِؤثر استخدام ما وراء البيانات على الوصول إلى مصادر الويب وذلك من خلال الإجابة على ثلاث تساؤلات رئيسية: • ما هى أنواع ما وراء البيانات المستخدمة فى وصف مصادر الويب؟ • إلى أى مدى يؤثر استخدام ما وراء البيانات فى صفحات الويب حيث يؤدى إلى تكشيفها من خلال أكثر من محرك بحث؟
تابع التساؤلات • هل يؤثر استخدام ما وراء البيانات على ترتيب صفحات الويب المسترجعة من خلال محركات البحث العالمية؟
لماذا ما وراء البيانات؟ لأنها أحد الأدوات الأساسية لوصف مصادر الويب حيث يرى البعض أنها أحد الحلول الأساسية لفهرسة وتكشيف مصادر الويب. كما أن العديد من المحركات العالمية تعلن أنها تعطى أولوية للصفحات التى تتضمن ما وراء بيانات عند تكشيف صفحات الويب .
الدراسات السابقة • توجد العديد من الدراسات التى تناولت موضوع ما وراء البيانات. وقد ركزت هذه الدراسات بصفة عامة على: • تحليل معدلات استخدامها فى وصف صفحات الويب مثال (Carven, 2000) جمع عينة عشوائية مكونة من 628 صفحة لأختبار استخدام ميتا تاج.
تابع الدراسات السابقة • أنواع ما وراء البيانات المستخدمة فى وصف الصفحات وأنواع الحقول المستخدمة فى عملية الوصف. مثال: قامت جماعة الاهتمام بدبلن المحورى بإعداد استبيان وإرساله إلى 29 مكتبة فى 9 دول مختلفة للسؤال عن مدى استخدام معيار دبلن المحورى فى وصف المصادر الإلكترونية فى تلك المكتبات وعدد وأسماء الحقول التى يغلب استخدامها
تابع الدراسات السابقة • إلى أى مدى تؤثر ما وراء البيانات على الترتيب فى محركات البحث. مثال: • (Henshaw, 2001) أختبرت مدى تاثير الميتا تاج على استرجاعية مقالات من مجلة First Monday فى سبع محركات بحث عالمية ومدى تأثير إضافة الميتا- تاج على ترتيب الصفحات.
تابع الدراسات السابقة • سهولة وإمكانية الاستخدام. مثال: قام (Swetland et al., 2000) بدراسة قدرة طلبة من الصف الرابع والخامس على وصف صفحات الويب التى قاموا بإعدادها لأنفسهم باستخدام معيار دبلن المحورى.
منهج الدراسة • المنهج الوصفى التحليلى • المنهج التجريبى
الخطوات • اختيار الاستفسارات (GLIS, DC, TEI, RDF, CIMI) • اختيار المحركات (AltaVista, HotBot, Infoseek) • البحث والأسترجاع • التحليل والتجريب
التحليل والتجريب • وتم تقسيم عملية التحليل والتجريب إلى مرحلتين أساسيتين: • المرحلة الأولى:التحليل وتم فى هذه المرحلة تحليل نتائج الاسترجاع للتعرف على معدلات استخدام ما وراء البيانات وأنواع الحقول المستخدمة فى وصف صفحات الويب، هذا إلى جانب تكشيف تلك الصفحات من جانب أكثر من محرك بحث.
تابع التحليل والتجريب • المرحلة الثانية التجريب • فصل الصفحات التى لا تحتوى ما وراء بيانات. • إعداد نسختين من كل صفحة تتضمن ما وراء بيانات ( أربعة حقول أساسية). • تحويل وتسجيل الملفات FTP and SE Registration • إعادة عملية البحث والاسترجاع. • مقارنة الترتيب النهائى للنسخ المختلفة.
نتائج الدراسة • التداخل والتكرار
أوضحت الدراسة أن علاقة الأرتباط (Correlation = .38)بين ترتيب الصفحات المكررة فى المحركات الثلاثة هى علاقة ضعيفة مما يعنى أن محركات البحث متفقة على ترتيب الصفحات المكررة فى المناطق الثلاثة المحددة.
استخدام ما وراء البيانات فى المكررات
تأثير ما وراء البيانات على محركات البحث
Mean St. Dev. 8.2381 2.58029 3.0526 3.76702 متوسط عدد الحقول المستخدمة
Minimum Rank Maximum Rank Mean Original Document 1 14 5.95 With Dublin Core 1 10 5.28 With Meta-Tags 1 10 5.024 Ave_wth_metadata 1 41 5.1547 متوسط ترتيب النسخ المختلفة