280 likes | 508 Views
پا ي گاه داده چند رسانه ا ي. استاد : جناب آقا ي دکتر رهگذر تهيه کننده : ي وحنا قد ي م ي - علی عباسی - کاوه پاشاي ي. رئوس مطالب. مقدمه مد ي ر ي ت اطلاعات مالت ي مد ي ا در پا ي گاه داده:
E N D
پايگاه داده چند رسانه اي استاد : جناب آقاي دکتر رهگذر تهيه کننده : يوحنا قديمي - علی عباسی- کاوه پاشايي
رئوس مطالب • مقدمه • مديريت اطلاعات مالتيمديا در پايگاه داده: • نکات مورد توجه براي ذخيره سازي داده ها • معماري سيستم • Continuous-Media Data • ماهيت دادههاي مالتيمديا • فرمت دادههاي مالتيمديا • پردازش Queryها
مقدمه • استفاده از متن براي نگهداري داده ها • دادههاي مالتيمديا • به مجوعه متن، گرافيک و صدا براي نمايش اطلاعات • هدف :ايجاد يک چهارچوب کلي براي درخواست، جمع آوري و ذخيره دادههايي مانند صوت و تصوير و عکس
مديريت اطلاعات مالتيمديا در پايگاه داده: • عکس و ويژگيهاي آن : به صورت مجموعهاي از تاپلها • ذخيره در پايگاه داده رابطهاي • مشکلات: • فهرستسازي • بهينه سازي Query • مديريت بافرها • کنترل همزماني • مسائل امنيتي • ترميم دادهها
مديريت اطلاعات مالتيمديا در پايگاه داده: • تبدیل دادههاي مالتيمديا به صورت رابطه • نوع خاصي از Queryها و اعمال را به صورت کارآمد • Queryهايي مانند "تمام تصاويري را بيابيد که در آنها شخصي در حال مطالعه است"
مديريت اطلاعات مالتيمديا در پايگاه داده: • ذخیره داده ها به صورت فايل • ذخیره اطلاعات مربوط به آنها در پایگاه داده • حجم داده • مشخصات ايجادکننده آن • نوع داده • مکان دادهها در روي ديسک • مزيت • حجم کمتر در پايگاه
مشکلات • از دست دادن امکانات پایگاه داده • مشکلات عدم فهرست سازی • ممکن است در حالي که مشخصات يک داده در داخل پايگاه وجود داشته باشد خود آن داده چون در بيرون از پايگاه ذخيره شده پاک شود و DBMS نمي تواند کنترلي روي اين موارد داشته باشد.
نکات مورد توجه براي ذخيره سازي داده ها • پايگاه دادهاي بايد انتخاب شود که بتواند Large object ها را پشتيباني کند زيرا دادههاي مالتيمديا حجم زيادي را اشغال ميکنند. • روشها: • قسمتبندي داده ها وذخیره جداگانه هر قسمت • ذخیره داده ها در خارج از پایگاه داده • اشاره گر به فایل حاوی اطلاعات در داخل پایگاه داده • استاندارد SQL/MED با دادههاي خارجي به گونهاي رفتار ميکند که گويي جزئي از پايگاه داده هستند
نکات مورد توجه براي ذخيره سازي داده ها • بازيابي دادهها از نوع audio و videoبا سرعت يکنواخت • Continuous-media-data • بازيابي دادههاي مشابه: منظور از اين اصطلاح اين است که در اين گونه پايگاه دادهها ما احتياج داريم که دادههايي که مشابه يک نوع خاص هستند را استخراج کنيم ممکن است دادههايي که استخراج ميشود کاملاً مشابه مورد درخواست شده نباشد اما به هر حال پايگاه داده بايد بتواند آنها را تشخيص داده و استخراج کند
بازيابي داده ها • بازيابي ديتاها در سيکلهاي زماني مشخص • بازيابي و نگهداري ميزان مشخصي از داده براي هر کاربر در هر سيکل در بافر حافظه • ارسال ديتاهاي ذخيره شده در بافرها براي کاربران در سيکل بعد • دوره کوتاه:حرکت بيشتر هد ديسک، اتلاف منابع • دروه زماني بزرگتر: حافظه بيشتر، زمان پاسخ اوليه طولاني، کاهشتعداد حرکات هد ديسک
معماري سيستم • ديتاهاي مالتيمديا روي چندين ديسک ذخيره ميشوند معمولا در سيستمهايي که حجم دادههاي آنها بسيار بالا است ممکن است از حافظه سومي براي ذخيره دادههايي که دفعات کمتري درخواست ميشوند استفاده کند. • افراد دادههاي مالتيمديا را با استفاده از وسائل مختلفي مشاهد مي کنند که به مجموعه آنها ترمينال گفته ميشود. • انتقال ديتاهاي مالتيمديا از يک سرور به چندين ترمينال احتياج به يک شبکه با ظرفيت بالا دارد.
انواع داده ها ذخيره شده در پايگاه داده • ديتاهاي مصور: • يک کاربر ممکن است تفاوت دو عکس شبيه به هم را نتواند به راحتي تشخيص دهد. به عنوان مثال در يک پايگاه داده که علائم تجاري ذخيره ميشود زماني که ما بخواهيم يک علامت تجاري جديد را در پايگاه ثبت کنيم. بايد سيستم بتواند تمام علائم تجاري مشابه با آن را که قبلاً ثبت شده است استخراج کند تا کاربر بتواند آنها را با هم مقايسه کند.
انواع داده ها ذخيره شده در پايگاه داده • ديتاهاي صوتي: • امروزه فرمان دادن به کامپيوتر به طور گستردهاي مورد توجه قرار گرفته است. در اين روش کاربر با صحبت کردن با سيستم فرامين لازم را به سيستم ميگويد و سيستم بايد دادههاي صوتي ورودي را دريافت و با دستورات مشابهي که در پايگاه داده ذخيره شده مقايسه کند و نوع دستور را تشخيص و دستورات صادره را اجرا کند. • دادههاي دستنويس شده: • ورودي سيستم ممکن است به صورت دستنويس باشد که اين ورودي ممکن است براي مقايسه با ساير دادههاي ذخيره شده به سيستم داده شود و يا به عنوان يک دستور به سيستم. به هر حال سيستم بايد بتواند اين نوع دادهها را تشخيص دهد که در اينجا باز هم مساله تست تشابه پيش ميآيد
Continuous-Media Data • دادههاي صوتي و تصويري: • سرعت بازيابي اين نوع دادهها بايد به اندازه کافي سريع باشد به گونهاي که بين قسمتهاي متوالي فاصلهاي ايجاد نشود. • سرعت بازيابي بايد آنقدر سريع نباشد که بافري که براي آن در نظر گرفته شده سرريز کند و در نتيجه دادهها از دست برود • سرعت بازيابي صوت و تصوير بايد هماهنگ باشد. زيرا اگر به عنوان مثال و صدا وتصوير يک فيلم را در پايگاه جداگانه ذخيره کنيم اگر اين هماهنگي در زمان بازيابي رعايت نشود صدا و تصوير پخش شده هماهنگ نخواهد بود
ماهيت دادههاي مالتيمديا: • متفاوت از دادههاي متني استاندارد • نحوه نمايش، مفاهيم • حجم زياد • وابسته به زمان • احتياج به پردازش زياد
مدل کردن دادههاي مالتيمديا: • اطلاعاتي مورد نيازدر مدلسازي دادههاي مالتيمديا : • جزئيات ساختار اشياء مختلف. • عملگرهايي که با توجه به ساختار هر شيئ براي آن شيئ تعريف ميشود. • ويژگيهاي هر کدام از اشياء. • ارتباط بين اشياء مالتيمديا و اشياء موجود در جهان واقعي. • بخشهاي مختلف اشياء مالتيمديا با نمايش ارتباط آنها با اشياء موجود در جهان واقعي و روشهايي که براي انجام اين کار وجود دارد. • ويژگيها، روابط و عملگرهاي موجود در مورد اشياء واقعي.
مدل کردن دادههاي مالتيمديا: • مدل کردن داده های مالتی مدیا: • استاندارد MPEG-7 • تفسير محتواي دادههاي مالتيمديا • استاندارد MPEG-4 • تجزيه و تحليل ساختيافته اشياء مالتيمديا
فرمت دادههاي مالتيمديا: • عکسها فرمت JPEG • فيلمها: ذخيره سازي هر فريم با فرمت JPEG • تشابه زياد فريم هاي متوالي • فيلم و صدا : فرمت MPEG : فشرده سازی به دلیل تشابه زیاد • کاهش سايز فيلمها با استفاده از فرمت • MPEG-1 مانند کيفيت VHS
پردازش Queryها: • Query ممکن است حاوييک داده مالتيمديا باشد که توسط کاربر به عنوان ورودي به آن داده شده است. • خروجي نيز ممکن است کاملاً شبيه چيزي نباشد که کاربر به عنوان ورودي درخواست کرده است بلکه يک حدي از تشابه را که دارا باشد کافي است.
پردازش Queryها: • اگر کاربر با کليک کردن روييک semcon مثلا s تقاضاي جستجوي پايگاه را براييافتن آن شيئ داشته باشد آنگاه سيستم ابتدا صفات اين شيئ را بررسي کرده، سعي در يافتن اشيائي ميکند که اين صفات را داشته باشند. همچنين اشياء ديگري را که شامل semconي شبيه s هستند و نيز اشيائي را که با آنها در ارتباط هستند جستجو ميکند
پردازش Queryها: • خروجيQueryهايي که در پايگاه دادههاي متعارف به کار ميرود مجموعه اطلاعاتي است که صددرصد منطبق با ورودي هستند. اما در پايگاه دادههاي مالتيمديا وضع فرق ميکند • مثال: • تمام عکسهايي را بيابيد که علي در آن حضور دارد( عکس علي به عنوان ورودي داده ميشود ) • عکس تمام محکوميني که شبيه اين( ورودي) هستند را بيابيد
پردازش Queryها: • براي نشان داده ميزان تشابه دو شيئ به هم از اعداد حقيقي بين صفر تا يک استفاده ميکنيم: • صفر نشان دهند تفاوت کامل دو شيئ • يک نشان دهنده تشابه کامل اين دو شيئ است • از نظر تئوري براي پاسخ به دو Query گفته شده در اسلاید قبل بايد تمام اشياء موجود در پايگاه را از نظر تشابه با عکس درخواستي طبقهبندي کرد و آنها را نمايش داد
پردازش Queryها: • انتخاب حد آستانه براي تشابه: • اگر براييک شيئ عدد بدست آمده ا زحد آستانه کمتر بود آن شيئ بازيابي نميشود. • با فيلتر کردن اشياء که ميزان تشابه آنها کمتر از حد آستانه است آنها را حذف ميکنيم. سپس اشياء باقيمانده را به ترتيب ميزان تشابه آنها به عنوان خروجي باز ميگردانيم.
پردازش Queryها: • استفاده از فهرستسازي براي تسريع عمل تعيين ميزان تشابه • در نظر گرفتن تعداد دلخواه مثلاً n از ويژگيهاي اشياء و نمايش به عنوان يک نقطه در فضايn بعدي • يک روش که بتواند نزديکترين نقطهاي را که داراي ويژگيهاي خاصي است پيدا کند را ميتوان به عنوان راهحلي براي ساختن فهرست در نظر گرفت که ميتواند تست تشابه را نيز به خوبي انجام دهد. • اين n ويژگي ممکن است مستقل از هم باشند و يا از يک ويژگي سراسري مرکب مشتق شده باشند.
پايگاه دادههاي تجاري که دادههاي مالتي مديا را پشتيباني ميکنند: • CA-Jasmine • DB2 Universal Database • ODB II • Oracle • Sybase • UniSQL
منابع و مراجع: • [1] Horea Todoran, “Smelling Objects for Multimedia Database Application” departemant of management of european instituation,babes-bolyai university,studies in informatics and control Vol. 14, No.4, December 2005 • [2] Daniel Pletinckx, Neil Silberman, Drik Callebaut, “Heritage presentation through interactive storytelling: a new multimedia database approach”The Journal of Visualization and Computer Animation Volume 14, Issue 4, Date: September 2003, Pages: 225-231 • [3] Harald Kosch, “Distributed Multimedia Database Technologies supported by MPEG-7 und MPEG-21” , CRC Press. 248 pages. November 2003. ISBN: 0-849-31854-8.[4] Arjen P. de Vries, “Content independence in multimedia databases”Journal of the American Society for Information Science and Technology Volume 52, Issue 11, Date: 2001, Pages: 954-960 • [5] Ulrich Marder, “VirtualMedia: Making Multimedia Database Systems Fit for World-wide Access” , University of Kaiserslautern Dept. of Computer Science ,2001 • [6] Grosky, “W. ManagingMultimedia Information in Database Systems”. COMMUNICATIONS OF THE ACM. December 1997.