1 / 20

HadoopDB : یک معماری ترکیبی از MapReduce و DBMS

HadoopDB : یک معماری ترکیبی از MapReduce و DBMS. ارائه نهایی درس پایگاه داده پیشرفته استاد درس: دکتر مسعود رهگذر ارائه دهنده: علیرضا انگبینی. منبع اصلی.

Download Presentation

HadoopDB : یک معماری ترکیبی از MapReduce و DBMS

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. HadoopDB: یک معماری ترکیبی از MapReduce و DBMS ارائه نهایی درس پایگاه داده پیشرفته استاد درس: دکتر مسعود رهگذر ارائه دهنده: علیرضا انگبینی

  2. منبع اصلی • A. Abouzeid, A. Silberschatz, and A. Rasin, "Hadoopdb: An architectural hybrid of mapreduce and dbms technologies for analytical workloads," VLDB'09, 2009, pp. 1084--1095.

  3. فهرست • مقدمه • MapReduce • Parallel Databases • معماری HadoopDB • نتایج اجرا • نتیجه گیری

  4. مقدمه • انفجار حجم داده ها • اتوماسیون در فرایندهای کسب وکار • افزایش تجهیزات دیجیتال • مثال- eBay 6.5 PB Yahoo 10+ PB • افزایش نیاز به تحلیل داده های خام برای کاربردهای مختلف

  5. مقدمه • مسئله: چگونگی انجام عملیات محاسباتی و تحلیلی بر روی حجم عظیمی از داده ها که بین هزاران گره توزیع شده اند. • رویکردها • MapReduce • Parallel Databases • هدف تحقیق: طراحی معماری سیستمی که از بهترین ویژگیهای دو رویکرد استفاده کند: • استفاده از مکانیزم های پایگاه داده های موازی برای کارایی و بهره وری • بهره گیری از ویژگیهای سیستم های مبتنی بر MapReduce برای مقیاس پذیری، تحمل خطا و انعطاف پذیری

  6. MapReduce • یک مدل برنامه نویسی برای حل مسائل محاسباتی در مقیاس وسیع و به صورت توزیعی • ارائه شده در سال 2003 توسط گوگل • پیاده سازی شده به زبان‌های مختلف • شامل دوتابع اصلی: • تابع Map: پردازش یک زوج (key,value) و تولید مجوعه ای از زوج های میانی • تابع Reduce: ادغام تمام value های میانی با key یکسان

  7. MapReduce(ادامه) • مثال: یافتن تعداد تکرار یک کلمه در یک متن (صفحه وب) • تابع Map: • Key: آدرس صفحه وب • Value: محتویات صفحه • خروجی: لیستی از زوج مرتب ها (تعداد رخداد,کلمه)

  8. MapReduce(ادامه) • تابع Reduce: • جمع مقادیر زوج‌ها با کلید مشترک • خروجی نهایی:

  9. مقایسه MapReduce و Parallel Databases

  10. مقایسه MapReduce و Parallel Databases

  11. HadoopDB • ایده اصلی: • استفاده از MapReduce به عنوان لایه ارتباطی و هماهنگ کننده فعالیت ها بین چندین گره (Hadoop) • گره ها از یک DBMS عادی استفاده می کنند (PostgreSQl)

  12. معماری HadoopDB

  13. معماری HadoopDB

  14. نتایج اجرا • از نظر • کارایی (Performance) • مقیاس پذیری (Scalability) • مقایسه HadoopDB با: • MapReduce (Hadoop) • Parallel Databases (Vertica , DBMS-X) • اجرا بر روی بستر آمازون EC2 با 10، 50 و 100 گره

  15. کارایی • Select Task • Full table scan • Random data: بدون index SELECT * FROM Data WHERE field LIKE ‘%XYZ%’

  16. کارایی (ادامه) • Join Task SELECT sourceIP, AVG(pageRank), SUM(adRevenue) FROM rankings, uservisits WHERE pageURL=destURL AND visitDate BETWEEN 2000-1-15 AND 2000-1-22 GROUP BY sourceIP ORDER BY SUM(adRevenue) DESC LIMIT 1;

  17. مقیاس پذیری • اجرا بر روی 10 گره • برای تحمل خطا: از بین بردن یک گره در وسط آزمایش • برای ناهمگنی: کاهش سرعت یک گره در کل مدت آزمایش

  18. نتیجه گیری • ترکیبی از معماری DBMS و MapReduce • مقیاس پذیری بالاتر نسبت به parallel databases • توانایی تحمل خطا مانند Hadoop • کارایی در حد parallel databases • هزینه: رایگان و متن باز

  19. منابع • [1] A. Abouzeid, A. Silberschatz, and A. Rasin, "Hadoopdb: An architectural hybrid of mapreduce and dbms technologies for analytical workloads," VLDB'09, 2009, pp. 1084--1095. • [2] J. Dean and S. Ghemawat, "MapReduce: Simplified data processing on large clusters," OSDI, 2004. • [3] K. Heafield, "Introduction To Hadoop," Google Inc, 2008.

  20. پایان با تشکر

More Related