1 / 40

به نام یگانه هستی بخش

به نام یگانه هستی بخش. OLAP. www.itsweetworld.blogfa.com. پیاده سازی داده ها. در سازمانها داده ها و اطلاعات معمولا به دوشکل در سیستم ها پیاده سازی می شوند: (OLTP) 1)سیستم های عملیاتی (OLAP,DW/BI,DSS) 2)سیستم های اطلاعاتی. مقایسه سیستم های عملیاتی و اطلاعاتی.

miette
Download Presentation

به نام یگانه هستی بخش

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. به نام یگانه هستی بخش

  2. OLAP www.itsweetworld.blogfa.com

  3. پیاده سازی داده ها در سازمانها داده ها و اطلاعات معمولا به دوشکل در سیستم ها پیاده سازی می شوند: (OLTP)1)سیستم های عملیاتی (OLAP,DW/BI,DSS)2)سیستم های اطلاعاتی

  4. مقایسه سیستم های عملیاتی و اطلاعاتی

  5. مقایسه سیستم های عملیاتی و اطلاعاتی

  6. مقایسه سیستم های عملیاتی و اطلاعاتی

  7. مقایسه سیستم های عملیاتی و اطلاعاتی

  8. مقایسه سیستم های عملیاتی و اطلاعاتی

  9. OLAP چیست؟ • تکنولوژيOLAP پاسخي جديد به مشكلات سيستم‌هاي حمايت از تصميم‌گيري، است. تکنولوژي OLAP ابزارها و مفاهيمي را ارائه مي‌کند که به وسيله آن‌ها امکان انجام يک تحليل موثر و دلخواه بر روي هر نوع داده‌اي فراهم مي‌گردد.OLAP يک تکنيک ساده نيست بلكه مجموعه‌اي از مفاهيمي از قبيل سازمان پايگاه داده، نمايش داده و مدل کردن کواِري است. • تکنولوژيOLAP نامي است که به طيف گسترده‌اي از تکنيک‌ها اطلاق مي‌شود. اين تکنيک‌ها شامل روشهايي براي مرتب کردن، پرس و جو کردن و تحليل کردن داده‌ها است. همچنين شامل قالب‌‌هاي گزارش‌گيري و رابط کاربر هم هستند.

  10. OLAP و DATAMINING • OLAP و Data Mining مکمل یکدیگر می‌‌باشند. به طور مثالOLAP قادر است تا نقطه بُروز مشکلات، در حوزه خاصی را نمایش دهد، و Data Mining قادر است تا با نگاهی عمیق‌تر به داده‌‌های آن حوزه، رفتار مولفه‌‌های موثر در آن را تحلیل و مدل‌‌سازی نماید. •    در OLAP از مدل به داده و در Data Mining از داده به مدل خواهید رسید.•    در OLAP از سوال به جواب و در داده کاوی از جواب به سوال خواهید رسید.

  11. خصوصيات قابل ارزيابي OLAP • تحليل: منظور از تحليل آن است که سيستم بايد بتواند از عهده هر تحليل منطقي و آماري که مورد نياز کاربر باشد، برآيد. تحليل ممکن است شامل تحليل سري‌هاي زماني، تخصيص هزينه، تبديل واحد پول، جستجوي هدف، کواِري‌هاي مخصوص ساختارهاي چند بعدي، مدل کردن غير رويه‌اي، تشخيص استثنا، داده‌کاوي و ساير کاربرد‌ها باشد. انجام همه اين تحليل‌ها بايد براي کاربر نهايي به اندازه کافي ساده باشند.

  12. خصوصيات قابل ارزيابي OLAP • سريع: منظور از سرعت آن است که سيستم بايد بيشتر پاسخ خود را در زمان معقولي به کاربر بازگرداند. تحقيقات اخير نشان داده‌است که اگر کاربر نهايي ظرف 30 ثانيه پاسخي دريافت نکند، تصور مي‌کند که فرايند دچار شکست شده است. رسيدن به اين معيار ( يعني زمان پاسخ کمتر از 30 ثانيه) هنگامي که با حجم زيادي از اطلاعات سروکار داريم کار ساده‌اي نيست. بخصوص وقتي نياز به کواِري‌هاي پيچيده و مستقل داريم. محصولات OLAP چندين راهکار براي رسيدن به اين سرعت ارائه نموده است، که روش‌هايي مثل اختصاصي کردن نوع ذخيره‌سازي داده، شاخص بندي، از پيش محاسبه کردن تجميع‌ها و سخت افزارهاي ويژه از آن دسته روش‌ها هستند.

  13. خصوصيات قابل ارزيابي OLAP • اشتراکي: منظور اين است که سيستم همه نيازمندي‌هاي امنيتي را براي محرمانه ماندن داده‌ها و براي دسترسي‌هاي چندگانه خواندن/نوشتن پياده‌سازي کند. به خصوص محرمانه ماندن معقوله مشكلي است. براي تحليل مناسب پايگاه داده‌هاي مربوط به OLAP بايد شامل هر مقدار داده که ممکن است باشند. براي محدود کردن دسترسي به داده‌هاي محرمانه، بايد يک مراقبت خاص براي دسترسي‌هاي درست و سطوح دسترسي تعريف شود.

  14. خصوصيات قابل ارزيابي OLAP • چند بعدي: يک نياز اساسي OLAP است. سيستم بايد يک شماي مفهومي چند بعدي از داده‌ها را مهيا نمايد، که شامل مفاهيم سلسله مراتبي هم باشد. همچنين بايد قابليت داشتن تعداد دلخواه بعد و سطح تجميع را فراهم کند.

  15. مدل‌هاي داده‌اي رابطه‌اي وچندبعدي • - مدل داده رابطه‌اي بر اساس دو مفهوم اساسي موجوديت و رابطه بنا نهاده شده است. از اين رو آن را با نام مدل ER نيز مي‌شناسند. • موجوديت: نمايانگر همه چيزهايي که در پايگاه داده وجود خارجي دارند يا به تصور در مي‌آيند. پديده‌ها داراي مشخصاتي هستندکه به آن‌ها صفت گفته مي‌شود. • رابطه: پديده‌ها را به هم مي‌پيوندد و چگونگي در ارتباط قرار گرفتن آن‌ها با يکديگر را مشخص مي‌کند.

  16. مدل داده چند‌بعدي • مدل داده چند‌بعدييا MD بر پايه دو ساختار جدولي اصلي بنا نهاده‌شده‌است: • جدول حقايق يا Fact Table • جداول ابعاد‏ يا Dimension Table • اين ساختار امکان داشتن يک نگرش مديريتي و تصميم‌گيري به داده‌هاي موجود در پايگاه داده را تسهيل مي‌کند. • جدول حقايق: قلب حجم‌ داده‌اي ما را تشکيل مي‌دهد و شامل دو سري فيلد است: کليدهاي خارجي به ابعاد و شاخص‌ها. جداول حقايق را مي‌توان به عنوان تابعي از ابعاد بر روي شاخص‌ها تصور کرد.

  17. شاخصها و بعد • شاخص‌ها يا Measure: معيارهايي هستند که بر روي آن‌ها تحليل انجام مي‌گيرد و درون جدول حقايق قرار دارند. شاخص‌ها قبل از شکل‌گيري انبار داده توسط مديران و تحليل‌گران به دقت مشخص مي‌‌شوند. چون در مرحله کار با انبار اطلاعات اساسي هر تحليل بر اساس همين شاخص‌ها شکل مي‌گيرد. شاخص‌‌ها تقريباً هميشه مقادير عددي را شامل مي‌شوند. مثلا براي يک فروشگاه زنجيره‌اي اين شاخص‌ها مي‌توانند واحدهاي فروخته‌شده کالاها و مبلغ فروش به تومان باشند. • بعد يا Dimension: هر موجوديت در اين مدل مي‌تواند با يک بعد تعريف شود. ولي بعدها با موجوديت‌هاي مدل ER متفاوتند زيرا آن‌ها سازمان شاخص‌ها را تعيين مي‌کنند. علاوه بر اين داراي يک ساختار سلسله مراتبي هستند و به طور کلي براي حمايت از سيستم‌هاي تصميم گيري سازمان‌دهي شده‌اند. • اجزاي بعدها member نام دارند و تقريباٌ همه بعدها، memberهاي خود را در يک يا چند سطح سلسله مراتبي سازمان‌دهي مي‌نمايند، که اين سلسله مراتب نمايانگر مسير تجميع و ارتباط بين سطوح پايين‌تر (مثل روز) و سطوح بالاتر (مثل ماه و سال) است. وقتي يک دسته از memberهاي خاص با هم مفهوم جديدي را ايجاد مي‌‌کنند، به آنها يک سطح مي‌گوييم. (مثلاٌ هر سي روز را ماه مي‌‌گوييم. در اين حالت ماه يک سطح است. • مثلاً در فروشگاه زنجيره‌اي بعدهايي از قبيل بعد زمان، فروشگاه، محصول و خريدار رامي‌توانيم داشته باشيم. که بعد زمان داراي سطوحي از قبيل روز، هفته، ماه، فصل و سال است، که memberها را طبقه‌بندي مي‌کنند. بعد فروشگاه هم ممکن است داراي سلسله مراتبي به شکل زير باشد:

  18. حجم‌هاي داده‌اي - • حجم‌هاي داده‌اي يا Cube از ارتباط تعدادي بعد با تعدادي شاخص تعريف مي‌‌شود. ترکيب memberهاي هر بعد از حجم داده‌اي فضاي منطقي را تعريف مي‌کند که در آن مقادير شاخص‌ها ظاهر مي‌‌شوند. هر بخش مجزا که شامل يکي از memberهاي بعد در حجم داده‌اي است ، سلول ناميده‌مي‌شود. سلول‌ها شاخص‌هاي مربوط به تجميع‌هاي مختلف را در خود نگهداري مي‌نمايند. در واقع مقادير مربوط به حقايق که در جدول حقايق تعريف مي‌شوند در حجم داده‌اي در سلول‌ها نمايان مي‌گردند cellمحورهاي حجم داده‌اي، صفت‌هاي موجوديت‌هاي انبار را مشخص مي‌کنند. به بيان ديگر هر محور مشخص کننده يک بعد از انبار است و هر مقدار روي محور يک member از آن بعد را مشخص مي‌نمايد. • حجم داده‌اي بر خلاف آن چه از نام لاتينش استنباط مي‌‌گردد و در نمودارها به نمايش در مي‌آيد، در انبارهاي داده واقعي مي‌تواند بسيار بيشتر از دو بعد داشته باشد

  19. شماهاي داده‌اي • شماي ستاره‌اي يا Star Schema: متداولترين شما، همين شماي‌ستاره‌اي است. که در آن انبار‌داده با استفاده از اجزاي زير تعريف مي‌شود: • يک جدول مرکزي بزرگ به نام جدول حقايق که شامل حجم زيادي از داده‌هاي بدون تکرار است. • مجموعه‌اي از جدول‌هاي کمکي کوچک‌تر به نام‏ جدول بعد ، که به ازاي هر بعد يکي از اين جداول موجود خواهد بود. • شکل اين شما به صورت يک ستاره است که جدول حقايق در مرکز آن قرار گرفته و هر يک از ‏ جداول بعد‏ به وسيله شعاع‌هايي به آن مربوط هستند. • مشكل اين مدل احتمال پيشامد افزونگي در آن است.

  20. شماي دانه‌برفي يا Schema Snowflake Schema • در واقع شماي دانه‌برفي، نوعي از شماي ستاره‌اي است که در آن بعضي از ‏ جداول بعد نرمال شده‌اند. و به همين خاطر داراي تقسيمات بيشتري به شکل جداول اضافي مي‌باشد که از ‏ جداول بعد‏ جدا شده‌اند. • تفاوت اين دو شما در اين است که جداول شماي دانه برف نرمال هستند و افزونگي در آن‌ها کاهش يافته است. که اين براي کار کردن با داده‌ها و از لحاظ فضاي ذخيره‌سازي مفيد است. ولي در عوض کارايي را پايين مي‌آورد، زيرا در محاسبه کواِري‌ها به joinهاي بيشتري نياز داريم.

  21. مدل کهکشانی • در کاربرد‌هاي پيچيده براي به اشتراک گذاشتن ابعاد نياز به جداول حقايق چندگانه احساس مي‌شود که يک يا چند ‏ جدول بعد‏ را در بين خود به اشتراک مي‌گذارند. اين نوع شما به صورت مجموعه‌اي از شماهاي ستاره‌اي است و به همين دليل شماي کهکشان يا شماي منظومه‌اي ناميده‌مي‌شود. اين شما به ما اين امکان را مي‌دهد که جداول بعد بين جداول حقايق مختلف به اشتراک گذاشته شوند.

  22. انبار داده DATA WHAREHOUSE راهبردی است که دسترسی آسان به ”اطلاعات درست“در ”زمانی درست“ به ”کاربران درست“ را فراهم می آورد تا ”تصمیم گیری سازمانی ”قابل انجام باشد. بانکهای اطلاعاتی به کار رفته درسیستم های اطلاعاتی انبار داده نامیده می شوند متشکل از مکعبهای اطلاعاتی چند بعدی بوده که امکان آنالیز سریع اطلاعات پایگاه داده های مختلف را فراهم می‌آورند. بعنوان مثال يک پایگاه داده چند بعدی می تواند فروش کل ساليانه را با ماه فروش ، تعداد مشتری و قیمت متقاطع سازد. حاصل اين تقاطع اين است که گزارشات بسيار متنوعی مثل مجموع فروش در ماه خاص يا بهترين قیمت و مشتری سال و ... از سيستم به راحتی قابل استخراج است.

  23. شمای کلی DW

  24. انبارداري داده ها، از اولین استراتژي تلفیق شرکت آمریکایی حمایت کرد: • اولین شرکت آمریکایی که استراتژي خود را از بانکداري سنتی تغییر داد صرفا روي مدیریت روابط • بامشتري تاکید داشت که موجب شد این شرکت قادر به تغییر از یک شرکت با 60 میلیون ضرر در سال • 1990 به رهبر خدمات مالی ابتکاري در دهه بعد شود . اجراي موفق این استراتژي بدون انبار داده ها امکان پذیر نبود و می توانست اطلاعات مربوط به رفتارهاي مشتري نظیر محصولاتیکه استفاده می کنند،خرید و موقعیت مشتري را ذخیره کنند • • شناسایی 20 درصد از مشتریان سودآور رده بالا • • شناسایی 40 تا 50 درصدي از مشتریان غیر سودآور • • حفظ استراتژي ها • • مجراهاي توزیع با هزینه کمتر • • استراتژي هایی براي تو سعه روابط مشتري • • جریانهاي اطلاعاتی مجددا طراحی شده • دسترسی به اطلاعات در طول انبار داده ها می تواند موجب یک تغیییر انقلابی و تکاملی شود اولین • شرکت آمریکایی قادر به دستیابی به یک تغییر انقلابی شد و خودش را به شرکتهاي خدمات مالی تبدیل • کرد

  25. ملاحظات مربوط به طراحي پايگاه داده انبار • پس از دريافت داده‌ها و انجام امور مربوط به پيش پردازش داده‌ها، در مرحله بعدي از فعاليت‌ها لازم است که جدول‌هاي مربوط به data mart هر بخش از انبار را طراحي کنيم. در طي اين فرايند بايد قواعدکلي مربوط به مدل داده‌ چندبعدي را به دقت لحاظ کنيم. هر چند طراحي و ساخت جداول انبار داده کاملاً مشابه پايگاه داده‌هاي معمولي است. دو گام‌ اساسي در طراحي و ساخت جداول مربوط به data martها مطرح است: • تعريف نيازمندي‌هاي کاربر • سوالي که در اينجا مطرح است اين است که انبار داده چه کاري را بايد براي کاربر انجام دهد ؟ در اين فاز ليست تحليل‌هايي که کاربران داده‌ها (تصميم‌گيران سيستم و مديران) تا به حال انجام داده‌اند، به علاوه آن چه مي‌‌دانند يا حدس مي‌زنند در آينده به آن احتياج خواهد بود و تحليل‌هايي که طراحان انبار داده حدس مي‌‌زنند مفيد خواهد بود؛ تهيه مي‌شود و براي بازبيني نهايي در اختيار مديران يا تصميم گيرنده‌ها قرار مي‌گيرد. پس از اخذ نظر آن‌ها ليست تحليل‌ها نهايي خواهد شد. اين ليست ارتباط تنگاتنگي با تعيين شاخص‌هاي جدول حقايق دارد. • تعيين داده‌هايي که در تحليل‌ها به آن‌ها نياز داريم و بايد به سيستم وارد شوند • بعد از مرحله طراحي و ساخت، داده‌ها از سيستم اطلاعاتي موجود به انبار داده منتقل خواهند شد. اين همان مرحله بارگذاري داده‌ها را تشکيل مي‌دهد. در اين قسمت با توجه به جدول حقايق و جداول ابعادي که طراحي شده‌اند، داده‌هاي مورد نياز انبار را شناسايي کرده وبا نوشتن اسکريپت‌هاي لازم آن‌ها را بار مي‌کنيم.

  26. ملاحظات مربوط به طراحي پايگاه داده انبار • در طراحي جدول‌هاي مربوط به انبار بايد اصول مدل داده‌چند‌بعدي در نظر گرفته‌شود. • نخست بايست با توجه به ليست تحليل‌ها شاخص‌هايdata mart رامشخص کرد. توجه به اين نکته ضروري است که با توجه به ابزاري که data mart با آن طراحي خوا هد شد، کافي است شاخص‌هايي لحاظ شوند که امکان محاسبه کردن و يا افزودن آن‌ها به شاخص‌ها در هنگام کار با data mart فراهم نيست. براي مثال در Microsoft Analysis Manager ابزارهاي لازم جهت محاسبه مجموع، تعداد، حداکثر و حداقل داده‌هاي يک فيلد مهيا است. بنابراين براي مثال مي توان از قرار دادن فيلد شاخص تعداد فروش کل يک جنس در جدول حقايق اجتناب ورزيد و در عوض اين مقدار را هنگام کار با data mart محاسبه نمود. • در مرحله بعد، ابعاد مشخص مي‌شوند. که در واقع موجوديت‌هايي هستند که کاربر مايل است شاخص‌ها بر حسب آن‌ها قابل ارائه باشند. در اين مرحله اصول سلسله مراتب member‌‌هاي هربعد در نظرگرفته مي‌شود. • سپس جدول حقايق که شامل کليدهاي خارجي ابعاد و شاخص‌ها است، ساخته خواهد شد. • و در نهايت روابط بين جداول بعد و جدول حقيقت شکل خواهد گرفت.

  27. انتقال اطلاعات به جدول‌هاي طراحي شده • پس از ساختن data mart اکنون زمان آن است که داده‌هاي پايگاه داده منبع در جدول‌هاي جديد جايگزين شوند. • ابتدا جداول ابعاد که احتمالاً با تغييرات کمي درساختار جديد قرار گرفته‌اند، با در نظر گرفتن تغييرات احتمالي نام‌ها و ساختارها ، با نوشتن اسکريپت‌هاي مناسب جايگزين مي‌گردند. در مرحله بعد کليدهاي خارجي جدول حقايق با پيوند زدن جداول بعد و انتخاب کليدهاي آن‌ها پر مي‌شود. در آخر نوبت به پر کردن شاخص‌ها مي‌رسد. در اين مرحله همانطور که پيشتر هم به آن اشاره شد، با توجه به امکانات ابزار پياده‌سازي اسکريپت‌هاي لازم جهت پرکردن اوليه شاخص‌ها نوشته و اجرا خواهد شد.

  28. ساخت حجم‌هاي داده‌اي (در AM ) • ساخت حجم‌هاي داده‌اي با استفاده از ابزار Microsoft Analysis Manager بسيار ساده است. روال کار بدين نحو است که ابتدا با استفاده از ويزاردهاي از پيش تعريف شده، يک منبع داده را انتخاب مي‌کنيم. منبع داده در واقع پايگاه داده‌اي است که ما آن را با ملاحظات خاصي با مدل چند بعدي و براي انبار داده ساخته‌ايم. درواقعدر اين مرحله به AM اطلاع مي‌دهيم مايل هستيم داده‌هاي ما را از روي پايگاه داده مذکور بار کند. در گام بعدي در AM ويزارد ديگريرا که مربوط به ساخت حجم‌هاي داده‌اي است فعال مي‌کنيم تا از ما درباره اين که کدامجدولمربوط به جدول حقايق است؛ کدام فيلدهاي آن شاخص هستند ، کدام جداول را ميخواهيم به عنوان جدول بعد تعريف کنيم و نهايتاً اينکه آيا ساختار جدول بعد ما از نوع شماي ستاره‌اي است يا دانه برفي ، سوال کرده وحجم داده‌اي مورد نظر ما را ايجاد کند.

  29. عمليات بر روي حجم‌هاي داده‌اي • Roll Up (يا Drill-up): با بالا رفتن در ساختار سلسله مراتبي مفهومي يک حجم داده‌اي، يا با کاهش دادن بعد، يک مجموعه‌ با جزئيات کمتر (خلاصه شده) ايجاد مي‌نمايد. بالا رفتن در ساختار سلسله مراتبي به معناي حذف قسمتي از جزئيات است. براي مثال اگر قبلاٌ بعد مکان بر حسب شهر بوده آن را با بالا رفتن در ساختار سلسله مراتبي بر حسب کشور درمي‌آوريم. ولي وقتي با کاهش دادن بعد سروکار داريم منظور حذف يکي از ابعاد و جايگزين کردن مقادير کل است. در واقع همان عمل تجميع است. • Drill Down: بر عکس عملRoll-up است و از موقعيتي با جزئيات داده‌اي کم به جزئيات زياد مي‌رود. اين کار با پايين آمدن در ساختار سلسله مراتبي( به سمت جزئيات بيشتر) يا با ايجاد ابعاد اضافي انجام مي‌گيرد.

  30. -

  31. - • Slice: با انتخاب و اعمال شرط بر روي يکي از ابعاد يک subcube به شکل يک برش دو بعدي ايجاد مي‌کند. در واقع همان عمل انتخاب است. • Dice:Diceبا انتخاب قسمتي از ساختار سلسله مراتبي بر روي دو يا چند بعد يک subcube ايجاد مي‌نمايد.

  32. MOLAP,ROLAP • در تکنولوژيOALP داده‌ها به دو صورت چند‌بعدي (MOLAP) و رابطه‌اي (ROLAP) ذخيره مي‌شوند. OLAP پيوندي(HOLAP) تکنولوژيي است که دو نوع قبل را با هم ترکيب مي‌کند. • 1. MOLAP: روشي است که معمولاٌ براي تحليل‌هاي OLAP در تجارت مورد استفاده قرار مي‌گيرد. در MOLAP، داده‌ها با ساختار يک حجم‌ داده‌اي چند بعدي ذخيره مي‌شوند. ذخيره‌سازي در پايگاه‌داده‌هاي رابطه‌اي انجام نمي‌گيرد، بلكه با يک فرمت خاص انجام مي‌شود. اغلب محصولات موفق MOLAP از يک روش چند‌بعدي استفاده مي‌نمايند که در آن يک سري حجم‌هاي داده‌اي کوچک، انبوه و از پيش محاسبه‌شده، يک ‌حجم داده‌اي بزرگرا مي‌سازند. • براي مثال MOLAP ابزاري ايده‌آل براي استفاده در مواقعي است که شما نياز به پرس‌و‌جوي اطلاعاتي داريد که شامل فاکتورهاي زمان (روز، هفته، ماه، سال)، مناطق جغرافيايي (شهر، استان، کشور)، خطوط توليد و يا دسته‌بندي‌ها، کانال‌هاي مختلف ( افراد خريدار، انبار‌ها، و غيره)، مي‌باشد. • به بيان ديگر، روش MOLAP به شما اجازه مي‌دهد داده‌هاي مربوط به محصولات فروخته شده، را بر حسب افراد خريدار تا هر تعداد مشتري در گروه‌هاي صنعتي مختلف در مناطق مختلف و در بازه‌هاي زماني مختلف دسته‌بندي ذخيره و پردازش نماييد. • علاوه ‌بر‌اين MOLAP به شما امکان مي‌دهد داده‌هاي ديدهاي تحليل‌گران را دسته بندي کنيد، که اين در حذف اشتباهات و برخورد با ترجمه‌هاي پرغلط کمک بزرگي است. • گذشته از همه اين‌ها از آن‌جا که داده‌ها به طور فيزيكي در حجم‌هاي داده‌اي بزرگ چند‌بعدي ذخيره مي‌شوند، سرعت انجام فعاليت‌ها بسيار زياد خواهد بود. • از آنجا که يک کپي از داده‌هاي منبع در کامپيوتر Analysis server ذخيره‌مي‌شود، کواِري‌‌ها مي‌توانند بدون مراجعه به منابع مجدداً محاسبه شوند. کامپيوتر Analysis server ممکن است کامپيوترسرور که تقسيم بندي‌ها در آن انجام شده يا کامپيوتر ديگري باشد. اين امر بستگي به اين دارد که تقسيم‌بندي‌ها در کجا تعريف شده‌اند. حتي اگر پاسخ کواِري‌ها از روي تقسيمات تجميع شده قابل دستيابي نباشند، MOLAP سريع‌ترين پاسخ را فراهم مي‌کند. سرعت انجام اين کار به طراحي و درصد تجميع تقسيم‌بندي‌ها بستگي دارد.

  33. مزایاو معایب • مزايا: کارايي عالي- حجم‌هاي داده‌اي MOLAP براي بازيابي سريع داده‌ها ساخته ‌شده‌اند و در فعاليت‌هاي slice و dice به صورت بهينه پاسخ مي‌دهند. ترکيب سادگي و سرعت مزيت اصلي MOLAP است. • در ضمنMOLAP قابليت محاسبه محاسبات پيچيده را فراهم مي‌کند. همه محاسبات پيش از وقتي که حجم‌هاي داده‌اي ساخته مي‌‌شود، ايجاد مي‌شوند. بنابراين نه تنها محاسبات پيچيده انجام شدني هستند بلكه بسيار سريع هم پاسخ مي‌دهند. • معايب: عيب اين روش اين است که تنها براي داده‌هايي با مقدار محدود کارکرد خوبي دارد. از آنجا که همه محاسبات- زماني‌ که حجم‌هاي داده‌اي ساخته مي‌شود، محاسبه مي‌گردند، امکان اين ‌که حجم‌هاي داده‌اي مقدار زيادي از داده‌ها را در خود جاي دهد، وجود ندارد.

  34. ROLAP • محدوديت MOLAP در حجم داده‌هاي قابل پرس‌و‌جو و نياز به روشي که از داده‌هاي ذخيره‌شده به روش رابطه‌اي حمايت کند، موجب پيشرفت ROLAP شد. • مبناي اين روش کارکردن با داده‌هايي که در پايگاه‌داده‌هاي رابطه‌اي ذخيره‌شده‌اند، براي انجام اعمال slicing و dicing معمولي است. با استفاده از اين مدل ذخيره‌سازي مي‌توان داده‌ها را بدون ايجاد واقعي تجميع در پايگاه‌داده‌هاي رابطه‌اي به هم مربوط کرد. • مزايا: با اين روش مي‌توان به حجم زيادي از داده‌ها را رسيدگي کرد. محدوديت حجم داده در تکنولوژي ROLAP مربوط به محدوديت حجم داده‌هاي قابل ذخيره‌سازي در پايگاه‌داده‌هاي رابطه‌اي است. به بيان ديگر، خود ROLAP هيچ محدوديتي بر روي حجم داده‌ها اعمال نمي‌کند. • معايب: ممکن است کارايي پايين بيايد. زيرا هر گزارش ROLAP در واقع يک کواِري SQL (يا چند کواِري SQL )در پايگاه داده‌هاي رابطه‌اي است و اگر حجم داده‌ها زياد باشد ممکن است زمان پاسخ کواِري طولاني شود. در مجموع ROLAP سنگين است، نگهداري آن سخت است و کند هم هست. بخصوص زماني که نياز به آدرس دهي جدول‌هاي ذخيره شده در سيستم چند بعدي داريم. • اين محدوديت ناشي از عملكرد SQL است. زيرا تکنولوژي ROLAP بر پايه عبارات مولد SQL براي پرسش و پاسخ بر روي پايگاه داده رابطه‌اي است و عبارات SQL به همه نيازها پاسخ نمي‌دهند (مثلاٌ محاسبه حساب‌هاي پيچيده در SQL مشكل است)، بنابراين فعاليت‌هاي ROLAP به آن ‌چه SQL قادر به انجام آن است محدود مي‌گردد.

  35. تفاوت ROLAP ,MOLAPمعرفی HOLAP • تفاوت ROALP و MOLAP : تفاوت اصلي اين دو در معماري آن‌ها است. محصولات MOLAP داده‌هاي مورد نياز را در يک حافظه نهان مخصوص مي‌گذارد. ولي ROLAP تحليل‌هاي خود را بدون استفاده از يک حافظه مياني انجام مي‌دهد، بدون آن‌ که از يک مرحله مياني براي گذاشتن داده‌ها در يک سرور خاص استفاده کند. • با توجه به کند بودن ROLAP در مقايسه باMOLAP ، بايد توجه داشت که کاربرد اين روش بيشتر در پايگاه داده‌هاي بسيار بزرگي است که گاه‌گاهي پرس و جويي بر روي آن‌ها شکل مي‌گيرد، مثل داده‌هاي تاريخي و کمتر جديد سال‌‌هاي گذشته. • نکته: اگر از Analysis Services که به وسيله Microsoft OLE DB Provider مهيا شده استفاده مي‌کنيد، تجميع‌ها نمي‌توانند براي تقسيم‌بندي از روش ROLAP استفاده نمايند. • 3. HOLAP: با توجه به نياز رو به رشدي که براي کارکردن با داده‌هاي بلادرنگ در بخش‌هاي مختلف در صنعت و تجارت احساس مي‌شود، مديران تجاري انتظار دارند بتوانند با دامنه وسيعي از اطلاعات که فوراً و بدون حتي لحظه‌اي تأخير در دسترس باشند، کار کنند. در حال حاضر شبکه اينترنت و ساير کاربرد‌ها يي که به داده‌هايي از منابع مختلف مراجعه دارند و نياز به فعاليت با يک سيستم بلادرنگ هم دارند، همگي از سيستم HOLAP بهره مي‌گيرند. • تکنولوژي‌هاي HOLAP تلاش مي‌کنند مزاياي MOLAP وROLAP را با هم ترکيب نمايند.HOLAP يک نرم‌افزار معمول است که تراکنش‌هاي ROLAP وMOLAP را با سرعت بسيار زياد سامان مي‌دهد. • سرورHOLAP مثلMOLAP داده‌ها را در يک مدل چند‌بعدي ذخيره ‌مي‌نمايد. ولي هيچ کپي از داده‌هاي مبدأ ايجاد نمي‌کند. سرور HOLAP تکنيک حجم‌هاي داده‌اي را براي بالا بردن سرعت کار به کار مي‌گيرد. هنگامي‌که نياز به اطلاعات جزئي هست، HOLAP مي‌تواند از حجم‌هاي داده‌اي به داده‌هاي رابطه‌اي “drill through” انجام دهد. اين روش ابزارهاي تحليل داده-گراي قديمي را با اتصالات فرا متن جديد ترکيب کرده تا ليست داده‌ها و خصوصيات آن‌ها و ساير انواع اطلاعات را، صرف‌نظر از نوع آن‌ها، با هم مرتبط مي‌کند، تا شکل غني‌تري از تحليل را براي کاربر مهيا کند. براي کواِري‌هايي که فقط به داده‌هاي خلاصه‌اي که در تجميع‌ها وجود دارند نياز دارند، اين روش مثل MOLAP عمل مي‌کند. • در آينده ، HOALP به کاربران امکان مي‌دهد، با دسترسي بلادرنگ به انبارهاي داده‌ و ابزارهاي حمايت از تصميم‌گيري از طريق مرورگرهاي استاندارد اينترنت، به نوعي تحليل‌ غني‌تر که در اختيار کاربر خواهد بود برسند.

  36. اهمیتOLAP • هدف نمايش داده اين است که کاربرانبار داده را از وقوع وقايع مطلع کنيم. از طريق انبار داده که مهيا نموده‌ايم، مي‌توانيم ديد کلاني و یکپارچه بر روي فعاليت‌هاي تجاري داشته باشيم. حتي مي‌توانيم از فن‌آوري داده‌کاوي براي کشف دانش‌هاي مفيد در امر تحليل بهره بگيريم. همانطور که مي‌دانيم تکنولوژي OLAP با مدل کردن داده‌ها در قالب حجم‌هاي داده، امکان داشتن هم زمان ديد کلي و تفصيلي به داده‌ها را فراهم کرده است. يعني اين که کاربر مي‌تواند به داده‌ها هم در سطح بالا و هم در سطح پايين از فعاليت‌هاي تجاري دسترسي آسان داشته باشد. علاوه براين با توجه به مدل چندبعدي داده‌ها در OLAP حجم‌هاي داده براي دسترسي به اطلاعات در اختيار کاربر هستند، که درنتيجه امکان بريدن داده به قطعات کوچک که مناسب با نيازهاي کاربران باشدرا فراهم مي‌نمايد.به خاطر اين قابليت‌هاي OLAP نمايش داده در اين روش در مقايسه با روش هاي ديگر بسيار راحت و با کيفيت است و گزارش‌هاي باارزشي را ارائه مي کنند. به خصوص اگر از ابزارهاي کمکي ديگري مثل صفحات گسترده و نمودارهاي EXCEL نيزاستفاده شود، ارزش و اهميت اين فن‌اوري بسيار بيشتر مشخص مي‌گردد. ابزارMicrosoft Analysis Manager امکاني را براي ما فراهم مي کند که ماقادر مي‌سازد داده‌هاي خود را در قالب نمودارهاي EXCEL به نمايش دراوريم.

  37. بررسی :صنایع مسOUTOKUMPU • محصولات مس شرکت "اتوکامپو" (فنلاند) هر ساله میلیون ها کیلوگرم فلزات پایه مورد فرآوري قرار می دهد. • که در محصولاتی از قبیل تسمه ، مخازن آب آشامیدنی ، و رادیاتورها استفاده می شود. این محصولات درخدمت صنایع الکترونیک ، استخراج از معادن و فلزات ، حمل و نقل و شرکتهاي ساخت و ساز در سراسر جهان قرار می گیرد. اتوکامپو داراي چهار بخش با 13 خطوط کار مستقل در اروپا و امریکا و آسیا است. تعیین سودحجم معاملات مشتریان و سودآوري حاصل از یک محصول ، چگونگی کاهش هزینه هاي تولید از مسایل مهم این شرکت است. ادغام و تجزیه و تحلیل اطلاعات کسب شده از هر واحد چالشی عظیم است ، چرا که بازارفروش در بخش هاي مختلف شامل الزامات به خصوصی است که به نظر نمی رسد با یک سیستم کلی عملی • است. • . راه حل ساخت یک انبار داده واستفاده از یک وب سایت مبتنی بر سرور • لذا OLAPمورد استفاده قرار گرفت. دو مدل به سرعت ساخته شد. یکی براي پشتیبانی از سود حاصل از مشتري و محصولات و دیگري جهت گزارش عملکرد تحویل.

  38. کلام آخر:موفقیت در هوشمندی تجاری، درس های فراگرفته شده و معرفی ابزار • یک گزارش جامع ۲۶۹ صفحه‌ای با عنوان OLAP که در نوامبر ۲۰۰۳ توسط Nigel Pendseمنتشر ‌شده است در مورد این که مزایای BI (Business Intelligence) یا هوشمندی تجاری تا چه حد واقعی و ملموس است، توضیح می‌دهد. • این گزارش نشان می‌دهد، تقریباً ۱۹ درصد از شرکت‌هایی که BI را به کاربرده‌اند به اهداف تجاری خود یا حتی به چیزی فراتر از آن رسیده‌اند. بیش از ۶۰ درصد اذعان داشته‌اند که حداقل به قسمت اعظم اهداف تجاری خود دست یافته‌اند. • گزارش ” • Nigel Pendseیک فرد با تجربه در زمینه‌ی OLAP شناخته می‌شود. وی دارای ۲۵ سال سابقه در زمینه‌ی کار با محصولات BI است. در ابتدا وی به عنوان یک کاربر، سپس فروشنده و از سال ۱۹۹۴ به بعد به عنوان یک تحلیل‌گر صنعتی با محصولات BI تجربه کسب کرده است. وی تهیه کننده اصلی گزارش OLAP است (http://www.olapreport.com)که منابع ارزنده‌ای برای تحلیل عمیق برنامه‌ها، کاربردها، محصولات و بازار OLAP در اختیار ما می‌گذرد. • فیلم آموزشی کوتاه از بکارگیری OLAP در اکسل در آدرس زیر • http://www.microsoft.com/download/en/details.aspx?displayla • ng=en&id=4512 • دموی نرم افزاری کار با OLAP یک تجربه مفید از آدرس زیر دانلود فرمایید • http://pca.adventureworkscube.prototype.pcapps.com/ • آموزش کوتاه در زمینه نحوه ّبه کارگیری و اجرایOLAP در اسکیوال سرور 2008 • http://www.accelebrate.com/sql_training/ssas_2008_tutorial.htm • پایان نامه سال 2011 توسط آقای احمد طالب برای اخذ درجه دکترا در زمینه بهینه سازی کواری های OLAP چند بعدی • http://spectrum.library.concordia.ca/7388/1/Taleb_PhD_S2011.pdf

  39. منابع • [1] GayatriSathe, SunitaSarawagi. Intelligent Rollups in Multidimensional OLAP Data. VLDB (2001) • [2] Dimitri Theodoratos, Spyros Ligoudistianos, TimosSellis. Designing the Global Data Warehouse with SPJ Views. VLDB (1999) • [3] Jian Yang, Kamalakar Karla alem, Qing Li. Algorithms for Materialized View Design in Data Warehousing Environment. VLDB (1997) • [4] DimitriTheodorados, TimosSellis. Dynamic Data Warehouse. Design.University of Athens (2000) • [5] Martin Ester, Hans-Peter Kriegel, Jörg Sander, Michael Wimmer, XiaoweiXu. Incremental Clustering for Mining in a Data Warehousing Environment. Proceedings of the 24th VLDB Conference USA (1998) • [6] PanosVassiliadis, MokraneBouzeghoub, ChristophQuix. Towards Quality-Oriented Data Warehouse Usage and Evolution. University of Versailles (2000) • [7] YannisKotidis. A DataWarehousing Architecture for Enabling Service Provisioning Process. VLDB (2001) • [8] Nikos Karayannidis, ArisTsois, TimosSellis, Roland Pieringer, Volker Markl, Frank Ramsak,RobertFenk, Klaus Elhardt, Rudolf Bayer. Processing Star Queries on Hierarchically-Clustered Fact Tables. VLDB (2002) • [9] LadjelBellatreche, Kamalakar /karlapalam. Logical and Physical Design in Data Warehousing Environments. VLDB (2000) • کتاب توربان

More Related