440 likes | 701 Views
به نام یگانه هستی بخش. OLAP. www.itsweetworld.blogfa.com. پیاده سازی داده ها. در سازمانها داده ها و اطلاعات معمولا به دوشکل در سیستم ها پیاده سازی می شوند: (OLTP) 1)سیستم های عملیاتی (OLAP,DW/BI,DSS) 2)سیستم های اطلاعاتی. مقایسه سیستم های عملیاتی و اطلاعاتی.
E N D
OLAP www.itsweetworld.blogfa.com
پیاده سازی داده ها در سازمانها داده ها و اطلاعات معمولا به دوشکل در سیستم ها پیاده سازی می شوند: (OLTP)1)سیستم های عملیاتی (OLAP,DW/BI,DSS)2)سیستم های اطلاعاتی
مقایسه سیستم های عملیاتی و اطلاعاتی
مقایسه سیستم های عملیاتی و اطلاعاتی
مقایسه سیستم های عملیاتی و اطلاعاتی
مقایسه سیستم های عملیاتی و اطلاعاتی
مقایسه سیستم های عملیاتی و اطلاعاتی
OLAP چیست؟ • تکنولوژيOLAP پاسخي جديد به مشكلات سيستمهاي حمايت از تصميمگيري، است. تکنولوژي OLAP ابزارها و مفاهيمي را ارائه ميکند که به وسيله آنها امکان انجام يک تحليل موثر و دلخواه بر روي هر نوع دادهاي فراهم ميگردد.OLAP يک تکنيک ساده نيست بلكه مجموعهاي از مفاهيمي از قبيل سازمان پايگاه داده، نمايش داده و مدل کردن کواِري است. • تکنولوژيOLAP نامي است که به طيف گستردهاي از تکنيکها اطلاق ميشود. اين تکنيکها شامل روشهايي براي مرتب کردن، پرس و جو کردن و تحليل کردن دادهها است. همچنين شامل قالبهاي گزارشگيري و رابط کاربر هم هستند.
OLAP و DATAMINING • OLAP و Data Mining مکمل یکدیگر میباشند. به طور مثالOLAP قادر است تا نقطه بُروز مشکلات، در حوزه خاصی را نمایش دهد، و Data Mining قادر است تا با نگاهی عمیقتر به دادههای آن حوزه، رفتار مولفههای موثر در آن را تحلیل و مدلسازی نماید. • در OLAP از مدل به داده و در Data Mining از داده به مدل خواهید رسید.• در OLAP از سوال به جواب و در داده کاوی از جواب به سوال خواهید رسید.
خصوصيات قابل ارزيابي OLAP • تحليل: منظور از تحليل آن است که سيستم بايد بتواند از عهده هر تحليل منطقي و آماري که مورد نياز کاربر باشد، برآيد. تحليل ممکن است شامل تحليل سريهاي زماني، تخصيص هزينه، تبديل واحد پول، جستجوي هدف، کواِريهاي مخصوص ساختارهاي چند بعدي، مدل کردن غير رويهاي، تشخيص استثنا، دادهکاوي و ساير کاربردها باشد. انجام همه اين تحليلها بايد براي کاربر نهايي به اندازه کافي ساده باشند.
خصوصيات قابل ارزيابي OLAP • سريع: منظور از سرعت آن است که سيستم بايد بيشتر پاسخ خود را در زمان معقولي به کاربر بازگرداند. تحقيقات اخير نشان دادهاست که اگر کاربر نهايي ظرف 30 ثانيه پاسخي دريافت نکند، تصور ميکند که فرايند دچار شکست شده است. رسيدن به اين معيار ( يعني زمان پاسخ کمتر از 30 ثانيه) هنگامي که با حجم زيادي از اطلاعات سروکار داريم کار سادهاي نيست. بخصوص وقتي نياز به کواِريهاي پيچيده و مستقل داريم. محصولات OLAP چندين راهکار براي رسيدن به اين سرعت ارائه نموده است، که روشهايي مثل اختصاصي کردن نوع ذخيرهسازي داده، شاخص بندي، از پيش محاسبه کردن تجميعها و سخت افزارهاي ويژه از آن دسته روشها هستند.
خصوصيات قابل ارزيابي OLAP • اشتراکي: منظور اين است که سيستم همه نيازمنديهاي امنيتي را براي محرمانه ماندن دادهها و براي دسترسيهاي چندگانه خواندن/نوشتن پيادهسازي کند. به خصوص محرمانه ماندن معقوله مشكلي است. براي تحليل مناسب پايگاه دادههاي مربوط به OLAP بايد شامل هر مقدار داده که ممکن است باشند. براي محدود کردن دسترسي به دادههاي محرمانه، بايد يک مراقبت خاص براي دسترسيهاي درست و سطوح دسترسي تعريف شود.
خصوصيات قابل ارزيابي OLAP • چند بعدي: يک نياز اساسي OLAP است. سيستم بايد يک شماي مفهومي چند بعدي از دادهها را مهيا نمايد، که شامل مفاهيم سلسله مراتبي هم باشد. همچنين بايد قابليت داشتن تعداد دلخواه بعد و سطح تجميع را فراهم کند.
مدلهاي دادهاي رابطهاي وچندبعدي • - مدل داده رابطهاي بر اساس دو مفهوم اساسي موجوديت و رابطه بنا نهاده شده است. از اين رو آن را با نام مدل ER نيز ميشناسند. • موجوديت: نمايانگر همه چيزهايي که در پايگاه داده وجود خارجي دارند يا به تصور در ميآيند. پديدهها داراي مشخصاتي هستندکه به آنها صفت گفته ميشود. • رابطه: پديدهها را به هم ميپيوندد و چگونگي در ارتباط قرار گرفتن آنها با يکديگر را مشخص ميکند.
مدل داده چندبعدي • مدل داده چندبعدييا MD بر پايه دو ساختار جدولي اصلي بنا نهادهشدهاست: • جدول حقايق يا Fact Table • جداول ابعاد يا Dimension Table • اين ساختار امکان داشتن يک نگرش مديريتي و تصميمگيري به دادههاي موجود در پايگاه داده را تسهيل ميکند. • جدول حقايق: قلب حجم دادهاي ما را تشکيل ميدهد و شامل دو سري فيلد است: کليدهاي خارجي به ابعاد و شاخصها. جداول حقايق را ميتوان به عنوان تابعي از ابعاد بر روي شاخصها تصور کرد.
شاخصها و بعد • شاخصها يا Measure: معيارهايي هستند که بر روي آنها تحليل انجام ميگيرد و درون جدول حقايق قرار دارند. شاخصها قبل از شکلگيري انبار داده توسط مديران و تحليلگران به دقت مشخص ميشوند. چون در مرحله کار با انبار اطلاعات اساسي هر تحليل بر اساس همين شاخصها شکل ميگيرد. شاخصها تقريباً هميشه مقادير عددي را شامل ميشوند. مثلا براي يک فروشگاه زنجيرهاي اين شاخصها ميتوانند واحدهاي فروختهشده کالاها و مبلغ فروش به تومان باشند. • بعد يا Dimension: هر موجوديت در اين مدل ميتواند با يک بعد تعريف شود. ولي بعدها با موجوديتهاي مدل ER متفاوتند زيرا آنها سازمان شاخصها را تعيين ميکنند. علاوه بر اين داراي يک ساختار سلسله مراتبي هستند و به طور کلي براي حمايت از سيستمهاي تصميم گيري سازماندهي شدهاند. • اجزاي بعدها member نام دارند و تقريباٌ همه بعدها، memberهاي خود را در يک يا چند سطح سلسله مراتبي سازماندهي مينمايند، که اين سلسله مراتب نمايانگر مسير تجميع و ارتباط بين سطوح پايينتر (مثل روز) و سطوح بالاتر (مثل ماه و سال) است. وقتي يک دسته از memberهاي خاص با هم مفهوم جديدي را ايجاد ميکنند، به آنها يک سطح ميگوييم. (مثلاٌ هر سي روز را ماه ميگوييم. در اين حالت ماه يک سطح است. • مثلاً در فروشگاه زنجيرهاي بعدهايي از قبيل بعد زمان، فروشگاه، محصول و خريدار راميتوانيم داشته باشيم. که بعد زمان داراي سطوحي از قبيل روز، هفته، ماه، فصل و سال است، که memberها را طبقهبندي ميکنند. بعد فروشگاه هم ممکن است داراي سلسله مراتبي به شکل زير باشد:
حجمهاي دادهاي - • حجمهاي دادهاي يا Cube از ارتباط تعدادي بعد با تعدادي شاخص تعريف ميشود. ترکيب memberهاي هر بعد از حجم دادهاي فضاي منطقي را تعريف ميکند که در آن مقادير شاخصها ظاهر ميشوند. هر بخش مجزا که شامل يکي از memberهاي بعد در حجم دادهاي است ، سلول ناميدهميشود. سلولها شاخصهاي مربوط به تجميعهاي مختلف را در خود نگهداري مينمايند. در واقع مقادير مربوط به حقايق که در جدول حقايق تعريف ميشوند در حجم دادهاي در سلولها نمايان ميگردند cellمحورهاي حجم دادهاي، صفتهاي موجوديتهاي انبار را مشخص ميکنند. به بيان ديگر هر محور مشخص کننده يک بعد از انبار است و هر مقدار روي محور يک member از آن بعد را مشخص مينمايد. • حجم دادهاي بر خلاف آن چه از نام لاتينش استنباط ميگردد و در نمودارها به نمايش در ميآيد، در انبارهاي داده واقعي ميتواند بسيار بيشتر از دو بعد داشته باشد
شماهاي دادهاي • شماي ستارهاي يا Star Schema: متداولترين شما، همين شمايستارهاي است. که در آن انبارداده با استفاده از اجزاي زير تعريف ميشود: • يک جدول مرکزي بزرگ به نام جدول حقايق که شامل حجم زيادي از دادههاي بدون تکرار است. • مجموعهاي از جدولهاي کمکي کوچکتر به نام جدول بعد ، که به ازاي هر بعد يکي از اين جداول موجود خواهد بود. • شکل اين شما به صورت يک ستاره است که جدول حقايق در مرکز آن قرار گرفته و هر يک از جداول بعد به وسيله شعاعهايي به آن مربوط هستند. • مشكل اين مدل احتمال پيشامد افزونگي در آن است.
شماي دانهبرفي يا Schema Snowflake Schema • در واقع شماي دانهبرفي، نوعي از شماي ستارهاي است که در آن بعضي از جداول بعد نرمال شدهاند. و به همين خاطر داراي تقسيمات بيشتري به شکل جداول اضافي ميباشد که از جداول بعد جدا شدهاند. • تفاوت اين دو شما در اين است که جداول شماي دانه برف نرمال هستند و افزونگي در آنها کاهش يافته است. که اين براي کار کردن با دادهها و از لحاظ فضاي ذخيرهسازي مفيد است. ولي در عوض کارايي را پايين ميآورد، زيرا در محاسبه کواِريها به joinهاي بيشتري نياز داريم.
مدل کهکشانی • در کاربردهاي پيچيده براي به اشتراک گذاشتن ابعاد نياز به جداول حقايق چندگانه احساس ميشود که يک يا چند جدول بعد را در بين خود به اشتراک ميگذارند. اين نوع شما به صورت مجموعهاي از شماهاي ستارهاي است و به همين دليل شماي کهکشان يا شماي منظومهاي ناميدهميشود. اين شما به ما اين امکان را ميدهد که جداول بعد بين جداول حقايق مختلف به اشتراک گذاشته شوند.
انبار داده DATA WHAREHOUSE راهبردی است که دسترسی آسان به ”اطلاعات درست“در ”زمانی درست“ به ”کاربران درست“ را فراهم می آورد تا ”تصمیم گیری سازمانی ”قابل انجام باشد. بانکهای اطلاعاتی به کار رفته درسیستم های اطلاعاتی انبار داده نامیده می شوند متشکل از مکعبهای اطلاعاتی چند بعدی بوده که امکان آنالیز سریع اطلاعات پایگاه داده های مختلف را فراهم میآورند. بعنوان مثال يک پایگاه داده چند بعدی می تواند فروش کل ساليانه را با ماه فروش ، تعداد مشتری و قیمت متقاطع سازد. حاصل اين تقاطع اين است که گزارشات بسيار متنوعی مثل مجموع فروش در ماه خاص يا بهترين قیمت و مشتری سال و ... از سيستم به راحتی قابل استخراج است.
انبارداري داده ها، از اولین استراتژي تلفیق شرکت آمریکایی حمایت کرد: • اولین شرکت آمریکایی که استراتژي خود را از بانکداري سنتی تغییر داد صرفا روي مدیریت روابط • بامشتري تاکید داشت که موجب شد این شرکت قادر به تغییر از یک شرکت با 60 میلیون ضرر در سال • 1990 به رهبر خدمات مالی ابتکاري در دهه بعد شود . اجراي موفق این استراتژي بدون انبار داده ها امکان پذیر نبود و می توانست اطلاعات مربوط به رفتارهاي مشتري نظیر محصولاتیکه استفاده می کنند،خرید و موقعیت مشتري را ذخیره کنند • • شناسایی 20 درصد از مشتریان سودآور رده بالا • • شناسایی 40 تا 50 درصدي از مشتریان غیر سودآور • • حفظ استراتژي ها • • مجراهاي توزیع با هزینه کمتر • • استراتژي هایی براي تو سعه روابط مشتري • • جریانهاي اطلاعاتی مجددا طراحی شده • دسترسی به اطلاعات در طول انبار داده ها می تواند موجب یک تغیییر انقلابی و تکاملی شود اولین • شرکت آمریکایی قادر به دستیابی به یک تغییر انقلابی شد و خودش را به شرکتهاي خدمات مالی تبدیل • کرد
ملاحظات مربوط به طراحي پايگاه داده انبار • پس از دريافت دادهها و انجام امور مربوط به پيش پردازش دادهها، در مرحله بعدي از فعاليتها لازم است که جدولهاي مربوط به data mart هر بخش از انبار را طراحي کنيم. در طي اين فرايند بايد قواعدکلي مربوط به مدل داده چندبعدي را به دقت لحاظ کنيم. هر چند طراحي و ساخت جداول انبار داده کاملاً مشابه پايگاه دادههاي معمولي است. دو گام اساسي در طراحي و ساخت جداول مربوط به data martها مطرح است: • تعريف نيازمنديهاي کاربر • سوالي که در اينجا مطرح است اين است که انبار داده چه کاري را بايد براي کاربر انجام دهد ؟ در اين فاز ليست تحليلهايي که کاربران دادهها (تصميمگيران سيستم و مديران) تا به حال انجام دادهاند، به علاوه آن چه ميدانند يا حدس ميزنند در آينده به آن احتياج خواهد بود و تحليلهايي که طراحان انبار داده حدس ميزنند مفيد خواهد بود؛ تهيه ميشود و براي بازبيني نهايي در اختيار مديران يا تصميم گيرندهها قرار ميگيرد. پس از اخذ نظر آنها ليست تحليلها نهايي خواهد شد. اين ليست ارتباط تنگاتنگي با تعيين شاخصهاي جدول حقايق دارد. • تعيين دادههايي که در تحليلها به آنها نياز داريم و بايد به سيستم وارد شوند • بعد از مرحله طراحي و ساخت، دادهها از سيستم اطلاعاتي موجود به انبار داده منتقل خواهند شد. اين همان مرحله بارگذاري دادهها را تشکيل ميدهد. در اين قسمت با توجه به جدول حقايق و جداول ابعادي که طراحي شدهاند، دادههاي مورد نياز انبار را شناسايي کرده وبا نوشتن اسکريپتهاي لازم آنها را بار ميکنيم.
ملاحظات مربوط به طراحي پايگاه داده انبار • در طراحي جدولهاي مربوط به انبار بايد اصول مدل دادهچندبعدي در نظر گرفتهشود. • نخست بايست با توجه به ليست تحليلها شاخصهايdata mart رامشخص کرد. توجه به اين نکته ضروري است که با توجه به ابزاري که data mart با آن طراحي خوا هد شد، کافي است شاخصهايي لحاظ شوند که امکان محاسبه کردن و يا افزودن آنها به شاخصها در هنگام کار با data mart فراهم نيست. براي مثال در Microsoft Analysis Manager ابزارهاي لازم جهت محاسبه مجموع، تعداد، حداکثر و حداقل دادههاي يک فيلد مهيا است. بنابراين براي مثال مي توان از قرار دادن فيلد شاخص تعداد فروش کل يک جنس در جدول حقايق اجتناب ورزيد و در عوض اين مقدار را هنگام کار با data mart محاسبه نمود. • در مرحله بعد، ابعاد مشخص ميشوند. که در واقع موجوديتهايي هستند که کاربر مايل است شاخصها بر حسب آنها قابل ارائه باشند. در اين مرحله اصول سلسله مراتب memberهاي هربعد در نظرگرفته ميشود. • سپس جدول حقايق که شامل کليدهاي خارجي ابعاد و شاخصها است، ساخته خواهد شد. • و در نهايت روابط بين جداول بعد و جدول حقيقت شکل خواهد گرفت.
انتقال اطلاعات به جدولهاي طراحي شده • پس از ساختن data mart اکنون زمان آن است که دادههاي پايگاه داده منبع در جدولهاي جديد جايگزين شوند. • ابتدا جداول ابعاد که احتمالاً با تغييرات کمي درساختار جديد قرار گرفتهاند، با در نظر گرفتن تغييرات احتمالي نامها و ساختارها ، با نوشتن اسکريپتهاي مناسب جايگزين ميگردند. در مرحله بعد کليدهاي خارجي جدول حقايق با پيوند زدن جداول بعد و انتخاب کليدهاي آنها پر ميشود. در آخر نوبت به پر کردن شاخصها ميرسد. در اين مرحله همانطور که پيشتر هم به آن اشاره شد، با توجه به امکانات ابزار پيادهسازي اسکريپتهاي لازم جهت پرکردن اوليه شاخصها نوشته و اجرا خواهد شد.
ساخت حجمهاي دادهاي (در AM ) • ساخت حجمهاي دادهاي با استفاده از ابزار Microsoft Analysis Manager بسيار ساده است. روال کار بدين نحو است که ابتدا با استفاده از ويزاردهاي از پيش تعريف شده، يک منبع داده را انتخاب ميکنيم. منبع داده در واقع پايگاه دادهاي است که ما آن را با ملاحظات خاصي با مدل چند بعدي و براي انبار داده ساختهايم. درواقعدر اين مرحله به AM اطلاع ميدهيم مايل هستيم دادههاي ما را از روي پايگاه داده مذکور بار کند. در گام بعدي در AM ويزارد ديگريرا که مربوط به ساخت حجمهاي دادهاي است فعال ميکنيم تا از ما درباره اين که کدامجدولمربوط به جدول حقايق است؛ کدام فيلدهاي آن شاخص هستند ، کدام جداول را ميخواهيم به عنوان جدول بعد تعريف کنيم و نهايتاً اينکه آيا ساختار جدول بعد ما از نوع شماي ستارهاي است يا دانه برفي ، سوال کرده وحجم دادهاي مورد نظر ما را ايجاد کند.
عمليات بر روي حجمهاي دادهاي • Roll Up (يا Drill-up): با بالا رفتن در ساختار سلسله مراتبي مفهومي يک حجم دادهاي، يا با کاهش دادن بعد، يک مجموعه با جزئيات کمتر (خلاصه شده) ايجاد مينمايد. بالا رفتن در ساختار سلسله مراتبي به معناي حذف قسمتي از جزئيات است. براي مثال اگر قبلاٌ بعد مکان بر حسب شهر بوده آن را با بالا رفتن در ساختار سلسله مراتبي بر حسب کشور درميآوريم. ولي وقتي با کاهش دادن بعد سروکار داريم منظور حذف يکي از ابعاد و جايگزين کردن مقادير کل است. در واقع همان عمل تجميع است. • Drill Down: بر عکس عملRoll-up است و از موقعيتي با جزئيات دادهاي کم به جزئيات زياد ميرود. اين کار با پايين آمدن در ساختار سلسله مراتبي( به سمت جزئيات بيشتر) يا با ايجاد ابعاد اضافي انجام ميگيرد.
- • Slice: با انتخاب و اعمال شرط بر روي يکي از ابعاد يک subcube به شکل يک برش دو بعدي ايجاد ميکند. در واقع همان عمل انتخاب است. • Dice:Diceبا انتخاب قسمتي از ساختار سلسله مراتبي بر روي دو يا چند بعد يک subcube ايجاد مينمايد.
MOLAP,ROLAP • در تکنولوژيOALP دادهها به دو صورت چندبعدي (MOLAP) و رابطهاي (ROLAP) ذخيره ميشوند. OLAP پيوندي(HOLAP) تکنولوژيي است که دو نوع قبل را با هم ترکيب ميکند. • 1. MOLAP: روشي است که معمولاٌ براي تحليلهاي OLAP در تجارت مورد استفاده قرار ميگيرد. در MOLAP، دادهها با ساختار يک حجم دادهاي چند بعدي ذخيره ميشوند. ذخيرهسازي در پايگاهدادههاي رابطهاي انجام نميگيرد، بلكه با يک فرمت خاص انجام ميشود. اغلب محصولات موفق MOLAP از يک روش چندبعدي استفاده مينمايند که در آن يک سري حجمهاي دادهاي کوچک، انبوه و از پيش محاسبهشده، يک حجم دادهاي بزرگرا ميسازند. • براي مثال MOLAP ابزاري ايدهآل براي استفاده در مواقعي است که شما نياز به پرسوجوي اطلاعاتي داريد که شامل فاکتورهاي زمان (روز، هفته، ماه، سال)، مناطق جغرافيايي (شهر، استان، کشور)، خطوط توليد و يا دستهبنديها، کانالهاي مختلف ( افراد خريدار، انبارها، و غيره)، ميباشد. • به بيان ديگر، روش MOLAP به شما اجازه ميدهد دادههاي مربوط به محصولات فروخته شده، را بر حسب افراد خريدار تا هر تعداد مشتري در گروههاي صنعتي مختلف در مناطق مختلف و در بازههاي زماني مختلف دستهبندي ذخيره و پردازش نماييد. • علاوه براين MOLAP به شما امکان ميدهد دادههاي ديدهاي تحليلگران را دسته بندي کنيد، که اين در حذف اشتباهات و برخورد با ترجمههاي پرغلط کمک بزرگي است. • گذشته از همه اينها از آنجا که دادهها به طور فيزيكي در حجمهاي دادهاي بزرگ چندبعدي ذخيره ميشوند، سرعت انجام فعاليتها بسيار زياد خواهد بود. • از آنجا که يک کپي از دادههاي منبع در کامپيوتر Analysis server ذخيرهميشود، کواِريها ميتوانند بدون مراجعه به منابع مجدداً محاسبه شوند. کامپيوتر Analysis server ممکن است کامپيوترسرور که تقسيم بنديها در آن انجام شده يا کامپيوتر ديگري باشد. اين امر بستگي به اين دارد که تقسيمبنديها در کجا تعريف شدهاند. حتي اگر پاسخ کواِريها از روي تقسيمات تجميع شده قابل دستيابي نباشند، MOLAP سريعترين پاسخ را فراهم ميکند. سرعت انجام اين کار به طراحي و درصد تجميع تقسيمبنديها بستگي دارد.
مزایاو معایب • مزايا: کارايي عالي- حجمهاي دادهاي MOLAP براي بازيابي سريع دادهها ساخته شدهاند و در فعاليتهاي slice و dice به صورت بهينه پاسخ ميدهند. ترکيب سادگي و سرعت مزيت اصلي MOLAP است. • در ضمنMOLAP قابليت محاسبه محاسبات پيچيده را فراهم ميکند. همه محاسبات پيش از وقتي که حجمهاي دادهاي ساخته ميشود، ايجاد ميشوند. بنابراين نه تنها محاسبات پيچيده انجام شدني هستند بلكه بسيار سريع هم پاسخ ميدهند. • معايب: عيب اين روش اين است که تنها براي دادههايي با مقدار محدود کارکرد خوبي دارد. از آنجا که همه محاسبات- زماني که حجمهاي دادهاي ساخته ميشود، محاسبه ميگردند، امکان اين که حجمهاي دادهاي مقدار زيادي از دادهها را در خود جاي دهد، وجود ندارد.
ROLAP • محدوديت MOLAP در حجم دادههاي قابل پرسوجو و نياز به روشي که از دادههاي ذخيرهشده به روش رابطهاي حمايت کند، موجب پيشرفت ROLAP شد. • مبناي اين روش کارکردن با دادههايي که در پايگاهدادههاي رابطهاي ذخيرهشدهاند، براي انجام اعمال slicing و dicing معمولي است. با استفاده از اين مدل ذخيرهسازي ميتوان دادهها را بدون ايجاد واقعي تجميع در پايگاهدادههاي رابطهاي به هم مربوط کرد. • مزايا: با اين روش ميتوان به حجم زيادي از دادهها را رسيدگي کرد. محدوديت حجم داده در تکنولوژي ROLAP مربوط به محدوديت حجم دادههاي قابل ذخيرهسازي در پايگاهدادههاي رابطهاي است. به بيان ديگر، خود ROLAP هيچ محدوديتي بر روي حجم دادهها اعمال نميکند. • معايب: ممکن است کارايي پايين بيايد. زيرا هر گزارش ROLAP در واقع يک کواِري SQL (يا چند کواِري SQL )در پايگاه دادههاي رابطهاي است و اگر حجم دادهها زياد باشد ممکن است زمان پاسخ کواِري طولاني شود. در مجموع ROLAP سنگين است، نگهداري آن سخت است و کند هم هست. بخصوص زماني که نياز به آدرس دهي جدولهاي ذخيره شده در سيستم چند بعدي داريم. • اين محدوديت ناشي از عملكرد SQL است. زيرا تکنولوژي ROLAP بر پايه عبارات مولد SQL براي پرسش و پاسخ بر روي پايگاه داده رابطهاي است و عبارات SQL به همه نيازها پاسخ نميدهند (مثلاٌ محاسبه حسابهاي پيچيده در SQL مشكل است)، بنابراين فعاليتهاي ROLAP به آن چه SQL قادر به انجام آن است محدود ميگردد.
تفاوت ROLAP ,MOLAPمعرفی HOLAP • تفاوت ROALP و MOLAP : تفاوت اصلي اين دو در معماري آنها است. محصولات MOLAP دادههاي مورد نياز را در يک حافظه نهان مخصوص ميگذارد. ولي ROLAP تحليلهاي خود را بدون استفاده از يک حافظه مياني انجام ميدهد، بدون آن که از يک مرحله مياني براي گذاشتن دادهها در يک سرور خاص استفاده کند. • با توجه به کند بودن ROLAP در مقايسه باMOLAP ، بايد توجه داشت که کاربرد اين روش بيشتر در پايگاه دادههاي بسيار بزرگي است که گاهگاهي پرس و جويي بر روي آنها شکل ميگيرد، مثل دادههاي تاريخي و کمتر جديد سالهاي گذشته. • نکته: اگر از Analysis Services که به وسيله Microsoft OLE DB Provider مهيا شده استفاده ميکنيد، تجميعها نميتوانند براي تقسيمبندي از روش ROLAP استفاده نمايند. • 3. HOLAP: با توجه به نياز رو به رشدي که براي کارکردن با دادههاي بلادرنگ در بخشهاي مختلف در صنعت و تجارت احساس ميشود، مديران تجاري انتظار دارند بتوانند با دامنه وسيعي از اطلاعات که فوراً و بدون حتي لحظهاي تأخير در دسترس باشند، کار کنند. در حال حاضر شبکه اينترنت و ساير کاربردها يي که به دادههايي از منابع مختلف مراجعه دارند و نياز به فعاليت با يک سيستم بلادرنگ هم دارند، همگي از سيستم HOLAP بهره ميگيرند. • تکنولوژيهاي HOLAP تلاش ميکنند مزاياي MOLAP وROLAP را با هم ترکيب نمايند.HOLAP يک نرمافزار معمول است که تراکنشهاي ROLAP وMOLAP را با سرعت بسيار زياد سامان ميدهد. • سرورHOLAP مثلMOLAP دادهها را در يک مدل چندبعدي ذخيره مينمايد. ولي هيچ کپي از دادههاي مبدأ ايجاد نميکند. سرور HOLAP تکنيک حجمهاي دادهاي را براي بالا بردن سرعت کار به کار ميگيرد. هنگاميکه نياز به اطلاعات جزئي هست، HOLAP ميتواند از حجمهاي دادهاي به دادههاي رابطهاي “drill through” انجام دهد. اين روش ابزارهاي تحليل داده-گراي قديمي را با اتصالات فرا متن جديد ترکيب کرده تا ليست دادهها و خصوصيات آنها و ساير انواع اطلاعات را، صرفنظر از نوع آنها، با هم مرتبط ميکند، تا شکل غنيتري از تحليل را براي کاربر مهيا کند. براي کواِريهايي که فقط به دادههاي خلاصهاي که در تجميعها وجود دارند نياز دارند، اين روش مثل MOLAP عمل ميکند. • در آينده ، HOALP به کاربران امکان ميدهد، با دسترسي بلادرنگ به انبارهاي داده و ابزارهاي حمايت از تصميمگيري از طريق مرورگرهاي استاندارد اينترنت، به نوعي تحليل غنيتر که در اختيار کاربر خواهد بود برسند.
اهمیتOLAP • هدف نمايش داده اين است که کاربرانبار داده را از وقوع وقايع مطلع کنيم. از طريق انبار داده که مهيا نمودهايم، ميتوانيم ديد کلاني و یکپارچه بر روي فعاليتهاي تجاري داشته باشيم. حتي ميتوانيم از فنآوري دادهکاوي براي کشف دانشهاي مفيد در امر تحليل بهره بگيريم. همانطور که ميدانيم تکنولوژي OLAP با مدل کردن دادهها در قالب حجمهاي داده، امکان داشتن هم زمان ديد کلي و تفصيلي به دادهها را فراهم کرده است. يعني اين که کاربر ميتواند به دادهها هم در سطح بالا و هم در سطح پايين از فعاليتهاي تجاري دسترسي آسان داشته باشد. علاوه براين با توجه به مدل چندبعدي دادهها در OLAP حجمهاي داده براي دسترسي به اطلاعات در اختيار کاربر هستند، که درنتيجه امکان بريدن داده به قطعات کوچک که مناسب با نيازهاي کاربران باشدرا فراهم مينمايد.به خاطر اين قابليتهاي OLAP نمايش داده در اين روش در مقايسه با روش هاي ديگر بسيار راحت و با کيفيت است و گزارشهاي باارزشي را ارائه مي کنند. به خصوص اگر از ابزارهاي کمکي ديگري مثل صفحات گسترده و نمودارهاي EXCEL نيزاستفاده شود، ارزش و اهميت اين فناوري بسيار بيشتر مشخص ميگردد. ابزارMicrosoft Analysis Manager امکاني را براي ما فراهم مي کند که ماقادر ميسازد دادههاي خود را در قالب نمودارهاي EXCEL به نمايش دراوريم.
بررسی :صنایع مسOUTOKUMPU • محصولات مس شرکت "اتوکامپو" (فنلاند) هر ساله میلیون ها کیلوگرم فلزات پایه مورد فرآوري قرار می دهد. • که در محصولاتی از قبیل تسمه ، مخازن آب آشامیدنی ، و رادیاتورها استفاده می شود. این محصولات درخدمت صنایع الکترونیک ، استخراج از معادن و فلزات ، حمل و نقل و شرکتهاي ساخت و ساز در سراسر جهان قرار می گیرد. اتوکامپو داراي چهار بخش با 13 خطوط کار مستقل در اروپا و امریکا و آسیا است. تعیین سودحجم معاملات مشتریان و سودآوري حاصل از یک محصول ، چگونگی کاهش هزینه هاي تولید از مسایل مهم این شرکت است. ادغام و تجزیه و تحلیل اطلاعات کسب شده از هر واحد چالشی عظیم است ، چرا که بازارفروش در بخش هاي مختلف شامل الزامات به خصوصی است که به نظر نمی رسد با یک سیستم کلی عملی • است. • . راه حل ساخت یک انبار داده واستفاده از یک وب سایت مبتنی بر سرور • لذا OLAPمورد استفاده قرار گرفت. دو مدل به سرعت ساخته شد. یکی براي پشتیبانی از سود حاصل از مشتري و محصولات و دیگري جهت گزارش عملکرد تحویل.
کلام آخر:موفقیت در هوشمندی تجاری، درس های فراگرفته شده و معرفی ابزار • یک گزارش جامع ۲۶۹ صفحهای با عنوان OLAP که در نوامبر ۲۰۰۳ توسط Nigel Pendseمنتشر شده است در مورد این که مزایای BI (Business Intelligence) یا هوشمندی تجاری تا چه حد واقعی و ملموس است، توضیح میدهد. • این گزارش نشان میدهد، تقریباً ۱۹ درصد از شرکتهایی که BI را به کاربردهاند به اهداف تجاری خود یا حتی به چیزی فراتر از آن رسیدهاند. بیش از ۶۰ درصد اذعان داشتهاند که حداقل به قسمت اعظم اهداف تجاری خود دست یافتهاند. • گزارش ” • Nigel Pendseیک فرد با تجربه در زمینهی OLAP شناخته میشود. وی دارای ۲۵ سال سابقه در زمینهی کار با محصولات BI است. در ابتدا وی به عنوان یک کاربر، سپس فروشنده و از سال ۱۹۹۴ به بعد به عنوان یک تحلیلگر صنعتی با محصولات BI تجربه کسب کرده است. وی تهیه کننده اصلی گزارش OLAP است (http://www.olapreport.com)که منابع ارزندهای برای تحلیل عمیق برنامهها، کاربردها، محصولات و بازار OLAP در اختیار ما میگذرد. • فیلم آموزشی کوتاه از بکارگیری OLAP در اکسل در آدرس زیر • http://www.microsoft.com/download/en/details.aspx?displayla • ng=en&id=4512 • دموی نرم افزاری کار با OLAP یک تجربه مفید از آدرس زیر دانلود فرمایید • http://pca.adventureworkscube.prototype.pcapps.com/ • آموزش کوتاه در زمینه نحوه ّبه کارگیری و اجرایOLAP در اسکیوال سرور 2008 • http://www.accelebrate.com/sql_training/ssas_2008_tutorial.htm • پایان نامه سال 2011 توسط آقای احمد طالب برای اخذ درجه دکترا در زمینه بهینه سازی کواری های OLAP چند بعدی • http://spectrum.library.concordia.ca/7388/1/Taleb_PhD_S2011.pdf
منابع • [1] GayatriSathe, SunitaSarawagi. Intelligent Rollups in Multidimensional OLAP Data. VLDB (2001) • [2] Dimitri Theodoratos, Spyros Ligoudistianos, TimosSellis. Designing the Global Data Warehouse with SPJ Views. VLDB (1999) • [3] Jian Yang, Kamalakar Karla alem, Qing Li. Algorithms for Materialized View Design in Data Warehousing Environment. VLDB (1997) • [4] DimitriTheodorados, TimosSellis. Dynamic Data Warehouse. Design.University of Athens (2000) • [5] Martin Ester, Hans-Peter Kriegel, Jörg Sander, Michael Wimmer, XiaoweiXu. Incremental Clustering for Mining in a Data Warehousing Environment. Proceedings of the 24th VLDB Conference USA (1998) • [6] PanosVassiliadis, MokraneBouzeghoub, ChristophQuix. Towards Quality-Oriented Data Warehouse Usage and Evolution. University of Versailles (2000) • [7] YannisKotidis. A DataWarehousing Architecture for Enabling Service Provisioning Process. VLDB (2001) • [8] Nikos Karayannidis, ArisTsois, TimosSellis, Roland Pieringer, Volker Markl, Frank Ramsak,RobertFenk, Klaus Elhardt, Rudolf Bayer. Processing Star Queries on Hierarchically-Clustered Fact Tables. VLDB (2002) • [9] LadjelBellatreche, Kamalakar /karlapalam. Logical and Physical Design in Data Warehousing Environments. VLDB (2000) • کتاب توربان