240 likes | 327 Views
Data Warehousing. انبارداده. انبار داده (Data Warehouse) چیست؟.
E N D
Data Warehousing انبارداده WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
انبار داده (Data Warehouse) چیست؟ • انـبـار داده بـه مجـموعـه ای از داده هــا گفـتـه می شود که از منابع مختلف اطلاعاتی سازمان جمع آوری ، دسته بندی و ذخیره می شود. در واقع یک انبار داده مخزن اصلی کلیه داده های حال و گذشته یک سازمان می باشد که برای همیشه جهت انجام عملیات گزارش گیری و آنالیز در دسترس مدیران می باشد. WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
انبار داده (Data Warehouse) چیست؟ WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
انبار داده (Data Warehouse) چیست؟ • تكنولوژي انبار دادهها شامل مجموعهای مفاهيم و ابزارهای جديدی است كه با فراهم آوردن اطلاعات از دانشگران (افراد اجرايي، مدير و تحليلگر) در تصميم گيری پشتيباني مينمايد. دليل اصلي ساخت انبار داده ها، بهبود كيفيت اطلاعات در سازمان است، در واقع دسترسي به دادهها از هر جا درون سازمان دادهها از منابع داخلي و خارجي تهيه ميشوند و به اشكال گوناگون از دادههای ساختاری گرفته تا دادههای ساخت نيافته مانند فايلهاي متني يا چند رسانهای، در مخزني مجتمع ميشوند. انبار دادهها يا DWH مخزني از اين دادههاست كه به صورتي قابل درك در دسترس كاربران نهايي كسب و كار قرار ميگيرد. • از اواسط سالهای 1980 نياز به انبار دادهها به وجود آمد و دريافتند كه سيستم های اطلاعاتي بايد به صورت سيستمهای عملياتي و اطلاعاتي مشخص شوند. سيستمهای عملياتي از فعاليتهای روزانه كسب و كار پشتيباني مينمايند و برای پاسخگويي سريع به ارتباطات از پيش تعريف شده مناسب هستند. دادههای عملياتي ارائه بيدرنگ و فعلي وضعيت كسب و كار ميباشند. اما سيستمهای اطلاعاتي براي مديريت و كنترل كسب وكار به كار ميروند. اين سيستمها از تجزيه و تحليل دادهها براي اتخاذ تصميم درباره عملكرد آني و آتي سازمان پشتيباني ميكنند و برای در خواستهاي موردی، پيچيده و به طور عمده فقط خواندني طراحي شدهاند.دادههاي اطلاعاتي تاريخي هستند، به عبارتي بيانگر ديدگاه ثابتي از كسب وكار در يك دوره زماني ميباشند. WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
انبار داده (Data Warehouse) چیست؟ • انـبـار داده بـه مجـموعـه ای از داده هــا گفـتـه می شود که از منابع مختلف اطلاعاتی سازمان جمع آوری ، دسته بندی و ذخیره می شود. در واقع یک انبار داده مخزن اصلی کلیه داده های حال و گذشته یک سازمان می باشد که برای همیشه جهت انجام عملیات گزارش گیری و آنالیز در دسترس مدیران می باشد. انبارهای داده حاوی داده هایی هستند که به مرور زمان از سیستم های عملیاتی آنلاین سازمان (OLTP) استخراج می شوند، بنابراین سوابق کلیه اطلاعات و یا بخش عظیمی از آنها را می توان در انبار داده ها مشاهده نمود. • از آنجائیکه انجام عملیات آماری و گزارشات پیچیده دارای بارکاری بسیار سنگینی برای سرورهای پایگاه داده می باشند، وجود انبار داده سبب می گردد که اینگونه عملیات تاثیری بر فعالیت برنامه های کاربردی سازمان (OLTP) نداشته باشد. • همانگونه که پایگاه داده سیستمهای عملیاتی سازمان ( برنامه های کاربردی ) به گونه ای طراحی می شوند که انجام تغییر و حذف و اضافه داده به سرعت صورت پذیرد، در مقابل انبار داده ها دارای معماری ویژه ای می باشند که موجب تسریع انجام عملیات آماری و گزارش گیری می شود (OLAP) . WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
تاریخچه و دلایل استفاده از انبار داده • از اواخر سال 1980 میلادی، انبـار های داده به عنـوان نـوع متـمـایزی از پایـگاه هـای داده مـورد استـفاده اغلـب سـازمـانـها و شرکت های متوسط و بزرگ واقع شدند. انبار های داده جهت رفع نیاز رو به رشد مدیریت داده ها و اطلاعات سازمانی که توسط پایگاه های داده سیستم های عملیاتی غیر ممکن بود، ساخته شدند. • سیستمهای عملیاتی سازمان (OLTP) دارای نقاط ضعفی می باشند که انبار های داده آنها را رفع می کنند. از جمله: • • بار پردازش گزارشات موجب کندی عملکرد برنامه های کاربردی می گردد.• پایگاه های داده برنامه های کاربردی دارای طراحی مناسبی جهت انجام عملیات آماری و گزارش نیستند.• بسیاری از سازمانها دارای بیش از یک برنامه کاربردی ( منابع اطلاعاتی) می باشند، بنابراین تهیه گزارشات در سطح سازمان غیر ممکن می شود.• تهیه گزارشات در سیستمهای عملیاتی غالبا نیازمند نوشتن برنامه های مخصوص می باشد که معمولا کند و پرهزینه هستند. WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
مراحل و نحوه ایجاد انبار داده در سازمان • بسیاری از شرکت ها و سازمانها به این باور رسیده اند که گردآوری، سازمان دهی و یکپارچه سازی داده ها در یک مخزن داده برای مدیریت بهینه و اتخاذ تصمیمات کلان یک ضرورت می باشد. • به طور کلی ساخت یک انبار داده، به شکل یک پروژه شامل مراحل اصلی زیر می باشد: • 1- استخراج داده های تراکنشی از پایگاه های داده به یک مخزن واحدشناخت منابع داده های سازمان و استخراج داده های ارزشمند از آنها یکی از اصلی ترین مراحل ایجاد انبار داده می باشد. 2- تبدیل داده هااز آنجائیکه سیستمهای اطلاعاتی و برنامه های کاربردی یک سازمان غالبا توسط افراد و پروژه های مختلف به مـرور زمان در مواجهـه با نیـازهای جدید سـاخته یا تغییر شـکل داده می شـوند، یکسـان سـازی آنها امری ضروری می باشد.در بسیاری از موارد نیز سیستمهای اطلاعاتی در بستر های مختلف پایگاه داده مانند Microsoft SQL Server ،Oracle ، Sybase ، Microsoft Access و غیره طراحی گردیده اند. بررسی جداول، برقراری ارتباط بین فیلدها و یک شکل سازی داده ها در این مرحله صورت می پذیرد. WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
مراحل و نحوه ایجاد انبار داده در سازمان 3- بارگذاری داده های تبدیل شده به یک پایگاه داده چند بعدیبر خلاف پایگاه داده سیستمهای عملیاتی (OLTP) که دارای معماری رابطه ای می باشند و از اصول نرمالیزه استفاده می کنند، طراحی انبار داده به شکلی ویژه بدون بهره گیری از اصول نرمالیزاسیون می باشد. درانبار داده فیلدها در جاهای مختلفی تکرار می شوند و روابط بین جداول کمتر به چشم می خورند. علت آن هم افزایش سرعت پردازش اطلاعات هنگام گزارشات و عملیات آماری می باشد. • 4- تولید مقادیر از پیش محاسبه شده جهت افزایش سرعت گزارش گیریمـقادیر از پیـش محاسـبه شده را تراکـم نیـز مـی نامـند. ایـن مرحلــه توســط سیستـمهایی نظــیر Microsoft SQL Server Analysis Services بسیار ساده تر شده است. ایـن تراکم ها کـه در ابـعاد مختلـف انبار داده سـاخته می شوند، موجب می شوند که سرعت انجام عملیات گزارش گیری به شکل محسوسی افزایش یابد. بایدتوجه داشت که عملیات ساخت این مقادیر بسیار زمان گیر بوده و نیازمند حافظه زیادی بر روی سروراست. 5- ساخت ( یا خرید ) یک ابزار گزارش گیریپس از انجام مراحل فوق، شـما می توانـید نسبـت به ساخت یا خـرید یـک نرم افزار گزارش گیـری تصمیم گیری نمایید. به طور معمـول هزینه سـاخت یک نرم افزار گزارش گـیری، بالاتـر از هزینـه خریـد آن از یک شرکت خارجـیمی شود. WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
ويژگيهاي اصلي دادههای انبار دادهها • دادههای موجود در انبار دادهها از سيستمهای عملياتي متنوع (نظير سيستمهاي پايگاه دادهها) و منابع دادهای خارجي (نظير پايگاه دادههای آماری و WWW )يكپارچه ميشوند. تفاوتهای ساختاری ومعنايي دادهها بايد پيش از يكپارچه سازی انسجام يابند. براي مثال دادهها بايد مطابق با مدل دادهای يكپارچه "همگن" شوند. بعلاوه، مقادير دادهاي سيستمهاي عملياتي بايد پاك شوند تا دادههای صحيحي در انبار دادهها وارد شوند. • نياز به دادههای تاريخي يكي از موارد مهم درشيوه انبار دادههاست. دادههای تاريخي برای تحليل روند كسب وكارضروری هستند. البته هزينه نگهداری اين گونه دادهها نيز بايد مورد توجه قرار گيرد. بعلاوه، دادههای انبار دادهها ثابت هستند، براي مثال دسترسي به DWH از نوع خواندني است. انجام اصلاحات در اين دادهها فقط هنگامي صورت ميگيرد كه اصلاحات دادههای منبع در انبار انتشار يابند. DWH دادههای ديگری به نام دادههای اشتقاق يافته (derived data) دارد. اين دادهها به طور صريح در منابع عملياتي ذخيره نميشوند، بلكه در حين بعضي از فرايندها از دادههای عملياتي، اشتقاق مييابند. برای مثال دادههای فروش را ميتوان در سطوح مختلف (هفتگي، ماهانه، فصلي) در انبار ذخيره نمود. WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
ويژگيهاي اصلي دادههای انبار دادهها WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
سيستمهاي انبار دادهها • سيستم انبار دادهها (DWS)شامل انبار دادهها و همه مولفههايي است كه براي ساخت، دستيابي و نگهداری DWH به كار ميروند. انبار دادهها بخش مركزی سيستم انبار دادهها را تشكيل ميدهد. گاهي اوقات انبار دادهها حجم عظيمي از اطلاعات را در واحدهای منطقي كوچكتر به نام Data Mart نگهداري ميكند. مولفه آماده سازی، مسووليت كسب يا دريافت دادهها را بر عهده دارد. اين مولفه شامل همه برنامهها وبرنامههای كاربردیای است كه مسوول استخراج دادهها از منابع عملياتي هستند. مولفه دستيابي شامل برنامههای كاربردی مختلف (OLAP يا برنامههای كاربردی داده كاوی) است كه امكان استفاده از اطلاعات ذخيره شده در انبار دادهها را فراهم ميآورند. • مولفه مديريت Metadata، وظيفه مديريت، تعريف و دستيبابي به انواع مختلف Metadataرا بر عهده دارد. در اصل ،Metadata"دادههايي درباره دادهها" يا "دادههايي است كه مفهوم دادهها را توصيف ميكنند". انواع مختلف Metadataدر انبار دادهها وجود دارند. مثلا اطلاعاتي درباره منابع عملياتي، ساختار دادههاي DWH و كارهايي كه در حين ساخت، نگهداري و دستيبابي به DWH انجام ميشوند. نياز به Metadata شناخته شده است. پياده سازي يك DWS منسجم ،كار پيچيده و دشواري است و شامل دو فاز مي باشد. درفاز اول كه پيكربندي DWS نام دارد، ديدگاه مفهومي انبار دادهها مطابق با نيازمنديهای كاربر مشخص ميشود. سپس منابع دادهای دخيل و روش استخراج و بار گذاري در انبار دادهها تعيين ميگردد. سرانجام، درباره پايگاه دادههای مورد نظر و روشهای دستيبابي دادهها تصميم گيری خواهد شد. پس از بار گذاري اوليه، در فاز عمليات DWS بايد دادههای انبار دادهها به منظور منظم refresh شوند. WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
طراحي انباردادهها • روشهای طراحي انباردادهها امكان پردازش كارآمد query را برروي حجم عظيمي از دادهها فراهم ميآورند. نوع ويژهای از الگوی پايگاه دادهها به نام star برای مدل سازی انباردادههای چند بعدی به كار ميرود. در اين حالت، پايگاه دادهها از يك جدول مركزی واقعيت يا fact و جداول چند بعدي تشكيل شده است. جدول واقعيت حاوی tuple هايي است كه بيانگر واقعيتهاي كسب و كار مانند فروش يا عرضه هستند. هر tuple جدول واقعيت به tupleهای جدول چند بعدي اشاره دارد. هرtuple جدول چند بعدي مواردي نظير محصولات، مشتريان، زمان و فروشنده را نشان ميدهد. • مدل چرخه حیات انبار داده ها WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
انبار دادههای مجازی • هدف انباردادههای مجازی، پياده سازي سريع انباردادهها بدون نياز به ذخيره سازي و نگهداری كپيهاي متعدد از دادههای منبع است. اغلب، انباردادههاي مجازی به سازمانها كمك ميكند تا به نياز واقعي كاربران نهايي پي ببرند. كاربران نهايي ميخواهند به طور مستقيم به دادههاي منبع بي درنگ با كمك ابزارهای توانمند شبكهای دسترسي پيدا كنند. معايب اين روش عبارتند از: • - كيفيت و سازگاري دادهها تضمين نميشود. زيرا فعاليتهای آماده سازی دادهها صورت نميگيرند. • - به طور معمول، دادههای تاريخي وجود ندارند. • - زمان دسترسي كاربر نهايي بسته به وجود يا عدم وجود منابع عملياتي، بار شبكه و پيچيدگي درخواست، غير قابل پيش بيني است. WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
مولفه انبارها در سازمان مؤلفه هاي يك انبار داده در شكل زير آمده است. WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
طراحي پايگاه داده ها همانطور كه گفته شد پايگاه داده ها در يك انبار داده ها به صورت نرمال طراحي نمي شود و بلكه پايگاه داده ها به صورت چندبعدي طراحي مي شود. به عنوان مثال در طراحي اطلاعات نگهداري شده براي فروش، زمان فروش، ناحيه فروش، فروشنده و محصول به فروش رفته به عنوان ابعاد مختلف در نظر گرفته ميشوند. با توجه به آنكه اين بعدها به زير وجود دارد: schema صورت سلسله مراتبي 11 تعريف شوند يا خير، دو از اين روش براي ايجاد مدل داده چندبعدي استفاده ميشود. در DWH در بيشتر : Star schema • ركورد fact و تعدادي جدول مجزا براي ابعاد است. در جدول fact اين مدل، پايگاهداده شامل يك جدول اطلاعاتي شامل تعدادي اشارهگر (كليد خارجي) به جداول ابعاد و مقادير مربوط به معيارهاي عددي است. ها به همراه كليدها در جداول ابعاد قرار ميگيرند. Attribute در اين مدل يك يا بيش از يك جدول بعد به صورت سلسله مراتبي : Snowflake schema • داده ها در آن سريعتر است. ولي load مي باشند. اين مدل نسبت به مدل قبل انعطاف پذيرتر است و زمان مديريت آن بسيار سخت تر است و اثر منفي در مدت زمان گزارشگيري دارد. WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
طراحي پايگاه داده ها fact مشخصات جدول • شامل اطلاعات عددي سازمان است. • حجم بسيار بالايي از داده ها را دربر دارد. • رشد بسيار سريعي دارد. • مي تواند شامل داده هاي پايه، مشتق شده و سرجمع باشد. • با دريافت كليد خارجي به جداول ابعاد متصل است مشخصات جدول بعد: • شامل اطلاعات متني سازمان است. • شامل داده هاي ايستا مي باشد. متصل است. Fact با انداختن كليد خارجي به جدول . WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
طراحي پايگاه داده ها در ادامه به ترتيب يك طراحي به روش آمده است.Snowflake schema و star schema WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
طراحي پايگاه داده ها WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
طراحي پايگاه داده ها همانطور كه از نام اين فرآيند مشخص است شامل سه مرحله واكشي اطلاعات از منابع داده اي، تغيير شكل و پالايش آنها و ذخيره سازي آن در انبار داده ها مي باشد. مرحله واكشي اطلاعات : داده ها در قالبهاي مختلف ( پايگاه داده هاي مختلف، انواع فايلها و حتي در سيستمهاي عامل متفاوت ) در نقاط مختلفي در سازمان پراكنده اند، در اين مرحله فيلدهاي اطلاعاتي از منابع داده اي استخراج مي شود. مرحله پالايش اطلاعات : در اين مرحله داده ها پالايش شده و به صورت موضوع گرا در مي آيند. WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
طراحي پايگاه داده ها WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
طراحي پايگاه داده ها WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه
فواید داشتن معماری انبار کالا داده ها ارائه یک چهارچوب سازمان: این معماری، خطوطی را بر اساس جزئیات فردی ترسیم می کند ،اینکه چه کسانی عهده دار کدام بخشها هستند. انعطاف پذیری و نگهداری بهبود یافته: به شما اجازه می دهد سرعت منابع داده های جدیدرا افزایش دهید. توسعه و استفاده مجدد سریعتر: توسعه دهندگان انبار کالا بهتر می توانند فرآیند داده های انبار کالا را درک کنند محتویات داده های پایه و نقشهای کار با سرعت بیشتر. ابزار های ارتباطی و مدیریتی : انتظارات را تعریف کنید، نقش ها و مسئولیت ها را تعیین کنید و برای فهمیدن نیاز های مشتریان با آنها ارتباط برقرار کنید. هماهنگ کردن تلاشهای همزمان : تلاشهای چند گانه مستقل، یک شانس برای پوشش موفقیت آمیز دارند.همچنین های بازار های داده بدون معماری ، لوله بخاری های آینده خواهند شد. اطلاعات در محیط کاری امروزه اساسی هستند. انبار کالا داده ، داده ها به اطلاعاتی که در ثبات و هوش سازمانی نقش دارد ، تغییر شکل می دهند. انبار کالا داده ، به عنوان سرمایه مهم در سرمایه گذاری محسوب می شود. انبار کالا داده می تواند پایه ای از کار برای تحصیل فواید رقابتی باشد و آینده ای روشن برای آن قابل پیش بینی است. WWW.pupuol.COM پوپول مرجع دانشگاه ومدرسه