1 / 158

تئوری اطلاعات تهیه کننده : مهندس سید محمد مدنیان

تئوری اطلاعات تهیه کننده : مهندس سید محمد مدنیان دانشجوی کارشناسی ارشد مدیریت صنعتی دانشگاه نجف آاباد کارشناسی مهندسی الکترونیک دانشگاه نجف آباد بهار 1392. از هرگونه کپی و قرار دان برروی سایتهای دیگر جدا خودداری شود حاصل تلاش چندین روز است حق کپی رایت فقط سایت مدیر

calla
Download Presentation

تئوری اطلاعات تهیه کننده : مهندس سید محمد مدنیان

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. تئوری اطلاعات تهیه کننده : مهندس سید محمد مدنیان دانشجوی کارشناسی ارشد مدیریت صنعتی دانشگاه نجف آاباد کارشناسی مهندسی الکترونیک دانشگاه نجف آباد بهار 1392

  2. از هرگونه کپی و قرار دان برروی سایتهای دیگر جدا خودداری شود حاصل تلاش چندین روز است حق کپی رایت فقط سایت مدیر کلیه حقوق مخصوص سایت مدیر

  3. مقدمه در طول دو دهه گذشته نفت به عنوان یک کالای استراتژیک و رقابتی همواهر مطرح بوده است. اما در طول سالهای اخیر پیشرفت های تکنولوژیکی از اهمیت این کالا کاسته و روز به روز به روز بر اهمیت منبعی دیگر که شاید برای خیلی ها هنوز ناشناخته باشد و اطلاعات نام دارد افزوده است . ( کریم زاده اطلاعات و تکنولوژی با یکدیگر در تعامل هستند و بر یکدیگر اثر می گذارند و باعث پیشرفت یا رکود یکدیگرمی شوند در این میان حجم عظیمی از اطلاعات تولید می گردد که اگر از سازماندهی منسجم و قوی برخوردارد نباشد نه تنها به سدی محکم در مقابل پیشرفت تکنولوژی تبدیل می شود بلکه حیات سازمان را نیز به خطر می اندازد از این رو نگرش سیستمی در مورد اطلاعات از اهمیت خاصی برخوردارمی شود و اطلاعات در قالب یک سیستم اطلاعاتی مطرح می گردد در این جا این سوال پیش می اید که چرا باید سیستمهای اطلاعاتی را مطالعه کرد ؟ طرح این سوال مانند این است که بپرسیم که چرا باید مباحث مدیریت مالی ، تحقیق در عملیات بازار یابی و سایر بخشهای اصلی فعالیت های یک سازمان کسب و کار را مطالع کرد

  4. داده، اطلاعات و دانش سيستمهاي اطلاعات براي دستيابي به اهداف گوناگوني طراحي شده اند . يكي ازاهداف اساسي، پردازش اقتصادي داده و تبديل آن به دانش و اطلاعات است . اجازه بدهيد به تعريف اين مفاهيم بپردازيم. اقلام داده به توصيف ابتدايي از اشياء، رويدادها، فعاليت ها و تراكنشهايي كه ثبت، دسته بندي و ذخيره شده ، ولي براي هدف خاصي سازماندهي نگرديده اند، مي پردازد. اقلام داده ممكن است عدد، حرف، شكل، صدا يا تصوير باشند . نمره يك دانش آموز و يا تعداد ساعات كار يك كارمند در طول يك هفته، داده محسوب مي شوند . يك پايگاه داده شامل داده هايي است كه با هدف بازيابي، سازماندهي شده اند. اطلاعات، داده اي است كه به گونه اي سازماندهي شده كه براي گيرنده مفهوم وارزش دارد . به طور مثال، معدل يك دانش آموز، اطلاعات است . گيرنده آن را تفسيرمي نمايد و نتايج و مفاهيمي را به طور ضمني استنتاج مي كند.

  5. اقلام داده معمولا بوسيله نرم افزار كاربردي، پردازش و به اطلاعات تبديل ميشوند. چنين پردازشي نسبت به بازيابي وخلاصه سازي ساده يك پايگاه داده، كاربرد مشخصتر و ارزش افزوده بيشتري به همراه دارد. نرم افزار كار بردي ممكن است يك سيستم مديريت موجودي مبتني بر وب، سيستم ثبت نام برخط دانشگاه يا يك سيستم خريد و فروش اينترنتي باشد. دانش، متشكل از داده يااطلاعاتي است كه به منظور مفاهمه،انتقال تجربه آموخته ها ومهارت سازماندهي شده و براي حل مشكل جاري ياانجام يك فعاليت ،به كارگرفته ميشوند. داده هايي كه بمنظور استخراج مفاهيم اساسي وبازتاب تجربيات ومهارتهاي گذشته پردازش ميشوند، براي گيرنده، دانش سازماني به ارمغان مي آورند كه ارزش بالقوه فراواني دارد . اخيراً مديريت دانش نيز به يكي از داغترين مباحث در حوزه فناوري اطلاعات تبديل شده است. داده ها، اطلاعات و دانش ميتوانند وروديهاي يك سيستم اطلاعاتي يا خروجيهاي آن باشند. براي مثال، داده هاي مربوط به كارمندان، حقوق ومدت زمان كارشان (ورودي) با هدف توليد اطلاعات ليست حقوق (خروجي)، پردازش ميشوند. اطلاعات ليست حقوق نيز بعداً ميتواند به عنوان ورودي براي سيستم ديگري كه به بودجه بندي يا توصيه به مديران دربارة ميزان حقوقها ميپردازد، به كار رود.

  6. داده تعريف اول- نمايش ذخيره‌شده اشياء فيزيكي، چيزهاي مجرد، بوده‌ها، رويدادها يا چيزهاي قابل مشاهده كه در تصميم‌سازي بكار مي‌آيند. تعريف دوم- هر مجموعه‌اي از بوده‌ها تعريف سوم- بوده‌هاي خام كه معناي اندكي دارند مگر اينكه به صورت منطقي سازماندهي شده باشند. تعریف چهارم : داده ها شامل واقعیت ها و اشکالی هستند که برای کاربر بی معنی هستند تعریف پنجم : داده به مطالبی گفته می شود که وارد کامپیوتر می گردند تا عملیات پردازش برروی آنها انجام شود

  7. تعریف بیت (BIT)، بایت (BYTE) و کلمه (WORD) : كوچكترين قسمت از اطلاعات باينري را بيت مي گويند. 8 بيت يك بايت و 16 بيت ( دو بايت) يك كلمه را مي سازند . كوچكترين ذره اطلاعاتي را بيت گويند.در سيستم دو دوئي يكي از دو حالت صفر (0) و يك (1)، يك بين اطلاعات است از تركيب چند بيت اطلاعات، بايت بوجود مي آيد.

  8. تعريف داده از ديدگاه ANSI نمايش بوده‌ها، پديده‌ها، مفاهيم يا شناخته‌ها به طرزي صوري و مناسب براي برقراري ارتباط، تفسير يا پردازش توسط انسان يا هر امكان خودكار هر نمايشي اعم از كاراكتري يا كميتهاي قياسي كه معنايي به آن قابل انتساب باشد.

  9. تعریفداده: • داده مقداری حقیقی است.داده ”data”از ریشه do و dare به معنی انجام دادن است,مناسبترین واژه ای است که به واقعیات شکل نیافته و بدون ساختار اطلاق میشود. • از وقایعی که اتفاق می افتد داده تولید می شود.به عبارت دیگر داده محصول فرعی رخدادها ست.

  10. مبانی مرتب سازی و دستیابی داده ها • سلسله مراتب داده ها(Data Hierarchy): یک بیت، کوچکترین واحد داده قابل پردازش در رایانه؛ یک بایت، مجموعه ای از بیت ها که یک کاراکتر ساده را معرفی می کند.یک رشته ترتیبی ازکاراکتر ها را گویند. • فیلد(field): یک رشته معنی دار یا یک ترکیب منطقی از کاراکتر ها به صورت یک کلمه را گویند. • رکورد(record): یک ترکیب منطقی از فیلد های مرتبط به هم که بیان کننده صفات یک پدیده است. • فایل(پرونده): یک ترکیب منطقی از از رکورد های مرتبط به هم در بر دارنده رکوردهای موجودیت ها ی همگن است مانند پرونده دانشجویان .

  11. مبانی مرتب سازی و دستیابی داده ها (ادامه) • پایگاه داده(Database): ترکیب منطقی از فایل های مرتبط به هم که بیانگر پدیده های متصل بهم در یک حوزه کاری است. • موجودیت(entity): یک شخص، مکان، شی، یا یک رویداد در ارتباط با اطلاعاتی که در یک رکورد نگهداری می شود. • موجودیت(entity): مفهوم کلی آنچه می خواهیم در موردش اطلاع داشته باشیم. • دانشجو،استاد،درس • صفت(attribute): هر ویژگی یا کیفیتی که یک مشخصه را توصیف می کند. • نام دانشجو،شماره دانشجویی،سال ورود

  12. مبانی مرتب سازی و دستیابی داده ها (ادامه) • کلید اولیه(primary key): یک فیلد شناسه که به تنهایی یک رکورد را مشخص و متمایز می کند. • شماره دانشجویی • کلید ثانویه(secondary key): یک فیلد شناسه که بعضی از اطلاعات شناسایی را دارد، اما نوعا یک فایل را با دقت کامل شناسایی نمی کند. • نام خانوادگی دانشجو

  13. چرخه حيات “داده” داده، در يك سيستم اطلاعات مديريت چرخه حيات خاص خود را دارد. در مراحل ايجاد، طراحي و عمليات سيستمهاي اطلاعاتي، سه جنبه اين چرخه حيات از اهميت ويژه اي برخوردار است. نخست طراح بايد بداند داده چگونه توليد ميشود. دوم وي بايد بداندچه پردازشي يا تلفيقي بر روي داده هاصورت ميپذيرد و سرانجام طراح بايد بداند كه انواع معين پردازش اطلاعات بويژه انتقال داده، و تبادل و ذخيره سازي و بازيابي داده ها چگونه انجام مي شود.

  14. چرخه حيات داده داده ها در یک سیستم اطلاعاتی مدیریت ، چرخه حیات خاص خود را دارد . سه مرحله با اهمیت این چرخه عبارتنداز ( - ایجاد  - طراحی - عملیات ) . 1) اولین نکته ای که باید طراح بداند این است که داده چگونه تولید می شود . 2) باید بداند چه نوع پردازشی یا تلفیقی روی داده انجام شده است . 3) طراح باید بداند که انوع معین پردازش اطلاعات به ویژه انتقال و تبادل و ذخیره سازی و باز یابی داده ها چگونه انجام می شود همچنان که شکل اسلاید بعدی نشان میدهد تولید مجدد داده ها میتواند در نقاط گوناگون چرخه حیات داده صورت پذیردو بنابراین در نمودار چرخه حیات داده نشان داده نشده است

  15. چرخه حيات داده

  16. چرخه حیات ”داده 1- تولید داده :تولید با ایجاد داده که در خانه سمت چپ آمده است میتواند به دلیل تعامل داخلی یا رخداد خارجی باشد 2- ذخیره داده : تولید داده نتیجه پدیده داخلی یا خارجی سازمان بوده که مشاهده و ثبت شده است تجربیات ، داد و ستد ها و عملیات تولید داده برنامه ریزی شده اند داده ها را به طور معمول برروی سند یا پایگاه اطلاعاتی ذخیره میکنند اگر داده ای بی ارزش باشد محو میگردد 3-انتقال داده : داده ها در چرخه حیات به طور مکرر از فرآیندی به فرآیند دیگری منتقل میشوند 4-بازیابی داده :بازیابی داده از سیستم مدیریت پایگاه اطلاعاتی به سهولت صورت میپذیرد زیرا داده ها مستقل از برنامه ها و کاربران نگهداری می شوند 5- تولید مجدد: داده هاباید را باید سازماندهی مجدد کرد تا قابل استفاده باشند

  17. چرخه حیات داده (ادامه ) • 6- ارزیابی داده : • داده ها باید ارزیابی شوند تا معین شود که به پردازش بیشتر نیاز دارد یا نه؟ • 7- دسته بندی داده : • داده ها چون بطور تصادفی جمع آوری میشوند، وبرای اینکه قابل استفاده گردند باید جداسازی صورت پذیرد حتی داده هایی که جداسازی و دسته بندی شده اند نیز ممکن است برای قابل استفاده شدن نیازمند دسته بندی جدیدی باشند برای مثال ، اعدا و ارقام فروش محصولات یک فروشگاه ممکن است براساس فروشنده ذخیره شده باشند ولی جداسازی انها برحسب محصول یا مشتری مورد نیاز باشد . • 8- تحلیل داده : • داده ها را میتوان پیش از استفاده یا شناسایی زمینه های مورد استفاده ، روند ها و رخدادها ی غیر معمول و با تعبیر و تفسیر تحلیل کرد.

  18. چرخه حیات داده (ادامه ) • 9- حسن استفاده: • شکل داده ها را می توان به کمک جمع و تفریق ويا فرمولهای رياضیتغییر داد. • 10 - ترکیب: • تلفیق دادهای متعدد اغلب ایجاب میکندآنها رادريک مجموعه کامل يا گزارش کاملسازمان دهی کنیم. • 11- به کار گیری: • داده ها وقتی به شکل معنی دار درمي آيند تبديل به اطلاعات و پس از مصرف بصورت ”داده“در می آيند،لذا در مورد نوع ذخيره سازی آنها بايد تصميم گيری شود • 11-محو: • داده ها را پس از ارزیابی میتوان محو کرد.برای مثال اطلاعا مربوط به قرار ملاقات ها یا مکان برگزاری سمینارهای داخلی سازمان یا برنامه های مربوط به مهمانیها ی سالانه سازمان پس از وقوع هیچگونه ارزشی ندارد

  19. انواع داده: داده های ورودی داده های ذخیره شونده داده های خروجی 1- داده های ورودی: داده هائی که به وسیله سخت افزار دریافت میشود 2- داده های ذخیره شونده: داده هائی است که بر روی سخت افزار ذخیره شده اند 3- داده های خروجی: داده هایی است که از پردازش داده های ورودی به وسیله سخت افزار تولید شده است

  20. پردازنده اصلی مجوز گوهینامه مجوز رسید حق مجوز خلاصه گزارش روزانه گزارش تغییرات روزانه انواع سه گانه داده برای سیستم صدور مجوز تقاضا نامه گواهینامه دوره آموزش حرفه ای • حرفه ای پرونده اصلی مراکز اموزش 21

  21. توضیح شکل اسلاید قبلی : سیستم تقاضانامه های صدور مجوز و گواهینامه های آموزش حرفه ای ( داده های ورودی ) ر ادریافت می دارد وبه داده های ذخیره شده مربوط به مجوزها و مراکز آموزش حرفه ای ( داده های ذخیره شده ) نیز دسترسی دارد و رسید دریافت وجه گواهینامه مجوز و دو نوع گزارش ( داده های خروجی ) تولید می کند

  22. انواع داده هاي سازماني 1- داده هاي وضعيتي : اين داده ها بيانگر عملي خاص در زمان معين هستند .مانند داده هايي كه بيانگر سطح موجودي در يك زمان خاص هستند.   2- داده هاي مبادلاتي : اين داده ها وقايع گذشته را شرح مي دهند  مانند داده هايي كه بيانگر دريافت رسيد سفارش فروش ،استخدام پرسنل و پذيرش بيمارهستند. 3- داده هاي عملياتي : اين داده ها بيانگر روش انجام عمليات و ساير توضيحات لازم در زمينه هر يك از عمليات می باشند . 4- داده هاي مهندسي : نقشه هاي مهندسي ،سياهه مواد هر محصول توليدي و غيره جزءداده هاي مهندسي به حساب مي آيند . 5- داده هاي نوشتاري : اين داده ها شامل مكاتبات ،گزارشات بازرگاني ،اسناد ،نمودارها و تصاوير مي باشند .

  23. مديريت “داده ها” سازمانهابراي مديريت مناسب هر منبع بايد نقشي راكه آن منبع ايفا ميكند،خواص آن و فرصتهايي را كه فراهم مي آوردوگامهايي را كه براي استفاده از اين فرصتها بايد برداشته شود بشناسند اما در حاليكه داده هاامكانات عظيمي را ارائه ميدهند چالشهاي خاصي را نيزفراهم مي آورند. برای مثال برخلاف سایرمنابع داده ها را میتوان بسهولت کپی کرد و با استفاده ازفناوری اطلاعات میتوان بادیگران در میان گذاشت وآنگاه به دهها راه متفاوت میتوان آنهارا بکارگرفت این در حالی است که توزیع اثر بخش داده ها بندرت صورت میپذیرد و در عوض بیشتر افراد واحدهای سازمانی آگاهانه یا ناآگاهانه داده هارا احتکار میکنند که منجربه جنگ سیاسی وحشیانه بر سر مالکیت آنها می گردد حتی در وضعیتهایی که داده ها مبادله میشود افراد و واحدها نسخه مخصوصی از آنرا تهیه کرده و اصلاح میکنند ناسازگاریهای ناشی از آن هدف تبادل داده ها را با شکست مواجهه میکنند از این گذشته برای سازمان ها اعمال خط مشی های گوناگون استفاده از داده ها و حفظ محرمانه بودن آنها دشوار است افرا د داده ها را با این هدف وارد کامپیوتر می کنند که برروی سخت افزار ذخیره شوند و داده های ذخیره شده برای ایجاد گزارش های گوناگون پیام ها و نمایش به طرق مختلف قابل دستیابی و پردازش خواهد بود

  24. فراداده‌ها: هدف هر سازمانی باید این باشد که تمام رسانه‌هایی را که به ‌کار می گیرد، بتواندمدیریت و آرشیو کند. و اینجاست که به فراداده‌ها (Metadata) نیاز داریم. فراداده‌هاهمان اطلاعاتی هستند که فرضا با استفاده از یک برچسب، بر پشت یک عکس الصاقمی‌‌کنیم. اما در همین حال، در دنیای داده‌های دیجیتال باید این فراداده‌ها رابه‌طور جداگانه مدیریت کنیم. در واقع، فراداده‌ها اطلاعاتی توصیفی هستند و مربوط بهحقوق و مجوزهای داده‌ها می باشند. پس به این ترتیب داده‌ها با اطلاعات دیگری که بهارزش پایگاه داده‌رسانی ما می‌‌افزایند، یعنی با فراداده ها کاملمی‌‌شوند. مدیریت داده‌های شرکتی: هدف مدیریت داده‌های شرکتی انباشت و مدیریت کل اطلاعات و محتوای یک شرکت استبرای رسیدن به چنین هدفی،کارکردهای دنیای سنتی آرشیو، سند وگردش کارهای مدیریتی باید با الزامات مدیریت محتواهماهنگ شود.به این ترتیب امکان ادغام مؤلفه‌های وب پایه با محصولات سنتی فراهم می‌‌شود

  25. تاریخچه پایگاه داده مفهوم پایگاه داده ازدهه ی ۱۹۶۰ برای کاهش مشکلات فزاینده درطراحی، ساخت، و نگهداشت سسیستمهای اطلاعاتی (معمولاً با تعداد زیادی کاربرِ نهایی همزمان،وباتعداد زیادی داده ی مختلف)ایجاد شده‌است.این مفهوم به همراه مفهوم سیستم‌های مدیریت پایگاه داده که دستکاری مؤثر و کارا به پایگاه داده‌ها را ممکن میکند رشد کرده‌است. اولین کاربردهای اصطلاح پایگاه داده به ژوئن ۱۹۶۳ باز میگردد،یعنی زمانی که شرکت System Development Corporationمسئولیت اجرایی یک طرح به نام«توسعه و مدیریت محاسباتی یک پایگاه داده‌ای مرکزی» رابرعهده گرفت. پایگاه داده به عنوان یک واژه واحد در اوایل دهه ۷۰در اروپاودراواخردهه۷۰ در خبر نامه‌های معتبرآمریکایی به کاررفت.(بانک داده‌ای یادراوایل سال ۱۹۶۶ در روزنامه واشینگتن پست کار رفت)اولین سیستم مدیریت پایگاه داده در دهه ۶۰ گسترش یافت. از پیشگامان این شاخه چارلز باخمن می‌باشد. مقالات باخمن این را نشان داد که فرضیات او کاربرد بسیار مؤثرتری برای دسترسی به وسایل ذخیره سازی را مهیا میکند.

  26. تاریخچه پایگاه داده درآن زمانها پردازش داده بر پایه کارت‌های منگنه و نوارهای مغناطیسی بودکه پردازش سری اطلاعات را مهیا میکند.دونوع مدل داده‌ای درآن زمانه ایجاد شد:CODASYL موجب توسعه مدل شبکه‌ای شدکه ریشه در نظریات باخمن داشت ومدل سلسله مراتبی که توسطNorthAmerican Rockwell ایجاد شدو بعداً با اقباس ازآن شرکت IBM محصولIMS را تولید نمود. مدل رابطه‌ای توسط E. F. Coddدر سال ۱۹۷۰ ارائه شد.او مدلهای موجود رامورد انتقاد قرار میداد.برای مدتی نسبتاً طولانی این مدل درمجامع علمی موردتأییدبود.اولین محصول موفق برای میکروکامپیوترها dBASEبودکه برای سیستم‌عاملهایCP/Mو PC-DOS/MS-DOSساخته شد.

  27. تاریخچه پایگاه داده در جریان سال۱۹۸۰ پژوهش برروی پایگاههای مدل توزیع شده و ماشینهای پایگاهی database machines متمرکز شد، اما تأثیرکمی بر بازار گذاشت.در سال ۱۹۹۰ توجهات به طرف مدل شیء گرا جلب شد. این مدل جهت کنترل داده‌های مرکب لازم بود و به‌سادگی بر روی پایگاه داده‌های خاص، مهندسی داده(شامل مهندسی نرم‌افزار منابع) و داده‌های چند رسانه‌ای کار می‌کرد. در سال ۲۰۰۰ نوآوری تازه‌ای رخ داد و پایگاه اکس‌ام‌ال (XML) به وجود آمد. هدف این مدل از بین بردن تفاوت بین مستندات و داده‌ها است و کمک می‌کند که منابع اطلاعاتی چه ساخت یافته باشند یا نه در کنار هم قرار گیرند.

  28. مفهوم پایگاه داده پایگاه داده‌ها (دادگان یا بانک اطّلاعاتی) به مجموعه‌ای از اطّلاعات با ساختار منظم و سامانمند گفته میشود.پایگاه‌های داده‌هامعمولاً درقالبی که برای دستگاههاورایانه‌هاقابل خواندن و دسترسی باشدذخیره میشوند.البته چنین شیوه ذخیره‌سازی اطلاعات تنهاروش موجود نیست وشیوه‌های دیگری مانندذخیره‌سازی ساده درپرونده‌هانیزاستفاده میگردد.آنچه ذخیره‌سازی داده‌هادر پایگاههای داده‌هارامؤثرمیسازدوجودیک ساختار مفهومی برای ذخیره‌سازی وروابط بین داده‌ها است. پایگاه داده دراصل مجموعه‌ای سازمان یافته از اطلاعات است.این واژه از دانش رایانه سرچشمه میگیرد،اما کاربرد وسیع و عمومی نیز دارد، این وسعت به اندازه‌ای است که مرکز اروپایی پایگاه داده(که تعاریف خردمندانه‌ای برای پایگاه داده ایجاد میکند)شامل تعاریف غیر الکترونیکی برای پایگاه داده میباشد. در این نوشتار به کاربردهای تکنیکی برای این اصطلاح محدود می‌شود.

  29. مفهوم پایگاه داده ( ادامه ) یک تعریف ممکن این است که:پایگاه داده مجموعه‌ای از رکوردهای ذخیره شده در رایانه با یک روش سیستماتیک (اصولی) مثل یک برنامه رایانه‌ای است که میتواند به سؤالات کاربر پاسخ دهد. برای ذخیره و بازیابی بهتر، هر رکورد معمولاً بصورت مجموعه‌ای از اجزای داده‌ای یا رویدادها سازماندهی میگردد. بخش‌های بازیابی شده در هر پرسش به اطلاعاتی تبدیل می‌شود که برای اتخاذ یک تصمیم کاربرد دارد. برنامه رایانه‌ای که برای مدیریت و پرسش و پاسخ بین پایگاه‌های داده‌ای استفاده می‌شود را مدیر سیستم پایگاه داده‌ای یا به‌اختصار DBMSمی‌نامیم. خصوصیات و طراحی سیستم‌های پایگاه داده‌ای در علم اطلاعات مطالعه می‌شود. مفهوم اصلی پایگاه داده این است که پایگاه داده مجموعه‌ای از رکوردها یا تکه‌هایی از یک شناخت است.نوعاً در یک پایگاه داده توصیف ساخت یافته‌ای برای موجودیت‌های نگه داری شده در پایگاه داده وجود دارد: این توصیف با یک الگو یا مدل شناخته می‌شود.

  30. مفهوم پایگاه داده ( ادامه ) مدل توصیفی، اشیا پایگاه‌های داده و ارتباط بین آن‌ها را نشان می‌دهد. روش‌های متفاوتی برای سازماندهی این مدل‌ها وجود دارد که به آن‌ها مدل‌های پایگاه داده گوییم. پرکاربردترین مدلی که امروزه بسیار استفاده می‌شود، مدل رابطه‌ای است که به طور عام به صورت زیر تعریف می‌شود: نمایش تمام اطلاعاتی که به فرم جداول مرتبط که هریک از سطرها و ستونها تشکیل شده‌است(تعریف حقیقی آن در علم ریاضیات برسی می‌شود). در این مدل وابستگی‌ها به کمک مقادیر مشترک در بیش از یک جدول نشان داده می‌شود. مدل‌های دیگری مثل مدل سلسله مراتب و مدل شبکه‌ای به طور صریح تری ارتباط‌ها را نشان می‌دهند. در مباحث تخصصی‌تر اصطلاح پایگاه داده به صورت مجموعه‌ای از رکوردهای مرتبط با هم تعریف می‌شود. بسیاری از حرفه‌ای‌ها مجموعه‌ای از داده‌هایی با خصوصیات یکسان به منظور ایجاد یک پایگاه داده‌ای یکتا استفاده می‌کنند. معمولاً DBMSها بر اساس مدل‌هایی که استفاده می‌کنند تقسیم بندی می‌شوند: ارتباطی، شیء گرا، شبکه‌ای و امثال آن. مدل‌های داده‌ای به تعیین زبانهای دسترسی به پایگاه‌های داده علاقه‌مند هستند. بخش قابل توجهی از مهندسی DBMS مستقل از مدل‌های می‌باشد و به فاکتورهایی همچون اجرا، هم‌زمانی، جامعیت و بازیافت از خطاهای سخت‌افزاری وابسته‌است.در این سطح تفاوت‌های بسیاری بین محصولات وجود دارد.

  31. انواع دادگان هادادگان ها از نظر ساختار مفهومی و شیوه ای رفتار با داده ها بر دو نوع هستند :1.دادگان رابطه ای2.دادگان شی گرامدلهای پایگاه داده شگرد های مختلفی برای مدل های داده ای وجود دارد. بیشتر سیستمهای پایگاه داده ای هر چند که طور معمول بیشتر از یک مدل را مورد حمایت قرار میدهند، حول یک مدل مشخص ایجاد شده اند. برای هر یک از الگوهای منطقیlogical model اجراهای فیزیکی مختلفی قابل پیاده شدن است و سطوح کنترل مختلفی در انطباق فیزیکی برای کاربران محیا می کند. یک انتخاب مناسب تاثیر موثری بر اجرا دارد. مثالی از موارد الگوی رابطه ایrelational modelاست. همه رویدادهای مهم در مدل رابطه ای امکان ایجاد نمایه هایی که دسترسی سریع به سطرها در جدول را می دهد،فراهم میشود.یک مدل داده ای تنها شیوه ساختمان بندی داده ها نیست بلکه معمولا بصورت مجموعه ای از عملیات ها که میتواند روی داده ها اجرا شود تعریف میشوند. برای مثال در مدل رابطه ای عملیاتی همچون گزینش selection،طرح ریزی projection و اتصال joinتعریف می گردد.

  32. مدلسازی • نمونه(instance): یک موجودیت مشخص از یک نوع موجودیت • شناسه(identifier): یک صفت که یک نمونه موجودیت را شناسایی می کند. • رابطه ها(relationships): اتصال های مفهومی موجودیت ها در یک پایگاه داده.

  33. مدلسازی(ادامه) • تعداد موجودیت هایی که در یک رابطه هستند، درجه آن رابطه نامیده می شود. رابطه بین دو موجودیت رایجتر است و اصطلاحا رابطه دوگانی نامیده می شود. • سه نوع رابطه دوگانی: • 1:1 : ارتیاط یک نمونه از یک نوع موجودیت با یک نمونه از نوع موجودیت دیگر • 1:M : ارتباط یک نمونه از یک نوع موجودیت با چند نمونه از نوع موجودیت دیگر • M:N : ارتباط یک نمونه از یک نوع موجودیت با چند نمونه از نوع موجودیت دیگر و برعکس.

  34. مدل تختمدل تخت یا جدولی flat or table model تشکیل شده است از یک آرایه دو بعدی با عناصر داده ای که همه اجزای یک ستون بصورت داده های مشابه فرض میشودو همه عناصر یک سطر با هم در ارتباط هستند. برای نمونه در ستونهایی که برای نام کاربری و رمز عبور درجزئی از سیستم های پایگاه داده ای امنیتی مورد استفاده قرار می گیرد هر سطر شامل رمز عبوری است که مخصوص یک کاربر خاص است. ستون های جدول که با آن در ارتباط هستند به صورت داده کاراکتری، اطلاعات زمانی، عدد صحیح یا اعداد ممیز شناور تعریف می شوند. این مدل پایه برنامه های محاسباتیspreadsheet است.پایگاه داده ها با فایلهای تخت به سادگی توسط فایلهای متنی تعریف میشوند. هر رکورد یک خط است و فیلد ها به کمک جدا کننده هایی از هم مجزا می شوند. فرضا به مثال اسلایدبعدی دقت کنید:

  35. id name team1 Amy Blues2 Bob Reds3 Chuck Blues4 Dick Blues5 Ethel Reds6 Fred Blues7 Gilly Blues8 Hank Reds داده های هر ستون مشابه هم است ما به این ستونها فیلد هاگوییم. و هر خط را غیر از خط اول یک رکورد(record می نامیم. خط اول را که برخی پایگاه های داده ای آنرا ندارند رکورد برچسبfield labelsگوییم. هرمقدار داده ای اندازه خاص خود را دارد که اگر به آن اندازه نرسد میتوان از کاراکنر فاصله برای این منظور استفاده کرد اما این مسئله مخصوصا زمانی که بخواهیم اطلاعات را بر روی کارتهای منگنه قرار دهیم مشکل ساز خواهد شد. امروزه معمولا از نویسه TAB برای جداسازی فیلد ها و کاراکتر خط بعد برای رکورد بعدی استفاده می کنیم. البته شیوه های دیگری هم وجود دارد

  36. مثلا به مثال زیر دقت کنید:"1","Amy","Blues""2","Bob","Reds""3","Chuck","Blues""4","Dick","Blues""5","Ethel","Reds""6","Fred","Blues""7","Gilly","Blues""8","Hank","Reds“ این مثال از جدا کننده کاما استفاده می کند.در این نوع مدل تنها قابلیت حذف،اضافه،دیدن و ویرایش وجود دارد که ممکن است کافی نباشد.Microsoft Excel این مدل را پیاده سازی می کند.

  37. مدل شبکه ای Networkدر سال 1969 و در کنفرانس زبانهای سیستم های داده ای CODASYL توسطCharlesBachman ارائه شد.در سال 1971مجددا مطرح شدو اساس کار پایگاه داده ای قرارگرفت و در اوایل دهه 80 با ثبت آن درسازمان بین المللی استانداردهای جهانی یا ISO به اوج رسید.مدل شبکه ای (database model بر پایه دو سازه مهم یعنی مجموعه ها و رکورد ها ساخته می شود و برخلاف روش سلسله مراتبی که از درخت استفاده می کند، گراف را به کار می گیرد. مزیت این روش بر سلسله مراتبی این است که مدل های ارتباطی طبیعی بیشتری را بین موجودیت ها فراهم می کند. الی رغم این مزیت ها به دو دلیل اساسی این مدل با شکست مواجه شد: اول اینکه شرکت IBMبا تولید محصولات IMS و DL/I که بر پایه مدل سلسله مراتبی است این مدل را نادیده گرفت. دوم اینکه سرانجام مدل رابطه ای elational model جای آنرا گرفت چون سطح بالاتر و واضحتر بود. تا اوایل دهه 80 به علت کارایی رابطهای سطح پایین مدل سلسله مراتبی و شبکه ای پیشنهاد میشد که بسیاری از نیاز های آن زمان را برطرف می کرد. اما با سریعتر شدن سخت افزار به علت قابلیت انعطاف و سودمندی بیشتر سیستم های رابطه ای به پیروزی رسیدند.

  38. رکورد ها در این مدل شامل فیلد هایی است( ممکن است همچون زبان کوبول (COBOL) به صورت سلسله مراتب اولویتی باشد). مجموعه ها با ارتباط یک به چند بین رکورد ها تعریف می شود: یک مالک و چند عضو. عملیات های مدل شبکه ای از نوع هدایت کننده است: یک برنامه در موقعیت جاری خود باقی می ماند و از یک رکوردبه رکورد دیگر میرود هر گاه که ارتباطی بین آنها وجود داشته باشد. معمولا از اشاره گرها(pointers) برای آدرس دهی مستقیم به یک رکورد در دیسک استفاده می شود. با این تکنیک کارایی بازیابی اضافه می شود هر چند در نمایش ظاهری این مدل ضروری نیست .

  39. مدل رابطه ای مدل رابطه ای relational model در یک مقاله تحصیلی توسط E. F. Codd در سال 1970 ارائه گشت. این مدل یک مدل ریاضیاتی است که با مفاهیمی چون مستندات منطقیpredicate logic وتئوری مجموعه ها set theoryدر ارتباط است. محصولاتی همچون اینگرس،اراکل،DB2 وسروراس کیوالSQL Server براین پایه ایجاد شده است. ساختار داده ها در این محصولات به صورت جدول است با این تفاوت که می تواند چند سطر داشته باشد. به عبارت دیگر دارای جداول چند گانه است که به طور صریح ارتباطات بین آنها بیان نمی شود و در عوض کلید هایی به منظور تطبیق سطر ها در جداول مختلف استفاده می شود. به عنوان مثال جدول کارمندان ممکن است ستونی به نام "موقعیت" داشته باشد که کلید جدول موقعیت را با هم تطبیق می دهد.

  40. ایگاه داده های چند بعدی پایگاه داده های رابطه ای توانست به سرعت بازار را تسخیر كند، هرچند كارهایی نیز وجود داشت كه این پایگاه داده ها نمیوانست بخوبی انجام دهد.بویژه به كارگیری كلیدها در چند ركورد مرتبط به هم ودرچندپایگاه داده مشترك،كندی سیستم راموجب میشد.برای نمونه برای یافتن نشانی كاربری با نام دیوید،سیستم رابطه ای باید نام وی را در جدول كاربرجستجو كند و كلید اصلی primary key را بیابد و سپس در جدول نشانیها، دنبال آن كلید بگردد. اگر چه این وضعیت از نظر كاربر، فقط یك عملیات محسوب، اما به جستجو درجداول نیازمند است كه این كار پیچیده و زمان بر خواهد بود. راهكار این مشكل این است كه پایگاه داده هااطلاعات صریح درباره ارتباط بین داده هاراذخیره نماید. میتوان به جای یافتن نشانی دیوید با جستجو ی كلید در جدول نشانی، اشاره گر به داده ها را ذخیره نمود. در واقع، اگر ركورد اصلی، مالك داده باشد، در همان مكان فیزیكی ذخیره خواهد شد و از سوی دیگر سرعت دسترسی افزایش خواهد یافت.چنین سیستمی را پایگاه داده های چند بعدی مینامند. این سیستم درهنگامیكه از مجموعه داده های بزرگ استفاده میشود، بسیار سودمند خواهد بود. از آنجاییكه این سیستم برای مجموعه داده های بزرگ به كار می رود، هیچگاه در بازار به طور مستقیم عمومیت نخواهد یافت.

  41. پایگاه داده های شیء اگر چه سیستم های چند بعدی نتوانستند بازار را تسخیر نمایند، اما به توسعه سیستم های شیء منجر شدند. این سیستم ها كه مبتنی بر ساختار و مفاهیم سیستم های چند بعدی هستند، به كاربر امكان می دهند تا اشیاء را به طور مستقیم در پایگاه داده ها ذخیره نماید. بدین ترتیب ساختار برنامه نویسی شیء گرا (object oriented را میتوان به طور مستقیم و بدون تبدیل نمودن به سایر فرمت ها، در پایگاه داده ها مورد استفاده قرار داد. این وضعیت به دلیل مفاهیم مالكیتownershipدر سیستم چند بعدی، رخ می دهد. در برنامه شیء گرا OO، یك شیء خاص "مالك " سایر اشیاء در حافظه است، مثلا دیوید مالك نشانی خود می باشد. در صورتی كه مفهوم مالكیت در پایگاه داده های رابطه ای وجود ندارد.

  42. ویژگی های سیستم مدیریت پایگاه داده ها سیستم مدیریت پایگاه داده ها،مجموعه ای پیچیده ازبرنامه های نرم افزاری است كه ذخیره سازی و بازیابی داده های (فیلدها، ركوردها و فایل ها) سازمان را در پایگاه داده ها، كنترل می كند. این سیستم، كنترل امنیت و صحت پایگاه داده ها را نیز بر عهده دارد. سیستم مدیریت پایگاه داده ها،درخواستهای داده راازبرنامه میپذیرد و به سیستم عامل دستور میدهد تا داده ها ی مناسب راانتقال دهدهنگامیكه چنین سیستمی مورداستفاده قرار میگیرد، اگر نیازمندیهای اطلاعاتی سازمانی تغییر یابد،سیستمهای اطلاعاتی نیز آسانتر تغییر خواهند یافت. سیستم مذكور از صحت پایگاه داده ها پشتیبانی میكند. بدین ترتیب كه اجازه نمیدهد بیش از یك كاربر در هر لحظه، یك ركورد را به روز رسانی كند. این سیستم ركوردهای تكراری را در خارج پایگاه داده ها نگاه می دارد. برای مثال، هیچ دو مشترك با یك شماره مشتری، نمی توانند در پایگاه داده ها وارد شوند. این سیستم روشی برای ورود و به روز رسانی تعاملی پایگاه داده ها فراهم می آورد. یك سیستم اطلاعات كسب و كار از موضوعاتی نظیر (مشتریان، كارمندان، فروشندگان و غیره) و فعالیت هایی چون (سفارشات، پرداخت ها، خریدها و غیره) تشكیل شده است.

  43. ویژگی های سیستم مدیریت پایگاه داده ها (ادامه ) طراحی پایگاه داده ها، فرایند تصمیم گیری درباره نحوه سازماندهی این داده ها در انواع ركوردها و برقراری ارتباط بین ركوردهاست.سیستم مدیریت پایگاه داده ها می تواند ساختار داده ها و ارتباط آنها را در سازمان به طور اثر بخش نشان دهد. سه نوع مدل متداول سازمانی عبارتند از: سلسله مراتبی، شبكه ای و رابطه ای. یك سیستم مدیریت پایگاه داده ها ممكن است یك، دو یا هر سه روش را فراهم آورد. سرورهای پایگاه داده ها، كامپیوترهایی هستند كه پایگاه داده های واقعی را نگاه می دارند و فقط سیستم مدیریت پایگاه داده ها و نرم افزار مربوطه را اجرا می كنند. معمولا این سرورها رایانه های چند پردازنده ای با رایه های دیسك RAID برای ذخیره سازی می باشند.

  44. سامانه مدیریت پایگاه داده ها سامانهٔ مدیریت پایگاه داده‌ها (به انگلیسی: database management system به اختصار: DBMS)، یک نرم‌افزار رایانه‌ای است که با هدف مدیریت پایگاه داده‌ها طراحی شده است به گونه‌ای که کاربر درگیر مسائل مربوط به ذخیره و بازیابی و شاخص‌بندی داده‌ها نمی‌شود و بر روی طراحی منطقی پایگاه تمرکز می نماید.این بسته به سازمان ها اجازه می دهد تا به راحتی پایگاه های داده را برای کاربردهای مختلف به وسیله ی مدیر پایگاه داده (به اختصار: DBAs) و متخصصان دیگر توسعه دهد. سامانه مدیریت پایگاه داده اجازه میدهد تا برنامه های مختلف کاربردی کاربر به طور همزمان به یک پایگاه داده دسترسی داشته باشد. سامانه های مدیریت پایگاه داده ممکن است از مدل های مختلف پایگاه داده جهت سهولت در توصیف و حمایت از برنامه های کاربردی، استفاده کنند (مانند مدل رابطه ای یا مدل شیی). زبان اختصاصی پایگاه داده، زبانی است که برنامه های کاربردی پایگاه داده و همچنین بازیابی و ارائه ی اطلاعات را ساده نموده است. یک سامانه مدیریت پایگاه داده امکان کنترل برای دسترسی به داده، اجرای تمامیت داده ها، مدیریت کنترل همزمانی و بازیابی پایگاه داده، پس از شکست و بازگرداندن آن از فایل های پشتیبان و همچنین حفظ امنیت پایگاه داده را فراهم می آورد.

  45. وظايف سيستم مديريت پايگاه داده وظايف DBMS در سيستم های مختلف تا حدودی متقاوت بوده و بستگي به نوع كاربران آن دارد. اما به طور كلي اين وظايف عبارتند از: 1.امکان تعريف پايگاه داده2. امکان ايجاد پايگاه داده3. امکان دستکاري داده ها4. بازيابي پايگاه داده5. بهنگام سازي پايگاه داده (عمليات درج، حذف و جايگزيني)6. تامين تسهيلاتي براي کاربر به منظور توسعه سيستم7. امکان سازماندهي مجدد8. کنترل امنيت و جامعيت داده ها9. ايجاد ديکشنري داده ها10. امکان کنترل کارائي

  46. اجزای سیستم مدیریت پایگاه داده وظایف DBMS توسط تعدادی مولفه نرم افزاری انجام میشود. هر كدام از این مولفه ها ممكن است مركب از چند واحد كوچكتر باشند.تعدادی از سرویسهای که توسط مولفه های DBMS داده می شوند در زیر لیست شده است: پردازش تراکنش Transaction Processing پردازش تراکنش عملیاتی که از منابع مختلف میرسد را روی پایگاه داده اجرا میکند به نحوی که خواص مطلوب تراکنش خدشه دار نشود. سرویس های کنترل همروندی و ترمیم به این مولفه برای برقراری خواص ACID کمک می کنند. به این ترتیب اجرای همروند تراکنش ها و سازگاری پایگاه داده حتی در صورت وقوع شکستی در سیستم تضمین می شود. 2. کنترل همروندی Concurrency Control مدیریت اجرای همروند تراکنش ها روی پایگاه داده در حین برقراری سازگاری را به عهده دارد.

  47. اجزای سیستم مدیریت پایگاه داده 3. ترمیم Recovery ترمیم تضمین میکند که اگر اجرای تراکنش با عدم موفقیت یا سقط روبرو شد، تاثیر نامطلوبی روی پایگاه داده یا تراکنش های دیگر نگذارد و حالت پایگاه داده را همیشه سازگار نگه دارد. 4. مدیریت ثبت احوالLog Management هر اتفاقی در سیستم در یک فایل ذخیره می شود و توسط مدیریت ترمیم برای حفظ صحت و اعتبار پایگاه داده هنگام خرابی يا سقط سيستم استفاده می شود. 5. واسطه زبانی Language Interface دستوراتی را برای تعریف داده، کار کردن با آن دراختیار کاربران و برنامه های کاربردی قرار می دهد.

  48. اجزای سیستم مدیریت پایگاه داده 6. تحمل پذیری خطاFault Tolerancy توانائی ارائه سرویس های قابل اطمینان توسط DBMS حتی در صورت بروز نقص را تحمل پذیری خطا می گویند. انواع خطاهائی که ممکن است پیش بیاید عبارتند از:        • خطای منطقی : تراکنش موفق نمی شود مثلا به دلیل ورودی بد، سرریزی        • خطای سیستمی : تراکنش موفق نمی شود مثلا به دلیل بن بست        • سقط سیستم : قطع برق، پاک شدن حافظه اصلی، پر شدن دیسک        • ناتوانی دیسک : خرابی هد، خرابکاری عمدی، آتش سوزی، 7. کاتالوگ داده Data Catalog یا دیکشنری داده یک پایگاه داده سیستمی شامل اطلاعاتی درباره داده، ارتباطات و قیدها در پایگاه اصلی است. گاهی به آن متاداده هم گفته می شود.

  49. 8. امنیت Security امنیت به محافظت داده در مقابل افشاشدن، تغییر و خرابی اشاره دارد. هر کابر و برنامه کاربردی امتیاز ویژه ای برای دسترسی به داده دارد. کاربران ممکن است دیدگاه های مختلفی نسبت به داده های پایگاه داده با توجه امتیازات ویژه خود داشته باشند. سیستم امنیتی همچنین، توسط رویه های شناسائی و مجوز، دسترسی به پایگاه داده را محدود می کند. 9. مدیریت ذخیره سازی Storage Management DBMS مکانیسم های خاصی برای ذخیره دائمی داده و دسترسی به منبع فیزیکی و بازیابی داده دارد. مدیر ذخیره سازی بین داده ذخیره شده در پایگاه داده و برنامه کاربردی و پرس و جوهای ارسال شده به سیستم واسطه می شود. 10. مدیریت قفل (Lock Management) هنگام استفاده اشتراکی از داده انواع مختلفی از قفل روی داده گذاشته می شود (مثل Read Lock و Write Lock). 11. مدیریت بن بست (Deadlock Management) بن بست وقتی اتفاق می افتد که تراکنش ها برای بدست آوردن منابع در یک دایره بسته قرار گیرند یعنی هر یک منبعی در اختیار دارد که مورد تقاضای دیگری است و درخواست منبعی را می کند که در اختیار تراکنش منتظر منبع است. در پایگاه داده منابع رکوردها هستند. مديريت منبع مسئول رفع اين مشکل هستند.

More Related