1.6k likes | 1.87k Views
تئوری اطلاعات تهیه کننده : مهندس سید محمد مدنیان دانشجوی کارشناسی ارشد مدیریت صنعتی دانشگاه نجف آاباد کارشناسی مهندسی الکترونیک دانشگاه نجف آباد بهار 1392. از هرگونه کپی و قرار دان برروی سایتهای دیگر جدا خودداری شود حاصل تلاش چندین روز است حق کپی رایت فقط سایت مدیر
E N D
تئوری اطلاعات تهیه کننده : مهندس سید محمد مدنیان دانشجوی کارشناسی ارشد مدیریت صنعتی دانشگاه نجف آاباد کارشناسی مهندسی الکترونیک دانشگاه نجف آباد بهار 1392
از هرگونه کپی و قرار دان برروی سایتهای دیگر جدا خودداری شود حاصل تلاش چندین روز است حق کپی رایت فقط سایت مدیر کلیه حقوق مخصوص سایت مدیر
مقدمه در طول دو دهه گذشته نفت به عنوان یک کالای استراتژیک و رقابتی همواهر مطرح بوده است. اما در طول سالهای اخیر پیشرفت های تکنولوژیکی از اهمیت این کالا کاسته و روز به روز به روز بر اهمیت منبعی دیگر که شاید برای خیلی ها هنوز ناشناخته باشد و اطلاعات نام دارد افزوده است . ( کریم زاده اطلاعات و تکنولوژی با یکدیگر در تعامل هستند و بر یکدیگر اثر می گذارند و باعث پیشرفت یا رکود یکدیگرمی شوند در این میان حجم عظیمی از اطلاعات تولید می گردد که اگر از سازماندهی منسجم و قوی برخوردارد نباشد نه تنها به سدی محکم در مقابل پیشرفت تکنولوژی تبدیل می شود بلکه حیات سازمان را نیز به خطر می اندازد از این رو نگرش سیستمی در مورد اطلاعات از اهمیت خاصی برخوردارمی شود و اطلاعات در قالب یک سیستم اطلاعاتی مطرح می گردد در این جا این سوال پیش می اید که چرا باید سیستمهای اطلاعاتی را مطالعه کرد ؟ طرح این سوال مانند این است که بپرسیم که چرا باید مباحث مدیریت مالی ، تحقیق در عملیات بازار یابی و سایر بخشهای اصلی فعالیت های یک سازمان کسب و کار را مطالع کرد
داده، اطلاعات و دانش سيستمهاي اطلاعات براي دستيابي به اهداف گوناگوني طراحي شده اند . يكي ازاهداف اساسي، پردازش اقتصادي داده و تبديل آن به دانش و اطلاعات است . اجازه بدهيد به تعريف اين مفاهيم بپردازيم. اقلام داده به توصيف ابتدايي از اشياء، رويدادها، فعاليت ها و تراكنشهايي كه ثبت، دسته بندي و ذخيره شده ، ولي براي هدف خاصي سازماندهي نگرديده اند، مي پردازد. اقلام داده ممكن است عدد، حرف، شكل، صدا يا تصوير باشند . نمره يك دانش آموز و يا تعداد ساعات كار يك كارمند در طول يك هفته، داده محسوب مي شوند . يك پايگاه داده شامل داده هايي است كه با هدف بازيابي، سازماندهي شده اند. اطلاعات، داده اي است كه به گونه اي سازماندهي شده كه براي گيرنده مفهوم وارزش دارد . به طور مثال، معدل يك دانش آموز، اطلاعات است . گيرنده آن را تفسيرمي نمايد و نتايج و مفاهيمي را به طور ضمني استنتاج مي كند.
اقلام داده معمولا بوسيله نرم افزار كاربردي، پردازش و به اطلاعات تبديل ميشوند. چنين پردازشي نسبت به بازيابي وخلاصه سازي ساده يك پايگاه داده، كاربرد مشخصتر و ارزش افزوده بيشتري به همراه دارد. نرم افزار كار بردي ممكن است يك سيستم مديريت موجودي مبتني بر وب، سيستم ثبت نام برخط دانشگاه يا يك سيستم خريد و فروش اينترنتي باشد. دانش، متشكل از داده يااطلاعاتي است كه به منظور مفاهمه،انتقال تجربه آموخته ها ومهارت سازماندهي شده و براي حل مشكل جاري ياانجام يك فعاليت ،به كارگرفته ميشوند. داده هايي كه بمنظور استخراج مفاهيم اساسي وبازتاب تجربيات ومهارتهاي گذشته پردازش ميشوند، براي گيرنده، دانش سازماني به ارمغان مي آورند كه ارزش بالقوه فراواني دارد . اخيراً مديريت دانش نيز به يكي از داغترين مباحث در حوزه فناوري اطلاعات تبديل شده است. داده ها، اطلاعات و دانش ميتوانند وروديهاي يك سيستم اطلاعاتي يا خروجيهاي آن باشند. براي مثال، داده هاي مربوط به كارمندان، حقوق ومدت زمان كارشان (ورودي) با هدف توليد اطلاعات ليست حقوق (خروجي)، پردازش ميشوند. اطلاعات ليست حقوق نيز بعداً ميتواند به عنوان ورودي براي سيستم ديگري كه به بودجه بندي يا توصيه به مديران دربارة ميزان حقوقها ميپردازد، به كار رود.
داده تعريف اول- نمايش ذخيرهشده اشياء فيزيكي، چيزهاي مجرد، بودهها، رويدادها يا چيزهاي قابل مشاهده كه در تصميمسازي بكار ميآيند. تعريف دوم- هر مجموعهاي از بودهها تعريف سوم- بودههاي خام كه معناي اندكي دارند مگر اينكه به صورت منطقي سازماندهي شده باشند. تعریف چهارم : داده ها شامل واقعیت ها و اشکالی هستند که برای کاربر بی معنی هستند تعریف پنجم : داده به مطالبی گفته می شود که وارد کامپیوتر می گردند تا عملیات پردازش برروی آنها انجام شود
تعریف بیت (BIT)، بایت (BYTE) و کلمه (WORD) : كوچكترين قسمت از اطلاعات باينري را بيت مي گويند. 8 بيت يك بايت و 16 بيت ( دو بايت) يك كلمه را مي سازند . كوچكترين ذره اطلاعاتي را بيت گويند.در سيستم دو دوئي يكي از دو حالت صفر (0) و يك (1)، يك بين اطلاعات است از تركيب چند بيت اطلاعات، بايت بوجود مي آيد.
تعريف داده از ديدگاه ANSI نمايش بودهها، پديدهها، مفاهيم يا شناختهها به طرزي صوري و مناسب براي برقراري ارتباط، تفسير يا پردازش توسط انسان يا هر امكان خودكار هر نمايشي اعم از كاراكتري يا كميتهاي قياسي كه معنايي به آن قابل انتساب باشد.
تعریفداده: • داده مقداری حقیقی است.داده ”data”از ریشه do و dare به معنی انجام دادن است,مناسبترین واژه ای است که به واقعیات شکل نیافته و بدون ساختار اطلاق میشود. • از وقایعی که اتفاق می افتد داده تولید می شود.به عبارت دیگر داده محصول فرعی رخدادها ست.
مبانی مرتب سازی و دستیابی داده ها • سلسله مراتب داده ها(Data Hierarchy): یک بیت، کوچکترین واحد داده قابل پردازش در رایانه؛ یک بایت، مجموعه ای از بیت ها که یک کاراکتر ساده را معرفی می کند.یک رشته ترتیبی ازکاراکتر ها را گویند. • فیلد(field): یک رشته معنی دار یا یک ترکیب منطقی از کاراکتر ها به صورت یک کلمه را گویند. • رکورد(record): یک ترکیب منطقی از فیلد های مرتبط به هم که بیان کننده صفات یک پدیده است. • فایل(پرونده): یک ترکیب منطقی از از رکورد های مرتبط به هم در بر دارنده رکوردهای موجودیت ها ی همگن است مانند پرونده دانشجویان .
مبانی مرتب سازی و دستیابی داده ها (ادامه) • پایگاه داده(Database): ترکیب منطقی از فایل های مرتبط به هم که بیانگر پدیده های متصل بهم در یک حوزه کاری است. • موجودیت(entity): یک شخص، مکان، شی، یا یک رویداد در ارتباط با اطلاعاتی که در یک رکورد نگهداری می شود. • موجودیت(entity): مفهوم کلی آنچه می خواهیم در موردش اطلاع داشته باشیم. • دانشجو،استاد،درس • صفت(attribute): هر ویژگی یا کیفیتی که یک مشخصه را توصیف می کند. • نام دانشجو،شماره دانشجویی،سال ورود
مبانی مرتب سازی و دستیابی داده ها (ادامه) • کلید اولیه(primary key): یک فیلد شناسه که به تنهایی یک رکورد را مشخص و متمایز می کند. • شماره دانشجویی • کلید ثانویه(secondary key): یک فیلد شناسه که بعضی از اطلاعات شناسایی را دارد، اما نوعا یک فایل را با دقت کامل شناسایی نمی کند. • نام خانوادگی دانشجو
چرخه حيات “داده” داده، در يك سيستم اطلاعات مديريت چرخه حيات خاص خود را دارد. در مراحل ايجاد، طراحي و عمليات سيستمهاي اطلاعاتي، سه جنبه اين چرخه حيات از اهميت ويژه اي برخوردار است. نخست طراح بايد بداند داده چگونه توليد ميشود. دوم وي بايد بداندچه پردازشي يا تلفيقي بر روي داده هاصورت ميپذيرد و سرانجام طراح بايد بداند كه انواع معين پردازش اطلاعات بويژه انتقال داده، و تبادل و ذخيره سازي و بازيابي داده ها چگونه انجام مي شود.
چرخه حيات داده داده ها در یک سیستم اطلاعاتی مدیریت ، چرخه حیات خاص خود را دارد . سه مرحله با اهمیت این چرخه عبارتنداز ( - ایجاد - طراحی - عملیات ) . 1) اولین نکته ای که باید طراح بداند این است که داده چگونه تولید می شود . 2) باید بداند چه نوع پردازشی یا تلفیقی روی داده انجام شده است . 3) طراح باید بداند که انوع معین پردازش اطلاعات به ویژه انتقال و تبادل و ذخیره سازی و باز یابی داده ها چگونه انجام می شود همچنان که شکل اسلاید بعدی نشان میدهد تولید مجدد داده ها میتواند در نقاط گوناگون چرخه حیات داده صورت پذیردو بنابراین در نمودار چرخه حیات داده نشان داده نشده است
چرخه حیات ”داده 1- تولید داده :تولید با ایجاد داده که در خانه سمت چپ آمده است میتواند به دلیل تعامل داخلی یا رخداد خارجی باشد 2- ذخیره داده : تولید داده نتیجه پدیده داخلی یا خارجی سازمان بوده که مشاهده و ثبت شده است تجربیات ، داد و ستد ها و عملیات تولید داده برنامه ریزی شده اند داده ها را به طور معمول برروی سند یا پایگاه اطلاعاتی ذخیره میکنند اگر داده ای بی ارزش باشد محو میگردد 3-انتقال داده : داده ها در چرخه حیات به طور مکرر از فرآیندی به فرآیند دیگری منتقل میشوند 4-بازیابی داده :بازیابی داده از سیستم مدیریت پایگاه اطلاعاتی به سهولت صورت میپذیرد زیرا داده ها مستقل از برنامه ها و کاربران نگهداری می شوند 5- تولید مجدد: داده هاباید را باید سازماندهی مجدد کرد تا قابل استفاده باشند
چرخه حیات داده (ادامه ) • 6- ارزیابی داده : • داده ها باید ارزیابی شوند تا معین شود که به پردازش بیشتر نیاز دارد یا نه؟ • 7- دسته بندی داده : • داده ها چون بطور تصادفی جمع آوری میشوند، وبرای اینکه قابل استفاده گردند باید جداسازی صورت پذیرد حتی داده هایی که جداسازی و دسته بندی شده اند نیز ممکن است برای قابل استفاده شدن نیازمند دسته بندی جدیدی باشند برای مثال ، اعدا و ارقام فروش محصولات یک فروشگاه ممکن است براساس فروشنده ذخیره شده باشند ولی جداسازی انها برحسب محصول یا مشتری مورد نیاز باشد . • 8- تحلیل داده : • داده ها را میتوان پیش از استفاده یا شناسایی زمینه های مورد استفاده ، روند ها و رخدادها ی غیر معمول و با تعبیر و تفسیر تحلیل کرد.
چرخه حیات داده (ادامه ) • 9- حسن استفاده: • شکل داده ها را می توان به کمک جمع و تفریق ويا فرمولهای رياضیتغییر داد. • 10 - ترکیب: • تلفیق دادهای متعدد اغلب ایجاب میکندآنها رادريک مجموعه کامل يا گزارش کاملسازمان دهی کنیم. • 11- به کار گیری: • داده ها وقتی به شکل معنی دار درمي آيند تبديل به اطلاعات و پس از مصرف بصورت ”داده“در می آيند،لذا در مورد نوع ذخيره سازی آنها بايد تصميم گيری شود • 11-محو: • داده ها را پس از ارزیابی میتوان محو کرد.برای مثال اطلاعا مربوط به قرار ملاقات ها یا مکان برگزاری سمینارهای داخلی سازمان یا برنامه های مربوط به مهمانیها ی سالانه سازمان پس از وقوع هیچگونه ارزشی ندارد
انواع داده: داده های ورودی داده های ذخیره شونده داده های خروجی 1- داده های ورودی: داده هائی که به وسیله سخت افزار دریافت میشود 2- داده های ذخیره شونده: داده هائی است که بر روی سخت افزار ذخیره شده اند 3- داده های خروجی: داده هایی است که از پردازش داده های ورودی به وسیله سخت افزار تولید شده است
پردازنده اصلی مجوز گوهینامه مجوز رسید حق مجوز خلاصه گزارش روزانه گزارش تغییرات روزانه انواع سه گانه داده برای سیستم صدور مجوز تقاضا نامه گواهینامه دوره آموزش حرفه ای • حرفه ای پرونده اصلی مراکز اموزش 21
توضیح شکل اسلاید قبلی : سیستم تقاضانامه های صدور مجوز و گواهینامه های آموزش حرفه ای ( داده های ورودی ) ر ادریافت می دارد وبه داده های ذخیره شده مربوط به مجوزها و مراکز آموزش حرفه ای ( داده های ذخیره شده ) نیز دسترسی دارد و رسید دریافت وجه گواهینامه مجوز و دو نوع گزارش ( داده های خروجی ) تولید می کند
انواع داده هاي سازماني 1- داده هاي وضعيتي : اين داده ها بيانگر عملي خاص در زمان معين هستند .مانند داده هايي كه بيانگر سطح موجودي در يك زمان خاص هستند. 2- داده هاي مبادلاتي : اين داده ها وقايع گذشته را شرح مي دهند مانند داده هايي كه بيانگر دريافت رسيد سفارش فروش ،استخدام پرسنل و پذيرش بيمارهستند. 3- داده هاي عملياتي : اين داده ها بيانگر روش انجام عمليات و ساير توضيحات لازم در زمينه هر يك از عمليات می باشند . 4- داده هاي مهندسي : نقشه هاي مهندسي ،سياهه مواد هر محصول توليدي و غيره جزءداده هاي مهندسي به حساب مي آيند . 5- داده هاي نوشتاري : اين داده ها شامل مكاتبات ،گزارشات بازرگاني ،اسناد ،نمودارها و تصاوير مي باشند .
مديريت “داده ها” سازمانهابراي مديريت مناسب هر منبع بايد نقشي راكه آن منبع ايفا ميكند،خواص آن و فرصتهايي را كه فراهم مي آوردوگامهايي را كه براي استفاده از اين فرصتها بايد برداشته شود بشناسند اما در حاليكه داده هاامكانات عظيمي را ارائه ميدهند چالشهاي خاصي را نيزفراهم مي آورند. برای مثال برخلاف سایرمنابع داده ها را میتوان بسهولت کپی کرد و با استفاده ازفناوری اطلاعات میتوان بادیگران در میان گذاشت وآنگاه به دهها راه متفاوت میتوان آنهارا بکارگرفت این در حالی است که توزیع اثر بخش داده ها بندرت صورت میپذیرد و در عوض بیشتر افراد واحدهای سازمانی آگاهانه یا ناآگاهانه داده هارا احتکار میکنند که منجربه جنگ سیاسی وحشیانه بر سر مالکیت آنها می گردد حتی در وضعیتهایی که داده ها مبادله میشود افراد و واحدها نسخه مخصوصی از آنرا تهیه کرده و اصلاح میکنند ناسازگاریهای ناشی از آن هدف تبادل داده ها را با شکست مواجهه میکنند از این گذشته برای سازمان ها اعمال خط مشی های گوناگون استفاده از داده ها و حفظ محرمانه بودن آنها دشوار است افرا د داده ها را با این هدف وارد کامپیوتر می کنند که برروی سخت افزار ذخیره شوند و داده های ذخیره شده برای ایجاد گزارش های گوناگون پیام ها و نمایش به طرق مختلف قابل دستیابی و پردازش خواهد بود
فرادادهها: هدف هر سازمانی باید این باشد که تمام رسانههایی را که به کار می گیرد، بتواندمدیریت و آرشیو کند. و اینجاست که به فرادادهها (Metadata) نیاز داریم. فرادادههاهمان اطلاعاتی هستند که فرضا با استفاده از یک برچسب، بر پشت یک عکس الصاقمیکنیم. اما در همین حال، در دنیای دادههای دیجیتال باید این فرادادهها رابهطور جداگانه مدیریت کنیم. در واقع، فرادادهها اطلاعاتی توصیفی هستند و مربوط بهحقوق و مجوزهای دادهها می باشند. پس به این ترتیب دادهها با اطلاعات دیگری که بهارزش پایگاه دادهرسانی ما میافزایند، یعنی با فراداده ها کاملمیشوند. مدیریت دادههای شرکتی: هدف مدیریت دادههای شرکتی انباشت و مدیریت کل اطلاعات و محتوای یک شرکت استبرای رسیدن به چنین هدفی،کارکردهای دنیای سنتی آرشیو، سند وگردش کارهای مدیریتی باید با الزامات مدیریت محتواهماهنگ شود.به این ترتیب امکان ادغام مؤلفههای وب پایه با محصولات سنتی فراهم میشود
تاریخچه پایگاه داده مفهوم پایگاه داده ازدهه ی ۱۹۶۰ برای کاهش مشکلات فزاینده درطراحی، ساخت، و نگهداشت سسیستمهای اطلاعاتی (معمولاً با تعداد زیادی کاربرِ نهایی همزمان،وباتعداد زیادی داده ی مختلف)ایجاد شدهاست.این مفهوم به همراه مفهوم سیستمهای مدیریت پایگاه داده که دستکاری مؤثر و کارا به پایگاه دادهها را ممکن میکند رشد کردهاست. اولین کاربردهای اصطلاح پایگاه داده به ژوئن ۱۹۶۳ باز میگردد،یعنی زمانی که شرکت System Development Corporationمسئولیت اجرایی یک طرح به نام«توسعه و مدیریت محاسباتی یک پایگاه دادهای مرکزی» رابرعهده گرفت. پایگاه داده به عنوان یک واژه واحد در اوایل دهه ۷۰در اروپاودراواخردهه۷۰ در خبر نامههای معتبرآمریکایی به کاررفت.(بانک دادهای یادراوایل سال ۱۹۶۶ در روزنامه واشینگتن پست کار رفت)اولین سیستم مدیریت پایگاه داده در دهه ۶۰ گسترش یافت. از پیشگامان این شاخه چارلز باخمن میباشد. مقالات باخمن این را نشان داد که فرضیات او کاربرد بسیار مؤثرتری برای دسترسی به وسایل ذخیره سازی را مهیا میکند.
تاریخچه پایگاه داده درآن زمانها پردازش داده بر پایه کارتهای منگنه و نوارهای مغناطیسی بودکه پردازش سری اطلاعات را مهیا میکند.دونوع مدل دادهای درآن زمانه ایجاد شد:CODASYL موجب توسعه مدل شبکهای شدکه ریشه در نظریات باخمن داشت ومدل سلسله مراتبی که توسطNorthAmerican Rockwell ایجاد شدو بعداً با اقباس ازآن شرکت IBM محصولIMS را تولید نمود. مدل رابطهای توسط E. F. Coddدر سال ۱۹۷۰ ارائه شد.او مدلهای موجود رامورد انتقاد قرار میداد.برای مدتی نسبتاً طولانی این مدل درمجامع علمی موردتأییدبود.اولین محصول موفق برای میکروکامپیوترها dBASEبودکه برای سیستمعاملهایCP/Mو PC-DOS/MS-DOSساخته شد.
تاریخچه پایگاه داده در جریان سال۱۹۸۰ پژوهش برروی پایگاههای مدل توزیع شده و ماشینهای پایگاهی database machines متمرکز شد، اما تأثیرکمی بر بازار گذاشت.در سال ۱۹۹۰ توجهات به طرف مدل شیء گرا جلب شد. این مدل جهت کنترل دادههای مرکب لازم بود و بهسادگی بر روی پایگاه دادههای خاص، مهندسی داده(شامل مهندسی نرمافزار منابع) و دادههای چند رسانهای کار میکرد. در سال ۲۰۰۰ نوآوری تازهای رخ داد و پایگاه اکسامال (XML) به وجود آمد. هدف این مدل از بین بردن تفاوت بین مستندات و دادهها است و کمک میکند که منابع اطلاعاتی چه ساخت یافته باشند یا نه در کنار هم قرار گیرند.
مفهوم پایگاه داده پایگاه دادهها (دادگان یا بانک اطّلاعاتی) به مجموعهای از اطّلاعات با ساختار منظم و سامانمند گفته میشود.پایگاههای دادههامعمولاً درقالبی که برای دستگاههاورایانههاقابل خواندن و دسترسی باشدذخیره میشوند.البته چنین شیوه ذخیرهسازی اطلاعات تنهاروش موجود نیست وشیوههای دیگری مانندذخیرهسازی ساده درپروندههانیزاستفاده میگردد.آنچه ذخیرهسازی دادههادر پایگاههای دادههارامؤثرمیسازدوجودیک ساختار مفهومی برای ذخیرهسازی وروابط بین دادهها است. پایگاه داده دراصل مجموعهای سازمان یافته از اطلاعات است.این واژه از دانش رایانه سرچشمه میگیرد،اما کاربرد وسیع و عمومی نیز دارد، این وسعت به اندازهای است که مرکز اروپایی پایگاه داده(که تعاریف خردمندانهای برای پایگاه داده ایجاد میکند)شامل تعاریف غیر الکترونیکی برای پایگاه داده میباشد. در این نوشتار به کاربردهای تکنیکی برای این اصطلاح محدود میشود.
مفهوم پایگاه داده ( ادامه ) یک تعریف ممکن این است که:پایگاه داده مجموعهای از رکوردهای ذخیره شده در رایانه با یک روش سیستماتیک (اصولی) مثل یک برنامه رایانهای است که میتواند به سؤالات کاربر پاسخ دهد. برای ذخیره و بازیابی بهتر، هر رکورد معمولاً بصورت مجموعهای از اجزای دادهای یا رویدادها سازماندهی میگردد. بخشهای بازیابی شده در هر پرسش به اطلاعاتی تبدیل میشود که برای اتخاذ یک تصمیم کاربرد دارد. برنامه رایانهای که برای مدیریت و پرسش و پاسخ بین پایگاههای دادهای استفاده میشود را مدیر سیستم پایگاه دادهای یا بهاختصار DBMSمینامیم. خصوصیات و طراحی سیستمهای پایگاه دادهای در علم اطلاعات مطالعه میشود. مفهوم اصلی پایگاه داده این است که پایگاه داده مجموعهای از رکوردها یا تکههایی از یک شناخت است.نوعاً در یک پایگاه داده توصیف ساخت یافتهای برای موجودیتهای نگه داری شده در پایگاه داده وجود دارد: این توصیف با یک الگو یا مدل شناخته میشود.
مفهوم پایگاه داده ( ادامه ) مدل توصیفی، اشیا پایگاههای داده و ارتباط بین آنها را نشان میدهد. روشهای متفاوتی برای سازماندهی این مدلها وجود دارد که به آنها مدلهای پایگاه داده گوییم. پرکاربردترین مدلی که امروزه بسیار استفاده میشود، مدل رابطهای است که به طور عام به صورت زیر تعریف میشود: نمایش تمام اطلاعاتی که به فرم جداول مرتبط که هریک از سطرها و ستونها تشکیل شدهاست(تعریف حقیقی آن در علم ریاضیات برسی میشود). در این مدل وابستگیها به کمک مقادیر مشترک در بیش از یک جدول نشان داده میشود. مدلهای دیگری مثل مدل سلسله مراتب و مدل شبکهای به طور صریح تری ارتباطها را نشان میدهند. در مباحث تخصصیتر اصطلاح پایگاه داده به صورت مجموعهای از رکوردهای مرتبط با هم تعریف میشود. بسیاری از حرفهایها مجموعهای از دادههایی با خصوصیات یکسان به منظور ایجاد یک پایگاه دادهای یکتا استفاده میکنند. معمولاً DBMSها بر اساس مدلهایی که استفاده میکنند تقسیم بندی میشوند: ارتباطی، شیء گرا، شبکهای و امثال آن. مدلهای دادهای به تعیین زبانهای دسترسی به پایگاههای داده علاقهمند هستند. بخش قابل توجهی از مهندسی DBMS مستقل از مدلهای میباشد و به فاکتورهایی همچون اجرا، همزمانی، جامعیت و بازیافت از خطاهای سختافزاری وابستهاست.در این سطح تفاوتهای بسیاری بین محصولات وجود دارد.
انواع دادگان هادادگان ها از نظر ساختار مفهومی و شیوه ای رفتار با داده ها بر دو نوع هستند :1.دادگان رابطه ای2.دادگان شی گرامدلهای پایگاه داده شگرد های مختلفی برای مدل های داده ای وجود دارد. بیشتر سیستمهای پایگاه داده ای هر چند که طور معمول بیشتر از یک مدل را مورد حمایت قرار میدهند، حول یک مدل مشخص ایجاد شده اند. برای هر یک از الگوهای منطقیlogical model اجراهای فیزیکی مختلفی قابل پیاده شدن است و سطوح کنترل مختلفی در انطباق فیزیکی برای کاربران محیا می کند. یک انتخاب مناسب تاثیر موثری بر اجرا دارد. مثالی از موارد الگوی رابطه ایrelational modelاست. همه رویدادهای مهم در مدل رابطه ای امکان ایجاد نمایه هایی که دسترسی سریع به سطرها در جدول را می دهد،فراهم میشود.یک مدل داده ای تنها شیوه ساختمان بندی داده ها نیست بلکه معمولا بصورت مجموعه ای از عملیات ها که میتواند روی داده ها اجرا شود تعریف میشوند. برای مثال در مدل رابطه ای عملیاتی همچون گزینش selection،طرح ریزی projection و اتصال joinتعریف می گردد.
مدلسازی • نمونه(instance): یک موجودیت مشخص از یک نوع موجودیت • شناسه(identifier): یک صفت که یک نمونه موجودیت را شناسایی می کند. • رابطه ها(relationships): اتصال های مفهومی موجودیت ها در یک پایگاه داده.
مدلسازی(ادامه) • تعداد موجودیت هایی که در یک رابطه هستند، درجه آن رابطه نامیده می شود. رابطه بین دو موجودیت رایجتر است و اصطلاحا رابطه دوگانی نامیده می شود. • سه نوع رابطه دوگانی: • 1:1 : ارتیاط یک نمونه از یک نوع موجودیت با یک نمونه از نوع موجودیت دیگر • 1:M : ارتباط یک نمونه از یک نوع موجودیت با چند نمونه از نوع موجودیت دیگر • M:N : ارتباط یک نمونه از یک نوع موجودیت با چند نمونه از نوع موجودیت دیگر و برعکس.
مدل تختمدل تخت یا جدولی flat or table model تشکیل شده است از یک آرایه دو بعدی با عناصر داده ای که همه اجزای یک ستون بصورت داده های مشابه فرض میشودو همه عناصر یک سطر با هم در ارتباط هستند. برای نمونه در ستونهایی که برای نام کاربری و رمز عبور درجزئی از سیستم های پایگاه داده ای امنیتی مورد استفاده قرار می گیرد هر سطر شامل رمز عبوری است که مخصوص یک کاربر خاص است. ستون های جدول که با آن در ارتباط هستند به صورت داده کاراکتری، اطلاعات زمانی، عدد صحیح یا اعداد ممیز شناور تعریف می شوند. این مدل پایه برنامه های محاسباتیspreadsheet است.پایگاه داده ها با فایلهای تخت به سادگی توسط فایلهای متنی تعریف میشوند. هر رکورد یک خط است و فیلد ها به کمک جدا کننده هایی از هم مجزا می شوند. فرضا به مثال اسلایدبعدی دقت کنید:
id name team1 Amy Blues2 Bob Reds3 Chuck Blues4 Dick Blues5 Ethel Reds6 Fred Blues7 Gilly Blues8 Hank Reds داده های هر ستون مشابه هم است ما به این ستونها فیلد هاگوییم. و هر خط را غیر از خط اول یک رکورد(record می نامیم. خط اول را که برخی پایگاه های داده ای آنرا ندارند رکورد برچسبfield labelsگوییم. هرمقدار داده ای اندازه خاص خود را دارد که اگر به آن اندازه نرسد میتوان از کاراکنر فاصله برای این منظور استفاده کرد اما این مسئله مخصوصا زمانی که بخواهیم اطلاعات را بر روی کارتهای منگنه قرار دهیم مشکل ساز خواهد شد. امروزه معمولا از نویسه TAB برای جداسازی فیلد ها و کاراکتر خط بعد برای رکورد بعدی استفاده می کنیم. البته شیوه های دیگری هم وجود دارد
مثلا به مثال زیر دقت کنید:"1","Amy","Blues""2","Bob","Reds""3","Chuck","Blues""4","Dick","Blues""5","Ethel","Reds""6","Fred","Blues""7","Gilly","Blues""8","Hank","Reds“ این مثال از جدا کننده کاما استفاده می کند.در این نوع مدل تنها قابلیت حذف،اضافه،دیدن و ویرایش وجود دارد که ممکن است کافی نباشد.Microsoft Excel این مدل را پیاده سازی می کند.
مدل شبکه ای Networkدر سال 1969 و در کنفرانس زبانهای سیستم های داده ای CODASYL توسطCharlesBachman ارائه شد.در سال 1971مجددا مطرح شدو اساس کار پایگاه داده ای قرارگرفت و در اوایل دهه 80 با ثبت آن درسازمان بین المللی استانداردهای جهانی یا ISO به اوج رسید.مدل شبکه ای (database model بر پایه دو سازه مهم یعنی مجموعه ها و رکورد ها ساخته می شود و برخلاف روش سلسله مراتبی که از درخت استفاده می کند، گراف را به کار می گیرد. مزیت این روش بر سلسله مراتبی این است که مدل های ارتباطی طبیعی بیشتری را بین موجودیت ها فراهم می کند. الی رغم این مزیت ها به دو دلیل اساسی این مدل با شکست مواجه شد: اول اینکه شرکت IBMبا تولید محصولات IMS و DL/I که بر پایه مدل سلسله مراتبی است این مدل را نادیده گرفت. دوم اینکه سرانجام مدل رابطه ای elational model جای آنرا گرفت چون سطح بالاتر و واضحتر بود. تا اوایل دهه 80 به علت کارایی رابطهای سطح پایین مدل سلسله مراتبی و شبکه ای پیشنهاد میشد که بسیاری از نیاز های آن زمان را برطرف می کرد. اما با سریعتر شدن سخت افزار به علت قابلیت انعطاف و سودمندی بیشتر سیستم های رابطه ای به پیروزی رسیدند.
رکورد ها در این مدل شامل فیلد هایی است( ممکن است همچون زبان کوبول (COBOL) به صورت سلسله مراتب اولویتی باشد). مجموعه ها با ارتباط یک به چند بین رکورد ها تعریف می شود: یک مالک و چند عضو. عملیات های مدل شبکه ای از نوع هدایت کننده است: یک برنامه در موقعیت جاری خود باقی می ماند و از یک رکوردبه رکورد دیگر میرود هر گاه که ارتباطی بین آنها وجود داشته باشد. معمولا از اشاره گرها(pointers) برای آدرس دهی مستقیم به یک رکورد در دیسک استفاده می شود. با این تکنیک کارایی بازیابی اضافه می شود هر چند در نمایش ظاهری این مدل ضروری نیست .
مدل رابطه ای مدل رابطه ای relational model در یک مقاله تحصیلی توسط E. F. Codd در سال 1970 ارائه گشت. این مدل یک مدل ریاضیاتی است که با مفاهیمی چون مستندات منطقیpredicate logic وتئوری مجموعه ها set theoryدر ارتباط است. محصولاتی همچون اینگرس،اراکل،DB2 وسروراس کیوالSQL Server براین پایه ایجاد شده است. ساختار داده ها در این محصولات به صورت جدول است با این تفاوت که می تواند چند سطر داشته باشد. به عبارت دیگر دارای جداول چند گانه است که به طور صریح ارتباطات بین آنها بیان نمی شود و در عوض کلید هایی به منظور تطبیق سطر ها در جداول مختلف استفاده می شود. به عنوان مثال جدول کارمندان ممکن است ستونی به نام "موقعیت" داشته باشد که کلید جدول موقعیت را با هم تطبیق می دهد.
ایگاه داده های چند بعدی پایگاه داده های رابطه ای توانست به سرعت بازار را تسخیر كند، هرچند كارهایی نیز وجود داشت كه این پایگاه داده ها نمیوانست بخوبی انجام دهد.بویژه به كارگیری كلیدها در چند ركورد مرتبط به هم ودرچندپایگاه داده مشترك،كندی سیستم راموجب میشد.برای نمونه برای یافتن نشانی كاربری با نام دیوید،سیستم رابطه ای باید نام وی را در جدول كاربرجستجو كند و كلید اصلی primary key را بیابد و سپس در جدول نشانیها، دنبال آن كلید بگردد. اگر چه این وضعیت از نظر كاربر، فقط یك عملیات محسوب، اما به جستجو درجداول نیازمند است كه این كار پیچیده و زمان بر خواهد بود. راهكار این مشكل این است كه پایگاه داده هااطلاعات صریح درباره ارتباط بین داده هاراذخیره نماید. میتوان به جای یافتن نشانی دیوید با جستجو ی كلید در جدول نشانی، اشاره گر به داده ها را ذخیره نمود. در واقع، اگر ركورد اصلی، مالك داده باشد، در همان مكان فیزیكی ذخیره خواهد شد و از سوی دیگر سرعت دسترسی افزایش خواهد یافت.چنین سیستمی را پایگاه داده های چند بعدی مینامند. این سیستم درهنگامیكه از مجموعه داده های بزرگ استفاده میشود، بسیار سودمند خواهد بود. از آنجاییكه این سیستم برای مجموعه داده های بزرگ به كار می رود، هیچگاه در بازار به طور مستقیم عمومیت نخواهد یافت.
پایگاه داده های شیء اگر چه سیستم های چند بعدی نتوانستند بازار را تسخیر نمایند، اما به توسعه سیستم های شیء منجر شدند. این سیستم ها كه مبتنی بر ساختار و مفاهیم سیستم های چند بعدی هستند، به كاربر امكان می دهند تا اشیاء را به طور مستقیم در پایگاه داده ها ذخیره نماید. بدین ترتیب ساختار برنامه نویسی شیء گرا (object oriented را میتوان به طور مستقیم و بدون تبدیل نمودن به سایر فرمت ها، در پایگاه داده ها مورد استفاده قرار داد. این وضعیت به دلیل مفاهیم مالكیتownershipدر سیستم چند بعدی، رخ می دهد. در برنامه شیء گرا OO، یك شیء خاص "مالك " سایر اشیاء در حافظه است، مثلا دیوید مالك نشانی خود می باشد. در صورتی كه مفهوم مالكیت در پایگاه داده های رابطه ای وجود ندارد.
ویژگی های سیستم مدیریت پایگاه داده ها سیستم مدیریت پایگاه داده ها،مجموعه ای پیچیده ازبرنامه های نرم افزاری است كه ذخیره سازی و بازیابی داده های (فیلدها، ركوردها و فایل ها) سازمان را در پایگاه داده ها، كنترل می كند. این سیستم، كنترل امنیت و صحت پایگاه داده ها را نیز بر عهده دارد. سیستم مدیریت پایگاه داده ها،درخواستهای داده راازبرنامه میپذیرد و به سیستم عامل دستور میدهد تا داده ها ی مناسب راانتقال دهدهنگامیكه چنین سیستمی مورداستفاده قرار میگیرد، اگر نیازمندیهای اطلاعاتی سازمانی تغییر یابد،سیستمهای اطلاعاتی نیز آسانتر تغییر خواهند یافت. سیستم مذكور از صحت پایگاه داده ها پشتیبانی میكند. بدین ترتیب كه اجازه نمیدهد بیش از یك كاربر در هر لحظه، یك ركورد را به روز رسانی كند. این سیستم ركوردهای تكراری را در خارج پایگاه داده ها نگاه می دارد. برای مثال، هیچ دو مشترك با یك شماره مشتری، نمی توانند در پایگاه داده ها وارد شوند. این سیستم روشی برای ورود و به روز رسانی تعاملی پایگاه داده ها فراهم می آورد. یك سیستم اطلاعات كسب و كار از موضوعاتی نظیر (مشتریان، كارمندان، فروشندگان و غیره) و فعالیت هایی چون (سفارشات، پرداخت ها، خریدها و غیره) تشكیل شده است.
ویژگی های سیستم مدیریت پایگاه داده ها (ادامه ) طراحی پایگاه داده ها، فرایند تصمیم گیری درباره نحوه سازماندهی این داده ها در انواع ركوردها و برقراری ارتباط بین ركوردهاست.سیستم مدیریت پایگاه داده ها می تواند ساختار داده ها و ارتباط آنها را در سازمان به طور اثر بخش نشان دهد. سه نوع مدل متداول سازمانی عبارتند از: سلسله مراتبی، شبكه ای و رابطه ای. یك سیستم مدیریت پایگاه داده ها ممكن است یك، دو یا هر سه روش را فراهم آورد. سرورهای پایگاه داده ها، كامپیوترهایی هستند كه پایگاه داده های واقعی را نگاه می دارند و فقط سیستم مدیریت پایگاه داده ها و نرم افزار مربوطه را اجرا می كنند. معمولا این سرورها رایانه های چند پردازنده ای با رایه های دیسك RAID برای ذخیره سازی می باشند.
سامانه مدیریت پایگاه داده ها سامانهٔ مدیریت پایگاه دادهها (به انگلیسی: database management system به اختصار: DBMS)، یک نرمافزار رایانهای است که با هدف مدیریت پایگاه دادهها طراحی شده است به گونهای که کاربر درگیر مسائل مربوط به ذخیره و بازیابی و شاخصبندی دادهها نمیشود و بر روی طراحی منطقی پایگاه تمرکز می نماید.این بسته به سازمان ها اجازه می دهد تا به راحتی پایگاه های داده را برای کاربردهای مختلف به وسیله ی مدیر پایگاه داده (به اختصار: DBAs) و متخصصان دیگر توسعه دهد. سامانه مدیریت پایگاه داده اجازه میدهد تا برنامه های مختلف کاربردی کاربر به طور همزمان به یک پایگاه داده دسترسی داشته باشد. سامانه های مدیریت پایگاه داده ممکن است از مدل های مختلف پایگاه داده جهت سهولت در توصیف و حمایت از برنامه های کاربردی، استفاده کنند (مانند مدل رابطه ای یا مدل شیی). زبان اختصاصی پایگاه داده، زبانی است که برنامه های کاربردی پایگاه داده و همچنین بازیابی و ارائه ی اطلاعات را ساده نموده است. یک سامانه مدیریت پایگاه داده امکان کنترل برای دسترسی به داده، اجرای تمامیت داده ها، مدیریت کنترل همزمانی و بازیابی پایگاه داده، پس از شکست و بازگرداندن آن از فایل های پشتیبان و همچنین حفظ امنیت پایگاه داده را فراهم می آورد.
وظايف سيستم مديريت پايگاه داده وظايف DBMS در سيستم های مختلف تا حدودی متقاوت بوده و بستگي به نوع كاربران آن دارد. اما به طور كلي اين وظايف عبارتند از: 1.امکان تعريف پايگاه داده2. امکان ايجاد پايگاه داده3. امکان دستکاري داده ها4. بازيابي پايگاه داده5. بهنگام سازي پايگاه داده (عمليات درج، حذف و جايگزيني)6. تامين تسهيلاتي براي کاربر به منظور توسعه سيستم7. امکان سازماندهي مجدد8. کنترل امنيت و جامعيت داده ها9. ايجاد ديکشنري داده ها10. امکان کنترل کارائي
اجزای سیستم مدیریت پایگاه داده وظایف DBMS توسط تعدادی مولفه نرم افزاری انجام میشود. هر كدام از این مولفه ها ممكن است مركب از چند واحد كوچكتر باشند.تعدادی از سرویسهای که توسط مولفه های DBMS داده می شوند در زیر لیست شده است: پردازش تراکنش Transaction Processing پردازش تراکنش عملیاتی که از منابع مختلف میرسد را روی پایگاه داده اجرا میکند به نحوی که خواص مطلوب تراکنش خدشه دار نشود. سرویس های کنترل همروندی و ترمیم به این مولفه برای برقراری خواص ACID کمک می کنند. به این ترتیب اجرای همروند تراکنش ها و سازگاری پایگاه داده حتی در صورت وقوع شکستی در سیستم تضمین می شود. 2. کنترل همروندی Concurrency Control مدیریت اجرای همروند تراکنش ها روی پایگاه داده در حین برقراری سازگاری را به عهده دارد.
اجزای سیستم مدیریت پایگاه داده 3. ترمیم Recovery ترمیم تضمین میکند که اگر اجرای تراکنش با عدم موفقیت یا سقط روبرو شد، تاثیر نامطلوبی روی پایگاه داده یا تراکنش های دیگر نگذارد و حالت پایگاه داده را همیشه سازگار نگه دارد. 4. مدیریت ثبت احوالLog Management هر اتفاقی در سیستم در یک فایل ذخیره می شود و توسط مدیریت ترمیم برای حفظ صحت و اعتبار پایگاه داده هنگام خرابی يا سقط سيستم استفاده می شود. 5. واسطه زبانی Language Interface دستوراتی را برای تعریف داده، کار کردن با آن دراختیار کاربران و برنامه های کاربردی قرار می دهد.
اجزای سیستم مدیریت پایگاه داده 6. تحمل پذیری خطاFault Tolerancy توانائی ارائه سرویس های قابل اطمینان توسط DBMS حتی در صورت بروز نقص را تحمل پذیری خطا می گویند. انواع خطاهائی که ممکن است پیش بیاید عبارتند از: • خطای منطقی : تراکنش موفق نمی شود مثلا به دلیل ورودی بد، سرریزی • خطای سیستمی : تراکنش موفق نمی شود مثلا به دلیل بن بست • سقط سیستم : قطع برق، پاک شدن حافظه اصلی، پر شدن دیسک • ناتوانی دیسک : خرابی هد، خرابکاری عمدی، آتش سوزی، 7. کاتالوگ داده Data Catalog یا دیکشنری داده یک پایگاه داده سیستمی شامل اطلاعاتی درباره داده، ارتباطات و قیدها در پایگاه اصلی است. گاهی به آن متاداده هم گفته می شود.
8. امنیت Security امنیت به محافظت داده در مقابل افشاشدن، تغییر و خرابی اشاره دارد. هر کابر و برنامه کاربردی امتیاز ویژه ای برای دسترسی به داده دارد. کاربران ممکن است دیدگاه های مختلفی نسبت به داده های پایگاه داده با توجه امتیازات ویژه خود داشته باشند. سیستم امنیتی همچنین، توسط رویه های شناسائی و مجوز، دسترسی به پایگاه داده را محدود می کند. 9. مدیریت ذخیره سازی Storage Management DBMS مکانیسم های خاصی برای ذخیره دائمی داده و دسترسی به منبع فیزیکی و بازیابی داده دارد. مدیر ذخیره سازی بین داده ذخیره شده در پایگاه داده و برنامه کاربردی و پرس و جوهای ارسال شده به سیستم واسطه می شود. 10. مدیریت قفل (Lock Management) هنگام استفاده اشتراکی از داده انواع مختلفی از قفل روی داده گذاشته می شود (مثل Read Lock و Write Lock). 11. مدیریت بن بست (Deadlock Management) بن بست وقتی اتفاق می افتد که تراکنش ها برای بدست آوردن منابع در یک دایره بسته قرار گیرند یعنی هر یک منبعی در اختیار دارد که مورد تقاضای دیگری است و درخواست منبعی را می کند که در اختیار تراکنش منتظر منبع است. در پایگاه داده منابع رکوردها هستند. مديريت منبع مسئول رفع اين مشکل هستند.