320 likes | 539 Views
به نام آنكه جان را فكرت آموخت. جلسه هفتم. بانكهاي اطلاعاتي. ذخيره سازي و بازيابي اطلاعات. نسلهاي مختلف در ارتباط با ذخيره سازي و بازيابي اطلاعات وجود داشته است. در يك مقايسة اوليه روشهاي مورد استفاده در دو دستة ذيل بررسي ميشود: روش هاي سنتي روش مدرن. Traditional File Environment.
E N D
به نام آنكه جان را فكرت آموخت جلسه هفتم بانكهاي اطلاعاتي
ذخيره سازي و بازيابي اطلاعات • نسلهاي مختلف در ارتباط با ذخيره سازي و بازيابي اطلاعات وجود داشته است. در يك مقايسة اوليه روشهاي مورد استفاده در دو دستةذيل بررسي ميشود: • روش هاي سنتي • روش مدرن
Traditional File Environment • The organization has multiple applications with related data files Each application has a specific data file related to it, containing all the data records needed by the application Each application comes with an associated application-specific data file
Problems: Traditional File Environment • Data redundancy – same piece of data found in several places. • Data inconsistency – various copies of data no longer agree. • Data isolation – data in several application data files is hard to access and integrate. • Security – may be difficult to limit access to various data items in applications. • Data integrity – data must be accurate and correct. • Application/data dependence – applications are developed based on the way data is stored.)low isolation)
Database Management System (DBMS) Database : The Modern Approach The database management system(DBMS) provides access to the data
بانك دادهها (اطلاعاتي) يا پايگاه دادهها چيست؟ مجموعة داده هاي ذخيره شده ( در ارتباط با موضوع)به صورت مجتمع و مبتني بر ساختار تعريف شده با افزونگي كم ، تحت كنترل متمركز و قابل استفاده براي يك يا چند كاربر بصورت مشترك را گويند. سيستم مديريت بانك دادهها (اطلاعات)DBMS چيست؟ سيستمي كه امكان نگهداري دادهها ، بازيابي، تغيير ، اضافه و حذف آنها را توسط كاربر ميسر ميكند.
Locating Data in Databases (Two Choices) • Two choices: Centralized or Distributed(متمركز يا توزيعي) • Choice will affect: user accessibility, query response time, data entry, security, and cost • Option 1: Centralized database • All the related files are in one physical location • Provides database administrators with the ability to work on a database as a whole at one location • Data consistency is improved and security is easier • Files are only accessible via the centralized host computer • Recovery from disasters is easier • Vulnerable to a single point of failure • Speed problem due to transmission delays
Locating Data in Databases (continued) • Option 2: Distributed database • Complete copies of a database, or portions of a database, are in more than one location, close to the user • Type 1: Replicated database • Copies of database in many locations • Reduced single-point-of-failure problems • Increased user access responsiveness • Type 2: Partitioned databases • A portion of the database in each location • Each location responsible for its own data
به نام آنكه جان را فكرت آموخت جلسه هشتم بانك هاي اطلاعاتي – ادامه
اجزاي اصلي بانكهاي اطلاعات رابطهاي • (انواع بانكهاي اطلاعاتي شبيه: سلسله مراتبي ، شبكهاي ، رابطهاي (RDBMS )) • موجوديت Entity • پديده، شي ، شخص ، مكان يا مفهومي كه در رابطه با آن اطلاعات جمعآوري ميشود ( شبيه دانشجو، درس، ماشين و ...) كه معمولا توسط سطرهاي (يا ركوردها) يك جدول Table نمايش داده ميشوند.
اجزاي اصلي بانكهاي اطلاعات رابطهاي • خصلت يا صفت Attribute • بيان كننده ويژگيهاي يك موجوديت است مثلا نام ، شماره دانشجويي، آدرس و .. براي دانشجو كه توسط ستونهاي جدول )يا فيلد( نمايش داده ميشوند. Fieldكوچكترين واحد ذخيره سازي اطلاعات است. • رابطه Relation • بيان كننده پيوند منطقي بين موجوديتها استمثلا ارتباط موجوديت دانشجو و كلاس
مثال: موجوديت دانشجو فيلدها ركورد ها
مثال: موجوديت درس فيلدها ركورد ها
ارتباط بين موجوديتها ممكن است موجوديتها با يكديگر رابطه داشته باشند. هر ارتباط از يك مفهوم يا سمانتيك Semantic خاصي برخوردار است كه داراي يك بار اطلاعاتي است و در بانك اطلاعاتي ذخيره ميشود. درجه ارتباط مبين تعداد موجوديتهايي است كه در آن ارتباط مشاركت دارند. ارتباط بين موجوديتها را با دياگرام ER يا EER نشان ميدهند. ER=Entity Relationship ; EER=Extended ER
استاد دانشجو ارائه درس ثبت نام در درس درس ارتباط بين موجوديتها ارتباط درجه چند؟ نمودار ER
نمودارEER موجوديت با نماد مستطيل خصيصه با نماد بيضي ارتباط با نماد لوزي
مثالي از يك نمودار EER و بررسي انواع خصيصه يا صفت( فيلد) • انواع صفت يا خصيصه : • الف ـ صفت يا خصيصه كليدي يا كليد KEY شامل : • كليد اصلي PK ( ساده يا مركب ) • كليد خارجي FK • ب ـ صفت ساده و مركب( تجزيه پذير يا تجزيه ناپذير) • ج ـ صفت تك مقداري يا چند مقداري • د ـ صفت مشتق
انواع ارتباط الف ـ ارتباط اجباري يا اختياري ب ـ وابستگي وجودي ( وجود يك موجوديت وابستگي مستقيم به وجود موجوديت ديگري دارد در اينصورت موجوديت وابسته را موجوديت ضعيف Weak گويند.) ج ـ ارتباط از لحاظ نوع اتصال ( يك به يك ، يك به چند و چند به چند)
محصول جزئيات سفارش سفارش مشتري يك چند • كد محصول • نام محصول • قيمت محصول • ....... • شماره سفارش • كد محصول • مقدار سفارش • تخفيف • ....... • كد سفارش • كد مشتري • تاريخ سفارش • ....... • كد مشتري • نام مشتري • آدرس مشتري • ....... چند چند يك يك بانك اطلاعاتي فروش
اجزا ومعماري سيستم بانك اطلاعاتي كاربران DBA زبان برنامه نويسي ميزبان (HL) و زبان فرعي دادهاي (DSL) تصوير يا ديد خارجي ( External View ) ديد خاص كاربران از بيرون كه متفاوت است. تصوير يا ديد اداراكي ( Conceptual View ) ديد طراح بانك شامل موجوديتها، ارتباطات و .. DBMS تصوير يا ديد داخلي يا فيزيكي ( Internal View ) فايلها و رسانه ذخيرهسازي براي ارتباط سطوح سه گانه تبديلاتي وجود دارد(Transformation)
سلسهمراتب عناصر اطلاعاتي در بانك اطلاعات مخزن يا انباردادهWarehouseData بانك يا پايگاه داده فايل ركورد فيلد بايت بيت
اصل جامعيت ارجاعي مطابق اين اصل لازم است كه كلية ارتباطهاي تعريف شده بين جداول هماهنگ و معني دار باشد. يعني نبايد موجوديتهاي فرزندي در بانك باشد كه داراي پدر نباشد يا يتيم باشد.
اصل جامعيت ارجاعي جدول جزئيات درس :موجوديت فرزند جدول درس :موجوديت پدر اگر سطري از جدول پدر حذف گردد لازم است تا سطرهاي فرزند حذف شود وگرنه يتيم ميشود.يا در اضافه شدن سطر جديد به فرزند بايد قبلا پدر آن تعريف شده باشد.
قوانين نرمال سازي در بانكهاي اطلاعاتي براي طراحي بهينه بانك اطلاعاتي كه شامل : -حداقل كردن تعداد دادهها ي تكراري يا كاهش افزونگي Redundancy ـ كاهش احتمال خطا و افزايش سرعت و كارايي - افزايش قابليت انعطاف و تسهيل نگهداري و پشتيباني از داده ها از قواعد نرمال سازي استفاده ميشود.
قوانين نرمال سازي در بانكهاي اطلاعاتي • قواعد يا سطوح نرمال : • 1NF ( First Normal Form) • 2NF ( Second Normal Form) • 3NF ( Third Normal Form) • BCNF ( Boyce/Codd Normal Form) • 4NF (Fourth Normal Form) • 5NF (Fifth Normal Form) • DKNF(Domain-Key Normal Form)
فرم 1NF يك جدول يا رابطه وقتي به فرم 1NF است كه كليه ستونها يا صفتها يا فيلدها ي آن Atomic باشند. سوال : اگر در جدولي فيلد آدرس استفاده شود آيا 1NF در آن صادق است؟
فرم 2NF يك جدول يا رابطه وقتي به فرم 2NF است كه اولا 1NF باشد و ثانيا هر فيلد يا صفت غير كليد لازم است مستقيما به كليد اصلي ( يا اجزاي آن در صورت مركب بودن) وابسته باشد. سوال : در جدول دوره آموزشي كه شامل فيلدهاي كد دوره ، كد دپارتمان كد رئيس دپارتمان است و كد دوره و كد دپارتمان بصورت مشترك كليد اصلي هستند آيا جدول تابع 2NF است؟
فرم 3NF يك جدول يا رابطه وقتي به فرم3NF است كه اولا تابع 2NF باشد يعني همه صفات غير كليدي به كليد اصلي وابسته باشد و ثانيا هيچ دو صفت غير كليدي به يكديگر وابسته نباشند. سوال : اگر در جدول درس فيلدهاي كد درس ، كد معلم ، سنوات سابقه معلم و نام معلم باشند آيا 3NF در آن صادق است؟
Data Warehouses and Data Mining Data Marts Are Subsets of Data Warehouse in which only a focused portion of the data warehouse information is kept. • Data Mining: an information analysis tool that involves the automated discovery of patterns and relationships in a data warehouse