420 likes | 931 Views
בסיסי נתונים - מצגת ההרצאה -. 1. מערכות ניהול קבצים FMS - File management Systems. תו, שדה, רשומה, קובץ הפיתוח של תוכנית היישום: הגדרת מבנה הקובץ כתיבת הלוגיקה העסקית הידור ריצה ← הפיקוח מועבר אל FMS אשר מחזיר את התוצאה בעיות: כול תוכנית מחזיקה הגדרת הקובץ
E N D
בסיסי נתונים - מצגת ההרצאה - 1
מערכות ניהול קבצים FMS - File management Systems • תו, שדה, רשומה, קובץ • הפיתוח של תוכנית היישום: • הגדרת מבנה הקובץ • כתיבת הלוגיקה העסקית • הידור • ריצה ← הפיקוח מועבר אל FMS אשר מחזיר את התוצאה • בעיות: • כול תוכנית מחזיקה הגדרת הקובץ • רמה נמוכה של תמיכה בשינויים: שינוי בקובץ גורר שינוי בתוכנית • פתרון דרך קובץ נוסף הביא לכפילות נתונים • FMS מנהל קובץ אחד, לא את הקשרים ביטול אב ללא הבנים שלו 2
מערכות לניהול בסיסי נתונים (1) DBMS - Database Management Systems • קובץ ← מושג פיסי • טבלה ← מושג לוגי ← בכל קובץ טבלה אחת או יותר • בסיס נתונים ← אוסף טבלאות קשורות בקשרים לוגיים כלשהם • המאפשר את שיתוף הנתונים בין היישומים השונים • בסיס הנתונים מכיל גם טבלאות המתארות את מבנה בסיס הנתונים עצמו • ניהול הקשרים=יחסים=Relational בין הטבלאות (בניגוד ל←FMS) • מערכת RDBMS ← כול הטבלאות כאוסף אינטגרטיבי↔אחד בעל קשרים • הגדרת נתונים Data Definition← לוגית ופיסית ← חיצונית ליישום • טיפול בנתונים D. Manipulation← גישה אל בסיס הנתונים וביצוע פעולות אילוצי אמינות Integrity Constrains← הבאים להבטיח אמינות בסיס הנתונים 3
מערכות לניהול בסיסי נתונים (2) DBMS - Database Management Systems • מערכת RDBMS ← כול הטבלאות כאוסף אינטגרטיבי↔אחד בעל קשרים • הגדרת נתונים Data Definition← לוגית ופיסית ← חיצונית ליישום • טיפול בנתונים D. Manipulation← גישה אל בסיס הנתונים וביצוע פעולות • אילוצי אמינות Integrity Constrains← להבטיח אמינות בסיס הנתונים • מערכת אחת מרכזית: • המנהלת את כול הפניות אל בסיס הנתונים • מכירה את כול הקשרים • ניהול ההגדרות של הנתונים באופן מרכזי ובלתי תלוי בתוכניות 4
מודל העבודה שלRDBMS(3) מודל ההפשטה שלANSI/SPARC ↔ DB 5
תכונות/יכולות תוכנות לבניית DB • הגדרת טבלה: שם חד←משמעי חד←חד ערכי • הגדרת העמודות: שם חד←משמעי חד←חד ערכי • הגדרת סוג הנתוניםTYPE • המפתח העיקרי Primary Key • תחומים של ערכים מותרים (מרחב ערכים) • קשרים לוגיים בין הטבלאות • כללי הגנה על הטבלאות והנתונים • פרוצדורות בסיסDatabase Procedures • מזניקים Triggers 6
אי תלות פיסית ולוגית אפיון בסיסי נתונים Data Model Entity Relationship Diagram Entity Relationship Model מודל פתוח סגור 7
מודל הנתונים • תפישה רעיונית המבטאת מציאות תודות להפשטה • או • מסגרת לוגית המתארת את המציאות • הגדרהM = {Structure, Constrains, Operators}: • כלי תפישתי המשמש לתיאור המציאות באמצעות אוסף כללים המגדירים: • מבנה הנתונים← ישויות, תכונות, קשרים • האילוצים אשר על הנתונים לקיים← חד ערכיות, ערכים, תחומים... • האופרטורים לעדכון ושינוי הנתונים← פעולות על פי חוקיות שליפה של כול >3 • בניה בעזרת תרשים ERD במספר שלבים: • הגדרה של הישויות וכול פרטי המידע • הקשרים • ישויות וקשרים מורכבים • נרמול 8
Entity Relationship Diagram מודל תפישתי הנפוץ ביותר. פותח על ידי Peter Chen בשנת 1976. זהו מודל גרפי המייצג את מערכת המידע כאוסף של ישויות ושל קשרים בין הישויות. המודל מספק כלי לתכנון בסיס הנתונים על בסיס תבנית המידע בארגון.
ערך של תכונה • ערך של תכונה מוגדר כתוכן התכונה בנקודת זמן מסוימת. • לדוגמא: • הערך של התכונה "גובה" בישות "אבי לוי" היא 1.80.
דוגמא: מס' סטודנט הוא ערך בודד. ציונים של הסטודנט הוא תכונה מרובת ערכים.
Entity Relationship Data Model(1) • ישות = מייצגת אוביקט • חזקה = קיומה העצמאי בלתי תלוי באחרת אב • חלשה = קיומה העצמאי תלוי באחרת בן • תכונה Attribute = מאפיין Characteristic של האוביקט • פשוטה = אינה ניתנת לחלוקה • מורכבת = ניתנת לחלוקה למרכיבים כתובת, שם • מחושבת = ערכה הוא תוצאה של חישוב נתונים אחרים גיל • נתון מובנה = מבנה קבוע • נתון לא מובנה = צרופה תמונה, קובץ • סוג נתונים TYPE • שלם Integer • עשרוני Decimal • מחרוזת Character • בוליאני Boolean 16
Entity Relationship Data Model(2) • תכונה Attribute = מאפיין Characteristic של האוביקט • ערך Value • ערך חובה Mandatory • ערך בודד או מרובת ערכים Single or Multiple • מרחב ערכים Domain = סוג, שיטת ייצוג, אופרטורים רק כפל • טווח • רשימה סופת • סוג הנתונים ת.ז. • בעיות בשיטה זו: • הוספה מאוחרת של תכונות • מתי לייצג אוביקט מסוים כישות 17
Entity Type קבוצת ישויות • קבוצה או סוג ישות = אוסף (מופעים (Occurrences • ישויות מאותו סוג הנבדלות בערכי התכונות • קבוצת ישות מיוצגת כטבלה (אחת או יותר) • תכונה = עמודה • ישות = שורה • ישות על ← ישות כללית המכילה תכונות המשותפות • לכול תת הישויות שלה. רכבים←רכבי שטח+רכבי כביש • ← כול תת ישות מוסיפה תכונות ייחודיות לה, • ללא חפיפה של תכונות (על↔תת) • ← ישות על שייכת רק לתת ישות אחת 18
מפתח Key • מפתח אפשרי Candidate Key ← • זיהוי חד ערכי Unique ID • מינימליות/אי כפילות Non redundancy • לא ניתן לסלק אף לא תכונה אחת מבלי להרוס את התנאי הקודם • מפתח ראשי Primary Key ← מתוך האפשריים • פשוט = תכונה אחת • מורכב = כמה תכונות לשם הגדרה חד ערכית קורס+סמסטר+סטודנט←ציון בקורס • מפתח זר Foreign Key ← [לשם הגדרה של קשרים] • תכונה או יותר המשמשת מפתח ראשי בקבוצה אחרת • ערכי המפתח הזר הם תת קבוצה של ערכים בקבוצה השניה או NULL 19
מפתח מפתח של קבוצת ישות מוגדר כאוסף של תכונות מינימלי המזהות באופן חד ערכי מופע של ישות מסוימת בקבוצת הישויות.
דוגמאות למפתחות בקבוצת הישות "סטודנטים": ת.ז. הוא מפתח. בקבוצת הישות "חיילים": ת.ז. או מספר אישי הוא מפתח. בקבוצת הישויות "ציונים": ת.ז. סטודנט + מס' קורס + סמסטר + שנה. בקבוצת הישויות "קורסים": מס' קורס או מס' מחלקה + שם קורס מהווה מפתח.
דוגמא לא נכונה למפתח • ת.ז. + שם סטודנט אינו מפתח מכיוון שמפתח חייב להיות מינימלי. • שם סטודנט אינו מפתח מכיוון שאינו מגדיר באופן חד ערכי כל מופע אפשרי של קבוצת הישויות.
סימון מפתח בתרשים dep_num Courses name points
קשר יחס בעל משמעות בין קבוצות ישות. דוגמא: • בבסיס נתונים של המוסד אקדמי: סטודנטים לומדים בקורסים. לכן יש קשר בין קבוצת הישויות "סטודנטים" לבין קבוצת הישויות "קורסים". • בבסיס נתונים של חברת וידאו: שחקנים משתתפים בסרטים. לכן יש קשר בין קבוצת הישויות "שחקנים" לבין קבוצת הישויות "סרטים".
כיצד הדבר נראה בדיאגרמה? קשר מסומן באמצעות מעוין דוגמא:
נרמול נתונים Data Normalization תהליך המייצר טבלאות המייצגות את המודל התפישתי באופן מדויק ואמין ללא כפילות או אנומליה 29
אנומליה ← סתירה paradox בנתונים • ההוספה Insertion • כאשר מבקשים להוסיף לטבלה נתונים ללא מפתח • הביטול Deletion • כאשר בעת ביטול שורה אובדים נתונים נוספים • העדכון Update • כאשר עדכון הנתונים יוצר פרדוקס/חוסר עקביות עדכון חלקי • הפתרון: פירוק טבלאות ← תוך שימור המידע והתלויות 30
חוקי הנרמול בשלב האפיון • NF1 ← כול תכונה יכולה לקבל ערך אחד, ללא קבוצות/נגררות • אין תכונות מחושבות • סטודנט←קורסים הופך להיות סטודנט←סטודנט/לקורס • NF2 ← כול תכונה שאינה המפתח חייבת להיות תלויה בכול המפתח • מספור ח←ן+מספר ספק • NF3 ← כול תכונה שאינה מפתח חייבת להיות תלויה אך ורק במפתח • עובדים, ת.ז., שם, מס' מחלקה, שם מחלקה ← להוסיף טבלה מס' מחלקה, שם מחלקה • BCNF ← אסור כי תהיינה תלויות במפתח מורכב 31
העיצוב ← תיאור ERD על ידי Relational Data Model • המטרה: ייצוג הנתונים באופן המאפשר תרגום לבסיס נתונים • טבלה = קבוצת ישויות • שורה = ישות • תכונה = עמודה • הקשרים הן העמודות הזהות בטבלאות השונות 32
תרגיל מסכם • התבקשתם ע"י הנהלת המכללה לתכנן בסיס נתונים שיאפשר את ביצוע במטלות הבאות: • טיפול בפרטי סטודנטים. • טיפול בציונים. • טיפול בגביית כספים מסטודנטים (בלבד). • טיפול ורישום לקורסים. 33
סימנים ERD = הכיתוב בסכמה • <> קשר • # ← מפתח PK = מפתח זר = FK • * ← אינו יכול לקבל NULL = NN או M • l ← ישות חלשה • > ← קשר רב ערכי, רב-רב ערכי • ( ← יחס בחירה "או" • O ← Optional 34
טבלת סטודנטים • ת.ז. - PK • שם משפחה. • שם פרטי. • כתובת. • טלפון. • ממוצע בגרות. • ציון פסיכומטרי. • תאריך לידה. 35
טבלת ציונים • ת.ז - PK • מס' קורס - PK • שנת לימודים - PK • סמסטר - PK • מועד - PK • ציון 36
טבלת תשלומים • מס' אסמכתא - PK • ת.ז • סיבת התשלום • תאריך התשלום • אמצעי תשלום • סכום 37
טבלת קורסים • מס' קורס - PK • שם הקורס • דרישות קדם • נקודות זכות 38
טבלת קבוצות לימוד (של קורסים) • יום לימוד • שעת התחלה • שעת סיום • מס' מרצה • מינימום נרשמים • מקסימום נרשמים • חדר לימוד • מס' קבוצה - PK • מס' קורס • או "מפתח מרובה": • מספר קורס - PK • מספר קבוצה - PK 39
רישום סטודנטים לקבוצות • ת.ז - PK • מס' קבוצה - PK 40
שאלות ? 41