560 likes | 831 Views
POWTÓRZENIE. Faza projektowania bazy danych : Modelowanie związków encji. Zbiór encji; Wystąpienie encji; Związek; Wystąpienie związku; Stopień związku; Związki rekurencyjne; Atrybuty encji: proste , złożone , jednowartościowe , wielowartościowe , pochodne ; Atrybuty związków;
E N D
POWTÓRZENIE Faza projektowania bazy danych:Modelowanie związków encji • Zbiór encji; • Wystąpienie encji; • Związek; • Wystąpienie związku; • Stopień związku; • Związki rekurencyjne; • Atrybuty encji:proste, złożone, jednowartościowe, wielowartościowe, pochodne; • Atrybuty związków; • Więzy strukturalne:wzajemnie jednoznaczne, typu „jeden do wielu”, typu „wiele do wielu”; • Więzy liczności i uczestnictwa; • Problemy występujące w modelach ER:pułapka wachlarzowa, pułapka szczelinowa; • Rozszerzone modelowanie związków encji:Specjalizacja, Generalizacja, Agregacja, Kompozycja.
Normalizacja: Głównym celem projektowania bazy przeznaczonej dla systemu relacyjnego jest właściwa reprezentacja danych, związków i więzów. W identyfikowaniu właściwych relacji pomaga technika nazywana normalizacją, która można powiedzieć jest techniką wstępującą projektowania bazy danych. Normalizacja – to technika służąca do wyznaczania zbioru relacji o pożądanych na podstawie wymagań względem danych przedsiębiorstwa cechach.
1972 – po raz pierwszy przedstawiony proces normalizacji przez E.F.Codda; wówczas zproponował trzy postacie normalne: 1NF, 2NF, 3NF (normal form). 1974 – R.Boyce i E.F.Codd wprowadzili silniejszą definicję trzeciej postaci normalnej (postać normalna Boyce’a-Codda BCNF) Powyższe postacie normalne są oparte na zależnościach funkcyjnych pomiędzy atrybutami. Wprowadzone kilka lat później wyższe postacie normalne, wychodzące poza BCNF, czwarta i piąta postać normalna (Fagin 1977, 1979) dotyczą sytuacji występujących bardzo rzadko.
Redundancja danych i anomalie aktualizacji: Główne zadanie w projektowaniu relacyjnej bazy danych to pogrupowanie atrybutów w relacje w sposób, który minimalizuje redundancję danych – efektem jest zmniejszenie wymagań pamięciowych dla plików implementujących bazowe relacje. Np. porównanie relacji: PersonelBiuro z relacjami: Personel Biuro
PersonelBiuro: Personel: Biuro:
Takie relacje zawierające redundantne dane mogą być przyczyną anomalii aktualizacji, które dzielą się na: • anomalie wstawienia (przy nowym pracowniku informacje o biurze mogą być błędnie wpisane – niespójność bazy); • anomalie usuwania (po usunięciu informacji o pracowniku znikają informacje o biurze); • anomalie modyfikacji (gdy zmiana adresu biura trzeba zmienić we wszystkich rekordach pracowników tego biura). Poprzez dekompozycję relacji PersonelBiuro na relacje Personel i Biuro pozbywamy się problemu anomalii aktualizacji.
Proces normalizacji: Normalizacja jest to formalna technika oparta na kluczach głównych oraz na zależnościach funkcyjnych. Często realizowana w serii kroków, z których każdy odpowiada specyficznej postaci normalnej o ustalonych własnościach. Relacje otrzymują wówczas coraz bardziej ograniczony format, stając się tym samym coraz mniej podatne na anomalie aktualizacji.
Postać nieznormalizowana – to tabela zawierająca co najmniej jedną powtarzającą się grupę. Pierwsza postać normalna (1NF – first normal form) – to relacja, w której każde przecięcie wiersza i kolumny zawiera tylko jedną wartość. Druga postać normalna (2NF) – oznacza relację w pierwszej postaci normalnej, w której każdy atrybut spoza klucza głównego jest od niego w pełni funkcyjnie zależny. Trzecia postać normalna (3NF) – oznacza relację w pierwszej i w drugiej postaci normalnej, w której żaden atrybut spoza klucza głównego nie jest od niego przechodnio zależny.
Zależności funkcyjne: Zależność funkcyjna opisuje związek pomiędzy atrybutami w relacji (tabeli): Np. z relacji Personel czyli dla każdego pracownika występuje tylko jedno stanowisko; czyli istnieje wielu pracowników powiązanych z danym typem stanowiska.
Np.: Rozważmy wartości atrybutów pracownikNr i imięNazwisko w relacji Personel. Dla sytuacji przedstawionej w tabeli Personel mogą zachodzić następujące zależności funkcyjne: pracownikNr → imięNazwisko imięNazwisko → pracownikNr Jednak po rozważeniu wszystkich możliwych wartości atrybutów pracownikNr i imięNazwisko w relacji Personel jedynym związkiem, który pozostaje prawdziwy jest: pracownikNr → imięNazwisko
Postać nieznormalizowana – to tabela zawierająca co najmniej jedną powtarzającą się grupę. Nieznormalizowana tabela KlientWynajęcie:
Pierwsza postać normalna (1NF – first normal form) – to relacja, w której każde przecięcie wiersza i kolumny zawiera tylko jedną wartość. Pierwszy sposób usuwania powtarzających się grup: KlientWynajęcie
Drugi sposób usuwania powtarzających się grup: Klient NieruchomośćWynajęcieWłaściciel
Druga postać normalna (2NF) Normalizacja z pierwszej do drugiej postaci normalnej polega na usunięciu zależności częściowych: Wynajęcie WłaścicielNieruchomość
Trzecia postać normalna (3NF) Wszystkie atrybuty spoza klucza głównego w relacji WłąścicielNieruchomość są funkcyjnie zależne od klucza głównego, z wyjątkiem atrybutu wImięNazwisko, który jest także zależny od właścicielNr. Usuwamy, zatem powyższą zależność: Nieruchomość Właściciel
KlientWynajęcie 1NF WłaścicielNieruchomość 2NF Wynajęcie Klient Nieruchomość Właściciel 3NF Rozkład relacji KlientWynajęciew 1NF do relacji w 3NF:
Zestawienie relacji w 3NF: Klient Wynajęcie Nieruchomość Właściciel
Postać normalna Boyce’a-Codda (BCNF): oznacza relację, w której każdy wyznacznik zależności jest kluczem kandydującym. Potencjalne naruszenie BCNF może wystąpić w relacji o następujących własnościach: - relacja zawiera dwa (lub więcej) złożone klucze kandydujące; - klucze kandydujące relacji pokrywają się (tzn. mają co najmniej jeden wspólny atrybut).
Np. dla sytuacji: WywiadZKlientem Relacja WywiadZKlientem zawiera trzy złożone klucze kandydujące: (klientNr, dataWywiadu) (pracownikNr, dataWywiadu, czasWywiadu) (pokójNr, dataWywiadu, czasWywiadu) które pokrywają się wzajemnie, dzieląc między sobą wspólny atrybut dataWywiadu.
Natomiast mamy następujące zależności funkcyjne: zf1klientNr, dataWywiadu → czasWywiadu, pracownikNr, pokójNr (klucz główny) zf2pracownikNr, dataWywiadu, czasWywiadu → klientNr(klucz kandydujący) zf3pokójNr, dataWywiadu, czasWywiadu → pracownikNr, klientNr (klucz kandydujący) zf4pracownikNr, dataWywiadu → pokójNr Relację WywiadZKlientem przekształcamy do relacji Wywiad i PokójPersonel: Wywiad (klientNr, dataWywiadu, czasWywiadu, pracownikNr) PokójPersonel (pracownikNr, dataWywiadu, pokójNr) wówczas gdy pracownicy przeprowadzają wiele wywiadów dziennie.
Wywiad PokójPersonel
POWTÓRZENIE Normalizacja: • Pojęcia: • redundancja danych; • anomalie aktualizacji (wstawienia, usuwania, modyfikacji); • dekompozycja i jej własności; • zależności funkcyjne. • Proces normalizacji: • postać nieznormalizowana; • pierwsza postać normalna (1NF – first normal form); • druga postać normalna (2NF); • trzecia postać normalna (3NF); • postać normalna Boyce’a-Codda (BCNF).
Metodologia : to kompleksowe podejście wykorzystujące procedury, techniki, narzędzia oraz metody tworzenie dokumentacji służące realizacji i uproszczeniu procesu projektowania. Konceptualne projektowanie bazy danych – to proces tworzenia modelu dla informacji wykorzystywanych w przedsiębiorstwie, niezależny od wszelkich szczegółów reprezentacji fizycznej.
Logiczne projektowanie bazy danych – to proces tworzenia modelu dla informacji wykorzystywanych w przedsiębiorstwie, przystosowanego do konkretnego modelu danych (np. model relacyjny), lecz niezależnego od konkretnego SZBD i innych szczegółów implementacji fizycznej. Fizyczne projektowanie bazy danych – proces tworzenia opisu implementacji bazy danych w pamięci zewnętrznej, który zawiera relacje bazowe, organizację plików, indeksy stosowane dla uzyskania efektywnego dostępu do danych, a także wszystkie więzy integralności i zagadnienia bezpieczeństwa.
Główne zasady efektywnego projektowania baz danych: • jak najwięcej kontaktuj się z użytkownikami bazy danych; • w trakcie całego procesu modelowania danych postępuj zgodnie z przyjętą metodologią; • stosuj podejście uwzględniające przepływ danych; • uwzględniaj w modelu kwestie struktury i integralności danych;
stosuj w trakcie projektowania techniki konceptualizacji, normalizacji i oceny możliwości realizacji wymaganych transakcji; • wszędzie, gdzie tylko to możliwe, wyrażaj model danych za pomocą diagramów; • stosuj język projektowania bazy danych (DBDL od ang. Database Design Language) do opisu tych własności, których nie można w prosty sposób wyrazić za pomocą diagramów; • utwórz słownik danych uzupełniający diagramy i DBDL; • zawsze, gdy zachodzi taka potrzeba, powtarzaj odpowiednie kroki modelowania.
Konceptualne projektowanie bazy danych: Krok 1. Tworzenie lokalnego konceptualnego modelu danych dla każdej perspektywy Krok 1.1. Określ występujące zbiory encji Krok 1.2. Ustal typy występujących związków Krok 1.3. Określ atrybuty odpowiadające poszczególnym zbiorom encji i związkom Krok 1.4. Określ dziedziny poszczególnych atrybutów Krok 1.5. Ustal klucze kandydujące i klucze główne Krok 1.6. Rozważ możliwość zastosowania zaawansowanych metod modelowania (krok opcjonalny) Krok 1.7. Zweryfikuj utworzony model pod kątem występowania redundancji Krok 1.8. Zweryfikuj możliwość realizacji transakcji w lokalnym modelu konceptualnym Krok 1.9. Omów lokalny konceptualny model danych z użytkownikiem
Logiczne projektowanie bazy danych w modelu relacyjnym: Krok 2. Tworzenie i weryfikacja lokalnego modelu logicznego dla każdej perspektywy: Krok 2.1. Usuń własności niekompatybilne z modelem relacyjnym (krok opcjonalny); Krok 2.2. Wyznacz relacje dla lokalnego logicznego modelu danych; Krok 2.3. Wykonaj normalizację relacji; Krok 2.4. Sprawdź, czy relacje umożliwiają realizację transakcji; Krok 2.5. Wyznacz więzy integralności; Krok 2.6. Omów lokalny logiczny model danych z użytkownikiem. Krok 3. Tworzenie i weryfikacja globalnego logicznego modelu danych: Krok 3.1. Scal lokalne logiczne modele danych w model globalny; Krok 3.2. Sprawdź poprawność globalnego logicznego modelu danych; Krok 3.3. Sprawdź możliwości przystosowania modelu do przewidywanych zmian; Krok 3.4. Omów globalny logiczny model danych z użytkownikami.
Proces konceptualnego i logicznego projektowania bazy danych składa się z trzech głównych kroków. Celem kroku 1 jest podział problemu na zadania łatwiejsze do analizy poprzez rozważenie różnych perspektyw użytkowników. W wyniku kroku 1 powstaje wiele (lub jeden) lokalnych konceptualnych modeli danych. Każdy z tych modeli powinien stanowić kompletną i dokładną reprezentacje zagadnienia z punktu widzenia innego użytkownika lub grupy użytkowników. Krok 2 odwzorowuje każdy lokalny model konceptualny na lokalny logiczny model danych dla modelu relacyjnego, składający się z diagramów związków encji, schematów relacji oraz dokumentacji pomocniczej. W kroku 3 następuje integracja lokalnych logicznych modeli danych (reprezentujących różne perspektywy) w jeden globalny logiczny model danych całego przedsiębiorstwa (reprezentujący wszystkie perspektywy użytkowników).
Krok 1: Tworzenie lokalnego konceptualnego modelu danych dla każdej perspektywy (każdego obszaru zainteresowań) W trakcie analizy zagadnienia zazwyczaj zidentyfikowanych zostaje wiele różnych perspektyw. W przypadku dużego stopnia wzajemnego ich pokrywania się, niektóre z nich można połączyć w perspektywy „grupowe” z nadanymi im własnymi nazwami. Krok 1.1.Określ występujące zbiory encji (dokumentuj informacje o zbiorach encji) Częstą metodą określenia zbiorów encji jest wyróżnienie obiektów, których istnienie wynika z samej natury modelowego zagadnienia. Czasami wyróżnienie zbiorów encji może być trudne, co spowodowane jest sposobem ich reprezentacji w specyfikacjach wymagań użytkowników, którzy posługują się zazwyczaj przykładami lub analogiami, czy też synonimami i homonimami.
Fragment słownika danych przedstawiający opis zbiorów encji: Uzupełnieniem konceptualnego modelu danych jest dokumentacja, w tym słownik danych utworzony w trakcie tworzenia modelu
Ustal typy występujących związków (między wyróżnionymi wcześniej zbiorami encji): Krok 1.2. Dużą uwagę należy poświęcić temu, aby wykryć wszystkie związki zawarte wprost lub wynikające pośrednio ze specyfikacji wymagań użytkownika. W tym celu: • używaj diagramów związków encji (ER); • ustal krotności w poszczególnych związkach encji (do weryfikowania i utrzymywania określonych własności danych); • sprawdź czy występują pułapki wachlarzowe lub szczelinowe; • sprawdź, czy każdy zbiór encji występuje w przynajmniej jednym związku (należy jeszcze raz sprawdzić wymagania użytkownika i ustalić, czy nie doszło do pominięcia jakichś związków lub czy encja nie występuje w innej części modelu); • udokumentuj typy związków.
Biuro Personel Ma BiuroNr PersonelNr Nadzoruje Oferuje Klient Nieruchomość Ogląda NieruchomośćNr KlientNr Posiada Wynajmuje Wynajęty Przez Wynajęcie Właściciel prywatny WłaścicielNr WynajęcieNr Pierwsze przybliżenie diagramu:
Określ atrybuty odpowiadające poszczególnym zbiorom encji i związkom Krok 1.3. Poprzez zidentyfikowanie rodzajów informacji o encjach i związkach, które chcemy reprezentować w bazie danych. Określamy: • atrybuty proste i złożone; • atrybuty jednowartościowe i wielowartościowe; • atrybuty pochodne – umieszczamy je aby uniknąć utraty informacji w przypadku usunięcia bądź zmodyfikowania atrybutów od których zależy atrybut pochodny; • potencjalne problemy; • dokumentowanie informacji o atrybutach (po zidentyfikowaniu atrybutów należy przyporządkować im adekwatne i czytelne dla użytkownika nazwy).
Krok 1.4.Określ dziedziny poszczególnych atrybutów • W kompletnym modelu danych określona jest dziedzina każdego atrybutu, a także: • dopuszczalny zbiór wartości atrybutu; • dopuszczalny zakres długości i format atrybutu. Mogą być też podane dodatkowe informacje o dziedzinach, takie jak zbiór dopuszczalnych operacji na atrybutach oraz wykaz atrybutów, które mogą być ze sobą porównywane lub używane łącznie. • Możemy zdefiniować np.: • dziedzinę dopuszczalnych numerów pracowników (pracownikNr) jako zbiór łańcuchów o długości nie większej niż 5 znaków, w których pierwsze dwa znaki są literałami, a następne (od jednego do trzech) tworzą liczbę z zakresu 1-999; • dopuszczalne wartości dla atrybutu płeć jako np. zbiór łańcuchów jednoznakowych: „M” lub „K”.
Krok 1.5.Ustal klucze kandydujące i klucze główne: Kluczem kandydującym jest minimalny zbiór atrybutów, który jednoznacznie identyfikuje każde wystąpienie encji w zbiorze encji. • Przy wyborze klucza głównego spośród kluczy kandydujących warto rozważyć: • klucz o najmniejszej liczbie atrybutów; • klucz, którego wartości najrzadziej ulegają zmianom; • klucz kandydujący o najmniejszej liczbie znaków (dotyczy kluczy składających się z atrybutów tekstowych); • klucz o najmniejszej wartości maksymalnej (dotyczy kluczy o wartościach numerycznych); • klucz, z którego najłatwiej będzie korzystać użytkownikowi. Jeśli wybór klucza głównego jest możliwy, wtedy zbiór encji nazywamy silnym, zaś gdy nie możemy wybrać żadnego klucz głównego, zbiór encji nazywany jest słabym.
Kieruje dataPoczątkowa premia 0..1 Zarządza 0..1 Personel Biuro 1..1 0..1 Ma 1..1 BiuroNr PersonelNr 1..* 1..1 1..1 1..1 Oferuje Nadzoruje DataRejestracji Rejestruje 0..* Wynajęcie Klient Preferencje Wynajmuje Określa 0..* 1..1 1..1 1..1 KlientNr UmowaNr 0..* 1..1 Wynajęty Przez Nieruchomość 1..* 0..100 NieruchomośćNr 1..* dataOgłoszenia 1..* 1..* koszt PPosiada I Posiada Ogłasza 0..1 0..1 Gazeta Właściciel prywatny Właściciel Instytucjonalny 0..* NazwaGazety I Nazwa WłaścicielNr Diagram związków encji z informacjami o kluczach głównych:
Krok 1.6.Rozważ możliwość zastosowania zaawansowanych metod modelowania (krok opcjonalny): Rozważenie potrzeby użycia zaawansowanych metod modelowania, takich jak specjalizacja/generalizacja, agregacja i kompozycja. Użycie (bądź nie) zaawansowanych metod modelowania powinno służyć czytelności diagramu związków encji i jasności modelu dla istotnych zbiorów encji i związków między nimi. Np. możemy dokonać generalizacji encji WłaścicielPrywatny i WłaścicielInstytucjonalny, tworząc nadklasę Właściciel zawierającą wspólne dla obu zbiorów encji atrybuty: włascicielNr, adres i telNr.
Krok 1.7.Zweryfikuj utworzony model pod kątem występowania redundancji: • Proces ten składa się z następujących czynności: • ponowne sprawdzenie związków wzajemnie jednoznacznych (1:1) – ponieważ w trakcie ustalania występujących zbiorów encji może dojść do utworzenia dwóch różnych zbiorów reprezentujących te same obiekty ze świata rzeczywistego np. Klient i Najemca; • usunięcie związków redundantnych (nadmiarowych) – ponieważ naszym celem jest stworzenie minimalnego modelu danych. Wykrycie istnienia więcej niż jednej ścieżki między dwoma zbiorami encji jest stosunkowo łatwe, jednak nie muszą one oznaczać, że jeden ze związków jest redundantny, ponieważ mogą one reprezentować inne powiązania między zbiorami encji. Przy poszukiwaniu redundancji istotne jest zatem zrozumienie i analiza znaczenia poszczególnych związków.
Krok 1.8.Zweryfikuj możliwość realizacji transakcji w lokalnym modelu konceptualnym : Teraz należy sprawdzić czy utworzony model rzeczywiście umożliwia wykonanie wszystkich transakcji wymaganych w danej perspektywie. • Możemy to osiągnąć poprzez: • sporządzenie opisu wymagań poszczególnych transakcji i sprawdzeniu, czy wszystkie informacje wymagane do realizacji transakcji zostały umieszczone w modelu; • wykorzystanie ścieżek transakcji – poprzez graficzną reprezentację ścieżki, przez którą przechodzi transakcja na diagramie związków encji, możemy też w ten sposób ustalić, które elementy modelu nie są wykorzystywane, a które są krytyczne dla realizacji transakcji. Przeprowadzenie tych czynności sprawdzających na tym etapie projektu (a nie później) jest bardzo istotne, ponieważ naprawianie błędów w modelu na dalszym etapie pracy jest i dużo trudniejsze i droższe. Krok 1.9.Omów lokalny konceptualny model danych z użytkownikiem (w celu weryfikacji, czy model jest „prawdziwą” reprezentacją modelowanej perspektywy).
Logiczne projektowanie bazy danych w modelu relacyjnym: Krok 2. Tworzenie i weryfikacja lokalnego modelu logicznego dla każdej perspektywy Krok 2.1.Usuń własności niekompatybilne z modelem relacyjnym (krok opcjonalny jeżeli wybieramy relacyjny SZBD do realizacji bazy danych); • Cele tego kroku to: • usunięcie binarnych związków typu „wiele do wielu” (*:*) – dekomponowanie poprzez utworzenie pośredniego zbioru encji, a następnie zamianę związku „wiele do wielu” (*:*) na dwa związki typu „jeden do wielu” (1:*), w których występuje nowy zbiór encji; • usunięcie rekurencyjnych związków typu „wiele do wielu” (*:*) – poprzez ich rozłożenie i ustalenie nowego „pośredniczącego” zbioru encji; • usunięcie związków złożonych – też poprzez rozłożenie i utworzenie pośredniczącego zbioru encji; • usunięcie atrybutów wielowartościowych (poprzez zastąpienie ich nowym zbiorem encji).
Krok 2.2.Wyznacz relacje dla lokalnego logicznego modelu danych: Związki pomiędzy encjami są reprezentowane za pomocą „wiązania” poprzez klucze główne i obce. W każdym binarnym związku typu 1:* encja występująca po stronie „jeden” jest encją nadrzędną, a encja po stronie „wiele” podrzędną. Związek taki jest reprezentowany poprzez umieszczenie atrybutów klucza głównego encji nadrzędnej w relacji reprezentującej encję podrzędną. Atrybuty te stanowią klucz obcy relacji podrzędnej. Np.:
Elementy procesu przekształcania encji i związków na relacje:
Krok 2.3.Wykonaj normalizację relacji : Przeprowadzamy proces normalizacji: 1NF – usuwa powtarzające się grupy atrybutów; 2NF – usuwa częściowe zależności od klucza głównego; 3NF – usuwa przechodnie zależności od klucza głównego; BCNF – usuwa pozostałe anomalie z zależności funkcyjnych Normalizacja daje bardzo elastyczny projekt, który łatwo daje się dalej rozwijać i rozszerzać. Krok 2.4.Sprawdź, czy relacje umożliwiają realizację transakcji
Krok 2.5.Wyznacz więzy integralności : • Trzeba rozważyć pięć typów więzów integralności: • wymagana obecność danych; • więzy dziedzin atrybutów (ustalane z wyborem dziedzin atrybutów – krok 1.4); • integralność encji (ograniczenie, że klucz główny zbioru encji nie może przyjmować wartości pustych należy uwzględnić po wyborze klucza głównego – 1.5); • integralność referencyjna (wymuszanie więzów integralności); • więzy ogólne (reguły biznesowe, zasady działania). • Krok 2.6.Omów lokalny logiczny model danych z użytkownikiem
Krok 3. Tworzenie i weryfikacja globalnego logicznego modelu danych : Krok 3.1.Scal lokalne logiczne modele danych w model globalny • Spis typowych czynności wykonywanych w metodzie scalania: • Porównanie nazw i zawartości encji/relacji i ich kluczy kandydujących. • Porównanie nazw i zawartości związków/kluczy obcych. • Scalenie encji/relacji z lokalnych modeli danych. • Włączenie (bez scalania) encji/relacji unikalnych dla poszczególnych lokalnych modeli danych. • Scalenie związków/kluczy obcych występujących w lokalnych modelach danych. • Włączenie (bez scalania) związków/kluczy obcych unikalnych dla poszczególnych lokalnych modeli danych. • Sprawdzenie kompletności zbiorów encji/relacji i związków/kluczy obcych. • Sprawdzenie kluczy obcych. • Sprawdzenie więzów integralności.
Relacje reprezentujące globalny logiczny model danych projektu WymarzonyDom :