120 likes | 295 Views
Projektion (Auswahl von Spalten). Grundoperationen über Relationen. FHTW Berlin Datenbanken Prof. Dr. Zschockelt. 1. Projektion (Auswahl von Spalten). Beispiel:
E N D
Projektion (Auswahl von Spalten) Grundoperationen über Relationen FHTW Berlin Datenbanken Prof. Dr. Zschockelt 1. Projektion (Auswahl von Spalten) Beispiel: Auswahl der ersten drei Spalten für eine externe Sicht! Beispiel: Anzeige ausgewählter Personaldaten Definition: R[L] = R[B1, B2, ... Bj] = { t*=(xi(1), ... xi(j):(x1, ... xn) є R }, wobei L = (B1, B2, ..., Bj) eine Attributskombination von R = (A1, ... An) bezeichnet.
Projektion (Auswahl von Spalten) Grundoperationen über Relationen FHTW Berlin Datenbanken Prof. Dr. Zschockelt 2. Selektion (Auswahl von Zeilen) Beispiel: Auswahl aller Personen weiblichen Geschlechts ( Gesch = "w" ) Definition: R(P) = { t є R:P(t)='true' }sofern die Bedingung P auf R(A1, ... , An) erklärt ist.
Projektion (Auswahl von Spalten) Grundoperationen über Relationen FHTW Berlin Datenbanken Prof. Dr. Zschockelt 3. [natürlicher] Join (Verbund von zwei oder mehr Tabellen) Verbunden über die Felder PersNr in beiden Tabellen. Beispiel: Anzeige der Sprachkenntnisse Anmerkung: Projektion, Selektion und Verbund können kombiniert angewendet werden.
Projektion (Auswahl von Spalten) Grundoperationen über RelationenJoin (Verbund von zwei oder mehr Tabellen) FHTW Berlin Datenbanken Prof. Dr. Zschockelt Der Join (Verbund, Verknüpfung, Verkettung ) ermöglicht die Ableitung einer Relation R(A1, ... An) aus der tupelweisen Verknüpfung zweier Relationen R1(B1, ..., Bi)R2(C1, ..., Cj) kartesisches Produkt. Durch spezielle Formen des Joins werden Einschränkungen definiert: 1. Theta-Join: Selektion der Tupel aus dem Produkt zweier Relationen auf Grund eines Prädikates P (z. B. Ai>Bj). 2. Equi-Join: Verkettung zweier Relationen über "UND"-verknüpfte in Semantik und Wertebereich (Domäne) gleiche Attribute. 3. Natürlicher Join: Equi-Join mit Elimination der doppelt auftretenden Attribute. 4. Outer-Join: Übernahme aller Tupel der ersten Relation R1 und natürlicher Join mit den Tupeln der zweiten Relation R2 (auch Semi-Join) . Anmerkung: Für die Wirtschaftsinformatik sind insbesondere der natürliche und der Outer-Join bedeutsam.
Projektion (Auswahl von Spalten) Zusatzoperationen über RelationenAggregatfunktionen und Gruppierung FHTW Berlin Datenbanken Prof. Dr. Zschockelt Einige für kommerzielle DBMS notwendige Operationen lassen sich nicht mit den Grundoperationen der relationalen Algebra formulieren. Sie sind jedoch unentbehrlich für professionelle Datenbankauswertungen. • Aggregatfunktionen berechnen Werte über alle Tupel (Zeilen) • einer Relation (Tabelle), wenn kein Gruppierungsmerkmal existiert ODER • einer Gruppe von Tupeln (Zeilen) einer Tabelle, wenn ein Gruppierungsmerkmal existiert. Grundlegende Aggregatfunktionen sind: SUM (Summierung), COUNT (Anzahl), AVG (Durchschnitt), MIN (Minimum), MAX (Maximum) . Eine Gruppe kann eine oder mehrere Attribute (Spalten) einer Relation (Tabelle) umfassen und wird durch die Gleichheit der gespeicherten Daten in diesen Attributen definiert.
Problemstellung der Normalisierung FHTW Berlin Datenbanken Prof. Dr. Zschockelt Physische relationale Datenmodelle in 1NF können von schlechter Qualität sein. Ursache dafür sind mögliche Redundanzen und Anomalien. Der Prozess der Qualitätsverbesserung eines physischen relationalen Datenmodells durch Beseitigung/Verminderung der Redundanzen und Anomalien wird Normalisierung genannt. Von besonderer Bedeutung für die Modellierung von relationalen Datenbanken (RDB) ist die dritte Normalform (3NF). Die Theorie der Normalisierung fußt auf funktionalen Abhängigkeiten zwischen den Attributen einer Relation. Neben dem theoretischen Ansatz der Normalisierung gibt es typische semantische Beziehungstypen, die immer zum gleichen Resultat des Normalisierungsprozesses führen.
Redundanzen undAnomalien im RDM FHTW Berlin Datenbanken Prof. Dr. Zschockelt Redundanz: Weitschweifigkeit, Überfluss (Überladung einer Information mit überflüssigen Informationselementen) BESTELLUNG (Bestellung, Lieferant, Name, Datum, Artikel, Bezeichnung, Anzahl) Die Tabelle befindet sich in 1NF, ist also formal zulässig, aber qualitativ nicht hinreichend gut !
Redundanzen undAnomalien im RDM FHTW Berlin Datenbanken Prof. Dr. Zschockelt Redundanz: Weitschweifigkeit, Überfluss (Überladung einer Information mit überflüssigen Informationselementen) BESTELLUNG (Bestellung, Lieferant, Name, Datum, Artikel, Bezeichnung, Anzahl) Alle grün gekennzeichneten Informationen sind aus unterschiedlichen Gründen redundant !
Der Prozess der Normalisierung FHTW Berlin Datenbanken Prof. Dr. Zschockelt Das Normalisieren einer Relation (Tabelle) wird immer durch Aufteilung der Relation auf mehrere Relationen realisiert. Es wird so lange normali-siert, bis die nach der Aufteilung neu entstandenen Relationen der er-wünschten Normalform entsprechen. Beispiel: Diese Relationbefindet sichin 1NF Diese Relationen befinden sich in 3NF
Fazit der Normalisierungstheorie FHTW Berlin Datenbanken Prof. Dr. Zschockelt • Nach den (theoretischen) Regeln der Normalisierung lässt sich eindeutig die Normalform einer Relation bestimmen. • Relationen lassen sich folglich immer in 3NF normalisieren. Es gibt für spezielle Fälle jedoch noch weitere Normalformen (4NF, 5NF) und Normalisierungsverfahren (z. B. Boyce Codd Normal-form – BCNF). siehe dazu Elmasri/Navathe: "Grundlagen von Datenbank- systemen", Addison-Wesley 2002 • Aus betriebswirtschaftlicher (semantischer) Sicht führen typische Beziehungskonstellationen zu vorhersehbaren Normalisierungs-problemen. Bei Erkennen der typischen Beziehungskonstellation kann das daraus resultierende Normalisierungsproblem auch durch praktische Erfahrung gelöst werden.
Zwei typische semantische Beziehungstypenmehrwertige Attribute FHTW Berlin Datenbanken Prof. Dr. Zschockelt Ein- und mehrwertige Attribute in einer Relation, die ein Objekt beschreibt, führen immer zur Verletzung der 2NF. Sie müssen als Master-Detail-Beziehung immer mit zwei oder mehr Relationen beschrieben werden. Beispiel: BESTELLUNG (Bestellung, Lieferant, Name, Datum, Artikel, Anzahl, Nettopreis) Die bestellten Artikel, ihre Bezeichnung und Anzahl sind ein Detail des Masters BESTELLUNG, das in einer Bestellung mehrfach vorkommen kann. Die Lösung: BESTELLUNG (Bestellung, Lieferant, Name, Datum)POSTEN (Bestellung, Artikel, Anzahl, Nettopreis)
Zwei typische semantische BeziehungstypenDynamische Domänen FHTW Berlin Datenbanken Prof. Dr. Zschockelt Dynamische Domänen dienen zur Verwaltung eines sehr großen und/oder stark veränderlichen Wertevorrats für ein Attribut, dessen Konsistenz über die referentielle Integrität geprüft wird.Dynamische Domänen müssen deshalb immer in einer eigenen Relation verwaltet werden. Beispiel: BESTELLUNG (Bestellung, Artikel, Anzahl, Nettopreis)ARTIKELKATALOG (Artikel, Artikelbezeichnung) Artikel in der Tabelle BESTELLUNG ist ein Fremdschlüssel, der die referentielle Abhängigkeit von der Tabelle ARTIKELKATALOG wider-spiegelt. Generell gilt aber: Semantische Beziehungen zwischen Objekten werden vorrangig in semantischen Datenmodellen (z. B. ERM) wirksam.