1 / 35

Semantisches Datenmodell für flächenbezogene Daten

Semantisches Datenmodell für flächenbezogene Daten. Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller. Gliederung. Flächenbezogene Daten Semantisches Datenmodell Entwurfsebenen Beschreibung konsistenter Zustände Definition von Produktionen Konsistenz

lazaro
Download Presentation

Semantisches Datenmodell für flächenbezogene Daten

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Semantisches Datenmodell für flächenbezogene Daten Von Solveig Velte Hauptseminar: Nichtrelationale Datenbanken Prof. Dr. Thaller

  2. Gliederung • Flächenbezogene Daten • Semantisches Datenmodell • Entwurfsebenen • Beschreibung konsistenter Zustände • Definition von Produktionen • Konsistenz • Schemadefinition • Fazit

  3. Flächenbezogene Daten • Zweidimensionales Ordnungskriterium • Höhe als gesondertes, sekundäres Kriterium • Z.B.: Linien, Strecken, Punkte • Unterschied zu administrativen Daten: stärkere innere Verknüpfung

  4. Flächenbezogene Daten • Durch den Raumbezug müssen neben messbaren auch topologische Eigenschaften (z.B. Nachbarschaftsbeziehungen) und deren Manipulation modelliert werden. • Nachteile der klassischen Datenmodelle: • Topologische Eigenschaften und andere semantische Zusammenhänge müssen umständlich und oft indirekt dargestellt werden. • Relationen- und Netzwerkmodell legen Schwerpunkt auf Informationsstrukturierung und nicht auf Datenmodellierung. Dynamische Aspekte sind nicht voll im Datenmodell integriert.

  5. Flächenbezogene Daten • Flächenbezogene Konsistenzbedingungen stellen zusätzliche Anforderungen an ein Datenbanksystem, diese betreffen metrische und topologische Beziehungen, z.B.: • Ein Grenzpunkt einer Parzelle ist mindestens an zwei Grenzstrecken beteiligt, d.h. es gibt keine „freiliegenden“ Grenzpunkte • Jeder Streckenzug hat genau einen Anfangs- und Endpunkt • Jede Parzelle verweist auf mindestens einen Eigentümer

  6. Anforderungen an ein flächenbezogenes Datenmodell • Berücksichtigung von semantische Zusammenhängen bei flächenbezogenen Daten. Geometrische Daten und deren Beziehungen müssen gleichberechtigt beschrieben und behandelt werden. • Soll deskriptiv sein, da die Struktur und die Permanenz der Daten im Vordergrund stehen. Der deskriptive Ansatz zur Datenbeschreibung gilt auch für die Manipulationsseite. • Muss der Datendefinition wie der -manipulation gleichermaßen gerecht werden. • Soll problemorientiert sein, d.h. es soll eine möglichst große Klasse flächenbezogener Daten bewältigen. • Muss einen formalen Rahmen haben, d.h. durch eine mathematische Theorie begründet sein. • Das Modell muss für Erweiterungen und Ergänzungen offen bleiben. Neue Erkenntnisse und Anwendungsbeispiele sollten ohne allzu großen Aufwand ins bestehende System integriert werden können.

  7. Semantisches Datenmodell • Das Modell kombiniert semantischen Untersuchungen (Theorie der Graphgrammatik) mit dem klassischen Relationenmodells („relationale“ Graphgrammatik) • Von zentraler Bedeutung beim diesem Modell ist die einheitliche Beschreibung statischer und dynamischer Aspekte • Damit unterscheidet sich das Modell von andern Ansätzen, welche zwischen der formalen Beschreibung der Datenstruktur und der Formalisierung von Manipulationssprachen trennen.

  8. Semantisches Datenmodell • Beinhaltet Schichtenmodell • Verschiedene Abstraktionsniveaus der Modellbildung erleichtern den Entwurf der Daten- und Manipulationsstruktur. • Drei Entwurfsebenen: Zustandsebene, Darstellungsebene, Objektebene • Zur Beschreibung der Datenstruktur werden allgemein markierte Graphen verwendet

  9. Graphen • Def.: Ein markierter Graph besteht aus einer Menge V von Knoten, einer Menge E von Kanten und einer Funktion a, welche der Menge der Kanten eine Menge ungeordneter Paare koinzidenter Knoten zuordnet. • Def.: Ein gerichteter Graph oder Digraph ist ein markierter Graph, bei welchem die Funktion a, der Menge der Kanten eine Menge geordneter Paare verschiedener Knoten zuordnet.

  10. Zustandsebene • Die Zustandsebene beschreibt das eigentliche Vorkommen der Entitäten. Eine Entität wird durch Eigenschaft-Wertpaare charakterisiert. • Entitäten lassen sich anschaulich durch Knoten und Kanten eines Graphen darstellen. Die Knoten eines solchen Zustandsgraphen entsprechen einzelnen Datenwerten, die Kanten zeigen die Bedeutung der Beziehung zwischen zwei Datenwerten auf. • Def.: Ein Zustandsgraph besteht aus einer Menge von Datenwerten (Knotenmenge) und Beziehungen (Kantenmenge). Jede Beziehung ist mit der entsprechenden Eigenschaft der zugehörigen Eigenschaft-Wertpaare markiert. • Der Zustandsgraph ist nicht gerichtet d.h. die Kanten repräsentieren gleichzeitig beide Beziehungsrichtungen. Diese Regelung gilt auf sämtlichen Entwurfsebenen. • Der Zustandgraph beschreibt das Datenvorkommen und wichtige semantische Zusammenhänge.

  11. Zustandsebene

  12. Darstellungsebene • Ideen und Begriffe basieren auf einer Erweiterung des Relationenmodells, bei welchem globale und lokale Datenaspekte unterschieden werden. • Auf der Darstellungsebene werden einzelne Knoten und Kanten des Zustandsgraphen (Datenwert, Eigenschaft) in Klassen zusammengefasst. Diese Ebene dient also der Abstraktion, d.h. der datenmäßigen Beschreibung von Entitätsmengen. • Die Zusammenfassung von Entitäten zu Entitätsmengen entspricht der Bildung von mathematischen Relationen (Tabellen). • Pro Relation muss mindestens eine Schlüsselkombination vorhanden sein.

  13. Darstellungsebene • Zur Beschreibung von Eigenschaften einer Entitätsmenge werden Attribute verwendet. • Attribut: Funktion, welche eine Entitätsmenge in einen Wertebereich oder ein kartesisches Produkt von Wertebereichen abbildet. • Bsp.: Entitätsmenge: PUNKT Wertemenge: pktart = (´GP`, ´TP1`, ´TP2`, ´TP3´) Attribut: Punktart • Stimmen zwei Entitäten und sämtliche ihrer Wertkombinationen überein, so werden die beiden Entitäten identisch genannt. Diese identifizierende Eigenschaft kann bereits für einen Teil der Attributskombination gelten. Ist sie minimal, so dass bei Weglassen eines der Attribute der Kombination die eindeutige Identifizierbarkeit verletzt würde, so führt dies zum Begriff des Indentifikationsschlüssels.

  14. Darstellungsebene • Wertebereiche eines Primärschlüssels nennen wir global, solche einzelner Nichtprimärattribute heißen lokal. Die Attribute welche in globale bzw. lokale Wertebereiche abbilden, werden entsprechend global bzw. lokal genannt. Durch globale bzw. lokale Betrachtungen wird geklärt, ob gewisse Wertebereiche in verschiedenen oder ausschließlich einzelnen Entitätsmengen verwendet werden dürfen. • DEF.: Ein Darstellungsgraph besteht aus globalen und lokalen Wertebereichen (Knotenmenge) und aus globalen und lokalen Attributen (Kantenmenge). Die Funktionen, markiert durch Attributsnamen, dürfen nur von globalen in globale bzw. von globalen in lokale Wertebereich abbilden.

  15. Darstellungsebene

  16. Objektebene • Auf der Objektebene werden die einzelnen Entitätsmengen und Beziehungen modelliert. • Durch die dritte Normalform werden (m,n) Beziehungen zwischen Relationen aufgespalten. Dies ergibt eine sogennante Beziehungsrelation, in welche die globalen Attribute der zugehörigen Stammrelation eingehen. Allgemein wird jede Beziehung zwischen Entitätsmengen mittels globalen Attributen dargestellt. • Unter der Rolle einer bestimmten Relation verstehen wir ein Attribut, welches in einer fremden Relation einen globalen Wertebereich referenziert -> Beziehungen zwischen verschiedenen Relationen werden ermöglicht/Globaleigenschaften

  17. Objektebene • Unterscheidung von drei Relationentypen: • Entitätsrelation: besitzt ausschließlich eigene Globalattribute • Beziehungsrelation: darf nur Globalattribute fremder Relationen aufweisen • Gemischte Relation: enthält eigene Globalattribute und solche fremder Relationen

  18. Objektebene • Def.: Ein Objektgraph besteht aus Relationen (in dritter Normalform) als Knotenmenge und Globalattributen als Kantenmenge.

  19. Beschreibung konsistenter Zustände • Der geschilderte Entwurfsprozess führt iterativ zur relevanten Information und deren Struktur. Je nach Entwurfsebene stehen globale oder lokale Fakten im Vordergrund. Um die Menge sämtlicher konsistenter Zustände zu beschreiben, werden gerichtete Graphen verwendet. • Die Einführung gerichteter Graphen ermöglicht, die Datendefinition und –manipulation einheitlich anzugeben. Bei der Datendefinition wird die Struktur der Daten und ihrer Beziehungen beschrieben, indem jedem konsistenten Zustand ein gerichteter Graph zugeordnet wird. Die Anwendung von Ableitungsregeln gerichteter (Prozess-) Graphen auf konsistente Zustände entspricht einer abstrakten Beschreibung der Datenmanipulation.

  20. Strukturgraph • Def.: Ein Strukturgraph ist ein gerichteter Graph und wie folgt definiert: • Die Knoten entsprechen Relationen (Objektebene) oder globalen bzw. lokalen Wertebereichen (Darstellungsebene). • Die Kanten sind gerichtet und zeigen die zu einer Relation gehörigen Global- bzw. Lokalattribute (im nicht markierten Fall) oder Rollen (im markierten Fall)

  21. Strukturgraph

  22. Definition von Produktionen • Def.: Eine Produktion (auch Produktionsregel) hat die folgende Form: <plist;plist>: <left side>  <right side>wobei die Parameterliste die zu substituierenden Größen für die Linke bzw. rechte Seite angibt, und die linke bzw. rechte Seite der Produktionsregel je einen Prozessgraphen darstellt. Die implizit gegebene Verklebungsvorschrift ermöglicht das Ersetzen des linken Prozessgraphen durch den rechten. • Bei Graphersetzung muss im Restgraphen das Vorkommen der rechten Seite der Produktionsregel richtig eingebettet werden. Hier stellt sich im allgemeinen die Frage, welche Knoten des Restgraphen verbunden werden sollen. Die Produktionsregel enthält deshalb zusätzlich eine Verklebungsvorschrift.

  23. Definition von Produktionen

  24. Konsistenztheorem • Jede Produktion überführt einen konsistenten in einen konsistenten Zustand (Abgeschlossenheit oder Konsistenzerhaltung) • Jeder konsistente Zustand kann erzeugt werden (Vollständigkeit oder Konsistenzerzeugung) • Die Produktionsregeln modellieren das dynamische Verhalten, indem jeder konsistente Zustand aus dem (initialen) Startgraphen hergeleitet wird. Konsistenzbedingungen lassen sich durch Eigenschaften der Prozessgraphen formulieren.

  25. Seiteneffekte bei Datenmanipulationen • Verlangen wir bei Mutationsoperationen Konsistenzerhaltung, so müssen vor und nach der eigentlichen Ausführung gewisse Konsistenzbedingungen erfüllt sein. Bei den meisten Anwendungen können diese Konditionen isoliert überprüft werden; dies ist bei flächenbezogenen Daten selten der Fall. Geometrische Daten sind oft as Teilstrukturen zusammengesetzt und zeigen verschiedenste semantische Verbindungen.

  26. Seiteneffekte bei Datenmanipulationen • Durch die Graphennotation werden die Seiteneffekte einer Produktion auf anschauliche Art freigelegt. • Vor der eigentlichen Ausführung einer Manipulation müssen oft einzelne Datenwerte und semantische Verbindungen überprüft werden. Solche auftretenden Nachbarschaften und damit gekoppelte Seiteneffekte werden durch Prozessgraphen modelliert.

  27. Seiteneffekte bei Datenmanipulationen • Def.: Ein Prozessgraph ist ein gerichteter Graph und wie folgt definiert: • Die Knoten entsprechen Relationen (Objektebene) oder einzelnen Datenwerten, Konstanten oder Parameter (Zustandsebene). • Die Kanten sind gerichtet und zeigen die zu einer Relation gehörenden Global- bzw. Lokalattribute (im nicht markierten Fall) oder Rollen (im markierten Fall) • Definition des Prozessgraphen illustriert die Verwandtschaft zum Strukturgraphen der Datendefinition. Dabei liegt die Idee zugrunde, die Datenmanipulation aus der Daten und Strukturbeschreibung herzuleiten.

  28. Seiteneffekte bei Datenmanipulationen

  29. Entwurfsebenen

  30. Schema • Schema: enthält zentral verwaltete Angaben über den Aufbau, Zugriffsbefugnisse, Restriktionen bei Manipulationen etc. -> Datenbank kann konsistenzerhaltend benutzt werden • Schemadefinition soll sich nicht nur auf die Datenstruktur begrenzt sein, sondern auch Manipulationsaspekte miteinbeziehen • Def.: Ein Schema ist durch folgende Regel gegeben: <schema definition> ::= schema <static part> <dynamic part> Wobei der statische Teil (Datenschema) die Wertebereiche und die Relationen festlegt und der dynamische Teil (Manipulationsschema) einen vollständigen Satz von Transaktionen definiert.

  31. Datenschema • Für das statische Datenschema werden die Objekt- und die Darstellungsebene gebraucht. • Def.: <static part> ::= <domain definition> <relation definition> umfasst die Definition der lokalen bzw. globalen Wertebereiche und Entitäts-, gemischte- bzw. Beziehungsrelationen.

  32. Manipulationsschema • Objekt- und die Zustandsebene relevant • Konsistenzerhaltende Produktionen werden spezifiziert • Übersetzung einer Produktion in eine lineare Programmprozedur, welche einen konsistenten Datenbankzustand in einen neuen konsistenten Zustand überführt • Einbezug von Konsistenzbedingungen und semantischen Regeln in Manipulationsoperationen mit Fehlerbehandlung bei Regelverstoß

  33. Fazit • Graphen eignen sich gut um Strukturzusammenhänge direkt aufzuzeigen • Neben der statischen Struktur der Daten ist ihre Dynamik miteinbezogen. Der Entwurf von konsistenzerhaltenden Prozessen basiert auf der einheitlichen Datenbeschreibung (drei Ebenen). Die Kanten der Prozessgraphen drücken wichtige Zusammenhänge aus. Diese Seiteneffekte werden durch Graphen anschaulich und übersichtlich modelliert. Schon eine einfache Mutation, wie z.B. die Änderung der Koordinaten eines Grenzpunktes betrifft mehrere Entitäsmengen. • Die vorgestellten Graphtheoretischen Konzepte erlauben eine einheitliche Darstellung verschiedener Datenbankaspekte, welche bis anhin mit heterogenen Methoden untersucht werden mussten.

  34. Ende

  35. Fragen?

More Related