200 likes | 324 Views
Entwicklungsetappen von DBMS. FHTW Berlin Datenbanken Prof. Dr. Zschockelt. Softwareentwicklungs- Basis betrieblicher Tendenzen komponente IKS.
E N D
Entwicklungsetappen von DBMS FHTW Berlin Datenbanken Prof. Dr. Zschockelt Softwareentwicklungs- Basis betrieblicherTendenzen komponente IKS hierarchische Mainframe-DB 1960 Theoretische Arbeiten zum relationalen DM (Codd) 1970 Non-Standard DBMS 1980 Relationale DBMS SQL-1 ISO/IEC-9075-Norm verabschiedet(1986) OLTP-DBMS dominieren Verteilte DBS Unternehmens-DM Client-Server-DBMS 1990 Erste Online-DB SQL-92 ODBC Objektorientierte DBMS Data Warehouse ORDBMS Multi-Media-DB Web-Interface für DBMS 2000 Data Mining DB-basierte Web-Applikationen Mobile Computing XML/Webservices Wissenstechniken 2003 DB werden unternehmens-strategische Kerntechnik 2004 Datenströme ergänzen die DB-Technologie
Datenbankstrategie ist unternehmenskritisch FHTW Berlin Datenbanken Prof. Dr. Zschockelt • Datenbanktechnologie und Web (Architektur, XML, Webservices) • Mobile Datenbanken (Architektur, Kommunikationsprofile, lokations-abhängiger Datenzugriff) • Wissenstechniken (Data Warehousing, Wissensmanagement) Herausforderungen: Forschungsschwerpunkte: • Bewältigung der Heterogenität(= Integrationsfähigkeit) • Bewältigung wachsender Datenquanten • Transformation von Daten in Informationen und Wissen
Relationale – objektorientierte DBMS FHTW Berlin Datenbanken Prof. Dr. Zschockelt • Objektorientierte DBMS • Verwalten Objekte, • Lösen spezielle Aufgaben, • standardisierte Sprachenebene (ODL/OQL) noch in Entwicklung, • sind technologisch noch in Entwicklung • Relationale DBMS • Verwalten Tabellen, • dominieren im Unternehmen, • Nutzen SQL als standardisierte Sprachenebene, • sind technologisch ausgereift. Objektrelationale DBMS verbinden die Vorteile beider und sind als Erweiterung relationaler DBMS konzipiert.
Verteilte Datenbanksysteme- Definitionen - FHTW Berlin Datenbanken Prof. Dr. Zschockelt Eine verteilte Datenbank (VDB, englisch DDB) ist eine Sammlung mehrerer semantisch zusammenhängender Datenbanken, welche über ein Computernetzwerk verteilt sind Ein verteiltes Datenbankmanagementsystem (VDBMS, englisch DDBMS) ist ein Softwaresystem, welches eine VDB verwaltet und transparente Verteilung der Daten für die Nutzer übernimmt. Client-Server Verteiltes Datenbanksystem Knoten Client Server
Verteilte DBMS Vertikal fragmentiert horizontal fragmentiert FHTW Berlin Datenbanken Prof. Dr. Zschockelt Nutzer (Rechnerzugänge) räumlich verteilt Historisch gewachsene heterogene "DB-Landschaft" Datenmenge zu groß
Typische Anwendungen Verteilter DBS FHTW Berlin Datenbanken Prof. Dr. Zschockelt • Datenbasis für räumlich verteilte Unternehmen (Bereiche und Abteilungen an unterschiedlichen Standorten). • Datenbasis für Unternehmen mit Filialen. • Datenbankunterstützte mobile Clients (z. B. Vertreter). • Hochverfügbare Datenbankanwendungen (Netz und technischer bzw. medizinischer Bereich). • Schnelle Recherche über sehr große Datenmengen (z. B. im Web und/oder Data Warehousing). • B to B-Kommunikation zwischen kooperierenden Unter-nehmen.
Besonderheiten verteilter Datenbanken FHTW Berlin Datenbanken Prof. Dr. Zschockelt Im Vergleich zu "einfachen" Datenbanksystemen ergeben sich einige technologische Besonderheiten durch die transparente und in der Regel nicht disjunkte Verteilung der Daten. Insbesondere betrifft das • Die Entwicklung eines globalen Datenmodells mit Fragmen-tierung und Allokation der Daten. • Die Planung und Realisierung des Datenzugriffs auf mehrere Knoten, insbesondere die Entwicklung globaler Views. • Die Sicherung der globalen Datenintegrität, inklusive globaler Fehlererholungsprozesse. • Die Replikation der Daten bei redundantem Mapping. Die Realisierung erfolgt mittels eines- Föderierten Datenbanksystems (FDBS) mit globalem Schema oder- Multidatenbanksystems ohne globalem Schema.
Aspekte der Architektur VDBS in Unternehmen FHTW Berlin Datenbanken Prof. Dr. Zschockelt • Technisch-technologischer Aspekt: Alle Knoten sind gleichberechtigt. Online/Offline ist prozess- und kostenabhängig. • Betriebsorganisatorischer Aspekt: Leitungsstrukturen werden abgebildet, z. B. Master/ Slave-Architektur für hierarchische Leitungsorganisation • Geschäftsprozessorientierter Aspekt:Pull (Information bei Bedarf holen) oder Push (Information bei Entstehung versenden). • Räumlich-zeitlicher Aspekt:Berücksichtigung des Tagesrhythmus und örtlicher Besonderheiten (z. B. Gültigkeit von Kursen, Preisen) • Sicherheitsaspekt:Datenreplikation aus Sicherheitsgründen, Schutz unternehmens-kritischer Daten.
Typische VDB- Architektur für betriebswirtschaftliche Anwendungen Zentrale Filiale 2 Filiale 1 Filialen Filiale 3 FHTW Berlin Datenbanken Prof. Dr. Zschockelt Hierarchische Struktur (Master/Slave-Modell) Beachte: Aus technologischer Sicht sind alle Knoten gleichberechtigt.
Mobile Computing – Mobile Datenbanken FHTW Berlin Datenbanken Prof. Dr. Zschockelt • Mobile Clients • DB-Clients • Browserbasierte Clients Zentrale Datenbank • Mobile Datenbanken(= VDB mit mobilen Knoten) Konsistenzhaltung mittels Online Konsistenzhaltung mittels Replikation Konsistenzhaltung mittels gelegentlicher Synchronisation Hauptproblem: Gerätetyp + Browser erkennen Marktführer: iAnywhere Solutions (Sybase) SQL-Anywhere deckt ca. 68% des Weltbedarfs als kleine mobile DB auf Clients.
Gründe für den Datenbankzugang über das Web FHTW Berlin Datenbanken Prof. Dr. Zschockelt Technologiebasis externe Informationsquelle - vereinheitlichter Zugriff auf - Data Warehouse Zugriff Online-Datenbanken - Electronic Commerce, Merchant - Zugriff auf Daten in Dokumenten Server u. a. mit Lebenszyklus - Nutzung der Funktionalität einer - Zugriff auf XML-Daten (Workflow-) Datenbank - DB-Thin-Client
Anforderungen an den Datenbankzugang über das Web FHTW Berlin Datenbanken Prof. Dr. Zschockelt 1. Neue Datentypen wünschenswert. Implementation hierarchischer Verzeichnisstrukturen Intelligente Volltextsuche z. B. in XHTML-Dokumenten Versionierte Dokumente 2. Lange Transaktionen erforderlich. (HTTP ist zustandslos) 3.Systemblockierung durch fehlerhafte Abfragestrategien vermeiden. 4. Authentisierung der Nutzer erforderlich. ("Normaler" Passwortschutz für kritische Anwendungen (z. B. Bankgeschäfte) nicht ausreichend.) 5. Lokale Datenintegritätskontrollen ermöglichen. 6. "Datenbanktypische" Präsentationsformen ermöglichen. (dynamische Formulare und Berichte)
Schematische Darstellung der DB-Anbindung FHTW Berlin Datenbanken Prof. Dr. Zschockelt • Client Web-Browser Java-Anwendung (Applet) Anwendung • Internet • Intranet Web-ServerApplikationsserverMiddleware Daten-Server Datenbank
Aspekte der DB-Einbindung in Web-Applikationen Datenbank WWW-Server Browser ? FHTW Berlin Datenbanken Prof. Dr. Zschockelt • Art der Veröffentlichung (dynamisch oder statisch) • Netzwerk-Umgebung (LAN oder WAN) • Realisierungsort (Client oder Server) • Implementiertes formales Datenmodell (strukturiert = relational/objektorientiert/objektrelational oder semistrukturiert) • Technologievariante des Datenbankzugriffs • Entwicklungstechniken und -tools • Bewertungskriterien: • Entwicklungsaufwand in Bezug zur Nutzungshäufigkeit • Sicherheit des Datentransfers • Stabilität und Schnelligkeit des Zugriffs • Erwartete Anzahl konkurrierender Nutzer
Basistechnologien für den Web-Zugriff auf DB Realisiert die Logik einer Applikation auf einem eigenen Server. Geeignet für große und/oder komplexe Anwendungen insbesondere bei komplexen Geschäftsprozessen. Einbindung von logischen Komponenten in die DBMS-Funktionalität. Geeignet insbesondere für Multimedia- und technische Anwendungen auf ODBMS z. B. CSP (Caché Server Pages). XML (Extensible Markup Langugage) erobert die Informatik-Welt, ist aber dennoch nicht für jede Applikation unabdingbar. Der "Klassiker" – erste Realisierungsform des DB-Zugriffs. Bindet jedoch viele Systemressourcen und ist wenig konkurrenzfähig gegenüber modernen Technologien. FHTW Berlin Datenbanken Prof. Dr. Zschockelt • Common Gateway Interface ( CGI )Prinzip: WWW-Server reagiert auf Client-Anforderungen durch Aufruf einer CGI-Schnittstelle. Diese startet beliebige Applikationen (z. B. C, PERL, Batch-Dateien), welche ihre Resultate an den WWW-Server zurückgeben, der sie an den WWW-Client sendet. • 2. Application Programming Interface (API) • Prinzip: WWW-Server realisieren oder vermittelt eine Verbindung zur Programier-schnittstelle des DBMS. • 3. Application-Server • Prinzip: WWW-Server baut Verbindung zum Applikation-Server auf. Dieser realisiert Gateway-Funktionalität zur Datenbank. • 4. DBMS mit Web-Server-Funktionalität • Prinzip: Datenbankserver erfüllen "eingebettete" Web-Server-Aufgaben. • 5. Web-Spracherweiterungen • Prinzip: Spracherweiterungen ermöglichen einen direkten Zugriff auf Datenbanken Sehr verbreitet im Freeware-Bereich, weniger geeignet für komplexe Geschäftsprozesse.Dominierend sind ASP (Avtive Server Pages) und ASP.NET,PHP (Hypertext Preprocessor) sowie Java-Servlets.
Datenströme FHTW Berlin Datenbanken Prof. Dr. Zschockelt Datenstrom = kontinuierlich übersandte Datensätze, deren Größe, Menge sowie schnelles Aufkommen verbieten, sie vor der Verarbeitung zu speichern. Anwendungsgebiete sind z. B. Nachrichten, Systemüberwachung- und –steuerung, Analyse wissenschaftlicher Daten, Paketverfolgung usw.
XML (Extensible Markup Language) FHTW Berlin Datenbanken Prof. Dr. Zschockelt ein SGML (Standard Generalized Markup Language) - Subset Grundidee der Sprache Inhalt und Struktur Jedes Dokument wird zerlegt in XML Layout XHTML, … • … liefert Methoden für das Arbeiten mit Daten und ihren Komponenten (www.xml.com) deutsche Einführung: members.aol.com/xmldoku/. • Vorteile: • Präzisere Suchanfragen durch neue Sprachelemente • Entwicklung flexiblerer Web-Anwendungen durch Weitergabe der Resultate von DB-Anfragen • Lokale Berechnung und Manipulation auf dem Client möglich. • Unterschiedliche Darstellungen auf dem Client möglich. • Verteilung von XML-basierten Daten mittels HTTP möglich.
XML (Extensible Markup Language) FHTW Berlin Datenbanken Prof. Dr. Zschockelt • Geschäftsdaten und Datenbanken • "70 % Geschäftsdaten stehen in Textdokumenten" • Unterscheidung aus struktureller Sicht in • dokumentenzentrierte Dokumente, • semistrukturierte Dokumente, • datenzentrierte Dokumente. • Speicherort sind u. a. DBMS vom Typ • relationaler DBMS (inhaltsorientiert zerlegt / strukturorientiert zerlegt / opaque approach (CLOB), • ojektorientierter/objektrelationaler DBMS (benutzerdefinierte Objekte), • "nativer" XML-DBMS (z. B. Tamino). • Speicherformen • CLOB-Ansatz (Textform bleibt bewahrt), • grafenorientierte Speicherung (DOM und Dokument werden gespeichert), • relationale strukturorientierte Zerlegung (Mapping). Abfragesprachen sind XPath (www.w3.org/TR/xpath.html), XML-QL(www.w3.org/TR/NOTE-xml-ql.html), Volltext-SQL u.a.
XML und Datenbanken Speicherung von XMLDokumenten GenerischeSpeicherung derDokumentstruktur Speicherung alsGanzes Abbildung aufDatenbank-struktur AutomatischeVerfahren Anwender-definierteVerfahren Document ObjektModell Volltextindex Volltextindex undStrukturindex EinfachegenerischeSpeicherung geeignet für dokumentzentrierte XML-Dokumente geeignet für semistrukturierte XML-Dokumente geeignet für datenzentrierte XML-Dokumente FHTW Berlin Datenbanken Prof. Dr. Zschockelt Quelle: Datenbank Spektrum Heft 5/2003 Beispiel Web-Service-Architektur.doc (Zschockelt)
Semantic-Web eine Vision? FHTW Berlin Datenbanken Prof. Dr. Zschockelt Problemstellung: Software soll unpräzise Fragestellungen tolerieren verknüpfen mit Ontologien Thesauren Ontologie (KI) = formal definiertes System von Dingen und deren Beziehung zueinander, welche durch Regeln beschrieben werden. Sprachen zur Beschreibung von Ontologien sind z. B. RDF (Resource-Description-Framework), F-Logic und OWL (Ontology Web Language vom WWW-Consortium propagierte Semantic-Web-Sprache). Thesaurus = Stichwortsammlung; erfasst Synonyme, kennzeichnet Homonyme.Begriffe erhalten eine Bedeutung. Thesauren können nach bestimmten Konventionen (z. B. Dublin Core) mit Metadaten angereichert werden. Quelle: Computer Zeitung Nr. 13/2004 Beispiel Web-Service-Architektur.doc (Zschockelt)