540 likes | 635 Views
Technologische Grundlagen des Web Warehousing. Juraj Kosmal a0005753@unet.univie.ac.at. Präsentationsinhalt. Internet / Internetservices Webkomponente Datenbankzugang übers Web Architektur und Kapazität eines Web Warehouse Systems. Internet und Internetservices. Internet. Topologie
E N D
Technologische Grundlagen des Web Warehousing Juraj Kosmal a0005753@unet.univie.ac.at KFK Verteilte Systeme/Informationssysteme WS 2002
Präsentationsinhalt • Internet / Internetservices • Webkomponente • Datenbankzugang übers Web • Architektur und Kapazität eines Web Warehouse Systems KFK Verteilte Systeme/Informationssysteme WS 2002
Internet und Internetservices KFK Verteilte Systeme/Informationssysteme WS 2002
Internet • Topologie • TCP/IP Protokoll • Internetadressierung • Uniform Resource Locator (URL) KFK Verteilte Systeme/Informationssysteme WS 2002
Internetservices • World Wide Web (WWW) • serverseitige Architektur • Client schickt ein Request, Server verarbeitet ihn und schickt die Antwort zurück (zB HTML) • File Transfer Protocol (FTP) • Bewegung in der Verzeichnisstruktur • Kopieren von Daten KFK Verteilte Systeme/Informationssysteme WS 2002
Internetservices • Gopher • Menüführung von einer Seite zur nächsten • Wide Area Information Service (WAIS) • ermöglicht eine Dokumentensuche • Telnet • ermöglicht eine Fernsteuerung des Computers KFK Verteilte Systeme/Informationssysteme WS 2002
Internetservices • Internet Relay Chat (IRC) • ermöglicht die Führung einer Realzeitkommunikation • Mail • ermöglicht den Korrespondezaustausch • a0005753@unet.univie.ac.at KFK Verteilte Systeme/Informationssysteme WS 2002
Webkomponente KFK Verteilte Systeme/Informationssysteme WS 2002
Webkomponente • HTML • MIME Typen • Zustandslosigkeit KFK Verteilte Systeme/Informationssysteme WS 2002
HTML • erlaubt, eine Sache auf verschiedensten Computern gleich zu sehen • dynamische Bewegung zwischen Seiten mittels Hypertext • nicht nur Text, sondern auch Graphiken, Ton und Bild KFK Verteilte Systeme/Informationssysteme WS 2002
HTML <HTML> <HEAD><TITLE>HALLO</TITLE></HEAD> <BODY> <CENTER><P>Ich bin zentriert!</P></CENTER> <FONT COLOR = "#FF0080">Ich bin rosarot!</FONT> <P><FONT SIZE = +2>Ich bin um 2 Einheiten größer!</FONT></P> <P><a href="Anderes_Dokument.html">Ich bin ein Link zum anderen Dokument.</a></P> <P>Und das bin ich: <IMG SRC = "photo.jpg" WIDTH=100 HEIGHT=120></IMG></P> </BODY> </HTML> KFK Verteilte Systeme/Informationssysteme WS 2002
HTML KFK Verteilte Systeme/Informationssysteme WS 2002
MIME • Multipurpose Internet Mail Extensions • Browser schickt gleichzeitig mit dem Request eine Mitteilung, welche MIME-Typen er unterstützt KFK Verteilte Systeme/Informationssysteme WS 2002
MIME KFK Verteilte Systeme/Informationssysteme WS 2002
Zustandslosigkeit KFK Verteilte Systeme/Informationssysteme WS 2002
Der Datenbankzugang über das Web KFK Verteilte Systeme/Informationssysteme WS 2002
Der Datenbankzugang über das Web • Preprocess and publish approach (PPP) • Common Gateway Interface (CGI) • Java KFK Verteilte Systeme/Informationssysteme WS 2002
Preprocess and publish approach • Dokumente werden vorbereitet, in das HTML Format konvertiert... (preprocess) • ...und zur Verfügung gestellt (publish). • User bewegt sich mittels • erhaltenen URLs • Hypertext KFK Verteilte Systeme/Informationssysteme WS 2002
Common Gateway Interface • Architektur • Komponente • Input • Kommunikation • Verarbeitung • Output KFK Verteilte Systeme/Informationssysteme WS 2002
Input • mittels command line • http://www.animal-server.com/dogs/dog-names.exe?20 KFK Verteilte Systeme/Informationssysteme WS 2002
Input • mittels HTML <HTML> <HEAD><TITLE>Umfrage</TITLE></HEAD> <BODY> <CENTER><P><H2>Umfrage</H2></P></CENTER> <FORM ACTION = "http://www.umfragezentrale.at"> <P>Wieviele Hundenamen möchten Sie bekommen? <INPUT TYPE = "TEXT" NAME = "AnzHN"></P> </FORM> </BODY> </HTML> KFK Verteilte Systeme/Informationssysteme WS 2002
Input • mittels HTML KFK Verteilte Systeme/Informationssysteme WS 2002
Kommunikation • Browser - Server • Übergabe von Methode, URL, Parametern, MIME-Typen GET HTTP://WWW.UMFRAGEZENTRALE.AT?AnzHN=20 HTTP/2.0 Accept text/html Text/text …… …… KFK Verteilte Systeme/Informationssysteme WS 2002
Kommunikation • Server - Programm • Übergabe mehrerer Daten wegen Zustandslosigkeit... KFK Verteilte Systeme/Informationssysteme WS 2002
Kommunikation • Server - Programm • Übergabe mehrerer Daten wegen Zustandslosigkeit • Darstellung des Responds • einfacher Text • HTML Dokument KFK Verteilte Systeme/Informationssysteme WS 2002
Verarbeitung • 3 Spracharten • Scripts • Standardprogrammiersprachen • Java • Standardisierte Datenbankzugangskonfi-gurationen KFK Verteilte Systeme/Informationssysteme WS 2002
Vorteile Einfach zu lernen, schreiben, verwenden Mächtigkeit der Befehle Einfach zu lesen, ändern Nachteile Unsicher, weil uncompiliert gehalten Ineffizient Geringe Anzahl an Befehlen Verarbeitung - Scripts KFK Verteilte Systeme/Informationssysteme WS 2002
Verarbeitung - Standardprogrammiersprachen • Große Sammlung an Befehlen • Compilierbar • Höhere Sicherheit • Höhere Effizienz • Schwer veränderbar • Schwer zu erlernen KFK Verteilte Systeme/Informationssysteme WS 2002
Verarbeitung – Standardisierte Datenbankzugangskonfigurationen • Server Native Database • ODBC Database Interface • Native Remote Database Interface • Middleware-driven Interface KFK Verteilte Systeme/Informationssysteme WS 2002
Output • Ausgabe der Information in einem nützlichen Format KFK Verteilte Systeme/Informationssysteme WS 2002
Der Datenbankzugang über das Web • Preprocess and publish approach (PPP) • Common Gateway Interface (CGI) • Java KFK Verteilte Systeme/Informationssysteme WS 2002
Java KFK Verteilte Systeme/Informationssysteme WS 2002
Java • Charakteristik • COBOL des 21. Jahrhunderts • Objektorientiert • Sicher • Keine Zeiger • Bytecodeprüfer • Plattformunabhängigkeit • Multithreading KFK Verteilte Systeme/Informationssysteme WS 2002
Java • Komponente • Java Development Kit (JDK) • Compiler, Applet Viewer, Debugger, Applet Demos • Java Application Programming Interface (Java API) • java.lang, java.io, java.util, java.net, usw. KFK Verteilte Systeme/Informationssysteme WS 2002
Java • Standard Extensions • Enterprise Extensions – remote access • JDBC – relationale DB • RMI • IDL • Commerce Extensions KFK Verteilte Systeme/Informationssysteme WS 2002
Java • Standard Extensions • Management Ext. • Server API • Media API • Java Beans KFK Verteilte Systeme/Informationssysteme WS 2002
Java Database Connectivity • Datenzugriff mit Java • Sammlung von Klassen und Methoden • DriverManager, Driver • Connection, Statement • Query, ResultSet • Close KFK Verteilte Systeme/Informationssysteme WS 2002
JDBC - Beispiel //* The animal listing program lists all animals in //* the database and their ages import java.sql.* public class Samplet extends java.applet.Applet { public void paint (Graphics g) { //* declare string variables to hold values String driver = "oracle.sql.OracleDriver" String url = "jdbc:oracle:thin:bob@animaldb" String user = "bob" String pass = "bobpw" String query1 = "Select name, age from animal" KFK Verteilte Systeme/Informationssysteme WS 2002
JDBC - Beispiel try { //*load the driver; Class.forName(driver); //* make the connection Connection c; c = DriverManager.getConnection(url,user,pass); //* create the statement Statement stmt; stmt = c.createStatement(); //* Execute the Query and load into the ResultSet //* called rs ResultSet rs = stmt.executeQuery(query1); KFK Verteilte Systeme/Informationssysteme WS 2002
JDBC - Beispiel //* create loop for the processing of results //* the value of next will be incremented(the next //* row will be read) until there are none left. //* Then rs.next() will be false and the //* while loop will end while (rs.next()) { //* get the two columns from the next row //* the first column, name, is a String, so use //* getString the second column, age, is an //* Integer, so use getInt print them out KFK Verteilte Systeme/Informationssysteme WS 2002
JDBC - Beispiel String c1 = rs.getString(1); Integer c2 = rs.getInt(2); g.drawString(c1,20,y); g.drawString(c2,100,y); y = y +10; } //* Close the statement and the connection stmt.close(); c.close(); } } } KFK Verteilte Systeme/Informationssysteme WS 2002
Architektur und Kapazität eines Webwarehouse KFK Verteilte Systeme/Informationssysteme WS 2002
Architektur und Kapazität eines Webwarehouse • Funktionalität • Architektur • Kapazität KFK Verteilte Systeme/Informationssysteme WS 2002
Architektur eines Web Warehouse • Intranet Configuration • Leveraged Inbound Configuration • Leveraged Outbound Configuration • Dual-Leveraged Configuration KFK Verteilte Systeme/Informationssysteme WS 2002
Funktionalität der Data Warehousing Umgebung • Erwerbsfunktion (E) • Speicherfunktion (S) • Zugriffsfunktion (Z) KFK Verteilte Systeme/Informationssysteme WS 2002
Intranet Configuration Z S E KFK Verteilte Systeme/Informationssysteme WS 2002
Leveraged Inbound Configuration Z S E KFK Verteilte Systeme/Informationssysteme WS 2002
Leveraged Outbound Configuration E S Z KFK Verteilte Systeme/Informationssysteme WS 2002
Dual-Leveraged Configuration E S Z KFK Verteilte Systeme/Informationssysteme WS 2002