1 / 31

Data und Web Mining

Data und Web Mining. KFK Semantic Web: Knowledge Management LV-Leiter: Mag. Peter Höfferer Helena Oroszlan Sybille Pipal. Data Mining Definitionen Allgemeines Data Mining Prozess Methoden und Techniken Anwendungsgebiete Data Warehouse | OLAP | Data Cubes. Web Mining

Download Presentation

Data und Web Mining

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Data und Web Mining KFK Semantic Web: Knowledge Management LV-Leiter: Mag. Peter Höfferer Helena Oroszlan Sybille Pipal

  2. Data Mining Definitionen Allgemeines Data Mining Prozess Methoden und Techniken Anwendungsgebiete Data Warehouse | OLAP | Data Cubes Web Mining Definition Allgemeines Konzepte Analyse von Web Daten Web Mining Verfahren Tools Anwendungsgebiete Probleme Überblick Überblick Data und Web Mining H. Oroszlan, S. Pipal

  3. Daten formalisierte Darstellung von Sachverhalten, Begriffen oder Befehlen unstrukturiertes Gebilde aus Zeichen maschinell verarbeitet enthalten Informationen Datenbanken und Datenbanksysteme systematisch strukturierte, langfristig verfügbare Sammlung von Daten DBMS als Schnittstelle für Kommunikation mit DB Netzwerke Gruppe von PCs, die miteinander verbunden sind gemeinsame Nutzung von Daten LAN | WAN Data Mining - Definitionen 1 Data Mining | Definitionen Data und Web Mining H. Oroszlan, S. Pipal

  4. Data Mining Entdecken und Extrahieren von Informationen  Finden von Mustern Wissensgewinnung Knowledge Discovery in Databases (KDD) oft Synonym für Data Mining gesamte Findungsprozess  beschreibt automatisierte Verfahren nützt Data Mining Methoden Text Mining  Mustererkennung in unformatierten Daten Web Mining  Mustererkennung im WWW Data Mining - Definitionen 2 Data Mining | Definitionen Data und Web Mining H. Oroszlan, S. Pipal

  5. Wozu dient Data Mining? Ziel: aus einer klar definierten Datenmenge Wissen zu extrahieren Data Mining | Allgemeines Data und Web Mining H. Oroszlan, S. Pipal

  6. Vorteile Wettbewerbsvorteile Entdeckung + Gewinnung von Informationen aus Daten relevante Informationen Stütze für Kundenbetreuungssystem Nachteile Datenschutz keine Gewissheit über Richtigkeit hohe Kosten hohe Wissensanforderung Data Mining Data Mining | Allgemeines Data und Web Mining H. Oroszlan, S. Pipal

  7. Voraussetzungen – Ansprüche an die Daten Unvollständigkeit und Spärlichkeit der Daten Dynamik der Daten Datenschmutz Redundanz Irrelevante Felder Datenvolumen Prozessphasen Planungsphase Vorbereitungsphase Miningphase Auswertungsphase Data Mining Prozess Data Mining | Der Prozess Data und Web Mining H. Oroszlan, S. Pipal

  8. Beantwortung der Frage: WAS WOLLEN WIR ERREICHEN? Definition von Erwartungswerten Berechnung des erwarteten Aufwands (Kosten + Zeit) Beschaffung von Fachleuten Planungsphase Data Mining | Der Prozess Data und Web Mining H. Oroszlan, S. Pipal

  9. Datenbeschaffung Identifikation der Datenquellen Datenextraktion aus verschiedenen Datenquellen Datenintegration zu einem Datenbestand Gesetzliche Vorschriften berücksichtigen Datenaufbereitung Identifikation falscher Werte Identifikation fehlender Werte Identifikation korrelierter Merkmale Algorithmus der Datenerhebung wird festgelegt Daten an die Anforderungen des Algorithmus anpassen Vorbereitungsphase Data Mining | Der Prozess Data und Web Mining H. Oroszlan, S. Pipal

  10. Suche nach Mustern innerhalb großer Datenbestände Generierung von problemspezifischen Modellen Auswertung der Ergebnisse Rückkopplung ? Visualisierung der Teilergebnisse Miningphase Data Mining | Der Prozess Data und Web Mining H. Oroszlan, S. Pipal

  11. Auswertung der Ergebnisse Interpretation der Anwender Visualisierung der Ergebnisse Wissensgewinnung Auswertungsphase Data Mining | Der Prozess Data und Web Mining H. Oroszlan, S. Pipal

  12. Der Prozess im Überblick Data Mining | Der Prozess Data und Web Mining H. Oroszlan, S. Pipal

  13. Klassifikation = Gruppenbildung ähnlicher Objekte Entscheidungsbaum - neuronale Netze fallbasiertes Schließen Techniken und Methoden 1 Data Mining | Der Prozess Data und Web Mining H. Oroszlan, S. Pipal

  14. Segmentierung = Zerlegung in Teile Clusteranalyse PrognoseBasis: Werte aus früheren PeriodenZiel: Prognose für Zukunft + Gewinn unbekannter Ausprägungen Abhängigkeitsanalyse Warenkorbanalyse Abweichungsanalyse Objekte mit untypischen Merkmalsausprägungen feststellen = Identifikation von Ausreißern Techniken und Methoden 2 Data Mining | Der Prozess Data und Web Mining H. Oroszlan, S. Pipal

  15. Business Intelligence Customer Relationship Management (CRM) Einzelhandel Chemie- und Pharmakologie Industrie Fernerkundungsdaten Banken Versicherungen Telefonfirmen Fluglinien Anwendungsgebiete Data Mining | Anwendung Data und Web Mining H. Oroszlan, S. Pipal

  16. Data Warehouse Datenbanksystem, das Daten aus verschiedenen Quellen verwaltet Data Mining | artverwandte Begriffe Data und Web Mining H. Oroszlan, S. Pipal

  17. Data Warehouse 2 RDB: Relationale Datenbank | VLRDB: Very Large RDB | OORDB: Objektrelationale DB | OODB: Objektorientierte DB | MDDB: Mehrdimensionale DB Data Mining | artverwandte Begriffe Data und Web Mining H. Oroszlan, S. Pipal

  18. OLAP (1/4)(Online Analytical Processing) • Methoden und Tools • Analyse von Kennzahlen • Codd Regeln • FASMI Data Mining | artverwandte Begriffe Data und Web Mining H. Oroszlan, S. Pipal

  19. OLAP – FASMI (2/4) • Fast • Analysis • Shared • Multidimensional • Information Data Mining | artverwandte Begriffe Data und Web Mining H. Oroszlan, S. Pipal

  20. OLAP – Architekturkonzepte (3/4) • ROLAP (relational) • MOLAP (multidimensional) • HOLAP (hybride) • DOLAP (desktop) Data Mining | artverwandte Begriffe Data und Web Mining H. Oroszlan, S. Pipal

  21. OLAP – Data Cube (4/4) • Dimensionen • Ausprägungen • Zellen • Hierarchien Wien Stmk Dimension 1 Bgld Wein Dimension 2 Bier Jan. Feb. Mär. Dimension 3 Data Mining | artverwandte Begriffe Data und Web Mining H. Oroszlan, S. Pipal

  22. Web Mining • Beschaffung und Auswertung von Web Daten • 2 Ansätze • Web Content Mining • Web Usage Mining Web Mining | Überblick Data und Web Mining H. Oroszlan, S. Pipal

  23. Was sind Web Daten? • Anzahl der Clicks • Zeit auf der Web Seite • Wörter in Suchmaschinen Web Mining | Allgemeines Data und Web Mining H. Oroszlan, S. Pipal

  24. Web Mining Konzepte • Logfiles • Cookies • Registrierung • Unterschiedliche Konzepte Web Mining | Allgemeines Data und Web Mining H. Oroszlan, S. Pipal

  25. Analysen von Web Daten Datenauswahl Datenaufbereitung Datenbereinigung Identifikation v. Nutzen u. Sitzungen Datenintegration Mustererkennung Interpretation Web Mining | Allgemeines Data und Web Mining H. Oroszlan, S. Pipal

  26. Web Mining Prozess Web Mining | Der Prozess Data und Web Mining H. Oroszlan, S. Pipal

  27. Web Mining Verfahren • Path Analyse • Assoziationsanalyse • Clusteranalyse • Klassifikationsanalyse • Sequenzanalyse Web Mining | Verfahren Data und Web Mining H. Oroszlan, S. Pipal

  28. Web Mining Tools • Pattern Discovery Tools • Erkennen verschiedener Patterns • WEBMINER • Pattern Analysis Tools • Analyse der gefundenen Patterns • WebViz • Data Cube Web Mining | Tools Data und Web Mining H. Oroszlan, S. Pipal

  29. Anwendungsgebiete • Kundenprofile • Platzierung der Werbungen • Strukturierung einer Web Seite • Kundenspezifische Werbung • Kontakt via E-mail • Personalisiert Web Seite Web Mining | Anwendung Data und Web Mining H. Oroszlan, S. Pipal

  30. Probleme • Schnelle Änderung von Web Daten • Logfiles alleine nicht ausreichend • Registrierung nicht korrekt • Muss interne Daten integrieren • Gewisse Auskünfte nicht möglich Web Mining | Probleme Data und Web Mining H. Oroszlan, S. Pipal

  31. Danke für Ihre Aufmerksamkeit!

More Related