340 likes | 572 Views
Data Mining mit SQL Server 2008 und Excel 2007. Steffen Krause Technical Evangelist Microsoft http://blogs.technet.com/steffenk. Agenda. Was ist Data Mining und wie können Sie es nutzen ? Data Mining Prozess SQL Server Data Mining Data Mining Integration
E N D
Data Mining mit SQL Server 2008 und Excel 2007 Steffen Krause Technical Evangelist Microsoft http://blogs.technet.com/steffenk
Agenda • Was ist Data Mining und wiekönnenSieesnutzen? • Data Mining Prozess • SQL Server Data Mining • Data Mining Integration • Data Mining Programmierbarkeit • Excel Addins
Analyse-Typen • Abfrage/Reporting/Analyse • “Was ist passiert?” • Einfache Reports • Key Performance Indikatoren • OLAP-Würfel – Slice & Dice • Echtzeit - “Was passiert derzeit?” • Ereignisse/Trigger • Data Mining • “Was wird passieren?” • “Wie/warum ist das passiert?”
Was ist Data Mining? • “Data Mining ist die halbautomatische Extraktion von Mustern, Änderungen, Assoziationen, Anomalien und anderen statistisch signifikanten Strukturen aus großen Datenmengen.” Robert Grossman • “Die nichttriviale Extraktion von impliziten, vorher unbekannten und potentiell nützlichen Informationen aus Daten" W. Frawley,et al 1992 • “Die Wissenschaft vom Herausziehen nützlicher Information aus großen Datenmengen oder Datenbanken” D. Hand, et al 2001 • Auch bekannt als • Machine Learning • PredictiveAnalytics
Data Mining Aufgaben • Klassifikation • Schätzung • Segmentierung • Assoziation • Voraussage • Text-Analyse • Fortgeschrittene Daten-Erforschung
Agenda • Was ist Data Mining und wiekönnenSieesnutzen? • Data Mining Prozess • SQL Server Data Mining • Data Mining Integration • Excel Addins
Vorherzusagende Daten Trainingsdaten Mining-Modell DM Engine DM Engine Mining-Modell Mining-Prozess Mining-Modell Mit Vorhersagen
Business Understanding Data Understanding Data Preparation Modeling Evaluation Deployment Data Mining ProzessCRISP-DM “Doing Data Mining” Data “Putting Data Mining to Work” www.crisp-dm.org
Business Understanding Data Understanding Data Preparation Modeling Evaluation Deployment Data Mining Process in SQLCRISP-DM SSAS (OLAP) DSV SSIS SSAS (OLAP) Data SSIS SSAS(OLAP) SSRS Flexible APIs SSAS (Data Mining) www.crisp-dm.org
Demo-Zusammenfassung • Datenvorbereitung mit Sampling-Transformationen in Integration Services • Analysis Services Project in Visual Studio® erstellen • Modelle erstellen und auf den Server deployen • Modelle mit Lift Chart evaluieren • Modell mit Reporting Services in Produktion nehmen
Agenda • Was ist Data Mining und wiekönnenSieesnutzen? • Data Mining Prozess • SQL Server Data Mining • Data Mining Integration • Excel Addins
Angebot in SQL Server • Neun (7-10) Algorithmen, gemeinsam mit MS Research entwickelt • Data Mining wird zugänglich und einfach benutzbar durch ein integriertes Benutzerinterface, Unterstützung über Produktgrenzen hinaus und ein vertrautes Standard-API. • Komplettes Framework für Erstellung und Deployment von intelligenten Anwendungen
Business Knowledge Data Mining Relativer Geschäfts-Wert OLAP Reports (Adhoc) Reports (Statisch) Einfach Kompliziert Usability Wert von Data Mining SQL Server
Clustering Zeitreihen (2 Algorithmen) Naïve Bayes Sequence Clustering Assoziation Vollständiger Satz von Algorithmen Entscheidungsbäume Eingeführt mit SQL Server 2000 Neuronale Netzwerke + Lineare Regression Logistische Regression
Agenda • Was ist Data Mining und wiekönnenSieesnutzen? • Data Mining Prozess • SQL Server Data Mining • Data Mining Integration • Excel Addins
Data Mining User Interface • SQL Server BI Development Studio • Umgebung für Erstellung und Daten-Erforschung • Data Mining-Projekte in Visual Studio Solutions mit zusammenhängenden Projekten • Source Control Integration • SQL Server Management Studio • Eine Anwendung für alle Verwaltungsaufgaben • Management, Ansicht und Abfrage von Mining Modellen
BI Integration • Integration Services • Data Mining Processing und Ergebnisse integrieren sich direkt in die Pipeline • OLAP • Processing von Mining-Modellen direkt aus Cubes • Verwendung von Mining-Ergebnissen als Dimensionen • Reporting Services • Einbetten von Data Mining Ergebnissen direkt in Reporting Services Reports
Eingebettetes Data Mining • Entscheidungen ohne Programmierung • Geschäftsregeln aus Daten lernen • Kundenanpassung • Logik automatisch an den Kunden angepaßt • Automatisches Update • Logik durch Re-Processing mit aktuellen Daten aktualisiert
Agenda • Was ist Data Mining und wiekönnenSieesnutzen? • Data Mining Prozess • SQL Server Data Mining • Data Mining Integration • Excel Addins
“Data Mining ist schwer” • Anwender wollen nur anwenden • Wie können Sie: • Das Problem definieren? • Daten auswählen? • Eingaben selektieren? • Ausgaben definieren? • Ergebnisse interpretieren? • Ergebnisse überprüfen?
Mission Impossible • “Data Mining für die Massen” • Data Mining Angebote für alle Benutzer
Table Analysis Tools for Office Excel 2007 • Ausreisserhervorheben • Kategorienfinden • Einflussfaktor-Analyse • Vorhersage • Was wärewenn • Zielsuche • Fill from example • Warenkorbanalyse
Data Mining Client für Office Excel 2007 • Datenvorbereitung • Modell-Erstellung aus Excel Daten • Modell-Test • Modell-Ansicht • Modell-Verwaltung • Vorhersage aus Excel Daten • Import von Vorhersagedaten nach Excel
Data Mining Templates for Office Visio 2007 Grafische Data Mining Sichtenals Visio-Diagramme Interaktion Annotation Publikation
Excel Addins demo
Zusammenfassung • Neun Algorithmen + Viewer • BI Dev Studio für Entwickler und Analysten • Excel 2007 für Analysten und Jedermann • Integration mit SSIS, SSAS und SSRS • Neue Welt der “Intelligenten Anwendungen” • Vollständige Plattform für alle Ebenen der DM-Nutzung
Ressourcen • http://www.sqlserverdatamining.com • http://www.sqlis.com/ • http://www.sqlserveranalysisservices.com/ • http://msdn.microsoft.com/sql/ • Blogs • http://blogs.technet.com/steffenk • http://blogs.msdn.com/jamiemac • Webcasts • http://www.microsoft.com/germany/technet/webcasts
Your MSDN resourcescheck out these websites, blogs & more! PresentationsTechDays: www.techdays.chMSDN Events: http://www.microsoft.com/switzerland/msdn/de/presentationfinder.mspxMSDN Webcasts: http://www.microsoft.com/switzerland/msdn/de/finder/default.mspx MSDN EventsMSDN Events: http://www.microsoft.com/switzerland/msdn/de/events/default.mspxSave the date: Tech•Ed 2009 Europe, 9-13 November 2009, Berlin MSDN Flash (our by weekly newsletter)Subscribe: http://www.microsoft.com/switzerland/msdn/de/flash.mspx MSDN Team BlogRSS: http://blogs.msdn.com/swiss_dpe_team/Default.aspx Developer User Groups & CommunitiesMobile Devices: http://www.pocketpc.ch/Microsoft Solutions User Group Switzerland: www.msugs.ch.NET Managed User Group of Switzerland: www.dotmugs.chFoxPro User Group Switzerland: www.fugs.ch
Your TechNet resourcescheck out these websites, blogs & more! PresentationsTechDays: www.techdays.ch TechNet EventsTechNet Events: http://technet.microsoft.com/de-ch/bb291010.aspx Save the date: Tech•Ed 2009 Europe, 9-13 November 2009, Berlin TechNet Flash (our by weekly newsletter)Subscribe: http://technet.microsoft.com/de-ch/bb898852.aspx Schweizer IT Professional und TechNet BlogRSS: http://blogs.technet.com/chitpro-de/ IT Professional User Groups & CommunitiesSwissITPro User Group: www.swissitpro.chNT Anwendergruppe Schweiz: www.nt-ag.chPASS (Professional Association for SQL Server): www.sqlpass.ch
Save the date for tech·days nextyear! 7. – 8. April 2010Congress Center Basel
Premium Sponsoring Partners Classic Sponsoring Partners Media Partner