1 / 17

Fundamentos de Minería de Datos

Fundamentos de Minería de Datos. Introducción al Data Mining. Fernando Berzal fberzal@decsai.ugr.es. ¿Qué es la minería de datos?. Extracción de patrones (“conocimiento”) en grandes cantidades de datos. Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining

flo
Download Presentation

Fundamentos de Minería de Datos

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Fundamentos de Minería de Datos Introducción alData Mining Fernando Berzalfberzal@decsai.ugr.es

  2. ¿Qué es la minería de datos? Extracción de patrones (“conocimiento”)en grandes cantidades de datos Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía

  3. ¿Qué es la minería de datos? Extracción de patrones (“conocimiento”)en grandes cantidades de datos Requisitos • No trivial • Implícito • Previamente desconocido • Potencialmente útil Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía

  4. “Data rich, Information poor” Conocimiento(patrones interesantes) ¿Qué es la minería de datos? Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía

  5. KDD (Knowledge Discovery in Databases) Extracción de conocimiento en bases de datos Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía

  6. KDD (Knowledge Discovery in Databases) Extracción de conocimiento en bases de datos • Limpieza de datos(eliminación de ruido e inconsistencias) • Integración de datos(combinación de múltiples fuentes de datos) • Reducción/Selección de datos(identificación de datos relevantes para el problema) • Transformación de datos(preparación de los datos para su análisis) • Minería de datos(técnicas de extracción de patrones y medidas de interés) • Presentación de resultados(técnicas de visualización y de representación del conocimiento) Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía

  7. KDD (Knowledge Discovery in Databases) Extracción de conocimiento en bases de datos Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía

  8. Carácter multidisciplinar Evaluación de resultadosResumen de datos Gestión de grandes cantidades de datos Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía Bases de datos Estadística Data Mining Visualización IA AprendizajeRepresentación del conocimiento Presentación de resultados

  9. Clasificación de técnicas En función de su propósito general: • Técnicas descriptivas • Técnicas predictivas También se pueden clasificar atendiendo a • el tipo de datos que hay que analizar • el tipo de “conocimiento” que se obtiene • el tipo de herramienta que utiliza • el dominio de aplicación Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía

  10. Fuentes de datos • Bases de datos relacionales • Bases de datos multidimensionales (DW) • Bases de datos transaccionales • Series temporales, secuencias y data streams • Datos estructurados (grafos, redes sociales) • Datos espaciales y espaciotemporales • Textos e hipertextos (p.ej. Web) • Bases de datos multimedia (p.ej. imágenes) Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía

  11. Técnicas de Data Mining Caracterización o resumen Discriminación o contraste Patrones frecuentes, asociaciones y correlaciones Clasificación y predicción Detección de agrupamientos (clustering) Detección de anomalías (outliers) Análisis de tendencias (series temporales) Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía

  12. Evaluación de resultados Un resultado es interesante si… • es comprensible (por seres humanos) • es válido con cierto grado de certeza • es potencialmente útil • es novedoso o sirve para validar una hipótesis El interés de los resultados se puede evaluar • objetivamente (criterios estadísticos) • subjetivamente (perspectiva del usuario) Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía

  13. Sistemas de Data Mining Una tarea de minería de datos puede describirse en términos de… • Datos relevantes(lo que hay que analizar) • Tipo de conocimiento(lo que se desea obtener) • Conocimiento previo (background knowledge, para guiar el proceso) • Medidas de interés(para evaluar los resultados obtenidos) • Técnicas de representación(para representar los resultados obtenidos) Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía

  14. Sistemas de Data Mining Arquitecturatípica Interfaz de usuario Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía Evaluación de patrones Base de conocimiento Motor de minería de datos Base de datos o Data Warehouse Limpieza, integración, selección y transformación de datos … DB DW WWW

  15. Temas de investigación • Técnicas eficientes de minería de datos • Escalabilidad • Técnicas incrementales • Algoritmos paralelos • Incorporación de conocimiento previo • Evaluación de resultados (interés) • Interacción con el usuario • Técnicas interactivas (a distintos niveles de abstracción) • Técnicas de presentación y visualización de resultados • Análisis de “nuevos” tipos de datos • Estructuras complejas (grafos, redes sociales) • Bases de datos heterogéneas… Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía

  16. Bibliografía: Libros de texto Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía Jiawei Han & Micheline Kamber: “Data Mining: Concepts and Techniques” Morgan Kaufmann, 2006, ISBN 1558609016 Pang-Ning Tan, Michael Steinbach & Vipin Kumar: “Introduction to Data Mining” Addison-Wesley, 2006, ISBN 0321321367

  17. Bibliografía: Investigación • REVISTAS • ACM Transactions on KDD • IEEE Transactions on Knowledge and Data Engineering • Data Mining and Knowledge Discovery (DMKD) • ACM SIGKDD Explorations • Data & Knowledge Engineering (DKE) • CONGRESOS • KDD (ACM SIGKDD International Conference on KDD) • ICDM (IEEE International Conference on Data Mining) • SDM (SIAM Data Mining Conference) • PKDD (Principles and Practices of KDD) • SIGMOD (Management of Data) • CIKM (Information and Knowledge Management) • WEB: http://www.kdnuggets.com/ Definición Técnicas deData Mining Evaluaciónde resultados Sistemas deData Mining Temas de investigación Bibliografía

More Related