190 likes | 450 Views
Claudio Henríquez Berroeta. KDD y Técnicas de Minería de Datos en Weka. Contenidos. Introducción, conceptos fundamentales. Técnicas de Minería de Datos Prédictivas Descriptivas Análisis de Datos Ejemplos Prácticos Preguntas. Introducción. Conceptos Fundamentales Business Intelligent
E N D
Claudio Henríquez Berroeta KDD y Técnicas de Minería de Datos en Weka
Contenidos Introducción, conceptos fundamentales. Técnicas de Minería de Datos Prédictivas Descriptivas Análisis de Datos Ejemplos Prácticos Preguntas
Introducción Conceptos Fundamentales Business Intelligent Knowledge discovery in Databases (KDD) Data Mining
Business Intelligent La inteligencia de Negocios es un conjunto de métodos, técnicas y herramientas que apoyan la toma de decisiones para obtener ventajas competitivas en el mercado. Concepto surge a raíz de los Decision Support System (DSS).
Knowledge Discovery in Databases • Proceso de Descubrimiento de conocimiento en Bases de Datos.
Data Mining (1) Minería de Datos se denomina a la explotación de las bases de datos para obtener información no trivial, es decir, encontrar patrones o relaciones en los datos. Antecedentes Grandes cantidades de datos. Aumento de la capacidad de respaldo.
Técnicas de Minería de Datos Descriptivas Buscan describir las relaciones encontradas en las Bases de Datos. Predictivas Buscan predecir un resultado en base a los patrones encontrados en las Bases de Datos.
Técnicas Descriptivas Reglas de asociación Clustering (agrupamiento)
Técnicas Predictivas Árboles de Decisión Redes Neuronales Máquinas de Soporte Vectorial Clasificadores Bayesianos
Análisis de datos de entrada Selección Creación de un Data Almacén de Datos Preprocesamiento Análisis Cualitativo Análisis Cuantitativo Transformación Enriquecimiento
Tipos de Datos Numéricos No soportados por todos los algoritmos edad precio sueldo Nominales Subtipo: Binarios nombre dirección producto sexo
Problema Un gerente de una empresa española, quiere saber las características del producto que se vendió más durante el primer semestre del 2003, y así poder determinar el orden de las prioridades para su abastecimiento.