130 likes | 317 Views
APORTACIONES EN EL SOFTWARE ELVIRA: MAYO’03-MAYO’04 GRUPO ISG, UPV-EHU. Donostia, 14-V-2004. PROGRAMADORES. Rubén Armañanzas Rosa Blanco José L. Flores Aritz Pérez Guzmán Santafé. APORTACIONES EN VARIOS CAMPOS. Construcción clasificadores supervisados
E N D
APORTACIONES EN EL SOFTWARE ELVIRA: MAYO’03-MAYO’04GRUPO ISG, UPV-EHU Donostia, 14-V-2004
PROGRAMADORES • Rubén Armañanzas • Rosa Blanco • José L. Flores • Aritz Pérez • Guzmán Santafé Implementaciones en Elvira ISG
APORTACIONES EN VARIOS CAMPOS • Construcción clasificadores supervisados • Medidas “filter” de selección-rankeo de variables predictoras • Construcción clasificadores no-supervisados • Discretización de variables continuas • Interfaz gráfico (GUI) de Elvira Aportaciones en el cvs (la mayoría en el GUI) Implementaciones en Elvira ISG
1. CONSTRUCCION CLASIFICADORES SUPERVISADOS (Rosa) • Naive-Bayes (Duda & Hart’73) • Selective naive Bayes (Langley & Sage’94) • Tree Augmented Network (TAN, Friedman’97) • Semi naive Bayes (Pazzani’97) • K-dependence Bayesian classifiers (k-DB, Sahami’96) elvira.learning.classification.supervised.discrete Implementaciones en Elvira ISG
1. CONSTRUCCION CLASIFICADORES SUPERVISADOS (Rosa) • Todos disponibles en el GUI • Mediante el GUI: • muestra gráfica de la estructura • estimación porcentaje bien clasificados • categorización-testeo de nuevos casos • posibilidad uso corrección Laplace • ... • Sus clases y métodos relacionados principales, explicados en el capítulo 9 (“Classification”) de Elvira-Book • Aritz (local) versión para el campo CONTINUO de los cinco clasificadores anteriores Implementaciones en Elvira ISG
2. RANKEO DE PREDICTORAS POR MEDIDAS “FILTER” (Rubén) • Rankeo mediante siete medidas “filter” univariadas (correlación clase-predictora): • Información mutua • Entropía Shannon • Métrica Bhattacharyya • Distancias: Euclídea, Matusita, Kullback-Leibler (2) • elvira.learning.preprocessing.FilterMeasures.java Implementaciones en Elvira ISG
2. RANKEO DE PREDICTORAS POR MEDIDAS “FILTER” (Rubén) • Mediante el GUI: • Expresión matemática de la medida • A un fichero de salida posibilidad de proyectar un subconjunto de variables (+ clase) según el rankeo • Punto de corte “codo” (Molina y col.’02) sobre el ranking. Línea de comandos • “Correlation Feature Selection” (CFS, Hall’99). “Filter” multivariada. Línea de comandos Implementaciones en Elvira ISG
3. CONTRUCCION CLASIFICADORES NO SUPERVISADOS (Guzmán) • Aprendizaje de la estructura naive-Bayes no supervisada de dos formas: • EM (Dempster’77) • EM Multi-Start • Mediante el GUI: • muestra gráfica de la estructura • posibilidad uso corrección Laplace, ... • Sus clases y métodos relacionados principales, explicados en el capítulo 9 (“Classification”) de Elvira-Book elvira.learning.classification.unsupervised.discrete Implementaciones en Elvira ISG
4. DISCRETIZACION DE VARIABLES CONTINUAS (José Luis) • Cinco métodos de discretización: • Equal Frequency • Equal Width • Sun Square Differences • Unsupervised Monothetic Contrast • K-means elvira.learning.preprocessing.Discretization.java Implementaciones en Elvira ISG
4. DISCRETIZACION DE VARIABLES CONTINUAS (José Luis) • Mediante el GUI: • Discretización: • Global (“masiva”): discretizar todas las variables con el mismo método • Local (“normal”): aplicar un método de discretización concreto por variable • Generación de un fichero de casos de salida con la discretización realizada Implementaciones en Elvira ISG
5. INTERFAZ GRAFICO - GUI (Rubén) • Soporte en el GUI al aprendizaje a partir de casos: • Preproceso: • Imputación • Discretización • Medidas “filter” de rankeo • Aprendizaje automático • Clasificación supervisada • Clasificación no supervisada • Factorización de distribuciones de probabilidad mediante redes Bayesianas (+ Restricciones) Implementaciones en Elvira ISG
5. INTERFAZ GRAFICO - GUI (Rubén) • Post aprendizaje: • Estimación porcentaje bien clasificados • Categorización – Testeo de un fichero de casos elvira.gui.DataBaseMonitor.java elvira.gui.DataBaseMonitorWorker.java Implementaciones en Elvira ISG