1 / 85

Investigaciones y Aplicaciones de Sistemas Inteligentes en el Per

El expositor. Mag?ster en Inteligencia Artificial - Instituto Tecnol?gico de Monterrey.Ingeniero de Sistema - Universidad Nacional de Ingenier?a, Lima-Per?.Docente en Inteligencia Artificial y Miner?a de Datos - UNI.Docente en Inteligencia Artificial - USMP.Docente en Sistemas Inteligentes y Si

latanya
Download Presentation

Investigaciones y Aplicaciones de Sistemas Inteligentes en el Per

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    1. Investigaciones y Aplicaciones de Sistemas Inteligentes en el Perú

    2. El expositor Magíster en Inteligencia Artificial - Instituto Tecnológico de Monterrey. Ingeniero de Sistema - Universidad Nacional de Ingeniería, Lima-Perú. Docente en Inteligencia Artificial y Minería de Datos - UNI. Docente en Inteligencia Artificial - USMP. Docente en Sistemas Inteligentes y Simulación de Sistemas - UPC. Investigador Principal del Instituto de Investigación de la FIIS-UNI. Investigador en Ciencias de Computación con publicaciones en: IJCNN-2007 of August 2007 Orlando, FL, USA. ICAIPR of July 2007 Orlando, FL, USA. ICIAR2005, Toronto – Canada. LNCS-2005, Springer Journal – Canada. CLEI2004 Lima-Perú y CLEI2006 Santiago de Chile. Consultor en Sistemas Inteligentes y Sistemas Autónomos. Gerente de KASPeru SAC

    3. Temario Inteligencia Artificial. 5 Proyectos de Investigación. 11 Proyectos de Desarrollo. 47 Proyectos Futuros. 79

    4. INTELIGENCIA ARTIFICIAL Sistemas Inteligentes

    5. Inteligencia Natural Es la capacidad de: Entender y comprender el entorno. Aprender de la experiencia. Pensar y actuar con cierta intención. De resolver problemas.

    6. Inteligencia Artificial Es una ciencia que intenta la construcción de algoritmos para imitar el comportamiento y el razonamiento de los humanos.

    7. Inteligencia Artificial ¿Cómo piensan-razonan los humanos? No se sabe, solo pensamos. ¿Cómo actúan los humanos? Test de turing

    8. ¿Cómo podemos hacer IA si no sabemos cómo pensamos ni podemos demostrar qué software actúa como humano?

    9. Agentes Un agente es todo aquello que percibe su ambiente mediante sensores y que responde o actúa en tal ambiente por medio de efectores.

    10. Sistemas Inteligentes Sistemas inteligentes Agentes Autónomo. Usa conocimiento (patrones) Aprende Lógica difusa. O(kn), O(n!) Sistemas de Información Requiere del humano Usa información (relaciones) Memoriza. Lógica booleana O(nk)

    11. PROYECTOS DE INVESTIGACIÓN

    12. Proyectos de Investigación Pronóstico diario de la energía eléctrica en días feriados usando redes neuronales. Comparación de cuatro técnicas de selección de características envolventes para procesos de clasificación. Detección de microcalcificaciones en imágenes de mamografías usando diferencia de filtros gaussianos optimizados.

    13. Pronóstico diario de la energía eléctrica en días feriados usando redes neuronales

    14. Definición del Problema ¿Cómo pronosticar la demanda en días feriados? Los productores de energía requiere pronosticar la demanda de la energía eléctrica para planificar su operación y mantenimiento La demanda de energía es más compleja los días feriados.

    15. Soluciones Anteriores Neural networks ARIMA Fuzzy Logic Fuzzy Neural Network

    16. Solución Propuesta Se diseña tres modelos de pronóstico de demanda de energía eléctrica para días feriados y para días no feriados. Se usa redes neuronales y se compara con el ARIMA. Es necesario un enfoque global para tratar con la demanda de la energía en días feriados tan bien como en días no feriados.

    17. Solución Propuesta Neural Network. Codificación de los días, considerando el día precedente y el día siguiente como días feriados.

    18. Modelo de Pronóstico

    19. Red Neuronal

    20. Medición de resultados Medidas de la bondad de ajuste (intentan medir en cuánto se desvía el nivel pronósticado del nivel real). Siendo: Es el valor de la serie de tiempo en el momento t Es el valor pronosticado en el momento t Es el error pronosticado en el momento t Número de puntos pronosticados.

    21. Experimentos Los resultados para días feriados, día anterior y día siguiente de acuerdo al MAPE es:

    22. Comparación de cuatro técnicas de selección de características envolventes para procesos de clasificación.

    23. Planteamiento del Problema Dado una base de datos con Sm características, cómo encontrar un subconjunto de características Sm’ tal que logren minimizar el error de un clasificador. Cómo eliminar aquellas variables que no contribuyen en la clasificación.

    24. Selección de Características Si se evalúa todo el espacio de posibles combi-naciones, el costo computacional es muy alto. Si m es la cantidad de características identificadas y n es la cantidad de características deseadas, el número total de posibles subconjuntos a evaluar es:

    25. Proceso de Selección de Características

    26. Generación del Sub-Conjunto Búsqueda exhaustiva Búsqueda secuencial hacia delante. Búsqueda secuencial hacia atrás. Búsqueda Aleatoria (BA). Búsqueda Aleatoria Optimizada (BAO) Búsqueda Mejor Primero (BMP) Búsqueda Genética (BG)

    27. Evaluación del Sub-Conjunto Filtro. Independientes del algoritmo de aprendizaje. Componente principal, entropía. Envolvente. Usan el mismo algoritmo para escoger el sub-conjunto como para el aprendizaje. Búsqueda Aleatoria, Búsqueda Aleatoria Optimizada, Búsqueda Mejor Primero, Búsqueda Genética. Híbridos. Filtro + Envolvente.

    28. Criterio de Paro ¿Cuándo detener la búsqueda? : error del clasificador

    29. Algoritmos de Clasificación Desarrollado por Quinlan. Es un árbol de regresión. Es recursivo, y se basa en la estrategia "divide y vencerás“ Mejora del ID3. Aprendizaje probabilístico: Incremental: Cada ejemplo puede incrementar / decrementar la probabilidad de que una hipótesis sea correcta. La predicción probabilística predice múltiples hipótesis ponderadas

    30. Algoritmos de Clasificación Presentadas en 1992. Vapnik y Chervonenkis. Crea nuevas características linealmente separables. Busca un hiperplano que puede separar el espacio en dos partes

    31. Diseño de Experimentos

    32. Resultados Experimentales

    33. Conclusión Voting Reducción del error No se puede concluir quién es el peor (2BA y 1BG) No se puede concluir quién es el mejor (2 BAO y 1BG) Reducción de la dimensionalidad. El peor es BAO para la data usada (3 BAO) No se puede concluir quién es el mejor (2 BG, 1 BA)

    34. Conclusión ANOVA Reducción del error El peor es el BG para la data usada Los mejores son BAO y BA para la data usada, pero entre los no se de puede concluir una diferencia. Reducción de la dimensionalidad. El peor es el BAO para la data usada Los mejores son BA y BG para la data usada, pero entre los no se de puede concluir una diferencia.

    35. Detección de microcalcificaciones en imágenes de mamografías usando diferencia de filtros gaussianos optimizados.

    36. El problema Dada una BD de mamografías, cómo procesar las imágenes para detectar microcalcificaciones de tal forma que se logre minimizar el número de falsos negativos y el número de falsos positivos.

    37. Modelo de solución

    38. 1. PRE-PROCESAMIENTO

    39. 1.2. Corte Automático

    40. 2. DETECCION DE SEÑALES El filtro DoG es un filtro pasabandas, en el dominio del espacio, construido a partir de dos Filtros Gaussianos simples. Estos dos filtros deben tener varianzas diferentes.

    41. 2.1. Filtro DoG

    42. 2.1. Filtro DoG.

    43. 2.2. Segmentación Extrae ventanas cuadradas de 9x9, cuyo centro corresponde al centro de masa de cada uno de los puntos seleccionados en la etapa anterior.

    44. 3. EXTRACCION DE CARACTERISTICAS

    45. 4. CLASIFICACION

    46. Resultados Obtenidos

    47. PROYECTOS DE DESARROLLO

    48. Proyectos de Desarrollo Desarrollo de un algoritmo para la estructuración de datos de direcciones proporcionados en formato libre. Pronóstico sub-horario de la Demanda Eléctrica Pronóstico de dinero en efectivo para agencias bancarias y cajeros electrónicos

    49. Desarrollo de un algoritmo para la estructuración de datos de direcciones proporcionados en formato libre 2007

    50. Formato Libre - Estructurado Datos de direcciones en formato libre, no pueden ser manipulados por sistemas de DB. Para que un sistema de DB manipule los datos requiere una representación interna mediante un modelo de datos. La representación cumple reglas gramáticales.

    51. Planteamiento del Problema El problema consiste en cómo hacer para convertir un texto en formato libre en una representación interna dadas ciertas reglas gramáticales.

    52. Procedimiento de Solución

    53. Procedimiento de Solución

    54. 1.1. Parsing and Find Words Analizador sintáctico (parsing) El analizador sintáctico tiene como propósito identificar las palabras (cadenas) que componen una dirección sin formato. Las palabras pueden están separadas por delimitadores. El resultado es una secuencia de palabras.

    55. 1.1. Parsing and Find Words

    56. 1.2. Parsing and Find Words Búsqueda de palabras (find words) Verifica si la palabra identificada es palabra valida. Se busca en una tabla de dominio de palabras (conjunto de palabras válidas pertenecientes a la(s) ciudad(s) donde se va ha trabajar). Una palabra válida pasa a ser un token, el resto de palabras se revisan (pueden ser nuevas o inválidas)

    57. 1.2. Parsing and Find Words Búsqueda de palabras (find words) Búsqueda exacta. Si la palabra se encuentra exactamen en el dominio de palabras Búsqueda fonética (similaridad fonética) Si la palabra se pronuncia similarmente a alguna palabra del dominio de palabras. Búsqueda por distancia (similaridad métrica) Si la palabra se escribe similarmente a alguna palabra del dominio de palabras.

    58. 1.2. Parsing and Find Words Búsqueda de palabras (find words) Búsqueda exacta. Búsqueda fonética Búsqueda por distancia Arequipa ? Arequipa CANADA ? Canada Focet ? Faucet Focep ? Faucet Cayao ? Callao Lincee ? Lince Coma ? Comas

    59. 2.1. Token Clasification Base de datos del dominio de trabajo Corresponde a todas las tablas del modelo. Los tipos de elementos pueden ser: Tipo de urbanizacion – Urbanizacion Tipo de via – Via Tipo de hito – Hito Tipo de vivienda – Vivienda Tipo de interior – Zona – Manzana – Lote

    60. 3. Gramatic La gramática corresponde a las reglas que definen la estructura de cada dirección. Se refiere a la presencia o no de un tipo de elemento y al orden en que los tipos de elementos se pueden presentar en una dirección. Una regla es una estructura conformada por huecos, cada hueco pertence a un tipo de elemento. Cuando una dirección es descompuesta en sus tipos de elementos, se intenta que buscar los casos en los que exista coincidencia.

    61. 3. Gramatic ejemplo de reglas gramáticales

    62. 4. Find elements Intenta hacer coincidir las secuencias de tipos de elementos (conformadas por tokens) con algunas de las reglas gramaticales diseñadas. Entrega todos los posibles casos donde exista coincidencia o cercania.

    63. 4. Find elements Recibe una secuencia de tokens, cada uno de los cuales tiene asignado una lista de tipos de elementos. Identifica todas las posibles conbinaciones de secuencias de tipos de elementos que se pueden formar. Intenta hacer coincidir las secuencias de tipos de elementos con algunas de las reglas gramaticales disenadas.

    64. 4. Find elements

    65. Pronóstico sub-horario de la Demanda Eléctrica 2007

    66. Alcances Funcionales

    67. Transformación de datos Los datos de la demanda histórica (Y) tienen una estructura que relaciona la fecha y hora del día y el valor de la demanda total ejecutada. Se preparan los datos para ingresarlos al modelo.

    68. Modelado Pronóstico de la demanda sub-horaria para el día siguiente (PD1), 48 puntos, espaciados cada 30 minutos, haciendo uso de datos hasta el día anterior. Se pretende usar los datos del dia anterior, el dia que está una, dos y tres semanas atrás y otras combinaciones.

    69. Modelado Pronóstico de la demanda sub-horaria para el resto del día (PD2), haciendo uso de los datos del día anterior y de lo ocurrido en el día. El uso de datos de día anteriores se evaluara en la etapa de optimización del modelo. Pronóstico de la demanda sub-horaria para las siguientes 2 horas (PD3), haciendo uso de los datos del día anterior y de lo ocurrido en el día. Dependiendo de la infraestructura de computo se definirá la frecuencia de entrenamiento de la red.

    70. Técnicas de Pronóstico Redes Neuronales Fuzzy Logic Se utiliza cuando la complejidad del proceso es muy alta y no existen modelos matemáticos precisos, para procesos no lineales y cuando las definiciones no estan definidas (impreciso o subjetivo).

    71. Optimización de los modelos En número de modelos a diseñar es muy grande. Dependen de la cantidad de parámetros y sus valores. Es necesario búscar el mejor modelo. Se usan criterios de medición de resultados. ALGORITMOS GENÉTICOS Es una técnica de optimización no lineal multivariada. Es un método sistemático para la resolución de problemas de búsqueda y optimización que usan los mismos métodos de la evolución biológica: selección basada en la población, reproducción sexual y mutación.

    72. Medición de resultados Medidas de la bondad de ajuste (intentan medir en cuánto se desvía el nivel pronósticado del nivel real). Siendo: Es el valor de la serie de tiempo en el momento t Es el valor pronosticado en el momento t Es el error pronosticado en el momento t Número de puntos pronosticados.

    73. Pronóstico de dinero en efectivo para agencias bancarias y cajeros electrónicos 2006

    74. Planteamiento del Problema Cómo pronosticar el monto (stock) de dinero en efectivo que se va ha tener en los siguientes periodos de tiempo (horas, días, semanas, etc.), de tal manera que puede mantener un nivel óptimo de efectivo en todo momento.

    75. Objetivo del Proyecto Para calcular el nivel óptimo de efectivo para agencias y cajeros electrónicos se debe de tomar en consideración los siguientes aspectos, no necesariamente medibles.

    76. Modelo para Cajeros

    77. Modelo para cajeros

    78. Modelo para cajeros

    79. PROYECTOS FUTUROS

    80. Proyectos de Investigación Detección del Fraude Bancario. Determinación del Riesgo Crediticio. Análisis de fuentes de información documental abierta – extensible a radio y TV. Identificación del idioma desde la voz. Planificación de movimientos en robots autoconfigurables. Reconocimiento automático de la mosca de la fruta.

    81. Proyectos de Investigación Participación en Concursos: FINCYT HP GOOGLE KDD-CUP

    82. Negocios Constitución de KAS Peru Knowledge and Systems www.kasperu.com

    83. Asociaciones Académicas SPIA Sociedad Peruana de Inteligencia Artificial www.spia.org.pe

    84. Libros Desarrollo de Proyectos de Investigación en Computación. Sistemas Inteligentes – Agentes Lógicos Sistemas Inteligentes – Agentes de Búsqueda Sistemas Inteligentes – Agentes Conexionistas Introducción a la Visión Computacional.

    85. Ing. Samuel Alonso, Oporto Díaz (Ms) soporto@kasperu.com www.kasperu.com UNIVERSIDAD NACIONAL DE INGENIERIA

    86. GRACIAS

More Related