Investigaciones y Aplicaciones de Sistemas Inteligentes en el Per

1. Investigaciones y Aplicaciones de Sistemas Inteligentes en el Per�

2. El expositor Mag�ster en Inteligencia Artificial - Instituto Tecnol�gico de Monterrey. Ingeniero de Sistema - Universidad Nacional de Ingenier�a, Lima-Per�. Docente en Inteligencia Artificial y Miner�a de Datos - UNI. Docente en Inteligencia Artificial - USMP. Docente en Sistemas Inteligentes y Simulaci�n de Sistemas - UPC. Investigador Principal del Instituto de Investigaci�n de la FIIS-UNI. Investigador en Ciencias de Computaci�n con publicaciones en: IJCNN-2007 of August 2007 Orlando, FL, USA. ICAIPR of July 2007 Orlando, FL, USA. ICIAR2005, Toronto � Canada. LNCS-2005, Springer Journal � Canada. CLEI2004 Lima-Per� y CLEI2006 Santiago de Chile. Consultor en Sistemas Inteligentes y Sistemas Aut�nomos. Gerente de KASPeru SAC

3. Temario Inteligencia Artificial. 5 Proyectos de Investigaci�n. 11 Proyectos de Desarrollo. 47 Proyectos Futuros. 79

4. INTELIGENCIA ARTIFICIALSistemas Inteligentes

5. Inteligencia Natural Es la capacidad de: Entender y comprender el entorno. Aprender de la experiencia. Pensar y actuar con cierta intenci�n. De resolver problemas.

6. Inteligencia Artificial Es una ciencia que intenta la construcci�n de algoritmos para imitar el comportamiento y el razonamiento de los humanos.

7. Inteligencia Artificial �C�mo piensan-razonan los humanos? No se sabe, solo pensamos. �C�mo act�an los humanos? Test de turing

8. �C�mo podemos hacer IA si no sabemos c�mo pensamos ni podemos demostrar qu� software act�a como humano?

9. Agentes Un agente es todo aquello que percibe su ambiente mediante sensores y que responde o act�a en tal ambiente por medio de efectores.

10. Sistemas Inteligentes Sistemas inteligentes Agentes Aut�nomo. Usa conocimiento (patrones) Aprende L�gica difusa. O(kn), O(n!) Sistemas de Informaci�n Requiere del humano Usa informaci�n (relaciones) Memoriza. L�gica booleana O(nk)

11. PROYECTOS DE INVESTIGACI�N

12. Proyectos de Investigaci�n Pron�stico diario de la energ�a el�ctrica en d�as feriados usando redes neuronales. Comparaci�n de cuatro t�cnicas de selecci�n de caracter�sticas envolventes para procesos de clasificaci�n. Detecci�n de microcalcificaciones en im�genes de mamograf�as usando diferencia de filtros gaussianos optimizados.

13. Pron�stico diario de la energ�a el�ctrica en d�as feriados usando redes neuronales

14. Definici�n del Problema �C�mo pronosticar la demanda en d�as feriados? Los productores de energ�a requiere pronosticar la demanda de la energ�a el�ctrica para planificar su operaci�n y mantenimiento La demanda de energ�a es m�s compleja los d�as feriados.

15. Soluciones Anteriores Neural networks ARIMA Fuzzy Logic Fuzzy Neural Network

16. Soluci�n Propuesta Se dise�a tres modelos de pron�stico de demanda de energ�a el�ctrica para d�as feriados y para d�as no feriados. Se usa redes neuronales y se compara con el ARIMA. Es necesario un enfoque global para tratar con la demanda de la energ�a en d�as feriados tan bien como en d�as no feriados.

17. Soluci�n Propuesta Neural Network. Codificaci�n de los d�as, considerando el d�a precedente y el d�a siguiente como d�as feriados.

18. Modelo de Pron�stico

19. Red Neuronal

20. Medici�n de resultados Medidas de la bondad de ajuste (intentan medir en cu�nto se desv�a el nivel pron�sticado del nivel real). Siendo: Es el valor de la serie de tiempo en el momento t Es el valor pronosticado en el momento t Es el error pronosticado en el momento t N�mero de puntos pronosticados.

21. Experimentos Los resultados para d�as feriados, d�a anterior y d�a siguiente de acuerdo al MAPE es:

22. Comparaci�n de cuatro t�cnicas de selecci�n de caracter�sticas envolventes para procesos de clasificaci�n.

23. Planteamiento del Problema Dado una base de datos con Sm caracter�sticas, c�mo encontrar un subconjunto de caracter�sticas Sm� tal que logren minimizar el error de un clasificador. C�mo eliminar aquellas variables que no contribuyen en la clasificaci�n.

24. Selecci�n de Caracter�sticas Si se eval�a todo el espacio de posibles combi-naciones, el costo computacional es muy alto. Si m es la cantidad de caracter�sticas identificadas y n es la cantidad de caracter�sticas deseadas, el n�mero total de posibles subconjuntos a evaluar es:

25. Proceso de Selecci�n de Caracter�sticas

26. Generaci�n del Sub-Conjunto B�squeda exhaustiva B�squeda secuencial hacia delante. B�squeda secuencial hacia atr�s. B�squeda Aleatoria (BA). B�squeda Aleatoria Optimizada (BAO) B�squeda Mejor Primero (BMP) B�squeda Gen�tica (BG)

27. Evaluaci�n del Sub-Conjunto Filtro. Independientes del algoritmo de aprendizaje. Componente principal, entrop�a. Envolvente. Usan el mismo algoritmo para escoger el sub-conjunto como para el aprendizaje. B�squeda Aleatoria, B�squeda Aleatoria Optimizada, B�squeda Mejor Primero, B�squeda Gen�tica. H�bridos. Filtro + Envolvente.

28. Criterio de Paro �Cu�ndo detener la b�squeda? : error del clasificador

29. Algoritmos de Clasificaci�n Desarrollado por Quinlan. Es un �rbol de regresi�n. Es recursivo, y se basa en la estrategia "divide y vencer�s� Mejora del ID3. Aprendizaje probabil�stico: Incremental: Cada ejemplo puede incrementar / decrementar la probabilidad de que una hip�tesis sea correcta. La predicci�n probabil�stica predice m�ltiples hip�tesis ponderadas

30. Algoritmos de Clasificaci�n Presentadas en 1992. Vapnik y Chervonenkis. Crea nuevas caracter�sticas linealmente separables. Busca un hiperplano que puede separar el espacio en dos partes

31. Dise�o de Experimentos

32. Resultados Experimentales

33. Conclusi�n Voting Reducci�n del error No se puede concluir qui�n es el peor (2BA y 1BG) No se puede concluir qui�n es el mejor (2 BAO y 1BG) Reducci�n de la dimensionalidad. El peor es BAO para la data usada (3 BAO) No se puede concluir qui�n es el mejor (2 BG, 1 BA)

34. Conclusi�n ANOVA Reducci�n del error El peor es el BG para la data usada Los mejores son BAO y BA para la data usada, pero entre los no se de puede concluir una diferencia. Reducci�n de la dimensionalidad. El peor es el BAO para la data usada Los mejores son BA y BG para la data usada, pero entre los no se de puede concluir una diferencia.

35. Detecci�n de microcalcificaciones en im�genes de mamograf�as usando diferencia de filtros gaussianos optimizados.

36. El problema Dada una BD de mamograf�as, c�mo procesar las im�genes para detectar microcalcificaciones de tal forma que se logre minimizar el n�mero de falsos negativos y el n�mero de falsos positivos.

37. Modelo de soluci�n

38. 1. PRE-PROCESAMIENTO

39. 1.2. Corte Autom�tico

40. 2. DETECCION DE SE�ALES El filtro DoG es un filtro pasabandas, en el dominio del espacio, construido a partir de dos Filtros Gaussianos simples. Estos dos filtros deben tener varianzas diferentes.

41. 2.1. Filtro DoG

42. 2.1. Filtro DoG.

43. 2.2. Segmentaci�n Extrae ventanas cuadradas de 9x9, cuyo centro corresponde al centro de masa de cada uno de los puntos seleccionados en la etapa anterior.

44. 3. EXTRACCION DE CARACTERISTICAS

45. 4. CLASIFICACION

46. Resultados Obtenidos

47. PROYECTOS DE DESARROLLO

48. Proyectos de Desarrollo Desarrollo de un algoritmo para la estructuraci�n de datos de direcciones proporcionados en formato libre. Pron�stico sub-horario de la Demanda El�ctrica Pron�stico de dinero en efectivo para agencias bancarias y cajeros electr�nicos

49. Desarrollo de un algoritmo para la estructuraci�n de datos de direcciones proporcionados en formato libre 2007

50. Formato Libre - Estructurado Datos de direcciones en formato libre, no pueden ser manipulados por sistemas de DB. Para que un sistema de DB manipule los datos requiere una representaci�n interna mediante un modelo de datos. La representaci�n cumple reglas gram�ticales.

51. Planteamiento del Problema El problema consiste en c�mo hacer para convertir un texto en formato libre en una representaci�n interna dadas ciertas reglas gram�ticales.

52. Procedimiento de Soluci�n

53. Procedimiento de Soluci�n

54. 1.1. Parsing and Find Words Analizador sint�ctico (parsing) El analizador sint�ctico tiene como prop�sito identificar las palabras (cadenas) que componen una direcci�n sin formato. Las palabras pueden est�n separadas por delimitadores. El resultado es una secuencia de palabras.

55. 1.1. Parsing and Find Words

56. 1.2. Parsing and Find Words B�squeda de palabras (find words) Verifica si la palabra identificada es palabra valida. Se busca en una tabla de dominio de palabras (conjunto de palabras v�lidas pertenecientes a la(s) ciudad(s) donde se va ha trabajar). Una palabra v�lida pasa a ser un token, el resto de palabras se revisan (pueden ser nuevas o inv�lidas)

57. 1.2. Parsing and Find Words B�squeda de palabras (find words) B�squeda exacta. Si la palabra se encuentra exactamen en el dominio de palabras B�squeda fon�tica (similaridad fon�tica) Si la palabra se pronuncia similarmente a alguna palabra del dominio de palabras. B�squeda por distancia (similaridad m�trica) Si la palabra se escribe similarmente a alguna palabra del dominio de palabras.

58. 1.2. Parsing and Find Words B�squeda de palabras (find words) B�squeda exacta. B�squeda fon�tica B�squeda por distancia Arequipa ? Arequipa CANADA ? Canada Focet ? Faucet Focep ? Faucet Cayao ? Callao Lincee ? Lince Coma ? Comas

59. 2.1. Token Clasification Base de datos del dominio de trabajo Corresponde a todas las tablas del modelo. Los tipos de elementos pueden ser: Tipo de urbanizacion � Urbanizacion Tipo de via � Via Tipo de hito � Hito Tipo de vivienda � Vivienda Tipo de interior � Zona � Manzana � Lote

60. 3. Gramatic La gram�tica corresponde a las reglas que definen la estructura de cada direcci�n. Se refiere a la presencia o no de un tipo de elemento y al orden en que los tipos de elementos se pueden presentar en una direcci�n. Una regla es una estructura conformada por huecos, cada hueco pertence a un tipo de elemento. Cuando una direcci�n es descompuesta en sus tipos de elementos, se intenta que buscar los casos en los que exista coincidencia.

61. 3. Gramatic ejemplo de reglas gram�ticales

62. 4. Find elements Intenta hacer coincidir las secuencias de tipos de elementos (conformadas por tokens) con algunas de las reglas gramaticales dise�adas. Entrega todos los posibles casos donde exista coincidencia o cercania.

63. 4. Find elements Recibe una secuencia de tokens, cada uno de los cuales tiene asignado una lista de tipos de elementos. Identifica todas las posibles conbinaciones de secuencias de tipos de elementos que se pueden formar. Intenta hacer coincidir las secuencias de tipos de elementos con algunas de las reglas gramaticales disenadas.

64. 4. Find elements

65. Pron�stico sub-horario de la Demanda El�ctrica 2007

66. Alcances Funcionales

67. Transformaci�n de datos Los datos de la demanda hist�rica (Y) tienen una estructura que relaciona la fecha y hora del d�a y el valor de la demanda total ejecutada. Se preparan los datos para ingresarlos al modelo.

68. Modelado Pron�stico de la demanda sub-horaria para el d�a siguiente (PD1), 48 puntos, espaciados cada 30 minutos, haciendo uso de datos hasta el d�a anterior. Se pretende usar los datos del dia anterior, el dia que est� una, dos y tres semanas atr�s y otras combinaciones.

69. Modelado Pron�stico de la demanda sub-horaria para el resto del d�a (PD2), haciendo uso de los datos del d�a anterior y de lo ocurrido en el d�a. El uso de datos de d�a anteriores se evaluara en la etapa de optimizaci�n del modelo. Pron�stico de la demanda sub-horaria para las siguientes 2 horas (PD3), haciendo uso de los datos del d�a anterior y de lo ocurrido en el d�a. Dependiendo de la infraestructura de computo se definir� la frecuencia de entrenamiento de la red.

70. T�cnicas de Pron�stico Redes Neuronales Fuzzy Logic Se utiliza cuando la complejidad del proceso es muy alta y no existen modelos matem�ticos precisos, para procesos no lineales y cuando las definiciones no estan definidas (impreciso o subjetivo).

71. Optimizaci�n de los modelos En n�mero de modelos a dise�ar es muy grande. Dependen de la cantidad de par�metros y sus valores. Es necesario b�scar el mejor modelo. Se usan criterios de medici�n de resultados. ALGORITMOS GEN�TICOS Es una t�cnica de optimizaci�n no lineal multivariada. Es un m�todo sistem�tico para la resoluci�n de problemas de b�squeda y optimizaci�n que usan los mismos m�todos de la evoluci�n biol�gica: selecci�n basada en la poblaci�n, reproducci�n sexual y mutaci�n.

72. Medici�n de resultados Medidas de la bondad de ajuste (intentan medir en cu�nto se desv�a el nivel pron�sticado del nivel real). Siendo: Es el valor de la serie de tiempo en el momento t Es el valor pronosticado en el momento t Es el error pronosticado en el momento t N�mero de puntos pronosticados.

73. Pron�stico de dinero en efectivo para agencias bancarias y cajeros electr�nicos 2006

74. Planteamiento del Problema C�mo pronosticar el monto (stock) de dinero en efectivo que se va ha tener en los siguientes periodos de tiempo (horas, d�as, semanas, etc.), de tal manera que puede mantener un nivel �ptimo de efectivo en todo momento.

75. Objetivo del Proyecto Para calcular el nivel �ptimo de efectivo para agencias y cajeros electr�nicos se debe de tomar en consideraci�n los siguientes aspectos, no necesariamente medibles.

76. Modelo para Cajeros

77. Modelo para cajeros

78. Modelo para cajeros

79. PROYECTOS FUTUROS

80. Proyectos de Investigaci�n Detecci�n del Fraude Bancario. Determinaci�n del Riesgo Crediticio. An�lisis de fuentes de informaci�n documental abierta � extensible a radio y TV. Identificaci�n del idioma desde la voz. Planificaci�n de movimientos en robots autoconfigurables. Reconocimiento autom�tico de la mosca de la fruta.

81. Proyectos de Investigaci�n Participaci�n en Concursos: FINCYT HP GOOGLE KDD-CUP

82. Negocios Constituci�n de KAS Peru Knowledge and Systems www.kasperu.com

83. Asociaciones Acad�micas SPIA Sociedad Peruana de Inteligencia Artificial www.spia.org.pe

84. Libros Desarrollo de Proyectos de Investigaci�n en Computaci�n. Sistemas Inteligentes � Agentes L�gicos Sistemas Inteligentes � Agentes de B�squeda Sistemas Inteligentes � Agentes Conexionistas Introducci�n a la Visi�n Computacional.

85. Ing. Samuel Alonso, Oporto D�az (Ms) soporto@kasperu.com www.kasperu.com UNIVERSIDAD NACIONAL DE INGENIERIA

86. GRACIAS

Investigaciones y Aplicaciones de Sistemas Inteligentes en el Per

Investigaciones y Aplicaciones de Sistemas Inteligentes en el Per

Presentation Transcript

SISTEMAS DE INFORMACION GEOGRAFICA: APLICACIONES EN EL SECTOR AGROPECUARIO

Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas

Sistemas Inteligentes

Sistemas de Soporte de Decisiones (DSS) y Sistemas Inteligentes

Redes Inteligentes Nuevas tecnologías y aplicaciones en el ámbito de la energía en Chile

FUNDAMENTOS DE SISTEMAS DE TRANSMISIÓN: TECNOLOGÍAS Y APLICACIONES

SISTEMAS DE CONTROL PARA VIVIENDAS Y OFICINAS INTELIGENTES

Sistemas en Tiempo Real: Introduccion y Aplicaciones

Sistemas Inteligentes

Sistemas Inteligentes de Transporte

SISTEMAS DE MEDIDAS ANGULARES Y APLICACIONES

Sistemas Inteligentes

Sistemas Inteligentes de Segurança

Grupo de investigación en Bases de Datos y Sistemas de Información Inteligentes

Sistemas Inteligentes

Monitoria de Sistemas Inteligentes

Sistemas Inteligentes

Sistemas de Información Geográfica y sus Aplicaciones en Salmonicultura

Aplicaciones de Redes Inteligentes

Sistemas Inteligentes

APLICACIONES EN DISPOSITIVOS INTELIGENTES Y SU USO EN LA EDUCACIÓN

Sistemas de NOAA y sus aplicaciones en Costa Rica - Centroamérica