1 / 59

INSTITUTO POLITÉCNICO NACIONAL

INSTITUTO POLITÉCNICO NACIONAL. Centro de Investigación en Computación. Presentación de proyectos del Laboratorio de Procesamiento Digital de Señales. Expositor: José Luis Oropeza Rodríguez. México D. F., a 20 de agosto de 2010. BOSQUEJO DE LA PRESENTACIÓN.

Download Presentation

INSTITUTO POLITÉCNICO NACIONAL

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. INSTITUTO POLITÉCNICO NACIONAL Centro de Investigación en Computación Presentación de proyectos del Laboratorio de Procesamiento Digital de Señales Expositor: José Luis Oropeza Rodríguez México D. F., a 20 de agosto de 2010

  2. BOSQUEJO DE LA PRESENTACIÓN • Exposición de proyectos y actividades

  3. El procesamiento digital de señales es una operación o transformación de una señal en un hardware digital según reglas bien definidas las cuales son introducidas al hardware a través de un software específico que puede o no manejar lenguajes tanto de alto como de bajo nivel. El Laboratorio de procesamiento digital de señales es de reciente creación y surge como una necesidad que se tiene de dar cabida a proyectos que tienen involucrados esta tarea tan importante de la ciencia de la computación.

  4. Sadaoki Furui, Juergen Schroeter, LRR and Hiroya Fujisaki--Visit to Tokyo Institute of Technology--1998

  5. The Hidden Markov Model (HMM) Team--LRR, Fred Juang, Mohan Sondhi, and Steve Levinson--1992 Peter Heeman y John-Paul Hossom investigadores en CSLU Steve Young Cambridge Raj Reddy (CMU)

  6. PARADIGMA BASADO EN TEMPLATES PARADIGMA QUE UTILIZA ASPECTOS CONECCIONISTAS PARADIGMA BASADO EN CONOCIMIENTO PARADIGMA BASADO EN ASPECTOS ESTOCÁSTICOS

  7. Reconocimiento de Voz El siguiente diagrama de flujo muestra el proceso de extracción de los parámetros LPC de una señal de voz [Rabiner and Hwang, 1998]

  8. Reconocimiento de voz

  9. 1. El material del robot es de aluminio en las partes fijas, fierro en las partes de desplazamiento y bronce en las de deslizamiento. 2. El porta laparoscopio está construido de acrílico. 3. Los motores de cada articulación son de corriente directa con transmisión tipo engrane.

  10. Un gran obstáculo en la utilización de los manipuladores como máquinas de uso general es la falta de comunicación eficaz y apropiada entre el usuario y el sistema robótico. Hay tres grandes enfoques para lograr la comunicación con el robot: • 1. • el reconocimiento de palabra discreta • 2. • enseñar y reproducir y, • 3. • lenguajes de programación de alto nivel.

  11. Los comandos de voz son: • 1. • sube (up) • 2. • baja (down) • 3. • derecha (right) • 4. • izquierda (left) • 5. • entrar (in) • 6. • salir (out) • 7. • sí (yes) • 8. • no (no) • Para usar la voz como comando de control, se requiere de tres etapas principales: adquisición y adecuación, análisis y descomposición en parámetros temporales y frecuenciales así como reconocimiento y activación.

  12. DESCRIPCIÓN. Se puede tener a una silla robotizada equipada con un conjunto de elementos informáticos y sensores para medir y permitir el procesamiento de la señal del entorno. LIMITACIONES. El usuario puede introducir la localización hacia dónde dirigirá la silla o el movimiento que desea realizar por medio de órdenes verbales. La silla entonces ejecuta un conjunto de movimientos hasta el lugar que se le ha indicado. VENTAJAS. Aumentar las posibilidades de los individuos con severas discapacidades motrices, especialmente en entornos donde resulta difícil maniobrar la silla.

  13. Gran parte de la inteligencia artificial aplicada a la ayuda de discapacitados está orientada al desarrollo de sillas de ruedas. Las cuales están orientadas a dar una mejor calidad de vida ampliando el rango de manipulación y movilidad para personas con problemas motrices. • Factores claves: • 1. • Silla robótica. Es convencional, equipada con sistemas informáticos y sensores, los cuales captan el entorno y el estado de la silla. Dicha información es captada y procesada por un conjunto de procesadores acoplados a la silla permitiendo con ello, la transmisión de información a los actuadores correspondientes. • 2. • Interfaz hombre-máquina. Son las entidades que permiten la comunicación. Para este caso, es unidireccional pues la persona emite a la silla las órdenes correspondientes. En muchas ocasiones, se recomienda que se diseñe un sistema de reconocimiento propio a las características del individuo, pues puede tener problemas de dicción. • 3. • Inteligencia contenida de guiado autónomo. Estos son reflejados en sistemas que generan el movimiento de un vehículo entre localizaciones mientras se evitan posibles colisiones con obstáculos que puedan aparecer en el camino.

  14. 1. Silla comercial motorizada equipada con computadores y sensores 2. Su forma es rectangular con tracción diferencial (dos ruedas controlables y dos ruedas libres) 3. Disposición de 2 motores eléctricos de corriente continua para impulsar las dos ruedas traseras. Las delanteras permiten el giro de la silla. 4. Dos procesadores pueden ser utilizados, uno de ellos con capacidades de memoria de 64MB para controlar la silla a bajo nivel (interrelación directa con los servomecanismos) y el otro a alto nivel (para llevar una relación con los programas encargados de la gestión del procesamiento y reconocimiento de la señal de voz). 5. Un sensor que sea capaz de medir la distancia de los objetos situados en torno a la silla.

  15. 1. El usuario introduce los comandos por medio de la voz. 2. El sistema de reconocimiento traduce e interpreta estas señales para convertirlas en movimiento. EL RECONOCEDOR DE VOZ Adelante Detrás Izquierda Derecha Lejos Medio Cerca Anda Para

  16. 1.Se utilizan Modelos Ocultos de Markov 2.Coeficientes MFCC (Mel-Frequency Cepstrum Coefficients 3.Algoritmo de búsqueda de Viterbi, empleado en el reconocedor

  17. Opera lanzará un navegador con sistema de reconocimiento de voz. La próxima versión del navegador de Opera Software incluirá funciones de reconocimiento de voz utilizando la tecnología ViaVoice de IBM, según han comunicado los responsables de la compañía desarrolladora noruega.

  18. Velocidad de Comparación. MegaMatcher es capaz de comparar de 9,000 a 60,000 huellas por segundo Utilizando un PC stand-alone. La velocidad de comparación puede ser aumentada significativamente utilizando un cluster (Ver esquema). MegaMatcher incluye software de cluster para ejecutar comparaciones paralelas, lo que permite alcanzar alta productividad y eficiencia.

  19. OBJETIVO. Realizar un sistema de reconocimiento de voz capaz de interactuar con un usuario para poder otorgar información de la ubicación de lugares a donde desea desplazarse el usuario, utilizando como medio la WEB y mapas geográficos digitalizados. REMEMBRANZA.Mediante este proyecto se pretende realizar un sistema de interacción hombre-máquina, que permita poder localizar, mediante un corpus previamente definido, la localización de lugares específicos auxiliándose de mapas geográficos digitalizados. Se platea la posibilidad de poder establecer un centro de información con un motor de reconocimiento capaz de orientar a un usuario específico, y en su lengua origen, sobre información del lugar destino a donde desea llegar, así como de interactuar con el usuario sobre los posibles lugares a donde desea llegar. Se utilizarán mapas geográficos digitalizados que contengan, asimismo, información visual capaz de permitir al usuario una mayor capacidad de interacción y obtención de los resultados que planea desde un inicio. RUIDO. INFOVOZ tiende a trabajar mejor sobre líneas telefónicas normales. Esto generalmente genera mas problemas en ruidos ambientales.

  20. PROBLEMAS

  21. Objetivo. Crear un conjunto de herramientas que exploten las capacidades del software HTK y permitan incrementar las capacidades de éste. Remembranza. A lo largo del tiempo el software HTK ha representado uno de los programas de mayor respaldo en cuestiones de reconocimiento de señales de voz. Microsoft durante bastante tiempo ha realizado el estudio del mismo y a partir de su código ha logrado implementar una gran cantidad de aplicaciones que son una realidad en el mercado actual. El entendimiento y la modificación del HTK permitirá incrementar el acervo que se tiene en materia de reconocimiento de voz y crear nuevas estrategias que permitan el desarrollo provechoso para el idioma español.

  22. SPHINX

  23. Objetivo. Realizar un sistema que permita el procesamiento y reconocimiento de las placas de automóviles para permitir el acceso a recintos o el control de un sistema de seguridad. Microsoft durante bastante tiempo ha realizado el estudio del mismo y a partir de su código ha logrado implementar una gran cantidad de aplicaciones que son una realidad en el mercado actual. es una solución para las zonas de estacionamiento proporcionando seguridad a los vehículos, aumento en la velocidad y la calidad del servicio, y la reducción de los ingresos no autorizados, el fraude y el robo registro y archivo automáticos en la base de datos de imagen de video con fecha, hora y número de placa simplifica la búsqueda de información en la base de datos con el número de placa, fecha y hora de estacionamiento integra barreras, puertas automáticas y sistemas de administración del estacionamiento análisis opcional de la matrícula del vehículo, compara la placa frontal a la entrada y a la salida

  24. Receptor Unificado Triple-play DSL (Internet, Televisión y Voz sobre IP)

  25. Los implantes cocleares constan de: a) Componentes externos, que se llevan sobre b) Componentes internos, que se implantan por medio de una operación quirúrgica.

  26. Los sistemas de reconocimiento de voz pueden encontrarse en nuestros días en sistemas portátiles (PADs, teléfonos celulares, SmartPhones, etc.), para ello se requiere que los motores sean colocados dentro de estos equipos electrónicos. Uno de los recientes avances sobre esta temática se encuentra en los trabajos desarrollados por CMU con Pocket Sphinx, por medio del cual se pueden realizar o llevar a cabo las diferentes tareas de reconocimiento de voz sobre un dispositivo portátil.

  27. DISEÑO DE UN PROCESADOR DIGITAL DE SEÑALES UTILIZANDO LENGUAJES DE DESCRIPCIÓN DE HARDWARE

  28. SISTEMAS EMBEBIDOS

More Related