250 likes | 471 Views
“Control de dispositivos por comandos de voz”. Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M . en C . Fuentes Covarrubias Ricardo M . en C . Fuentes Covarrubias Andrés Gerardo. Índice. Introducción. Antecedentes. Estado del arte.
E N D
“Control de dispositivos por comandos de voz” Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo M. en C. Fuentes Covarrubias Andrés Gerardo
Índice • Introducción. • Antecedentes. • Estado del arte. • Procesamiento del lenguaje natural. • Aparato fonador • Entorno de desarrollo Arduino. • Robot Mitsubishi rv-m1 • Circuito del control Veear. • Conclusiones. • Bibliografía.
Introducción • En la actualidad se busca la automatización de todos los procesos de la vida diaria, mejorando de esta manera la calidad de vida de las personas. La finalidad de este proyecto es controlar dispositivos por comandos de voz, de tal manera que cualquiera pueda comunicarse con estos. • El proyecto consistió en el diseño y la implementación del controlador encargado de manejar el posicionamiento del brazo del robot Mitsubishi rv-m1 aplicando técnicas del lenguaje natural por medio del speechrecognition kit SR-06/sr-07, así como la utilización del entorno Arduino para programar la interfaz entre la tarjeta de voz y el brazo de robot. Nuestros objetivos planteados al inicio de la investigación fueron: • Diseñar la interfaz entre el speechrecognition kit y el brazo de robot Mitsubishi rv-m1 con la ayuda del entorno Arduino. • Desarrollar la tabla de posiciones del brazo del robot. • Adaptar el hardware del brazo robótico con la tarjeta de voz.
Antecedentes • En el año 1870 Alexander Graham Bell quería construir un sistema/dispositivo que hiciera el habla visible a las personas con problemas auditivos donde el resultado fue el teléfono. • En el año 1880 Tihamir Nemes solicita permiso para desarrollar un sistema de transcripción automática que identificara secuencias de sonidos y los imprimiera (texto), pero fue rechazado como "Proyecto no Realista". Treinta años después AT&T Bell Laboratories construye la primera máquina capaz de reconocer voz. Requería extenso reajuste a la voz de una persona, pero una vez logrado tenía un 99% de certeza. Por lo tanto surge la esperanza de que el reconocimiento de voz sea simple y directo. • A mediados de los 60's la mayoría de los investigadores reconoce que era un proceso mucho más intrincado y sutil de lo que habían anticipado. Por lo tanto empiezan a reducir los alcances y se enfocan a sistemas más específicos como: • Dependientes del Locutor. • Flujo discreto de habla (con espacios / pausa entre palabras). • Vocabulario pequeño (menor o igual a 50 palabras).
Después, IBM y CMV trabajan en reconocimiento de voz continuo pero no se ven resultados hasta los 70's. A principios de ellos se produce el 1er Producto de reconocimiento de voz, el VIP100 de ThresholdTechnology Inc. (utilizaba un vocabulario pequeño, dependiente del locutor, y reconocía palabras discretas). Gana el U.S. NationalAward en 1972. Más tarde nace el interés de ARPA del U.S. Department of Defense, y gracias al lanzamiento de grandes proyectos de investigación y financiamiento por parte del gobierno, se precipita la época de la inteligencia artificial. • El proyecto financiado por ARPA busca el reconocimiento de habla continua de un vocabulario extenso, impulsando a los investigadores a que se enfoquen en el entendimiento del habla. • Los sistemas empiezan a incorporar módulos de: • Análisis léxico (conocimiento léxico). • Análisis sintáctico (Estructura de Palabras). • Análisis semántico (Significado). • Análisis pragmático (Intención). • Estos proyectos terminan en 1976 con el resultado de que CMU, SRI y MIT crearon sistemas para el proyecto ARPA SUR (SpeechUnderstandingResearch). • De los 80's a los 90's surgen los sistemas de vocabulario amplio, que ahora son la norma (más de 1000 palabras). Adicionalmente bajan los precios de estos sistemas.
Estado del arte • El uso del lenguaje natural utilizado como medio de comunicación entre humano-máquina ha tenido un impacto muy importante en los últimos años, ya que la tecnología busca facilitar su uso y aplicación, de tal manera que una persona no necesite ser un experto en el área para interactuar con algún dispositivo inteligente, que es el objetivo de la quinta generación de computadoras.
Procesamiento del lenguaje natural • Gracias a la inteligencia artificial se han simulado diferentes funciones del cuerpo humano como la voz, brazos, piernas, vista, oídos, etc. Es por medio de esta misma ciencia que estudiamos el sistema de la comunicación por señales de voz, el cual es la emisión y recepción de señales fonéticas de forma oral, para de esta manera comprenderlo y traducirlo al lenguaje máquina, con el propósito de que un conjunto de circuitos pueda comprender el lenguaje natural y realizar una reacción conforme al mensaje emitido.
Aparato fonador • La complejidad del cuerpo humano nos permite producir una gran variedad de sonidos que modulamos para formar las palabras con las que nos comunicamos, dentro de los componentes que intervienen en el proceso de la producción del habla se encuentran: la glotis que constituye el verdadero órgano de fonación humano y está ubicada dentro de la laringe, pulmones, dos pares de cuerdas vocales, las cavidades de la cabeza relacionadas con el sistema respiratorio y nasofaríngeo, entre otros. El mecanismo brevemente resumido de dicho proceso es el siguiente: • El diafragma empuja los pulmones, haciendo que se expulse el aire. • El aire circula por la tráquea y laringe, pasando por las cuerdas vocales y haciendo que vibren con un tono fundamental. • El tono fundamental producido por las cuerdas vocales pasa, a través de la laringe, a la caja de resonancia que forman las cavidades nasales y orales. • Algunas frecuencias entran en resonancia en las cavidades nasales y orales, saliendo hacia el exterior como la información más importante del habla.
Entorno de desarrollo Arduino • Para poder comunicar la tarjeta de reconocimiento de voz con la computadora que controla el robot Mitsubishi es necesario tener un dispositivo que nos facilite el trabajo por eso decidimos trabajar con Arduino. • “Arduino es una plataforma de electrónica abierta (open source) para la creación de prototipos basada en software y hardware flexibles y fáciles de usar. Se creó para artistas, diseñadores, aficionados y cualquiera interesado en crear entornos u objetos interactivos”
Arduino permite capturar información por medio de sensores gracias a sus pines y puede manifestarse por medio de motores, luces o actuadores, en nuestro caso por medio del robot Mitsubishi. • El entorno cuenta con su propio lenguaje de programación llamado “lenguaje de programación Arduino”, basado en wiring y un entorno de desarrollo, basado en processing, con la gran ventaja de ser código abierto esto quiere decir que pudimos desarrollar sin comprar licencia y modificar los archivos sin problemas. • Lo primero que hicimos después de tener la placa Arduino fue la instalación de los drivers de este a nuestra computadora para eso conectamos la placa al puerto USB y Windows instalo automáticamente, después cargamos el software, es muy importante saber la versión del Arduino, nosotros ocupamos el IDE 0022 de acuerdo con nuestro microcontrolador atmega328. • Para comprobar que funcionó correctamente abrimos un ejemplo de los que ya vienen incluidos, conectamos el Arduino, seleccionamos el modelo de la placa, el puerto serie COM1 o COM2 dependiendo de nuestra configuración preferente y finalmente cargamos el archivo, mediante motores o luces (diodos) se observa el comportamiento del programa.
Robot Mitsubishi rv-m1 Antecedentes del Robot • Robot viene de la República Checa usada por primera vez por el escrito KarelCapek en su obra R.U.R. (Rossum’s Universal Robots) en 1917, la utilizó para referirse en sus libros, a máquinas con forma humanoide. Después en 1940, Isaac Asimov la uso para referirse a lo mismo. Robot significa “labor forzada” o bien esclavo.
Hoy en nuestros días el significado no es tomado por las tendencias del pasado, surge de nuestras necesidades, agricultura, la industria, etc. Después de la revolución industrial el término robot cubría ya la faz de la tierra. • En nuestro caso llamamos robot a un brazo mecánico capaz de realizar trabajos precisos y del área de la industria. • El robot Mitsubishi RV-M1 posee 5 grados de movimiento se representan en la siguiente imagen de J1 hasta J5. Los movimientos son permitidos por el cable de señal que recibe los datos y un cable potencia.
La unidad motora que se encarga del control del robot y de alimentarlo. Se muestra a continuación con sus componentes.
Caja de enseñanza • La caja de enseñanza es un control manual para el robot, se conecta a la unidad motora en el puerto teaching box. Sirve para programar las rutinas, realizar los movimientos, guardarlos y borrarlos con sus respectivos comandos.
Circuito del control Veear • La línea de productos Veearincluye una serie de productos hardware y software diseñados para ayudarle en el desarrollo e implementación de capacidades de reconocimiento de voz para muchas aplicaciones donde la capacidad de comando de voz es deseada y conveniente. • El circuito utilizado para el proyecto es el “EasyVR Arduino Shield” por ser una tarjeta multipropósito diseñada para fácilmente añadir capacidades de reconocimiento de voz en varios lenguajes de programación, de una manera eficaz, versátil, robusta y rentable para cualquier aplicación desarrollada en la plataforma Arduino.
conclusiones • A partir de la revolución industrial los robots han tomado un gran papel en muchas áreas de trabajo y en la industria. Son utilizados desde juguetes hasta máquinas de trabajo forzado ciertamente sin recibir un sueldo. De aquí partió nuestra visión de crear soluciones a problemas diarios y facilitar las labores humanas. • La industria, el comercio, la agricultura, etc. Son áreas indispensable e inmediatamente obligatorias para el desarrollo económico del país. Nuestro trabajo de investigación viene a facilitar y reforzar lo antes ya establecido, aportando una solución viable, utilizar el brazo de robot Mitsubishi rv-m1 controlado mediante comandos voz, para realizar labores pesadas o peligrosas sin la intervención directa con un ser humano. • Al finalizar nuestra investigación y llevarlo a la práctica hemos obtenido los resultados esperados de nuestro análisis, logrando así aportar una visión más clara y concreta de los que la inteligencia artificial con la ayuda de algo elemental como lo es el lenguaje natural, pueden hacer por nuestra vida diaria.
bibliografía • Ingrid KirschningTlatoa [2005], “Reconocimiento de Voz”. Documento electrónico consultado el 02/03/2013 en la página de la Universidad de las Américas Puebla: http://ict.udlap.mx/people/ingrid/Clases/IS412/ • Bernal Bermúdez Jesús; Bobadilla Sancho Jesús; Gómez Vilda Pedro. Reconocimiento de voz y fonética acústica. Primera edición. México, D.F.: Alfaomega, 2000. ISBN 970-15-0541-7. • Arduino [2010], “Arduino”. Documento electrónico consultado el 24/04/2013 en: http://www.arduino.cc/es/ • Robot [19 de enero de 2006], “Robot”. Página web consultada 20/05/2013 en: http://www.xatakaciencia.com/robotica/el-origen-de-la-palabra-robot