Interacción humano-máquina por voz para la operación de plataformas robóticas móviles

Héctor Gutiérrez Hernández, J. Jesús Arellano Pimentel, Daniel Pacheco Bautista

Resumen


En el presente trabajo se describe el desarrollo de una interfaz de comunicación capaz de reconocer una serie de comandos teniendo como entrada la señal acústica emitida por un usuario con el objetivo de interactuar con plataformas robóticas móviles. Para realizar la comunicación entre la interfaz de usuario y la plataforma móvil se realizó un diseño modular con una arquitectura cliente-servidor. Está comunicación se implementó mediante sockets orientados a conexión y el software Player/Stage que permite controlar los dispositivos de un robot y obtener información de sus sensores. En el sistema de reconocimiento del habla se utilizaron los modelos ocultos de Markov, a través de la plataforma HTK, empleando cinco estados con 3 mixturas Gaussianas por estado; además, se diseñó un corpus de entrenamiento para el español Mexicano utilizando el alfabeto Mexbet. Durante los experimentos realizados se obtuvieron porcentajes de reconocimiento de 98.26% en palabras y 94.39% en frases reconocidas de manera completa; la validación de los resultados fue hecha mediante el método “Word Accuracy”.


Texto completo:

1309-1328 PDF

Referencias


I.H. Villamil Espinosa. Aplicaciones en Reconocimiento de Voz utilizando HTK. Tesis de Maestría en Electrónica. Pontificia Universidad Javeriana. Santa Fe de Bogotá, DC. 2005.

A.B. Caballero Pedrera. Reconocimiento automático de habla con adaptación al género y al locutor. Tesis de Ingeniería en Telecomunicaciones. Universidad Carlos III de Madrid. Departamento de Teoría de la Señal y Comunicaciones. Leganés. 2010.

U. M. García García. Módulo de reconocimiento de voz a texto independiente de locutor para sistemas de diálogo. Tesis de Ingeniería en Electrónica. Pontifica Universidad Católica del Perú, 2011.

L.A. Pineda. El proyecto DIME y el robot conversacional Golem: Una experiencia multidisciplinaria entre la computación y la lingüística. Universidad Nacional Autónoma de México. UNAM. 2008. Recuperado de:

http://turing.iimas.unam.mex//~luis/DIME/ , julio de 2014.

V.M.E. García. Análisis de actos del habla con el esquema dime-damsl:

Modelación de diálogos prácticos en transacciones para la interacción humanocomputadora. Ph.D. dissertation, Universidad Nacional Autónoma de México, 2013.

L.A. Pindea. Grupo Golem: RoboCup@Home 2013. Proceedings of Robocup 2013. Vol, pp. 2013.

H.H Avilés-Arriaga, L.E. Sucar, E.F. Morales, B.A. Vargas, J. Sánchez & E. Corona. Markovito: A flexible and general service robot. In Design and Control of Intelligent Robotic Systems (pp.401-423). Springer Berlin Heidelberg.

L.E. Sucar, E.F. Morales, H.H. Avilés-Arriaga, P. Oropeza & R. Luis. Markovito’s Team Description RoboCup@ Home 2014. Instituto Nacional de Astrofísica, Optica y Electrónica. 2014.

M. Hawley, P. Enderby, P. Green, S. Brownsell, A. Hatzis, M. Parker, J.

Carmichael, S. Cunningham, P. O’Neill, R. Palmer. STARDUST; Speech Training And Recognition for Dysarthric Users of Assistive Technology. In Proceedings of the 7th European Conference for the Advancement of Assistive Technology in Europe. Dublin, Ireland. 2003.

J.O. Cuátara Priede. Fonética de la ciudad de México. Aportaciones desde las tecnologías del habla. Tesis para obtener el título de Maestro en Lingüística Hispánica. Universidad Nacional Autónoma de México. 2004.

Pistas Educativas, No. 108, Octubre 2014. México, Instituto Tecnológico de Celaya.

D. Jurafsky, J.H. Martin. Speech and Language Processing. Second Edition. 2000. Pearson: Prentice.

S. Young, P. Woodland. The HTK Book (for HTK Version 3.4). Cambridge University Engineering Department. 2006.

C.J. Leggetter, P.C. Woodland. Maximum likelihood Maximum likelihood linear regression for speaker adaptation of continuous density hidden Markov model. Computer Speech and Language, 9(2):171-185, 1995.

B. Shneiderman. Designing the user interface: strategies for effective humancomputer interaction. Addison-Wesley Reading, MA. 4th ed. 2004.






URL de la licencia: https://creativecommons.org/licenses/by/3.0/deed.es

Barra de separación

Licencia Creative Commons    Pistas Educativas está bajo la Licencia Creative Commons Atribución 3.0 No portada.    

TECNOLÓGICO NACIONAL DE MÉXICO / INSTITUTO TECNOLÓGICO DE CELAYA

Antonio García Cubas Pte #600 esq. Av. Tecnológico, Celaya, Gto. México

Tel. 461 61 17575 Ext 5450 y 5146

pistaseducativas@itcelaya.edu.mx

http://pistaseducativas.celaya.tecnm.mx/index.php/pistas