Juraj Kačur, Gregor Rozinaj, Renata Rybárová
Miquel Soriano
La interfaz multimodal (MMI) consta de varios temas y módulos que sirven para una comunicación natural y fácil de usar con el sistema. En conjunto, estos módulos representan la funcionalidad de MMI. La lista de módulos que pueden ser parte de la interfaz multimodal es la siguiente: el reconocimiento del hablante, el reconocimiento de comandos y del habla, el reconocimiento multi facial, la navegación por gestos, la navegación con los ojos y la síntesis de voz. Este módulo introducirá algunos de ellos para ayudar a entender los principios básicos y los algoritmos que se nos presentan en nuestra vida cotidiana.
El objetivo principal del módulo es introducir al estudiante en lo fundamental de la interfaz multimodal y su aplicación. El estudiante se familiarizará con los principios básicos del reconocimiento facial, la identificación del hablante y la navegación por comandos de voz y por gesto. Al final, se describen las posibles aplicaciones multimodales de todas las modalidades mencionadas.
Interfaz multimodal, aplicación multimodal, identificación de usuario, reconocimiento facial 2D/3D, navegación por gestos, reconocimiento de voz, identificación del hablante.