2Tecnologías para el control del sistema

Las tecnologías utilizadas para el control del sistema pueden diferir según el área donde se usan. Para diferentes tipos de control del sistema (navegación gestual, navegación por voz, seguimiento ocular, etc.), también se utilizan hardwares diferentes.

HW usado en el proceso de reconocimiento de gestos:

Pantallas táctiles

Generalmente, podemos distinguir dos tipos de pantallas táctiles: resistivas y capacitivas.

Una pantalla táctil resistiva consta de varias capas, de las cuales las capas flexibles de plástico y vidrio son dos capas importantes de resistencia eléctrica.

Ambas capas se enfrentan entre sí y entre ellas hay un espacio fino. Cuando un dedo o la punta de un lápiz presiona la superficie exterior, ambas películas se encuentran. La medida de la resistencia de ambas capas en el lugar de contacto permite una medición precisa de la posición táctil.

Ventajas de una Pantalla Táctil Resistiva:

  • Alta resistencia al polvo y al agua
  • Se utiliza mejor con un dedo, mano enguantada o lápiz óptico
  • Mejor adecuada para el reconocimiento de escritura a mano

Desventajas de una Pantalla Táctil Resistiva:

  • No demasiado sensible, se debe apretar fuerte
  • Pobre contraste debido a tener reflexiones adicionales de la capa extra de material colocada sobre la pantalla
  • No soporta multi-toque
image
Pantalla Táctil Resistiva

Una pantalla táctil capacitiva consiste también en dos capas separadas de vidrio, que están recubiertas con un conductor como Óxido de Estaño de Indio (ITO).

El cuerpo humano es un conductor de carga eléctrica. Cuando un dedo toca el vidrio de la superficie capacitiva, cambia el campo electrostático local. El sistema monitoriza continuamente el movimiento sobre cada pequeño condensador para averiguar el área exacta donde el dedo ha tocado la pantalla.

Ventajas de una Pantalla Táctil Capacitiva:

  • Debido a que la pantalla táctil capacitiva tiene una capa de vidrio en lugar de plástico, se ve más brillante y nítida
  • Muy sensible al tacto y no necesita un lápiz óptico
  • Soporta multi-toque

Desventajas de una Pantalla Táctil Capacitiva:

  • Debido a que la tecnología depende de la naturaleza conductora del cuerpo humano, no funciona si el usuario usa guantes
  • Debido a que tienen una estructura compleja, son bastante caras
  • El vidrio es más propenso a romperse
image
Pantalla táctil capacitiva

Micrófonos

Un micrófono convierte ondas acústicas en señales eléctricas. Un diafragma reacciona vibrando a las ondas acústicas, y produce cargas eléctricas de la intensidad correspondiente. Existen varias técnicas para generar la señal eléctrica, por ejemplo, condensador, dinámico, piezoeléctrico o incluso láser. Los teléfonos móviles suelen utilizar micrófonos electret. o MEMS (Sistemas Micro Eléctrico Mecánicos o MicroElectrical-Mechanical System en inglés).

Micrófono de Condensador

Dos placas se alimentan para crear un condensador. Una de las placas actúa como una membrana y se mueve en base a las ondas acústicas entrantes. El movimiento cambia la tensión de salida, generando la señal.

image
Esquema principal de un micrófono de condensador

Por lo general, un micrófono de estudio, es más sensible que el micrófono dinámico. Se utiliza para grabar instrumentos musicales.

El micrófono necesita una fuente de alimentación.

Un micrófono electret es una actualización tecnológica del micrófono de condensador, haciéndolo más resistente. El micrófono electret se usa en la mayoría de los dispositivos móviles en la actualidad.

Micrófono Dinámico

La membrana del micrófono se conecta a una bobina ubicada alrededor de un imán permanente. La presión aplicada a la membrana obliga a la bobina a moverse a lo largo del imán y genera corriente eléctrica.

image
Esquema principal de un micrófono dinámico

El micrófono dinámico es menos sensible, lo que lo hace más adecuado para grabar canciones en vivo.

Otras tecnologías para la adquisición de sonido incluyen carbón, piezoeléctrico, cinta, MEMS, líquido o láser.

Según la forma de los componentes básicos, un micrófono puede tener una sensibilidad diferente a los diferentes ángulos de la fuente de sonido. El más común es el patrón cardioide, que hace que el micrófono capte las ondas de sonido que se encuentran frente a él, pero que no lo haga por detrás. Otros patrones de sensibilidad incluyen omnidireccional, bidireccional y direccional.

image
Muestra de las Características Direccionales de un Micrófono. A. Omnidireccional. B. Cardioide. C. Bidireccional (figura de 8). D. Direccional (Escopeta).

Una combinación de varios micrófonos (por ejemplo, ordenados en una fila) crea una matriz de micrófonos. La matriz puede enfocarse mejor hacia el área seleccionada mientras ignora el área innecesaria. Una característica importante de las matrices de micrófonos es la capacidad de deducir la dirección de la que proviene la voz del orador. Esto ayuda a apuntar a otros sistemas del sistema multimedia.

Seguimiento ocular y BCI

El seguimiento ocular es el proceso de medir la posición del punto de la mirada (donde está mirando la persona rastreada) o el movimiento de los ojos en relación con la cabeza.

Los sistemas para el seguimiento ocular se basan principalmente en cámaras que capturan el ojo o las imágenes de los ojos y en base a esto evalúan la posición de la mirada. Las cámaras capturan la imagen del ojo normalmente con una frecuencia de cuadro desde 30Hz (nivel de entrada, juego) hasta 1200Hz (nivel de investigación). Básicamente, existen dos construcciones de rastreadores oculares: la variante móvil, donde las cámaras que capturan la posición de los ojos están montadas en gafas o incorporadas en un HMD, o la variante fija, donde las cámaras se colocan en una caja debajo de la pantalla / monitor. Las versiones binoculares móviles (cada ojo se rastrea mediante una cámara dedicada) de seguidor ocular son generalmente más precisas que las monoculares (solo se rastrea un ojo) y permiten movimientos oculares más grandes. Además de las cámaras oculares, en la variante móvil también se utiliza la cámara “general”, que captura el entorno y permite trazar la posición de la mirada en la imagen circundante.

image
Principio del rastreador de ojo monocular móvil, el visor es escaneado por la cámara general y la posición de la pupila por la cámara ocular

Básicamente, existen dos construcciones de rastreadores oculares: la variante móvil, donde las cámaras están montadas en gafas o incorporadas en un HMD, o la variante fija, donde las cámaras se colocan en una caja debajo de la pantalla / monitor. Además de las cámaras “oculares” mencionadas anteriormente, en la variante móvil también se utiliza la cámara “general”, que captura el entorno y permite trazar la posición de la mirada en la imagen circundante.

Una Interfaz Cerebro-Computadora (BCI) es una tecnología que permite la comunicación entre un cerebro humano y un sistema externo (generalmente basado en computadora). BCI puede referirse a una tecnología que lee señales del cerebro por un sistema externo y/o a una tecnología que envía señales al cerebro.

Para el control del dispositivo, el interés principal es leer las señales del cerebro e interpretar la intención del usuario. Las señales enviadas al cerebro se pueden utilizar como canal de retroalimentación. La tecnología BCI para enviar las señales al cerebro puede usar, por ejemplo, estimulación magnética (TMS del inglés transcranial magnetic stimulation) [7]. El TMS es un enfoque no invasivo en el que se utiliza un campo magnético cambiante para generar una corriente eléctrica en la región objetivo del cerebro a través de inducción electromagnética. La tecnología BCI para leer las señales cerebrales en su mayoría utiliza electroencefalografía (EEG) – señales eléctricas creadas por las neuronas y capturadas en la piel sobre el cráneo mediante electrodos, que suelen estar chapados en oro o húmedos. Normalmente, los sistemas BCI usan 2 electrodos (nivel de entrada, juego) - 4 y más, hasta 256 (nivel de investigación). La parte importante de las señales capturadas (ondas cerebrales) se encuentran en la banda de frecuencia de 2Hz-30Hz, son muy débiles (2-30mV) y necesitan ser amplificadas. Este rango de frecuencia se divide entre más subbandas (también llamadas ondas cerebrales), como beta, theta, etc. La presencia de energía en estas subbandas puede indicar varias situaciones. Depende también de la ubicación de la medición. Por ejemplo, las ondas delta hasta 4 Hz, ubicadas en la parte frontal y para los adultos, están presentes en más etapas del sueño Las ondas alfa entre 7 Hz y 13 Hz ubicadas en las regiones posteriores de la cabeza, a ambos lados, aumentan con el cierre del ojo y con la relajación, y se atenúan con la apertura del ojo o el esfuerzo mental. Las ondas mu entre 8Hz y 13Hz, están ubicadas en la corteza sensoriomotora (parte central superior en el cuero cabelludo en ambos lados) y están presentes durante las acciones motoras o incluso en la imaginación de las acciones motoras. Un problema es que también se capturan las señales myo (señales generadas debido a los movimientos musculares) y éstas son un orden de magnitud más grandes (10-300 mV). Por lo tanto, es necesario un postproceso cuidadoso. También hay sistemas que se basan en señales myo, capturadas por ejemplo en la muñeca o en el antebrazo, para captar los gestos. En su mayoría, los sistemas basados en señales myo realmente están pensados para ser usados en soluciones neuroprotésicas. Un caso especial es la oculografía (que captura las señales de los músculos del movimiento del ojo). Estos sistemas ahora son ampliamente reemplazados por los sistemas de seguimiento ocular basados en cámaras mencionados anteriormente.

image
Ubicaciones espaciales relevantes BCI para la adquisición de la señal mediante EEG: a) Ubicación del córtex SMR (rojo - parte motora, azul - sensorial) b) Sistema 10/20 para colocación del electrodo c) Colocación del electrodo del dispositivo Emotiv EPOC BCI