1MMI architektura

V současné době je nejrozšířenějším rozhraním sloužícím ke komunikaci člověka s počítačem klávesnice s počítačovou myší anebo dotykový displej. Tato zařízení představují adaptaci lidí úrovni počítačů ve spojení s přirozeným způsobem vzájemné komunikace a ovládání. V posledních letech se však začaly objevovat požadavky lidí na potřebu komunikovat s počítači rovnocenným způsobem jako mezi sebou samotnými, tj. řečí, mimikou a gesty. Takto totiž dokáží lidé přenést mnohem více informací než použitím periferních zařízení. Toto nás přivádí k pojmu multimodální rozhraní MMI (MultiModal Interface).

Multimodální rozhraní se skládá z různých částí a modulů, které slouží pro přirozenou a uživatelsky příjemnou formu komunikace, resp. interakce se systémem. Spolu tyto moduly představují funkce MMI. Součástí MMI mohou být tyto moduly:

  • hlasová identifikace
  • rozeznání řeči a hlasových povelů
  • rozeznání více tváří
  • rozeznání gest a navigace pomocí gest
  • navigace očima
  • syntéza řeči
  • predikční modul (modul anebo systém pro filtrování informací, a který se snaží predikovat ohodnocení nebo preferenci uživatele, kterou by dal zvolené položce)

Všeobecně se architektura multimodálního rozhraní skládá z několika vrstev. Fyzická vrstva představuje hardwarová vstupní a výstupní zařízení umožňující přímou interakci s okolím. Multimodální údaje poskytované vstupními zařízeními (např. kamery, senzory, mikrofony, atd.) jsou zpracované paralelně každým modulem zvlášť (moduly jsou nad fyzickou vrstvou, tato vrstva se nazývá vrstvou modalit). MMI řadič (na vrstvě MMI) sbírá výstupní data ze všech modulů, vyhodnocuje je a následně spojuje do jednoho výstupního datového toku. Výsledný tok informací obsahuje informace o uživatelích a autorizaci o jimi požadovaných akcií. Tento tok se přenáší až do aplikační vrstvy.