4 Navigace pomocí gest
4.2 Získávání obrazových dat

Na začátku byl výzkum algoritmů rozeznávání gest založený na vstupu z RGB (Red Green Blue) kamery. Tento přístup přináší některé výhody, které však jsou převáženy řadou nevýhod. RGB obraz se v principu skládá z barevných kanálů a existuje mnoho faktorů, které negativně ovlivňují kvalitu RGB obrazu.

Např. změna osvětlení může radikálně ovlivnit kvalitu obrazu. Změna podmínek osvětlení v místnosti totiž zcela zásadně mění jas a kontrast obrazu. Tím se stává rozeznávání pomocí RGB obrazu nejisté a méně přesné [2].

V posledních několika letech začali vědci používat tzv. hloubkový obraz pro další zpracování v oblasti rozeznávání gest. Hloubkový obraz je dvojrozměrný obraz, který obsahuje další dodatečné informace – hloubku. Většina hloubkových senzorů je založena na infračerveném IR (Infra Red) záření (např. senzor Kinect – viz obr. 4.2). Senzor vrací data, která představují vzdálenost každého pixelu na snímku od snímače (senzoru). Získané vzdálenosti mohou být jednoduše přepočítány na odstíny šedé barvy, a tak jsou hloubková data reprezentována jako černobílá videosekvence. Získání dat nevyžaduje žádné zvláštní podmínky.

Hloubková data mají víc informací než data získaná RGB kamerami. Hlavní výhodou je, že hloubková kamera využívá infračervené světlo a v infračervené zóně se nevyskytuje tolik šumu a rušení. Takže infračervený snímač není tolik citlivý na kvalitu scény jako RGB snímače [2].

image
Obrázek 4.2. Obraz z hloubkové kamery

Vzdálenost každého pixelu ze snímače je definovaná v milimetrech.

Pokud chceme převést hloubkový obraz do obrazu v odstínech šedé barvy, musíme znát minimální a maximální možnou vzdálenost.

(003)    

kde d je aktuální vzdálenost daného pixelu, dmin je minimální možná vzdálenost od senzoru a dmax je maximální možná vzdálenost od senzoru [2].

Jako pomůcka při získávání vstupního obrazu mohou sloužit extra prvky, jako např. světélkující náramek, prsten anebo malý míček v ruce.