4 Navigácia pomocou gest
4.2 Získavanie obrazových dát

Na začiatku bol výskum algoritmov rozpoznávania gest založený na vstupe z RGB (Red Green Blue) kamery. Tento prístup prináša niektoré výhody, ktoré sú však prevážené nevýhodami. RGB obraz sa skladá z farebných kanálov a existuje mnoho faktorov, ktoré negatívne ovplyvňujú kvalitu RGB obrazu.

Zmena osvetlenia môže radikálne ovplyvniť kvalitu obrazu. Zmena podmienok osvetlenia v miestnosti úplne mení jas a kontrast obrazu. Tým sa stáva rozpoznávanie pomocou RGB obrazu neisté a menej presné [2].

V posledných niekoľkých rokoch začali vedci používať hĺbkový obraz pre ďalšie spracovanie v oblasti rozpoznávania gest. Hĺbkový obraz je dvojrozmerný obraz, ktorý obsahuje ďalšie informácie - hĺbku. Väčšina hĺbkových senzorov je založená na infračervenom (infrared IR) žiarení (napr. Kinect senzor na Fig. 4.2). Senzor vracia dáta, ktoré predstavujú vzdialenosť každého pixelu v snímke od snímača (senzora). Získané vzdialenosti môžu byť jednoducho prepočítané na odtiene sivej, a tak sú hĺbkové dáta reprezentované ako čiernobiela video sekvencia. Získanie dát nevyžaduje žiadne zvláštne podmienky.

Hĺbkové dáta majú viac informácií ako dáta získané RGB kamerami. Hlavnou výhodou je, že hĺbková kamera využíva infračervené svetlo a v infračervenej zóne nie je toľko šumu a rušení. Takže infračervený snímač nie je tak citlivý na kvalitu scény ako RGB snímače [2].

image
Fig. 4.2 – Obraz z hĺbkovej kamery

Vzdialenosť každého pixelu zo snímača je definovaná v milimetroch.

Ak chceme previesť hĺbkový obraz do obrazu v odtieňoch sivej, musíme vedieť minimálnu a maximálnu možnú vzdialenosť.

(003)    

kde d je aktuálna vzdialenosť daného pixelu, dmin je minimálna možná vzdialenosť od senzora a dmax je maximálna možná vzdialenosť od senzora [2].

Ako pomôcka pri získavaní vstupného obrazu môžu slúžiť extra prvky ako svetielkujúci náramok, prsteň alebo malá loptička v ruke.