Řečový signál je fyzicky tvořen hlasovými orgány, které jsou ale ovládané mozkovou činností jedince. Oba dva aspekty úzce souvisí s daným jedincem, proto obě aktivity vnášejí do řečového signálu specifické vlastnosti hovořícího; proto se i řečový signál označuje jako biometrický.
I když je primární úlohou řečového signálu přenos řečové informace, obsahuje v sobě též dodatečné informace např. specifické pro hovořícího, které jsou dané velikostí, tvarem a tuhostí jednotlivých hlasových orgánů, náladou, zdravotním stavem, vzděláním, povahou, původem, zvyky atd.
Způsob zakódování těchto informací do řečového signálu není úplně známý, stejně jako i samotný matematický popis této operace. Proto je poměrně náročné separovat a extrahovat jednotlivé příznaky pro zvolenou oblast zpracování řeči (rozpoznávaní řeči, identifikace hovořícího, atd.). Navíc řeč obsahuje velkou variabilitu hovořícího způsobenou různými vlivy, např. náladou, fyzickým stavem, chorobou, atd. Nakonec signál může být značně degradovaný přítomností šumů a vlivem nahrávacích zařízení a prostředí, v němž k nahrávání došlo.
Modifikace signálu, které nejsou způsobené řečníkem (zařízení, prostor, atd.) se označují jako změny relace. Tyto změny mají významný vliv na úspěšnost identifikace a proto musí být ošetřeny. To platí zejména v případech, kdy se podmínky nahrávání neshodují s podmínkami nasazení.