text=
A beszédfelismerést nehezíti, ha nem csak egy felhasználó beszédét, hanem sok ember hangját kell felismerni. Ekkor beszélőfüggetlen felismerésre kell tervezni a rendszert, amihez beszélőfüggetlen akusztikus modellekre van szükség. Mint már láttuk, egyetlen beszélőnél is nagy a hangok variáltsága, több beszélő esetén ez pedig még nagyobb. Az ábrán jól látható, hogy ugyanazon szó különböző emberek kiejtésében mennyire eltérő akusztikai szerkezetet mutat.