text=Izolált szavas beszédfelismerési feladatoknál egyetlen szót vár a beszédfelismerő. A feldolgozás első lépéseként egy úgynevezett beszéddetektor meghatározza, hogy mikor kezdődik a beszéd, és mikor van vége. A beszédet megelőzheti a szájnyitásból, illetve levegő vételből származó zörej és követheti hasonló.
Kétféle detektálási hibával kell számolni. Az első, amikor elhangzott beszéd, viszont a detektor nem jelzett, a másik, mikor nem volt beszéd és mégis jelzett a rendszer. Ezek összefüggnek, és mindkét hibát egyszerre nem is lehet kiküszöbölni.
Az ábrán az intenzitásküszöb beállításának hatását láthatjuk. A legalacsonyabb energiájú beszédhanghoz alkalmazkodó küszöb esetén lesznek olyan zörejek, melyekre jelezni fog a rendszer (a, b ábra). A küszöb szintjének emelésével bizonyos zörejek kiszűrhetők, de ekkor a beszédjelből a kis energiájú részek elveszhetnek (c, d ábra). A nagyobb hibát az jelenti, ha az elhangzott szót nem tekinti beszédnek a rendszer.
Nagy zajban a beszéd detektálása nem, vagy csak nehezen megoldható. Azonban nagy környezeti zajban egyelőre a beszédfelismerők sem képesek kielégítően működni.