text=
Vannak olyan esetek, amikor a felismerendő beszéd már nem modellezhető kapcsolt szavas modellekkel, hanem folyamatos felismerőre van szükség. Ha például egy számsorozatot kell felismerni, az nem megoldható kapcsolt szavas módon, mivel nem tudjuk, hogy hány szám fog elhangzani. Folyamatos felismerési technikákat kell tehát alkalmazni az egyszerű szósorozat felismerőktől a komplex felépítésű diktáló, illetve dialógusrendszerekig.
Az ábrán két megoldás látható egy egyszerű élelmiszervásárlási mintahálózatra. A felső a már ismert, kapcsolt szavas megoldás. Két alhálózatot illesztettünk a rendszerbe, az egyik egy számmodell, a másik pedig egy élelmiszer lista. A második megoldás annyiban különbözik az előzőtől, hogy van egy visszafelé mutató él a gráf végéről a szám hálózat elé. Ezzel a "kérem" elhangzása után folyamatosan, többféle árut is kérhetünk. Így eljutottunk egy egyszerű folyamatos felismerő felépítéséig. Ha kapcsolt szavas megoldással szeretnénk több áru kérésére alkalmas hálózatot készíteni, akkor egymás után többször meg kellene ismételni a szám-, illetve élelmiszer-alhálózatot. Ahányszor megismételjük az elemeket, annyi kérést képes felismerni a rendszer, többet nem (kevesebbet igen).
A különbség aprónak tűnik a két megközelítés között, ám mégis sok problémával kell megküzdeni. Egy kapcsolt szavas számfelismerő esetén például külön problémát jelent a számok szétválasztása. Ha valaki az ezeregyszázötvennyolc számot mondja be, azt 8-féle képpen lehet számokra bontani, de vajon melyik a helyes? Ha csak egy számot vártunk, akkor egyértelmű a megoldás, de ha többet, akkor már nem.
Ahogy az emberek közötti kommunikációban is, a beszélőnek visszajelzésre van szüksége, hogy a gép helyesen ismerte-e fel a beszédet. Tehát nem lehet megvárni a bemondás végét, és csak azután végrehajtani a felismerést, mivel ez túl hosszú idő lenne. Folyamatosan jelezni kell például visszakérdezéssel (bár kis késleltetéssel), hogy mi az, amit már biztosan felismert a rendszer. Így van lehetőség a kontrollra és esetleg javításokra is.