text=A bemutatott mintaalkalmazás alkalmas bármely bemondott magyar városnév felismerésére. A megoldás személyfüggetlen. Ilyen felismerőt lehet alkalmazni például automatikus menetrendi vagy egyéb tudakozó rendszereknél. A rendszer izolált szavas felismerési eljárással működik. A beszélőfüggetlenség és a nagy szótár hatásos kezelésére statisztikus módszert, azaz rejtett Markov modell alapú felismerést alkalmaznak. A szótár mérete skálázható a főbb nagyvárosokat tartalmazó kis szótártól a teljes, négyezer kétszáz települést tartalmazó nagy szótárig. Természetesen a szótár méretének növelésével a felismerés hatékonysága csökken, ezt még fokozza, hogy sok hasonló településnevünk van. Nyíregyházát és Zalaegerszeget nehéz összekeverni, de például a Beled, Beleg, Berek hármasból kiválasztani a megfelelőt nem egyszerű feladat.
A mintaalkalmazást a Budapesti Műszaki Egyetem Távközlési és Telematikai Tanszékén fejlesztik. A rendszer elkészítésének első és egyben legnehezebb lépése az akusztikus modellek betanítása volt. Ehhez a tanító adatbázis 13 beszélőjétől származó egy órányi hanganyag szolgált alapul. A felismerés beszédhang alapú, tehát minden hanghoz egy-egy modellt kellett betanítani. A rövid és hosszú mássalhangzó párokhoz azonos modell rendelhető, mivel azok főként a hosszukban különböznek. A dz illetve dzs hangok betanítása nehézségekbe ütközik az igen ritka előfordulásuk miatt. A teljes rendszerhez összesen 40 három állapotú Markov modell betanítására volt szükség. Minden állapotban 10 Gauss eloszlás keveréke modellezi a jellemző vektorok eloszlását.
A következő lépés a referenciaszótár összeállítása volt. A települések nevei adottak, de a fonetikus átiratukat el kellett készíteni. Az írott alakból lehetőség van egy saját fejlesztésű szabályrendszer segítségével a kiejtést tükröző úgynevezett fonotipikus átiratot előállítani. Az átírás nem mindig egyértelmű, különösen a kettős betűk okoznak problémát, például a Kiszsidány vagy a Doborgazsziget esetén a szs illetve a zsz karakterek betűkre szegmentálása többféle módon is lehetséges. Az egyértelmű megoldáshoz morfológiai elemzésre van szükség, mivel összetett szavakról van szó. A fonotipikus átirat tehát néhány kivételtől eltekintve automatikusan elkészíthető. Így előállt a felismeréshez szükséges szótár is.
A rendszer gyakorlati megvalósításához szükség van még egy beszéddetektorra, valamint a szünet illetve zajmodelleket tartalmazó feldolgozó egységre.
A felismerő a szótár méretétől függően 10-20 százalékos hibaaránnyal működik. A városnév felismerés több irányban is kiterjeszthető, külföldi városnevek is bekerülhetnek a szótárba, illetve a magyar városnevek "külföldi" kiejtéseire is szükség lehet a konkrét alkalmazások függvényében.