message=A feladat egy olyan beszélőfüggetlen rendszer készítése, amely egymillió alatt minden számot felismer. Azt már beláttuk, hogy ezt nem szótáralapon, hanem nyelvi hálózat segítségével kell megoldani.
A felismerő készítésekor az első lépés az akusztikus modellek betanítása volt. Általános szöveggel és számokat tartalmazó hanganyaggal is tanítottuk a rendszert. Utóbbi esetben lényegesen jobb felismerési eredményeket kaptunk (a felismerési hiba relatíve 60 százalékkal csökkent), mivel a tanító szöveg hangkapcsolatai megegyeztek a felismerési feladatban előfordulókkal. Jelen esetben is igaz az az általános megállapítás, hogy nagy mennyiségű, címkézett hanganyag szükséges a beszédhang-modellek betanításához. Tehát a rendszer elkészítésének jelentős hányadát a hangmodellek elkészítése jelenti.
A nyelvi hálózat összeállítása során könnyen belátható, hogy valóban minden szám előáll az alkalmazott gráf segítségével. A részszótárakban szereplő összesen 23 elemet manuálisan át lehet írni beszédhangok sorozatává, így a teljes gráf könnyen összeállítható.
A bemutatott gráf hiányossága, hogy nem kezeli a szókapcsolatoknál fellépő hangmódosulásokat. Például a 606 "hat-száz-hat"-ként áll elő. Ha minden szót önállóan átírunk beszédhangok sorozatává, akkor az eredmény "h a t sz á z h a t" lesz. A valóság azonban nem ez, a t és sz hangok cc-vé olvadnak össze, a z pedig zöngétlenedik az őt követő h miatt, így h a cc á sz h a t a helyes átirat. Ezek mellett még számtalan hasonulási jelenség fordul elő, melyek jelentős része szabályrendszerrel leírható.
A hasonulási problémát kezelni kell, mivel a felismerő gráfjának tartalmazni kell a felismerendő szavak összes lehetséges beszédhangsorozat-reprezentációját. A legegyszerűbb megoldás, hogy minden szónak az összes hasonulásos alakja is szerepel a szótárban, így minden helyes sorozat előáll, bár helytelenek is előfordulhatnak. A bővített szótár bevezetése 30 százalékos relatív hibaarány-csökkenést jelentett a felismerő rendszerben. A tipikus hét-két-négy tévesztés azonban egyenlőre nehezen kiküszöbölhető, de ez az ember számára is sokszor gondot jelent.
Számfelismerő hálózat továbbfejlesztéseként például telefonszám-felismerőt lehet tervezni. Érdemes belegondolni, hogy a sokféle telefonszám kiejtése mennyire növeli meg a gráf bonyolultságát.