text=A nyelvi modellt külön kell választani a szótártól. A szótár tartalmazza a nyelvi modellben használt legkisebb egységek (szavak, morfémák) beszédhang szintű átiratát, míg a nyelvi modell ezek lehetséges kapcsolatát írja le. A szótárban általában a feladathoz illeszkedő szavakat szokás feltüntetni, de a magyar nyelvű felismerésnél hamar beleütközünk a ragozás okozta problémába. Nem célszerű egy-egy szó összes (akár tízezer) ragozott alakját felsorolni a szótárban, célszerűbb azt a nyelvi modellbe illeszteni.
Ragozási hálózatok megvalósítására elfogadott technológia a bigramm-modellek alkalmazása, amikor két halmazt képzünk, a szótövek és a toldalékok halmazát. A két részhalmaz között teljes párosítást hajtunk végre, de az egyes élekhez súlyokat rendelünk, melyeket szövegadatbázisok alapján kell becsülni. A valóságban nem létező szótő-toldalék párok így nulla súllyal fognak szerepelni. Azon párok, melyek nem fordulnak elő a tanító szövegben szintén nulla súlyt kapnak, noha nem ilyenek. Ennek az ellentmondásnak az elkerülése érdekében úgynevezett simító eljárások alkalmazhatók, melyek azonban nem tudnak különbséget tenni a hibás és a hiányzó párok között, így minden párosítás, bár eltérő valószínűséggel, de megengedett lesz. Az igazi megoldást az explicit ragozási információ modellbe építése jelentheti.