text=
Az adatbázisok minőségére vonatkozó néhány jellemző adatot mutatjunk be a táblázatban. A rögzített hanganyag minőségét erősen befolyásolja, hogy milyen mikrofont használnak a felvételnél, milyenek a digitalizálási paraméterek, milyenek a hangrögzítés akusztikai körülményei. A bemondás módja nagymértékben befolyásolja a felvétel fonetikai jellegzetességeit. A spontán szövegben sokkal több az esetlegesség, mint a felolvasásnál, a hangsúlyozás is jelentősen eltérő. A feldolgozás alapegységének maghatározása lényeges minőségi jellemző, és meghatározza az adatbázis nyelvi tartalmát.
Amerikában a TIMIT és az ATIS adatbázisok a legjelentősebbek. Ezeket gépi beszédfelismerés céljára hozták létre, és amerikai angol nyelven, akusztikai modellek felépítésére alkalmasak.
A TIMIT adatbázis személyfüggetlen fonetikai alapú beszédfelismerők betanítására és tesztelésére szolgál. Szómodellek felépítésére alkalmatlan, mivel szűkített szótárkészletet használ, fonetikailag gazdag mondatai viszont kiválóan alkalmasak beszédhangmodellek létrehozására. Az adatbázis egy része betanításra, másik része tesztelésre ad lehetőséget.
ATIS (Air Travel Information System) repülőtéri információval kapcsolatos szótárkészleten alapuló adatbázis. Minden elem rögzítésre került, spontán társalgással és olvasva, hivatali körülmények között is.