s2=
Az adatbázisok minőségére vonatkozó néhány jellemző adatot mutatjunk be a táblázatban. A rögzített hanganyag minőségét erősen befolyásolja, hogy milyen mikrofont használnak a felvételnél, milyenek a digitalizálási paraméterek, milyenek a hangrögzítés akusztikai körülményei. A bemondás módja nagymértékben befolyásolja a felvétel fonetikai jellegzetességeit. A spontán szövegben sokkal több az esetlegesség, mint a felolvasásnál, a hangsúlyozás is jelentősen eltérő. A feldolgozás alapegységének maghatározása lényeges minőségi jellemző, és meghatározza az adatbázis nyelvi tartalmát.
Amerikában a TIMIT és az ATIS adatbázisok a legjelentősebbek. Ezeket gépi beszédfelismerés céljára hozták létre, és amerikai angol nyelven, akusztikai modellek felépítésére alkalmasak.
A TIMIT adatbázis személyfüggetlen fonetikai alapú beszédfelismerők betanítására és tesztelésére szolgál. Szómodellek felépítésére alkalmatlan, mivel szűkített szótárkészletet használ, fonetikailag gazdag mondatai viszont kiválóan alkalmasak beszédhangmodellek létrehozására. Az adatbázis egy része betanításra, másik része tesztelésre ad lehetőséget.
ATIS (Air Travel Information System) repülőtéri információval kapcsolatos szótárkészleten alapuló adatbázis. Minden elem rögzítésre került, spontán társalgással, és olvasva hivatali körülmények között is.
&s3=Az adatbázis tartalmára vonatkozó mennyiségi jellemzők igen széles skálán változnak, mint ahogy az a táblázatból is kitűnik. A felhasználás jellege, a feldolgozási módszer, az alapegységek kiválasztása mind nagymértékben meghatározzák, hogy milyen szövegtartalmú és hány bemondást tartalmazó adatbázisra van szükség. Például a TI Digits adatbázis jól működő személyfüggetlen számfelismerők létrehozását teszi lehetővé, mivel igen nagyszámú beszélő bemondását tartalmazza.