text=A beszédszintézis azt jelenti, hogy a beszédet gépi úton állítjuk elő. Ha az előállítandó beszéd tartalma (szövege) előre ismert, akkor kötött szótáras szintézisről beszélünk, (például banki számlatájékoztató, hangposta stb.), ha viszont elore nem ismert szöveget kell géppel felolvastatni (hír, könyv, SMS, e-mail, fax), akkor úgynevezett szövegfelolvasót kell megvalósítani. Mindkét megoldásnál valamilyen akusztikai építőelemtárból kell a beszédjelet alapszinten összeállítani. Az építőelemek lehetnek paramétersorozatok (például: formáns, idő, alaphang, LPC együtthatók stb.) és lehetnek emberi ejtésből kivágott beszédjel részletek (hangok, hangkapcsolatok, szótagok, szavak, mondatrészek, mondatok). A kötött szótáras szintézis megoldható viszonylag kevés fonetikai, beszédakusztikai ismerettel, a szövegfelolvasóhoz jól megalapozott nyelvészeti, fonetikai és digitális beszédfeldolgozási szakismeretre van szükség. A beszédszintetizátorok hangminősége attól függ, hogy a fenti ismereteket milyen szinten alkalmazták a tervezésnél. Ebből adódik, hogy a beszédszintetizátorok hangminősége széles skálán mozog a nagyon rossztól az emberi hanghoz közelállóig.