text=A beszédszintézishez készített adatbázisoknál más szempontokat kell figyelembe venni, mint a beszédfelismerésre vagy kutatásra készítetteknél. Itt az a cél, hogy a közlendő információt beszéd formájában lehessen megvalósítani. Az adatbázisokat itt is emberi bemondásból származó beszédből készítik, azonban elég egy beszélő hangjának rögzítése egy adott rendszerhez. Az adatbázisok elemei a mai gyakorlatban minden esetben az emberi hangból kivágott jelrészletek, amelyeket a szintézis során egymáshoz kapcsolnak. Így építik fel a szintetizált beszédjel hullámformáját. Az adatbázis elkészítéséhez - a rendszer típusától függetlenül - minden esetben meg kell határozni a bemondó által felolvasandó szöveget. Ez gondos tervezést igényel. Figyelembe kell venni a beszéd akusztikai szerkezetének leglényegesebb tulajdonságait. Ezért a tervezésbe célszerű fonetikust, beszédkutatási szakembert bevonni. A jó hangminőségű beszédszintetizáló szolgáltatás elkészítését erősen meghatározza, hogy a felolvasandó szöveget mennyire gondosan tervezték meg.
A kötött szótáras rendszerek adatbázisában általában mondatokat, mondatrészeket és szavakat rögzítenek. Az ehhez tervezett szöveganyagot úgy kell elkészíteni, hogy a szótár leendő elemeit olyan szövegkörnyezetbe kell helyezni, amilyenben azok meg fognak szólalni a kész rendszerben. Tehát úgynevezett vivőmondatokba kell a kivágandó elemeket elhelyezni.
A szövegfelolvasókhoz tervezett szöveges anyagokba nem mondatokat, hanem rövid hangsoregységeket kell tervezni. Itt még fontosabb a beszédkutatási szakember bevonása a munkába. A nem megfelelően megtervezett szövegből kivágott hangelemek összekapcsolása után torz, darabos, természetellenes beszéd lesz a szintézisben.