message=A beszéd természetére jellemző a fizikai paraméterek nagymértékű variáltsága akár egy beszélőn belül, beszélők között, továbbá az akusztikai környezet függvényében is. A beszédadatbázisok feladata az, hogy mintáikkal ezt a nagyfokú változatosságot minél jobban lefedjék.
Az ábrán a BUDAPEST szó különböző bemondásokból származó spektrogramvariációit mutatjuk be. Figyeljük meg a színképi paraméterek, valamint a beszédhangok időtartamának változatosságát.
A beszédparaméterek számos hatás következtében megváltozhatnak, variáltságuknak több forrása van. Ilyen források lehetnek az egyén beszédstílusa, a hangképző szervek biológiai tulajdonságai, a hangképző szervek személyre jellemző méretei stb. E variáltság miatt a különböző személyek által létrehozott beszéd a maga fizikai értékeiben is más és más. Ez a variáltság különösen a beszédfelismerést nehezíti meg.
A hangképzés folyamatosan változó mozgások összessége, amit a felismerésnél kvantálva használunk. A folyamatos hangképzőszervi mozgások miatt (koartikuláció) az adott hang fizikai tulajdonságait befolyásolják az azt megelőző és követő hangok fizikai tulajdonságai.
A fizikai paraméterek variáltságát okozhatják továbbá a környezeti, akusztikai körülmények is. Ilyenek pl. a zajos, zajtalan környezet, visszhangok, teremakusztikai hatások, az átviteli lánc tulajdonságai (telefonbeszéd) stb.
A variáltságot okozó tényezők számos módon csoportosíthatók, mégis talán a beszélőn belüli, és a beszélők közötti variáltság szerinti csoportosítás illik a legjobban a felismerők működési tulajdonságaihoz.
A környezeti hatások a beszédjellel együtt jelen vannak a hangtérben. Kétfajta környezeti hatást különböztetünk meg: a statikust (teremakusztikai hatások, utózengési idő, rögzítő berendezések, stb.) és dinamikust (zaj, mikrofonpozíció stb.). Ezek nehezítik a beszéd akusztikai paramétereinek egyértelmű meghatározását a felismeréskor.