text=A folyamatos beszédben a nyelvi szintű rövid-hosszú hangidőtartam-arányok egymásba tolódhatnak, tehát egy nyelvileg hosszú hang fizikai hossza nem szükségszerűen nagyobb, mint egy rövid hangé és fordítva. Ezért nehéz például a szövegfelolvasó rendszereknél a szintetizálandó hangok tényleges időtartamát eredményesen megjósolni. Ezt többszintű modellezéssel lehet csak jól közelíteni.