message=
Kempelen Farkas (1734-1804), az első beszélőgép megalkotója
Kempelen Farkas a XVIII. század második felének híres magyar tudósa, feltalálója volt. A barokk kor mechanikai eszközeinek világában alkotott, és az akkori lehetőségek maximumát nyújtotta. A világ első fonetikusának is tartják, mivel ő alkotta meg az első olyan mechanikus szerkezetet, amely az emberi hanghoz nagyon hasonló hangzású jeleket tudott kiadni. Beszélőgépét 22 éven át tökéletesítette, míg a végleges változatot az 1791-ben Bécsben megjelent könyvében írta le. A könyv címlapján ez olvasható: Wolfgang von Kempelen, k.k. wirklichen Hofrats, Mechanismus der Menschlichen Sprache nebst Beschreibung seiner sprechenden Maschine. Mit XXVII Kupfertalen.
A magyar változatot (Mollay Károly fordításában) 1989-ben a Szépirodalmi Kiadó adta közre: "Az emberi beszéd mechanizmusa, valamint a szerző beszélőgépének leírása" (XXVII metszeti rajzzal)
Kempelen a tudós alaposságával tanulmányozta az emberi hangképzést. Számos olyan megállapítást fogalmazott meg, amelyet később a tudomány is igazolt. Tanulmányozta az állatok hangadását, a nem beszéd jellegű emberi hangképzést (fütyülés, krákogás, horkolás, csók), sőt a beszédhibákat is, hogy minél jobban megértse az emberi hangképzés mechanizmusát. Javaslatokat is tett a beszédhibák javítására.
Leírásai, könyvének rézmetszetei hosszú időre előremutatóan ismertették a beszédszerveket, azok működését és részvételüket az egyes beszédhangok képzésében.
Kempelen 1769-ben kezdte építeni első beszélőgépét, amit 1782-ben mutatott be először a bécsi császári udvarban. 1790-re elkészítette a végleges változatot. A géppel gyermekhangon, több nyelven, szavakat és rövid mondatokat lehetett előállítani. (Kempelen kísérletei során több gépet is épített. Egy ilyen köztes, eredeti példányt a müncheni Deutsches Museum őriz.)
A beszélőgéppel Kempelen (saját tudtán kívül) új korszakot nyitott meg: az ember-gép kapcsolat beszéddel megvalósított korát, ami tulajdonképpen most kezd kiteljesedni a 21. század elején. Kempelen tehát több, mint 200 évvel megelőzte korát. Ő maga élete legnagyobb alkotásának tartotta a beszélőgépet, de az akkori társadalomban messze nem ismerték fel ennek a jelentőségét.
A beszélő gép energiáját a nagyméretű fújtató adja. Ezzel fújhatjuk be a levegőt a gép "torkába", amely a burkolati "szélláda" belsejében helyezkedik el. A fújtató mozgatását a kezelő személy a jobb karjának könyökével végezte (lenyomás). A nyugalmi helyzetbe való visszaállást az ellensúly húzóereje segíti. Kempelen gépének belsejében egy hermetikusan zárt fadoboz ("torok") szolgált a hangkeltésre. Ebben a dobozban található e rezgő nyelv, ami a zöngés hangokhoz adja a forrásjelet, valamint két kisméretű szelepláda, amelyik az s és f hangok megszólaltatásához a levegőt az oldalsó fúvókákba irányítja. A fadoboz tetején 3 billentyű található amelyeket az s, az f és az r hang megszólaltatásánál kell lenyomni a jobb kéz ujjaival. Az orrlyukakat imitáló két függőleges cső befogásával normál beszédhangot, a nyílások kinyitásával orrhangzósabb zöngés hangot lehet előállítani. A két csövet a kéz két középső ujjával célszerű befogni. A kisujj szolgál az f hang, a mutató ujj az s hang billentyűjének a lenyomására. A hüvelyk ujjal az r hang billentyűjét lehet lenyomni, ha tenyerünk alá behajlítjuk. A beszélőgép "szája" egy gumiból készült tölcsérszerű alakzat. Ez szolgál a zöngés hangok formálására. A keresztmetszet és az alak változtatásával lehet megszólaltatni az egyes magánhangzókhoz és zöngés mássalhangzókhoz hasonló hangzásokat. A gumitölcsérrel való manipulációkat a bal kéz tenyerével kell végezni.
A géppel leginkább zöngés hangokat lehet előállítani, a mássalhangzók közül a zárhangok is viszonylag elfogadható minőségben hozhatók létre. A palatális mássalhangzók azonban nehezen generálhatók. A gép az artikulációs mozgásokat hivatott utánozni mechanikus szerkezeteivel. Folyamatos beszéd a géppel nem állítható elő, hiszen az emberi beszédkeltés során másodpercenként 13-16 hangot képezünk. Belátható tehát, hogy Kempelen mechanikus szerkezetével ilyen mozgássorozatot nem lehet végrehajtani. A géppel szótagokat viszonylag jó minőségben lehet előállítani (kellő gyakorlás után), és előállíthatók rövid szavak is.
Kempelen Farkas beszélőgépét (1791-es leírása lapján) 2001-ben rekonstruálták és megépítették Budapesten. A rekonstrukció Kempelen Farkas 1791-ben kiadott könyve "Mechanismus der menschlichen Sprache nebst Beschreibung seiner sprechenden Maschine" (mit XXVII Kupfertalen) magyar nyelvű változata "Az emberi beszéd mechanizmusa, valamint a szerző beszélőgépének leírása" (XXVII metszeti rajzzal) alapján, valamint a müncheni Deutsches Museumban és a bécsi Hochschule für angewandte Kunstban végzett tanulmányok felhasználásával készült. A rekonstrukció tervezői és kivitelezői: Nikléczy Péter és Olaszy Gábor fonetikusok (MTA Nyelvtudományi Intézet, Kempelen Farkas Beszédkutató Laboratórium). A rekonstruált géppel 1791-es technológiával lehet beszédhangokat, szótagokat, rövid szavakat előállítani.
A világon az első szövegfelolvasó gép szabadalmát szintén magyar feltaláló, dr.Bánó Miklós okl. mérnök és közgazdasági mérnök adta be 1916-ban Budapesten.
Betű szerinti részlet a szabadalmi leírásból:
"Jelen találmány szerint ugyanis a nyelv egyes hangjait külön-külön fölvevő készüléken, pld. diktafon hengeren rögzítjük, ahol is annyi hengert használunk, ahány hang (vagy hangcsoport) van a nyelvben. Miután minden hengeren egy hang van rögzítve, természetes, hogy az bármely helyén, rövidebb vagy hosszabb ideig megszólaltatva, mindig ugyanazt a hangot (vagy hangcsoportot) adja vissza. Az egyik hengeren pld. az (r) , a másikon (ó), harmadikon a (zs), a negyediken az (a) hang van rögzítve. Ha tehát a megadott sorrendben szólaltatom meg az egyes hengereket, akkor a visszaadott (r, ó, zs, a) hangok egymásutánja a "rózsa" szóvá folyik össze. Ily módon megfelelő számú hanghenger (vagy hanglemez) elrendezése esetén tetszőleges szavakat és ezeknek megfelelő szünetek közbeiktatása utáni visszaadásával tetszőleges szöveget adhatunk vissza. Írógéppel kapcsolva a vázolt berendezést, az máris alkalmas arra, hogy a világtalan gépíró hallgassa a leírt szövegeket, a néma gépíró pedig a berendezés segélyével hangosan közölhesse mondanivalóját. Amit eddigelé a diktafonról mondtam, a mindenben áll a grammofon és más élőbeszéd visszaadására alkalmas készülékre is."
A tényleges szövegolvasók kifeljesztésére a 20. század második felében, a számítógépek fejlődése adta meg az igazi lökést.
A HUNGAROVOX magyar szövegfelolvasó (1982)
A HUNGAROVOX volt az első magyar nyelvű számítógépes szövegfelolvasó rendszer, amelyet az MTA Nyelvtudományi Intézetének Fonetikai Laboratóriuma fejlesztett ki 1980-82 között. A rendszer PDP11/34 típusú DEC gyártmányú számítógépből, a szövegfelolvasást vezérlő szoftverből és a VOX 12 beszédszintetizátorból állt.
A HUNGAROVOX magyar szolgálati szabadalom (1982. május 5.).
A rendszer tervezői és fejlesztői: Olaszy Gábor villamosmérnök, fonetikus; Kiss Gábor programozó matematikus; Nikléczy Péter elektrotechnikus, fonetikus.
A beszédelőállítás módszere: fonetikai szabályrendszerrel és hangszelettárral működtetett formánsszintetizátor.
A beszédépítéshez használt elemek: beszédhangnál rövidebb hangszeletek
A hangszeletek száma: 360
Memóriaigény: 150 kByte
Első bemutatás: 1982. május 6. a 8. Akusztikai Kollokviumon, Budapesten
Nyilvános bemutatás: 1983. tavaszán a BNV-n az MTA pavilonjában
A Hungarovox szabadalmát 1983-ban a Budapesti Elektroakusztikai Gyár megvásárolta.
Az előállított beszéd jellemzői
Hangszínezet: normál, rekedt, suttogó
Hangtípus: férfi
Hangmagasság: változtatható
Beszédsebesség: változtatható
Természetesség: szintetikus hang, robotos hangzású
Érthetőség: rövid hozzászokás után jól érthető
Magyarországon a 1980-as évektől kezdve aktív kutató munka folyt a szöveg-beszéd átalakítók megalkotására. Ennek egyik motorja az MTA Nyelvtudományi Intézet Fonetikai laboratóriuma volt. Itt végezték az alapkutatásokat. A másik komoly kutató és fejlesztő intézmény a Budapesti Műszaki Egyetem jelenlegi Távközlési és Telematikai Tanszéke és jogelődei. MTA Nyelvtudományi Intézetének Fonetikai Laboratóriumában készítették el az első magyar nyelvű elektronikus szöveg-beszéd átalakító rendszert, amelyet HUNGAROVOX néven mutattak be 1983-ban. A rendszerben működő analóg áramkörökből felépített beszédszintetizátort (VOX-12) egy PDP-11/34-es DEC gyártmányú számítógéppel vezérelték. Ekkor a világon csak angol és svéd nyelvű hasonló rendszer működött.
A magyar fejlesztések nem álltak le, az elkövetkező évtizedben az MTA és a Budapesti Műszaki Egyetem összefogásával több digitális elvű beszédszintetizáló rendszert fejlesztettek ki és építettek meg, amelyeknek a hangminősége egyre javult. Ezekben a rendszerekben először a formánselvű MEA8000, majd ennek utódja a PCF8200 szabadon programozható szintetizátor-chip szolgált a beszédhangok előállítására. Ezek a rendszerek dallamos beszédet szolgáltattak, azonban a beszéd hangszínezete gépies volt. 1987-ben került kereskedelmi forgalomba (gyártó: Megamicro Kisszövetkezet) az első ilyen magyar nyelvű beszédszintetizátor, amelyiket Commodore-64 számítógéppel lehetett használni.
A szabad programozási lehetőséget kihasználva a Fonetikai Laboratóriumban kialakították a német, finn, eszperantó, holland, spanyol és olasz beszéd szintéziséhez szükséges szabályrendszereket, így a 90-es évekre a BME TTT-vel közös munkában megszületett a MULTIVOX több nyelvű beszédszintetizáló rendszer, amelyik ugyanazon a beszédszintetizátor áramkörrel, csupán a vezérlő szoftver átkapcsolásával tudott a fenti nyelvek bármelyikén megszólalni.
A 80-as évek végén Király József fizikus készített egy olyan beszédszintetizátort, amelyben a beszédet emberi hangból kivágott hullámforma részletekből állította össze (PC Talker). Ez monoton hangzású, kissé torz beszédet adott (ebben az időben még nem voltak hangkártyák).
1994-ben a NIKOL Gmk kifejlesztette a PC-ROBOT elnevezésű, PC-be dugható beszédszintetizátor-kártyát. Ez volt az első kereskedelemben is kapható PC-ben használható magyar szövegfelolvasó. Ilyen kártyákat használtak sok éven keresztül számos ipari vezérlő rendszerben, a változó tartalmú üzenetek beszéddel való megszólaltatására.
A 90-es évek közepétől a fejlesztési irány egyre inkább a tisztán szoftver alapú és emberi hangból építkező, a hangkártyákat, mint megszólaltató eszközöket felhasználó beszédszintetizátorok felé fordult. A Budapesti Műszaki Egyetem Távközlési és Telematikai Tanszékén kifejlesztették a PCF 8200 chip-nek megfelelő szoftver alapú szintetizátort, így a MULTIVOX rendszer hardverfüggetlenné vált. Ennek a rendszernek a magyar szövegfelolvasó szoftver legkésőbbi változata (1999) 2002-től ingyenesen hozzáférhető az Informatikai Kormánybiztosságtól, és felhasználható a legkülönfélébb fejlesztésekre bárki számára.
A legújabb szövegfelolvasó fejlesztéseknél azt a célt tűzték ki a kutatók egyrészről, hogy a szintetizált beszéd minél jobban közelítse meg az emberi beszéd hangzását, másrészről pedig, hogy hosszú szövegek felolvasásánál (például regények, elbeszélések, könyvismertetők stb.) a szintetizált beszéd dallama, ritmusa, hangsúlyozása egyre természetesebb legyen. Ilyen kutató munka eredménye a Profivox elnevezésű magyar nyelvű professzionális szövegfelolvasó, amelyik 1999-ben készült el, és azonnal üzembe állították egy olyan mobil telefonos szolgáltatásban (Mail mondó) amelyben a felhasználó meghallgathatta az elektronikus leveleinek (e-mail) szövegét. A Profivox II., a továbbfejlesztett változat már regények, könyvismertetők stb. felolvasására is alkalmas. A rendszer értelmezi a könyv szövegét, megvalósítja a legfontosabb hanglejtési formákat és ritmikus, többnyire korrektül hangsúlyozott kellemes hangzású beszédet szolgáltat.
A Profivox II. magyar szövegfelolvasó méltó utódja Kempelen mechanikus gépének.