80 likes | 184 Views
Aki még nem hallott mesterségesen generált beszédet azt kérdezi, hogy: Miben különbözik a Világhalló és a beszédszintetizátor? Hasonlat: A beszédszintetizátor a motor, a Világhalló a karosszéria. Aki már hallott beszédszintetizátort beszélni azt kérdezi, hogy:
E N D
Aki még nem hallott mesterségesen generált beszédet azt kérdezi, hogy: Miben különbözik a Világhalló és a beszédszintetizátor? Hasonlat: A beszédszintetizátor a motor, a Világhalló a karosszéria. Aki már hallott beszédszintetizátort beszélni azt kérdezi, hogy: Miben különbözik a Világhalló és egy képernyőolvasó? Hasonlat: A képernyőolvasás az otthon főzés, a Világhalló az étteremben evés. Bemutatkozik a Világhalló
A Világhalló bemutatkozikannak aki még nem hallott mesterségesen generált beszédet Az elérhető szövegeket kombinált szöveg- és hangfolyamként juttatja el a hallgatóhoz (mint egy „szövegrádió”) egy speciális, erre a célra kifejlesztett hang-szöveg szinkronprotokoll (wow) segítségével. Ez biztosítja, hogy a szövegben navigálni, lapozni lehessen. Ez a megoldás szerzői jogi szempontból is előnyös, a szöveg nem jelenik meg önállóan.
A Világhalló bemutatkozikAnnak aki már hallott beszédszintetizátort • A VILÁGHALLÓ egy központilag menedzselt integrált online szolgáltatás • A szoftver-komponensek és az internetes szövegállomány változásainak követését és a rendszerbe építését a szolgáltató végzi: • A beszédgeneráló motor fejlettebb verzióra cserélése (pl. több hangszín, állítható sebesség), az újabb motorok (pl. idegennyelvű) beépítése, • Az elektronikus formában elérhetővé vált szövegek, szövegábrázolási standardok (pl. XML, TEI) használata, • Aszámítógépes nyelvi elemzés új eredményeinek felhasználása. • A tárolt szövegek a felolvasásra legalkalmasabb formátumra hozatala, függetlenül attól, hogy milyen formátumban érhetők el (HTML, ZIPHTML, TXT, ZIPTXT, MSWORD, RTF, XML, SGML) • A felolvasás szempontjából informatív, strukturális és nyelvi annotációk (ilyenek pl. a mondat, bekezdés, versszak, fejezet, stb. jelölések vagy az – akár ragozott - idegenszó illetve név helyes kiejtése). • Egy egységes közeget és vizuális információk nélkül is kezelhető felhasználói felületet biztosít. • Ez a felület személyre szabható, beállítható a legkedvezőbb megjelenés és a billentyűk, amikkel kezelni lehet. • A felhasználói beállítások megmaradnak, míg a folytonosan fejlődő alkalmazás minden bejelentkezésnél frissül (Webstart). A felhasználói beállítások közül az egyik legfontosabb a „KÖNYVJELZŐ” funkció, mely lehetőséget biztosít arra, hogy ott folytassuk a könyvet ahol abbahagytuk. (Egy átlagos méretű könyv felolvasása 12 órát venne igénybe.)
KLIENS A Világhalló rendszer komponensei VH SZERVER NYELVI ELEMZŐ PROFIVOX
1.) Indítható a program egy web oldalon elhelyezettlink segítségével, mely a VilágHalló szerver által már feldolgozott könyvre való hivatkozást tartalmaz. Ekkor a VilágHalló kliens automatikusan elindul a felhasználó számítógépén és elkezdi felolvasni a linkben hivatkozott szöveget. 2.) Elindítható a kliens számítógépen. Ekkor a felhasználói felület keresőés tallózófunkcióival választható ki a felolvasni kívánt könyv, ill. ennek valamely részlete, vagy folytatható a felolvasás a felhasználó által korábban letett könyvjelzők valamelyikétől . Verziók követésére a Java WebStartalkalmazás-menedzser rendszert használja A VilágHalló kliens felhasználói felülete konfigurálható a felhasználók igényeinek megfelelően. A konfigurálással a megjelenés (színek, betűméret, stb.), a felolvasás módja (részletesség, sebesség, szintetizátor) és a vezérlés (billentyűkombinációk) állítható be A VilágHalló kliens A kliens program fő feladata könyvek ill. hosszabb szövegek felolvasása. Kétféle módon használható
Web szerver Apache, Tomcat web és alkalmazás szerverek gondoskodnak a VilágHalló szerver oldali komponenseinek futtatásáról és weben keresztüli elérhetőségéről. ContentServlet A kliens programokat kiszolgáló egység. A felhasználók nyilvántartását, beléptetését, a könyvjelzők kezelését, a könyvek adatbázisában való keresést végzi és közvetít a hangszerver és a kliens között. JNLPServlet A kliens alkalmazás letöltését és frissítését végzi, valamint a gondoskodik az alkalmazásnak a hívási paraméterekkel történő indításáról. TTS szerver Egyszerű TCP protokollon keresztül teszi elérhetővé a MS Speech API-n keresztül plug-in-elt text-to-speech motort a ContentServlet számára A VilágHalló szerver Komponesek
A felolvasható szövegek gyűjteménye A VilágHalló rendszernek „saját gyűjteménye” van a felolvasható szövegekből. Az ide bekerülő szövegeket, könyveket egy előkészítő program dolgozza fel. Ez az előkészítés teszi lehetővé a felhasználók számára a könyvek keresését és a szövegben való navigálást valamint az értelmezett felolvasást. Előkészítő rendszer A könyv meta-adatainak és a szöveg forrásának a megadása és tárolása:A könyvet leíró XML állomány megadásával vagy az adatok közvetlen bevitelével. Ez biztosítja a felhasználók számára a keresés lehetőségét. A különböző típusú szövegek azonos alakra való konvertálása. (A szövegek lehetnek TXT, HTML, tömörített (zip-elt) TXT vagy HTML és XML formátumúak.) A szövegek strukturális feldolgozása Könyvek esetében ez a nyitólap, tartalom, fejezetek, stb. felismerését és a szerkezet adatbázisban való rögzítését jelenti. Ez teszi lehetővé a könyv szerkezeti elemein való navigálást. A szövegek nyelvtani feldolgozása Ez szótövelést, szófelismerést és mondatokra bontást jelent. Ez teszi lehetővé a szintetizátor meghajtását értelmes szintaktikus egységekkel, mely alapfeltétele a helyes intonációnak, a kivételszavak felismerését és helyes kiejtésük megállapítását, valamint a mondat-szintű navigálást a felolvasott szövegben. Nyelvi Elemző