280 likes | 455 Views
E-levél felolvasó esettanulmány. Beszédinformációs rendszerek előadás Németh Géza, Zainkó Csaba [nemeth, zainko ] @ttt.bme.hu Beszédkutatási laboratórium htt p://speechlab.ttt.bme.hu. Távközlési példa Honnan. PSTN. Távközlési példa Hova ..... ?. ?. Beszéd -keltés -szintézis
E N D
E-levél felolvasóesettanulmány Beszédinformációs rendszerek előadás Németh Géza, Zainkó Csaba [nemeth, zainko]@ttt.bme.hu Beszédkutatási laboratórium http://speechlab.ttt.bme.hu
Távközlési példaHova ..... ? ? Beszéd -keltés -szintézis -felismerés -megértés Dialógus vezérlés CTI PSTN (Mobil, WEB..) LAN
Ötlet • E-levél felolvasó ötlete: Egy reális alkalmazási környezet fejlesztése TTS fejlesztéshez BME 1994 • Szakiránylabor, Önállólabor, Diplomaterv más projektek keretében kialakult egy bemutatható rendszer 1999-re
Indok • TTS értékelés önmagában nehéz • Siemens - Bonni egyetem (1999): nincs 'élesben' elfogadható német TTS6 TTS rendszert 45 diák tesztelt 45 perces ülésekben (1-6) • téma: menetrend, emil/fax olvasás, felhaszn. utasítás, újságolvasás • legjobb osztályzat: 3 körül, de témától nagyon függ • KPN holland emil-felolvasó teszt (2 gyártó) • DTMF <-> besz. felism, prompt <-> TTS • vélemény: nem használható • BME-TTT ???
Demórendszer • 4 csatornás • Formáns szintetizátoros • Adminisztrációs felület nélküli • „Kiteszteletlen” • Nagy erőforrás-igényű (méretéhez képest) • Speciális működési környezet (csak ftp)
Igényfelmérés • Demó bemutatása ipari felhasználó részére • Az adott rendszer ipari felhasználásra alkalmatlan volt • Nem az adott rendszert bemutatása a fő cél, hanem a technológiai szint ismertetése
"Éles" rendszer fejlesztési lépései • Demo rendszer bemutatása a partnernek • Ütemek és elfogadási sarokpontok meghatározása • Tesztrendszer belső használatra • Tesztrendszer szűkkörű használatra • Végleges rendszer
Fejlesztéshez kapcsolódó projektek • Nyelvdetekció • Ékezetesítés • TTS fejlesztés • Formáns • Hullámforma alapú • Hullámforma alapú, adott rendszerre való optimalizálása • Telefonos interfész, CTI
Miért kell? Gyors, hatékony Statisztikai alapon 3 nyelv azonosítása Nyelvdetekció
Miért kell? Miért nehéz? |m|e|g|b|i|z|h|a|t|o|s|a|g|a | |2| | |2| | |2| |4| |2| |2 27 lehetségesalak agyat ágyat agyát ágyát Ékezetesítés
Statisztikai alapú Nyelvtan alapú Kombinált Azonos csonkolt alakkal rendelkező szavak száma Ékezetesítés II.
Dialógus tervezés • 3 felhasználói kategória szerinti felvett rendszerüzenetek 2 hangon • (kezdő, tapasztalt, szakértő) • félbeszakítható szöveg és előre beírható kód • egybillentyűs navigáció, 3x ismétlés • 'globális' parancsok • 0: környezet függő súgó, *: vissza, 5: szünet/konfig • azonosítás több típusa • több nyelv figyelembe vétele
Ipari felhasználás • Távoli adminisztráció • Távoli felügyelet • Riasztás • Önteszt, megbízhatóság növelése • Robosztus megoldások • Tartalék rendszer (langyos) • Rugalmas bővíthetőség
Tesztelés folyamata • 2 rendszer • ipari partnernél • saját laborban • A projekt elején a funkcionális teszten van a hangsúly • Projekt végén a hibamentes működés
Kapcsolatok más rendszerekkel • Email szerver • Központi felügyelet • Ügyfélszolgálati rendszer • Hálózati kapcsolat • Informatika/Fejlesztés
Üzemviteli támogatás • Folytonos monitorozási lehetőség • Automatikus hibajelentés
Érintett vállalati osztályok • Ipari partner: • informatika • üzletfejlesztés • üzemeltetés • ügyfélszolgálat • minőségbiztosítás Mindegyiknek más volt az érdeke cégen belül.
Prioritások összetettsége • Minden osztálynak más a fontos • Ügyfélszolgálat: a problémás esetek számát kívánja csökkenteni (jobb tájékoztatás, részletes segítség. • Üzletfejlesztés/Marketing: A cég koncepciójába beilleszteni a rendszert • Üzemeltetés: Egyszerű rendszer, kevés hibalehetőséggel, nagy fokú automatizmus • ...
Szerződéskötés • Tartalma: • Technikai tartalom • Finanszírozási kérdések • Ütemezés, határidők • Aláírók: • Megfelelő szintű és jogosultságú személyek • Jogi osztály beleszólása