110 likes | 292 Views
ATraNoS. Workshop 17 september 2004 Patrick Wambacq. ATraNoS = Automatische Transcriptie en Normalisatie van Spraak. Doelstellingen: transcriptie van spontane spraak conversie van deze transcripties volgens de noden van de gebruikers, bv. ondertiteling. Spraakherkenningsproblemen.
E N D
ATraNoS Workshop 17 september 2004 Patrick Wambacq
ATraNoS = Automatische Transcriptieen Normalisatie van Spraak • Doelstellingen: • transcriptie van spontane spraak • conversie van deze transcripties volgens de noden van de gebruikers, bv. ondertiteling ATraNoS workshop Antwerpen 17 september 2004
Spraakherkenningsproblemen moeilijkheids- graad Spreekstijl spontaan Natuurlijke conversatie vloeiend Dialoog- systemen Kantoor- toepassingen voorgelezen Name dialing Directory assistance verbonden Spraak commando’s geïsoleerd Vocabularium grootte 10 100 1000 10000 100000 ATraNoS workshop Antwerpen 17 september 2004
Benchmarks mens vs. computer ATraNoS workshop Antwerpen 17 september 2004
ATraNoS architectuur module samengestelde woorden akoestisch model lexicon statistische ondertiteling woorden audio audio segmentatie spraak spraak decoder ondertitel combinatie P2G convertor fonemen regel- gebaseerde ondertiteling betrouwbaarheid detectie haperingen taalmodel ATraNoS workshop Antwerpen 17 september 2004
Partners en Werkpakketten • WP1: segmentatie van audiostroom in homogene segmenten: Universiteit Gent, ELIS • WP2: behandeling van OOV woorden: • P2G converter: Universiteit Antwerpen, Centrum voor Nederlandse Taal en Spraak (CNTS) • samengestelde woorden: K.U.Leuven, Centrum voor Computerlinguïstiek (CCL) • betrouwbaarheidsmaten: K.U.Leuven, ESAT ATraNoS workshop Antwerpen 17 september 2004
Partners en Werkpakketten • WP3: spontane spraak problemen: • detectie van haperingen (ELIS) • statistisch taalmodel (ESAT) • WP4: ondertiteling: • statistische ondertitelingsmodule (CNTS) • linguïstische ondertitelingsmodule (CCL) ATraNoS workshop Antwerpen 17 september 2004
Programma van vandaag 9u30: onthaal 10u: inleiding en overzicht: Patrick Wambacq 10u30: segmentatie van audio en detectie van haperingen in spraak: Jean-Pierre Martens, Frederik Stouten, An Vandecatseye 11u45: automatische transcriptie van spraak: Jacques Duchateau 12u30: lunch 14u: behandeling van spontane spraakfenomenen: Frederik Stouten, Jacques Duchateau 14u45: automatische generatie van ondertitels: Erik Tjong Kim Sang, Vincent Vandeghinste 15u45: conclusies en afsluiting: Patrick Wambacq 16u15: borrel ATraNoS workshop Antwerpen 17 september 2004
Conclusies • wetenschappelijke vooruitgang geboekt • doelstellingen van het project zijn gehaald: • deliverables zijn er allemaal • disseminatie en valorisatie verlopen vlot • goede samenwerking tussen partners leidt tot nieuwe gezamenlijke activiteiten ATraNoS workshop Antwerpen 17 september 2004
Disseminatie • tot nog toe 25 artikels in CLIN(01, 02, 03), ICSLP(02, 04), ROBUST04, ACL04, LREC(02, 04), ASRU(01, 03), EuroSpeech03, CoNLL(02, 03), ICASSP02, JMLR02 • artikels te vinden op website,http://atranos.esat.kuleuven.ac.be ATraNoS workshop Antwerpen 17 september 2004
Valorisatie • resultaten of delen ervan worden gebruikt in heel wat projecten van de projectpartners • MUSA, CALL, FLaVoR, METIS II, ONTOBASIS, PASCAL network, SPACE (?), Stevin programma (??) • specifiek voor ondertiteling: MUSA (EU 5e kader) met partners ILSP, Systran, BBC, LCC, CNTS, ESAT, zie http://sifnos.ilsp.gr/musa ATraNoS workshop Antwerpen 17 september 2004