90 likes | 230 Views
Bayerisches Archiv für Sprachsignale. Florian Schiel & Christoph Draxler schiel | draxler @bas.uni-muenchen.de Institut für Phonetik und Sprachverarbeitung Ludwig-Maximilians-Universität München http://www.bas.uni-muenchen.de/Bas. BAS Überblick. Motivation.
E N D
Bayerisches Archiv für Sprachsignale Florian Schiel & Christoph Draxler schiel | draxler @bas.uni-muenchen.de Institut für Phonetik und Sprachverarbeitung Ludwig-Maximilians-Universität München http://www.bas.uni-muenchen.de/Bas
BAS Überblick Motivation ELDA/LDC-Kataloge:85% aller deutschen Sprachkorpora20% aller deutschen Aussprachelexika
BAS Neueste Korpora Motivation
BAS Vision Motivation • Akuter Bedarf: Transnationales Corpus für Deutsch (TCD) • Vorbilder BNC (Großbritannien), CGN (Belgien/Niederlande) • Schweiz, Österreich, Deutschland, Luxemburg, Italien • Umfang • mindestens 10 Mio Wörter Sprachaufnahmen, davon • 1 Mio Wörter transliteriert/segmentiert • Terminologien/Ontologien für 10 Domänen • Organisation • Konsortium der beteiligten Staaten • öffentlich verfügbar • Finanzbedarf ca. 20 Mio EUR • Dauer 4 Jahre (+ 1 Jahr Planungsphase)
Ph@ttSessionz Motivation Sprachaufnahmen über das Internet • Training von Spracherkennungssystemen • Untersuchung regionaler Variation • 41 Schulen (Gymnasien) in Deutschland • 90 h Sprachdaten in hoher Qualität
BAS ALC Motivation • Kooperation mit Rechtsmedizin (LMU) • 150 Sprecher (75f+75m) alkoholisiert/nüchtern • Atemalkohol- und Blutalkoholtests • Sprachtypen: gelesen, Monolog, Dialog, Command&Control • Vision: automatische Detektion im Fahrzeug
BAS SmartWeb Motivation • Realistische Interaktion mit SmartPhone / PDA • Sprachgesteuerter Web-Zugriff vom fahrenden Motorrad • Triaden-Kommunikation: Mensch - Mensch - Maschine • OnFocus / OffFocus durch Gesichtsvideo
BAS SIGNUM Motivation • Erstes deutsches Gebärdensprachkorpus • Kooperation mit Universität Aachen • 25 Gebärder mit 450 Glossen und 780 'Sätzen' • 1 TByte Videodaten