100 likes | 232 Views
NADIA Workshop. Folien MMK. Übersicht. Modelle Dekodertechnologie Modellerzeugung Vorversuch Stand eigener Erkenner TODOs. Spracherkennung. Sprachmod. Lexikon. akust. Mod. Dekoder. Wortkette. Sprachsignal. Modelle. Sprachmodell: beschreibt Wortübergänge
E N D
NADIA Workshop Folien MMK
Übersicht • Modelle • Dekodertechnologie • Modellerzeugung • Vorversuch • Stand eigener Erkenner • TODOs
Spracherkennung Sprachmod. Lexikon akust. Mod. Dekoder Wortkette Sprachsignal
Modelle • Sprachmodell: beschreibt Wortübergänge • Lexikonbeschreibt Phonemübergänge • akustische Modellebeschreiben physikalische Parameter der Phoneme
Dekodierungbedeutet optimale Zuordnung über alle Ebenen will Sprachmod. ich v I l Lexikon I x ak. Modell Sprachsignal
Erkennungsergebnis • 1-best: eine einzige optimale Zuordnung • N-best-sentences: Liste der N besten Äußerungen • N-best-words: Worthypothesengraph durch Betrachtung der N besten Möglichkeiten an jedem Wortübergang
Modellgewinnung • Sprachmodell: aus der Korpusorthographie, z.B. bei N-Gramm Wortfolge • Lexikon: aus Wortliste der Korpus-orthographie + Aussprache-Varianten • akust. Modelle: aus Phonemfolgen aller Korpusäußerungen (rekonstruierbar aus Orthographie + Lex. mit Ausspr.-Var.)
Vorversuch • Göteburgverschriftung → orthogr. Korpus (mit trans.pl) • Korpuswortliste → Lexikon • orthogr. Korpus → Bigrammsprachmodell • zusammen mit akust. Modellen aus Verbmobil → Worthyp.-Graphen • Test Adaption der akust. Modelle
Stand Erkenner • hierarchische Sprachmodelle • keine Aussprachevarianten • 1-best Dekodierung • nicht optimiert • bis jetzt mit ca. 4000 Kodezeilen überschaubar
TODOs • Architektur • N-best-words Algorithmus implementieren • Aussprachevarianten • Performance-Optimierung • Testsuite aufbauen • Programmierschnittstelle zu CLT • Modellerstellung • optimierte akustischer Modelle • Sprachmodelle für Sprachverstehen