80 likes | 278 Views
Nuance i Göteborg. Nuance workshop Sthlm 3/6 2002. Användningar. dialogsystem: GoDiS moduler för att koppla Nuance till TrindiKit flera språk nu: svenska, engelska flera domäner resebyrå, video, hemassistent. Vad vi har gjort. handkodade grammatiker jobbigt!
E N D
Nuance i Göteborg Nuance workshop Sthlm 3/6 2002
Användningar • dialogsystem: GoDiS • moduler för att koppla Nuance till TrindiKit • flera språk • nu: svenska, engelska • flera domäner • resebyrå, video, hemassistent
Vad vi har gjort • handkodade grammatiker • jobbigt! • växla grammatik under dialogen • växla språk under dialogen • timeout • om användaren ej säger något inom N sekunder återtar systemet turen • positiv eller negativ feedback inom 2 sek • U: Flyg till Paris • S: OK, flyg. • U: - / Ja / Nej • S: Till Paris. / Inte flyg. Så hur vill du resa?
problem • ljudkort – dålig dokumentation om vad som egentligen krävs. • speciellt problem med laptops; Extigy lösningen? • barge-in kräver IP-telefoni (eller telefonkort) –omständigt att utforska detta. • licens: 1 recserver samt 2 recclients. problematiskt i flerspråkigt dialogsystem • etc…
framtida forskning • automatgenerera grammatiker • från typteoretiska grammatiker (Grammatical Framework - Ranta) • från särdragsgrammatik (HPSG) – Ginzburg • från VoiceXML (extrahera) • statistiska språkmodeller • utifrån inspelad korpus
parallella igenkännare • t ex global och lokal grammatik • global: allt som anv. kan säga • lokal: svar på aktuella frågor • alt: dynamisk viktning • flexibel turtagning • asynkron dialoghantering • enkel barge-in är inte optimalt • systemet behöver hålla reda på när användaren avbryter, vad systemet hunnit säga, etc. • igenkänning av betoning • hitta betonade ord; ev. egen modul oberoende av Nuance
koppla till telefonnätet • har testat IP-telefoni • få in i handdator • utforska semantik i Nuance • nu: separat tolkningsmodul • talarspecifik igenkänning • bootstrap från talaroberoende • [finns stöd i Nuance!?]
anteckningar • h323 för linux: openh323.org • brygga IP – vanlig telefon • kräver kort för 1000:- • voicexml-konvertering generellt