100 likes | 228 Views
Voice activity detection from gaze in video mediated communication. Michal Hradis , Shahram Eivazi , Roman Bednarik. Vysoké učení technické v Brně , Fa kulta informačních technologií v Brně Bo ž et ě chova 2, 612 66 Brno zemcik , ihradis , herout @ fit.vutbr.cz 2 . 12 . 2010. Data.
E N D
Voice activity detection from gaze in video mediated communication Michal Hradis, ShahramEivazi, Roman Bednarik Vysoké učení technické v Brně, Fakulta informačních technologií v Brně Božetěchova 2, 612 66 Brno zemcik,ihradis,herout@fit.vutbr.cz 2.12.2010
Data Záhlaví (99.99.9999)
Úloha • Pro každého účastníka určit, jestli mluví. • Pouze na základě pohledových dat. Záhlaví (99.99.9999)
Přístup • SVM klasifikátor • RBF jádro • mluví x nemluví • zvlášť pro každého účastníka • příznaky z krátké minulosti extrahované zvlášť pro každého účastníka Záhlaví (99.99.9999)
pohledová data anotace - predikce • počet fixací • průměrná délka fixace • průměrná vzdálenost fixací okno + počet lidí, na které se podíval ostatní lidi člověk zájmu vše ostatní Záhlaví (99.99.9999)
Výsledky • BaselineEER =28 % • Spojená okna 200 ms, 400 ms, 600 ms a 800 ms • Lineární 13 % • RBF 11% pohledová data anotace - predikce okna 1, 2, 3 Záhlaví (99.99.9999)
D-META evaluace(http://d-meta.inrialpes.fr/) • Task: Conversationalengagementprediction • Aktuálně se připravuje Call forpapers (konference je v US ) • Určení úrovně zapojení člověka ve vedlejší místnosti do konverzace: • No interest, Following, Responding, Conversing, Influencing, Managing • Předběžné termíny: • 19-Mar-2012 Data set annotation is released • 31-Jul-2012 Paperdeadline • 24-Aug-2012 Authornotiffication • 14-Sep-2012 Camera-ready • Oct-2012 Workpresented atD-META'12 Záhlaví (99.99.9999)
RBM – restrictedboltzmanmachine h v Záhlaví (99.99.9999)
Nápověda tagů (TRECVID) Záhlaví (99.99.9999)
CRBM – conditional RBM h c v Záhlaví (99.99.9999)