Dhruv Batra (Virginia Tech)

Overview of Challenge Aishwarya Agrawal(Virginia Tech) Stanislaw Antol(Virginia Tech) Larry Zitnick(Facebook AI Research) Dhruv Batra(Virginia Tech) Devi Parikh(Virginia Tech)

Outline • Overview of Task and Dataset • Overview of Challenge • Winner Announcements • Analysis of Results

VQA Task

VQA Task What is the mustache made of?

VQA Task AI System What is the mustache made of?

VQA Task AI System bananas What is the mustache made of?

Real images (from COCO) Tsung-Yi Lin et al. “Microsoft COCO: Common Objects in COntext.” ECCV 2014. http://mscoco.org/

and abstract scenes.

Questions Stump a smart robot! Ask a question that a human can answer,but a smart robot probably can’t!

VQA Dataset

Dataset Stats • >250K images (COCO + 50K Abstract Scenes) • >750K questions (3 per image) • ~10M answers (10 w/ image + 3 w/o image)

Two modalities of answering • Open Ended • Multiple Choice (18 choices) • 1 correct answer • 3 plausible choices • 10 most popular answers • Rest random answers

Accuracy Metric

Human Accuracy (Real)

Human Accuracy (Abstract)

VQA Challenges on www.codalab.org Real Open Ended Real Real Multiple Choice Abstract Open Ended Abstract Abstract Multiple Choice

Real Image Challenges: Dataset Dataset size is approximate

Real Image Challenges: Test Dataset • 80K test images • Four splits of 20K images each • Test-dev(development) • Debugging and Validation - unlimited submission to the evaluation server. • Test-standard(publications) • Used to score entries for the Public Leaderboard. • Test-challenge(competitions) • Used to rank challenge participants. • Test-reserve(check overfitting) • Used to estimate overfitting. Scores on this set are never released. Dataset size is approximate Slide adapted from: MSCOCO Detection/Segmentation Challenge, ICCV 2015

VQA Challenges on www.codalab.org Real Open Ended Real Real Multiple Choice Abstract Open Ended Abstract Abstract Multiple Choice

Abstract Scene Challenges: Dataset

Award GPUs!!!

Abstract Scene Challenges • Open-Ended Challenge • 5 teams • 5 institutions • 3 countries • Multiple-Choice Challenge • 4 teams • 4 institutions • 3 countries • Top 3 teams are same for Open Ended and Multiple Choice

Abstract Scene Challenges Winner Team MIL-UT Andrew Shin* Kuniaki Saito* Yoshitaka Ushiku Tatsuya Harada Open Ended Challenge Accuracy: 67.39 Multiple ChoiceChallenge Accuracy: 71.18

Real Image Challenges • Open-Ended Challenge • 25 teams • 26 institutions • 8 countries • Multiple-Choice Challenge • 15 teams • 17 institutions • 6 countries • Top 5 teams are same for Open Ended and Multiple Choice

Real Image Challenges Honorable Mention Brandeis Aaditya Prakash Open Ended Challenge Accuracy: 62.80 Multiple Choice Challenge Accuracy: 65.17

Real Image Challenges Runner-Up Team Naver Labs Hyeonseob Nam JeongheeKim Open Ended Challenge Accuracy: 64.89 Multiple ChoiceChallenge Accuracy: 69.37

Real Image Challenges Winner Team UC Berkeley & Sony Akira Fukui Dong HukPark Daylen Yang Anna Rohrbach Trevor Darrell Marcus Rohrbach Open Ended Challenge Accuracy: 66.90 Multiple ChoiceChallenge Accuracy: 70.52

Real Open-Ended Challenge arXiv v6 ICCV15

Real Open-Ended Challenge +12.76% absolute

Statistical Significance • Bootstrap samples 5000 times • @ 99% confidence

Real Open-Ended Challenge

Easy vs. Difficult Questions (Real Open-Ended Challenge)

Easy vs. Difficult Questions (Real Open-Ended Challenge) • 80.6% of questions can be answered by at least 1 method! Difficult Questions

Easy vs. Difficult Questions (Real Open-Ended Challenge) Easy Questions Difficult Questions

Difficult Questions with Rare Answers

Dhruv Batra (Virginia Tech)

Dhruv Batra (Virginia Tech)

Presentation Transcript

Virginia Tech Hokies vs St Bonaventure Bonnies Live NCAA Bas

Virginia Tech AE

BizWatts Introduction

Virginia Tech Crisis

Michael Castelhano, Virginia Tech Jeffrey Alwang, Virginia Tech Ruben Botello, PROINPA, Bolivia Nick Kuminoff, Virginia

Stormwater Control Infrastructure and Residential Property Values

Virginia Tech E-portfolio Systems Development

Why is water quality important??

Virginia tech Massacre

Wireless @ Virginia Tech wireless.vt

High-Level Programming Issues for Reconfigurable Computing Systems

Virginia Tech massacre

Virginia Tech University

Virginia Tech (Ut Prosim= That I may serve!)

HokieMart On-line Training Module Revised 07-29-13

Erin Crede, Virginia Tech Maura Borrego, Virginia Tech Elizabeth Creamer, Virginia Tech

Low-complexity Scheduling for Wireless Networks

Computational Modeling Capabilities for Neutral Gas Injection

Virginia Tech 2008

Virginia Bioinformatics Institute Virginia Tech

Computational Modeling Capabilities for Neutral Gas Injection

Virginia Tech