220 likes | 352 Views
What the aibos could learn from the midsize league. Overview of past research activities at the University of Amsterdam. Speaker Jürgen Sturm. Overview. Midsize soccer league Onderzoek UvA 2000-2004 Team gebaseerde gedragsselectie Particle filters voor lokalisatie. Midsize league.
E N D
What the aibos could learn from the midsize league Overview of past research activities at the University of Amsterdam Speaker Jürgen Sturm
Overview • Midsize soccer league • Onderzoek UvA 2000-2004 • Team gebaseerde gedragsselectie • Particle filters voor lokalisatie
Team based Action planning Master project of Matthijs Spaan
Clockwork Orange Architecture Sense-Think-Act
Team based Action planning World model Robot, Teamgenoten Tegenstanders Bal Player skills: • Turn • Move • Dribble • Shoot • Seek • Chase
Team based Action planning • Het balbezit bepaald de team strategie • Wij balbezit → Attack • Zij balbezit → Defend • Niemand balbezit → Intercept • De team strategie is algemeen, oftewel hetzelfde voor alle teamgenoten
Team based Action planning Dynamische rolallocatie Om in te schatten wat de optimale rolverdeling is, zijn er verschillende evaluatie functies gemaakt, met als variabelen: • Tijd benodigd om bij de bal te komen • Huidige positie • Balbezit
Team based Action planning Resultaten • Team Strategie 2001 • Seattle 0-8 5-0 3-0 1-4 0-4 • Rolverdeling kwart-finale CS Freiburg
Team based Action planning Resultaten • Actieverdeling kwart-finale
Markov State • World States • Sensor Readings • Actions • Action Model • Sensor Model
Particle distribution Markov State Estimation • Markov State Estimation • Problem: how to represent efficiently a probability distribution? • Monte-Carlo solution
prior distribution Particle filtering • Particle filters is een Monte Carlo methode • Houdt een aantal hypothesen bij mbv particles • De waarschijnlijkheid distributie kan hierbij een willekeurige vorm hebben. apply action and sensor model select most likely hypothesis by random sampling on weight (posterior distribution)
Particle filtering • Particle Filter moet robuust zijn tegen verstoringen • Alle particles fout, sensor model correct (kidnap) • sensor model fout, particles correct (noise, outlier) • Allebei fout • Kidnapper-noise dilemma • Noise vaak tijdelijk gecorreleerd
Particle filtering • Solutions to the kidnapper-noise dilemma • Re-sample strategy • Re-sample all particles from scratch after a given period without overlap (“reset” by a watchdog) • Sample-from-likelihood • Sample part of the new particles directly from the sensor data
t: t+1: t+2: t+3: t+4: Particle filteringSolution: Coherence • initiëren rechtstreeks uit de metingen een kleine subset • nieuwe particle eigenschap: coherence • De nieuwe set van particles wordt samengesteld mbv de eigenschappen: • weight, likelihood en coherence • MaxCoherence kan gebruikt worden om het conservatisme in te stellen • Korte periode van twijfel bij consistente verstoringen
Particle filtering • Experimenten met een 1-D gesimuleerde omgeving • 3 scenarios • kidnap • Korte periode (4 tijdstappen) van consistent foute metingen • Langere periode (20 tijdstappen) van willekeurige foute metingen • 5 particle filter configuraties • normal • reinitialize • sample from likelihood • coherence with maxCoherence=5 • coherence with maxCoherence=15
Particle filteringResults • Coherence PF is nooit de slechtste oplossing • Het conservatisme is goed in te stellen met Cmax • Coherence PF test de consistentie van alternatieve hypothesen, en veranderd gelijkmatig zijn aannames
Conclusion • Robot toepassingen hebben vaak vergelijkbare problemen • Er is bij de UvA (en TUD) veel ervaring met problemen zoals: • Gedrag selectie en coördinatie • Lokalisatie