1 / 33

A látás számítástechnikai modelljei: Computational vision

A látás számítástechnikai modelljei: Computational vision. A látás problematikája. B ülthoff. Miért?. a világ 3D, a kép 2D a látott kép függ a kamerától (CCD, infra, BW) annak szenzitivitásától (felbontás, etc) megvilágítástól környezettől (köd, por etc)

tawana
Download Presentation

A látás számítástechnikai modelljei: Computational vision

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. A látás számítástechnikai modelljei:Computational vision

  2. A látás problematikája

  3. Bülthoff

  4. Miért? • a világ 3D, a kép 2D • a látott kép függ • a kamerától (CCD, infra, BW) • annak szenzitivitásától (felbontás, etc) • megvilágítástól • környezettől (köd, por etc) • a tárgy anyagának visszaverő képességétől (textura, szin etc) • Nagy mennyiségű info!

  5. Egy látórendszer feladatai • A világ, a tárgyak, képek leírása • Képfeldolgozás (fontos vonások kivonása) • Szegmentálás (körvonalak, régiók, területek elkülönítése) • Minta felismerés (egy tárgyat tartalmazó képek azonosítása) • Kép megértése (több tárgy esetén 3D modell elkészítése a világról) • Végső cél: a tárgyak, dolgok felismerése a képben

  6. Interpretáció, felismerés Alak azonosítás Szegmetálás 3D Fontos jellemzők kivonása Textura analízis Körvonal detekció

  7. V1 representation

  8. Do you really want to study vision?

  9. Parallel patways - monkey

  10. Computational Problems in Object Recognition • How to account for shape-based encoding? • Objects are more than the sum of their parts • Properties of object constancy • Viewing position • distance, size • orientation • Illumination, contrast, color • Occlusion • defining cue

  11. Computational Problems in Object Recognition • Frame of reference: object constancy across orientation • View-dependent • Separate representation of an object for each viewpoint • View-invariant • Critical properties/features used for object recognition • Major/minor axes, etc.

  12. Computational Problems in Object Recognition • Hierarchical coding hypothesis • Object defined by Gnostic (or grandmother) cell? single neuron that represents"granny" activated by outputs from increasingly more complex detectors. NO!

  13. The inferotemporal cortex Unimodal „end-station of object recognition pathway

  14. Tamura and Tanaka, 2001 Complex shapes

  15. Sugase et al, 1999 Faces

  16. Logothetis, 1996, Booth and Rolls, 1998 -viewpoint

  17. View-based recognition • Recognition of 3-D objects depends upon multiple, stored views of objects • Object recognition occurs when a current pattern matches a stored pattern

  18. FFA: „the one and only” • Often referred to as Fusiform Face Area (FFA) • Same location as face-specific cell responses • Near areas involved with color vision & achromatopsia cooccurs with prosopagnosia • A prosopagnosic showed no activity in FFA in response to faces • .Autists neither...

  19. What activates the FFA? • Kanwisher & her colleagues have probed the type of stimuli that activate this region • Strong response: Frontal shots, profiles, cartoon faces, inverted faces?!, inverted cartoon faces, cat faces, faces with no eyes, & eyes alone. • Weak response: Schematic faces, animal bodies, houses, back of head. • FFA appears broadly tuned

  20. Is it a category? • Simon says „no”

  21. only front views? • simon says „no” • Is it animate vs nonanimate? • simon says „no”

  22. Expert activations in the FFA • Greeble experts show activation in FFA whereas Greeble novices do not show significant activation • Greebles may be a “face” • Dog & Bird experts also show increased activity in the FFA. However, the activation is only half of that seen for faces • Imaging data is equivocal.

  23. Expertise and the FFA • expertise leads to specialisation of a given area, previously thought to be face specific!

  24. Unexpected ventral areas Parahippocampal place area (PPA) – responds to places fMRI has revealed several areas that have no clear monkey homologues PPA Preferred Epstein & Kanwisher, 1998 Nonprefer. Extrastriate body area (EBA) – responds to bodies EBA Preferred Downing et al., 2001 Nonprefer.

  25. EBA- human

  26. EBA/LOC FFA- PPA

  27. Another alternative • James Haxby, NIMH, Bethesda, MD • objectotopy • one back repetition detection for other views of faces houses manmade objects

  28. distinct pattern of activations for each category • overlapping, distributed.

  29. Distributed processing

  30. Conclusion- confusion • THUS: • 1. FFA- faces • 2. FFA- expertise • 3. What are you talking about? One ring above all-one area for all. VENTRAL OCCIPITO-TEMPORAL CORTEX

  31. A model summary

  32. Összefoglalás • erős hierarchia • növekvő komplexitás, RF • egyre nagyobb „hasonlóság a percepcióhoz” (invarianciák) • masszív parallellitás • eltérő tulajdonságok - eltérő rendszerek • szétosztott reprezentáció • flexibilitás, plaszticitás

  33. If our brain was simple we would be too simple to understand it. Mario Puzo

More Related