610 likes | 623 Views
This presentation explores the goal of recovering 3D structure using geometric vision techniques. It discusses the inherent ambiguity of structure and depth from single views and examines various cues in the image that allow us to overcome this ambiguity.
E N D
Stereo Vision • Presented by: HadarElor
מבוסס על השקפים של טל הסנר Geometric vision • Goal: Recovery of 3D structure • Structure and depth are inherently ambiguous from single views.
Geometric vision • Goal: Recovery of 3D structure • What cues in the image allow us to do this? Slide credit: Svetlana Lazebnik
Shading [Figure from Prados & Faugeras 2006]
Focus/defocus Images from same point of view, different camera parameters 3d shape / depth estimates [figs from H. Jin and P. Favaro, 2002]
Texture [From A.M. Loh. The recovery of 3-D structure using visual texture patterns. PhD thesis]
Perspective effects Image credit: S. Seitz
Motion Figures from L. Zhang http://www.brainconnection.com/teasers/?main=illusion/motion-shape
Estimating scene shape “Shape from X”: Shading, Texture, Focus, Motion… Stereo: shape from “motion” between two views infer 3d shape of scene from two (multiple) images from different viewpoints Main idea: scene point image plane optical center
Geometry for a Simple Stereo System • First, assuming parallel optical axes, known camera parameters (i.e., calibrated cameras): B. Leibe Slide credit: Kristen Grauman
World point Depth of p image point (left) image point (right) Focal length optical Center (right) optical center (left) baseline B. Leibe Slide credit: Kristen Grauman
Geometry for a Simple Stereo System • Assume parallel optical axes, known camera parameters (i.e., calibrated cameras). We can triangulate via: Similar triangles (pl, P, pr) and (Ol, P, Or): disparity B. Leibe Slide credit: Kristen Grauman
Disparity ועומק מרחק מהמצלמות (depth) הבדל במיקומי הנקודה בתמונות (disparity) מצלמות disparity
Depth From Disparity Image I(x,y) Disparity map D(x,y) Image I´(x´,y´) (x´,y´)=(x+D(x,y), y) B. Leibe
General Case With Calibrated Cameras • The two cameras need not have parallel optical axes. vs. B. Leibe Slide credit: Kristen Grauman, Steve Seitz
Stereo Correspondence Constraints • Given p in the left image, where can the corresponding point p’ in the right image be? B. Leibe Slide credit: Kristen Grauman
Stereo Correspondence Constraints • Given p in the left image, where can the corresponding point p’ in the right image be? B. Leibe Slide credit: Kristen Grauman
Stereo Correspondence Constraints B. Leibe Slide credit: Kristen Grauman
epipolar line epipolar line epipolar plane Stereo Correspondence Constraints • Geometry of two views allows us to constrain where the corresponding pixel for some image point in the first view must occur in the second view. • Epipolar constraint: Why is this useful? • Reduces correspondence problem to 1D search along conjugate epipolar lines. B. Leibe Slide adapted from Steve Seitz
Epipolar Geometry • Epipolar Plane • Baseline • Epipoles • Epipolar Lines Slide adapted from Marc Pollefeys
Example B. Leibe Slide credit: Kristen Grauman
For a given stereo rig, how do we express the epipolar constraints algebraically? B. Leibe
בניית המטריצה ההכרחית • נגדיר • עבור מטריצת סיבוב R, הקשר בין מיקום P במערכת הקואורדינטות השמאלית לימנית הוא: מישור אפּי-פולרי
Rotation Matrix Express 3d rotation as series of rotations around coordinate axes by angles Overall rotation is product of these elementary rotations: Slide credit: Kristen Grauman
בניית המטריצה ההכרחית • שלושת הוקטורים , ו- נמצאים על אותו המישור: המישורהאפיפולרי מישור אפּי-פולרי
Cross Product & Dot Product • Vector cross product takes two vectors and returns a third vector that’s perpendicular to both inputs. • So here, c is perpendicular to both a and b, which means the dot product = 0. Slide credit: Kristen Grauman
בניית המטריצה ההכרחית • שלושת הוקטורים , ו- נמצאים על אותו המישור: המישורהאפיפולרי • הוא וקטור הניצב למישור • מכאן: • היות ו- • אזי: • נציב במשואה ונקבל: מישור אפּי-פולרי
Matrix Form of Cross Product Slide credit: Kristen Grauman
בניית המטריצה ההכרחית • נשכתב באמצעות כפל מטריצות • נגדיר • ונקבל: • המטריצה E נקראת המטריצה ההכרחית(Essential Matrix) מישור אפּי-פולרי
המטריצה ההכרחית • היות ונקודות במישורי התמונות נתונות בקואורדינטותהומ', נחליף P ב- p (שכן זהות עד לכדי כפל בקבוע) • הואישר במישור התמונה הימנית אשר מובטח כי מכיל את הנקודה • E שימושית כאשר נתונות לנו קואורדינטות נקודות במישור התמונה. • לנו יש קואורדינטות פיקסלים בתמונה...
המטריצה היסודית • מטריצה היסודית Fundamental Matrix F • דומה באופייה למטריצה היסודית אך הפעם ו- בקואורדינטות פיקסלים • עבור ו- מטריצות פנימיות של שתי המצלמות • חישוב המטריצה היסודית באמצעות "אלג' שמונה הנקודות"
Fundamental matrix • Relates pixel coordinates in the two views • More general form than essential matrix: we remove need to know intrinsic parameters • If we estimate fundamental matrix from correspondences in pixel coordinates, can reconstruct epipolar geometry without intrinsic or extrinsic parameters Grauman
Computing F from correspondences Cameras are uncalibrated: we don’t know E or left or right Mint matrices Estimate F from 8+ point correspondences. Grauman
Computing F from correspondences Each point correspondence generates one constraint on F We can re-write as: Grauman
כיול מערכת סטראו So, where to start with uncalibrated cameras? Need to find fundamental matrix F and the correspondences (pairs of points (u’,v’) ↔ (u,v)). 1) Find interest points in image 2) Compute correspondences 3) Compute epipolar geometry 4) Refine Example from Andrew Zisserman
Stereo pipeline with weak calibration 1) Find interest points Grauman
Stereo pipeline with weak calibration 2) Match points only using proximity Grauman
עעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעעע