360 likes | 461 Views
Technion - Israel institute of technology department of Electrical Engineering. הטכניון - מכון טכנולוגי לישראל הפקולטה להנדסת חשמל. המעבדה למערכות ספרתיות מהירות. High speed digital systems laboratory. GPS/INS Tracking System Using Particle Filter Model.
E N D
Technion - Israel institute of technology department of Electrical Engineering הטכניון - מכון טכנולוגי לישראלהפקולטה להנדסת חשמל המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory GPS/INS Tracking System Using Particle Filter Model Performed by: LiranSperling 200476216 Gal Braun 301357059 Instructor: EvgenyFiksman 1
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Project Requirements Implement the INS/GPS system using particle filter model algorithm using Nvidia GPU and OpenCL platform 3
GPGPU Languages המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory • DirectX (1995) • Cuda (2006) • OCL (2008) • Open Computing Language • Managed by Khronos group • Use all computation resources in system • Derived from C99 6
Khronos Group המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory 6
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Our GPU – GeForce GTX285 Price: 200$ – 250$
GPU Architecture המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory 6
OCL Memory model המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory 6
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory From C to OpenCL
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory SystemDescription Combined GPS/INS navigation based on the particles filter model • INS – Inertial Navigation System • GPS – Global Positioning System • Particles Filter Model – Combining the GPS and INS algorithms. 4
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory SystemDescription every 10 msec INS every 1 sec GPS Weights recalculation Neff > Nth every 1 sec Neff < Nth Resampling 4
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Block Diagram CPU Initialization Particle Propagation Randomizing No GPS measure GPS measure Particle weight calc State vector calculation Effective particles number calc Particles number > Nth Particles number < Nth Covariance matrix calc Matrix Inversion Resampling Regularization Weight recomputation 5
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Why GPU and OCL? • Many Particles (30000). • Each particle is independent to the others. • Major parts of the algorithms can be performed in parallel. • OpenCL parallel computing will enable to use the GPGPU computing power to optimize the algorithm performance.
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Calculation Optimization - Example We would like to use our multi-core GPGPU to optimize the calculation time. How can it be done ?
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Example - CPU Calculation time = 0 time units 12 5 2 13 16 8 5 41 17 27 3 9 20 34 7 12 … 219 231 12 17 32 19 0 Sum = 15 2 1 3 4 16
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Example – Naive GPU 12 5 2 13 16 8 5 41 17 27 3 9 20 34 7 12 0 529 Sum = 529 Calculation time = 0 time units 1
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory But… • Is the output correct ? • Can this level really be achieved cosidering memory access & sychronizing ?
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Example – Our GPU Solution 12 5 2 13 16 8 5 41 17 27 3 9 20 34 7 12 0 29 0 32 0 5 0 22 36 0 42 0 12 0 53 0 0 231 Sum = 0 65 74 0 17 0 75 0 0 82 0 149 Calculation time = 0 time units 1 2 3 4
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Our Solution • Takes approximately . • Utilizes the GPUPU multi-core to the maximum. • And with large calculations (say, 30000 * 16), the calculation time is extremely reduced compared to the linear CPU solution.
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Development Methodology
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Development Methodology • Function layer: • Transforming Matlab functions into OpenCL kernels & code. • Major difficulty was tranforming the Matlab “natural” matrix calculations into parallel C code and kernels. • Comparing the outputs of the matlab and OpenCL functions.
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Development Methodology • Block layer: • The algorithm was divided into two major parts: • Particles propagation block & weights recalculation. • Resampling block. • Major difficulty was synchronizing the code parts done by the CPU (the parts written in C code) and the parts done by the GPU (the parts written as OpenCLkernels). • Comparing the outputs of the matlab and OpenCL. • Major difficulty was finding errors since it meant checking iteration by iteration of the algorithm running.
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Development Methodology • Final Simulation: • Running the entire algorithm over the 100 seconds long data file we received. • Comparing the results to the results provided by the C programming group.
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Results – X coordinate
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Results – Ycoordinate
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Results – Zcoordinate
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Results – X velocity
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Results – Y velocity
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Results – Z velocity
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Results – Running Time %GPU calculating time:
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Results – Running Time %GPU calculating time (excluding prediction):
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Results – Running Time Number of calls to function:
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Results – Running Time Number of calls to function (excluding Prediction & reads from memory):
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Results – Running Time Function run time:
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Results – Running Time Cycle run time (presenting the 3 types of possible cycles):
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory Block Diagram CPU Initialization Particle Propagation Randomizing No GPS measure GPS measure Particle weight calc State vector calculation Effective particles number calc Particles number > Nth Particles number < Nth Covariance matrix calc Matrix Inversion Resampling Regularization Weight recomputation 5 5
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory שאלות? 3