210 likes | 333 Views
Departamento : Informática Aplicada => Sistemas Informáticos (Bloque IV - Planta 4ª) Profesores : Pablo Carazo D4417 email : pcarazo@eui.upm.es TABLÓN DE ANUNCIOS : <==> www.dia.eui.upm.es Normas del Curso Tutorías Notas Exámenes PRÁCTICAS : Laboratorio 4405.
E N D
Departamento: Informática Aplicada => Sistemas Informáticos • (Bloque IV - Planta 4ª) • Profesores: • Pablo Carazo D4417 email: pcarazo@eui.upm.es • TABLÓN DE ANUNCIOS: <==> www.dia.eui.upm.es • Normas del Curso • Tutorías • Notas • Exámenes • PRÁCTICAS:Laboratorio 4405 proPar Presentación Curso 14/15 L y X 9-10 13-14 16-17
proPar Presentación2 Mi despacho Tablón ? Secretaria L y J (15’00 a 18’00)
proPar Presentación3 “Aumento de prestaciones” Un año • Alta productividad • Alto rendimiento 6 meses Misma tarea en menos tiempo 3 en un año • + gente • + ahínco • mejor • + CPU’s • + GHz • algoritmo Más tareas en el mismo tiempo
proPar Objetivo4 • Poner a trabajar juntos a varios procesadores (2 ... 10.000 ...) ¿Buses? Intel AMD Oracle 8 núcleos 8 núcleos 16 núcleos Decenas de núcleos Miles de núcleos 16 12 61 RED
proPar Presentación5 OBJETIVOS: “Ejecutar un programa más rápido” • Poner a trabajar juntos a varios procesadores (2 … 10.000 …) Libro electrónico: How to Survive the Multicore Software Revolution Paralelismo en el PC Gran desafío Prensa 19/06/12: IBM recupera el liderazgo mundial supercomputadores 1.572.864 núcleos 16,32 PetaFlops 1993 CM-5/1024 3 días 1 segundo Intel AMD Oracle • Entornos de desarrollo (Hw + Lenguaje + Depurador + Monitor) 8 núcleos 8 núcleos 16 núcleos • Técnicas básicas para el desarrollo de programas paralelos • Implementaciones concretas(Prácticas)
proPar Presentación6 OBJETIVOS: “Ejecutar un programa más rápido” Prensa 19/06/12: IBM recupera el liderazgo mundial supercomputadores 1.572.864 núcleos 17,17 PetaFlops 1993 CM-5/1024 3 días 1 segundo TOP500 Jun/2013: China duplica la capacidad del Titan 2 años antes 3.120.000 núcleos 33,86 PetaFlops 3 1 ¿ Jun2014 ? 2 Titan (USA) con 560.640 núcleos
proPar Presentación7 • Programa de Teoría • Computadores Paralelos • Programación basada en paso de mensajes (MPI) • Técnicas básicas de programación paralela • Compulsiva, Divide y vencerás, Pipeline, • Síncrona, Equilibrado de carga y Terminación • Programación basada en memoria común (OpenMP, CUDA) • Algoritmos y aplicaciones Ordenación, Numéricos, Imagen, Búsqueda • Bibliografía • TransparenciasFotocopias?? / WWW • “Parallel Programming. .....”. B. Wilkinson & M. Allen - P.H. 1999-2005 • “Parallel Programming in C with MPI and OpenMP”. Quinn,M.J. – MGH 2003
proPar Presentación8 Arquitecturas Paralelas Programación … Concurrente ySistemas Operativos Algorítmica y complejidad Relación con otras asignaturas: • Computadores Paralelos • Programación con paso de mensajes (MPI) • Técnicas básicas de programación paralela • Programación con memoria común (OpenMP) • Algoritmos y aplicaciones • Ordenación, Numéricos, Imagen, Búsqueda
proPar Presentación9 • Las prácticas Programa de Prácticas • Entorno • Cluster de 10 PC’s –cada uno 4 núcleos- (Lab4405) + PC9 • Lenguaje de programación “C” • MPI “Message Passing Interface” • Toma de contacto (mediciones de tiempos) • Montecarlo (PI), Divide y vencerás (# veces) • Cálculo de números primos • Cálculo de fractales • Entorno OpenMP: PI y ordenación ¿Breviario de C? CUDA • Planificación • .. 22 de Sep => Agruparse en grupos de dos • .. 10 de Dic => 5/6 turnos de 2+2 horas
proPar Presentación10 Dibujaremos este fractal en secuencial en 43 segundos y, utilizando 16 núcleos, lo conseguiremos dibujar en tan sólo 3 segundos
proPar Presentación12 Pentium Core 2 Quad Q6600 2,4GHz• 8ML2 •4GB • 500GB pc4 pc3 pc2 pc1 pc5 Core i7 Switch GigaEthernet pc6 Red E.U.I. pc7 pc8
proPar Presentación13 Pentium Core 2 Quad Q8200 2,4GHz• 4ML2 •2GB • 300GB PC10 PC11
proPar Presentación14 PC9 2 Xeon E5520 Quad 2,26GHz• 8ML3 •12GB • 500GB
proPar Presentación 15 3 * NVIDIA GEFORCE GTX 660 2GB GDDR5 960 núcleos 1,03 GHz
proPar Presentación 16 34,245 seg MPI 4 núcleos 8,840 seg 1,329 seg MPI 32 núcleos 1,809 seg
proPar Presentación17 Zynq dual core ARM-A9 1GB SDRAM Parallella Epiphani-16 Desktop Computer 16 núcleos 600MHz => 19,2 GFlops
proPar Presentación Planificación19 Septiembre Teoría Prácticas Noviembre Teoría Prácticas L 8 Presentación L 3 3. Primos X 10 comParale X 5 T2 mComún L 15 comParale L 10 X 17 pasoMsj X 12 memComún L 22 pasoMsj L 17 4. Fractales X 24 compulsiva X 19 memComún L 29 1. Contacto L 24 4. Fractales Octubre X 26 ordenación Diciembre X 1 divideVence L 6 1. Contacto L 1 5. openMP X 8 T1 y … X 3 ordenación L 13 2. MonteCar L 8 X 15 pipeline X 10 T3 Artículos L 20 2. MonteCar L 15 5. openMP X 22 síncrona X 17 Artículos L 27 3. Primos X 29 equiliTermi
proPar Presentación20 • “A Common Parallel Computing Framework for Modeling Hydrological Processes of • River Basins”, 2011 • “AA-Sort: A New Parallel Sorting Algorithm for Multi-core Parallel Systems”, 2007 • “Un banco de pruebas de ordenación paralela”, 2007 • “Parallel Suffix Sorting”, 2001 • “Invasive MPI on Intel’s Single-Chip Cloud Computing”, 2012 • Evaluación contínua [Adherirse* ..6Oct] • Asistencia 4 puntos (Control + tests) • Trabajo 2 puntos (Exposición o Escrito) • Práctica 4 puntos (Funcionando en 1,2,4,8,16 núcleos) FIN Guía de aprendizaje Competencia “Análisis y síntesis”
proPar Presentación21 Actividad Horas presenciales Horas no presenciales Horas totales Clases 28 28 56 Prácticas 20 40 60 Presentación artículos 4 14 18 Tests 3 12 15 Tutorías 1 0 1 Totales 56 94 150