An lisis comparativo de rendimiento

1. An�lisis comparativo de rendimiento Usuarios, administradores y dise�adores

3. 1. Introducci�n �Qu� es la referenciaci�n? Factores influyentes Las cargas de prueba Comparaci�n del rendimiento de dos sistemas

4. �Qu� es la referenciaci�n? Referenciaci�n (benchmarking) T�cnicas usadas en la comparaci�n del rendimiento de diferentes sistemas inform�ticos Todos los sistemas se han de someter a la misma carga

7. Medidas del rendimiento Tiempo: el computador que hace la misma cantidad de trabajo en el m�nimo tiempo es el m�s r�pido Las medidas de rendimiento han de ser reproducibles, indicando las condiciones en que se han obtenido Procesador, frecuencia de funcionamiento, memoria, cache, ... No hay que confundir el rendimiento del sistema con el rendimiento del procesador

8. Factores influyentes en la referenciaci�n Elementos hardware de cada equipo Procesador, placa base y chipset, memoria principal, discos, ... Sistema operativo Sistema de memoria Configuraciones de las memorias cache y virtual Efecto del compilador sobre el c�digo ejecutable Cuidado con las posibles optimizaciones j=log(5.0); por for(i=1;i<=5000;i++) j=log(5.0); x=exp(log(x)/2*T1) por la expresi�n x=sqrt(exp(log(x)/T1)), ya que sqrt(exp(x))=exp(x/2) Hay compiladores �listos� que detectan los benchmarks cl�sicos

9. Carga de trabajo (workload) Conjunto de todas las demandas a que est� sometido un sistema inform�tico durante un periodo de tiempo Programas, datos, �rdenes, usuarios, ... Carga de prueba (test workload) Carga a que se somete un sistema inform�tico durante una sesi�n de medida de rendimiento Carga de trabajo y carga de prueba

10. La carga real Dif�cil de utilizar en la evaluaci�n de sistemas Resulta complicado reproducirla Var�a a lo largo del tiempo Interacciona con el sistema inform�tico

11. Caracterizaci�n o modelado de la carga Descripci�n cuantitativa Toma de medidas de rendimiento A partir del sistema y carga reales, o bien a partir de modelos El modelado de la carga

12. Obtenci�n de los �ndice de prestaciones

13. Ejemplo de medida de rendimiento

14. Terminolog�a Perspectivas de rendimiento Usuario: tiempo de respuesta o tiempo de ejecuci�n Administrador: cantidad de trabajo hecha por unidad de tiempo o productividad Hay que evitar terminolog�a ambigua �Este sistema es tantas veces m�s lento que aquel� �Este sistema es tantas veces mejor que aquel� Hablaremos de Mejora del rendimiento Mejora del tiempo de respuesta o de ejecuci�n

15. �Qu� sistema es m�s r�pido? El rendimiento del computador A es n veces mejor que el rendimiento del computador B si Ejemplo: TA=10 s y TB=15 s El computador A es 1.5 veces m�s r�pido que el B

16. �Qu� sistema es m�s r�pido? El rendimiento del computador A es un n% superior al rendimiento del computador B si Ejemplo: TA=10 s y TB=15 s El computador A es un 50% m�s r�pido que el B

17. �Rendimientos diferentes? Ejecuci�n de n programas en dos m�quinas A y B �Son significativas las diferencias obtenidas? Hay que usar mecanismos estad�sticos Intervalo de confianza para las diferencias Nivel de confianza, por ejemplo, del 95% (?=0.05) Si incluye el cero, entonces no hay diferencias significativas Si no incluye el cero, entonces las m�quinas tienen rendimientos significativamente diferentes

18. Ejemplo de rendimientos similares Tiempos de ejecuci�n en dos sistemas A y B

19. C�lculo del intervalo de confianza Como el intervalo calculado es (-9.80, 9.17) e incluye el cero podemos afirmar, con un nivel de confianza del 95%, que las diferencias NO SON SIGNIFICATIVAS

20. 2. �ndices cl�sicos de rendimiento CPI, MIPS, MFLOPS

21. CPI (cycles per instruction) Es un valor medio que interesa minimizar Depende de la organizaci�n y arquitectura (lenguaje m�quina) Inconveniente: ignora el tiempo imprevisible que hace falta para sincronizar procesador y memoria cache (ciclos de espera, fallos en cache, ...) El valor m�nimo es 1 Ciclos por intrucci�n de un programa

22. Ejemplo de c�mputo Procesador con un reloj a 500 MHz o 0,5 GHz �Cu�l es la duraci�n del tiempo de ciclo del reloj? Relaci�n entre tiempo y frecuencia

23. Cada instrucci�n necesita un determinado n�mero de ciclos, y por tanto, el valor de CPI depende de las instrucciones ejecutadas por cada programa Instrucciones de escritura (store): 12% 2 ciclos Instrucciones de lectura (load): 21% 2 ciclos Instrucciones de la ALU: 43% 1 ciclo Instrucciones de salto: 24% 2 ciclos C�lculo del CPI de un programa

24. MIPS (million of instructions per second) Se denominan MIPS nativos Depende del juego de instrucciones y los MIPS medidos var�an entre programas en el mismo computador Meaningless indicator of processor speed MIPS relativos: referidos a una m�quina de referencia (proceso de normalizaci�n) MIPS

25. Ejemplo con MIPS El programa P contiene 200?106 instrucciones Procesador 1 (175 MHz): ejecuta P en 10 s Procesador 2 (300 MHz): ejecuta P en 5 s

26. MFLOPS (million of floating-point operations per second) Se denominan MFLOPS nativos Basado en operaciones y no en instrucciones El tiempo de ejecuci�n de la f�rmula es el del programa, incluyendo el tiempo consumido por las instrucciones de enteros La dura realidad El juego de instrucciones en coma flotante varia de una arquitectura a otra y, dentro de una misma arquitectura, cada instrucci�n tiene un tiempo distinto que puede variar seg�n los operandos MFLOPS

27. Consideran la complejidad de las operaciones en coma flotante Suma, resta, multiplicaci�n, comparaci�n, negaci�n: poco costosas Divisi�n, ra�z cuadrada: costosas Trigonom�tricas: muy costosas Ejemplo de normalizaci�n de operaciones en coma flotante ADD, SUB, COMPARE, MULT ? 1 operaci�n normalizada DIVIDE, SQRT ? 4 operaciones normalizadas EXP, SIN, ATAN, ... ? 8 operaciones normalizadas MFLOPS normalizados

28. C�lculo de los MFLOPS de un programa Programa Spice: el computador DECStation 3100 tarda en 94 segundos en ejecutarlo Contiene 109.970.178 operaciones en coma flotante de las cuales: 15.682.333 son divisiones (DIVD) El resto tiene una complejidad similar a la de la suma

29. 4. Benchmarks Microbenchmarks: toys, kernels Programas Sandra, WinBench y PassMark Corporaciones: BAPCO, SPEC, TPC

30. Microbenchmarks: toys Sieve (algoritmo criba de Erat�stenes) Encuentra los n�meros primos entre 1 y n Comparaci�n de microprocesadores y lenguajes de alto nivel Funci�n de Ackermann Programa recursivo Evaluaci�n del mecanismo de llamada a procedemiento Otros ejemplos Funci�n de Fibonacci M�todos de ordenaci�n de vectores Un largo etc�tera

31. Microbenchmarks: kernels Whetstone (1976) Peque�as aplicaciones cient�ficas (coma flotante) Estructurado en m�dulos independientes Linpack (1983) Aplicaciones cient�ficas de c�lculo num�rico de coma flotante Resoluci�n de sistemas densos de ecuaciones lineales Dhrystone (1984) Entornos t�picos de programaci�n: aspectos de los lenguajes fuente de sistemas operativos, editores, compiladores, etc�tera Aspectos no num�ricos: manejo de cadenas de caracteres Inicialmente dise�ado en Ada, hay versiones en C y Pascal

32. Programa Sandra Eval�a procesador, memoria, disco, tarjeta gr�fica, red Calcula MIPS (dhrystone) y MFLOPS (whetstone) http://www.sisoftware.net

34. PassMark Software Variedad de programas para evaluar el rendimiento y fiabilidad de los computadores personales Hardware benchmarking and reliability testing software Ejemplos de productos Simple PC Benchmarking PC Reliability and Load Testing http://www.passmark.com

35. BAPCO BAPCo (Business Applicationn Performance Corporation) http://www.bapco.com Evaluaci�n de computadores en entornos empresariales Benchmarks desarrollados SYSmark 2004 MobileMark 2005 WebMark 2004 Intervienen muchas empresas Toshiba, Microsoft, IBM, Dell HP, Intel, AMD, ZDNet, ...

36. SPEC SPEC (Standard Performance Evaluation Corporation) MISSION: to establish, maintain, and endorse a standardized set of relevant benchmarks and metrics for performance evaluation of modern computer systems Funciones de SPEC Desarrollar benchmarks Hacer p�blicos los resultados Intervienen muchas empresas HP, MIPS, Sun, AT&T, Compaq, IBM, Intel, Motorola, DEC, etc. http://www.spec.org

38. TPC TPC (Transactions Processing Performance Council) Entornos transaccionales (OLTP: on-line transaction processing) http://www.tpc.org Compuesto por varios programas TPC-App, TPC-C, TPC-H Aspectos tratados Sistemas de bases de datos distribuidas Arquitectura cliente/servidor, servidores web Unidades: peticiones procesadas por segundo (tps)

41. HINT (Hierarchical INTegration ) Coste de computaci�n y tiempo de ejecuci�n variables Se resuelve un problema matem�tico cuya soluci�n se puede ir mejorando paulatinamente C�lculo de los l�mites racionales inferior y superior de: Medida de prestaciones: QUIPS (quality improvement per second) �til para explorar los l�mites computacionales de los computadores as� como la calidad del resultado

42. Aspecto t�pico de gr�ficas con QUIPS

43. �Impacto futuro de HINT? John Gustafson (derecha) y Quinn Snell (Ames Lab) afirman que HINT es posiblemente el benchmark m�s portable jam�s escrito Con HINT se pueden medir las prestaciones de cualquier supercomputador, por sofisticado que sea, como si de una simple calculadora se tratara

44. 4. Resumen de rendimientos: aproximaciones Uso de medias Normalizaci�n de rendimientos

45. �C�mo expresar el rendimiento? El rendimiento es una variable multidimensional Habr�a de expresarse mediante m�ltiples �ndices Sin embargo, las comparaciones son m�s sencillas si se usa un �nico �ndice de rendimiento (a minimizar o maximizar) �C�mo concentrar todas las variables en una sola? Utilizar la mejor variable que represente el rendimiento Asegurar que su obtenci�n es v�lida M�todo habitual de s�ntesis: uso de medias Hay que tener especial cuidado con la normalizaci�n de valores

46. Puntos de partida Est� aceptado universalmente que El tiempo necesario para llevar a terme un determinado c�mputo refleja la esencia del rendimiento de un computador Dos propiedades indispensables Si resumimos el rendimiento de un computador para un conjunto de benchmarks en una �nica cantidad expresada en unidades de tiempo, entonces ha de ser directamente proporcional al tiempo total (ponderado) consumido por los benchmarks Si resumimos el rendimiento de un computador para un conjunto de benchmarks en una �nica cantidad expresada en ratio, entonces ha de ser inversamente proporcional al tiempo total (ponderado) consumido por los benchmarks

47. La media aritm�tica �til para tiempos de respuesta No se ha de utilizar con ratios Recomendaci�n: normalizar el resultado final (no cada xi)

48. La media arm�nica �til cuando los valores son ratios con unidades de tiempo en el denominador (MIPS, MFLOPS) No se ha de utilizar con tiempos de respuesta Recomendaci�n: normalizar el resultado final (no cada xi)

49. La media geom�trica No es �til ni para tiempos de respuesta ni para ratios �nica virtud: mantiene el mismo orden en las comparaciones con valores normalizados (consistencia) Usado en los benchmarks de SPEC y BAPCO Sin embargo, este orden puede no ser el correcto

50. Ejemplo de comparaci�n con tiempos

51. Comparaci�n con el tiempo total Ordenaci�n con el tiempo total: De m�s r�pida a m�s lenta: A, B, C, D Esto no significa que A sea siempre la m�s r�pida (depende del programa), aunque, en conjunto, s� que lo es

52. Resumen con la media aritm�tica

53. Dividimos el valor obtenido en una m�quina de referencia entre los valores de cada fila (aceleraciones) A partir de aqu� el resumen con las medias se hace con los valores normalizados (aceleraciones) Ahora la aceleraci�n es un �ndice a maximizar Normalizaci�n de rendimientos: ratios

54. Comparaci�n con valores normalizados

55. Lecturas de la gr�fica anterior A obtiene mejor �ndice en todos los casos Altibajos en la media aritm�tica Comparaci�n de B y C con tiempos B es m�s r�pido que C: 2010,3 s frente a 2166,1 s Relaci�n de tiempos: 2166,1/2010,3 = 1,08 Comparaci�n de B y C con la media geom�trica B y C son casi igual de r�pidos: 9,60 s frente a 9,59 s Relaci�n de medias geom�tricas: 9,60/9,59 = 1,00

56. 5. Estrategias de an�lisis Efectos de la normalizaci�n y de la ponderaci�n

57. Estrategias de an�lisis Muy raramente un estudio comparativo de prestaciones es un trabajo aburrido, sobre todo cuando intervienen los dise�adores e inteseres econ�micos Caso de estudio Tres sistemas: A, B y C Dos programas de prueba: P1 y P2 Tiempo de ejecuci�n en segundos de cada programa

58. Tiempo individual de cada m�quina A es 10 veces m�s r�pido que B para P1 B es 10 veces m�s r�pido que A para P2 C es 50 veces m�s r�pido que A para P2 B es 2 veces m�s r�pido que C para P1 C es 5 veces m�s r�pido que B para P2 Sin embargo, la comparaci�n entre los tres sistemas resulta confusa Tiempo individual de cada programa

59. Tiempo total de respuesta Buena aproximaci�n si los programas de prueba se ejecutan en tiempo no demasiado diferentes B es 9.1 (1001/110) veces m�s r�pido que A para P1 y P2 C es 25 (1001/40) veces m�s r�pido que A para P1 y P2 C es 2.75 (110/40) veces m�s r�pido que B para P1 y P2 Tiempo total de ejecuci�n

60. Resumiendo las datos con una media Buena aproximaci�n si los programas de prueba se ejecutan las mismas veces Resumiendo las datos con una media ponderada Por ejemplo, si el responsable del 80% de la carga es P1 y del 20% es P2, entonces el peso del primero es 0.8 y el del segundo es 0.2 Utilizando medias aritm�ticas

61. Aproximaci�n si no se conoce la proporci�n de cada programa Se supone que el tiempo se distribuye entre los n programas C�lculo de los pesos para cada programa Medias aritm�ticas ponderadas

62. C�lculo de medias aritm�ticas ponderadas Problema de la media aritm�tica ponderada Hay dependencia de la m�quina de referencia Hay dependencia del tiempo usado en cada programa de prueba Medias aritm�ticas ponderadas: resumen

63. Normalizaci�n de los tiempos Normalizaci�n sobre diferentes bases

64. Principales conclusiones An�lisis de los resultados El rendimiento calculado con la media aritm�tica varia seg�n la m�quina de referencia Col. 2: B es m�s lenta que A (referencia A) Col. 4: A es m�s lenta que B (referencia B) Col. 3: C es m�s lenta que A y B (referencia A) Col. 9: C es m�s r�pida que A y B (referencia C) Las medias geom�tricas son consistentes independientemente de la m�quina de referencia A y B tienen el mismo rendimiento El tiempo de ejecuci�n de C es el 63% de A o B Sin embargo, el tiempo total de ejecuci�n de A es 9 veces el de B, y el de B tres veces el de C

65. 6. Ejemplos reales CPU2000 (SPEC) SYSMark 2004 (BAPCO)

66. El paquete SPEC CPU2000 Compuesto por dos partes CINT2000: rendimiento en aritm�tica entera intensiva CFP2000: rendimiento en aritm�tica de coma flotante intensiva �Qu� quiere decir la �C�? Se eval�an componentes, no el sistema entero �Qu� componentes se eval�an? Procesador Arquitectura de memoria Compilador �Qu� componentes no se eval�an? Subsistema de disco, red o gr�ficos

67. Criterios de selecci�n de programas Portabilidad a muchas arquitecturas 32 y 64 bits: Alpha, Intel, PA-RISC, Rxx00, SPARC, etc Portabilidad a muchos sistemas operativos Unix, Linux y Windows No han de contener I/O, ni red ni gr�ficos Han de caber en 256 MB de memoria principal para no provocar intercambio (swapping) con el disco No han de pasar m�s del 5% del tiempo ejecutando c�digo que no sea especificado por SPEC

68. Programas dentro de CPU2000 CINT2000: 12 programas Todos en lenguaje C 164.gzip Utilidad de compresi�n 176.gcc Compilador de C 186.crafty Programa para jugar al ajedrez 197.parser Procesador de lenguaje natural 254.gap Teor�a computacional de grupos CFP2000: 14 programas, en lenguajes FORTRAN y C 6 en FORTRAN77, 4 en FORTRAN90 y 4 en C 173.applu Ecuaciones diferenciales parciales 178.galgel Din�mica de fluidos 200.sixtrack Modelo de acelerador de part�culas

69. �ndices prestaciones en SPEC CPU2000 �ndices de prestaciones Aritm�tica entera SPECint2000, SPECint_base2000 Aritm�tica en coma flotante SPECfp2000, SPECfp_base2000 Significado de �base� y �non-base� Compilaci�n en modo conservativo o agresivo C�lculo Media geom�trica de los valores normalizados respecto de la m�quina de referencia Sun Ultra5_10 con un procesador a 300 MHz Tarda aproximadamente 2 d�as en ejecutar todos los benchmarks del paquete

70. C�lculo del �ndice SPECfp_base Hardware AMD Gigabyte GA-7ZM motherboard 1.1 GHz Athlon L1 cache: 64KB I+64KB D on chip L2 cache: 256KB (I+D) on chip Memory: 256MB PC133 SDRAM Software Windows 2000 Compiler: Visual Fortran 6.5

71. Benchmark SYSMark 2004 Considera la carga en dos categor�as Internet Content Creation (ICC) Dreamweaver, Photoshop, Flash, Premiere... Office Productivity (OP) Word, Excel, Access, Netscape, WinZip, ... Con cada programa se ejecuta un conjunto de tareas (tasks) de acuerdo con un modelo de comportamiento del usuario Las medidas se basan en el tiempo de respuesta Se mide el tiempo de ejecuci�n de cada tarea individual Para cada categor�a se calcula el tiempo medio de ejecuci�n de todas las tareas incluidas en ella

72. C�lculo del �ndice SYSMark 2004 El tiempo medio de cada categor�a se normaliza (ratio) respecto de una m�quina de referencia (calibration platform) y se multiplica por 100 Si ratio = 200 ? doble de r�pida que la de referencia Finalmente, el �ndice SYSMark se calcula mediante la media geom�trica de los dos ratios obtenidos

An lisis comparativo de rendimiento

An lisis comparativo de rendimiento

Presentation Transcript

An??lisis ocupacional

L nea de Base y An lisis

An lisis de G nero:

AN LISIS CUENTOS DE HORACIO QUIROGA

An lisis de la Cadena

An lisis FODA

AN LISIS DE SITUACI N DE SALUD

An lisis de Morbilidad

Dualidad y An lisis de Sensibilidad

An lisis de Contenido, An lisis Actancial.

An lisis del subdesarrollo

An lisis de Correspondencias

An lisis de confiabilidad

An lisis FODA

An lisis de la MP

An lisis Factorial de Correspondencias

AN LISIS ORGANIZACIONAL

An lisis de los indicadores financieros de Soriana.

AN LISIS DE POLIMEROS

An lisis de Procesos de Decisiones

Comparativo de

Comparativo de máquinas