1 / 44

PentiumPro Vs. Pentium MMX

PentiumPro Vs. Pentium MMX. Namik P. Ley André El-Ama. Die Probanden:. System A: PentiumPro 200MHz 64MB RAM System B: PentiumMMX 233MHz 64MB RAM.

ginata
Download Presentation

PentiumPro Vs. Pentium MMX

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. PentiumPro Vs. Pentium MMX Namik P. Ley André El-Ama

  2. Die Probanden: System A: PentiumPro 200MHz 64MB RAM System B: PentiumMMX 233MHz 64MB RAM Verglichen werden soll nur die Prozessorperformance! Andere Leistungsunterschiede wie etwa unterschiede der Grafikkarte werden von uns weitest gehend ausgeglichen. Das Ziel: Der Ansatz zum Vergleich der beiden Prozessoren liegt in Ihrer Architektur. Es sollen hier also die Besonderheiten des Designs heraus gestellt werden, so daß etwa die um 33MHz geringere Taktfrequenz des PentiumPro nur sekundäre Relevanz hat. Insbesondere liegt unser Augenmerk auf den zwei primären Unterschieden. Der PentiumMMX hat durch die MMX-Erweiterung die Möglichkeit, Daten im SIMD Verfahren zu bearbeiten, während der PentiumPro einen im Prozessortakt arbeitenden L2 Cache besitzt.

  3. Der PentiumPro:  dynamische Befehlsausführung  drei zwölfstufige Pipelines  On-Chip-FPU  getrennte L1-Befehls- und Daten-Caches mit Write-Back-Strategie  „Out of order“ Abschluß der Befehle  Register-Rennaming mit 40 Registern  Data Forwarding  dynamische Verzweigungsvorhersage  spekulative Ausführung von Befehlen  Multiprozessing mit bis zu vier PPro ohne zusätzliche Logik  auf 36-Bit erweiterter Adressbus für einen physikalischen Adressraum von 64 GByte.  neue Funktionen CMOVcc für bedingte MOV-Operationen  im selben Gehäuse intergrierter L2-Cache, der über einen dedizierten Bus mit vollem CPU-Takt angesprochen wird

  4. Die Besonderheiten der MMX-Technologie • SIMD Technologie • 24 entsprechend neue Befehle (mit allen Variation sind es 57) • 8 getarnte 64-Bit MMX Register • 4 neue Datentypen • 100% Abwärtskompatibel • Doppelte 1‘st Level Größe (16KB/16KB) • Wurde um eine Pipline-Stufe um höhere Taktfrequenzen zu erzielen • Wurde um 1,2 Mio. Transistoren ergänzt

  5. SIMD Technologoe

  6. Mappen der MMX-Register auf die FP-Register

  7. Neue Datentypen

  8. FP und MMX in einer Applikation FP_code : ..... ..... /* FP-Stack leeren MMX_code : ..... EMMS FP_code2 : ..... ..... /* FP-Stack leeren

  9. Bug im Pentium-MMX und PII • Umschaltung von MMX nach FP per EMMS • MMX : ca. 1458 Taktzyklen • PII : ca. 5287 Taktzyklen • Normalerweise war vorgesehen, daß diese • Umschaltung drei Taktzyklen verbraucht

  10. Pipeline der MMX CPU

  11. Block-Diagramm des Pentium MMX Prozessors

  12. Beispiel einer SIMD-Addition

  13. Beispiel einer Vektor-Multiplikation

  14. Addition ohne Überlaufschutz (Wrap-Arround)

  15. Addition mit Überlaufschutz (saturation)

  16. iComp Index 2.0 • CPUmark32 • Norton SI-32 • SPECint_base95 • SPECfp_base95 • Intel Media Benchmark

  17. iComp Index 2.0

  18. MPEG Benchmark • Quelle • AVI Video • Länge : 40sek (ca. 200MB) • Auflösung : 352*288 • Ziel • MPEG Video (ca. 4MB) • Benutzte Software • Xing-Encoder 2.2 (MMX-optimiert) • Konvertierungzeit • MMX-233 : 155 Sek • MMX-200 : 180 Sek (umgerechnet) • PPro-200 : 271 Sek

  19. MP3 Benchmark • Quelle • WAV-Sounddatei • Länge : 16Min 12Sek (ca. 170MB) • Auflösung : 16-Bit; Stereo; 44kHz • Ziel • MP3-Datei (ca. 15MB) • Benutzte Software • Audio Catalyst 2.0 (nicht MMX optimiert) • Konvertierungzeit • MMX-233 : 5Min 49Sek • MMX-200 : 6Min 46Sek(umgerechnet) • PPro-200 : 4Min 30Sek

  20. Spiele Benchmark • Spiel • Hexen II (ohne 3D-Karten Unterstützung) • Nicht MMX optimiert

  21. MMX-Befehle : Datentransfer

  22. MMX-Befehle : Packen

  23. MMX-Befehle : Entpacken

  24. MMX-Befehle : Arithmetik

  25. MMX-Befehle : Schieben

  26. MMX-Befehle : Vergleichen

  27. MMX-Befehle : Logik

  28. MMX-Befehle : Sonstiges

More Related