360 likes | 468 Views
Technologischer Nutzen von 64-bit-Architekturen. Rudolf Nordhues Unisys Deutschland GmbH. Technology 24%. Services 76%. 56% Umsatz außerhalb der USA. Unisys Portrait. Weltweit Unisys Corporation mit Hauptsitz in Blue Bell/Philadelphia, USA
E N D
Technologischer Nutzen von 64-bit-Architekturen Rudolf Nordhues Unisys Deutschland GmbH
Technology 24% Services76% 56% Umsatz außerhalb der USA Unisys Portrait Weltweit • Unisys Corporation mit Hauptsitz in Blue Bell/Philadelphia, USA • 50.000 Kunden in über 100 Ländern, vertreten in allen Regionen der Erde • Ca. 36.500 Mitarbeiter • $5,9 Milliarden Umsatz im Jahr 2003 • Gelistet bei NYSE • Ein Fortune 300 Unternehmen
Server Technologie • Imagine it. Leistungsstarke Enterprise-Server mit Großrechner-Qualitäten und offenem Betriebssystem für die Konsolidierung und für große geschäftskritische Anwendungen. • Done. Die Unisys ES7000-Familie mit Windows Datacenter Edition Betriebssystem: 1000-fach bewährt.
Speichermodell 32-Bit Technologie • Standard Windows 2000 virtueller Adressraum • 4 Gigabyte RAM Tuning • Physische Adresserweiterung Intel x86 (PAE) • Address Windowing Extension (AWE) • Large Memory Enabled (LME) • Windows Produkt Optionen • Datenbanken SQL Server / Oracle • Exchange Server 2000 • Terminal Services
32-Bit virtueller Adressraum • 232 = 4.294.967.296 Bytes = 4 GBytes
Standard Windows virtueller Adressraum 00000000 • Jeder Prozess kann über einen 4GB großen virtuellen Adressraum verfügen • 2 GB Benutzerbereich • 2 GB Systembereich .exe Code Globale Variablen Stacks von Threads .dll code Eindeutig pro Prozess, Benutzermodus 2GB 7FFFFFFF 80000000 Kernel und Ausführungsschicht HAL, Starttreiber Filesystem Cache Paged pool Nonpaged pool pro Prozess, nur im Kernelmodus 2GB C0000000 Prozessseitentabellen, Hyperspace Systemweit, nur im Kernelmodus FFFFFFFF
Task Manager Physischer Arbeitsspeicher Freie Seiten, Null-und Standby-Listen Systemseiten(z.B. Cache) Summe Paged + Nonpaged Zugesicherter virtueller Speicher Auslagerungspool Residenter Pool Virtueller Speicher ohne Erweiterung der Auslagerungsdatei
4Gigabyte RAM Tuning Adressraum 00000000 • auch bekannt als • Application Memory Tuning oder • /3GB Tuning • möglich auf x86 mit W2K AS, W2K3 EE und W2K DCE, W2K3 DCE • maximal bis zu 16 GB RAM .exe code Globale Variablen Per-Thread Benutzermodus Stacks .dll code Prozess Heaps Eindeutig pro Prozess, Benutzermodus 3GB pro Prozess, nur im Kernelmodus BFFFFFFF C0000000 Prozess Seitentabellen, Hyperspace Systemweit, nur im Kernelmodus Exec, Kernel, HAL, Treiber, etc. 1GB FFFFFFFF
4 GB RAM Tuning • nutzbar durch • Aktivierung durch Angabe von /3GB in boot.ini • Anwendung benötigt LargeAddressAware • Linker-Option /LARGEADDRESSAWARE:Yes • überprüfbar mittels [boot loader] timeout=30 default=multi(0)disk(0)rdisk(0)partition(1)\WINNT [operating systems] multi(0)disk(0)rdisk(0)partition(1)\WINNT= "W2K DCE 3GB" /3GB Imagecfg oracle.exe
Physische Adresserweiterung für x86 (PAE) • 232 = 4.294.967.296 Bytes = 4 GBytes 232+4 = 68.719.476.736Bytes = 64 GBytes
Physische Adresserweiterung für x86 (PAE) • notwendig um mehr als 4 GB RAM zu adressieren • spezieller Kernel • in Kombination mit/3GB max. 16 GB RAM • Aktivierung durch boot.ini 0 GB 4 GB /PAE Angabe in boot.ini erforderlich [boot loader] timeout=30 default=multi(0)disk(0)rdisk(0)partition(1)\WINNT [operating systems] multi(0)disk(0)rdisk(0)partition(1)\WINNT= "W2K DCE PAE" /PAE 32 GB
Systemnutzen von PAE Kernel Speicher • Systemadressraum bis 32 GB RAM • Benutzertransparent • Reduzierung von Paging • Unterstützung durch LME Hardware 2(or 3)GB Prozess Mapping to Kernel 2(or 3)GB Prozess Mapping to Kernel 2(or 3)GB Prozess Mapping to Kernel
Übersetzung virtueller Adressen ohne PAE Seitenverzeichnisindex10 Bits Seitentabellenindex10 Bits Byteindex 12 Bits 32 Bit Adresse KPROCESS Index Index Physische Adresse CR3Register PFN PTE 32 Bit breit PFN Gesuchtes Byte gesuchte Seite PDE PFN Page Frame NumberPDE Page Directory EntryPTE Page Table Entry 32 Bit breit Seitenverzeichnis(1 pro Prozess,1024 Einträge) Seitentabellen(bis zu 512 pro Prozess+ bis zu 512 systemweit,1024 Einträge pro Tabelle Physischer Adressraum
Übersetzung virtueller Adressen mit PAE Seitenverzeichnis-zeigerindex 2 Bits Seitenverzeichnisindex9 Bits Seitentabellenindex9 Bits Byteindex 12 Bits 32 Bit Adresse Index Index Index KPROCESS Physische Adresse CR3Register PFN PTE 64 Bit breit PFN Gesuchtes Byte gesuchte Seite PDE 64 Bit breit PFN PDESeitenverzeichniszeiger(1 pro Prozess, 4 Einträge) Seitenverzeichnis(bis zu 4 pro Prozess,512 Einträge) Seitentabellen(512 Einträge pro Tabelle) Physischer Adressraum
Address Windowing Extension • Ermöglicht den Zugriff auf mehr als 2 GB bzw. 3GB durch einen Prozess mittels AWE API’s • AWE API Aufrufe • Reservieren des physischen Speichers; AllocateUserPhysicalPages() • Erstellen eines Adressierungsfensters auf den physischen Speicher; VirtualAlloc() with the MEM_PHYSICAL FLAG • Abbildung von physischem Speicher im Adressierungsfenster; MapUserPhysicalPages() • FreeUserPhysicalPages()
AWE Arbeitsweise 1. Schritt Anwendung 2 GB bzw. 3 GB Benutzeradressraum Systemadressraum2GB bzw. 1GB AllocateUserPhysicalPages() Virtueller Adressraum des Prozesses Physischer Speicher
AWE Arbeitsweise 2. Schritt Anwendung 2 GB bzw. 3 GB Benutzeradressraum Systemadressraum2GB bzw. 1GB AllocateUserPhysicalPages() AWE- Fenster VirtualAlloc() Virtueller Adressraum des Prozesses Physischer Speicher
AWE Arbeitsweise 3. Schritt Anwendung 2 GB bzw. 3 GB Benutzeradressraum MapUserPhysicalPages() Systemadressraum2GB bzw. 1GB AWE- Fenster VirtualAlloc() AWE- Fenster VirtualAlloc() Virtueller Adressraum des Prozesses Physischer Speicher
AWE Arbeitsweise 3. Schritt Anwendung 2 GB bzw. 3 GB Benutzeradressraum MapUserPhysicalPages() Systemadressraum2GB bzw. 1GB AWE- Fenster VirtualAlloc() AWE- Fenster VirtualAlloc() Virtueller Adressraum des Prozesses Physischer Speicher
AWE Einschränkungen • Prozesse können keine Seiten gemeinsam nutzen • dieselbe physische Seite kann nicht mehreren virtuellen Adressen im selben Prozess zugeordnet werden • der AWE Bereich kann keinen ausführbaren Programmcode enthalten • der AWE Bereich ist nicht nutzbar als Datenpuffer für Grafik- oder Videoaufrufe • jeder AWE Bereich ist als eine Einheit wieder freizugeben
AWE E/A mit Large Memory Enabled Network Anwendung Disk 2 GB bzw. 3 GB Benutzeradressraum MapUserPhysicalPages() Systemadressraum2GB bzw. 1GB direkte E/A AWE- Fenster VirtualAlloc() AWE- Fenster VirtualAlloc() Virtueller Adressraum des Prozesses Physischer Speicher
64-Bit virtueller Adressraum • 232 = 4.294.967.296 Bytes = 4 GBytes • 264 = 18.446.744.073.709.551.616 Bytes = 17.179.869.184 GBytes • = 16 ExaBytes
64-Bit / 32-Bit Vergleich Adressraum • Kenndaten
Systemnutzen von 64-Bit • Datenbanken mit großen Cachebedarf > 2.7 GB, wie bei DHW Systemen üblich • Oracle Datenbanken mit großen Bedarf an PGAs für interne Sorts • Oracle Datenbanken mit mehr als 2000 Concurrent Datenbankverbindungen • große zentrale SAP Systeme • SAP APO Systeme mit Livecache • Serverkonsolidierung
IA32 rp2470 rx2600 Itanium2 Datenbank Migration leichter geht’s nicht! • Datenbankkopie erstellen • Kopie dem Itanium2 System bekanntgeben • Starten der Databank auf dem Itanium2 System • erledigt in Minuten! • Architekturwechsel ohne Risiko • Performancegewinn • Zukunftssichere Plattform SAN infrastructure virtualized storage system
Agenda • Unternehmensdarstellung • 32-bit oder 64-bit Technologie, Limits und Benefits • 64-bit Hardware Architektur-Ansätze • Implementierungsbeispiel im Zusammenspiel von SAP und Microsoft SQL 2000 • Praxisdemo mit Remote-Zugriff auf einen 64-bit Enterprise Server im Unisys SAP Competence Center Walldorf • Summary
1 2 3 4 5 Intel Itanium™ 2 Architectural Features 1024 TB Memory Addressing System Bus Bandwidth 6.4 GB/s 3/6/9 MB On-die L3 Cache 8 Issue Ports 6 7 8 9 10 11 328 Registers On-die Registers Execution Units 2 FP, 1 SIMD 2 Load, 2 Store 6 Integer, 3 Branch Core Frequency 1.5 GHz 6 Instructions / Cycle Instructions / Clk Performance via Parallelism
Unisys ES7000 Server Familie 9 Modelle Aries Orion Aries Orion 510 520 530 540 550 560 410 420 430 32-bit – Xeon MP 64-bit – Itanium 2 Heute verfügbar!
IA64 CPU IA64 CPU IA64 CPU IA64 CPU IA64 CPU IA64 CPU IA64 CPU IA64 CPU IA64 CPU IA64 CPU IA64 CPU IA64 CPU IA64 CPU IA64 CPU IA64 CPU IA64 CPU Memory Memory SNC SNC SNC SNC Memory Memory SPS (ISPM) SIOH-I SPS (ISPM) SIOH (IOHM) SIOH (IOHM) FLASH FLASH ICH ICH P64H2 P64H2 P64H2 P64H2 P64H2 P64H2 P64H2 P64H2 IDE IDE LAN USB USB USB USB PCI PCI IDE IDE LAN USB USB USB USB PCI PCI Unisys 64-bit ES7000 Architektur
Unisys 64-bit ES7000 Architektur • verteilte Shared-Memory Architektur • Bis zu 4 Prozessor/Memory Knoten • Jeder Knoten enthält bis zu 4 Prozessoren und 32GB RAM • Knotenkontroller ermöglichen den Zugriff auf andere Knoten und E/A Hubs • bis zu 16 Itanium2 Prozessoren • 1.3GHz mit 3MB on-die Cache • 1.5GHz mit 6MB on-die Cache • bis zu 2 Crossbars • Interconnect Prozessor/Memory Knoten und E/A Hubs • Datendurchsatz pro Verbindung bis zu 6.4 GB/sec, non-blocking, Full-Duplex • Datendurchsatz bis zu 38.4 GB/s pro Crossbar
Unisys 64-bit ES7000 Architektur - Memory • Hochleistungsspeicherarchitektur bis zu 128GB RAM • großer, flacher virtueller Adressraum bis zu 16 Terabytes • 8 TB for Windows kernel • 8 TB for user processes • Performance Boost für Windows Kernel und Anwendung • kein 32-Bit PAE/AWE Mapping/Un-Mapping Aufwand • Zuordnung physische Seiten • Zuordnung eines virtuellen Adressfensters • Mappen der physischen Seiten auf das VA Fenster • Effektivere Adressumsetzung von virtuell auf physisch, weniger (TLB) Fehlzugriffe • Bis zu 4 Wege Memory Interleave • erlaubt parallelen Speicherzugriff
Agenda • Unternehmensdarstellung • 32-Bit oder 64-Bit Technologie, Limits und Benefits • 64-Bit Hardware Architektur-Ansätze • Implementierungsbeispiel im Zusammenspiel von SAP und Microsoft SQL 2000 • Praxisdemo mit Remote-Zugriff auf einen 64-Bit Enterprise Server im Unisys SAP Competence Center Walldorf • Summary
Summary • keine Adressierungslimits mit 64-Bit Technologie (PAE, 3GB, AWE entfällt) • Ideale Plattform für große OLTP Datenbanken und Data Warehouse Datenbanken • Ideale Plattform zur Anwendungskonsolidierung • SAP & Siebel Benchmarks beweisen eine Skalierung über auch für Anwendungen über 8 CPU‘en hinaus
Precision Thinking. Relentless Execution. Vielen Dank