140 likes | 320 Views
The AMD Athlon (K7 ). Шина AMD Athlon. AMD Opteron. 31. 15. 7. 0. 63. In x86. Added by x86-64. AH. AL. RAX. EAX. AL. AH. EAX. 127. 0. 79. 0. SSE. GPR. x87. EAX. XMM0. EDI. XMM7. R8. XMM8. Program Counter. 31. 0. 63. EIP. R15. XMM15. x86-64 Programmer’s Model.
E N D
31 15 7 0 63 In x86 Added by x86-64 AH AL RAX EAX AL AH EAX 127 0 79 0 SSE GPR x87 EAX XMM0 EDI XMM7 R8 XMM8 Program Counter 31 0 63 EIP R15 XMM15 x86-64 Programmer’s Model
СвойстваAMD64 Ядро AMD64 (х86-64) • Одновременное исполнение 32-разрядного и 64-разрядного кода. • Преодолен барьер 4 Гбайт для памяти, присущий 32-разрядным системам. Интегрированный контроллер памяти DDR • Увеличенная скорость выполнения приложений за счет существенного сокращения латентности ОП. Канал HyperTransport™ • Пиковая пропускная способность до 19 Гбайт/с на процессор, что уменьшает узкие места в системе ввода/вывода. • Технология HyperTransport масштабируется в зависимости от количества процессоров.
Подсистема памяти • 64-разрядная виртуальная адресация • Плоское адресное пространство • 64-битные регистры • 8 новых РОН (R8-R15) • 8 новых регистров SSE (xmm8-xmm15) • КЭШ L1: 64+64 Кбайт, 2-ассоциативный • КЭШ L2: 1024 Кбайт, 16-ассоциативный
Работа конвейера • Выборка (FETCH) 16 байт/такт • Распределение по 3 OP в планировщики из декодировщика (буфер 24 OP) • Производительность FPU: • x87: 1 MUL + 1 ADD (1.9 FLOP/c max) • 3DNow: 2 MUL + 2 ADD (3.4 FLOP/c max) • Целочисленная производительность: • 32 бита: 1 ADD + 1 MUL(3 такта) • 64 бита: 1 ADD или 1 MUL (4 такта) • Предсказание ветвлений:
ТЕХНОЛОГИЯ HYPERTRANSPORT • HyperTransport – это высокопроизводительный интерфейс, соединенный по принципу «точка-точка» (peer-to-peer). Это теоретически означает, что между собой могут быть соединены любые компоненты системы, причем без применениякаких-либо коммутаторов или мостов.Каждое соединение состоит из субсоединения Передачи (Tx) и субсоединения Получения (Rx), работающих асинхронно. Передача данных организована в виде пакетов длиной до 64 байт. Пиковая производитель-ность до 12,8 Гб/c. Соединение HyperTransport может иметь магистраль шириной 2,4,8,16,32 или 64 бит в 100 МБ/сек для каждого направления.
1 -- системная шина процессора; 2 -- интерфейс памяти; 3 -- межчиповое соединение; 4 -- интерфейсы ввода-вывода для шин. ТЕХНОЛОГИЯ HYPERTRANSPORT
Свойства HyperTransport • Масштабируемая пропускная способность при обмене информацией с другими процессорами, подсистемами ввода/вывода и прочими устройствами. • Поддержка до трех согласованных каналов HyperTransport, что обеспечивает пиковую пропускную одного процессора до 19,2 Гбайт/с. • Пропускная способность одного канала, достигающая 6,4 Гбайт/с, является достаточной для поддержки новыхтехнологий обмена данными, включая шину PCI-X, новые модели памяти DDR, архитектуру InfiniBand и сети 10G Ethernet. • Низкое энергопотребление (напряжение питания – 1,2 В) уменьшает общее тепловыделение вычислительной системы.
Интегрированный контроллер памяти DDR DRAM • Изменяет порядок доступа центрального процессора к ОП, в результате чего увеличивается пропускная способность, уменьшается латентность памяти и увеличивается производительность процессора. • Доступная пропускная способность памяти масштабируется вместе с числом процессоров. • 128-разрядная шина памяти и интегрированный контроллер памяти DDR DRAM с поддержкой до 8 модулей памяти типа registered DDR DIMM на процессор. • Доступная полоса пропускная способность памяти до 5,3 Гбайт/с на процессор (при спецификации памяти PC2700).
Alpha 21264 Opteron 240 244=16 TB Memory 240=1 TB 64 бита 3,2 MB/sec 128 бит 6,4 MB/sec L2 cache 1 MB Cache memory L2 cache 1 MB 1х128 Bus width 2х64 L1 cache 64 KB L1 cache 64KB 12 5 Conveyer length 8 6 Issue ports count 120 integer 120 float 80 integer 72 float Register count 3MEM 3 ALU 3 FPU 2 ALU 2 MEM 2 FPU Functional units 833 MHz 1,4 MHz Frequency 4 instructions / cycle 3 x86 instructions / cycle Throughput Сравнение характеристик