320 likes | 597 Views
Архитектура современных ЭВМ. Кафедра Параллельных вычислений (ИВМиМГ) Кафедра Параллельных вычислительных технологий Маркова Валентина Петровна, markova@ssd.sscc.ru Куликов Игорь Михайлович, kulikov@ssd.sscc.ru. Определение архитектуры компьютера.
E N D
Архитектура современных ЭВМ Кафедра Параллельных вычислений (ИВМиМГ) Кафедра Параллельных вычислительных технологий • Маркова Валентина Петровна, markova@ssd.sscc.ru • Куликов Игорь Михайлович, kulikov@ssd.sscc.ru
Определение архитектуры компьютера • Архитектура компьютера – логическая организация компьютера с точки зрения программиста, (программно-видимые средства) • IA-32,Intel Core, AMD x86-64, STI Cell, IBM POWER • Микроархитектура компьютера – совокупностьаппаратных решений для серии процессоров, реализующих ее программную модель • IA-32 (IntelArchitecture 32 bit)представлена двумя микроархитектурами: • P6 (Pentium Pro, Pentium II и Pentium III) • NetBurst (Celeron, Pentium 4, Xeon ,….)
Архитектурные принципы компьютера фон Неймана • Принцип программного управления • Принцип хранимой программы • Синхронное функционирование • Принцип условного перехода • Принцип использования двоичной системысчисления • Принцип иерархичности ЗУ
Машины потока команд Характерной чертой компьютеров фон Неймана является наличие глобально адресуемой памяти и счетчика команд, которые позволяют УУ многократно повторять один и тот же цикл действий: 1)Извлечение очередной команды машинного кода, 2)Декодирование и выполнение команды в автоматическом режиме. В результате глобально адресуемая память и счетчик команд создают поток команд, которые УУ декодирует, а АЛУ исполняют.
Управляющие стратегии вычислений • Команда выполняется, если предыду-щая команда, определенная в машин-ном коде, выполнена (control flow). • Команда выполняется, когда требуе-мые операнды готовы (data flow). • Команда выполняется, когда ее резу-льтат требуется другой команде (demand driven). • Команда выполняется, когда появля-ются частичные образы данных (pattern driven).
Узкие места архитектуры фон Неймана • Последовательное выпол-нение команд. • Хранение данных и прог-раммы в одном ОЗУ. • Один канал связи.
Усовершенствования архитектуры фон Неймана • Усовершенствования в области CБИС-технологий. • Программного обеспечения. • Архитектурные усовершенствования.
Прогресс в СБИС-технологиях. Закон Мура
Усовершенствование ПО • Языки программирования ВУ. • Компиляторы. • Библиотеки подпрограмм. • Параллельные языки програм-мирования. • Коммуникационные библиотеки.
Оптимизация подсистемы памяти Контроллер памяти Высокоскоростная шина Кэш и иерархия памяти Виртуальная память Аппаратная предвыборка данных и команд Оптимизация выполнения команд Конвейеризация Упрощение набора команд Истинный параллелизм Данные Инструкции Потоки Программы Архитектурные усовершенствования
Характеристикисуперкомпьютера Roadrunner(№1 http://www.top500.org) • Процессоры • PowerXCell 8i 3.2 ГГц (12 240 шт.) • Opteron DC 1.8 ГГц (6 562 шт.) • Всего ядер 122 400 • Общая память 98 Тбайт • Производительность • 1026 TFlops (макс) • 1375.78 TFlops (пиковая) • 437 MFlops/watt • Энергопотребление 2.35 мегаватт
3я команда 2я команда 1я команда Конвейер команд Ступени Запись результата 1 2 Вычисление операции 1 2 3 Выборка операндов 1 2 Декодирование команды 3 1 2 3 Выборка команды 1 2 Время
3я команда 2я команда 1я команда Конвейер команд Все ступени конвейера активны Латентность конвейера Ступени Запись результата 1 2 3 4 5 6 9 7 8 Вычисление операции 1 2 3 4 5 6 9 7 8 Выборка операндов 1 2 3 4 5 6 9 7 8 Декодирование команды 1 2 3 4 5 6 9 7 8 Выборка команды 1 2 3 4 5 6 9 7 8 Время
Параллелизм на уровне инструкций (ILP) CPU INT Окно команд FP MEM BR
Параллелизм на уровне инструкций (ILP) Время
Параллелизм на уровне нитей (TLP) CPU Окно команд Нить №1 INT FP Окно команд MEM Нить №2 BR
Параллелизм на уровне нитей (TLP) Нить №1 Нить №2 Время
Многоядерность(Multi-Core) Окно команд Процесс №1 Окно команд Процесс №2
Основные проблемы • Power Wall – стена мощности • Процессоры греются • Memory Wall – стена памяти • Память медленнее процессоров • Frequency Wall – стена частоты • Транзисторы маленькие, процессоры большие • Complexity Wall – стена сложности • Процессоры больше управляют вычислениями, чем вычисляют
Итоги • Современные архитектуры произрастают из корняфон-Неймана • Оптимизации идут экстенсивно вплоть до стен (walls)
Алмазные кристаллы • 1000 vs 150 °C • 200 vs 20 Вольт