570 likes | 819 Views
Прогнозные оценки развития высокопроизводительной вычислительной техники. Эйсымонт Л.К. ОАО «НИЦЭВТ» (Концерн радиостроения “ Вега ” ). Четыре сегмента рынка суперкомпьютеров. Таблица 1. Зафиксированные в 2002 году объемы четырех сегментов рынка суперкомпьютеров.
E N D
Прогнозные оценки развития высокопроизводительной вычислительной техники.Эйсымонт Л.К.ОАО «НИЦЭВТ» (Концерн радиостроения “Вега”)
Четыре сегмента рынка суперкомпьютеров Таблица 1. Зафиксированные в 2002 году объемы четырех сегментов рынка суперкомпьютеров. • На самом деле оказалось, что общий объем рынка составил: • ~ $9.000 • Дальнейший рост ожидается: • ~ $15.000 • ~ $17.000 • Это 30% рынка серверных платформ • Нас интересует Technical • Capability – • суперкомпьютеры для решения задач, требующих предельных возможностей (стратегические задачи) Таблица 2. Предсказанные в 2002 году объемы сегментов рынка суперкомпьютеров.
Разные сегменты суперкомпьютерного рынка – разные технологии, разные прогнозы (видение IBM). Наиболее чувствительный к новым технологиям сегмент - CКСН
Специфика формирования прогнозных оценок -- Прогнозные оценки даются с точки зрения архитектора заказных суперкомпьютеров высшего диапазона производительности, предназначенных для решения уникальных стратегически важных для государства задач, далее - суперкомпьютеров стратегического назначения (СКСН) -- Выделяются два связанных друг с другом процесса будущего развития (на примере США, Япония и Китай – по такому же образцу): - революционное развитие, определяемое необходимостью решения стратегических задач государства: 1) работы по программе DARPA HPCS создания заказных СКСН с перспективной архитектурой и глобально адресуемой памятью, далее – перспективных СКСН; 2) работы по Федеральному плану США разработок и исследований в области СКСН, которые являются усилением и обобщением программы DARPA HPCS. - эволюционное развитие, определяемое рынком и появлением массовой и коммерчески доступной элементной базы “новой волны”, основа которой - многоядерно-мультитредовые микропроцессоры и многосокетные платы на их основе, являющиеся мощными SMP-узлами с разделяемой между сокетами платы общей памятью.
Проекты создания суперкомпьютеров стратегического назначения (СКСН) с перспективной архитектурой США – программа DARPA HPCS (2002) - проект Cascade (Cray) - системы Baker, Granite,Marble. 250 млн $ на 2008-2010. федеральный проект - проект PERCS (IBM) - 250 млн $ на 2008-2010, федеральный проект Япония – программа Next Generation Supercomputer Министерства Образования, Культуры, Спорта, Науки и Технологий(2006) - проект 3K (Институт физических и химических исследований (RIKEN) и Fujitsu),1.2 млрд.$, федеральный проект. Китай – программа 863 Министерства науки и технологий(2006) - проект HPP (Институт вычислительных технологий (ICT), фирма Dawning, Национальный университет оборонных технологий (NUDT)), федеральный проект Россия – в рамках ФЦП Минпромторговли РФ, Минобрнауки РФ (2005) - проект Ангара (ОАО”НИЦЭВТ”)
Главная решаемая проблема в проектах создания перспективных СКСН – “стена памяти”Что это за проблема ?
Интегральные оценки реальной производительности – пакет HPC Challenge и метод “APEX-поверхности” Cхема организации APEX-теста
Пример профиля работы с памятью задачи CF-класса(DGEMM)
Пример профиля работы с памятью для задачи DIS-класса(SpMV) Рис. Профиль обращений к памяти для теста SpMV (A*p=q)
Пример профиля работы с памятью для задачи DIS-класса(FFT-одномерное быстрое преобразование Фурье)
Пример профиля работы с памятью для задачи DIS-класса(BFS)
Пример профиля работы с памятью для задачи DIS-класса(RandomAccess)
Коммуникационные профили разных задач.Большой объем передаваемой информации, нерегулярный и коллективный характер взаимодействий приводят к деградации реальной производительности и плохой масштабируемости.
Требования к перспективным CКСН программы DARPA HPCS.
Общий взгляд на задачи дляСКСН и влияние базовых характеристик СКСН на эффективность решения этих задач. • Контроль боеготовности ядерных арсеналов и разработка новых боезапасов. • Радиоэлектронная разведка и другие задачи разведывательных сообществ. • Решение задач военного характера. • Предсказание климата. • Физика плазмы – решение задач создания термоядерных реакторов. • Решение инженерных задач в области машиностроения. • Биоинформатика и вычислительная биология, задачи влияния окружающей среды. • Предсказание землетрясений. • Геофизические расчеты. • Астрофизика (+ поиск новых источников энергии). • Материаловедение и нанотехнологии. • Исследования социальных систем – макроэкономика и социальная динамика.
Подробный комментарий к задачам, для которых в первую очередь создаются перспективные СКСН программы DARPA HPCS (или в решении каких задач мы рискуем отстать)
Мирные приложения – значимость перспективных СКСН для развития общества VI технологический уклад - Биотехнологии - Нанотехнологии - Проектирование живого - Вложения в человека - Новое природопользование - Роботехника - Новая медицина - Высокие гуманитарные технологии - Проектирование будущего и управление им - Технологии сборки и уничтожения социальных субъектов V технологический уклад - Компьютеры - Малотоннажная химия - Телекоммуникации - Электроника - Интернет
Организация работ в области перспективных СКСН в США, контроль качества разработок с использованием новых подходов объективного оценочного тестирования реальной производительности Одновременно ведется программа DARPA PCA разработки перспективных встроенных суперкомпьютеров (ВСК) , во многом похожая по решаемым принципиальным проблемам на DARPA HPCSи контролируемая той же организацией – Линкольновской лабораторией Массачусетского технологического института. В данном докладе это не рассматривается, требует отдельного детального рассмотрения.
Об организации работ в области суперкомпьютерных технологий в США DARPA Cray – проект CASCADE IBM - проект PERCS MIT – проект RAW Stanford Unv. – проект Smart Memory Unv.of South.Calif. (+Raytheon) – проект MONARCH Unv.of Texas at Austin (+IBM) – проект TRIPS
Cистема тестов оценки производительностиCКСН программы DARPA HPCS
Сравнение NEC SX-9 с другими системами(современный подход - kiviat-диаграмма,на лучах – наименования тестов пакета HPC Challenge)
Примеры планов и основных решений проектов создания перспективных СКСН США, Японии и КитаяБазовые стратегии решения проблемы “стены памяти”- обеспечение толерантности процессора к задержкам за счет работы со скоростью, определяемой темпом выполнения операций, а не задержками их выполнения (мультитредовые и векторные архитектуры);- обеспечение управляемой локализации как данных при вычислениях, так и вычислений при данных (кэши, удаленные вызовы процедур, DAE-архитектуры и модели вычислений);- применение статических и динамических потоковых моделей вычисленийс управлением вычислениями потокомданных(streambased-архитектуры, dataflow-архитектуры, одновременно решает проблему ограниченного ILP, т.е. ограниченного параллелизма выполнения машинных команд)
Планы создания новых суперкомпьютеров фирмы Cray (+ унификация !)
Планы создания новых суперкомпьютеров фирмы IBM (+ унификация!)
Новая политика Японии в области стратегических вычислений
Фирма Сray, проект Cascade программы DARPA HPCS– базовая концепция проекта
Cтруктура CКСН Сray Cascade Baker и Granite • Глобально адресуемая память с унифицированной для всех типов узлов архитектурой • Конфигурируемые сеть, память, процессоры и ввод-вывод • Гетерогенная обработка на множестве узлов разного типа и внутри • тредово-векторных (MVP) узлов • Возможность адаптации при конфигурировании, компиляции в процессе выполнения
Многоядерно-мультитредовый микропроцессор Power7 – базовый микропроцессор CКСН IBM PERCS Кристалл Power 7 Одно многоядерное ядро (Core) • 8 ядер, в каждом ядре 4 треда, SMT-мультитредовость, • запуск в одном ядре 6 команд за такт; • - в одном мультитредовом ядре 12 функциональных • устройств: FXU -2, FPU – 4, LSU -2, VSX – 1, BRU – 1, • СRU-1, DFU -1; • объем кэш-памяти L3 – 32 Мбайт, 2 контроллера • внешней DRAM - памяти; • 32 сокета на плате, т.е. 1024 треда над общей памятью • кристалл – 567 мм2 , 1.2 млрд.транзисторов, 4 Ггц.
Модифицированная сеть Клоса – коммуникационная сеть СКСН IBM PERCS Обычная свернутая сеть Клоса, при передачах проходят несколько линков, но это лучше, чем для сетей N-тор Сеть IBM PERCS, при большинстве передач проходят только один линк, лучше, чем для сети Клоса
Многоядерный мультитредово-потоковый микропроцессор СКСН “Ангара” (вариант J10)
Какие характеристики можно ожидать от перспективных СКСН ? Результаты оценочных тестовых экспериментов на имитационной архитектурной модели российской перспективной СКСН “Ангара”(данные по зарубежным перспективным СКСН пока недоступны, ожидаются в 2010 году)
APEX-поверхности для микропроцессоров разного типа и узла СКСН “Ангара”
APEX-поверхности для мультипроцессорных систем разного типа(256 узлов) и СКСН “Ангара”
Эффективность СКСН “Ангара” на тесте умножения разреженной матрицы на вектор J7-2 J10-4
Эффективность СКСН “Ангара”на тесте BFS работы с графами
Какие изменения происходят в области коммерчески доступной элементной базы “новой волны”и вычислительных средств?“Вынужденные” решенияпроблемы стены памяти из-за появления многоядерных микропроцессоров.Требуемого стратегическими приложениями решения проблемы стены памяти пока нет, хотя стало полегче…
Ослабление закона Мура, многоядерные микропроцессоры
Прогнозируемые общие изменения микроархитектуры процессоров • применение малой и существенной мультитредовости • применение гомогенных и гетерогенных реконфигурируемых полей ядер • увеличение пропускной способности интерфейса с памятью и сетью • обеспечение эффективной работы с глобально адресуемой памятью
Многосокетная плата нового поколения с микропроцессорами AMD (HyperTransport-!)
Многосокетные платы нового поколения с микропроцессорами Intel (QuickPath - !)
Реальная производительность одной многосокетной платы на задаче UA расчета на структурированной динамически изменяемой сетке.
Динамика изменений среднего времени обращения к памяти для разной пространственно-временной локализации и разной мультитредовости.
Динамика изменений среднего времени обращения к памяти для лучшей и худшей точки APEX-поверхности
Сравнение современных многоядерных микропроцессоров и многосокетных плат с массово-мультитредовыми микропроцессорамиперспективных СКСН. Задача CG, класс C.
Что будет после достижения целей DARPA HPCS и похожих других программ создания стратегических СКСН?Прогнозы и планы дальнейшего развития в соответствии с Федеральным планом США2004 года по возрождению работ в области стратегических информационных технологий
Экзафлопсная перспектива 2020 года ( усиление тредового и потокового параллелизма) Додекатрон
Оценки предельных возможностей использования кремниевой элементной базы при построении высокопроизводительных систем (ноябрь 2004, Sandia Lab). Peta – 1015 , Exa – 1018 , Zetta – 1021 , Yotta – 1023 1 – обычная кремеиевая технология, программируемые микропроцессоры 2 – бычная кремниемая технология, но прямая аппаратная реализация решателей задач 3 – новая технология с транзисторами на квантовых точках и реверсивной логике, программируемые средства - зеленая линия, прямая аппаратная реализация - красная