1 / 20

Сергей Черепанов Ведущий специалист ЗАО «МЦСТ» mcst.ru

Микропроцессоры серии МЦСТ- R. Сергей Черепанов Ведущий специалист ЗАО «МЦСТ» http://www.mcst.ru. RISC архитектура 3 ревизии V7, V8: 32 -х битная V9 : 64-х битная Чипы делают SUN Fujitsu Gaisler Research ЗАО «МЦСТ». Архитектура SPARC. Микропроцессоры MCST - R 1.

kele
Download Presentation

Сергей Черепанов Ведущий специалист ЗАО «МЦСТ» mcst.ru

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Микропроцессоры серии МЦСТ-R Сергей Черепанов Ведущий специалист ЗАО «МЦСТ» http://www.mcst.ru

  2. RISC архитектура 3 ревизии V7, V8: 32-хбитная V9: 64-х битная Чипы делают SUN Fujitsu Gaisler Research ЗАО «МЦСТ» Архитектура SPARC

  3. Микропроцессоры MCST-R 1 • Универсальные микропроцессоры для целочисленных и плавающих вычислений • Лицензионная и патентная чистота • Полная аппаратная совместимость с архитектурой SPARC V8 • RISC-архитектура • 3-адресная команда • форматы данных • целочисленные 32 разряда • вещественные 32/64/128 разрядов • многооконный регистровый файл • Возможность использования большого массива стороннего программного обеспечения

  4. Микропроцессоры MCST-R 2

  5. 4 поколения микропроцессоров архитектуры SPARC V8 Процессы: 0.5–0.13um Частоты: 80–500 MHz Последний микропроцессор с архитектурой V8: MCST R500S Двухъядерная система на кристалле Пятистадийный конвейер (классический RISC) Технология изготовления: TSMC 0.13um LVLK Частота: 500 MHz Задачи при разработке микропроцессора следующего поколения Миграция на архитектуру V9 Суперскалярная микроархитектура Частота 1 GHz Поддержка ccNUMA Микропроцессоры MCST-R 3

  6. 4 процессорных ядра на чипе 2 Mb общей кэш-памяти L2 Интегрированный контроллер памяти DDR2 Объединение до 4-х чипов в ccNUMA систему без дополнительной логики Южный мост – отдельный чип (также разработан в МЦСТ) Доступ в южный мост по LVDS линку CORE0 CORE1 CORE2 CORE3 DDR2 SDRAM L2 IS Link 1 IS Link 0 IS Link 2 Coherency Controller Memory Controller System Link Controller 0 System Link Controller 2 System Link Controller 1 Switch 6x6 Host Bridge IO Link Controller IO Link MCST-4R:система на кристалле Функциональная схема MCST-4R

  7. MCST-4R: SPARC ядро Вычислительное ядро MCST-R • Набор инструкций SPARC V9 • SIMD расширения VIS • Операция сложения с умножением • 7-тактный целочисленный конвейер • Суперскалярное выполнение инструкций • Статическое планирование • Операции IU0: • Сложение/сдвиг/логические • Генератор адреса обращения в память • Операции IU1 • Сложение/сдвиг/логические • Умножение • Деление

  8. MCST-4R:конвейер ядра 1 • Суперскалярный конвейер: 2 инструкции за такт • Возможные сочетания команд • integer+integer • integer+memory • integer+floating point • integer+control transfer • Целочисленный конвейер • Сложение/сдвиг/логические 1 такт • Доступ в кэш L1 3 такта • Умножение 6 тактов • Конвейер операций с плавающей точкой • Сложение 4 такта • Умножение 5 тактов • Сравнение 2 такта • Сложение с умножением 9 тактов • Деление 11/18 тактов

  9. MCST-4R:конвейер ядра 2

  10. 64-х разрядныйвиртуальный адрес, 40 разрядный физический адрес Все кэш-памяти первого уровня поддерживают доступ со стороны процессора И снупинг каждый такт L2 кэш поддреживает доступ со стороны процессора ИЛИ снупинг каждый такт Протокол когерентности кэш-памятей MOESI в L1 данных и L2 Шина данных между ядром и L2 шириной 256 бит TLB программно наполняемы L1 кэш данных с отложенной записью снижает требования к L2 по полосе пропускания MCST-4R:подсистема памяти

  11. Характеристики кэш-памятей: MCST-4R: кэш-памяти и TLB • Для достижения необходимой частоты сделаны двухуровневые TLB • TLB первого уровня: • Однотактный доступ • 8 строк • Полностью ассоциативный • TLB второго уровня: • Двухтактный доступ • Разделен на полностью ассоциативную часть и частично ассоциативную часть

  12. В МЦСТразработан ccNUMA протокол 3-х хоповый, на основе широковещательных сообщений Контроллер когерентности обнаруживает и разрешает конфликты Системные линки имеют ширину 16 бит, пропускная способность 1GT Линк ввода-вывода может быть использован для создания кластера в режиме RDMA DDR2 SDRAM DDR2 SDRAM DDR2 SDRAM DDR2 SDRAM SOUTH BRIDGE SPI Boot PROM МЦСТ-4R МЦСТ-4R SPD Ethernet SATA USB МЦСТ-4R МЦСТ-4R PCI-Express PCI MCST-4R:протокол ccNUMA Система на основе MCST-4R

  13. Маршрут проектирования: Standard cell’ы, тулы Synopsys Заказной маршрут: целочисленный регистровый файл 5 портов чтения (4 целочисленных операнда и 1 слово данных на запись) 3 портов записи (2 целочисленных результата и 1 результат из памяти) Целевая частота 1 GHz Разбалансировка дерева распространения синзросигнала RTL оптимизируется для достижения частоты Перемещение логики между ступенями конвейера (например предварительно декодированный код в кэш-памяти инструкций) Рассеиваемая мощность Автоматическое отключение синхросигнала на неработающей логике Ручное отключение синхросигнала на неработающей логике (например в FPU) Использование транзисторов с низким/средним/высоким порогом MCST-4R: Физический дизайн 1

  14. Синтез частоты для различных доменов синхронизации Deterministic fractional ratio clocking for DDR2 Other domains have integer clock ratio На приемнике LVDS линка нужен DLL DLL построен на standard cell’ах, охарактеризован в SPICE Площадь ядра: 7.6 mm² Площадь кристалла: ~115 mm² MCST-4R: Физический дизайн 2

  15. Широко используется автономное тестирование Симулятор системы позволяет отладить софт до появления аппаратуры Случайные и направленные тесты Самопроверка в RTL FPGA прототип MCST-4R: отладка Автономное тестирование кэш-памяти инструкций и устройства прерываний

  16. FPGA прототип построен на основеALTERA Stratix2 10 FPGA чипов: 4 чипа: ядра MCST-R(один чип на ядро) 4 чипа: L2 кэш 1 чип: интегрированный северный мост 1 чип: южный мост Основные ограничения: Контакты корпуса Емкость статических памятей (при макетировании L2) Частота: 50 MHz На прототипе успешно загружен Linux Макетирование на FPGA позволяет отладку по шагам: Linux заработал до окончания проектирования L2 и FPU MCST-4R: FPGA прототип

  17. Порт JTAG Программные точки останова Трассировка программы Полный доступ ко всем регистрам Выполнение теневой инструкции Встроенный логический анализатор Сбор сигналов Сбор трассы(одно или много ядер) Конфигурируемое оборудование Возможно отключить агрессивные оптимизации MCST-4R: отладка кристалла MCST-4R JTAG консоль

  18. Разработан компилятор С/С++ Общий фронт-енд, бэк-енд и промежуточное представление с VLIW проектом Использует технологии статического планирования, разработанные для VLIW Автоматическая векторизация при помощи VIS Автоматическое распараллеливание циклов на многоядерных системах Код лучше, чем из-под GCC Linux-SPARC64 работает на MCST-4R с небольшими изменениями MCST-4R: компилятор и ОС

  19. 1 GHz на техпроцессе TSMC 90nm с standard cell маршрутом проектирования Тестовые образцы ожидаются к концу 2010 г. Заключение Спасибо за внимание

  20. Сергей Черепанов, ЗАО «МЦСТ» Владимир Волин, ЗАО «МЦСТ» Авторы

More Related