660 likes | 862 Views
Что такое ГРИД ?. Олешко С.Б. Петербургский институт ядерной физики г.Гатчина. Немного истории. 1964 год – фирма IBM создаёт семейство машин IBM360 (System 360). Это первые компьютеры третьего поколения (на интегральных микросхемах)
E N D
Что такое ГРИД? Олешко С.Б. Петербургский институт ядерной физики г.Гатчина
Немного истории • 1964 год – фирма IBM создаёт семейство машин IBM360 (System 360). Это первые компьютеры третьего поколения (на интегральных микросхемах) • В СССР IBM/360 была клонирована под названием ЕС ЭВМ. Они были программно совместимы со своими американскими прообразами • Считается, что семейство System 360является первым мейнфреймом. Мейнфрейм - это главный компьютер вычислительного центра с большим объемом внутренней и внешней памяти • До 80-х годов развитие мейнфреймов определяло общее развитие вычислительной техники
Суперкомпьютеры • В общем случае, суперкомпьютер — это компьютер значительно более мощный, чем доступные для большинства пользователей машины • Появление термина “суперкомпьютер” принято связывать с компьютерными системами Сеймура Крея (CDC 6600, CDC 7600, Cray-1, Cray-2) • Переход от скалярных процессоров к векторным процессорам, затем к параллельной работе нескольких векторных процессоров
Микропроцессоры и ПК • В конце 70-х - начале 80-х годов прогресс в развитии микропроцессоров привёл к появлению персональных компьютеров. • Это же привело к смене магистрального направления развития суперкомпьютеров от векторно-конвейерной обработки к большому и сверхбольшому числу параллельно соединённых скалярных процессоров. • Сейчас массивно-параллельные системы могут объединять в себе сотни и даже тысячи отдельных процессорных элементов
Мировой рейтинг Top500 • Первое место - суперкомпьютер IBM Roadrunner, установленный в американской Национальной лаборатории в Лос-Аламосе, насчитывающий 129600 ядер. Его мощность составила 1105 терафлоп (флоп - число операций с плавающей запятой в секунду). Программа работ полностью засекречена.
Мировой рейтинг Top500 • Второй - суперкомпьютер Cray XT5 (Jaguar), установленный в Окридже (США), 150152 ядер. Мощность - 1059 терафлоп в секунду
Кластеры • Кластер – это система, в которых серийные процессорные модули объединены высокоскоростными коммутационно-связными средствами локальных сетей • Преимущества: • меньшая стоимость • надёжность • можно наращивать вычислительную мощность • стандартизация программного обеспечения
Суперкомпьютеры в России • СК "МВС-100K" - HP Cluster Platform на базе 4-ядерных процессоров Xeon 5400 (7920 процессорных ядер ). Расположен в Межведомственном суперкомпьютерном центре в Москве. Мощность – 71,28 терафлоп.
Суперкомпьютеры в России Кластер T-Platforms T60, расположенный в МГУ им Ломоносова (5000 ядер). Мощность – 47 терафлоп.
Кластер Беовульф (Beowulf) • Беовульф – это мультикомпьютерная архитектура, которая может использоваться для параллельных вычислений. • Это система, обычно состоящая из одного серверного узла и одного или более клиентских узлов, соединенных при помощи некоторой сети. • Это система, построенная из готовых промышленных компонент, например ПК, на которых может работать ОС Linux • Она не содержит специфических аппаратных компонентов и легко воспроизводима • Серверный узел управляет всем кластером и является файл-сервером для клиентских узлов. Он также является консолью кластера и шлюзом во внешнюю сеть.
Сетевые технологии • Развитие технологий локальных сетей • Появление глобальных компьютерных сетей, прежде всего – Интернет • технологии (программы и аппаратура) • инфраструктура (каналы передачи данных) • распределённые ресурсы • стандарты • пользователи
Грид и распределённые вычисления Распределённые вычислительные инфраструктуры существовали и до Грид, но …. • обычно они представляют собойлокальные или специализированные системы • созданные для одной определённой цели или для отдельной группы пользователей • обычно количество пользователей ограничено • не допускается совместное использование ресурсов других организаций
Грид и распределённые вычисления Грид идёт дальше и предполагает: • Различные типы ресурсов • не всегда одинаковые аппаратная часть, данные, приложения и политика администрирования • Различные способы взаимодействия • различные группы приложений хотят взаимодействовать с Грид различными способами • Доступ к ресурсам через границы административных доменов для неограниченного количества не локальных пользователей • Динамическая природа ресурсов • Ресурсы часто добавляются/удаляются/изменяются • Масштабируемость до всемирных размеров
Для чего это нужно? Физика высоких энергий симуляция, реконструкция, анализ, … Медицина / Здравоохранение отображение, диагностика и лечение Биоинформатика геном человека, поиск новых лекарств, … Нанотехнологии разработка новых материалов на молекулярном уровнe Инженерия авиационная безопасность, проектирование… Природные ресурсы и Окружающая среда прогноз погоды, прогнозирование наводнений, … Термоядерный синтез проект ITER Материаловедение
9 12 18 Предпосылки Грид • Стремительное развитие сетевой транспортной среды и технологий высокоскоростной передачи данных. • скорости сетей удваиваются каждые 9 месяцев • 1986 – 2000 : x 340 000 • 2001 – 2010 : x 4000 • Наличие во многих организациях высокопроизводительных вычислительных ресурсов (часто кластеров) • вычислительные скорости удваиваются каждые 18 месяцев • 1986 – 2000 : x 500 • 2001 – 2010 : x 60 • Развитие традиционных Интернет- технологий • Необходимость решения сложных научных, инженерных и бизнес-задач Волоконно-оптическая связь (бит/сек) Кристаллы памяти (бит/кв. дюйм) Производительность на затраченный доллар Кристаллы процессоров (число транзисторов) 0 1 2 3 4 5 Количество лет
Что такое Грид ТерминГРИДбыл выбран по аналогии с энергетическими сетями (electric power grid) подобно тому, как при использовании энергосистем мы не интересуемся – какой конкретный электрогенератор выработал ток, который мы потребляем, при использовании компьютерного грида мы можем не заботиться о том - какой конкретно компьютер (или устройство хранения/передачи данных) в грид-системе выполнил нашу задачу
Интернет Что такое Грид Грид – это множество компьютеров • (суперкомпьютеры, кластеры, персональные компьютеры, …), средств хранения данных, специальных устройств, служб, которые могут динамически входить и покидать Грид-систему. • Они гетерогенны во всех аспектах • Они могут быть географически распределены и соединены скоростными сетями передачи данных • Они могут быть доступны по запросу для некоторого множества пользователей
Что такое Грид Грид призван обеспечить возможность делать компьютерные вычисления «по требованию» просто подключившись к «решетке» вычислительных ресурсов.
„ Что такое Грид Опять аналогия В энергосетях определяющую роль играют: технологиипередачи и (пере)распределения электроэнергии на большие большие расстояния; инфраструктура- аппаратные средства (повышающие/понижающие подстанции, линии электропередач, другое электрооборудование, позволяющее электростанциям предоставлять энергию потребителям) и соответствующие службы (ремонта, контроля и т.д.); стандарты– параметры электрического тока (напряжение в сети, частота), типы и размеры вилок/розеток, позволяющие без проблем подключать любой электроприбор к единой сети.
Что такое Грид Также как и электрические сети, грид это соединение • технологии, • инфраструктуры • стандартов.
Что такое Грид Технология это специальное программное обеспечение, которое позволяет организациям или частным лицам предоставлять ресурсы (компьютеры, хранилища данных, сети и другие) в общее пользование, а потребителям – использовать их, когда необходимо.
Что такое Грид Инфраструктура состоит из • аппаратных средств и • служб (на основе людских и программных ресурсов), которые должны быть организованы, и постоянно поддерживаться для того, чтобы ресурсы могли совместно использоваться.
Что такое Грид Стандарты должны определять • формат и • протоколы обмена сообщениями, как между службами, так и между службами и пользователями, а также правила работы грида.
История 1985–1995Программа Национального Научного Фонда США«National Science Foundation (NSF) Supercomputer Centers». Октябрь 1997 NSF инициировал новую программу развития информационных технологий – Partnerships for Advanced Computational Infrastructure (PACI). 1998Создан (и успешно развивается) инструментальный пакет Globus Toolkit. 1999 Сформировалось(и активно действует) международное научное Грид-сообщество –Global Grid Forum (GGF) 2002 GGF и IBM была представлена новая системная разработка – Open Grid Service Architecture (OGSA). 2003Создано объединение Enterprise Grid Alliance (EGA) 2006GGF и EGA объявили о слиянии и образованииOpen Grid Forum (OGF)
Что такое Грид Отдельный компьютер (РС) Прикладное ПО Операционная система РС Ресурсы РС Диски, процессор, память …
Что такое Грид Отдельный компьютер Прикладное ПО Операционная система Ресурсы РС Локальная сеть Прикладное ПО Промежуточное ПОдля соединения с другими узлами (компьютеры, серверы, …) Операционная система каждого узла Ресурсыузла
Что такое Грид Отдельный компьютер Локальная сеть Прикладное ПО Прикладное ПО Промежуточное ПОдля соединения с другими узлами Операционная система Операционная система каждого узла Ресурсы РС Ресурсыузла Следующий шаг - Грид Прикладное ПО Промежуточное ПОдля соединения с другими локальными сетями… Промежуточное ПОдля соединения с другими узлами (компьютеры, серверы, …) Операционная система каждого узла Ресурсыузла
WWW и Грид World Wide Webобеспечивает доступ кинформации, которая находится в миллионах различных серверов, географически распределённых по всему миру В отличии от WWW:ГРИД– это новая вычислительная инфраструктура, которая обеспечивает бесперебойный доступ квычислительным мощностям и ресурсам хранения данных, распределённых по всему миру
ППО Грид (middleware) • ”Прозрачное” взаимодействие между гетерогенными ресурсами (принадлежащих различным, географически распределённым организациям), приложениями и пользователями возможно только при помощи… • использования специализированного программного обеспечения, называемого middleware • Middleware “скрывает” технические детали Грид-инфраструктуры и обеспечивает безопасную интеграцию/распределение ресурсов интернет-протоколы не обеспечивают безопасный механизм доступа к разделяемым ресурсам
Мобильный доступ G R I D M I D D L E W A R E Суперкомпьютера, PC-кластеры Рабочие станции Хранилища данных, эксперименты, … Визуализация Internet, сети ППО Грид (middleware)
Использование Грид • Организация эффективного использования ресурсов для небольших задач, с утилизаций временно простаивающих компьютерных ресурсов • Распределенные супервычисления, решение очень крупных задач, требующих огромных процессорных ресурсов, памяти и т.д. • Вычисления с привлечением больших объемов географически распределенных данных, например, в метеорологии, астрономии, физике высоких энергий • Коллективные вычисления, в которых одновременно принимают участие пользователи из различных организаций
Проект SETI@home • Поиск следов внеземных цивилизаций • Обработка данных, полученных радиотелескопом Аресибо • Около 5 млн. участников • 1200 CPU лет в день • Постоянная вычислительная мощность ~34 TF (примерно такая, какая достигнута в Симуляторе Земли в Японии) • Высокая степень гетерогенности ресурсов - >77 различных типов процессоров
Проект GIMPS • http://www.mersenne.org/ • Поиск простых чисел Мерсенна. Числа Мерсенна имеют вид Mp = 2p – 1, где p-простое • Самое большое известное на данный момент простое число M43112609 = 243112609 − 1 было найдено в рамках проекта GIMPS в августе 2008 года. Оно состоит из 12,978,189 цифр!! • Ресурсы (на 10.06.2009): • команд – 216 • участников – 20888 • CPUs – 115601 • мощность - 38.497 терафлоп
Проект WISDOM • Приложение Drug Discovery, позволяющее вычислять вероятность прямого контакта между потенциальным лекарством и белком-мишенью • Первый в истории биомедицины сеанс массовой обработки данных (малярия) • Исследовано 46 миллионов посадочных лиганд • Получено более 1 Тб данных • Использованы ~1000 компьютеров из 15 стран, что составляет ~ 80 машино/лет • Средний фактор ускорения – 600 • Второй сеанс (птичий грипп) • Использованы ~5000 компьютеров из 27 стран, что составляет ~ 420 машино/лет • Получено более 2 Тб данных • Средний фактор ускорения – 2000
О ЦЕРНе (CERN) • Расположен на границе Щвейцарии-Франции. Крупнейший в мире исследовательский центр по ФВЭ • Работают представители ~500 университетов и институтов (штат~2500чел., 6500 визитеров из ~40 стран) • Сделано много открытий и разработано много новых технологии, включаяWWW. • Большинство Нобелевских лауреатов по физике последних лет так или иначе связаны с ЦЕРН.
Большой адронный коллайдер (LHC) Длина окружности ускорителя – 27 км. Запуск перенесён на 2009 год
Что такое БАК? • Энергия столкновения пучков протонов – 14 TeV • Используя новейшие сверхпроводящие технологии он будет работать при температуре –271°C, т.е. немного выше абсолютного нуля • С общей длиной в 27 км ускоритель будет самой большой сверхпроводящей установкой в мире
Результаты Начиная с такого набора событий: Необходимо найти такое: Селективность (степень отбора) ~ 1 из 1013, что примерно соответствует поиску иголки в 20 миллионах стогах сена!!!