1 / 66

Что такое ГРИД ?

Что такое ГРИД ?. Олешко С.Б. Петербургский институт ядерной физики г.Гатчина. Немного истории. 1964 год – фирма IBM создаёт семейство машин IBM360 (System 360). Это первые компьютеры третьего поколения (на интегральных микросхемах)

Download Presentation

Что такое ГРИД ?

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Что такое ГРИД? Олешко С.Б. Петербургский институт ядерной физики г.Гатчина

  2. Немного истории • 1964 год – фирма IBM создаёт семейство машин IBM360 (System 360). Это первые компьютеры третьего поколения (на интегральных микросхемах) • В СССР IBM/360 была клонирована под названием ЕС ЭВМ. Они были программно совместимы со своими американскими прообразами • Считается, что семейство System 360является первым мейнфреймом. Мейнфрейм - это главный компьютер вычислительного центра с большим объемом внутренней и внешней памяти • До 80-х годов развитие мейнфреймов определяло общее развитие вычислительной техники

  3. IBM360 (System 360).

  4. Суперкомпьютеры • В общем случае, суперкомпьютер — это компьютер значительно более мощный, чем доступные для большинства пользователей машины • Появление термина “суперкомпьютер” принято связывать с компьютерными системами Сеймура Крея (CDC 6600, CDC 7600, Cray-1, Cray-2) • Переход от скалярных процессоров к векторным процессорам, затем к параллельной работе нескольких векторных процессоров

  5. Cray-2

  6. Микропроцессоры и ПК • В конце 70-х - начале 80-х годов прогресс в развитии микропроцессоров привёл к появлению персональных компьютеров. • Это же привело к смене магистрального направления развития суперкомпьютеров от векторно-конвейерной обработки к большому и сверхбольшому числу параллельно соединённых скалярных процессоров. • Сейчас массивно-параллельные системы могут объединять в себе сотни и даже тысячи отдельных процессорных элементов

  7. Мировой рейтинг Top500 • Первое место - суперкомпьютер IBM Roadrunner, установленный в американской Национальной лаборатории в Лос-Аламосе, насчитывающий 129600 ядер. Его мощность составила 1105 терафлоп (флоп - число операций с плавающей запятой в секунду). Программа работ полностью засекречена.

  8. IBM Roadrunner

  9. Мировой рейтинг Top500 • Второй - суперкомпьютер Cray XT5 (Jaguar), установленный в Окридже (США), 150152 ядер. Мощность - 1059 терафлоп в секунду

  10. Cray XT5 (Jaguar)

  11. Кластеры • Кластер – это система, в которых серийные процессорные модули объединены высокоскоростными коммутационно-связными средствами локальных сетей • Преимущества: • меньшая стоимость • надёжность • можно наращивать вычислительную мощность • стандартизация программного обеспечения

  12. Суперкомпьютеры в России • СК "МВС-100K" - HP Cluster Platform на базе 4-ядерных процессоров Xeon 5400 (7920 процессорных ядер ). Расположен в Межведомственном суперкомпьютерном центре в Москве. Мощность – 71,28 терафлоп.

  13. Суперкомпьютеры в России Кластер T-Platforms T60, расположенный в МГУ им Ломоносова (5000 ядер). Мощность – 47 терафлоп.

  14. Кластер Беовульф (Beowulf) • Беовульф – это мультикомпьютерная архитектура, которая может использоваться для параллельных вычислений. • Это система, обычно состоящая из одного серверного узла и одного или более клиентских узлов, соединенных при помощи некоторой сети. • Это система, построенная из готовых промышленных компонент, например ПК, на которых может работать ОС Linux • Она не содержит специфических аппаратных компонентов и легко воспроизводима • Серверный узел управляет всем кластером и является файл-сервером для клиентских узлов. Он также является консолью кластера и шлюзом во внешнюю сеть.

  15. Кластер ПИЯФ

  16. Кластер ПИЯФ

  17. Кластер ПИЯФ

  18. Сетевые технологии • Развитие технологий локальных сетей • Появление глобальных компьютерных сетей, прежде всего – Интернет • технологии (программы и аппаратура) • инфраструктура (каналы передачи данных) • распределённые ресурсы • стандарты • пользователи

  19. Грид и распределённые вычисления Распределённые вычислительные инфраструктуры существовали и до Грид, но …. • обычно они представляют собойлокальные или специализированные системы • созданные для одной определённой цели или для отдельной группы пользователей • обычно количество пользователей ограничено • не допускается совместное использование ресурсов других организаций

  20. Грид и распределённые вычисления Грид идёт дальше и предполагает: • Различные типы ресурсов • не всегда одинаковые аппаратная часть, данные, приложения и политика администрирования • Различные способы взаимодействия • различные группы приложений хотят взаимодействовать с Грид различными способами • Доступ к ресурсам через границы административных доменов для неограниченного количества не локальных пользователей • Динамическая природа ресурсов • Ресурсы часто добавляются/удаляются/изменяются • Масштабируемость до всемирных размеров

  21. Для чего это нужно? Физика высоких энергий симуляция, реконструкция, анализ, … Медицина / Здравоохранение отображение, диагностика и лечение Биоинформатика геном человека, поиск новых лекарств, … Нанотехнологии разработка новых материалов на молекулярном уровнe Инженерия авиационная безопасность, проектирование… Природные ресурсы и Окружающая среда прогноз погоды, прогнозирование наводнений, … Термоядерный синтез проект ITER Материаловедение

  22. 9 12 18 Предпосылки Грид • Стремительное развитие сетевой транспортной среды и технологий высокоскоростной передачи данных. • скорости сетей удваиваются каждые 9 месяцев • 1986 – 2000 : x 340 000 • 2001 – 2010 : x 4000 • Наличие во многих организациях высокопроизводительных вычислительных ресурсов (часто кластеров) • вычислительные скорости удваиваются каждые 18 месяцев • 1986 – 2000 : x 500 • 2001 – 2010 : x 60 • Развитие традиционных Интернет- технологий • Необходимость решения сложных научных, инженерных и бизнес-задач Волоконно-оптическая связь (бит/сек) Кристаллы памяти (бит/кв. дюйм) Производительность на затраченный доллар Кристаллы процессоров (число транзисторов) 0 1 2 3 4 5 Количество лет

  23. Что такое Грид ТерминГРИДбыл выбран по аналогии с энергетическими сетями (electric power grid) подобно тому, как при использовании энергосистем мы не интересуемся – какой конкретный электрогенератор выработал ток, который мы потребляем, при использовании компьютерного грида мы можем не заботиться о том - какой конкретно компьютер (или устройство хранения/передачи данных) в грид-системе выполнил нашу задачу

  24. Интернет Что такое Грид Грид – это множество компьютеров • (суперкомпьютеры, кластеры, персональные компьютеры, …), средств хранения данных, специальных устройств, служб, которые могут динамически входить и покидать Грид-систему. • Они гетерогенны во всех аспектах • Они могут быть географически распределены и соединены скоростными сетями передачи данных • Они могут быть доступны по запросу для некоторого множества пользователей

  25. Что такое Грид Грид призван обеспечить возможность делать компьютерные вычисления «по требованию» просто подключившись к «решетке» вычислительных ресурсов.

  26. Что такое Грид Опять аналогия В энергосетях определяющую роль играют: технологиипередачи и (пере)распределения электроэнергии на большие большие расстояния; инфраструктура- аппаратные средства (повышающие/понижающие подстанции, линии электропередач, другое электрооборудование, позволяющее электростанциям предоставлять энергию потребителям) и соответствующие службы (ремонта, контроля и т.д.); стандарты– параметры электрического тока (напряжение в сети, частота), типы и размеры вилок/розеток, позволяющие без проблем подключать любой электроприбор к единой сети.

  27. Что такое Грид Также как и электрические сети, грид это соединение • технологии, • инфраструктуры • стандартов.

  28. Что такое Грид Технология это специальное программное обеспечение, которое позволяет организациям или частным лицам предоставлять ресурсы (компьютеры, хранилища данных, сети и другие) в общее пользование, а потребителям – использовать их, когда необходимо.

  29. Что такое Грид Инфраструктура состоит из • аппаратных средств и • служб (на основе людских и программных ресурсов), которые должны быть организованы, и постоянно поддерживаться для того, чтобы ресурсы могли совместно использоваться.

  30. Что такое Грид Стандарты должны определять • формат и • протоколы обмена сообщениями, как между службами, так и между службами и пользователями, а также правила работы грида.

  31. История 1985–1995Программа Национального Научного Фонда США«National Science Foundation (NSF) Supercomputer Centers». Октябрь 1997 NSF инициировал новую программу развития информационных технологий – Partnerships for Advanced Computational Infrastructure (PACI). 1998Создан (и успешно развивается) инструментальный пакет Globus Toolkit. 1999 Сформировалось(и активно действует) международное научное Грид-сообщество –Global Grid Forum (GGF) 2002 GGF и IBM была представлена новая системная разработка – Open Grid Service Architecture (OGSA). 2003Создано объединение Enterprise Grid Alliance (EGA) 2006GGF и EGA объявили о слиянии и образованииOpen Grid Forum (OGF)

  32. Что такое Грид Отдельный компьютер (РС) Прикладное ПО Операционная система РС Ресурсы РС Диски, процессор, память …

  33. Что такое Грид Отдельный компьютер Прикладное ПО Операционная система Ресурсы РС Локальная сеть Прикладное ПО Промежуточное ПОдля соединения с другими узлами (компьютеры, серверы, …) Операционная система каждого узла Ресурсыузла

  34. Что такое Грид Отдельный компьютер Локальная сеть Прикладное ПО Прикладное ПО Промежуточное ПОдля соединения с другими узлами Операционная система Операционная система каждого узла Ресурсы РС Ресурсыузла Следующий шаг - Грид Прикладное ПО Промежуточное ПОдля соединения с другими локальными сетями… Промежуточное ПОдля соединения с другими узлами (компьютеры, серверы, …) Операционная система каждого узла Ресурсыузла

  35. WWW и Грид World Wide Webобеспечивает доступ кинформации, которая находится в миллионах различных серверов, географически распределённых по всему миру В отличии от WWW:ГРИД– это новая вычислительная инфраструктура, которая обеспечивает бесперебойный доступ квычислительным мощностям и ресурсам хранения данных, распределённых по всему миру

  36. ППО Грид (middleware) • ”Прозрачное” взаимодействие между гетерогенными ресурсами (принадлежащих различным, географически распределённым организациям), приложениями и пользователями возможно только при помощи… • использования специализированного программного обеспечения, называемого middleware • Middleware “скрывает” технические детали Грид-инфраструктуры и обеспечивает безопасную интеграцию/распределение ресурсов интернет-протоколы не обеспечивают безопасный механизм доступа к разделяемым ресурсам

  37. Мобильный доступ G R I D M I D D L E W A R E Суперкомпьютера, PC-кластеры Рабочие станции Хранилища данных, эксперименты, … Визуализация Internet, сети ППО Грид (middleware)

  38. Использование Грид • Организация эффективного использования ресурсов для небольших задач, с утилизаций временно простаивающих компьютерных ресурсов • Распределенные супервычисления, решение очень крупных задач, требующих огромных процессорных ресурсов, памяти и т.д. • Вычисления с привлечением больших объемов географически распределенных данных, например, в метеорологии, астрономии, физике высоких энергий • Коллективные вычисления, в которых одновременно принимают участие пользователи из различных организаций

  39. Проект SETI@home • Поиск следов внеземных цивилизаций • Обработка данных, полученных радиотелескопом Аресибо • Около 5 млн. участников • 1200 CPU лет в день • Постоянная вычислительная мощность ~34 TF (примерно такая, какая достигнута в Симуляторе Земли в Японии) • Высокая степень гетерогенности ресурсов - >77 различных типов процессоров

  40. Проект GIMPS • http://www.mersenne.org/ • Поиск простых чисел Мерсенна. Числа Мерсенна имеют вид Mp = 2p – 1, где p-простое • Самое большое известное на данный момент простое число M43112609 = 243112609 − 1 было найдено в рамках проекта GIMPS в августе 2008 года. Оно состоит из 12,978,189 цифр!! • Ресурсы (на 10.06.2009): • команд – 216 • участников – 20888 • CPUs – 115601 • мощность - 38.497 терафлоп

  41. Проект WISDOM • Приложение Drug Discovery, позволяющее вычислять вероятность прямого контакта между потенциальным лекарством и белком-мишенью • Первый в истории биомедицины сеанс массовой обработки данных (малярия) • Исследовано 46 миллионов посадочных лиганд • Получено более 1 Тб данных • Использованы ~1000 компьютеров из 15 стран, что составляет ~ 80 машино/лет • Средний фактор ускорения – 600 • Второй сеанс (птичий грипп) • Использованы ~5000 компьютеров из 27 стран, что составляет ~ 420 машино/лет • Получено более 2 Тб данных • Средний фактор ускорения – 2000

  42. О ЦЕРНе (CERN) • Расположен на границе Щвейцарии-Франции. Крупнейший в мире исследовательский центр по ФВЭ • Работают представители ~500 университетов и институтов (штат~2500чел., 6500 визитеров из ~40 стран) • Сделано много открытий и разработано много новых технологии, включаяWWW. • Большинство Нобелевских лауреатов по физике последних лет так или иначе связаны с ЦЕРН.

  43. Большой адронный коллайдер (LHC) Длина окружности ускорителя – 27 км. Запуск перенесён на 2009 год

  44. Что такое БАК? • Энергия столкновения пучков протонов – 14 TeV • Используя новейшие сверхпроводящие технологии он будет работать при температуре –271°C, т.е. немного выше абсолютного нуля • С общей длиной в 27 км ускоритель будет самой большой сверхпроводящей установкой в мире

  45. Эксперименты на БАК

  46. Место для детектора ATLAS

  47. Детектор ATLAS

  48. Детектор ATLAS

  49. Как будет работать БАК

  50. Результаты Начиная с такого набора событий: Необходимо найти такое: Селективность (степень отбора) ~ 1 из 1013, что примерно соответствует поиску иголки в 20 миллионах стогах сена!!!

More Related