150 likes | 323 Views
Клеточно-автоматные модели диффузионного процесса. Участники проекта: Кузнецов Дмитрий, Михайлов Александр, Спешилов Константин. Руководитель: Медведев Ю.Г. План доклада. Булева синхронная модель Булева асинхронная модель Целочисленная асинхронная модель Целочисленная синхронная модель
E N D
Клеточно-автоматные модели диффузионного процесса Участники проекта: Кузнецов Дмитрий, Михайлов Александр, Спешилов Константин. Руководитель: Медведев Ю.Г.
План доклада • Булева синхронная модель • Булева асинхронная модель • Целочисленная асинхронная модель • Целочисленная синхронная модель • Сравнение синхронной и асинхронной моделей • Уравнение диффузии • Система диффузионной обработки изображений • Параллельная реализация алгоритмов диффузии
Синхронныйбулев КА • Состояния клеток: 0, либо 1. • Такт: • Вся область разбивается на блоки по 4 клетки • Клетки блока меняются состояниями равновероятно по или против часовой стрелки • Итерация состоит из двух тактов: четного и нечетного. • 2 способа обработки граничных клеток • Замыкание • Не обрабатываются
Асинхронный булев КА • Состояния клеток: 0, либо 1. • Микроитерация: • Случайным образом выбирается одна клетка области • Выбирается направление обмена (один из 4х соседей) • Выбранные две клетки меняются состояниями • Одна итерация это N микроитераций, N — количество клеток в автомате.
Асинхронный целочисленный КА • Микроитерация: • Случайным образом выбирается одна клетка области • Выбирается направление обмена (один из 4х соседей) • Частицы в клетках делятся на две части в пропорции k : (1-k): • активные • пассивные • Выбранные две клетки меняются активными частями • Одна итерация это N микроитераций, N — количество клеток в автомате.
Синхронный целочисленный КА • Такт: • Вся область разбивается на блоки по 4 клетки • Выделяется активная часть клеток, аналогично асинхронному автомату • Клетки блока меняются активными частями равновероятно по или против часовой стрелки • Итерация состоит из двух тактов: четного и нечетного.
Сравнение синхронного и асинхронного КА • Экспериментально было обнаружено, что для достаточно гладких исходных распределений скорость диффузии, представляемой синхронным и асинхронным автоматами одинакова при использовании одного коэффициента диффузии КА k, однако для этих автоматов различны линейные масштабы. • Выявлен коэффициент пропорциональности между линейными масштабами: m = 1.16 • Это означает, что если реализован один из КА (синхронный, либо асинхронный), можно получить распределение, которое дал бы второй КА.
Диффузия, описываемая ДУ • Процесс беспорядочного блуждания частиц, который приводит к выравниванию концентрации вещества в пространстве, называется диффузией. • В двумерном непрерывном случае при постоянном коэффициенте диффузии d процесс описывается уравнением Лапласа: • u(x,y,t) — концентрация вещества в точке с координатами x,y в момент времени t. • Недостатки моделирования диффузии с помощью ДУ: • Использование вещественных чисел связано с потерей точности в вычислениях. • Для высокой точности результата нужно решать ДУ на достаточно подробных сетках, что требует много ресурсов и длительного времени вычисления
Система диффузионной обработки изображений
Метод – Domain decomposition Разбиение по процессам по одному измерению 2 метода измерения времени Пропорциональный Непропорциональный 2 метода реализации Блокирующая(MPI_Send, MPI_Recv) Неблокирующая(MPI_Isend, MPI_Irecv, MPI_Wait) Параллельная реализация синхронных клеточных автоматов
Использовавшиеся кластеры • НКС-30Т • Управляющий модуль - • hp ProLiant DL380 G5 - • 2 процессора Intel Quad-Core • Xeon E5440, 2.83 ГГц, RAM 8 ГБайт • Вычислительный блейд-сервер • hp ProLiant BL2x220c ( 32 шт.) - • 2 сервера по 2 процессора Intel Quad-Core • Xeon Е5450, 3 ГГц, RAM 16 ГБайт • всего 128 процессоров (512 ядер) • пиковая производительность – 6.1 Тфлопс • МВС-100К • с пиковой производительностью 140,16 TFlops в настоящий момент является самым мощным суперкомпьютером, установленным в странах СНГ. В его состав входят 1460 вычислительных модуля, каждый из которых оснащён двумя четырёхядерными процессорами Intel Xeon, работающими на частоте 3 ГГц. Для объединения узлов кластера в единое решающее поле используется технология Infiniband.
Время обработки одной клетки на одной итерации 256 процессорами. Размеры задачи – массив 100000х250, 100 итераций
Эффективность распараллеливания. Размеры задачи – массив 100000х250, 100 итераций