1 / 38

Постановка задачи и связь с предыдущими исследованиями

Автоматическая система реального времени для обнаружения объектов и ориентиров на изображении, основанная на обработке цветных изображений Кий К.И . Институт Прикладной Математики им. Келдыша РАН , IKI Таруса 2010. Постановка задачи и связь с предыдущими исследованиями.

Download Presentation

Постановка задачи и связь с предыдущими исследованиями

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Автоматическая система реального времени для обнаружения объектов и ориентиров на изображении, основанная на обработке цветных изображенийКий К.И.Институт Прикладной Математики им. Келдыша РАН, IKIТаруса 2010

  2. Постановка задачи и связь с предыдущими исследованиями • Задача обобщенной сегментации цветных изображенийи поиска ориентиров • Выделить на цветном изображении однородные части реальных объектов и построить их сжатое описание, содержащие описание формы и полутоновое и цветовое описания без индексирования точек массива изображения. • Обеспечить выполнение процедур в реальном времени на современных мобильных компьютерах. • Задача примыкает к исследованиям по сегментации цветных изображенийи выделению объектов интереса (salient features). • Существенное отличие состоит в том, что мы не решаем задачу преобразования изображения в субъективно подобное, но использующее меньшие диапазоны цветов.

  3. Построение геометризованной гистограммы изображения Изображение, задаваемое скалярной функцией интенсивности (черно-белое, инфракрасное, и т.д.) I. Локальная конструкция • Изображение разбивается на узкие горизонтальные (вертикальные) полосы. • Каждое множествo уровня интенсивности проектируется на горизонтальную (вертикальную) ось. Его проекция является набором отрезков на горизонтальной (вертикальной) оси. Каждому интервалу предписывается его мощность (число точек полосы, спроектированных на этот интервал. • В соответствие каждой полосе изображения ставится в соответствие множество интервалов на горизонтальной вертикальной оси координатной системы изображения. Каждому интервалу предписано определенное значение интенсивности и мощности.

  4. Изображение, множество отрезков для всех уровней, и сгустки в полосе

  5. Кадр из Бури в Пустыне, описание полосы изображения

  6. Множество отрезков, соответствующее 20ой полосе полутоновой компоненты изображения

  7. Предложение.Описанное выше отрезковое описание полосы изображения может быть получено за один проход массива изображения полосы и сложность его получения линейно зависит от числа пикселов. Gi - множество интервалов, соответствующее i-ойполосе, называется геометризованной гистограммой этой полосы G=Gi- объединение геометризованных гистограмм для всех полос называется глобальной геометризованной гистограммой изображения, соответствующей заданному разбиению изображения на полосы. Если обозначить Bконечноеупорядоченное множество, нумерующее полосы, то мы можем рассмотреть проекцию p: G→B, слоямикоторой являются Gi.

  8. Топологические структуры на G, задаваемые неевклидовыми мерами близости • ri (I, J) = L(I∩J)/Si(I, J) i = 1, 2; • S1(I, J) = max (L(I), L(J)), • S2(I, J) = min (L(I), L(J)); • L(I), L(J), L(I∩J) - длины соответствующих отрезков; • di(I, J) =1 - ri(I, J) - соответствующие псевдо-метрики.

  9. Геометризованная гистограмма, соответствующая распределениям цвета • Цветовая компонента задается парой G/(G+B),G/(G+R)или G/(G+B),R/(R+B).Вместе с полутоновой компонентой I получаем систему координат G/(G+B),G/(G+R),Iи G/(G+B),R/(R+B),I, где (R, G, B) координаты стандартного представления цветных изображений. • Пары G/(G+B),G/(G+R) иG/(G+B),R/(R+B)задают представление цвета эквивалентное представлению, задаваемому парой (H,S)(оттенок, насыщение), так как любая пара однозначно определяет любую внутреннюю точку цветового треугольника. • Необходимо построить геометризованную гистограмму для заданного распределения цветов (цветного изображения), т.е. необходимо построить расслоение отрезков аналогичное расслоению отрезков для скалярной функции интенсивности.

  10. Стандартныйцветовой треугольник

  11. Системы координатG/(G+B), R/(R+B)и G/(G+B), G/(G+R)

  12. ИзображенияG/(G+B), G/(G+R), иGrayscale

  13. Изображение комнаты и его компоненты

  14. Изображение коридора и три его компоненты

  15. Изображение темного коридора и его компоненты

  16. Изображение дорожной обочины

  17. Построение геометризованной гистограммы для цветных изображений • Тривиальный способ: строится геометризованная гистограмма для компоненты G/(G+B)и дополнительно каждый интервал снабжается гистограммой распределения уклонения от среднего значения другого отношения, например G/(G+R), и дополнительно для каждого отрезка вычисляются верхнее и нижнее значение полутоновой компоненты. • Данный метод хорошо работает, например, на изображениях дорожных сцен на фоне растительности и плохо работает на сложных сценах со многими предметами разных цветов – объекты не различаются на уровне построения локальной геометризованной гистограммы. • Правильный метод состоит в учете обеих компонент G/(G+B)и G/(G+R)при построении системы отрезков локальной геометризованной гистограммы. Этот метод есть некоторая аналогия человеческой зрительной системы (теория Геринга трех стрелок измерительных приборов).

  18. Процедура расширения диапазона значений G/(G+B) • Рассмотрим случайG/(G+B) >= 0.5 (остальные случаи аналогичны). Пусть G/(G+B)принимает дискретные значения 0,…,k. • Если точка, определяемая парой G/(G+B), G/(G+R), имеет оттенок из желтой области, то расширенной функции CF=G/(G+B)extприсваивается значение G/(G+B). В случае если точка попадает в зеленой или красный диапазоны, значения G/(G+B)ext увеличиваются на k + 1 и 2(k + 1), соответственно. • Для CFстроится система интервалов в полосе также как это делалось для G/(G+B). Каждый интервал снабжается классической гистограммой уклонений значений G/(G+R)от среднего значения в точках полосы, соответствующих заданному интервалу, значением мощности интервала, и верхним, нижним и средним значением полутоновой компоненты.

  19. Корректировка функцииCFдля отделения бесцветных и темных компонент • Вводятся дополнительные значения CF, чтобы описывать объекты, которые имеют “наивный” белый, серый (светло-серый, темно-серый) и черный цвета. Кроме того темные но окрашенные компоненты интегрируются по аналогии с человеческим зрением. • Для каждой цветовой области устанавливаются свои правила (диапазоны значений полутоновой компоненты) принадлежности к определенному наивному цвету. • Данная процедура принудительным образом делает бесцветные компоненты однородными по отношению к полутону. • Темным компонентам присваиваются некоторые интегрированные цвета.

  20. Выделение однородных окрашенных интервалов геометризованной гистограммы • Полученные интервалы геометризованной гистограммы характеристической функции CF в зависимости от гистограммы уклонений оппонентного отношения (R/(R+B)или G/(G+R)) признаютсяоднородными или неоднородными в цветовом отношении. • Аналогичная процедура проводится для определения полутоновой однородности с рассмотрением ширины полутонового и диапазона и уклонения среднего значения от верхней и нижней границ диапазона.

  21. Процедура согласования результатов с человеческим зрением • Определение заметных и незаметных цветов окрашенных интервалов. • Основываясь на средних значениях и диапазонах численных характеристик окрашенных интервалов, их мощности, а также характеристик окружения по некоторым правилам определяется заметен ли сам интервал и его цвет.

  22. Пример геометризованной гистограммы с обработкой

  23. Процедуры построения сгустков (color bunches) интервалов в геометризованной гистограмме полосы • Выбираются интервалы имеющие однородный заметный цвет и сами признанные заметными. • Устраивается процедура выживания сильнейших интервалов. Интервалы бросаются на прямую и в каждой точке выживает сильнейший интервал (имеющий максимальную плотность). Данная процедура проделывается итеративно и в нескольких цветовых диапазонах. Интервалы упорядочиваются в зависимости от доли точек, в которых они выжили. Выжившие интервалы берутся как семена при построении кластеров. Кластеры строятся с помощью метрик, описанных выше. • Проводятся различные процедуры, устраняющие дублирование. Кластерам приписываются некоторые средние значения H (hue) и S(saturation) и I и диапазоны вариации их значенийа также интервал на оси полосы.

  24. Построение структурного графа • Вершины графа STG– цветовые сгустки для всех полос разбиения изображения. Граф разбивается на несколько слоев, каждый слой соответствует цветовым сгусткам одной полосы. • Определяются соседние цветовые сгустки в одинаковых слоях (соответствующих одной полосе) и в соседних слоях (соответствующих соседним полосам). Сгустки являются соседними если их интервалы пересекаются или близки в смысле близостей, подобных приведенным выше. • Слева направо (или справа налево) строятся последовательности ребер графа STG. Каждый цветовой сгусток соединяется с соседним сгустком в соседнем слое имеющим наиболее близкие и сходные цветовые характеристики.

  25. Структурный граф изображения коридора с человеком в кадре. Вертикальные прямые соответствую горизонтальным полосам изображения с соответствующими номерами, окрашенные квадраты – цветовым сгусткам, отрезки прямых – ребрам графа.

  26. Построение глобальных объектов • Строятся непрерывные системы сгустков окрашенных интервалов, которые соответствую путям на структурном графе таким, что каждый путь содержит по одной точке в каждом слое. По аналогии с теорией расслоений такие непрерывные системы называются сечениями. • Глобальные окрашенные объекты-сечения используются как кубики, из которых складываются реальные окрашенные объекты в кадре. Геометрически глобальные объекты соответствуют связным компонентам ребер графа. • Более сложные многоцветные сложные объекты складываются из соседних окрашенных объектов.

  27. Примеры глобальных объектов-сечений

  28. Примеры построения цветовых сгустков

  29. Поиск ориентиров

  30. Структурный граф

  31. Уличная сцена

  32. Структурный граф уличной сцены

  33. Другие примеры

  34. Снимки с конференции

  35. Выделенные объекты

  36. Программная реализация • Система реализованав С++(Visual Studio 2008) вместе со средствами сопряжения с вводом изображений из телекамер с использованием DirectX SDK. • Скорость обработки для цветных изображений 640х480 8-10 fps, для изображений 320х240, в четыре раза быстрее. Однокомпонентные изображения обрабатываются в 6 раз быстрее цветных изображений. • Система имеет средства для работы через сеть, включая работу через Internet.

  37. Выводы • Разработан новый метод представления сцен, основанный на понятии геометризованной гистограммы, удобный для решения задач понимания изображений в реальном времени. • Основу представления данных составляет структурный граф, поставленный в соответствие любому цветному изображению. • Геометризованная гистограмма и структурный граф позволяют разделять и находить различные предметы на изображениях. • Предложенная техника дает подход к интерпретации цветовых характеристик объектов на изображении сходной с интерпретацией, выполненной человеком. • Разрабатывается система поиска ориентиров на изображениях, основанная на развитой технике. • Необходимо строить разные правила интерпретации, повысить точность используемых параметров, и организовать процедуру обучения с целью выбора оптимальных правил для разных классов изображений.

More Related