260 likes | 488 Views
Курсовая работа по теме Алгоритмы и технологии сжатия цифрового видео. Выполнил : студент гр с-54 Куликов В.А.
E N D
Курсовая работа по темеАлгоритмы и технологии сжатия цифрового видео Выполнил: студент гр с-54 Куликов В.А
Основные проблемы с несжатым видео:-Большой видео поток-Несжатые данные занимают очень много места-Каналы передачи и возможности храненияограничены Пример: Видео 720х576 пикселов 25 кадров в секунду всистеме RGB и прогрессивной развертке потребуетпотока данных примерно в 240 Мбит/сек (т.е. 1.8 Гб вминуту). На DVD-ROM диск размером 4.7Гб войдетвсего 2.5 минуты. => Нужно сжатие в 35 раз для записифильма. Причины сжатия видео
Не существует метода оценки кадра полностью адекватному человеческому восприятиюНе существует метода оценки пропущенных кадров, полностью адекватного человеческому восприятиюРазные кодеки "затачиваются" под разные типы фильмов.Качество сжатия конкретного фильма может сильнозависеть от параметров кодирования. Любой кодек дает разное качество по кадрам одного и того же фильма
Без потерь качестваС потерями качестваБез потерь с точки зрения восприятияС естественной потерей качестваС неестественными потерями качества Технологии сжатия
Что используется при сжатии Используется избыточность: Пространственная( используется DCT или Wavelet преобразования) Временная(между кадрами, сжимается межкадровая разница) Цветового пространства( RGB переводится в YUV и цветовые компоненты прореживаются) • Когерентность областей изображения — • малое локальное изменение цвета • Избыточность в цветовых плоскостях — • используется большая важность яркости для восприятия • Подобие между кадрами — • на скорости 25 кадров в секунду соседние кадры, как правило, изменяются незначительно
Пространственная избыточность – цвет большинства соседних точек одинаков. Временная избыточность– кадры весьма похожи Просторанственная и временная избыточность
Межкадровая разница Именно такие кадры (с учетом поправки на компенсацию движения) и сжимает кодек. Их больше 99% в потоке. (Амплитуды – малы, изображение практически однородно)
ПКД Кодек, использующий ПКД - Microsoft RLE (MRLE) Особенности: 1)Хорошо подходит для черно-белых или 8 разрядных графических изображений, таких как кадры анимации. 2)Не подходит для естественных изображений с высоким разрешением. Последовательное кодирование длины КРАТКОЕ ОПИСАНИЕ ПКД кодирует последовательность пикселей одинакового цвета (например, черного или белого) как одиночное ключевое слово. Так, например, последовательность пикселей: 77 77 77 77 77 77 77 может быть закодирована как 7 77 (семь 77).
VQ Кодеки, использующие VQ - Indeo, Cinepak Особенности: 1)Процесс кодирования в вычислительном отношении интенсивен и не может быть выполнен в реальном времени без специализированных аппаратных средств. 2)Быстрый процесс декодирования. 3)Появление блочных артефактов при высоком сжатии. Векторная квантизация КРАТКОЕ ОПИСАНИЕ При векторной квантизации изображение делится на блоки. Кодер идентифицирует класс подобных блоков и заменяет их на "универсальный" блочный представитель, составляет поисковую таблицу коротких двоичных кодов к "универсальным" блокам. Декодер использует поисковую таблицу, чтобы транслировать приблизительное изображение, составленное из "универсальных" блоков согласно поисковой таблице.
ДКП Кодеки, использующие ДКП - Motion JPEG, MPEG-1,MPEG-2, MPEG-4, H.261, H.263, H.266 Особенности: 1)Появление блочных артефактов при высоком сжатии. 2)Излом острых граней. Случайное размытие в острых граней. 3)Большие требования к вычислительным мощностям. Дискретное косинус преобразование КРАТКОЕ ОПИСАНИЕ ДКП - широко используемое преобразование при сжатии изображения. Данные о яркости и цвете сохраняются в виде коэффициента частоты.
DWT Кодеки, использующие DWT - - VxTremem, Intel Indeo 5.x, Intel Indeo 4.x Особенности:1)большинство DWT кодеков осуществляют преобразование без блочных артефактов. 2)Алгоритмы сжатия, основанные на DWT, часто превосходят по быстродействию ДКП. 3)Субъективное качество видеоизображений, сжатых с DWT, может быть лучше, чем при ДКП с таким же коэффициентом сжатия. Дискретное преобразование элементарной волны
Особенности:1)Может достигать лучшего сжатия, чем независимое кодирование отдельных кадров. 2)Ошибки накапливаются в кадрах после ключевого кадра, в конечном счете, требуя следующий ключевой кадр. Кодирование разности кадров КРАТКОЕ ОПИСАНИЕ Обычно изменения между соседними кадрами незначительны (например, в случае шара, летящего перед статическим фоном, большая часть изображения не меняется между кадрами). На этом основан алгоритм кодирования разности кадров.
КД Кодеки, использующие КД: VxTreme, MPEG-1,2, и 4, H.261, H.263, H.264 Особенности:1)Cжатия видео выше, чем при кодировании разности кадров. 2)Стадия кодирования алгоритма КД в вычислительном отношении интенсивна. 3)Схема КД, используемая в международных стандартах MPEG, H.261, и H.263 работает лучше всего для сцен с ограниченным движением. Компенсация движения КРАТКОЕ ОПИСАНИЕ При сжатии, изображение делится на блоки. Для каждого блока кодируется вектор движения, указывающий на блок в предыдущем или следующем кадре, который схож с кодируемым блоком. Блок ссылки может совпадать с исходным или отличаться от него. Кодеку не требуется распознавать присутствие шара или другого объекта. Он лишь сравнивает блоки пикселей в декодированном кадре и кадре ссылки.
Типы кадров в потоке I-тип - кодирования данных на основе только текущего изображения; Р-тип - кодирование на основе текущего и предыдущего кадров; В-тип - кодирование с учетом текущего предыдущего и последующего кадров;
AVI (Audio Video Interlive) • MPEG (Motion Picture Experts Group) • - ASF (Advanced Streaming Format) Форматы файлов
AVI • Формат с перемежающимися блоками аудио- и видеоинформации • «Чанковый» формат • Неприспособленность к стримингу • Ограничение на размер файла в 2Гб
MPEG-1 • Битрейт порядка 1-2 Мбит/с • -Произвольный доступ к фрагментам • -Обратное воспроизведение • -Быстрый поиск вперед/назад • -Синхронизация видео и аудио потоков • -Основная сфера применения MPEG-1 - формат VideoCD • -Средний размер фильма 700mb
Свойства MPEG – 2 Совместимостьс MPEG-1 Поддержка множества форматов Видеопоследовательностей Кадровая/блочная структура картинки Кадровая/блочная двунаправленная адаптивная компенсация движения Кадровое/блочное адаптивное DCT Альтернативное сканирование DCT коэффициентов Формат картинки: (4:2:0),(4:2:2),(4:4:4) Нелинейная таблица квантования Отличия от MPEG-1 Кодирование последовательностей с интерлейсингом Масштабируемость–позволяет декодировать видеопотокс меньшим качеством, разрешением и частотой кадров, чем он был закодирован
MPEG-4 • Технология фрактального сжатия • Wavelet • MC • спрайты • обьекты с прозрачным фоном • 3d-рендеринг • Встроенный язык описания BIFS
H.264 Кодирование
PSNR • Метрика, которую часто используют на практике, называется мерой отношения сигнала к шуму (peak-to-peak signal-to-noise ratio — PSNR). Где x, y – пиксели изображений; n,m – размеры по горизонтали и вертикали.
Blocking measure • Значение метрики пропорционально визуальной степени "блочности” изображения. • В контрастных областях кадра границы блоков почти незаметны, а в однородных та же граница будет хорошо видна
Bluring measure • Данная метрика позволяет сравнить степень размытия двух изображений, относительно друг друга. Чем ближе её значение к 0, тем больше размыто изображение. Исходное Обработанное Bluring Measure Красный цвет - первое изображение чётче второго, зелёный цвет - второе изображение чётче первого.