Исследование алгоритма сжатия неподвижных изображений 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Исследование алгоритма сжатия неподвижных изображений



Цель работы: изучение эффективности функционирования алгоритма сжатия неподвижных изображений.

Средства для исследования: ПК, пакет «Colorimetrie».

 

Основные положения

Телевизионный сигнал обладает пространственной и временной избыточностью, определяемой статистическими свойствами изображений. Кроме того, можно выделить избыточность по восприятию, обусловленную свойствами зрительной системы, структурную, обусловленную особенностями стандарта преобразования изображения в телевизионный сигнал, и спектральную избыточность, обусловленную высокой частотой дискретизации.

В настоящее время алгоритм сжатия неподвижных кадров (видеоизображений) основывается на стандарте JPEG (Joint Photographic Experts Group). Алгоритм JPEG осуществляет кодирование элементов изображения в частотной области. Этапы кодирования JPEG можно представить в виде следующего набора процедур:

- дискретизация;

- дискретно-косинусное преобразование;

- квантование;

- кодирование Хаффмана.

Стандарт JPEG определяет четыре режима сжатия: иерархический, прогрессивный, последовательный и «без потерь».

Последовательный режим является простейшим режимом JPEG. Он обеспечивает кодирование изображения сверху вниз по строкам. Каждый цветовой компонент полностью кодируется в один скан-блок сжатых данных, который содержит результаты одного прохода по изображению для одного или нескольких компонентов. В этом режиме сжатия стандарт JPEG определяет два альтернативных процесса кодирования: по Хаффману и арифметическое.

В прогрессивном режиме компоненты изображения кодируются во множестве сканов (от 2 до 896). Начальные сканы создают грубую версию изображения, а последующие – улучшают его качество. Изображения с прогрессивным сжатием предназначены для просмотра во время их декодирования. Недостатки режима: его труднее реализовать, чем последовательный режим; при просмотре изображения по мере его загрузки требуется значительно больший объем обработки. Прогрессивный JPEG наиболее выгоден тогда, когда относительная вычислительная мощность превышает относительную скорость передачи изображения. В целом, размеры файлов изображений при последовательном и прогрессивном режимах примерно одинаковы.

Иерархический режим – это суперпрогрессивный режим, в котором изображение разделяется на множество кадров, включающих в свой состав несколько сканов. Первый кадров создает версию изображения с низким разрешением. Остальные кадры улучшают качество изображения путем повышения разрешения. Недостаток режима – его сложность.

Режим без потерь предназначен для применения в случаях, когда требуется точное восстановление сжатого изображения. В этом режиме величина каждого пикселя предсказывается в виде отличий от соседних с ними (сверху и слева) пикселей. Эта величина кодируется с использованием кода переменной длины. Фаза DCT вообще не используется, так как ошибки округления могут привести к потерям. Не используется субдискретизация и преобразование цветов.

На этапе дискретизации данные пикселей преобразуются из цветового пространства RGB в цветовое пространство по соотношениям:

 

                                  (6.1)

                                 (6.2)

                               (6.3)

 

и выполняется субдискретизация составляющих.

Формат JPEG позволяет выполнять дискретизацию значений отдельных компонентов с разными частотами (относительной частотой, с которой выполняется оцифровка компонента).

 

Дискретное косинусное преобразование DCT (Discrete Cosine Transform)

Дискретное косинусное преобразование осуществляет перевод отдельных блоков изображения, размер которых определен в JPEG 8x8 пикселей, из пространственной в область пространственных частот. Для многокомпонентных изображений, например  или RGB, DCT применяется раздельно к блокам каждого компонента. Известно, что пиксели изображения имеют корреляцию по двум направлениям (горизонтальному и вертикальному). Поэтому методы сжатия изображений используют двумерное DCT, которое задается формулой:

 

(6.4)

 

Где   v – горизонтальная координата графического блока,

u – вертикальная координата графического блока,

x – вертикальная координата внутри блока,

y – горизонтальная координата внутри блока,

для и в противном случае .

 

Два члена в квадратных скобках являются ядрами преобразования, а представляет собой пиксельные данные блока реального рисунка

DCT является однозначной операцией, так что на основании вычисленного массива изображения в спектральной области с помощью обратного DCT можно восстановить исходное изображение без каких-либо потерь по формуле:

 

      (6.5)

 

На этапе квантования результатов DCT в процессе JPEG-сжатия изображения отбрасываются несущественные для восстановления изображения коэффициенты дискретно-косинусного преобразования. Квантование является тем звеном обработки сигнала, на котором JPEG вносит потери. Оно определяет точность хранения результатов DCT и коэффициент сжатия. JPEG использует простое линейное квантование. Каждое из значений DCT делится на коэффициент квантования, индивидуальный для каждой пространственной частоты, который берется из заранее определенной таблицы коэффициентов квантования (табл. 6.1) размером 8х8 (естественно, она должна быть одинакова для кодера и декодера).

 

Таблица 6.1 – Коэффициенты квантования

Яркостная составляющая

Составляющих цветности

16 11 10 16 24 40 51 61 17 18 24 47 99 99 99 99
12 12 14 19 26 58 60 55 18 21 26 66 99 99 99 99
14 13 16 24 49 57 69 56 24 26 56 99 99 99 99 99
14 17 22 29 51 87 80 62 47 66 99 99 99 99 99 99
18 22 37 56 68 109 103 77 99 99 99 99 99 99 99 99
24 35 55 64 81 104 113 92 99 99 99 99 99 99 99 99
49 64 78 87 103 121 120 101 99 99 99 99 99 99 99 99
72 92 95 98 112 100 103 99 99 99 99 99 99 99 99 99

 

На вход дискретного косинусного преобразователя DCT поступают 8х8 массивы пикселей изображения с различными значениями интенсивности по яркости и цвету. На выходе преобразователя уже другой массив чисел размером 8х8.

Первый коэффициент преобразования, имеющий индекс (0,0) особенный. Он представляет среднее значение всех 64 входящих пикселей матрицы 8х8. При движении коэффициента слева направо по горизонтали или вниз по вертикали преобразования говорят о росте пространственной частоты. DCT эффективно потому, что оно имеет тенденцию концентрировать энергию преобразования в коэффициентах, расположенных в верхнем левом углу матрицы, где наименьшая пространственная частота. Каждое число из матрицы коэффициентов DCT делится на специальное число из «Таблицы квантования», а результат округляется до ближайшего целого. Все 64 числа из таблицы квантования являются параметрами JPEG-преобразования.

После квантования коэффициентов DCT происходит сокращение избыточности их последовательности с помощью кода Хаффмана или арифметического кодирования. Для этого формируется линейная последовательность квантованных коэффициентов DCT блока путем их считывания в зигзагообразном порядке. При этом происходит объединение серии нулевых значений DCT.

При декодировании на приемной стороне коэффициенты матрицы DCT, значения которых были переданы по каналам связи, умножаются на элементы матрицы квантования, что восстанавливает верные значения коэффициентов, но с ошибкой округления, значение которой мало для низкочастотных компонентов блока отсчетов изображения, но велико для высокочастотных.

Следует отметить, что в настоящее время имеется несколько различных пакетов программ по алгоритму JPEG. В некоторых программах требуется дополнительное дисковое пространство в дополнение к основной памяти. Некоторые предусматривают несколько фиксированных режимов сжатия, другие дают возможность выбирать их. Важным фактором является скорость сжатия, которая может изменяться в широких пределах. Некоторые алгоритмы создают самовосстанавливающиеся изображения. Многие системы сжатия по стандарту JPEG требуют очень большого объема памяти. Заметим, что пользователи алгоритма JPEG могут устанавливать различную степень сжатия, идя на компромисс между качеством изображения и размером файла (временем вычислений). Разные программы могут обладать весьма различными функциональными и скоростными возможностями.

Для цветного изображения при использовании полного алгоритма в зависимости от качества изображения обеспечиваются следующие затраты бит на растровый элемент (пиксель):

- 0,25...0,5 бит/эрл – хорошее качество;

- 0,5...0,75 бит/эрл – очень хорошее качество;

- 0,75...1,5 бит/эрл – отличное качество для большинства применений.

 



Поделиться:


Последнее изменение этой страницы: 2020-03-26; просмотров: 141; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.119.131.178 (0.014 с.)