Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Психофизиологи ческие модели изображения

Поиск

Из курса геометрии мы знаем, что математическая точка — это бесконечно малый объект, имеющий положение в пространстве, но не имеющий таких свойств, как размер и цвет. Чтобы ввести возможность кодирования цвета, необходимо расширить математическую модель. Такие расширенные модели называют психофизиологическими моделями цветового пространства.

Существует несколько психофизиологических моделей. Они используются в разных областях вычислительной техники. Мы рассмотрим две основные модели: RGB и CMYK.

ЦВЕТОВАЯ МОДЕЛЬ RGB

В основе цветовой модели RGB лежит положение о том, что любой произвольный цвет можно получить, смешивая три основные цветовые составляющие: красную (Red, R), зелёную (Green, G) и синюю (Blue, В). Соответственно, числовой код произвольного цвета в этой модели выражают комбинацией трёх чисел, значения которых пропорциональны яркостям цветовых составляющих. Каждую из составляющих записывают одним байтом. Таким образом, цвет одной точки в модели RGB записывается тремя байтами (24 бита).

Поскольку цвет получается сложением трёх цветов, эту модель называют аддитивной (addition, англ. — сложение). Применяют её в тех случаях, когда итоговый цвет физически получается сложением сигналов трёх лучей, что, например, имеет место на экранах компьютерных мониторов. Чёрный цвет в модели RGB соответствует I минимальному значению каждой из трёх составляющих (0, 0, 0). Белый цвет соответствует максимальным значениям составляющих цветов (255, 255, 255).

Поскольку модель RGB предусматривает представление цвета одной точки тремя байтами (24 бита), это даёт в совокупности 224 (то есть более 16,5 миллионов) цветовых оттенков. В некоторых областях спектра количество возможных значений превосходит возможности человеческого глаза, а в некоторых областях возможности глаза шире. В целом же считается, что эта модель соответствует усреднённым психофизиологическим характеристикам человеческого зрения.

 

ЦВЕТОВАЯ МОДЕЛЬ CMYK

Каждому из трёх основных цветов соответствует свой дополнительный цвет: голубой, пурпурный и жёлтый. Эти цвета названы дополнительными, потому что они дополняют основной цвет до белого, например:

КРАСНЫЙ + ГОЛУБОЙ = БЕЛЫЙ.

Справедливо и обратное: основной цвет можно получить вычитанием дополнительного цвета из белого:

КРАСНЫЙ = БЕЛЫЙ - ГОЛУБОЙ.

С вычитанием лучей света мы имеем дело, когда просматриваем изображения, напечатанные на бумаге. Из белого света, попадающего на страницу, вычитаются цветовые составляющие, «захваченные» красителем. Такая модель называется субтрактивной (subtraction, англ. — вычитание).

Цветовая модель CMYK - это пример субтрактивной модели. В её основе лежат четыре цветовые составляющие: голубая (Cyan, С), пурпурная (Magenta, М), жёлтая (Yellow, Y) и чёрная (BlacK, К). Эту модель применяют, когда создают или обрабатывают изображения, предназначенные для печати на бумаге.

Чисто теоретически, любой произвольный цвет можно было бы представить комбинацией трёх дополнительных цветов (CMY). Но цветовая модель CMYK не теоретическая, а практическая. На практике при просмотре печатных изображений мы никогда не имеем идеального потока белого света. Не бывает идеальной белой бумаги и не бывает идеальных красителей. Для компенсации погрешностей, связанных с используемыми материалами, в цветовую модель добавлена четвёртая составляющая, чёрная. Поэтому в цветовой модели CMYK код цвета точки записывается комбинацией четырёх байтов, а не трёх, как в модели RGB. Идеальному чёрному цвету в этой модели соответствуют максимальные значения составляющих (255, 255, 255, 255), а идеальному белому — нулевые значения (0, 0, 0, 0)

 

Форматы записи изображений

И

з-за того, что при кодировании изоб­ражений образуются обширные мас­сивы данных, результат кодирования крайне редко используют для непосредст­венной записи изображения. В большинстве случаев перед записью данные уплотняют­ся (сжимаются) специальным образом. Существует несколько стандартных меха­низмов сжатия данных. С ними связаны определённые соглашения, называемые форматами. Сведения о том, какой имен­но формат был использован при записи изображения, обычно записывают в начале выборки данных, представляющей изоб­ражение.

ФОРМАТ BMP

Этот простейший формат записи числовых данных, представляющих изображение, используется на персональных компьюте­рах, работающих под управлением опера­ционной системы Windows. Формат предназначен для записи изображений, кодированных в модели RGB, то есть изображений, предназначен­ных для воспроизведения на экране. Цвет каждой точки записывается 24 битами. Первые 8 бит соответствуют значению красной составляющей, следующие 8 бит — зелёной, и последние 8 бит — синей.

Оригинальный формат BMP не предусма­тривает никакого сжатия изображений — этим обеспечивается высокая скорость за­писи и воспроизведения, что повышает производительность внутренних операций Windows. Записи изображений в формате BMP име­ют увеличенный размер, что неудобно для хранения больших коллекций и транспор­тировки данных по каналам компьютер­ных сетей.

Существует разновидность формата BMP, допускающая некоторое сжатие (уплотнение) записей. Этот формат назы­вают BMP /RLE. Сжатие осуществляется по методу RLE - - Run Length Encoding (кодирование с учётом текущей длины ряда). Достоинством метода сжатия RLE явля­ется высокая скорость работы, связанная с простотой принципа. Недостатком мето­да RLE является низкая эффективность, если данные редко повторяются.

ФОРМАТ TIFF

Этот формат удобно использовать для пе­реноса высококачественных изображений между компьютерами разных систем. На­звание формата является сокращением от выражения Tagged Image File Format, что переводится на русский язык как формат записи помеченных изображений.

Формат допускает запись изображений в разных цветовых моделях (RGB,CMYK, полутоновая, чёрно-белая). Поддержка модели CMYK делает этот формат наиболее удобным для работы с изображениями, предназначенными для печати.

Помимо данных об изображении формат TIFF позволяет записать и сохранить вместе с изображением текстовые данные (пометить изображение). Эту возможность используют для сохранения примечаний, комментариев, сведений об авторе. Например, цифровые фотоаппараты могут автоматически приписывать к изображению сведения о дате и времени фотосъемки, а также о настройках фотоаппарата в момент съёмки кадра.

Как и в формате BMP, изображение, за­писанное в формате TIFF, может как иметь, так и не иметь внутреннее сжатие (как правило, оно его имеет). Но в качестве механизма сжатия используется немного более сложный и более совершенный метод LZW.

ФОРМАТ GIF

Формат GIF (Graphic Interchange Format — формат обмена изображениями) — один из старейших форматов записи изображений. Формат GIF рассчитан на табличное коди­рование изображений с приложением к за­писи 256-цветной палитры. Для уменьше­ния объема полученные данные в процессе записи сжимаются по методу LZW. Палит­ра, прикладываемая к каждому изображе­нию, занимает менее одного килобайта.

Он был разработан ещё в 1978 г. Его второе рождение относится к 1994 г., когда он стал одним из основных форматов представления изображений в Интернете. Этому способствовал малый размер записей по сравнению с другими форматами. Сегодня в Интернете этот формат используют для представления малоцветных изображений, имеющих большие области одинакового цвета (обычно это не фотографии, а рисунки).

ФОРМАТ JPEG

Формат JPEG предназначен для эффективной записи полноцветных графических изображений, как правило, фотографических. В записи изображения используется метод 24-разрядного кодирования цвета по модели RGB с высокоэффективным, но необратимым механизмом сжатия данных. При воспроизведении данных, записанных со сжатием в формате JPEG, полученная последовательность не точно соответству­ет данным, имевшимся перед записью. Подобные методы сжатия нельзя приме­нять для записи текстовой и числовой ин­формации, но для изображений искаже­ния не всегда являются критическими. Общепринято считать, что запись изображений в формате JPEG предназначена для их эффективной транспортировки, хране­ния и демонстрации. Но этим форматом не следует пользоваться для записи изобра­жений, которые должны проходить допол­нительную обработку (редактирование), потому что сам процесс записи уже внёс в них необратимые искажения.

При записи изображений в формате JPEG можно выбрать параметр качества, измеряемый в баллах от 1 до 100 (иногда от 1 до 10). Чем выше значение этого пара­метра, тем меньше величина вносимой погрешности, но тем больше объём полу­ченных данных. Для фотографических изображений, полученных цифровым фо­тоаппаратом, достаточным считается пара­метр качества порядка 40-50%. Он позво­ляет в несколько раз снизить объём данных и почти не сказывается на субъективном восприятии качества. Для изображений, предназначенных для публикации в Ин­тернете, устанавливают параметр качества на уровне 5-20%.

 

Кодирование и запись видео

К

одирование видеоизображений основано на разложении видеоряда в виде последовательности отдельных изображений (кадров). На этом, в частности, основано телевидение (25 кадров в секунду для Европы и 30 кадров с секунду для Японии и США) и кинотехника (24 кадра в секунду). То есть кодирование видеоряда заключается в ко­дировании каждого из составляющих его кадров как отдельного изображения, с по­следующей записью последовательности кадров.

Цифровая запись видеоизображений име­ет две особенности.

• Кодирование данных и их запись рассматриваются порознь и определяются разными стандартами.

• Запись видеоизображений обычно сопровождается записью звука, то есть речь идёт о синхронной записи как минимум двух потоков данных.

Одним из наиболее известных форматов записи (не кодирования) видео является формат AVI, введённый в действие компа­нией Microsoft для компьютеров, работа­ющих под управлением операционной системы Windows. Согласно стандарту AVI, в начале записи размещается заголовок, описывающий всю структуру записи. Он позволяет узнать, из каких блоков звука и видео состоит за­пись, как они чередуются между собой и какой метод кодирования использован при записи каждого из блоков. Формат AVI не определяет способ кодиро­вания звука и видео, а только указывает на него, поэтому его ещё называют метаформатом или форматом-контейнером.

Формат кодирования данных в записан­ных блоках может быть любым, но в нача­ле записи AVI обязательно есть сведения о том, какой именно формат использован. Соответственно, для декодирования запи­си при её воспроизведении следует исполь­зовать не любой метод, а только тот, кото­рый соответствует избранному формату кодирования.

КОДЕК

Для воспроизведения видеозаписей и зву­козаписей, записанных в каком-либо метаформате, например AVI, необходимо иметь специальную программу, которая называ­ется кодеком. Слово кодек происходит от сочетания двух слов: кодер-декодер. То есть кодек — это программа, предназначенная для кодирования последовательности кад­ров в виде наборов чисел перед их записью или для декодирования числовой последо­вательности перед воспроизведением записи. Когда мы приобретаем видеофильм, за­писанный на компакт-диске, к нему, как правило, прикладывается программа-ко­дек. При первом воспроизведении фильма кодек устанавливается на компьютере. При последующих воспроизведениях уста­новка кодека уже не происходит, пока нам в руки не попадёт фильм, закодированный другим кодеком. В этом случае будет уста­новлен новый кодек. Постепенно на ком­пьютере собирается коллекция кодеков на все случаи жизни.

ФОРМАТ MPEG

Существует множество различных форма­тов кодирования видеоизображений при их записи. Изобилие форматов связано с тем, что одновременно с преобразованием записи в числовую форму решается вопрос о сжатии полученной последовательности, а сжимать её можно по-разному.

Одним из наиболее распространённых является метод, получивший название MPEG. В основе стандарта MPEG лежит идея о том, что соседние кадры видеоряда, как правило, имеют сравнительно небольшие отличия друг от друга и, записав полнос­тью один кадр, мы можем при записи следующего кадра записывать не всё изоб­ражение, а только его отличия от преды­дущего кадра. В общей последовательно­сти видеоряда выявляются так называемые опорные кадры и промежуточные кадры, которые кодируются по-разному. Опорные кадры обычно являются начальными кад­рами новых сцен. Промежуточные кадры соответствуют одной сцене и имеют много общего с опорным кадром сцены.

Формат MPEG был разработан для записи видеоданных, хранимых на персональных компьютерах и переносимых на лазерных компакт-дисках. В те времена, когда начи­налась разработка формата, компьютеры не отличались производительностью, по­этому для записи видеоданных были вве­дены искусственные ограничения:

• размер кадров: 352 х 288 точек;

• частота кадров: 30 кадров в секунду.

Несколько позже был введён более совер­шенный формат MPEG 2, позволяющий кодировать видеозаписи с разрешением отдельных кадров до 720 х 576 точек. Этот формат нашёл очень широкое применение и используется:

• для записи видеофильмов на цифро­вых видеодисках (DVD-ROM);

• для передачи телевизионных про­грамм по каналам спутниковой связи (спутниковое телевидение);

• для передачи телевизионных про­грамм в цифровом формате через эфир или по кабельным сетям (цифровое телевидение).

Формат MPEG 2 обеспечивает степень сжа­тия исходного видеоряда примерно в 40-50 раз, что позволяет разместить двухча­совой видеофильм (200 Гбайт) на одном диске DVD-ROM (4,7 Гбайт). Но для того, чтобы разместить его на компакт-диске CD-ROM (650 Мбайт), нужна ещё более вы­сокая степень сжатия. При определённой потере качества её позволяет получить формат сжатия MPEG 4. От формата MPEG 2 формат MPEG 4 от­личается более изощрённой математикой, используемой при кодировании. В частно­сти, математические процедуры позволя­ют различать элементы сцены, обладаю­щие различной активностью, и кодировать их по-разному. Потом, при воспроизведе­нии фильма, сцена для каждого кадра фор­мируется из разных объектов.

 

Кодирование и запись звука

З

вук представляет собой локальные из­менения давления воздуха, распространяющиеся в пространстве в виде упругих волн. Органы слуха человека регистрируют перепады давления и передают сигналы в головной мозг на обработку. Органы слуха человека способны регистрировать далеко не все перепады звукового давления. Ограничения есть как по амплитуде, так и по частоте. Считается, что люди различают звуковые сигналы, имеющие частоту от 20 Гц до 20 кГц. Звуковые колебания низкой частоты, неразличимые для системы органов слуха человека, называют инфразвуком, а неразличимые колебания высокой частоты — ультразвуком.

Различия в амплитудах звуковых волн люди воспринимают как громкость звука. В технике принято измерять громкость звука в децибелах (дБ). Считается, что человек способен различать звуковые сигна­лы в диапазоне 20-120 дБ. Вот несколько характерных значений.

 

20 дБ — Тихий шёпот на расстоянии 4-5 м.

40 дБ — Спокойный разговор.

60 дБ — Шум толпы.

80 дБ — Звук вблизи оживлённой автотрассы.

100 дБ — Шум вблизи проходящего поезда.

120 дБ — Болевой порог (звук на расстоянии 100 м от взлетающего реактивного самолёта).

При звуке громкостью более 140 дБ (близкий разрыв артиллерийского снаря­да) происходит физическое поражение ор­ганов слуха (лопаются барабанные пере­понки), а звук громкостью более 180 дБ смертелен для человека.

ГЛУБИНА КОДИРОВАНИЯ ЗВУКА

Глубину кодирования выбирают так, что­бы обеспечить достаточную различимость амплитуд сигналов. Если выражать мгно­венное значение одним байтом (0-255), то удастся записать лишь узкий диапазон громкостей шириной всего в 48 децибел, например от 20 дБ до 68 дБ. Этого доста­точно для адекватного воспроизведения речи, но мало для музыки. То есть восьми­разрядное кодирование можно использо­вать лишь в цифровых диктофонах, сото­вых телефонах и цифровых системах телефонной связи.

В настоящее время для потребительской записи музыки используют 16-разрядное кодирование, а для профессиональных задач глубина кодирования доходит до 32 разрядов. При 16-разрядном кодирова­нии замеренное значение амплитуды зву­кового сигнала записывается 16-разряд­ным двоичным словом и представляется двумя байтами. Это позволяет различать 65 536 уровней громкости. Общий диапа­зон громкостей составляет при этом 96 дБ, например от 20 дБ до 116 дБ. Такая запись может адекватно передать и тихий шёпот, и рёв взлетающего самолёта.

ФОРМАТЫ ЗВУКОЗАПИСИ

Стандарты и соглашения, относящиеся к способам записи звуковых данных, орга­низованы примерно так же, как стандар­ты записи видео. Существуют форматы прямой записи — форматы записи выбор­ки данных, существуют метаформаты (контейнерные форматы), определяющие структуру записи, и существуют форматы сжатия данных, определяющие, как имен­но была закодирована исходная последова­тельность данных, полученная в результа­те прямой записи.

МЕТАФОРМАТ WAV

Как мы уже говорили выше, для воспро­изведения выборки данных нам не хвата­ет ряда дополнительных сведений. Эти све­дения приписывают к данным и получают запись в контейнерном формате (метаформате). Одним из контейнерных форматов, в частности, является формат WAV, вве­дённый в действие компаниями IBM и Microsoft. Это основной звуковой метаформат для компьютеров платформы IBM PC. Для операционной системы Windows он считается стандартом. На компьютерах других систем могут действовать другие метаформаты, введённые другими корпо­рациями.

Формат WAV определяет структуру зву­козаписи. Звукозапись имеет общий заго­ловок (метку формата) и может состоять из нескольких блоков данных (выборок), при­чём каждая выборка может быть закоди­рована по-разному.

О глубине кодирования, количестве ка­налов, частоте дискретизации и формате сжатия можно узнать по заголовку выбор­ки. Кроме звуковых выборок запись в фор­мате WAF может содержать и данные не звуковой природы, например текстовые блоки. В этом случае воспроизведение зву­ка может сопровождаться текстовыми со­общениями, например об авторе и испол­нителе музыкальной композиции.

Формат WAV позволяет раз­мещать внутри общей звукозаписи блоки выборок данных, закодированные со сжа­тием. В этом случае заголовок выборки со­держит сведения о том, каким методом выборка была сжата.

Многократное сжатие обеспечивают не­обратимые методы, похожие на рассмотрен­ные выше методы JPEG и MPEG. В част­ности, в настоящее время для эффективного сжатия выборок звуковых данных исполь­зуется разновидность метода MPEG, кото­рая сокращён­но обозначается как МРЗ.

При степени сжатия 1:10 формат МР3 обеспечивает удовлетворительное качество воспроизведения звукозаписи, отличимое от оригинала только на звуковоспроизво­дящей аппаратуре высших классов. При степени сжатия 1:4 качество воспроизведения таково, что сжатую запись на слух практически нельзя отличить от ориги­нальной (несжатой).

Сегодня в формате МРЗ распространяются звукозаписи на компакт-дисках (до 110 часов звучания на одном носителе), поставляются звукозаписи, размещённые в Интернете, вещают радиостанции Интернет-радио. Ориентировочно можно считать, что формат МРЗ позволяет расходовать 1 Мбайт носителя данных на одну минуту звукозаписи. Это позволяет оценивать ёмкость носителей.

АУДИОКОДЕКИ

Принцип воспроизведения сжатых звукозаписей тот же, что и принцип воспроизведения сжатых видеозаписей. Существует особый класс программ — кодеки (кодек =кодер + декодер), осуществляющих коди­рование сжатой последовательности данных при записи и её декодирование при воспроизведении. Записи распространяют­ся в метаформате, например WAV. Встре­тив внутри записи блок данных, записан­ный со сжатием, программа, отвечающая за воспроизведение звука, подключает нужный кодек (он указан в заголовке бло­ка) и с его помощью распаковывает дан­ные.

 



Поделиться:


Последнее изменение этой страницы: 2016-08-01; просмотров: 214; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.143.237.203 (0.01 с.)