Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Психофизиологи ческие модели изображенияСодержание книги
Поиск на нашем сайте
Из курса геометрии мы знаем, что математическая точка — это бесконечно малый объект, имеющий положение в пространстве, но не имеющий таких свойств, как размер и цвет. Чтобы ввести возможность кодирования цвета, необходимо расширить математическую модель. Такие расширенные модели называют психофизиологическими моделями цветового пространства. Существует несколько психофизиологических моделей. Они используются в разных областях вычислительной техники. Мы рассмотрим две основные модели: RGB и CMYK. ЦВЕТОВАЯ МОДЕЛЬ RGB В основе цветовой модели RGB лежит положение о том, что любой произвольный цвет можно получить, смешивая три основные цветовые составляющие: красную (Red, R), зелёную (Green, G) и синюю (Blue, В). Соответственно, числовой код произвольного цвета в этой модели выражают комбинацией трёх чисел, значения которых пропорциональны яркостям цветовых составляющих. Каждую из составляющих записывают одним байтом. Таким образом, цвет одной точки в модели RGB записывается тремя байтами (24 бита). Поскольку цвет получается сложением трёх цветов, эту модель называют аддитивной (addition, англ. — сложение). Применяют её в тех случаях, когда итоговый цвет физически получается сложением сигналов трёх лучей, что, например, имеет место на экранах компьютерных мониторов. Чёрный цвет в модели RGB соответствует I минимальному значению каждой из трёх составляющих (0, 0, 0). Белый цвет соответствует максимальным значениям составляющих цветов (255, 255, 255). Поскольку модель RGB предусматривает представление цвета одной точки тремя байтами (24 бита), это даёт в совокупности 224 (то есть более 16,5 миллионов) цветовых оттенков. В некоторых областях спектра количество возможных значений превосходит возможности человеческого глаза, а в некоторых областях возможности глаза шире. В целом же считается, что эта модель соответствует усреднённым психофизиологическим характеристикам человеческого зрения.
ЦВЕТОВАЯ МОДЕЛЬ CMYK Каждому из трёх основных цветов соответствует свой дополнительный цвет: голубой, пурпурный и жёлтый. Эти цвета названы дополнительными, потому что они дополняют основной цвет до белого, например: КРАСНЫЙ + ГОЛУБОЙ = БЕЛЫЙ. Справедливо и обратное: основной цвет можно получить вычитанием дополнительного цвета из белого: КРАСНЫЙ = БЕЛЫЙ - ГОЛУБОЙ. С вычитанием лучей света мы имеем дело, когда просматриваем изображения, напечатанные на бумаге. Из белого света, попадающего на страницу, вычитаются цветовые составляющие, «захваченные» красителем. Такая модель называется субтрактивной (subtraction, англ. — вычитание). Цветовая модель CMYK - это пример субтрактивной модели. В её основе лежат четыре цветовые составляющие: голубая (Cyan, С), пурпурная (Magenta, М), жёлтая (Yellow, Y) и чёрная (BlacK, К). Эту модель применяют, когда создают или обрабатывают изображения, предназначенные для печати на бумаге. Чисто теоретически, любой произвольный цвет можно было бы представить комбинацией трёх дополнительных цветов (CMY). Но цветовая модель CMYK не теоретическая, а практическая. На практике при просмотре печатных изображений мы никогда не имеем идеального потока белого света. Не бывает идеальной белой бумаги и не бывает идеальных красителей. Для компенсации погрешностей, связанных с используемыми материалами, в цветовую модель добавлена четвёртая составляющая, чёрная. Поэтому в цветовой модели CMYK код цвета точки записывается комбинацией четырёх байтов, а не трёх, как в модели RGB. Идеальному чёрному цвету в этой модели соответствуют максимальные значения составляющих (255, 255, 255, 255), а идеальному белому — нулевые значения (0, 0, 0, 0)
Форматы записи изображений
з-за того, что при кодировании изображений образуются обширные массивы данных, результат кодирования крайне редко используют для непосредственной записи изображения. В большинстве случаев перед записью данные уплотняются (сжимаются) специальным образом. Существует несколько стандартных механизмов сжатия данных. С ними связаны определённые соглашения, называемые форматами. Сведения о том, какой именно формат был использован при записи изображения, обычно записывают в начале выборки данных, представляющей изображение. ФОРМАТ BMP Этот простейший формат записи числовых данных, представляющих изображение, используется на персональных компьютерах, работающих под управлением операционной системы Windows. Формат предназначен для записи изображений, кодированных в модели RGB, то есть изображений, предназначенных для воспроизведения на экране. Цвет каждой точки записывается 24 битами. Первые 8 бит соответствуют значению красной составляющей, следующие 8 бит — зелёной, и последние 8 бит — синей. Оригинальный формат BMP не предусматривает никакого сжатия изображений — этим обеспечивается высокая скорость записи и воспроизведения, что повышает производительность внутренних операций Windows. Записи изображений в формате BMP имеют увеличенный размер, что неудобно для хранения больших коллекций и транспортировки данных по каналам компьютерных сетей. Существует разновидность формата BMP, допускающая некоторое сжатие (уплотнение) записей. Этот формат называют BMP /RLE. Сжатие осуществляется по методу RLE - - Run Length Encoding (кодирование с учётом текущей длины ряда). Достоинством метода сжатия RLE является высокая скорость работы, связанная с простотой принципа. Недостатком метода RLE является низкая эффективность, если данные редко повторяются. ФОРМАТ TIFF Этот формат удобно использовать для переноса высококачественных изображений между компьютерами разных систем. Название формата является сокращением от выражения Tagged Image File Format, что переводится на русский язык как формат записи помеченных изображений. Формат допускает запись изображений в разных цветовых моделях (RGB,CMYK, полутоновая, чёрно-белая). Поддержка модели CMYK делает этот формат наиболее удобным для работы с изображениями, предназначенными для печати. Помимо данных об изображении формат TIFF позволяет записать и сохранить вместе с изображением текстовые данные (пометить изображение). Эту возможность используют для сохранения примечаний, комментариев, сведений об авторе. Например, цифровые фотоаппараты могут автоматически приписывать к изображению сведения о дате и времени фотосъемки, а также о настройках фотоаппарата в момент съёмки кадра. Как и в формате BMP, изображение, записанное в формате TIFF, может как иметь, так и не иметь внутреннее сжатие (как правило, оно его имеет). Но в качестве механизма сжатия используется немного более сложный и более совершенный метод LZW. ФОРМАТ GIF Формат GIF (Graphic Interchange Format — формат обмена изображениями) — один из старейших форматов записи изображений. Формат GIF рассчитан на табличное кодирование изображений с приложением к записи 256-цветной палитры. Для уменьшения объема полученные данные в процессе записи сжимаются по методу LZW. Палитра, прикладываемая к каждому изображению, занимает менее одного килобайта. Он был разработан ещё в 1978 г. Его второе рождение относится к 1994 г., когда он стал одним из основных форматов представления изображений в Интернете. Этому способствовал малый размер записей по сравнению с другими форматами. Сегодня в Интернете этот формат используют для представления малоцветных изображений, имеющих большие области одинакового цвета (обычно это не фотографии, а рисунки). ФОРМАТ JPEG Формат JPEG предназначен для эффективной записи полноцветных графических изображений, как правило, фотографических. В записи изображения используется метод 24-разрядного кодирования цвета по модели RGB с высокоэффективным, но необратимым механизмом сжатия данных. При воспроизведении данных, записанных со сжатием в формате JPEG, полученная последовательность не точно соответствует данным, имевшимся перед записью. Подобные методы сжатия нельзя применять для записи текстовой и числовой информации, но для изображений искажения не всегда являются критическими. Общепринято считать, что запись изображений в формате JPEG предназначена для их эффективной транспортировки, хранения и демонстрации. Но этим форматом не следует пользоваться для записи изображений, которые должны проходить дополнительную обработку (редактирование), потому что сам процесс записи уже внёс в них необратимые искажения. При записи изображений в формате JPEG можно выбрать параметр качества, измеряемый в баллах от 1 до 100 (иногда от 1 до 10). Чем выше значение этого параметра, тем меньше величина вносимой погрешности, но тем больше объём полученных данных. Для фотографических изображений, полученных цифровым фотоаппаратом, достаточным считается параметр качества порядка 40-50%. Он позволяет в несколько раз снизить объём данных и почти не сказывается на субъективном восприятии качества. Для изображений, предназначенных для публикации в Интернете, устанавливают параметр качества на уровне 5-20%.
Кодирование и запись видео
одирование видеоизображений основано на разложении видеоряда в виде последовательности отдельных изображений (кадров). На этом, в частности, основано телевидение (25 кадров в секунду для Европы и 30 кадров с секунду для Японии и США) и кинотехника (24 кадра в секунду). То есть кодирование видеоряда заключается в кодировании каждого из составляющих его кадров как отдельного изображения, с последующей записью последовательности кадров. Цифровая запись видеоизображений имеет две особенности. • Кодирование данных и их запись рассматриваются порознь и определяются разными стандартами. • Запись видеоизображений обычно сопровождается записью звука, то есть речь идёт о синхронной записи как минимум двух потоков данных. Одним из наиболее известных форматов записи (не кодирования) видео является формат AVI, введённый в действие компанией Microsoft для компьютеров, работающих под управлением операционной системы Windows. Согласно стандарту AVI, в начале записи размещается заголовок, описывающий всю структуру записи. Он позволяет узнать, из каких блоков звука и видео состоит запись, как они чередуются между собой и какой метод кодирования использован при записи каждого из блоков. Формат AVI не определяет способ кодирования звука и видео, а только указывает на него, поэтому его ещё называют метаформатом или форматом-контейнером. Формат кодирования данных в записанных блоках может быть любым, но в начале записи AVI обязательно есть сведения о том, какой именно формат использован. Соответственно, для декодирования записи при её воспроизведении следует использовать не любой метод, а только тот, который соответствует избранному формату кодирования. КОДЕК Для воспроизведения видеозаписей и звукозаписей, записанных в каком-либо метаформате, например AVI, необходимо иметь специальную программу, которая называется кодеком. Слово кодек происходит от сочетания двух слов: кодер-декодер. То есть кодек — это программа, предназначенная для кодирования последовательности кадров в виде наборов чисел перед их записью или для декодирования числовой последовательности перед воспроизведением записи. Когда мы приобретаем видеофильм, записанный на компакт-диске, к нему, как правило, прикладывается программа-кодек. При первом воспроизведении фильма кодек устанавливается на компьютере. При последующих воспроизведениях установка кодека уже не происходит, пока нам в руки не попадёт фильм, закодированный другим кодеком. В этом случае будет установлен новый кодек. Постепенно на компьютере собирается коллекция кодеков на все случаи жизни. ФОРМАТ MPEG Существует множество различных форматов кодирования видеоизображений при их записи. Изобилие форматов связано с тем, что одновременно с преобразованием записи в числовую форму решается вопрос о сжатии полученной последовательности, а сжимать её можно по-разному. Одним из наиболее распространённых является метод, получивший название MPEG. В основе стандарта MPEG лежит идея о том, что соседние кадры видеоряда, как правило, имеют сравнительно небольшие отличия друг от друга и, записав полностью один кадр, мы можем при записи следующего кадра записывать не всё изображение, а только его отличия от предыдущего кадра. В общей последовательности видеоряда выявляются так называемые опорные кадры и промежуточные кадры, которые кодируются по-разному. Опорные кадры обычно являются начальными кадрами новых сцен. Промежуточные кадры соответствуют одной сцене и имеют много общего с опорным кадром сцены. Формат MPEG был разработан для записи видеоданных, хранимых на персональных компьютерах и переносимых на лазерных компакт-дисках. В те времена, когда начиналась разработка формата, компьютеры не отличались производительностью, поэтому для записи видеоданных были введены искусственные ограничения: • размер кадров: 352 х 288 точек; • частота кадров: 30 кадров в секунду. Несколько позже был введён более совершенный формат MPEG 2, позволяющий кодировать видеозаписи с разрешением отдельных кадров до 720 х 576 точек. Этот формат нашёл очень широкое применение и используется: • для записи видеофильмов на цифровых видеодисках (DVD-ROM); • для передачи телевизионных программ по каналам спутниковой связи (спутниковое телевидение); • для передачи телевизионных программ в цифровом формате через эфир или по кабельным сетям (цифровое телевидение). Формат MPEG 2 обеспечивает степень сжатия исходного видеоряда примерно в 40-50 раз, что позволяет разместить двухчасовой видеофильм (200 Гбайт) на одном диске DVD-ROM (4,7 Гбайт). Но для того, чтобы разместить его на компакт-диске CD-ROM (650 Мбайт), нужна ещё более высокая степень сжатия. При определённой потере качества её позволяет получить формат сжатия MPEG 4. От формата MPEG 2 формат MPEG 4 отличается более изощрённой математикой, используемой при кодировании. В частности, математические процедуры позволяют различать элементы сцены, обладающие различной активностью, и кодировать их по-разному. Потом, при воспроизведении фильма, сцена для каждого кадра формируется из разных объектов.
Кодирование и запись звука
вук представляет собой локальные изменения давления воздуха, распространяющиеся в пространстве в виде упругих волн. Органы слуха человека регистрируют перепады давления и передают сигналы в головной мозг на обработку. Органы слуха человека способны регистрировать далеко не все перепады звукового давления. Ограничения есть как по амплитуде, так и по частоте. Считается, что люди различают звуковые сигналы, имеющие частоту от 20 Гц до 20 кГц. Звуковые колебания низкой частоты, неразличимые для системы органов слуха человека, называют инфразвуком, а неразличимые колебания высокой частоты — ультразвуком. Различия в амплитудах звуковых волн люди воспринимают как громкость звука. В технике принято измерять громкость звука в децибелах (дБ). Считается, что человек способен различать звуковые сигналы в диапазоне 20-120 дБ. Вот несколько характерных значений.
20 дБ — Тихий шёпот на расстоянии 4-5 м. 40 дБ — Спокойный разговор. 60 дБ — Шум толпы. 80 дБ — Звук вблизи оживлённой автотрассы. 100 дБ — Шум вблизи проходящего поезда. 120 дБ — Болевой порог (звук на расстоянии 100 м от взлетающего реактивного самолёта). При звуке громкостью более 140 дБ (близкий разрыв артиллерийского снаряда) происходит физическое поражение органов слуха (лопаются барабанные перепонки), а звук громкостью более 180 дБ смертелен для человека. ГЛУБИНА КОДИРОВАНИЯ ЗВУКА Глубину кодирования выбирают так, чтобы обеспечить достаточную различимость амплитуд сигналов. Если выражать мгновенное значение одним байтом (0-255), то удастся записать лишь узкий диапазон громкостей шириной всего в 48 децибел, например от 20 дБ до 68 дБ. Этого достаточно для адекватного воспроизведения речи, но мало для музыки. То есть восьмиразрядное кодирование можно использовать лишь в цифровых диктофонах, сотовых телефонах и цифровых системах телефонной связи. В настоящее время для потребительской записи музыки используют 16-разрядное кодирование, а для профессиональных задач глубина кодирования доходит до 32 разрядов. При 16-разрядном кодировании замеренное значение амплитуды звукового сигнала записывается 16-разрядным двоичным словом и представляется двумя байтами. Это позволяет различать 65 536 уровней громкости. Общий диапазон громкостей составляет при этом 96 дБ, например от 20 дБ до 116 дБ. Такая запись может адекватно передать и тихий шёпот, и рёв взлетающего самолёта. ФОРМАТЫ ЗВУКОЗАПИСИ Стандарты и соглашения, относящиеся к способам записи звуковых данных, организованы примерно так же, как стандарты записи видео. Существуют форматы прямой записи — форматы записи выборки данных, существуют метаформаты (контейнерные форматы), определяющие структуру записи, и существуют форматы сжатия данных, определяющие, как именно была закодирована исходная последовательность данных, полученная в результате прямой записи. МЕТАФОРМАТ WAV Как мы уже говорили выше, для воспроизведения выборки данных нам не хватает ряда дополнительных сведений. Эти сведения приписывают к данным и получают запись в контейнерном формате (метаформате). Одним из контейнерных форматов, в частности, является формат WAV, введённый в действие компаниями IBM и Microsoft. Это основной звуковой метаформат для компьютеров платформы IBM PC. Для операционной системы Windows он считается стандартом. На компьютерах других систем могут действовать другие метаформаты, введённые другими корпорациями. Формат WAV определяет структуру звукозаписи. Звукозапись имеет общий заголовок (метку формата) и может состоять из нескольких блоков данных (выборок), причём каждая выборка может быть закодирована по-разному. О глубине кодирования, количестве каналов, частоте дискретизации и формате сжатия можно узнать по заголовку выборки. Кроме звуковых выборок запись в формате WAF может содержать и данные не звуковой природы, например текстовые блоки. В этом случае воспроизведение звука может сопровождаться текстовыми сообщениями, например об авторе и исполнителе музыкальной композиции. Формат WAV позволяет размещать внутри общей звукозаписи блоки выборок данных, закодированные со сжатием. В этом случае заголовок выборки содержит сведения о том, каким методом выборка была сжата. Многократное сжатие обеспечивают необратимые методы, похожие на рассмотренные выше методы JPEG и MPEG. В частности, в настоящее время для эффективного сжатия выборок звуковых данных используется разновидность метода MPEG, которая сокращённо обозначается как МРЗ. При степени сжатия 1:10 формат МР3 обеспечивает удовлетворительное качество воспроизведения звукозаписи, отличимое от оригинала только на звуковоспроизводящей аппаратуре высших классов. При степени сжатия 1:4 качество воспроизведения таково, что сжатую запись на слух практически нельзя отличить от оригинальной (несжатой). Сегодня в формате МРЗ распространяются звукозаписи на компакт-дисках (до 110 часов звучания на одном носителе), поставляются звукозаписи, размещённые в Интернете, вещают радиостанции Интернет-радио. Ориентировочно можно считать, что формат МРЗ позволяет расходовать 1 Мбайт носителя данных на одну минуту звукозаписи. Это позволяет оценивать ёмкость носителей. АУДИОКОДЕКИ Принцип воспроизведения сжатых звукозаписей тот же, что и принцип воспроизведения сжатых видеозаписей. Существует особый класс программ — кодеки (кодек =кодер + декодер), осуществляющих кодирование сжатой последовательности данных при записи и её декодирование при воспроизведении. Записи распространяются в метаформате, например WAV. Встретив внутри записи блок данных, записанный со сжатием, программа, отвечающая за воспроизведение звука, подключает нужный кодек (он указан в заголовке блока) и с его помощью распаковывает данные.
|
|||||||
Последнее изменение этой страницы: 2016-08-01; просмотров: 214; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.143.237.203 (0.01 с.) |