Кодирование звуковой информации 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Кодирование звуковой информации



 

Можно выделить два основных направления.

Метод FM (Frequency Modulation) основан на том, что теоретически любой сложный звук при помощи преобразования Фурье можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых представляет собой правильную синусоиду, следовательно, может быть описан числовыми параметрами, то есть числовым кодом.

В природе звуковые сигналы имеют непрерывный спектр, то есть являются аналоговыми.

Проблема заключается в том, чтоб преобразовать такие сигналы в цифровые, то есть дискретные. Такой процесс называется оцифровкой.

Их разложение в гармонические ряды и представление в виде дискретных цифровых сигналов выполняют специальные устройства — аналогово-цифровые преобразователи (АЦП). Обратное преобразование для воспроизведения звука, закодированного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП).

При таких преобразованиях неизбежны потери информации, связанные с методом кодирования, поэтому качество звукозаписи обычно получается не вполне удовлетворительным и соответствует качеству звучания простейших электромузыкальных инструментов с окрасом, характерным для электронной музыки. В то же время данный метод кодирования обеспечивает весьма компактный код, и потому он нашел применение еще в те годы, когда ресурсы средств вычислительной техники были явно недостаточны.

Метод таблично-волнового (Wave-Table) синтеза лучше соответствует современному уровню развития техники. Если говорить упрощенно, то можно сказать, что где-то в заранее подготовленных таблицах хранятся образцы звуков для множества различных музыкальных инструментов (хотя не только для них). В технике такие образцы называют сэмплами. Числовые коды выражают тип инструмента, номер его модели, высоту тона, продолжительность и интенсивность звука, динамику его изменения, некоторые параметры среды, в которой происходит звучание, а также прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, то качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.

Кодирование видеоинформации

Изображение в видео состоит из отдельных кадров, которые меняются с определенной частотой. Кадр кодируется как обычное растровое изображение, то есть разбивается на множество пикселей. Закодировав отдельные кадры и собрав их вместе, получают видео.

Видеоданные характеризуются частотой кадров и экранным разрешением. Скорость воспроизведения видеосигнала составляет 30 или 25 кадров в секунду, в зависимости от стандарта. Наиболее известными из таких стандартов являются: PAL, используемый в Европе, и NTSC, распространенный в Северной Америке и Японии.

Разрешение для стандарта NTSC составляет 768 на 484 точек, а для PAL и SECAM – 768 на 576 точек. Но не все пиксели используются для хранения видеоинформации. Так, при стандартном разрешении 768 на 576 пикселей, на экране отображается 704 на 540 пикселей. В формате Digital Video (DV) размер кадра составляет 720 на 576 пикселей. Такое же разрешение имеет кадр стандарта DVD Video. Размер кадра формата Video-CD составляет 352 на 288 пикселей.

Если представить каждый кадр изображения как отдельный рисунок, то видеоизображение будет занимать очень большой объем, например, одна секунда записи в системе PAL будет занимать 25 Мбайт, а одна минута – уже 1,5 Гбайт. Поэтому на практике используются различные алгоритмы сжатия для уменьшения скорости и объема потока видеоинформации.

 

Если использовать сжатие без потерь, то самые эффективные алгоритмы позволяют уменьшить поток информации не более чем в два раза. Для более существенного снижения объемов видеоинформации используют сжатие с потерями.

Среди алгоритмов с потерями одним из наиболее известных является MotionJPEG или MJPEG. Приставка Motion говорит, что алгоритм JPEG используется для сжатия не одного, а нескольких кадров.

Еще одним методом сжатия видеосигнала является MPEG. Поскольку видеосигнал транслируется в реальном времени, то нет возможности обработать все кадры одновременно. В алгоритме MPEG запоминается несколько кадров. Основной принцип состоит в предположении того, что соседние кадры мало отличаются друг от друга. Поэтому можно сохранить один кадр, который называют исходным, а затем сохраняются только изменения от исходного кадра, называемые предсказуемыми кадрами.

Считается, что за 10-15 кадров картинка изменится настолько, что необходим новый исходный кадр. В результате при использовании MPEG можно добиться уменьшения объема информации более чем в 200 раз, хотя это и приводит к некоторой потере качества. В настоящее время используются алгоритм сжатия MPEG-1, разработанный для хранения видео на компакт-дисках с качеством VHS, MPEG-2, используемый в цифровом, спутниковом телевидении и DVD, а также алгоритм MPEG-4, разработанный для передачи информации по компьютерным сетям и широко используемый в цифровых видеокамерах и для домашнего хранения видеофильмов.

Видеоформаты и видеостандарты

 

В первую очередь определимся с видеостандартами. Их обязательно нужно учитывать при создании видеофильма или видеоролика.

PAL - видеостандарт, используемый в Европе и России:

размер видео 720х576, 25 fps (25 кадров в секунду).

NTSC - 720х480, 29,97 fps.

Стандарт SECAM используется для телевизионного вещания.

VHS - аналоговое видео, это формат записи на видеокассетах.

DV (Digital Video) - это цифровой видеоформат, разработанный совместно ведущими мировыми компаниями-производителями видео для цифровой записи. Этот формат имеет малый коэффициент сжатия видеосигнала (5:1) и дает высокое качество видеосъемки. В этом формате снимают видео MiniDV-камеры.

DV формат характеризуется большим видеопотоком и, соответственно, имеет большой выходной видеофайл. Часовая запись на MiniDV кассету, будет иметь объем примерно 12 Гб, или 1 мин - 200 Мб.

Стандарты сжатия цифрового видео

MPEG - один из основных стандартов сжатия. Аббревиатура MPEG (Moving Pictures Expert Group) - это название международного комитета, занимающегося разработкой данного стандарта сжатия. Его разновидности:

MPEG-1 - формат сжатия для компакт-дисков (CD-ROM). Качество видео - как у обычного видеомагнитофона, разрешение 352х240, диск с фильмом в таком формате обычно обозначается VCD (VideoCD).

MPEG-2 - формат для DVD-дисков, цифрового телевидения. В этом формате снимают видео DVD-, HDD-, Flash-камеры.

MPEG-3 - сейчас не используется. Не следует путать с MP3 (MPEG Audio Layer 3) - технологией сжатия звука!

MPEG-4 - это формат, получаемый с помощью известных кодеков DivX, XviD, H.264 и др. Часто его называют MP4. Уменьшает видеопоток еще сильнее, чем MPEG-2, но изображение довольно хорошего качества, поэтому этот формат поддерживает большинство современных DVD-плееров и видеокамер.

Ну а теперь сравним: фильм длительностью 1,5 часа в формате DV занимает примерно 20 Гб, в MPEG-2 - 4,7 Гб (пишем на DVD-диск), в формате MPEG-4 - 700 Мб (пишем на CD-диск).

HD (High Definition) - формат высокого разрешения, новый формат особой четкости изображения. Имеет две разновидности: HD1 с разрешением 1280х720 и HD2 - 1440х1080.

В последнее время большинство бытовых камер пишут в формате HD, основанном на кодеке MPEG-2. Качество видео высокое, но чтобы смотреть видео в формате HD, нужно иметь соответствующее оборудование для просмотра (например, ЖК или плазменный телевизор с большой диагональю), иначе вы не сможете оценить качество видео

 

Расширения видеофайлов

 

AVI (Audio-Video Interleaved) - это расширение огромного количества видеофайлов, но не является форматом или кодеком. Это контейнер, разработанный Microsoft, в котором могут храниться потоки 4-х типов - видео, аудио, текст и midi (MIDI (англ. Musical Instrument Digital Interface — цифровой интерфейс музыкальных инструментов) — стандарт цифровой звукозаписи).

WMV (Windows Media Video) - это формат от Microsoft, именно в нем можно получить видеоролик, сделанный с помощью программы Movie Maker.

MOV - формат Apple Macintosh QuickTime, может содержать кроме видео также графику, анимацию, 3D. Чаще всего для проигрывания этого формата нужен QuickTime Player.

MKV - тоже контейнер, который может содержать видео, аудио, субтитры, меню и пр. Имеет открытый код, пока не очень распространен, но очень перспективен.

3gp - видео для мобильных телефонов третьего поколения, имеют малый размер и низкое качество.

FLV (Flash Video) - формат видео для размещения и передачи в Интернете, используется такими площадками для размещения видеоклипов, как YouTube, RuTube, Tube.BY, Google Video, Муви и многие другие.

SWF (Shockwave Flash) - это расширение анимации созданной в программе Adobe Flash, а также видео в формате flash, проигрывается браузерами с помощью Flash Player. Флеш-ролики широко распространены в Интернете.

m2v, m2p - расширения видео в формате MPEG-2.

 

Количество информации. Формулы Хартли и Шеннона

 

Следует различать объем информации и количество информации. Ранее мы говорили лишь об объемах информации, понимая под этим объем хранимых или передаваемых данных.

Существует множество ситуаций, когда возможные события имеют различные вероятности реализации. Например, если монета несимметрична (одна сторона тяжелее другой), то при ее бросании вероятности выпадения "орла" и "решки" будут различаться.

Формулу для вычисления количества информации в случае различных вероятностей событий предложил Клод Шеннон в 1948 году. В этом случае количество информации определяется по формуле:

   

где I - количество информации;
N - количество возможных событий;
рi - вероятность i -го события.

Например, пусть при бросании несимметричной четырехгранной пирамидки вероятности отдельных событий будут равны:

 

Р1 = 1/2, р2 = 1/4, р3 = 1/8, р4 = 1/8.

 

Тогда количество информации, которое мы получим после реализации одного из них, можно рассчитать по формуле

 

 

Такой подход к определению количества информации называется вероятностным.

Для частного, но широко распространенного и рассмотренного выше случая, когда события равновероятны (pi = 1/ N), величину количества информации I можно рассчитать по формуле Ральфа Хартли

 

открытой им в 1928 г.

По этой формуле можно определить, например, количество информации, которое получим при бросании симметричной и однородной четырехгранной пирамидки:

I = log24 = 2 бита. Таким образом, при бросании симметричной пирамидки, когда события равновероятны, мы получим большее количество информации (2 бита), чем при бросании несимметричной (1,75 бита), когда события неравновероятны.

Количество информации, которое мы получаем, достигает максимального значения, если события равновероятны.

Пример 1 из теста Министерства образования и науки РФ

 

Решение. Поскольку события имеют разную вероятность, то используем формулу Шеннона

 

Пример 2 из теста Министерства образования и науки РФ

 

Решение. Поскольку может быть с равной вероятностью загадано любое целое число из диапазона [1, 64], то используем формулу Хартли

 

В заключение составим оптимальный алгоритм игры «Угадай целое число» для произвольного числа N.

Для этого применим стратегию половинного деления диапазона поиска, который называют «метод половинного деления», другое название - «метод бисекции». Блок-схема алгоритма приведена ниже.

 

Алгебра логики

 

Логика очень древняя наука. Ещё в античные времена была известна формальная логика, позволяющая делать заключения о правильности какого-либо суждения не по его фактическому содержанию, а только по форме его построения. Например, уже в древности был известен закон исключения третьего. Его содержательная трактовка была такова: «Во время своих странствований Платон был в Египте ИЛИ не был Платон в Египте». В такой форме это или любое другое выражение будут правильны (тогда говорили: истинно). Ничего другого быть не может: Платон либо был, либо не был в Египте - третьего не дано.

Другой закон логики - закон непротиворечивости. Если сказать: «Во время своих странствий Платон был в Египте И не был Платон в Египте», то очевидно, любое высказывание, имеющее такую форму, всегда будет истинным или ложным.

Например: Листва на деревьях опадает осенью. Земля прямоугольная.

Первое высказывание содержит истинную информацию, а второе - ложную. Вопросительное, побудительное и восклицательное предложения не являются высказываниями, так как в них ничего не утверждается и не отрицается.

Пример предложений, не являющихся высказываниями: Не пейте сырую воду! Кто не хочет быть счастливым?

Высказывания могут быть и такими: 2 > 1, Н2О + SO3 = H2SO4. Здесь используются языки математических символов и химических формул.

Приведённые выше примеры высказываний являются простыми. Но из простых высказываний можно получить сложные, объединив их с помощью логических связок. Логические связки - это слова, которые подразумевают определённые логические связи между высказываниями. Основные логические связки издавна употребляются не только в научном языке, но и в обыденном, - это “ и ”, “ или ”, “ не ”, “ если... то ”, “ либо... либо ” и другие известные нам из русского языка связки. В рассмотренных нами трёх законах формальной логики использовались связки “ и ”, “ или ”, “ не ”, “ если... то ” для связи простых высказываний в сложные.

В 1847 году английский математик Джордж Буль, преподаватель провинциального университета в маленьком городке Корке на юге Англии разработал алгебру логики.

Алгебра логики очень проста, так как каждая переменная может принимать только два значения: истина или ложь.

Логическая константа 1 означает, что какое-то событие истинно, в противоположность этому логический 0 означает, что высказывание не соответствует истине, т. е. ложно. Логическое выражение строится из логических переменных (А, В, Х, …), логических операций и круглых скобок.

В алгебре логики знаки операций обозначают лишь три логические операции ИЛИ, И, НЕ.

1. Логическая операция ИЛИ (V). Логическую функцию принято задавать в виде таблицы. В левой части этой таблицы перечисляются все возможные значения аргументов функции, т. е. входные величины, а в правой указывается соответствующее им значение логической функции. Для элементарных функций получается таблица истинности данной логической операции. Операцию ИЛИ называют также логическим сложением, и потому её можно обозначать знаком «+».

Для операции ИЛИ таблица истинности имеет вид:

 

A B A + B
     
     
     
     

 

Рассмотрим сложное единичное высказывание: «Летом я поеду в деревню или в туристическую поездку». Обозначим через А простое высказывание «Летом я поеду в деревню», а через В - простое высказывание «Летом я поеду в туристическую поездку». Тогда логическое выражение сложного высказывания имеет вид А+В, и оно будет ложным только, если ни одно из простых высказываний не будет истинным.

2. Логическая операция И (&). Таблица истинности для этой функции имеет вид:

A B A & B
     
     
     
     

 

Из таблицы истинности следует, что операция И - это логическое умножение, которое ничем не отличается от традиционно известного умножения в обычной алгебре. Операцию И можно обозначить знаком по-разному:

В формальной логике операции логического умножения соответствуют связки и, а, но, хотя.

3. Логическая операция НЕ. Эта операция является специфичной для алгебры логики и не имеет аналога в обычной алгебре. Таблица истинности для этой функции имеет вид:

A ⌐A
   
   

 

Она обозначается чертой над значением переменной, либо знаком приставки перед значением переменной:

Читается в обоих случаях одинаково «Не А».

В вычислительной технике операцию НЕ называют отрицанием или инверсией, операцию ИЛИ - дизъюнкцией, операцию И - конъюнкцией. Набор логических функций “ И ”, “ ИЛИ ”, “ НЕ ” является функционально полным набором или базисом алгебры логики. С помощью него можно выразить любые другие логические функции, например операции “строгой дизъюнкции”, “импликации” и “эквивалентности” и др. Рассмотрим некоторые из них.

В записях, где используются логические переменные, принимающие только два значения - логический ноль и логическая единица. Применение этих законов позволяет производить упрощение логических функций, т.е. находить для них выражения, имеющие наиболее простую форму.

 

Логические выражения

 

Среди логических операций введен приоритет:

«НЕ» – имеет высший приоритет,

«И» – имеет средний приоритет,

«ИЛИ» – имеет низший приоритет.

Примеры логических выражений с расстановкой очередности выполнения операций при вычислении выражений

 

Вычисление значения логического выражения при X = 1, Y = 0, Z = 1

 

 

 

Пример из теста Министерства образования и науки РФ

Решение. Заполним таблицу по столбцам.

 

a b c
             
             
             
             
             
             
             
             

 

Из таблицы видно, что нужно указать первое логическое выражение.



Поделиться:


Последнее изменение этой страницы: 2016-08-01; просмотров: 165; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.149.251.154 (0.068 с.)