Постоянный Битрейт или Constant Bitrate ( CBR ) 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Постоянный Битрейт или Constant Bitrate ( CBR )



· Означает, что скорость записи не меняется.

· CBR позволяет рассчитать: на какое время записи хватит того или иного объёмапамяти – объём делим на скорость, получается время. Пример:

1) Объём памяти - 128 МБайт, BR (скорость) 256 - Кбит/сек.

2) Переводим биты в байты: 256 делим на 8, получается 32КБайта/сек.                                                        

3) 128МБайт – это примерно 128000КБайт (более верно использовать коэффициент не 1000, а 1024 – округляем для упрощения).                                                                                                                       

4) Делим объём на скорость и получаем время: 128000 делим на 32, получается 4000 секунд.             

5) Чтобы секунды перевести в минуты, делим на 60; чтобы в часы – на 3600.                                    

6) ИТОГ: чуть больше 66 минут, или 1 час 6 минут.

· Есть форматы, которые поддерживают только CBR: Audio CD, WAV и ATRAC.

Переменный Битрейт или Variable Bitrate (VBR)

· Скорость передачи данных в течении всей записи меняется (потому и называется - переменный). Если в песне в какой то момент времени используется не весь диапазон частот, например соло на бас гитаре, то имеет смысл понизить битрейт для экономии места, т.к. верхние частоты в данный момент не используются и надо тратить на них информацию.

· Основное назначение VBR: экономно использовать память и уместить на цифровом носителе больше музыки по времени.

· Часто используется в MP3, WMA, AAC - в этих форматах возможен и CBR.

· Есть форматы, в которых возможен только VBR – OGG Vorbis (и AMR).

· Существует ещё и ABR (Average B itrate) – это разновидность VBR, у которого заданы верхняя и нижняя границы.

Преимущество переменного битрейта – либо меньший объем файла при таком же качестве как у постоянного, либо лучшее качество при таком же объеме файла.

Форматы сжатия звука

По сути дела, та или иная цифровая форма представления аналоговых аудио сигналов уже является способом кодирования – последовательность чисел, описывающая аналоговый аудио сигнал, сама по себе является цифровым кодом. Однако кодирование, о котором мы будем сейчас говорить, - это нечто другое. Сейчас рассмотрим методы кодирования цифровых аудио сигналов.

Оцифрованный аудио сигнал «в чистом виде» является достаточно точной, но не самой компактной формой записи исходного аналогового сигнала.

Чтобы получить полную информацию об оригинальном аналоговом сигнале в частотной полосе от 20 до 20 кГц (в слышимом диапазоне частот), аналоговый сигнал необходимо дискретизовать с частотой не менее 40 кГц. Так, стандарт CD - DA (стандарт записи данных на привычных для всех аудио компакт-дисках) устанавливает следующие параметры кодирования: двух- или одноканальная запись в формате с частотой дискретизации 44.1 кГц и разрядностью квантования 16 бит. Один час музыки в таком формате занимает объем около 600 Мб (60 минут * 60 секунд * 2 канала * 44100 отсчетов в секунду * 2 байта на отсчет = около 605 Мб). Учитывая, что, например, музыкальная коллекция рядового любителя музыки вполне может насчитывать 5000 треков средней продолжительностью около 3 минут каждый, объем памяти, требуемый для ее хранения в исходном цифровом виде, оказывается очень внушительным. Поэтому хранение относительно больших объемов аудио данных, гарантирующее достаточно хорошее качество звучания, требует применения разных «ухищрений», позволяющих уплотнить данные.

Форматы цифрового звука можно разделить на 2 больших типа.

1. Сжатие данных без потерь (англ. «lossless coding») - это способ кодирования (уплотнения) цифровой аудио информации, позволяющий осуществлять стопроцентное восстановление исходных данных из сжатого потока (под понятием «исходные данные» здесь подразумевается исходный вид оцифрованных аудио данных). К такому способу уплотнения данных прибегают в случаях, когда требуется абсолютное, стопроцентное сохранение качества оригинального звучания аудио данных. Существующие сегодня алгоритмы беспотерьного сжатия позволяют сократить занимаемый данными объем на 20-50% и при этом гарантировать стопроцентное восстановление исходного цифрового материала из сжатых данных. Механизмы работы подобных кодеров сходны с механизмами работы архиваторов общих данных, таких, как, например, ZIP или RAR, но при этом адаптированы специально для сжатия аудио данных. Беспотерьное кодирование, хотя и идеально с точки зрения сохранности качества аудио материалов, но оказывается неспособным обеспечить высокий уровень компрессии. Самыми известными и распространенными форматами беспотерьного сжатия являются FLAC и APE. Они обеспечивают сжатие в среднем на 30%, т.е. если сжать обычный CD в формат FLAC, то битрейт будет вместо 1400 кбит/с, примерно 900 кбит/с, а качество соответственно остается исходным.

2. Существует другой, более современный путь уплотнения данных. Это так называемое сжатие данных с потерями (англ. «lossy coding»).Цель такого кодирования заключается в достижении любыми путями максимально высокого коэффициента компрессии данных при сохранении качества их звучания на приемлемом уровне. В основе идеи кодирования с потерями лежит два простых основополагающих соображения:

исходные цифровые аудио данные избыточны – они содержат много лишней, бесполезной для слуха информации, которую можно удалить, тем самым, повысив коэффициент компрессии;

требования к качеству звучания аудио материала могут быть разными и зависят от конкретных целей и сфер использования.

Кодирование с потерями потому и называется «с потерями», что приводит к утрате некоторой части аудио информации. Такое кодирование приводит к тому, что декодированный сигнал при воспроизведении звучит похоже на оригинальный, но фактически перестает быть ему идентичным. В основе большинства методов кодирования с потерями лежит использование психоакустических свойств слуховой системы человека, а также различных хитростей, связанных с переквантованием и передискретизацией сигнала. В частотности, в процессе компрессии аудио данные анализируются кодером на предмет выявления различных деталей звучания, которыми можно пренебречь. Замаскированные частоты, неслышимые и слабослышимые детали звучания – всем этим можно пожертвовать с целью достижения более высокого значения коэффициента компрессии. Там, где в звучании важна лишь разборчивость (например, в телефонии, где наличие частот выше 4 кГц не является необходимым), аудио информация в процессе кодирования подвергается серьезному «упрощению», что вкупе с использованием «умных» квантователей и удачных «жадных» алгоритмов компрессии данных позволяет достичь высочайших степеней компрессии (1: 50 и выше). Там, где качеству звучания предъявляются более высокие требования (например, в портативных и бытовых аудио устройствах), аудио материалы подвергают более щадящему кодированию. Надо отметить, что степень агрессивности кодера по отношению к деталям звучания может регулироваться (эта способность, впрочем, зависит от конкретной реализации). В среднем, современные кодеры даже при столь высокой степени компрессии, как 1: 10 позволяют обеспечить отличное звучание, качество которого средним слушателем на средней аппаратуре оценивается как равное качеству звучания исходных аудио данных.

Сегодня существует множество кодеров аудио данных, основанных на идее кодирования с потерями. Вот только некоторые из них: MPEG-1 Audio Layer 3 (всем известный как MP3), Windows Media Audio (WMA), Ogg Vorbis (OGG), MPEG-2/4 AAC и другие. Рассмотрим их поподробнее.

 

Форматы сжатия с потерями

MPEG-1 Layer 3

Известный сегодня фактически каждому пользователю компьютера под незамысловатой маркой «MP3» кодек MPEG-1 Layer 3 – это наиболее старый из всех распространенных на сегодня lossy-кодеков. Своим названием он обязан группе MPEG, которая занималась его разработкой и которая продолжает разрабатывать новые аудио и видео кодеки. О ней стоит упомянуть отдельно.

MPEG расшифровывается как «Moving Picture Coding Experts Group», дословно – «группа экспертов по кодированию подвижных изображений». Группа MPEG ведет свою историю с января 1988 года и занимается разработкой различных алгоритмов и стандартов кодирования аудио и видео информации. В собраниях MPEG принимают участие несколько сотен специалистов из более чем двухсот крупных и мелких компаний. При этом большая часть участников MPEG - это специалисты, занятые в тех или иных научных и академических учреждениях. На сегодняшний день группой MPEG разработаны следующие стандарты:

MPEG-1 (принят в ноябре 1992 г.) - стандарт кодирования, хранения и декодирования подвижных изображений и аудио информации;

MPEG-2 (принят в ноябре 1994 г.) - стандарт кодирования данных для цифрового телевещания;

MPEG-4 - стандарт для мультимедиа приложений (в его разработке еще далеко не поставлена точка);

MPEG-7 - универсализованный стандарт работы с мультимедиа информацией, предназначенный для обработки, компоновки и управления мультимедиа информацией.

Стандарт MPEG-1 представляет собой, по сути, целый комплект аудио и видео стандартов. Согласно стандартам ISO (International Standards Organization), аудио часть MPEG-1 включает в себя три алгоритма различных уровней сложности: Layer 1 (уровень 1), Layer 2 (уровень 2) и Layer 3 (уровень 3, называемый большинством просто «MP3»). Общая структура процесса кодирования одинакова для всех уровней MPEG-1. Вместе с тем, несмотря на схожесть уровней в общем подходе к кодированию, уровни различаются по целевому использованию и задействованным в кодировании внутренним механизмам. Для каждого уровня определен свой формат записи выходного потока данных и, соответственно, свой алгоритм декодирования. Алгоритмы MPEG-1 основаны в целом на изученных свойствах восприятия звуковых сигналов слуховым аппаратом человека.

Процедура кодирования аудио информации, вкратце, представляет собой следующий процесс. В начале кодирования входной цифровой аудио поток в формате WAV с помощью цифровых фильтров разделяется на несколько частотных полос. Дальнейший процесс зависит от Layer ' a.

В случае Layer 3 (то есть, в случае MP3) в каждой полосе сигнал раскладывается на частотные составляющие спектра. Спектр входного сигнала очищается от заведомо неслышных составляющих - низкочастотных шумов и наивысших гармоник. На следующем этапе производится психоакустический анализ кодируемого аудио материала в диапазоне слышимых частот. Вышеописанные процессы преобразования позволяют исключить из исходного аудио материала больше половины информации. На заключительном этапе кодирования производится сжатие уже готового потока данных (архивация).

Комплект MPEG-1 предусмотрен для кодирования аудио сигналов, оцифрованных с частотой дискретизации 32, 44.1 и 48 КГц. Три упомянутых выше уровня MPEG-1 различаются свой целевой направленностью, механизмами кодирования и, таким образом, обеспечивают различные степени сжатия. Так, например, аудио данные в формате [44.1 кГц / 16 бит / стерео], Layer 1 позволяет сохранить без особо ощутимых потерь качества при скорости потока (битрейте) 384 Кбит/с, что составляет 4-х кратный выигрыш в занимаемом данными объеме; Layer 2 обеспечивает субъективно такое же качество при 192 - 224 Кбит/с, а Layer III (MP3) - при 128-160. Нельзя говорить о выигрыше или проигрыше одного уровня перед другим, так как каждый уровень разработан для достижения своей собственной цели. Например, преимущество Layer 3 заключается в том, что фактически он позволяет сжимать информацию в 8-12 раз (в зависимости от битрейта) без сильно ощутимых потерь качества исходного звучания. При этом, однако, обеспечиваемая им скорость компрессии является самой низкой среди всех уровней. Layer 2 потенциально способен обеспечить более высокое качество кодирования в виду более «легкой» внутренней обработки сигнала в процессе преобразования. В то же время, Layer 2 не позволяет достичь таких высоких степеней компрессии, какие достигаются при использовании Layer 3.

Ogg Vorbis Одной из негативных сторон кодека MP3 являлась и является его коммерческая основа, заключающаяся как минимум в том, что каждый производитель, создающий новый программный или аппаратный MP3-кодер, обязан платить отчисления изобретателям кодека. Эта ситуация не могла не вызывать недовольство среди пользователей и разработчиков. Так появились независимые разработки в области компрессии аудио.

Кодек Ogg Vorbis вышел в свет в июне 2000 года. Он является частью проекта Ogg Squish, нацеленного на создание полностью открытой системы мультимедиа. Разработчиком проекта является группа, именующаяся Xiphophorus. В основе Ogg Vorbis лежат те же идеи, что и в основе MPEG-1 Layer II, при этом Ogg Vorbis использует свои собственные оригинальные математические алгоритмы, а также собственную психоакустическую модель, что освобождает его разработчиков от необходимости выплачивать какие-то лицензионные отчисления или производить иные выплаты сторонним фирмам-производителям. Кодек Ogg Vorbis, будучи созданным позже MPEG-1, является несколько более развитым. Он рассчитан на сжатие данных на всех возможных битрейтах без ограничений, от 8 Кбит/с до 512 Кбит/с. Кодер позволяет хранить внутри файлов-контейнеров подробные комментарии об исполнителе и названии композиции, а также предусматривает возможность кодирования нескольких каналов аудио (более двух), возможность редактирования содержимого файлов и поддержку техники «масштабируемых битрейтов» - возможности изменения битрейта аудио потока без необходимости его декодирования. Стоит отметить, что при кодировании в этот формат нет возможности выставить битрейт, можно выставить только уровень качества от 1 до 10, соостветственно 10- наивысшее качество, но и объем файла тоже будет довольно большой.

 

Windows Media Audio (WMA) Кодек Windows Media Audio (сокращенно WMA) является сегодня собственной разработкой компании Microsoft и успешно ею продвигается. Изначально, кодек WMA разрабатывался фирмой Voxware и имел название Voxware Audio Codec, однако впоследствии компания забросила его доработку, остановившись на v4.0. Разработки Voxware были выкуплены компанией Microsoft, серьезно доработаны и представлены общественности в виде аудио кодека под названием Windows Media Audio (сокращенно WMA).

Если кодек MP3 был изначально стандартизован на предмет разрешенных значений битрейтов и других основных параметров, то WMA изменялся параллельно своему становлению и развитию. На сегодняшний день существует несколько версий кодека WMA: v1, v2, v7, v8 и v9. Внутреннее устройство и механизмы кодирования кодека держатся компанией Microsoft в секрете, однако, опираясь на результаты некоторых тестов, можно предположить, что идеи, легшие в основу WMA, не сильно отличаются от идей, на которых базируются методы MPEG-1.

AAC (Advanced Audio Coding) Группа MPEG, конечно, не удовлетворилась разработкой аудио кодека, включенного в стандарт MPEG-1. Исследования в области кодирования аудио продолжались и вылились в создание новых стандартов кодирования аудио от MPEG.

Общий стандарт MPEG-2 разрабатывался специально для кодирования телевизионных сигналов. В апреле 1997 комплект MPEG-2 получил «продолжение» в виде алгоритма MPEG-2 AAC (MPEG-2 Advanced Audio Coding – продвинутое аудио кодирование).

Так же, как и в комплекте аудио стандартов MPEG-1, в основе алгоритма AAC лежит психоакустический анализ сигнала. Вместе с тем, алгоритм AAC имеет в своем механизме множество дополнений, направленных на улучшение качества выходного аудио сигнала. В частности, используется другой тип преобразований, улучшены методы шумовой обработки, модернизирован метод записи выходного бит-потока и т.д. Следует отметить, что кодек AAC не является обратно совместимым с уровнями MPEG-1, а значит, аудио материалы в формате MPEG-2 AAC не могут быть декодированы с помощью декодера MPEG-1.

Спустя несколько лет после стандартизации MPEG-2, свет увидел новый комплект стандартов, комплект MPEG-4. По обыкновению, стандарт MPEG-4, помимо прочего, описывает и методы кодирования аудио. Эти методы объединены под общим названием MPEG-4 AAC.

Расширение AAC под именем aacPlus было анонсировано компанией Coding Technologies 9 октября 2002 года. aacPlus основан на использовании технологии SBR (Spectral Band Replication). Технология SBR предназначена для улучшения качества передачи верхнего частотного диапазона. Идея технологии и предпосылки к ее созданию состоят вот в чем. Дело в том, что кодеки, использующие психоакустическую модель, как показывает практика, имеют один общий недостаток: все они обеспечивают довольно хорошее качество звучания во всем диапазоне слышимых частот, но только до битрейта 128-112 Кбит/с. Компрессия на более низких битрейтах приводит к очень заметной деградации качества звучания, что заставляет разработчиков кодеков при использовании низких битрейтов принудительно ограничивать кодируемый диапазон частот. Технология SBR является попыткой устранить этот досадный недостаток за счет сохранения ограниченной информации о верхней полосе частотного спектра сигнала в процессе кодирования и последующего искусственного синтеза (воссоздания) верхних частот в процессе декодирования. Технология хоть и является очень искусственным методом решения проблемы, но, тем не менее, оказывает благотворное влияние на восприятие закодированных таким образом аудио материалов.

Надо сказать, что «комплектация» MPEG-4 новыми подстандартами и дополнениями продолжается, так что список механизмов и инструментарий кодирования MPEG-4 может постепенно расширяться. Кроме того, нужно заметить, что не все стандартизованные в MPEG-4 методы кодирования нашли отражение в реально существующих аппаратных или программных продуктах. Это связано с тем, что многое из описанного в MPEG-4 стандартизует способы обмена информации, но не сами способы кодирования. Многие идеи кодирования (в особенности, это касается компрессии видео) требуют даже по сегодняшним меркам гигантских вычислительных способностей, так что до полной реализации всего предусмотренного в MPEG-4 еще далеко.

Перечисленные форматы конечно не все, существует множество кодеков, но они в основном используют принципы, заложенные в этих основных форматах.

В заключении разговора о lossy-кодировании стоить заметить следующее. Кодирование с потерями – это очень удобный инструмент. Однако в отличие от беспотерьного кодирования – достаточно опасный инструмент. Применяться lossy -кодирования должно там, где ему место. Совершенно очевидно, что кодированию с потерями ввиду самой его сути не место, например, в студийной звукозаписи. При этом совершенно нелогично отказываться от его использования, например, в телефонии.

Для уменьшения объема файла есть некоторые способы двухканального кодирования:

Dual Channel - самый простой способ кодирования стерео сигнала, каждому каналу отдается ровно половина потока.

Stereo - при использовании данного способа кодирования каждый канал кодируется отдельно, так же как и в предыдущем способе. Единственное отличие заключается в том, что размеры потоков являются величиной динамической. Кодер в процессе сжатия определяет, какому каналу отдать приоритет на каждом конкретном участке записи. Это, например, позволяет избежать кодирования тишины в одном из каналов. В это время другой канал кодируется качественней. Обычно такой вид кодирования позволяет получить более качественный звук.

Joint Stereo

· (MS Stereo) - в данном случае сигнал раскладывается на средний между каналами и разностный. Далее один из каналов кодируется очень качественно, а другой - очень некачественно. Если каналы практически совпадают (как в попсе), то можно получить очень хорошее качество сигнала. Используется при средних и низких BR.

· (MS/IS Stereo) - этот метод может применяться для низких BR. Здесь кодируется только средний сигнал между каналами (фактически становится моно). Сохраняется только разность в мощности сигнала между каналами. Такая потеря качества на высоких BR неприемлема, но на низких BR данная методика позволяет получить достаточно качественный сигнал.

Дополнительно

Многие форматы поддерживают возможность записывать в сам файл песни дополнительную текстовую или даже графическую информацию: ID3 tag. В Тэгах может содержаться информация об исполнителе песни, жанре, альбоме, годе выхода и т.д. Нужно не путать Тэги с названием файлов – это разные вещи. Они бывает двух версий: версия 1 и 2. Во 2-ой версии больше различный полей для записи.

В некоторых форматах может использоваться DRM (формат защиты авторских прав). Т.е. файл может быть защищен от копирования, не воспроизводиться на каких-либо устройствах и т.д.

Многие форматы поддерживают многоканальный звук, т.е. не только стерео, а большее количество каналов. Часто, например на DVD диске с фильмом можно увидеть надпись: звук DD 5.1. Что же означают цифры 5.1 – это значит, что звук закодирован в 5 каналов+специальный низкочастотный – итого 6 каналов. Низкочастотный канал (сигнал) предназначен для низкочастотной колонки (сабвуфера). Эта колонка служит только для воспроизведения басов, причем ее можно поставить практически в любое местов комнате, т.к. человеческое ухо не может спозиционировать низкочастотный источник звука. Сабвуфер придумали для того, что бы уменьшить размеры остальных колонок, т.к. для вопроизведения басов требуется динамик большого размера.

Если написано, что звук в формате DD 2.0. это значит, что это просто стерео и нет отдельной дорожки для сабвуфера. Буквы DD означают Dolby Digital – формат звука в DVD-фильмах, формат неплохой, но в большинстве случаев лучше звучит DTS (Digital Theater System), т.к. он оптимизирован именно для фильмов и имеет больший битрейт.

 



Поделиться:


Последнее изменение этой страницы: 2020-12-09; просмотров: 187; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.15.174.76 (0.026 с.)