Лекция 9. 1 основы числового кодирования 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Лекция 9. 1 основы числового кодирования



 

Информация становится знанием, когда она упорядочена и сохранена. Сохраняется информация в процессе, который называ­ется записью. При этом информация пре­образуется в данные. Запись — это управ­ляемый процесс регистрации данных, представляющих информацию.

Схемы кодирования

В процессе записи информационный объект становится данными. Напри­мер, число записывают последовательнос­тью цифр, слово — последовательностью букв, а предложение — последовательнос­тью слов и знаков препинания. Примеры можно продолжать, но вывод уже ясен: чтобы информация стала данными, необ­ходим информационный метод, устанавли­вающий соответствие между элементами информационного объекта и элементами данных, полученных в ходе записи. Этот информационный метод называется мето­дом кодирования информации, а процесс преобразования элементов информацион­ных объектов в элементы данных называ­ется кодированием информации.

Существуют три основные схемы, в кото­рые укладывается большинство методов кодирования информации: аналоговое ко­дирование, табличное кодирование и чис­ловое кодирование. В рамках табличного кодирования есть свои схемы, например символьное кодирование и цифровое коди­рование.

Аналоговое кодирование

Аналоговое кодирование — это метод регистрации непрерывной последова­тельности сигналов известной физической природы в виде подобной ей последова­тельности данных другой физической при­роды.

Характерными системами, реализую­щими аналоговое кодирование, являются: фотографические устройства (кроме циф­ровых), магнитофоны, видеокамеры (не цифровые), устройства передачи радиосиг­налов и другие. Согласно определению, принцип аналогового кодирования имеет две характер­ные особенности:

· как исходная последовательность сиг­налов, так и результирующие данные имеют непрерывный характер;

· результирующие данные подобны исходным сигналам по избранному критерию подобия.

Табличное кодирование

Схемы табличного кодирования информации не встречаются в живой природе — это изобретение общества. В их основе лежат предварительно созданные таблицы образцов сигналов. Кодируемый сигнал сравнивается с образцами таблицы, из них выбирается ближайший похожий, и запи­сывается не сам сигнал, а его образец.

Поскольку при кодировании элемент информации заменяется элементом дан­ных, теоретически всё равно, какую при­роду имеет этот элемент — он может быть рисунком, символом, комбинацией зна­ков. Он также может быть записан и ком­бинацией цифр. Например, мы можем построить таблицу, в которой каждой бук­ве будет соответствовать её порядковый номер в алфавите. Это пример таблично-цифровой схемы кодирования. Подобные схемы очень удобны, когда речь идёт о ко­дировании информационных объектов, от­носящихся не к природе, а к обществу, например для кодирования текстов доку­ментов и сообщений.

Важно обратить внимание на то, что хотя при таблично-цифровом кодировании эле­менты информации и записываются груп­пами цифр, у полученных групп нет чис­ловой природы - - их природа остаётся символьной. Чтобы подчеркнуть, что ре­зультатом таблично-цифрового кодирова­ния являются не числа, а группы цифр, этот вид кодирования называют цифро­вым кодированием.

Числовое кодирование

 

Совместить достоинства аналогового и цифрового кодирования позволяет так называемое числовое кодирование. Согласно этой схеме кодирования элементы инфор­мации записываются числами, значения которых пропорциональны величине заре­гистрированного сигнала. Дан­ные, образующие числовую запись, очень удобны для автоматической обработки средствами вычислительной техники.

Сохранение подобия необходимо для за­писи информации естественного происхож­дения, переносимой электромагнитными или упругими волнами. Это предопределя­ет применение числового кодирования для записи фотографической, звуковой и ви­деоинформации с целью обработки данных на компьютере.

Системы счисления

Вопросы, касающиеся записи чисел и действий с ними, относятся к арифметике. Она вводит в этой области следующую сис­тему понятий.

• Набор правил представления (изображения) и наименования чисел называ­ется системой счисления.

• Знаки, используемые для записи чисел, называют цифрами.

• Если значение, описываемое цифрой, зависит от ее положения в записи чис­ла, система счисления называется по­зиционной.

• Положение цифры в записи числа в позиционной системе счисления назы­вают разрядом.

Основным параметром, характеризую­щим ту или иную систему счисления, явля­ется её основание. Основание позиционной системы счисления — это множитель, ко­торый определяет изменение значения, описываемого цифрой, при переносе её в следующий по старшинству разряд. Следу­ющий по старшинству разряд располагается слева от данного. Основание системы счисления совпадает с количеством разных цифр, используемых в ней для записи чисел.

В математике и в быту общепринята по­зиционная десятичная система счисле­ния. Единица старшего разряда (например, в числе 10) соответствует десяти единицам младшего разряда. Запись чисел производится при помощи десяти разных цифр: О, 1,2,3,4,5,6,7,8,9.

Для представления числовых данных в компьютере используется двоичная систе­ма счисления. Основание этой системы равно двум. Соответственно, для записи чисел в этой системе используются только два символа (цифры): 0 и 1.

Если в разряде числа содержится мини­мальное число, для которого в системе счисления определён символ, значение это­го разряда называется пустым. Если в раз­ряде числа содержится максимальное чис­ло, для которого в системе счисления определён символ, значение этого разряда называется полным. Таким образом, осо­бенностью двоичной системы счисления является то, что двоичные разряды всегда являются либо полными, либо пустыми.

Если при записи информации использо­вано числовое кодирование, а запись полу­ченных чисел выполнена в двоичной сис­теме счисления, можно сделать следующие выводы.

1. Поскольку разряд числа, записанного в двоичной системе, всегда либо по­лон, либо пуст и, в отличие от других систем счисления, не имеет промежуточных состояний, можно утверждать, что неопределённость значения двоичного разряда теоретически яв­ляется минимально возможной и рав­на 1/2. В любых иных системах счис­ления неопределённость значения разряда выше, поскольку в них возможны промежуточные состояния разряда.

2. Поскольку неопределённость состоя­ния разряда двоичного числа теоретиче­ски является минимально возможной, можно утверждать, что в закрытой информационной системе (только в закрытой) количество информации, снимающее эту неопределённость, является минимально возможным регистрируемым количеством инфор­мации.

3. Поскольку при записи информации образуются данные, мы можем утверждать, что содержание двоичного раз­ряда является минимальным количе­ством данных, которым может быть представлено минимальное количе­ство информации при её записи. Из сказанного вытекает, что двоичный разряд можно считать:

а) минимальной единицей измерения количества данных;

б) минимальной единицей представле­ния информации при записи.

Полезные особенности двоичного разря­да были заслуженно отмечены. Он получил индивидуальное название -- бит. Слово «бит» происходит от английского слова bit, которое, в свою очередь, является произ­водным от словосочетания bynary digit, что на русский язык переводится как двоич­ная цифра.

Бит — это двоичный разряд. Его инфор­мационным содержанием является его состояние (полон/пуст). Допустимо также говорить, что бит установлен/сброшен, включён/выключен. Можно говорить и о его числовом значении (1 или 0).

В вычислительной технике наиболее устоявшейся является единица, называе­мая байтом. Байт — это композиция из восьми взаимосвязанных битов.

Байт, в отличие от бита, может быть весь­ма разнообразным по информационному содержанию. Прежде всего, его информа­ционным содержанием являются 256 раз­личимых состояний (28 = 256). При коди­ровании положительных целых чисел информационным содержанием байта является число от 0 до 255. Но поскольку кодировать можно не только положитель­ные числа, байт может выражать отрица­тельное число, символ алфавита, цвет точ­ки, высоту звука и многое другое.

Обратите особое внимание на то, что байт — это не группа из восьми последова­тельных битов, а именно композиция. Байт имеет собственное информационное содержание.

Байт — это технический термин, связан­ный с определённым уровнем развития техники. Байт не всегда считался восьми­разрядным. В прошлом существовали компьютеры, в которых данные представ­лялись семиразрядными и шестиразряд­ными байтами. В настоящее время пред­ставление о байте как о восьмибитовой композиции общепринято, и нет основа­ний предполагать, что оно может изме­ниться в ближайшем будущем,

Производными единицами измерения количества данных являются: килобайт (Кбайт), мегабайт (Мбайт), гигабайт (Гбайт), терабайт (Тбайт) и другие. В математике и физике принято считать, что приставка кило- перед обозначением единицы изме­рения обозначает более крупную единицу измерения, отличающуюся от исходной в тысячу раз (приставка мега — в миллион раз). Однако в информатике используется иной подход. Здесь соответствие между основной единицей измерения и производ­ной устанавливается через масштабный множитель, являющийся степенью двой­ки. Так, например, 1 Кбайт = 210 байт, то есть, если быть точным, 1Кбайт = 1024 бай­та. Как видите, отличие от тысячи невели­ко (менее 3%), и для инженерных задач полученная погрешность вполне приемле­ма. Но при переходе к более крупным про­изводным единицам точность начинает быстро падать, и это явление приходится учитывать.

1 Кбайт = 2ю байт = 1024 байт

1 Мбайт = 220 байт = 1 048 576 байт

1 Гбайт = 230 байт = 1 073 741 824 байт

 

КОДИРОВАНИЕ ЧИСЕЛ И ТЕКСТОВ

 

В качестве схем кодирования данных для компьютеров используют цифровые схемы (табличные) или числовые. И в том, и в другом случае аналоговая информация представляется битами, байтами или ком­позициями байтов. В этом разделе мы познакомимся с методами цифрового и числового кодирования основных видов информации при её записи. Рассматривать мы будем их в хронологическом порядке -именно так, как учёные создавали и вне­дряли методы кодирования.

 



Поделиться:


Последнее изменение этой страницы: 2017-02-05; просмотров: 1035; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.222.121.170 (0.008 с.)