Измерение количества информации 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Измерение количества информации



В качестве единицы информации Клод Шеннон предложил принять один бит (англ. bitbi nary digi t — двоичная цифра). Связано это с логической организацией и физическим устройством ПК, как программно управляемого автомата.

Бит в теории информации количество информации, необходимое для различения двух равновероятных сообщений (типа "орел"—"решка", "чет"—"нечет" и т.п.).

В вычислительной технике битом называют наименьшую "порцию" памяти компьютера, необходимую для хранения одного из двух знаков "0" и "1", используемых для внутримашинного представления данных и команд.

В основе работы такой системы представления информации лежит двоичная система счисления (используются цифры 0 и 1)

Бит — слишком мелкая единица измерения. На практике чаще применяется более крупная единица — байт, равная восьми битам.

 

Используются более крупные производные единицы информации:

· 1 Килобайт (Кбайт) = 1024 байт = 210 байт,

· 1 Мегабайт (Мбайт) = 1024 Кбайт = 220 байт,

· 1 Гигабайт (Гбайт) = 1024 Мбайт = 230 байт.

· 1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт,

· 1 Петабайт (Пбайт) = 1024 Тбайт = 250 байт.

· 1 Эксабайт (Эбайт) = 1024 Пбайта = 260 байт.

· 1 Зеттабайт (Збайт) = 1024 Эбайта = 270 байт.

· 1 Йоттабайт (Йбайт) = 1024 Збайта = 280 байт.

Кодировка – способ компьютерного представления символов.

Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму.

Для представления текстовой информации в компьютере чаще всего используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации, т. к. 28 = 256. Но 8 бит составляют один байт, следовательно, двоичный код каждого символа занимает 1 байт памяти ЭВМ.

Все символы такого алфавита пронумерованы от 0 до 255, а каждому номеру соответствует 8-разрядный двоичный код от 0000 0000 до 1111 1111. Этот код является порядковым номером символа в двоичной системе счисления.

Присвоение символу определенного числового кода – это вопрос соглашения. В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange), кодирующая первую половину символов с числовыми кодами от 0 до 127 (коды от 0 до 32 отведены не символам, а функциональным клавишам). В системе ASCII закреплены две таблицы кодирования: базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255, т.е. всего 256 символов.

1 байт в ASCII кодирует 1 символ.

Примеры: 1. Слово март составляет 4 байта.

2. Например, книга содержит 100 страниц; на каждой странице – 40 строк, в каждой строке – 50 символов. Объем информации, содержащийся в книге, рассчитывается следующим образом:

Страница содержит 40 × 50 = 2000 байт информации. Объем всей информации в книге (в разных единицах):

2000 × 100 = 200 000 байт.

200 000 / 1024 = 195,3125 Кб» 195 Кб.

195,3125/ 1024 = 0,19073486328125 Мб» 0,2 Мб.

Национальные стандарты кодировочных таблиц включают международную часть кодовой таблицы без изменений (от 0 до 127), а во второй половине содержат коды национальных алфавитов, символы псевдографики и некоторые математические знаки. К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows, MS-DOS, Macintosh и ISO), что вызывает дополнительные трудности при работе с русскоязычными документами.

В конце 90-х годов появился новый международный стандарт Unicode, который отводит под один символ не один байт, а два, и поэтому с его помощью можно закодировать не 256, а 1 112 064 различных символов (в первой версии было принято 65536 (216), 1 112 064 – в последующих, последняя версия 2008 г.− 5.1, в ней использеутся пока немногим более 100 000 колодвых позиций ). Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.



Поделиться:


Последнее изменение этой страницы: 2017-01-28; просмотров: 459; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.138.116.50 (0.009 с.)