Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Измерение количества информации
В качестве единицы информации Клод Шеннон предложил принять один бит (англ. bit — bi nary digi t — двоичная цифра). Связано это с логической организацией и физическим устройством ПК, как программно управляемого автомата. Бит в теории информации — количество информации, необходимое для различения двух равновероятных сообщений (типа "орел"—"решка", "чет"—"нечет" и т.п.). В вычислительной технике битом называют наименьшую "порцию" памяти компьютера, необходимую для хранения одного из двух знаков "0" и "1", используемых для внутримашинного представления данных и команд. В основе работы такой системы представления информации лежит двоичная система счисления (используются цифры 0 и 1) Бит — слишком мелкая единица измерения. На практике чаще применяется более крупная единица — байт, равная восьми битам.
Используются более крупные производные единицы информации: · 1 Килобайт (Кбайт) = 1024 байт = 210 байт, · 1 Мегабайт (Мбайт) = 1024 Кбайт = 220 байт, · 1 Гигабайт (Гбайт) = 1024 Мбайт = 230 байт. · 1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт, · 1 Петабайт (Пбайт) = 1024 Тбайт = 250 байт. · 1 Эксабайт (Эбайт) = 1024 Пбайта = 260 байт. · 1 Зеттабайт (Збайт) = 1024 Эбайта = 270 байт. · 1 Йоттабайт (Йбайт) = 1024 Збайта = 280 байт. Кодировка – способ компьютерного представления символов. Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. Для представления текстовой информации в компьютере чаще всего используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации, т. к. 28 = 256. Но 8 бит составляют один байт, следовательно, двоичный код каждого символа занимает 1 байт памяти ЭВМ. Все символы такого алфавита пронумерованы от 0 до 255, а каждому номеру соответствует 8-разрядный двоичный код от 0000 0000 до 1111 1111. Этот код является порядковым номером символа в двоичной системе счисления. Присвоение символу определенного числового кода – это вопрос соглашения. В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange), кодирующая первую половину символов с числовыми кодами от 0 до 127 (коды от 0 до 32 отведены не символам, а функциональным клавишам). В системе ASCII закреплены две таблицы кодирования: базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255, т.е. всего 256 символов.
1 байт в ASCII кодирует 1 символ. Примеры: 1. Слово март составляет 4 байта. 2. Например, книга содержит 100 страниц; на каждой странице – 40 строк, в каждой строке – 50 символов. Объем информации, содержащийся в книге, рассчитывается следующим образом: Страница содержит 40 × 50 = 2000 байт информации. Объем всей информации в книге (в разных единицах): 2000 × 100 = 200 000 байт. 200 000 / 1024 = 195,3125 Кб» 195 Кб. 195,3125/ 1024 = 0,19073486328125 Мб» 0,2 Мб. Национальные стандарты кодировочных таблиц включают международную часть кодовой таблицы без изменений (от 0 до 127), а во второй половине содержат коды национальных алфавитов, символы псевдографики и некоторые математические знаки. К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows, MS-DOS, Macintosh и ISO), что вызывает дополнительные трудности при работе с русскоязычными документами. В конце 90-х годов появился новый международный стандарт Unicode, который отводит под один символ не один байт, а два, и поэтому с его помощью можно закодировать не 256, а 1 112 064 различных символов (в первой версии было принято 65536 (216), 1 112 064 – в последующих, последняя версия 2008 г.− 5.1, в ней использеутся пока немногим более 100 000 колодвых позиций ). Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.
|
|||||
Последнее изменение этой страницы: 2017-01-28; просмотров: 461; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.119.160.85 (0.008 с.) |