Кодирование данных двоичным кодом 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Кодирование данных двоичным кодом



Данные – составная часть информации. Данные могут храниться и транспортироваться на носителях различных видов (бумага, магнитные диски, фотография и т.д.). Любой носитель можно характеризовать параметром разрешающей способности (количество данных, записанных в единице измерения для данного носителя) и динамическим диапазоном (логарифмическое отношение интенсивности амплитуд максимального и минимального регистрируемого сигналов). От этих свойств носителя нередко зависит полнота, доступность и достоверность информации. Задача преобразования информации с целью смены носителя является одной из важнейших задач информатики.

В ходе информационного процесса данные преобразуются из одного вида в другой с помощью методов. Обработка данных включает в себя множество различных операций. Можно выделить следующие основные операции:

· сбор данных – накопление информации;

· формализация данных – приведение данных, поступающих из разных источников, к одинаковой форме;

· фильтрация данных – отсеивание «лишних» данных, в которых нет необходимости для принятия решений;

· сортировка данных – упорядочение данных по заданному признаку;

· архивация данных – организация хранения данных в удобной и легкодоступной форме;

· защита данных – комплекс мер для предотвращения утраты, воспроизводств и модификации данных;

· транспортировка данных – прием и передача данных между удаленными участниками информационного процесса;

· преобразование данных – перевод данных из одной формы в другую или из одной структуры в другую.

 

Работа с информацией может иметь огромную трудоемкость и ее надо автоматизировать. Для автоматизации работы с данными, относящимися к различным типам, важно унифицировать их форму представления. Для этого используются прием кодирования, то есть выражение данных одного типа через данные другого типа. Естественные человеческие языки – это не что иное, как системы кодирования понятий для выражения мыслей посредством речи. К языкам близко примыкают азбуки – системы кодирования компонентов языка с помощью графических символов.

Система кодирования в вычислительной технике называется двоичным кодированием и основана на представлении данных последовательностью двух знаков: 0 и 1 – двоичные цифры (bi nary digi t), сокращенно bit (бит).

Одним битом могут быть выражены 2 понятия: 0 или 1 (да или нет).

Двумя битами можно закодировать четыре различных понятия:

00 01 10 11

Тремя битами – восемь:

000 001 010 011 100 101 110 111

 

Общая формула имеет вид: N = 2m, где

 

N – количество независимых кодируемых значений;

m – разрядность двоичного кодирования, принятая в данной системе.

 

Целые числа кодируются достаточно просто – достаточно взять целое число и делить его пополам до тех пор, пока в остатке не образуется 0 или 1. Совокупность остатков от каждого деления, записанная справа налево вместе с последним остатком, и образует двоичный аналог десятичного числа. Например:

 

19:2 = 9+ 1 9:2 = 4+ 1 4:2 = 2+ 0 2:2 = 1 +0

Таким образом, 1910 = 100112

Проверка: 1 *20+ 1 *21+ 0 *22+ 0 *23+ 1 *24=19

 

Для кодирования целых чисел от 0 до 256 достаточно иметь 8 разрядов (28=256). 16 бит позволяют закодировать целые числа в диапазоне от 0 до 65535, а 24 бита – уже более 16.5 миллионов разных значений.

Для кодирования действительных чисел используют 80-разрядное кодирование. Число сначала преобразуется в нормализованную форму. Например,

35468, 24627 = 0.3546824627105

мантисса характеристика

Большую часть из 80 бит отводят для хранения мантиссы вместе со знаком числа, а некоторое число разрядов – для характеристики вместе со знаком порядка.

Если каждому символу алфавита сопоставить определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию. Для кодирования 256 символов достаточно 8 бит.

Институт стандартизации США ввел в действие систему кодирования ASCII (American Standard Code for Information Interchange – стандартный код информационного обмена США).

В системе ASCII закреплены две таблицы кодирования – базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.

Коды от 0 до 31 – это коды для управления выводом данных. Начиная с кода 32 по код 127 размещены коды знаков препинания, цифр, арифметических действий, некоторых вспомогательных символов и символов английского алфавита. Прописные и строчные символы русского языка в компьютерах, работающих на платформе Windows, размещены, начиная с кодов 192(А) по 255(я) – кодировка Windows 1251.

В СССР была разработана система кодирования КОИ -7, в российском секторе Интернет сейчас используют КОИ – 8.

Графическое изображение состоит из мельчайших точек, образующих узор, называемый растром. Так как линейные координаты и яркость каждой точки можно выразить с помощью целых чисел, то растровое кодирование позволяет использовать двоичный код для представления графических данных.

Для кодирования черно-белого изображения достаточно 8-разрядного кода. Для кодирования цветных изображений применяется принцип декомпозиции произвольного цвета на основные составляющие: Красный (Red, R), зеленый (Green,G), синий (Blue,B) – система RGB. Если для кодирования яркости каждой составляющей использовать 256 значений (8 бит), то на кодирование одной точки надо затратить 24 разряда. При этом система кодирования обеспечивает однозначное определение 16,5 миллионов различных цветов, что близко к чувствительности человеческого взгляда.

Кодирование звуковой информации пришло в вычислительную технику позже, поэтому методы кодирования ее двоичным кодом далеки от стандартизации.

Структуры данных

Работа с большими наборами данных автоматизируется проще, когда данные упорядочены, т.е. образуют заданную структуру. Существует три основных типа структур данных:

· линейная;

· иерархическая;

· табличная.

 

Линейные структуры – это списки данных. Каждый элемент данных однозначно определяется своим номером в массиве.

Табличные структуры – это упорядоченные структуры, в которых адрес элемента определяется номером строки и номером столбца, на пересечении которых находится ячейка, содержащая искомый элемент. Существуют таблицы, содержащие более чем два измерения.

Нерегулярные данные, которые трудно представить в виде списка или таблицы, часто представляют в виде иерархических структур. В иерархической структуре адрес каждого элемента определяется путем доступа (маршрутом), ведущим от вершины структуры к данному элементу. Например, путь доступа к программе, запускающей программу Калькулятор:

Пуск ►Программы ►Стандартные ►Калькулятор

 

Файлы и файловые структуры

 

В информатике для измерения данных используют тот факт, что разные типы данных имеют двоичное представление и поэтому вводят единицы данных, основанных на двоичном разряде (бит).

Наименьшей единицей измерения является байт, равный восьми битам. С его помощью кодируется один символ.

Более крупной единицей является килобайт.

1 Кбайт = 1024 байт = 210 байт

Одна страница машинописного текста составляет около 2 Кбайт

Используют и более крупные единицы.

1 Мбайт = 1024 Кбайт = 220 байт. Оперативная память – 128, 256 Мбайт

1 Гбайт = 1024 Мбайт = 230 байт. Объем жесткого диска – десятки Гбайт

1 Тбайт = 1024 Гбайт = 240 байт. Виртуальная память ≤ 64 Тбайт

 

В качестве единицы хранения данных принят объект переменной длины, называемый файлом. Файл – это последовательность произвольного числа байтов, обладающая уникальным собственным именем. В файле хранят данные, относящиеся к одному типу.

Хранение файлов организуется в иерархической структуре, которая в данном случае называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором сохраняются файлы. Далее файлы группируются в каталоги (папки), внутри которых могут быть созданы вложенные каталоги (папки). Пример записи полного имени файла:

С:\Documents and Setting\Gesh\My Documents\Информатика\Информация и информатика.doc

 

Информатика

 

Слово информатика происходит от французского слова Informatique, образованного в результате объединения терминов Information (информация) и Automatique (автоматика), что выражает ее суть как науки об автоматической обработке информации. В большинстве стран Западной Европы и США используется другой термин – Computer Science (наука о средствах вычислительной техники). В качестве истоков информатики обычно называют две науки – документалистику и кибернетику. Документалистика сформировалась в конце XIX века в связи с бурным развитием производственных отношений. Ее расцвет пришелся на 20-30 годы XX века, а основным предметом стало изучение рациональных средств и методов повышения эффективности документооборота.

Основы близкой к информатике технической науки кибернетики были заложены трудами по математической логике американского математика Норберта Винера, опубликованными в 1948 году, а само название происходит от греческого слова (kyberneticos – искусный в управлении).

 

Информатика – это техническая наука, систематизирующая приемы

создания

хранения

воспроизведения

обработки средствами вычислительной техники, а также

передачи принципыфункционирования этих средств и методы данных управления ими.

 

Из этого определения видно, что информатика очень близка к технологии, поэтому ее предмет нередко называют информационной технологией.

 

Предмет информатики составляют следующие понятия:

1. Аппаратное обеспечение средств вычислительной техники.

2. Программное обеспечение средств вычислительной техники.

3. Средства взаимодействия аппаратного и программного обеспечения.

4. Средства взаимодействия человека с аппаратными и программными средствами.

 

В информатике, таким образом, особое внимание уделяется вопросам взаимодействия. Для этого придуман даже термин интерфейс (аппаратный, программный аппаратно-программный).

Основной задачей информатики является систематизация приемов и методов работы с аппаратными и программными средствами вычислительной техники.

Информатика – практическая наука. В составе основной задачи информатики можно выделить следующие направления для практических приложений:

 

1. Архитектура вычислительных систем – приемы и методы построения систем, предназначенных для автоматической обработки данных.

2. Интерфейсы вычислительных систем – приемы и методы управления аппаратным и программным обеспечением.

3. Программирование – приемы, методы и средства разработки компьютерных программ.

4. Преобразование данных – приемы и методы преобразования структур данных.

5. Защита информации – обобщение приемов, разработка методов и средств защиты данных.

6. Автоматизация – функционирование программно-аппаратных средств без участия человека.

7. Стандартизация – обеспечение совместимости между аппаратными и программными средствами, а также между форматами представления данных.

На всех этапах технического обеспечения информационных процессов для информатики ключевым понятием является эффективность.

 



Поделиться:


Последнее изменение этой страницы: 2016-12-13; просмотров: 345; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.149.214.32 (0.034 с.)