ЗНАЕТЕ ЛИ ВЫ?

Кодирование текстовой информации. Двоичное кодирование текстовой информации. Различные кодировки кириллицы



Первые компьютеры были созданы для обработки число­вой информации. Начиная с конца 60-х годов XX века, компьютеры стали использовать для обработки текстовой информации. В настоящее время практически все пользова­тели персональных компьютеров работают с текстами, испо­льзуя специальные программы — текстовые редакторы.

Человек различает символы по их начертанию, а компью­тер — по их кодам. В мире в качестве стандарта кодирова­ния символьной информации принята таблица ASCII (American Standard Code for Interchange). В ней для кодирования одного символа используется количество информации, равное 1 байту (8 битов). Всего с помощью одного байта можно закодировать: N = 28 = 256 символов. Этого вполне достаточно для представления текстовой информации на компьютере. Таблица разделена на две части по 128 символов. Первая (основная) часть содержит буквы латинского алфавита, десятичные цифры, знаки пунктуации, арифметических действий и др. Вторая часть (расширение) предназначена, в основном, для кодирования национальных алфавитов. Ко­дирование заключается в том, что каждому символу ставит­ся в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Присвоение символу конкретного кода — это вопрос соглашения, которое фиксируется в кодовой таблице. Первые 33 кода (с 0 по 32) обозначают не символы, а операции (новая строка — код 10, возврат каретки — код 13, ввод пробела — код 32, и т. д.).

В настоящее время существует пять различных кодовых таблиц для русских букв: КОИ-8, СР1251 (для Windows), СР866 (ASCII, MS DOS), Mac (для Macintosh), ISO (International Standards Organization, код, используемый в языке HTML). Такое количество кодировок затрудняет чтение текстов в Интернете и отображение в тестовых редакторах. Одному и тому же двоичному коду в различных кодировках поставлены в соответствие различные символы. Например, в ASCII русская буква А имеет код — 10000000, КОИ-8 — 11100001, СР1251 — 11000000.

Для того чтобы правильно прочесть текст, присланный в другой кодировке, необходимо:

  • в текстовом редакторе Microsoft Word в меню Сервис - Параметры - Общиеактивизировать флажок подтверждать преобразование при открытии, выбрать нужную кодировку;
  • при работе в браузере, например IE, в меню Вид - Вид кодировкивыбрать нужную кодировку.

При вводе в компьютер текстовой информации происхо­дит ее двоичное кодирование. Пользователь нажимает на клавиатуре клавишу с символом — ив компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера. В процессе вывода симво­ла на экран монитора производится обратный процесс — де­кодирование, т. е. преобразование кода символа в его изображение, которое хранится в памяти компьютера.

Новый международный стандарт Unicode (Юникод) отводит на каждый символ не один байт, а два, и потому с его помощью можно закодировать не 256 символов, а N = 216 = = 65 536. Кодировка Unicode поддерживает все знаки всех языков и пригодна для чтения в Microsoft Internet Explorer, начиная с версии 4.0, и Microsoft Office с 1997 г.

 

Основные приемы преобразования текстов: редактирование и форматирование

Текст, созданный в текстовом редакторе, может быть пре­образован, т. е. отредактирован и отформатирован. Редакти­рование — это преобразование документа, обеспечивающее вставку, удаление, перемещение его фрагментов (объектов). Объект — это и весь текст в целом, и абзац, и строка, и сло­во, и символ, и таблица, и ее составляющие. Редактирова­ние может быть применено к любому объекту документа, который предварительно выделен.

 

Возможны следующие операции редактирования:

  • удаление, перемещение, копирование;
  • отмена или возврат выполнения последних операций;
  • поиск и замена фрагментов текста;
  • вставка необходимого объекта (рисунок, файл, содер­жимое буфера обмена, гиперссылку, объект OLE — формулу, диаграмму, таблицу из приложения Excel, анимацию, звук).

Всё, что позволяет делать с текстом или его фрагментами меню Правка -Вставка и некоторые кнопки панели инстру­ментов Стандартная, и будет являться редактированием.

Форматирование — это изменение вида документа, т. е. такое его преобразование, которое меняет форму представле­ния документа. Форматирование может быть применено к любому выделенному объекту документа (см. схему).

Возможны следующие виды форматирования:

1) Задание параметров страницы (размер, поля, ориента­ция и др.).

2) Форматирование абзаца:

выравнивание (по ширине, центру, правому и лево­му краям);

установка отступа первой строки;

установка отступов и интервалов между строками и абзацами.

3) Форматирование символов:

изменение шрифта — растровый (Comic Sans MS) или векторный (Bookman Old Style), моноширинный (Courier), рубленый (Arial) или с засечками (Times New Roman);

изменение начертания шрифта (обычное, полужирное, курсивное, полужирное курсивное, варианты подчеркивания, цвет символов, нижний или верхний индексы);

изменение размера символов (единицей измерения размера шрифта является пункт (пт), 1 пт = 0,376 мм. Например, 10 пт — размер, 14 пт — размер).

4) Формирование списков.

5) Оформление границ и заливки.

6) Организация колонок.

7) Форматирование таблиц (направление текста, объединение ячеек, ширина столбцов и высота строк и т. д.).

Большую помощь при форматировании оказывает инструмент Формат по образцу, находящийся на панели инстру­ментов Форматирование.

При сохранении текстовых документов в текстовых редак­торах (процессорах) можно задавать различные форматы:





Последнее изменение этой страницы: 2016-04-26; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.238.107.166 (0.006 с.)