Работа 1.1. Кодирование текстовой информации в Интернет. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Работа 1.1. Кодирование текстовой информации в Интернет.



Цель работы: Изучить принципы представления в Интернет текстовой информации. Получить практические навыки кодирования и декодирования текстовой информации.

Порядок выполнения работы.

1. Изучить теоретическую часть

2. Выполнить задания в соответствии с заданным вариантом и отразить результате в отчете

3.  Представить отчет на проверку преподавателю. Отчет должен содержать номера пунктов работы, краткое содержание задания в каждом пункте и (в правой колонке) результат выполнения каждого пункта.

Теоретическая часть

Широкое распространение компьютерных сетей стало возможным благодаря решению не только вопросов связи компьютеров, но и их информационной совместимости. На начальном этапе проблемы с совместимостью приводили к полному искажению текстов, и даже возник специальный термин: кракозя́бры (крякозя́бры) - бессмысленный набор символов (абракадабра), чаще всего получаемый на компьютере в результате неправильного перекодирования исходного текста.

Чаще всего кракозябры образуются по причине неправильно настроенной кодировки символов, а также из-за использования неподходящего шрифта. Практически до конца ХХ века пользователи Интернет широко использовали нескольких кодировок кириллицы: DOS 866,  КОИ-8, Windows CP-1251, ISO 8859-5), MacCyrillic и ряд других. В результате неправильной конфигурации серверов и недостаточной совместимости тексты порой было невозможно прочесть. Получая сообщения по электронной почте или зайдя на веб-сайт, неопытные пользователи могли наткнуться на странные необычные символы вместо букв кириллицы. Пример отображения информации типа кракозябр первой страницы сайта MAIL.RU приведен на рис. 1.1.1.

 

Рис. 1.1.1.

Пример отображения типа кракозябр информации первой страницы сайта MAIL.RU

 

Проблему «кракозябр» можно было решить либо внедрением методов указания используемой кодировки, либо внедрением единой (общей) для всех кодировки.

До сегодняшнего дня существуют разные стандарты для представления, символов, которые отличаются лишь порядком нумерации символов. На рис. 1.1.2. можно видеть набор кодировок браузера Explorer 11, которыми до сегодняшнего дня оснащается этот браузер.

 

 

Рис. 1.1.2

Набор кодировок браузера Explorer 11

 

Долгое время наиболее распространённым был американский стандартный код для информационного обмена - ASCII [American Standard-Code for Information Interchange], который был введён в США еще в 1963г. В 1977 году в несколько модифицированном виде он был принят в качестве всемирного стандарта Международной организации стандартов (International Standards Organization -. ISO) под названием ISO-646. Согласно этому стандарту каждому символу поставлено в соответствие число от 0 до 255.

В ОС Linux для представления русских букв еще используется кодировка КОИ-8. Однако, она во-первых, не допускает одновременное представление русских и, например, французских букв. Во-вторых, такая кодировка совершенно непригодна для представления, китайских иероглифов.

В 1991 году была создана некоммерческая организация «Консорциум Юникода» (англ. Unicode Consortium, Unicode Inc.), которая предложила новый стандарт – Unicode, который обеспечил одновременное представление математических символов, букв греческого алфавита, латиницы, кириллицы и многое другое. Возможности данной кодировки настолько широки, что сейчас в ее набор включены даже наборы картинок (смайлики), см. Рис. 1.1.3..

 

Рис. 1.1.3.

Пример набора картинок (смайликов), вошедших в стандарт Unicode.

 

Кодировка Unicode использует 16 разрядов, и может содержать 65536 символов. Это символы большинства народов мира, элементы иероглифов, спецсимволы, 5000 – мест для частного использования, резерв из 30000 мест.

Именно достоинств стандарта Unicode позволили ему уверенно потеснить все остальные кодировки в течении 10 лет (рис. 1.1.4.) и, сегодня, проблема кракозябры встречается гораздо реже чем 6-8 лет назад.

Рис. 1.1.4

Динамика роста популярности Unicode в Интернет

 

В данной работе с использованием таблиц кодировки различного типа проводится перевод текстового материала в цифровой вид и обратно.

В таблицах 1.1.1-1.1.4 представлены кодировки для четырех стандартов, используемых в сети Интернет до настоящего времени и с которыми выполняются практические задания в данной работе. В таблицах приняты следующие обозначения:

· Dec – десятичные цифры;

· Hex – шестнадцатеричные цифры.


 

Таблица 1.1.1.

Таблица UNICODE


Таблица 1.1.2.

Таблица ASCII

Таблица 1.1.3

 

Таблица Windows-1251

 

Таблица 1.1.4.

Таблица КОИ-8

Десятич­ный код Символ Десятич­ный код Символ Десятич­ный код Символ
192 ю 214 ж 235 К
193 а 215 в 236 Л
194 б 216 ь 237 М
195 ц 217 ы 238 Н
196 д 218 з 239 О
197 е 219 ш 240 П
198 ф 220 э 241 Я
199 г 221 щ 242 Р
200 х 222 ч 243 С
201 и 223 ъ 244 Т
202 й 224 Ю 245 У
203 к 225 А 246 Ж
204 л 226 Б 247 В
205 м 227 Ц 248 Ь
206 н 228 Д 249 Ы
207 о 229 Е 250 З
208 п 230 Ф 251 Ш
209 я 231 Г 252 Э
210 р 232 X 253 Щ
211 с 233 И 254 Ч
212 т 234 Й 255 Ъ
213 у 160 пробел    

Таблица 1.1.5.

Кодовая таблица азбуки Морзе

Практическая часть

Подготовка к работе.

· Создайте файл отчета в Word по образцу, приведённому в приложении 1, и заполните его шапку.

ПРИМЕЧАНИЕ. Ваша фамилия (с инициалами) должна являться именем файла отчета.

· Получите номер варианта из табл. 1.1.6 и занесите его в отчет. Далее задания выполняются согласно номеру варианта, если иное не указано в задании.

Таблица 1.1.6

Вариант Пункт практической части № 3 СТАНДАРТ/ 10-или 16-ричный код Пункт практической части № 5 Пункт практической части № 6
1 UNICODE/10 кодирование 111504101715021100
2 UNICODE/16 таможня 04151315040504150215
3 Windows-1251/10 МИИТ 02142111150215
4 Windows-1251/16 РУТ 2605170513052031050215
5 КОИ-8 / 10 Москва 131518110200
6 UNICODE/10 юрист 1310141811
7 Windows-1251/16 студент 15131811
8 UNICODE/16 инспектор 02142111150215
9 Windows-1251/10 граница 1813151205141811
10 КОИ-8 / 10 паспорт 18152510
11 UNICODE/10 терминал 111504101715021100
12 Windows-1251/16 досмотр 010517121014
13 КОИ-8 / 10 Смоленск 133314230514
14 UNICODE/16 Мурманск 130004171004
15 КОИ-8 / 10 пост 2015131811
16 UNICODE/10 контроль 2605170513052031050215
17 UNICODE/16 евросоюз 18152510
18 Windows-1251/10 франция 111504101715021100
19 Windows-1251/16 Германия 133314230514
20 UNICODE/16 Бельгия 010517121014
21 Windows-1251/10 Швеция 02142111150215
22 КОИ-8 / 10 Монако 15131811
23 Windows-1251/16 Италия 04151315040504150215
24 UNICODE/16 Испания 131518110200
25 UNICODE/10 Австрия 2605170513052031050215
26 UNICODE/16 шифр 02142111150215
27 Windows-1251/16 Декларация 010517121014
28 КОИ-8 / 10 кодировка 133314230514
29 Windows-1251/10 Интернет 15131811
30 UNICODE/10 телефон 130004171004

 

 

Выполнение работы

1. Закодируйте свое имя и фамилию латинскими буквами 16-ричными цифрами в коде ASCII (с помощью таблицы 1.1.2. ASCII). Числа разделять пробелом, а фамилию и имя тремя пробелами.

Результат занесите в отчет.

2. Закодируйте свое имя и фамилию кириллицей 10-ричными цифрами, разделяя цифры пробелами а фамилию и имя тремя пробелами в трех разных стандартах:

· UNICODE

· Windows-1251

· КОИ-8

Результат занесите в отчет.

3. Используя таблицы кодировок, закодируйте по условиям вашего варианта название нашего института – ЮРИДИЧЕСКИЙ ИНСТИТУТ. Результат занесите в отчет.

4. Используя кодовую таблицу азбуки Морзе (табл. 1.1.5.) Расшифруйте (декодируйте), что здесь написано (буквы отделены друг от друга пробелами).

 

Результат поместите в отчет

5. Закодируйте с помощью азбуки Морзе слова согласно варианту, используя символы «-» и «.». Результат поместите в отчет.

 

6. Используя произвольную кодировочную таблицу 1.1.7, приведенную ниже расшифруйте текст заданный кодом в таблице вариантов (первая цифра кода – номер строки, вторая – номер столбца).

Таблица 1.1.7

Результат занесите в отчет.

7. Оформите и представьте отчет на проверку преподавате л ю.

Контрольные вопросы

1. Что такое крякозябры и в чем причина их появления?

2. Что такое ASCII?

3. Какая кодировка является наиболее популярной в Интернет и почему?.

4. Чем определяется популярность кода UNICODE в Интернет?.

5. Почему до сих пор браузеры обеспечиваются широким набором различных кодировок?

6. Когда UNICODE стал наиболее популярной кодировкой в Интернет?

7. Можно ли используя браузер Explorer 11 получить на экране пример крякозябры и, если да, то как?

 



Поделиться:


Последнее изменение этой страницы: 2021-07-18; просмотров: 233; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.146.105.137 (0.015 с.)