Методы классификации информации 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Методы классификации информации



 

Классификация –это система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Применительно к информации существуют информационные объекты.

Пример. В университете, например, существуют объекты: информация о студентах – объект «студент»; информация о преподавателях – объект «преподаватель»; информация о факультетах – объект «факультет» и т.д.

Свойства информационного объекта определяются реквизитами. Реквизиты представляются либо числовыми данными, например, все, стоимость, год, либо признаками, например, цвет, марка машины, фамилия.

Реквизит – логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.

Пример. Информация в студенте представлена следующими реквизитами: фамилия, имя, отчество, пол, год рождения, место рождения, адрес домашний, факультет и т.д.

Классификация нужна для выявления общих свойств информационного объекта, а также для разработки правил (алгоритмов) и процедур обработки информации. При классификации необходимо соблюдать следующие требования:

-полнота охвата объектов рассматриваемой области;

-однозначность реквизитов;

-возможность включения новых объектов.

В любой стране разработаны и применяются государственные, отраслевые, региональе классификаторы. Например, классифицированы отрасли промышленности, оборудование, профессии, единицы измерения, статьи затрат и т.д.

Классификатор – систематизированный свод наименований и кодов классификационных группировок.

Код – это условное обозначение объекта или явления в виде знака или системы знаков, построенное по определенным правилам.

При классификации пользуются понятием классификационного признака, который позволяет установить сходство или различие объектов.

Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный.

Иерархический метод классификации устанавливает между классификационными группировками иерархические отношения подчинения, с последовательной детализацией их свойств: класс, подкласс, группа, подгруппа, вид и т.д.

 

0 уровень

 

1уровень

 

2 уровень

 

3 уровень

 

Достоинства:

-простота построения;

-использование независимых классификационных признаков в различных ветвях иерархической структуры.

Недостатки:

-жесткая структура, которая приводит к сложности внесения изменений, т.к. приходится перераспределять все классификационные группировки;

-невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.

Пример иерархической системы классификации для информационного объекта «факультет»:

 

0 уровень

       
   


1-название ф-та Коммерческий Информационные

(классификационный системы

признак)

2-возраст до 20 лет 20-30 лет свыше 30 лет до 20 лет 20-30 лет свыше 30 лет

                                               
     
                 
     
   
 
 
 


3-пол м ж м ж м ж м ж м ж м ж

                                               
             
           
 


4-наличие детей есть нет есть нет есть нет есть нет есть нет есть нет

у женщин

Метод фасетной классификации основан на множестве независимых признаков. Набор таких признаков может быть произвольным, что позволяет группировать объекты по любому сочетанию признаков. Является одноуровневым, исходное множество объектов разбивается на подмножества классификационных группировок в соответствии со значениями признаков отдельных фасетов. Фасеты независимы между собой.

Схема построения фасетной системы классификации в виде таблицы:

    фасеты
     
значения фасетов   Ф1 Ф2 Ф3 Фi Фn
               
               
             
k              

Достоинства:

-возможность создания большой емкости классификации, т.е. использование большого числа признаков классификации и их значений для создания группировок;

-возможность простой модификации всей структуры существующих группировок.

Недостатком фасетной системы классификации является сложность ее построения, т.к. необходимо учитывать все многообразие классификационных признаков.

Пример.

Наименование факультета Возраст Пол Дети
Радиотехнический до 20 лет м есть
Машиностроительный 20-30 лет ж нет
Коммерческий свыше 30 лет    
Информационные системы      
Математический      

Суть дескрипторного метода классификации:

-отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов, среди которых могут находиться синонимы;

-выбранные ключевые слова нормализуются, т.е. из совокупности синонимов выбираются наиболее употребимые;

-создается словарь дескрипторов, т.е. словарь отобранных слов и словосочетаний.

Пример. Объект классификации – успеваемость студентов. Ключевые слова: оценка, экзамен, зачет, преподаватель, студент, семестр, название предмета. Синонимов нет, эти ключевые слова можно использовать как словарь дескрипторов.

Предметная область: учебная деятельность в вузе. Ключевые слова: студент, обучаемый, учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор, коллега, факультет, аудитория, лекция, практическое занятие и т.д. Встречаются синонимы. После нормализации словарь дескрипторов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, доцент, профессор, факультет, аудитория, лекция, практическое занятие и т.д.

 

Система кодирования

 

Система кодирования – это совокупность правил кодового обозначения объектов.

Применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.

Код – это условное обозначение объекта или явления в виде знака или системы знаков, построенная по определенным правилам. (второй раз дается определение, см. выше)

Код строится на базе алфавита, состоящего из букв, цифр и других символов.

Код характеризуется:

-длиной – число позиций в коде;

-структурой – порядок расположения в коде символов, используемых для обозначения классификационного признака.

Процедура присвоения объекту кодового обозначения называется кодированием.

Основные причины кодирования экономической информации:

1.Обеспечение однозначной идентификации объекта.

2.Сокращение объемов работ при решении задач.

Основные требования к кодам:

-min значности и простота построения;

-наличие резерва;

-коды должны разрабатываться на длительный период времени;

-коды каждой отдельной номенклатуры должны иметь одинаковую значность;

-коды должны по возможности дублировать уже сложившиеся обозначения;

-коды должны учитывать специфику программных и технических средств;

-коды должны помехозащищены.

В системе кодирования используются 2 группы методов:

- в классификационной системе кодирования необходима предварительная классификация объектов на основе иерархической или фасетной системы;

- регистрационная система кодирования предварительной классификации объектов не требует.

Система кодирования

Классификационная Регистрационная

Последовательная Параллельная 1.Порядковая Серийно-порядковая

(для иерархической (для фасетной 2.Серийная

классификации) классификации) 3.Десятичная

4.Шахматная (матричная)

5.Повторения

Последовательное кодирование: сначала записывается код старшей группировки 1-го уровня, затем 2-го, 3-го и т.д.

Пример. 1310 – студенты коммерческого факультета свыше 30 лет, мужчины; 2221 – студенты факультета информационных систем, от 20 до 30 лет, женщины, имеющие детей.

Параллельное кодирование используется для фасетной системы классификации. Все фасеты кодируются независимо друг от друга; для значения каждого фасета выделяется определенное количество разрядов кода.

Пример. 1 разряд – пол, 2-й – наличие детей у женщин, 3 - возраст, 4 – факультет. 2135 – женщины свыше 30 лет, имеющие детей, студенты математического факультета; 1021 – 1021 – мужчины возраста 20-30 лет, студенты радиотехнического факультета.

Регистрационное кодирование

Наименование материалов Порядковая система кодирования Серийная система кодирования Десятичная система кодирования
I.Черные металлы 1.Чугун 2.Сталь 3.Прокат   1-15 3 (4-15 резерв)   103 (104-199 резерв)
II.Цветные металлы 1.Аллюминий 2.Медь 3.Серебро 4.Свинец   16-24 19 (20-24 резерв)   24 (25-29 резерв)

1.Порядковая система кодирования предполагает кодирование позиций числами натурального ряда в порядке возрастания без пропусков.

Достоинства: малозначность и простота построения.

Недостатки:

-невозможность расширения позиции номенклатуры без нарушения принятой системы классификации;

-трудности при подведении итогов, приходится запоминать с какого номера начинается и каким заканчивается каждая группа позиций;

-при кодировании не учитывается количество признаков.

2.Серийная система является продолжением порядковой системы. На каждую группу позиций номенклатуры, объединенную одним общим признаком, выделяется серия порядковых номеров с учетом резерва. Размер серии произвольный.

Достоинства: наличие резерва, простота построения.

Недостатки: не всегда можно правильно определить размер серии, трудности при расшифровке, т.к. приходится запоминать с какого номера начинается и каким заканчивается каждая серия.

3.Десятичная система – наиболее широко применяется в практике обработки информации. Здесь для каждого кодируемого признака выделяется один или несколько десятичных разрядов.

Структура кода: Х Х Х


группа порядок

материала следования

в группе

Достоинства: возможность кодирования многопризначных номенклатур; автоматическое формирование резервов; простота расшифровки.

Недостатки: не всегда обоснованные резервы; многозначность кода.

4.Шахматная (матричная) система. Она не является самостоятельной системой, а представляет форму изображения серийного или десятичного кода для двупризначных номенклатур.

 

Вид вклада Вид операции До востребования Срочный Накопительный  
1.Приход 2.Расход 3.Зачисление 4.Списание       11-20 21-30 31-40 41-50

Структура кода: Х Х

 

вид вид

операции вклада

5.Система повторения (коды повторения). Эта система предполагает использование уже сложившихся цифровых обозначений: номера месяцев, разряды работ и рабочих, номера счетов в бухгалтерском учете и др.

 



Поделиться:


Последнее изменение этой страницы: 2016-08-16; просмотров: 665; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.119.111.9 (0.04 с.)