Информационные технологии. классификация. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Информационные технологии. классификация.



Мера информации

· Синтаксическая мера.

объем информации измеряется кол-вом символов в сообщении

единица измерения – бит\байт

кол-во (I) информации

Энтропия – степень неопределенности состояния системы

Формула Шеннона: H(α) =

Н – энтропия, N- число возможных состояний системы, Pi – вероятность того,что система находится в i-том состоянии, α – система, log – логарифм, ∑ - сумма.

Случаи, когда все состояния системы вероятны, то формула упрощается:

Формула Хартли: I= = n

m-основание системы исчисления, N- кол-во разрядов

· Семантическкая мера:

Тезаурус – совокупность сведений, которыми располагает пользователь или система.

семантическая мера - = 0, =∞

· прогматическая мера: – рассматриваются отношения между сообщениями и получателем – потребителем содержания сообщения (внешние свойства)

Мера Ед.измерения Примеры
Синтаксическая энтропия Бит, байт
Семантическая тезаурус Комп. сеть, ПК, пакеты прикладных программ
Прогматическая Ценность, экономические показатели Рентабельность, производительность, коэфицент амортизации

 

3.

Свойства информации:

1. адекватность – это определенный уровень соответсвия создаваемого образа реальному объекту, процессу, явлению и т.д.

2. достоверность - Информация достоверна, если она отражает истинное положение дел. Объективная информация всегда достоверна, но достоверная информация может быть как объективной, так и субъективной. Достоверная информация помогает принять нам правильное решение.

3. полнота - Информацию можно назвать полной, если ее достаточно для понимания и принятия решений. Неполная информация может привести к ошибочному выводу или решению.

4. избыточность -

5. объективность - Объективность информации характеризует её независимость от чьего-либо мнения или сознания, а также от методов получения. Более объективна та информация, в которую методы получения и обработки вносят меньший элемент субъективности.

6. доступность - мера возможности получить ту или иную информацию

7. актуальность - важность для настоящего времени, злободневность, насущность. Только вовремя полученная информация может быть полезна.

качество информации – совокупность св-в, обуславливающее её способность удовлетворять потребности людей.

доступность, актуальность, фостоверность.

 

4.

Информационные процессы:

1. сбор

2. передача

3. накопление

4. хранение

5. обработка (преобразование)

6. использование (представить информацию для удобного восприятия пользователю)

В результате исполнения информационных процессов осуществляются информационные права и свободы, выполняются обязанности соответствующими структурами производить и вводить в обращение информацию, затрагивающую права и интересы граждан, а также решаются вопросы защиты личности, общества, государства от ложной информации и дезинформации, защиты информации и информационных ресурсов ограниченного доступа от несанкционированного доступа.

 

6.

Цифровые аудиоформаты

По принципу записи выделяют следующие методы:

Магнитная звукозапись — запись цифровых сигналов производится на магнитную ленту. Выделяют два типа записи:

продольно-строчная система записи — в которой лента движется вдоль блока неподвижных магнитных головок записи/воспроизведения (DASH,DCC)

наклонно-строчная система записи — в которой лента движется вдоль барабана вращающихся магнитных головок и запись осуществляется наклонно отдельными дорожками, что обеспечивает большую плотность, по сравнению с продольно-строчной системой записи. (R-DAT, ADAT)

Магнитооптическая запись — запись ведется с помощью магнитной головки на специальный магнитооптический слой и в момент намагничивания кратковременно разогревается лазером до температуры точки Кюри. (Минидиск,Hi-MD)

Лазерная запись — запись производится лазерным лучом, который выжигает углубления (питы) на светочувствительном слое оптического носителя. (Компакт-диск, DVD-Audio, DTS, SACD)

Оптическая (фотографическая) запись звука — основана на воздействии светового потока на светочувствительный слой носителя (киноленты). (Dolby Digital, SDDS)

Запись звука на электронные носители — звуковые данные при помощи персонального компьютера записываются в виде файлов на различные носители (жесткие диски, перезаписываемые оптические диски, флеш-карты, твердотельные накопители), при этом отсутствует ограничение на обязательное соответствие формата звука формату носителя.

На цифровых носителях и в персональных компьютерах для хранения звука (музыки, голоса и т. п.) применяются различные форматы, позволяющие выбрать приемлемое соотношение сжатия, качества звука и объёма данных.

Популярные форматы файлов для персональных компьютеров и соответствующих устройств:

(OGG) (MP3) (WAV) (WMA)

 

Параметры, влияющие на качество цифровой звукозаписи

Основными параметрами, влияющими на качество цифровой звукозаписи, являются:

Разрядность АЦП и ЦАП. (Разрядность (битность) в информатике — количество разрядов (битов) электронного (в частности, периферийного) устройства или шины, одновременно обрабатываемых этим устройством или передаваемых этой шиной.)

 

Частота дискретизации АЦП и ЦАП. ((Частота дискретизации (или частота семплирования, англ. sample rate) — частота взятия отсчетов непрерывного во времени сигнала при его дискретизации (в частности, аналого-цифровым преобразователем). Измеряется в герцах.) 8 000 Гц — телефон, достаточно для речи, кодек Nellymoser; 11 025 Гц; 16 000 Гц; 22 050 Гц — радио; 32 000 Гц; 44 100 Гц — используется в Audio CD; 48 000 Гц — DVD, DAT; 96 000 Гц — DVD-Audio (MLP 5.1); 192 000 Гц — DVD-Audio (MLP 2.0); 2 822 400 Гц — SACD, процесс однобитной дельта-сигма модуляции, известный как DSD — Direct Stream Digital, совместно разработан компаниями Sony и Philips; 5 644 800 Гц — DSD с удвоенной частотой дискретизации, однобитный Direct Stream Digital с частотой дискретизации вдвое больше, чем у SACD. Используется в некоторых профессиональных устройствах записи DSD.)

 

Джиттер АЦП и ЦАП (Джи́ттер (англ. jitter — дрожание) или фазовое дрожание цифрового сигнала данных [1] — нежелательные фазовые и/или частотные случайные отклонения передаваемого сигнала. Возникают вследствие нестабильности задающего генератора, изменений параметров линии передачи во времени и различной скорости распространения частотных составляющих одного и того же сигнала. Причины возникновения джиттера. Фазовые шумы петли ФАПЧ (фазовой автоподстройки частоты) устройства, синхронизируемого внешним сигналом.Джиттер, вызываемый ФАПЧ, проявляется при прослушивании материала с записывающего устройства, синхронизируемого от воспроизводящего устройства. АЦП. В современных цифровых системах звукозаписи и воспроизведения основным источником джиттера является АЦП.Нынешние полностью цифровые студийные синхронизаторы достаточно совершенны и часто вносят джиттер меньший, чем АЦП. Влияние джиттера на характеристики АЦП Частота дискретизации АЦП обычно задаётся кварцевым генератором, а любой кварцевый генератор (особенно дешёвый) имеет ненулевые фазовые шумы. Таким образом, моменты времени получения отсчетов сигнала (дискретов) расположены на временной оси не совсем равномерно. Это приводит к размыванию спектра сигнала и ухудшению отношения сигнал/шум.)

Передискретизация (Передискретиза́ция (англ. resampling) в обработке сигналов — изменение частоты дискретизациидискретного (чаще всего цифрового) сигнала. Алгоритмы передискретизации широко применяются при обработке звуковых сигналов, радиосигналов и изображений (передискретизация растрового изображения — это изменение его разрешения в пикселах))

Также немаловажными остаются параметры аналогового тракта цифровых устройств звукозаписи и звуковоспроизведения:

Отношение сигнал/шум

Взаимопроникновение каналов

Динамический диапазон

Сжатие (компрессия)аудиоданных представляет собой процесс уменьшения скорости цифрового потока за счет сокращения статистической и психоакустической избыточности цифрового звукового сигнала.

 

36. Цифровые форматы изображений

JPEG (JPEG (произносится «джейпег»[1], англ. Joint Photographic Experts Group, по названию организации-разработчика) — один из популярных графических форматов, применяемый для хранения фотоизображений и подобных им изображений. Файлы, содержащие данные JPEG, обычно имеют расширения (суффиксы) .jpeg, .jfif, .jpg, .JPG, или .JPE. Однако из них .jpg является самым популярным на всех платформах.MIME-типом является image/jpeg.)

 

TIFF (TIFF (англ. Tagged Image File Format) — формат хранения растровых графических изображений. TIFF стал популярным форматом для хранения изображений с большой глубиной цвета. Он используется при сканировании, отправке факсов, распознавании текста, в полиграфии, широко поддерживается графическими приложениями. TIFF был выбран в качестве основного графического формата операционной системы NeXTSTEP и из неё поддержка этого формата перешла в Mac OS X. Формат был разработан Aldus Corporation в сотрудничестве с Microsoft для использования с PostScript. Компания-владелец спецификаций — Aldus Corporation — впоследствии объединилась с Adobe Systems, владеющей в настоящее время авторским правом на эти спецификации.[1] Изначально формат поддерживал сжатия без потерь, впоследствии формат был дополнен для поддержки сжатия с потерями в формате JPEG. Файлы формата TIFF, как правило, имеют расширение.tiff или.tif.)

 

RAW (формат данных) (RAW (англ. raw — cырой, необработанный) — формат данных, содержащий необработанные (или обработанные в минимальной степени) данные, что позволяет избежать потерь информации, и не имеющий чёткой спецификации. В таких файлах содержится полная информация о хранимом сигнале. Данные в RAW-файлах могут быть несжатыми, сжатыми без потерь или сжатыми с потерями.)

 

DNG (DNG (Digital Negative Specification), Цифрово́й негати́в — открытый формат для RAW файлов изображений, используемый в цифровой фотографии. Разработан компанией Adobe Systems с целью создать стандартный формат для RAW файлов изображений вместо множества различных форматов разных производителей фотокамер. Анонсирован 27 сентября2004 года[1].)

 

37. Кодирование видеосигналов

Запись видео в цифровом формате требует соблюдения баланса между качеством и размером файла/битрейтом.Для уменьшения размера файла и снижения битрейта в большинстве форматов используется операция сжатия с выборочным снижением качества.Сжатие необходимо для уменьшения размера видеофайлов с целью повышения эффективности хранения, передачи и воспроизведения.Без сжатия один кадр видео стандартного разрешения занимает почти 1 Мб (мегабайт) дискового пространства.При частоте кадров стандарта NTSC, составляющей примерно 30 кадров в секунду, секунда несжатого видео занимает почти 30 Мб, а 35 секунд видеоматериала занимает примерно 1 Гб дискового пространства.Для сравнения 5-минутный NTSC-файл, сжатый в формате DV, занимает 1 Гб при битрейте примерно 3,6 Мб в секунду.Для сохранения максимально возможной степени качества при сжатии видео следует выбирать наименьший коэффициент сжатия, что позволяет создать видео в пределах допустимых значений размера файла и битрейта целевых носителей и воспроизводящих устройств.

 

38. Сетевые топологии. Сетевые устройства.

Сетевая тополо́гия (от греч.τόπος, - место) — способ описания конфигурации сети, схема расположения и соединения сетевых устройств.

Сетевая топология может быть

физической — описывает реальное расположение и связи между узлами сети.

логической — описывает хождение сигнала в рамках физической топологии.

информационной — описывает направление потоков информации, передаваемых по сети.

управления обменом — это принцип передачи права на пользование сетью.

Существует множество способов соединения сетевых устройств. Выделяют 3 базовых топологии:

Шина (Топология типа общая ши́на, представляет собой общий кабель (называемый шина или магистраль), к которому подсоединены все рабочие станции. На концах кабеля находятся терминаторы, для предотвращения отражения сигнала)

 

Кольцо (Кольцо́ — это топология, в которой каждый компьютер соединен линиями связи только с двумя другими: от одного он только получает информацию, а другому только передает. На каждой линии связи, как и в случае звезды, работает только один передатчик и один приемник. Это позволяет отказаться от применения внешних терминаторов.)

 

Звезда (Звезда́ — базовая топологиякомпьютерной сети, в которой все компьютеры сети присоединены к центральному узлу (обычно коммутатор), образуя физический сегмент сети.)

 

И дополнительные (производные):

Двойное кольцо

Ячеистая топология

Решётка

Дерево

Fat Tree

Снежинка

Полносвязная

Дополнительные способы являются комбинациями базовых.В общем случае такие топологии называются смешанными или гибридными, но некоторые из них имеют собственные названия, например «Дерево».

 

39.

Уровень 1, физический Физический уровень получает пакеты данных от вышележащего канального уровня и преобразует их в оптические или электрические сигналы, соответствующие 0 и 1 бинарного потока.Эти сигналы посылаются через среду передачи на приемный узел. Механические и электрические/оптические свойства среды передачи определяются на физическом уровне и включаютя:

Тип кабелей и разъемов

Разводку контактов в разъемах

Схему кодирования сигналов для значений 0 и 1

К числу наиболее распространенных спецификаций физического уровня относятся:

EIA-RS-232-C, CCITT V.24/V.28 - механические/электрические характеристики несбалансированного последовательного интерфейса.

EIA-RS-422/449, CCITT V.10 - механические, электрические и оптические характеристики сбалансированного последовательного интерфейса.

IEEE 802.3 -- Ethernet

IEEE 802.5 -- Token ring

Уровень 2, канальный

Канальный уровень обеспечивает создание, передачу и прием кадров данных.Этот уровень обслуживает запросы сетевого уровня и использует сервис физического уровня для приема и передачи пакетов. Спецификации IEEE 802.x делят канальный уровень на два подуровня: управление логическим каналом (LLC) и управление доступом к среде (MAC). LLC обеспечивает обслуживание сетевого уровня, а подуровень MAC регулирует доступ к разделяемой физической среде.

Наиболее часто используемые на уровне 2 протоколы включают:

• HDLC для последовательных соединений

• IEEE 802.2 LLC (тип I и тип II) обеспечивают MAC для сред 802.x

• Ethernet

• Token ring

• FDDI

• X.25

• Frame relay

Уровень 3, сетевой

Сетевой уровень отвечает за деление пользователей на группы.На этом уровне происходит маршрутизация пакетов на основе преобразования MAC-адресов в сетевые адреса.Сетевой уровень обеспечивает также прозрачную передачу пакетов на транспортный уровень.

Наиболее часто на сетевом уровне используются протоколы:

• IP - протокол Internet

• IPX - протокол межсетевого обмена

• X.25 (частично этот протокол реализован на уровне 2)

• CLNP - сетевой протокол без организации соединений

Уровень 4, транспортный

Транспортный уровень делит потоки информации на достаточно малые фрагменты (пакеты) для передачи их на сетевой уровень.

Наиболее распространенные протоколы транспортного уровня включают:

• TCP - протокол управления передачей

• NCP - Netware Core Protocol

• SPX - упорядоченный обмен пакетами

• TP4 - протокол передачи класса 4

Уровень 5, сеансовый

Сеансовый уровень отвечает за организацию сеансов обмена данными между оконечными машинами.Протоколы сеансового уровня обычно являются составной частью функций трех верхних уровней модели.

Уровень 7, прикладной

Прикладной уровень отвечает за доступ приложений в сеть.Задачами этого уровня является перенос файлов, обмен почтовыми сообщениями и управление сетью.

К числу наиболее распространенных протоколов верхних уровней относятся:

• FTP - протокол переноса файлов

• TFTP - упрощенный протокол переноса файлов

• X.400 - электронная почта

• Telnet

• SMTP - простой протокол почтового обмена

• CMIP - общий протокол управления информацией

• SNMP - простой протокол управления сетью

• NFS - сетевая файловая система

FTAM - метод доступа для переноса файлов

 

 

40. Смотреть выше

 

Мера информации

· Синтаксическая мера.

объем информации измеряется кол-вом символов в сообщении

единица измерения – бит\байт

кол-во (I) информации

Энтропия – степень неопределенности состояния системы

Формула Шеннона: H(α) =

Н – энтропия, N- число возможных состояний системы, Pi – вероятность того,что система находится в i-том состоянии, α – система, log – логарифм, ∑ - сумма.

Случаи, когда все состояния системы вероятны, то формула упрощается:

Формула Хартли: I= = n

m-основание системы исчисления, N- кол-во разрядов

· Семантическкая мера:

Тезаурус – совокупность сведений, которыми располагает пользователь или система.

семантическая мера - = 0, =∞

· прогматическая мера: – рассматриваются отношения между сообщениями и получателем – потребителем содержания сообщения (внешние свойства)

Мера Ед.измерения Примеры
Синтаксическая энтропия Бит, байт
Семантическая тезаурус Комп. сеть, ПК, пакеты прикладных программ
Прогматическая Ценность, экономические показатели Рентабельность, производительность, коэфицент амортизации

 

3.

Свойства информации:

1. адекватность – это определенный уровень соответсвия создаваемого образа реальному объекту, процессу, явлению и т.д.

2. достоверность - Информация достоверна, если она отражает истинное положение дел. Объективная информация всегда достоверна, но достоверная информация может быть как объективной, так и субъективной. Достоверная информация помогает принять нам правильное решение.

3. полнота - Информацию можно назвать полной, если ее достаточно для понимания и принятия решений. Неполная информация может привести к ошибочному выводу или решению.

4. избыточность -

5. объективность - Объективность информации характеризует её независимость от чьего-либо мнения или сознания, а также от методов получения. Более объективна та информация, в которую методы получения и обработки вносят меньший элемент субъективности.

6. доступность - мера возможности получить ту или иную информацию

7. актуальность - важность для настоящего времени, злободневность, насущность. Только вовремя полученная информация может быть полезна.

качество информации – совокупность св-в, обуславливающее её способность удовлетворять потребности людей.

доступность, актуальность, фостоверность.

 

4.

Информационные процессы:

1. сбор

2. передача

3. накопление

4. хранение

5. обработка (преобразование)

6. использование (представить информацию для удобного восприятия пользователю)

В результате исполнения информационных процессов осуществляются информационные права и свободы, выполняются обязанности соответствующими структурами производить и вводить в обращение информацию, затрагивающую права и интересы граждан, а также решаются вопросы защиты личности, общества, государства от ложной информации и дезинформации, защиты информации и информационных ресурсов ограниченного доступа от несанкционированного доступа.

 

6.

информационные технологии. классификация.

Технология – совокупность знаний о способах и средствах производственных процессов, при которых происходит качественное изменении объектов.

IT – это совокупность методов, процессов и программно-техническмх средств, обеспечивающих информационные процессы с целью повышения качетсва информации

 

Уровни изучения IT^

1.теоретический

2.исследовательсикй

3.прикладной

 

Классификация IT:

1.телекоммуникационные

2.мульти-медиа

3.управление БД

4.защита информации

5.САПР(система автоматизированного программирования)

6.проектирование информации

7.геоинформационные технологии

8.ERP (система управления предприятиями)

9.технология управления знанием

 

12. системы, основанные на знаниях:

6типов:

1.экспертные системы – это реализированный при помощи комп. технологий и основанный на знаниях программный продукт, главной ф-ией которой является формулировка решения проблемы.

моделируют процесс принятия решения свойственное человеческому мозгу

создаются языками программирования: losp, prolog

требования к реализации экспертных систем:

1.обратный вывод

2.выделение узкой предметной области

эксперт БД

механизм получения знаний

база знаний

механизм логического вывода

интерфейс пользователя

пользователь

достоинство:

1.быстрота принятия решения

2.возможность многократного решения типовых задач

3.раздельное использование БЗ и механизма лог.вывода

4.возможность модификации установленных заранее правил

5.возможность узнать как было получено решение

недостатки:

1.потребность в экспертных системах для подтверждения заключения

2.ориентация на узкую область знаний

3.механичность выводов, отсутствие творческих рекомендаций

4.трудоемкость в получении и организации знаний

области применения:

1.применяется там, где помогает сэкономить время

2.позволяет сэкономить деньги

3.обучение персонала

Решение легко формализуется на основе устойчивых правил

2.нейронные сети- попытки воспроизвести при помощи математики и комп-а работу клеток головного мозга

основная строительная единица – нейрон или нервная клетка

нейрон обрабатывает множество входных сигналов по опр алгоритму и выдающая выходные сигнала др. нейронами

элементы:

1.искуственные нейроны

2.математическая модель

3.програмно-типологическая организация

достоинства:

1.обучаемость (нейрон может выдавать разл. выходные материалы в зав.от того, какие данные были получены)

2.самоорганизация (связана с наличием весовых коэфицентов)

3.устойчивость к ошибкам

4.работа в режиме реального времени

недостатки:

1.время и обучение

2.дороговизна аппаратной реализации

3. сложность тиражируемости решений

области применения:

1.там,где есть большой массив данных

2.неизвестный алгоритм

3.большое кол-во шумов

4.в медицине

5.распознование лиц, голосов, отпечатков пальцев

6. обработка звуковых сигналов

7. наведение целей

8.оценка кредитоспособности

3. генетические алгоритмы - программа, в которой создаются популяции особей представленные хромосомами

процессы:

1.воспросизведение (на базе родительских шаблонов создается новое поколение, цель – эволюция)

2.скрещивание (строки кода в случайном порядке разбиваются пополам и обмениваются с другими сроками)

3. мутация (в случайном порядке изменяется 1 символ)

процесс генетического алгоритма явл. цикличным до достижения высокого уровня

в процессе популяции старые популяции уничтожаются

используется для решения логических задач

 

14. Классификация моделей:

1 способ: по назначению: познавательная, прагматическая, инструментальная

2 способ: по уровню моделирования: теоритическая, эмпирическая, аппроксимация (полуэмпирисечкая)

3 способ: по принадлежности к иерархическому уровню: микромодель, макромодель, метамодель

4 способ: по характеру взаимодействия с окр средой: открытая, закрытая

5 способ: по способу представления св-в объекта: аналитическая, алгоритмическая, имитационная

6 способ: по причинной обусловленности: детерминирующая (однозначно определяется набор выходных параметров для выходных параметров), стохастическая=вероятностная

7 способ: по отношению ко времени: статические, динамические

8 способ: по сфере применения: техническая, экономическая, военная, социальная

9 способ: по методологии применения: учебная, опытная, игровая, имитационная, научно- исследовательская

10 способ: по способу представления: материальная, компьютерная, некомпьютерная, невербальная, информационная, формализованная, неформализованная.

 

5)Основы классификации

и структурирования информации

Классификация-это система распределения объектов (предметов,явлений,процессов,понятий) по классам в соответствии с определенным признаком.

Пример, Всю информацию об университете можно классифицировать по многочисленным

информационным объектам, которые будут характеризоваться общими

свойствами:

• информация о студентах — в виде информационного объекта ≪Студент≫;

• информация о преподавателях — в виде информационного объекта ≪Преподаватель

• информация о факультетах — в виде информационного объекта ≪Факультет≫

Свойства информационного объекта определяются информационными параметрами,

называемыми реквизитами. Реквизиты представляются либо числовыми

данными (например, вес, стоимость, год), либо признаками (например, цвет, марка

машины, фамилия

Реквизит–это логически неделимый информационный элемент, списывающий определенное свойство объекта,процесса,явления

Пример, Информация о каждом студенте в отделе кадров университета систематизирована

и представлена посредством одинаковых реквизитов:

• фамилия, имя, отчество;

• пол;

• год рождения;

• место рождения;

• адрес проживания;

• факультет, где проходит обучение студент, и т. д.

Все перечисленные реквизиты характеризуют свойства информационного объекта

≪Студент≫.

Иерархическая система классификации

□ исходное множество элементов составляет 0-й уровень и делится в зависимости

от выбранного классификационного признака на классы (группировки), которые

образуют 1-й уровень;

□ каждый класс 1-го уровня в соответствии с характерным классификационным

признаком делится на подклассы, которые образуют 2-й уровень;

□ каждый класс 2-го уровня аналогично делится на группы, которые образуют

3-й уровень, и т. д.

В иерархической системе классификации каждый объект на любом уровне

должен быть отнесен к одному классу, который характеризуется конкретным значением

выбранного классификационного признака. Для последующей группировки

в каждом новом классе необходимо задать свои классификационные признаки и их

значения. Таким образом, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на

последующем уровне иерархии. •

Количество уровней классификации, соответствующее числу признаков, выбранных

в качестве основания деления, характеризует глубину классификации.

Достоинства иерархической системы классификации:

□ простота построения;

□ использование независимых классификационных признаков в различных ветвях

иерархической структуры.

Недостатки иерархической системы классификации:

□ жесткая структура, которая приводит к сложности внесения изменений, так как

приходится перераспределять все классификационные группировки;

□ невозможность группировать объекты по заранее непредусмотренным сочетаниям

признаков.

Пример, Поставлена задача — создать иерархическую систему классификации

для информационного объекта ≪Факультет≫, котораяпозволилабыклассифицировать

информациюобовсехстудентахпоследующимклассификационным

признакам: факультет, накоторомучитсястудент, возрастнойсоставстудентов,

полстудента, дляженщин—наличиедетей.

Системаклассификации, представленнаянарис. 1.5, будетиметьследующиеуровни:

• 0-йуровень.Информационныйобъект≪Факультет≫.

• 1-йуровень. Выбираетсяклассификационныйпризнак—названиефакультета,

чтопозволяетвыделитьнесколькоклассовсразныминазваниямифакультетов,

вкоторыххранитсяинформацияобовсехстудентах.

• 2-йуровень. Выбираетсяклассификационныйпризнак—возраст, который

имееттриградации: до 20 лет, от 20 до 30 лет, свыше 30 лет. Покаждомуфакультету

выделяютсятривозрастныхподклассастудентов.

• 3-йуровень. Выбираетсяклассификационныйпризнак—пол.Каждыйподкласс

2-гоуровняразбиваетсянадвегруппы. Такимобразом, информация

остудентахкаждогофакультетавкаждомвозрастномподклассеразделяется

надвегруппы: мужчиныиженщины.

• 4-йуровень. Выбираетсяклассификационныйпризнак—наличиедетей

уженщин: есть, нет.

Созданнаяиерархическаясистемаклассификацииимеетглубинуклассификации,

равнуючетырем.__

Фасетная система классификации

Фасетная система классификации в отличие от иерархической позволяет выбирать

признаки классификации независимо как друг от друга, так и от семантического

содержания классифицируемого объекта. Признаки классификации называются

фасетами (Гасе! — рамка). Каждый фасет (Ф^) содержит совокупность

однородных значений данного классификационного признака. Причем значения

в фасете могут располагаться в произвольном порядке, хотя предпочтительнее

их упорядочение.

Пример. Фасет цвет содержит значения: красный, белый, зеленый, черный, желтый.

Фасет специальность содержит названия специальностей. Фасет образование

содержит значения: среднее, среднее специальное, высшее.

Схема построения фасетной системы классификации в виде таблицы представлена

на рис. 1.6. Названия столбцов соответствуют выделенным классификационным

признакам (фасетам), обозначенным Фь Ф2,..., Ф„..., Ф„ (например:

цвет, размер одежды, вес и т. д.). Произведена нумерация строк таблицы. В каждой

клетке таблицы хранится конкретное значение фасета. Например, фасет цвет, обозначенный

как Ф2, содержит значения красный, белый, зеленый, черный и желтый.

Процедура классификации состоит в присвоении каждому объекту соответствующих

значений из фасетов. При этом могут быть использованы не все фасеты. Для

каждого объекта задается конкретная группировка фасетов структурной формулой,

в которой отражается их порядок следования:

= (Фь Ф2, Ф„ Ф/г)

Здесь Ф^ — г-й фасет; п— количество фасетов.

Достоинства фасетной системы классификации:

□ возможность достижения большой емкости классификации, то есть использования

большого количества признаков классификации и их значений для

создания группировок;

□ ВОЗМОЖНОСТЬ простой модификации всей системы классификации без изменения

структуры существующих группировок.

Недостатком фасетной системы классификации является сложность ее построения,

так как необходимо учитывать все многообразие классификационных

признаков.

Пример. Вернемся к примеру из подраздела ≪Иерархическаясистемаклассификации

≫идлясопоставленияразработаемфасетнуюсистемуклассификации.

Сгруппируемипредставимввидетаблицы (табл. 1.1) всеклассификационные

признакипофасетам:

• название факультета — фасет с пятью названиями факультетов;

• возраст — фасет с тремя возрастными группами;

• пол — фасет с двумя градациями;

• дети — фасет с двумя градациями.

Структурную формулу любого класса можно представить в виде.

К, = {Факультет, Возраст, Пол, Дети).

Присвоив конкретные значения каждому фасету, получим следующие классы:

• Кх = {Радиотехнический факультет, возраст до 20 лет, мужчина, есть дети);

• К2= {Коммерческий факультет, возраст от 20 до 30 лет, мужчина, детей нет);

• К^ = {Математический факультет, возраст до 20 лет, женщина, детей нет)

и т. д.

Дескрипторная система классификации

Для организации поиска информации, для ведения тезаурусов (словарей)

эффективно используется дескрипторная (описательная) система классификации,

язык которой приближается к естественному языку описания информационных

объектов. Особенно широко она применяется в библиотечной системе поиска.

Суть дескрипторного метода классификации заключается в следующем:

1. Отбирается совокупность ключевых слов или словосочетаний, описывающих

определенную предметную область или совокупность однородных объектов.

Причем среди ключевых слов могут быть синонимы.

2. Выбранные ключевые слова и словосочетания подвергаются нормализации,

то есть из совокупности синонимов выбирается один или несколько наиболее

употребимых.

3. Создается словарь дескрипторов, то есть словарь ключевых слов и словосочетаний,

отобранных в результате процедуры нормализации.

Пример. В качестве объекта классификации рассмотрим успеваемость студентов.

Ключевыми словами могут быть выбраны: оценка, экзамен, зачет, преподаватель,

студент, семестр, название предмета. Здесь нет синонимов, поэтому указанные

ключевые слова можно использовать как словарь дескрипторов.

В качестве предметной области выбираем учебную деятельность в высшем учебном

заведении. Ключевыми словами могут быть выбраны: студент, обучаемый,

учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор,

коллега, факультет, подразделение университета, аудитория, комната, лекция,

практическое занятие, занятие и т. д. Среди указанных ключевых слов встречаются

синонимы, например: студент, обучаемый, учащийся; преподаватель, учитель,

педагог; факультет, подразделение университета и т. д. После нормализации

словарь дескрипторов будет состоять из следующих слов: студент, преподаватель,

лектор, ассистент, доцент, профессор, факультет, аудитория, лекция, практическое

занятие и т. д.

Между дескрипторами устанавливаются связи, которые позволяют расширить

область поиска информации. Связи могут быть трех видов:



Поделиться:


Последнее изменение этой страницы: 2016-08-14; просмотров: 126; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.223.172.252 (0.313 с.)