Данные и метаданные информационных систем 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Данные и метаданные информационных систем



Информационные системы ис­пользуют ресурсы нескольких категорий — средства вычислитель­ной техники, системное и прикладное программное обеспечение, ин­формационные, лингвистические и человеческие ресурсы.

Информационные ресурсы системы составляют главный компонент модели предметной области, которую система поддерживает.Важно заметить, что в любой информационной системе поддержива­ется две категории информационных ресурсов. Ресурсы первой катего­рии непосредственно используются конечными пользователями систе­мы. Ресурсы второй категории можно было бы назвать метаресурсами. Описывая свойства ресурсов первой категории, они позволяют системе корректно оперировать ими. Как уже отмечалось, ресурсы первой кате­горий часто называют данными независимо от среды их представления (изображения, текстовые документы, аудиозаписи и т.д.), а метаресурсы — метаданными. метаданные — это данные о данных. Однако фактически метаданные могут описывать свойс­тва не только собственно данных, но и информационной системы в целом, отдельных ее механизмов и их функций, других ее ресурсов, поддерживае­мых технологий, пользователей и т.д. данные в информационной системе представ­ляют собой некоторую абстрактную модель реальности. Рассмат­ривая соотношение между данными и метаданными, можно сказать, что метаданные — это данные более высокого уровня абстракции по отноше­нию к описываемым ими данным. Метаданные, предназначенные для компьютерного использования, пред­ставляются в формализованном виде. Если же они предназначены для пользователей, то чаще всего представляются на естественном языке. В системах, основанных на технологиях баз данных, поддержива­ются структурированные данные, организованные в виде таблиц или каких-либо иных структур данных. К информационным ресурсам систем баз данных относятся также и схемы баз данных. В таких системах они относятся к категории метаданных. В текстовых системах информационные ресурсы включают коллекции документов, представленных на естественных языках. Это информаци­онные ресурсы для конечных пользователей. Кроме того, поддерживают­ся метаданные — тезаурусы, спецификации онтологии.

Тезаурус – от греческого «сокровищница», множество смысловых единиц некоторого языка с заданной на нем системой семантических отношений. Тезаурус фактически определяет семантику языка ( нац. языка, языка науки, формального языка).

Семантика – от греческого «обозначающий ». Одно из направлений трактовки – «значение» (смысл) единиц языка.

Онтология – от греческого ontos – сущность. Раздел философии, в котором рассматривается всееобщие основы, принципы бытия, его структура и закономерности.

Структурированные модели, слабоструктурированные модели

Структурированные модели

Модели такого рода основаны на выяв­лении регулярной структуры предметной области. Для конструирова­ния таких моделей нужно типизировать сущности предметной области, относя к одному типу сущности с одинаковым набором свойств. Анало­гичным образом типизируются связи между сущностями. Связи определяются на множествах типов сущностей и могут иметь различную арность.Представление предметной области, сконструированное с помощью рассматриваемого подхода, также называется структурированным.

Одной из разновидностей рассматриваемого подхода к моделирова­нию предметной области является объектный (или объектно-ориенти­рованный) подход, который дает возможность моделировать не только структуру предметной области, но и поведение экземпляров сущностей, относящихся к каждому определенному типу. С этой целью определение каждого типа сущностей включает определения допустимых на его эк­земплярах операций (или методов).

При использовании структурированных моделей представление пред­метной области имеет два уровня.

Представление более высокого уровня абстракции — это модель предметной области, отображающая ее свойства, инвариантные во времени. Эта модель представляется в терминах типов сущностей предметной области и типов связей между ними. Такую модель называют интенсионалом предметной об­ласти.

Второй, более конкретный уровень, моделирует состояние пред­метной области в зависимости от времени. Модель этого уровня пред­ставляется в терминах конкретных экземпляров сущностей и связей определенных типов между ними. Эту модель называют экстенсионалом предметной области.

На структурированных моделях предметной области с регулярной структурой основаны системы баз данных.

Слабоструктурированные модели.

При создании некоторых инфор­мационных систем применяется подход к моделированию предметной об­ласти, при котором регулярная ее структура не определена или она не существует в рассматриваемом случае. Такой подход используется, например, в системах, основанных на различного рода языкак разметки.(типа HTML)

В рассматриваемом подходе не предусматривается строгая типизация сущностей предметной области и связей между сущностями. Представление предметной области обычно является одноуровневым.

Поддержи­вается экстенсионал предметной области — ее представление в терми­нах конкретных экземпляров сущностей и связей между ними. Иногда предпринимается попытка некоторой типизации сущностей и связей. Но не гарантируется, что свойства типов обязательно присущи всем от­носящимся к ним экземплярам. Определенный в таком случае интен­сионал, по аналогии с системами баз данных иногда называемый схе­мой, не играет директивной роли. Конкретные экземпляры сущностей и связей, свойства которых не соответствуют схеме, системой не отвер­гаются.

Такого рода представления предметной области называют слабо­структурированными. Информационные ресурсы систем, основанных на рассматриваемом подходе, называют слабоструктурирован­ными данными.

Наиболее известной информационной системой, в которой поддержи­вается слабоструктурированное представление предметной области, яв­ляется глобальная распределенная гипермедийная информационная истема World Wide Web (далее — Web), базирующаяся на технологи­ях HTML.

Неструктурированные модели

К этой категории относятся вербаль­ные модели, то есть модели, описывающие реальность в виде текстов на естественном языке. В таких моделях явным образом не представляется структура предметной области — множество сущностей, их свойств, раз­личного рода связей между этими сущностями, интересующих пользо­вателей системы. Эта структура может быть реконструирована на осно­ве анализа содержания заданных текстов, однако не всегда однозначным образом. Автоматизация такого анализа — достаточно сложная задача, связанная с технологиями обработки естественного языка (Natural Language Processing).

Существует широкий спектр информационных систем, поддержива­ющих неструктурированные модели предметной области. В простейших из них задачи анализа и понимания естественного языка возлагаются на пользователя. В продвинутых системах большая часть нагрузки, связан­ной с решением этих задач, возлагается на систему.

Здесь уместно вспомнить об интенсионале предметной области. В систе­мах рассматриваемого класса он может быть материализован в форме теза­уруса, описания онтологии предметной области и других инструментов, ко­торые относятся к средствам лингвистической поддержки системы В простейших системах он явно не представлен в системе и ей не доступен. Что касается упоминавшихся продвинутых систем, то их возможности по работе с содержанием поддерживаемых в системе доку­ментов основаны именно на интенсиональной модели предметной облас­ти, явным образом представленной в системе. Представления предметной области в вербальных моделях можно на­звать неструктурированными. Информационные ресурсы таких сис­тем часто называют неструктурированными данными.

К числу ин­формационных систем, использующих вербальные модели предметной области, относятся системы текстового поиска.



Поделиться:


Последнее изменение этой страницы: 2016-07-14; просмотров: 440; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.135.219.166 (0.008 с.)