Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Данные и метаданные информационных системСодержание книги
Похожие статьи вашей тематики
Поиск на нашем сайте
Информационные системы используют ресурсы нескольких категорий — средства вычислительной техники, системное и прикладное программное обеспечение, информационные, лингвистические и человеческие ресурсы. Информационные ресурсы системы составляют главный компонент модели предметной области, которую система поддерживает.Важно заметить, что в любой информационной системе поддерживается две категории информационных ресурсов. Ресурсы первой категории непосредственно используются конечными пользователями системы. Ресурсы второй категории можно было бы назвать метаресурсами. Описывая свойства ресурсов первой категории, они позволяют системе корректно оперировать ими. Как уже отмечалось, ресурсы первой категорий часто называют данными независимо от среды их представления (изображения, текстовые документы, аудиозаписи и т.д.), а метаресурсы — метаданными. метаданные — это данные о данных. Однако фактически метаданные могут описывать свойства не только собственно данных, но и информационной системы в целом, отдельных ее механизмов и их функций, других ее ресурсов, поддерживаемых технологий, пользователей и т.д. данные в информационной системе представляют собой некоторую абстрактную модель реальности. Рассматривая соотношение между данными и метаданными, можно сказать, что метаданные — это данные более высокого уровня абстракции по отношению к описываемым ими данным. Метаданные, предназначенные для компьютерного использования, представляются в формализованном виде. Если же они предназначены для пользователей, то чаще всего представляются на естественном языке. В системах, основанных на технологиях баз данных, поддерживаются структурированные данные, организованные в виде таблиц или каких-либо иных структур данных. К информационным ресурсам систем баз данных относятся также и схемы баз данных. В таких системах они относятся к категории метаданных. В текстовых системах информационные ресурсы включают коллекции документов, представленных на естественных языках. Это информационные ресурсы для конечных пользователей. Кроме того, поддерживаются метаданные — тезаурусы, спецификации онтологии. Тезаурус – от греческого «сокровищница», множество смысловых единиц некоторого языка с заданной на нем системой семантических отношений. Тезаурус фактически определяет семантику языка ( нац. языка, языка науки, формального языка). Семантика – от греческого «обозначающий ». Одно из направлений трактовки – «значение» (смысл) единиц языка. Онтология – от греческого ontos – сущность. Раздел философии, в котором рассматривается всееобщие основы, принципы бытия, его структура и закономерности. Структурированные модели, слабоструктурированные модели Структурированные модели Модели такого рода основаны на выявлении регулярной структуры предметной области. Для конструирования таких моделей нужно типизировать сущности предметной области, относя к одному типу сущности с одинаковым набором свойств. Аналогичным образом типизируются связи между сущностями. Связи определяются на множествах типов сущностей и могут иметь различную арность.Представление предметной области, сконструированное с помощью рассматриваемого подхода, также называется структурированным. Одной из разновидностей рассматриваемого подхода к моделированию предметной области является объектный (или объектно-ориентированный) подход, который дает возможность моделировать не только структуру предметной области, но и поведение экземпляров сущностей, относящихся к каждому определенному типу. С этой целью определение каждого типа сущностей включает определения допустимых на его экземплярах операций (или методов). При использовании структурированных моделей представление предметной области имеет два уровня. Представление более высокого уровня абстракции — это модель предметной области, отображающая ее свойства, инвариантные во времени. Эта модель представляется в терминах типов сущностей предметной области и типов связей между ними. Такую модель называют интенсионалом предметной области. Второй, более конкретный уровень, моделирует состояние предметной области в зависимости от времени. Модель этого уровня представляется в терминах конкретных экземпляров сущностей и связей определенных типов между ними. Эту модель называют экстенсионалом предметной области. На структурированных моделях предметной области с регулярной структурой основаны системы баз данных. Слабоструктурированные модели. При создании некоторых информационных систем применяется подход к моделированию предметной области, при котором регулярная ее структура не определена или она не существует в рассматриваемом случае. Такой подход используется, например, в системах, основанных на различного рода языкак разметки.(типа HTML) В рассматриваемом подходе не предусматривается строгая типизация сущностей предметной области и связей между сущностями. Представление предметной области обычно является одноуровневым. Поддерживается экстенсионал предметной области — ее представление в терминах конкретных экземпляров сущностей и связей между ними. Иногда предпринимается попытка некоторой типизации сущностей и связей. Но не гарантируется, что свойства типов обязательно присущи всем относящимся к ним экземплярам. Определенный в таком случае интенсионал, по аналогии с системами баз данных иногда называемый схемой, не играет директивной роли. Конкретные экземпляры сущностей и связей, свойства которых не соответствуют схеме, системой не отвергаются. Такого рода представления предметной области называют слабоструктурированными. Информационные ресурсы систем, основанных на рассматриваемом подходе, называют слабоструктурированными данными. Наиболее известной информационной системой, в которой поддерживается слабоструктурированное представление предметной области, является глобальная распределенная гипермедийная информационная истема World Wide Web (далее — Web), базирующаяся на технологиях HTML. Неструктурированные модели К этой категории относятся вербальные модели, то есть модели, описывающие реальность в виде текстов на естественном языке. В таких моделях явным образом не представляется структура предметной области — множество сущностей, их свойств, различного рода связей между этими сущностями, интересующих пользователей системы. Эта структура может быть реконструирована на основе анализа содержания заданных текстов, однако не всегда однозначным образом. Автоматизация такого анализа — достаточно сложная задача, связанная с технологиями обработки естественного языка (Natural Language Processing). Существует широкий спектр информационных систем, поддерживающих неструктурированные модели предметной области. В простейших из них задачи анализа и понимания естественного языка возлагаются на пользователя. В продвинутых системах большая часть нагрузки, связанной с решением этих задач, возлагается на систему. Здесь уместно вспомнить об интенсионале предметной области. В системах рассматриваемого класса он может быть материализован в форме тезауруса, описания онтологии предметной области и других инструментов, которые относятся к средствам лингвистической поддержки системы В простейших системах он явно не представлен в системе и ей не доступен. Что касается упоминавшихся продвинутых систем, то их возможности по работе с содержанием поддерживаемых в системе документов основаны именно на интенсиональной модели предметной области, явным образом представленной в системе. Представления предметной области в вербальных моделях можно назвать неструктурированными. Информационные ресурсы таких систем часто называют неструктурированными данными. К числу информационных систем, использующих вербальные модели предметной области, относятся системы текстового поиска.
|
||||
Последнее изменение этой страницы: 2016-07-14; просмотров: 480; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.26.149 (0.008 с.) |