Фактографические системы на основе баз данных. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Фактографические системы на основе баз данных.



На основе баз данных строятся фактографические и документальные системы.

Документальные системы – для работы с документами на естественном языке (монографии, публикации, тексты). Наиболее распространены ИПС.

Фактографические системы – оперируют фактическими сведениями, представленными в виде специальным образом организованных совокупностей формализованных записей данных. Центральное звено ФС – БД. ФС делят на два класса – OLAP и OLTP.

OLTP – системы операционной обработки данных, OLAP – системы, ориентированные на анализ данных и поддержку принятия решения.

Сфера применения OLTP – системы платежей, резервирования мест в поездах, самолетах, гостиницах, банковские и биржевые системы. Логическая единица функционирования OLTP – транзакция (перевод денег со счета на счет – транзакция). Таким образом, OLTP – это оперативная обработка транзакций или выполнение транзакций в режиме реального времени.

Вопрос OLTP: “Есть ли свободные места в купе поезда 95 Москва - Барнаул на 20.12.02?”

OLАP, являясь системами поддержки принятия решений, ориентированы на выполнение сложных запросов, требующих статистической обработки исторических данных, моделирования процессов предметной области, прогнозирования развития явлений.

Вопрос OLАP: “Каким будет объем продаж ж/д билетов в денежном выражении в следующих трех месяцах с учетом сезонных колебаний?”

Вопрос OLАP банка: “Найти среднее значение промежутка времени между выставлением счета и оплатой его клиентом в текущем и прошедшем году отдельно для разных групп клиентов».

Сложный аналитический запрос в большинстве случаев невозможно сформулировать на SQL, для этого применяют специальные языки, например, Express 4GL фирмы Oracle.

Оперативность в таких сложных системах достигается за счет применения мощной ВТ, сложных методов анализа и специальных хранилищ данных. Данные в OLАP системах должны быть организованы особым образом, так как образуются большие информационные массивы, выполнение некоторых запросов (анализ тенденций, прогнозирование) требуют хронологической упорядоченности, для обслуживания многих запросов требуются агрегированные данные.

Данные, применяемые для анализа, стали выделять в отдельные БД и назвали хранилищами данных.

Концепция хранилищ данных предполагает интеграцию и согласование данных из различных источников и разделение наборов данных, используемых в OLAP и OLTP системах.

Хранилище – это интегрированный, неизменяемый и поддерживающий хронологию набор данных, предназначенный для обеспечения принятия управленческого решения.

 
 

 


Источники, из которых поступает информация в хранилище, не связаны между собой, поэтому данные имеют различную структуру и форматы представления. Производится согласование данных, т.е. приведение к единому формату, устранение дублирующих и некорректных значений. Подготовленные данные загружаются в хранилище.

Хранилище данных должно обладать такими свойствами:

· Ориентация на предметную область, структура хранилища должна отображать представление аналитика об информации, с которой ему приходится работать.

· Данные при загрузке должны агрегироваться.

· После загрузки внесение каких-либо изменений, кроме добавления записей, не предполагается.

· Поддержка хронологии, учет хронологии достигается введением ключевых понятий типа «Дата» и «Время» в структуры хранилищ данных.

Рассмотрим свойства данных в OLAP и OLTP системах.

 

Свойство OLTP OLAP
Назначение данных Оперативный поиск, несложные виды обработки Аналитическая обработка, прогнозирование
Уровень агрегации Детализированные Агрегированные
Период хранения данных От нескольких месяцев до одного года От нескольких лет до десятков лет
Частота обновления Высокая, маленькими порциями Малая, большими порциями

 



Поделиться:


Последнее изменение этой страницы: 2017-02-22; просмотров: 353; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.163.58 (0.004 с.)