Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву
Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Інформаційні сховища: склад і структура, багатомірна модель даних, проектування багатомірних баз даних, застосування технологій OLAP для обробки даних.Содержание книги
Поиск на нашем сайте Сховище даних (DW) - система, що підтримує несуперечливу інтегровану предметно-орієнтовану сукупність історичних даних організації з мстою підтримки прийняття стратегічних рішень. Сховище даних представляє також різнобічні інструментальні засоби для аналізу даних. Концепція сховищ даних - це концепція підготовки даних для подальшого аналізу. Інформаційні сховища призначені для систем підтримки прийняття рішень. Сховища даних розробляються з урахуванням специфіки предметної області, а не застосувань, які обробляють дані. Дані у сховищі повинні бути інтегровані, зведені до єдиного синтаксичного і семантичного вигляду, перевірені на цілісність і несупєречливість. Приклад: багатомірні дані
1). Представлення у вигляді двомірної матриці
2). Представлення інформації у вигляді тривимірного куба
Decision Cube
Create cube university ( Domension Faculted Level Type varchar () Level Type varchar () Domension Speciality Level ITP Level IUST Domension Year Level 2000 Level 2001 Основні операції над гіпер кубом: 1. переріз – передбачає формування підмножини гіперкуба, в якому значення одного або більшої кількості вимірів є фіксованим. 2. обертання – передбачає зміну порядку вимірів. 3. деталізація – передбачає подання інформації по певному переметру у більш детальному вигляді. 4. згортання- це консолідація даних, тобто заміна одного з вимірів іншим більш високого рівня. Основними поняттями багатомірної моделі є: вимірювання та значення. Вимірювання – це множина, яка утворює одну з граней гіпер кубу і є аналогом домену в реляційній моделі.
Найбільш відомою схемою збереження гіпер кубу є схема зірка. Зірка представляє собою структуру в центрі якої знаходиться таблиця даних, яка вміщує фактичні дані і яка оточена таблицями розмінностей, які вміщують посилкові дані. При створенні сховища даних однією з основних задач є визначення оптимальної структури зберігання даних з точки зору забезпечення прийнятного часу відповіді на аналітичні запити і потрібного об'єму пам'яті. Всі дані в сховищі даних поділяються на такі категорії: детальні дані; агреговані дані; метадані.
Послідовність проектування сховища даних показана на рис. При моделюванні сховищ даних використовуються концепції ЕК-моделювання з деякими обмеженнями. Кожна модель складається з таблиці зі складовим ключом, яка називається таблицею фактів, і набору невеликих таблиць, які називаються таблицями розмірностей. У таблиці фактів розміщуються дані, які найбільш інтенсивно використовуються для аналізу. У довідковій таблиці перелічені можливі значення одного з вимірів гіперкуба. Кожен вимір описується своєю власною таблицею. Кожна таблиця розмірності має простий первинний ключ, який точно відповідає одному з компонентів складового ключа в таблиці фактів. Тобто первинний ключ таблиці фактів складається з декількох зовнішніх ключів. Така нейтралізована структура називається схемою "зірка". В основі концепції сховищ даних лежить ідея розподілу на дві групи даних, що використовуються: для оперативної обробки (ОLТР) і для рішення задач аналізу (ОLАР). ОLТР — системи оперативной обробки траизакцій, які призначені для підтримки поточної діяльності різного роду організацій. ОLАР - системи оперативної аналітичної обробки, які призначені для підтримки прийняття рішень і орієнтовані головним чином на нерегламентовані запити. Термін ОLАР дозволяє описувати технологію обробки даних, в якій застосовується багатомірне представлення апретованих даних для забезпечення швидкого доступу до даних для поглибленого аналізу. В основі інформаційних сховищ знаходиться багатомірна модель даних, яка наз. гіперкубом. Математичні методи обробки аналітичної інформації: регресія; кореляція;прогнозування; пластермізація. Data Mining – система самостійно на основі великих масивів інформації приймає рішення про нові закономірності та зв’язки. 1. Розрізняють OLAP: MOLAP – Multi OLAP, передбачає створення інформаційних сховищ на основі БД фізично. 2. ROLAP – Relation OLAP, реляційна OLAP, модель даних, яка існує віртуально. 3. HOLAP – Hybrid OLAP, застосування і фізичного, і віртуального збереження інформації. У багатьох випадках замість OLAP застосовують так звані магазини даних, які представляють собою підмножину сховища даних, які підтримують вимоги окремого підрозділу організації. Документальні інформаційні системи, їхній склад і структура; порівняти фактографічні і документальні системи; пояснити яким чином організовано збереження документів, як виконується індексація і пошук документів. Інформація є: фактографічна (числа,символи) та документальна. Фактографічні моделі – містять відомості, які представленні у вигляді спеціальним чином організованих сукупностей формалізованих записів даних. Документальні моделі даних відповідають представленню про слабко структуровану інформацію, яка орієнтована на вільні формати документів текстів або природні мови. Слабоструктуровані дані-це дані, які не достатньо формалізовані, або не повні і які мають структуру, яка може швидко і не передбачено змінюватись. Зберігати дані можна наступним чином: 1. у вигляді файлової системи; 2. використання звичайної СУБД; 3. розробка інформаційної пошукової системи, яка забезпечує пошук або: 1. по спеціально виділених атрибутах; 2. повнотекстовий пошук. 4. розробка гіпертекстової системи. Існує 3 підходи: 1. збереження окремих документів; 2. на кожен документ свор. картка (автор,назва,рік),картки утворюють журнал; 3. інформ.-пошукові системи: по окремим словам,повнотекстові (интернет);розмітка документів (html,xml). Модель документу: Структура- характеризує логічну організацію документів. Форма-харак. зовнішнє представлення документу. Фізична організація- характеризує фізичне зберігання документів на зовнішніх носіях інформації. Розрізняють документи: прості (зміст, структура, фізичне представлення, форми); складні (документ, який включає в себе певні структури-графіка, відео, ауді); віртуальний це документ, який фізично,як єдине ціле не існує але користувачу представляється як єдине ціле. Документ характеризується: розподіленою обробкою, захистом документів, багатоверсійністю, колективною роботою над документом, архітектура обробки клієнт-сервер, масштабування. Системи автоматизованої обробки технічних документів включають в себе: підсистема управління документами; підсистема управління даними о проектах; підсистема маршрутизації документів. PDM передбачає управління данними на протязі всього життєвого циклу документів. PDM включає в себе: 1. документацію по САПР 2. виробничу документацію 3. маркетингова документація 4. експлуатація документація PDM забезпечує розвинену систему пошуку за різними критеріями. Організація збереження інформації представляє собою бд в якій збер. інформація про проекти, а також картотека з інформацією про документи.
Пошук інформації Розрізняють: швидкий (по першим літерам);атрибутивний (за картотекою);пошук за електронним підписом;пошук за змістом документу. Управління доступом: підсистема контролю доступом;підсистема моніторингу доступу до архиву документів. Функції документальних систем. Система управління документами (СУД) виконує наступні функції: введення документів; індексування документів (атрибутивне, повнотекстове); функція збереження документів, яка передбачає архівування та підтримкубагатоверсійності документів; організація групової роботи над документами; організація прав доступу до документів; формування звітів. Мови розмітки документів: - SGML-standart genetralised makup language. Ця мова визначає допустимий набір тегів їх атрибутів. За допомогою SGML можна описувати структуру документу. - HTML –hyper text markup language –дозволяє оформлювати документи, розмічати їх за допомогою тегів. - XML-extensible markup language –це мова розмітки, яка описує цілий клас об’єктів які називаються XML-документами. На відміну від HTML ця мова дозволяє зберігати внутрішню структуру документу. Популярне поєднання: СУБД + XML+WEB Переваги гіпертекстових систем:наявність користувацького інтерфейсу,можливість встановлення зв”зків між вузлами і отримання від нього ін фор.; наявність розвиненої системи пошуку; наявність системи збереження територіально розподіленої інформації. Значення мови XML для бази даних: Стандартизований засіб представлення інформації;стандартизованиц засіб опису представлення баз даних (XML може працювати з браузером).; чіткий розводіл структури,змісту і відображення інформації; можливість перевірки змісту документів; підтримка міжнародних стандартів длч типів документів. XML працює зі слабо структурованими даними.які є неповними або недостатньо формалізованими і мають структуру що може швидко змінюватись..
|
||||||||||||||||||||||||||
|
Последнее изменение этой страницы: 2017-01-25; просмотров: 420; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 216.73.216.214 (0.009 с.) |