Відмінності проектування сховищ даних від баз даних. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Відмінності проектування сховищ даних від баз даних.



СД за своїм призначенням не схожі на БД OLTP-систем, які обслуговують поточну оперативну діяльність підприємств та організацій. СД використав.для підтримки прийняття стратегічних рішень, що дозволяє проводити порівняння і прогнозування майбутніх результатів.

Основними відмінностями при проектуванні сховищ даних порівняно з проектування баз даних є:

1.У базі даних OLTP-систем дані нормалізуються з метою запобігання виникненню аномалій надмірності та порушення цілісності й узгодженості БД при внесенні змін до БД. Дані в сховищі даних є статичними,тобто в них практично не вносять зміни.

2.При проектуванні БД не врахов-ся процедури їх подальшої обробки.При проектуванні СД потрібно знати і враховувати процедури агрегування даних.

3. при проектув СД необх враховувати «часовий фактор», тобто ступінь деталізації фактів.

14.Характеристика другої нормальної форми. Вiдношення перебувають у 2НФ, якщо вони перебувають у 1НФ i кожний неключовий атрибут функцiонально повно залежить вiд складового ключа. (Атрибут перебуває в повнiй функцiональнiй залежностi, якщо вiн залежить вiд всього ключа i не залежить вiд його складових частин).Розглянемо конкретний приклад: дано вiдно­шення НОРМА(код деталі, код матеріалу, назва матеріалу, ціна матеріалу, норма витрат матеріалу на деталь).

Побудуємо дiаграму функцiональних залежностей:

Отже, атрибут «назва матерiалу» залежить не вiд всього ключа, а лише вiд його частини, а атрибут «Норма витрат матерiалу на деталь» залежить вiд всього ключа, тобто перебуває в повнiй функцiональнiй залежностi.

Таким чином початкове вiдношення НОРМА розбивається на два вiдношення:МАТЕРIАЛ (код матерiалу, назва матерiалу, цiна матерiалу);НОРМА_ВИТРАТ (код деталi, код матерiалу, норма витрат матерiалу на деталь).

Переваги 2НФ: зручнiсть внесення змiн у БД. Трудомісткiсть внесення змiн у БД значно менша, ніж у ненормалiзовану БД. 2НФ повнiстю виключає можливiсть виникнення протирiччя даних, а також економить пам’ять при зберіганнi вiдношень у пам’ятi ЕОМ.

 

15.Характеристика третьої нормальної форми. Вiдношення перебуває в 3 НФ, якщо воно перебуває в 2НФ i кожний неключовий атрибут нетранзитивно залежить вiд первинного ключа.Транзитивна залежнiсть –– це залежнiсть мiж неключовими атрибутами.Транзитивні залежності також вилучають за допомогою декомпозицiї вiдношення на два чи бiльше iнших вiдношень, якi не містять транзитивних залежностей i об’єднання яких дасть початкове вiдношення. Напр., вiдношення ВИКЛАДАЧ (табельний N, прiзвище, по-сада, оклад, кафедра, телефон) перебуває в 2НФ, але вмiщує транзитивну залежнiсть:

Табельний N *

Призвіще

Посада

Оклад

Код кафедри

Телефон кафедри

В результатi зведення до 3НФ отримуємо два вiдношення: ВИКЛАДАЧ (табельний N, прiзвище, посада, оклад, кафедра) i КАФЕДРА (код кафедри, телефон кафедри).

Переваги 3НФ: вилучається надлишкове дублювання iнформацiї; спрощується процес внесення змiн; можна зробити ще такий висновок: вiдношення перебуває в 3НФ, якщо змiна значення будь-якого його атрибута (крiм тих, що входять до первинного ключа) не призведе до необхiдностi змiни iнших полiв.

Iснує ще пiдсилена 3НФ — нормальна форма Бойса – Кодда (БКНФ).

БКНФ вивчає залежностi ключових атрибутiв вiд неключових; якщо такi залежностi iснують, то їх потрiбно вилучити.

Розглянемо приклад вiдношення АВТОМОБIЛЬ (модель автомобiля, кiлькiсть цилiндрiв у двигунi, країна-виготовлювач). У цьому вiдношеннi iснують такi залежностi:

Отож, ключовий атрибут «модель автомобiля» залежить вiд неключового атрибута «країна-виготовлювач». Тому при зведеннi до БКНФ початкове вiдношення буде розбито на такі вiдношення: АВТОМОБIЛЬ (модель автомобiля, кiлькiсть цилiндрiв у двигунi);ВИРОБНИК (країна-виготовлювач, модель автомобiля).

Вiдношення перебуває в БКНФ, якщо воно перебуває в 3НФ i в ньому вiдсутнi залежностi ключiв вiд неключових атрибутiв. Вiдношення, яке перебуває в БКНФ, завжди є вiдношенням у 3НФ. Але, навпаки, вiдно­шення в 3НФ не завжди можна привести до нормальної форми Бойса – Кодда, не втративши залежності мiж його атрибутами.

Нормальна форма Бойса – Кодда має такi самі переваги, що й 3НФ.

 

16.Характеристика четвертої нормальної форми. На четвертому кроцi нормалiзацiї проводиться аналiз на присут­нiсть багатозначних залежностей у вiдношеннi. Вiдношення R перебуває в 4НФ, якщо в структурi багатозначної залежностi, визначеної на множинi атрибутiв, є лише тривiальнi чи/або такi нетривiальнi багатозначнi залежностi, що лiва частина будь-якої з них є ключем.

Напр.:Дано вiдношення ВИКЛАДАЧ (прiзвище, група, предмет), у якому присутнi багатозначнi залежностi: прiзвище -->> група, прiзвище -->> предмет. У цьому вiдношенні є дві незалежні одна від одної багатозначні залежності, які можуть спричинити аномалії. Якщо у викладача з’являється нова група, доводиться добавляти не один кортеж, а стільки, скільки предметів він читає в цій групі. Аналогiчна ситуацiя спостерігається з уведенням нового предмета. Тому потрiбно виконати декомпозицiю початкового вiдношення на два таких: Викладач_Група (прiзвище, група), Викладач_Предмет (прiзвище, предмет). Декомпозицiя початкового вiдношення на кiлька iнших має гарантувати його зворотнiсть, тобто забезпечувати отримання початкового вiдношення шляхом об’єднання вiдношень, якi було отримано в результатi декомпозицiї. Однак не завжди декомпозицiя гарантує зворотнiсть.

1 7. Порядок вилучення синонімії та омонімії та узагальнення атрибутів при інфологічному проектуванні БД.

Перший крок, який виконується при iнфологiчному проекту-ваннi, є аналiз атрибутiв на предмет вилучення синонiмiї i омонiмiї. Серед атрибутiв можуть зустрiтися такi, що мають однаковi iмена, але є рiзними за змiстом, тобто омонiми. У цьому разі атрибутам-омонiмам потрiбно присвоїти рiзнi унiкальнi iмена.

Крiм того, є випадки синонiмiї, коли один i той самий атрибут у рiзних документах має рiзну назву. У цьому разі всiм таким атрибутам присвоюється одне iм’я. Вибираючи назву для синонiмiчної групи атрибутiв, серед атрибутiв-синонiмiв необхiдно вибрати iм’я, яке є семантичною домiнантою для представленої групи, i залишити його в перелiку атрибутiв, а всi iншi синонiмiчнi його назви вилучити зі списку.

Складаючи список атрибутiв, можливо, необхiдно буде виконати ще одну операцiю, яка назвивається узагальненням. При цьому деяку сукупнiсть атрибутiв замiнюють одним атрибутом, який узагальнює сутнiсть представленої групи. Узагальненню пiдлягають атрибути, що мають однаковий формат i семантику.

 

18.Характеристика типів зв’язків в Erwin.

В ERwin зв'язки можуть характеризуватися таким чином: ідентифікуючий зв'язок встановлюється між незалежною батьківською сутністю та залежною дочірньою сутністю. Остання при ідентифікуючому зв'язку є завжди залежною При встановленні ідентифікуючого зв'язку атрибути первинного ключа батьківської сутності автоматично переносяться до складу первинних атрибутів дочірньої сутності. В дочірній сутності первинні ключі батьківської сутності позначаються як вторинні літерами (FK). При генерації фізичної моделі атрибути первинного ключа отримають ознаку NOT NULL.

При встановленні неідентифікуючого зв'язку дочірня сутність залишається незалежною.

Неідентифікуючим є зв'язок, коли екземпляр дочірньої сутності ідентифікується інакше, ніж через зв'язок з батьківською сутністю. Атрибути, які складають первинний ключ батьківської сутності, при цьому мігрують до складу неключових атрибутів дочірньої сутності. Неідентифікуючий зв'язок використовується для зв'язування незалежних сутностей. У разі обов'язкового зв'язку {Not Null) при генерації БД атрибут зовнішнього ключа отримає ознаку NOT NULL, незважаючи на те, що зовнішній ключ не ввійде до первинного ключа дочірньої сутності. У разі необов'язкового зв'язку (Nulls Allowed) зовнішній ключ може набувати значення Null.

Категоріальним зв'язком об'єднуються сутності, що належать до однієї категорії. Деякі сутності визначають цілу категорію об'єктів одного типу. У такому разі створюється сутність для визначення категорії і для кожного елемента категорії, Зв'язок, що об'єднує такі сутності, називається категоріальним. Батьківська сутність категорії називається супертипом, дочірня — підтипом.). Залежно від того, чи всі можливі сутності-підтипи включені до моделі, категорія може бути повною чи неповною.

Повний категоріальний зв'язок (повна категорія) — це такий зв'язок, коли кожному екземпляру сутності-супертипу обов'язково відповідає певний екземпляр сутності-підтипу.

Неповний категоріальний зв'язок (неповна категорія) — це такий зв'язок, коли певним екземплярам сутності-супертипу немає відповідних сутностей-підтипів

Таким чином, зв'язок визначає сутність як залежну або незалежну. Розрізняють кілька типів залежних сутностей.

* Характеристична— залежна дочірня сутність, яка зв'язана лише з однією батьківською сутністю і за змістом зберігає інформацію про характеристики батьківської сутності.

• Асоціативна — залежна дочірня сутність, яка зв'язана з кількома батьківськими сутностями.

• Іменна — окремий випадок асоціативної сутності, яка не має своїх власних атрибутів, а лише атрибути батьківських сутностей, що мігрували як зовнішні ключі.

Потужність зв'язку — це відношення кількості екземплярів батьківської сутності до відповідної кількості екземплярів дочірньої сутності.



Поделиться:


Последнее изменение этой страницы: 2017-01-25; просмотров: 278; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.223.32.230 (0.009 с.)