Принципи побудови сховищ даних 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Принципи побудови сховищ даних



Сховище даних - це логічно інтегроване джерело даних для додатку систем підтримки ухвалення рішень (DSS) і інформаційних систем керівника (EIS). Кажучи про логічну інтегрованість, тому що деякі прості середовища сховищ даних, можуть бути централізованими (незалежно від того, розподіленими або централізованими є самі джерела даних для них). Проте найвідповіднішим, у міру зростання популярності сховищ даних стануть, мабуть, розподілені архітектури. Можливо навіть, що розподіленість стане необхідною властивістю через такі чинники, як ємність запам’ятовуючих пристроїв.

Розвинута архітектура, де як джерелами для сховища даних виступають декілька баз даних, показана на мал. 4.1.

Важливо, проте, розуміти, що сховище даних - не є розподіленою або нерозподіленою базою даних.

Оскільки призначення сховища даних - це інформаційна підтримка ухвалення рішень, а не операційної обробки або обробки трансакцій, то багато принципів, що лежать в основі технології баз даних, втрачають для них своє значення. Зокрема, в сховищах даних не підтримуються операції оновлення даних, традиційні для систем баз даних. Нижче перераховано чотири основоположні принципи організації сховищ даних.

1. Наочна орієнтація. В операційних інформаційних системах звичайно підтримується декілька наочних областей, кожна з яких може послужити кандидатом для представлення в сховищі даних. Наприклад, для магазина роздрібної торгівлі видео- і музичною продукцією можуть представляти інтерес наступні наочні області:

- клієнти;

- відеокасети;

- компакт-диски і аудіокасети;

- співробітники;

- постачальники.

Неважко провести аналогію між наочними областями сховища даних і класами об’єктів в об’єктно-орієнтованих базах даних. Дійсно, методи проектування і моделювання, що вживаються в об’єктно-орієнтованих базах даних, можуть виявитися корисними і при формуванні наочних областей сховищ даних.

2. Можливості інтеграції. Вище вже обговорювалися проблеми інтеграції даних, що виникають при побудові глобальних схем для розподілених середовищ федеральних або мультибаз даних. Мовилося про те, що одна і та ж сутність у різних існуючих базах даних і додатках може бути представлено абсолютно по-різному, і що всі ці уявлення повинні бути відображені в деяке загальне уявлення. Точно такий же принцип повинен застосовуватися і до середовища сховищ даних, що одержують інформацію від низки додатків і операційних баз даних, як показано на мал. 4.1.

 

Мал. 4.1. Множина баз даних як джерело для сховища даних

 

3. Немінливість даних. У сховищах даних не підтримуються традиційні для систем баз даних операції оновлення даних. Для різних середовищ баз даних характерні різні рівні мінливості даних. Так, в реляційних базах даних допускаються вставки рядків, зміни значень стовпців, видалення рядків, виконувані регулярно в процесі звичайної діяльності. В сховищах даних підтримується модель „масового завантаження” даних (виконується в задані моменти часу) згідно зі встановленими правилами витягання їх з джерел. Масове завантаження може виконуватися з централізованої бази даних, що знаходиться в тій же обчислювальній системі, що і сховище даних, а може здійснюватися і шляхом одночасних витягань даних з розподілених баз даних (або навіть з розрізнених баз даних або інформаційних систем, які не знаходяться під контролем якого-небудь типу глобальної схеми). Коротше кажучи, модель оновлення індивідуальних об’єктів, що використовується в традиційних базах даних, не застосовується до сховищ даних.

4. Зміни в часі. Завдяки всім можливостям інтеграції і підтримки інформації сховище даних - це дещо більше, ніж просто «складна послідовність миттєвих знімків». Воно завжди має певний часовий (темпоральний) аспект, властивий його вмісту. Далі будуть розглянуті тимчасові бази даних як ще одна область управління інформацією, що зароджується. Фундаментальний принцип часових баз даних, що полягає в тому, що час є ключовим компонентом бази даних і її вмісту, також можна віднести і до сховищ даних.

 

Мал. 4.2. Архітектура централізованого і розподіленого сховища даних

 

Організації, що вже використовують сховища даних або планують робити це в майбутньому, неминуче зіткнуться з необхідністю мати в тому або іншому ступені можливість розподілення, подібно до своїх операційних баз даних. Тому архітектори, проектувальники і фахівці з реалізації сховищ даних повинні мати уявлення про принципи побудови розподілених сховищ даних, а також про існуючі комерційні і інші розробки такого роду.

Розглянемо архітектуру сховищ даних, зображену на мал. 4.2. Централізоване сховище даних може застосовуватися для таких середовищ, де осереддям даних компанії як і раніше є мейнфрейм. В той же час недоцільно зберігати централізовану архітектуру інформаційних додатків в ситуаціях, коли операційні додатки (і відповідні дані) базуються на розподілених обчислювальних системах.

 



Поделиться:


Последнее изменение этой страницы: 2016-07-11; просмотров: 575; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.138.33.87 (0.004 с.)