Перелік умовних позначень, скорочень 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Перелік умовних позначень, скорочень



Д.О. Ладичук, В.І. Пічура

 

 

Бази даних

Геоінформаційних систем

 

Х е р с о н - 2 0 0 6

Географічні Інформаційні Системи (ГІС) в аграрних університетах України (ГІСАУ) European Commission     Directorate-General Education and Culture Tempus Project CD_JEP-25215-2004, GISAU Geographic Information Systems (GIS) in Agrarian Universities in Ukraine (GISAU)

Д.О. Ладичук, В.І. Пічура

 

Бази даних

Геоінформаційних систем

Навчальний посібник

Партнери:

- Херсонський державний аграрний університет (UKR)

- Glasgow Caledonian University (United Kingdom)

- University of Gävle (Sweden)

- Херсонський державний університет (UKR)

Х е р с о н - 2 0 0 6

Географічні Інформаційні Системи (ГІС) в аграрних університетах України (ГІСАУ) European Commission     Directorate-General Education and Culture Tempus Project CD_JEP-25215-2004, GISAU Geographic Information Systems (GIS) in Agrarian Universities in Ukraine (GISAU)

D.O. Ladychuk, V.I. Pichura

Data bases for GIS

 

Textbook

 

Partners:

- Kherson State Agrarian University (UKR)

- Glasgow Caledonian University (United Kingdom)

- University of Gävle (Sweden)

- Kherson State University (UKR)

 

K h e r s o n - 2006

 

УДК 0046

ББК 32.97.

 

Рецензенти: ЛИСОГОРОВ К.С. – доктор сільськогосподарських наук, ст. науковий співробітник, завідуючий лабораторією автоматизованих систем управління Інституту землеробства південного регіону УААН;

МАРАСАНОВ В.В. – доктор технічних наук, професор, завідуючий кафедрою економічної кібернетики Херсонського державного аграрного університету.

 

Ладичук Д.О., Пічура В.І. Бази даних геоінформаційних систем – Херсон: Вид-во ХДУ, 2006. - с.

 

Навчальний посібник створений на основі літературного огляду робіт провідних українських та зарубіжних фахівців в області геоінформаційних систем та технологій. Науково – методичні матеріали призначенні для створення концептуальної основи, принципів та методології баз даних з метою прийняття оптимальних рішень в галузі “Гідромеліорації”.

Розрахований на фахівців сільського та водного господарства, наукових працівників, викладачів, студентів.

 

Учебное пособие создано на основе литературного обзора работ ведущих украинских и иностранных специалистов в областы геоинформационных систем и технологий. Научно-методические материалы предназначены для создания концептуальной основы, принципов и методологии баз данных с целью принятия оптимальных решений в отрасли “Гидромелиорации”.

 

Ladychuk D.O., Pichura V. I.

    Data base of the Geoinformation Systems, Kherson, State Agrarian University, 2006.

    The textbook is written on the basis of the literature review of the famous Ukrainian and foreign specialists in the sphere of GIS and technologies. Research and teaching materials are meant for the establishment of conceptual grounds, principles and methodology of database in decision making in the sphere of hydromelioration.

    It is intended for specialists of agricultural enterprises, academics, researchers, teachers and students.

 

Рекомендовано до друку вченою радою Херсонського державного аграрного університету 30 червня 2006р. (протокол № 10)

 

ISBN 966-

© Д.О.Ладичук, 2006

© В.І.Пічура,2006


ВСТУП

Геоінформаційна система (ГІС) є відносно новим, сучасним технічним засобом об’єднання та аналізу різноманітної інформації.

Завдяки широкому застосуванню ГІС в усіх сферах професійної та громадської діяльності зростає роль географічної інформації як багатогалузевого та загальносуспільного предмета споживання.

Як нова сфера інформаційної діяльності. що швидко розвивається та широко застосовується. геоінформаційна сфера наприкінці ХХ століття досягла свого інформаційного і технічного бар’єра, коли технологічний рівень організації даних, їх накопичення, пошуку та доступу до них, оцінки їх якості та придатності для конкретного використання не відповідає постійно зростаючим обсягам геопросторових даних, що створюються різними суб’єктами геоінформаційної діяльності [2].

ГІС – це одночасно і довідкове джерело (банк інформації) й експерта система, завдяки якій можна приймати оперативні оптимальні рішення при наявності масової і нерідко протиречивої вихідної інформації.

ГІС може організовувати тематично різноманітну просторову інформацію, використовувати з неї багато дій і забезпечувати її автоматизований аналіз.

Створення інфраструктур геопросторових даних будь – якого рівня ґрунтується на загальних основних складових, принципах і методах реалізації. до таких належать: інституційні основи, базові набори геопросторових даних, бази метаданих та механізми обміну динними, стандарти на геопросторові дані, метадані та геоінформаційні сервіси, технологічні засоби інформаційно – комунікаційного середовища створення, оброблення та використання геопросторових даних [1].

Сьогодні ці дані дуже часто вводяться прямо в ГІС, створюючи географічну базу даних, що основана на прямих спостереженнях та інші бази даних, які дозволяють створювати комп’ютерне представлення вивчаємих об’єктів.

Організований певним чином масив даних, збережений в обчислювальній системі, називається базою даних.

Основні ідеї сучасної інформаційної технології базуються на концепції, відповідно до якої дані повинні бути організовані в бази даних з метою адекватного відображення реального миру, що змінюється, і задоволення інформаційних потреб користувачів. Ці бази даних створюються й функціонують під управлінням спеціальних програмних комплексів, називаних системами управління базами даних (СУБД).

Збільшення обсягу й структурної складності збережених даних, розширення кола користувачів інформаційних систем привели до широкого поширення найбільш зручних і порівняно простих для розуміння реляційних (табличних) СУБД. Для забезпечення одночасного доступу до даних безлічі користувачів, нерідко розташованих досить далеко друг від друга й від місця зберігання баз даних, створені мережні мультікористувальські версії БД заснованих на реляційній структурі. У них тим або іншим шляхом вирішуються специфічні проблеми паралельних процесів, цілісності (вірності) і безпеки даних, а також санкціонування доступу.

Переваги використання баз даних, пов’язані із централізованим управлінням за допомогою систем управління базами даних (СУБД). А так як бази даних є основою ГІС, виникає необхідність у створенні цього посібника.

 

Структура дисципліни

 

Спеціальність

Форма навчання

Курс

Семестр

Всього годин

В тому числі

Контрольна робота

Іспит

Лекцій практичних лабораторних самостійних
ГІС в меліорації денна VI 108 14 16 24 54 1 1

 

 


Ієрархічна модель даних. Ієрархічна структура представляє сукупність елементів, зв'язаних між собою за певними правилами. Об'єкти, зв'язані ієрархічними відносинами, утворять орієнтований граф (перевернене дерево).

До основних понять ієрархічної структури ставляться: рівень, елемент (вузол), зв'язок. Вузол — це сукупність атрибутів даних, що описують деякий об'єкт. На схемі ієрархічного дерева вузли представляються вершинами графа. Кожний вузол на більше низькому рівні зв'язаний тільки з одним вузлом, що перебуває на більше високому рівні. Ієрархічне дерево має тільки одну вершину (корінь дерева), не підлеглу ніякій іншій вершині й находящуюся на самому верхньому (першому) рівні. Залежні (підлеглі) вузли перебувають на другому, третьому й т.д. рівнях. Кількість дерев у базі даних визначається числом кореневих записів.

До кожного запису бази даних існує тільки один (ієрархічний) шлях від кореневого запису.

Поняття бази даних

Мета будь-якої інформаційної системи — обробка даних про об'єкти реального миру. У широкому змісті слова база даних — це сукупність відомостей про конкретні об'єкти реального миру в якій-небудь предметній області. Під предметною областю прийнято розуміти частину реального миру, що підлягає вивченню для організації управління й в остаточному підсумку автоматизації, наприклад, підприємство, вуз і т буд.

Створюючи базу даних, користувач прагне впорядкувати інформацію з різними ознаками і швидко робити вибірку з довільним сполученням ознак. Зробити це можливо, тільки якщо дані структуровані.

Структурування — це введення угод про способи подання даних.

Неструктурованими називають дані, записані, наприклад, у текстовому файлі.

Користувачами бази даних можуть бути різні прикладні програми, програмні комплекси, а також фахівці предметної області, що виступають у ролі споживачів або джерел даних, називані кінцевими користувачами.

У сучасній технології баз даних передбачається, що створення бази даних, її підтримка й забезпечення доступу користувачів до неї здійснюються централізовано за допомогою спеціального програмного інструментарію — системи управління базами даних.

База даних (БД) — це пойменована сукупність структурованих даних, що ставляться до певної предметної області.

Система управління базами даних (СУБД) — це комплекс програмних і мовних засобів, необхідних для створення баз даних, підтримки їх в актуальному стані й організації пошуку в них необхідної інформації.

Централізований характер управління даними в базі даних допускає необхідність існування деякої особи (групи осіб), на яку покладають функції адміністрування даними, збереженими в базі.

За технологією обробки дані бази даних підрозділяються на централізовані й розподілені.

Централізована база даних зберігається в пам'яті однієї обчислювальної системи. Якщо ця обчислювальна система є компонентом мережі ЕОМ, можливий розподілений доступ до такої бази. Такий спосіб використання баз даних часто застосовують у локальних мережах ПК.

Розподілена база даних складається з декількох, можливо пересічних або навіть дублюючих одну одну частин, збережених у різних ЕОМ обчислювальній мережі. Робота з такою базою здійснюється за допомогою системи управління розподіленою базою даних (СУРБД).

За способом доступу до даних бази даних розділяються на бази даних з локальним доступом і бази даних з вилученим (мережним) доступом.

Система баз даних (database system) — це, по суті, не що інше, як комп'ютеризована система зберігання записів. Користувачеві цієї системи надається можливість виконувати безліч різних операцій над такими файлами, наприклад:

• додавати нові порожні файли в базу даних;

• додавати нові дані в існуючі файли;

• вести пошук даних в існуючих файлах;

• змінювати дані в існуючих файлах;

• видаляти дані з існуючих файлів;

• видаляти існуючі файли з бази даних, тобто позбуватися від їхнього вмісту.

Система баз даних - це комп'ютеризована система зберігання записів; тобто це комп'ютеризована система, основна мета якої – зберігати інформацію й надавати її на вимогу. До інформації може відноситися все, що заслуговує на увагу окремого користувача або підприємства, що використовує систему.

Однокористувальницька система (single-user system) — це система, у якій у те саме час до бази даних може одержати доступ не більше одного користувача; багатокористувальницька система (multi-user system) — це система, у якій до бази даних можуть одержати доступ відразу кілька користувачів.

У загальному випадку дані в базі даних (принаймні в більших системах) є інтегрованими й загальними. Ці два аспекти, інтеграція й дозвіл загального доступу, являють собою найбільш важливу перевагу використання систем баз даних на "великому" устаткуванні; і щонайменше один з них - інтеграція - є перевагою їхнього використання на "малому" устаткуванні.

• Під поняттям інтегровані дані мається на увазі можливість представити базу даних як об'єднання декількох окремих файлів даних, повністю або частково, що перекриваються.

Під поняттям загальні дані мається на увазі можливість використання окремих областей даних у базі даних декількома різними користувачами, тобто кожний із цих користувачів може мати доступ до однієї й тій же області даних (причому різні користувачі можуть використовувати ці дані для різних цілей). Як уже згадувалося, різні користувачі можуть мати доступ навіть до однієї й тій же області даних у той саме час (одночасний доступ) [10].

• Вхідні дані — це інформація, передана системі (звичайно з термінала або робочої станції). Така інформація може стати причиною змін у постійних даних (вона може стати частиною постійних даних), але не є частиною бази даних як такої.

• Вихідні дані — це повідомлення й результати, видавані системою (звичайно видаються на печатку або відображаються на екрані). І знову ж цю інформацію можна брати з постійних даних, але її не можна розглядати як частину бази даних.

Розходження між постійними й транзитними даними не можна назвати чітким - воно в деякій мері залежить від контексту (наприклад, від того, як використовуються дані). Однак допускаючи, що це розходження доступно принаймні на інтуїтивному рівні, можна дати більше точне визначення терміна "база даних":

Переваги системи баз даних у порівнянні із традиційним паперовим методом змісту записів наступні.

• Компактність. Немає необхідності в багатотомних паперових картотеках.

• Швидкість. Комп'ютер може вести пошук і змінювати дані набагато швидше людини. Зокрема, на спеціальні питання, що виникають у процесі роботи (наприклад: "Яких труб в нас зараз більше – ВТ-12 або ВТ-15?"), можна одержати відповідь швидко, не затрачаючи часу на візуальний пошук.

• Низькі трудовитрати. Немає необхідності в стомлюючій ручній роботі над картотекою. Механічну роботу машини завжди виконують краще.

• Застосовність. Точна, свіжа інформація в будь-який момент під рукою.

Ці переваги здобувають ще більше значення в багатокористувальницькому середовищі, де база даних, імовірно, більше й складніше однокористувальницької. Крім того, багатокористувальницьке середовище має додаткову перевагу: система баз даних надає об'єкту централізоване управління його даними (а таке управління є найціннішою властивістю бази даних). Уявіть собі протилежну ситуацію – об'єкт, що не використовує систему баз даних: для кожного

окремого додатка створюються свої файли, найчастіше розташовувані на окремих магнітних стрічках або дисках, у результаті чого дані виявляються розрізненими. Систематично управляти такими даними дуже складно[10].

 

Питання для самоперевірки

 

1. Предметна область і бази даних.

2. Роль баз даних в процесі формування інформаційних ресурсів, в тому числі для цілей управління територіями.

3. Класифікація інформаційних систем.

4. Використання ГІС в гідромеліорації.

5. Експертні системи для обробки даних.

 

Моделі даних

Види моделей даних

 

На великих ЕОМ сімдесятих років програмісти прагнули з максимальною ефективністю використовувати машинний час і пам'ять. Тому широке поширення одержав ієрархічний підхід до організації баз даних. Ієрархічні бази даних організовуються у вигляді дерев, що припускає нерівноправність між даними – одні дані виявляються жорстко підлеглі іншим. Така організація даних нагадує деякі схеми побудови баз знань в експертних системах і забезпечує високоефективний пошук інформації. Але ієрархічний підхід до організації баз даних має й очевидні недоліки, наприклад, необхідність жорстко визначати зв'язок між даними, що істотно ускладнює організацію інформації. Щоб перебороти подібні недоліки була запропонована мережна модель даних, у якій крім вертикальних зв'язків між даними, передбачалися й горизонтальні. Прикладом реалізації такої моделі може служити система директорій (фолдерів), що дозволяє організувати інформацію на жорсткому диску персонального комп'ютера. Але й ця модель вимагає досить більших зусиль при організації інформації.

Дані в базі даних називають "постійними" (хоча насправді вони можуть недовго залишатися такими!). Під словом "постійні" маються на увазі дані, які відрізняються від інших, більше мінливих даних, таких як проміжні результати, вхідні й вихідні дані, оператори управління робочі черги, програмні блоки управління й взагалі всі транзитні дані.

Поєднуючи частки подання про вміст бази даних, отримані в результаті опитування користувачів, і свої подання про дані, які можуть знадобитися в майбутніх додатках, АБД спочатку створює узагальнений неформальний опис створюваної бази даних. Це опис, виконаний з використанням природної мови, математичних формул, таблиць, графіків і інших засобів, зрозумілих всім людям, що працюють над проектуванням бази даних, називають інфологіченою моделлю даних.

Така людино-орієнтована модель повністю незалежна від фізичних параметрів середовища зберігання даних. Зрештою цим середовищем може бути пам'ять людини, а не ЕОМ. Тому інфологічна модель не повинна змінюватися доти, поки якісь зміни в реальному світі не зажадають зміни в ній деякого визначення, щоб ця модель продовжувала відбивати предметну область.

Інші моделі є комп'ютеро-орієнтованими. З їхньою допомогою СУБД дає можливість програмам і користувачам здійснювати доступ до збережених даних лише за їхними іменами, не піклуючись про фізичне розташування цих даних. Потрібні дані відшукуються СУБД на зовнішніх запам'ятовувальних пристроях по фізичній моделі даних.

Тому що зазначений доступ здійснюється за допомогою конкретної СУБД, то моделі повинні бути описані мовою опису даних цієї СУБД. Такий опис, створюваний АБД за інфологічною моделі даних, називають даталогічною моделлю даних.

Трьохрівнева архітектура (інфологічний, даталогічний і фізичний рівні) дозволяє забезпечити незалежність збережених даних від їхніх програм, що використовують. АБД може при необхідності переписати збережені дані на інші носії інформації й (або) реорганізувати їхню фізичну структуру, змінивши лише фізичну модель даних. АБД може підключити до системи будь-яке число нових користувачів (нових додатків), доповнивши, якщо треба, даталогічну модель. Зазначені зміни фізичної й даталогіної моделей не будуть замічені існуючими користувачами системи (виявляться "прозорими" для них), так само як не будуть замічені й нові користувачі. Отже, незалежність даних забезпечує можливість розвитку системи баз даних без руйнування існуючих додатків.

Інфологічна модель відображає реальний мир у деякі зрозумілі людині концепції, повністю незалежні від параметрів середовища зберігання даних. Існує безліч підходів до побудови таких моделей: графовые моделі, семантичні мережі, модель " сутність-зв'язок" і т.д. Найбільш популярної з них виявилася модель " сутність-зв'язок".

Інфологічна модель повинна бути відображена в комп'ютеро-орієнтовану даталогічну модель, "зрозумілу" СУБД. У процесі розвитку теорії й практичного використання баз даних, а також засобів обчислювальної техніки створювалися СУБД, що підтримують різні даталогічні моделі.

Спочатку стали використовувати ієрархічні даталогічні моделі. Простота організації, наявність заздалегідь заданих зв'язків між сутностями, подібність із фізичними моделями даних дозволяли домагатися прийнятної продуктивності ієрархічних СУБД на повільних ЕОМ з досить обмеженими обсягами пам'яті. Але, якщо дані не мали деревоподібної структури, то виникала маса складностей при побудові ієрархічної моделі й бажанні домогтися потрібної продуктивності.

Мережні моделі також створювалися для мало ресурсних ЕОМ. Це досить складні структури, що складаються з "наборів" - пойменованих дворівневих дерев. "Набори" з'єднуються за допомогою " записів-зв'язувань", створюючи ланцюжки й т.д. При розробці мережних моделей було вигадане безліч "маленьких хитростей", що дозволяють збільшити продуктивність СУБД, але істотно ускладнили останні. Прикладний програміст повинен знати масу термінів, вивчити кілька внутрішніх мов СУБД, детально представляти логічну структуру бази даних для здійснення навігації серед різних екземплярів, наборів, записів і т.п. Один з розроблювачів операційної системи UNIX сказав "Мережна база - це самий вірний спосіб втратити дані".

Складність практичного використання ієрархічних і мережних СУБД змушувала шукати інші способи подання даних. Наприкінці 60-х років з'явилися СУБД на основі інвертованих файлів, що відрізняються простотою організації й наявністю досить зручних мов маніпулювання даними. Однак такі СУБД володіють рядом обмежень на кількість файлів для зберігання даних, кількість зв'язків між ними, довжину запису й кількість її полів.

Фізична організація даних впливає на експлуатаційні характеристики БД. Розроблювачі СУБД намагаються створити найбільш продуктивні фізичні моделі даних, пропонуючи користувачам той або інший інструментарій для поднастройки моделі під конкретну БД. Розмаїтість способів коректування фізичних моделей сучасних промислових СУБД не дозволяє розглянути їх у цьому розділі.

Реляційні бази даних

Недоліків великої кількості покажчиків можна уникнути використовуючи ще одну структуру баз даних - реляційну. В ній дані зберігаються як упорядковані записи або рядки значень атрибутів. Атрибути об'єктів групуються в окремих рядках у виді так званих відносин, оскільки вони зберігають свої положення в кожнім рядку і виразно зв'язані один з одним [Pr.G. Неаlеу, 1991]. Кожний стовпчик містить значення одного атрибута для всього набору об'єктів.

Реляційні системи засновані на наборі математичних принципів, називаних реляційною алгеброю або алгеброю відносин [J.D. Ullman, 1982], що встановлює правила проектування і функціонування таких систем. Оскільки реляційна алгебра ґрунтується на теорії множин, кожна таблиця відносин функціонує як безліч, і перше правило говорить, що таблиця не може мати рядок, що цілком збігається з яким-небудь іншим рядком. Оскільки кожний з рядків унікальний, одна або трохи колонок можуть використовуватися для визначення критерію пошуку, визначеного імені з першого стовпчика. Такий критерій пошуку називається первинним ключем для пошуку значень в інших колонках бази даних [11].

Реляційні системи коштовні тим, що дозволяють нам збирати дані в досить прості таблиці, при цьому задачі організації даних також прості. При необхідності ми можемо стикувати рядка з однієї таблиці з відповідними рядками з іншої таблиці, використовуючи сполучний механізм, називаний реляційним з'єднанням. Будь-яка кількість таблиць може бути "зв'язана". З'єднання відбувається по рівності значень стовпчика первинного ключа однієї таблиці з іншим стовпчиком другої таблиці. Стовпчик другої таблиці, з яким зв'язаний первинний ключ, називається зовнішнім ключем.

Для визначення виду, який таблиці повинні мати, встановлений набір правил, називаних нормальними формами [E.F. Соdd, 1970]. Перша нормальна форма затверджує, що таблиця повинна складатися з рядків і стовпчиків і, оскільки стовпчики будуть використовуватися як ключі пошуку, у кожній з них на кожнім рядку повинне знаходитися тільки одне значення. Друга нормальна форма вимагає, щоб кожен стовпчик, що не є первинним ключем, цілком залежав від первинного ключа. Це спрощує таблиці і зменшує надмірність обмеженням, що кожен рядок даних може бути знайдений тільки через його первинний ключ. Третя нормальна форма, зв'язана з другою, вимагає, щоб стовпчики, що не є первинним ключем, "залежали" від первинного ключа, у той час, як первинний ключ не залежить від якого-небудь не первинного ключа. Правила нормальних форм були підсумовані Кентом [W. Кеnt, 1983]. Ці правила досить корисні і повинні строго виконуватися.

 

Питання для самоперевірки

 

1. Типи моделей даних.

2. Основні характеристики і можливості застосування ієрархічної, мережевої й реляційної моделей даних.

3. Особливості багатошарових моделей ГІС.

4. Введення, збереження та редагування БД ГІС.

5. Структури баз даних для управління даними.

 

Введення даних в ГІС. У випадку ГІС одна тільки побудова бази даних часто займає три чверті часу. У комерційних додатках це означає, що три чверті вартості системи також піде на цю операцію і редагування. Є багато способів уведення даних. Одні виглядають примітивними, начебто приміщення прозорої сітки на карту. Інші - більш сучасні, тому що використовують пристрою цифрового введення — дигітайзери і сканери.

 

Питання для самоперевірки

 

1. Підходи до проектування реляційних баз даних.

2. Методи і моделі, за допомогою яких виконується опис и структуруються різноманітні предметові середовища.

3. Класична методологія проектування баз даних.

4. Етапи проектування баз даних.

5. Реляційні бази даних, їх характеристика.

 

 

Відображення

 

Відображення концептуальний-внутрішній визначає відповідність між концептуальним поданням і збереженою базою даних, тобто як концептуальні записи й поля представлені на внутрішньому рівні. При зміні структури збереженої бази даних, тобто при внесенні змін у визначення структури зберігання, змінюється й відображення концептуальний-внутрішній таким чином, щоб концептуальна схема залишилася незмінною. Інакше кажучи, щоб зберегти незалежність даних, результати таких змін не повинні торкнутися концептуального рівня.

Відображення зовнішній-концептуальний визначає відповідність між деяким зовнішнім поданням і концептуальним поданням. Загалом, розходження, які можуть існувати між цими двома рівнями, подібні до розходжень між концептуальним поданням і збереженою базою даних.

Між іншим, більшість систем дозволяє виражати визначення одного зовнішнього подання через інше (тобто за допомогою відображення зовнішній-зовнішній) не вимагаючи обов'язково явно визначати відображення на концептуальний рівень. Ця можливість корисна, якщо кілька подань схожі між собою. Зокрема, ця можливість є в багатьох реляційних системах.

Первинний ключ - це унікальний ідентифікатор для таблиці, тобто стовпець або така комбінація стовпців, що в будь-який момент часу не існує двох рядків, що містять однакове значення в цьому стовпці або комбінації стовпців.

 І нарешті, домен - це загальна сукупність значень, з якої беруться справжні значення для певних атрибутів певного відношення [10]

Домени насамперед мають концептуальну природу. Вони можуть бути або не бути явно збережені в базі даних як реальні набори значень; фактично в більшості випадків вони не зберігаються. Але вони повинні бути, принаймні, визначені в рамках визначень бази даних і тоді кожне визначення атрибута повинне включати посилання на відповідний домен, у такий спосіб системі буде відомо, які атрибути можна порівнювати, а які - немає.

Щоб конкретизувати ідеї реляційної моделі використовується гіпотетично реляційна мова для ілюстрації цих ідей. Ясно, що в першу чергу потрібний спосіб створення нового домена:

CREATE DOMAIN domain data-type;

Тут domain— це ім'я нового домена, a data-type відповідає типу даних [10].

4.4 Інфологічна модель даних " Сутність-Зв'язок"

Основні поняття

Мета інфологічного моделювання - забезпечення найбільш природних для людини способів збору й подання тої інформації, що передбачається зберігати в створюваній базі даних. Тому інфологічна модель даних намагаються будувати за аналогією із природною мовою (остання не може бути використаний у чистому виді через складність комп'ютерної обробки текстів і неоднозначності будь-якої природної мови). Основними конструктивними елементами інфологічних моделей є сутності, зв'язки між ними і їхньої властивості (атрибути).

Сутність – будь-який помітний об'єкт (об'єкт, що ми можемо відрізнити від іншого), інформацію про яке необхідно зберігати в базі даних. Сутностями можуть бути люди, місця, літаки, рейси, смак, колір і т.д. Необхідно розрізняти такі поняття, як тип сутності й екземпляр сутності. Поняття тип сутності ставиться до набору однорідних особистостей, предметів, подій або ідей, що виступають як ціле. Екземпляр сутності ставиться до конкретної речі в наборі. Наприклад, типом сутності може бути МІСТО, а екземпляром - Херсон, Київ і т.д.

Атрибут – пойменована характеристика сутності. Його найменування повинне бути унікальним для конкретного типу сутності, але може бути однаковим для різного типу сутностей. Атрибути використовуються для визначення того, яка інформація повинна бути зібрана про сутність. Абсолютне розходження між типами сутностей і атрибутами відсутній. Атрибут є таким тільки у зв'язку з типом сутності. В іншому контексті атрибут може виступати як самостійна сутність.

Ключ – мінімальний набір атрибутів, за значеннями яких можна однозначно знайти необхідний екземпляр сутності. Мінімальність означає, що виключення з набору будь-якого атрибута не дозволяє ідентифікувати сутність по тому що залишилися.

Зв'язок – асоціювання двох або більше сутностей. Якби призначенням бази даних було тільки зберігання окремих, не зв'язаних між собою даних, то її структура могла б бути дуже простою. Однак одне з основних вимог до організації бази даних - це забезпечення можливості відшукання одних сутностей за значеннями інших, для чого необхідно встановити між ними певні зв'язки. А тому що в реальних базах даних нерідко втримуються сотні або навіть тисяча сутностей, те теоретично між ними може бути встановлене більше мільйона зв'язків. Наявність такої безлічі зв'язків і визначає складність інфологічних моделей.

Існують три основні класи сутностей: стрижневий, асоціативний й характеристичний, а також підклас асоціативних сутностей – позначення.

Стрижнева сутність (стрижень) – це незалежна сутність (трохи докладніше вона буде визначена нижче).

Асоціативна сутність (асоціація) – це зв'язок виду " багато-до-багатьох" ("- до-багатьох" і т.д.) між двома або більше сутностями або екземплярами сутності. Асоціації розглядаються як повноправні сутності:

- вони можуть брати участь в інших асоціаціях і позначеннях точно так само, як стрижневі сутності;

- можуть мати властивості, тобто мати не тільки набір ключових атрибутів, необхідних для вказівки зв'язків, але й будь-яке число інших атрибутів, що характеризують зв'язок.

Характеристична сутність (характеристика) – це зв'язок виду " багато -до-однієї" або " одна-до-однієї" між двома сутностями. Єдина мета характеристики в рамках розглянутої предметної області складається в описі або уточненні деякої іншої сутності. Необхідність у них виникає у зв'язку з тим, що сутності реального миру мають іноді багатозначні властивості [22].

Первинні й зовнішні ключі

Нагадаємо, що ключ або можливий ключ – це мінімальний набір атрибутів, за значеннями яких можна однозначно знайти необхідний екземпляр сутності. Мінімальність означає, що виключення з набору будь-якого атрибута не дозволяє ідентифікувати сутність по тому що залишилися. Кожна сутність володіє хоча б одним можливим ключем. Один з них приймається за первинний ключ. При виборі первинного ключа варто віддавати перевагу нескладовим ключам або ключам, складеним з мінімального числа атрибутів. Недоцільно також використовувати ключі з довгими текстовими значеннями. Також необхідно забезпечити унікальність первинного ключа.

Зовнішні ключі:

· Якщо сутність У зв'язує сутності А та В, то вона повинна включати зовнішні ключі, що відповідають первинним ключам сутностей А та В.

· Якщо сутність У позначає сутність А, то вона повинна включати зовнішній ключ, що відповідає первинному ключу сутності А. [23]/

У будь-якій таблиці, як правило, хоча б одне поле є ключовим. Завдяки ключовим полям будь-який запит до бази даних може бути оформлений у вигляді операцій з таблицями і їхніми полями (атрибутами), але не з їхніми рядками. Крім того, ключові поля використовуються для підтримки цілісності реляційної бази даних. Таблиця може мати тільки один унікальний ідентифікатор, називаний первинним ключем ( primary key ) і трохи вторинних (зовнішніх) ключів (foreign key), що посилаються на первинні ключі інших таблиць.При цьому зовнішні ключові поля таблиці, повинні мати одне зі значень, певне для первинних ключів.

Назва полів у допоміжній таблиці можуть і не збігатися з назвами первинних ключів, але тип даних і розмір цих полів повинні збігатися обов'язково. Забезпечення цілісності даних досягається при встановленні двох перемикачів у меню СУБД Access – «Каскадне відновлення зв'язаних полів» і «Каскадне видалення зв'язаних полів»[11].

Нормалізація відносин

 

Ті самі дані можуть групуватися в таблиці (відносини) різними способами, тобто можлива організація різних наборів відносин взаємозалежних інформаційних об'єктів. Угруповання атрибутів у відносинах повинне бути раціональним, тобто мінімізуючим дублювання даних і процедури, що спрощує, їхню обробку й відновлення.

Певний набір відносин має кращі властивості при включенні, модифікації, видаленні даних, чим всі інші можливі набори відносин, якщо він відповідає вимогам нормалізації відносин.

Нормалізація відносин — формальний апарат обмежень на формування відносин (таблиць), що дозволяє усунути дублювання, забезпечує несуперечність збережених у базі даних, зменшує працевитрати на ведення (уведення, коректування) бази даних.

Виділено три нормальні форми відносин і запропонований механізм, що дозволяє будь-яке відношення перетворити до третього (самої зробленої) нормальній формі.

Перша нормальна форма.

Відношення називається нормалізованим або наведеним до першої нормальної форми, якщо всі його атрибути прості (неподільні). Перетворення відносини до першої нормальної форми може привести до збільшення кількості реквізитів (полів) відносини й зміні ключа.

Друга нормальна форма.

Щоб розглянути питання приведення відносин до другої нормальної форми, необхідно дати пояснення до таких понять, як функціональна залежність і повна функціональна залежність.

Описові реквізити інформаційного об'єкта логічно пов'язані із загальним для них ключем, цей зв'язок носить характер функціональної залежності реквізитів.

Функціональна залежність реквізитів — залежність, при якій екземплярі інформаційного об'єкта певному значенню ключового реквізиту відповідає тільки одне значення описового реквізиту.

Таке визначення функціональної залежності дозволяє при аналізі всіх взаємозв'язків реквізитів предметної області виділити самостійні інформаційні об'єкти.

У випадку складеного ключа вводиться поняття функціонально повної залежності.

Функціонально повна залежність не ключових атрибутів полягає в тім, що кожний не ключовий атрибут функціонально залежить від ключа, але не перебуває у функціональній залежності ні від якої частини складеного ключа.

Відношення буде перебувати в другій нормальній формі, якщо воно перебуває в першій нормальній формі, і кожний не ключовий атрибут функціонально повно залежить від складеного ключа.

Третя нормальна форма.

Поняття третьої нормальної форми ґрунтується на понятті нетранзитивної залежності.



Поделиться:


Последнее изменение этой страницы: 2019-05-20; просмотров: 194; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.227.24.209 (0.118 с.)