Структура і технологія наповнення 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Структура і технологія наповнення



 

Структуру і склад інформаційної бази на різних рангах інтеграції даних з визначенням методів фіксації показників та форм представлення інформації обгрунтовано на основі сформованих систем вимог і концептуальних моделей організації даних у різних функціональних модулях ПІК об'єкту, які дають можливість створення адекватної інформаційної моделі території досліджень.

При цьому системну організацію тематичної інформації здійснюють, як було зазначено вище, з урахуванням адресних вимог бази знань і бази даних.

База знань формується як сукупність знань для обгрунтування та оптимізації прийняття рішень. Концептуальна модель організації даних у її межах передбачає диференціацію інформації з видокремленням нормативно-регламентуючої бази (НРБ) і системи загальнодовідкових даних, що забезпечує вибір параметрів на стадії ідентифікації об'єктів.

Нормативно-регламентуюча база. Одним із перших етапів створення бази знань є розробка нормативно-регламентуючої бази з системою кодифікації та відповідними експертними системами, що забезпечують вибір оптимальних умов вирощування тієї чи іншої сільгоспкультури, визначення складу і параметрів технологічних операцій рослинництва.

У її основу покладено структуризацію даних у середині кожного з тематичних та системних модулів ПС-1, ПС-2, ПС-3 з використанням класифікаційних схем як засобів описування вміщеної у них інформації.

Основою формування інформаційної бази при вирішенні завдань просторового оцінювання має бути територіально-галузева інформаційна база та природно-ресурсний паспорт об'єкта, який вміщує елементи інформаційно-довідкової і геоінформаційної баз даних[8].

Вихідною інформацією для побудови територіально-галузевої бази що­до природно-ресурсної основи регіону слугують матеріали:

• комплексних гідрогеологічних та інженерно-геологічних зйомок для цілей меліорації (М 1:50000-1:200000), виконаних організаціями Державного комітету природних ресурсів України;

• вишукувальних підрозділів і організацій Держводгоспу, Мінагрополітики, Держкомзему, з вивчення кліматичних, гідрогеологічних, ґрунтових, грунтово-меліоративних, інженерно-геологічних та екологічних умов зрошуваних і прилеглих до них земель (М 1:10000-1:200000);

• гідрогеолого-меліоративної і водогосподарської служб Держводгоспу України з вивчення меліоративного й еколого-меліоративного стану земель, технічного стану зрошувальних систем і водогосподарських об'єктів, стану діючих агроіригаційних навантажень і режимів експлуатації (М 1:10000-1:100000); оперативна та довгострокова інформація мережі моніторингового контролю й спеціального випробування;

• спеціальних (у тому числі експериментальних) досліджень впливу зрошення на природні комплекси, зокрема на стан і еволюцію грунтів, що виконані різними науковими установами країни;

• великомасштабних суцільних ґрунтових і агрохімічних обстежень, спеціального випробування ґрунтів (вміст поживних речовин і забруднювальних елементів, вологозапаси, мінливість продуктивності грунтів);

• космічних досліджень, аерофотозйомок, геофізичного зондування тощо;

• топооснови, плани землекористування тощо (М 1:2000-1:200000).

Створення регіональних баз знань, локальних інформаційно-довідкових і відповідно геоінформаційних баз даних здійснюється в автономному режимі для різних рівнів функціональних завдань на основі єдиних концептуальних моделей організації і структуризації інформації в рамках ПІК.[8]

Концептуальне подання — це подання всієї інформації бази даних у трохи більш абстрактній формі у порівнянні з фізичним способом зберігання даних. Однак концептуальне подання істотно відрізняється від способу подання даних якому-небудь окремому користувачеві. Загалом кажучи, концептуальне подання - це подання даних такими, які "вони є насправді", а не такими, якими змушений їх бачити користувач у рамках, наприклад, певного мови або використовуваного апаратного забезпечення.

Концептуальне подання складається з безлічі екземплярів кожного типу концептуального запису. Концептуальний запис зовсім не обов'язково повинна збігатися із зовнішнім записом, з одного боку, і зі збереженим записом - з іншої.

Концептуальне подання визначається за допомогою концептуальної схеми, що включає визначення кожного типу концептуальних записів.

Концептуальна схема використовує іншу мову визначення даних — концептуальну. Щоб домогтися незалежності даних, не можна включати у визначення концептуальної мови будь-який розгляд структури зберігання або методу доступу. Визначення концептуальної мови повинні ставитися тільки до змісту інформації. Це означає, що в концептуальній схемі не повинно бути ніякого згадування про подання збереженого файлу, послідовності збережених записів, індексуванні, хеш-адресації, покажчиках або інших подробицях зберігання або доступу. Якщо концептуальна схема дійсно забезпечує незалежність даних у цьому змісті, то зовнішні схеми, певні на основі концептуальної, свідомо будуть забезпечувати незалежність даних.

Концептуальне подання — це подання всього вмісту бази даних, а концептуальна схема — це визначення такого подання. Однак сьогоднішня система реально не підтримує такого концептуального рівня, що хоча б небагато наблизився до цього ступеня розвиненості; у більшості існуючих систем "концептуальна схема" у дійсності являє собою трохи більше, ніж просте об'єднання всіх окремих зовнішніх схем з додатковими засобами безпеки й правилами забезпечення цілісності [10].

 

Відображення

 

Відображення концептуальний-внутрішній визначає відповідність між концептуальним поданням і збереженою базою даних, тобто як концептуальні записи й поля представлені на внутрішньому рівні. При зміні структури збереженої бази даних, тобто при внесенні змін у визначення структури зберігання, змінюється й відображення концептуальний-внутрішній таким чином, щоб концептуальна схема залишилася незмінною. Інакше кажучи, щоб зберегти незалежність даних, результати таких змін не повинні торкнутися концептуального рівня.

Відображення зовнішній-концептуальний визначає відповідність між деяким зовнішнім поданням і концептуальним поданням. Загалом, розходження, які можуть існувати між цими двома рівнями, подібні до розходжень між концептуальним поданням і збереженою базою даних.

Між іншим, більшість систем дозволяє виражати визначення одного зовнішнього подання через інше (тобто за допомогою відображення зовнішній-зовнішній) не вимагаючи обов'язково явно визначати відображення на концептуальний рівень. Ця можливість корисна, якщо кілька подань схожі між собою. Зокрема, ця можливість є в багатьох реляційних системах.

Первинний ключ - це унікальний ідентифікатор для таблиці, тобто стовпець або така комбінація стовпців, що в будь-який момент часу не існує двох рядків, що містять однакове значення в цьому стовпці або комбінації стовпців.

 І нарешті, домен - це загальна сукупність значень, з якої беруться справжні значення для певних атрибутів певного відношення [10]

Домени насамперед мають концептуальну природу. Вони можуть бути або не бути явно збережені в базі даних як реальні набори значень; фактично в більшості випадків вони не зберігаються. Але вони повинні бути, принаймні, визначені в рамках визначень бази даних і тоді кожне визначення атрибута повинне включати посилання на відповідний домен, у такий спосіб системі буде відомо, які атрибути можна порівнювати, а які - немає.

Щоб конкретизувати ідеї реляційної моделі використовується гіпотетично реляційна мова для ілюстрації цих ідей. Ясно, що в першу чергу потрібний спосіб створення нового домена:

CREATE DOMAIN domain data-type;

Тут domain— це ім'я нового домена, a data-type відповідає типу даних [10].

4.4 Інфологічна модель даних " Сутність-Зв'язок"

Основні поняття

Мета інфологічного моделювання - забезпечення найбільш природних для людини способів збору й подання тої інформації, що передбачається зберігати в створюваній базі даних. Тому інфологічна модель даних намагаються будувати за аналогією із природною мовою (остання не може бути використаний у чистому виді через складність комп'ютерної обробки текстів і неоднозначності будь-якої природної мови). Основними конструктивними елементами інфологічних моделей є сутності, зв'язки між ними і їхньої властивості (атрибути).

Сутність – будь-який помітний об'єкт (об'єкт, що ми можемо відрізнити від іншого), інформацію про яке необхідно зберігати в базі даних. Сутностями можуть бути люди, місця, літаки, рейси, смак, колір і т.д. Необхідно розрізняти такі поняття, як тип сутності й екземпляр сутності. Поняття тип сутності ставиться до набору однорідних особистостей, предметів, подій або ідей, що виступають як ціле. Екземпляр сутності ставиться до конкретної речі в наборі. Наприклад, типом сутності може бути МІСТО, а екземпляром - Херсон, Київ і т.д.

Атрибут – пойменована характеристика сутності. Його найменування повинне бути унікальним для конкретного типу сутності, але може бути однаковим для різного типу сутностей. Атрибути використовуються для визначення того, яка інформація повинна бути зібрана про сутність. Абсолютне розходження між типами сутностей і атрибутами відсутній. Атрибут є таким тільки у зв'язку з типом сутності. В іншому контексті атрибут може виступати як самостійна сутність.

Ключ – мінімальний набір атрибутів, за значеннями яких можна однозначно знайти необхідний екземпляр сутності. Мінімальність означає, що виключення з набору будь-якого атрибута не дозволяє ідентифікувати сутність по тому що залишилися.

Зв'язок – асоціювання двох або більше сутностей. Якби призначенням бази даних було тільки зберігання окремих, не зв'язаних між собою даних, то її структура могла б бути дуже простою. Однак одне з основних вимог до організації бази даних - це забезпечення можливості відшукання одних сутностей за значеннями інших, для чого необхідно встановити між ними певні зв'язки. А тому що в реальних базах даних нерідко втримуються сотні або навіть тисяча сутностей, те теоретично між ними може бути встановлене більше мільйона зв'язків. Наявність такої безлічі зв'язків і визначає складність інфологічних моделей.

Існують три основні класи сутностей: стрижневий, асоціативний й характеристичний, а також підклас асоціативних сутностей – позначення.

Стрижнева сутність (стрижень) – це незалежна сутність (трохи докладніше вона буде визначена нижче).

Асоціативна сутність (асоціація) – це зв'язок виду " багато-до-багатьох" ("- до-багатьох" і т.д.) між двома або більше сутностями або екземплярами сутності. Асоціації розглядаються як повноправні сутності:

- вони можуть брати участь в інших асоціаціях і позначеннях точно так само, як стрижневі сутності;

- можуть мати властивості, тобто мати не тільки набір ключових атрибутів, необхідних для вказівки зв'язків, але й будь-яке число інших атрибутів, що характеризують зв'язок.

Характеристична сутність (характеристика) – це зв'язок виду " багато -до-однієї" або " одна-до-однієї" між двома сутностями. Єдина мета характеристики в рамках розглянутої предметної області складається в описі або уточненні деякої іншої сутності. Необхідність у них виникає у зв'язку з тим, що сутності реального миру мають іноді багатозначні властивості [22].

Первинні й зовнішні ключі

Нагадаємо, що ключ або можливий ключ – це мінімальний набір атрибутів, за значеннями яких можна однозначно знайти необхідний екземпляр сутності. Мінімальність означає, що виключення з набору будь-якого атрибута не дозволяє ідентифікувати сутність по тому що залишилися. Кожна сутність володіє хоча б одним можливим ключем. Один з них приймається за первинний ключ. При виборі первинного ключа варто віддавати перевагу нескладовим ключам або ключам, складеним з мінімального числа атрибутів. Недоцільно також використовувати ключі з довгими текстовими значеннями. Також необхідно забезпечити унікальність первинного ключа.

Зовнішні ключі:

· Якщо сутність У зв'язує сутності А та В, то вона повинна включати зовнішні ключі, що відповідають первинним ключам сутностей А та В.

· Якщо сутність У позначає сутність А, то вона повинна включати зовнішній ключ, що відповідає первинному ключу сутності А. [23]/

У будь-якій таблиці, як правило, хоча б одне поле є ключовим. Завдяки ключовим полям будь-який запит до бази даних може бути оформлений у вигляді операцій з таблицями і їхніми полями (атрибутами), але не з їхніми рядками. Крім того, ключові поля використовуються для підтримки цілісності реляційної бази даних. Таблиця може мати тільки один унікальний ідентифікатор, називаний первинним ключем ( primary key ) і трохи вторинних (зовнішніх) ключів (foreign key), що посилаються на первинні ключі інших таблиць.При цьому зовнішні ключові поля таблиці, повинні мати одне зі значень, певне для первинних ключів.

Назва полів у допоміжній таблиці можуть і не збігатися з назвами первинних ключів, але тип даних і розмір цих полів повинні збігатися обов'язково. Забезпечення цілісності даних досягається при встановленні двох перемикачів у меню СУБД Access – «Каскадне відновлення зв'язаних полів» і «Каскадне видалення зв'язаних полів»[11].

Нормалізація відносин

 

Ті самі дані можуть групуватися в таблиці (відносини) різними способами, тобто можлива організація різних наборів відносин взаємозалежних інформаційних об'єктів. Угруповання атрибутів у відносинах повинне бути раціональним, тобто мінімізуючим дублювання даних і процедури, що спрощує, їхню обробку й відновлення.

Певний набір відносин має кращі властивості при включенні, модифікації, видаленні даних, чим всі інші можливі набори відносин, якщо він відповідає вимогам нормалізації відносин.

Нормалізація відносин — формальний апарат обмежень на формування відносин (таблиць), що дозволяє усунути дублювання, забезпечує несуперечність збережених у базі даних, зменшує працевитрати на ведення (уведення, коректування) бази даних.

Виділено три нормальні форми відносин і запропонований механізм, що дозволяє будь-яке відношення перетворити до третього (самої зробленої) нормальній формі.

Перша нормальна форма.

Відношення називається нормалізованим або наведеним до першої нормальної форми, якщо всі його атрибути прості (неподільні). Перетворення відносини до першої нормальної форми може привести до збільшення кількості реквізитів (полів) відносини й зміні ключа.

Друга нормальна форма.

Щоб розглянути питання приведення відносин до другої нормальної форми, необхідно дати пояснення до таких понять, як функціональна залежність і повна функціональна залежність.

Описові реквізити інформаційного об'єкта логічно пов'язані із загальним для них ключем, цей зв'язок носить характер функціональної залежності реквізитів.

Функціональна залежність реквізитів — залежність, при якій екземплярі інформаційного об'єкта певному значенню ключового реквізиту відповідає тільки одне значення описового реквізиту.

Таке визначення функціональної залежності дозволяє при аналізі всіх взаємозв'язків реквізитів предметної області виділити самостійні інформаційні об'єкти.

У випадку складеного ключа вводиться поняття функціонально повної залежності.

Функціонально повна залежність не ключових атрибутів полягає в тім, що кожний не ключовий атрибут функціонально залежить від ключа, але не перебуває у функціональній залежності ні від якої частини складеного ключа.

Відношення буде перебувати в другій нормальній формі, якщо воно перебуває в першій нормальній формі, і кожний не ключовий атрибут функціонально повно залежить від складеного ключа.

Третя нормальна форма.

Поняття третьої нормальної форми ґрунтується на понятті нетранзитивної залежності.

Транзитивна залежність спостерігається в тому випадку, якщо один із двох описових реквізитів залежить від ключа, а інший описовий реквізит залежить від першого описового реквізиту.

Відношення буде перебувати в третій нормальній формі, якщо воно перебуває в другій нормальній формі, і кожний неключовий атрибут нетранзитивно залежить від первинного ключа.

Для усунення транзитивної залежності описових реквізитів необхідно провести "розщеплення" вихідного інформаційного об'єкта. У результаті розщеплення частина реквізитів віддаляється з вихідного інформаційного об'єкта й включається до складу інших (можливо, знову створених) інформаційних об'єктів.

Типи зв'язків:

Всі інформаційні об'єкти предметної області зв'язані між собою. Розрізняються зв'язки декількох типів, для яких уведені наступні позначення:

· один до одного (1:1);

· один до багатьох (1: М);

· багато до багатьох (М: М).

Зв'язок один до одного (1:1) допускає, що в кожний момент часу одному екземпляру інформаційного об'єкта А відповідає не більше одного екземпляра інформаційного об'єкта В й навпаки.

При зв'язку один до багатьох (1:М) одного екземпляра інформаційного об'єкта А відповідає 0, 1 або більше екземплярів об'єкта В, але кожний екземпляр об'єкта У зв'язаний не більш ніж з 1 екземпляром об'єкта А.

Зв'язок багато до багатьох (М:М) допускає, що в кожний момент часу одному екземпляру інформаційного об'єкта А відповідає 0, 1 або більше екземплярів об'єкта В й навпаки [25].

 

Питання для самоперевірки

 

1. Два підходи до моделювання предметної області.

2. Технологія аналізу предметної області.

3. Поняття сутностей, їх атрибутів, зв’язків між ними.

4. Поняття первинних та зовнішніх ключів.

5. Поняття нормальні форми.

 

 



Поделиться:


Последнее изменение этой страницы: 2019-05-20; просмотров: 267; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.137.220.120 (0.048 с.)