Загальні відомості про базу даних,геоінформаційні системи і їх використання в професійній сфері 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Загальні відомості про базу даних,геоінформаційні системи і їх використання в професійній сфері



Поняття бази даних

Зауважимо, що в літературних джерелах існує багато описів поняття бази даних, що зовні значно відрізняються один від одного, акцентуючи увагу на тій чи іншій рисі об'єкта опису, але по своїй суті вони достатньо близькі.

База даних (БД) - це сукупність взаємозв'язаних даних, що зберігаються разом.Основними та невід'ємними властивостями БД є такі:

- для даних допускається така мінімальна надлишковість, яка сприяє їх оптимальному використанню в одному чи кількох застосуваннях;

- незалежність даних від програм;

- для пошуку та модифікації даних використовуються спільні механізми;

- як правило, у складі БД існують засоби для підтримки її цілісності та захисту від неавторизованого доступу

Прокоментуємо додатково підкреслені слова та вирази у вищенаведеному описі, порівнюючи в основному з близьким попередником БД - файловими системами (ФС).

На відміну від файлових систем БД зорієнтована для підтримки даних для кількох застосувань. На практиці ця властивість інколи порушується. Часом таке порушення можна пояснити тим, що проект вводиться в дію поетапно, і у певний момент дійсно функціонує тільки одне застосування. Іноді відхід від вказаної властивості зумовлений іншими важлими причинами, але, на жаль, не є рідкістю просто помилка у виборі засобів для реалізації проекту і ситуація нагадує відоме прислів'я про стрілянину з гармати по горобцям.

Взаємозв'язаність даних полягає в тому, що доступ до певної групи даних якогось застосування загалом полегшує доступ до інших груп даних цього ж застосування. В умовах орієнтації БД на велику кількість застосувань виникає необхідність у підтримці значного числа різноманітних зв'язків між даними. Саме у розумінні тісного логічного зв'язку використані слова про збереження разом даних. Розглянемо приклад, який ілюструє вказану властивість у порівнянні з простими ФС.

Приклад про міщок з різнокольоровими кульками.

Нехай у мішку є багато різнокольорових кульок, і завдання полягає в тому, щоб знайти кульку певного кольору, витягаючи їх по одній з мішка. Якщо операції витягання кульки з мішка повністю незалежні між собою, то цей приклад є аналогом технології роботи у рамках простих ФС з послідовним доступом. Якщо ж припустити, що кульки зв'язані між собою різнокольоровими мотузками, тоді пошук кульки можна пришвидчити, використавши на черговому кроці мотузку потрібного кольору. Цей варіант прикладу є аналогом технології роботи з взаємозв'язаними (мотузками) даними, що характерно для функціонування БД.

Вимога мінімізаціїї надлишковості полягає у мінімальній кількості копій для одних і тих же даних з урахуванням орієнтації на кілька застосувань. Ці надлишкові копії використовуються для підтримки зв'язків між даними. Як приклад, розглянемо відомості, що зберігаються у відділі кадрів деякого підприємства про своїх співробітників. Користувачами цієї інформації виступають адміністрація, профспілкова організація та бухгалтерія підприємства. Адміністрацію цікавлять дані про кваліфікацію, професійний рівень і досвід роботи, профспілки використовують відомості соціально-побутового характеру, а бухгалтерія оброблює ті дані, що потрібні для нарахувань заробітної плати та підрахунку податків, інших нарахувань та відрахувань. Хоча інформація і різнорідна, але все ж має значну спільну частину. Всім користувачам потрібні службовий номер, прізвище, ім'я, по-батькові співробітника, його рік народження, дані про умови праці. Інформація про сімейний стан та склад сім'ї використовується бухгалтерією і профспілками. Якщо для зберігання даних застосувати технологію ФС, то можливі два крайні варіанти: а)незалежні один від одного файли, відсортовані згідно з потребами того чи іншого користувача, передбачають значну надлишковість даних; б)всі дані знаходяться у одному файлі, відсортованому так, як потрібно одному з користувачів (наприклад, адміністрації) - надлишковість при цьому практично відсутня, але зручно працювати тільки одному з користувачів. Концепція БД займає проміжне становище між вищеописаними крайніми позиціями.

Зайва надлишковість має кілька недоліків. По-перше, зберігання кількох копій веде до додаткових витрат пам'яті. По-друге, доводиться виконувати численні операції оновлення для кількох надлишкових копій. Крім того, оскільки різні копії даних можуть відповідати різним стадіям оновлення, то інформація, що зберігається в системі на певний час може стати суперечливою.

Про незалежність даних часто говорять, як про одну з основних властивостей БД. Під цим поняттям розуміється можливість зміни структури даних без зміни програм, що її використовують, а також рівень самоінтерпрето-ваності даних. Міра незалежності даних тісно пов'язана з ступенем необхідної деталізації відомостей про організацію їх зберігання. Проілюструємо цю ситуацію дещо абстрагованим прикладом. Припустимо, що ви збираєтесь переглянути фільм у кінотеатрі, а для того, щоб прибути на місце плануєте скористатись послугами таксі. Поінформованість та досвід водія таксі відповідають мірі незалежності. У одному випадку Вам достатньо вказати лише назву фільму, а все інше зробить водій. У іншому випадку Вам потрібно буде визначити назву кінотеатру. Наступне зниження рівня - це адреса кінотеатру, а ще далі - вказівки по дорозі типу "їхати прямо, звернути наліво, а через 500 метрів - направо і т.п.". Аналогічно і користувачу при підвищенні ступеня незалежності даних треба менше задавати (і знати) "процедурної" інформації щодо доступу до даних. Зауважимо, що певний (хоч і досить низький) рівень незалежності мають сучасні ФС: при доступі до файлу достатньо вказати його ім'я, а інформація про треки та сектори непотрібна, але зміна розміру запису вимагає корекції всіх програм, що звертались до цього файла.

Під цілісністю БД розуміють несуперечливість між собою даних, що в ній зберігаються. Наприклад, для кадрових відомостей рік народження співробітника не може бути більшим року призначення на посаду або поточного року. Щоб запобігти виникненню таких ситуацій при модифікації і поповненнях БД, співвідношення між даними контролюються спеціальними засобами підтримки цілісності БД. Специфікація подібних умов, що накладаються на дані і відслідковуються при будь-яких їх оновленнях, покладаються на спеціальну службу Адміністратора бази даних (АБД), а системи управління базами даних (СУБД) надають інструментальні засоби, які забезпечують службі АБД можливість виконання її функцій.

За критерієм виразової потужності інструментальні засоби специфікації умов цілісності можна підрозділити на такі групи:

1) порівняння поля запису (або атрибута) з константою або з іншим полем цього ж запису; приклад такої умови наводився вище;

2) порівняння поля запису з полем або кількома полями інших записів;

3) порівняння поля запису з множиною (підмножиною) значень полів всього файлу або навіть кількох файлів. При порівняннях використовуються відношення належності (неналежності) елемента множині, або застосовуються множинні функції типу суми, кількості, середнього арифметичного, тощо. Приклад такої умови: заробітна плата певного службовця не може більш ніж у 5 разів перевищувати середнє арифметичне від заробітної плати його підлеглих.

Зауважимо також, що вищенаведений поділ на групи має в своїй основі не тільки виразову потужність, а і складність алгоритмів реалізації.

Оскільки однією з основних властивостей БД є орієнтація на широке коло застосувань, то природно передбачити засоби захисту від неавторизованого доступу (навмисного чи ненавмисного) користувачів до даних. З цією метою в БД встановлюється система паролів та ідентифікацій користувачів, а також розподіл даних і користувачів на групи з різноманітними взаємними правами.

Класифікація

В науковій літературі існує досить значне розмаїття щодо класифікації АІС. Різні автори в залежності від своїх задач та точок зору виділяють ті чи інші критерії і розподіляють пріоритети між ними. Зупинимось на одному з таких підходів, який на наш погляд, найбільш узгоджується з іншими темами цього курсу. Отже, АІС класифікуються:

1) за призначенням (фактографічні, документальні та змішані);

2) за мовами (замкнуті системи, системи з базовою мовою та змішані);

3) за локалізацією (локальні та розподілені);

4) з а схемою додаткової обробки (постобробка та попередня обробка);

5) за структурами даних (ієрархічні, мережаного типу, реляційні).

Розглянемо по черзі і детальніше кожний з критеріїв.

1) за призначенням.

Документальні системи зорієнтовані на обробку та зберігання документа (порівняно великої за розміром послідовності символів), внутрішню структуру якого система (майже) повністю ігнорує, тобто він неподільний (атомарний) з точки зору системи. Споживачем результатів пошуку виступає, як правило, кінцевий користувач.

Фактографічні системи оперують фактами (даними) різних типів, що зв'язані в системі в більш чи менш складні структури. Дані, що є результатом пошуку, можуть стати складовою частиною звітів або використовуються різноманітними обчислювальними процесами.

Змішані системи включають в себе в тих чи інших пропорціях риси обох вищеназваних варіантів. Переважну більшість сучасних систем для ПЕОМ слід віднести до категорії змішаних.

Звичайно, наведені описові характеристики не дають можливості чітко визначитись у випадку класифікації кожної конкретної ІС, але дозволяють зробити перші грубі припущення. Для більш точних класифікаційних оцінок необхідно враховувати додаткові властивості, що відносяться до пошукового процесу, а також до особливостей мов запитів, реалізованих в тій чи іншій системі. Оскільки подальші наші розгляди будуть стосуватися переважно фактографічних систем, тому зараз приділимо більше уваги саме документальним системам.

Дескрипторні або документальні АІС (ДАІС) історично були першими. Спочатку їх мовою була нічим не обмежена природна мова. Перші ДАІС були призначені для пошуку книг та документів у бібліотеках і великих сховищах, тому їх і почали називати документографічними.

Основним елементом інформаційного простору ДАІС була анотація або реферат книги, документа, явища чи об'єкта. Реферат повинен відображувати ті риси, які цікавлять користувача (як правило - людини). В ньому виділяються слова чи слоросполучення, які в сукупності майже однозначно (в ідеалі точно) відповідають повному опису об'єкта, крім того, таких слів повинно бути відносно небагато. Їх називають ключовими словами або дескрипторами. Запит для ДАІС можна зформулювати у вигляді переліку дескрипторів, який на думку користувача характеризує потрібний реферат, а значить, і відповідний об'єкт. Алгоритм формування відповіді послідовно порівнює запит з кожним рефератом і вибирає такі, що пройшли порівняння. В таких системах запит називають пошуковим розпорядженням, а реферат - пощуковим образом.

2) за мовами (замкнуті системи, системи з базовою мовою та змішані);

Системи з базовою мовою передбачають взаємодію користувача з СУБД з середовища якоїсь іншої мови програмування, де і виконуються більшість постпошукових перетворень даних. Такий підхід зручний для розробки різного роду систем як надбудов над СУБД, бо дає можливість створювати високоефективні програми постпошукової обробки даних.

Замкнуті системи самостійно забезпечують користувача всіма необхідними засобами як для локалізації даних, так і для їх постпошукової чи передпошукової обробки. Недоліком таких систем є те, що в них відсутні (або малоефективні) засоби для розробки надбудов – проблемно-орієнтованих комплексів.

Змішані системи передбачають наявність обох можливостей двох попередніх підходів і є найбільш поширеними на сьогодні.

3) за локалізацією (локальні та розподілені);

Локальність передбачає розташування всього програмного забезпечення і даних на одному ізольованому комп’ютері, а розподіленість означає розташування системи на мережі комп’ютерів з певною стратегією рознесення даних.

4) з а схемою додаткової обробки (постобробка та попередня обробка);

Головним призначенням будь-якої системи баз даних є підтримка функцій локалізації даних, що зберігаються, але дуже важливою властивістю, що може значно підняти інтерфейсний рівень системи, є наявність постобробки даних після їх локалізації в базі даних, чи попередньої обробки.

5) за структурами даних (ієрархічні, мережаного типу, реляційні).

Структури даних, що підтримуються в системі бази даних, - це важливий фактор, що впливає, як на виразову потужність, так і на ефективність функціонування. Для систем з ієрархічною структурою базовою структурою даних є дерево; як правило, вони мають найвищу ефективність функціонування, але виразові можливості їх відносно низькі. Системи з структурами даних типу мережа мають значно кращі виразові можливості, але дещо програють у ефективності функціонування, точніше, від користувача вимагається значно вищий рівень кваліфікації для ефективної експлуатації таких систем. В останні десятиріччя найбільшого розповсюдження (особливо для персональних ЕОМ) зазнали СУБД реляційного типу, для яких характерно щонайпростіша структура даних (плоский файл), але одночасово суттєво підвищений рівень мов маніпулювання даними, що максимально употужнює виразові можливості та знижує ефективність функціонування, тому для таких систем потрібні потужні комп’ютери, і вони значно чутливіші (порівняно з попередниками) до росту об’ємів даних.

Геоінформаційні системи

Геоінформаційна система (ГІС) — інформаційна система, що призначена для обробки просторово-часових даних, основою інтеграції якої слугує географічна інформація. Це засіб або інструментарій для вирішення завдань територіального плану. ГІС являє собою набір підсистем збору, збереження, маніпулювання даними та їхнього аналізу, виведення та представлення просторово-організованої інформації.

Останніми десятиріччями у світі розроблено велику кількість різноманітних геоінформаційних систем. Запропоновано різні класифікації, кожна з яких певною мірою ранжирує існуюче різноманіття в певну кількість однорідних класів з використанням однієї або декількох ознак.

Звичайно геоінформаційні системи класифікують за такими ознаками:

- за призначенням – залежно від цільового використання;

- за проблемно-тематичною орієнтацією – залежно від сфери застосування;

- за територіальним охопленням – залежно від розміру території масштабного ряду цифрових картографічних даних, що складають базу даних ГІС.

За призначенням геоінформаційні системи поділяють на багатоцільові та спеціалізовані. Багатоцільовими системами, як правило, є регіональні ГІС, призначені для розв'язання широкого спектра завдань, пов'язаних з регіональним керуванням. Спеціалізовані ГІС забезпечують виконання однієї або кількох близьких функцій. До них, як правило, відносять геоінформаційні системи:

- інформаційно-довідкові;

- моніторингові;

- інвентаризаційні;

- прийняття рішень;

- дослідницькі;

- навчальні.

Дослідницькі ГІС створюються для забезпечення розв'язання будь-якої наукової проблеми або сукупності наукових проблем із застосуванням методів просторово-часового аналізу й моделювання.

Навчальні ГІС розробляються для забезпечення навчального процесу, як правило, у вищих навчальних закладах. Як об'єкт у таких геоінформаційних системах частіше за все розглядаються території польових стаціонарів – баз навчальних польових практик студентів.

За проблемно-тематичною орієнтацією звичайно виділяють типи геоінформаційних систем, що відповідають «основним сферам застосування ГІС», тобто:

- земельно-кадастрові;

- екологічні і природокористувальницькі;

- Інженерних комунікацій і міського господарства;

- надзвичайних ситуацій;

- навігаційні;

- соціально-економічні;

- геологічні;

- транспортні;

- торгово-маркетингові;

- археологічні;

- військові;

- інші.

За територіальним охопленням найбільш логічним є поділ геоінформаційних систем на:

- глобальні;

- загальнонаціональні;

- регіональні;

- локальні.

ГІС зберігає інформацію про реальний світ у вигляді набору тематичних шарів, які об'єднані на основі географічного положення. Цей простий, але дуже гнучкий підхід довів свою цінність при вирішенні різноманітних реальних завдань. Будь-яка географічна інформація містить відомості про просторове положення, будь це прив'язка до географічних або інших координат, або посилання на адресу, поштовий індекс, виборчий округ або округ перепису населення, ідентифікатор земельної або лісової ділянки, назва дороги й т.п. При використанні подібних посилань для автоматичного визначення місця розташування або місць розташування об'єкта (об'єктів) застосовується процедура, що має назву геокодування. З її допомогою можна швидко визначити й подивитися на карті, де перебуває об'єкт, що цікавить вас, або явище, такі як будинок, у якому проживає ваш знайомий або перебуває потрібна вам організація, де відбулося землетрус або повінь, за яким маршрутом простіше й швидше добратися до потрібного вам пункту.

Дані – це ймовірно найбільш важливий компонент ГІС. Дані про просторове положення (географічні дані) і пов'язані з ними табличні дані можуть збиратися й підготовлятися самим користувачем, або здобуватися в постачальників на комерційній або іншій основі. У процесі управління просторовими даними ГІС інтегрує просторові дані з іншими типами й джерелами даних, а також може використовувати СУБД, що застосовуються багатьма організаціями для упорядочення й підтримки наявних у їхньому розпорядженні даних. Географічне положення (розміщення) просторових об'єктів представляється 2-х чи 3-х мірними координатами в географічно співвіднесеній системі координат (широта/довгота).

ГІС може працювати із двома типами даних, що істотно відрізняються - векторними й растровими. У векторній моделі інформація про крапки, лінії й полігони кодується й зберігається у вигляді набору координат X,Y. Місце розташування крапки (крапкового об'єкта), наприклад свердловини, описується парою координат (X,Y). Лінійні об'єкти, такі як дороги, ріки або трубопроводи, зберігаються як набори координат X,Y. Полігональні об'єкти, типу річкових водозборів, земельних ділянок або областей обслуговування, зберігаються у вигляді замкнутого набору координат. Векторна модель особливо зручна для опису дискретних об'єктів і менше підходить для опису безупинно мінливих властивостей, таких як типи ґрунтів або доступність об'єктів. Растрова модель оптимальна для роботи з безперервними властивостями. Растрове зображення являє собою набір значень для окремих елементарних складових (осередків), воно подібно відсканованій карті або картинці. Обидві моделі мають свої переваги й недоліки. Сучасні ГІС можуть працювати як з векторними, так і з растровими моделями.

Геоінформаційна система знаходиться в постійному розвитку. Сучасні технології надзвичайно розширюють коло, використовують електронну картографічну інформацію і професій осіб. Більшою мірою це необхідно тим, хто на основі ГІС ухвалює серйозні рішення, пов'язані з точними вимірюваннями, проектними роботами, навігацією. Необхідність у використанні земельного кадастру виникає і у юристів, що спеціалізуються на оформленні операцій з нерухомістю. От чому пріоритетним напрямом є геоінформаційна освіта, створення учбових і повчальних ГІС-СИСТЕМ, затвердження державних стандартів по спеціалізації "ГІС" для підготовки бакалаврів, фахівців, магістрів. Такі фахівці потрібні: у адміністративно-управлінські органи районів, областей України; для управління земельними ресурсами і ведення кадастру; у проектних і будівельних організаціях, архітектурних управліннях, організаціях охорони навколишнього середовища.

 

 



Поделиться:


Последнее изменение этой страницы: 2016-07-11; просмотров: 230; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.134.78.106 (0.036 с.)