Джерела даних, стандарти, формати даних. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Джерела даних, стандарти, формати даних.



Основними джерелами даних, які використовуються в ГІС, є: топографічна карта і плани міст; спеціальні карти; діапозитиви постійного зберігання номенклатурних аркушів топографічних карт та планів міст; матеріали великомасштабних топографічних зйомок; цифрові моделі місцевості; цифрові моделі рельєфу; цифрові карти місцевості; матеріали аерофотозйомки і матеріали космічної зйомки; матеріали наземної фототеодолітної зйомки; фотодокументи про місцевість, в тому числі і у цифровому виді; вихідні геодезичні дані: каталоги координат геодезичних і нівелірних пунктів, матеріали побудови фотограмметричних мереж, результати польової підготовки фотознімків та розвитку планово-висотної основи; воєнно-географічні описи місцевості; різні довідкові дані (таблиці, графіки, описи, звіти, схеми тощо); матеріали польових топогеодезичних робіт і спостережень супутникових навігаційних систем. В загальному виді всі матеріали можна розподілити на п’ять основних груп (рис. 3.1.)

 
 


Першим кроком до створення геоінформаційної системи є використання усіх наявних джерел даних про місцевість для створення просторової бази даних про місцевість та об’єкти на ній. Для переводу даних з різних джерел у цифрову форму, яку здатен сприймати персональний комп’ютер, необхідно організувати структури для зберігання даних та їх подальшого використання. В ГІС ці структури специфічні і дуже відрізняються від прийнятих в інших інформаційних системах (наприклад CAD, Mapping). Усі переваги геоінформаційних систем полягають у можливостях об’єднання, зберігання, управління даними про об’єкти місцевості та зв’язки між ними.

Двома основними типами інформації, що використовуються ГІС є просторові і тематичні бази даних. Просторова інформація містить описи зв’язків між об’єктами, їх кількісні та якісні характеристики. Але, щоб зрозуміти, як просторова інформація зберігається та використовується персональним комп’ютером, необхідно більш докладно розглянути спочатку традиційні структури комп’ютерних файлів, які забезпечують зберігання, пошук та упорядкування елементів даних. Потім ми перейдемо до більш високого рівня організації даних в ПК, який називається базами даних, що складаються з комбінацій файлових структур для підтримки більш складних методів управління даних.

Файл – це проста система обліку, що дозволяє комп’ютеру відслідковувати записи даних, які ми вводимо в нього, та отримувати ці записи в будь-якому потрібному порядку. Теж саме і для геоінформаційних систем. Одна з найважливіших функцій ГІС – зберігання об’єктів та їх атрибутів (характеристик) таким чином, щоб дозволяв нам, наприклад, вибрати потрібну комбінацію цих об’єктів. Іншими словами, кожний графічний об’єкт повинен зберігатися в явному виді разом зі своїми атрибутами так, щоб ми могли вибрати потрібну нам комбінацію даних за необхідний час.

Найпростішою структурою файла є неупорядкований масив записів. Недоліком такої структури є те, що для того щоб знайти потрібну інформацію необхідно переглянути усі наявні записи. Приклад - неупорядкована картотека.

Послідовно упорядковані файли. В цьому методі подання інформації використовує порівняння кожного нового запису з наявними для визначення того, де місце цієї записи. Такі файли можуть використовувати букви алфавіту або числа. Пошук потрібного запису починається з середини (розподіл на дві однакові частини) та вибіркою запису в середині. Коли вона є тією, що необхідна, то процедура пошуку закінчується. Якщо шуканий запис знаходиться наперед вибраного, то ми виконуємо ту ж саму операцію з першою половиною, а якщо після - то з другою половиною файлу. Цим досягається швидкість пошуку у порівнянні з неупорядкованими файлами. Але в нашому випадку, кожний новий запис повинен вставлятися на відповідне місце послідовності, інакше наш файл стане неупорядкованим, який буде вимагати послідовного перебору всіх наявних записів.

В обох розглянутих нами випадках записи ідентифікувалися за ключовиматрибутом - словом або числом. Елементи, які ми включаємо в базу даних геоінформаційної системи - це, головним чином, точка, лінії, області. Кожному об’єкту надаються певні атрибути (характеристики) і завдання буде полягати у пошуку елементів з певним набором атрибутів. Для такого випадку використовують індексні файли (рис. 3.2).

Індексний файл будується в наступній послідовності. З вихідного файлу в новий файл копіюють значення одного атрибуту для усіх записів разом з положенням цих записів. Іншими словами, новий запис в новому файлі складається з запису значення атрибуту і адреси запису у вихідному файлі, з якого це значення було взято. Потім потрібно упорядкувати записи нового файла у відповідності із значенням атрибуту. Тепер, щоб знайти необхідний запис з встановленим значенням атрибуту, ми шукаємо його у новому файлі розглянутим раніш способом (розподілом на дві частини). Відшукав потрібну запис в індексному файлі, ми отримаємо адресу запису вихідного файлу за допомогою якого можливо отримати усі атрибути об’єктів. Таким чином, для пошуку в основному файлі використовується додатковий індексний файл, який називається зовнішнім індексом, а сам вихідний файл, стає індексованим.

Користувачам ГІС необхідно пам’ятати, що для використання зовнішнього індексу необхідно виконання трьох умов. По-перше, необхідно знати критерії за якими буде організовуватися пошук (для кожного критерію будується свій індексований файл). Друге, посилання на доповнення у вихідному файлі повинні розміщуватися у відповідних місцях індексних файлів, щоб не порушувати їх упорядкованість. Третє, якщо не передбачено заздалегідь якийсь критерій, то необхідно використовувати послідовний перебір для пошуку необхідної інформації.

 

№ квадратів Властивості
Нахил Напрям Стан
    Пн Добре
    Пд Погано
    З Відмінно
    С Посередньо
    ПдЗ Погано
    ПдС Добре
Стан Номер квадрата
Погано 2,5
Задовільно  
Добре 1,6
Відмінно  

Але на практиці, під час роботи з інформацією геоінформаційної системи, ми дуже рідко обмежуємося одним файлом, звичайно використовується багато різних файлів.

Організований набір взаємопов’язаних файлів даних називається базою даних. Складність роботи з файлами в базі даних потребує більш удосконаленого управління, яке реалізується системою управління базою даних (СУБД). Хоча постійно створюються нові реалізації структур баз даних, проте існує всього три основних типа баз даних: ієрархічні (древовидні); мереживі; реляційні (табличні) структури баз даних. Розглянемо більш докладно їх сутність.

Ієрархічні (древовидні) бази даних (рис. 3.3).В багатьох випадках існує зв’язок між даними (кожний елемент даних має прямий зв’язок з деяким числом "нащадків" і кожний "нащадок" в свою чергу має зв’язок зі своїми "нащадками"). Така система називається ієрархічною. Головною її характеристикою є прямий зв’язок між різними гілками. Гілки засновані на формально ключових ознаках, які визначають переміщення по цій структурі від однієї гілки до іншої. Тобто, обов’язковою є інформація про ключову ознаку. На практиці, природа ієрархічної системи подання даних потребує докладного визначення кожного відношення, щоб створити відповідну структуру та її правила устрою. Головною перевагою такої структури є легкий пошук. Але, якщо опис структури зроблено некоректно, або критерій пошуку не включено у цю структуру, то в такому випадку пошук стає неможливим.

 

Для створення такої системи потрібно знання усіх можливих запитань, які можуть виникнути, так як вони є основою для розробки опису ієрархічної системи.

Найбільш простим прикладом використання ієрархічної структури бази даних є комп’ютеризована система бібліографічного пошуку. Така система імітує способи пошуку книг та статей, які люди використовували до впровадження комп’ютерів. Користувачі можуть шукати виходячи з теми, імені автора, назви і за діапазоном номерів у каталозі, що обмежує наш пошук частиною бібліотечного фонду.

Проте, на практиці ситуації з недостатньо визначеним запитом не так вже рідкі при роботі з інформацією у геоінформаційній системі. Одна з найбільш складних речей в цьому випадку – випередити усі можливі типи запитів користувачів. Як нам відомо, бази даних ГІС звичайно містять множину типів інформації і різних тематичних (спеціальних) карт. І однією з самих цікавих властивостей геоінформаційної системи є те, що користувач може спробувати виконати пошук або дослідження взаємозв’язків, які не передбачалися до створення системи. Тому, ієрархічна структура не зовсім підходить для цього із-за її жорсткої ключової структури.

Крім цього суворого обмеження ієрархічна структура часто породжує великі індексні файли, що потребують додаткових витрат пам’яті ПЕОМ для зберігання даних та зростання часу до їх доступу.

Мереживі бази даних ГІС (рис. 3.4) використовують відношення "багато до великої кількості", при чому кожний елемент може мати багато атрибутів, а кожний атрибут у свою чергу пов’язаний з багатьма елементами. Для реалізації таких відношень разом з кожним елементом даних може бути пов’язана спеціальна змінна, яка називається покажчиком, що вказує нам всі інші елементи, які пов’язані з цим елементом.

 
 


Рис. 3.4. Мережна структура даних: вона дозволяє користувачу переміщуватися від одного елемента даних до другого через ланцюг виказувачів, що виражають взаємовідносини між елементами даних.

 

Мереживі структури звичайно розподіляються, як удосконалені ієрархічні структури, оскільки вони менш жорсткі і можуть подати відношення "багато до багатьох". Їм притаманна більша гнучкість пошуку та вони зменшують надлишковість даних. Їх головним недоліком є велика кількість покажчиків (вказувачів), що призводить до значних витрат пам’яті ПЕОМ. Крім того, хоча зв’язки між елементами даних більш гнучкі, але вони все ж таки повинні бути визначені за допомогою покажчиків. Крім того, велика кількість зв’язків може призвести до виникнення ускладнень, втрат та помилок.

Реляційні бази даних. Недоліку – великої кількості покажчиків (вказувачів) можливо запобігти використовуючи ще одну структуру баз даних - реляційну. В ній дані зберігаються, як упорядковані записи або строки значень атрибутів. Атрибути об’єктів групуються в окремих строках у вигляді так називаних "відношень", оскільки вони зберігають своє положення у кожній строчці і певним чином пов’язані одна з одною (рис. 3.5).

Реляційні системи базуються на наборі математичних принципів, що називаються реляційною алгеброю, або алгеброю відношень, яка встановлює правила проектування і функціонування таких систем. Оскільки реляційна алгебра базується на теорії множин, то кожна таблиця відношень функціонує, як множина, і перше правило полягає в тому, що кожна таблиця не може мати строку, яка повністю співпадає з будь-якою іншою строчкою. Так, як кожна строчка унікальна, то одна чи кілька колонок можуть використовуватися для визначення критерію пошуку. Такий критерій пошуку називається “первинним ключем” для пошуку даних в інших колонках бази даних.

 

Перевагою реляційних систем є те, що вони дозволяють збирати дані в досить прості таблиці. За необхідності ми можемо стикувати строки з однієї таблиці з відповідними строками з іншої таблиці, використовуючи механізм зв’язку, який називається “реляційним поєднанням”. Будь-яка кількість таблиць може бути таким чином “пов’язана”. Зв’язок здійснюється за рівнянням значень колонки первинного ключа однієї таблиці з іншою колонкою другої таблиці. Така колонка другої таблиці називається “зовнішнім ключем”. Такий зв’язок означає, що всі колонки другої таблиці прив’язані до колонок першої таблиці. Ми можемо прив’язати сюди третю таблицю, взявши для цього колонку другої таблиці, як “первинний ключ” до відповідної “ключової колонки” (“зовнішнього ключа”) третьої таблиці. Процес може продовжуватися і далі приєднанням простих нових таблиць.

Необхідно пам’ятати, що для встановлення реляційного поєднання, кожна таблиця повинна мати хоча б одну спільну колонку з іншою таблицею, з якою необхідно встановити зв’язок. Для встановлення виду, який повинні мати таблиці - встановлені “нормальні форми”. Їх існує три.

Перша нормальна форма. Таблиця складається зі строк і колонок. Так, як колонка використовується, як ключ пошуку, то в кожній з них на кожній строчці повинно знаходитися тільки одне значення.

Друга нормальна форма. Кожна колонка, яка не є первинним ключем, повністю залежить від первинного ключа. Це спрощує таблиці і зменшує надлишковість обмеженням, що кожна строчка даних може бути знайдена тільки через її первинний ключ. Якщо необхідно знайти визначену строку, використовуючи інші відношення, то можна використати реляційне поєднання замість того, щоб дублювати колонки в різних таблицях.

Третя нормальна форма. Вона пов’язана з другою формою, та вимагає, щоб колонки, які не є первинним ключем, залежали від первинного ключа, в той же час, як первинний ключ не може залежати від будь-якого не первинного ключа. Іншими словами, ми повинні використовувати первинний ключ для пошуку значень в інших колонках, але нам не потрібно використовувати інші колонки для пошуку значень в колонці первинного ключа.

Розглянувши можливі джерела даних для геоінформаційних систем, та формати їх зберігання тепер визначимо, що просторова інформація в ГІС може бути представлена у двох основних форматах – растровому і векторному форматі. Растровий формат застосовується для перегляду графічної інформації. Векторний формат застосовується для виконання операцій, що пов’язані з аналізом і моделюванням.

Як в групі растрових так і в групі векторних зображень, форма запису в файл у кожній конкретній геоінформаційній системі неоднакова. Історично склалося, що виробники, які працювали в області комп’ютерної графіки створювали власні формати графічних даних.

Форматом файла називається шаблон за яким він створюється. Шаблон описує які дані (строки, одинокі символи, числа) та в якому порядку повинні бути занесені в файл. Коли ГІС “знайома” з цим форматом, то вона може прочитати дані з цього файлу даного формату та правильно їх інтерпретувати, і навпаки, записати свої дані в цьому форматі та бути зрозумілою іншою системою. Форматів даних існує велика кількість, деякі з них настільки популярні, що стали практично стандартами. Це пов’язано з їх розповсюдженістю, характеристиками самого формату (швидкість зчитування/запису, величина на яку можливо стиснення файлу, повнота опису інформації тощо). Деякі формати були прийняті в якості стандартних на основі рішень комісій по стандартах. Так формат IGES, що має статус національного стандарту США, був прийнятий міжнародною організацією стандартизації ISO в якості міжнародного стандарту.

Як правило, геоінформаційна система працює в своєму внутрішньому форматі даних, що найбільш сприятливий для конкретної системи, але підтримка можливо великої кількості стандартних форматів надзвичайно важлива, оскільки обсяг вже введених графічних зображень великий і не має сенсу знов водити ту ж саму інформацію, простіше її придбати (для цього необхідно “розуміти” формат зберігання цієї інформації).

Крім того, можливий такий випадок, що просторові дані вводяться у самостійній системі вводу, яка має власний формат, що відрізняється від формату, що прийнятий в ГІС. В такому випадку недоцільно відмовлятися від існуючої системи, а простіше перевести отримані дані в формат геоінформаційної системи та зворотно. При цьому існує одна умова: формат зберігання даних повинен бути достатньо повним. На відміну від координат, відсутні атрибути і опис об’єктів перевести в той формат, де вони потрібні, неможливо.

Стандартні формати існують, як для растрової так і для векторної інформації. До растрових форматів відносяться наступні: PCX; TIFF; GIF; RLE; RLC. Найбільш поширений з них – формат TIFF. До векторних форматів відносяться: DXF; DX90; PIC; DWC; IGES; DGN; HPGL. Найбільш поширений з них – формат DXF.

 



Поделиться:


Последнее изменение этой страницы: 2017-02-07; просмотров: 500; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.222.22.244 (0.024 с.)