Попередня обробка і перетворення даних 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Попередня обробка і перетворення даних



Ми використовуємо термін сировина, щоб описати дані, отримані з світу навкруги нас. Вони можуть бути даними, наданими приладами вони можуть бути також надані і обчислені відповідним програмним забезпеченням, таким як дані прогнозу погоди.

Вони можуть навіть бути даними, пов'язаними з вимірними подіями і юридичними особами, які ми знаходимо в природі або соціальному світі, як число жителів або коефіцієнти народжуваності у містах в певній державі. В кожному випадку ці колекції даних, відомі як набори даних дуже рідко поставляються нам з точною логічною структурою. Щоб бути в змозі обробити ці дані, використовуючи програмне забезпечення, ми повинні дати їм організовану логічну структуру. Структура, що звичайно використовується для цього типу даних, є табличною у форматі, відповідному для програмного забезпечення, яка повинна отримати і обробити їх. Іноді вхідні дані містяться в одній або більше базах даних і, тому, вже доступні в електронному форматі із чіткою структурою. В цьому випадку, початкові дані відповідають даним, розташованим в базах даних, і фази попередньої обробки і розробки залучають витягання цих даних з бази даних і перетворення їх в структурований формат, що використовується програмним забезпеченням візуалізації.

Такий файл буде джерелом низки даних в нашій системі. Фаза попередньої обробки повинна перетворити ці дані в табличний формат. Структури даних також можуть бути збагачені додатковою інформацією. Зокрема, фільтруючи операції, щоб усунути непотрібні дані і обчислення для того, щоб одержати нові дані, такі як статистика, яка може буде представлена у візуальній версії.

Візуальна картографія

Ключові проблеми цього процесу лежать у визначенні які візуальні структури використовувати, щоб нанести на карту дані і їх місцеположення в області показу. У абстрактних даних не обов'язково є реальне місцеположення у фізичному місці. Є деякі типи абстрактних даних, які, по їх самій природі, можуть легко знайти просторове місцеположення. Наприклад, дані, узяті від контролюючої станції для атмосферного забруднення, можуть легко знайти положення на географічній карті, за умови, що контролюючі станції, які проводять вимірювання, розташовані в точному пункті на території. Те ж саме стосується даних, узятих від юридичних осіб, у яких є власна топологічна структура, така як транспортні дані комп'ютерної мережі. Проте, є декілька типів даних, які належать юридичним особам, у яких немає ніякого природного географічного або топологічного розташування. Наприклад, число бібліографічних посилань в наукових текстах, споживання автомобільного палива, або зарплати різних професійних груп в межах компанії. У цього типу даних немає безпосередньої кореспонденції з вимірюванням фізичного місця, які оточують його. Ми повинні визначити візуальні структури, які відповідають тим даним, які ми хочемо представити візуально. Цей процес називають візуальною картографією. Мають бути визначені три структури:

1. просторова підстава.

2. графічні елементи.

3. графічні властивості.

Просторова підстававизначає вимірювання у фізичному місці, де візуальне уявлення створене. Просторова підстава може бути визначена з погляду координат. У декартовій системі просторова підстава відповідає x і у вісям. Кожна вісь може мати різні типи, типу даних, які ми хочемо нанести на карту. Зокрема вісь може бути кількісною, коли є метрика, пов'язана з цінностями; або - порядковою, коли про цінності не повідомляють

З погляду візуального сприйняття людини не всі графічні властивості поводяться таким же чином. Деякі графічні властивості більш ефективні ніж інші для представлення кількісних цінностей. Клівленд і Макджілл виконали дослідження і оцінили точність, з якою люди в змозі відчувати кількісні цінності, нанесені на карту до різних властивостей, графічних елементів, і просторових підстав.

Колір повинен бути підібраний з особливою увагою. Фактично, колір - єдина графічна властивість, в якій сприйняття може залежати від культурних, лінгвістичних, і фізіологічних чинників. Деякі співтовариства, наприклад, використовують обмежене число слів, щоб визначити весь кольоровий спектр (в деяких поселеннях, є тільки два слова, щоб описати кольори: чорний і білий). Тому можливо, що люди з різних культур можуть використовувати різноманітну термінологію, щоб ідентифікувати той же самий колір або можуть навіть мати різне сприйняття, за умови, що у них не могло бути певного терміну для того, щоб ідентифікувати важливий колір на пізнавальному рівні. У дослідженні сприйняття є така демонстрація представлення, що, навіть беручи до уваги культурні відмінності, існують кольори, які можна вважати первинними, білий, чорний, червоний, зелений, жовтий, і синій. Вони єдині кольори, які мають однаковий зміст і назву у всьому світі і, є кольорами, які повинні бути вибраними., коли необхідно нанести на карту ознаку категорії з максимуму шести кольорів. Колін пропонує обмежити будь-яку картографію категоричних ознак до цих шести первинних кольорів, але, у разі потреби, можливо розширити список, додаючи рожевий, коричневий, блакитний, помаранчовий, і фіолетовий. Щоб представити кількісні ознаки, або де є замовлення цінностей, використовування первинних кольорів не бажано, тому що (1) не могло б бути достатньо багатьох первинних кольорів, і (2) наша культура не завжди приймає замовлення кольорів до змістовного обговорення.

Рис. 2.8Можливевізуальне представлення даних зібраних з дискусійного форуму.

На рис. 2.8 можемо пізнати користувачів francesco і massimo, хто був найактивнішим в тому, щоб повісити нові оголошення на форумі і також в читанні. Користувачі росаріо і sebastiano, натомість, прочитали багато повідомлень, але дуже небагато брали за їх власними повідомленнями. Нарешті, ми можемо негайно вибрати користувачів michele і nino, хто був пасивним і в читанні і в передачі нових повідомлень.

Це - проблема, з якою ми стикаємося, за умови, що дуже часто до дійсних станів справ залучають дуже велику кількість даних, навіть мільйони пунктів. У цих випадках, коли область показу є дуже маленькою, щоб явно підтримати всі елементи візуального уявлення, використовуються різні методи, включаючи зміну масштабу зображення, сортування, центр плюс контекст, і чарівні лінзи.

 



Поделиться:


Последнее изменение этой страницы: 2016-04-25; просмотров: 403; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.137.187.233 (0.005 с.)