Роль метаданих в інформаційному середовищі 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Роль метаданих в інформаційному середовищі



Реферат

з дисципліни «Сховища даних»

на тему:

«Стандарти опису метаданих»

 

Виконала:

студентка групи КСІм-11

Москалюк Ю. О.

 

 

Прийняв:

доцент кафедри СКІД

Тарасов Д. О.

 

Львів 2012

 

 

Зміст

 

 

Вступ……………………………………………………………………….1—2

1. Роль метаданих в інформаційному середовищі………………………2—4

2. Класифікація форматів метаданих…………………………………….4—7

3. Огляд міжнародних проектів та ініціатив в області моделей і схем метаданих…………………………………………………………………..7—9

3.1. Формати бібліографічних записів…………………………….9—22

3.2. Стандарти опису метаданих специфічних областей застосування……………………………………………………….22—27

3.3. Метадані архівної інформації………………………………..27—29

3.4. Метадані географічної інформації…………………………..29—31

3.5. Метадані музейної інформації……………………………………32

3.6. Метадані наукової інформації……………………………….32—33

Висновок……………………………………………………………………….34

Список використаних джерел…………………………………………..35—36


Вступ

Метадані відіграють зростаючу ключову роль у створенні, поширенні, управлінні та використанні електронних матеріалів. Система метаданих організовує сукупність електронних інформаційних ресурсів (або цифрових об'єктів) електронного інформаційного середовища (ЕІС) — електронної бібліотеки, репозиторію тощо.

Основні технологічні процеси даного середовища будуються на основі системи метаданих, а саме:

· введення, обробка, організація зберігання і виключення цифрових об'єктів;

· пошук окремих цифрових об'єктів (інформаційних ресурсів) або їх сукупностей;

· навігація в інформаційному просторі;

· управління правами доступу до цифрових об'єктів, організація оплати за доступ та ін.

Система метаданих є зв'язуючою ланкою між внутрішніми властивостями електронної бібілотеки/архіву, обумовленими семантикою і структурою цифрових об'єктів і функціональними задачами користувача, і зовнішніми властивостями, обумовленими мережевим середовищем. При цьому різні категорії користувачів пред'являють до системи метаданих різні, зазвичай суперечливі вимоги. Користувачами метаданих є всі категорії користувачів – як зовнішні, так і персонал ЕІС. Тому формалізація метаданих є їх обов'язковою умовою. [5]

Формат метаданих – стандарт, що призначений для формального опису деякої категорії ресурсів. Такий стандарт звичайно включає набір полів (атрибутів, властивостей, елементів метаданих), що дозволяють характеризувати даний об'єкт. Іноді властивості метаданих мають відносний характер. Відомості, які в одній інформаційній системі є метаданими, в іншій – власне даними. Так, бібліографічні або реферативні бази даних, які в інформаційних системах колишніх поколінь були метаданими до традиційних (паперових) ресурсів. Американський дослідник Ф. Ланкастер, вважає, що метадані прийшли на зміну звичному терміну бібліографічний опис. У вступних "Нотатках з термінології" до третього видання своєї добре відомої у Північній Америці книги "Предметизація та реферування у теорії та практиці", перше видання якої одержало 1991 р. премію Американського товариства з інформацієзнавства, як краща книга в цій галузі, вчений звертає увагу на те, що загальноприйнята і повністю придатна термінологія бібліотечної професії замінюється, на його думку, без особливої потреби. Одним із таких очевидних прикладів він називає метадані. У "Міжнародній енциклопедії з інформацієзнавства та бібліотекознавства" міститься таке визначення: " Метадані є структурованою інформацією, що використовується для пошуку, доступу, використання і управління інформаційними ресурсами, головним чином у електронному середовищі. Схема метаданих складається з заздалегідь визначеного набору елементів, що містять інформацію про ресурс ". [6]

 

Метадані музейної інформації

CDWA (Categories for the Description of Works of Art) — категорії для опису творів мистецтва. Організація-розробник — The Art Information Task Force (AITF)

CDWA формулює загальні правила формулювання контенту баз даних з мистецтва і містить схематичне уявлення вимог і допущень, що містяться в дисципліні «Історія мистецтва».

CDWA фокусується на «рухомих» об'єктах і їх зображеннях, включаючи живопис, роботи на папері, скульптуру, кераміку, метал, меблі, дизайн та перформанс всіх часових періодів та всіх географічних регіонів.

Категорії CDWA розташовуються таким чином, щоб рухатися від опису твору мистецтва до опису, аналізу і текстового / візуального джерела інформації про нього. У певному сенсі, він рухається від об'єктивних даних до суб'єктивних інтерпретацій.

Даний стандарт опису метаданих широко використовується у всьому світі.

Object ID — стандарт опису метаданих для захисту культурних об'єктів в глобальному інформаційному суспільстві (Protecting Cultural Objects in the Global Information Society). Область застосування — ідентифікація об'єктів таким чином, щоб вони були знайдені / відновлені (recovered) у випадку крадіжки.

Object ID — стандарт опису творів мистецтва та антикваріату, створений у співпраці музеїв, організацій культурної спадщини, правоохоронних органів, торговців творами мистецтва та страховиків.

Список полів Object ID допомагає користувачам забезпечити витвір мистецтва повним описом, необхідним для його надійної ідентифікації.

 

Метадані наукової інформації

CDF (Common Data Format) — загальний формат опису метаданих, що застосовується для зберігання, маніпуляції та доступу до багатовимірних наборів даних. Організація-розробник — US National Space Science Data Center.

CDF є програмним інтерфейсом, який надає платформно-незалежний погляд на моделі даних CDF. Останні базуються на багатовимірних масивах, які класифікують дані за різними змінними, що відповідають одному з спостережуваних параметрів. Набори даних CDF відповідають базовій структурі (basic grid structure), в якій позиція кожної задається індексами. Словник даних використовується для унікальної ідентифікації змінних. Бібліотека даних CDF підтримує дві фізичні схеми кодування: використовуваної операційної системи та формату IEEE-754. Останній є форматом загального обміну даними CDF.

CDF розроблений NASA як частина американської космічної програми, він широко використовується для обміну між науковими базами даних.

CERIF (Common European Research Information Format) — загальний європейський формат для дослідницької інформації. Область застосування — бази даних загального призначення для обміну інформацією про наукові проекти. Організація-розробник — Європейська комісія (European Commission).

Даний стандарт визначає набір обов'язкових і додаткових полів, які повинні використовуватися для опису наукових проектів, що фінансуються ЄС, включаючи назву проекту, абстракт (project role), керівники проекту (director and principal investigators), контактну адресу, найменування організації, яка фінансує проект і ключові слова. Додаткова інформація включає посилання на інші проекти і опубліковані результати. В якості додатку до специфікації публікуються списки кодів для предметних областей.

Незважаючи на те, що специфікація опублікована ще в 1991, багато дослідників не знали про її існування. Після поновлення в 2000 році була створена спеціальна робоча група, яка займається розповсюдженням цього формату.

VICAR (Video Image Communication And Retrieval) — стандарт опису метаданих для передачі і пошуку відео зображень. Область застосування — робота з зображеннями із супутників. Файл у форматі VICAR складається з двох головних частин: міток, що описують даний файл і області зображень, що містить реальні дані. Мітки діляться на дві групи, одна на початку, інша в кінці файлу, хоча в нормі досить міток на початку.

Мітка складається з послідовності «ключове слово = значення», яка описує зображення у форматі ASCII (American Standard Code for Information Interchange). Перше ключове слово LBLSIZE вказує розмір області міток в байтах. Значення міток можуть бути трьох типів: ціле, натуральне або послідовність (integer, real, or string) [4].

 


Висновок

Системи метаданих є одним з найважливіших компонентів ЕІС, які в значній мірі визначають їх функціональні можливості та універсальні системи інформаційного пошуку. Оскільки основним середовищем реалізації ЕІС є Інтернет, вельми важливим і визначальним є застосування в проектних рішеннях по метаданих вимог мережевого середовища. Основним варіантом в даний час є рішення, які засновані на використанні мови XML і протоколу HTTP.

Електронні інформаційні ресурси Інтернету в цілому і різних інформаційних систем зокрема розрізняються винятковою різноманітністю. Тому єдиний засіб опису метаданих не може задовольнити всі потреби і вирішити всі виникаючі завдання [8].

В останні роки було розроблено безліч різноманітних наборів метаданих, які дозволяють різним організаціям, агентствам і групам користувачів використовувати метадані для вирішення специфічних завдань. Стандартизація метаданих забезпечує однорідність подання метаінформації, полегшує її поширення серед різних організацій і агентств, надання універсального доступу до інформації. Тому розробки засобів для роботи з метаданими (в т.ч. наборів метаданих, мов опису метаданих та ін) вкрай важливі для забезпечення глобального доступу до інформації.

Ресурси, кодовані із застосуванням відкритих стандартів і форматів, мають більший шанс на збереження при тривалому зберіганні даних, ніж ресурси, кодовані за допомогою локальних методів і форматів. Використання міжнародних стандартів і форматів – єдина стратегія, що веде до створення цілісних сховищ інформації великих об'ємів з уніфікованим доступом до даних різних груп користувачів.


Список використаних джерел:

 

1. Internet Calendaring and Scheduling Core Object Specification (iCalendar) [Електронний ресурс]. — Режим доступу: http://tools.ietf.org/html/rfc5545

 

2. UNIMARC and Cataloguing Rules (UNICAT) [Електронний ресурс] // сайт CERL (Consortium of Europian Research Libraries). — Режим доступу: http://www.cerl.org/web/en/resources/hpb/fileproc/unicat?s=unimarc

 

3. vCard: The Electronic Business Card [Електронний ресурс] //сайт Internet mail Consortium. — Режим доступу: http://www.imc.org/pdi/vcard-21.doc

 

4. Обзор международных проектов и инициатив в области моделей и схем метаданных [Електронний ресурс] // Информационно-интерактивный портал "Российские электронные библиотеки". — Режим доступу: http://www.elbib.ru/index.phtml?page=elbib/rus/methodology/md_rev/md_intro

 

5. Саух В. М. Тенденції створення і використання електронних інформаційних ресурсів і сервісів [Електронний ресурс] / В.М. Саух, С. М. Іванова // Електронне наукове фахове видання «Інформаційні технології і засоби навчання». — 2009. — №6 (14). — Режим доступу: http://www.ime.edu-ua.net/em.html.

 

6. Стрішенець Н. В. Метадані у сучасному бібліотекознавстві. Метадані – нове чи старе поняття? [Електронний ресурс]. — Режим доступу: www.nbuv.gov.ua/portal/Soc_Gum/bdil/2010_2/1.pdf

 

7. УКРМАРК — Національний формат представлення бібліографічних даних [Електронний ресурс]. — Режим доступу: http://www.nbuv.gov.ua/library/ukrmarc.html

 

8. Чернова Л. В. Разработка методов и средств автоматизации процесса подготовки метаданных в полнотекстовых информационных системах [Електронний ресурс] // Лаборатория Разработки и Внедрения Информационных Технологий. — Режим доступу: http://rd.feb-web.ru/chernova-09.html#113

 

9. Ярмолюк Р. С. Основні типи та джерела помилок у записах електронного каталогу [Електронний ресурс] / Р.С. Ярмолюк // Вісник Національного Університету «Львівська політехніка». Інформаційні системи та мережі. — 2010. — № 689. — Режим доступу: http://ena.lp.edu.ua:8080/bitstream/ntb/12165/1/Yarmolyuk(apkt-2012).pdf

 

10. Бібліографічні формати та структура запису в електронному каталозі [Електронний ресурс]. — Режим доступу: http://chl.kiev.ua/Default.aspx?id=6093

 

 

11. Using Dublin Core - Dublin Core Qualifiers [Електронний ресурс] // сайт The Dublin Core Metadata Initiative. — Режим доступу: www.nbuv.gov.ua/portal/Soc_Gum/bdil/2010_2/1.pdf

 

12. Metadata standards and organizations [Електронний ресурс] // сайт бібліотеки університету Північної Кароліни. — Режим доступу: http://www.lib.ncsu.edu/cataloging/metadata/metadataStandards.html

 

13. UNIMARC Manual [Електронний ресурс] // сайт International Federation of Library Associations and Institutions. — Режим доступу: http://archive.ifla.org/VI/3/p1996-1/sec-uni.htm

 

Реферат

з дисципліни «Сховища даних»

на тему:

«Стандарти опису метаданих»

 

Виконала:

студентка групи КСІм-11

Москалюк Ю. О.

 

 

Прийняв:

доцент кафедри СКІД

Тарасов Д. О.

 

Львів 2012

 

 

Зміст

 

 

Вступ……………………………………………………………………….1—2

1. Роль метаданих в інформаційному середовищі………………………2—4

2. Класифікація форматів метаданих…………………………………….4—7

3. Огляд міжнародних проектів та ініціатив в області моделей і схем метаданих…………………………………………………………………..7—9

3.1. Формати бібліографічних записів…………………………….9—22

3.2. Стандарти опису метаданих специфічних областей застосування……………………………………………………….22—27

3.3. Метадані архівної інформації………………………………..27—29

3.4. Метадані географічної інформації…………………………..29—31

3.5. Метадані музейної інформації……………………………………32

3.6. Метадані наукової інформації……………………………….32—33

Висновок……………………………………………………………………….34

Список використаних джерел…………………………………………..35—36


Вступ

Метадані відіграють зростаючу ключову роль у створенні, поширенні, управлінні та використанні електронних матеріалів. Система метаданих організовує сукупність електронних інформаційних ресурсів (або цифрових об'єктів) електронного інформаційного середовища (ЕІС) — електронної бібліотеки, репозиторію тощо.

Основні технологічні процеси даного середовища будуються на основі системи метаданих, а саме:

· введення, обробка, організація зберігання і виключення цифрових об'єктів;

· пошук окремих цифрових об'єктів (інформаційних ресурсів) або їх сукупностей;

· навігація в інформаційному просторі;

· управління правами доступу до цифрових об'єктів, організація оплати за доступ та ін.

Система метаданих є зв'язуючою ланкою між внутрішніми властивостями електронної бібілотеки/архіву, обумовленими семантикою і структурою цифрових об'єктів і функціональними задачами користувача, і зовнішніми властивостями, обумовленими мережевим середовищем. При цьому різні категорії користувачів пред'являють до системи метаданих різні, зазвичай суперечливі вимоги. Користувачами метаданих є всі категорії користувачів – як зовнішні, так і персонал ЕІС. Тому формалізація метаданих є їх обов'язковою умовою. [5]

Формат метаданих – стандарт, що призначений для формального опису деякої категорії ресурсів. Такий стандарт звичайно включає набір полів (атрибутів, властивостей, елементів метаданих), що дозволяють характеризувати даний об'єкт. Іноді властивості метаданих мають відносний характер. Відомості, які в одній інформаційній системі є метаданими, в іншій – власне даними. Так, бібліографічні або реферативні бази даних, які в інформаційних системах колишніх поколінь були метаданими до традиційних (паперових) ресурсів. Американський дослідник Ф. Ланкастер, вважає, що метадані прийшли на зміну звичному терміну бібліографічний опис. У вступних "Нотатках з термінології" до третього видання своєї добре відомої у Північній Америці книги "Предметизація та реферування у теорії та практиці", перше видання якої одержало 1991 р. премію Американського товариства з інформацієзнавства, як краща книга в цій галузі, вчений звертає увагу на те, що загальноприйнята і повністю придатна термінологія бібліотечної професії замінюється, на його думку, без особливої потреби. Одним із таких очевидних прикладів він називає метадані. У "Міжнародній енциклопедії з інформацієзнавства та бібліотекознавства" міститься таке визначення: " Метадані є структурованою інформацією, що використовується для пошуку, доступу, використання і управління інформаційними ресурсами, головним чином у електронному середовищі. Схема метаданих складається з заздалегідь визначеного набору елементів, що містять інформацію про ресурс ". [6]

 

Роль метаданих в інформаційному середовищі

Кажучи про місце сучасного інформаційного середовища, необхідно враховувати ряд загальних чинників, що впливають на формування і функціонування інформації. Серед основних чинників є розвиток систем метаданих для опису ресурсів, зростання числа розробників інформаційного контенту, різке збільшення частини електронних ресурсів, включаючи повнотекстові бази даних, розвиток Інтернет-технологій, що забезпечують більш повний, зручний і оперативний пошук і тим самим становлять серйозну конкуренцію бібліотечним каталогам. Ресурси, кодовані із застосуванням відкритих стандартів і форматів, мають більший шанс на збереження при тривалому зберіганні даних, ніж ресурси, кодовані за допомогою локальних методів і форматів. Використання міжнародних стандартів і форматів – єдина стратегія, що веде до створення цілісних сховищ інформації великих об'ємів з уніфікованим доступом до даних різних груп користувачів.

Метадані — поняття виключно широке і містке. Роль метаданих щодо електронних ресурсів, перш за все, полягає в:

ü наданні можливостей більш швидкого, точного і повного виявлення необхідних ресурсів;

ü забезпеченні гнучких і різноманітних механізмів відбору відповідно до вимог користувача (пошукового запиту);

ü наданні інформації про необхідні вимоги до можливостей використання (необхідне прикладне програмне забезпечення, вільний дисковий простір і т.п.);

ü управлінні життєвим циклом інформаційних ресурсів (процесами створення, використання і зберігання цифрових документів).

Метадані здатні прискорити процес міжнародного доступу до інформації, тому можуть бути представлені на мовах, відмінних від мови самого об'єкта.

Електронні інформаційні ресурси Інтернету в цілому і різних інформаційних систем зокрема розрізняються винятковою різноманітністю. Тому єдиний засіб опису метаданих не може задовольнити всі потреби і вирішити всі виникаючі завдання. Крім цього, навіть якщо такий універсальний стандарт і був би розроблений і затверджений, немає можливості домогтися його неухильного виконання всіма творцями інформаційних ресурсів. Потім, виникає складний багатофакторний вибір, тому подібний стандарт неминуче буде винятково складним і громіздким, що тягне великі витрати на його імплементацію, підтримку, супровід, навчання персоналу і т.п. Інший аспект пов'язаний з тим, що значна частина ресурсів у мережі створюється непрофесіоналами, які і не можуть, і не хочуть вникати в складні правила генерації метаданих різних типів. Виходячи зі сказаного, можна запропонувати ряд принципів, що визначають політику в області метаданих в перспективних інформаційних системах (ІС) в публічному Інтернеті (наприклад, електронних бібліотеках):

o підтримувати декілька наборів метаданих, які задовольняють всі перспективні потреби ІС;

o забезпечити відображення всіх наборів в один, прийнятий за стандарт обміну;

o зберігати всі метадані в центральному репозиторії (каталозі, БД) метаданих;

o якщо творцеві колекції або ІС необхідний оригінальний набір елементів метаданих, то на ньому лежить відповідальність за розробку методів його відображення в один з поширених стандартів.

Такий підхід зберігає за творцями інформаційних об'єктів певну свободу вибору, але в той же час дозволяє:

- домогтися інтероперабельності між колекціями та ІС різного типу і походження;

- зробити всі записи доступними для відповідних сервісів [6].

Метадані на рівні колекцій та ІС виправдано створювати за участю професіоналів в даній предметній області, а на рівні об'єктів (документів) метадані бажано генерувати автоматично, для чого потрібна розробка або використання відповідного програмного забезпечення.

При цьому в каталозі (репозиторії, БД) метаданих можуть зберігатися записи:

· на рівні колекції (зміст, призначення, протоколи, формати, набори, умови доступу) — створені фахівцями в наборі елементів, прийнятому за стандарт обміну (наприклад, Дублінське ядро);

· на рівні об'єкта (документа, item) - в одному з підтримуваних даною ІС стандартів метаданих;

· нормалізовані записи на рівні об'єктів — відображення оригінального набору елементів метаданих в деякий формат обміну.

Метадані покликані описувати інформаційні об'єкти тих типів, на які розрахована дана інформаційна система. Класифікація таких об'єктів може включати, наприклад: публікація, організація, персона, проект, новини, подія,

навчальний об'єкт, форум, календар та інше. В залежності від того, які інформаційні об'єкти містить дана (проектована) ІС, і здійснюється вибір підмножини (профілю) наборів метаданих [8].

 



Поделиться:


Последнее изменение этой страницы: 2016-07-14; просмотров: 302; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.222.69.152 (0.075 с.)