Формати бібліографічних записів 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Формати бібліографічних записів



Найпоширенішим стандартом метаданихдля бібліотек, який фактично в основі своїй має AACR2 (Anglo-American Cataloguing Rules, Second Edition), є Дублінський набір основних елементів метаданих (Dublin Core Metadata Element Set) або Дублінське ядро ( Dublin Core) [8], як його скорочено називають (core перекладається як серцевина, осердя, ядро). Він дозволяє пошук е-ресурсів та інформації про них за аналогією з каталогом. Цей стандарт є форматом опису практично будь-яких інформаційних ресурсів, зокрема Інтернет, – не складний за структурою, відносно легкий у застосуванні, інтернаціональний, міжнародно-визнаний.

Ініціатива розробки Дублінського ядра метаданих бере початок 1995 р. з семінару, який зібрав разом бібліотекарів, дослідників електронних бібліотек, експертів з контенту для розробки міжнародно узгодженого набору елементів метаданих, який би став стандартом для е-ресурсів. Перша зустріч відбулася в Дубліні (штат Огайо), тому формат метаданих назвали Дублінським.

Стандарт розділений на два рівні: — простий, в якому 15 елементів; — кваліфікований, в якому 18 елементів, які уточнюють значення елементів. Елементи Дублінського ядра: — Title - назва; — Creator - творець; — Subject - тема; — Description - опис; — Publisher - видавець; — Type- тип; — Date - дата; — Contributor – той, хто вніс вклад; — Format - формат документа; — Identifier - ідентифікатор; — Source - джерело; — Language - мова; — Relation -відношення; — Coverage - покриття; — Rights - авторські права.

Кваліфікований набір елементів метаданих Дублінського ядра, окрім 15 перерахованих, містить ще три: — Audience – аудиторія. — Provenance – походження. — Rights Holder – утримувач прав. Кожний елемент може повторюватися.

У вересні 2001 р. набір метаданих Dublin Core був затверджений у США Американським Інститутом Національних Стандартів як стандарт Z39.85. В Австралії, Канаді, Данії, Фінляндії, Ірландії і Великобританії в цьому ж році формат Dublin Core рекомендований і прийнятий як державний стандарт для он-лайн ресурсів та е-комерції. З кінця 90-х почав широко використовуватися в Україні. Так, наприклад, наприкінці 1999 р. було прийняте рішення використовувати Dublin Core для цифрових ресурсів, що публікуються на сайті Кіровоградської ОУНБ. Починаючи з 2000 р. було введене правило —забезпечувати описом Dublin Core практично кожну html-сторінку.

Очевидно, що на основі DublinCore не можна створити повноцінного бібліографічного опису. З іншого боку, перевагою є простота опису. Бібліографічний формат сімейства MARC не замінити DublinCore, але каталог електронної бібліотеки за його допомогою може створити і звичайний користувач, а не тільки кваліфікований бібліотекар. Цей стандарт метаданих мав бути максимально простим для того, щоб автори могли виробляти свої власні метадані про ресурси, які вони створюють. Адже хоча й розроблені деякі засоби для забезпечення автоматичного створення метаданих Дублінського ядра для веб-ресурсів, ця робота все ще значною мірою виконується вручну. Давно пропонується альтернатива – використання метаданих, створених самими авторами. Але результати цього є не дуже задовільними. Автори дають забагато ключових слів, не завжди вказують дату, видавця, тип ресурсів тощо.

Окрім Дублінського ядра, кілька стандартів метаданих розроблено протягом останніх років. Ці стандарти пропонують набір елементів даних та схему кодування для створення метаданих спеціальних типів інформаційних ресурсів. Серед них бібліотекарів можуть зацікавити: Кодований архівний опис (Encoded Archival Description), Кодований архівний вміст/контент (Encoded Archival Content), Розширювана мова розмітки (XML) тощо. Оскільки метадані створювалися різними спільнотами, що мають відношення до інформації, то й стандарти їхні різняться. Бібліотекарі розробили MARC формат, як засіб кодування метаданих та стандарти опису AACR і ISBD. Вони є загальні за природою і можуть забезпечити описову інформацію про цифрові інформаційні ресурси різних типів і різних дисциплін, тоді як ISAD(G) є Загальним міжнародним стандартом архівного опису, а FGDC, 2007 – цифрових геопросторових метаданих і т. ін. Комп’ютерний світ виробив стандарти метаданих, базовані, наприклад, на застосуванні XML тощо.

В якості міжнародних комунікативних форматів для обміну даними із зарубіжними організаціями використовуються UNIMARC і MARC 21 (USMARC) [4]. Для перетворення даних при їх експорті і імпорті повинні бути розроблені або запозичені готові конвертори, що використовують таблиці відповідності полів бібліографічних записів форматів UNIMARC, MARC 21 і внутрішнього формату автоматизованої бібліотечної інформаційної системи.

Відомо, що стандартом каталогізації або бібліографічного опису у США є “Англо-американські правила каталогізації" (AACR2) і MARC формат, як засіб кодування бібліографічних даних.

MARC (Machine Readable Cataloguing) — стандартний формат обміну бібліографічними даними, є основою для побудови електронних каталогів бібліотек і бібліографічних баз даних.. Вперше програма MARC була розроблена Бібліотекою Конгресу США у 1965-1966 рр.. з метою отримання даних каталогізації в машиночитній формі. Аналогічна робота виконувалась у Великобританії Радою з Британської національної каталогізації для забезпечення використання машиночитних даних при підготовці друкованого видання Британської національної бібліографії — British National Bibliography (проект BNB MARC). На основі вказаних розробок у 1968 р. почав створюватися комунікативний англо-американський формат MARC (проект MARC). Стандарти MARC підтримуються технічним комітетом ISO TC46/SC4, міжнародною асоціацією бібліотек IFLA, Бібліотекою Конгресу США, британською бібліотекою, Національною бібліотекою Канади.

MARC, по суті, це правила виправлення різних частин каталогізаційного запису так, щоб він міг бути опрацьований з допомогою комп’ютера. В покращеній версії MARC були включені деякі принципи, які залишились без змін до нашого часу.

З початку 70-х років MARC збільшилось більш ніж на 20 форматів.

Комунікативний формат MARC має забезпечувати:

ü можливість його застосування для всіх видів бібліотечних документів;

ü достатню гнучкість для рішення різноманітних задач у доповнення до каталогізації;

ü зручність застосування в різних автоматизованих системах.

Для подолання несумісності форматів було прийнято рішення розробити міжнародний формат MARC (UNIMARC) в 1977 р., який дозволив би приймати записи, складені в будь-якому форматі MARC так, щоб вони могли конвертуватися в UNIMARC, а з нього в будь-який інший формат MARC. Таким чином, основною метою створення формату UNIMARC є сприяння міжнародному обміну даними в машиночитаній формі між національними бібліографічними службами.

У 80-роках групою IFLA, до складу якої увійшли представники кількох країн, у тому числі Бібліотека Конгресу США, розроблений міжнародний універсальний комунікативний формат UNIMARC.

UNIMARC — це потужна інформаційна мова, яка відображає різноманіття бібліографічного опису і є стандартом представлення бібліографічного запису в машиночитаному вигляді, що регламентує форму подання інформації, і тому UNIMARC обраний як основа для розробки формату для каталогізації електронних ресурсів. Формат поширюється на монографії, серіальні видання, картографічні матеріали, ноти, звукозаписи, графіку, проекційні й відео матеріали. Остання редакція UNIMARC (1994 р.) включає набір полів для опису специфічних характеристик, що є гідною основою для каталогізації електронних ресурсів [2]. Формат UNIMARC був вибраний багатьма європейськими бібліотеками для електронного обміну даними каталогів, а також Консорціумом європейських дослідницьких бібліотек (CERL) для формування бібліографічної бази даних, що об’єднує каталожні дані з різних бібліотек Європи. Для побудови бази даних комп'ютерного онлайн центру OCLC (Online Computer Library Center) був застосований формат USMARC. Ця база даних містить більше 30 млн. бібліографічних записів і використовується більш ніж 20 тис. бібліотеками в 61 країні. Щотижня в неї додаються більше 34 тисяч записів по монографіях, періодичних виданнях, аудіо- і відеоматеріалах, картах, архівах, рукописах, комп'ютерних файлах. База даних OCLC є результатом кооперованої діяльності з каталогізації Бібліотеки конгресу США, Національної бібліотеки Канади і Національної бібліотеки Австралії.

Формати USMARC і UNIMARC постійно розвиваються. Формат USMARC, широко поширений в світі, став де-факто міжнародним обмінним форматом. У своїх останніх редакціях формат USMARC перетворився в комплекс спеціалізованих форматів (USMARC Concise Formats) для запису бібліографічних, авторитетних, класифікаційних даних, даних про фонди та громадської інформації (відповідно — USMARC for Bibliographic Date; USMARC Format for Authority Data, USMARC for Classification Data, USMARC Format for Holding Data, USMARC Format for Community information). Кожен із зазначених форматів опублікований, містить подібний опис полів, інструкції по застосуванню і правила, що забезпечують введення та ідентифікацію даних.

Формат UNIMARC, спочатку розроблений в якості міжнародного обмінного, також знайшов застосування в світовому співтоваристві і не тільки як обмінний, але в деяких організаціях і як внутрішній.

Запис у форматі UNIMARC складається з Позначки запису, Довідника та Змінних полів.

Позначка запису (Record Label) – перше та обов’язкове поле в UNIMARC-записі, що складається з позиційно визначених елементів даних (чисел і кодів), що надають інформацію, необхідну для автоматизованої обробки запису. Має фіксовану довжину, яка складає 24 символьні позиції. Елементи в Record Label необхідні в першу чергу для обробки запису і тільки побічно для ідентифікації інформаційного ресурсу.

Довідник (Directory) – запис, що містить мітку (тег) (3 знаки), довжину (4 знаки) та початкове місце розміщення кожного змінного поля у записі (5 знаків). Довжина кожного запису містить 12 символьних позицій. Ніяких додаткових символів не допускається в записі Довідника.

Змінні поля – решта полів, у яких організовані дані в UNIMARC-запису. Дані розподілені за полями змінної довжини, кожне з яких ідентифіковане міткою поля, що складається з трьох цифр і зберігається в статті Довідника для цього поля. Існує два типи полів змінної довжини:

Змінні контрольні поля – 0ХX поля. Ці поля визначаються міткою поля в Довіднику, але вони не містять позицій індикаторів і кодів підполів.

Поля змінних даних – решта змінних полів - 1XX-9XX. Додатково до позначення міткою поля в Довіднику, поля змінних даних містять також дві позиції індикаторів, що розміщуються на початку кожного поля, і двосимвольний код підполя, що передує кожному елементу даних у середині поля.

Поля змінних даних згруповано в блоки за першим символом мітки поля, що визначає функцію даних усередині запису. Тип інформації в полі визначається двома останніми символами мітками поля.

0XX Поля ідентифікаційної інформації (Identification Block) — поля містять набір символів, які однозначно ідентифікують запис (наприклад, контрольний номер запису, наданий установою, що здійснює створення та розповсюдження ресурсу, ідентифікаційні та класифікаційні номери і т.п.).
1XX Поля кодованих даних (Coded Information Block) — дані загальної обробки для різних типів ресурсів (наприклад, вид запису, код мови каталогізації, код країни, де ресурс опублікований і т.д.). Поля містять основні кодовані дані фіксованої довжини, які визначаються відповідно до позицій символу в підполі. Позиції невикористовуваних елементів даних містять символи-заповнювачі (|).
2XX Поля назв та відомості про відповідальність (Descriptive Information Block) — містять назву, а також будь-яку іншу інформацію, повʼязану з назвою та відомості про відповідальність за випуск (місце, назва, адреса видавництва і т.д.)
3XX Поля приміток (Notes Block) — Загальна примітка; примітка про додаток; Примітка про наявність додаткової фізичної форми і т.д.
4XX Поля визначення звʼязку (Linking Entry Block) — містять інформацію, яка ідентифікує інші одиниці, ніж та, на яку створюється бібліографічний запис. Ці поля призначені для внесення приміток у записі, в якому вони містяться. Дані поля можуть також забезпечувати автоматичний зв’язок між даним бібліографічним записом і бібліографічним записом на пов’язаний ресурс, якщо для пов’язаної одиниці існує окремий запис.
5XX Поля пов’язаних назв (Related Title Block) — Уніфікована назва; Переклад назви, здійснений організацією, що каталогізує; Відомості про назву; Інша форма назви і т.п.
6XX Поля предметного аналізу і доступу (Subject Analysis Block)
7XX Поля інтелектуальної відповідальності (Intellectual Responsibility Block) — первинна, альтернативна та вторинна інтелектуальна відповідальність: включають всіх фізичних та юридичних осіб, сімей, пов'язаних з інформаційним обʼєктом.
8XX Поля міжнародного використання (International Use Block) — блок містить поля, узгоджені на міжнародному рівні, що містять відомості про походження запису.
9XX Поля локального використання (National Use Block)

Індикатори (позиції індикаторів) — це перші дві позиції символів в полях даних змінної довжини, що містять значення, які інтерпретують або доповнюють дані, що знаходяться в полі. Значення індикаторів в першій і другій позиціях прописується кожному індикатору окремо. Значення індикаторів можуть бути представлені цифрами або маленькими буквами латинського алфавіту. Пробіл, що позначається символом #, використовується, якщо позиція індикатора не визначена. У полях змінних даних пробіл може відображати як певне значення, так і те, що індикатор для цього поля не визначено.

Коди підполів - це два символи, за допомогою яких усередині поля розрізняються елементи даних (наприклад: назва, продовження назви, відповідальність тощо). Код підполя складається з роздільника (знак $) та наступним за ним ідентифікатором елементу даних (a, b, c, h тощо). Ідентифікатори позначаються маленькими буквами латинського алфавіту або цифрами. Коди підполів визначаються для кожного поля окремо. Там де це можливо, дотримується однорідність їх значення (наприклад, в полях 100, 600, 700 для імен осіб). Порядок вживання підполів зазвичай визначається діючими стандартами та правила каталогізації.

Повторюваність поля та підполя визначається форматом і залежить від характеру представлених даних. Повторюваність чи неповторюваність поля або підполя позначається знаками (П) та (НП) після назви кожного поля або підполя. Наприклад, запис може містити тільки одне 1XX поле, поле 100 може містити тільки одне підполе $a (Ім’я особи), але може містити більш ніж одне підполе $c (титули, звання та інші слова, що асоціюються з іменем) [13].

 

Приклад:

001 5-799 005 19961003171540 100 ## $a 19961005 101 0# $a eng 200 1# $a What is modern mathematics? $e a guide to teachers in further education $f David Lawrence 330 ## $a An item that provides an introduction to simplex method and describes the work of algorithm 615 ## $a Foundations of mathematics and statistics $n 7372 700 #1 $a Lawrence $b David Herbert 701 #0 $a Michael Day 215 ## $a 50 p.

 

Примітки:

Поля Індикатори Підполя
001 — ідентифікатор запису
005 — ідентифікатор версії
100 — дані загальної обробки ## — не визначені $a — дані про дату створення запису
101 — дані про мову 0 — ресурс оригінальною мовою $a – дані про мову
200 — відомості про назву 1 — назва як точка доступу $a — основна назва $e — уточнення назви $f — перші відомості про відповідальність  
330 — анотація ресурсу ## — не визначені $a — текст анотації  
615 — предметна категорія ## — не визначені $a — опис предметної категорії $n — код предметної категорії
700 — первинна інтелектуальна відповідальність 1 — прізвище передує імені особи $a — текст головного імені особи $b — частина імені, відмінна від головного
701 — альтернативна інтелектуальна відповідальність 0 — прямий порядок імені особи (імʼя перед прізвищем) $a — текст головного імені особи  
215 — фізична характеристика ресурсу ## — не визначені $a — специфічне позначення матеріалу і розмір ресурсу

 

 

Формат Dublin Core є більш простим форматом у порівнянні з UNIMARC. Для формату UNIMARC, як професійного формату передачі даних, який враховує правила бібліографічного опису, обов'язкова більш строга деталізація окремих елементів опису [11]. Для наочності приведена таблиця 2 відповідностей між елементами двох форматів.

 

Табл. 2 Відповідності між елементами двох форматів

Dublin Core UNIMARC
Title (Назва) Кваліфікатори:
  • Alternative
200 $a Основна назва 200 $e Відомості, що відносяться до назви 517 $a Варіант назви(Other Variant Title)
Creator (Створювач, Автор)
  • PersonalName
 
  • CorporateName
   
700 $a Ім'я особи — первинна інтелектуальна відповідальність 701 $a Ім'я особи — альтернативна інтелектуальна відповідальність 710 $a Найменування організації - первинна інтелектуальна відповідальність 711 $a Найменування організації - альтернативна інтелектуальна відповідальність 200 $f Перші відомості про відповідальність  
Subject (Предмет, Ключові слова) Схеми: § UDC § DDC § LCC § LCSH - Предметні рубрики бібліотеки Конгресу США. § MeSH - Предметні рубрики медичні (США). 610 $a Неконтрольовані предметні терміни (Поле використовується для запису тематичних термінів, не запозичених з контрольованих списків наочних рубрик або дескрипторних словників) 606 Найменування теми як предмет 675 Універсальна десяткова класифікація (UDC/УДК) 676 Десяткова класифікація Дьюі (DDC/ДДК) 680 Класифікація Бібліотеки Конгресу (LCC/КБК) 686 Індекси інших класифікацій
Description (Опис)
  • Table Of Contents
  • Abstract
330 $a Резюме або реферат
Publisher (Видавець)
  • CorporateName
210 $c Ім'я видавця, розповсюджувача і т.д.
Contributor (Співавтор)
  • CorporateName
  • PersonalName
711 $a Найменування організації - альтернативна інтелектуальна відповідальність 701 $a Ім'я особи — альтернативна інтелектуальна відповідальність 200 $g Наступні відомості про відповідальність    
Date (Дата) Кваліфікатори:
  • Modified (Дата, коли ресурс був востаннє змінений)
· Valid (Дата, коли ресурс діє) · Available (Дата, коли ресурс став чи був доступний) · Issued (Дата формального виходу (публікації) ресурсу) · Created (Дата, коли ресурс був уперше створений) Схема: ISO 8601
    005 ідентифікатор версії ресурсу (Version Identifier)   210 $d Дата видання, поширення і т.д. (Date of Publication, Distribution, etc.). Дані про дату повинні записуватись відповідно до ISO 8601-1989 у вигляді чисел без роздільників між роком, місяцем і числом (YYYYMMDD).   100 General Processing Data field (поле даних загальної обробки)
Type (Тип) — текст, зображення, звук, набір даних, програма, подія, інтерактивні медіа, фізичний об'єкт. 608 Форма, жанр, фізичні характеристики документа
Format (Формат)
  • Medium (Медіа-тип ресурсу).
  • Extent (Розмір, величина ресурсу).
230 $a Специфічна область матеріалу: характеристика електронного ресурсу 336 $a Тип комп'ютерного файлу
Identifier (Ідентифікатор) Схеми: URL; URI; URN; ISBN; ISSN; інвентарний номер 001 (обов'язкове для UNIMARC) 010 (ISBN) 011 (ISSN) 020 (Номер документа в національній бібліографії) 035 Інші системні номери 856 $u (URL)
Source (Джерело) Схема: URI 324 Оригінальна версія примітки
Language (Мова) Схеми: RFC 1766, ISO 639-2. 101 Мова документа (Language of the Item) (ISO 639-2)
Relation (Відношення) Схема: URI
  • IsPartOf - Поточний цифровий ресурс є частиною якогось іншого ресурсу.
  461 $u URI—488 поля запису посилань на повʼязані обʼєкти (Linking Entry Field for Other Related Work)  
  • HasPart - Вміщує частину іншого ресурсу.
  • IsFormat Of - є форматом чи механічною репродукцією іншого ресурсу.
  • HasFormat - має в собі версію, чи видання, історичну частину іншого ресурсу.
 
  • References - Посилання на інший ресурс.
  • IsReferencedBy - є посиланням іншого ресурсу.
 
  • Requires - Потрібно другий ресурс для функціонування, доставки, утримання і т.д.
  • IsRequiredBy - Потрібно для другого ресурсу для функціонування, доставки, утримання і т.д.
Covarage (Охоплення) Кваліфікатори:
  • spatial - просторовий (охоплення)
  • temporal - часовий (охоплення)
  • PlaceName - назва місцевості
  • PeriodName - ім'я часового періоду
  610 0# $a Uncontrolled Subject Term — поле використовується для запису предметних термінів, які не містяться в контрольованих списках предметних рубрик Схеми: DCMI Point, ISO 3166, TGN
Rights (Авторські права) 333 ## $aUsers/Intended Audience Note — примітки про особливості поширення і використання  

Для формату UNIMARC (UKRMARC, RUSMARC) ряд полів є обов'язковим, без наявності яких запис не буде повноцінним. Наведена таблиця 3 цих обов'язкових полів та відповідні їм поля формату Dublin Core:

Табл. 3 Обов'язкові поля форматів

UNIMARC Dublin Core
001 - Ідентифікатор запису Identificator (Ідентифікатор)
100 - Дані загальної обробки (Поле містить кодовані дані фіксованої довжини щодо записів про документи на будь-яких носіях.) Date (Дата), Language (Мова)
101 - Мова документа Language (Мова)
200 - Заголовок і відомості про відповідальність Title (Заголовок), Creator (Створювач, Автор), Contributor (Співавтор)

Національний формат UKRMARC представлення бібліографічних даних розроблявся міжвідомчою робочою групою фахівців Національної бібліотеки України імені В. І. Вернадського (Національна академія наук України), Національної парламентської бібліотеки України (Міністерство культури і мистецтв України) та Наукової бібліотеки ім. М. Максимовича Київського національного університету імені Тараса Шевченка (Міністерство освіти і науки України) в рамках договору про інформаційну співпрацю за підтримки Міжнародного фонду "Відродження".

Призначення формату:

  1. забезпечення комп'ютерної каталогізації документів;
  2. забезпечення обміну бібліографічними даними;
  3. забезпечення розробки сумісних внутрішніх форматів інформаційних систем бібліотек та інших бібліографічних установ України.

UKRMARC являє собою специфічну реалізацію міжнародного стандарту ISO 2709-1981, який визначає структуру записів, що містять бібліографічні дані. Він установлює, що кожен підготовлений до обміну бібліографічний запис повинен містити:

а) маркер запису — складається з 24 символів;

б) довідник — складається з 3-цифрової позначки для кожного поля даних, довжини поля та позиції початкового символу, який відноситься до першого поля даних;

в) поля даних змінної довжини — відокремлюються одне від одного роздільником полів.Загалом 192 полів та 1523 підполів [7].

Приклад.

020 ## $a 0877790019 $z 0877780116 100 1# $a Карцева, О. $q (Олена). 200 ## $a Душа на сторожі $e („Зимові марення“). 260 ## $a Львів: $b Вид-во Львівського університету, $c 2007.

Примітки:

Поля Індикатори Підполя
020 — Міжнародний стандартний книжковий номер $a – Міжнародний стандартний книжковий номер (ISBN) (НП); $z – Закритий/ неправильний ISBN (П)
100 — ім’я особи 1 – Тип імені особи (Прізвище) $a – Ім’я особи (НП); $q – Більш повна форма імені (НП)
200 — відомості про назву $a — Основна назва (П) $e — підзаголовок (П)
260 — вихідні дані $a – Місце публікації, розповсюдження і т.п. (П) $b – назва видавництва (П); $c – дата публікації (П)

 

Водночас упровадження цілої низки стандартів та схем метаданих викликає занепокоєння деяких фахівців. Частина з них є послідовними прихильниками стандартів каталогізації, які, як відомо, охоплюють також і електронні ресурси. Вони вважають, що впровадження MARC-формату у бібліотеках було найуспішнішим упровадженням метаданих в історії, що він встановлює вичерпний стандарт метаданих, витримав випробування часом і може бути схемою метаданих для майбутнього. Хоча слід відзначити, що всі ці стандарти метаданих відіграють важливу роль в організації інформації та управлінні нею.

 



Поделиться:


Последнее изменение этой страницы: 2016-07-14; просмотров: 455; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.225.31.159 (0.037 с.)