Основы построения банков данных 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Основы построения банков данных



О.А. Мелихова

 

БАЗЫ ДАННЫХ

 

 

 

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

Государственное образовательное учреждение высшего профессионального образования

ТАГАНРОГСКИЙ ГОСУДАРСТВЕННЫЙ РАДИОТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

 

О.А. Мелихова

 

БАЗЫ ДАННЫХ

 

КОНСПЕКТ ЛЕКЦИЙ

 

 

ТАГАНРОГ 2006

 

 

УДК:

 

Мелихова О.А. Базы данных: Конспект лекций. Под редакцией З.А. Мелиховой

Таганрог: Изд-во ТРТУ, 2006. -   с.

 

В работе рассматриваются принципы организации баз данных на концептуальном, внешнем и физическом уровнях, методы проектирования баз данных, средства защиты данных и способы поддержания их целостности, приводятся обзор и сравнительный анализ современных СУБД.

    Конспект лекций предназначен для студентов всех форм обучения по направлению «Информатика и вычислительная техника».

 

 

Рецензенты:

 

Н.И. Витиска, д-р техн. наук, профессор, проректор по учебной работе Таганрогского государственного педагогического института,

 

Ю.О. Чернышев, д-р техн. наук, профессор, зав. кафедрой Прикладной математики и вычислительной техники Ростовской Государственной академии сельскохозяйственного машиностроения.

 

© Таганрогский государственный

радиотехнический университет

                                   

                                                © Мелихова О.А. 2006                               

 

 

СОДЕРЖАНИЕ

Введение

1 Основы построения банков данных

1.1 Информация и её свойства. Данные

1.2 Два аспекта рассмотрения банков данных

1.3 Терминология

1.4 Эволюция концепций баз данных

1.5 Требования к банкам данных

1.6 Структура банков данных

1.7 Архитектура банков данных и этапы проектирования баз данных

2 Инфологическое проектирование баз данных

2.1 Сущность инфологического подхода к проектированию баз данных

2.2 Модель типа «сущность - связь»

2.3 Построение модели локальных представлений

2.4 Объединение моделей локальных представлений

3 Модели данных

3.1 Сетевая модель данных

3.2 Иерархическая модель данных

3.3 Реляционные модели данных

3.4 Нормализация реляционных отношений

4 Физическая организация баз данных

4.1 Способы физической организации и хранения данных

4.2 Последовательные структуры данных

4.3 Индексно-последовательный метод доступа

4.4 Индексно-произвольный метод доступа

4.5 Инвертированный метод доступа

4.6 Прямой метод доступа. Хеширование

5 Установление связей между объектами в информационной системе

5.1 Установление функциональных связей между объектами

5.2 Установление структурных связей между объектами

6 Сравнительный анализ современных СУБД

7 Распределение баз данных

7.1 Проектирование распределенных баз данных

7.2 Обработка запросов в распределенной базе данных

8 Базы знаний

8.1 Модели представления знаний

8.2 Модели вывода решений

Заключение

Тесты для проверки полученных знаний по дисциплине «Базы данных»

Глоссарий по дисциплине «Базы данных»

Библиографический список


ВВЕДЕНИЕ

Данная работа представляет собой конспект лекций по дисциплине «Базы данных». Целью данной дисциплины рассмотрение основных направлений развития современных систем баз данных, изучение методов их проектирования, организации средств защиты данных.

Основными задачами дисциплины является формирование у студентов знания основных принципов организации баз данных на концептуальном, внешнем и физическом уровнях, знания современных систем управления базами данных, знания средств защиты данных и поддержания их целостности, а также приобретение навыков работы по созданию и программированию баз данных средствами современных СУБД.

Это пособие написано в результате многолетнего чтения лекций, научно – исследовательской и практической работы автора в области моделирования систем искусственного интеллекта. Оно включает следующие разделы:

· основы построения банков данных

· инфологическое проектирование баз данных

· сетевые, иерархические, реляционные модели данных

· физическая организация баз данных

· установление связей между объектами в информационных системах

· анализ современных СУБД

· способы проектирования распределенных баз данных

 

При изучении дисциплины «Базы данных» предполагается проведение лекционных, лабораторных и индивидуальных занятий со студентами. Для самопроверки усвоения материала лекций в пособие включены тесты, а так же глоссарий, содержащий основные понятия в области баз данных.

Данный конспект лекций предназначен для студентов, магистрантов, аспирантов, обучающихся по направлению «Информатика и вычислительная техника».


Терминология

 

а) по технических средствам:

Внешние запоминающие устройства: накопители на магнитных дисках, накопители на магнитных лентах.

ТОМ – это отдельная физическая единица любой периферийной запоминающей среды.

Запоминающее устройство с прямым доступом – это устройство, в котором каждая физическая запись имеет уникальный адрес и характеризуется дискретным местоположением.

Дорожка – это устройство с прямым доступом, содержащее данные, которые могут быть прочитаны одной считываемой головкой без ее перемещения.

Цилиндр – это группа дорожек.

б) термины, относящиеся к данным:

Логические и физические описания.

Логические описания данных указывают, в каком виде данные представляются пользователю.

Физическое описание данных определяет способы физического хранения данных в памяти.

Следует отметить, что для уменьшения времени доступа к данным физическая запись может содержать несколько логических записей.

CODASYL – Ассоциация по языкам и системам обработки данных.

Элементы данных – наименьшая единица поименованных данных, может состоять из любого количества бит или байт.

Агрегат данных – это поименная совокупность элементов данных внутри записи, которая рассматривается как единое целое. Например, агрегат данных ДАТА может состоять из элементов ДЕНЬ, МЕСЯЦ, ГОД. Выделяют два типа агрегатов данных:

вектор – это одномерная упорядоченная совокупность данных; повторяющаяся группа – это совокупность данных, которая встречается несколько раз в экземпляре записи.

Запись – это поименованная совокупность элементов или агрегатов данных.

Сегмент – агрегаты данных и записей, как правило, это один или несколько элементов данных.

Файл – поименная совокупность всех экземпляров логических записей данного типа.

База данных – это совокупность экземпляров различных типов записей и отношений между записями, агрегатами данных, элементами данных. Совокупность базы данных и СУБД образуют банк данных.

База данных – это даталогическое представление информационной модели предметной области.

Банк данных – это система баз данных. Иначе говоря, это информационная система, включающая в свой состав комплекс специальных методов и средств (информационных, математических, программных, языковых, организационных, технических), которые используются для поддержания динамической информационной модели предметной области с целью удовлетворения различных запросов пользователей.

Физическая запись – элементарная единица данных, которая может быть записана или считана одной командой ввода/вывода.

Экстент – это совокупность физических записей, расположенных последовательно на внешнем запоминающем устройстве.

Набор данных – это поименованная совокупность физических записей, на практике часто содержит несколько экстентов.

Виртуальные и прозрачные данные.

* Виртуальные данные – это те данные, которые пользователю представляются существующими в машине, фактически в таком виде они отсутствуют.

* Прозрачные данные – это те данные, которые фактически существуют в базе, но пользователю они представляются несуществующими.

 

I -й этап. 60-е гг.

ЛФ                                    ФД

 

 

Вв.-выв.

 

 

ЛФ – логический файл

ФД – физические данные

Ввод-вывод реализован программно.

   
   
   
   
   
   
   

 

Это так называемая файловая система. Последовательная организация физических данных. Физическая и логическая структуры идентичны. Независимость данных отсутствуют. Схема характеризуется большой избыточностью данных.

 

II -й этап. Конец 60-х

                                                                                Последовательная

ЛФ                                    запись ФД

     
     
     
   
 

Методы доступа

 
   
  с адресацией  
  данных  
     

 

Реализован последовательный или произвольный доступ к физическим данным. Избыточность остается высокой. Данные используются по-прежнему для одного приложения.

 

III -й этап. Начало 70-х.

Создаются первые системы управления базами данных (СУБД).

 

ЛФ прикладных программ                                         ФД

   
   
     
   
     
     
   
     
     
     
     
     
   
   
     
     
     
   
  Управление  
  данными  

Различные логические файлы могут быть получены из одних и тех же физических данных. Характерным для этой структуры является возможность использования одних и тех же физических данных различными пользователями. Такой подход позволил уменьшить избыточность данных.

IV этап. Современные базы данных.

                                                                               Физическая база                       

ЛФ                                                                               данных

   

 

Глобальное логическое описание данных или концептуальная схема

 

 

   

 

     

 

   

 

     

 

           
           
         
           
           
     

 

     

 

     

 

   

 

     

 

   

 

     

 

     

 

     

 

     

 

Независимость                                                  Независимость             

 логических                                                                физических

данных                                                                     данных  

Программные средства обеспечивают логическую и физическую независимость данных. Принципиальным вопросом является наличие концептуальной схемы, которая не зависит от представления данных или изменения приложения. Для управления используются специальные языки: язык описания данных, язык манипулирования данными.

    Логическая независимость данных означает, что общая логическая структура данных может быть изменена без изменения конкретных приложений.

    Физическая независимость данных означает, что физическое расположение и организация данных могут меняться, однако при этом не изменяется ни концептуальная схема, ни прикладная программа.

    Концептуальная схема образует общее глобальное логическое описание данных. СУБД стремятся к неизменности концептуальной схемы.

 

Требования к банкам данных

 

    Банк данных является частью любой автоматизированной системы такой как САПР, АСУП, АСУТП и т.д. Задачей банка данных является поддержание информационной модели в необходимом состоянии и обеспечении запросов пользователей. Это требует, чтобы в банке данных выполнялись три операции: включить, удалить, изменить. Эти операции обеспечивают хранение и модификацию данных.

    С развитие автоматизированной системы изменяется состав объектов предметной области, изменяются связи между ними. Все это должно находить отражение в информационной системе. Т.о., организация банка данных должна быть гибкой. Покажем место банка данных в составе автоматизированной системы.

 

   

Источники информации для автоматизированной системы

Входная информация  

Банк       Модель

данных  предметной

                области

               

 

Другие источники информации  
 

 

 

     

 

 

Сбор информации

 

Выходная информация

Функциональная часть автоматизированной системы (прогнозирование, анализ, принятие решения)

       
Предметная область

Реализация решений   Решения  
                   

 

    При проектировании банка данных необходимо учитывать два аспекта обеспечения запросов пользователя.

    1) Определение границ конкретной предметной области и разработка информационной модели. Отметим, что банк данных должен обеспечивать информацией всю систему как в настоящем, так и в будущем с учетом ее развития.

    2) Разработка банка данных должна ориентироваться на эффективное обслуживание запросов пользователей. В связи с этим необходимо анализировать типы и виды запросов пользователей. Также необходимо анализировать функциональные задачи автоматизированной системы, для которой этот банк будет являться источником информации.

    Пользователи банка данных различаются по следующим признакам:

· по признаку постоянства общения с банком. Пользователи: постоянные и разовые;

· по уровню допуска. Часть данных должна быть защищена;

· по форме представления запросов. Запросы могут давать программисты, непрограммисты, пользователи задачи.

В связи с большой разнородностью пользователей в банке данных предусматривается специальное средство, позволяющее привести все запросы к единой терминологии. Это средство называется словарь данных.

Выделим основные требования, которым должен отвечать банк данных со стороны внешних пользователей. Банк данных должен:

1. Обеспечивать возможность хранения и модификации больших объемов многоаспектной информации. Удовлетворять сегодняшним и вновь возникающим требованиям со стороны пользователя.

2. Обеспечивать заданные уровни достоверности и непротиворечивости хранимой информации.

3. Обеспечивать доступ к данным только тех пользователей, которые имеют соответствующие полномочия.

4. Обеспечивать возможность поиска информации по произвольной группе признаков.

5. Удовлетворять заданным требованиям производительности при обработке запросов.

6. Иметь возможность реорганизации и расширения при изменении границ предметной области.

7. Обеспечивать выдачу информации пользователю в различной форме.

8. Обеспечивать возможность одновременного обслуживания большого числа внешних пользователей.

Для удовлетворения этих требований необходимо вводить централизованное управление данными.

Выделим основные преимущества централизованного управления данными по сравнению с ранее используемым обеспечением.

1) Сокращение избыточности хранимых данных. Данные, которые используются несколькими приложениями структурируются (интегрируются) и хранятся в единственном экземпляре.

2) Устранение противоречивости хранимых данных. В связи с безизбыточностью данных устраняется ситуация, когда при фактическом изменении данного оно кажется измененным не во всех записях.

3) Многоаспектное использование данных при однократном их вводе.

4) Комплексная оптимизация на основе анализа требований пользователя. Выбираются такие структуры данных, которые обеспечивают наилучшее обслуживание.

5) Обеспечение возможности стандартизации. При этом облегчается обмен данными с другими автоматизированными системами, а также процедуры контроля и восстановления данными.

6) Обеспечение возможности санкционированного доступа к данным, т.е. наличие механизмов защиты данных.

Следует подчеркнуть, что основной проблемой централизованного управления данными является обеспечение независимости прикладных программ от данных. Это объясняется тем, что интеграция данных, оптимизация структур данных требуют изменения хранимого представления данных и метода доступа к данным.

Вывод: Главной отличительной чертой банка данных является наличие централизованного управления данными.

Структура банка данных

Банк данных является автоматизированной системой. Основными компонентами которой являются: база данных, система управления базой данных, администратор базы данных, словарь данных, вычислительная система и обслуживающий персонал.

 

 

 

 

 

Банк данных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

   

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вычисли-тельная система

 

База дан-ных

 

Система управления базой данных

 

Словарь данных

 

Админист-ратор базы данных

 

Обслужи-вающий персонал

 

 

 

 

 
 

 

 

 

 
 

 

 

 

 

 

 

 

 

 

 

Операции-онная система

 

Техничес-кие средства

 

 

 

 

 

 

 

                                                                 

 

Рассмотрим некоторые компоненты этой структуры.

База данных – это даталогическое представление информационной модели предметной области.

СУБД – это специальный пакет программ с помощью которого реализуется централизованное управление базой данных и обеспечивается доступ к данным. В каждой СУБД имеются трансляторы или интерпретаторы с языка описания данных (ЯОД) и языка манипулирования данными (ЯМД), которые едины для всего банка.

Схема данного – это описание структуры данных на каком-либо формализованном языке.

Язык описания данных – это язык высокого уровня, который предназначен для задания схемы базы данных. С его помощью описываются типы данных, их структура и связи между данными. В соответствии с полученным описанием данных СУБД может найти в базе требуемые данные, преобразовать их требуемым образом и передать их, например, в прикладную программу.

Язык манипулирования данными – представляет собой систему команд, таких как сортировка, добавление, удаление, поиск и т.д.

Схему взаимодействия прикладной программы с СУБД можно представить в виде:

 

Прикладная программа   СУБД
START . . . .   . . . . . .
Рабочая область    

Инициализация передачи

данных и их редактирование

 

СУБД на основе запроса прикладной программы, сформулированного на языке манипулирования данными, находит в базе требуемые данные, преобразует их и предает пользователю.

    Отметим, что именно в СУБД используются средства защиты данных как от сбоев технических средств, так и несанкционированного доступа. Наиболее простыми средствами защиты являются пароли файлов, в больших системах, как правило, применяются сложные программные процедуры защиты.  

Словарь данных – это специальная система в банке данных, которая предназначена для хранения единообразной централизованной информации обо всех ресурсах конкретного банка данных.

 

В словаре содержатся следующие сведения:

- об объектах, их свойствах и отношениях для конкретной предметной области;

- о данных, хранимых в базе: наименование, структура этих данных;

- коды защиты данных;

- источники информации и т.д.

 

Словарь позволяет уменьшить избыточность и противоречивость данных, использовать единую терминологию для данной предметной области.

Администратор базы данных – это лицо или группа лиц, которые реализуют управление базой данных. Если рассматривать банк данных как систему управления, то в качестве объекта управления выступает база данных, а в качестве управляющего органа – группа специалистов. Поэтому банк данных рассматривают как автоматизированную систему.

Основная функция администратора базы данных – это обеспечение структур данных, взаимосвязи между ними в форме удобной для конкретного пользователя, т.е. выполнение функции администрирования. Важнейшим требованием для эффективной работы администратора базы данных является независимость прикладных программ от самих данных. В основе метода обеспечения независимости лежит следующая идея: пользователям системы требуется информационное содержание данных, а не детали и особенности их построения в ЭВМ. Поэтому эти подробности в прикладную программу не помещают. Вся эта информация реализуется через языки ЯМД и ЯОД, либо через специализированные языки запросов.

 

Пользователь

П1

П2

П n

Комплекс системных программ

 
   

 
 

ПП1

    ПП2

ПП n

 
 

РО

    РО

РО

 

 

 
     

Внешний уровень

ВМД1

 

ВМД2

ВМД n

 
     

 

 
     

Концептуальный уровень

КМД

 
   

 

Внутренний уровень

ВнМД

 
                                   

 

 


ПП1…, ПП2  - прикладная программа

РО – рабочая область

ВМД- внешняя модель данных

КМД – концептуальная модель данных

ВнМД – внутренняя модель данных

ФБД – физическая база данных

 

Рассмотрим модели данных.

ВнМД или физическая модель – эта модель отражает особенности размещения баз данных во внешней памяти вычислительной системы. Модель содержит сведения о характеристиках устройств внешней памяти, форматах записей, индексов каталогов и т.п. Обычно при проектировании СУБД не разрабатывают программу манипулирования данными на физическом уровне, а используют программы методов доступа, имеющиеся в операционной системе. Такой подход обеспечивает независимость операций хранения и обработки данных от используемых технических средств.

ВМД – это уровень логического представления данных для каждого пользователя. ВМД отражает некоторую часть концептуальной модели данных, она имеет свою схему (подсхему). В базе данных имеется столько внешних схем, сколько требуется для описания различных внешних моделей. Такой подход позволяет упростить работу пользователей, т.к. каждый пользователь работает со своими данными, а также обеспечивает более надежную защиту данных.

КМД – это уровень глобального логического представления информационного содержания базы данных. КМД имеет свою схему.

Таким образом, в 3-х уровневой архитектуре банка данных СУБД реализует следующее отображение:

ВМД→КМД→ВнМД→ФБД

Следует отметить, что для унификации процессов обмена информацией между пользователями и системой, между администратором базы данных и системой, между моделями данных различных уровней в процессе проектирования разрабатываются соответствующие интерфейсы. Эти интерфейсы реализуются с помощью ЯОД, ЯМД.

Выводы:

1) 3-х уровневый подход к построению банков данных, включающий внешний, концептуальный и внутренний уровни, получил наибольшее распространение.

2) При таком подходе на внешнем уровне поддерживается модель предметной области для всех приложений. При этом форма соблюдается удобная для каждого пользователя. На концептуальной уровне поддерживается модель предметной области общая для всех приложений. На внутреннем уровне хранятся данные модели предметной области для всех приложений.

3) При такой архитектуре банк данных обладает высокой способностью адаптации к возможным изменениям не только в приложениях, но и в самих данных. Это обеспечивается изолированностью внешних и внутренних моделей данных. В основе такой изолированности лежит КМД. Схема КМД стабильна и поэтому может обеспечить долговременную работу всей системы.

Замечание. Кроме трех указанных уровней в банках данных существует еще один. Он является предшествующим этим трем. Модель этого уровня должна выражать информацию о предметной области в виде, независимом от используемой СУБД. Этот уровень называется инфологическим.

Рассмотрим этапы проектирования баз данных.

Процесс проектирования баз данных представляет собой сложный процесс проектирования отображения:

 

Описание предметной области   Схема ВнМД

 

Этапы проектирования баз данных представляют собой последовательную разработку схем вышеуказанных трех уровней.

1) Описание предметной области будущей базы данных.

а) Получение и анализ концептуальных требований пользователей.

б) Формализация и стандартизация этих требований.

в) Построение инфологической модели.

2) Выбор СУБД.

а) Формулировка требований к системе управления (требования со стороны концептуальной модели, со стороны кадровых экономических требований).

б) Выбор конкретных СУБД (СУБД претендентов), окончательный выбор СУБД.

3) Логический этап проектирования.

а) На этом этапе решается задача проектирования логической модели базы данных, а именно производится организация данных, выделенных на предыдущих этапах проектирования в форму, приемлемую для СУБД.

б) Разработка концептуальной схемы внешних моделей данных с учетом выбираемой СУБД.

4) Проектирование физической модели.

Производится выбор рациональной структуры хранения данных и методы доступа к этим данным.

1                     2                     3                              4

 

 


                                                                                       5

ПОСТАВКА

                                                                                    6

 

 

                                                                                         7

 

 

                                                                                             8

 

 

Исходная граф-схема локального

Представления

Недостаток. Нельзя представить информацию об отдельном поставщике, который в настоящее время поставок не выполняет.

Для этого вводим сущность «поставщик» и связь с «поставкой».

 


2

 

ПОСТАВЩИК

 

 

   

  ПОСТАВКА  

 

Достоинство. Используя связь «поставляет» можно определить, какой конкретно поставщик выполняет поставку.

Недостаток. Нет информации об отдельных товарах, если они отсутствуют в поставке.

Для этого необходимо ввести сущность «товар». Тогда граф-схема локального представления примет вид:

 



Поделиться:


Читайте также:




Последнее изменение этой страницы: 2021-12-15; просмотров: 31; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.149.251.154 (0.231 с.)