Развитие основных понятий представления данных 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Развитие основных понятий представления данных



Развитие основных понятий представления данных

Задачи бывают двух видов:

- Вычислительные: Достаточно простое представление данных и сложный, многооперационный процесс вычислений;

- Задачи обработки данных: Простой алгоритм обработки данных и сложное представление обрабатываемых данных

Для описания представлений данных в невычислительных задачах вводится ряд новых понятий:

ü Элемент данных (поле) – наименьшая единица поименованных данных (fio, o, kod, s);

ü Запись – поименованная совокупность элементов данных (полей) (шапка таблицы);

ü Экземпляр записи – текущее значение элементов записи;

ü Файл - поименованная совокупность всех экземпляров записей заданного типа (вся таблица).

При эксплуатации нескольких файлов одновременно возникают принципиальные эксплуатационные недостатки:

1. Информация дублируется (fio, o), что приводит к существенному перерасходу памяти.

2. При внесении изменений (например, изменении фамилии) приходится вносить одно и тоже значение несколько раз в разные файлы, что приводит к увеличению затрат машинного времени.

3. Существует потенциальная возможность противоречивости данных (в один файл изменения внесены, в другой - нет).

Можно объединить все в один файл, объединив одинаковые записи, но возникает новая проблема – увеличение времени решения задачи, что в некоторых случаях совершенно недопустимо.

Тогда создаются два файла, связанные определенными полем. Так появилось понятие «базы данных».

 

Обзор СУБД

СУБД бывают локальными, встраиваемыми и серверными.

ВСТРАИВАЕМЫЕ: Может поставляться как составная часть некоторого программного продукта, не требуя процедуры самостоятельной установки.

Предназначена для локального хранения данных своего приложения и не рассчитана на коллективное использование в сети.

Физически чаще всего реализована в виде подключаемой библиотеки. Доступ к данным со стороны приложения может происходить через SQL либо через специальные программные интерфейсы.

ЛОКАЛЬНЫЕ: Сфера применения: государственные (муниципальные) учреждения, сфера образования, сфера обслуживания, малый и средний бизнес. Специфика возникающих там задач заключается в том, что объемы данных не являются катастрофически большими, частота обновлений не бывает слишком большой, организация территориально обычно расположена в одном небольшом здании, количество пользователей колеблется от одного до 10-15 человек.

Имеют относительно упрощенную архитектуру, в частности, функционируют в режиме файл-сервер, поддерживают не все возможные функции СУБД (например, не ведется журнал транзакций, отсутствует возможность автоматического восстановления базы данных после сбоев и т. п.).

Обладают всеми недостатками файл-серверной архитектуры

Достоинство – низкая цена.

СЕРВЕРНЫЕ: Недостаток – высокая стоимость.

Например:

Стоимость MS SQL Server: от 29 до 400 т. рублей.

Одно клиентское подключение: 7 т. Рублей.

Администрирование базы данных – это функция управления базой данных (БД). Лицо ответственное за администрирование БД называется “Администратор базы данных” (АБД).

Администратор базы данных (АБД) – это лицо, отвечающее за выработку требований к базе данных, её проектирование, реализацию, эффективное использование и сопровождение, включая управление учётными записями пользователей БД и защиту от несанкционированного доступа, а так же поддержку целостности базы данных.

Иерархическая модель данных

Иерархические базы данных - самая ранняя модель представления сложной структуры данных.

Информация в иерархической базе организована по принципу древовидной структуры, в виде отношений "предок- потомок ". Каждая запись может иметь не более одной родительской записи и несколько подчиненных. Связи записей реализуются в виде физических указателей с одной записи на другую.

Основной недостаток иерархической структуры базы данных - невозможность реализовать отношения " многие-ко-многим ", а также ситуации, когда запись имеет несколько предков.

Иерархические базы данных графически могут быть представлены как перевернутое дерево, состоящее из объектов различных уровней. Верхний уровень (корень дерева) занимает один объект, второй - объекты второго уровня и так далее.)

Между объектами существуют связи, каждый объект может включать в себя несколько объектов более низкого уровня. Такие объекты находятся в отношении предка (объект, более близкий к корню) к потомку (объект более низкого уровня), при этом объект -предок может не иметь потомков или иметь их несколько, тогда как объект - потомок обязательно имеет только одного предка. Объекты, имеющие общего предка, называются близнецами.

Иерархической базой данных является Каталог папок Windows.

Организация данных в СУБД иерархического типа определяется в терминах: элемент, запись (группа), групповое отношение, база данных.

Операции над данными, определенные в иерархической модели:

• Добавить в базу данных новую запись. Для корневой записи обязательно формирование значения ключа.

• Изменить значение данных предварительно извлеченной записи. Ключевые данные не должны подвергаться изменениям.

• Удалить некоторую запись и все подчиненные ей записи.

• Извлечь корневую запись по ключевому значению, допускается также последовательный просмотр корневых записей.

• Извлечь следующую запись (следующая запись извлекается в порядке левостороннего обхода дерева).

В операции ИЗВЛЕЧЬ допускается задание условий выборки (например, извлечь сотрудников с окладом более 10 тысяч руб.)

Достоинства иерархической модели данных:

1. Контроль целостности данных поддерживается автоматически (правило целостности: потомок не может быть без родителя, а у некоторых родителей может не быть потомков).

2. Эффективное использование памяти ЭВМ.

3. Хорошие показатели времени выполнения операций над данными.

4. Очень удобна для работы с иерархически упорядоченной информацией

Недостатки иерархической модели данных:

1. Громоздкость для обработки информации с достаточно сложными логическими связями.

2. Необходимость дублирования данных.

3. Не предусмотрена поддержка соответствия между парными записями

4. Сложность понимания для обычного пользователя.

Сетевая модель данных

Сетевая модель данных позволяет отображать разнообразные взаимосвязи элементов данных в виде произвольного графа, обобщая тем самым иерархическую модель.

Для описания схемы сетевой БД используется две группы типов: «запись» и «связь». Тип «запись» определяется для двух типов «запись»: предка и потомка. Количество предков у каждой «записи» не ограничивается (сводные родители).

Каждый экземпляр группового отношения характеризуется следующими признаками:

Режим включения подчиненных записей:

ü автоматический - невозможно занести в БД запись без того, чтобы она была сразу же закреплена за неким владельцем;

ü ручной - позволяет запомнить в БД подчиненную запись и не включать ее немедленно в экземпляр группового отношения. Эта операция позже инициируется пользователем

Режим исключения.

Принято выделять три класса членства подчиненных записей в групповых отношениях:

• Фиксированное. Подчиненная запись жестко связана с записью владельцем и ее можно исключить из группового отношения только удалив. При удалении записи-владельца все подчиненные записи автоматически тоже удаляются.

• Обязательное. Допускается переключение подчиненной записи на другого владельца, но невозможно ее существование без владельца. Для удаления записи-владельца необходимо, чтобы она не имела подчиненных записей с обязательным членством.

• Необязательное. Можно исключить запись из группового отношения, но сохранить ее в базе данных не прикрепляя к другому владельцу. При удалении записи-владельца ее подчиненные записи - необязательные члены сохраняются в базе, не участвуя более в групповом отношении такого типа.

Операции:

• Добавить - внести запись в БД и, в зависимости от режима включения, либо включить ее в групповое отношение, где она объявлена подчиненной, либо не включать ни в какое групповое отношение.

• Включить в групповое отношение - связать существующую подчиненную запись с записью-владельцем.

• Переключить-связать существующую подчиненную запись с другой записью-владельцем в том же групповом отношении

• Обновить-изменить значение элементов предварительно извлеченной записи.

• Извлечь- извлечь записи последовательно по значению ключа, а также используя групповые отношения - от владельца можно перейти к записям - членам, а от подчиненной записи к владельцу набора

• Удалить-убрать из БД запись. Если эта запись является владельцем группового отношения, то анализируется класс членства подчиненных записей. Обязательные члены должны быть предварительно исключены из группового отношения, фиксированные удалены вместе с владельцем, необязательные останутся в БД.

• Исключить из группового отношения - разорвать связь между записью-владельцем и записью-членом.

Достоинства:

1. Хорошие показатели по затратам памяти и оперативности обработки данных.

2. Более эффективная работа с данными имеющими сложные логические связи.

Недостатки:

1. Высокая сложность и жёсткость схемы БД.

2. Ослаблен контроль целостности данных.

3. Сложность для понимания и выполнения обработки информации в БД обычным пользователем.

Многомерная модель данных

Многомерный подход к представлению данных в базе появился практически одновременно с реляционным, но интерес к ним стал приобретать массовый характер с середины 90-х.

Реляционные СУБД предназначались для информационных систем оперативной обработки и в этой области весьма эффективны. В системах аналитической обработки они показали себя несколько неповоротливыми и недостаточно гибкими. Более эффективными здесь оказываются многомерные СУБД (МСУБД).

Многомерные СУБД являются узкоспециализированными СУБД, предназначенными для интерактивной аналитической обработки информации.

Основными понятиями, используемые в этих СУБД являются:

• агрегируемость;

• историчность;

• прогнозируемость данных

Агрегируемость данных означает рассмотрение информации на различных уровнях ее обобщения. В ИС степень детальности представления информации зависит от уровня пользователя: аналитик, пользователь-оператор, управляющий, руководитель.

Историчность данных предполагает обеспечение высокого уровня статичности собственно данных и их взаимосвязей, а также обязательность привязки ко времени.

Прогнозируемость данных подразумевает задание функций прогнозирования и применение их к различным временным интервалам.

Достоинства:

Удобство и эффективность аналитической обработки больших объёмов данных, связанных со временем.

Недостатки:

Громоздкость для обычных задач оперативной обработки информации.

Основные понятия реляционной алгебры

Основная идея реляционной алгебры состоит в том, что коль скоро отношения являются множествами, то средства манипулирования отношениями могут базироваться на традиционных теоретико-множественных операциях, дополненных некоторыми специальными операциями, специфичными для баз данных.

  • При выполнении операции объединения двух отношений производится отношение, включающее все кортежи, входящие хотя бы в одно из отношений-операндов.
  • Операция пересечения двух отношений производит отношение, включающее все кортежи, входящие в оба отношения-операнда.
  • Отношение, являющееся разностью двух отношений включает все кортежи, входящие в отношение - первый операнд, такие, что ни один из них не входит в отношение, являющееся вторым операндом.
  • При выполнении прямого произведения двух отношений производится отношение, кортежи которого являются конкатенацией (сцеплением) кортежей первого и второго операндов.
  • Результатом ограничения отношения по некоторому условию является отношение, включающее кортежи отношения-операнда, удовлетворяющее этому условию.
  • При выполнении проекции отношения на заданный набор его атрибутов производится отношение, кортежи которого производятся путем взятия соответствующих значений из кортежей отношения-операнда.
  • При соединении двух отношений по некоторому условию образуется результирующее отношение, кортежи которого являются конкатенацией кортежей первого и второго отношений и удовлетворяют этому условию.
  • У операции реляционного деления два операнда - бинарное и унарное отношения. Результирующее отношение состоит из одноатрибутных кортежей, включающих значения первого атрибута кортежей первого операнда таких, что множество значений второго атрибута (при фиксированном значении первого атрибута) совпадает со множеством значений второго операнда.
  • Операция переименования производит отношение, тело которого совпадает с телом операнда, но имена атрибутов изменены.
  • Операция присваивания позволяет сохранить результат вычисления реляционного выражения в существующем отношении БД.

Основные понятия реляционного исчисления

Если сформулировать тот же запрос с использованием реляционного исчисления, то мы получили бы формулу, которую можно было бы прочитать, например, следующим образом:

-Выдать СОТР_ИМЯ и СОТР_НОМ для сотрудников таких, что существует отдел с таким же значением ОТД_НАЧ и значением ОТД_КОЛ большим 3.

Во второй формулировке мы указали лишь характеристики результирующего отношения, но ничего не сказали о способе его формирования. В этом случае система должна сама решить, какие операции и в каком порядке нужно выполнить над отношениями СОТРУДНИКИ и ОТДЕЛЫ.

Обычно говорят, что алгебраическая формулировка является процедурной, т.е. задающей правила выполнения запроса, а логическая - описательной (или декларативной), поскольку она всего лишь описывает свойства желаемого результата. Как мы указывали в начале лекции, на самом деле эти два механизма эквивалентны и существуют не очень сложные правила преобразования одного формализма в другой.

 

Этапы создания БД в Access

Этапы проектирования РБД:

1. Построение информационно-логической модели данных предметной области

2. Определение структуры РБД

3. Конструирование таблиц БД

4. Создание схемы данных

5. Ввод данных в таблицы

Порядок создания РБД:

1. Создать таблицы в режиме Конструктор

2. Установить связи между таблицами

3. Создать формы для таблиц

4. Заполнить таблицы РБД через формы

Создание таблицы в режиме КОНСТРУКТОР: в режиме КОНСТРУКТОР задаются названия и типы полей таблицы, формат данных.

Устанавливать связь между одноименными полями двух реляционных таблиц, проводя линию связи от КЛЮЧЕВОГО поля ГЛАВНОЙ таблицы к одноименному полю ПОДЧИНЕННОЙ.

Какая из таблиц главная должен определять разработчик базы данных.

В процессе создания связей 1:1 и 1:М необходимо задавать ОБЕСПЕЧЕНИЕ ЦЕЛОСТНОСТИ ДАННЫХ

Если установлены параметры каскадного обновления и удаления записей, то при корректировке пользователем данных в главной таблице Access будет автоматически производить корректировку данных в подчиненной таблице.

Если же установлен только параметр "Обеспечение целостности данных", то при попытке нарушить условие целостности данных Access выдает предупреждение.

 

Практическая часть

2.1. Запрос на выборку всех данных из таблицы:

SELECT * FROM Название_таблицы

2.2 Запрос на выборку данных с условием:

SELECT * FROM Сделка WHERE Количество>20

SELECT Название, Цена FROM Товар WHERE Цена>=100 And Цена<=150

SELECT Фамилия, ГородКлиента FROM Клиент WHERE ГородКлиента="Москва" Or ГородКлиента="Самара"

SELECT Название, Цена FROM Товар WHERE Цена BETWEEN 100 And 150 и т.д.

 

2.3 Запрос на выборку данных с группированием:

Вычислить средний объем покупок, совершенных каждым покупателем:

SELECT Клиент.Фамилия, Avg(Сделка.Количество)

AS Среднее_количество

FROM Клиент INNER JOIN Сделка

ON Клиент.КодКлиента=Сделка.КодКлиента

GROUP BY Клиент.Фамилия

Определить, на какую сумму был продан товар каждого наименования.

SELECT Товар.Название, Sum(Товар.Цена*Сделка.Количество)

AS Стоимость

FROM Товар INNER JOIN Сделка

ON Товар.КодТовара=Сделка.КодТовара

GROUP BY Товар.Название

 

2.4 Запрос на выборку данных по шаблону:

С помощью оператора LIKE можно выполнять сравнение выражения с заданным шаблоном, в котором допускается использование символов-заменителей:

• Символ * – вместо этого символа может быть подставлено любое количество произвольных символов.

• Символ? заменяет один символ строки.

• [] – вместо символа строки будет подставлен один из возможных символов, указанный в этих ограничителях.

• [^] – вместо соответствующего символа строки будут подставлены все символы, кроме указанных в ограничителях.

SELECT Клиент.Фамилия, Клиент.Телефон FROM Клиент

WHERE Клиент.Телефон LIKE '?4*‘

SELECT Клиент.Фамилия, Клиент.Телефон FROM Клиент

WHERE Клиент.Телефон LIKE '?[2-4]*‘

SELECT Клиент.Фамилия FROM Клиент

WHERE Клиент.Фамилия LIKE "*ро*"

2.5 Запрос на выборку данных с вычисляемым полем:

SELECT Товар.Название, Товар.Цена,

Сделка.Количество, Товар.Цена*Сделка.Количество AS Стоимость

FROM Товар INNER JOIN Сделка

ON Товар.КодТовара=Сделка.КодТовара

SELECT Фирма, Фамилия+" "+

Left(Имя,1)+"."+Left(Отчество,1)+"."AS ФИО FROM Клиент

SELECT Товар.Название, Year(Сделка.Дата)

AS Год, Month(Сделка.Дата) AS Месяц

FROM Товар INNER JOIN Сделка

ON Товар.КодТовара=Сделка.КодТовара

 

 

Развитие основных понятий представления данных

Задачи бывают двух видов:

- Вычислительные: Достаточно простое представление данных и сложный, многооперационный процесс вычислений;

- Задачи обработки данных: Простой алгоритм обработки данных и сложное представление обрабатываемых данных

Для описания представлений данных в невычислительных задачах вводится ряд новых понятий:

ü Элемент данных (поле) – наименьшая единица поименованных данных (fio, o, kod, s);

ü Запись – поименованная совокупность элементов данных (полей) (шапка таблицы);

ü Экземпляр записи – текущее значение элементов записи;

ü Файл - поименованная совокупность всех экземпляров записей заданного типа (вся таблица).

При эксплуатации нескольких файлов одновременно возникают принципиальные эксплуатационные недостатки:

1. Информация дублируется (fio, o), что приводит к существенному перерасходу памяти.

2. При внесении изменений (например, изменении фамилии) приходится вносить одно и тоже значение несколько раз в разные файлы, что приводит к увеличению затрат машинного времени.

3. Существует потенциальная возможность противоречивости данных (в один файл изменения внесены, в другой - нет).

Можно объединить все в один файл, объединив одинаковые записи, но возникает новая проблема – увеличение времени решения задачи, что в некоторых случаях совершенно недопустимо.

Тогда создаются два файла, связанные определенными полем. Так появилось понятие «базы данных».

 



Поделиться:


Последнее изменение этой страницы: 2017-01-26; просмотров: 153; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.146.221.52 (0.075 с.)