ТОП 10:

Типы данных, используемые в реляционной модели



Типы данных, используемые в реляционной модели

Домены

В реляционной модели данных с понятием тип данных тесно связано понятие домена, которое можно считать уточнением типа данных.

Домен- это семантическое понятие. Домен можно рассматривать как подмножество значений некоторого типа данных имеющих определенный смысл. Домен характеризуется следующими свойствами:

· Домен имеет уникальное имя (в пределах базы данных)

· Домен определен на некотором простом типе данных или на другом домене

· Домен может иметь некоторое логическое условие , позволяющее описать подмножество данных, допустимых для данного домена

· Домен несет определенную смысловую нагрузку

Например, домен , имеющий смысл "возраст сотрудника" можно описать как следующее подмножество множества натуральных чисел:

Если тип данных можно считать множеством всех возможных значений данного типа, то домен напоминает подмножество в этом множестве.

Отличие домена от понятия подмножества состоит именно в том, что домен отражает семантику , определенную предметной областью. Может быть несколько доменов, совпадающих как подмножества, но несущие различный смысл. Основное значение доменов состоит в том, что домены ограничивают сравнения . Некорректно, с логической точки зрения, сравнивать значения из различных доменов, даже если они имеют одинаковый тип. В этом проявляется смысловое ограничение доменов. Синтаксически правильный запрос "выдать список всех деталей, у которых вес детали больше имеющегося количества" не соответствует смыслу понятий "количество" и "вес".

Свойства отношений

Свойства отношений непосредственно следуют из приведенного выше определения отношения. В этих свойствах в основном и состоят различия между отношениями и таблицами.

1. В отношении нет одинаковых кортежей . Таблицы в отличие от отношений могут содержать одинаковые строки.

2. Кортежи не упорядочены (сверху вниз) . Действительно, несмотря на то, что мы изобразили отношение "Сотрудники" в виде таблицы, нельзя сказать, что сотрудник Иванов "предшествует" сотруднику Петрову. Причина та же - тело отношения есть множество, а множество не упорядочено. Это вторая причина, по которой нельзя отождествить отношения и таблицы - строки в таблицах упорядочены. Одно и то же отношение может быть изображено разными таблицами, в которых строки идут в различном порядке .

3. Атрибуты не упорядочены (слева направо) . Т.к. каждый атрибут имеет уникальное имя в пределах отношения, то порядок атрибутов не имеет значения. Это свойство несколько отличает отношение от математического определения отношения (см. гл.1 - компоненты кортежей там упорядочены ). Это также третья причина, по которой нельзя отождествить отношения и таблицы - столбцы в таблице упорядочены. Одно и то же отношение может быть изображено разными таблицами, в которых столбцы идут в различном порядке .

4. Все значения атрибутов атомарны . Это следует из того, что лежащие в их основе атрибуты имеют атомарные значения. Это четвертое отличие отношений от таблиц - в ячейки таблиц можно поместить что угодно - массивы, структуры, и даже другие таблицы.

 

3.Ключи (PK,AK, FK)

Проектируя БД, мы сталкиваемся с такими проблемами, как протеворечивость, дублирование, недостоверность, неполнота данных, и справиться с этими проблемами нам помогает введение ограничений в виде ключей:

Первичный ключ (primary key) - это атрибут или группа атрибутов, однозначно идентифицирующая экземпляр сущности.

Потенциальный ключ. В одной сущности могут оказаться несколько атрибутов или наборов атрибутов, претендующих на роль первичного ключа. Такие претенденты называются потенциальными ключами (candidate key).

Ключи могут быть сложными, т. е. содержащими несколько атрибутов.

Альтернативный ключ (Alternate Key) - это потенциальный ключ, не ставший первичным. Каждая сущность должна иметь по крайней мере один потенциальный ключ. Многие сущности имеют только один потенциальный ключ. Такой ключ становится первичным. Некоторые сущности могут иметь более одного возможного ключа. Тогда один из них становится первичным, а остальные - альтернативными ключами.

Некоторые значения не должны быть произвольными, они должны браться из списка. для этого есть внешний ключ. О: атрибут или группа атрибутов называется внешним ключом отношения R, если 1)сущ-т отнош-е S с потенц.ключом К

2)для любого кортежа r из R выполняется: либо а)сущ.кортеж s из S: FK(r)=K(s) или б)FK(r)=NULL, т.е. для любого значения внешнего ключа должна найтись строчка (уникальная) в другом отношении, у к-й значение ПК совпадает со значением внешнего ключа.

 

4.Целостность реляц.данных. трехзначная логика.

ц. – корректность, непротиворечивость, завершенность.

1. – NULL – значение специальное для обозначения какого-либо среднего ответа в ячейке БД. неопределенное, неизвестное. в ПК такого значения быть не может.

2. потенц.кл. – нельзя добавить противоречащую ключу запись.

3.внешние ключи – можно добавить не произвольные данные, а связанные с данными в другой таблице.

Ссы́лочная це́лостность (англ. referential integrity) — необходимое качество реляционной базы данных, заключающееся в отсутствии в любом её отношении внешних ключей, ссылающихся на несуществующие кортежи.

 

5.Нормальзация, функц. зависимости

Нормализация – это разбиение таблицы(декомпозиция) на две или более, обладающих лучшими свойствами при добавлении, изменении и удалении данных.

Окончательная цель нормализации сводится к получению такого проекта базы данных, в котором каждый факт появляется лишь в одном месте, т.е. исключена избыточность информации. Это делается не столько с целью экономии памяти, сколько для исключения возможной противоречивости хранимых данных.

функциональная зависимость данных- ограничения на возможные взаимосвязи между данными, которые могут быть текущими значениями схемы отношений. Обозначается: X→Y

Говорится: «X функционально определяет Y» или «Y функционально зависит от X».

Левая часть выражения называется детерминантом (детерминантой)функциональной зависимости (ФЗ), правая – зависимой частьюФЗ.

 

6.Нормальные формы отношений.

1нф – отношение находится в 1 нф, если выполняются все свойства отношения.

2 нф – отношение нах-ся в 2 нф, если нет неключевых атрибутов, зависящих от части сложного ключа.

О: Атрибут (группа атрибутов) У зависит от атр(гр.атр) Х, если для любого сост-я отн-я Р для всех кортежей р1,р2 из Р, р1(х)= р2(х) => р1(у)=р2(у).

следствие: отношение с простым PK уже находится во 2 нф.

3нф – отношение находится в 3 нф тогда и только тогда, когда нах-ся во 2 нф и все неключевые атрибуты взаимно независимы.

нфбк – отнощение находится в нФ Бойса-Кодда, ó детерминанты всех функц.зависимостей явл-ся потенц.ключом.

7.Язык sql.

Основу языка SQL составляют операторы, условно разбитые не несколько групп по выполняемым функциям:

­ Операторы DDL (Data Definition Language) - операторы определения объектов базы данных.

­ Операторы DML (Data Manipulation Language) - операторы манипулирования данными.

­ Операторы защиты и управления данными, и др.

Операторы DDL (Data Definition Language) - операторы определения объектов базы данных

к ним относятся create, drop, alter (table, view,..)

Операторы DML (Data Manipulation Language) - операторы манипулирования данными:

­ SELECT - отобрать строки из таблиц

­ INSERT - добавить строки в таблицу

­ UPDATE - изменить строки в таблице

­ DELETE - удалить строки в таблице

­ COMMIT - зафиксировать внесенные изменения

­ ROLLBACK - откатить внесенные изменения

8. Select использование имен корелляции

Использование имен корреляции (алиасов, псевдонимов)
Иногда приходится выполнять запросы, в которых таблица соединяется сама с собой, или одна таблица соединяется дважды с другой таблицей. При этом используются имена корреляции (алиасы, псевдонимы), которые позволяют различать соединяемые копии таблиц. Имена корреляции вводятся в разделе FROM и идут через пробел после имени таблицы. Имена корреляции должны использоваться в качестве префикса перед именем столбца и отделяются от имени столбца точкой. Если в запросе указываются одни и те же поля из разных экземпляров одной таблицы, они должны быть переименованы для устранения неоднозначности в именованиях колонок результатирующей таблицы. Определение имени корреляции действует только во время выполнения запроса.
Пример 19. Отобрать все пары поставщиков таким образом, чтобы первый поставщик в паре имел статус, больший статуса второго поставщика:
SELECT
P1.PNAME AS PNAME1,
P1.PSTATUS AS PSTATUS1,
P2.PNAME AS PNAME2,
P2.PSTATUS AS PSTATUS2
FROM
P P1, P P2
WHERE P1.PSTATUS1 > P2.PSTATUS2;
В результате получим следующую таблицу:
PNAME1 PSTATUS1 PNAME2 PSTATUS2
Иванов 4 Петров 1
Иванов 4 Сидоров 2
Сидоров 2 Петров 1

Оператор объединения

Реляционная алгебра:

Оператор SQL:

SELECT * FROM A UNION SELECT * FROM B;

Оператор вычитания

Реляционная алгебра:

Оператор SQL:SELECT * FROM A EXCEPT SELECT * FROM B

Реляционный оператор переименования RENAME выражается при помощи ключевого слова AS в списке отбираемых полей оператора SELECT. Таким образом, язык SQL является реляционно полным.

Остальные операторы реляционной алгебры (соединение, пересечение, деление) выражаются через примитивные, следовательно, могут быть выражены операторами SQL. Тем не менее, для практических целей приведем их.

Оператор пересечения

Реляционная алгебра:

Оператор SQL:

SELECT * FROM A INTERSECT SELECT * FROM B;

Транзакции и блокировки

Под транзакцией понимается неделимая с точки зрения воздействия на БД последовательность операторов манипулирования данными (чтения, удаления, вставки, модификации), приводящая к одному из двух возможных результатов: либо последовательность выполняется, если все операторы правильные, либо вся транзакция откатывается, если хотя бы один оператор не может быть успешно выполнен. Обработка транзакций гарантирует целостность информации в базе данных. Таким образом, транзакция переводит базу данных из одного целостного состояния в другое.

транзакция мб подтверждена (коммит) или откачела (роллбак)

Транзакции также составляют основу изолированности в многопользовательских системах, где с одной БД параллельно могут работать несколько пользователей или прикладных программ. Одна из основных задач СУБД – обеспечение изолированности, т.е. создание такого режима функционирования, при котором каждому пользователю казалось бы, что БД доступна только ему. Такую задачу СУБД принято называть параллелизмом транзакций.

При выполнении транзакции система управления базами данных должна придерживаться определенных правил обработки набора команд, входящих в транзакцию. В частности, разработано четыре правила, известные как требования ACID, они гарантируют правильность и надежность работы системы.

ACID-свойства транзакций

Характеристики транзакций описываются в терминах ACID (Atomicity, Consistency, Isolation, Durability – неделимость, согласованность, изолированность, устойчивость).

  • Транзакция неделима в том смысле, что представляет собой единое целое. Все ее компоненты либо имеют место, либо нет. Не бывает частичной транзакции. Если может быть выполнена лишь часть транзакции, она отклоняется.
  • Транзакция является согласованной, потому что не нарушает бизнес-логику и отношения между элементами данных. Это свойство очень важно при разработке клиент-серверных систем, поскольку в хранилище данных поступает большое количество транзакций от разных систем и объектов. Если хотя бы одна из них нарушит целостность данных, то все остальные могут выдать неверные результаты.
  • Транзакция всегда изолирована, поскольку ее результаты самодостаточны. Они не зависят от предыдущих или последующих транзакций – это свойство называется сериализуемостью и означает, что транзакции в последовательности независимы.
  • Транзакция устойчива. После своего завершения она сохраняется в системе, которую ничто не может вернуть в исходное (до начала транзакции) состояние, т.е. происходит фиксация транзакции, означающая, что ее действие постоянно даже при сбое системы. При этом подразумевается некая форма хранения информации в постоянной памяти как часть транзакции.

Блокировка представляет собой метод управления параллельными процессами, при котором объект БД не может быть модифицирован без ведома транзакции, т.е. происходит блокирование доступа к объекту со стороны других транзакций, чем исключается непредсказуемое изменение объекта. Различают два вида блокировки: exclusive, non-exclusive.

16. Объекты схемы СУБД oracle.

Триггер - это механизм, позволяющий создавать процедуры, которые будут автоматически запускаться при выполнении команд INSERT, UPDATE или DELETE. Триггеры позволяют ужесточить политику ограничений, а также автоматизировать некоторые функции.

Транзакция - логически-завершенный фрагмент последовательности действий (одна или более SQL-команд, завершенных фиксацией или откатом). Производительность системы СУБД часто оценивается числом производимых транзакций в секунду или в минуту.

Объекты схемы - это абстракция (логическая структура) составляющих базы данных. Объекты схемы состоят из: индексов, кластеров, пакетов, последовательностей, хранимых процедур, синонимов, таблиц, представлений и т.д.

Таблица - основная единица хранения данных БД Oracle. Состоит из имени таблицы, строк и столбцов. Каждый столбец также имеет имя и тип данных. Таблицы хранятся в табличных пространствах, причем, часто, в одном табличном пространстве находятся несколько таблиц.

Кластер - набор таблиц, которые физически хранятся как одна и имеют общие столбцы. Использование кластеров крайне эффективно, если часто обрабатываются запросы к данным двух и более таблиц, имеющих общие столбцы. К таблицам можно обращаться по отдельности даже в том случае, если они являются частью кластерной таблицы.

Индекс - структура, которая позволяет извлекать данные быстро и эффективно (точно также как содержание какой-либо книги позволяет найти интересующий раздел). Индекс объявляется для одного или нескольких столбцов. Доступ к таблице происходит по проиндексированному столбцу
(столбцам).

Представление (вид) - это как бы рамка, окно для просмотра данных из одной или более таблиц. Вид не хранит никаких данных, он только представляет их. С видами можно делать те же операции, что и с таблицами (строить запросы, обновлять, удалять), но с некоторыми ограничениями. Представления часто используются, чтобы упростить восприятие пользователем хранящихся в базе данных путем извлечения из таблицы лишь части необходимых данных или набора данных из нескольких таблиц. Кроме того, представления могут использоваться для ограничения доступа пользователей к некоторым данным. Физически представление хранится в БД просто как текст запроса.

Хранимая процедура - это предопределенный SQL-запрос, хранимый в словаре данных. Хранимые процедуры разрабатываются для эффективного выполнения запросов. При использовании хранимых процедур можно уменьшить сетевой трафик СУРБД и, тем самым, увеличить
производительность.

Последовательность (sequence)- генератор последовательностей Oracle, используется для создания последовательности цифр в кэше. Пользоваться этим генератором гораздо удобнее чем формировать последовательности вручную, поскольку вручную придется хранить где-то информацию о последнем значении последовательности, создавать новое значение и изменять предыдущее. Одну и ту же последовательность можно использовать одновременно для нескольких таблиц.

 

17. альтернативные модели

18. Эрвин

Типы данных, используемые в реляционной модели

Домены

В реляционной модели данных с понятием тип данных тесно связано понятие домена, которое можно считать уточнением типа данных.

Домен- это семантическое понятие. Домен можно рассматривать как подмножество значений некоторого типа данных имеющих определенный смысл. Домен характеризуется следующими свойствами:

· Домен имеет уникальное имя (в пределах базы данных)

· Домен определен на некотором простом типе данных или на другом домене

· Домен может иметь некоторое логическое условие , позволяющее описать подмножество данных, допустимых для данного домена

· Домен несет определенную смысловую нагрузку

Например, домен , имеющий смысл "возраст сотрудника" можно описать как следующее подмножество множества натуральных чисел:

Если тип данных можно считать множеством всех возможных значений данного типа, то домен напоминает подмножество в этом множестве.

Отличие домена от понятия подмножества состоит именно в том, что домен отражает семантику , определенную предметной областью. Может быть несколько доменов, совпадающих как подмножества, но несущие различный смысл. Основное значение доменов состоит в том, что домены ограничивают сравнения . Некорректно, с логической точки зрения, сравнивать значения из различных доменов, даже если они имеют одинаковый тип. В этом проявляется смысловое ограничение доменов. Синтаксически правильный запрос "выдать список всех деталей, у которых вес детали больше имеющегося количества" не соответствует смыслу понятий "количество" и "вес".







Последнее изменение этой страницы: 2017-01-25; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 35.173.57.202 (0.014 с.)