Системы управления базами данных. Языки описания и манипулирования данными. Стандартизация языков запросов. SQL и XML – стандарты. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Системы управления базами данных. Языки описания и манипулирования данными. Стандартизация языков запросов. SQL и XML – стандарты.



СУБД – программное средство, предназначенное для создания и обслуживания БД. Функции СУБД: 1. Непосредственное управление данными во внешней памяти. 2. Управление буферами оперативной памяти - СУБД обычно работают с БД значительного размера. Понятно, что если при обращении к любому элементу данных будет производиться обмен с внешней памятью, то вся система будет работать со скоростью устройства внешней памяти. Практически единственным способом реального увеличения этой скорости является буферизация данных в оперативной памяти. 3. Управление транзакциями - Транзакция - это последовательность операций над БД, рассматриваемых СУБД как единое целое. Либо транзакция успешно выполняется, и СУБД фиксирует (COMMIT) изменения БД, произведенные этой транзакцией, во внешней памяти, либо ни одно из этих изменений никак не отражается на состоянии БД. 4. Журнализация - Журнал - это особая часть БД, недоступная пользователям СУБД и поддерживаемая с особой тщательностью (иногда поддерживаются две копии журнала, располагаемые на разных физических дисках), в которую поступают записи обо всех изменениях основной части БД. 5. Поддержка языков БД - Чаще всего выделялись два языка - язык определения схемы БД (SDL - Schema Definition Language) и язык манипулирования данными (DML - Data Manipulation Language). SDL служил главным образом для определения логической структуры БД. DML содержал набор операторов манипулирования данными, т.е. операторов, позволяющих заносить данные в БД, удалять, модифицировать или выбирать существующие данные. К ним относятся: SELECT - отобрать строки из таблиц INSERT - добавить строки в таблицу UPDATE - изменить строки в таблице DELETE - удалить строки в таблице COMMIT - зафиксировать внесенные изменения ROLLBACK - откатить внесенные изменения. Массовое распространение SQL в различных, довольно сильно отличающихся диалектах привело к необходимости его стандартизации. В 1986 году ISO (Международная организация по стандартизации) и ANSI (Американский национальый институт стандартов) опубликовали стандарт SQL 86, который затем дважды - в 1989 и в 1992 годах - пересматривался. До последнего времени большинство СУБД поддерживали стандарт SQL92.Новый стандарт SQL99, при разработке именовавшийся как SQL3, стандартизировал объектные расширения языка SQL и некоторые процедурные расширения языка SQL. В стандарте SQL99 определено обязательное функциональное ядро (Core) и набор уровней расширенного соответствия. Уровни расширенного соответствия не являются обязательными для реализации в СУБД, претендующей на поддержку стандарта SQL99. СУБД может не поддерживать ни одного уровня расширенного соответствия или поддерживать любые из них. В настоящий момент стандарт SQL99 содержит следующие уровни соответствия: Функциональное ядро. Поддержка работы с датой/временем. Управление целостностью. Активные базы данных. На этом уровне соответствия определяется поддержка триггеров базы данных, хранимых в базе данных и выполняемых. Триггеры представляют собой фрагменты кода, выполняемые перед или после указанного изменения данных (такого как вставка строки, удаление или изменение строки). OLAP -Этот уровень соответствия определяет средства описания более сложных запросов. Базовая поддержка объектов (Basic Object Support). - Этот уровень соответствия стандартизирует использование объектов, вводя поддержку объектных типов данных, определяемых пользователем, применение типизированных таблиц (таблиц на базе объектных типов), использование массивов и ссылочных типов данных, а также переопределение внешних процедур. Расширенная поддержка объектов (Enhanced Object Support). - Этот уровень соответствия включает все возможности, предоставляемые уровнем базовой поддержки объектов, дополняя их поддержкой множественного наследования для типов данных, определяемых пользователем.

XML (eXtensible Markup Language) расширяемый язык разметки, в настоящее время устойчиво ассоциируется с понятием стандарта в форматах электронного обмена данными. XML - это метаязык, используемый для определения других, специфических для отдельной области или индустрии в целом, языков описания данных. Таким образом, создание различными разработчиками языков разметки в виде расширений языка XML, неизбежно приводит к появлению множества версий XML-документов, описывающих сходные данные. Стандартизация XML-форматов, как процесс, приводящий к разумной минимизации количества применяемых XML-расширений, является условием интеграции бизнес-приложений в технологиях B2B, B2C, B2P и так далее. В настоящее время вопросы применения XML относятся больше к области теоретических дискуссий и борьбы корпоративных форматов, а не практического его применения. Поэтому большинству разработчиков порой бывает трудно разобраться, какое из существующих расширений XML имеет смысл применять. Дело осложняется еще и тем, что до сих пор нет широко распространенных программных продуктов для работы с XML-документами. Чем сейчас, в основном, могут воспользоваться широкие массы разработчиков: постоянно растущим набором языков описания (например, XML Schema), рабочими версиями отраслевых форматов, парсерами XML-документов и разрозненными версиями XML-серверов. А для практического применения XML необходимо самостоятельно расширять словарь метаданных и дорабатывать программное обеспечение для обработки XML-документов. Поэтому перед многими разработчиками остро стоит вопрос – каким стандартам и программным средствам следует отдать предпочтение, прежде чем решиться идти на затраты, связанные с вхождением в технологию XML.

 

 

Типология баз данных. Документальные базы данных. Фактографические базы данных. Гипертекстовые и мультимедийные базы данных. Объектно-ориентированные базы данных. Распределенные базы данных. Коммерческие базы данных. Информационные хранилища. ОLАР-технология.

Типология БД:

1.По форме представляемой информации можно выделить фактографические, документальные и мультимедийные БД. Особенностью фактографической информации является практическая очевидность (минимальная неопределённость, не требующая использования сложных или нечётких процедур) идентификации и интерпретации факта, как его имени, так и состояния. Документальная информация отличается неопределённостью или переменной структурой данных (документов). Т.е. инф-я в БД содержит определенный набор полей. 2. По типу хранимой информации можно выделить фактографические, документальные, лексикографические БД. Лексикографические базы – это классификаторы, кодификаторы, словари основ слов, тезаурусы, рубрикаторы и т.д., обычно используемые в качестве справочных совместно с документальными или фактографическими БД. Документальные подразделяются по уровню представления инф-и: полнотекстовые(обрабатывают документ на первичном уровне) и библиографические-реферативные(вырабатывают вторичные документы). 3. По типу используемой модели данных традиционно выделяют: иерархические, сетевые, реляционные. Иерархические и сетевые модели данных называют ещё навигационными. Иерархическая м одель вообще реализовывалась средствами древовидных структур с корневыми сегментами, имеющими физический указатель на другие сегменты. Преимущество - уменьшение избыточности хранения инф-и. Одно из неудобств такой модели данных заключается в том, что реальный мир не может быть легко представлен в виде древовидной структуры с единственным корневым сегментом. Пример – файловая структура каталога. Сетевая модель данных –реализуется графовыми структурами(графы). Она позволяет более гибко описывать предметные области. Недостатки такие же как у иерархической + она имеет сложную структуру. Здесь, как и в иерархических БД, ассоциации поддерживаются с помощью физических указателей. Примером этой модели является Интернет. Реляционная модель –подразумевает единственную структуру – отношения. Достоинства: простота, наличие мощного математического аппарата (реляц-я алгебра, реляц-е исчисление), поддерживает ненавигационный способ доступа к данным, поддержка унифицированного языка доступа к данным. Недостатки: не все предметные области легко описываются набором отношений, реляц-я модель хранит мало инф-и о связях между объектами предменой области. 4. По типологии доступа и характеру использования хранимой информации: специализированные и интегрированные БД. 5. По топологии хранения данных: локальные и распределённые БД. 6. По степени доступности: общедоступные и с ограниченным доступом пользователей к БД. 7. По способу организации инф-го фонда – бд с файловой с-й, прикладные, предметные.

Гипертекстовая база данных - текстовая база данных, записи в которой содержат связи с другими записями, позволяющими компоновать ансамбли записей на основе их логической связанности. Фактографическая база данных — хранят и обрабатывают сведения об объектах пред. Области, представленных в виде сообщений строго регламент-й стр-ры и имеющие простой смысл. Документографические БД содержат описания документов. В зависимости от содержания описания различают документографические БД типов БО (только библиографическое описание документа), БК (библиографическое описание и ключевые слова) и БКР (библиографическое описание, ключевые слова, реферат или аннотация). Появились также полнотекстовые БД, содержащие полные тексты документов, которые являются собственно документальными. Объектно-ориентированные базы данных (ООБД) строятся из объектов. Объекты хранятся физически как строки или столбцы таблицы. В этом случае реляционную модель можно рассматривать как «таблично-ориентированную» модель данных, так как соответствующие ей БД строятся из таблиц. В ООБД важнейшее место отводится объектам, на основе которых могут определяться другие объекты благодаря использованию концепции, называемой наследованием. Каждый объект имеет состояние и поведение. Состояние объекта - набор значений его атрибутов. Поведение объекта - набор методов (программный код), оперирующих над состоянием объекта, причем каждый объект имеет уникальный набор методов. Значение атрибута объекта - это тоже некоторый объект или множество объектов. Состояние и поведение объекта инкапсулированы в объекте; взаимодействие между объектами производится на основе передачи сообщений и выполнении соответствующих методов. Распределенная база данных - совокупность баз данных, физически распределенная по взаимосвязанным ресурсам вычислительной сети и доступная для совместного использования. Основная задача систем управления распределенными базами данных состоит в обеспечении средства интеграции локальных баз данных, располагающихся в некоторых узлах вычислительной сети, с тем, чтобы пользователь, работающий в любом узле сети, имел доступ ко всем этим базам данных как к единой базе данных. При этом должны обеспечиваться: 1) простота использования системы; 2) возможности автономного функционирования при нарушениях связности сети или при административных потребностях; 3) высокая степень эффективности. Коммерческая база д-х – Коммерческие базы данных представляют собой базы данных, специально предназначенные для продажи пользователям.напр Oracle.

Хранилище данных – это предметно-ориентированный, интегрирован­ный, поддерживающий хронологию набора данных, организованный для целью управления и призванные выступать в роли единственного источника инф-и, обеспечив-го менеджеров и аналитиков достоверными сведениями.

OLAP (англ. OnLine Analytical Processing, аналитическая обработка в реальном времени) — технология обработки информации, включающая составление и динамическую публикацию отчётов и документов. Используется аналитиками для быстрой обработки сложных запросов к базе данных. Служит для подготовки бизнес-отчетов по продажам, маркетингу, в целях управления, т. н. data mining — добыча данных. Причина использования OLAP для обработки запросов — это скорость. Реляционные БД хранят сущности в отдельных таблицах, которые обычно хорошо нормализованы. Эта структура удобна для операционных БД (системы OLTP), но сложные многотабличные запросы в ней выполняются относительно медленно. OLAP делает мгновенный снимок реляционной БД и структурирует её в пространственную модель для запросов. OLAP-структура, созданная из рабочих данных, называется OLAP-куб. Куб создаётся из соединения таблиц с применением схемы звезды. В центре «звезды» находится таблица фактов, которая содержит ключевые факты, по которым делаются запросы. Множественные таблицы с измерениями присоединены к таблице фактов. Эти таблицы показывают, как могут анализироваться агрегированные реляционные данные. Количество возможных агрегирований определяется количеством способов, которыми первоначальные данные могут быть иерархически отображены. Куб потенциально содержит всю информацию, которая может потребоваться для ответов на любые запросы. Из-за громадного количества агрегатов, зачастую полный расчёт происходит только для некоторых измерений, для остальных же производится «по требованию». Сложность в применении OLAP состоит в создании запросов, выборе базовых данных и разработке схемы, в результате чего большинство современных продуктов OLAP поставляются вместе с огромным количеством предварительно настроенных запросов. Другая проблема — в базовых данных. Они должны быть полными и непротиворечивыми.



Поделиться:


Последнее изменение этой страницы: 2016-08-26; просмотров: 471; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.219.14.63 (0.008 с.)