Основы баз данных и знаний. Системы управления базами данных 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Основы баз данных и знаний. Системы управления базами данных



3.7.1. Понятие базы данных и баз знаний

Хранение и накопление являются одними из основных действий, осуществляемых над информацией и главным средством обеспечения её доступности в течение какого-то времени. Для хранения и поиска информации существуют базы данных, лежащие в основе информационных систем (ИС).

Информационная система - это хранилище информации, снабженное процедурами ввода, поиска, размещения и выдачи информации. Наличие таких процедур - главная особенность информационных систем, отличающих их от простых скоплений информационных материалов.

База Данных (БД) — информационная модель, позволяющая в упорядоченном виде хранить данные о группе объектов с одинаковым набором свойств; поименованная совокупность структурированных данных, относящихся к определенной предметной области.

Предметная область — некоторая часть реально существующей системы, функционирующая как самостоятельная единица.

База данных — объективная форма представления и организации совокупности данных, систематизированных таким образом, чтобы эти данные могли быть найдены и обработаны с помощью ЭВМ.

Каждая ИС состоит из двух частей: базы данных (БД) и системы управления базами данных (СУБД).

Доступ к данным и управления ними происходит в среде специального программного пакету — системы управления базами данных (СУБД).

СУБД – это программное обеспечение (ПО), которое позволяет создавать БД, обновлять и дополнять информацию, обеспечивать гибкий доступ к информации. СУБД создает на экране компьютера определенную среду для работы пользователя (интерфейс), и имеет определенные режимы работы и систему команд

Система управления базами данных - это комплекс программных и языковых средств, необходимых для создания структуры баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации. Последовательность операций над данными, которая отслеживается СУБД от начала и до завершения называется транзакцией.

На настоящий момент существует множество различных СУБД. Наиболее широкую известность получили такие как Dbase, Clipper, FoxPro, Paradox, Microsoft Access.

 

База знаний (БЗ) (англ. Knowledge base, KB) — это особого рода база данных, разработанная для управления знаниями (метаданными), то есть сбором, хранением, поиском и выдачей знаний. Раздел искусственного интеллекта, изучающий базы знаний и методы работы со знаниями, называется инженерией знаний.

Под базами знаний понимает совокупность фактов и правил вывода, допускающих логический вывод и осмысленную обработку информации. В языке Пролог базы знаний описываются в форме конкретных фактов и правил логического вывода над базами данных и процедурами обработки информации, представляющих сведения и знания о людях, предметах, фактах событиях и процессах в логической форме.

Наиболее важным свойством информации, хранящейся в базах знаний, является достоверность конкретных и обобщенных сведений в базе данных и релевантности информации, получаемой с использованием правил вывода, заложенных в базу знаний. В ответах на простейшие запросы к базам знаний системы логического программирования Пролог, выдает значения «истина» и «ложь» в зависимости от наличия соответствующих фактов.

Наиболее важный параметр БЗ — качество содержащихся знаний. Лучшие БЗ включают самую релевантную, достоверную и свежую информацию, имеют совершенные системы поиска информации и тщательно продуманную структуру и формат знаний.

3.7.2. Классификация баз данных

По технологии обработки данных базы данных подразделяются на:

· централизованные

· распределенные

Централизованная база данных хранится в памяти одной вычислительной системы. Эта вычислительная система может быть мэйнфреймом — тогда доступ к ней организуется с использованием терминалов — или файловым сервером локальной сети ПК.

Распределенная база данных состоит из нескольких, возможно, пересекающихся или даже дублирующих друг друга частей, которые хранятся в различных ЭВМ вычислительной сети. Работа с такой базой осуществляется с помощью системы управления распределенной базой данных (СУРБД).

По способу доступа к данным базы данных разделяются на:

· базы данных с локальным доступом

· базы данных с сетевым доступом.

Для всех современных баз данных можно организовать сетевой доступ с многопользовательским режимом работы.

Централизованные базы данных с сетевым доступом могут иметь следующую архитектуру:

· файл-сервер;

· клиент-сервер базы данных;

· «тонкий клиент» — сервер приложений — сервер базы данных (трехуровневая архитектура).

Файл-сервер. Архитектура систем БД с сетевым доступом предполагает выделение одной из машин сети в качестве центральной (файловый сервер), на котором хранится большинство программ и данных. По требованию пользователя ему пересылаются необходимая программа и данные. Обработка информации выполняется на рабочей станции. (СУБД Microsoft Access, Borland Paradox)

 

Клиент-сервер. В этой архитектуре на выделенном сервере, работающем под управлением серверной операционной системы, устанавливается специальное программное обеспечение (ПО) — сервер БД, СУБД подразделяется на две части: клиентскую и серверную. Основа работы сервера БД — использование языка запросов (SQL). Запрос на языке SQL, передаваемый клиентом (рабочей станцией) серверу БД, порождает поиск и извлечение данных на сервере. Извлеченные данные транспортируются по сети от сервера к клиенту. Хранение данных и их обработка производится на мощном сервере, который выполняет также контроль за доступом к ресурсам и данным.

Рабочая станция получает только результаты запроса. Разработчики приложений по обработке информации обычно используют эту технологию. (СУБД MS SQL Server, Sybase, Oracle)

Тем самым количество передаваемой по сети информации уменьшается во много раз.

Трехуровневая архитектура функционирует в Интранет- и Интернет-сетях. Клиентская часть («тонкий клиент»), взаимодействующая с пользователем, представляет собой HTML-страницу в Web-браузере либо Windows-приложение, взаимодействующее с Web-сервисами. Вся программная логика вынесена на сервер приложений, который обеспечивает формирование запросов к базе данных, передаваемых на выполнение серверу баз данных. Сервер приложений может быть Web-сервером или специализированной программой (например, Oracle Forms Server)

По характеру хранимой информации

· документальные

· фактографические

Документальные БД содержат неструктурированные документы с информацией разного типа: текстовой, звуковой, графической, мультимедийной, представленной в виде файлов. Например, БД современной музыки может содержать тексты и ноты песен, фотографии авторов, звуковые записи, видеоклипы.

Единичным элементом данных в документальных БД является неструктурированный на более мелкие элементы документ.

Основная задача документальных информационных систем - хранение, накопление и предоставление пользователю документов, содержание, тематика, реквизиты которых соответствуют его информационным потребностям.

Фактографические БД содержат информацию, относящуюся непосредственно к предметной области (сотрудниках, подразделениях, книгах и т.д.). Сведения могут поступать из разных источников, они преобразовываются и хранятся в виде записей в точно определенном формате. Фактографическая информация представляется в виде числовых и буквенных данных о каких-либо характеристиках, элементах, материалах и других компонентах соответствующего объекта (вес, количество, размеры, стоимость и т.д.). Сюда же относятся данные, необходимые для расчетов (коэффициенты, таблицы, графики и т.п.).

 

3.7.3. Модели данных.

Данные, хранимые в базе имеют определённую структуру (модель), БД м.б. реляционными и нереляционными

· реляционная (совокупность таблиц, связанных между собой)

· иерархическая (в виде дерева);

· сетевая (данные хранятся в виде произвольного списка);

В иерархических базах данных существует строгая подчиненность элементов: один главный, остальные подчиненные.

Иерархическая модель БД представляет собой совокупность объектов различного уровня, причем объекты нижнего уровня подчинены объектам верхнего уровня (пример, Файловая структура).

Сетевойподход к организации данных является расширением иерархического. В сетевой модели данных любой объект может быть одновременно и главным, и подчиненным, и может участвовать в образовании любого числа взаимосвязей с другими объектами. Сетевая БД состоит из набора записей и набора связей между этими записями (пример, организация информации в Интернет WWW)

В реляционной модели данные разбиваются на наборы, которые составляют табличную структуру. Эта структура таблиц состоит из индивидуальных элементов данных, называемых полями. Одиночный набор или группа полей известна как запись.

Реляционная модель данных является совокупностью простейших двумерных таблиц – отношений (англ. relation), т.е. простейшая двумерная таблица определяется как отношение (множество однотипных записей объединенных одной темой).

3.7.4. Системы управления базами данных, возможности, разновидности

Системы управления базами данных (СУБД) – комплекс программных средств, предназначенных для организации и ведения базы данных: создания структуры новой базы, наполнения ее содержанием, редактирования содержимого и визуализации информации.

Существует много систем управления базами данных. Они могут по-разному работать с разными объектами и предоставляют пользователю разные функции и средства. Для каждой классификации БД, существуют свои СУБД

Основные функции СУБД:

· управление данными во внешней памяти (на дисках);

· управление данными в оперативной памяти с использованием дискового кэша;

· журнализация изменений, резервное копирование и восстановление базы данных после сбоев;

· поддержка языков БД (язык определения данных, язык манипулирования данными).

БД может содержать разные типы объектов. Каждая СУБД может реализовывать свои типы объектов.

Объекты файла БД для СУБД MS Access

Таблица – основная единица хранения информации в базе. Состоит из полей (столбцов) и записей (строк).

Поля (столбцы) – содержат данные (информацию) одного типа. Поле имеет имя, длину и тип данных.

Записи (строки) – все поля, содержащие информацию об одном объекте. Каждая запись таблицы содержит одинаковые поля, но в них содержатся различные данные.

Таблицу можно создать, изменить, переименовать, удалить.

Создать – задать структуру и имя таблицы.

Изменить – изменить названия и характеристики полей и т. д.

Между таблицами можно устанавливать связи. Таблицу можно просматривать, обновлять, сортировать, выводить на печать. Таблица может быть создана в одном из 3х режимов:

· Создание таблицы в режиме конструктора;

· Создание таблицы с помощью мастера;

· Создание таблицы путем ввода данных

Запрос (query) – требование на отбор нужных данных из одной или нескольких таблиц по заданным условиям или выполнение определённых действий с данными, средство выбора необходимой информации из базы данных. Вопрос, сформированный по отношению к базе данных, и есть запрос. Применяются два типа запросов: по образцу (QBE – Query by example) и структурированный язык запросов (SQL – Structured Query Language).

QBE-запрос по образцу – средство для отыскания необходимой информации в базе данных. Он формируется не на специальном языке, а путем заполнения бланка запроса в окне Конструктора запросов.

SQL–запросы – это запросы, которые составляются (программистами) из последовательности SQL – инструкций. Эти инструкции задают, что надо сделать с входным набором данных для генерации выходного набора. Все запросы Access строит на основе SQL – запросов, чтобы посмотреть их, необходимо в активном окне проектирования запроса выполнить команду Вид/SQL.


Существует несколько типов запросов:

· запрос на выборку – позволяет извлечь нужную информацию из таблиц, рассчитать показатели, но не изменяет данные в таблицах;

· запрос на изменение (обновление, добавление, удаление) – выполняется в режиме конструктора, даёт возможность корректировать информацию, которая содержится в таблицах;

Форма – средство отображения данных на экране, где размещаются элементы управления, отображения и изменения данных в полях, может создаваться пользователем для ввода и корректировки данных в таблицы БД; даёт возможность просматривать данные, добавлять новые записи, изменять и удалять записи из таблиц (бланк для заполнения при вводе данных в базу). В окне формы табличные данные выводятся строго по одной записи на экране.

Access предоставляет возможность вводить данные как непосредственно в таблицу, так и с помощью форм. Форма в БД - это структурированное окно, которое можно представить так, чтобы оно повторяло форму бланка. Формы создаются из набора отдельных элементов управления.

Внешний вид формы выбирается в зависимости от того, с какой целью она создается. Формы Access позволяют выполнять задания, которые нельзя выполнить в режиме таблицы. Формы позволяют вычислять значения и выводить на экран результат. Источником данных для формы являются записи таблицы или запроса.

Форма предоставляет возможности для:

· ввода и просмотра информации базы данных

· изменения данных

· печати

· создания сообщений


Способы создания форм:

· Конструктор форм (предназначен для создания формы любой сложности)

· Мастер форм (позволяет создавать формы различные как по стилю, так и по содержанию)

Отчёт – средство отображения данных при выводе на печать. В отчёте можно группировать и сортировать данные в любом порядке, получать итоговые значения, средние значения и другие статистические величины, а также помещать в него графические диаграммы.

Для создания отчёта данные можно использовать из таблиц, запросов и форм. Распечатав непрерывную форму, можно создать отчёт, в котором выведены значения всех или некоторых полей таблицы или запроса.

Страницы - страницы доступа к данным представляют собой специальную Web-страницу, предназначенную для просмотра и работы через Интернет или интрасеть с данными, которые хранятся в базах данных Microsoft Access или БД MS SQL Server.

Макрос - набор макрокоманд, создаваемый пользователем для автоматизации выполнения конкретных операций.

Модуль - объект, содержащий программы на языке Visual Basic, применяемые в некоторых случаях для обработки данных.

 



Поделиться:


Последнее изменение этой страницы: 2016-12-10; просмотров: 4536; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.226.96.61 (0.039 с.)