Индексные файлы. Индексно-прямые файлы. Индексно-последовательные файлы. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Индексные файлы. Индексно-прямые файлы. Индексно-последовательные файлы.



Индекс – это структура данных кот помогает СУБД обнаружить отдельные записи => ускоряет время выполнения запроса.

Индексные файлы состоят из 2-х частей, эти части не обязательно совмещены физически. 1) Индексная; 2) Содержит записи файла.

Индекс исключает последовательное сканирование файлов. В зависимости от организации индексной и основной части различают 2 типа файлов:

1)С плотным индексом (индексно-прямые);

2)С не плотным разделенным индексом (индексно-последовательные).

При использовании индексных файлов используются следующий принцип распределения файлов на диске:

1) Файлы ОС должны быть отделены от файлов БД.

2) Основные файлы БД должны быть отделены от индексных файлов.

Значение в индексных файлах упорядочены по полю индексирования, кот обычно строится на базе одного атрибута. Если файл данных имеет последовательное упорядочивание, а поле индексирования является ключевым, то индекс назыв первичным индексом.

Если файл являясь упорядоченным, а поле индексирования не является ключевым, то индекс является вторичным или индексом кластеризации.

В индексном файле может быть один первичный и несколько вторичных индексов.

Индексно-прямые файлы (файлы с плотным индексом)

Состоят из записей одинаковой длины расположенных в произвольном порядке. Структура индексной части имеет вид: значение ключа, потом №записи. При последовательном просмотре БД 12500 обращений к диску. При индексно прямом – 12 обращений к диску. Операции добавления и удаления новых записей. Для добавления новых записей необходимо определить положение новой записи и найти место для всиавки. В индексной области необходимо занести информ в контекстное меню. Индексная обл разбивается на блоки и в каждом блоке оставляется свободная обл (% расширения). При вставке нужный блок модифицируется в памяти и в измененном виде записывается обратно на диск. Когда % расширения исчерпан возникает переполнение индексной обл. В этом случае поступают 2-мя способами: 1) Выполняется модификация всей индексной обл, выделяются заново блока, и заново выделяется % расширения («-» большой расход машинного времени). 2) Организовать обл переполнения для индексной обл («-» увеличивается время доступа к произвольной записи).

Обл переполнения – временный не отсортированный файл называемый файлом переполнения или файлом трансакции. При вставке записи, при нулевом % расширения записывается в файл трансакции кот. периодически сливается с основным отсортированным файлом. Таким образом операции вставки выполняются более эффективно, а операции извлечения данных дольше. При удалении записи выполн последовательность действий: 1)Запись основной обл. помечается как удаленная; 2) В индексном файле соответствующий индекс уничтожается физически; 3) Записи в индексном файле перемещаются заполняя пустое место, следовательно переписывается блок.

Индексно-последовательные файлы

Отсортированный файл данных с первичным индексом. Эта структура явл компромиссом м/д файлами с последовательной и произвольной организацией. В этих файлах данные могут обрабатываться как последовательным так и прямым доступом, который выполняется поиском по заданному ключевому значению с использованием индекса.

Индексно-последовательный файл имеет более сложную структуру, которая обычно включает: первичную область хранения, отдельный индекс или последовательность индексов, область переполнения.

Не плотный индекс строится для упорядоченных файлов. В индексной обл мы ищем нужный блок по заданному значению первичного ключа. Т.к. записи упорядочены, то значение первичной записи блока позволяет быстро определить в каком блоке находится искомая запись, все остальные действия происходят в основной области.

После нахождения нужного блока, внутри блока выполняется последовательный просмотр записей поэтому и назыв файлы индексно-последовательными.

Время доступа к произвольной записи 9 обращений к диску. При добавлении новых записей ищется требуемый блок, помещается в него запись, блок модифицируется.

Реорганизация выполняется блока основной части, а индексная область не корректируется. При возрастании индексного файла организуются многоуровневые индексы.

Распределенные СУБД. Распределенная обработка данных. Параллельные СУБД.

В распределенной БД не все данные хранятся централизовано, они распределены по узлам сети коммуникационными линиями. Каждый узел имеет свою собственную БД и могут обращаться к данным хранящимся на других узлах. РБД – это БД находящаяся на географич. удалении узлов сети (СУРБД). РБД состоит из логически единой БД распределенной на несколько фрагментов, фрагмент может находится на одном или нескольких ПК. Ф-ты могут управляться отдельной СУБД. Данные могут обрабатываться и на каждом компьютере и на компьютерах требующих доступ по сети.

В распределенной СУБД должно существовать хотя бы одно глобальное приложение. Поэтому СУРБД должна иметь особенности: 1)Набор логически связанных распределенных данных. 2) Сохраняемые данные разбиты на некоторое кол-во фрагментов. 3)М/д фр-тами должна быть организована репликация данных. 4) Фр-ты распределены по различным сайтам. 5)Сайты связаны м/д собой сетевыми соединениями. 6)Работа с данными на каждом сайте управляется СУБД. 7)СУБД на каждом сайте способна поддерживать автономную работу локальных приложений. 8)Работа каждого сайта должна поддерживаться хотя бы одним глобальным приложением.

Распределенная обработка - обработка с использ. центральной БД доступ к которой может осуществляться с различных компьютеров сети.

Параллельная СУБД - это система управл БД функционирующая с использованием нескольких процессов и систем жестких дисков, что позволяет распоралировать выполнение нескольких операций с целью повышения производительности обработки. Паралел. СУБД должна обеспечивать управление совместным доступом к ресурсам. Паралел СУБД делятся на 1)Системы с распределение памяти. 2)Системы с распределение дисков. 3)Системы без распределения.

Надо помнить, что паралел СУБД используются исключительно для повышения производительности и узлы БД могут находится на одном ПК. При распределенной СУБД узлы распределены территориально и используют сетевой доступ

Преимущества и недостатки СУРБД.

«+» 1)Отражают структуру организации. 2)Разделяемость и локальная автономность. 3) Повышение доступности и надежности данных. 4)Превышение производительности. 5)Экономические выгоды(организовать многоуровневую систему с помощью компьютерной сети дешевле, чем приобретать дорогостоящие супер компьютеры. Дешевле выполнять локальную обработку, чем оплачивать увеличивающийся трафик сети.). 7)Модульность системы. (Наращивание БД за счет добавления новых узлов дешевле, чем замена программного обеспечения и аппаратных уст-в у центр. БД.)

«-» 1)Повышение сложности. 2)Увеличение стоимости. 3)Проблемы защиты. 4)Усложнение контроля за целостностью данных. 5)Отсутствие стандартов. 6)Недостаток опыта работы с СУРБД. 7)Усложнение процедуры разработки БД.

Гомогенные и гетерогенные рабпределенные СУБД.

К гомогенным системам относятся те в которых все сайты используют один и тот же тип СУБД.

В гетерогенных системах на сайтах могут функционировать различного типа СУБД использующие разные модели БД, т.е. они могут включать реляционные, сетевые, иерархические и объектно-ориентированные СУБД.

Гомогенные системы значительно проще проектировать и сопровождать. Их легко наращивать, повышать производительность за счет организации параллельной обработки на разных сайтах.

Гетерогенные системы возникают чаще всего на базе уже существующих узлов с разными моделями данных. Их объединяют в одну распределенную БД.

Ф-ции распределенных СУБД.

Они выполняют тот же набор возможностей, что и централизованные – ероме этого:

1) Обеспечивают доступ к удаленным сайтам, позволяют передавать запросы и данные м/д сайтами входящими в сеть.

2) Сохранять сведения о распределении данных в сети.

3) Обеспечивать средства обработки распределенных запросов, оптимизации запросов и организации удаленного доступа.

4) Поддерживать целостность реплицируемых данных.

5) Иметь расширенные ф-ции восстановления, учитывать возможность отказа отдельных сайтов и линий связи.



Поделиться:


Последнее изменение этой страницы: 2016-08-14; просмотров: 1114; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.137.192.3 (0.01 с.)