Сформулируйте основные проблемы применения распределенных БД 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Сформулируйте основные проблемы применения распределенных БД



Поясните утверждение: «Хотя системы управления реляционными базами данных доступны для пользователей, они никогда не считались средством, дающим мощные функции по синтезу, анализу и консолидации (функций, называемых многомерным анализом данных)» Э.Кодд, 1993г.

 

Как обычно происходит процесс разработки решений:

Исторически сложилось так, что решения по автоматизации оперативной деятельности наиболее развиты. Речь идет о системах транзакционной обработки данных (OLTP), иначе называемых оперативными системами. Эти системы обеспечивают регистрацию некоторых фактов, их непродолжительное хранение и сохранение в архивах. Основу таких систем обеспечивают системы управления реляционными базами данных (РСУБД). Традиционным подходом являются попытки использовать уже построенные оперативные системы для поддержки принятия решений. Обычно пытаются строить развитую систему запросов к оперативной системе и использовать полученные после интерпретации отчеты непосредственно для поддержки решений. Отчеты могут строиться на заказной базе, т.е. руководитель запрашивает отчет, и на регулярной, когда отчеты строятся по достижении некоторых событий или времени. Например, традиционный процесс поддержки принятия решений может выглядеть таким образом: руководитель идет к специалисту информационного отдела и делится с ним своим вопросом. Затем специалист информационного отдела строит запрос к оперативной системе, получает электронный отчет, интерпретирует его и доводит его до сведения руководящего персонала.

Конечно, такая схема обеспечивает в какой-то мере поддержку принятия решений, но она имеет крайне низкую эффективность и огромное число недостатков. Ничтожное количество данных используется для поддержки критически важных решений. Есть и другие проблемы. Подобный процесс очень медленен, так как длителен сам процесс написания запросов и интерпретации электронного отчета. Он занимает многие дни, в то время как руководителю, быть может, необходимо принять решение прямо сейчас, немедленно. Если учесть, что руководителя после получения отчета может заинтересовать другой вопрос (скажем, уточняющий или требующий рассмотрения данных в другом разрезе), то этот медленный цикл должен повториться. А так как процесс анализа данных оперативных систем будет происходить итерационно, то времени тратится ещё больше. Другая проблема - различие областей деятельности специалиста по информационным технологиям и руководителя, которые могут мыслить в разных категориях и, как следствие, - не понимать друг друга. Это значит, что потребуются дополнительные уточняющие итерации, а это снова время, которого всегда не хватает. Ещё одной важной проблемой является сложность отчетов для понимания. У руководителя нет времени выбирать интересующие цифры из отчёта, тем более что их может оказаться слишком много (вспомним огромные многостраничные отчеты, в которых реально используются несколько страниц, а остальные - на всякий случай). Отметим также, что работа по интерпретации ложится чаще всего на специалистов информационных отделов. То есть грамотный специалист отвлекается на рутинную и малоэффективную работу по рисованию диаграмм и т.п., что, естественно, не может благоприятно сказываться на его квалификации. Кроме того, не является секретом присутствие в цепочке интерпретации благожелателей, заинтересованных в преднамеренном искажении поступающей информации.

Вышеуказанные недостатки заставляют задуматься и об общей эффективности оперативной системы, и о затратах, связанных с ее существованием, так как оказывается, что затраты на создание оперативной системы не окупаются в должной степени эффективностью ее работы.

В действительности эти проблемы не являются следствием низкого качества оперативной системы или ее неудачной постройки. Корни проблем кроются в фундаментальном отличии той оперативной деятельности, которая автоматизируется оперативной системой, и деятельностью по разработке и принятию решений. Отличие это состоит в том, что данные оперативных систем являются просто записями о некоторых имевших место событиях, фактах, но никак не информацией в общем смысле этого слова. Информация - это то, что снижает неопределенность в какой-либо области. И было бы очень неплохо, если бы информация снижала неопределенность в области подготовки решений. По поводу непригодности для этой цели оперативных систем, построенных на РСУБД, в свое время высказался небезызвестный E.F. Codd, человек, стоявший в 70-е годы у истоков технологий систем управления реляционными БД: “Хотя системы управления реляционными БД доступны для пользователей, они никогда не считались средством, дающим мощные функции по синтезу, анализу и консолидации (функций, называемых многомерным анализом данных)”. Речь идет именно о синтезе информации, о том, чтобы превращать данные оперативных систем в информацию и даже в качественные оценки.


 

Вариант 2

Возможность применения информационных систем, построенных на основе баз данных, в бизнесе; концепция файловых систем и объективные причины перехода к построению информационных систем на основе баз данных.

Сформулируем главные принципы файловых систем:

1. Пользователь “видит” данные как совокупность файлов, работа с которыми обеспечивается, как правило, стандартными средствами, входящими в состав операционной системы и доступными в используемых языках программирования.

2. Каждая содержащаяся в файле запись представляет собой последовательность символов (байтов), которая кодирует те или иные данные, сведения предметной области. Способ кодирования определяется программистом, создавшим данный файл с помощью написанной им программы. Всякая программа, предназначенная для извлечения данных из файла, должна “знать” принятый способ кодирования. Любые изменения способа кодирования (например, связанные с изменениями в обслуживании предметной области, изменения формата данных) влекут изменение всех программ, работающих с данным файлом.

3. Решение новой задачи на основе данных, содержащихся в файлах системы, требует написания новой программы обработки файлов, определение данных содержится внутри приложений, а не хранится отдельно и независимо от них.

4. Для просмотра данных файла применялись последовательный или произвольный методы доступа.

 

Ограничения, присущие файловым системам:

1 .Разделение и изоляция данных.

Когда данные изолированы в отдельные файлы, доступ к ним весьма затруднен. При выполнении процедуры поиска программист должен осуществлять синхронную обработку файлов, где находятся необходимые данные. Трудности возникают, когда требуется получить данные из более, чем двух файлов.

 

2. Дублирование данных.

Из-за децентрализованной работы с данными, проводимой в каждом отделе независимо от других отделов, неизбежно возникает проблема дублирования используемой информации в создаваемых файлах. Такая ситуация неблагоприятна по следующим причинам:

- дублирование данных сопровождается неэкономным расходованием ресурсов, поскольку на ввод избыточных данных требуется затрачивать дополнительные время и деньги. Кроме того, для хранения этих данных требуется дополнительное место во внешней памяти, что связано с дополнительными накладными расходами;

- -дублирование неизбежно приводит к проблеме логического рассогласования данных, к нарушению их целостности, что в конечном итоге негативно сказывается на достоверности информации, предоставляемой соответствующими подразделениями организации;

- проблема неоднозначности, при которой один и тоже элемент по-разному трактуется в файлах, что приводит к неоднозначному толкованию объектов предметной области.

 

3. Зависимость от данных.

Физическая структура и способ хранения записей файла жестко зафиксированы в коде программ приложений, поэтому возникают проблемы с изменением этих структур (например, изменение длины некоторого поля файла потребует выполнения значительного число дополнительных операций). Кроме этого, могут существовать ссылки на изменяемый файл, поэтому программисту придется выявить подобные программы, перепроверить и изменить их. Выполнение всех этих действий требует больших затрат времени и может стать причиной возникновения ошибок. Рассмотренная особенность файловых систем называется зависимость от программ и данных (program- data dependence).

 

4. Несовместимость файлов.

Структура файлов определяется кодом программы и зависит от используемого языка программирования. Прямая несовместимость файлов, создаваемых при помощи различных языковых средств может стать причиной затруднения их совместной обработки.

 

5. Фиксированные запросы / быстрое увеличение числа приложений.

С точки зрения пользователя возможности файловых систем существенно превосходят возможности ручных картотек. Следствием этого становится увеличение требований к реализации готовых запросов. Работа с файловыми системами во многом зависит от программистов, в чьи функции и входит разработка запросов и приложений. Возможны два варианта развития сложившейся ситуации. Первый вариант – это отсутствие инструментов для созданий незапланированных запросов (ad hoc). Во втором случае наблюдалось интенсивное увеличение числа файлов и приложений, эти файлы обрабатывающие. В итоге, и в том, и в другом случае, наступал момент, когда с объемами работ программисты и вычислительные ресурсы справиться не могли, программное обеспечение не могло адекватно соответствовать запросам пользователей, усложнялась процедура сопровождения приложений и падала эффективность работы с данными.

С течением времени, подобная организация работы изживает себя, и ей на смену приходит совершенно иная концепция.

Однако файловые системы из-за особенностей их структуры определили некоторые области их целесообразного применения. Данное программное обеспечение имеет смысл использовать в информационных системах, отвечающих следующим требованиям:

· структура предметной области остается практически неизменной в течение всего срока жизни системы.

· количество существенно - значимых запросов (количество различных обрабатывающих программ), на которые надо отвечать на протяжении жизненного цикла системы, ограничено и сравнительно небольшое.

 

Поясните утверждение: «Хотя системы управления реляционными базами данных доступны для пользователей, они никогда не считались средством, дающим мощные функции по синтезу, анализу и консолидации (функций, называемых многомерным анализом данных)» Э.Кодд, 1993г..

 

Как обычно происходит процесс разработки решений:

Исторически сложилось так, что решения по автоматизации оперативной деятельности наиболее развиты. Речь идет о системах транзакционной обработки данных (OLTP), иначе называемых оперативными системами. Эти системы обеспечивают регистрацию некоторых фактов, их непродолжительное хранение и сохранение в архивах. Основу таких систем обеспечивают системы управления реляционными базами данных (РСУБД). Традиционным подходом являются попытки использовать уже построенные оперативные системы для поддержки принятия решений. Обычно пытаются строить развитую систему запросов к оперативной системе и использовать полученные после интерпретации отчеты непосредственно для поддержки решений. Отчеты могут строиться на заказной базе, т.е. руководитель запрашивает отчет, и на регулярной, когда отчеты строятся по достижении некоторых событий или времени. Например, традиционный процесс поддержки принятия решений может выглядеть таким образом: руководитель идет к специалисту информационного отдела и делится с ним своим вопросом. Затем специалист информационного отдела строит запрос к оперативной системе, получает электронный отчет, интерпретирует его и доводит его до сведения руководящего персонала.

Конечно, такая схема обеспечивает в какой-то мере поддержку принятия решений, но она имеет крайне низкую эффективность и огромное число недостатков. Ничтожное количество данных используется для поддержки критически важных решений. Есть и другие проблемы. Подобный процесс очень медленен, так как длителен сам процесс написания запросов и интерпретации электронного отчета. Он занимает многие дни, в то время как руководителю, быть может, необходимо принять решение прямо сейчас, немедленно. Если учесть, что руководителя после получения отчета может заинтересовать другой вопрос (скажем, уточняющий или требующий рассмотрения данных в другом разрезе), то этот медленный цикл должен повториться. А так как процесс анализа данных оперативных систем будет происходить итерационно, то времени тратится ещё больше. Другая проблема - различие областей деятельности специалиста по информационным технологиям и руководителя, которые могут мыслить в разных категориях и, как следствие, - не понимать друг друга. Это значит, что потребуются дополнительные уточняющие итерации, а это снова время, которого всегда не хватает. Ещё одной важной проблемой является сложность отчетов для понимания. У руководителя нет времени выбирать интересующие цифры из отчёта, тем более что их может оказаться слишком много (вспомним огромные многостраничные отчеты, в которых реально используются несколько страниц, а остальные - на всякий случай). Отметим также, что работа по интерпретации ложится чаще всего на специалистов информационных отделов. То есть грамотный специалист отвлекается на рутинную и малоэффективную работу по рисованию диаграмм и т.п., что, естественно, не может благоприятно сказываться на его квалификации. Кроме того, не является секретом присутствие в цепочке интерпретации благожелателей, заинтересованных в преднамеренном искажении поступающей информации.

Вышеуказанные недостатки заставляют задуматься и об общей эффективности оперативной системы, и о затратах, связанных с ее существованием, так как оказывается, что затраты на создание оперативной системы не окупаются в должной степени эффективностью ее работы.

В действительности эти проблемы не являются следствием низкого качества оперативной системы или ее неудачной постройки. Корни проблем кроются в фундаментальном отличии той оперативной деятельности, которая автоматизируется оперативной системой, и деятельностью по разработке и принятию решений. Отличие это состоит в том, что данные оперативных систем являются просто записями о некоторых имевших место событиях, фактах, но никак не информацией в общем смысле этого слова. Информация - это то, что снижает неопределенность в какой-либо области. И было бы очень неплохо, если бы информация снижала неопределенность в области подготовки решений. По поводу непригодности для этой цели оперативных систем, построенных на РСУБД, в свое время высказался небезызвестный E.F. Codd, человек, стоявший в 70-е годы у истоков технологий систем управления реляционными БД: “Хотя системы управления реляционными БД доступны для пользователей, они никогда не считались средством, дающим мощные функции по синтезу, анализу и консолидации (функций, называемых многомерным анализом данных)”. Речь идет именно о синтезе информации, о том, чтобы превращать данные оперативных систем в информацию и даже в качественные оценки.


 

Вариант 4

1. Классификация информационных систем в зависимости от использования на различных уровнях управления; требования к представлению и обработке информационных ресурсов на различных уровнях управления компании.

Наибольшее распространение получили ИС организационного управления, которые предназначены для автоматизации функций управленческого персонала. Учитывая.наиболее широкое применение и разнообразие этого класса систем, часто различные информационные системы понимаются именно в этом толковании. К этому классу ИС относятся информационные системы управления как промышленными фирмами, так и непромышленными экономическими объектами — предприятиями сферы обслуживания. Основными функциями таких систем являются оперативный контроль и регулирование, оперативный учет и анализ, перспективное и оперативное планирование, бухгалтерский учет, управление сбытом и снабжением и решение других экономических и организационных задач.

Интегрированные ИC предназначены для автоматизации всех функций управления фирмой и охватывают весь цикл функционирования экономического объекта: начиная от научно-исследовательских работ, проектирования, изготовления, выпуска и сбыта продукции, анализа эксплуатации изделия.

Корпоративные ИС используются для автоматизации всех функций управления фирмой или корпорацией, имеющей территориальную разобщенность между подразделениями, филиалами, отделениями, офисами и т. д.

ИC научных исследований обеспечивают решение научно-исследовательских задач на базе экономико-математических методов и моделей.

Обучающие ИС используются для подготовки специалистов в системе образования, при переподготовке и повышении квалификации ботников различных отраслей экономики.

По степени автоматизации информационных процессов ИС подразделяются на:

Ручные информационные системы, которые характеризуются отсутствием современных технических средств обработки информации и выполнением всех операций человеком по заранее разработанным методикам.

Автоматизированные информационные системы — человеко-машинные системы, обеспечивающие автоматизированный сбор, обработку и передачу информации, необходимой для принятия управленческих решений в организациях различного типа.

Автоматические информационные системы характеризуются выполнением всех операций по обработке информации автоматически, без участия человека, но оставляют за человеком контрольные функции.

Основной составляющей частью автоматизированной информационной системы является информационная технология (ИТ), развитие которой тесно связано с развитием и функционированием ИС.

Информационная технология (ИT) — процесс, использующий совокупность методов и средств реализации операций сбора, регистрации, передачи, накопления и обработки информации на базе программно-аппаратного обеспечения для решения управленческих задач экономического объекта.

 

В соответствии с уровнями принятия решений в функционировании информационной технологии можно выделить три контура: долгосрочного стратегического планирования, среднесрочного тактического планирования и оперативного регулирования деятельности организации.

1. Стратегический уровень ориентирован на руководителей высшего ранга. За счет организации информационной технологии обеспечивается доступ к информации, отражающей текущее состояние дел в фирме, внешней среде, их взаимосвязи и необходимой для принятия стратегических решений. Основными целями стратегического уровня управления являются:

определение системы приоритетов развития организации;

оценка перспективных направлений развития организации;

выбор и оценка необходимых ресурсов для достижения поставленных целей.

В соответствии с этими направлениями информационная технология обеспечивает высшему руководству оперативный, удобный доступ и сортировку информации по ключевым факторам, которые позволяют оценивать степень достижения стратегических целей фирмы

и прогнозировать ее деятельность на длительную перспективу. Особенностями информационной технологии контура долгосрочного планирования и анализа прогнозируемого функционирования является построение агрегированных моделей развития организации с учетом деятельности смежных производственно-хозяйственных комплексов.

Модели данного контура функционирования информационной технологии должны учитывать:

особенности развития рыночных отношений в стране;

возможные перспективные виды продукции (товары и услуги), относящиеся к профилю деятельности организации или предприятия;

потенциальные виды производственных ресурсов, возможные для использования при создании новых видов продукции (товаров, услуг);

перспективные технологические процессы изготовления новых видов продукции (товаров и услуг).

Учет перечисленных факторов в модели функционирования информационной технологии базируется преимущественно на использовании внешней для деятельности организации информации. Таким образом ИТ должна располагать развитой коммуникационной средой (включая Internet) для получения, накопления и обработки внешней информации.

Отличительной особенностью функционирования ИТ в контуре долгосрочного стратегического планирования, базирующемся на использовании агрегированных моделей, следует считать решающую роль самого управленческого персонала в процессе принятия решений. Высокий уровень неопределенности и неполноты информации повышает значение субъективного фактора как основы принятия решений. При этом автоматизированная информационная технология выступает в роли вспомогательного средства, обеспечивающего главную предпосылку для организации деятельности аппарата управления.

Таким образом, информационные технологии поддержки стратегического уровня принятия решений помогают высшему звену управления организацией решать неструктурированные задачи, основной из которых является сравнение происходящих во внешней среде изменений с существующим потенциалом фирмы.

Основным инструментарием для поддержки работы высшего руководящего звена являются разрабатываемые стратегические информационные системы для реализации стратегических перспективных целей развития организации.

В настоящее время еще не выработана общая концепция внедрения стратегических информационных систем из-за их целевой и функциональной многоплановости. Существуют три тенденции их использования:

За основу первой принято положение, что сначала формулируются цели и стратегии их достижения, а только затем автоматизированная информационная технология приспосабливается к выработанной заранее стратегии;

Вторая тенденция основана на том, что организация использует стратегическую информационную систему при формулировании целей и стратегическом планировании;

За основу третьей тенденции принята методология синтеза двух предыдущих тенденций — встраивания стратегической информационной системы в существующую информационную технологию с совмещением выработки концепции развития организации в управленческом звене фирмы.

Информационные технологии призваны создать общую среду компьютерной и телекоммуникационной поддержки стратегических решений в неожиданно возникающих ситуациях.

2. Тактический уровень принятия решений основан на автоматизированной обработке данных и реализации моделей, помогающих решать отдельные, в основном слабо структурированные задачи (например, принятие решения об инвестициях, рынках сбыта и т. д.). К числу основных целей тактического уровня руководства относятся:

обеспечение устойчивого функционирования организации в целом;

создание потенциала для развития организации;

создание и корректировка базовых планов работ и графиков реализации заказов на основе накопленного в процессе развития организации потенциала.

Для принятия тактических решений информационная технология должна обеспечивать руководителей среднего звена информацией, необходимой для принятия индивидуальных или групповых решений тактического, плана. Обычно такие решения имеют важное значение на определенном временном интервале (месяц, квартал, год).

Тактический уровень принятия решения средним управленческим звеном используется для мониторинга (постоянного слежения), контроля, решений и администрирования. Основными функциями, которые выполняются на базе автоматизированной информационной технологии, являются: сравнение текущих показателей с прошлыми, составление периодических отчетов за определенный период, обеспечение доступа к архивной информации, принятие тактических управленческих решений и т. д.

Функционирование информационной технологии в контуре среднесрочного тактического планирования базируется на использовании моделей, отражающих реальные факторы и условия возможного развития деятельности организаций и предприятий, в значительной степени учитываются внешние требования поставщиков и потребителей. Однако в данном контуре внешняя информация точно соответствует возможным и практически осуществляемым направлениям развития организаций и предприятий, что повышает уровень определенности данных и модели системы управления.

Для поддержки принятия тактического решения в информационной технологии фирмы используются такие инструментальные средства, как базы данных, системы обработки знаний, системы поддержки принятия решений и т. д.

Одним из инструментальных средств для принятия тактического решения в настоящее время являются системы поддержки принятия решений, которые обслуживают частично структурированные задачи, результаты которых трудно спрогнозировать заранее. Системы поддержки принятия решений имеют достаточно мощный аналитический аппарат с несколькими моделями. Основными характеристиками таких систем являются:

возможность решения проблем, развитие которых трудно прогнозировать;

наличие инструментальных средств моделирования и анализа;

возможность легко менять постановки решаемых задач и входных данных;

гибкость и адаптируемость к изменению условий;

технология, максимально ориентированная на пользователя.

3. Оперативный (операционный) уровень принятия решений является основой всех автоматизированных информационных технологий. На этом уровне выполняется огромное количество текущих рутинных операций по решению различных функциональных задач экономического объекта. Оперативное управление ориентировано на достижение целей, сформулированных на стратегическом уровне, за счет использования определенного на тактическом уровне потенциала. При этом к числу важнейших приоритетов оперативного управления следует отнести:

получение прибыли за счет реализации запланированных заранее мероприятий с использованием накопленного потенциала;

регистрацию, накопление и анализ отклонений хода производства от запланированного;

выработку и реализацию решений по устранению или минимизации нежелательных отклонений.

Функционирование информационной технологии в контуре текущего планирования и оперативного регулирования происходит в условиях определенности, полноты информации и зачастую в режиме реального времени обработки информации.

Информационные технологии обеспечивают специалистов на оперативном уровне информационными продуктами, необходимыми для принятия ежедневных оперативных управленческих решений. Назначение инструментальных средств информационной технологии на этом уровне — отвечать на запросы о текущем состоянии фирмы и контролировать информационные потоки организации, что соответствует оперативному управлению.

Задачи, цели и источники информации на оперативном уровне заранее определены и структурированы. Выполняется программная обработка информации по заранее разработанным алгоритмам.

Информационная технология, поддерживающая управление на оперативном уровне, является связующим звеном между организацией и внешней средой. Через оперативный уровень также поставляются данные для остальных уровней управления. Инструментальные средства на оперативном уровне управления имеют небольшие аналитические возможности. Они обслуживают специалистов организации, которые нуждаются в ежедневной, еженедельной информации о состоянии дел как внутри фирмы, так и во внешней среде. Основное их назначение состоит в отслеживании ежедневных операций в организации и периодическом формировании строго структурированных сводных типовых отчетов.

Основные информационные потребности на оперативном уровне могут быть удовлетворены с помощью типовых функциональных и проблемно-ориентированных аппаратно-программных инструментальных средств для текстовой, табличной, графической и статистической обработки данных, электронных коммуникаций и т. д.

Хранение данных

Второй слой предназначен непосредственно для хранения значимой, проверенной, согласованной, непротиворечивой и хронологически целостной информации, которую с достаточно высокой степенью уверенности

можно считать достоверной.

Собственно хранилище данных не ориентировано на решение какой-либо определенной функциональной

аналитической задачи. Цель хранилища – обеспечить целостность и поддерживать хронологию всевозможных корпоративных данных, и с этой точки зрения оно нейтрально по отношению к приложениям. В связи с этим в большинстве случаев для выполнения определенного комплекса функционально замкнутых аналитических задач рационально создавать витрины данных, в основе которых может быть как многомерная, так и реляционная модель данных. По существу витрина представляет собой относительно небольшое, но что самое важное, функционально-ориентированное хранилище, в котором информация хранится специальным образом, оптимизированным с точки зрения решения конкретных аналитических задач некоторого подразделения или группы аналитиков. Обычно информация попадает в витрины из хранилища и в этом случае витрины называются зависимыми. Возможна также ситуация, когда источником информации для пополнения витрин служат непосредственно оперативные и внешние транзакционные системы. Такие витрины, получившие название независимых, как правило, рассматриваются как временное решение, позволяющее достаточно быстро и с небольшими затратами решить наиболее важные задачи, оценить преимущества нового подхода, сформулировать некоторые рекомендации для более масштабного проекта разработки общего хранилища.

Хранилище реализуется в виде реляционной базы данных, работающей под управлением достаточно мощной реляционной СУБД. Такая СУБД должна поддерживать эффективную работу с терабайтными объемами информации, иметь развитые средства ограничения доступа, обеспечивать повышенный уровень надежности и секретности, соответствовать необходимым требованиям по восстановлению и архивации и т.п..

Витрины данных могут строиться на основе как реляционной, так и многомерной технологии баз данных.

Обычно для достаточно большой части аналитических приложений оказывается удобной и эффективной технология интерактивного многомерного анализа и в этом случае витрина представляет собой многомерную базу данных, реализованную в архитектуре OLAP, ROLAP или HOLAP.

Анализ данных

Для организации доступа аналитиков к данным хранилища и витрин используются специализированные рабочие места, поддерживающие необходимые технологии как оперативного, так и долговременного анализа. Результаты работы аналитиков оформляются в виде отчетов, графиков, рекомендаций и сохраняются как на локальном компьютере, так и в общедоступном узле локальной сети.

Аналитическая деятельность в рамках корпорации достаточно разнообразна и определяется характером решаемых задач, организационными особенностями компании, уровнем и степенью подготовленности аналитиков. В связи с этим современный подход к инструментальным средствам анализа не ограничивается использованием какой-то одной технологи. В настоящее время принято различать четыре основных вида аналитической деятельности (рис. 1): стандартная отчетность, нерегламентированные запросы, многомерный анализ (OLAP) и извлечение знаний (data mining). Каждая из этих технологий имеет свои особенности, определенный набор типовых задач и должна поддерживаться специализированной инструментальной средой.

 

 

Сформулируйте основные проблемы применения распределенных БД

В наше время распределенным базам данных нашли широчайшее применение, поскольку корпорации и фирмы размещаются во многих офисах, как в пределах одного города, так и разбросанным по нескольким странам и даже континентам. Особенно это касается фирм, связанных с билетами, авиа и водными перевозками и так далее.

Фактически, распределенная база данных – это совокупность логически взаимосвязанных баз данных, распределенных в компьютерной сети.

Главная задача таких баз данных – обработка распределенных данных. При этом в общем случае считается, что данные находятся на компьютерах различных моделей и производителей, функционирующих под управлением различных операционных систем, и доступ к ним осуществляется разнородным программным обеспечением, а территориально сами компьютеры могут быть удалены друг от друга и находиться в различных точках планеты.

Распределенные СУБД классифицируют на гомогенные и гетерогенные системы. В гомогенных системах все узлы используют один и тот же тип СУБД, например Oracle, а в гетерогенных системах могут функционировать различные СУБД.

Правила Дейта для распределенных СУБД, выдвинутые в 1987 году:

· Основной принцип – с точки зрения конечного пользователя распределенная система должна выглядеть в точности так, как и обычная, нераспределенная;

· Локальная автономность – узлы в распределенной системе должны быть автономными;

· Отсутствие опорного центрального узла – в системе не должно быть ни одного узла, без которого система не сможет функционировать;

· Непрерывное функционирование – в идеале в системе никогда не должна возникать потребность в плановой остановке ее функционирования для добавления или удаления узлов или фрагментов;

· Независимость от расположения – пользователь должен получать доступ к базе данных с любого из узлов;

· Независимость от фрагментации – пользователь должен получать доступ к данным независимо от способа фрагментации;

· Независимость от репликации (обновления);

· Обработка распределенных запросов – система должна поддерживать обработку запросов, ссылающихся на данные, ссылающиеся на данные, расположенные на более чем одном узле;

· Обработка распределенных транзакций – система должна поддерживать выполнение транзакций, как единицы восстановления;

· Независимость от типа оборудования – РСУБД должна быть способна функционировать на оборудовании с различными вычислительными платформами;

· Независимость от операционной системы – РСУБД должна быть способна функционировать под управлением различных операционных систем;

· Независимость от сетевой архитектуры – РСУБД должна быть способна функционировать в сетях с различной архитектурой и типами носителей;

· Независимость от типа СУБД – РСУБД должна быть способна функционировать поверх различных локальных СУБД с различными типами используемых моделей данных, т. е. должна поддерживать гетерогенность.

На практике трудно найти РСУБД, которая удовлетворяла бы всем этим характеристикам сразу. Существует ряд препятствий, из-за которых трудно построить идеальную РСУБД, а именно:

· Низкая производительность – в централизованной базе данных доступ к данным осуществляется за единицы миллисекунд, а скорость передачи – миллионы символов в секунду, в то время как скорость передачи данных по телефонной линии через модем значительно ниже, время доступа уже исчисляется секундами, пропускная способность файла уменьшается до 500 символов в секунду;

· Проблема сохранения целостности данных – чтобы при выполнении распределенных транзакций соблюдался принцип «все или ничего», необходимо активное взаимодействие двух или более СУБД, возможно, работающих на разных вычислительных системах;



Поделиться:


Последнее изменение этой страницы: 2017-01-25; просмотров: 76; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.25.74 (0.102 с.)