Информационная система. Основные свойства данных 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Информационная система. Основные свойства данных



Информационная система представляет собой программный комплекс, функции которого состоят в надежном хранение информации в памяти компьютера, в выполнение необходимых преобразований информации или вычислений, предоставлении результатов в такой обработке в форме, приемлемой для пользователя.

Обычно объем информации, с которым приходится иметь дело, таким системам достаточно велики, а сама информация имеет весьма сложную структуру.

Целостность данных:

Свойства данных:

Актуальность – своевременность изменения данных, соответственно изменения происходящие с моделирующими объектами(реального мира).

Непротиворечивость – возможность однозначной интерпретации имеющихся данных.

Совокупность свойств актуальности и непротиворечивости данных называют также целостностью данных.

Целостность данных также имеет особую важность, например, сохранение целостности базы данных, содержащих важные знания медицинского характера.


 

2…Система управления базами данных. Простейшая база данных. Сводные таблицы.

База данных (БД) – совокупность связанных данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования, независимая от прикладных программ. База данных является информационной моделью предметной области. Обращение к базам данных осуществляется с помощью системы управления базами данных (СУБД).

Основой любой информационной системы является хранение данных, которые обычно называют базой данных (БД).

Другие компоненты информ. Системы (все, что непосредственно не относятся к массивам данных) – средства создания базы данных, ввода/вывода и обратных хранящейся информации называется системами управления базой данных.

Простейшие базы данных

Чтобы файл считался БД информация в нем должна иметь некоторую структуру, чтобы легко различались элементарные единицы данных – зафиксированные акты реального мира. Например, оцифрованный текстовый файл ЭКГ сигнал в виде линейного ряда чисел.

Сводные таблицы.

Кроме хранения, ввода и вывода данных системы управления БД представляют инструменты анализа данных. Стандартным средством анализа данных наз. Сводная таблица(СТ).

СТ - массив итоговых данных, характеризующих структуру массива исходных данных.


3…Дублирование данных и методы его исключения.

Под избыточностью данных понимают дублирование данных, содержащихся в базе данных. При этом различают дублирование данных простое (неизбыточное) и избыточное.

Избыточность данных при выполнение операций с ними несет нарушение целостности БД,

Неизбыточное дублирование является естественным и недопустимым.

Нарушение целостности данных

Даже с случае неизбыточного дублирования легко может быть нарушена целостность данных.

- удаление одного из дублирующих значений номера телефона;

- при смене номера телефона.

Избыточное дублирование(кабинет дублируется несколько раз).

При изменении номера телефона, в каком либо кабинете необходимо изменять содержимое не одной, а нескольких ячеек таблицы данных.

Декомпозиция таблиц

Наиболее общепринятый способ ликвидации избыточного дублирования данных – декомпозиция(разбиение) исходной таблицы на несколько новых. Это приводит к неизбыточному дублированию, декомпозиция данных уменьшается, но одновременно увеличивается время поиска нужной информации.


4…Проектирование реляционных баз данных.

Связь между таблицами – отношения. БД «Отображает отношения».

Проектирование реляционных баз данных заключается в определение состава таблицы и связей между ними. При этом полученная структура должна обеспечить как целостность данных, так и быстрый доступ к ним.

Для обеспечения целостности:

Структура должна быть такой, чтобы при работе с базой требовалось вводить в нее как можно меньше данных. Каждому элементарному факту, имеющему место в моделируемой (реальной) системе, в БД должна соответствовать одна ячейка одной таблицы.

Две стратегии проектирования

1)классический способ, когда проектирование «умозрительно» выделяет из моделируемой системы объекты и их характеристики, после чего «вручную» создается структура данных удовлетворяющая указанным таблицам.

2)с использование так наз. CASE – системы, которые автоматизируют процесс разработки не только структур БД, но и информ. системы в целом.

Уникальное поле

Ключевое поле – поле, данные в котором применяются для связи с другими таблицами в базе данных.

 


5…Связи в базах данных.

Связь осуществляется путем сопоставления данных в ключевых столбцах; обычно это столбцы, имеющие в обеих таблицах одинаковые названия. В большинстве случаев сопоставляются первичный ключ одной таблицы, содержащий для каждой из строк уникальный идентификатор, и внешний ключ другой таблицы. Например, с каждым из изданий, находящихся в продаже, можно связать объемы его продаж путем создания столбца "ИД_издания" в таблице "Книги" (первичный ключ) и столбца "ИД_издания" в таблице "Продажи" (внешний ключ).

Существует три вида связей между таблицами. Вид создаваемой связи зависит от того, как заданы связанные столбцы.

Связи "один ко многим" - наиболее распространенный вид связи. При такой связи каждой строке таблицы А может соответствовать множество строк таблицы Б, однако каждой строке таблицы Б может соответствовать только одна строка таблицы А. Например, между таблицами "Издатели" и "Книги" установлена связь "один ко многим": каждый из издателей может опубликовать множество книг, однако каждая книга публикуется лишь одним издателем.

Связи "многие ко многим" При установлении связи "многие ко многим" каждой строке таблицы А может соответствовать множество строк таблицы Б и наоборот. Такая связь создается при помощи третьей таблицы, называемой соединительной, первичный ключ которой состоит из внешних ключей, связанных с таблицами А и Б. Например, между таблицами "Авторы" и "Книги" установлена связь вида "многие ко многим", задаваемая с помощью связей вида "один ко многим" между каждой из этих таблиц и таблицей "АвторыКниг". Первичный ключ таблицы "АвторыКниг" - это сочетание столбцов "ИД_автора" (первичного ключа таблицы авторов) и "ИД_книги" (первичного ключа таблицы заголовков).

Связи "один к одному" При установлении связи "один к одному" каждой строке таблицы А может соответствовать только одна строка таблицы Б и наоборот. Связь "один к одному" создается в том случае, когда оба связанные столбца являются первичными ключами или на них наложены ограничения уникальности.

Этот вид связи используется редко, поскольку в такой ситуации связываемые данные обычно можно хранить в одной таблице. Использовать связь вида "один к одному" можно в указанных ниже случаях.

• Чтобы разделить таблицу, содержащую слишком много столбцов.

• Чтобы изолировать часть таблицы по соображениям безопасности.

• Для хранения данных кратковременного использования, удалить которые проще всего путем очистки таблицы.

• Для хранения данных, имеющих отношение только к подмножеству основной таблицы.


13…Зависимость, его свойства, статистическая значимость.

Важно отмечать зависимость переменных от экспериментального воздействия и зависимость их между собой. О зависимости между переменными говорят в том случае, если наблюдаемые значения этих переменных распределены соответствующим образом.

Не существует иного способа представления знаний, кроме как в терминах зависимостей между количествами или качествами, выраженными какими-либо переменными.

Свойства:

- Величина зависимости

Можно относительно легко понять и измерить. Другими словами, зная величину взаимосвязи можно предсказать значения одной переменной по значениям другой.

- Надежность взаимосвязи

Надежность взаимосвязи – менее очевидное понятие. Надежность говорит как о том, насколько вероятно, что зависимость, найденная в исследуемой выборке, характерна для выборки генеральной. Обычно надежность найденных взаимосвязей между переменными можно количественно оценить и представить с помощью стандартной статистической меры наз. р - уровнем или уровнем значимости.

Статистическая значимость

СЗ результата представляет собой меру уверенности в его «истинности». Р – уровень представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю популяцию. Более высокий р – уровень соответствует более низкому уровню доверия к найденной зависимости между переменными.

Уровень значимости (р – уровень) – вероятность ошибочно отклонить предложения об отсутствии данной значимости в популяции.

Допустимый уровень значимости – результаты, значимые на уровне

p<0.01 обычно рассматривается как статистические значимые

p<0.005 или p<0.001 считаются высоко значимыми.

Чем больше число проведенных статистических анализов, тем большее число значимых (на выбранном уровне) результатов будет обнаружено чисто случайно. Некоторые статистические методы, включающие много сравнений и т. о. имеющие высокую вероятность повторить такого рода ошибки производят специальную корректировку или поправку на общее число сравнений.

Тем не менее многие статистические методы (особенно простые метолы анализа данных) не предлагают какого-либо способа решения данной проблемы.

Поэтому, следует с осторожностью оценивать надежность неожиданных результатов при большом числе статистических обработок.


14… Зависимости между объёмом выборки, статистической значимостью, величиной и надёжностью зависимости.

Зависимости между величиной и надёжностью зависимости

Несмотря, на то, что величина и надежность зависимости являются различными характеристиками взаимосвязи между переменными, нельзя сказать, что они совершенно независимы.



Поделиться:


Последнее изменение этой страницы: 2017-02-10; просмотров: 250; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.22.119.251 (0.014 с.)