Информация. Данные. Предметная область. Базы данных. СУБД.



Информация. Данные. Предметная область. Базы данных. СУБД.

Информация – (от лат. informatio – разъяснение, изложение)

Первоначально – сведения, передаваемые людьми устным, письм. или др. способом ( с помощью условных сигналов, техн. средств и т.д.);

С сер. 20 в. общенаучное понятие, включающее обмен сведениями между людьми, человеком и автоматом, автоматом и автоматом; обмен сигналами в животном и растительном мире; передачу признаков от клетки к клетке, от организма к организму и т.д.

Данные — это результат фиксации, отображения информации на каком-либо материальном носителе, то есть зарегистрированное на носителе представление сведений независимо от того, дошли ли эти сведения до какого-нибудь приёмника и интересуют ли они его

Предметная область -- часть реального мира, рассматриваемая в БД.

База данных– высоко-организованная совокупность данных, предназначенная для их хранения, накопления и обработки, в частности, для быстрого поиска .

Система управления базами данных (СУБД)-совокупность языковых и программных средств, используемая для создания и ведения БД (обновления, обеспечения доступа к данным по запросам пользователя и т.д.).

2.Анализ предметной области и составление технического задания

Модели данных. Уровни моделей дынных.

Сначаластали использовать иерархические даталогические модели. Простота организации, наличие заранее заданных связей между сущностями, сходство с физическими моделями данных позволяли добиваться приемлемой производительности иерархических СУБД на медленных ЭВМ с весьма ограниченными объемами памяти. Но, если данные не имели древовидной структуры, то возникала масса сложностей при построении иерархической модели и желании добиться нужной производительности.

Сетевые модели также создавались для мало ресурсных ЭВМ. Это достаточно сложные структуры, состоящие из "наборов" – поименованных двухуровневых деревьев. "Наборы" соединяются с помощью "записей-связок", образуя цепочки и т.д. При разработке сетевых моделей было выдумано множество "маленьких хитростей", позволяющих увеличить производительность СУБД, но существенно усложнивших последние. Прикладной программист должен знать массу терминов, изучить несколько внутренних языков СУБД, детально представлять логическую структуру базы данных для осуществления навигации среди различных экземпляров, наборов, записей и т.п. Один из разработчиков операционной системы UNIX сказал "Сетевая база – это самый верный способ потерять данные".

Сегодня наиболее распространены реляционные модели, которые будут подробно рассмотрены в главе

Уровни моделей данных:концептуальная модель, логическая модель, физическая.

4.Концептуальная (инфологическая) модель предметной области. Языки построения концептуальных моделей. CASE-средства.

Объединяя частные представления о содержимом базы данных, полученные в результате опроса пользователей, и свои представления о данных, которые могут потребоваться в будущих приложениях, АБД сначала создает обобщенное неформальное описание создаваемой базы данных. Это описание, выполненное с использованием естественного яз ыка, математических формул, таблиц, графиков и других средств, понятных всем людям, работающих над проектированием базы данных, называют инфологической моделью данных.(обобщение ,не привязанное к каким-либо ЭВМ и СУБД,описание предметной области..набор данных и их типов и т.д).

инфологическая модельне должна изменяться до тех пор, пока какие-то изменения в реальном мире не потребуют изменения в ней некоторого определения, чтобы эта модель продолжала отражать предметную область. инфологическая модель отображает реальный мир в некоторые понятные человеку концепции, полностью независимые от параметров среды хранения данных. Существует множество подходов к построению таких моделей: графовые модели, семантические сети, модель "сущность-связь" и т.д. . Наиболее популярной из них оказалась модель "сущность-связь", которая будет рассмотрена в главе 2.

Классификация сущностей предметной области.ER-диаграммы.

Сущность – любой различимый объект (объект, который мы можем отличить от другого), информацию о котором необходимо хранить в базе данных. Сущностями могут быть люди, места, самолеты, рейсы, вкус, цвет и т.д. Необходимо различать такие понятия, как тип сущности и экземпляр сущности. Понятие тип сущности относится к набору однородх личностей, предметов, событий или идей, выступающих как целое. Экземпляр сущности относится к конкретной вещи в наборе. Например, типом сущности может быть ГОРОД, а экземпляром – Москва, Киев и т.д.

Стержневая сущность (стержень) – это независимая сущность

Ассоциативная сущность (ассоциация) – это связь вида "многие-ко-многим" ("-ко-многим" и т.д.) между двумя или более сущностями или экземплярами сущности (как в примере 2.4). Ассоциации рассматриваются как полноправные сущности:

они могут участвовать в других ассоциациях и обозначениях точно так же, как стержневые сущности;

При построении инфологическихмоделей можно использовать язык ER-диаграмм (от англ. Entity-Relationship, т.е. сущность-связь). В них сущности изображаются помеченными прямоугольниками, ассоциации – помеченными ромбами или шестиугольниками, атрибуты – помеченными овалами, а связи между ними – ненаправленными ребрами, над которыми может проставляться степень связи (1 или буква, заменяющая слово "много") и необходимое пояснение.

Между двумя сущностям, например, А и В возможны четыре вида связей.

Первый тип – связь ОДИН-К-ОДНОМУ (1:1): в каждый момент времени каждому представителю (экземпляру) сущности А соответствует 1 или 0 представителей сущности В:

Студент может не "заработать" стипендию, получить обычную или одну из повышенных стипендий.

Второй тип – связь ОДИН-КО-МНОГИМ (1:М): одному представителю сущности А соответствуют 0, 1 или несколько представителей сущности В.

Квартира может пустовать, в ней может жить один или несколько жильцов.

Язык инфологического моделирования(ЯИМ)

Чаще же применяется менее наглядный, но более содержательный язык инфологического моделирования (ЯИМ), в котором сущности и ассоциации представляются предложениями вида:

СУЩНОСТЬ (атрибут 1, атрибут 2 , ..., атрибут n)

АССОЦИАЦИЯ [СУЩНОСТЬ S1, СУЩНОСТЬ S2, ...]

(атрибут 1, атрибут 2, ..., атрибут n)

где S – степень связи, а атрибуты, входящие в ключ, должны быть отмечены с помощью подчеркивания.

Целостность.виды целостности.

Целостность (от англ. integrity – нетронутость, неприкосновенность, сохранность, целостность) – понимается как правильность данных в любой момент времени. Но эта цель может быть достигнута лишь в определенных пределах: СУБД не может контролировать правильность каждого отдельного значения, вводимого в базу данных (хотя каждое значение можно проверить на правдоподобность). Например, нельзя обнаружить, что вводимое значение 5 (представляющее номер дня недели) в действительности должно быть равно 3. С другой стороны, значение 9 явно будет ошибочным и СУБД должна его отвергнуть. Однако для этого ей следует сообщить, что номера дней недели должны принадлежать набору (1,2,3,4,5,6,7).

Выделяют три группы правил целостности:

Целостность по сущностям. Целостность по ссылкам.

Целостность, определяемая пользователем.

Целостность по сущностям. Требования для первичных ключей.

Т.к. потенциальные ключи фактически служат идентификаторами объектов предметной области (т.е. предназначены для различения объектов), то значения этих идентификаторов не могут содержать неизвестные значения. Действительно, если бы идентификаторы могли содержать null-значения, то мы не могли бы дать ответ "да" или "нет" на вопрос, совпадают или нет два идентификатора.

Это определяет следующее правило целостности сущностей:

Правило целостности сущностей. Атрибуты, входящие в состав некоторого потенциального ключа не могут принимать null-значений.

(Сущностная целостность определяет строку как уникальную сущность в конкретной таблице. Она обеспечивает целостность столбцов идентификаторов или первичного ключа таблицы с помощью индексов и ограничений UNIQUE или PRIMARY KEY.)

Доменная целостность

Доменная целостность — это достоверность записей в конкретном столбце. Она включает ограничения типа данных, ограничения формата при помощи ограничений CHECK и правил, а также ограничения диапазона возможных значений при помощи ограничений FOREIGN KEY, CHECK, DEFAULT, определений NOT NULL и правил.

Даталогическая модель.

Под даталогической понимается модель, отражающая логические взаимосвязи между элементами данных безотносительно их содержания и физической организации. При этом даталогическая модель разрабатывается с учетом конкретной реализации СУБД, также с учетом специфики конкретной предметной области на основе ее инфологической модели.

даталогическое проектирование

Стадия проектирования БД, на которой модель данных конкретизируется с учетом особенностей используемой СУБД, осуществляется привязка компонентов модели к местам хранения данных на физических носителях.

Даталогическая модель - Модель данных, разрабатываемая на стадии даталогического проектирования БД

13. реляционные базы данных, основные свойства, основные определения.

Реляционная база данных – это совокупность отношений, содержащих всю информацию, которая должна храниться в БД. Однако пользователи могут воспринимать такую базу данных как совокупность таблиц. Так на рис. 3.2 показаны таблицы базы данных, построенные по инфологической модели базы данных "Питание"

Свойства БД:

1. Каждая таблица состоит из однотипных строк и имеет уникальное имя.

2. Строки имеют фиксированное число полей (столбцов) и значений (множественные поля и повторяющиеся группы недопустимы). Иначе говоря, в каждой позиции таблицы на пересечении строки и столбца всегда имеется в точности одно значение или ничего.

3. Строки таблицы обязательно отличаются друг от друга хотя бы единственным значением, что позволяет однозначно идентифицировать любую строку такой таблицы.

4. Столбцам таблицы однозначно присваиваются имена, и в каждом из них размещаются однородные значения данных (даты, фамилии, целые числа или денежные суммы).

5. Полное информационное содержание базы данных представляется в виде явных значений данных и такой метод представления является единственным. В частности, не существует каких-либо специальных "связей" или указателей, соединяющих одну таблицу с другой. Так, связи между строкой с БЛ = 2 таблицы "Блюда" на рис. 3.2 и строкой с ПР = 7 таблицы продукты (для приготовления Харчо нужен Рис), представляется не с помощью указателей, а благодаря существованию в таблице "Состав" строки, в которой номер блюда равен 2, а номер продукта – 7.

6. При выполнении операций с таблицей ее строки и столбцы можно обрабатывать в любом порядке безотносительно к их информационному содержанию. Этому способствует наличие имен таблиц и их столбцов, а также возможность выделения любой их строки или любого набора строк с указанными признаками (например, рейсов с пунктом назначения "Париж" и временем прибытия до 12 часов).

Будучи математиком по образованию Э.Кодд предложил использовать для обработки данных аппарат теории множеств (объединение, пересечение, разность, декартово произведение). Он показал, что любое представление данных сводится к совокупности двумерных таблиц особого вида, известного в математике как отношение – relation.

Наименьшая единица данных реляционной модели – это отдельное атомарное (неразложимое) для данной модели значение данных. Так, в одной предметной области фамилия, имя и отчество могут рассматриваться как единое значение, а в другой – как три различных значения.

Доменом называется множество атомарных значений одного и того же типа. Так, на рис. 1.1 домен пунктов отправления (назначения) – множество названий населенных пунктов, а домен номеров рейса – множество целых положительных чисел.

Заголовок (на рис. 1.1 он назывался интерпретацией) состоит из такого фиксированного множества атрибутов A1, A2, ..., An, что существует взаимно однозначное соответствие между этими атрибутами Ai и определяющими их доменами Di (i=1,2,...,n).

Тело состоит из меняющегося во времени множества кортежей, где каждый кортеж состоит в свою очередь из множества пар атрибут-значение (Ai:Vi), (i=1,2,...,n), по одной такой паре для каждого атрибута Ai в заголовке. Для любой заданной пары атрибут-значение (Ai:Vi) Vi является значением из единственного домена Di, который связан с атрибутом Ai.

Степень отношения – это число его атрибутов. Отношение степени один называют унарным, степени два – бинарным, степени три – тернарным, ..., а степени n – n-арным. Степень отношения "Рейс"

Первая нормальная форма

Первая и главная нормальная форма требует от таблицы (а точнее, от ее проектировщика) следования следующим правилам:

Каждый столбец в строке должен быть атомарным, т.е. столбец может содержать одно и только одно значение для заданной строки.

Каждая строка в таблице обязана содержать одинаковое количество столбцов. Учитывая обязательную атомарность столбцов, следует, что все строки в таблице должны иметь одинаковое количество значений.

Все строки в таблице, в общем, должны быть уникальны. Значения в столбцах могут дублироваться, но строки, взятые целиком — не могут

Вторая нормальная форма

Два правила второй нормальной формы говорят о том, что:

Таблица обязана соответствовать первой нормальной форме.

Все столбцы, не входящие в полный первичный ключ, должны зависеть от полного первичного ключа.

Третья нормальная форма.

Третья норма данных расширяет две предыдущие, неся в себе два правила:

Таблица должна соответствовать второй нормальной форме.

Все столбцы, не входящие в полный первичный ключ, должны зависеть от него и не должны зависеть друг от друга.


 

 

Графики динамики.

Для изображения и внесения суждения о развитии явления во времени строятся диаграммы динамики. Используются: столбиковые, ленточные, квадратные, круговые, линейные, радиальные. Для построения линейных графиков применяют систему прямоугольных координат. По оси абсцисс откладывается время , а по оси ординат - размеры явлений или процессов. От этого зависит общий вид графика. Преувеличение масштаба по оси ординат по сравнению с масштабом на оси абсцисс дает резкие колебание. Масштабом равномерной шкалы будет длина отрезка, принятого за единицу. На одном графике не следует помещать более трех кривых, диаграмма теряет наглядность. Если нужно сравнить динамику двух показателей понадобится не одна, а две шкалы. Одну размещают справа, другую слева. Недостаток линейной диаграммы – шкала позволяет измерять только отраженные на диаграмме приросты или уменьшения.

Ряды общих индексов

Речь идет о последовательном индексировании общих индексов, т.е. построении системы базисных и цепных общих индексов с постоянными и переменными весами. В зависимости от характера базы и характера весов возможны четыре системы общих индексов.

На примере общего индекса цен по схеме Ласпейреса:

 

 

19.Структурные средние (медиана и мода), способы их расчёта.

Для характеристики структуры вариационных рядов применяются показатели особого рода, которые называют структурными средними.

Мода (Мо) – это значение варьирующего признака, наиболее часто встречающиеся в данном ряду. Модой, или иначе, модальной величиной признака в дискретном ряду является вариант, имеющий наибольшую частоту (или частость).

Медиана (Ме) – это численное значение признака у той единицы изучаемой совокупности, которая находится в середине ранжированного ряда. Медиана делит совокупность на две равные части. Одна часть единиц совокупности имеет значение варьирующего признака меньше, чем медиана, другая – большее.

При определении моды и медианы по данным интервального вариационного ряда применяют специальные формулы:

,

где – нижняя граница модального интервала (модальным называется интервал, имеющий наибольшую частоту);

– величина модального интервала;

, , – частота модального, до и после модального интервалов, соответственно.

,

где – нижняя граница медианного интервала (медианным называется первый интервал, накопленная частота которого превышает половину общей суммы частот);

– величина медианного интервала;

– сумма накопленных частот до медианного интервала;

– частота медианного интервала.

После расчета медианы и моды необходимо пояснить их экономический смысл.

 

 

Информация. Данные. Предметная область. Базы данных. СУБД.

Информация – (от лат. informatio – разъяснение, изложение)

Первоначально – сведения, передаваемые людьми устным, письм. или др. способом ( с помощью условных сигналов, техн. средств и т.д.);

С сер. 20 в. общенаучное понятие, включающее обмен сведениями между людьми, человеком и автоматом, автоматом и автоматом; обмен сигналами в животном и растительном мире; передачу признаков от клетки к клетке, от организма к организму и т.д.

Данные — это результат фиксации, отображения информации на каком-либо материальном носителе, то есть зарегистрированное на носителе представление сведений независимо от того, дошли ли эти сведения до какого-нибудь приёмника и интересуют ли они его

Предметная область -- часть реального мира, рассматриваемая в БД.

База данных– высоко-организованная совокупность данных, предназначенная для их хранения, накопления и обработки, в частности, для быстрого поиска .

Система управления базами данных (СУБД)-совокупность языковых и программных средств, используемая для создания и ведения БД (обновления, обеспечения доступа к данным по запросам пользователя и т.д.).

2.Анализ предметной области и составление технического задания









Последнее изменение этой страницы: 2016-04-06; Нарушение авторского права страницы

infopedia.su не принадлежат авторские права, размещенных материалов. Все права принадлежать их авторам. Обратная связь - 54.225.41.203