Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ

Первичная обработка результатов наблюдения

⇐ ПредыдущаяСтр 4 из 7Следующая ⇒

После завершения отбора необходимого числа единиц в выборку и регистрации предусмотренных программой наблюдения изучаемых признаков этих единиц, переходят к обработке этих данных.

Статистическая обработка выборки начинается с составления дискретного вариационного ряда. Обычно полученные наблюдаемые данные представляют собой множество расположенных в беспорядке чисел. Просматривая это множество чисел, зачастую бывает трудно выявить какую-либо закономерность их варьирования (изменения). Для изучения закономерностей варьирования значений случайной величины опытные данные подвергаются обработке. При систематизации выборочных данных используются дискретные и интервальные ряды распределений.

Причём, прежде всего полученные экспериментальные данные ранжируются.

Ранжирование - расположение результатов наблюдений над случайной величиной в порядке возрастания или убывания.

После ранжирования опытные данные объединяются в группы, т. е. группируются. Каждое значение случайной величины, входящее в отдельную группу сгруппированного ряда, называется вариантом, а изменение этого значения – варьированием. Для каждой группы сгруппированного ряда данных можно подсчитать численность вариант, т. е. определить число, показывающее, сколько раз встречается соответствующий вариант в ряде наблюдений, это число называется частотой варианта, обозначается n_i. Сумма частот вариант равна объёму выборки n. Отношение частоты варианта к объёму выборки называется относительной частотой, или частостью, обозначается р _i ^*: р _i ^* = .

Отметим, что сумма относительных частот равна единице

р₁^* + р₂^* +…+ р _i ^* = .

Дискретным вариационным рядомраспределения называется ранжированная совокупность вариантов х _i с соответствующими им частотами n_i или частостями р _i ^*.

Если изучаемая случайная величина является непрерывной, то ранжирование и группировка наблюдаемых значений не позволяют выявить характерные черты варьирования её значений. Нецелесообразно также построение дискретного ряда для дискретной случайной величины, число возможных значений которой велико. В этом случае следует построить интервальный вариационный ряд распределения. Для его построения весь интервал варьирования наблюдаемых значений случайной величины разбивается на ряд частичных интервалов и подсчитывается частота попадания значений величины в каждый частичный интервал.

Интервальным вариационным рядом называется упорядоченная совокупность интервалов варьирования случайной величины с соответствующими частотами или частостями попаданий в каждый из них значений величины.

Число интервалов определяется либо по таблице рекомендуемого числа интервалов для выборок разного объёма, приведённой ниже, либо рассчитывается по формуле Стерджеса (Sturges, 1926 г.)

Рекомендуемое число интервалов для выборок разного объёма

Объём выборки n	10-30	30-60	60-100	100-300	300-400
Число интервалов k	4-5	5-6	7	8	9

На практике считают, что правильно составленный ряд распределения содержит от 6 до 15 частичных интервалов.

Затем определяется шаг или ширина интервала по формуле:

где - максимальное значение измеряемого показателя в упорядоченной (ранжированной) выборке; - минимальное значение показателя.

Полученное значение шага обычно округляют в большую сторону до размерности измеряемого показателя.

Нижняя граница первого интервала выбирается чуть меньшей или равной минимальному значению выборки, то есть от до .

После этого заполняется таблица (табл. 10.1) по результатам выборки, которые распределены в интервалы, т. е. результаты измерений представляются в виде вариационного ряда по образцу, где количество строк зависит от количества интервалов.

Таблица 10.1

№ интервала	Границы интервала	Срединное значение интервала	Частота n_i	Накопленная частота	Частость р _i^*	Накопленная частость
1	2	3	4	5	6	7

В первый столбец таблицы вписывается номер интервала.

Во второй столбец – границы интервала. Причем верхняя граница первого интервала определяется прибавлением шага интервала к его нижней границе. Этот результат является также и нижней границей для следующего интервала. Максимальное число верхней границы последнего интервала должно быть больше или равно максимальному значению показателя в выборке.

В третий столбец вписываются срединные значения интервалов.

Середины интервалов являются средними арифметическими значениями границ интервалов. Причём достаточно определить середину первого интервала, прибавив к ней шаг интервала, получить середину второго интервала и т.д.

Четвёртый столбец – частота (n_i), т. е. количество значений, попавших в заданный интервал. Если граничный результат был учтен в интервале, то в последующем интервале учитываются значения выше граничного результата.

Пятый столбец – накопленная частота, которая рассчитывается суммированием частот предыдущих интервалов. Причем в последней строке этого столбца обязательно должно быть число, равное объему выборки (n).

Шестой столбец – частость(р _i ^*), т. е. отношение частоты к объёму выборки.

Седьмой столбец – накопленная частость, получаемая суммированием частостей предыдущих интервалов. В последней строке столбца 6 получается единица.

Распределение измерений, представленное в столбцах 2(границы интервалов) и 4(частота) или 2(границы интервалов) и 6(частость), называется вариационным рядом.

Графическое представление результатов измерений выражается в построении трех графиков: полигона частот (рис.10.1), гистограммы (рис. 10.2) и полигона накопленных частот (кривой сумм или кумуляты) (рис.10. 4).

Полигон частот и гистограмма показывают распределение измеряемых показателей и их сгруппированность вокруг среднего значения.

Для построения полигоначастот в декартовых координатах по оси абсцисс откладываются срединные значения интервалов, а по оси ординат – соответствующие им частоты (или частости).

Рис. 10.1. Полигон частот результатов

Для построения гистограммы по оси абсцисс откладываются границы интервалов и на них восстанавливаются прямоугольники до уровня частот, соответствующих интервалам, отложенных по оси ординат (рис.10.2). Площадь гистограммы равна сумме всех частот, т. е. объёму выборки, или сумме частостей, т. е. единице.

Рис. 10.2. Гистограмма распределения результатов

Если нанести на гистограмму пунктирной линией полигон распределения частот, то мы получим первоначальное представление о дифференциальной функции распределения.

Таким образом, теоретическим аналогом гистограммы является плотность распределения вероятностей, или дифференциальная функция распределения (рис. 10.3).

Рис. 10.3. Плотность распределения вероятностей

Иначе говоря, гистограмма является экспериментальным аналогом плотности распределения вероятностей генеральной совокупности.

На основе полученного вариационного ряда необходимо построить функцию распределения выборки или эмпирическую функцию F *(x), то есть функцию найденную по данным эксперимента.

Если за принять некоторое значение в табличном ряду, а за – число наблюдений, расположенных левее в том же табличном ряду, то эмпирической функцией распределения случайной величины называют функцию F *(x), определяющую для каждого значения x относительную частоту события X < x:

F *(x)= .

Эта функция служит приближённой оценкой теоретической функции распределения F (x) случайной величины Х. Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция F (x) определяет вероятность события Х<х, а эмпирическая функция определяет относительную частоту этого же события. обладает всеми свойствами F (x), а именно:

1) значения эмпирической функции принадлежат интервалу [0;1];

2) F *(x)- неубывающая функция;

3) если - наименьшее значение, - наибольшее, то F *(x)= 0 при и F *(x)= 1 при x > .

Эмпирическую функцию F *(x) называют полигоном накопленных частот сумм или кумулятой. Онапоказывает прирост показателей от интервала к интервалу, поэтому его ещё называют кривой сумм. Для построения полигона накопленных частот по оси абсцисс откладываются верхние границы интервалов, а по оси ординат – соответствующие им накопленные частоты (или накопленные частости) (рис. 10.4). накопленная

частота

Рис.10.4. Полигон накопленных частот результатов

Теоретическим аналогом полигона накопленных частот результатов является функция распределения, или интегральная функция распределения (рис.10.5).

Рис. 10.5. Функция распределения

Иначе говоря, полигон накопленных частот результатов является экспериментальным аналогом функции распределения.

На основании полученных выборочных данных необходимо сделать предположение, относительно закона распределения изучаемого признака. Для того чтобы проверить, согласуется ли это предположение с данными наблюдений, вычисляют частоты наблюдаемых значений, т.е. находят теоретически сколько раз величина Х должна была принять каждое из наблюдаемых значений, если она распределена по предполагаемому закону. Для этого находят выравнивающие (теоретические) частоты по формуле: где n –число испытаний, - вероятность наблюдаемого значения , вычисленная при допущении, что Х имеет предполагаемое распределение.

В случае непрерывного распределения весь интервал возможных значений делят на k непересекающихся интервалов и вычисляют вероятности попадания Х в i -й частичный интервал, а затем, как и для дискретного распределения, умножают число испытаний на эти вероятности. Эмпирические и выравнивающие частоты сравнивают, и при небольшом расхождении данных, делают заключение о выбранном законе распределения.

На следующем этапе производится аналитический анализ, в ходе которого находятся основные статистические характеристики вариационного ряда.

К основным статистическим характеристикам ряда измерений (вариационного ряда) относятся характеристики положения (средние характеристики, или центральная тенденция выборки); характеристики рассеяния (вариации, или колеблемости) и х арактеристики формы распределения.

К характеристикам положения относятся среднее арифметическое значение (среднее значение), мода и медиана.

К характеристикам рассеяния (вариации, или колеблемости) относятся: размах вариации, дисперсия, среднее квадратическое (стандартное) отклонение, ошибка средней арифметической (ошибка средней), коэффициент вариации и др.

К характеристикам формы относятся коэффициенты асимметрии, (мера скошенности) и эксцесс.

Приведем формулы для расчёта основных статистических характеристик.

Характеристики положения

⇐ Предыдущая 1 2 345 6 7 Следующая ⇒

Читайте также:

Где возникла философия и почему?

Относительная высота сжатой зоны бетона

Сущность проекции Гаусса-Крюгера и использование ее в геодезии

Тарифы на перевозку пассажиров

Последнее изменение этой страницы: 2021-12-15; просмотров: 74; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.17.79.60 (0.022 с.)