Проверка статистических гипотез 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Проверка статистических гипотез



           Условимся называть статистической гипотезой всякое предположение о виде закона распределения некоторого признака генеральной совокупности.

           Проверку правильности или неправильности выдвинутой гипотезы проводят статистическими методами с помощью критерия согласия. Под критерием согласия подразумевают совокупность условий, подтверждающих справедливость принятой гипотезы. В результате такой проверки может быть принято правильное или неправильное решение. Поэтому при оценке согласованности выдвинутой гипотезы возможны ошибки двух типов: если отклоняется правильная гипотеза и если принимается ложная гипотеза.

 Ошибки первого типа относятся к ошибкам первого рода; ошибки второго типа – к ошибкам второго рода.

Вероятность ошибки первого рода обычно обозначают через α и называют уровнем значимости критерия согласия.

Вероятность ошибки второго рода обозначают через β. Величину (1 ), т.е. вероятность того, что будет отвергнута ошибочная гипотеза, называют мощностью критерия.

           Для проверки справедливости гипотезы о законе распределения случайной величины используют несколько критериев, различных по мощности и методу обработки исходных данных, из которых наиболее распространенными являются критерий Колмогорова и критерий χ2 (хи-квадрат) Пирсона. Первый используется в случае, когда параметры распределения известны до опыта и требуется после опыта проверить согласованность теоретического и экспериментального распределения, второй – при неизвестных параметрах распределения.

           Для применения критерия χ2 при оценивании согласия теоретического и статистического распределений вариационный ряд эмпирических значений разбивают на k равных интервалов. Число значений ряда в интервале (эмпирическая частота) обозначают буквой ni. Зная границы каждого интервала и принятый закон распределения, можно найти вероятность попадания случайной величины в этот интервал р i. После этого из формулы  находится теоретическая частота появления события . Для определения меры расхождения по критерию χ2  используют выражение:

 

(9.1)

               

Полученное значение χ2 сравнивают с критическим значением этого критерия. Значение  выбирают по таблице в зависимости от уровня значимости α и числа степеней свободы r = k -1- m, где k – это число интервалов, m – число параметров предполагаемого распределения.

           Гипотезу о предполагаемом законе распределения считают справедливой при условии . Если , гипотезу отвергают.

Пример 9.1. По полученным в результате измерений данным (табл.9.1.) проверить гипотезу о нормальном распределении генеральной совокупности.

 

 

 

Таблица 9.1.

Номер интервала

Границы

интервала

Частота Середина интервала Квадрат середины интервала

Разности

Границы

i ni zi Zi+1
1 4 6 15 5 25 -8,63 -6,63 -1,84 -1,41
2 6 8 26 7 49 -6,63 -4,63 -1,41 -0,99
3 8 10 25 9 81 -4,63 -2,63 -0,99 -0,56
4 10 12 30 11 121 -2,63 -0,63 -0,56 -0,13
5 12 14 26 13 169 -0,63 1,37 -0,13 0,29
6 14 16 21 15 225 1,37 3,37 0,29 0,72
7 16 18 24 17 289 3,37 5,37 0,72 1,14
8 18 20 20 19 361 5,37 7,37 1,14 1,57
9 20 22 13 21 441 7,37 9,37 1,57 1,99
Σ     n =200            

 

Решение: Вычисляем среднее значение интервала  и находим .Далее находим . Используя для выборочной дисперсии формулу , находим D в =181,56-159,52=22,04. Отсюда .

Для того чтобы вычислить теоретические вероятности попадания случайных величин в интервалы (xi, xi+1), на основании таблиц функции Лапласа находим значения Ф(zi) и Ф(zi+1).

После этого составляем еще одну таблицу для расчета теоретических частот (табл.9.2)

Таблица 9.2

Номер

интервала

i

Границы

Ф(zi)

Ф(zi+1)

Pi= Ф(zi)- Ф(zi+1)

Zi Zi+1
1 -1,84 -1,41 -0,4671 -0,4207 0,0464 9,28
2 -1,41 -0,99 -0,4207 -0,3389 0,0818 16,36
3 -0,99 -0,56 -0,3389 -0,2123 0,1266 25,32
4 -0,56 -0,13 -0,2123 -0,0517 0,1606 32,12
5 -0,13 0,29 -0,0517 0,1141 0,1658 33,16
6 0,29 0,72 0,1141 0,2642 0,1501 30,02
7 0,72 1,14 0,2642 0,3729 0,1087 21,74
8 1,14 1,57 0,3729 0,4418 0,0689 13,78
9 1,57 1,99 0,4418 0,4767 0,0349 6,98

 

Составляем таблицу для определения  (табл.9.3)

Таблица 9.3

i ni
1 15 9,28 5,72 32,7 3,52
2 26 16,36 9,64 92,9 5,68
3 25 25,32 -0,32 0,1 0
4 30 32,12 -2,12 4,5 0,14
5 26 33,16 -7,16 52,3 1,58
6 21 30,02 -9,02 81,4 2,75
7 24 21,74 2,26 5,1 0,23
8 20 13,78 6,22 38,7 2,8
9 13 6,98 6,02 36,2 5,2
å         21,9

 

Число степеней свободы r =9-3=6, по уровню значимости a=0,05 и r =6 из таблицы распределения c2 находим . Так как , то гипотеза отвергается, следовательно, требуется либо изменить вид закона, либо повторить опыты.

Задачи теории корреляции

Функциональной зависимостью называется такая связь между переменными величинами, при которой зависимая величина - функция - полностью определяется значениями влияющих независимых величин - аргументов. Вид зависимости между аргументами и функцией обычно задается в виде формулы.

Наиболее часто на практике используются: линейная функция y = ax + b, гиперболическая , показательная - , степенная (обычно парабола) - .

Корреляционная зависимость - это такая связь между величинами, когда определенным значениям влияющих величин - факторов соответствуют множество значений зависимой величины, распределенных по известному закону распределения.

Например, чем больше товарооборот x, тем больше должна быть сумма издержек обращения y (x), однако, если фактические данные о товарообороте и издержках, полученных от разных потребительских обществ, нанести в виде точек на координатную плоскость (x, y), то они могут иметь вид прямолинейного вытянутого облака -корреляционного поля (рис.10.1.)

Под корреляционной зависимостью y от x понимается зависимость условной средней  от x, т.е. . Это равенство называется уравнением регрессии y на х. Вместе с регрессией y на х всегда может быть построена и регрессия   x на y, с уравнением .

При определении корреляционной зависимости, решаются две задачи:

1. установить форму корреляционной зависимости, т.е. вид функции;

2. оценить тесноту (силу) корреляционной связи (она оценивается по величине рассеяния значений y вокруг условного среднего . Чем меньше рассеяние, тем сильнее корреляционная зависимость).



Поделиться:


Последнее изменение этой страницы: 2021-04-05; просмотров: 65; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.119.126.80 (0.011 с.)