ТОП 10:

Проверка согласия теоретического и статистического распределений



При построении гистограммы была выдвинута гипотеза о законе распределения генеральной совокупности. Назовем этот закон распределения теоретическим. Проверим его согласие с распределением выборки.

Сущность проверки статистической гипотезы заключается в том, чтобы установить, согласуются или нет данные наблюдения и выдвинутая гипотеза, можно ли расхождения между гипотезой и результатом выборочных наблюдений отнести за счет случайной погрешности, обусловленной механизмом случайного отбора. При этом критерии в задачах проверки гипотез о параметрах распределения называют критериями значимости, а в задачах проверки гипотез о законах распределения – критериями согласия.

Идея проверки статистической гипотезы состоит в следующем. Пусть - выдвинутая гипотеза, которую назовем основной, противопоставляя ее множеству альтернативных гипотез. Для проверки основной гипотезы проводится опыт, результатом которого является величина , скалярная мера близости между гипотетическим и эмпирическим распределениями или между гипотетической и эмпирической характеристиками распределения. представляет собой одномерную величину, значения которой изменяются от опыта к опыту. Закон распределения предполагается известным. По заданному область значений можно разбить на две области: . Область определяется из условия и называется критической областью гипотезы на уровне значимости . Таким образом, при условии справедливости гипотезы попадание величины в критическую область есть событие маловероятное, практически невозможное. Процедура проверки гипотезы заключается в следующем: по заданному уровню значимости определяются , затем проводится опыт. Если его результат , т. е. произошло событие, практически невозможное при условии справедливости гипотезы , то гипотеза отвергается на уровне значимости . Если , т. е. , то гипотеза не отвергается на уровне значимости . Стандартным значением для уровня значимости является одно из следующих значений: 0,05; 0,01; 0,001. Величина Z называется критериемпроверки гипотезы .

Очевидно, что при такой проверке правильная гипотеза может быть отвергнута.

Ошибка, заключающаяся в том, что отвергается верная гипотеза, называется ошибкой первого рода. Вероятность такой ошибки равна . Выбор малого гарантирует, что ошибка первого рода будет совершаться редко.

Возможна еще ошибка второго рода, состоящая в том, что гипотеза ,будучиневерной, не отвергается. Вероятность ошибки второго рода равна

. Величина

называется мощностью критерия при заданном . Для уменьшения вероятности ошибки второго рода или, что то же самое, для увеличения мощности критерия, вероятность должна быть возможно большей.

Таким образом, при выборе критической области будем руководствоваться следующими соображениями:

, . (3)

Процесс проверки статистической гипотезы сводится к следующему:

- выдвигается основная гипотеза и множество альтернативных гипотез ;

- выбирается критерий, представляющий собой некоторую меру близости между гипотетическим и эмпирическим распределениями или между гипотетической и эмпирической характеристиками распределения;

- критерий выбирается так, чтобы его распределение было известно;

- назначается уровень значимости и определяется критическая область ;

- производится опыт и по данным опыта (выборочным наблюдениям) вычисля-

ется значение критерия ;

- если , то гипотеза отвергается, если , то гипотеза не отвергается на уровне значимости .

Из большого числа различных критериев чаще других используется критерий согласия , предложенный К. Пирсоном. В этом критерии в качестве меры расхождения теоретического и статистического распределений выбирается величина , определяемая равенством

, (4)

где n – объем выборки; – число интервалов, на которые разбита выборка;

–число элементов выборки, попавших в -й интервал; – теоретическая вероятность попадания значений случайной величины в -й интервал.

Вероятность определяется в согласии с теоретическим законом распределения

, (5)

 

или , (6)

где - границы –го интервала.

Примеры

Пусть выдвинуты гипотезы о распределении генеральной совокупности:

1) по показательному закону

где - оценка параметра показательного закона распределения по выборке; . Здесь - оценка математического ожидания;

2) по нормальному закону ,

где - оценка математического ожидания, - оценка дисперсии по выборке. - оценка среднего квадратичного; - функция Лапласа (табл. А1);

3) по закону Релея ,

где - оценка параметра закона Релея по выборке : ;

4) по равномерному закону ,

где - оценки крайних значений выборки, которые находятся из системы .

Случайная величина , независимо от вида закона распределения генеральной совокупности, при достаточно больших имеет распределение с числом степеней свободы , где - число интервалов, r – число параметров распределения, определенных по выборке.

Задаваясь уровнем значимости , по таблице А2 определим критическое значение , такое, что . При больших распределено асимптотически нормально и можно пользоваться таблицами нормального закона. Если , то выдвинутая гипотеза о виде закона распределения генеральной совокупности не отвергается на уровне значимости (гипотеза не противоречит опытным данным), если же , то гипотеза отвергается на уровне значимости .

Замечание. Критерий Пирсона обладает большей мощностью, если интервалы содержат примерно равное число элементов, при этом длины интервалов не обязательно должны быть равными. Поэтому при использовании критерия Пирсона нужно произвести новое разбиение данной выборки на интервалы, содержащие примерно равное число элементов.

Замечание.Все расчеты вести с тем количеством знаков, с каким даны значе-

ния случайной величины (можно добавить один дополнительный знак).

Пример выполнения и оформления лабораторной работы

Дана выборка, содержащая 200 элементов (см. лаб. раб. 1, табл. 1). Упорядочим выборку. Наименьшее число равно 0,000 9 94, наибольшее число равно

3,666 642. Интервал (0,0001; 3,700) разделим на 20 равных частей. Границы интервалов занесем в графу 2 таблицы 1. Число элементов, попавших в i-й интервал, занесем в графу 3. Два числа - 3,014 916, 3,666 642, резко отличающиеся от других и полученные, видимо, за счет грубых ошибок опыта, можно отбросить. Таким образом, . Объединим интервалы таким образом, чтобы новые интервалы содержали не менее 8-10 элементов. Новые границы интервалов, а также число элементов, попавших в уточненные интервалы, поместим в графы 4 и 5, в графу 6 поместим частоты попаданий в каждый интервал. По полученным данным построим гистограмму (см. лаб. раб. 1, рис.2,). Вид гистограммы дает право выдвинуть гипотезу о показательном распределении генеральной совокупности.

Оценку параметра показательного закона можно определить следующим обра-

зом: . - число уточненных интервалов.

Для удобства значения поместим в графу 8, значения

предварительно были помещены в графу 7. Оценка математического ожидания , оценка параметра показательного закона . Для вычисления величины - меры расхождения теоретического и статистического распределений - вычислим теоретические вероятности попаданий значений случайной величины в – й интервал по формуле (6). Значения для каждого занесем в графу 11. Вычисленное значение .

В данном примере по выборке определен один параметр . Следовательно, и число степеней свободы распределения . Зададимся уровнем значимости . По таблице А2 находим . Вычисленное значение меньше , следовательно, гипотеза не отвергается с уровнем значимости .

Контрольные вопросы

1. Что такое эмпирическая функция распределения, как она вычисляется по данным выборки?

2. Что такое гистограмма распределения, как она строится по данным выборки?

3. Объяснить содержательный смысл критерия как меры близости эмпирического и теоретического распределений.

4. Как учитывается при пользовании критерием согласия факт определения

параметров теоретического распределения по данным выборки?

5. Почему при гипотезу следует отбросить?

 


Таблица 1

    № п/п     J (до объединения) (до объеди-не-ния)     J (после объединения)   (после объ-един-ения)                      
(0,000-0,185) (0,000-0,185) 0,252 525 0,0925 0,233 585   0,244 485 0,052 3541
(0,185-0,370) (0,185-0,370) 0,191 919 0,2775 0,053 2575   0,184 713 0,055 6801
(0,370-0,555) (0,370-0,555) 0,141 414 0,4625 0,065 4039   0,139 554 0,004 9092
(0,555-0,740) (0,555-0,740) 0,111 111 0,6475 0,071 9444   0,105 434 0,060 525
(0,740-0,925) (0,740-0,925) 0,085 859 0,8325 0,071 4778   0,079 657 0,095 5973
(0,925-1,110) (0,925-1,295) 0,101 010 1,11 0,112 1211   0,105 650 0,040 3464
7 (1,110-1,295)                
(1,295-1,480)                
(1,480-1,665) (1,295-1,850) 0,070707 1,5725 0,111 1867   0,079 914 0,210 0245
(1,665-1,850)                
(1,850-2,035)                
(2,035-2,220)                
(2,220-2,405) (1,850-2,775) 0,045454 2,3125 0,105 1123   0,045 678 0,000 2145
(2,405-2,590)                
(2,590-2,775)
1

 
(2,775-2,960)  
(2,960-3,145)  
(3,145-3,330)  
(3,330-3,515)  
(3,515-3,700)  


Исходные данные для лабораторных работ 1 и 2

Вариант № 1  
1.3477 0.2103 0.1986 0.6075 0.1855 1.2369 0.6342 0.6085
0.1149 0.0589 2.4146 0.3616 0.0507 0.4288 0.5271 0.0256
0.0122 0.0372 3.1630 0.0052 0.1318 0.2368 0.3951 0 1228
1.2179 1.1764 0.7849 0.0127 1.1532 0.6347 0.3706 1.4618
0.6058 2.2735 0.9660 2.5070 1.2873 0.2850 0.4288 1.5013
0.6288 0.3467 0.0852 0.3289 0.8315 0.5832 0.9193 0.2175
0.7987 0.3619 0.9346 1.1240 2.0330 0.4499 0.8190 0.3876
1.5254 0.0460 0.2162 0.0940 0.3219 0.0553 0.5683 0.7826
0.1124 0.4599 0.8962 0.4216 0.5704 0.5462 0.0617 0.3739
1.1240 0.2457 0.8243 0.7718 2.2571 3.1750 0.1205 0.1577
0.2793 0.2657 0.3568 0.3157 0.5193 0.0412 0.0783 0.5974
0.3485 0.3693 0.1615 4.1198 0.6488 0.6333 0.3160 2.4637
0.3243 0.6258 1.0332 2.1218 0.5510 1.0726 0.2653 0.8948
0.5117 0.5252 0.4743 0.4009 0.4780 0.2046 1.9297 0.2017
0.0243 0.2475 0.4533 1.5822 1.0943 0.1892 0.0776 0.6677
0.0492 0.7961 0.7037 1.6622 0.6615 0.3959 0.1086 0.4650
2.1563 0.9641 0.0725 0.0578 0.1003 0.7716 0.5468 0.7078
0.9448 0.1065 0.8215 0.0667 2.3079 2.9904 0.2937 0.1147
0.2728 0.9434 0.4326 0.2749 2.9410 0.2141 0.1783 0.2735
0.1445 0.0090 0.1459 0.1555 0.4759 1.5617 0.8086 0.4629
0.0746 4.9853 1.2168 1.0016 0.8417 1.1090 0.2977 0.9793
0.9855 2.6596 0.6743 0.4680 0.0179 1.9120 0.4759 0.4485
0.8310 1.2612 0.1081 2.7027 1.4983 0.1689 0.4115 0.0489
0.5970 0.2522 1.3052 0.4892 0.1613 0.0472 2.6204 0.4666
0.4302 0.7117 0.1903 1.5936 1.1317 0.1480 0.9583 0.6624

Вариант № 2

 







Последнее изменение этой страницы: 2016-04-19; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 34.204.183.113 (0.009 с.)