Критерий Пирсона для проверки гипотезы о виде закона распределения случайной величины. Критерий Колмогорова. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Критерий Пирсона для проверки гипотезы о виде закона распределения случайной величины. Критерий Колмогорова.



Ранее рассматривались гипотезы, в которых закон распределения генеральной совокупности предполагался известным. Теперь займемся проверкой гипотез о предполагаемом законе неизвестного распределения, то есть будем проверять нулевую гипотезу о том, что генеральная совокупность распределена по некоторому известному закону. Обычно статистические критерии для проверки таких гипотез называются критериями согласия.

Критерием согласия называется критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Это численная мера расхождения между эмпирическим и теоретическим распределением.

Основная задача. Дано эмпирическое распределение (выборка). Сделать предположение (выдвинуть гипотезу) о виде теоретического распределения и проверить выдвинутую гипотезу на заданном уровне значимости α.

Решение основной задачи состоит из двух частей:

1. Выдвижение гипотезы.

2. Проверка гипотезы на заданном уровне значимости.

Рассмотрим подробно эти части.

1. Выбор гипотезы о виде теоретического распределения удобно делать с помощью полигонов или гистограмм частот. Сравнивают эмпирический полигон (или гистограмму) с известными законами распределения и выбирают наиболее подходящий.

Приведём графики важнейших законов распределения:

 

Примеры эмпирических законов распределения приведены на рисунках:

                   
     
     
   
 
 

 


           
     


а) б) в)

В случае (а) выдвигается гипотеза о нормальном распределении, в случае (б) — гипотеза о равномерном распределении, в случае (в) — гипотеза о распределении Пуассона.

Основанием для выдвижения гипотезы о теоретическом распределении могут быть теоретические предпосылки о характере изменения признака. Например, выполнение условий теоремы Ляпунова позволяет сделать гипотезу о нормальном распределении. Равенство средней и дисперсии наводит на гипотезу о распределении Пуассона.

На практике чаще всего приходится встречаться с нормальным распределением, поэтому в наших задачах требуется проверить только гипотезу о нормальном распределении.

Проверка гипотезы о теоретическом распределении отвечает на вопрос: можно ли считать расхождение между предполагаемыми теоретическим и эмпирическим распределениями случайным, несущественным, объясняемым случайностью попадания в выборку тех или иных объектов, или же это расхождение говорит о существенном расхождении между распределениями. Для проверки существуют различные методы (критерии согласия) — c 2 (хи-квадрат), Колмогорова, Романовского и др.

 

Критерий Пирсона.

Достоинством критерия Пирсона является его универсальность: с его помощью можно проверять гипотезы о различных законах распределения.

1. Проверка гипотезы о нормальном распределении. Пусть получена выборка достаточно большого объема п с большим количеством различных значений вариант. Для удобства ее обработки разделим интервал от наименьшего до наибольшего из значений вариант на s равных частей и будем считать, что значения вариант, попавших в каждый интервал, приближенно равны числу, задающему середину интервала. Подсчитав число вариант, попавших в каждый интервал, составим так называемую сгруппированную выборку:

варианты……….. х 1 х 2хs

частоты…………. п 1 п 2пs,

где хi – значения середин интервалов, а пi – число вариант, попавших в i -й интервал (эмпирические частоты). По полученным данным можно вычислить выборочное среднее и выборочное среднее квадратическое отклонение σВ. Проверим предположение, что генеральная совокупность распределена по нормальному закону с параметрами M (X) = , D (X) = . Тогда можно найти количество чисел из выборки объема п, которое должно оказаться в каждом интервале при этом предположении (то есть теоретические частоты). Для этого по таблице значений функции Лапласа найдем вероятность попадания в i -й интервал:

,

где аi и bi - границы i -го интервала. Умножив полученные вероятности на объем выборки п, найдем теоретические частоты: пi =n·pi. Наша цель – сравнить эмпирические и теоретические частоты, которые, конечно, отличаются друг от друга, и выяснить, являются ли эти различия несущественными, не опровергающими гипотезу о нормальном распределении исследуемой случайной величины, или они настолько велики, что противоречат этой гипотезе. Для этого используется критерий в виде случайной величины

. (7)

Смысл ее очевиден: суммируются части, которые квадраты отклонений эмпирических частот от теоретических составляют от соответствующих теоретических частот. Можно доказать, что вне зависимости от реального закона распределения генеральной совокупности закон распределения случайной величины (7) при стремится к закону распределения с числом степеней свободы k = s – 1 – r, где r – число параметров предполагаемого распределения, оцененных по данным выборки. Нормальное распределение характеризуется двумя параметрами, поэтому k = s – 3. Для выбранного критерия строится правосторонняя критическая область, определяемая условием

(8)

где α – уровень значимости. Следовательно, критическая область задается неравенством а область принятия гипотезы - .

Итак, для проверки нулевой гипотезы Н 0: генеральная совокупность распределена нормально – нужно вычислить по выборке наблюдаемое значение критерия:

, (7`)

а по таблице критических точек распределения χ2 найти критическую точку , используя известные значения α и k = s – 3. Если - нулевую гипотезу принимают, при ее отвергают.

Пример. Результаты исследования спроса на товар представлены в таблице:

 

Стоимость, руб. 120–160 160–180 180–200 200–220 220–280
Кол-во, шт.          

Выдвинуть гипотезу о виде распределения и проверить её на уровне значимости a=0,01.

I. Выдвижение гипотезы.

Для указания вида эмпирического распределения построим гистограмму

 

 
 

 


120 160 180 200 220 280

 

По виду гистограммы можно сделать предположение о нормальном законе распределения изучаемого признака в генеральной совокупности.

II. Проверим выдвинутую гипотезу о нормальном распределении, используя критерий согласия Пирсона.

1. Вычисляем , sВ.В качестве вариант возьмём среднее арифметическое концов интервалов:

;

.

2. Найдём интервалы (Zi; Zi+1): ; .

За левый конец первого интервала примем (-¥), а за правый конец последнего интервала - (+¥). Результаты представлены в табл. 4.

3. Найдем теоретические вероятности Рi и теоретические частоты (см. табл. 4).

 

 

Таблица 4

i Граница интервалов Ф(Zi)     Ф(Zi+1)     Pi= Ф(Zi+1)-Ф(Zi)        
    xi xi+1 Zi Zi+1
      -1,14 -0,5 -0,3729 0,1271 6,36
      -1,14 -0,52 -0,3729 -0,1985 0,1744 8,72
      -0,52 0,11 -0,1985 0,0438 0,2423 12,12
      0,11 0,73 0,0438 0,2673 0,2235 11,18
      0,73 0,2673 0,5 0,2327 11,64

 

4. Сравним эмпирические и теоретические частоты. Для этого:

а) вычислим наблюдаемое значение критерия Пирсона.

Вычисления представлены в табл.5.

Таблица 5

i
    6,36 -1,36 1,8496 0,291
    8,72 1,28 1,6384 0,188
    12,12 1,88 3,5344 0,292
    11,18 0,82 0,6724 0,060
    11,64 -2,64 6,9696 0,599
S        

 

б) по таблице критических точек распределения c2 при заданном уровне значимости a=0,01 и числе степеней свободы k=m–3=5–3=2 находим критическую точку ; имеем .

Сравниваем c . . Следовательно, нет оснований отвергать гипотезу о нормальном законе распределения изучаемого признака генеральной совокупности. Т.е. расхождение между эмпирическими и теоретическими частотами незначимо (случайно). ◄

Замечание. Интервалы, содержащие малочисленные эмпирические частоты (ni<5), следует объединить, а частоты этих интервалов сложить. Если производилось объединение интервалов, то при определении числа степеней свободы по формуле K=m-3 следует в качестве m принять число оставшихся после объединения интервалов.

Пример. По выборке из 24 вариант выдвинута гипотеза о нормальном распределении генеральной совокупности. Используя критерий Пирсона при уровне значимости среди заданных значений = {34, 35, 36, 37, 38} указать: а) наибольшее, для которого нет оснований отвергать гипотезу; б) наименьшее, начиная с которого гипотеза должна быть отвергнута.

Найдем число степеней свободы с помощью формулы:

,

где - число групп выборки (вариант), - число параметров распределения.

Так как нормальное распределение имеет 2 параметра ( и ), получаем

.

По таблице критических точек распределения , по заданному уровню значимости и числу степеней свободы определяем критическую точку .

В случае а) для значений , равных 34 и 35, нет оснований отвергать гипотезу о нормальном распределении, так как . А наибольшее среди этих значений .

В случае б) для значений 36, 37, 38 гипотезу отвергают, так как . Наименьшее среди них .◄

 

2. Проверка гипотезы о равномерном распределении. При использовании критерия Пирсона для проверки гипотезы о равномерном распределении генеральной совокупности с предполагаемой плотностью вероятности

необходимо, вычислив по имеющейся выборке значение , оценить параметры а и b по формулам:

, (9)

где а* и b* - оценки а и b. Действительно, для равномерного распределения М (Х) = , , откуда можно получить систему для определения а* и b *: , решением которой являются выражения (9).

Затем, предполагая, что , можно найти теоретические частоты по формулам

Здесь s – число интервалов, на которые разбита выборка.

Наблюдаемое значение критерия Пирсона вычисляется по формуле (7`), а критическое – по таблице с учетом того, что число степеней свободы k = s – 3. После этого границы критической области определяются так же, как и для проверки гипотезы о нормальном распределении.

 

3. Проверка гипотезы о показательном распределении. В этом случае, разбив имеющуюся выборку на равные по длине интервалы, рассмотрим последовательность вариант , равноотстоящих друг от друга (считаем, что все варианты, попавшие в i – й интервал, принимают значение, совпадающее с его серединой), и соответствующих им частот ni (число вариант выборки, попавших в i – й интервал). Вычислим по этим данным и примем в качестве оценки параметра λ величину . Тогда теоретические частоты вычисляются по формуле

Затем сравниваются наблюдаемое и критическое значение критерия Пирсона с учетом того, что число степеней свободы k = s – 2.

Пример. Для выборки, интервальный статистический ряд которой имеет вид

 

Номер интервала Границы интервала Эмпирические частоты
  2 – 5  
  5 – 8  
  8 – 11  
  11 – 14  
  14 – 17  
  17 – 20  

 

проверить при уровне значимости α = 0,05 гипотезу о:

а) показательном; б) равномерном; в) нормальном законе распределения генеральной совокупности с помощью критерия Пирсона.

Объем выборки п = 70. Будем считать вариантами середины частичных интервалов: х 1 = 3,5, х 2 = 6,5,…, х 6 = 18,5.

Найдем = 11,43; σВ = 4,03; s = 4,05.

а) Вычислим теоретические частоты в предположении о показательном распределении генеральной совокупности при

аналогично Наблюдаемое значение критерия Критическая точка χ 2(0,05;4)=9,5; и гипотеза о показательном распределении отклоняется.

б) Для равномерного распределения

теоретические частоты: Наблюдаемое значение критерия Критическая точка и гипотеза о равномерном распределении отклоняется.

 

в) Теоретические частоты для нормального распределения:

Так же вычисляются Наблюдаемое значение критерия Критическая точка Поскольку гипотеза о нормальном распределении генеральной совокупности принимается. ◄

 

Критерий Колмогорова.

Этот критерий применяется для проверки простой гипотезы Н 0 о том, что независимые одинаково распределенные случайные величины Х 1, Х 2, …, Хп имеют заданную непрерывную функцию распределения F (x).

Найдем функцию эмпирического распределения Fn (x) и будем искать границы двусторонней критической области, определяемой условием

. (10)

А.Н.Колмогоров доказал, что в случае справедливости гипотезы Н 0 распределение статистики Dn не зависит от функции F (x), и при

где - (11)

- критерий Колмогорова, значения которого можно найти в соответствующих таблицах. Критическое значение критерия λп (α) вычисляется по заданному уровню значимости α как корень уравнения .

Можно показать, что приближенное значение вычисляется по формуле

, где z – корень уравнения

На практике для вычисления значения статистики Dn используется то, что

, где

а - вариационный ряд, построенный по выборке Х 1, Х 2, …, Хп. Можно дать следующее геометрическое истолкование критерия Колмогорова: если изобразить на плоскости О ху графики функций Fn (x), Fn (x) ±λ n (α) (рис. 1), то гипотеза Н 0 верна, если график функции F (x) не выходит за пределы области, лежащей между графиками функций Fn (x) -λ n (α) и Fn (x) +λ n (α).

 



Поделиться:


Последнее изменение этой страницы: 2017-02-07; просмотров: 1700; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.117.107.90 (0.058 с.)