ЗНАЕТЕ ЛИ ВЫ?

Проверка статистической гипотезы о равенстве долей или вероятностей



Пусть в двух генеральных совокупностях проводятся независимые испытания, в результате которых может осуществиться или не осуществиться одно и то же событие.

Обозначим неизвестную долю появления этого события в первой генеральной совокупности через , а во второй генеральной совокупности – через . Нулевая гипотеза формулируется как утверждение о равенстве этих долей в обоих генеральных совокупностях: , где - это просто обозначение общего значения долей в двух генеральных совокупностях. В качестве альтернативной гипотезы можно выбрать следующие варианты: - двусторонняя, - односторонняя, - тоже односторонняя.

Для осуществления проверки нулевой гипотезы производится выборка, объёмом из первой генеральной совокупности, т.е. для этой генеральной совокупности произведено испытаний. Пусть в этих испытаниях интересующее нас событие появлялось раз. Тогда относительная частота появления этого события в выборке из первой генеральной совокупности . Аналогично, производится выборка, объёмом из второй генеральной совокупности, т.е. для этой генеральной совокупности произведено испытаний. Пусть в этих испытаниях интересующее нас событие появлялось раз. Тогда относительная частота появления этого события в выборке из второй генеральной совокупности .

Если обе выборки достаточно велики, то законы распределения случайных величин и будут близки к нормальному.

Выше уже обосновывалось, что математическое ожидание выборочной частоты равно генеральной доле: и . Дисперсии этих случайных величин таковы: и .

Покажем, что является несмещённой оценкой для . Действительно, . Поскольку испытания независимы, выборки будут тоже независимыми. Тогда можно использовать следующую формулу для дисперсии разности: .

Если нулевая гипотеза верна, то . Величина - неизвестна, её заменяют наилучшей точечной статистической оценкой: .

Для проверки нулевой гипотезы в этом случае используют -оценку, имеющую стандартное нормальное распределение:

Вычисленное значение -оценки следует сравнить с критическим. А вывод о том, принимать или отклонять нулевую гипотезу определяется тем, как сформулированы альтернативные гипотезы.

Пусть уровень значимости равен . Напомним, что уровень значимости задаёт исследователь из своих содержательных соображений, используя свой опыт проверки аналогичных гипотез. По таблицам или, например, в Excel необходимо определить значение - границу критической области. Это значение аргумента, при котором стандартная нормальная величина принимает значение .

Случай 1. Альтернативная гипотеза представлена двусторонним неравенством (двусторонняя гипотеза).

Критическая область для такой альтернативной гипотезы будет задаваться неравенством: . Если это неравенство выполняется, нет оснований принимать нулевую гипотезу, т.е. она должна быть отклонена, поскольку значение статистического критерия попадает в критическую область.

Случай 2. Альтернативная гипотеза представлена односторонним неравенством (односторонняя гипотеза).

Критическая область для такой альтернативной гипотезы будет задаваться неравенством: . Если это неравенство выполняется, нет оснований принимать нулевую гипотезу, т.е. она должна быть отклонена, поскольку значение статистического критерия попадает в критическую область.

Случай 3. Альтернативная гипотеза представлена односторонним неравенством (односторонняя гипотеза).

Критическая область для такой альтернативной гипотезы будет задаваться неравенством: . Если это неравенство выполняется, нет оснований принимать нулевую гипотезу, т.е. она должна быть отклонена, поскольку значение статистического критерия попадает в критическую область.

Пример. Для того чтобы оценить в сравнении активность электората Москвы и Санкт-Петербурга при избрании депутатов Государственной Думы, была сделана случайная выборка избирателей в этих двух городах. Затем выяснялось, какая часть каждой выборки реально пришла на тот или иной избирательный участок для участия в выборах. Данные оказались следующими: в Москве из 1500 потенциальных случайно выбранных избирателей реально в выборах приняли участие 480 человек, а в Санкт-Петербурге из 1630 потенциальных избирателей на избирательные участки пришли 490 человек. На уровне значимости 10% проверить гипотезу о равенстве генеральных долей избирателей в двух этих городах, которые реально приняли участие в выборах.

В качестве нулевой гипотезы можно принять равенство генеральных долей избирателей в Москве и в Санкт-Петербурге, а в качестве двусторонней альтернативной гипотезы – неравенство этих долей.

В данном случае в Москве приняли участие в выборах человек из избирателей, а в Санкт-Петербурге – человек из избирателей. Тогда доли избирателей из выборок, реально принявших участие в выборах в Москве равна , а в Санкт-Петербурге – .

Вычислим наилучшую точечную статистическую оценку доли, если она одинакова в обоих генеральных совокупностях: . Используя эту оценку доли избирателей, вычислим Z-оценку: .

По таблице значений функции Лапласа или используя функцию =НОРМСТОБР в Microsoft Excel находим критические значения для нормального распределения: для уровня значимости 0,9 оно равно 1,2816, а дополнительно – для уровня значимости 0,95 оно равно 1,6449, для уровня значимости 0,99 оно равно 2,3263.

Для всех уровней значимости получается, что вычисленное значение Z-оценки оказалось меньшим критических при указанных выше уровнях значимости – 0,9, 0,95 и 0,99. Ъто означает, что вычисленное значение Z-оценки находится в области допустимых значений, поэтому нет оснований отвергать нулевую гипотезу. Следовательно, генеральные доли избирателей, реально принявших участие в выборах в Москве и в Санкт-Петербурге, статистически значимо не отличаются, т.е. их можно считать одинаковыми.

Покажем все найденные значения на графике плотности стандартного нормального закона распределения, который описывает поведение случайной величины Zпри справедливости нулевой гипотезы.

a/2=0.05 a
Zкр= -1.65 0 Zкр=1.65 x
a/2=0.05 a
g=0.90 a
p(x) Zнабл=1.17

 


График стандартного нормального распределения с указанием области допустимых и критических значений для уровня значимости 0,9 ( ). Тогда , а ).

На этом графике видно, что красная точка, соответствующая вычисленному значению Z-оценки, находится внутри области допустимых значений нулевой гипотезы на уровне значимости 0,9. Это положение красной точки и определяет вывод о том, что нет оснований отвергать нулевую гипотезу на этом уровне значимости.





Последнее изменение этой страницы: 2017-01-20; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.238.184.78 (0.005 с.)