Проверка гипотезы о равенстве средних 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Проверка гипотезы о равенстве средних



8.1. Понятие зависимых и независимых выборок.

Выбор критерия для проверки гипотезы

 

Н0: m 1 = m2

 

в первую очередь определяется тем, являются ли рассматриваемые выборки зависимыми или независимыми. Введем соответствующие определения.

Опр. Выборки называются независимыми, если процедура отбора единиц в первую выборку никак не связана с процедурой отбора единиц во вторую выборку.

Примером двух независимых выборок могут служить обсуждавшиеся выше выборки мужчин и женщин, работающих на одном предприятии (в одной отрасли и т.д.).

Заметим, что независимость двух выборок отнюдь не означает отсутствие требования определенного рода сходства этих выборок (их однородности). Так, изучая уровень дохода мужчин и женщин, мы вряд ли допустим такую ситуацию, когда мужчины отбираются из среды московских бизнесменов, а женщины – из аборигенов Австралии. Женщины тоже должны быть москвичками и, более того – «бизнесвуменшами». Но здесь мы говорим не о зависимости выборок, а о требовании однородности изучаемой совокупности объектов, которое должно удовлетворяться и при сборе, и при анализе социологических данных[56].

Опр. Выборки называются зависимыми, или парными, если каждая единица одной выборки «привязывается» к определенной единице второй выборки.

Последнее определение, вероятно, станет более ясным, если мы приведем пример зависимых выборок.

Предположим, что мы хотим выяснить, является ли социальный статус отца в среднем ниже социального статуса сына (полагаем, что мы можем измерить эту сложную и неоднозначно понимаемую социальную характеристику человека). Представляется очевидным, что в такой ситуации целессобразно отбрать пары респондентов (отец, сын) и считать, что каждый элемент первой выборки (один из отцов) «привязан» к определенному элементу второй выборки (своему сыну). Эти две выборки и будут называться зависимыми.

 

8.2. Проверка гипотезы для независимых выборок

Для независимых выборок выбор критерия зависит от того, знаем ли мы генеральные дисперсии s12 и s22 рассматриваемого признака для изучаемых выборок. Будем считать эту проблему решенной, полагая, что выборочные дисперсии совпадают с генеральными. В таком случае в качестве критерия выступает величина:

 

(8.1)

 

Прежде, чем переходить к обсуждению той ситуации, когда генеральные дисперсии (или хотя бы одна из них) нам неизвестны, заметим следующее.

Логика использования критерия (8.1) похожа на ту, которая была описана нами при рассмотрении критерия “Хи-квадрат” (7.2). Имеется лишь одно принципиальное отличие. Говоря о смысле критерия (7.2), мы рассматривали бесконечное количество выборок объема n, «черпающихся» из нашей генеральной совокупности. Здесь же, анализируя смысл критерия (8.1), мы переходим к рассмотрению бесконечного количества пар выборок объемом n1 и n2. Для каждой пары и рассчитывается статистика вида (8.1). Совокупности получаемых значений таких статистик, в соответствии с нашими обозначениями, отвечает нормальное распределение (как мы условились, буква z используется для обозначения такого критерия, которому отвечает именно нормальное распределение).

Итак, если генеральные дисперсии нам неизвестны, то мы вынуждены вместо них пользоваться их выборочными оценками s12 и s22. Однако при этом нормальное распределение должно замениться на распределение Стьюдента – z должно замениться на t (как это имело место в аналогичной ситуации при построения доверительного интервала для математического ожидания). Однако при достаточно больших объемах выборок (n1, n2 ³ 30), как мы уже знаем, распределение Стьюдента практически совпадает с нормальным. Другими словами, при больших выборках мы можем продолжать пользоваться критерием:

 

(8.2)

 

Сложнее обстоит дело с такой ситуацией, когда и дисперсии неизвестны, и объем хотя бы одной выборки мал. Тогда вступает в силу еще один фактор. Вид критерия зависит от того, можем ли мы считать неизвестные нам дисперсии рассматриваемого признака в двух анализируемых выборках равными. Для выяснения этого надо проверить гипотезу:

H0: s12 = s22. (8.3)

Для проверки этой гипотезы используется критерий

 

. (8.4)

О специфике использования этого критерия пойдет речь ниже, а сейчас продолжим обсуждать алгоритм выбора критерия, использующего для проверки гипотез о равенстве математических ожиданий.

Если гипотеза (8.3) отвергается, то интересующий нас критерий приобретает вид:

 

 

(8.5)

 

(т.е. отличается от критерия (8.2), использовавшегося при больших выборках, тем, что соответствующая статистика имеет не нормальное распределение, а распределение Стьюдента). Если гипотез (8.3) принимается, то вид используемого критерия меняется:

 

(8.6)

 

 

Подведем итог того, как выбирается критерий для проверки гипотезы о равенстве генеральных математических ожиданий на основе анализа двух независимых выборок.

 

 

известны

s1 и s2

неизвестны

 

размер выборок большой

 

малый

 

H0: s1 = s2 отвергается

принимается

 

 

8.3. Проверка гипотезы для зависимых выборок

Перейдем к рассмотрению зависимых выборок. Пусть последовательности чисел

 

X1, X2, …, Xn;

Y1, Y2, …, Yn

это значения рассматриваемой случайной для элементов двух зависимых выборок. Введем обозначение:

 

 

Di = Xi - Yi, i = 1,..., n.

 

Для зависимых выборок критерий, позволяющий проверять гипотезу

H0: m1 = m 2

выглядит следующим образом:

= , где

=

 

Заметим, что только что приведенное выражение для sD есть не что иное, как новое выражение для известной формулы, выражающей среднее квадратическое отклонение. В данном случае речь идет о среднем квадратическом отклонении величин Di. Подобная формула часто используется на практике как более простой (по сравнению с «лобовым» подсчетом суммы квадратов отклонений значений рассматриваемой величины от соответствующего среднего арифметического) способ расчета дисперсии.

Если сравнить приведенные формулы с теми, которые мы использовали при обсуждении принципов построения доверительного интервала, нетрудно заметить, что проверка гипотезы о равенстве средних для случая зависимых выборок по существу является проверкой равенства нулю математического ожидания величин Di. Величина

есть среднее квадратическое отклонение для Di. Поэтому значение только что описанного критерия tn-1 по существу равно величине Di, выраженной в долях среднего квадратического отклонения. Как мы говорили выше (при обсуждении способов построения доверительных интервалов), по такому показателю можно судить о вероятности рассматриваемого значения Di. Отличие состоит в том, что выше шла речь о простом среднем арифметическом, распределенном нормально, а здесь – о средних разностей, такие средние имеют распределение Стьюдента. Но рассуждения о взаимосвязи вероятности отклонения выборочного среднего арифметического от нуля (при математическом ожидании, равном нулю) с тем, сколько единиц s это отклонение составляет, остаются в силе.

Примеры задач

 

1. На основе обработки массива анкет была получена следующая частотная таблица:

Зарплата Возраст

До 30 лет Старше 30 лет

 
 


До 500 30 10

500-1000 20 10

1000-1500 20 15

1500-1200 10 25

 

Можно ли считать, что средняя зарплата молодых респондентов (моложе 30 лет) ниже средней зарплаты представителей более старшего возраста (старше 30 лет)? Пояснить статистический смысл ответа.

 

 

2. Имеем следующую статистику по регионам

 

№ региона 1 2 3 4 5

 

Уровень безработицы

для мужчин 1,05 4,01 3,2 7,08 3,01

 

Уровень безработицы

для женщин 1,02 5,005 3,05 2,03 3,1

 

Можно ли считать, что среди мужчин уровень безработицы в среднем выше?

 

3. В результате замеров верхнего давления респондентов были получены следующие данные:


№ рес- Верхнее давление Верхнее давление

пондента в спокойном состо- при прослушивании

янии концерта тяжелого рока


1 120 110

2 110 130

3 100 120

4 130 130

5 110 130

Можно ли считать, что прослушивание концерта тяжелого рока в среднем повышает верхнее давление? Пояснить статистический смысл ответа.

 

ТЕМА 9.



Поделиться:


Последнее изменение этой страницы: 2016-07-11; просмотров: 1082; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.20.238.187 (0.02 с.)