Условия и ограничения применения критерия хи-квадрат Пирсона 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Условия и ограничения применения критерия хи-квадрат Пирсона



1. Сопоставляемые показатели должны быть измерены в номинальной шкале (например, пол пациента - мужской или женский) или в порядковой (например, степень артериальной гипертензии, принимающая значения от 0 до 3).

2. Данный метод позволяет проводить анализ не только четырехпольных таблиц, когда и фактор, и исход являются бинарными переменными, то есть имеют только два возможных значения (например, мужской или женский пол, наличие или отсутствие определенного заболевания в анамнезе...). Критерий хи-квадрат Пирсона может применяться и в случае анализа многопольных таблиц, когда фактор и (или) исход принимают три и более значений.

3. Сопоставляемые группы должны быть независимыми, то есть критерий хи-квадрат не должен применяться при сравнении наблюдений "до-"после". В этих случаях проводится тест Мак-Немара (при сравнении двух связанных совокупностей) или рассчитывается Q-критерий Кохрена (в случае сравнения трех и более групп).

4. При анализе четырехпольных таблиц ожидаемые значения в каждой из ячеек должны быть не менее 10. В том случае, если хотя бы в одной ячейке ожидаемое явление принимает значение от 5 до 9, критерий хи-квадрат должен рассчитываться с поправкой Йейтса. Если хотя бы в одной ячейке ожидаемое явление меньше 5, то для анализа должен использоваться точный критерий Фишера.

5. В случае анализа многопольных таблиц ожидаемое число наблюдений не должно принимать значения менее 5 более чем в 20% ячеек.

Как рассчитать критерий хи-квадрат Пирсона?

Для расчета критерия хи-квадрат необходимо:

1. Рассчитываем ожидаемое количество наблюдений для каждой из ячеек таблицы сопряженности (при условии справедливости нулевой гипотезы об отсутствии взаимосвязи) путем перемножения сумм рядов и столбцов с последующим делением полученного произведения на общее число наблюдений. Общий вид таблицы ожидаемых значений представлен ниже:

  Исход есть (1) Исхода нет (0) Всего
Фактор риска есть (1) (A+B)*(A+C) / (A+B+C+D) (A+B)*(B+D)/ (A+B+C+D) A + B
Фактор риска отсутствует (0) (C+D)*(A+C)/ (A+B+C+D) (C+D)*(B+D)/ (A+B+C+D) C + D
Всего A + C B + D A+B+C+D

2. Находим значение критерия χ2 по следующей формуле:

где i – номер строки (от 1 до r), j – номер столбца (от 1 до с), Oij – фактическое количество наблюдений в ячейке ij, Eij – ожидаемое число наблюдений в ячейке ij.

В том случае, если число ожидаемого явления меньше 10 хотя бы в одной ячейке, при анализе четырехпольных таблиц должен рассчитываться критерий хи-квадрат с поправкой Йейтса. Данная поправка позволяет уменьшить вероятность ошибки первого типа, т.е обнаружения различий там, где их нет. Поправка Йейтса заключается в вычитании 0,5 из абсолютного значения разности между фактическим и ожидаемым количеством наблюдений в каждой ячейке, что ведет к уменьшению величины критерия хи-квадрат.

Формула для расчета критерия χ2 с поправкой Йейтса следующая:

3. Определяем число степеней свободы по формуле: f = (r – 1) × (c – 1). Ссответственно, для четырехпольной таблицы, в которой 2 ряда (r = 2) и 2 столбца (c = 2), число степеней свободы составляет f2x2 = (2 - 1)*(2 - 1) = 1.

4. Сравниваем значение критерия χ2 с критическим значением при числе степеней свободы f (по таблице).

Данный алгоритм применим как для четырехпольных, так и для многопольных таблиц.

Как интерпретировать значение критерия хи-квадрат Пирсона?

В том случае, если полученное значение критерия χ2 больше критического, делаем вывод о наличии статистической взаимосвязи между изучаемым фактором риска и исходом при соответствующем уровне значимости.

Пример расчета критерия хи-квадрат Пирсона

Определим статистическую значимость влияния фактора курения на частоту случаев артериальной гипертонии по рассмотренной выше таблице:

  Артериальная гипертония есть (1) Артериальной гипертонии нет (0) Всего
Курящие (1)      
Некурящие (0)      
Всего      

1. Рассчитываем ожидаемые значения для каждой ячейки:

  Артериальная гипертония есть (1) Артериальной гипертонии нет (0) Всего
Курящие (1) (70*72)/150 = 33.6 (70*78)/150 = 36.4  
Некурящие (0) (80*72)/150 = 38.4 (80*78)/150 = 41.6  
Всего      

2. Находим значение критерия хи-квадрат Пирсона:

χ2 = (40-33.6)2/33.6 + (30-36.4)2/36.4 + (32-38.4)2/38.4 + (48-41.6)2/41.6 = 4.396.

3. Число степеней свободы f = (2-1)*(2-1) = 1. Находим по таблице критическое значение критерия хи-квадрат Пирсона, которое при уровне значимости p=0.05 и числе степеней свободы 1 составляет 3.841.

4. Сравниваем полученное значение критерия хи-квадрат с критическим: 4.396 > 3.841, следовательно зависимость частоты случаев артериальной гипертонии от наличия курения - статистически значима. Уровень значимости данной взаимосвязи соответствует p<0.05.

Число степеней свободы, f χ2 при p=0.05 χ2 при p=0.01
  3.841 6.635
  5.991 9.21
  7.815 11.345
  9.488 13.277
  11.07 15.086
  12.592 16.812
  14.067 18.475
  15.507 20.09
  16.919 21.666
  18.307 23.209
  19.675 24.725
  21.026 26.217
  22.362 27.688
  23.685 29.141
  24.996 30.578
  26.296  
  27.587 33.409
  28.869 34.805
  30.144 36.191
  31.41 37.566

 

билет №_6_

Центральные процессоры современных персональных компьютеров. Машинное представление чисел. Команды, адресация операндов, индексные регистры. Команды условного и безусловного перехода. Массивы.



Поделиться:


Последнее изменение этой страницы: 2016-08-10; просмотров: 2891; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.119.107.161 (0.026 с.)