Срсп 4. Анализ качественных признаков. Таблицы сопряженности 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Срсп 4. Анализ качественных признаков. Таблицы сопряженности



 

Существует множество признаков, различных явлений и вещей, измерение которых затруднено или вовсе невозможно. Например, как измерить признак «профессия» или «вид патологии», а как сравнить эти признаки для получения статистического представления о профессиональной заболеваемости?

В этих случаях изучается распространенность признаков, частота встречаемости признаков (доля объектов с интересующим нас признаком) в различных выборках, оценивается взаимосвязь частоты встречаемости одного признака с частотой встречаемости другого признака.

Для этого используются таблицы сопряженности. Столбцы этой таблицы обозначают градации одного признака, строки – градации другого признака. В каждой ячейке записывается число случаев с сопряженными признаками.

Наиболее простой случай таблица 2х2 (исследуется частота совместного распространения двух признака, каждый из которых имеет две градации).

В общем случае Н(0) формулируется следующим образом:

· в генеральных совокупностях доля объектов с интересующими нас признаками одинакова

· или частота встречаемости одного признака не зависит от частоты встречаемости другого признака

· или какой-либо фактор не влияет на частоту встречаемости признака (признаков)

СЛУЧАЙ 1. Выборки независимые

Предположим, что у нас есть два качественных признака, характеризующие обследованных лиц. Занесем эти данные в таблицу сопряженности

 

  Первая признак (первая градация) Первый признак (вторая градация) Всего
Второй признак (первая градация) Частота встречаемости a Частота встречаемости b a +b
Второй признак (вторая градация) Частота встречаемости c Частота встречаемости d с+d
  n1=a+c n2=b+d n =a+b+c+d

 

Критерием для проверки нулевой гипотезы является хи-квадрат Пирсонас поправкой Йетса

 


 

Его критическое значение находится для заданного уровня значимости α и числа степеней свободы f =(m-1)(n-1), где m -число столбцов, n – число строк (Приложение 5).

 

Если то Н(0) принимается,

В случае принимается Н(1)

Можно вычислить меру связи между двумя признаками – ею является коэффициент ассоциацииЮла Q (аналог коэффициента корреляции)

 

Q лежит в пределах от 0 до 1. Близкий к единице коэффициент свидетельствует о сильной связи между признаками. При равенстве его нулю – связь отсутствует.

Работа с преподавателем

Руководствуясь тем, что аспирин препятствует образованию тромбов, Г. Харатер решил проверить, нельзя ли снизить риск тромбоза назначением небольших доз аспирина (160 мг/сут.). Было проведено контролируемое испытание. Все больные, согласившиеся принять участие в испытании и не имевшие противопоказаний к аспирину, были случайным образом разделены на две группы: 1-я получала плацебо, 2-я - аспирин. Исследование проводилось до тех пор, пока общее число больных с тромбозом шунта не достигло 24. Группы практически не различались по возрасту, полу и продолжительности лечения гемодиализом.

В 1-й группе тромбоз шунта произошел у 18 из 25 больных, во 2-й -у 6 из 19. Можно ли говорить о статистически значимом различии доли больных тромбозом, а тем самым об эффективности аспирина?

Зададим уровень значимости α =0,05

Сформулируем Н(0): в генеральной совокупности доля больных тромбозом не зависит от приема аспирина.

Занесем результаты испытания в таблицу.

 

  Тромбоз есть Тромбоза нет  
Плацебо      
Аспирин      
Всего      

 

Посчитаем значение критерия хи-квадрат с поправкой Йетса

Q=0,7

Мы задали 5% -ный уровень значимости α = 0,05. Тогда критическое значение = 3,84 (по таблице для f =1). Полученное значение χ2 =5,56 больше, чем критическое, следовательно, мы отвергаем Н(0) гипотезу о том, что аспирин не влияет на проявление тромбоза шунта. Следовательно, мы можем утверждать с вероятностью 95%, что использование аспирина эффективно снижает риск тромбоза в генеральной совокупности.

Q=0,7 показывает сильную связь между приемом аспирина и вероятностью тромбоза.

Случай 2. Выборки зависимые

Над одними и теми же объектами проводятся два наблюдения: до и после. (прием лекарства, обучение, внушение и т.д.)

Подсчитывается сколько раз данное свойство встречается:

• и «до» и «после», (+,+)

• только «до» (+,-)

• только «после» (-,+)

• ни «до» ни «после» (-,-)

  Наличие признака«после»
Наличие признака«до» нет(-) есть(+)
есть(+) a Число изменений от (+) к (-) c Число сохранивших (+)
нет (-) b Число сохранивших (-) d Число изменений от (–) к (+)

Н(0) – доля объектов с интересующим нас признаком «после» не изменилась по сравнению с «до»

• Вычисляем критерий хи-квадрат Мак-Нимара


Если то Н(0) принимается

Если то принимаем Н(1),

Работа с преподавателем. Было проведено исследование эффективности антитабачной рекламы. Для этого сравнили соотношение курящих/некурящих до и после проведения рекламной компании.

Сформулируем Н(0): рекламная компания, проведенная в генеральной совокупности, не повлияет на долюкурящих.

Или - соотношение курящих и некурящих среди членов генеральной совокупности после рекламной компании не изменится.

Зададим уровень значимости α =0,01

Рекламная компания была проведена среди 100 человек. В результате исследования были получены следующие результаты

 

  После рекламы
До рекламы Не курят (-) Курят (+)
Курят (+) 32 (курили, но не стали курить) 25 (курили и курят)
Не курят (-) 43 (не курили и не курят) 0 (не курили, но стали курить)

 

Мы задали 1% -ный уровень значимости α = 0,01. Тогда критическое значение = 6,64 (по таблице для f =1). Полученное значение χ2 =30 больше, чем критическое, следовательно:

мы отвергаем нулевую гипотезу и принимаем альтернативную о том, что с вероятностью 99 % рекламная компания повлияет на соотношение курящих и некурящих в популяции (генеральной совокупности).

 

Контрольные вопросы

1. Для каких целей используются таблицы сопряженности

2. Структура таблицы сопряженности

3. Сформулирйте нулевую гипотезу для общего случая

4. Какие данные заносятся в таблицу сопряженности в случае зависимых выборок

5. Какие критерии используются при анализе таблицы сопряженности

Задание к СРСП 4.

1. Сформулируйте цель проведенного исследования

2. Сформулируйте нулевую и альтернативную гипотезы

3. Составьте таблицу сопряженности

4. Решите задачу на уровне значимости 0,05

Вариант 1

Исследовалась заболеваемость в сельской и городской местности. Выборочные исследования показали, что в селе из ста жителей обращались к врачу 36 человека, в городе из 100 жителей посетили врача 28 человек. Определить зависит ли обращаемость к врачу от места жительства.

Вариант 2.

Среди 84 лиц, страдающих гипертонией, с давлением более 160 мм.рт.ст. было 24 человека. После приема препарата их стало 18. Сделайте вывод об эффективности препарата.

Вариант 3

Сравнивалась эффективность двух методов лечения и получены следующие данные

  1 вид лечения 2 вид лечения
Вылечились    
Не вылечились    

 

Отличаются ли по эффективности эти два вида лечения?

Вариант 4

В конце первого года обучения в вузе в группе студентов из 15 человек было 6 отличников. В конце второго года обучения их стало 8. Определить, меняется ли успеваемость на втором курсе.

Вариант 5

1000 человек классифицировали по признаку дальтонизма. По приведенным ниже данным проверить, есть ли зависимость между наличием дальтонизма и полом человека.

  Мужчины Женщины
Дальтоники    
Не дальтоники    

 

Вариант 6

Во время эпидемии гриппа изучалась эффективность прививок против этого заболевания. Получены следующие результаты:

 

С прививкой Без прививки
заболели не заболели заболели не заболели
       

Указывают ли эти результаты на эффективность прививок?

Вариант 7

До внедрения новой системы профилактики заболеваний к врачу обращался каждый третий из 90 человек. После внедрения уже обращается каждый шестой. Охарактеризовать эффективность новой системы профилактики.

 

Вариант 8

Данные социологического исследования показали, что среди молодежи спортом занимаются 42 человека из 200 опрошенных, среди лиц старшего возраста – 55 из 325 опрошенных. Определите, есть ли зависимость увлеченности спортом от возраста.

 

Вариант9.

Среди 84 подземных рабочих хронический бронхит регистрируется у четверти, у строителей он диагностирован у трети из 105 обследованных. Определить влияет ли профессия на риск возникновения хронического бронхита. У кого эта вероятность выше?

 

Вариант 10.

500 человек классифицировали по признаку аллергии к полыни. По приведенным ниже данным проверить, есть ли зависимость между наличием аллергии и полом человека.

  Мужчины Женщины
Есть аллергия    
Нет аллергии    

Вариант 11

До открытия бассейна в детском саду у 16 детишек из 150 наблюдались частые ОРВИ. Через год занятий в бассейне в этой группе количество таких лиц уменьшилось до 12.

Нужно ли строить бассейны в детских садах.

Вариант 12.

После первого года обучения в группе студентов было 9 хорошистов и 6 троечников. На втором курсе группа пополнилась еще тремя студентами и по итогам сессии 11 стали хорошистами и 7 троечниками. Определить меняется ли успеваемость от курса к курсу?

 

Вариант 13.

В исследуемом регионе в текущем году родилось 286 мальчиков и 314 девочек. Соотносятся ли эти данные с предположением, что вероятность рождения мальчиков и девочек одинакова.



Поделиться:


Последнее изменение этой страницы: 2016-08-12; просмотров: 1645; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.119.139.50 (0.033 с.)