Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Общая форма таблицы сопряженности размерности 2x2Содержание книги
Поиск на нашем сайте
Предположим, мы располагаем таблицей сопряженности для двух переменных-признаков X и Y, каждая из которых принимает лишь два значения, которые мы условно обозначим как «0» и «1». В каждой из четырех клеток таблицы содержатся абсолютные частоты, т. е. число случаев для каждого из возможных сочетаний значений признаков (т. е. для сочетаний «0—1», «1—1», «0—0», «1—0»). Обозначим частоты в каждой из клеток таблицы латинскими буквами а, b, с и d. В такой общей форме таблица сопряженности для двух дихотомических признаков будет выглядеть как на таблице 8.4. Для расчета коэффициента сопряженности «фи» используют формулу:
Эта простая в вычислительном отношении формула получается в результате ряда преобразований исходной формулы для вычисления величины «хи-квадрат» (c2). Эта исходная формула позволяет лучше понять общую идею оценки связи качественных признаков, которую мы опишем, не вдаваясь в статистические детали. Исходная формула для величины «хи-квадрат» выглядит так: Понятно, что наблюдаемые частоты мы можем найти в клетках таблицы сопряженности. Но что понимается под ожидаемыми, точнее, теоретически ожидаемыми частотами? Ожидаемые частоты — это те частоты, которые должны были бы стоять в клетках той же таблицы сопряженности, если бы две интересующие нас переменные были бы независимы, т. е. расслоение наблюдений по одному признаку оставалось бы пропорциональным для разных подгрупп, выделенных по другому признаку. Пусть, например, данные относительно участия в парламентских выборах для 1000 опрошенных позволили построить таблицу 8.5. Таблица 8.5 Участие в выборах и пол
Для приведенных в таблице 8.5 данных гипотеза (или модель) независимого поведения признаков предполагала бы, что в мужской и женской подгруппах пропорция участия и неучастия в выборах должна была бы сохраняться такой же, как и для всей выборки в целом (разумеется, в пределах выборочной ошибки). Например, для женщин число участвовавших в выборах, с учетом их доли в выборке (равной 400/1000) составило бы , т. е. 280 проголосовавших. Отсюда автоматически следует, что до избирательных участков не дошли бы 120 дам (т. е. 400 - 280). Ожидаемая частота голосования для мужчин составила бы Соответственно не проголосовали бы 180 мужчин. Для модели независимости признаков таблица сопряженности выглядела бы так: Таблица 8.6 Ожидаемые частоты для распределения участия в выборах по полу (рассчитанные в соответствии с моделью независимости признаков)
Сравнив таблицы 8.5 и 8.6, мы видим, что многое во второй из них «осталось как было». Маргиналы таблицы, т. е. общее количество мужчин и женщин, проголосовавших и не проголосовавших, остались, естественно, неизменными. Отличаются лишь теоретически ожидаемые частоты в клетках таблицы 8.6. «Хи-квадрат» как раз и оценивает суммарную величину отклонения наблюдаемых значений от ожидаемых («взвешенную» относительно ожидаемых частот). Для данных таблицы 8.5 величина «хи-квадрат» составит 136,128 (проверьте самостоятельно, используя данные табл. 8.6). Это явно много, но, чтобы оценить существенность, значимость полученной величины, следует воспользоваться специальными таблицами[32]. Отметим, что для того чтобы найти табличное значение, нужно определить так называемое число степеней свободы. В рассматриваемом примере оно равно единице, так как все теоретически ожидаемые частоты в таблице 8.5 — при заданных маргиналах — можно получить, вычислив лишь одну из них. Если бы размерность таблицы была бы 4x4 (по четыре номинальные градации для каждого признака), то оценка «хи-квадрат» производилась бы для (4 - 1)(4 - 1) = 9, т. е. 9 степеней свободы. Обсуждавшийся выше коэффициент j — это просто квадратный корень нормированного относительно численности выборки «хи-квадрата». Удобства коэффициента j очевидны: его легче вычислить, не прибегая к расчету ожидаемых частот, к тому же его величина меняется в пределах от 0 до 1. (Попробуйте рассчитать значение для данных таблицы 8.5.) Существуют и другие коэффициенты взаимосвязи (сопряженности) признаков, основанные на величине «хи-квадрат», например, V Крамера, Т Чупрова. Таблица 8.7
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||
Последнее изменение этой страницы: 2016-12-13; просмотров: 253; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.224.45.32 (0.006 с.) |