Коэффициенты корреляции рангов Спирмена и Кендала 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Коэффициенты корреляции рангов Спирмена и Кендала



Коэффициенты корреляции рангов – это менее точные, но более простые по расчету непараметрические показатели для измерения тесноты связи между двумя коррелируемыми признаками. К ним относятся коэффициенты Спирмэна (ρ) и Кендала (τ), основанные на корреляции не самих значений коррелируемых признаков, а их рангов – порядковых номеров, присваиваемых каждому индивидуальному значению х и у (отдельно) в ранжированном ряду. Оба признака необходимо ранжировать (нумеровать) в одном и том же порядке: от меньших значений к большим или наоборот. Если встречается несколько значений х (или у), то каждому из них присваивается ранг, равный частному от деления суммы рангов (мест в ряду), приходящихся на эти значения, на число равных значений. Ранги признаков х и у обозначают символами Rx и Ry (иногда Nx и Ny). Суждение о связи между изменениями значений х и у основано на сравнении поведения рангов по двум признакам параллельно. Если у каждой пары х и у ранги совпадают, это характеризует максимально тесную связь. Если же наблюдается полная противоположность рангов, т.е. в одном ряду ранги возрастают от 1 до n, а в другом – убывают от n до 1, это максимально возможная обратная связь. Подходы для оценки тесноты связи у Спирмэна и Кендала несколько различаются. Для расчета коэффициента Спирмэна значения признаков х и у нумеруют (отдельно) в порядке возрастания от 1 до n, т.е. им присваивают определенный ранг (Rx и Ry) – порядковый номер в ранжированном ряду. Затем для каждой пары рангов находят их разность (обозначается как d = RxRy), и квадраты этой разности суммируют.

, (12.16.)

где d – разность рангов х и у;

       n – число наблюдаемых пар значений х и у.

Коэффициент ρ может принимать значения от 0 до ±1. Следует иметь в виду, что, поскольку коэффициент Спирмэна учитывает разность только рангов, а не самих значений х и у, он менее точен по сравнению с линейным коэффициентом. Поэто­му его крайние значения (1 или 0) нельзя безоговорочно расцени­вать как свидетельство функциональной связи или полного от­сутствия зависимости между х и у. Во всех других случаях, т.е. когда ρ не принимает крайних зна­чений, он довольно близок к r.

Формула   (12.16) применима строго теоретически только тогда, когда отдельные значения ху), а следовательно, и их ранги не повторяются. Для случая повторяющихся (связанных) рангов есть другая, более сложная формула, скорректированная на число по­вторяющихся рангов. Однако опыт показывает, что результаты расчетов по скорректированной формуле для связанных рангов мало отличаются от результатов, полученных по формуле для не­повторяющихся рангов. Поэтому на практике формула (12.16) ус­пешно применяется как для неповторяющихся, так и для повто­ряющихся рангов.

Коэффициент корреляции рангов Кендала τ строится несколь­ко по-другому, хотя его расчет также начинается с ранжирования значений признаков х и у. Ранги х (Rx) располагают строго в порядке возрастания и па­раллельно записывают соответствующее каждому Rx значение Ry. Поскольку Rx записаны строго по возрастанию, то ставится задача определить меру соответствия последовательности Ry «пра­вильному» следованию Rx. При этом для каждого Ry последо­вательно определяют число следующих за ним рангов, превыша­ющих его значение, и число рангов, меньших по значению. Первые («правильное» следование) учитываются как баллы со знаком «+», и их сумма обозначается буквой Р. Вторые («непра­вильное» следование) учитываются как баллы со знаком «–», и их сумма обозначается буквой Q. Очевидно, что максимальное значение Р достигается в том слу­чае, если ранги y (Ry) совпадают с рангами х (Rx) и в каждом ряду представляют ряд натуральных чисел от 1 до п. Тогда после первой пары значений Rx = 1 и Ry = 1 число превышения данных значений рангов составит (n – 1), после второй пары, где Rx = 2 и Ry = 2, соответственно (п – 2) и т.д. Таким образом, если ранги х и у совпадают и число пар рангов равно n, то

.

Если же последовательность рангов х и у имеет обратную тенденцию по отношению к последовательности рангов х, то Q будет такое же максимальное значение по модулю:

.

Если же ранги у не совпадают с рангами х, то суммируются все положительные и отрицательные баллы (S= P+ Q); отношение этой суммы S к максимальному значению одного из слагаемых и представляет собой коэффициент корреляции рангов Кендэла τ, т.е.:

. (12.17)

Формула коэффициента корреляции рангов Кендала (12.17.) применяется для случаев, когда отдельные значения признака (как х, так и у) не повторяются и, следовательно, их ранги не объе­динены. Если же встречается несколько одинаковых значений х (или у), т.е. ранги повторяются, становятся связанными, коэффици­ент корреляции рангов Кендэла определяется по формуле:

, (12.18)

где  S – фактическая общая сумма баллов при оценке +1 каж­дой пары рангов с одинаковым порядком изменения и –1 каждой пары рангов с обратным порядком изме­нения;

        – число баллов, корректирующих (уменьшающих) максимальную сумму баллов за счет повторений (объединений) t рангов в каждом ряду.

Отметим, что случаи следования одинаковых повторяющихся рангов (в любом ряду) оцениваются баллом 0, т.е. они не учиты­ваются при расчете ни со знаком «+», ни со знаком «–».

Преимущества ранговых коэффициентов корреля­ции Спирмэна и Кендала: они легко вычисляются, с их помощью можно изучать и измерять связь не только между количественны­ми, но и между качественными (описательными) признаками, ранжированными определенным образом. Кроме того, при ис­пользовании ранговых коэффициентов корреляции не требуется знать форму связи изучаемых явлений.

Пример. Десять школьников сдавали выпускной экзамен ЕГЭ по математике и вступительный экзамен по системе централизованного тестирования. Результаты обоих экзаменов оценивались по 100-балльной шкале и оказались следующими (1-я строка – оценки ЕГЭ, вторая – централизованного тестирования):

87 82 80 79 63 55 40 34 33 29  

57 92 80 69 71 43 49 51 20 19

Найти выборочные коэффициенты корреляции Спирмена и Кендалла.

 

Решение.

Составим последовательности рангов по убыванию баллов на каждом экзамене:

xi 1  2  3  4  5      6  7  8  9  10

yi 5  1  2  4  3  8  7  6  9  10.

Вычислим di: d 1 = 1 – 5 = -4; d 2 = 2 – 1 = 1; d 3 = 3 – 2 = 1; d 4 = 4 – 4 = 0;

d 5 = 5 – 3 = 2; d 6 = 6 – 8 = -2; d 7 = 7 – 7 = 0; d 8 = 8 – 6 = 2; d 9 = d 10 = 0.

Найдем  Тогда выборочный коэффициент ранговой корреляции Спирмена

Приступим к вычислению коэффициента корреляции Кендалла. Определим, сколько рангов, больших данного, располагается справа от каждого yi:

R 1 = 5; R 2 = 8; R 3 = 7; R 4 = 5; R 5 = 5; R 6 = 2; R 7 = 2; R 8 = 2; R 9 = 1; R 10 = 0;

R = 5 + 8 + 7 + 5 + 5 + 2 + 2 + 2 + 1 = 37;

Заметим, что величины выборочных коэффициентов корреляции позволяют предполагать существование связи между результатами экзаменов. Для проверки этого предположения следует проверить гипотезу о значимости соответствующего выборочного коэффициента ранговой корреляции.

 

5. Коэффициент корреляции знаков (Фехнера)

Коэффициент корреляции знаков (Фехнера) – простейший показатель тесноты связи, основанный на сравнении поведения отклонений индивидуальных значений каждого признака (x и y) от своей средней величины. При этом во внимание принимаются не величины отклонений () и (), а их знаки («+» или «–»). Определив знаки отклонений от средней величины в каждом ряду, рассматривают все пары знаков и подсчитывают число их совпадений (С) и несовпадений (Н). Тогда коэффициент Фехнера рассчитывается как отношение разности чисел пар совпадений и несовпадений знаков к их сумме, т.е. к общему числу наблюдаемых единиц:

.         (12.19.)

Очевидно, что если знаки всех отклонений по каждому признаку совпадут, то КФ= 1, что характеризует наличие прямой связи. Если все знаки не совпадут, то КФ=– 1(обратная связь). Если же åС= åН, то КФ= 0. Итак, как и любой показатель тесноты связи, коэффициент Фехнера может принимать значения от 0 до 1. Однако, если КФ= 1, то это ни в коей мере нельзя воспринимать как свидетельство функциональной зависимости между х и у. Следует иметь в виду, что поскольку КФ зависит только от знаков и не учитывает величину самих отклонений х и у от их средних величин, то он практически характеризует не столько тесноту связи, сколько ее наличие и направление.

    Учитывая отсутствие однозначности и четкости в оценке значений показателей корреляции, часто в рамках корреляционного анализа целесообразно рассчитать несколько показателей для одной и той же пары признаков и выполнить совместный анализ показателей.

      Табл.12.5. Пороговые значения показателей корреляции

Показатель Пороговое значение
Коэффициент корреляции 0,70
Эмпирическое корреляционное отношение 0,70
Коэффициент детерминации 0,50
Коэффициент Спирмена 0,50
Коэффициент Кендала 0,50
Коэффициент Фехнера 0,50

 



Поделиться:


Последнее изменение этой страницы: 2021-12-15; просмотров: 201; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.223.119.17 (0.014 с.)