Методы оценки корреляционной связи 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Методы оценки корреляционной связи



В расчетной части корреляционного анализа необходимо выбрать наиболее подходящие для каждой пары признаков показатели корреляции. При выборе показателей корреляции следует проанализировать все множество основных показателей с точки зрения их применимости и целесообразности для конкретной пары признаков.

Основные показатели корреляции:

1) коэффициент корреляции;

2) эмпирическое корреляционное отношение;

3) коэффициент детерминации;

4) коэффициент Спирмена;

5) коэффициент Кендалла;

6) коэффициент Фехнера;

 

Каждый из перечисленных показателей имеет определенное назначение, область

применения, расчетную формулу и особенности интерпретации числовых значений. Первые три показателя называются параметрическими и предназначены для оценки тесноты связи между количественными признаками. Следующие показатели называются непараметрическими и предназначены для оценки тесноты связи между описательными признаками.

Рассмотрим последовательно особенности каждого показателя.

Коэффициент корреляции

Коэффициент корреляции

- применяется для оценки тесноты связи между количественными признаками;

- измеряет только линейную связь;

- диапазон изменения показателя [−1;+1];

- чем ближе по абсолютной величине значение показателя к 1, тем теснее связь между признаками;

- знак значения показателя указывает на направление связи: если r >0,

то связь прямая, если  r <0, то связь обратная.

Коэффициент корреляции или линейный коэффициент корреляции – самый популярный измеритель тесноты линейной связи между двумя количественными признаками x и y,  применяется для оценки тесноты связи между количественными признаками; измеряет только линейную связь.

Линейный коэффициент корреляции r представляет собой среднюю величину из произведений нормированных отклонений для x и у:

   (12.1.) или           . (12.2.)

Числитель формулы (12.2), деленный на n, представляющий собой среднее произведение отклонений значений двух признаков от их средних значений, называется коэффициентом ковариации – это мера совместной вариации факторного x и результативного y признаков:

                 .  

Недостатком коэффициента ковариации является то, что он не нормирован, в отличие от линейного коэффициента корреляции. Очевидно, что линейный коэффициент корреляции представляет собой частное от деления ковариации между х и у на произведение их средних квадратических отклонений: 

.    (12.3)

Путем несложных математических преобразований можно получить и другие модификации формулы линейного коэффициента корреляции, например:

                   , (12.4)      , (12.5)

, (12.6) .(12.7)

Линейный коэффициент корреляции может принимать значения от –1 до +1, причем знак определяется в ходе решения, всякое промежуточное значение r от 0 до 1 характеризует степень приближения корреляционной связи между х и у к функциональной. Существует эмпирическое правило (шкала Чэддока) для оценки тесноты связи, представленное в таблице 12.3.

Таблица 12.3. Шкала Чэддока

| r | Теснота связи
менее 0,1 отсутствует линейная связь
0,1 ÷ 0,3 слабая
0,3 ÷ 0,5 умеренная
0,5 ÷ 0,7 заметная
более 0,7 сильная (тесная)

Таким образом, коэффициент корреляции при линейной зависимости служит как мерой тесноты связи, так и показателем, характеризующим степень приближения корреляционной зависимости между х и у к линейной. Поэтому близость значения r к 0 в одних случаях может означать отсутствие связи между х и у, а в других свидетельствовать о том, что зависимость не линейная.

Проверка коэффициента корреляции на значимость (существенность). Интерпретируя значение коэффициента корреляции, следует иметь в виду, что он рассчитан для ограниченного числа наблюдений и подвержен случайным колебаниям, как и сами значения x и y, на основе которых он рассчитан. Другими словами, как любой выборочный показатель, он содержит случайную ошибку и не всегда однозначно отражает действительно реальную связь между изучаемыми показателями. Для того, чтобы оценить существенность (значимость) самого r и, соответственно, реальность измеряемой связи между х и у, необходимо рассчитать среднюю квадратическую ошибку коэффициента корреляции σ r. Оценка существенности (значимости) r основана на сопоставлении значения r с его средней квадратической ошибкой: .

Существуют некоторые особенности расчета σ r в зависимости от числа наблюдений (объема выборки) n.

1.Если число наблюдений достаточно велико (n >30), то σ r рассчитывается по формуле:

.  (12.8.)

Обычно, если >3, то r считается значимым (существенным), а связь – реальной. Задавшись определенной вероятностью, можно определить доверительный интервал (), где t – коэффициент доверия, рассчитываемый по интегралу Лапласа.

Если число наблюдений небольшое (n <30), то σ r рассчитывается по формуле:

, (12.9)

а значимость r проверяется на основе t- критерия Стьюдента, для чего определяется расчетное значение критерия по формуле (11.10.) и сопоставляется c tТАБЛ.

. (12.10)

Табличное значение tТАБЛ находится по таблице распределения t -критерия Стьюдента при уровне значимости α=1-β и числе степеней свободы ν= n–2. Если tРАСЧ> tТАБЛ ,то r считается значимым, а связь между х и у – реальной. В противном случае (tРАСЧ< tТАБЛ) считается, что связь между х и у отсутствует, и значение r, отличное от нуля, получено случайно.

 



Поделиться:


Последнее изменение этой страницы: 2021-12-15; просмотров: 49; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.15.225.173 (0.01 с.)