Парная корреляция и регрессия 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Парная корреляция и регрессия



Часто при анализе взаимосвязей социально-экономических явлений среди различных факторов, влияющих на результат, бывает важно выделить наиболее значимый факторный признак, который в большей степени обусловливает вариацию результативного признака (например, зависимость проданных туристическими фирмами путевок от затрат на рекламу или зависимость производительности труда операторов ЭВМ от стажа работы). Этим обусловлена необходимость измерения парных корреляций и построения уравнений парных регрессий.

Парная корреляция характеризует тесноту и направленность связи между результативным и факторным признаками. Парная регрессия позволяет описать форму связи в виде уравнения парной регрессии (табл.2).

Таблица 2. Основные виды уравнений парной регрессии

Наименование формы парной регрессии Вид уравнения парной регрессии
Линейная = а0 + a1x
Гиперболическая = а0 + a1 (1/x)
Параболическая = а0 + a1x + a2x2
Степенная = а0 x a1

Где – теоретическое значение результативного признака (y) при определенном значении факторного признака (x), подставленном в регрессионное уравнение;

а0 – свободный член уравнения;

a1, a2 – коэффициенты регрессии.

Параметры уравнений парной регрессии a1, a2 называют коэффициентами регрессии. Для оценки параметров уравнения парной регрессии используется метод наименьших квадратов. МНК заключается в определении параметров а0, a1, a2, при которых сумма квадратов отклонений фактических значений результата (yi) от теоретических минимизируется. Так, (2.1.) описывает исходное условие МНК для парной линейной корреляционной связи.

или (2.1.)

f (а0, a1) =

 

На основании (2.1.) определяются частные производные функции f(а0, a1), которые затем приравниваются к 0. Далее полученные уравнения преобразуются в систему нормальных уравнений, из которых определяются параметры а0, a1. При этом число нормальных уравнений в общем случае будет равно числу параметров. При использовании СПП параметры регрессионного уравнения определяются автоматически. Подробнее МНК изложен в / 6,7 /.

В частности коэффициент парной линейной регрессии a1 определяется в соответствии с (2.2.) и характеризует меру связи между вариациями факторного и результативного признаков. Коэффициент регрессии показывает, насколько в среднем изменяется значение результативного признака при изменении факторного на единицу.

, (2.2.)

где n – объем совокупности.

Тесноту и направление парной линейной корреляционной связи измеряют с помощью линейного коэффициента корреляции (2.3.), принимающего значения в пределах от –1 до +1 (см. табл.3).


(2.3.)

Квадрат коэффициента корреляции называют коэффициентом детерминации (r2). Коэффициент детерминации можно интерпретировать как долю общей дисперсии результативного признака (y), которая объясняется вариацией факторного признака (x).

Таблица 3. Оценка характера связи по линейному коэффициенту корреляции

 

Значения линейного коэффициента корреляции Характер связи
r = - 1 связь функциональная
-1< r < -0,7 -0,7 £ r £ -0,5 -0,5 < r < 0 связь обратная сильная связь обратная умеренная связь обратная слабая
r = 0 связь отсутствует
0 < r < + 0,5 +0,5 £ r £ +0,7 + 0,7< r < + 1 связь прямая слабая связь прямая умеренная связь прямая сильная
r = +1 связь функциональная

 

Значимость линейного коэффициента корреляции проверяется на основе t-критерия Стьюдента: проверяется нулевая гипотеза об отсутствии связи между факторным и результативным признаками (H0 : r = 0). Для проверки H0 по формуле (2.4) следует рассчитать t-статистику (tр) и сравнить ее с табличным значением (tт), определяемым с использованием таблицы приложения 2 по заданным уровню значимости (a) и числу степеней свободы (d.f.). Если tр > tт, то гипотеза H0 отвергается с вероятностью ошибки меньше, чем a·100%. Это свидетельствует о значимости линейного коэффициента корреляции и статистической существенности зависимости между факторным и результативным признаками.

, (2.4.)

где

k = n-2, для малой выборки,

k = n, при большом числе наблюдений (n>100).

Аналогично оценивается значимость коэффициента регрессии. tр рассчитывают как отношение взятого по модулю коэффициента регрессии к его средней ошибке с заданными уровнем значимости (a) и числом степеней свободы d.f. = n-2.



Поделиться:


Последнее изменение этой страницы: 2016-08-26; просмотров: 503; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.118.2.15 (0.007 с.)