Тема 3. Методика изучения корреляционных связей в исследовании экономики 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Тема 3. Методика изучения корреляционных связей в исследовании экономики



 

Корреляционно-регрессионный анализ данных наблюдений включает в себя следующие практические приемы:

1. построение корреляционного поля и составление корреляционной таблицы;

2. вычисление выборочных коэффициентов корреляции и корреляционных отношений;

3. проверка статистической гипотезы значимости связи;

4. отбор наиболее информативных факторных признаков X для построения уравнения регрессии, описывающего (моделирующего) конкретный вид зависимости между величинами;

5. расчет регрессионной модели, выражающей зависимость результативного признака от факторных переменных Y = f (X 1, X 2, …, Xm);

6. проверка гипотезы адекватности модели имеющимся наблюдениям, оценка качества полученной модели;

7. использование модели для предсказания или прогнозирования значений зависимой переменной при новых значениях независимых переменных.

Рассмотрим подробно методику этих приемов. Корреляционное поле и корреляционная таблица служат вспомогательными средствами при анализе исходных данных. Символизирует наблюдение корреляционное поле, или диаграмма рассеивания, что представляет собой совокупность точек на координатной плоскости, соответствующих двумерному выборочному распределению (X, Y). По характеру расположения точек составляют первоначальное мнение о форме зависимости случайных факторов X и Y. При большом объеме данных результаты обычно группируют в форме корреляционной таблицы, в клетках которой на пересечениях строк и столбцов указывают число случаев (частоты), в которых определенные уровни независимого фактора X сочетаются со значениями результативного показателя Y. Визуальный анализ таблицы позволяет исследователю выявить аномальные явления и при необходимости исключить их из дальнейшего рассмотрения, таблица дает также первоначальное представление о силе связи между наблюдаемыми величинами.

Более точную информацию о тесноте и направлении корреляционной связи дают коэффициент корреляции и корреляционное отношение. Меру линейной зависимости между двумя случайными величинами Y и X представляет парный коэффициент корреляции Пирсона ryx, который вычисляют по формуле [3,с.206]:

(1).

Здесь − среднее арифметическое значение из произведения величины x и y; − среднее арифметическое значений величины X; - среднее арифметическое значений величины Y;, − среднее квадратичное отклонение, соответственно, величин X и Y. Число Cyx называют ковариацией, что представляет собой среднее произведение отклонений двух величин от их соответствующих средних. Коэффициент корреляции ryx принимает значение только на отрезке [-1; 1]. Его значение близкое к «+1» или к «−1», говорит о сильной прямой или обратной корреляции. В этом случае все точки корреляционного поля группируются около некоторой прямой. В то же время, высокая корреляция не обязательно означает наличие причинной связи между X и Y, поскольку, например, обе эти изучаемые величины могут зависеть от третьей величины Z. Значение ryx близкое к нулю указывает на отсутствие линейной связи между X и Y, но не исключает возможность существования нелинейной связи между этими переменными, что требует дальнейшего исследования. В решении прикладных задач используется следующая качественная оценка парного коэффициента корреляции [7, с. 182]:

Таблица 1

Оценка коэффициента корреляции

Значение коэффициента корреляции (по модулю) Качественная характеристика силы связи
До 0,3 Практически отсутствует (слабая)
0,3 – 0,7 Средняя
0,7 – 0,9 Высокая
0,9 – 0,99 Весьма высокая

* Положительное значение коэффициента свидетельствует о том, что связь между признаками прямая, отрицательное – обратная.

 

При изучении связей в сложных экономических системах возникает необходимость исследовать тесноту связи не только между каждым фактором и зависимым признаком, а и между каждой парой факторов, что является предметом многофакторного корреляционного анализа. При этом вычисляются парные коэффициенты корреляции как между зависимой переменной и факторными переменными, так и между самими факторными переменными. Таким образом, строится корреляционная матрица [7, с. 183]:

 

... (2),

… … … …

 

элементы которой есть парные коэффициенты корреляции между соответствующими факторами. Заметим, что матрица (2) симметрична относительно главной диагонали. На основе корреляционной матрицы в дальнейшем исследовании определяются частные и множественные коэффициенты корреляции и детерминации. После вычисления коэффициентов корреляции следует проверить их значимость. При этом задается уровень значимости α, равный вероятности принятия ошибочного решения. В расчетах обычно берут одно из следующих значений уровня значимости: 0,05; 0,02; 0,01; 0,001. Возможность ошибки следует из того факта, что для установления тесноты взаимосвязи необходима выборка лишь ограниченного числа данных из некой генеральной совокупности объектов. С увеличением числа наблюдений доверие к коэффициенту корреляции будет возрастать. Значимость коэффициента ryx проверяется по t -критерию Стьюдента или с помощью таблицы Фишера-Йейтса [7, с. 185-186]. В таблице Фишера-Йейтса находят значение r кр при заданном уровне значимости α и υ=(n -2) − количестве степеней свободы (в случае парной корреляции). Если (α,υ), коэффициент ryx считается значимым. Заметим, что коэффициент корреляции лишь оценивает связь, исходя из выборочных значений факторов. Если эти значения хорошо отражают состояние изучаемой экономической системы, то вычисленные коэффициенты корреляции будут указывать на реальные связи по всей совокупности объектов системы. Тесноту линейной зависимости результативного показателя Y от факторных признаков X 1, X 2, …, Xm измеряют с помощью множественного коэффициента корреляции [8, с. 269-275], в качестве выборочной оценки которого используют выражение:

(3),

где y рег. i – индивидуальные значения признака Y по уравнению линейной регрессии; yi – индивидуальные выборочные значения Y; − выборочное среднее значение показателя Y; n – объем выборки. Число d = R 2 называют множественным коэффициентом детерминации. Он показывает, какая доля дисперсии результативного признака объясняется влиянием факторных признаков. Если число R <0,3, тогда теснота связи считается слабой, если R >0,7 – сильной [1, с. 48]. Значимость множественного коэффициента детерминации проверяют на основании F -критерия. При этом вычисляют наблюдаемое значение [7, с. 197]:.

По таблице F -распределения находят критическое значение F кр. (α, υ1, υ2), где α – уровень значимости, υ1= m -1, υ2 = n - m. Если F набл. > F кр., тогда коэффициенты множественной корреляции и детерминации признаются значимыми. При небольшом числе наблюдений, если (n – m)/ m ≤20, вычисляют скорректированный коэффициент детерминации [7, с. 189-190]:. Отметим, что всегда d скор. < d.

Тесноту связи в зависимостях, отличных от линейной, рекомендуется измерять с помощью корреляционного отношения η, интерпретация которого зависит от вида исследуемой связи. При расчете показателя тесноты связи по аналитической группировке используют формулу [3, с. 196]:

 

(4),

где – средние групповые значения показателя Y, fj – частота в j -й группе, – см. выше. В данном случае η называют эмпирическим корреляционным отношением, его уровень находится в зависимости от числа групп. По уравнению регрессии вычисляют теоретическое корреляционное отношение ηтеор, квадрат которого равен [3, с. 197]:

 

(5).

Таким образом, корреляционное отношение в общем определяется формулой [1, с.49]:, где δ2 – дисперсия, обусловленная факторными признаками, σ2 – общая дисперсия результативного признака. Значение η2 называют коэффициентом детерминации. Для оценки качественной характеристики коэффициента детерминации используют шкалу, представленную таблицей 2 [7, с. 226].

Таблица 2

Оценка коэффициента детерминации

Значение коэффициента детерминации Характеристика связи
Меньше 0,3 Весьма слабая
0,3 – 0,5 Слабая
0,5 – 0,8 Средняя
0,8 и выше Сильная

 

Таким образом, коэффициент детерминации измеряет долю вариации результативного признака, которую можно объяснить полученным уравнением регрессии, т.е. вариацией факторов, включенных в модель регрессии. В случае линейной зависимости между двумя признаками X и Y значение ηтеор= ryx. В случае множественной линейной корреляции значение ηтеор= R, а его квадрат ηтеор2= d, то есть, корреляционное отношение является универсальным показателем тесноты связи. Процедура проверки значимости коэффициентов корреляции Пирсона ryx и множественного коэффициента корреляции R опирается на допущение о нормальном распределении исходных данных. Для экспериментальных данных, распределение которых существенно отличается от нормального, также для выборок малого объема целесообразно использовать ранговую корреляцию, базирующуюся только на случайном характере исходных данных. Непараметрическим аналогом классического коэффициента корреляции Пирсона является коэффициент ранговой корреляции Спирмена [3, с. 221]:

(6),

где n – количество наблюдений, – квадрат разности рангов для i -го наблюдения. При этом рангом называют номер возрастающих (или убывающих) значений факторного или зависимого (результативного) признака. Коэффициент корреляции ρ имеет ту же интерпретацию взаимосвязи показателей, что и линейный коэффициент корреляции ryx, но дает менее точную оценку взаимосвязи показателей. Однако простота расчета коэффициента Спирмена ρ делает его применимым на практике в тех случаях, когда требуется приблизительно оценить тесноту связи. Существенной считается связь, если [7, с. 245]. Находит применение и другой показатель тесноты связи – ранговый коэффициент корреляции Кендела [1, с. 280]:

(7),

где P – сумма величин, исчисленных для каждого ранга зависимого признака как число последующих рангов, больших взятого ранга, Q – отрицательное суммарное количество последующих рангов, меньших каждого взятого ранга зависимого показателя, n – число наблюдений. Метод Кендела отличается от метода Спирмена тем, что более детально анализирует тенденцию связи переменных, но принимает во внимание только факты близости или различия пар наблюдений без учета степени различий. Оба метода позволяют в сложных условиях сократить объем вычислительной работы. В случае множества факторных переменных строят также матрицу парных коэффициентов корреляции, аналогичную матрице (2). Значимость этих коэффициентов определяется с помощью Z -статистики [9, с. 156]:

;. Значения Z крит (ρ) и Z крит (τ) находят в таблицах соответствующих распределений статистических справочников. Если Z набл (ρ)> Z крит (ρ) или Z набл. (τ)> Z крит (τ), то ρ или τ считаются значимыми.

Заметим, что результаты корреляционного анализа не могут дать полного понимания роли факторных переменных в формировании результативного показателя, нельзя также представить корреляцию факторов как связь их уровней, что создает серьезные ограничения в исследовании многофакторных экономических систем. Интерпретация результатов исследования корреляционных связей требует дополнительного углубления регрессионного анализа.

 



Поделиться:


Последнее изменение этой страницы: 2021-01-08; просмотров: 66; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.141.21.115 (0.018 с.)