Описание взаимосвязей с помощью регрессионного анализа 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Описание взаимосвязей с помощью регрессионного анализа



 

Все явления и процессы, характеризующие социально-экономическое развитие и составляющие единую систему показателей экономики, тесно взаимосвязаны и взаимозависимы между собой. В статистике показатели, характеризующие эти явления, могут быть связаны корреляционными зависимостями различной степени тесноты, которые исследуются с помощью методов корреляционного и регрессивного анализов.

Корреляционный анализ взаимосвязи показателей позволяет решать следующие задачи:

1. Оценка тесноты связи между показателями с помощью парных и множественных коэффициентов корреляции.

2. Оценка уравнения регрессии.

Целью регрессионного анализа является получение оценки функциональной зависимости теоретического среднего значения результативного признака от факторных При этом в регрессионном анализе заранее предполагается наличие причинно-следственных связей между результативным и факторными признаками.

Статистическая модель взаимосвязи явлений в виде уравнения регрессии

 

 

будет адекватно описывать реальное явление или процесс при выполнении следующих основных условий:

1) результативный признак должен подчиняться нормальному закону распределения относительно своих средних значений при различных значениях факторных признаков;

2) отдельные наблюдения, на основе которых строится модель регрессии, должны быть получены независимо друг от друга.

Одной из проблем построения уравнения регрессии является выбор её размерности – определение числа факторов, включаемых в модель. Число факторных признаков, входящих в модель должно быть оптимальным, т.е. необходимо учитывать существенные признаки и исключать несущественные (второстепенные) признаки.

Корреляционно-регрессионные модели, какими бы сложными они не были, не вскрывают полностью всех причинно-следственных связей, однако достаточно адекватно могут описывать влияние на результативные признаки существенных факторов, если проведён предварительный качественный анализ сущности и специфики исследуемых явлений и процессов.

В теории статистики изучаются парные и множественные корреляции. При парной корреляции рассматривается связь результативного признака с одним единственным факторным признаком, при множественной – с двумя и более факторными признаками. В соответствии с этим строящиеся регрессионные модели могут быть парные и множественные.

Например, если устанавливается зависимость уровня оплаты труда от производительности труда то такая регрессия парная. Если же изучается зависимость уровня оплаты труда не только от производительности труда но и от квалификации работников цены продукции качества продукции то такая регрессия множественная.

Парная регрессия, характеризующая связь между результативным и факторным признаками, аналитически описывается уравнениями различного типа:

 

прямая

гипербола

парабола

показательная функция

степенная функция

полулогарифмическая функция и др.

 

Определить тип уравнения можно, используя различные способы, например, исследуя зависимость между признаками графически.

Оценка параметров уравнений регрессии осуществляется методом наименьших квадратов, сущность которого состоит в нахождении параметров при которых сумма квадратов отклонений фактических значений результативного признака от теоретических, полученных по уравнению регрессии, минимальна. Т.е.

 

 

Распространенным случаем связи в общественных и экономических явлениях является прямая зависимость между результативным и факторным признаком. Для прямой зависимости

 

.

 

Минимизируя как функцию параметров и , получаем систему уравнений:

 

 

Преобразовав уравнения, получим систему обычных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов:

 

 

Решая систему этих уравнений, находим:

 

 

где - число единиц наблюдений (пар значений ).

Используя способ, аналогичный рассмотренному выше, можно определить параметры парной регрессии, описываемой другими видами уравнений – гиперболой, параболой и др.

Множественная регрессия

 

При исследовании зависимостей методами множественной (многофакторной) регрессии задача формулируется также, как и при использовании парной регрессии, только в этом случае требуется определить аналитическое выражение связи между результативным признаком и факторными признаками .

Выбор формы связи для множественной регрессии осложняется тем, что теоретически зависимость между признаками может быть выражена большим числом различных функций.

Поскольку уравнение регрессии строится главным образом для количественного выражения взаимосвязей, оно должно отражать реально сложившиеся между факторами связи с достаточной степенью точности, поэтому для определения типа исходного уравнения регрессии часто используется метод перебора различных уравнений и соответствующих им оценок соответствия фактическим данным по точности.

Практика построения многофакторных моделей связи показывает, что реально существующие зависимости между явлениями можно описать, используя следующие типы моделей:

 

линейная

степенная

показательная

параболическая

гиперболическая

 

Серьёзная сложность формирования уравнений множественной регрессии состоит в определении оптимального числа факторных признаков, а также в том, что почти все факторные признаки в реальных процессах и явлениях находятся в зависимости друг от друга.

Если аналитическая форма связи подобрана, выбраны все факторные признаки, то параметры многофакторного уравнения регрессии могут быть определены различными методами: графическим методом, методом наименьших квадратов и т.д.

 

Измерение тесноты связи

 

Проверка практической значимости построенных в корреляционно-регрессионном анализе математических моделей осуществляется посредством показателей тесноты связи между факторным и результативным признаками.

К простейшим показателям степени тесноты связи относят коэффициент корреляции знаков, предложенный немецким учёным Г.Фехнером. Этот показатель основан на оценке степени согласованности знаков (направлений) отклонений факторного и результативного признаков от их средних значений.

Коэффициент корреляции знаков определяется формулой

 

 

где - число совпадений знаков отклонений индивидуальных величин от их средних ; - число несовпадений знаков отклонений. Коэффициент Фехнера может принимать значение в пределах от -1 до +1. Если знаки большинства пар отклонений совпадут, то тогда показатель будет близок к 1, что свидетельствует о наличии прямой связи.

Более совершенным показателем степени тесноты связи является линейный коэффициент корреляции, впервые введённый английским математиком К.Пирсоном:

 

 

В этом показателе учитываются не только знаки отклонений индивидуальных значений признаков от средних, но и сами величины таких отклонений.

Между линейным коэффициентом и коэффициентом регрессии в уравнении линейной парной регрессии существует зависимость, определяемая формулой

 

 

где и - средние квадратические отклонения факторного и результативного признаков, соответственно.

Линейный коэффициент корреляции имеет большое значение при исследовании социально-экономических явлений и процессов, распределение которых близко к нормальному. Поэтому на практике часто анализ начинают с расчёта этого коэффициента. Линейный коэффициент корреляции может принимать значения в пределах от -1 до +1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при коэффициенте корреляции указывает на направление связи – прямой зависимости соответствует знак плюс, а обратной – знак минус. Условие является необходимым и достаточным, чтобы признаки и были независимы. При этом условии соответствующие коэффициенты регрессии обращаются в нуль, а прямые регрессии по и по оказываются взаимно перпендикулярными в прямоугольной системе координат.

Линейный коэффициент корреляции достаточно точно оценивает степень тесноты связи лишь в случае наличия линейной зависимости между признаками. При наличии же криволинейной зависимости линейный коэффициент корреляции недооценивает степень тесноты связи и даже может быть равен нулю. В таких случаях зависимости между признаками применяют эмпирическое корреляционное отношение и теоретическое корреляционное отношение (индекс корреляции).

Эмпирическое корреляционное отношение рассчитывается по данным, получаемым в результате группировки

 

 

где - общая дисперсия результативного признака;

- межгрупповая дисперсия результативного признака;

- средняя внутригрупповых дисперсий результативного признака.

 

Теоретическое корреляционное отношение определяется по формуле

 

 

где - факторная дисперсия или дисперсия выравненных значений результативного признака (т.е. рассчитанных по уравнению регрессии)

 

 

- остаточная дисперсия, отображающая вариацию результативного признака от всех прочих, кроме , факторов

 

 

Соотношение между факторной и общей дисперсиями

 

 

называется индексом детерминации и характеризует часть общей вариации результативного признака , описываемую фактором в регрессионной модели. Корень квадратный из индекса детерминации определяет индекс корреляции .

Необходимо заметить, что правило сложения дисперсий в виде

 

 

выполняется всегда для определённой совокупности наблюдений. Заметим также, что по абсолютной величине линейный коэффициент корреляции равен индексу корреляции только при прямолинейной связи.

Представленные выше показатели тесноты связи, исчисленные по данным сравнительно небольшой статистической совокупности (при ), могут искажаться действием случайных причин. Это вызывает необходимость проверки их существенности.

Для оценки значимости коэффициента корреляции (или коэффициентов регрессии) применяется t –критерий Стьюдента. Вычисленное значение критерия

 

 

сравнивается с критическим , которое берётся из таблицы значений Стьюдента с учётом заданного уровня значимости и числа степеней свободы . Если величина , то величина коэффициента корреляции признаётся значимой.

Для оценки значимости индекса корреляции (или адекватности построенной регрессионной модели) применяется F-критерий Фишера. Фактическое значение критерия вычисляется по формуле

 

 

и сравнивается с критическим значением , которое определяется по таблице F-критерия с учётом принятого уровня значимости и числа степеней свободы и - число параметров уравнения регрессии). При величина индекса корреляции признаётся значимой.

В случаях, если изучаются совокупности достаточно большого объёма, применяют другие методы оценки значимости описанных выше показателей (например, пользуются таблицей интеграла вероятностей Лапласа).

В заключение настоящей темы следует подчеркнуть, что интерпретация моделей регрессии должна осуществляться методами той отрасли знаний, к которой относятся исследуемые явления и процессы. Но всякая интерпретация начинается со статистической оценки уравнения регрессии в целом и оценки значимости входящих в модель параметров.

При анализе адекватности уравнения регрессии описываемому процессу возможны следующие варианты:

1) построенная модель на основе её проверки по F-критерию в целом адекватна, и все коэффициенты регрессии значимы. Такая модель может быть использована для принятия решений и прогнозов;

2) модель по F-критерию адекватна, но часть коэффициентов регрессии незначима. В этом случае модель пригодна для принятия некоторых решений, но не для производства прогнозов;

3) модель по F-критерию адекватна, но все коэффициенты регрессии незначимы. Такая модель непригодна для принятия решений и осуществления прогнозов.

 

ПРИЛОЖЕНИЯ

 

П1. Некоторые значения коэффициента доверия при заданных значениях

доверительной вероятности

0,4843 0,5161 0,5467 0,5763 0,6047 0,6319 0,6579 0,6827 0,7063 0,7287 0,7499 0,7699 0,7887 0,8064 0,8230 0,8385 0,8529 0,8664 0,65 0,70 0,75 0,80 0,85 0,90 0,95 1,00 1,05 1,10 1,15 1,20 1,25 1,30 1,35 1,40 1,45 1,50 0,8789 0,8904 0,9011 0,9109 0,9199 0,9281 0,9357 0,9426 0,9488 0,9545 0,9596 0,9643 0,9684 0,9722 0,9756 0,9786 0,9812 0,9836 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90 1,95 2,00 2,05 2,10 2,15 2,20 2,25 2,30 2,35 2,40 0,9858 0,9876 0,9892 0,9907 0,9920 0,9931 0,9940 0,9949 0,9956 0,9963 0,9968 0,9973 0,9977 0,9980 0,9984 0,9989 0,9994 0,9999 2,45 2,50 2,55 2,60 2,65 2,70 2,75 2,80 2,85 2,90 2,95 3,00 3,05 3,10 3,15 3,26 3,42 3,90

 

П2. Критические значения корреляционного отношения и индекса

детерминации при уровне значимости

                 
  0,771                

 

П3. Критические значения F-критерия при уровне значимости

                 
9 10 11 12 14 16 18 20 30 60 120 161,4 18,51 10,13 7,71 6,61 5,99 5,59 5,32 5,12 4,96 4,82 4,75 4,60 4,49 4,41 4,35 4,17 4,08 4,00 3,92 199,5 19,00 9,45 6,94 5,79 5,14 4,74 4,46 4,26 4,10 3,98 3,88 3,74 3,63 3,55 3,49 3,32 3,23 3,15 3,07 215,7 19,16 9,28 6,59 5,41 4,76 4,35 4,07 3,86 3,71 3,59 3,49 3,34 3,24 3,16 3,10 2,92 2,84 2,76 2,68 224,6 19,25 9,12 6,39 5,19 4,53 4,12 3,84 3,63 3,48 3,36 3,26 3,11 3,01 2,93 2,87 2,69 2,61 2,52 2,45 230,2 19,30 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3,33 3,20 3,11 2,96 2,85 2,77 2,71 2,53 2,45 2,37 2,29 234,0 19,33 8,94 6,16 4,95 4,28 3,87 3,58 3,37 3,22 3,09 3,00 2,85 2,74 2,66 2,60 2,42 2,34 2,25 2,17 238,9 19,37 8,84 6,04 4,82 4,15 3,73 3,44 3,23 3,07 2,95 2,85 2,70 2,59 2,51 2,45 2,27 2,18 2,10 2,02 242,0 19,39 8,78 5,96 4,74 4,06 3,63 3,34 3,13 2,97 2,86 2,76 2,60 2,49 2,41 2,35 2,16 2,12 2,04 1,90 248,0 19,44 8,66 5,80 4,56 3,87 3,44 3,15 2,93 2,77 2,65 2,54 2,39 2,28 2,19 2,12 1,93 1,84 1,75 1,65

 



Поделиться:


Последнее изменение этой страницы: 2016-04-20; просмотров: 273; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.17.154.171 (0.103 с.)