Корреляционно – регрессионный метод изучения связи 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Корреляционно – регрессионный метод изучения связи



Корреляционно-регрессионный метод позволяет решить две основные задачи:

1. определить аналитическую форму связи между факторным и результативным признаками

2. установить меру тесноты связи между признаками, т.е. определить, в какой мере вариация Х обуславливает вариацию У (У - результативный признак, Х - факторный признак).

Наиболее распространенными являются следующие виды корреляционной зависимости:

1) причина (фактор) непосредственно связана с результатом, т.е. Х®У, У=F(х)

2) следствие (результат) определяется не одним фактором а их комплексом, Х ®

Х1 ®

Х2 ® У

Х3 ®

Хn ®

В этом случае Y=F(x1, x2, x3,...,xn)

3) два и более следствий (результатов) вызваны одной общей причиной,

® У - потребление масла

® У1 - потребление творога

Х - доход ® У2 и т.п.

® У3

® Уn

В этом случае F(x)=Y1, Y2,..., Yn

 

Корреляционно регрессионный анализ позволяет выяснить на основе наблюдений над большим количеством фактов, как изменилась бы функция (У), в связи с изменением одного (интересующего нас) аргумента (Х), если бы все остальные аргументы не изменялись, и определить степень искажающего влияния прочих (неучтенных факторов) на исследуемую зависимость.

Корреляционно регрессионный метод включает несколько этапов:

‹ Применению предшествует выявление сущности социально-экономических явлений и проведение статистических наблюдений. проведение предварительного анализа данных (сводки, группировки данных).

Œ Постановка задачи и выбор факторных и результативных признаков на основе изучения взаимосвязи с помощью формально-статистического метода анализа. Цель наблюдения может быть шире, чем цель корреляционно-регрессионного анализа.

 Выбор формы связи между фактическим и результативным признаками.

Ž Измерение тесноты связи между фактическим и результативным признаками.

 Оценка результатов наблюдения, пояснение, анализ.

 

Выбранная форма связи должна отражать экономическую природу изучаемых явлений и быть по возможности простой.

Уравнение регрессии (функция связи) должно наилучшим образом аппроксимировать изучаемое явление.

Парная корреляция

Рассмотрим несколько случаев парной корреляции:

I. Линейная корреляция

Имеет место при равномерном изменении признака. Ломанная линия регрессии позволяет заключить, что уравнение прямой может являться в данном случае уравнением связи. После выбора уравнения связи задача заключается в нахождении параметров уравнения связи. Для их нахождения пользуются методом наименьших квадратов, который основывается на предположении независимости друг от друга отдельных наблюдений. Сущность метода наименьших квадратов основывается на том, что отыскиваются такие значения коэффициентов регрессии, при которых сумма квадратов отклонений фактических значений результативного признака от теоретических (вычисляется по функции выравнивания или уравнению связи) будет минимальной.

ух=a0+a1*x - функция связи

S=S(у-ух)2 ®min

S=S(у- a0-a1*x)2 ®min

¶S/¶a1=0

æ na0+a1Sx=Sу,

è a0Sx+a1Sx2=Sxу

где n - число наблюдений, число пар Х и У

Решив эти уравнения, относительно а0 и а1, найдем параметры, подставив которые в уравнение связи построим прямую.

II. Kриволинейная корреляция

Если в качестве уравнения связи выбрана парабола второго порядка, то выравнивание производится по следующей функции:

ух=a0+a1*x+a2*x2

æ na0+a1Sx+a2Sx2=Sу,

ê a0Sx+a1Sx2+a2Sx3=Sxу

è a0Sx2+a1Sx3+a2Sx4=Sух2

Вычисляем результативное значение выравненного признака по функции связи. Строим эмпирическую линию регресии.

III. Если установлено наличие обратной связи, то уравнение связи может быть гипербола.

ух01

æ na0+a1S1/x=Sу,

è a0S1/x+a1S1/x2=Sу/х

IV Обратной связью может быть и линейная лорреляция, при отрицательном значении а1.

 

V. Уравнение связи - степенная функция

ух0а1

lg ух=lg a0+a1lg x

æ n lg a0+a1S lg x=S lg у,

è lg a0*S lg x+a1S lg x2=S lg x*lg у

 

Пример:

Рассмотрим пример определения функции связи между двумя признаками:

ОФ [x] Выпуск [y]   ху   х2   ух
    2,4 14,4   2,692
    4,0 32,0   3,537
    3,6 32,4   3,958
    4,0 40,0   4,38
    4,5 45,0   4,38
    4,6 50,6   4,802
    5,6 67,2   5,224
    6,5 84,5   5,646
    7,0 98,0   6,068
    5,0 75,0   6,49
    47,2 539,1   47,177

1. Определяем факторный и результативный признаки

2. Строим эмпирическую линию регрессии

3. Делаем предположение о возможной форме 0связи

ух=a0+a1*x, ух - выравненное значение у по х.

æ na0+a1Sx=Sу,

è a0Sx+a1Sx2=Sxу

æ10а0+108а1=47,2

è108а0+1236а1=539,1

æа1=0,432

èа0=0,16

Уравнение связи принимает вид ух=0,16+0,432х

Логический смысл параметров уравнения линейной регрессии

а0 - показывает усредненное влияние на результативный признак неучтенных факторов.

а1 - коэффициент регрессии, показывает, на сколько в среднем изменится значение результативного признака при изменении факторного на единицу.

а1(уïх)=sу/sх*rху

уïх - взаимосвязь х и у

sу - среднее квадратическое отклонение результативного признака

sх - среднее квадратическое отклонение факторного признака

rху - линейный коэффициент парной корреляции

Для экономической интерпретации пользуются коэффициентом эластичности, который показывает, на сколько % в среднем изменится значение результативного признака при изменении факторного на 1%.

В случае линейной зависимости коэффициент эластичности равен:

Э=а1*х/у

При параболической зависимости коэффициент эластичности равен:

Э=(а12х)*х/у

Одним из примеров обоснования необходимости поиска других кривых для наилучшей аппроксимации зависимости служит остаточная дисперсия:

s2ост=S(у-ух)2/n

Если остаточная дисперсия велика, необходимо искать другую аппроксимацию, другую кривую.

Множественная корреляция

Под множественной корреляцией понимется исследование статистической зависимости результативного признака от нескольких факторных признаков. Основная задача при этом состоит в вычислении значения переменной, соответствующей определенным значениям двух и большего числа факторов.

Особенности многофакторного анализа:

 Многофакторный корреляционно-регрессионный анализ должен проводиться на большом числе наблюдений, т.к. надежность корреляционных формул зависит непосредственно от количества данных. используемых при расчетах. Исходная информация должна включаться в корреляционный расчет на основе качественного анализа.

 Число факторов, включаемых в уравнение связи, должно быть ограниченным, т.к. введение большого числа факторов делает решение задачи более сложным. В уравнение нельзя вводить факторы, находящиеся в функциональной и близкой к ней связи.

 Выбор той или иной формы связи при множественной корреляции диктуется рядом соображений:

 выбранная функция должна отражать сущность закономерности

 уравнение связи должно иметь по возможности более простой вид.

 

В статистической совокупности наибольшее распространение получили линейная и приведенные к линейной формы связи.

В общем виде уравнение линейной связи имеет вид:

ух1, х2, х3,...хn01х12х2+...+аnxn

Рассмотрим частные случаи множественной линейной корреляции:

а)Двухфакторный комплекс: результат и два фактора.

уxz=a0+a1*x+a2*z

æ na0+a1Sx+a2Sz=Sу,

ê a0Sx+a1Sx2+a2Sxz=Sxу

è a0Sz+a1Sxz+a2Sz2=Sуz

б) Трехфакторный комплекс.

уxzv=a0+a1*x+a2*z+a3*v

æ na0+a1Sx+a2Sz+a3Sv=Sу,

ê a0Sx+a1Sx2+a2Sxz+a3Sxv=Sxу

ê a0Sz+a1Sxz+a2Sz2+a3Szv=Sуz

è a0Sv+a1Sxv+a2Szv+a3Sv2=Sуv

Коэффициент линейного уравнения множественной регрессии показывает, на сколько единиц изменится функция с изменением аргумента на одну единицу, при закрепленном положении других аргументов на определенном уровне, обычно среднем.

Для интерпретации коэффициента аi уравнения множественной регрессии используется частный коэффициент эластичности, который имеет вид:

Э=аi*xi/y

xi - среднее значение i-того факторного признака

аi - коэффициент регрессии при i-том факторном признаке

у - среднее значение результативного признака

Частный коэффициент эластичности показывает на сколько % в среднем изменится функция при изменении аргумента (регрессора) на 1% при фиксированных значениях других аргументов.

Показатели тесноты связи

Важнейшей задачей корреляционно-регрессионного анализа является измерение тесноты связи между явлениями и признаками. При этом различают две группы показателей: параметрические и непараметрические.



Поделиться:


Последнее изменение этой страницы: 2016-04-23; просмотров: 298; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.146.65.212 (0.016 с.)