Понятие причинности, регрессии и корреляции 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Понятие причинности, регрессии и корреляции



В процессе статистического исследования зависимостей вскрываются причинно-следственные отношения между явлениями, что позволяет выявить факторы (признаки), оказывающие основное влияние на вариацию изучаемых явлений и процессов. Причинно-следственные отношения – это такая связь явлений и процессов, когда изменение одного из них – причины ведёт к изменению другого – следствия.

Социально-экономические явления представляют собой результат одновременного воздействия большого числа причин. Следовательно, при изучении этих явлений необходимо выявлять главные основные причины, абстрагируясь от второстепенных, для чего статистическое изучение связи проводится в три этапа.

В основе первого этапа лежит качественный анализ, связанный с анализом природы социального или экономического явления методами экономической теории, социологии, конкретной экономики. Второй этап – построение модели связи, базируется на методах статистики: группировках, средних величинах, таблицах и так далее. Третий, последний этап интерпретация результатов, вновь связан с качественными особенностями изучаемого явления. Статистика разработала множество методов изучения связей. Выбор метода изучения связи зависит от цели исследования, от поставленной задачи.

Признаки по их значению для изучения взаимосвязи делятся на два класса. Признаки, обуславливающие изменения других, связанных с ними признаков, называются факторными, или просто факторами. Признаки, изменяющиеся под действием факторных признаков, называют результативными. В статистике различают функциональную и стохастическую зависимости. Функциональной называют такую связь, при которой определённому значению факторного признака соответствует одно значение результативного.

Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называется стохастической. Частным случаем стохастической связи является корреляционная, при которой изменение среднего значения результативного признака обусловлено влиянием изменения факторных признаков.

Связи между явлениями и их признаками классифицируются по степени тесноты, направлению и аналитическому выражению.

По степени тесноты связи различают ее отсутствие, а также, что она бывает слабая, сильная и умеренная. Это позволяет выявить коэффициент корреляции.

Количественные критерии оценки и тесноты связи

Величина коэффициента корреляции Теснота связи
практически отсутствует
слабая
умеренная
сильная

По направлению выделяют связь прямую и обратную. Прямая – это такая связь, при которой с увеличением или с уменьшением значений факторного признака происходит увеличение или уменьшение значения результативного. Так, например, рост производительности труда соответствует увеличению уровня рентабельности производства.

В случае обратной связи значения результативного признака изменяются под воздействием факторного, но в противоположном направлении по сравнению с изменением факторного признака. Так с увеличением уровня фондоотдачи снижается себестоимость единицы производимой продукции.

По аналитическому выражению выделяют связи прямолинейные (или просто линейные) и нелинейные. Если статистическая связь между явлениями может быть приблизительно выражена уравнением прямой линии, то её называют линейной связью вида:

` ух = а0 + а1х

Если же связь может быть выражена уравнением какой-либо кривой линии, например:

параболы -    = а0 + а1х + а2 x 2,

гиперболы - ` ух = а0 + а1 / х  и т.д.

Но такую связь называют нелинейной или криволинейной. Для выявления наличия связи, её характера и направления в статистике используются методы: приведения параллельных данных; аналитических группировок; графический; корреляции.  

Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о её характере.

Графически взаимосвязь двух признаков изображается с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат – результативного. Каждое пересечение линий, проводимых через эти оси, обозначаются точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определённой линии, выражающей форму связи.

Корреляция – это статистическая зависимость между случайными величинами, не имеющая строгого функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой. В статистике принято различать следующие варианты зависимостей:

1. Парная корреляция – связь между двумя признаками (результативным и факторным, или двумя факторными).

2. Частная корреляция – зависимость между результативным и одним факторным признаком при фиксированном значении других факторных признаков.

3. Множественная корреляция – зависимость результативного и двух или более факторных признаков, включённых в исследование.

Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).

Теснота связи количественно выражается величиной коэффициентов корреляции, которые давая количественную характеристику тесноты связи между признаками, позволяют определять «полезность» факторных признаков при построении уравнения множественной регрессии.

Регрессия тесно связана с корреляцией: корреляция оценивает силу (тесноту) статистической связи. Регрессия исследует её форму. Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком), обусловлено влиянием одной или нескольких независимых величин (факторов).

Одной из проблем построения уравнений регрессии является их размерность, то есть определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным. Сокращение размерности за счёт исключения второстепенных, несущественных факторов позволяет получить модель, быстрее и качественнее реализуемую. В то же время, построение модели малой размерности может привести к тому, что она будет недостаточно полно описывать исследуемое явление или процесс.

При построении моделей регрессии должны соблюдаться следующие требования:

1. Совокупность исследуемых исходных данных должна быть однородной и математически описываться непрерывными функциями.

2. Возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей.

3. Все факторные признаки должны иметь количественное (цифровое) выражение.

4. Наличие достаточно большого объёма исследуемой выборочной совокупности.

5. Причинно-следственные связи между явлениями и процессами должны описываться линейной или приводимой к линейной форме зависимостью.

6. Отсутствие количественных ограничений на параметры модели связи.

7. Постоянство территориальной и временной структуры изучаемой совокупности.

Соблюдение данных требований позволяет построить модель, наилучшим образом описывающую реальные явления и процессы.

 

2. Парная регрессия на основе метода наименьших
квадратов и метода группировок

Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями:

прямой                     ` ух = а01х

гиперболы               ` ух = а0 + а1

параболы            ` ух = а01х+а2х2      и т.д.

Определить тип уравнения можно, исследуя зависимость графически. Однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи – гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия. Оценка параметров уравнений регрессии (а0, а1, и а2 – в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели (а0, а1), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:

S = å (у- ` ух)2 ® min.

Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:

                na0 + a1 å x    = å y,

                         a0 å x + a1 å x2  = å xy,                           

где      n – объём исследуемой совокупности.

В уравнениях регрессии параметр а0 показывает усреднённое влияние на результативный признак неучтённых в уравнении факторных признаков. Коэффициент регрессии а1 показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения. На практике исследования часто проводятся по большому числу наблюдений. В этом случае исходные данные удобнее представлять в сводной групповой таблице. При этом анализу подвергаются сгруппированные данные и по факторному ), и по результативному (у) признакам, то есть уравнения парной регрессии целесообразно строить на основе сгруппированных данных.

Если значения х и у заданы в определённых интервалах (a, b), то для каждого интервала сначала необходимо определить середину (х’ / y ’ = (a + b) / 2), а затем уже коррелировать значения х’ и у’ и строить уравнения регрессии между ними.

Система нормальных уравнений для определения коэффициентов уравнения регрессии примет вид:

                      na+ a1 å xfx    = å yfy,

                     a0 å xfx + a1 å x2fx = å xyfy,                            

где        n – число анализируемых предприятий;

fx / fy – число предприятий, согласно распределению, соответственно по факторному и результативному признакам;

у fy / xfx – значения результативного и факторного признака по конкретной группе предприятий.

 



Поделиться:


Последнее изменение этой страницы: 2021-01-14; просмотров: 66; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.118.25.174 (0.021 с.)