Задачи корреляционно-регрессионного анализа 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Задачи корреляционно-регрессионного анализа



Изучение корреляционной связи преследует две цели:

1) Определение параметров уравнения, выражающего связь средних значений зависимой переменной со значениями независимой переменной.

2) Измерение тесноты связи двух признаков между собой.

Основным методом достижения первой цели является метод наименьших квадратов, разработанный К.Ф.Гауссом[10]. Он состоит в минимизации суммы квадратов отклонений фактически измеренных значений зависимой переменной Y от ее значений, вычисленных по уравнению связи с факторным признаком X.

Для измерения тесноты связи могут применяться различные показатели, основным из которых является коэффициент детерминации. Данный коэффициент вычисляется как отношение межгрупповой дисперсии результативного признака (характеризует влияние различий группировочного факторного признака на среднюю величину результативного признака) к общей дисперсии результативного признака (характеризует влияние на него всех причин и условий) и позволяет оценить влияние факторного признака на результативный.

,

где k - число групп по факторному признаку;

N - число единиц совокупности;

yi - индивидуальные значения результативного признака;

fi - частота в j-ой группе;

- средние групповые значения результативного признака;

- среднее значение результативного признака;

Корреляционный анализ позволяет с одной стороны, используя уравнение корреляционной связи, измерить зависимость между вариацией результативного признака и вариацией факторного признака, а с другой - используя меры тесноты связи, измерить долю вариации результативного признака, которая связана корреляционно с вариацией факторного признака.

К задачам, традиционно решаемым с помощью корреляционно-регрессионного метода, относятся:

1. Задача выделения важнейших факторов, влияющих на результативный признак (т.е. на вариацию его значений в совокупности). Эта задача решается в основном на базе тех или иных мер тесноты связи факторных признаков с результативным признаком.

2. Задача оценки деятельности по эффективности использования имеющихся ресурсов. Эта задача решается путем расчета для каждой единицы совокупности тех величин результативного признака, которые были бы получены при средней по совокупности эффективности использования факторов и сравнения их с фактическими результатами деятельности.

3. Задача прогнозирования возможных значений результативного признака при задаваемых значениях факторных признаков. Такая задача решается путем подстановки ожидаемых значений факторных признаков в уравнение связи и вычисления ожидаемых значений результативного признака. Приходится решать и обратную задачу - вычисление необходимых значений факторных признаков для обеспечения планового или желаемого значения результативного признака в среднем по совокупности. Эта задача обычно не имеет единственного решения в рамках данного метода и должна дополняться постановкой и решением оптимизационной задачи на нахождение наилучшего по определенному критерию варианта из множества возможных решений.

4. Задача подготовки данных, необходимых в качестве исходных для решения оптимизационных задач. Например, при разработке критериев оценки деятельности основных служб органов внутренних дел.

При решении каждой из названных задач нужно учитывать особенности и ограничения корреляционно-регрессионного метода. К числу таких особенностей относятся проблемы разделения влияния каждого из действующих факторов на результативный признак, необходимость специально обосновывать возможность причинной интерпретации уравнения как объясняющего связь между вариацией фактора и результата и некоторые другие. Следует так же помнить, что метод корреляционно-регрессионного анализа не может объяснить роли факторных признаков в создании результативного признака.

Парная линейная корреляция

Простейшей системой корреляционной связи является линейная связь между двумя признаками - парная линейная корреляция. Подобные системы встречаются в тех случаях, когда среди всех действующих факторов выделяется один важнейший, который и определяет вариацию результативного признака, а нелинейные формы связей без особого ущерба могут быть преобразованы в линейные.

Зависимость , называется уравнением регрессии y по x или линейной корреляционной зависимостью между y и x.

где – среднее значение результативного признака Y при определенном значении факторного признака X;

b – свободный член уравнения;

а – коэффициент регрессии, характеризующий вариацию Y, приходящуюся на единицу вариации X.

Коэффициенты уравнения регрессии рассчитываются по методу наименьших квадратов.

Параметр a определяется из соотношения

,

где – среднее значение случайной величины x×y;

и – средние значения факторного и результативного признаков соответственно;

sx – среднее квадратичное отклонение признака X;

xi и yi - индивидуальные значения соответствующих признаков.

Параметр b выражают из уравнения регрессии и вычисляют, подставляя средние значения признаков X и Y и найденное значение параметра а:

.

При парной связи ее теснота измеряется с помощью коэффициента корреляции:

Соотношение между значением модуля коэффициента корреляции и теснотой связи представлено в таблице 10.

Таблица 10

Значение модуля коэффициента корреляции Характер связи
0,00 – 0,30 крайне слабая или отсутствует
0,30 – 0,50 слабая
0,50 – 0,70 средняя
0,70 – 0,99 сильная

 

Рассматривая возможные значения коэффициента корреляции, следует учитывать, что нулевая величина этого коэффициента соответствует полному отсутствию какой-либо связи. Это возможно при полном взаимном погашении положительных и отрицательных отклонений признаков от их средних величин. Поскольку вероятность этого крайне мала для любой реальной совокупности, кроме бесконечно большой, то коэффициент корреляции для реальной совокупности отличен от нуля и при отсутствии связи!

Значение коэффициента корреляции, равное 1 (или -1) соответствует функциональной связи. Чем ближе связь к функциональной, тем ближе абсолютная величина коэффициента корреляции к единице. Отрицательное значение коэффициента корреляции свидетельствует об обратной зависимости.

Значение коэффициента корреляции можно посчитать с помощью функции КОРРЕЛ, встроенной в табличном процессоре MS Excel, это облегчит рутинные математические подсчеты. Так же в MS Excel можно построить на графике и эмпирическую ломаную, и уравнение регрессии.

Пример 7. Определение корреляции между числом преступлений, связанных с незаконным оборотом наркотиков, в Новосибирской и Омской областях (данные взяты с официального сайта Федеральной службы государственной статистики РФ www.gks.ru и приведены в таблице 11 (в ед., значение показателя за год)).

Таблица 11.

Можно изобразить графически динамические ряды данного вида преступлений в Новосибирской и Омской области (см. рис. 9).

Рис. 9. Динамика преступлений, связанных с незаконным оборотом наркотиков в Новосибирской и Омской областях

Проанализировав график, можно предположить, что эти данные будут коррелировать между собой. Рассчитав коэффициент корреляции, получаем, что , это означает, что корреляционная связь между признаками прямая и сильная. Изобразим графически эмпирические данные и построим прямую регрессии. Табличный процессор MS Excel позволяет нам автоматически строить прямую регрессии и указывать ее уравнение на диаграмме.

Рис. 10. Корреляционная зависимость числа преступлений, связанных с незаконным оборотом наркотиков Новосибирской и Омской областях

 


[1] См.: Лялин В. С. Правовая статистика: учебник / В. С. Лялин, Е. А. Костыря; Санкт-Петербург. ин-т внешнеэконом. связей, экономики и права, О-во "Знание" Санкт-Петербурга и Ленинград. обл. - СПб. 2006. С. 9.

[2] См.: Лунеев В. В. Юридическая статистика: учебник / В. В. Лунеев; Акад. правовой ун-т, Ин-т государства и права Рос. акад. наук. - М.: Юристъ, 2000. С. 23.

 

[3] http://www.gks.ru/wps/wcm/connect/rosstat/rosstatsite/main/population/infraction/.

 

[4] См.: Лунеев В. В. Юридическая статистика: учебник / В. В. Лунеев; Акад. правовой ун-т, Ин-т государства и права Рос. акад. наук. - М.: Юристъ, 2000. С. 307.

[5] См.: Лунеев В. В. Юридическая статистика: учебник / В. В. Лунеев; Акад. правовой ун-т, Ин-т государства и права Рос. акад. наук. - М.: Юристъ, 2000. С. 287.

[6] Чупров Александр Александрович - русский статистик (1874-1926).

[7] Елисеева И.И., Юзбашев М.М. Общая теория статистики. -М.:Финансы и статистика, 1998.

[8] Крастинь О.П. Разработка и интерпретация моделей корреляционных связей в экономике. — Рига: Зинатне, 1983.

[9] Стюдент (student) – псевдоним английского математика и статистика Вильяма Госсета (1876 - 1937).

[10] Карл Фридрих Гаусс – немецкий математик, физик и астроном (1777-1855).



Поделиться:


Последнее изменение этой страницы: 2016-12-16; просмотров: 1479; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.143.168.172 (0.017 с.)