Отбор фактора в модель парной регрессии 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Отбор фактора в модель парной регрессии



Фактор, который будет использован в парной модели, должен отвечать следующим требованиям: его влияние на результат должно быть таким, что влиянием всех остальных факторов можно пренебречь, но он не должен находиться в функциональной зависимости с результатом.

Число наблюдений фактора должно превышать число параметров при переменной в 6-7 раз. Так для модели вида необходимо не менее 6-7 наблюдений, а для модели потребуется не менее 12-14 наблюдений.

 

Спецификация модели парной регрессии

В парной регрессии используют линейные и нелинейные функции:

· – линейная функция

· – полином второй степени

· – полином третьей степени и т.д.

· – равносторонняя гипербола

· – степенная функция

· – показательная функция и т.д.

Выбор вида функции в модели парной регрессии может быть осуществлен следующими методами:

1. Графический метод. В его основу положено построение и исследование графика «корреляционное поле», на основании которого делается вывод о виде функции описывающей взаимосвязь между явлениями.

2. Аналитический метод. Опирается на изучение природы взаимосвязи между исследуемыми явлениями.

3. Экспериментальный метод. Вид функции подбирается экспериментально через анализ качества подбора функции, путем сравнения остаточной дисперсии рассчитанной для разных моделей.

Парная линейная регрессия

 

Парная линейная регрессия наиболее часто применяется в регрессионных моделях, в силу простоты расчета и интерпретирования результатов.

Расчет регрессионной модели данного вида заключается в нахождении уравнения вида:

(29)

или (30)

где;

- теоретическое значение результативного признака, рассчитанное по уравнению регрессии, показывающему взаимосвязь между и .

- фактическое значение результативного признака.

- случайная величина (возмущение, шум)

(31)

Показывает влияние не учтенных в модели факторов, а также случайных ошибок.

- параметры уравнения.

Решение уравнения регрессии заключается в расчете его параметров. Наибольшее распространение из методов расчета параметров уравнения получил метод наименьших квадратов (МНК). МНК позволяет получать такие значения , которые минимизируют сумму квадратов отклонений фактических значений от теоретических .

(32)

При расчете параметров уравнения при помощи МНК необходимо решить систему из двух нормальных уравнений.

(33)

Также используют и готовые уравнения.

Для расчета параметра :

; так как получим:

или (34)

где: (35)

(36)

Для расчета параметра :

(37)

Параметр - это теоретическое значение результативного признака при и только в этом случае имеет экономический смысл, если параметр экономического смысла не имеет. В геометрическом представлении означает координату точки пересечения линии регрессии с осью ординат.

Параметр называется коэффициентом регрессии. Коэффициент регрессии показывает, на сколько единиц, в среднем изменится результативный признак, если факторный признак увеличится на одну единицу. Например, если уравнение регрессии имеет вид:

где прибыль млн. руб. в месяц, а затраты на маркетинг тыс. руб. в месяц. Можно сказать, что при дополнительных затратах на маркетинг на 1 тыс. руб. прибыль в среднем возрастет на 0,02 млн. руб.

Геометрически это тангенс угла наклона прямой регрессии .

 

Пример 7. Имеются данные о средней прибыли (млн. руб.) и затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли (табл. 21).

Построить линейное уравнение регрессии.

Таблица 21.

  37,8 0,3
  38,0 0,5
  39,0 0,7
  37,5 0,8
  39,5 0,9
  36,8 1,1
  40,0 1,3
  40,1 1,6
  40,0 1,7
  39,0 2,2
  38,0 2,5
  41,0 2,6
  41,6 2,7
  41,0 3,0
  41,9 3,2

 

Решение. Для расчета параметров уравнения регрессии используем МНК. МНК в данном случае дает систему уравнений:

1. Рассчитаем, в таблице 22, все возможные значения и подставим в систему.

После подстановки данных получим систему:

1) Решим систему методом исключения параметра . Для этого первое уравнение разделим на 15, а второе на 25,10.

Далее из второго уравнения вычтем первое

Рассчитаем коэффициент регрессии:

.

Подставим значение в первое уравнение системы и рассчитаем параметр .

Таблица 22

  37,80 0,30 0,09 11,34 37,792344
  38,00 0,50 0,25 19,00 38,028410
  39,00 0,70 0,49 27,30 38,264476
  37,50 0,80 0,64 30,00 38,382510
  39,50 0,90 0,81 35,55 38,500543
  36,80 1,10 1,21 40,48 38,736609
  40,00 1,30 1,69 52,00 38,972676
  40,10 1,60 2,56 64,16 39,326775
  40,00 1,70 2,89 68,00 39,444808
  39,00 2,20 4,84 85,80 40,034974
  38,00 2,50 6,25 95,00 40,389074
  41,00 2,60 6,76 106,60 40,507107
  41,60 2,70 7,29 112,32 40,625140
  41,00 3,00 9,00 123,00 40,979240
  41,90 3,20 10,24 134,08 41,215306
Сумма 591,20 25,10 55,01 1004,63 591,199993
В среднем 39,413333 1,673333 3,667333 66,975333  
1,518713 0,931283 3,327158 38,874862  
2,306489 0,867289 11,069980 1511,254918  

 

2. Рассчитаем параметры уравнения , используя готовые уравнения.

Небольшие расхождения в расчете параметров разными методами объясняются ошибками округления.

Подставим полученные значения (возьмем значения полученные в Microsoft Excel, как наиболее точные. см. далее) в уравнение регрессии .

Коэффициент парной линейной регрессии показывает, что при увеличении фактора – «затраты на рекламу» на 1 единицу (1 млн. руб.), результат – «средняя прибыль» увеличится, в среднем на 1,180332 млн. руб.

Далее подставляя значения фактора в уравнение регрессии, рассчитаем теоретические значения , занесем их в последний столбик таблицы 22.

 

2) Рассмотрим решение данной задачи в Microsoft Excel.

Первое. В новой книге Microsoft Excel внесем исходные данные (рис 1).

 

 

Рисунок 1.

Далее нажимаем кнопку Сервис и в открывшейся панели нажимаем кнопку Анализ данных.

В панели Анализ данных нажимаем Регрессия:

В панели регрессия вводим входной интервал , выделяя столбик, содержащий данные результативного признака, и входной интервал , выделяя столбик, содержащий данные фактора. Ответ можно поместить на новом рабочем листе, в новой рабочей книге, или на листе, содержащем условия выбирая выходной интервал, для чего указываем графа-клетку начала размещения ответа (рис 2).

 

 

Рисунок 2.

Нажимаем ОК. Появится таблица, содержащая результаты регрессионного анализа (рис 3).

Рисунок 3.

Параметр в данной таблице находится на пересечении столбика «Коэффициенты» и строки «Y-пересечение», параметр - на пересечении столбика «Коэффициенты» и строки «Переменная Х1».

Парная линейная корреляция

 

Простейшим методом определения наличия и формы взаимосвязи является построения корреляционной таблицы и графика «корреляционное поле».

Корреляционная таблица – таблица, в которой записываются частоты сочетаний результативного и факторного показателей. В настоящее время корреляционная таблица не используется для вычисления уравнения связи.

Пример 8. Имеются данные о себестоимости единицы продукции (руб.) и затратах на рекламу (млн. руб.) (табл. 23).

Таблица 23.

                       
                       

 

Составим корреляционную таблицу (табл. 24).

Таблица 24.

y x         Итого
           
           
           
           
           
Итого          

 

По корреляционной таблице можно сделать следующие выводы. Если и распложены по возрастанию, то расположение частот около диагонали таблицы слева вниз направо говорит о прямой форме связи, если по диагонали вверх направо, то связь обратная. Если частоты находятся равномерно по всей таблицы – связь слабая.

 

Корреляционное поле (графический метод изучения взаимосвязей) – точечный график, характеризующий единицу наблюдения по двум признакам. Факторный признак откладывается по оси абсцисс, результативный признак по оси ординат.

По данным примера 8 построим корреляционное поле (рис. 4).

Рисунок 4

Анализ корреляционного поля показывает, что имеется прямая связь.

Если связь между признаками обратная, то корреляционное поле будет иметь примерно такой вид (рис. 5).

Рисунок 5

Если корреляционное поле имеет следующий вид (рис. 6) можно сделать вывод об отсутствии выраженной взаимосвязи.

Рисунок 6

Корреляционная таблица и корреляционное поле показывают лишь наличие, отсутствие и направление связи. Но они не дают представления о тесноте, интенсивности связи между признаками.

Тесноту связи в парной линейной модели определяют, рассчитывая линейный коэффициент парной корреляции или просто коэффициент корреляции. Существуют формулы расчета:

(38)

или (39)

где: - коэффициент регрессии;

- среднее квадратическое значение факторного признака;

- среднее квадратическое значение результативного признака;

(40)

где - сумма квадратов отклонений обусловленная влиянием фактора ;

- общая сумма квадратов отклонений признака .

 

Коэффициент корреляции также можно рассчитать через значение признаков в стандартизованном масштабе:

(41)

где: – значения признаков в стандартизованном масштабе.

(42)

(43)

Коэффициент корреляции может принимать значения от до . В статистике говорят, что если значения коэффициента парной корреляции:

· меньше 0,3 (-0,3) - связь положительная (отрицательная) слабая;

· от 0,3 до 0,7 (от -0,3 до -0,7) - связь положительная (отрицательная) средняя;

· свыше 0,7 (-0,7) - связь положительная (отрицательная) сильная;

· равен 1 (-1) - связь функциональная положительная (отрицательная);

· равен 0 – связь отсутствует.

 

Другой показатель тесноты связи – коэффициент парной детерминации. Он показывает часть вариации результативного признака, которая сложилась под влиянием включенного в парную модель фактора. Коэффициент парной детерминации рассчитывают, возводя в квадрат коэффициент парной корреляции или по формуле:

(44)

Коэффициент парной детерминации позволяет определять тесноту связи не только в линейных, но и в нелинейных моделях.

Коэффициент парной детерминации может принимать значения от до .

Пример 9. Имеются данные о средней прибыли (млн. руб.) и затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли (табл. 25).

Таблица 25.

  37,80 0,30
  38,00 0,50
  39,00 0,70
  37,50 0,80
  39,50 0,90
  36,80 1,10
  40,00 1,30
  40,10 1,60
  40,00 1,70
  39,00 2,20
  38,00 2,50
  41,00 2,60
  41,60 2,70
  41,00 3,00
  41,90 3,20
Сумма 591,20 25,10
В среднем 39,413333 1,673333
1,518713 0,931283

 

Рассчитать коэффициент парной линейной корреляции и коэффициент парной линейной регрессии .

Решение.

1) Так, как из примера 7 известно, что уравнение регрессии используем формулу:

Коэффициент парной корреляции показывает, что между исследуемыми признаками существует тесная положительная связь.

Возведя коэффициент корреляции в квадрат, получим коэффициент детерминации.

Коэффициент детерминации показывает, что 52% от всей вариации результативного признака обусловлено влиянием включенного в модель фактора, а 48% вариации вызвано влиянием всех остальных, не исследуемых в данной модели факторами.

 

2) Рассмотрим решение данной задачи в Microsoft Excel.

В новой книге Microsoft Excel внесем исходные данные (рис 7).

Далее нажимаем кнопку Сервис и в открывшийся панели нажимаем кнопку Анализ данных

В панели Анализ данных нажимаем корреляция:

В панели корреляция вводим входной интервал, выделяя все столбики, содержащий и данные результативного признака и данные фактора. Ответ можно поместить на новом рабочем листе, в новой рабочей книге, или на листе, содержащем условия выбирая выходной интервал, для чего указываем графа-клетку начала размещения ответа (рис. 7).

 

Рисунок 7.

Нажимаем ОК.

Появится таблица парных линейных коэффициентов корреляции (рис. 8).

Рисунок 8.

На пересечении столбца 1 и столбца 2 и будет искомый коэффициент парной линейной корреляции.

 



Поделиться:


Последнее изменение этой страницы: 2016-12-29; просмотров: 529; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.147.89.85 (0.07 с.)