Этапы построения эконометрической модели 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Этапы построения эконометрической модели



ЭТАПЫ ПОСТРОЕНИЯ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ

 

1. Качественный анализ сущности рассматриваемого явления и выдвижение гипотезы.

2. Формирование набора факторов, участвующих в модели и их анализ.

3. Сбор необходимой статистической информации.

4. Проведение спецификации модели, т.е. выбор общего вида модели, в том числе состава и формы входящих в неё связей между переменными.

5. Проведение оценки параметров уравнения.

6. Проверка адекватности модели, оценка точности модельных данных.

7. Интерпретация результатов моделирования.

8. Прогнозирование неизвестных значений зависимой переменной.

 

2. ПАРНАЯ РЕГРЕССИЯ

 

Парная регрессия – уравнение связи двух переменных у и x:

Различают линейные и нелинейные регрессии.

Линейная:

 

Нелинейные регрессии делят на два класса: регрессии, нелинейные относительно включенных объясняющих переменных, но линейных по оцениваемым параметрам, и, регрессии, нелинейные по оцениваемым параметрам.

 

Нелинейные по объясняющим переменным, но линейная по оцениваемым параметрам:

Регрессии, нелинейные по оцениваемым параметрам:

Степенная:

Показательная:

Экспоненциальная:

Логарифмическая:

Полулогарифмическая:

Обратная:

 

Нашей задачей является подобрать функцию , наилучшим способом описывающую зависимость y от x.

 

2.1. СПЕЦИФИКАЦИЯ МОДЕЛИ ГРАФИЧЕСКИМ МЕТОДОМ

 

Этот метод применяют в случае парной зависимости для наглядного изображения формы связи между изучаемыми экономическими показателями. Для этого в прямоугольной системе координат строят график, по оси ординат откладывают значения результативного признака Y, а по оси абсцисс - значения факторного признака X.

Совокупность точек результативного и факторного признаков называется полем корреляции.

На основании поля корреляции можно выдвинуть гипотезу о типе связи между всеми возможными значениями X и Y.

       
 
 
   

 

 


Рисунок 1. Графики различных функций.

ОЦЕНКА ПАРАМЕТРОВ МОДЕЛИ

 

Построение уравнения регрессии сводится к оценке её параметров. Согласно МНК (метод наименьших квадратов) поиск наилучшей аппроксимации набора наблюдений сводится к минимизации функционала:

Для линейной функции:

. (1)

Необходимые условия экстремума:

(2)

(3);

(4)

Введем обозначения: , , , .

 

В новых обозначениях система определения и принимает вид:

 

(5)

, (6)

, (7)

- выборочной дисперсии переменной x;

- выборочной дисперсии переменной y;

- выборочной ковариации.

 

2.3. ОЦЕНКА КАЧЕСТВА ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ

 

Проверить значимость уравнения регрессии - значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.

На первый взгляд, подходящим измерителем тесноты связи от является коэффициент регрессии , ибо он показывает, на сколько единиц в среднем изменяется , когда увеличивается на одну единицу. Однако зависит от единиц измерения переменных (например, он увеличится в 100 раз, если измерять не в метрах, а в сантиметрах).

Очевидно, что для использования как показателя тесноты связи, нужна такая стандартная система единиц измерения, в которой данные по различным характеристикам оказались бы сравнимы между собой.

 

 

Таблица 1. Показатели качества модели

Линейная зависимость Нелинейная зависимость
Показатели тесноты связи
Коэффициент корреляции Индекс корреляции
, где ,
Показатели детерминации
Коэффициент детерминации Индекс детерминации
F - критерий Фишера
Средняя ошибка аппроксимации

 

КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ

 

Статистика применяет систему, которая использует в качестве единицы измерения переменной её среднее квадратическое отклонение .

Подставив правую часть равенства (7) в уравнение , получим:

т.о. .

В этой системе величина показывает, на сколько величин изменится в среднем , когда увеличится на одно . Величина является показателем тесноты связи и называется выборочным коэффициентом корреляции (коэффициентом корреляции).

Для практических расчетов наиболее удобна формула:

или (8)

 

Свойства коэффициента корреляции:

1) , т.к. ;

2) при , корреляционная связь представляет линейную функциональную зависимость. При этом все наблюдаемые значения располагаются на прямой.

3) при линейная связь отсутствует.

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:


0.1 < rxy < 0.3: слабая;

0.3 < rxy < 0.5: умеренная;

0.5 < rxy < 0.7: заметная;

0.7 < rxy < 0.9: высокая;

0.9 < rxy < 1: весьма высокая;


Близость к нулю не означает отсутствия связи между признаками, она может оказаться достаточно тесной, но иметь нелинейную зависимость.

КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ

 

Проверка значимости уравнения регрессии производится на основе дисперсионного анализа. Обозначим через - модельные, теоретически вычисляемые по формуле значения, тогда

(9)

Преобразуем формулу дисперсии с учетом вышеуказанной суммы:

(10)

 

Далее

(11)

Так как имеет место равенство ,

и из МНК следуют два соотношения , (12)

то

(13)

Введем обозначения:

TSS (total sum of sguares) – вся дисперсия: сумма квадратов отклонений от среднего.

RSS (regression sum of sguares) – объясненная часть всей дисперсии (обусловленная регрессией).

ESS (error sum of sguares) – остаточная сумма, дисперсия остаточная.

 

Коэффициентом детерминации, или долей объясненной дисперсии называется:

.

 

Для линейной регрессии: или .

Тогда, . Получившаяся формула есть дисперсия объясненная, факторная, тогда .

Отсюда, можно выразить индекс корреляции R для нелинейной регрессии

. (14)

Свойства коэффициента детерминации:

1) в силу определения .;

2) если , то регрессия ничего не дает, т.е. не улучшает качество предсказания , по сравнению с .

3) если , то лежат на линии регрессии и между и y существует линейная функциональная зависимость, т.е. абсолютное совпадение: .

 

F-КРИТЕРИЙ ФИШЕРА

 

Оценка качества уравнения регрессии состоит в проверке гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого производится сравнение фактического и значений F-критерия Фишера-Снедекора. определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы

. (15)

где m – число степеней свободы, для парной регрессии m=1

- это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости . Уровень значимости - это вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно .

Если < , то - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.

Если > , то - гипотеза не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

ПРИМЕРЫ РЕШЕНИЯ ЗАДАЧ

 

Задача 1. При исследовании 8 магазинов получены следующие данные (табл.3).

1. Построить регрессионную модель зависимости объема товарооборота от числа работников.

2. Проверить значимость модели и коэффициентов модели.

3. Рассчитать коэффициент эластичности и дать ему экономическую интерпретацию.

4. Построить 95% доверительный интервал для оценки объема товарооборота отдельного магазина со 100 работниками.

Таблица 3. Исходные данные к Задаче 1.

 

Наблюдение Объем товарооборота, млн. руб. Число работников
  0,5  
  0,7  
  0,9  
  1,1  
  1,4  
  1,4  
  1,7  
  1,9  

 

Решение:

a. Проведем спецификацию модели графическим методом.

Поскольку необходимо найти зависимость объема товарооборота от числа работников, то в качестве Y – принимаем Объем товарооборота, X - Число работников.

 

Рисунок 2. Спецификация модели

На основании поля корреляции можно выдвинуть гипотезу о том, что связь между всеми возможными значениями X и Y носит линейный характер.

Для оценки параметров a и b - используют МНК (метод наименьших квадратов).

b. Параметры уравнения регрессии.

Выборочные средние:

,

 

Таблица 4. Расчет параметров модели

  x y x2 y2 x•y
    0.5   0.25 36.5
    0.7   0.49 59.5
    0.9   0.81 91.8
    1.1   1.21 126.5
    1.4   1.96 170.8
    1.4   1.96 176.4
    1.7   2.89 227.8
    1.9   3.61 279.3
сумма   9.6   13.18 1168.6

Используя формулы (6) и (7), получаем коэффициенты регрессии:

b = 0.0192, a = -0.97. (b>0, следовательно связь прямая)

Уравнение регрессии: y = 0.0192 x - 0.97,

Величина коэффициента b говорит о том, что с ростом числа работников на 1 человека, объем товарооборота магазина будет увеличиваться на 0,0192 млн. руб.

c. Теснота связи.

Среднеквадратическое отклонение:

,

Рассчитываем показатель тесноты связи. Таким показателем является линейный коэффициент корреляции, который рассчитывается по формуле:

В нашем примере связь между признаком Y и фактором X (по шкале Чеддока) весьма высокая.

Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:

Незначительные отклонения в расчетных величинах возможны из-за округления величин.

d. Коэффициент детерминации.

Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (модельные) значения результативного показателя y(x) для каждого наблюдения.

=0,9712,

т.е. в 97.12 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 2.88 % изменения Y объясняются факторами, не учтенными в модели.

Таблица 5. Расчет промежуточных величин для оценки качества модели

(yi-ycp)2 (y- )2 (xi-xcp)2 |y - |/y
0.43 0.49 0.004832   0.14
0.66 0.25 0.001495   0.0552
0.99 0.09 0.007812   0.0982
1.24 0.01 0.0192   0.13
1.37 0.04 0.000721   0.0192
1.45 0.04 0.002509   0.0358
1.6 0.25 0.009217   0.0565
1.85 0.49 0.002108   0.0242
9.6 1.66 0.0479   0.55

 

5. Критерий Фишера.

.

Табличное значение критерия со степенями свободы k1=1 и k2=6 (8-1-1), Fтабл = 5.99

Поскольку фактическое значение Fфакт > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).

6. Ошибка аппроксимации.

Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:

Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

7. Проверка статистической значимости параметров.

Несмещенной оценкой дисперсии возмущений является величина:

- необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).

- стандартная ошибка оценки (стандартная ошибка регрессии).

Стандартное отклонение случайной величины a:

Стандартное отклонение случайной величины b:

Поскольку 14.12 > 2.447, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

Поскольку 6.2 > 2.447, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

8. Доверительный интервал для коэффициентов уравнения регрессии.

Определим доверительные интервалы коэффициентов регрессии, которые с надежностью 95% будут следующими:

(b – tтабл mb; b + tтабл mb) = (0.0192 - 2.447 • 0.00136; 0.0192 + 2.447 • 0.00136) =

= (0.0158;0.0225)

С вероятностью 95% можно утверждать, что значение данного параметра будет лежать в найденном интервале.

(a – tтабл ma; a + tтабл ma) = (-0.9739 - 2.447 • 0.156; -0.9739 + 2.447 • 0.156) =

= (-1.356;-0.5922)

С вероятностью 95% можно утверждать, что значение данного параметра будет лежать в найденном интервале.

9. Коэффициент эластичности.

Коэффициенты регрессии (в примере b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х.

Для этих целей вычисляются коэффициенты эластичности и бета - коэффициенты.

Средний коэффициент эластичности E показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения.

Коэффициент эластичности находится по формуле:

В нашем примере коэффициент эластичности больше 1. Следовательно, при изменении Х на 1%, Y изменится более чем на 1%. Другими словами - Х существенно влияет на Y.

 

10. Интервальный прогноз.

Точечный прогноз показателя определяется путем подстановки в уравнение регрессии 0.0192 x - 0.97 соответствующего прогнозного значения =100.

Далее вычисляется средняя стандартная ошибка прогноза :

 

 

Строится доверительный интервал прогноза:

 

 

Задача 2. Имеются данные о количестве выпускаемой продукции в тыс. штук (x) и ее себестоимостью в у.е. (y).

 

Таблица 6. Исходные данные к Задаче 2.

X Y   X Y
  2,50 4,40     6,00 1,50
  3,00 3,60     6,50 1,40
  3,30 3,00     7,00 1,30
  4,00 2,70     7,50 1,20
  4,60 2,10     8,00 1,10
  5,00 1,80     8,50 1,10
  5,40 1,90     8,90 0,90

1. Для характеристики зависимости у от х рассчитать параметры следующих функций:

а) линейной;

б) степенной;

в) показательной;

г) равносторонней гиперболы.

2. Оценить каждую модель через среднюю ошибку аппроксимации и F-критерий Фишера.

3. Выбрать лучшую модель для прогноза.

 

Проведем спецификацию модели графическим методом.

 

Рисунок 3. Поле корреляции к Задаче 2.

 

Построим линейную и нелинейные регрессии и оценим их качество.

 

 

A. Линейная модель.

Для расчета параметров a и b линейной регрессии y=a=b*x рассчитываем , , , , .

 

Таблица 7. Расчет параметров линейной модели.

  xy x2 y2
  11,000 6,25 19,36
  10,800 9,00 12,96
  9,900 10,89 9,00
  10,800 16,00 7,29
  9,660 21,16 4,41
  9,000 25,00 3,24
  10,260 29,16 3,61
  9,000 36,00 2,25
  9,100 42,25 1,96
  9,100 49,00 1,69
  9,000 56,25 1,44
  8,800 64,00 1,21
  9,350 72,25 1,21
  8,010 79,21 0,81

 

Уравнение регрессии: .

C увеличением количества выпускаемой продукции на 1 тыс., ее себестоимость снижается в среднем на 0,4671 у.е.

Рассчитаем линейный коэффициент парной корреляции. ; .

Среднеквадратическое отклонение:

; .

.

Связь обратная и весьма высокая.

Определим коэффициент детерминации:

.

Вариация результата на 86% объясняется вариацией фактора x.

Таблица 7. Расчет промежуточных величин для оценки качества линейной модели

y- - ( - )2 y- (y- )2 │y- │/y
3,51 0,89 1,508 2,274 2,40 5,760 0,203
3,27 0,33 1,275 1,624 1,60 2,560 0,090
3,13 -0,13 1,134 1,287 1,00 1,000 0,045
2,81 -0,11 0,807 0,652 0,70 0,490 0,040
2,53 -0,43 0,527 0,278 0,10 0,010 0,203
2,34 -0,54 0,340 0,116 -0,20 0,040 0,300
2,15 -0,25 0,153 0,024 -0,10 0,010 0,133
1,87 -0,37 -0,127 0,016 -0,50 0,250 0,249
1,64 -0,24 -0,360 0,130 -0,60 0,360 0,171
1,41 -0,11 -0,594 0,353 -0,70 0,490 0,082
1,17 0,03 -0,827 0,685 -0,80 0,640 0,023
0,94 0,16 -1,061 1,126 -0,90 0,810 0,146
0,71 0,39 -1,295 1,676 -0,90 0,810 0,359
0,52 0,38 -1,481 2,194 -1,10 1,210 0,424

Найдем величину средней ошибки аппроксимации :

.

Рассчитываем F - критерий:

Fтабл = 4,7472.

Так как Fфакт > Fтабл, уравнение регрессии значимо.

B. Степенная модель.

Построению степенной модели предшествует процедура линеаризации переменных. В примере линеаризация производится путем логарифмирования обеих частей уравнения:

Где Y=lg y, X= lg x, C= lg a.

Для расчетов используем данные Таблицы 8.

Таблица 8. Расчет параметров степенной модели.

X Y XY X2 Y2
0,398 0,643 0,256 0,158 0,414
0,477 0,556 0,265 0,228 0,309
0,519 0,477 0,247 0,269 0,228
0,602 0,431 0,260 0,362 0,186
0,663 0,322 0,214 0,439 0,104
0,699 0,255 0,178 0,489 0,065
0,732 0,279 0,204 0,536 0,078
0,778 0,176 0,137 0,606 0,031
0,813 0,146 0,119 0,661 0,021
0,845 0,114 0,096 0,714 0,013
0,875 0,079 0,069 0,766 0,006
0,903 0,041 0,037 0,816 0,002
0,929 0,041 0,038 0,864 0,002
0,949 -0,046 -0,043 0,901 0,002
ЛОГАРИФМЫ      
10,18 3,52 2,079 7,81 1,46
0,73 0,25 0,148 0,56 0,10

 

 

Сумма

Среднее

Рассчитаем С и b:

Получим линейное уравнение: .

Выполнив его потенцирование, получим:

.

Подставляя в данное уравнение фактические значения x, получаем теоретические значения результата . По ним рассчитываем показатели: тесноты связи - индекс корреляции R и среднюю оценку аппроксимации .

.

Связь весьма высокая.

Определим индекс детерминации:

Вариация результата на 99% объясняется вариацией фактора x.

= 3,6 %.

Расчетные значения в среднем откланяются от фактических на 3,6 %.

Таблица 9. Расчет величин для оценки качества степенной модели.

ŷ

 

(y-ŷ)2 ŷ−yср (ŷ−y ср)2 y-yср (y-yср)2 │y-ŷ│/y
4,41

 

0,000 2,406 5,789 2,40 5,760 0,001
3,54 0,003 1,545 2,387 1,60 2,560 0,015
3,16 0,027 1,164 1,355 1,00 1,000 0,055
2,52 0,034 0,515 0,266 0,70 0,490 0,068
2,13 0,001 0,129 0,017 0,10 0,010 0,014
1,93 0,016 -0,072 0,005 -0,20 0,040 0,071
1,76 0,020 -0,241 0,058 -0,10 0,010 0,074
1,55 0,003 -0,449 0,202 -0,50 0,250 0,034
1,41 0,000 -0,590 0,348 -0,60 0,360 0,007
1,29 0,000 -0,709 0,503 -0,70 0,490 0,007
1,19 0,000 -0,811 0,658 -0,80 0,640 0,009
1,10 0,000 -0,899 0,809 -0,90 0,810 0,001
1,02 0,006 -0,976 0,953 -0,90 0,810 0,069
0,97 0,005 -1,031 1,063 -1,10 1,210 0,077
             
27,98 0,115 -0,02 14,4125 0,0000 14,44 0,50
2,00 0,008 0,00 1,0295 0,0000 1,03 0,04

 

Рассчитываем F - критерий:

.

Fтабл = 4,7472.

Так как Fфакт > Fтабл, уравнение регрессии значимо, статистически надежно.

ЗАДАЧИ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ.

 

Задание 1.

По семи территориям Уральского района известны значения двух признаков.

Таблица 15. Исходные данные к Заданию 1.

Район Расходы на покупку продовольственных товаров в общих расходах, %, у Среднедневная заработная плата одного работающего, у.е., х
Удмуртская респ. 68,8 4,51
Свердловская обл. 61,2 5,90
Башкортостан 59,9 5,72
Челябинская обл. 56,7 6,18
Пермская обл. 55,0 5,88
Курганская обл. 54,3 4,72
Оренбургская обл. 49,3 5,52

Требуется:

1. Для характеристики зависимости у от х рассчитать параметры следующих функций:

а) линейной;

б) степенной;

в) равносторонней гиперболы;

*г) показательной.

2. Оценить каждую модель через среднюю ошибку аппроксимации и F-критерий Фишера.

Результаты занести в таблицу 16.

 

Таблица 16. Результат регрессионного анализа Задания 1.

Уравнение регрессии Показатель тесноты связи Показатель детерминации F-критерий
1.        
2.        
3.        
4.        

 

* - задание повышенной сложности.

 

Задание 2.

 

По группе предприятий, производящих однородную продукцию, известно, как зависит себестоимость единицы продукции у от факторов, приведенных в табл. 17.

Таблица 17. Исходные данные к Заданию 2.

Признак-фактор Уравнение парной регрессии Среднее значение фактора
Объем производства, млн руб., x1 =2.64
Трудоемкость единицы продукции, чел.-час, х2 =1,38
Оптовая цена за 1 т энергоносителя, млн руб., х3 =1,503
Доля прибыли, изымаемой государством, %, х4 =26,3

Требуется:

1. Определить с помощью коэффициентов эластичности силу влияния каждого фактора на результат.

2. Ранжировать факторы по силе влияния.

ЗАДАНИЕ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ

 

Сформулировать гипотезу о взаимосвязи двух экономических показателях и провести эконометрическое исследование на основе реальных статистических данных, полученных из официальных источников статистической информации (Государственного комитета статистики РФ, международных финансовых организаций и др.).

 

*- По результатам проведенного эконометрического исследования подготовить научную статью для публикации в периодических научных изданиях.

 

  1. МНОЖЕСТВЕННАЯ РЕГРЕССИЯ

Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Если это невозможно, то следует попытаться выявить влияние других факторов, вводя их в модель, т.е. построить модель множественной регрессии



Поделиться:


Читайте также:




Последнее изменение этой страницы: 2017-02-21; просмотров: 621; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.131.110.169 (0.228 с.)