Оценка надежности результатов 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Оценка надежности результатов



Так же как и для множественной регрессии, можно сформулировать гипотезы о равенстве нулю параметров частных уравнений регрессии.

, частный -критерий оценивает статистическую значимость присутствия каждого фактора в уравнений. В числе показан прирост доли объяснённой или факторной вариации за счет дополнительного включения в модель соответствующего фактора:

- - прирост факторной дисперсии за счет ;

… … …

- -прирост факторной дисперсии за счет .

В знаменателе указана доля остаточной вариации по регрессионной модели, включающей полный набор факторов. Числитель и знаменатель формулы приведены к сравнимому виду путем деления на число степеней свободы, соответственно, на 1 и .

В , так как прирост факторной суммы квадратов отклонений обусловлен дополнительным включением в модель одного исследуемого фактора, то число степеней свободы для него равно 1.

Если , где =1, = , то дополнительное включение в модель фактора xi в модель статистически оправдано и коэффициент чистой регрессии bi при факторе xi статистически значим.

Если , то дополнительное включение в модель фактора xi не увеличивает существенно долю объяснённой вариации признака , значит, нецелесообразно включение его в модель.

С помощью частного - критерия можно проверить значимость всех коэффициентов регрессии в предположении, что каждый коэффициент вводился последним в уравнение.

 

Таблица 18. Дисперсионный анализ для оценки факторов.

Источники вариаций Число cтепеней свободы Суммы квадратов отклонений Дисперсии на одну степень свобод Д . .
общая x -- -- --
Факторная, в том числе за счет … за счет x x … x x x … x x x … x x x … x
остаточная x x x x

Средняя часть таблицы существенно меняется, в зависимости от того, какие гипотезы проверяются, так как во множественной регрессии источник вариации складывается из нескольких составляющих и каким образом проверяется действие включенных факторов, независимо, последовательно и в какой последовательности. Например: три переменных , , , то можно определить - критерий, частный, для уравнения с , затем - критерий последовательного включения после и наконец, - критерий, частный для уравнения с , , . Последовательный - критерий может интересовать лишь на стадии формирования модели. С критерием Стьюдента связан именно част..

Оценка значимости коэффициентов чистой регрессии по - критерию Стьюдента может быть проведена и без расчета частных - критериев. В этом случае, аналогично парной регрессии:

= ,

βi - коэффициент чистой регрессии при ;

- среднеквадратическая ошибка коэффициента регрессии βi.

Для уравнения средняя квадратическая ошибка коэффициента регрессии может быть определена так:

=

- средне квадратическое отклонение для y;

- средне квадратическое отклонение для ;

- коэффициент детерминации для уравнения множественной регрессии;

- коэффициент детерминации для зависимости фактора со всеми другими факторами уравнения множественной регрессии.

– число степеней свободы для остаточной суммы квадратов отклонений.

Если проверяется регрессия:

Для фактора определим

Для фактора определим частный - критерий

 

ПРИМЕР РЕШЕНИЯ ЗАДАЧИ

Задание 3.1. Имеются данные о заработной плате, возрасте, стаже работы по специальности и выработке по 15 рабочим цехам. Нужно установить влияние на заработную плату таких факторов, как возраст, стаж работы и выработка.

Решение.

1 этап -Предположим, что влияние всех из вышеперечисленных факторов имеет место быть. Для анализа влияния факторов построим эконометрическую модель.

2 этап – Результативным признаком в нашем примере является заработная плата, этот фактор мы обозначим за Y. Факторными признаками будут возраст, стаж работы и выработка, которые мы обозначим как x1, x2, x3 соответственно.

Что бы отобрать факторы для нашей модели, мы должны провести корреляционно-регрессионный анализ.

 

Таблица 19. Исходные данные к Заданию 3.1.

Исходные данные
Y x1 x2 x3
  4,1      
  4,8      
  4,3      
  3,8      
  3,4      
         
  4,9      
  4,7      
  5,1      
  4,8      
  3,9      
  4,3      
  3,4      
  4,8      
  3,6      

Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям.

1) Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.

2) Факторы не должны быть интеркоррелированы (т.е. между объясняющими переменными присутствует корреляция) и тем более находиться в точной функциональной связи.

Включение в модель факторов с высокой интеркорреляцией может привести к ненадежной оценке коэффициентов регрессии, так как нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются не интерпретируемыми.

Для отбора факторов в модель построим матрицу парных коэффициентов корреляции.

Рис 3. Вставка функции КОРРЕЛ.

Чтобы вычислить коэффициенты корреляции между факторами, в ячейке пересечения факторов вызываем функцию КОРРЕЛ.

В ячейку массив1 выбираем массив значений одного из коррелируемых факторов, массив 2 – значения другого фактора.

 

Рис4. Аргументы функции КОРРЕЛ.

После составления матрицы парной корреляции, производим анализ полученных значений.

 

Рис 5. Матрица парной корреляции.

Наиболее тесная связь с результативным признаком Y фактора х3, поэтому мы включаем его в нашу модель.

Коэффициент парной регрессии между факторами х2 и х3 больше 0,7, следовательно факторы мультиколлинеарны, значит из модели фактор х2 мы исключаем.

Итак, для дальнейшего анализа в модели мы оставляем факторы х1 и х3.

3 этап -Для анализа нашей модели выбираем линейную форму связи:

y= b1x1+b3x3+a.

В данном уравнении нам необходимо рассчитать коэффициенты b1, b3 и a.

4 этап – Для определения параметров модели программой MS EXCEL предусмотрена функция ЛИНЕЙН (иногда встречаются случаи, когда часть переменных зависимы линейно, а другая часть не линейно, к таким переменным нужно применить линеаризацию).

Так как нам нужно найти 3 параметра, следовательно, нам нужно выделить на свободном месте листка EXCEL массив – 3 столбца, 5 строк. Вызываем мастер функции.

Рис 6. Аргументы функции ЛИНЕЙН.

В ячейку «Известные_значения_у» добавляем массив Y.

В ячейку «Известные_значения_х» добавляем массив х (так как на предыдущих этапах мы выбрали для модели х1 и х3, то добавляем в ячейку массивы х1 и х3, важно, чтобы столбцы с этими значениями располагались рядом друг с другом).

В ячейку «Конст» пишем 1.

В ячейку «Статистика» пишем 1.

Далее единовременным нажатие Gtrl+Shift+Enter сворачиваем мастер функций.

Таблица 20. Значения параметров линейной модели

 

0,033027 0,06453 2,043816
0,010806 0,018294 0,27533
0,851902 0,236603 #Н/Д
34,5137   #Н/Д
3,864227 0,671773 #Н/Д

 

 

Полученная таблица означает следующее:

b1 = 0,033 b3 = 0,065 a = 2,044/

Индекс детерминации = 0,852.

Fфакт = 34,51.

5 этап – Анализ качества модели

Так как индекс детерминации равен 0,852, а это близко к 1, значит справедлив вывод – качество модели высокое.

Fфакт = 34,51, проверяем с табличным значением Критерия Фишера. Так как полученное нами значение больше табличного, модель статистически значима.

6 этап – Интерпретация результатов моделирования

y = 0,033 x1+0,065 x3+2,044.

Так как перед x1 и x3 коэффициенты имеют знак «+», то x1, x3 и у изменяются в одном направлении.

 

При изменении x1 на 1, у увеличится на 0,033 ед.

При изменении x3 на 1, у увеличится на 0,065 ед.

 

7 этап – Чтобы построить прогноз произведем расчеты

Рассчитаем модельное, подставив в y = 0,033 x1+0,065 x3+2,044 значения x1 и x3.

Талица 21. Расчет промежуточных величин

Средняя ошибка аппроксимации составила 4,39% (<7%), следовательно модель не содержит систематических ошибок и можно составлять прогноз.

 

 

ЗАДАЧИ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ.

 

Задание 3.

 

По 20 предприятиям региона (табл. 22) изучается зависимость выработки продукции на одного работника у (тыс. руб.) от ввода в действие новых основных средств (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих (%).

Таблица 22. Исходные данные к Заданию 3.

Номер предприятия у Номер предприятия у
1 7,0 3,9 10,0 11 9,0 6,0 21,0
2 7,0 3,9 14,0 12 11,0 6,4 22,0
3 7,0 3,7 15,0 13 9,0 6,8 22,0
4 7,0 4,0 16,0 14 11,0 7,2 25,0
5 7,0 3,8 17,0 15 12,0 8,0 28,0
6 7,0 4,8 19,0 16 12,0 8,2 29,0
7 8,0 5,4 19,0 17 12,0 8,1 30,0
8 8,0 4,4 20,0 18 12,0 8,5 31,0
9 8,0 5,3 20,0 19 14,0 9,6 32,0
10 10,0 6,8 20,0 20 14,0 9,0 36,0

Требуется:

1. Оценить показатели вариации каждого признака и сделать вывод о возможностях применения МНК для их изучения.

2. Проанализировать линейные коэффициенты парной и частной корреляции.

3. Написать уравнение множественной регрессии, оценить значимость его параметров, пояснить их экономический смысл.

4. С помощью F-критерия Фишера оценить статистическую надежность уравнения регрессии и Сравнить значения скорректированного и нескорректированного линейных коэффициентов множественной детерминации.

5. С помощью частных F-критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после .

6. Рассчитать средние частные коэффициенты эластичности и дать на их основе сравнительную оценку силы влияния факторов на результат.

 

Задание 4.

 

В табл. 23 представлены данные о рынке строящегося жилья в Санкт-Петербурге.

Таблица 23. Исходные данные к Заданию 4.

№ п/п y
1 1 1 39,0 20,0 8,2 0 1 0 15,9
2 3 1 68,4 40,5 10,7 0 1 0 27,0
3 1 1 34,8 16,0 10,7 0 1 12 13,5
4 1 1 39,0 20,0 8,5 0 1 12 15,1
5 2 1 54,7 28,0 10,7 0 1 12 21,1
6 3 1 74,7 46,3 10,7 0 1 12 28,7
7 3 1 71,7 45,9 10,7 0 0 0 27,2
8 3 1 74,5 47,5 10,4 0 0 0 28,3
9 4 1 137,7 87,2 14,6 0 1 0 52,3
10 1 1 40,0 17,7 11,0 1 1 8 22,0
11 2 1 53,0 31,1 10,0 1 1 8 28,0
12 3 1 86,0 48,7 14,0 1 1 8 45,0
13 4 1 98,0 65,8 13,0 1 1 8 51,0
14 2 1 62,6 21,4 11,0 1 1 0 34,4
15 1 1 45,3 20,6 10,4 1 1 8 24,7
16 2 1 56,4 29,7 9,4 1 1 8 30,8
17 1 1 37,0 17,8 8,3 0 1 0 15,9
18 3 1 67,5 43,5 8,3 0 1 0 39,0
19 1 1 37,0 17,8 8,3 0 1 3 15,4
20 3 1 69,0 42,4 8,3 0 1 3 28,6
21 1 1 40,0 20,0 8,3 0 0 0 15,6
22 3 1 69,1 41,3 8,3 0 1 0 27,7
23 2 1 68,1 35,4 13,0 1 1 20 34,1
24 2 1 75,3 41,4 12,1 1 1 20 37,7
25 3 1 83,7 48,5 12,1 1 1 20 41,9
26 1 1 48,7 22,3 12,4 1 1 20 24,4
27 1 1 39,9 18,0 8,1 1 0 0 21,3
28 2 1 68,6 35,5 17,0 1 1 12 36,7
29 1 1 39,0 20,0 9,2 1 0 0 21,5
30 2 1 48,6 31,0 8,0 1 0 0 26,4
31 3 1 98,0 56,0 22,0 1 0 0 53,9
32 2 1 68,5 30,7 8,3 1 1 6 34,2
33 2 1 71,1 36,2 13,3 1 1 6 35,6
34 3 1 68,0 41,0 8,0 1 1 12 34,0
35 1 1 38,0 19,0 7,4 1 1 12 19,0
36 2 1 93,2 49,5 14,0 1 1 12 46,6
37 3 2 117,0 55,2 25,0 1 1 12 58,5
38 1 2 42,0 21,0 10,2 1 0 12 24,2
39 2 2 62,0 35,0 11,0 1 0 12 35,7
40 3 2 89,0 52,3 11,5 1 1 12 51,2
41 4 2 132,0 89,6 11,0 1 1 12 75,9
42 1 2 40,8 19,2 10,1 1 1 6 21,2
43 2 2 59,2 31,9 11,2 1 1 6 30,8
44 3 2 65,4 38,9 9,3 1 1 6 34,0
45 2 2 60,2 36,3 10,9 1 1 12 31,9
46 3 2 82,2 49,7 13,8 1 1 12 43,6
47 3 3 98,4 52,3 15,3 1 1 12 52,2
48 3 3 76,7 44,7 8,0 1 1 0 43,1
49 1 3 38,7 20,0 10,2 1 1 6 25,0
50 2 3 56,4 32,7 10,1 1 1 6 35,2
51 3 3 76,7 44,7 8,0 1 1 6 40,8
52 1 3 38,7 20,0 10,2 1 0 0 18,2
53 1 3 41,5 20,0 10,2 1 1 0 2,1
54 2 3 48,8 28,5 8,0 1 0 0 22,7
55 2 3 57,4 33,5 10,1 1 1 0 27,6
56 3 3 76,7 44,7 8,0 1 1 0 36,0
57 1 4 37,0 17,5 8,3 0 1 7 17,8
58 2 4 54,0 30,5 8,3 0 1 7 25,9
59 3 4 68,0 42,5 8,3 0 1 7 32,6
60 1 4 40,5 16,0 11,0 0 1 3 19,8
61 2 4 61,0 31,0 11,0 0 1 3 29,9
62 3 3 80,0 45,6 11,0 0 1 3 39,2
63 1 3 52,0 21,2 11,2 1 1 18 22,4
64 2 3 78,1 40,0 11,6 1 1 18 35,2
65 3 4 91,6 53,8 16,0 1 0 18 41,2
66 1 4 39,9 19,3 8,4 0 1 6 17,8
67 2 4 56,2 31,4 11,1 0 1 6 25,0
68 3 4 79,1 42,4 15,5 0 1 6 35,2
69 4 4 91,6 55,2 9,4 0 1 6 40,8

Принятые в таблице обозначении:

y- цена квартиры, тыс. у.е.;

- число комнат в квартире;

- район города (1 - Приморский, Шувалово - Озерки, 2 - Гражданка, 3 - Юго-Запад, 4 - Красносельский);

- общая площадь квартиры (м2);

. - жилая площадь квартиры(м1);

- площадь кухни (м2);

- тип дома (1- кирпичный, 0 - другой);

- наличие балкона (1-есть, 0- нет);

- число месяцев до окончания срока строительства.

Задание:

1. Определите факторы, формировавшие цену квартир в строящихся домах в Санкт-Петербурге. Сформируйте фиктивную переменную z, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы: квартиры на севере города (Приморский район, Шувалово-Озерки, Гражданка) и на юге города (Юго-Запад, Красносельский район).

2. Составьте матрицу парных коэффициентов корреляции:

а) исходных переменных;

б) логарифмов исходных переменных (кроме фиктивных переменных). Вместо переменной используйте фиктивную переменную z.

3. Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов в линейной форме. Установите, какие факторы мультиколлинеарны.

*4. Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов в степенной форме. Установите, какие факторы мультиколлинеарны. В какой модели мультиколлинеарность проявляется сильнее?

5. Существует ли разница в ценах квартир, расположенных в северной и южной частях Санкт-Петербурга? Является ли наличие балкона или лоджии преимуществом квартиры на рынке?

*- задание повышенной сложности.

 

ЗАДАНИЕ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ

 

Сформулировать гипотезу о взаимосвязи нескольких экономических показателях и провести эконометрическое исследование, построив модель множественной регрессии, на основе реальных статистических данных, полученных из официальных источников статистической информации (Государственного комитета статистики РФ, международных финансовых организаций и др.).

 

*- По результатам проведенного эконометрического исследования подготовить научную статью для публикации в периодических научных изданиях.

 



Поделиться:


Последнее изменение этой страницы: 2017-02-21; просмотров: 246; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.149.229.253 (0.067 с.)