Тема: Мультиколлинеарность. Фиктивные переменные. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Тема: Мультиколлинеарность. Фиктивные переменные.



Содержание занятия.

1. Введение фиктивных переменных в уравнение множественной регрессии.

2. Частная корреляция модели множественной регрессии.

Литература: [1] стр155-169, [3] стр200-216, стр262-282

 

Задание 1 Пусть по данным о 20 рабочих цеха оценивается регрессия заработной платы рабочего за месяц от количественного фактора – возраст рабочего (лет) и качественного фактора – пол.

Заработная плата рабочего за месяц, $, у Возраст рабочего, лет, х1 Пол, м/ж, х2
      Ж М Ж Ж М М Ж М М М Ж М М М Ж М М М Ж М

Построить модель множественной регрессии.

 

Методические указания по выполнению задания:

Введем в модель фиктивную переменную z, которая принимает два значения: 1 – если пол рабочего мужской; 0 – если пол женский. Построим модель вида: .

Для оценки параметров модели используем метод наименьших квадратов. Построим систему нормальных уравнений:

В результате решения системы получим оценки:

Уравнение регрессии: .

Интерпретация параметра с=10,32 при фиктивной переменной: у мужчин зарплата в среднем выше, чем у женщин при одном и том же возрасте мужчины и женщины на 10,32$.

 

Задание №2

Изучается зависимость выработки продукции на одного работника у (тыс. д.ед.) от ввода в действие новых основных фондов х1 (% стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих х2 (%).

Номер предприятия у х1 х2
    3,9 3,9 3,7 4,0 3,8 4,8 5,4 4,4 5,3 6,8 6,0 6,4 6,8 7,2 8,0 8,2 8,1 8,5 9,6 9,0  
средние 9,6 6,19 22,3

Определить средние коэффициенты эластичности, частные коэффициентов корреляции.

 

Методические указания по выполнению задания:

Средние коэффициенты эластичности определяются по формуле:

Для данного уравнения множественной регрессии (построенном на предыдущем занятии) получим:

С увеличением основных фондов на 1% выработка продукции на одного работника увеличивается на 0,609% при устранении влияния действия удельного веса рабочих высокой квалификации в общей численности рабочих. С увеличением удельного веса рабочих высокой квалификации в общей численности рабочих на 1% выработка продукции на одного работника увеличивается на 0,199% при устранении влияния основных фондов.

Линейные коэффициенты частной корреляции рассчитываются по рекуррентной формуле:

Сравнивая полученные результаты, видно, что более сильное воздействие на выработку продукции оказывает действие новых основных фондов.

Лабораторная работа №8

Тема: Статистическая значимость коэффициентов линейной регрессии.

Содержание занятия:

1. Оценить практическую значимость уравнения множественной регрессии через индекс множественной корреляции

2. Оценка значимости уравнения множественной регрессии по F-критерию Фишера.

Литература: [1] стр129-141, [3] стр159-163, [4]стр85-86

Задание Изучается зависимость выработки продукции на одного работника у (тыс. д.ед.) от ввода в действие новых основных фондов х1 (% стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих х2 (%).

Номер предприятия у х1 х2
    3,9 3,9 3,7 4,0 3,8 4,8 5,4 4,4 5,3 6,8 6,0 6,4 6,8 7,2 8,0 8,2 8,1 8,5 9,6 9,0  
средние 9,6 6,19 22,3

1. Определить линейный коэффициент множественной корреляции. Сделайте вывод.

2. Провести оценку значимости уравнения множественной регрессии по F-критерию Фишера.

1. Линейный коэффициент множественной корреляции определяется следующим образом:

Зависимость y от х1 и х2 характеризуется как тесная.

 

2. Общий F-критерий проверяет гипотезу о статистической значимости уравнения регрессии и показателя тесноты связи:

Табличное значение F-критерия составляет 3,59 (приложение 2). Так как фактическое значение F-критерия Фишера превышает табличное значение, то можно сделать вывод о статистической значимости и надежности построенного уравнения множественной регрессии.

Лабораторная работа №9

Тема: Нелинейные эконометрические модели.

Содержание занятия:

1. Определение параметров нелинейной регрессии.

2. Оценка качества построенной модели нелинейной регрессии.

Литература: [1] стр62-87, [3] стр115-129, [4] стр77-81

 

Задание Имеются следующие исходные данные:

Предприятие Выпуск продукции, тыс.ед., х Затраты на производство, млн. тенге, у
     

1. Для характеристики зависимости у от х рассчитать параметры равносторонней гиперболы.

2. Оценить построенную модель через среднюю ошибку аппроксимации

 

Методические указания по выполнению задания:

Уравнение равносторонней гиперболы линеаризуется при замене . Тогда уравнение примет вид . Для определения параметров уравнения необходимо провести следующие расчеты:

x y z=1/х yz z2 y2 yx y-yx (y-yx)2 Ai
              -2.43 32.43 1051.8 108.1
      0.25 37.5 0.06   142.4 7.61 57.9179 5.074
      0.33 33.33 0.11   126.3 -26.3 691.605 26.3
      0.5   0.25   94.12 -24.12 581.578 34.45
      0.33 33.33 0.11   126.3 -26.3 691.605 26.3
      0.2   0.04     27.96 781.518 15.53
      0.17   0.03   158.5 51.52 2654.22 24.53
      0.25 37.5 0.06   142.4 7.61 57.9179 5.074
      0.33 33.33 0.11   126.3 -26.3 691.605 26.3
      0.5   0.25   94.12 -24.12 581.578 34.45
итого     3.87   2.03       7841.35 306.1
среднее 3.3   0.39 34.6 0.2       784.135 30.61

 

Параметры уравнения равносторонней гиперболы определяются следующим образом:

Уравнение равносторонней гиперболы имеет следующий вид:

Индекс корреляции: - связь между рассматриваемыми признаками очень тесная.

Средняя ошибка аппроксимации составила 30,61; поэтому качество построенной модели оценивается как плохое.

Лабораторная работа №10

Тема: Гетероскедастичность

Содержание занятия.

Применение тестов для оценки гетероскедастичности.

Литература: [1] стр155-169, [3] стр200-216, стр262-282

 

Задание Оценить регрессионную зависимость выпуска продукции обрабатывающей промышленности на душу населения у от валового внутреннего продукта на душу населения х для 17 стран. Исходные данные (усл.ед):

у х у х
           
           
           
           
           
           
           
           
           

На основе данных с помощью обычного МНК оценить регрессии для шести стран с наименьшими значениями показателя х и для шести стран с наибольшими значениями этого показателя.

 

Методические указания по выполнению задания:

Для установления явления гетероскедастичности существуют ряд тестов:

1) тест Голдфелда-Кванта; 2) тест ранговой корреляции Спирмена; 3) тест Уайта; 4) тест Глезера; 5) тест Парка.

Наиболее популярным является тест Голдфелда-Кванта. Данный тест используется для проверки следующего типа гетероскедастичности: когда среднее квадратическое отклонение случайной составляющей пропорционально значению признака-фактора хi в том наблюдении, т.е. .

Тест Голдфелда-Кванта состоит в следующем:

1) упорядочение п наблюдений по мере возрастания переменной х;

2) исключение из рассмотрения С центральных наблюдений; при этом (п-С):2>р, где р – число оцениваемых параметров;

3) разделение совокупности из (п-С) наблюдений на две группы соответственно с малыми и большими значениями фактора х и определение по каждой из групп уравнений регрессий;

4) определение остаточной суммы квадратов для первой и для второй S2 групп и нахождения их отношения R=S1:S2 (или R=S2:S1, в числителе должна быть наибольшая из сумм квадратов отклонений). При выполнении нулевой гипотезы о гомоскедастичности отношение R будет удовлетворять F -критерию со степенями свободы ((п-С-2р):2) для каждой остаточной суммы квадратов. Чем больше величина R превышает табличное значение F -критерия, тем больше нарушена предпосылка о равенстве дисперсий остаточных величин (если Fтабл > Fкр, то гетероскедастичность имеет место).

Применим тест Голдфелда-Кванта. Суммы квадратов отклонений составляют S1=229, S2=9804. При этом S2:S1=9804:229=42,8. Критическое значение Fкр =6,39, при 5-% уровне значимости. Поскольку F= 42,8 > Fкр =6,39, то нулевая гипотеза об отсутствии гетероскедастичности отклоняется.

 

Лабораторная работа № 11

Тема: Динамический ряд.

Содержание занятия.

1. Расчет автокорреляции уровней временного ряда.

2. Расчет параметров трендов.

Литература: [1] стр234-239,[2] стр138-139

 

Задание №1 Имеются условные данные о средних расходах на конечное потребление (усл. д.ед.) за 8 лет:

t                
yt                

Рассчитать коэффициент автокорреляции первого порядка.

 

Методические указания по выполнению задания:

Расходы на конечное потребление в текущем году зависят от расходов на конечное потребление предыдущих лет, поэтому определим коэффициент корреляции между рядами

yt и yt-1 и измерим тесноту связи между расходами на конечное потребление текущего и предыдущего годов. Формула для расчета коэффициента корреляции имеет вид:

В качестве переменной х рассмотрим ряд y2, y3,…, y8; в качестве переменной y - ряд y1, y2,… y7. Тогда приведенная формула примет вид:

где

Заполним таблицу:

t yt yt-1
    - - -3,29 -3,29 -1,29 -0,29 0,71 2,71 4,71 - -3 -2 -2 - 9,87 6,58 2,58 0,00 0,71 5,42 18,84 - 10,8241 10,8241 1,6641 0,0841 0,5041 7,3441 22,1841 -
итого           53,4287  

 

где .

Используя формулу, получаем коэффициент автокорреляции первого порядка:

Полученное значение свидетельствует об очень тесной зависимости между расходами на конечное потребление текущего и непосредственно предшествующих годов и, следовательно, о наличии во временном ряде сильной линейной тенденции. Аналогично можно определить коэффициенты автокорреляции второго и более высоких порядков.

Задание №2. Имеются данные об урожайности овощей в хозяйствах области:

Год Урожайность овощей, ц/га
  49,2 41,7 46,0 67,3 69,0 73,6 85,8 92,4 98,4 94,4

1. Построить графики ряда динамики и трендов.

2. Рассчитать параметры уравнений трендов.

3. Выбрать наилучший вид тренда на основании графического изображения и значения коэффициента детерминации.

Методические указания по выполнению задания:

Построение графиков осуществляется с помощью Мастера диаграмм:

1) введите исходные данные;

2) активизируйте Мастер диаграмм: в главном меню выберите Вставка/Диаграмма

3) в окне Тип выберите График. Щелкните по кнопке Далее.

4) Заполните диапазон данных. Установите флажок размещения данных в столбцах (строках). Щелкните по кнопке Далее.

5) Заполните параметры диаграммы на разных закладках: названия диаграммы и осей; подписи данных и др. Укажите место размещения диаграммы на отдельном или на имеющемся листе. Щелкните по кнопке Готово.

Линия тренда может быть добавлена в построенный график. Для этого:

1) выделите область построения диаграммы; в главном меню выберите Диаграмма/Добавить линию тренда;

2) в появившемся диалоговом окне выберите вид линии тренда и задайте соответствующие параметры. Для полиномиального тренда необходимо задать степень аппроксимирующего полинома. В качестве дополнительной информации на диаграмме следует отобразить уравнение регрессии и значение коэффициента детерминации, установив соответствующие флажки на закладке Параметры. Щелкните по кнопке ОК.

Для вышеприведенных исходных данных получены следующие уравнения трендов и значения коэффициента детерминации .

 

Тип тренда Уравнение
Линейный 0,9206
Полиномиальный второй степени 0,922
Степенной 0,8034
Экспоненциальный или 0,8846
Логарифмический 0,8063

Исходные данные лучше всего описывает полином второй степени. Следовательно, в рассматриваемом примере для расчета прогнозных значений следует использовать полиномиальное уравнение.

 

Лабораторная работа №12

Тема: Динамический ряд.

Содержание занятия.

1.Построение аддитивной и мультипликативной моделей временного ряда.

2.Прогнозирование по аддитивной и мультипликативной моделям.

Литература: [1] стр239-255,[2] стр137

Задание Пусть имеются поквартальные данные о прибыли компании за 3 года.

Год Квартал
I II III IV
         

Построить мультипликативную модель временного ряда и сделать прогноз на последующие два квартала.

Методические указания по выполнению задания:

Для построения мультипликативной модели временного ряда необходимо:

1) Провести выравнивание временного ряда методом скользящей средней.

2) Найти оценки сезонной компоненты как частное от деления фактических уровней ряда на центрированные скользящие средние (графа 5).

Расчет оценок сезонной компоненты в мультипликативной модели

№ квартала, t Прибыль, Yt Скользящая средняя за 4 квартала Центрированная скользящая средняя Оценка сезонной компоненты
    - 81,5 81,0 79,0 76,5 75,0 73,0 70,0 67,0 64,5 - - - - 81,25 80,00 77,75 75,75 74,00 71,50 68,50 65,75 - - - - 1,108 0,800 0,900 1,215 1,081 0,811 0,905 1,217 - -

Найденные оценки используются для расчета сезонной компоненты S. Для этого находятся средние за каждый квартал оценки сезонной компоненты Si. Взаимопогашаемость сезонных воздействий в мультипликативной модели выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна числу периодов в цикле (в примере равно 4).

Расчет сезонной компоненты

Показатели Год № квартала
I II III IV
    - 0,900 0,905 - 1,215 1,217 1,108 1,081 - 0,800 0,811 -
Итого за квартал   1,805 2,432 2,189 1,611
Средняя оценка сезонной компоненты   0,9025 1,216 1,0945 0,8055
Скорректированная сезонная компонента, Si   0,8983 1,2104 1,0895 0,8018

Имеем: 0,9025+1,216+1,0945+0,8055=4,0185.

Определим корректирующий коэффициент: k= 4:4,0185=0,9954. Определим скорректированные значения сезонной компоненты, умножив её средние оценки на корректирующий коэффициент

3) Разделим каждый уровень исходного ряда на соответствующие значения сезонной компоненты. Получим величины T*E=Yt/Si, которые содержат только тенденцию и случайную компоненту.

Расчет выравненных значений Т и ошибок в мультипликативной модели

t Yt Si T*E=Yt/Si T T*S E=Yt-(T*S) E2
    0,8983 1,2104 1,0895 0,8018 0,8983 1,2104 1,0895 0,8018 0,8983 0,2104 1,0895 0,8018 80,15 82,62 82,61 79,92 77,92 76,01 73,43 72,34 69,02 66,09 62,41 59,86 94,94 82,87 80,79 78,71 76,64 74,56 72,48 70,41 68,33 66,25 64,17 62,10 0,943 0,996 1,022 1,014 1,016 1,019 1,013 1,027 1,010 0,997 0,972 0,964 -4,306 -0,304 1,977 0,886 1,155 1,749 1,026 1,546 0,617 -0,195 -1,923 -1,793 18,545 0,092 3,908 0,784 1,334 3,062 1,054 2,390 0,381 0,038 3,698 3,217

4) Определить компоненту Т. Для этого рассчитываются параметры линейного тренда, используя уровни (Т*Е). Уравнение тренда имеет следующий вид: Т=87,022-2,076t. Подставляя в это уравнение значения t=1,2,…12 найти уровни Т для каждого момента времени.

5) Найти уровни временного ряда, умножив уровни Т на значения сезонной компоненты для соответствующих кварталов.

6) Расчет ошибки в мультипликативной модели производится по формуле E=Yt-(T*S) (графа 7).

Пусть необходимо дать прогноз прибыли в течение первого полугодия следующего года. Прогнозное значение Ft уровня временного ряда в мультипликативной модели есть произведение трендовой и сезонной компоненты. Для определения трендовой компоненты следует воспользоваться уравнением тренда Т=87,022-2,076t.

Т13=87,022-2,076*13=60,034.

Т14=87,022-2,076*14=57,958.

Значения сезонной компоненты S1=0,8983; S2=1,2104.

F13= Т13* S1=60,034*0,8983=53,928

F14= Т14* S2=57,958*1,2104=70,152

Прогноз ожидаемой прибыли компании на первое полугодие составит: 53,928+70,152=124,080 тыс. у.ед.

Лабораторная работа № 13

Тема: Динамический ряд.

Содержание занятия.

1. Применение методов исключения тенденции.

2. Автокорреляция в остатках. Расчет критерия Дарбина-Уотсона.

Литература: [1] стр263-278, [2] стр139-140

 

Задание. По данным за 18 месяцев построено уравнение регрессии зависимости прибыли предприятия у (млн. тенге) от цен на сырьё х1 (тыс. тенге за 1т) и производительности труда х2 (ед. продукции на 1 работника): . При анализе остаточных величин были использованы значения, приведенные в следующей таблице:

у х1 х2
       
       
       
 

.

Требуется:

1) по трем позициям рассчитать .

2) рассчитать критерий Дарбина-Уотсона.

3) оценить полученный результат при 5-% уровне значимости.

Методические указания по выполнению задания:

1) определяется путем подстановки фактических значений х1 и х2 в уравнение регрессии:

; ;

Остатки рассчитываются по формуле: .

Следовательно, ; .

Результаты вычислений оформим в таблицу:

      - - -  
             
    -50   -70    
... .... .... .... .... .... ....
           

2) Критерий Дарбина-Уотсона рассчитывается по формуле:

3) Фактическое значение d сравниваем с табличными значениями при 5-% уровне значимости. При п=18 месяцев и т=2 (число факторов) нижнее значение равно 1,05, а верхнее – 1,53. Так как фактическое значение d близко к 4, то можно считать, что автокорреляция в остатках характеризуется отрицательной величиной. Чтобы проверить значимость отрицательного коэффициента автокорреляции, найдем величину:

4 - d=4-3,81=0,19,

что значительно меньше, чем . Это означает наличие в остатках автокорреляции.

 

Лабораторная работа №14



Поделиться:


Последнее изменение этой страницы: 2016-04-23; просмотров: 474; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.218.254.122 (0.095 с.)