Тест на обнаружение автокорреляции 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Тест на обнаружение автокорреляции



Одной из предпосылок регрессионного анализа является независимость случайного члена в любом наблюдении от его значений во всех других наблюдениях. Если данное условие не выполняется, то говорят, что случайный член подвержен автокорреляции. В этом случае коэффициенты регрессии, полученные по МНК, оказываются неэффективными, хотя и несмещенными, а их стандартные ошибки рассчитываются некорректно.

Автокорреляция обычно встречается при использовании данных временного ряда. Стационарные временные ряды, это ряды, вероятностные свойства которых не изменяются во времени. Стационарные временные ряды применяются, в частности, при описании случайных составляющих анализируемых рядов.

Временной ряд yi (i = 1, 2, …, n) называется строго стационарным (или стационарным в узком смысле), если совместное распределение вероятностей n наблюдений y1, y2, …, yn такое же, как и n наблюдений при любых n, i, t. Другими словами, свойства строго стационарных рядов yi не зависят от i, т.е. от момента времени. Напомним, что в случае пространственной выборки отсутствие автокорреляции постулируется.

 

Тест Дарбина-Уотсона определяет наличие автокорреляции между соседними членами ряда.

Выдвигается нулевая гипотеза об отсутствии корреляции первого порядка, т.е. H0: r =0, где r – коэффициент корреляции между двумя соседними случайными членами Еi и Еi-1;

В качестве альтернативной гипотезы может выступать либо H1: r >0, либо H2: r < 0.

Соответствующей оценкой коэффициента корреляции r является коэффициент автокорреляции остатков первого порядка, который при достаточно большом числе наблюдений имеет вид:

Введем величину . Очевидно,

Естественно, что в случае отсутствия автокорреляции выборочный коэффициент r 1 окажется не сильно отличающимся от нуля, а значение статистики d будет близко к 2. Близость наблюдаемого значения к нулю должна означать наличие положительной автокорреляции, к четырем – отрицательной.

Тест Дарбина-Уотсона имеет один существенный недостаток – распределение статистики d зависит не только от числа наблюдений, но и от значений регрессоров xj (j =1, …, p). Это означает, что тест Д-У, вообще говоря, не представляет собой статистический критерий, в том смысле, что нельзя указать критическую область, которая позволяла бы отвергнуть гипотезу об отсутствии корреляции, если бы оказалось, что в эту область попало наблюдаемое значение статистики d. Однако, существуют два пороговых значения dВ и dН, зависящие только от числа наблюдений, числа регрессоров и уровня значимости, такие, что выполняются следующие условия.

Если фактически наблюдаемое значение d:

1. dB<d<4-dB, то гипотеза об отсутствии автокорреляции принимается;

2. dН<d<dB или 4- dB<d<4-dН, то вопрос об отвержении или принятии гипотезы остается открытым (область неопределенности критерия);

3. 0<d<4-dН, то принимается альтернативная гипотеза о положительной автокорреляции;

4. 4-dН<d<4, то принимается альтернативная гипотеза об отрицательной автокорреляции. Рис. 6. Границы значимости.

Для d – статистики найдены dB и dН границы на различных уровнях значимости и помещены в таблицу.

Недостатками критерия Д-У является:

1) Наличие области неопределенности критерия;

2) Критические значения d – статистики определены для объемов выборки не менее 15. В этом смысле при n = 6, 7, 8 результаты недостоверны даже для парной регрессии;

3) Методика расчета и использование критерия Д-У направлена только на выявление автокорреляции остатков первого порядка.

 

ПРИМЕР РЕШЕНИЯ ЗАДАЧИ

Задание 5.

Имеются данные об объемах потребления электроэнергии жителями региона в млн кВт*ч за 16 кварталов. (Таблица 24)

Таблица 24. Исходные данные к Задаче 5.

t
  6,0 - - - -
  4,4 6,0 - - -
  5,0 4,4 6,0 - -
  9,0 5,0 4,4 6,0 -
  7,2 9,0 5,0 4,4 6,0
  4,8 7,2 9,0 5,0 4,4
  6,0 4,8 7,2 9,0 5,0
  10,0 6,0 4,8 7,2 9,0
  8,0 10,0 6,0 4,8 7,2
  5,6 8,0 10,0 6,0 4,8
  6,4 5,6 8,0 10,0 6,0
  11,0 6,4 5,6 8,0 10,0
  9,0 11,0 6,4 5,6 8,0
  6,6 9,0 11,0 6,4 5,6
  7,0 6,6 9,0 11,0 6,4
  10,8 7,0 6,6 9,0 11,0

Задание. Построить модель временного ряда.

Решение.

Нанесем значения на график.

Рис.7. Спецификация модели временного ряда.

По графику можно установить наличие приблизительно постоянной амплитуды колебаний. Это свидетельствует о возможности построения аддитивной модели временного ряда.

Определим коэффициент автокорреляции первого порядка.

Он составит

Это значение свидетельствует о слабой зависимости текущих уровней ряда от непосредственно предшествующих им уровней.

Однако, как следует из графика, каждый следующий уровень зависит от уровней и в гораздо большей степени, чем от уровня

Рассчитав коэффициент автокорреляции второго порядка.

Продолжив расчеты, получим автокорреляционную функцию этого ряда (Таблица 25)

Таблица 25. Коррелограмма временного ряда Задания 5.

Лаг Коэффициент автокорреляции уровней Коррелограмма
  0,165154 **
  0,566873 ******
  0,113558 *
  0,983025 ************
  0,118711 *
  0,722046 *******
  0,003367  
  0,973848 ************

 

Анализ значений автокорреляционной функции позволяет сделать вывод о наличии в изучаемом временном ряде сезонных колебаний периодичностью в четыре квартала, т.к. =0,983.

Рассчитаем компоненты аддитивной модели.

Шаг 1. Проведем выравнивание исходных уровней ряда методом скользящей средней. Для этого:

· просуммируем уровни ряда последовательно за каждые четыре квартала со сдвигом на один момент времени и определим условные годовые объемы потребления электроэнергии (столбец 3 таблицы 26);

· разделив полученные суммы на 4, найдем скользящие средние (столбец 4 таблицы 26). Отметим, что полученные таким образом вы­равненные значения уже не содержат сезонной компоненты;

· приведем эти значения в соответствие с фактическими моментами времени, для чего найдем средние значения из двух последовательных скользящих средних — центрированные скользящие средние (столбец 5 табл. 26).

 

Таблица 26. Расчет оценок сезонной компоненты аддитивной модели

Номер квартала, t Потребле- ние элект-роэнергии, Итого за четыре квартала Скользящая средняя за четыре квартала Центриро- ванная скользящая средняя Оценка сезонной компоненты
           
  6,0 - - - -
  4,4 - - - -
  5,0 24,4 6,10 6,250 -1,250
  9,0 25,6 6,40 6,450 2,550
  7,2 26,0 6,50 6,625 0,575
  4,8 27,0 6,75 6,875 -2,075
  6,0 28,0 7,00 7,100 -1,100
  10,0 28,8 7,20 7,300 2,700
  8,0 29,6 7,40 7,450 0,550
  5,6 30,0 7,50 7,625 -2,025
  6,4 31,0 7,75 7,875 -1,475
  11,0 32,0 8,00 8,125 2,875
  9,0 33,0 8,25 8,325 0,675
  6,6 33,6 8,40 8,375 -1,775
  7,0 33,4 8,35 - -
  10,8 - - - -

· Шаг 2. Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда и центрированными скользящими средними (столбец 6 таблица 26).

Используем эти оценки для расчета значений сезонной компоненты S (таблица 27). Для этого найдем средние за каждый квартал (по всем годам) оценки сезонной компоненты .

Таблица 27. Расчет значений сезонной компоненты в аддитивной модели

  Показатель     Год Номер квартала, i
I II III IV
    - - -1,250 2,550
    5,575 -2,075 -1,100 2,700
    0,550 -2,025 -1,475 2,875
    0,675 -1,775 - -
Итого за i-й квартал (за все годы) × 1,800 -5,875 -3,825 8,125
Средняя оценка сезонной компоненты для i-го квартала, × 0,600 -1,958 -1,275 2,708
Скорректированная сезонная компонента, × 0,581 -1,977 -1,294 2,690

 

Для данной модели имеем:

Определим корректирующий коэффициент:

Рассчитаем скорректированные значения сезонной компоненты как разность между ее средней оценкой и корректирующим коэффициентом k:

где i=1:4

Таким образом, получены следующие скорректированные значения сезонной компоненты:

I квартал: = 0,581;

II квартал: = 1,977;

III квартал: = ,294;

IV квартал: = 2,690.

Проверим условие равенства нулю суммы значений сезонной компоненты:

Занесем полученные данные в таблицу 27 для соответствующих кварталов каждого года.

Шаг 3. Исключим влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного временного ряда. Получим величины Т+ Е= Y— S (столбец 4 таблица 28). Эти значения рассчитываются за каждый момент времени и содержат только тенденцию и случайную компоненту.

Таблица 28. Расчет выравненных значений T и ошибок E

t T + E = = T T+S E = (T+S)
               
  6,0 0,581 5,419 5,902 6,483 -0,483 0,2333
  4,4 -1,977 6,337 6,088 4,111 0,289 0,0835
  5,0 -1,294 6,294 6,275 4,981 0,019 0,0004
  9,0 2,690 6,310 6,461 9,151 -0,151 0,0228
  7,2 0,581 6,619 6,648 7,229 -0,029 0,0008
  4,8 -1,977 6,777 6,834 4,857 -0,057 0,0032
  6,0 -1,294 7,294 7,020 5,727 0,273 0,0745
  10,0 2,690 7,310 7,207 9,896 0,104 0,0108
  8,0 0,581 7,419 7,393 7,974 0,026 0,0007
  5,6 -1,977 7,577 7,580 5,603 -0,030 0,0009
  6,4 -1,294 7,694 7,766 6,472 -0,072 0,0052
  11,0 2,690 8,310 7,952 10,642 0,358 0,1282
  9,0 0,581 8,419 8,139 8,720 0,280 0,0784
  6,6 -1,977 8,577 8,325 6,348 0,252 0,0635
  7,0 -1,294 8,294 8,519 7,218 -0,218 0,0475
  10,8 2,690 8,110 8,698 11,388 -0,588 0,3457
116,80 0,00 116,76 116,81 116,80 -0,03 1,10

 

Шаг 4. Определим компоненту Т данной модели. Для этого проведем аналитическое выравнивание ряда + Е) аналогично парной регрессии.

 

Рис. 8. Выбор вида тренда.

Для упрощения расчетов, выберем линейный тренд, т.к. его также имеет высокое значение.

 

Результаты аналитического выравнивания следующие:

Константа………………………………………………..………….5,715416

Коэффициент регрессии……… ………………………………...0,186421

Стандартная ошибка коэффициента регрессии………………....0,015188

R-квадрат............................................................................................0,914971

Число наблюдений.............................................................................16

Число степеней свободы....................................................................14

Таким образом имеем линейный тренд: .

Подставив в это уравнение значения t = 1,...,16, найдем уровни T для каждого момента времени (столбец 5 таблица 28)

Шаг 5. Найдем значения уровней ряда, полученные по аддитивной модели.

Для этого прибавим к уровням T значения сезонной компоненты для соответствующих кварталов (столбец 6 таблица 28).

Шаг 6. В соответствии с методикой построения аддитивной модели расчет ошибки производится по формуле:

Численные значения абсолютных ошибок приведены в столбце 7 табл. 28.

По аналогии с парной моделью регрессии для оценки качества построения модели или для выбора наилучшей модели можно применять сумму квадратов полученных абсолютных ошибок. Для данной аддитивной модели сумма квадратов абсолютных ошибок равна 1,10 (столбец 8 таблица 28).

По отношению к общей сумме квадратов отклонений уровней ряда от его среднего уровня, равной 67,12, эта величина составляет чуть более 1,6%:

Следовательно, можно сказать, что аддитивная модель объясняет 98,4% общей вариации уровней временного ряда потребления электроэнергии за последние 16 кварталов.

 

ЗАДАЧИ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ.

Задачи для самостоятельного решения

Задание 6.

Имеются поквартальные данные по розничному товарообороту.

Таблица 29. Исходные данные к Заданию 6.

Номер квартала Товарооборот, % к предыдущему периоду Номер квартала Товарооборот, % к предыдущему периоду
1 100 11 98,9
2 93,9 12 101,9
3 96,5 13 113,1
4 101,8 14 98,4
5 107,8 15 97,3
6 96,3 16 102,1
7 95,7 17 97,6
8 98,2 18 83,7
9 104 19 84,3
10 99 20 88,4

Задание:

  1. Постойте график временного ряда.
  2. Постройте аддитивную и мультипликативную модель временного ряда.
  3. Оцените качество моделей через показатели средней абсолютной ошибки и среднего относительного отклонения.

Задание 7.

Имеются даны об объеме экспорта из Российской Федерации (млрд долл.)

Таблица 30. Исходные данные к Заданию 7.

Номер квартала Экспорт, млрд долл., цены ФОБ Номер квартала Экспорт, млрд долл., цены ФОБ
1 4087 13 6975
2 4737 14 6891
3 5768 15 7527
4 6005 16 7971
5 5639 17 5875
6 6745 18 6140
7 6311 19 6248
8 7107 20 6041
9 5741 21 4626
10 7087 22 6501
11 7310 23 6284
12 8600 24 6707

Задание:

  1. Построить график временного ряда.
  2. Построить аддитивную и мультипликативную модель временного ряда.
  3. Оценить качество каждой модели через показатели средней абсолютной ошибки среднего относительного отклонения. Выберете лучшую модель.

 

 

ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ.

Провести эконометрическое исследование данных, характеризующих один объект за ряд последовательных моментов (периодов) времени. Построить модель (аддитивную или мультипликативную) временного ряда на основе реальных статистических данных, полученных из официальных источников статистической информации (Государственного комитета статистики РФ, международных финансовых организаций и др.).

 

*- По результатам проведенного эконометрического исследования подготовить научную статью для публикации в периодических научных изданиях.

ЛИТЕРАТУРА:

1. Практикум по эконометрике: Учеб. пособие / И.И. Елисеева, С.В. Курышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. – 2–е изд., перераб. и доп. – М.: Финансы и статистика, 2014. – 344 с.

2. Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2 т. 2–у изд., испр. – Т. 2: Айвазян С.А. Основы эконометрики. – М.: ЮНИТИ–ДАНА, 2015. – 432 с.

3. Чураков Е.П. Прогнозирование эконометрических временных рядов: учеб. пособие / Е.П. Чураков. – М.: Финансы и статистика, 2014. – 208 с.

4. Эконометрика: учеб. / под ред. д–ра экон. наук, проф. В.С. Мхитаряна. – М.: Проспект, 2014. – 384 с.

5. Эконометрика: учеб. / под ред. И.И. Елисеевой. – М.: Проспект, 2015. – 288 с.

6. Эконометрика: Учебник/И.И. Елисеева, С.В. Курышева, Т.В. Костеева и др., Под ред. И.И. Елисеевой. – 2–е изд., перераб. и доп. – М.: Финансы и статистика, 2015. – 576 с.



Поделиться:


Последнее изменение этой страницы: 2017-02-21; просмотров: 468; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.46.36 (0.058 с.)