Интегрирование ряда (взятие разностей) 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Интегрирование ряда (взятие разностей)



Рассчитаем первые разности ряда в новой переменной (рис. 30):

– Name: d1_Y

– Comment: Первые разности ряда

– Formula: SELECT(Y;date)-LAG(SELECT(Y;date);1)

Сделаем дескриптивный анализ новой переменной d1_Y: «Describe» => «Time Series» => «Descriptive Methods…» (Рис. 31).

Рис. 30 Ввод новой переменной - первые разности ряда в новой переменной

 

Рис. 31 Диалоговое окно процедуры описательных статистик для первых разностей

 

Графики из процедуры приводятся на Рис. 32, 33, 34.

Судя по графику, среднее после интегрирования стало постоянным. Графики АКФ и ЧАКФ соответствуют процессу «белый шум», поскольку ни один коэффициент не является значимым.

Рис. 32 График динамики первых разностей

Рис. 33 График АКФ для первых разностей (перед резким ростом)

 

Рис. 34 График ЧАКФ для первых разностей (перед резким ростом)

 

Протестировать автокорреляционную функцию на значимость можно с помощью теста Бокса-Пирса из раздела отчета «Tests for Randomness» (Врезка 4). Поскольку P-значение (P-Value) для этого теста 0,80 > 0,05, принимается нулевая гипотеза: АКФ незначима до 24 лага включительно.

 

Врезка 4. Тест Бокса-Пирса для первых разностей ряда

Tests for Randomness of d1_Y

(3) Box-Pierce Test

Test based on first 24 autocorrelations

Large sample test statistic = 17,984

P-value = 0,803784

Еще раз проведем тесты на постоянство дисперсии и среднего ряда, теперь для первых разностей. Меню «Compare» => «Two Samples» => «Independent Samples…» (рис. 35)

Рис.35 Диалоговое окно процедуры проверки гипотез для первых разностей

 

Результаты теста на постоянство дисперсии даны во Врезке 5.

Нулевая гипотеза о постоянстве дисперсии принимается, поскольку

P-значение ≈ 1,11962E-7 < 0,05. Принимаем нулевую гипотезу: дисперсия ряда после интегрирования является не постоянной.

В настройках теста на постоянстве среднего нужно поставить флажок «Assume Equal Differences». Результат приводится во Врезке 6.

Нулевая гипотеза принимается (среднее постоянно), так как P-значение ≈ 0,23 > 0,05.

 

Врезка 5. Тест на постоянство дисперсии для первых разностей ряда

Comparison of Standard Deviations for d1_Y

Тест на постоянство дисперсии

Нулевая гипотеза: дисперсия в начале ряда равна дисперсии в конце, т.е. постоянна

Альтернативная гипотеза: дисперсия не постоянна

Comparison of Standard Deviations for d1_Y

  SH=1 SH=2
Standard deviation 0,365545 0,676699
Variance 0,133623 0,457921
Df    

Ratio of Variances = 0,291804

 

95,0% Confidence Intervals

Standard deviation of SH=1: [0,312768; 0,439917]

Standard deviation of SH=2: [0,605407; 0,767182]

Ratio of Variances: [0,195512; 0,448887]

 

F-test to Compare Standard Deviations

Null hypothesis: sigma1 = sigma2

Alt. hypothesis: sigma1 NE sigma2

F = 0,291804 P-value = 1,11962E-7

Reject the null hypothesis for alpha = 0,05.

P-Value > α (α = 0.05), следовательно нулевая гипотеза отвергается (дисперсия не постоянна)

 

Врезка 6. Тест на постоянство среднего для первых разностей ряда

Comparison of Means for d1_Y

Тест на постоянство среднего

Нулевая гипотеза: среднее в начале ряда равно среднему в конце, т.е. постоянно

Альтернативная гипотеза: среднее ряда не постоянно

95,0% confidence interval for mean of SH=1: -0,0408824 +/- 0,0884809 [-0,129363; 0,0475985]

95,0% confidence interval for mean of SH=2: 0,0461871 +/- 0,113491 [-0,0673041; 0,159678]

95,0% confidence interval for the difference between the means

not assuming equal variances: -0,0870694 +/- 0,142993 [-0,230063; 0,0559239]

 

t test to compare means

Null hypothesis: mean1 = mean2

Alt. hypothesis: mean1 NE mean2

not assuming equal variances: t = -1,20059 P-value = 0,231308

Do not reject the null hypothesis for alpha = 0,05.

P-Value > α (α = 0.05), следовательно нулевая гипотеза не отвергается (среднее постоянно)

Таким образом, в результате анализа временного ряда «Цена закрытия акций компании NVIDIA Corporation» удалось нам установить, что:

1. Для моделирования стоит использовать все имеющиеся значения с 20.04.2015 по 12.02.2016, поскольку кардинальных изменений не происходило.

2. Значения ряда не содержат тенденцию. Взятие первых разностей позволяет сделать среднее постоянным. Следовательно, в моделях ARIMA(p, d, q), которые будем строить для ряда далее, параметр d = 1.

3. АКФ для первых разностей ряда не содержит значимых коэффициентов автокорреляции. Следовательно, в моделях ARIMA(p, d, q) параметр q = 0 (лаг у последнего значимого коэффициента АКФ).

4. ЧАКФ для первых разностей ряда не содержит значимых коэффициентов частной автокорреляции. Следовательно, в моделях ARIMA(p, d, q) параметр p = 0 (лаг у последнего значимого коэффициента ЧАКФ).

 

Построение моделей ARIMA

Оценку параметров и расчет характеристик качества моделей проведем в процедуре: «Forecast» à «Automatic Model Selection…». (рис. 36,37)

Рис. 36 Процедура автоматического подбора модели

 

Прогноз будем строить на основе всех 208 наблюдений. Укажем, что нужно построить прогнозы на 3 периода времени вперед в поле «Number of Forecasts» и зададим 3наблюдения для тестовой выборки в поле «Withhold for Validation»

 

Рис.37 Диалоговое окно процедуры автоматического подбора модели

 

Процедура строит по умолчанию большое количество различных видов моделей. Оставим только модели ARIMA и установим максимальные значения параметров p, d, q. Щелчок правой кнопкой мыши в любом разделе отчета по процедуре à «Analysis Options…» откроет настройки видов моделей. Оставим флажки только у ARIMA и введем значения в поля:

– AR Terms, Max Order p: 0;

– MA Terms, Max Order q: 0;

– Differencing, Max Order d: 1;

– Differencing, Флажок «Include Constant».

После чего процедура оценит параметры всех вариантов моделей ARIMA с параметрами p, d, q от нуля до заданных нами значений, с константами и без. Лучшая, т.е. наиболее точная и простая модель выбирается автоматически по минимальному значению информационного критерия Акаике (AIC). Во Врезке 7 даны таблицы с характеристиками моделей из раздела отчета «Model Comparison».

Ниже приведены таблицы с характеристиками остатков и с ошибками моделей (Врезка 7). В таблицах с ошибками выделены лучшие значения в каждом столбце.

Врезка 7. Тесты остатков и ошибки моделей

Models

Список моделей

(A) ARIMA(0,1,0)

(B) ARIMA(0,1,0) with constant

(C) ARIMA(0,0,0) with constant

Estimation Period

Обучающая выборка

Model RMSE MAE MAPE ME MPE AIC
(A) 0,595533 0,393333 1,55077 0,0166667 0,0435842 -1,0366
(B) 0,596765 0,392941 1,54999 -0,000305958 -0,0258311 -1,02271
(C) 25,5656 25,1744 100,0 25,1744 100,0 6,48249

 

Тесты остатков моделей:

Model RMSE RUNS RUNM AUTO MEAN VAR
(A) 0,595533 OK OK OK OK **
(B) 0,596765 OK OK OK OK **
(C) 25,5656 *** *** *** *** ***

 

RMSE – среднеквадратическая ошибка

MAE – средняя абсолютная ошибка

MAPE – средняя абсолютная процентная ошибка

ME – средняя ошибка

MPE – средняя процентная ошибка

AIC – информационный критерий Акаике

Validation Period

Тестовая выборка

Model RMSE MAE MAPE ME MPE
(A) 0,261662 0,206667 0,806995 0,08 0,307142
(B) 0,256981 0,212325 0,829616 0,0630274 0,240544
(C) 25,4873 25,4867 100,0 25,4867 100,0

 

Key:

RMSE = Root Mean Squared Error

Среднеквадратическая ошибка

RUNS = Test for excessive runs up and down

Критерий нисходящих и восходящих серий

RUNM = Test for excessive runs above and below median

Критерий серий на основе медианы

AUTO = Box-Pierce test for excessive autocorrelation

Тест Бокса-Пирса на автокорреляцию

MEAN = Test for difference in mean 1st half to 2nd half

Тест на постоянство среднего

VAR = Test for difference in variance 1st half to 2nd half

Тест на постоянство дисперсии

OK = not significant (p >= 0,05)

Остатки прошли тест (соответствуют белому шуму)

* = marginally significant (0,01 < p <= 0,05)

Остатки не прошли тест для α = 0,05

** = significant (0,001 < p <= 0,01)

Остатки не прошли тест для α = 0,01

*** = highly significant (p <= 0,001)

Остатки не прошли тест для α = 0,001

 

Модель ARIMA(0, 1, 0) с константой оказалась лучшей по большинству критериев. У нее наименьшие значения средней абсолютной, средней абсолютной процентной ошибок, средней ошибки и средней процентной ошибки на обучающей выборке, а также у нее наименьшие значения среднеквадратической, средней и средней процентной ошибки на тестовой выборке. Также данная модель является ненамного хуже модели ARIMA(0, 1, 0) без константы по результату теста остатков моделей. Поскольку эта модель была признана лучшей процедурой «Automatic Model Selection», все графики в отчете по процедуре относятся именно к ней.

 

Прогноз по лучшей модели

Интервальный прогноз рассчитывается в разделе отчета «Forecast Table» (Рис. 38). Результат показан во Врезке 8.

 

Рис. 38. Включаем расчет интервального прогноза

 

Врезка 8. Интервальный прогноз по модели ARIMA(0, 1, 0) с константой

 

 

    Lower 95,0% Upper 95,0%
Period Forecast Limit Limit
209,0 25,747 24,5704 26,9235
210,0 25,7639 24,1001 27,4278
211,0 25,7809 23,7431 27,8188

 

Таким образом, согласно модели ARIMA(0, 1, 0) с константой, цена закрытия на акцию компании NVDA в момент времени №209 с вероятностью 95% будет лежать в интервале от 24,5704 до 26,9235 долл. США. Фактическое значение составило 26,99 долл. США.

цена закрытия на акцию компании NVDA в момент времени №209 с вероятностью 95% будет лежать в интервале от 24,1001 до 27,4278 долл. США. Фактическое значение составило 27,66 долл. США.

цена закрытия на акцию компании NVDA в момент времени №209 с вероятностью 95% будет лежать в интервале от 23,7431 до 27,8188 долл. США. Фактическое значение составило 30,04 долл. США.

График факта, модели и прогноза показан на Рис. 39.


Рис. 39. График факта, модели и интервального прогноза для лучшей модели

 



Поделиться:


Последнее изменение этой страницы: 2016-08-01; просмотров: 431; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.216.163 (0.032 с.)