Свойства предсказаний, полученных с помощью МНК 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Свойства предсказаний, полученных с помощью МНК



В последующих рассуждениях мы сосредоточимся в основном на пред­сказаниях, а не на прогнозах, и обсудим свойства коэффициентов уравнения регрессии и свойства случайного члена, а не переменной X в случае, когда ее значения неизвестны. И в этом есть положительные моменты. Если значение YT+p порождается тем же процессом, что и выборочные значения переменной Y (т.е. в соответствии с уравнением (11.50), где uT+p удовлетворяет предпосылкам регрессионной модели, и если мы строим наше пред­сказание YT+p с помощью уравнения (11.52), то ошибка предсказания fT+p будет иметь нулевое математическое ожидание и минимальную дисперсию. Первое свойство легко продемонстрировать:­

(11.56)

 

поскольку Е(b1) = β1, Е(b2)= β2 и Е(иT+р) = 0. Мы не будем доказывать свой­ство минимума дисперсии. Доказательство можно найти у Дж. Джонстона и Дж. Динардо (Jonston, Dinardo. 1997). Оба эти свойства сохраняются и для общего случая множественного регрессионного анализа.

В случае уравнения парной регрессии теоретическая дисперсия fT+p опре­деляется как

(11.57)

где и – соответственно выборочное среднее значение и сумма квадратов отклонений переменной X. Из формулы следует, и это неудиви­тельно, что чем больше значение X отклоняется от выборочного среднего, тем больше теоретическая дисперсия ошибки предсказания. Из формулы так же следует, и это вновь неудивительно, что чем больше объем выборки, тем меньше теоретическая дисперсия ошибки предсказания с нижним пре­делом, равным . С ростом объема выборки оценки b1, и b2 стремятся к ис­тинным значениям соответствующих коэффициентов (в случае выполне­ния предпосылок модели), и единственным источником ошибки при пред­сказании будет случайный член uT, а он по определению имеет дисперсию .

Доверительные интервалы для предсказаний

Мы можем получить значение стандартного отклонения для ошибки предсказания, если заменим в уравнении (11.57) на и извлечем квад­ратный корень. Тогда отношение величины (YT+p - ) к стандартной ошибке при оценивании уравнения для периода выборки будет подчинять­ся t-распределению с числом степеней свободы (Т- к). Отсюда мы можем получить доверительный интервал для действительного значения YT+p:

(11.58)

где tкрит — критическое значение t при заданных уровне значимости и числе степеней свободе, а с.о. — стандартная ошибка предсказания. На рис. 11.3 в общем виде показано соотношение между доверительным интервалом для предсказания и значением объясняющей переменной.


В уравнении множественной регрессии выражение, соответствующее (11.57), имеет гораздо более сложный вид, и оно лучше может быть представлено с помощью аппарата матричной алгебры. К счастью, имеется простой прием, который можно использовать для расчета значений стан­дартных ошибок при помощи компьютера. Обозначим период выборки как 1,..., Т, а период предсказания как T+1,..., T+Р. Вы оцениваете уравнение регрессии на выборке, совмещающей выборочный и прогнозный периоды, добавив (различные) фиктивные переменные для каждого из наблюдений периода предсказания. Это означает включение в модель набора фиктив­ных переменных DT+1, DT +2,..., DT+p где значение DT+p, равно нулю для всех наблюдений, кроме наблюдения Т + р, для которого оно равно единице. Как может быть показано, оценки коэффициентов при нефиктивных пере­менных и их стандартные отклонения будут в точности такими же, как и в уравнении регрессии, оцененном только на периоде выборки (см. работы Д. Салкевера (Salkever, 1976) и Ж.-М. Дюфора (Dufour, 1980)). Компьютер использует фиктивные переменные для получения точного соответствия в каждом наблюдении периода предсказания, и он делает это путем прирав­нивания коэффициента при фиктивной переменной к ошибке предсказа­ния, определенной выше. Стандартная ошибка этого коэффициента равна стандартной ошибке предсказания.

Пример

В табл. 11.7 представлены результаты оценивания логарифмической ре­грессии расходов на жилье на показатели дохода и относительных цен,

Таблица 11.7


Dependent Variable LGHOUS

Method: Least Squares

Sample: 1959 2003

Included observations 45


Variable Coefficient Std. Error t-Statistic Prob.
С -0.298460 0.194922 -1.531173 0.1340
LGDPI 1.036576 0.006497 159. 5366 0.0000
LGPRHOUS -0.423765 0.045451 -9.323628 0.0000
D00 -0.041629 0.017210 -2.418867 0.0205
D01 -0.027473 0.017436 -1.575655 0.1234
D02 -0.022256 0.017788 -1.251167 0.2185
D03 -0.030428 0.017893 -1.700556 0.0072
R-squared 0. 998852   Mean dependent var 6. 359334
Adjusted R-squared 0.998670   S.D. dependent var 0.437527
S.E of regression 0. 015955   Akaike info enter -5.296084
Sum squared resid 0. 0096 73   Schwarz criterion -5.015048
Log likelihood 12 6.1619   F-statistic 5508. 485
Durbin-Watson stat 0 802456   Prob(F-statistic) 0.000000

 

с фиктивными переменными D00—D03 для 2000—2003 гг. Коэффициенты при фиктивных переменных показывают ошибки предсказания, указанные в табл. 11.6. Предсказанный логарифм расходов на жилье в 2000 г в табл. 11.6 равняется 6,956. Из распечатки регрессии видно, что стандартная ошибка предсказания для этого года составляет 0,017. Для 38 степеней свободы кри­тическое значение t-статистики при 5%-ном уровне значимости равно 2,024, и мы получаем следующий 95%-ный доверительный интервал пред­сказания для данного года:

6,956 - 2,024 х 0,017 < Y< 6,956 + 2,024 х 0,017, (11.59)

то есть

6,922 < Y< 6,990. (11.60)

Доверительный интервал не включает фактическое значение (6,914), и, таким образом, по крайней мере, для этого года предсказание оказалось не­удовлетворительным. Очевидное объяснение этому состоит в том, что мы использовали очень простую статическую модель для оценки расходов на жилье. Как мы убедимся в следующей главе, динамическая модель является более предпочтительной.

Тесты на устойчивость

Тесты на устойчивость для регрессионной модели предназначены для оценки того, насколько поведение модели в послевыборочном периоде сравнимо с ее повелением в период выборки, на которой она была получе­на. В основании организации тестов на устойчивость могут лежать два принципа. Первый подход — сосредоточиться на предсказательной способ­ности модели, второй подход — оценить, происходит ли сдвиг параметров в период предсказания.



Поделиться:


Последнее изменение этой страницы: 2016-08-01; просмотров: 269; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.187.103 (0.006 с.)