Моделирование по данным временных рядов 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Моделирование по данным временных рядов



 

До сих пор наш анализ основывался на чанных перекрестных выборок в рамках модели А, а также более реалистичной модели Б. Теперь мы перехо­дим к данным временных рядов и модели С. Основное различие между мо­делью С и моделью В состоит в характере процесса генерирования данных (ПГД) или в том, как мы объясняем способ получения наблюдений. В модели В ПГД был очень прост: наблюдения генерировались случайно и неза­висимо Как следствие, порядок наблюдений в выборке был произвольным. Однако в модели С присутствие времени привносит естественный порядок. Чтобы подчеркнуть этот факт, будем использовать индекс t,а не I для на­блюдений, а их число обозначим как Т вместо n. Порядок не имеет значе­ния, если наблюдения для регрессоров генерировались случайным образом из фиксированной генеральной совокупности. Однако по двум причинам мы имеем дело не с этим случаем.

Во-первых, наблюдения для переменной А обозначают последовательность {X1,..., XT}, которая является подмножеством потенциально бесконечной последовательности {X-∞,...,Х0, X1...,ХT, ХТ-1,...,X}.Этот феномен опи­сывается как реализации процесса генерирования данных для периода t= 1,..., Т. Концептуально это отличается от случайной выборки из фикси­рованной генеральной совокупности. Во-вторых, многие регрессоры в мо­делях временных рядов обладают инерционностью, так что ПГД характери­зуется эволюцией на протяжении времени, а последовательные наблюдения оказываются коррелированными друг с другом.

Эти отличия приводят к тому, что свойства модели регрессии, в свою очередь, тоже будут отличаться от свойств модели В. Эти свойства, очевид­но, зависят от предпосылок регрессионной модели, так что нам будет необ­ходимо переформулировать их для случая регрессий временных рядов. Мы, однако, не будем это делать абстрактно, а отложим данную задачу до следу­ющей главы. Чтобы понять предпосылки, полезно познакомиться с регрес­сиями для временных рядов. В соответствии с этим в данной главе будут рассмотрены некоторые модели с несложной динамикой, а новая формули­ровка предпосылок будет сделана позже.

 

 

4.1. Статистические модели

 

Анализ здесь будет в основном иллюстрировать данные для оценивания функций спроса. Они получены на основе национальных счетов, опубликованных Бюро переписей США, и включают ежегодные агрегированные показатели по 20 различным категориям потребительских расходов за пери­од 1959 -2003 гг., наряду с данными о располагаемом личном доходе DPI и индексами цен по данным 20 категориям. Подробное описание, а также ин­формацию по загрузке данных с веб-сайта можно найти в Приложении В. Для примеров и упражнений используются две категории расходов – FOOD и HOUS (потребительские расходы на продовольствие и жилье соответ­ственно). Другие категории расходов предназначены для практической работы студентов в небольших группах, где каждый студент работает со своей категорией расходов, начиная с простейшей модели парной регрессии и по­степенно переходя к более сложным. Мы начнем с простой спецификации функции спроса на жилье, оценивая регрессию потребительских расходов по данной категории HOUS на DPI и индекс цен на жилье — PRELHOUS:

HOUSt = β1 2DPIt3 SRELHOUSt + ut (11.1)

Показатели HOUS и DPI измерены в миллиардах долларов в постоянных ценах 2000 г. Показатель PRELHOUS — это индекс, построенный путем де­ления номинального ценового дефлятора для жилья PFOUS на ценовой де­флятор для совокупных личных расходов РТРЕ и умножения на 100. Таким образом, HRELHOUS есть реальный, или относительный, индекс цен, пока­зывающий, становилось ли жилье более или менее дорогим по сравнению с остальными видами расходов. Динамика этого показателя представлена на рис. 11.1. Ясно, что данная относительная цена уменьшилась примерно на 10% с начала 1960-х до конца 1970-х гг., и индекс с тех пор демонстрирует медленный рост.

 

 

 


Рис 11.1. Ряд показателей относительных цен на жилье, 1959-2003 (2000=100)

 

Непосредственное оценивание линейной регрессии с помощью про­граммы EViews дало результат, представленный в табл. 11.1.

Таблица 11.1

Dependent Variable: HOUS

Method: Least Squares

Sample: 1959 2003

Included observations:45

VariaDie Coefficient Std. Error t-Statistic Prob.  
С 334.6657 37.26625 8.980396 0.0000
DPI 0.150925 0.001665 90.65785 0.0000
PRELHOUS -3.834387 0.460490 - 8.326764 0.0000
R-squared 0.996722   Mean dependent var 630.2830
Adjusted R-squared 0.996566   S.D.dependent var 249.2620
S.E. of regression 14.60740   Akaike info criter 8.265274
Sum squared resid 8961.801   Schwarz criterion 8.385719
Log likelinood -182.9687   F-statistic 6385.025
Durbin-Watson stat 0.337638   Prob(F-statistic) 0.000000
             

 

Это уравнение говорит о том, что увеличение располагаемого личного дохода на 1 млрд. долл. ведет к увеличению расходов на жилье на 0,15 млрд. долл. Иными словами, из 1 долл. дополнительно 15 центов будут израсходо­ваны на жилье Можно ли доверять этой цифре? Ответить на этот вопрос нелегко, но очевидно, что жилье является самой большой составляющей потребительских расходов, и можно ожидать, что данный коэффициент до­статочно велик. Отметим, что мы сейчас говорим об использовании жилья, а не об инвестициях в жилищное строительство. Использование жилья — это стоимость услуг, оказываемых с помощью имеющегося жилищного фонда. В случае аренды жилья в качестве расходов на жилье рассматривается арендная плата. В случае проживания в собственном жилье или аренды по льготным расценкам используется вмененная арендная плата, т.е. ры­ночная стоимость аренды этого жилья. Коэффициент при переменной PRELHOUS говорит о том, что увеличение ценового индекса на единицу приводит к сокращению расходов на жилье на 3,83 млрд. долл. Постоянный член в буквальном смысле показывает сумму, которая была бы потрачена на жилье, если бы обе переменные DPI и PRELHOUS равнялись нулю, но оче­видно, что эта интерпретация лишена смысла. Если говорить об отдельных домохозяйствах, то среди них могли бы быть такие, которые не имеют дохо­дов вообще, но пользуются жильем и другими предметами первой необхо­димости на основе трансфертных платежей, но здесь мы говорим о сово­купных данных для США в целом, и поэтому подобная интерпретация не имеет отношения к реальности.

Часто считают, что с математической точки зрения для функции спроса наиболее подходит функция с постоянной эластичностью следующего вида:

НОUS = β1 DPIβ2 PRELHOUSβ3 (11.2)

 

Линеаризовав ее с помощью логарифмирования, получаем

LGHOUS= β′1+ β2LGDPI + β3 PRELHOUS + u, (11.3)

 

где LGHOUS, LGDPI и LGPRHOUS — (натуральные) логарифмы HOUS, DPI и PRFLHOUS соответственно; и— натуральный логарифм случайного чле­на v, — β′1 логарифм β1, β2 и β3 представляют собой эластичности спроса по доходу и цене соответственно. Результат оценивания регрессии показан в табл. 11.2.

Коэффициенты при LGDPI и LGPRHOUS есть непосредственные оценки эластичностей спроса по доходу и цене соответственно. Похоже ли число 1,01 на эластичность спроса по доходу? Вполне вероятно. Принято подразделять потребительские расходы на нормальные и «худшие» блага, виды расходов, эластичности которых по доходу соответственно положительны и отрицательны, и далее подразделять нормальные блага на предметы первой необходимости и предметы роскоши, виды расходов, эластичности кото­рых по доходу соответственно меньше единицы и больше единицы. Оче­видно, что жилье является предметом первой необходимости, поэтому можно ожидать, что эластичность спроса на него окажется положительной, но меньшей единицы. Однако жилье включает и элемент роскоши, по­скольку при увеличении своих доходов люди тратят больше на более качес­твенное жилье. В результате общая ожидаемая оценка оказывается близкой к единице, поэтому полученная нами величина представляется разумной.

Таблица 11.2

Dependent Variable: LGHOUS

Method: Least Squares

Sample: 1959 2003

Included observations: 45

VariaDie Coefficient Std. Error t-Statistic Prob.  
С 0.005625 0.167903 0.033501 0.8734
DPI 1.031918 0.006649 155.1976 0.0000
PRELHOUS -0.483421 0.041780 -11.57056 0.0000
R-squared 0.998583   Mean dependent var 6.359334
Adjusted R-squared 0.998515   S.D.dependent var 0.437527
S.E. of regression 0.016859   Akaike info criter -5.263574
Sum squared resid 0.011937   Schwarz criterion -5.1431130
Log likelinood 121.4304   F-statistic 14797.05
Durbin-Watson stat 0.633113   Prob(F-statistic) 0.000000
             

 

4.2. Динамические модели

 

Далее мы добавим в модель некоторую простую динамику. Можно пред­положить, что некоторые виды потребительских расходов в значительной мере определяются текущими доходами и ценами, но это не так для таких категорий расходов, как жилье, которые подвержены значительной инер­ции. Мы рассмотрим спецификации модели, в которых расходы на жилье зависят от показателей доходов и цен с некоторым временным лагом, и по­пытаемся определить лаговую структуру, т.е. значения коэффициентов те­кущих и лаговых (запаздывающих) значений объясняющих переменных Значения переменной X с лагом в один период времени — это просто пред­шествующие значения X, и для удобства мы их обозначим как Х (-1). Обобщая, можно сказать, что переменная с лагом в s периодов времени имеет значения X в предшествующие s периодов, и она обозначается как X(-s). Основные регрессионные пакеты понимают такое обозначение, и для них нет необходимости обозначать лаговые переменные отдельно. В табл. 11.3 приведены данные для LGDPI, LGDPI(-1) и LGDPI(-2).Отметим, что между переменными LGDPI, LGDPI(-1) и LGDP1(-2)имеется высокая корреляция и это создает определенные проблемы.

 

 

Таблица 11.3.Текущие и лаговые значения логарифма располагаемого личного дохода

 

Год LGDPI LGDPI(-1) LGDPI(-2)
  7 4474  
  7,4729 7,4474
  7,5062 7,4729 7,4474
  7,5539 7,5062 7,4729
  7,5904 7,5539 7,5062
  7,660Г 7,5904 7,5539
  7,7202 7.6605 7.5904
  8,7129 8,6837 8,6563
  8,7476 8,7129 8,6837
  8,8045 8,7476 8,7129
  8,8337 8,8045 8,7476
  8,8810 8,8337 8,8045
  8,9002 8,8810 8,8337
  8,9306 8,9002 8,8810
200З 8,9534 8,9306 8,9002

В первом столбце табл. 11.4 представлены результаты оценивания лога­рифмической регрессии с использованием текущих доходов и цен. Во втором и третьем столбцах показаны результаты оценивания регрессии расхо­дов на жилье на показатели дохода и цен с лагом в один и два периода соответственно. Разумно предположить, что расходы на некоторую категорию благ могут зависеть как от текущих, так и от лаговых показателей дохода и цен.

 

Таблица 11.4.Альтернативные спецификации с лагом расходы на жилье

 

Variable (1) (2) (3) (4) (5)
LGDPI 1,03 (0,01) 0,33 (0,15) 0.29 (0 14)
LGDPI(-1) 1,01 (0,01) 0,68 (0,15) 0,22 (0,20)
LGDPI(-2) 0,98 (0,01) 0,49 (0,13)
LGPRHOUS -0,48 (0,04)   -0,09 (0,17) -0,28 (0.17)
LGPRHOUS(-1) 0,43 (0,04) -0,36 (0,17) 0,23 (0,30)
LGPRHOUF(-2) -0,38 (0,04) -0,38 (0,18)
R2 0,999 U.999 0,999 0,999 0,999

В четвертом столбце показаны результаты оценивания регрессии с ис­пользованием текущих показателей довода и цен, а также с лагом в один период времени. В пятом столбце добавлены также эти переменные с лагом в два периода.

Первые три уравнения регрессии почти совпадают. Это произошло вследствие очень высокой корреляции между LGDPI, LGDPL(-1) и LGDPI(-2). В последних двух уравнениях видны классические симптомы мультиколли­неарности. Точечные оценки здесь нестабильны, а стандартные ошибки стали намного большими при одновременном включении в уравнение ре­грессии текущих и лаговых показателей дохода и цен. Мы можем получить точные оценки долгосрочных эластичностей по доходу и цене (см. Вставку11.1), но из-за мультиколлинеарности мы не можем различать их теку­щие и лаговые эффекты. Для расходов типа расходов на жилье, где можно ожидать длительные лаги, простое добавление лагов в статическую модель вряд ли поможет нам определить структуру лагов.

Общим подходом к решению проблемы мультиколлинеарности является введение предположения о том, что данный динамический процесс име­ет простую лаговую структуру, т.е. эта структура может быть описана с по­мощью небольшого числа параметров. Одна из наиболее распространенных лаговых структур описывается распределением Койка, в котором предпо­лагается, что коэффициенты при лаговых объясняющих переменных явля­ются членами убывающей геометрической прогрессии. Мы рассмотрим две такие модели адаптивных ожиданий и частичной корректировки.

Вставка 11.1.Репараметризация динамической модели для определения долгосрочных эффектов

Предположим, что у нас есть следующая регрессия:

y= β1+ β2Xt - β3 Xt-1 + β4 Xt-2 + ut.

Как мы уже видели, мультиколлинеарность может помешать получить точ­ные оценки β2, β3 и β4. Тем не менее, можно продемонстрировать, что оценка долгосрочного эффекта Х на Y стабильна. В равновесии мы имеем:

Y = β1+ β2X + β3 X + β4X = β1+ (β2+ β3+ β4) X,

где Y и X - равновесные значения Y и Х. Следовательно, (β2+ β3+ β4) представ­ляет собой оценку долгосрочного влияния X. Мы можем рассчитать это число исходя из точечных оценок β2, β3 и β4 в начальной спецификации, но нам не хватает оценки стандартной ошибки. Чтобы оценить стандартную ошибку, пере­пишем модель следующим образом:

Уt = β1+ (β2+ β3+ β4)Xt - β3 (Xt - Xt-1 )- β4 (Xt - Xt-2 ) + ut

Точечная оценка коэффициента при Xt есть сумма точечных оценок β2, β3 и β4 в начальной спецификации, так что теперь мы можем получить необходимую стандартную ошибку. Так как вполне возможно, что значения X не сильно коррелированы с (Xt - Xt-1)или (Xt –Xt-2), проблема мультиколлинеарности может отсутствовать, так что стандартная ошибка будет довольно небольшой. Если мо­дель из пятого столбца табл11.4 переписать представленным способом и оце­нить, то мы получим оценку коэффициента при LGDPIt, равную 1,00 со стан­дартной ошибкой 0,01, и оценку коэффициента при LGPRHOUSt равную -0,41 со стандартной ошибкой 0,01. Как и ожидалось, стандартные ошибки при такой спецификации намного ниже, чем ошибки индивидуальных коэффициентов в начальной спецификации.

4.3. Модель адаптивных ожиданий

 

В прикладной экономике часто возникает необходимость моделировать ожидания. Это может быть очень важной и сложной задачей. В макроэко­номике, например, инвестиции, сбережения и спрос на активы чувствительны к ожиданиям относительно будущего. К сожалению, непосред­ственное измерение ожиданий не представляется возможным. В результате этого макроэкономические модели не позволяют получать достаточно точ­ных прогнозов, что затрудняет экономическое регулирование.

Если ожидания непосредственно не наблюдаемы, то могут быть исполь­зованы некоторые косвенные способы их оценки. Модель адаптивных ожи­ даний — одно из возможных решений. Этот процесс заключается в простой корректировке ожиданий, когда в каждый период времени реальное значе­ние переменной сравнивается с ее ожидаемым значением. Если реальное значение оказывается больше, то значение, ожидаемое в следующем пе­риоде, корректируется в сторону повышения, если меньше — то в сторону уменьшения. Предполагается, что размер корректировки пропорционален разности между реальным и ожидаемым значениями переменной.

Таким образом, если рассматривается переменная X, a Xet — ее значение, ожидаемое в период t на основе информации, имевшейся в период t- 1, то:

Xet+1-Xet = l(Xt-Xet) (0≤λ≤1). (11.4)

Это выражение может быть переписано в виде:

Xet+1 =λ Xt + (1-λ) Xet (0≤λ≤1). (11.5)

 

Выражение (11.5) утверждает, чти значение переменной X, ожидаемое в следующий период времени, формируется как взвешенное среднее ее ре­ального и ожидаемого значений в текущем периоде. Чем больше величи­на X, тем быстрее ожидаемое значение адаптируется к предыдущим реаль­ным значениям переменной.

Предположим, например, что зависимая переменная Yt связана с ожида­емым значением Xet+1 объясняющей переменной X в году t +1:

Yt = β1 + β2 Xet+1 + ut (11.6)

Равенство (11.6) выражает Y через величину Xet+1, которая ненаблюдаема и которую необходимо так или иначе заменить наблюдаемыми переменны­ми, т.е. реальными текущим и прошлыми значениями переменной Х и, мо­жет быть, прошлыми значениями переменной Y.

Начнем с замены воспользовавшись формулой (11.5):

Y = β1+ β2 (λXt + (1-λ) Xet) + ut = β1+ β2 λXt+ β2 (1-λ) Xet + ut (11.7)

Конечно, у нас по-прежнему есть ненаблюдаемая объясняющая пере­менная Xet, но если равенство (11.5) верно для некоторого периода t, то оно также верно и для периода t - 1:

Xet = λ Xt-1+ (1-λ) Xet-1 (11.8)

Подставив выражение для Xet в уравнение (11.7), мы получим:

Yt = β1+ β2 λXt2 λ(1-λ) Xt-1+ β2 λ(1-λ)2 Xet-1 + ut (11.9)

После добавления лагов и подстановки, выполненных s раз, выражение приобретает вид:

Yt1+ β2 λXt2 λ(1-λ)Xt-12 λ(1-λ)2Xet-2 +…+β2 λ(1-λ)s-1 Xt-s+1+ β2 λ(1-λ)s Xet-s+1 + ur (11.10)

Теперь разумно предположите, что λ лежит между 0 и 1, и в этом случае (1 - λ) будет также находиться между 0 и 1. Таким образом, (1 - λ)s бесконеч­но убывает при возрастании s. В конечном счете на некотором шаге член β2 (1 - λ)s Xet-s+1, становится пренебрежимо малым, и мы получаем модель, в которой все переменные наблюдаемы.

Лаговые переменные имеют здесь чеса, бесконечно убывающие в гео­метрической прогрессии, и такая структура описывается распределением Койка. Как мы видели из уравнения (11.10), оно очень просто с точки зрения параметризации, предполагая оценивание лишь одного дополни­тельного параметра по сравнению со статическим вариантом модели. По­скольку оно нелинейно по параметрам, при его оценивании не следует ис­пользовать МНК, причем сразу по двум причинам. Во-первых, мультиколлинеарность почти наверняка сделает оценки коэффициентов столь ненадежными, что они потеряют всякую ценность, — это как раз и есть та причина, которая побудила нас искать другие способы описания структуры лага. Во-вторых, полученные точечные оценки коэффициентов оказыва­ются несовместимыми для расчета параметров модели. Например, предпо­ложим, что оценена следующая зависимость:

Yt = 101 +0,60Хt+ 0,45Xt-1 + 0,20Х t-2+... (11.11)

Приравнивая теоретические выражения для коэффициентов при теку­щем и лаговых значениях X в уравнение (11.10) к оценкам из уравнения (11.11), получаем b2l=0,60, b2l(1 -l)= 0,45 и b2l(l -1)2= 0,20. Из первых двух равенств следует, что b2 равно 2,40 и l равно 0,25, но эти величины не удо­влетворяют третьему уравнению и уравнениям для всех остальных коэффи­циентов регрессии.

Вместо этого следует воспользоваться методами нелинейного оценива­ния. Многие основные регрессионные пакеты имеют встроенные возмож­ности для оценивания нелинейных регрессий. Если в вашем пакете этого нет, то можно оценить модель с помощью решетчатого поиска. Мы опишем здесь этот метод, хотя он и устарел, поскольку он поясняет процедуру реше­ния проблемы мультиколлинеарности. Перепишем уравнение (11.10) в виде двух уравнений:

Yt = β1+ β2Zt + ut (11.12)

Zt = λXt+λ(1-λ) Xt-1+ λ(1-λ)2 Xt-2+ λ(1-λ)3 Xt-3 (11.13)

 

Значения Zt, разумеется, зависят от величины λ. Мы рассчитываем 10 вариантов данных для переменной Zt, используя следующие значения λ: 0,1.0.2,0,3. 1,0 и оцениваем уравнение (11.12) с каждым из них. Вариант с наименьшей суммой квадратов остатков есть по определению решение по методу наименьших квадратов. Отметим, что все уравнения регрессии сво­дятся к уравнению парной регрессии Y на различные варианты Z, и поэтому проблема мультиколлинеарности полностью снимается.

В табл. 11.5 показаны оценки параметров и сумм квадратов остатков для решетчатого поиска, когда зависимой переменной был логарифм спроса на жилье, а объясняющими переменными — логарифмы DPI и относительных цен на жилье. При этом использовались восемь лаговых значений. Можно видеть, что оптимальное значение λ примерно равно 0,2, эластичность спроса по доходу примерно равна 1,12, а эластичность по цене — примерно -0,44.

 

Таблица 11.5. Логарифмическая регрессия расходов на жилье от располагаемого личного дохода и индекса относительных цен для модели адаптивных ожиданий (оценена с помощью решетчатого поиска)

λ b2 с.о.(b2) Ь3 с.о. (b3) RSS
0,1 1,55 0,01 -0,54 0,05 0,002107
0.2 1,12 0,01 -0,44 0,03 0,001901
0,3 1,03 0,01 -0,45 0,03 0,002063
0,4 1,02 0,01 -0,49 0,03 0,03 0,002533
0,5 1,03 0,01 -0,52 0,03 0,003190
0,6 1,04 0,01 -0,55 0,04 0,003935
0,7 1,05 0,01 -0,57 0,04 0,004719
0,8 1,06 0,01 -0,59 0,05 0,005531
0,9 1,06 0,01 -0,60 0,05 0,006377
1,0 1,07 0,01 -0,61 0,05 0,007263

 

Для более точной оценки λ можно продолжить решетчатый поиск с шагом 0,01 в диапазоне между 0,1 и 0,3 оказывается, что λ равно 0,21, при­чем эластичность по доходу составляет 1,11, а эластичность по цене не из­менилась. Отметим, что неявный коэффициент для дохода при Xt-8 β2λ(1-λ)8, равнялся примерно 1,11 х 0,21 х 0,798= 0,0354. Возможно, было бы лучше использовать большее число лагов. Проблема состоит в том, что веса в нашем случае уменьшаются слишком медленно, поскольку скорость корректировки λ мала, а значение 1 - λ велико



Поделиться:


Последнее изменение этой страницы: 2016-08-01; просмотров: 210; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.142.198.129 (0.043 с.)