Что такое «ловушка фиктивных переменных»? 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Что такое «ловушка фиктивных переменных»?



«Ловушка фиктивных переменных» - это включение в уравнение фиктивной переменной для эталонной категории. Вследствие этого невозможно дать интерпретацию коэффициентам регрессии, так как теперь отсутствует «база».

В каком количестве и как нужно ввести фиктивные переменные для выражения

Различий внутри группы с несколькими категориями?

Для выражения различий внутри группы с несколькими категориями число вводимых фиктивных переменных равно числу категорий минус один (минус «базовая категория»).

Если, например, 4 категории нужно выбрать базовую категорию 0, тогда фиктивные переменные D1,D2,D3 будут определяться следующим образом:

Категория 0 D1=D2=D3=0,

Категория 1 D1=1 D2=D3=0

Категория 2 D2=1 D1=D3=0

Категория 3 D3=1 D1=D2=0

Как ввести фиктивные переменные для нескольких групп, каждой с несколькими категориями?

Если нескольких групп, каждой с несколькими категориями, то в каждой группе фиктивная переменная определяется для каждой категории, кроме эталонной.

Если, например, 2 группы переменных – UM и D и в каждой по 3 категории, то тогда фиктивные переменные будут определяться следующим образом:

UM\D Категория 0 Категория 1 Категория 2
Категория 0 UM1=UM2=0 D1=D2=0 базовая кат. UM1=UM2=0 D1=1 D2=0 UM1=UM2=0 D2=1 D1=0
Категория 1 UM1=1 UM2=0 D1=D2=0 UM1=1 UM2=0 D1=1 D2=0 UM1=1 UM2=0 D2=1 D1=0
Категория 2 UM2=1 UM1=0 D1=D2=0 UM2=1 UM1=0 D1=1 D2=0 UM2=1 UM1=0 D2=1 D1=0

 

Как интерпретируется константа при использовании фиктивных переменных

Сдвига?

Константа – это оценка базового значения постоянного члена в уравнении регрессии, а коэффициенты при фиктивных переменных служат оценками приращения постоянного члена по сравнению с этим базовым уровнем.

257. Как интерпретируется константа при использовании фиктивных переменных

сдвига и наклона?

y = a + s*f1 + b1*x + t*f2, где f2=f1*x

Константа показывает величину смещения графика регрессии при х равном «0»: одну величину (a), когда фиктивная переменная (f1) принимает значение «0»; другую (a+s) – когда фиктивная переменная (f1) принимает значение «1».

Фиктивная переменная сдвига (какое бы значение она не принимала) не влияет на величину константы.

(др.вариант: константа показывает величину смещения графика регрессии для различных категорий качественной характеристики при х равном «0»).

258. Как интерпретируется коэффициент при фиктивной переменной сдвига?

Он показывает величину (s), на которую изменяется константа (a) в уравнении ререссии, если фиктивная переменная сдвига (f1) принимает значение «1».

259. Как интерпретируется коэффициент при фиктивной переменной наклона?

Он показывает величину (t), на которую изменяется коэффициент наклона (b1) в уравнении регрессии, если фиктивная переменная наклона (f2) принимает ненулевое значение.

(?)260. Как интерпретируется коэффициент при фиктивной переменной взаимодействия?

Возможно – аналогично 259, т.к. ф.п. взаимодействия также будет стоять при х.

Он показывает величину (t), на которую изменяется коэффициент наклона (b1) в уравнении регрессии, если фиктивная переменная взаимодействия (f2) принимает ненулевое значение.

261. Как определяется значимость коэффициента при фиктивной переменной?

С помощью t-теста:

Сравниваем t-статистику фиктивной переменной с t крит. (d.f.; двусторон.тест; уровень значимости). Если больше - значит отвергаем нулевую гипотезу о незначимости различий «у» по различным категориям качественной характеристики.

262. Как определяется значимость одновременно группы фиктивных переменных

сдвига и наклона?

С помощью F-теста:

Нулевая гипотеза (Но): коэффициенты при обеих фиктивных переменных равны 0.

F (k; d.f в уравнении с фикт.пер.) =

[(RSS без ф.п. – RSS с ф.п.)/k] / [RSS с ф.п./d.f. в ур.с ф.п.]

где k - число фиктивных переменных, совокупную значимость которых оцениваем.

Сравниваем с F крит. (k;d.f.;уров.знач-ти). Если больше - значит отвергаем Но.

263. Как определяется значимость одновременно нескольких фиктивных переменных

сдвига?

С помощью F-теста:

Но – все коэффициенты при этих нескольких фикт. переменных равны 0.

Расчет: полностью аналогично вопросу 262.

(?)264. Почему использование фиктивных переменных эквивалентно расчету регрессии на

отдельных частях выборки?

Фиктивная переменная строго принимает одно из 2-ух значений: 0 или 1.Следов-но, автоматически обеспечивается селекция выборки. Базовые коэф-ты рассчитываются так чтобы min-ть RSS для эталонной категории; а коэф-ты при фиктивных переменных – так чтобы min-ть RSS для другой категории. Результат будет в итоге такой же как и в случае оценки отдельных выборок.

265. В чем состоит тест Чоу для обнаружения структурного сдвига?

Тест Чоу = F-тест на значимость улучшения качества уравнения после разделения выборки. Для случая 2-х подвыборок (каждая обладает определенной кач-й хар-кой):

F = [(RSSвся выборка – RSSподвыборка1 – RSSподвыборка2)/k] / [(RSSподвыборка1 + RSSподвыборка2)/n-2k]

k – число использованных степеней свободы (т.е. число оцениваемых параметров)

n-2k – число степеней свободы после разделения выборки

Сравниваем с F крит. (k; n-2k; ур.знач-ти). Если F больше крит-й то Но о незначимости разбиения выборки отвергается.

266. Какую статистику использует тест Чоу? Как определяется число степеней свободы

для этой статистики?

1) F-статистику. 2) В тесте Чоу k и n-2k степени свободы. k - число использованных степеней свободы (в регрессии для всей выборки d.f. = n-k; когда выборку разбили d.f. в сумме по 2-ум подвыборкам = n-2k. Разница м/д ними и есть k); n-2k – число степеней свободы после разделения выборки (где n – объем выборки, k – число оцениваемых параметров).

267. Какому тесту эквивалентно использование теста Чоу?

F-тесту объясняющей способности совокупности фиктивных переменных.

(при условии что включен полный набор фиктивных переменных для качественных характеристик модели)

268. Почему введение фиктивных переменных является предпочтительным по

сравнению с использованием теста Чоу?

Метод фиктивных переменных более информативен: 1) показывает как различаются функции для разных категорий в случае наличия таких различий; 2) дает возможность выполнить t-тесты для отдельных коэф-тов фиктивных переменных.

ВРЕМЕННЫЕ РЯДЫ: СТАЦИОНАРНОСТЬ

269. Что означает, что временной ряд является стационарным?

Это означает, что теоретическое математическое ожидание и теоретическая дисперсия такого ряда не зависят от времени, а также если теоретическая ковариация между его значениями в моменты времени t и t+s зависит от s, но не от времени.

Пример такого ряда: процесс автокорреляции первого порядка AR (1)

Xt = β2*Xt-1 + εt (при -1<β2<1)

270. Какие основные виды нестационарности могут наблюдаться во временном ряде?

1) Случайное блуждание (β2=1):

a) частный случай (без константы): Xt = Xt-1 + εt

б) случайное блуждание с дрейфом: Xt = β1 + Xt-1 + εt

2) Детерминированный тренд (это ряд, включающий временной тренд):

Xt = β1 + β2*t + εt

271. Почему ряд, обладающий трендом, не является стационарным?

Потому что математическое ожидание такого ряда будет зависеть от переменной времени:

матем.ожид-е Xt в момент времени t будет равно β1 + β2*t, т.е. зависеть от t.

272. Каковы правила использования теста Дики-Фуллера для проверки временного ряда

на стационарность?

Стандартный тест ДФ основан на модели: Xt = β1 + β2*Xt-1 + γ*t + εt (проверяется стационарность именно этой модели)

Чтобы это сделать делается преобразование:

∆Xt = β1 + (β2-1)*Xt-1 + γ*t + εt

Но: нестационарность временного ряда. Возможны 2 ее варианта: 1) Но: β2-1 (ряд Xt является случайным блужданием, но при этом стационареным в разностях); 2) Но: γ = 0 (Xt является детерминированным трендом, при этом присутствует трендовая стационарность)

Рассчитываются соответствующие t статистики. Критические значения t стат-к для теста ДФ имеет нестандартное распределение. Есть таблица критических значений, предложенная МакКинноном и Дэвидсоном.

Если t > tcrit то гипотеза нестационарности ряда отвергается.

(?)273. Что является нулевой гипотезой при применении теста Дики-Фуллера?

Но: нестационарность временного ряда. Возможны 2 ее варианта: 1) Но: β2-1 (ряд Xt является случайным блужданием, но при этом стационареным в разностях); 2) Но: γ = 0 (Xt является детерминированным трендом, при этом присутствует трендовая стационарность)

(?)274. Какие табличные значения использует тест Дики-Фуллера?

Таблица критических значений для больших выборок МакКиннона и Дэвидсона.



Поделиться:


Последнее изменение этой страницы: 2016-04-26; просмотров: 1140; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.77.71 (0.018 с.)