Использование фиктивных переменных 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Использование фиктивных переменных



           Фиктивные переменные достаточно широко применяются в регрессионном анализе.

           Нелинейные регрессионные модели в большинстве случаев могут быть двух типов:

· модели нелинейные по переменным,

· модели нелинейные по параметрам.

           5.3.2.1. Модели нелинейные по переменным

 

           В первом случае параметры регрессии (ее коэффициенты) остаются неизменными, нелинейными являются лишь переменные (то же самое может относиться и ко множественной регрессии), например:

Y=b0 + bl* X+b2* X2 + b3*X3 + e.                                                                                                                         (1)

           В этом случае вводятся новые фиктивные переменные Z1= X2, Z2 = X3, и репрессия принимает вид:

Y=b0 + bl*X+b2*Z+b3*Z2 + e.                                                                                                                             (2)

           После этого коэффициенты данной линейной регрессии находятся с помощью обычных процедур множественной линейной регрессии. Но затем, при необходимости перехода от Z к X следует выполнить дополнительную процедуру вычисления:

X=√Z1                                                                                                                                                                       (3)

               

Модели нелинейные по параметрам

 

           Во втором случае, когда речь идет о нелинейности параметров (коэффициентов) регрессии: экспоненциальная модель,  степенная модель и др.

           В ряде случаев данные модели можно привести к линейной форме, например, путем логарифмирования.

           В этом случае коэффициенты находятся также с помощью обычных для линейной регрессии процедур. Если необходимо затем перейти от логарифма к самой величине, то используется функция EXP (numexpr), которую также можно найти в упомянутом окне Вычислить переменную. (см. рис. 5-22 и 5-23)

Рис.5-22. Команды «Вычислить переменную»

 

Рис.5-23. Окно вычисления новой переменной

           Гораздо более сложной становится ситуация, когда нелинейная функция не поддается линеаризации. В этом случае параметры могут быть определены лишь итеративным путем посредством последовательных приближений в процессе нелинейной оптимизации, когда минимизируется сумма квадратов разностей между предсказанными значениями регрессии по подбираемой формуле и исходными значениями. Здесь решающим становится подбор функциональной формы регрессионной модели, а также определение начальных значений искомых коэффициентов для нулевой итерации. Даже если выбрана подходящая формула, неудачное задание начальных значений может привести к тому, что итерационный процесс вообще не сойдется, или к тому, что полученное решение будет локальным, то есть годным лишь для конкретной точки и ее окрестностей. В общем случае при этом варианте расчета предусматривается достаточно длинный, многоступенчатый процесс.

Анализ остатков

 

Назначение анализа остатков

 

           Как правило, заранее неизвестно удовлетворяют ли исходные данные предположениям, лежащим в условиях применения метода МНК для нахождения неизвестных коэффициентов модели. Следовательно, необходимо произвести дополнительные исследования, сосредоточившись на остатках, для поиска доказательств того, что необходимые предположения не нарушены.

 

Понятие остатков

          

           Остатки - это разность между наблюденным значением и значением, предсказанным моделью:

ei = Yi – b0 – b1 Xi = Yi - Y `

           В регрессионном анализе предполагается, что истинные ошибки еi являются независимыми нормально распределенными случайными величинами со средним 0 и постоянной дисперсией σ2. Если в уравнение включен свободный член, среднее значение остатков всегда равно нулю, так что среднее остатков не дает никакой информации относительно истинного среднего ошибок. Поскольку сумма остатков должна равняться нулю, они не являются независимыми. Однако, если число остатков достаточно велико по сравнению с количеством независимых переменных, то на практике этой зависимостью можно пренебречь.

           Нормированные остатки. Об относительной величине остатков легче судить, когда они поделены на оценки своих стандартных отклонений. Рассчитанные в результатенормированные остатки, выражены в единицах стандартных отклонений в обе стороны от среднего значения. Например, то, что данный остаток равен -5198.1, не содержит достаточной информации. Однако, если вы знаете, что будучи пронормированным, он становится равным -3.1, то вам становится известным не только то, что наблюденное значение меньше предсказанного, но также и то, что данный остаток больше по абсолютной величине трех σ.

           Имеются и другие способы корректировки остатков:

· Нормированный остаток для j-того наблюдения — это остаток, деленный на выборочное стандартное отклонение. Нормированные остатки имеют нулевое среднее значение и единичное стандартное отклонение.

· Стьюдентизированный остаток — это остаток, деленный на оценку своего стандартного отклонения, меняющегося от одного наблюдения к другому, в зависимости от расстояния между X i и средним значением X.

           Значения нормированных и стьюдентизированных остатков, как правило, близки, хотя это и не всегда так. Стьюдентизированные остатки точнее отражают различия в дисперсиях истинных ошибок для разных наблюдений.

 

Проверка линейности

 

 Проверку линейности модели можно выполнить двумя способами.



Поделиться:


Последнее изменение этой страницы: 2021-01-08; просмотров: 82; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.135.194.251 (0.007 с.)