Интерпретация коэффициентов множественной регрессии 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Интерпретация коэффициентов множественной регрессии



Множественный регрессионный анализ позволяет нам разграничить влия­ние независимых переменных, допуская при этом возможность их коррелиро­ванности. Коэффициент регрессии при каждой переменной X дает оценку ее влияния на величину Y в случае неизменности влияния на нее всех остальных переменных X.

Это может быть продемонстрировано двумя способами. Один из них состо­ит в выяснении того, что если модель правильно специфицирована и выполне­ны предпосылки регрессионной модели, то оценки получаются несмещенны­ми. Это будет сделано в следующей главе для случая, когда имеются только две независимые переменные. Второй способ состоит в оценивании регрессион­ной зависимости Y от одной из переменных X, очистив предварительно пере­менные Y и X от составляющих, относящихся к другим объясняющим пере­менным. Оценка коэффициента наклона и ее стандартная ошибка в этом слу­чае получаются точно такими же, как при оценивании множественной регрессии. Этот результат доказан теоремой Фриша—Вауга—Ловелла (Frisch, Waugh, 1933; Lovell, 1963). Отсюда следует, что диаграмма рассеяния для зави­симости «очищенной» переменной 7 от «очищенной» переменной X является корректным графическим представлением их взаимосвязи, которое невозмож­но получить каким-либо другим путем. Этот результат мы не будем доказывать, но он будет проиллюстрирован с помощью функции заработка в разде­ле 3.1:

= β1 + β2S+ β3 ЕХР+и. (3.16)

Предположим, что нас особенно интересует зависимость между заработком и продолжительностью обучения и что мы хотели бы представить ее графиче­ски. Непосредственное построение точек зависимости EARNINGS от S, как это представлено на рис. 1.8, дает искаженный вид взаимосвязи, поскольку пере­менная ЕХР отрицательно коррелирована с S. Среди людей одинакового воз­раста, люди, которые провели в школе больше времени, чаще всего имеют меньше опыта работы. Вследствие этого, если S возрастает, то 1) EARNINGS будет иметь тенденцию к возрастанию, поскольку р2 положительно; 2) ЕХР бу­дет иметь тенденцию к убыванию, поскольку S и ЕХР отрицательно коррелированы, и 3) EARNINGS уменьшится благодаря убыванию ЕХР и тому, что рз положительна. Другими словами, вариации величины EARNINGS не будут полностью отражать влияние вариаций в S, поскольку частично они будут вы­званы связанными с этим вариациями в ЕХР. Вследствие этого при оценива­нии парной регрессии оценка β 2 будет смещена вниз. Мы исследуем это сме­щение аналитически в разделе 6.2.

В данном примере присутствует еще одна объясняющая переменная ЕХР. Чтобы «очистить» EARNINGS и S от их составляющих, обусловленных ЕХР, мы сначала оценим их регрессии на ЕХР:

EARNINGS = с12ЕХР; (3.17)

S = d1+d2EXP. (3.18)

Далее вычтем полученные теоретические значения из фактических значе­ний:

EEARN = EARNINGS - ; (3.19)

ES = S- . (3.20)

«Очищенные» переменные EEARN и ES — это, конечно, всего лишь оста­точные члены регрессий (3.17) и (3.18). Далее мы оценим регрессию EEARN на ES и получим представленную в табл. 3.2 распечатку результатов.

В записи оценки свободного члена регрессии использовано общее правило записи очень больших или очень маленьких чисел с заданным числом цифр. Запись е + п означает, что коэффициент должен быть умножен на 10n. Анало­гично е - п означает, что он должен быть умножен на 10 -n. Итак, в нашей ре­грессии свободный член практически равен нулю.

Вы можете убедиться в том, что коэффициент при ES идентичен коэффи­циенту при S в множественной регрессии в разделе 3.1. Рисунок 3.2 представ­ляет линию регрессии на диаграмме рассеяния. Пунктирная линия на рисун­ке — это парная регрессия EARNINGS на S и приведена для сравнения. Она немного более пологая, чем реальная зависимость EARNINGS от S, поскольку

Таблица 3.2

 

. reg EEARN ES Source SS df MS   Number of obs F(1,538) Prob > F R-squared Adj R-squared Root MSE 131.63 0.0000 0.1966 0.1951 12.898
Model Residual 21895.9298 89496.5833 1 538 21895.9298 166.350527          
Total 111392.513   206.665145          
EEARN Coef. Std. Err. t P>|t| [95% Conf. Interval]
ES _cons 2.678125 8.10e-09 .2334325.5550284 11.47 0.00 0.000 1.000 2.219574 -1.090288 3.136676 1.090288

она не учитывает эффект EXP. В этом случае отклонение мало, потому что мала корреляция между S и ЕХР, равная -0,22. Но, даже принимая во внимание этот факт, диаграмма полезна, потому что она позволяет напрямую увидеть соотно­шение между заработком и продолжительностью обучения при фиксирован­ном стаже работы. Наличие далеко лежащих наблюдений для больших значе­ний S приводит к выводу, что модель была в чем-то неправильно специфици­рована.



Поделиться:


Последнее изменение этой страницы: 2016-08-01; просмотров: 263; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.17.184.90 (0.005 с.)