Модель парной линейной регрессии 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Модель парной линейной регрессии



Коэффициент корреляции может показывать, что две переменные связа­ны друг с другом, однако он не дает представления о том, каким образом они связаны. Рассмотрим более подробно те случаи, для которых мы хотим предположить, что одна переменная, называемая обычно зависимой переменной, определяется другими переменными, называемыми объясняющими перемен­ными, независимыми переменными, или регрессорами. Предполагаемая матема­тическая зависимость, связывающая эти переменные, называется моделью регрессии. Если в модели присутствует только один регрессор, что будет пред­полагаться в данной и следующей главах, модель называется моделью парной регрессии. Если в модели присутствует два или более регрессора, то она назы­вается моделью множественной регрессии.

Сразу же отметим, что не следует ожидать получения точного соотноше­ния между какими-либо двумя экономическими показателями, за исключе­нием тех случаев, когда оно существует по определению. В учебниках по экономической теории эта проблема обычно решается путем приведения соотношения, как если бы оно было точным, и предупреждения читателя о том, что это аппроксимация. В статистическом анализе, однако, факт неточности со­отношения признается путем явного включения в него случайного фактора, описываемого случайным (остаточным) членом.

Начнем с рассмотрения простейшей модели:

 

Yi = β1 + β2xi+ui (1.1)

 

Величина Yi, значение зависимой переменной в наблюдении i, состоит из двух составляющих: 1) неслучайной составляющей β1+ β2 xi, где β1и β2 - это постоянные величины, называемые параметрами уравнения; а Х— значение объясняющей переменной в наблюдении i, и 2) случайного члена ui.

На рис. 1.1 показано, как комбинация этих двух составляющих определяет величину Y. Показатели X1 X2 Х3 и Х4 это четыре гипотетических значения объясняющей переменной. Если бы соотношение между Y и Х было точным, тосоответствующие значения Y были бы представлены точками Q1 Q4 на прямой. Наличие случайного члена приводит к тому, что в действительности значение Y получается другим. Предполагалось, что случайный член положи­телен в первом и четвертом наблюдениях и отрицателен в двух других, поэтому если отметить на графике реальные значения Y при соответствующих значе­ниях X, то мы получим точки Р1 - Р4.

Следует подчеркнуть, что точки Р — это все, что вы можете видеть на рис.1.1 на практике. Фактические значения β1и β2 и, следовательно, положе­ния точек Q неизвестны, так же как и фактические значения случайного члена..

Задача регрессионного анализа состоит в получении оценок β1и β2 и, следовательно, в определении положения прямой по точкам Р.

Почему же существует случайный член? Имеется несколько причин.

1. Невключение объясняющих переменных. Соотношение между Y и X почти наверняка является очень большим упрощением. В действительности суще­ствуют другие факторы, влияющие на Y, которые не учтены в уравнении (1.1), влияние этих факторов приводит к тому, что наблюдаемые точки лежат вне прямой. Часто происходит так, что имеются переменные, которые мы хотели бы включить в регрессионное уравнение, но не можем этого сделать потому, что не знаем, как их измерить. Например, далее в этой главе мы будем оцени­вать функции заработка, связывающие часовые заработки с продолжитель­ностью образования. Мы хорошо знаем, что срок обучения является не един­ственным фактором, влияющим на заработки, и в конечном счете мы усовер­шенствуем модель, включив в нее и другие переменные, такие как, например, трудовой стаж. Тем не менее, даже наилучшим образом специфицированная функция заработка объясняет не более половины разброса уровня заработков.

Многие другие факторы влияют на возможность получения хорошей работы, такие как, например, неизмеримые характеристики индивида или даже чистый фактор удачи в смысле нахождения данным индивидом работы, наилучшим образом соответствующей его индивидуальным способностям. Все эти прочие факторы вносят свой вклад в случайный член.

2. Агрегирование переменных. Во многих случаях рассматриваемая зависимость — это попытка объединить вместе некоторое количество микроэкономических соотношений. Например, функция суммарного потребления — этопопытка суммарного выражения совокупности решений отдельных индивидуумов о расходах. Так как отдельные соотношения, вероятно, имеют разные параметры, любая попытка определить соотношение между суммарными расходами и совокупным доходом является лишь аппроксимацией. Наблюдаемое расхождение при этом приписывается наличию случайного члена.

3. Неправильное описание структуры модели. Структура модели может быть описана неправильно или не вполне правильно. Здесь можно привести один из многих возможных примеров. Если зависимость относится к данным о временном ряде, то значение Y может зависеть не от фактического значения Xi а от значения, которое ожидалось в предыдущем периоде. Если ожидаемое и фактическое значения тесно связаны, то будет казаться, что между Y и Х существует зависимость, но это будет лишь аппроксимация, и расхождение вновь будет связано с наличием случайного члена.

4. Неправильная функциональная спецификация. Функциональное соотношение между Y и X математически может быть определено неправильно. Например, истинная зависимость может не являться линейной, а быть более сложной. Нелинейные зависимости будут рассмотрены в главе 4. Безусловно, надо постараться избежать возникновения этой проблемы, используя подхо­дящую математическую формулу, но любая самая изощренная формула является лишь приближением, и существующее расхождение вносит вклад в оста­точный член.

5. Ошибки измерения. Если в измерении одной или более взаимосвязанных переменных имеются ошибки, то наблюдаемые значения не будут соответствовать точному соотношению, и существующее расхождение будет вносил вклад в остаточный член.

Случайный член является суммарным проявлением всех этих факторов Очевидно, что если бы вас интересовало только измерение влияния Х на У, то было бы значительно удобнее, если бы случайного члена не было. Если бы он отсутствовал, то точки Р на рис. 1.1 совпадали бы с точками Q, и мы бы знали. что любое изменение в Y от наблюдения к наблюдению вызвано изменением Х исмогли бы точно вычислить β1и β2.

Однако в действительности каждое изменение У отчасти вызвано изменением u, и это значительно усложняет жизнь. По этой причине и иногда описывается как «шум».



Поделиться:


Последнее изменение этой страницы: 2016-08-01; просмотров: 289; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.141.30.162 (0.006 с.)