Оценка качества модели множественной регрессии: F-критерий Фишера, t-критерий Стьюдента. Мультиколлинеарность. Методы устранения мультиколлинеарности. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Оценка качества модели множественной регрессии: F-критерий Фишера, t-критерий Стьюдента. Мультиколлинеарность. Методы устранения мультиколлинеарности.



Значимость уравнения множественной регрессий в целом, так же как и в парной регрессии, оценивается с помощью F-критерия Фишера:

(3.32)

Где - факторная сумма квадратов на одну степень свободы;

- остаточная сумма квадратов на одну степень свободы;

- коэффициент (индекс) множественной детерминации;

m - число параметров при переменных х (в линейной регрессии совпадает с числом включенных в модель факторов);

n - число наблюдений.

Оценивается значимость не толь ко уравнения в целом, но и фактора, дополнительно включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фактор, вошедший вариации в модель, может существенно увеличивать долю объясненной вариации результативного признака. Кроме того, при наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть разной в зависимости от последовательности его введения в модель. Мерой для оценки включения фактора в модель служит частный F- критерий, т.е. .

(3.33)

Где - коэффициент множественной детерминации для модели с полным набором факторов;

- тот же показатель, но без включения в модель фактора ;

- число наблюдений;

- число параметров в модели (без свободного члена).

Если оцениваем значимость влияния фактора , то формула частного F –критерия примет вид:

(3.34)

В общем виде для фактора частный -критерий определится как

В числителе – прирост доли вариации у за счет дополнительный включается в модель соотношения фактура, в значении доля остаточных вариации для полной модели

Рассмотреть зависимость объема продукции у от затрат труда х, и технической оснащенности производства

;

Найдем и :

Дисперсионный анализ

 

Частный F-критерий оценивает значимость коэффициентов чистой регрессии. Зная величину F­xi, можно определить и t-критерий для коэффициента регрессии при i-м факторе, tbi, а именно:

Если уравнение содержит больше двух факторов, то соответствующая программа РС дает таблицу дисперсионного анализа, показывая значимость последовательного добавления к уравнению регрессии соответствующего фактора. Так, если рассматривается уравнение:

то определяются последовательно F-критерий для уравнения с одним фактором х1, далее F-критерий для дополнительного включения в модель фактора х2, т.е. для перехода от однофакторного уравнения регрессии к двухфакторному, и наконец, F-критерий для дополнительного включения в модель фактора х­3, т.е дается оценка значимости фактора х­3 после включения в модель факторов х1 и х2. В этом случае F-критерий для дополнительного включения фактора х2 после х1 является последовательным в отличие от F-критерия для дополнительного включения фактора х, который является частным F-критерием, ибо оценивает значимость фактора в предположении, что он включен в модель последним. С t-критерием Стьюдента связан именно частный F-критерий. Последовательный F-критерий может интересовать исследователя на стадии формирования модели.

Оценка значимости коэффициентов чистой регрессии по t-критерию Стьюдента может быть проведена и без расчета частных F-критериев. В этом случае, как и в парной регрессии, для каждого фактора используется формула:

где bi ­ - коэффициент чистой регрессии при факторе хi

mbi – среднеквадратическая ошибка коэффициента регрессии bi ­

Для уравнения множественной регрессии:

среднеквадратическая ошибка коэффициента регрессии может быть определена по следующей формуле

- среднеквадратическое отклонение для признака у;

- среднеквадратическое отклонение для признака хi

- коэффициент детерминации для уравнения множественной регрессии.

- коэффициент детерминации для значимости фактора хi со всеми другими факторами уравнения множественной регрессии.

n – m – 1 - число степеней свободы для остаточной суммы квадратов отклонений.

Как видим, чтобы воспользоваться данной формулой, необходимы матрица межфакторной корреляции и расчет по ней соответствующих коэффициентов детерминации . Так, для уравнения

оценка значимости коэффициентов регрессии b1, b2, b3 предполагает расчет трех межфакторных коэффициентов детерминации, а именно: , , .

Вместе с тем, если учесть, что

то можно убедиться, что

На основе соотношения bi и mbi получим

Аналогично можно оценивать и существенность частных показателей корреляции. Фактическое значение частного коэффициента корреляции сравнивается с табличным значением при или и числе степеней свободы k=n-h-2, где n- число наблюдений, h - число исключенных переменных. Так, если n =30 и оценивается существенность частного коэффициента корреляции второго порядка (например, ), то h=2 и k=26.

Если h является наивысшим порядком расчета частных коэффициентов корреляции для уравнения регрессии, то практически величина k совпадает с числом степеней свободы для остаточной вариации с n-m-1. Так, в уравнении , рассчитанном при n=30, n-m-1 =26. Если же уравнение регрессии дополняется расчетом частных коэффициентов корреляции разных порядков (второго, третьего и т.п.), то

k=n-h-2

Если величина частного F-критерия выше табличного значения, то это означает одновременного не только значимость рассматриваемого коэффициента регрессии, но и значимость частного коэффициента корреляции. Существует взаимосвязь между квадратом частного коэффициента корреляции и частным F-критерием, а именно:

Где - частный коэффициент детерминации фактора с y при неизменном уровне всех других факторов.

- доля остаточной вариации уравнения регрессии, включающего все факторы, кроме фактора

- доля остаточной вариации для уравнения регрессии с полным набором факторов.

Пример. Для рассматриваемой регрессии

; ;

Тогда

что соответствует ранее определенной величине .

Взаимосвязь показателей частного коэффициента корреляции, частного F-критерия и t- критерия Стьюдента для коэффициентов чистой регрессии может использоваться в процедуре отбора факторов. Отсев факторов при построении уравнения регрессии методом исключения практически можно осуществлять не только по частным коэффициентам корреляции, исключая на каждом шаге фактор с наименьшим незначимым значением частного коэффициента корреляции, но и по величинам tbi и Fxi. Частный F-критерий широко используется и при построении модели методом включения переменных и шаговым регрессионным методом.



Поделиться:


Последнее изменение этой страницы: 2017-02-07; просмотров: 404; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.21.106.69 (0.01 с.)