F- критерий для проверки качества оценивания 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

F- критерий для проверки качества оценивания



Даже если между Y и X отсутствует зависимость, по любой данной выборка наблюдений может показаться, что такая зависимость существует, возможно и слабая. Только по случайному стечению обстоятельств коэффициент корре­ляции и R2 будут в точности равны нулю. Итак, как узнать, действительно ли полученное для регрессии значение R2 отражает истинную зависимость или оно появилось случайно?

В принципе, мы могли бы принять следующую процедуру. Предположим что регрессионная модель задается уравнением

(2.8)

Примем в качестве нулевой гипотезы, что связь между Y и X отсутствует, т.е H0: β2 = 0. Найдем значение, которое может быть превышено величиной R2 в 5% случаев. Затем используем эту цифру в качестве критического уровня R2 для проверки гипотезы при 5%-ном уровне значимости. Если этот уровень превышается, то мы отклоняем нулевую гипотезу в пользу H1: β 2 0.

Такая проверка, подобно t-тесту для коэффициента регрессии, не служит доказательством. Действительно, при 5%-ном уровне значимости имеется риск допущения ошибки I рода (отклонения нулевой гипотезы, когда она ис­тинна) в 5% случаев, но можно, конечно, снизить этот риск за счет использо­вания более высокого уровня значимости, например, равного 1%. Тогда кри­тический уровень может быть превышен случайно только в 1% случаев, по­этому он выше критического уровня для проверки при 5%-ном уровне значимости.

Каким образом можно определить критический уровень для R2 при любом уровне значимости? Здесь возникает небольшая проблема. У нас нет таблицы критических уровней для R2. Традиционная процедура состоит в использова­нии косвенного подхода и выполнения так называемого F-теста, основанного на анализе дисперсии.

Предположим, что, как и ранее, вы можете разложить дисперсию зависи­мой переменной на «объясненную» и «необъясненную» составляющие, ис­пользуя уравнение (1.46)

(2.84)

(Напомним, что е равняется нулю и выборочное среднее значение Y рав­няется выборочному среднему значению Y.) Левая часть здесь является обшей суммой квадратов (TSS) отклонений зависимой переменной от ее выборочно­го среднего значения. Первый член в правой части является объясненной суммой квадратов (ESS), а второй член — необъясненной (остаточной) суммой квадратов (RSS):

 

TSS=ESS + RSS. (2.85)

 

F-статистика для проверки общего качества регрессии записывается как отношение объясненной суммы квадратов в расчете на одну независимую пе­ременную, деленное на остаточную сумму квадратов в расчете на одну степень свободы:

(2.86)

где к — число оцениваемых параметров в уравнении регрессии - 1 — коэф­фициенты наклона).

После деления числителя и знаменателя отношения на TSS эта F-статисти­ка может быть эквивалентно выражена на основе коэффициента R2:

(2.87)

В данном контексте к = 2, и, таким образом, уравнение (2.87) принимает вид

(2.88)

После вычисления F-критерия по значению коэффициента R2 вы отыски­ваете величину Fкрит — критический уровень F в соответствующей таблице. Если F > Fкрит то вы отклоняете нулевую гипотезу и делаете вывод о том, что имеющееся «объяснение» поведения величины Y лучше, чем можно было бы получить чисто случайно. В табл. А.З представлены критические уровни для F при уровнях значимости 5 и 1 %. В каждом случае критический уровень зависит от числа независимых переменных - 1), которое находится в верхней строке таблицы, и от числа степеней свободы (п - к), которое находится в крайнем левом ее столбце. В данном контексте рассматривается случай парной регрес­сии, когда к = 2, и мы должны использовать первую колонку таблицы.

В примере с функцией заработка из табл. 2.6, коэффициент R2 составил 0,1725. Поскольку было 540 наблюдений, F-статистика равняется R2 / [(1 - R2) / 538] = 0,1725 / (0,8275 / 538) = 112,15. При уровне значимости 0,1% критическое значение величины F при 1 и 500 степенях свободы (см. табл. А.З первый столбец, строка 500) составляет 10,96. Критическое значение при 1 и 538 степенях свободы еще меньше, и поэтому можно без колебаний отверг­нуть нулевую гипотезу в нашем конкретном примере. Другими словами, ле­жащая здесь в основе величина R2 столь высока, что мы отклоняем предполо­жение о том, что она могла появиться случайно. На практике F-статистика всегда вычисляется вместе с величиной R2, поэтому нет необходимости ис­пользовать уравнение (2.86).

Почему же используется этот косвенный подход? Почему бы не иметь таб­лицу значений коэффициента R2? Ответ заключается в том, что таблица зна­чений F-критерия является полезной для многих видов проверки дисперсии, одним из которых является расчет коэффициента R2. Вместо специализиро­ванной таблицы для каждого конкретного случая намного удобнее (или, по меньшей мере, экономнее) иметь одну обобщенную таблицу, делая при необ­ходимости преобразования типа (2.86).

Конечно, при необходимости можно вывести и критические значения ко­эффициента R2. Критическое значение R2 связано с критическим значением для F следующим уравнением:

(2.89)


из которого следует, что

 

(2.89)


В примере с функцией заработка критическое значение для F приуровне: значимости 1% составило примерно 10,95. Следовательно, в этом случае при к = 2

(2.91)

 


Хотя наша величина R2 и невелика, она превышает 0,020. Поэтому непосредственное сравнение величины R2 с его критическим значением подтверждает вывод о том, что в результате.F-теста мы должны отклонить нулевую ги­потезу.



Поделиться:


Последнее изменение этой страницы: 2016-08-01; просмотров: 331; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.138.174.95 (0.006 с.)