Оценка точности для уравнения парной регрессии. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Оценка точности для уравнения парной регрессии.



Для уравнения регрессии необходимо кроме b0, b1 оценить D(εi) = δ2, а также дисперсии D(b0), D(b1) и D(Y^), Рассматривая ε, b0, b1 и Y^ как случайные величины.

Оценку для δ2 вводят след образом.. Рассмотрим уравнение прогноза Y^ = b0+b1X для исходных точек (Yi,Xi), по которым получены МНК-оценки.

Yi = β0 + β1*xii i=1,n, и остатки регрессии еi=yi-y^i, где xiнаблюдаемые значения отклика yi. Тогда yi можно записать в виде yi= b0+b1*xi +ei.

Остатки еi являются наблюдаемыми значениями случайных величин εi.

Оценка δ2 в виде S2 = ^ δ2 связана с суммой квадратов остатков еi. Можно показать, что S2= δ2=∑ εi2/(n-2), а дисперсии b0, b1 и ковариация между ними запишутся в виде:

D(b0)=S2b0=S2∑xi2/n∑(xi-Xср)2

D(b1)=S2b1=S2

^cov(b0, b1 ) = - S2

где Xср = ∑xi/n.

6. Распределение МНК- оценок b0, b1 .

Принятие предположения εi~N означает, что yi, имеют совместное нормальное распределение, т е для вектора Y справедлива запись Y ~Nn(Xβ,δ2In).

Учитывая, что МНК-оценки b0, b1 являются линейными функциями от yi и, также имеют нормальное распределение b0 ~N (β02∑xi2/n∑(xi-Xср)2), b1 ~N(β02 .

Кроме того можно показать, что случайная величина(n-2)S2/ δ2 имеет распределение хи кадрат(n-2)? А дисперсия ошибок S2 не зависит от МНК – Оценок b0, b1

Интервальные оценки параметров R-модели.

Если предполагать, что εi~N(0,δ2), То 100(1*λ/2)%ое доверительные интервалы для β0, β1 и y будут определяться след образом: в1 ± t(n-2,1-λ/2)*

В0±t(n-2,1-λ/2)*S

Y^n ±± t(n-2,1-λ/2)= S(1+1/n+ )1/2 где t(n-2,1-λ/2) это (1-λ/2)% ая точка T-распределение с (n-2) степенями свободами обычно λ=0,05.

Таблица дисперсионного анализа и ее назначение в РА.

Источник дисперсии Сумма квадратов Степень свободы Средний квадрат F-статистика
Регрессия   SSR VR = 1 MSR = SSR/VR MSR/MSe
Отклонение от регрессии SSe Ve = n - 2 MSe = SSe/Ve  
Полная регрессия   SS V = n - 1    

При использовании ДА оценивается влияние фактора На Y, т е степень адекватности регрессии выборочном наблюдениям.

9. Меры качества R и R2.

Обычно генеральный коэффициент корреляции ρкоторый оценивается коэффициентом R, вводят с помощью формулы ρ2=(DY-σ2)/DY, где ρ=+√ρ2 называется коэффициентом множественной корреляции между Y и [x1….xp-1]. Выборочный коэф множеств. Корреляции между наблюденными величинами yi и вычисленными по модели величинами y^I:

R= или пользуясь таблицей ДА по формуле R=+√SSR/SS.

Критерии R и R2 (коэф детерминации) используют как меру линейной стохастической связи: чем больше значение R(0«R«1)? Тем сильнее связь, т е тем лучше f(X) соответствует наблюдениям. Мера R(R2 ) имеет дополнительное преимущество перед σ: имеет абсолютный характер при одной выборки наблюдений, поскольку оценивает степень тесности связи. Тем не менее и у этой меры есть свои недостатки: а) как и мера σ является внутренней мерой, т к построена по наблюдениям, по которым строится и модель, и мера; б) пригодна для проверки адекватности моделей относительно одной и той же выборки данных; в) используя эти меры, нельзя выявить набор значимых регрессоров; г) при увеличении количества регрессоров в модели значения R(R2) возрастают. Для устранения последнего недостатка соблюдают условие n>>p. Практически число наблюдений должно быть больше числа неизвестных в 5-15 раз. Кроме того вместо R(R2) предпочтительней применять так называемый скорректированный коэффициент множественной корреляции RC =√1-n(1-R2 )/(n-p) или скорректированный коэф множественной детерминации R2c.

Высокое значение R автоматически не гарантирует пригодность модели для прогноза и наоборот.

F-критерий.

Для оценки адекватности модели в целом и пригодности ее для прогноза можно использовать F-статистику F=MSR/S2.

Ее использование превращает задачу сравнения двух дисперсий: дисперсии MSR, обусловленной регрессией, и остаточной дисперсии S2 . При этом необходимо установить, значимую ли часть полной дисперсии DY объясняет модель, содержащая в общем случае регрессоры X1….xp-1. Для этого выдвигается статистическая гипотеза H0 : β12=….=β =0, т е гипотеза о том, что в модели

Yi = β0 + β1*x1,i+…+βp-1*xi,p-1i. Вычисляя выборочное значение F-критерия и сравнивая его с табличным FT(λ, р-1, n-p), проверяют выполнение неравенства. При F<=FT гипотеза H0 (гипотеза о неадекватности модели) принимается, в противном случае регрессия признается значимой.

На практике применяется правило: модель считается адекватной и пригодной для прогноза в случае, если F>4FT (λ, р-1, n-p).

При известном R значение F-критерия можно определить по формуле F= или для линейной парной регрессии F=(n-2)

Ошибка аппроксимации.

Аср.= 1/n(∑(yi-yi^/yi))*100%

5%-7% - хорошее качество аппроксимации.



Поделиться:


Последнее изменение этой страницы: 2016-08-26; просмотров: 234; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 52.14.221.113 (0.008 с.)