Метод наименьших квадратов (МНК) в расчете уравнения регрессии 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Метод наименьших квадратов (МНК) в расчете уравнения регрессии



Цель работы.

Студент должен знать: смысл регрессии x по y (регрессионных зависимостей), способы определения параметров регрессии (для линейной и квадратичной регрессии), метод наименьших квадратов.

Студент должен уметь: произвести расчет уравнения регрессии по результатам экспериментов произвести анализ программ ЭВМ для реализации метода регрессионного анализа.

Практическое значение выполняемых исследований

Различные величины, наблюдаемые в эксперименте, могут явно или неявно зависеть друг от друга. В последнем случае мы говорим о регрессии y по x Использование программ в языках программирования (например, BASIC) для нахождения параметров уравнения регрессии и обработки результатов экологических исследований. Данная работа позволяет обучаемому получить необходимые навыки в этой области.

Литература

1. В.М. Еськов, О.Е. Филатова, В.А. Рачковская Статистическая обработка результатов измерений в практикуме по экологии и естествознанию.- Сургут: Изд. СурГУ, 1999.- 43 с.

2. М. Дж. Кендалл, А. Стьюарт. Теория распределений.

3. В. В. Гмурман. Теория вероятностей и математическая статистика. – М.:

4. Ю. В. Линник. Метод наименьших квадратов. – М. – 2001. – 196 с.

Бюджет времени

На изучение темы отводится 6 часов, из них 2 часа лекций, 2 часа лабораторные занятия и 2 часа на самоподготовку.

 

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО I ЭТАПУ

"Самоподготовка"

Для подготовки к лабораторной работе Вам следует повторить пройденный материал и изучить лекции. Ответьте на следующие вопросы:

1. Что такое регрессионное уравнение? Для чего его используют?

2. Как проверяется соответствие гипотезы эксперименту методом наименьших квадратов?

3. Приведите алгоритм нахождения линейной регрессии.

 

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО II ЭТАПУ:

“Выполнение лабораторной работы”

Для выполнения этапа наберите описанную в блоке информации программу, реализующую алгоритм нахождения регрессионных уравнений. Оцените полученные параметры уравнения регрессии и сделайте выводы.

Блок информации

Сглаживание экспериментальных зависимостей можно выполнять методом наименьших квадратов. Уравнение регрессии может быть линейным, квадратичным и др. Рассмотрим простейший случай зависимости y=kx+b. Часто требуется построение графиков по эмпирическим данным или экспериментальное подтверждение известным из теории функциональным зависимостям между физическими величинами. Например, известна зависимость сопротивления металлов от температуры

(10.1)

которую можно записать в виде линейной зависимости

y=ax+b, (10.2)

где у=Rt, x=t, b=Ro, a=Roa. Часто популяционный рост на небольших участках времени также аппроксимирует такой линейной зависимосьтью.

В общем случае экспериментальных измерениях получают множество xi и соответствующих им yi (в данном случае ti и Rti). Однако, существуют случайные отклонения (ошибки) и, как следствие, разброс точек, т.е. вместо гладкой линии получается ломаная кривая. Для усреднения эмпирических зависимостей и получения наиболее реального графика используют графический, арифметический, алгебраический способы выравнивания экспериментальных данных. Наиболее точный из них- алгебраический, метод наименьших квадратов. В этом случае составляют сумму квадратов отклонений эмпирических значений yi от предполагаемых теоретических f(xi) и требуют минимума этой суммы, т.е.

 

(10.3)

 

где W®min, n- число измерений

При этом отдельные точки могут значительно отклоняться от графика (см. рис. 10.1), но, в целом, вся совокупность точек отклоняется на минимальное расстояние.

Так как в функцию f(x) входят параметры a,b,.., т.е. f(x,a,b...), то минимизируют по параметрам, используя необходимое условие экстремума функции W=W(a, b):

 

(10.4)

 

Поясним выше сказанное на конкретном примере зависимости (10.2). Здесь после подстановки f(x) имеем:

,

тогда

или

(10.5)

а

или

(10.6)

 

Получим систему двух уравнений (10.5)и (10.6) относительно неизвестных a и b (yi,xi получены в эксперименте). Эта система имеет вид:

 

 

 

Рис.10.1. Реализация метода наименьших квадратов

 

 

где

.

 

Тогда получим

 

 

Из решения этой системы уравнений можно получить для примера (10.1) значения параметров R0 и a:

(10.7)

и температурный коэффициент

(10.8)

 

Зная Ro и a легко построить график зависимости R=R(t). Отметим, что зависимость среднего значения какой- либо величины (например, R) от некоторой другой величины (t) называется регрессией y=u(х). Уравнение y=u(х), в котором х играет роль "независимой" переменной называется уравнением регрессии, а соответствующий график- линией регрессии величины у по х. Если регрессия у по х линейная, то можно записать, что

 

,

 

где my mx- математическое ожидание х и у, sx2 sy2- дисперсии х и у, r- коэффициент корреляции между х и у. Существенно, что для нормального совместного распределения обе линии регрессии y=u(х) и х=v(у) являются прямыми. Понятие коэффициента корреляции r раскрывается в следующей работе.

 

 

Приложение 1

 

 

ПРОГРАММА ОПРЕДЕЛЕНИЯ КОЭФФИЦИЕНТОВ

ЛИНЕЙНОЙ РЕГРЕССИИ

 

REM ************ f(x)=kx+b ********************

CLS

INPUT "введите количество n: ", n

DIM x(n): DIM y(n)

REM ********* заполнение массивов *************

FOR i = 1 TO n

PRINT "x ("; i; ") =";: INPUT "", x(i)

PRINT "y ("; i; ") =";: INPUT "", y(i)

NEXT i

REM *******************************************

REM********************************************

FOR i = 1 TO n

L = L - x(i) * y(i): REM L=S(-yx)

M = M + x(i) * x(i): REM M=S(x¤)

NN = NN + x(i): REM NN=S(x)

R = R + y(i): REM R=S(y)

NEXT i

REM *******************************************

REM********************************************

k = (L * n + R * NN) / (NN ^ 2 - M * n)

b = (R - k * NN) / n

PRINT "Имеем зависимость вида: y = k * x + b, где"

PRINT "k = "; k

PRINT "b = "; b

 

Лабораторная работа № 11

Программа расчета уравнения регрессии и коэффициента корреляции

 

Блок информации

Понятия о корреляционных зависимостях. Вычисление коэффициента корреляции. Множественная корреляция.

Существуют методы оценки близости полученных эмпирических данных с функциональными зависимостями типа (3.10), более того, можно оценить степень взаимосвязи различных наблюдаемых переменных, используя коэффициент корреляции r. Отметим, что в корреляционном анализе уравнение (3.10) получило название выборочного уравнения прямой линии регрессии у на х, причем, коэффициент a=ryx получил название выборочного коэффициента регрессии у на х.

При большом числе измерений каждому из значений х и у соответствует не одно, а несколько значений этих величин. Тогда данные эксперимента группируют в так называемую корреляционную таблицу (см. таблицу 2). В этой таблице nv - число встречаемости одинаковых значений v, а nt - одинаковых t и nvt - число встречаемости одинаковых пар v и t во всех опытах (они находятся на пересечении соответствующих строк и столбцов). В первой строке таблицы указаны наблюдаемые значения СВ t, а в первом столбце - значения СВ v. Очевидно, что

,

т.е. общему числу измерений. Отметим, что средние значения

, (3.17)

Тогда коэффициент регрессии определится по формуле, которая является модификацией (3.15) с учетом замечаний (3.17).

 

(3.18)

 

Выборочный коэффициент корреляции , где и - выборочные средние квадратические отклонения, определяемые по формулам

(3.19)

 

Как уже отмечалось выше (2.IV) для распределения Гаусса при r=0 величины v и t независимы, а при r=1 они связаны чисто функциональной зависимостью типа (3.10), что весьма важно для практических выводов.

В данном примере (таблица 2) зависимость v=vo+rvtt имеет конкретный физический смысл- это газовый закон Гей-Люссака, причем , а из rvt можно найти a - коэффициент теплового расширения газа (rvt=voa).

В общем случае выборочный коэффициент корреляции определяется по формуле:

,

где

Существенно, что r может отличаться от коэффициента корреляции rх,у, который можно рассчитать по формуле:

,

 

где , а sх и sу- средние квадратические отклонения.

При изучении связи между несколькими СВ х1, х2, …, хn используют корреляционную матрицу, состоящую из коэффициентов корреляции rij. Используют также множественный коэффициент корреляции. Например, при n=3 имеем

,

который характеризует меру линейной зависимости между СВ х1 2-мя другими СВ (х2 и х3).

Для таких случаев вычисляются и частные коэффициенты корреляции (когда, например, исключается влияние х3) между х1 и х2. Для этих величин разработаны специальные программы на ЭВМ.

 

 

Приложение 1

ПРОГРАММА РАССЧЕТА КОЭФФИЦИЕНТОВ КОРРЕЛЛЯЦИИ

 

REM **программа вычисляет коэффициент корреляции **

CLS

xs = 0: ys = 0: h = 0: sdx = 0: sdy = 0

INPUT "Kоличество n= ", n

REM ********* заполнение массивов ***********

DIM x(n): DIM y(n)

FOR m = 1 TO n

PRINT "x ("; m; ") =";: INPUT "", x(m)

PRINT "y ("; m; ") =";: INPUT "", y(m)

NEXT m

REM ********************************************

REM ************* средние x и y ******************

FOR m = 1 TO n

xs = xs + x(m)

ys = ys + y(m)

NEXT m

xs = xs / n: ys = ys / n

REM *******************************************

FOR m = 1 TO n: sdx = sdx + (x(m) - xs): NEXT m

FOR m = 1 TO n: sdy = sdy + (y(m) - ys): NEXT m

FOR m = 1 TO n: h = h + (y(m) - ys) * (x(m) - xs): NEXT m

REM ********************************************

REM ************ дисперсия *********************

FOR m = 1 TO n

sx = sx + (x(m) - xs) ^ 2

sy = sy + (y(m) - ys) ^ 2

NEXT m

cx = sdx / n: cy = sdy / n

REM **** среднее квадратическое отклонение *****

sxs = SQR((sx / n) - cx ^ 2)

sys = SQR((sy / n) - cy ^ 2)

REM ********* коэффициент корреляции ***********

rxy = ((h / n) - cx * cy) / (sxs * sys)

PRINT "Koэффициeнт kоppеляции rxy= "; rxy

SLEEP 15

 

 

Лабораторная работа № 12.



Поделиться:


Последнее изменение этой страницы: 2016-04-07; просмотров: 475; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.190.217.134 (0.038 с.)