Моделирование линейного уравнения регрессии.




ЗНАЕТЕ ЛИ ВЫ?

Моделирование линейного уравнения регрессии.



Линейная регрессия на графике изображается в виде прямой так, чтобы точки эмпирической линии располагались по обе стороны ее и по возможности ближе к ней.

Известно следующее уравнение линейной регрессии:

y = ax + b (6.1)

где у – значение зависимой переменной (признак); х – значение независимой переменной (фактор, влияющий на признак); а – коэффициент регрессии, показывающий степень зависимости между переменными (может быть также выражен тангенсом угла наклона линии регрессии к оси абсцисс); b – ордината линии, показывающая смещение начала прямой относительно начала координат.

Определим двумя способами неизвестные параметры а и b. Используем для этого пример нахождения линейной корреляции (см. п. 5.1).

Пример. Следует установить, как влияет гидролитическая кислотность i, мэкв. на 100 г почвы) на содержание подвижного марганца i, мг/кг почвы). В результате аналитических работ получены следующие данные:

хi
уi

Для решения поставленной задачи используем способ координат точек. Результаты наблюдений наносим на график, затем проводим прямую так, чтобы число точек по обе стороны линии было одинаковым (рис. 6.2). Для расчета параметров а и b выбираем две точки, которые находятся на прямой или рядом с ней (одну в начале и одну в конце). Используем координаты точек 1-й и 8-й: x1 = 69, у1 = 18; х8 = 95, y8 = = 90. Подставляя значения переменных в общее уравнение прямой, получаем систему уравнений:

Решаем эту систему относительно а и b: b = 18 – 69 а; 90 = 95a + (18 – 69a); 72 = =26a; a = 2,76 (или tg = 70°06'); b = 18 – 69 ∙ 2,76 = –173,07. Получив количественное значение параметров a и b, связь между х и у можно выразить конкретным уравнением регрессии:

y = 2,76x – 173,07, r0,99 = 0,87.

Это уравнение можно использовать для расчета содержания марганца, если имеются данные по гидролитической кислотности (с учетом заданных условий).

Приведенное выше уравнение регрессии можно получить также способом наименьших квадратов, используя координаты всех точек. Этот способ заключается в построении такой линии на графике, чтобы сумма квадратов отклонений от нее до точек эмпирической линии регрессии была наименьшей. Для определения параметров а и b составляется система уравнений:

(6.2)

Систему уравнений выводим следующим образом. Подставляем в общее уравнение прямой (6.1) все имеющиеся значения по гидролитической кислотности (х)и содержанию подвижного марганца (y), суммируем правые и левые части и получаем первое уравнение:

(6.3)

Затем каждое исходное уравнение из (6.3) умножаем на соответствующее значение х; просуммировав правые и левые части, получим второе уравнение:

Для расчета параметров а и b составляем табл. 6.1. Полученные данные подставляем в систему уравнений (6.2):

Решая систему, находим искомые параметры: а = 2,30 (tg = 66°30'); b= = 130,9. Подставив полученные показа­тели в искомое уравнение регрессии, находим y = 2,30x –130,9, r0,99=0,87.

Хотя значения параметров а и b, рассчитанные двумя способами, близки между собой, второй способ (наименьших квадратов) более точно определяет положение линии регрессии.

После составления уравнения регрессии и определения параметров а и b производим расчет точек у' теоретической линии регрессии. Для этого в уравнение регрессии поочередно подставляем значения х. Степень совпадения теоретической и эмпирической линии регрессии можно проверить, используя критерий хи-квадрат. Цифровые показатели для
(у у')2/у' (см. табл. 6.1) суммируем и получаем χ2= 30,47. Поскольку χф2 = 30,47 > χт2 = 21,66 при Р = 0,99 для ν = 9, то можно указать на недостаточное соответствие теоретической линии регрессии эмпирическому ряду. Составленные уравнения регрессии можно проверить на точность зависимости между переменными (х, у)не только по критерию хи-квадрат, но и по коэффициенту точности выравнивания линии r1, отражающему степень приближения (соответствия) фактических данных наблюдения к вероятным. Этот коэффициент определяем следующим образом:

, (6.4)

где (уф – Мф) = α – отклонение индивидуальных вариант от общего среднего арифметического по у; (уф ув)= β – отклонение индивидуальных экспериментальных вариант по у от расчетных по уравнению.

На основании исходных данных, полученных в табл. 6.2, используя формулу (6.4), имеем:

.

Принято считать: если r1 > 0,95, то уравнение регрессии соответствует более точному положению линии на графике. При r1 < 0,95 необходимо найти другую математическую зависимость. В приведенном примере r1 = 0,88 < 0,95, поэтому следует подобрать другую математическую зависимость. Такие же выводы получены при проверке на точность зависимости между переменными по критерию хи-квадрат. Оба критерия оценки (χ2, r1) на точность выравнивания линии уравнения регрессии используются и для других форм регрессионной зависимости.





Последнее изменение этой страницы: 2016-08-15; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.239.242.55 (0.004 с.)