Статистический анализ уравнений регрессии 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Статистический анализ уравнений регрессии



Дисперсия воспроизводимости

После постановки опытов и получения уравнения регрессии приступают к его статистическому анализу. При этом решают две задачи: оценивают значимость коэффициентов регрессии и проверяют адекватность математической модели. Соответствующей характеристикой является дисперсия параметра процесса (воспроизводимости), обозначаемая через s 2{ у }. Рассмотрим способы ее вычисления в зависимости от методики дублирования опытов.

1. Равномерное дублирование. Каждый из запланированных опытов повторяется одинаковое число раз, т. е. имеется N серий, в каждой
из которых ставится п дублированных (параллельных} опытов.

Обозначим результаты опытов первой серии через .
По ним можно рассчитать дисперсию первого опыта

,

где  – среднее по серии дублированных опытов;

 

Аналогично рассчитываются среднее  и дисперсии  всех остальных опытов:

                                     ;                                           (5.1)                                                                                    .                                     (5.2) 

                                                                

Отметим, что n – 1 числа степеней свободы всех дис-
персий одинаковы, т. е. . В качестве дисперсии вос-производимости  берется среднее арифметическое дисперсий
опытов

где N(n – 1 ) – число степеней свободы  этой дисперсии, равное сумме степеней свободы дисперсий опытов, N (n – 1) .                                                                                                           

2. Неравномерное дублирование. Каждый j -й опыт повторяется
в этом случае некоторое число раз . Как и в предыдущем случае, дисперсии первого, второго,..., j -го опытов  рассчитываются по формулам, аналогичным (5.1, 5.2), только вместо   n   подставляют .                                          

Числа степеней свободы дисперсий различны: . Диспер-
сия воспроизводимости для этого случая определяется по фор-
муле

.

Число степеней свободы

.

3. При отсутствии дублированных опытов для оценки дис-
персии воспроизводимости проводят отдельную серию опытов. Дисперсия опытов этой серии служит оценкой дисперсии воспроизводи-
мости.

 

8.2. Оценка точности, значимости коэффициентов регрессии
и интерполяция результатов

После того как получено уравнение регрессии и рассчитана оценка дисперсии воспроизводимости, следует оценить точность, с которой найдены коэффициенты регрессии. Поскольку они вычисляются по результатам эксперимента, а эти результаты являются случайными величинами, то случайными величинами будут и коэффициенты регрес-сии b . Поэтому в качестве показателя точности отыскания коэффициен-
та   b удобно  взять его дисперсию .

Для получения дисперсий коэффициентов регрессии используют матрицу   базисных функций Х. Рассмотрим матрицу Х) , элементы
которой обозначим через . Это квадратная матрица размером
(k + 1)(k + 1),  называемая ковариационнойматрицей:

Умножив каждый ее элемент на дисперсию воспроизводимости , можно  показать,  что  полученная  матрица  имеет  вид

            .               (5.3.)

Тогда

.

По главной диагонали матрицы (5.3) располагаются дисперсии коэффициентов регрессии, а недиагональные элементы – это ковариации между коэффициентами регрессии. Ковариация, так же как и коэффициент корреляции, является мерой линейной статистической связи между
двумя случайными величинами. Оценка ковариации двух случайных величин х и у, принимающих в однородной серии из n опытов значения :

.

Аналогично коэффициенту корреляции ковариация между не-зависимыми случайными величинами равна нулю. Таким образом,
для отыскания дисперсии коэффициентов регрессии требуется в
общем случае проделать сложные матричные преобразования. Пусть теперь имеет место дублирование опытов. В этом случае Х
будем формировать, учитывая только основные опыты; каждая строка будет содержать тогда условия проведения серии дублированных
опытов.

Рассмотрим отдельно случай равномерного дублирования. Для по-лучения оценок дисперсий и ковариаций коэффициентов регрессии следует каждый элемент матрицы (см. (5.3)) разделить
на число п дублированных опытов. Если же дублирование неравно-
мерное, эти оценки дисперсий и ковариаций коэффициентов регрессии являются элементами матрицы , где Р – матрица дубли-рования.

Для большинства планов, рекомендуемых теорией эксперимента, существуют простые формулы для отыскания дисперсий коэффициен-
тов регрессии, их дисперсий и ковариаций между ними. Более того,
ряд таких планов составлен исходя из требования равенства нулю ковариаций между коэффициентами регрессии. Это так называемые ортогональныепланы, к которым относятся, в частности, пол-
ный и дробный факторные планы.

При ортогональном планировании отбрасывание незначимых коэф-фициентов регрессии не приводит к изменению оценок остальных коэффициентов.

Для ортогональных планов оценки дисперсий  коэффициентов регрессии можно рассчитать по формулам:

без дублирования опытов, т. е.  при n = 1

;

при равномерном дублировании

.

После того как найдены оценки дисперсий коэффициентов регрессии, следует выявить незначимые коэффициенты, которые в математической модели можно приравнять нулю. Для этого используется t -критерий Стьюдента. Для каждого коэффициента регрессии  отыскивают t -отно-шение:

.                                             (5.4)                                                                

В формуле (5.4) в числителе стоит абсолютная величина коэффициента регрессии, в знаменателе – его эмпирический стандарт: корень квадратный из оценки дисперсии. Вычисленную величину  сравнивают с табличным значением  критерия Стьюдента [3]
для заданного уровня значимости q и числа степеней свободы .

Если , то коэффициент регрессии значим. Чем  больше, тем существеннее влияние на отклик у, оказываемое фактором   при этом коэффициенте. Если же , то коэффициент регрессии   незначим и член в уравнении регрессии должен быть отброшен. С учетом (5.4) условие того, что коэффициент регрессии незначим, можно записать
в более удобном виде:

.

При отбрасывании незначимых членов уравнения возникает определенное неудобство, связанное со статистической зависимостью коэффициентов регрессии. Эта зависимость проявляется в том, что
  после того как незначимые коэффициенты регрессии приравняли к нулю, оценки остальных коэффициентов регрессии изменяются. Отсюда практический вывод: после отбрасывания незначимых коэффициен-
тов регрессии желательно снова воспользоваться МНК для уточне-
ния оставшихся значимых коэффициентов регрессии.

С помощью t -критерия можно найти доверительный интервал
для произвольного коэффициента регрессии . Обозначим истинную величину этого коэффициента через . Тогда

.

Даже простейшая линейная модель позволяет получить важную информацию об объекте исследования. Запишем ее в нормализованных обозначениях факторов:

                                                           (5.5)                                                        

Коэффициенты этой математической модели имеют четкий физический смысл. Очевидно, что коэффициент   равен значению выходной величины, рассчитанному по уравнению регрессии, если все факторы зафиксированы на основном уровне, т. е. в середине диапазона варьирования. Знак коэффициента   свидетельствует охарактере влияния соответствующего фактора: если , то с ростом значения фактора  выходная величина растет; если , то с ростом  отклик уменьшается. Величина   равна приросту выходной величины, полученному при увеличении значения фактора   на половину диапазона его варьирования, например, с основного  до верхнего уровня . Как уже указывалось, из вида модели (5.5) следует, что графиком зависимости величины у от любого фактора  является прямая. Рассмотрение зависимостей выходной величины у от этого фактора при различных фиксированных значениях других факторов позволит получить семейство прямых, причем все эти прямые будут параллельны. Это связано с тем, что представление регрессионной модели в линейном виде (5.5) предполагает отсутствие взаимодействий факторов.

Чем больше абсолютная величина линейного коэффициента регрессии в модели (5.5), тем сильнее влияние соответствующего фактора.

Если, например, , то можно сделать вывод, что изменение фактора  в пределах его диапазона варьирования оказывает большее влияние на изменение отклика, чем варьирование фактора  в его диапазоне. Таким образом, с помощью линейной регрессионной модели можно сравнить степень влияния факторов на выходную величину
и выявить важнейшие из них.

 



Поделиться:


Последнее изменение этой страницы: 2021-03-09; просмотров: 110; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.47.253 (0.012 с.)