Проверка адекватности регрессионной математической модели 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Проверка адекватности регрессионной математической модели



Использование регрессионной модели позволяет вычислять значения в любой области варьирования факторов. Для чего в уравнение регрессии надо подставить соответствующие значения варьируемых факторов. Проверка адекватности модели необходима для того, чтобы убедиться в том, действительно ли, она правильно отражает поведение исследуемого объекта. Если выходная величина, рассчитанная по модели, существенно не отличается от той, которая получена экспериментальным путем, можно считать, что модель является адекватной.

Пусть основных опытов экспериментального плана и число параллельных (дублированных) опытов в каждом ом основном опыте, число оцениваемых коэффициентов регрессии в математической модели.

Если число основных опытов больше числа коэффициентов регрессии , то такой план эксперимента называется не насыщенным и в этом случае можно проверить адекватность математической модели. В противном случае, проверить адекватность невозможно.

Последовательность действий при проверке математической модели.

1. Рассчитывают сумму квадратов разностей между измеренными и полученными в результате расчетов по уравнению регрессии ;

а) в случае равномерного дублирования опытов

 

(3.26)

 

б) в случае неравномерного дублирования опытов

(3.27)

 

 

в) при отсутствии дублирования опытов

(3.28)

 

 

· Вычисляют число степеней свободы дисперсии адекватности

 

(3.29)

 

2. Вычисляют дисперсию адекватности

 

(3.30)

3. По критерию Фишера проверяют однородность дисперсий адекватности и воспроизводимости

 

(3.31)

 

Полученное значение сравнивают с , выбранном при уровне значимости и числах степеней свободы и Если выполняется условие то модель можно считать адекватной исследуемому объекту.

Можно оценить эффективность модели (ее информационную ценность). Для этого необходимо сделать следующее.

· Вычислить дисперсию относительно среднего значения отклика

 

(3.32)

где среднее значение функции отклика по всем опытам.

 

· Рассчитывают остаточную дисперсию :

(3.33)

 

 

· Вычисляют величину

 

(3.34)

 

Величина показывает, во сколько раз уравнение регрессии точнее описывает результаты эксперимента по сравнению со средним значением . Модель считается эффективной, если раз.

Для экспериментов с дублированными опытами формулы для вычисления рассчитываются по следующим формулам:

 

 

(3.25)

 

 

где значение выходной величины в ом дублированном опыте го основного опыта; число основных опытов:

 

(3.36)

 

Пример обработки результатов полного факторного эксперимента с двумя факторами.

План полного факторного плана с двумя факторами представлен в таблице 3.4.

Таблице 3.4

 

Вычисляем средние значения факторов по сериям дублированных опытов:

 

Поместим данные в таблицу 3.5.

 

Таблица 3.5


Вычисляем коэффициенты регрессионной математической модели:

 

Регрессионная математическая модель будет иметь вид:

 

 

Вычисление предсказанных значений функции отклика для всех основных опытов:

 

Проверка однородности дисперсий

 

 

Вычисление расчетного коэффициента Кохрена :

 

 

Табличный коэффициент Кохрена

Поскольку ( табличное значение коэффициента Кохрена), то гипотеза об однородности дисперсий принимается.

Вычисляем дисперсию воспроизводимости :

 

 

Вычисляем дисперсии коэффициентов регрессии:

 

 

Проверяем значимость коэффициентов регрессионной математической модели:

 

Поскольку меньше все коэффициенты значимы.

Проверка адекватности математической модели осуществляется в следующей последовательности:

 

· Вычисляется :

 

 

 

· Число оцениваемых коэффициентов регрессии

 

 

· Число степеней свободы, связанных с дисперсией адекватности:

 

 

· Дисперсия адекватности :

 

 

· Вычисление расчетного коэффициента Фишера:

 

 

· Табличный коэффициент Фишера

 

Поскольку то математическая модель адекватна.

Проверка эффективности оценивают в следующей последователь-ности.

 

· Выборочное среднее по всем сериям опытов :

 

 

· Вычисление дисперсии относительно среднего значения отклика

 

 

· Вычисление остаточной дисперсии

 

· Вычисление отношения .

Регрессионная модель считается эффективной, если В данном случае это условие выполнено.

Графики функции представлены на рисунке 3.6.

а) б)

 

 

Из графика видно, что данная зависимость является плоскостью в трехмерном пространстве.

Из графиков, рисунок 3.6, хорошо видно, что с увеличением фактора выходная величина увеличивается (коэффициент ), с увеличением фактора уменьшается (коэффициент ).

Чтобы оценить влияние взаимодействия факторов на выходную величину , необходимо в таблицу 6 ввести еще один столбец, таблица 3.6.

 

Таблица 3.6

Тогда коэффициент рассчитывается по формуле:

 

.

 

Теперь модель будет иметь вид

 

 

Проверим значимость коэффициента :

 

 

Расчетный коэффициент больше табличного , поэтому его необходимо включить в математическую модель.

 

Коэффициент оказался значимым, поэтому план стал насыщенным, и проверить адекватность модели невозможно.

План эксперимента можно записать с буквенными обозначениями уровней факторов, таблица 3.7.

 

Таблица 3.7

 

Здесь комбинации факторов на различных уровнях:

(1) - все факторы на нижнем уровне;

a - первый фактор на верхнем уровне;

b - второй фактор на верхнем уровне;

ab - оба фактора на верхнем уровне.

 

Такая запись матрицы плана полного факторного эксперимента значительно сокращает ее запись, особенно в том случае, когда количество факторов достаточно велико. Например, матрица ПФЭ для 3-х факторов будет иметь вид, таблица 3.8.

Таблица 3.8

 

Как видно из таблицы 9, запись матрицы ПФП в буквенных обозначениях для трех факторов значительно меньше матрицы со значениями 1 и +1.

 

3.8. Дробный факторный эксперимент [1, 3, 5, 24, 26, 36]

Количество опытов в полном факторном плане быстро увеличивается при увеличении количества варьируемых факторов Например, при число основных опытов Если, например, количество дублированных опытов , число опытов станет равным Такое количество экспериментов естественно совершенно недопустимо, особенно на начальном этапе экспериментального исследования. Поэтому необходимо найти способ сокращения количества экспериментов. Решение этой задачи подсказывает тот факт, что многие взаимодействия факторов лишь незначительно, а и то вовсе не влияют на выходную величину. Поэтому некоторое взаимодействие факторов можно заменить новым фактором, например, . И тогда вместо плана полного факторного эксперимента с четырьмя факторами () можно использовать матрицу плана с тремя факторами (). Это позволяет вместо основных опытов поставить эксперимент с опытами, то есть количество опытов сократится вдвое. Это будет, так называемый, дробный факторный план (ДФП). Матрица ДФП представлена в таблице 10.

Такой эксперимент называется дробным факторным экспериментом (ДФЭ). Этот план ДФЭ обозначается как . В плане ДФЭ столбец полностью повторяет столбец столбец столбец совпадает со столбцом и т. д. Отсюда следует, что оценки коэффициентов будут смешанными, то есть они являются совместными оценками двух эффектов:

 

(3.37)

 

Например, для ДФЭ можно составить следующие восемь генерирующих соотношений:

(3.38)

 

 

Таблица 3.9

 

Коэффициент регрессии со смешанными оценками могут удовлетворительно оценивать соответствующий истинный коэффициент, при условии, что второй эффект отсутствует, то есть его коэффициент незначимо отличается от нуля.

План дробного факторного эксперимента типа называется полурепликой от полного факторного эксперимента

Если в эксперимент включить еще один фактор, приравняв его к какому-нибудь взаимодействию факторов, например, получим четверть реплики от ПФЭ или Система смешивания оценок будет иметь вид

 

(3.39)

 

При введении еще одного фактора, например, получим ДФП типа реплики ПФЭ и т. д.

В ДФЭ типа каждая из групп содержит смешанных эффектов взаимодействия факторов.

Генерирующим соотношением или генератором плана называется соотношение, в котором в левой части стоит новый фактор, а в правой – произведение некоторых взаимодействий факторов, то есть генерирующее соотношение показывает, какие взаимодействия заменены новыми факторами.

Возникает необходимость выбрать, такое из восьми взаимодействий лучше выбрать для построения ДФД .

Определяющим контрастом называется соотношение, определенное как символическое произведение столбцов плана, равное +1 или 1:

 

(3.40)

 

С помощью определяющего контраста можно легко получить систему смешивания эффектов взаимодействия факторов.

Пусть необходимо определить систему смешивания оценок для генерирующего соотношения с определяющим контрастом поскольку Для этого необходимо умножить правую часть определяющего контраста на

 

(3.41)

 

Из полученного соотношения получаем следующую систему смешивания оценок:

(3.42)

 

Таким образом, для рассматриваемых генераторов плана будем иметь следующие оценки:

 

(3.43)

 

В шести указанных планах все линейные эффекты смешаны только с парными взаимодействиями и могут быть оценены независимо, если парные взаимодействия равны нулю. Реплики, в которых линейные эффекты смешаны с парными взаимодействиями, называются планами с разрешающей способностью R=III (по количеству факторов в определяющем контракте).

Дробные реплики с одинаковым количеством опытов могут иметь различные разрешающие способности. Например, для плана эксперимента

можно построить восемь полуреплик с различными разрешающими способностями со следующими ОК:

 

(3.44)

 

Какую реплику следует выбрать из восьми возможных?

Если необходимо более точно определить линейные эффекты, при условии, что тройные и взаимодействия более высокого порядка незначимы, можно выбрать полуреплику с или то есть с генерирующими соотношениями или Количество факторов в ОК этой реплики

Если нужно, чтобы линейные эффекты оценивались независимо от парных взаимодействий, необходимо использовать полуреплики с определяющими контрастами или с количеством членов для генерирующих соотношений . Эти полуреплике записываются только четными комбинациями букв

(3.45)

только нечетными комбинациями букв

 

(3.46)

 

Полуреплики, в которых новые вводимые факторы приравнивают взаимодействиям наивысших порядков, обладают максимальной разрешающей способностью . Они называются главными полурепликами.

Для полуреплики определяющие контрасты будут главными, поскольку они имеют максимальное число факторов.

Если взять, например, полуреплику с ОК то система смешивания оценок будет В этой полуреплике основные эффекты связаны с парными взаимодействиями.

Для полуреплики с ОК система смешивания оценок будет В этой полуреплике основные эффекты связаны с тройными взаимодействиями. В общем случае будет меньше (), потому предпочтение отдается полуреплике с ОК . Это позволяет уменьшить ошибку в оценке линейных коэффициентов регрессии

Введя новый фактор , можно получить четверть-реплику . Пусть , тогда определяющими контрастами будут и

Чтобы полностью охарактеризовать разрешающую способность четверть реплики, вводится понятие обобщающего определяющего контраста (ООК). В нашем примере третий определяющий контраст получается перемножением двух исходных то есть а их ООК будет иметь вид:

 

(3.47)

 

Этот план имеет разрешающую способность поскольку два ОК содержат по три члена. Коэффициенты регрессии будут являться совместными оценками:

 

(3.48)

Основные эффекты, без парных взаимодействий, можно получить, добавив новую четверть-реплику с ООК в которой факторы заменены на обратные. Этот метод называется «методом перевала». В результате получаем из реплики с разрешающей способности реплику с разрешающей способностью

 

Реплики большой дробности

Процедура выбора реплики большой дробности совершенно аналогична, рассмотренной ранее. Пусть необходимо провести эксперимент по ДФП с числом факторов При этом надо выбрать 1/8-реплики . Замена факторов , например, осуществляется следующим образом:

(3.49)

В таблице 3.10 приведены зависимости количества основных опытов от дробности реплики.

Таблица 3.10

 

Для каждого из этих решений можно сделать шесть перестановок. В итоге мы получаем 24 возможности выбора 1/8 реплики.

Наименее удачным будет выбор номер один, поскольку в нем линейные эффекты смешиваются с парными взаимодействиями.

Если априори известно, что взаимодействие будет наиболее существенным, необходимо выбрать второе решение, если третье, если четвертое.

Пусть мы выбрали четвертое решение, полагая, что фактор является наиболее существенным. Приравняем тройному взаимодействию и запишем генерирующие соотношения в виде

 

(3.50)

 

При этом мы ограничимся парными и тройными взаимодействиями факторов.

Для 1/8 реплики с генерирующими соотношениями

 

(3.51)

 

и определяющими контрастами:

 

(3.52)

 

Если попарно перемножить эти определяющие контрасты, то получим:

 

(2.53)

 

Произведение трех определяющих контрастов будет равно

Чтобы полностью охарактеризовать разрешающую способность этой 1/8 реплики, найдем обобщающий определяющий контраст

 

(3.54)

 

Получается следующая система смешивания:

 

(3.55)

 

С ростом числа факторов дробность реплик увеличивается и усложняется система смешивания оценок. Предельное число факторов для восьми опытов – семь. В этом случае оцениваются восемь коэффициентов линейного уравнения

 

(3.56)

 

число степеней свободы равно нулю .

С ростом числа факторов от 8 до 15 необходимо ставить 16 опытов.

Предельное число факторов для 16 опытов – пятнадцать. План с максимальным числом факторов для данного числа опытов и заданной модели называется насыщенным. В этом случае число основных опытов

равно числу оцениваемых коэффициентов регрессии Поэтому адекватность такой модели проверить нельзя.

Пример. Пусть задана матрица плана ДФЭ для трех факторов (полуреплика от ПФП ), таблица 3.11.

 

Таблица 3.11

ДФЭ

 

Здесь – факторы в нормализованных значениях; -факторы в натуральных значениях; – значения выходной величины в дублированных опытах – средние значения выходной величины в основных опытах.

Вычисляются оценки коэффициентов регрессии:

 

 

 

Регрессионная математическая модель в данном случае будет иметь вид

Вычисление предсказанных значений функции отклика для всех основных опытов:

 

 

Проверка однородности дисперсий по сериям дублированных опытов:

 

 

Вычисление расчетного коэффициента Кохрена :

 

 

Табличный коэффициент Кохрена

Поскольку ( табличное значение коэффициента Кохрена), то гипотеза об однородности дисперсий принимается.

Вычисляем дисперсию воспроизводимости :

 

 

Вычисляем дисперсии коэффициентов регрессии:

 

 

Проверяем значимость коэффициентов регрессионной математической модели:

 

 

Поскольку меньше коэффициенты значимы. Коэффициент незначим. Графики зависимостей функции отклика от каждого из варьируемых факторов представлены на рисунке 23.

 

Поскольку план эксперимента насыщенный, проверить адекватность математической модели невозможно.

В рассматриваемом плане генерирующим соотношением будет , определяющий контраст Умножая последовательно определяющий контраст на , и , получим следующую систему смешивания оценок:

 

(3.57)

 

Разрешающая способность этой дробной реплики будет равна



Поделиться:


Последнее изменение этой страницы: 2017-02-08; просмотров: 1319; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.147.89.24 (0.162 с.)