Глава 5. Регрессионные модели с одной входной переменной 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Глава 5. Регрессионные модели с одной входной переменной



 

Основные понятия

 

Технологические процессы машиностроительного производства, особенно процессы обработки резанием конструкционных материалов, очень сложны по своей физико-химической природе. До сих пор отсутст- вуют принятые всеми аналитические модели, точно описывающие законо- мерности процессов изнашивания и нагружения инструмента, тепловых процессов в зоне резания и т. д. Поэтому в технологии машиностроения очень часто используют модели, которые мы ранее обозначили как эмпи-

 

 

1 Методика отсеивания грубых выбросов по таблицам критических разностей рассмотрена в кн.: Рогов В. А. Методика и практика технических экспериментов: учеб. пособие. М., 2005. 288 с.


рические. Эмпирические модели объектов и процессов представляют со- бой результат обработки экспериментальных данных о поведении объекта или процесса методами математического статистического анализа. Очень часто для построения моделей объектов по результатам эксперименталь- ных исследований используют математический аппарат регрессионного и корреляционного анализа.

Термины «регрессия» и «корреляция» были введены в широкое упот- ребление статистиками Ф. Гальтоном и К. Пирсоном в конце XIX в. Они изучали взаимозависимости роста и массы людей разного возраста и стол- кнулись с необходимостью введения таких показателей указанной зависи- мости, которые бы отражали связь между исследуемыми характеристика- ми человека, но не определяли бы друг друга строго однозначно. В насто- ящее время «регрессия» и «корреляция» – основные понятия статистики.

Основная задача корреляционного анализа – выявление значимости связи между значениями различных случайных величин. Зависимость меж- ду величинами (в том числе и случайными), при которых одному значению одной величины (аргумента) отвечает одно или несколько вполне опре- деленных значений другой величины, называется, соответственно, одно- значной или многозначной функциональной зависимостью [11]. Зависи- мость между величинами, при которой каждому значению одной величины отвечает с соответствующей вероятностью множество возможных значе- ний другой, называют вероятностной (стохастической, статистической). Примерами корреляционной связи являются зависимости между предела- ми прочности и текучести стали определенной марки, между погрешно- стями размера и погрешностью формы поверхности детали, между темпе- ратурой испытания и прочностью материала и т. д.

Математический аппарат регрессионного анализа позволяет:

● оценить неизвестные параметры предлагаемой к исследованию регрессионной модели;

● проверить статистическую значимость параметров модели;

● проверить адекватность модели;

● оценить точность модели.

Вид регрессионной модели предлагает сам исследователь, при этом он исходит из следующего:

● физической сущности изучаемого объекта или явления;

● характера экспериментального материала;


● анализа априорной информации.

Самым простым для моделирования является объект, у которого один входной и один выходной фактор (рис. 5.1). Входной фактор характе- ризует воздействие на исследуемый объект. В технологических процессах машиностроения это могут быть температура, сила, время, геометрические параметры инструмента, характеристики обрабатываемого и инструмен- тального материалов и т. д. Выходной фактор характеризует реакцию (от- клик) объекта на воздействие входного фактора. Выходные факторы в тех- нологических процессах машиностроения – длина пройденного инстру- ментом пути, величина износа, напряжения, качество обработанной по- верхности и т. д.

 

Рис. 5.1. Объект исследования с одним входным и одним выходным фактором

 

Для начала построения эмпирической модели необходимо иметь данные экспериментальных исследований объекта (в виде таблицы или графика), в которых каждому значению входного фактора (X) соответству- ет значение выходного фактора (Y), т. е. известна пара чисел (хi, yi). Пары случайных переменных (x, y) подчиняются некоторому двумерному веро- ятностному распределению. Общее количество пар чисел пусть равно m (рис. 5.2).

 

Рис. 5.2. Графическое отображение результатов эксперимента


Данный график называется диаграммой рассеяния, или точечной диаграммой [12]. Необходимо найти такую кривую, которая бы наилуч- шим образом аппроксимировала экспериментальные точки. Для удобства дальнейшего исследования объекта эта кривая должна иметь для своего описания одну единственную формулу (функцию). Если мы соединим точ- ки на графике, то получим ломаную линию, состоящую из нескольких прямых отрезков и описываемую соответствующим количеством линей- ных моделей. Это крайне неудобно для исследования. Необходимо найти кривую, наилучшим образом описывающую все экспериментальные точки (рис. 5.3). Такую кривую называют кривой регрессии, или регрессионной кривой Y по X. В общем случае кривая регрессии может иметь любой вид (монотонно возрастающая, монотонно убывающая, с точками перегиба и т. д.), но она должна быть непрерывной, т. е. не должна иметь разрывов. В самом простом случае кривая регрессии имеет вид прямой линии.

 

Рис. 5.3. Построение линии регрессии

 

Обычно построение моделей и исследование объекта начинают с са- мых простых моделей – линейных. Линейной модели соответствует кривая регрессии в виде простой линии.

Как видно из графика (см. рис. 5.3), всегда имеются отклонения экс- периментальных точек от кривой регрессии, что вызвано влиянием других (неучтенных в модели) внешних факторов на исследуемый объект. В моде- лировании выходной фактор еще называют зависимой выходной перемен- ной, а входной – независимой входной переменной. Во время исследования


объекта входной фактор всегда носит детерминированный характер, а вы- ходной – случайный.

Выражение, которое устанавливает связь между случайной зависи- мой и детерминированной независимой переменными, представляет собой уравнение регрессии. Термин «уравнение регрессии», строго говоря, не со- всем корректный [12], но общепринятый. Модель, построенная на основе уравнения регрессии, является регрессионной моделью. Как указывалось ранее, для получения регрессионных моделей (уравнений регрессии) ис- пользуется математический аппарат регрессионного анализа.

Итак, как мы уже говорили, подбор кривой регрессии и регрессион- ной модели обычно начинают с простой прямой линии и, соответственно, с линейной модели. Если иметь неограниченно большое количество экспе- риментальных точек, то линейная регрессионная модель имеет вид [12]

 

y = β0 + β1 · x + e, (5.1)

 

ŷ = β0 + β1 · x, (5.2)

 

где ŷ – значения выходной переменной, рассчитанные (предсказанные)

по линейной модели;

x – значения входной переменной; β0 и β1 – коэффициенты регрессии;

e – остаток (невязка).

Определение коэффициентов регрессии осуществляется на основе метода наименьших квадратов. Метод наименьших квадратов применяют в тех случаях, когда случайная вариация входного фактора пренебрежи- тельно мала по сравнению с наблюдаемым диапазоном его измерения [12], т. е. значения входной переменной считаются фиксированными. Суть мето- да в том, что подбираются такие β0и β1, при которых сумма квадратов от- клонений измеренных величин y от предсказанных ŷ была бы минимальной.

Для пар наблюдений можно записать

 

y = β0 + β1 xi + e i. (5.3)

 

Отклонение измеренной величины y от предсказанной ŷ

 

e i = yiŷ = yi – (β0+ β1) x. (5.4)


Сумма квадратов отклонений выражается в виде

 


m m

S = ε2 = (y - β


- β x), (5.5)


å i

i =1


å i

i =1


 

0 1 i


 

где S – функция суммы квадратов.

Подберем bb 1так, чтобы при подстановке их вместо β0и β1значе- ние S было минимальным из возможных. Найдем частные производные (∂):

 


S m

= -2 (y - β


- β x)2, (5.6)


 

¶β0


å i

i =1


0 1 i


 


m
S = -2


x (y - β


- β x)2. (5.7)


 

¶β1


å i i

i =1


 

0 1 i


 

Наименьшее значение суммы квадратов отклонений достигается в том случае, когда коэффициенты β0и β1 удовлетворяют условию [11]

 


S

 

¶β0


= ¶ S

¶β1


= 0. (5.8)


 

Имеющиеся экспериментальные данные в виде пар (хi, yi) являются лишь ограниченной выборкой из общего числа состояний исследуемого объекта. Поэтому можно определить только оценки коэффициентов β0и β1, которые обозначают, соответственно, bb 1.

 

ŷ = b 0 + b 1 x. (5.9)

 

Такие модели в литературе часто называют однофакторными рег- рессионными моделями. Коэффициент регрессии b 1определяется по фор- муле [12]

 


 

b 1=


m

å(xi - x)(yi - y)

i =1

m


 

 

, (5.10)


å

i =1


(xi


- x)2


 

где хi – значение входного фактора во время эксперимента;

yi – значение выходного фактора, соответствующее xi;


¯ x – среднее значение входного фактора, определяемое по формуле

 


m

å xi

x = i =1

m


 

 

, (5.11)


 

¯ y – среднее значение выходного фактора, определяемое по формуле

 


m

å yi

y = i =1

m


 

 

. (5.12)


 

Коэффициент регрессии b 0

 

b 0 = ¯ ybx. (5.13)

 

Получаем

 

ŷ = ¯ y + b 1(xi – ¯ x), (5.14)

 


где


¯ x и ¯ y – координаты «центра тяжести» экспериментальных данных,


через который обязательно проходит линия регрессии.

 



Поделиться:


Последнее изменение этой страницы: 2017-02-07; просмотров: 489; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.129.23.30 (0.04 с.)