Численные методы для стохастических задач 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Численные методы для стохастических задач



Описанные в п. 11.3 методы предназначены для решения так называемых детерминированных задач.
Определение Задачу называют детерминированной, если погрешностью вычисления (или экспериментального определения) функции f(x) можно пренебречь. В противном случае задачу называют стохастической.
Метод золотого сечения рассчитан на детерминированные задачи. В стохастических задачах из-за ошибок эксперимента можно неправильно определить соотношения между значениями функции в точках; тогда дальнейшие итерации пойдут по ложному пути. Поэтому, если различия функции в выбранных точках стали того же порядка, что и экспериментальная погрешность, то итерации надо прекращать. Поскольку вблизи минимума чаще всего δf∼(δx)2, небольшая погрешность функции приводит к появлению довольно большой области неопределенности δx∼(δf∼)1/2.
Для стохасчтиеских задач разрабаытвают специальные методы их решения. Однако эти методы очень медленные, и применять их к детерминированным задачам невыгодно.
Опишем один алгоритм, который специально рассчитан на стохастические задачи. Он основан на предоположении о том, что ошибки в определении значения функции f(x) имеют статистическую природу, т.е. они целиком случайны, и систематической погрешности нет. Тогда можно определить минимум со сколь угодно высокой точностью (фактически игнорируя область неопределенности δx∼(δf∼)1/2), если воспользоваться следующим итерационным процессом:
xn+1 = xn − (an/bn)·[f(xn+bn)− f(xn−bn)]
где an, bn − последовательности положительных чисел, удовлетворяющие следующим условиям:
При n→∞ an, bn → 0, Σan=∞, Σ(an/bn)2<∞
При выполнении этих условий x→x* с вероятностью 1 при n→∞. Это означает, что x→x* почти всегда, но не обязательно. Этим условиям удовлетворяют, в частности, следующие последовательности чисел:
an =1/n; bn = n−1/3
Описанный выше алгоритм является обобщением известного алгоритма минимизации Роббинса-Монро. Он сходится очень медленно, ибо изменение аргумента за шаг равно |xn+1 − xn| ≈ 2an|f′(xn)|, а величины an убывают очень медленно. Поэтому применять этот алгоритм к детерминированным задачам невыгодно.

Геометрическое представление процесса минимизации

Классификация видов рельефа

Основные трудности многомерного случая удобно рассмотреть на примере функции двух переменных f(x,y). Функция z=f(x,y) задает в трехмерном пространстве x,y,z некоторую поверхность. Задача минимизации функции z=f(x,y) означает поиск наинизшей точки этой поверхности.
Рассмотрим рельеф этой поверхности,используя известные из топографии линии уровня. Для этого проведем равноотстоящие плоскости f=const и найдем линии их пересечения с поверхностью f(x,y); проекции этих линий на плоскость Oxy называются линиями уровня. Полученная в итоге картина напоминает топографическое изображение рельефа горизонталями. По виду линий уровня принято выделять три типа рельефа:

Типы рельефа

1. котловинный

2. овражный

3. неупорядоченный

Котловинный рельеф

При котловинном рельефе линии уровня напоминают эллипсы:


Рис. 11.6. Котловинный рельеф

В малой окрестности невырожденного минимума рельеф функции котловинный. Необходимые условия минимума функции двух переменных ∂f/∂x=0, ∂f/∂y=0 приводят к тому, что в разложении функции f(x,y) в окрестности минимума (x*,y*) отличными от нуля являются следующие члены:
f(x,y)=f(x*,y*)+0,5fxx(Δx)2+ fxyΔxΔy+0,5fyy(Δy)2+...
где введены следующие обозначения:
fxx = ∂2f/∂x2
fxy = ∂2f/∂x∂y
fyy = ∂2f/∂y2
причем квадратичная форма в правой части этого выражения - положительно определенная в окрестности минимума. Это означает, что при любых x,y (за исключением одновременно обращающихся в нуль) она положительна. Линии уровня положительно определенной квадратичной офрмы представляют собой эллипсы. В окрестности максимума эта квадратичная форма отрицательно определенная, а в седловинах − знакопеременна. Случай, когда все вторые производные обращаются в тчоке минимума в нуль, по существу ничего нового не дает, поскольку линии уровня вместо эллипсов будут похожими на них кривыми четвертого порядка.
Вблизи такого минимума функция мало меняется при заметных изменениях переменных. Поэтому, даже если мы не очень точно определим те значения переменных, которые должны минимизировать функцию, само значение функции при этом будет мало отличаться от минимального.

Овражный рельеф

При овражном типе рельефа на линиях уровня появляются участки с большой кривизной или точки излома. Геометрическое место точек излома называют истинным оврагом, если угол направлен в сторону возрастания функции и гребнем, если в сторону убывания:


Рис. 11.7. Овражный тип рельефа

Чаще встречается ситуация, в которой линии уровня всюду гладкие, однако на них имеются участки с большой кривизной; геометрические места точек с наибольшей кривизной называют разрешимыми оврагами или гребнями. В качестве примера можно привести рельеф функции f(x,y)=10(y−sinx)2 + 0,1x2, приведенный на следующем рисунке:


Рис. 11.8. Рельеф функции f(x,y)=10(y−sinx)2 + 0,1x2,

Рельеф, изображенный на этом рисунке, имеет ярко выраженный извилистый разрешимый овраг, "дно" которого - синусоида, а низшая точка - начало координат.
В физических задачах овражный рельеф указывает на то, что вычислитель не учел какую-то закономерность, имеющую вид связи между переменными. Обнаружение и явный учет этой закономерности облегчают решение задачи. Так, если в приведенном выше примере ввести новые переменные ξ=x, η=y−sinx, то рельеф становится котловинным.

Неупорядоченный рельеф

Неупорядоченный тип рельефа характеризуется наличием многих максимумов, минимумов и седловин. Примером может служить функция f(x,y)=(1+sin2x)(1+sin2y): она имеет минимумы в точках с координатами xk=πk; xl=πl; и максимумы в точках xk=π(k+1.2); xl=π(l+1.2); (здесь k,l − целые числа).


Рис. 11.9. Рельеф функции f(x,y)=(1+sin2x)(1+sin2y)


На первый взгляд кажется, что для нахождения точки минимума функции f(x,y) можно просто решить систему нелинейных уравнений ∂f/∂x=0, ∂f/∂y=0 любым известным численным мтеодом (например, методом простых итераций) и затем отбросить те решения, которые являются седловинами или максимумами. Однако на практике эти методы обычно сходятся в настолько малой окрестности минимума, что выбрать подходящее нулевое приближение удается далеко не всегда.
Все эффективные методы поиска минимума функции многих переменных сводятся к выбору направления движения по склонам ко "дну"; разные методы отличаются способами выбора траектории спуска. На сегодняшний день пока не предложено метода, одинаково эффективного для всех типов рельефа; метод, приспособленный к одному типу рельефа, может оказаться плохим на рельефе другого типа.
Общим для всех является необходимость выбора точки начального приближения (x0,y0) − то есть такой точки, из которой начинается спуск. После этого ищется следующая точка (x1,y1), значение функции в которой f(x1,y1) должно быть меньше значения функции в исходной точке f(x0,y0). Выбор начального приближения обычно представляет собой достаточно серьезную проблему, потому что



Поделиться:


Последнее изменение этой страницы: 2021-04-13; просмотров: 63; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.16.66.206 (0.006 с.)