Классические способы определения экстремумов, функций нескольких переменных
Министерство
образования Ставропольского
КУРСОВОЙ ПРОЕКТ
по дисциплине: «Математические методы»
тема: «Классические способы определения экстремумов, функций нескольких переменных»
Разработал
Группа
Подпись_________
Георгиевск
2011г.
Содержание
Содержание 2
Введение 3
Классические методы поиска экстремума функции одной переменной 3
Определение глобального максимума или минимума функции одной переменной 6
Выпуклые и вогнутые функции 6
Методы исключения интервалов 10
Правило исключения интервалов 11
Поиск экстремумов функции нескольких переменных 15
Заключение 18
Литература 19
Введение
Во многих областях науки и в практической деятельности часто приходится сталкиваться с задачами поиска экстремума функции. Дело в том, что многие технические, экономические и т.д. процессы моделируются функцией или несколькими функциями, зависящими от переменных – факторов, влияющих на состояние моделируемого явления. Требуется найти экстремумы таких функций для того, чтобы определить оптимальное (рациональное) состояние, управление процессом. Так в экономике, часто решаются задачи минимизации издержек или максимизации прибыли – микроэкономическая задача фирмы. В этой работе мы не рассматриваем вопросы моделирования, а рассматриваем только алгоритмы поиска экстремумов функций в простейшем варианте, когда на переменные не накладываются ограничения (безусловная оптимизация), и экстремум ищется только для одной целевой функции.
В своем курсовом
проекте я рассматриваю классические
способы определения
При
решении задач использовалось необходимое
и достаточное условие
1.Пояснительная записка
Определение глобального максимума или минимума функции одной переменной
Пусть требуется максимизировать f(x) при ограничениях a<=x<=b, где a и b – установленные границы измерений переменной x. (Очевидно в этом случае проверку наличия локального оптимума необходимо проводить не только в стационарных точках, но и в граничных точках интервала). Алгоритм следущий:
Шаг 1: приравнять df/dx=0 и найти все стационарные точки.
Шаг
2: выбрать все стационарные точки,
которые расположены а
Шаг 3:найти наибольшее значение f(x) из множества f(a),f(b),f(x1),…,f(xn). Это значение соответствует глобальному максимуму.
Выпуклые и вогнутые функции
Это важный класс унимодальных функций. Введем обозначение: x=(x1,x2,…,xn)-n-мерный вектор.
Определение:
Функция n мерных f(x), определенная на
выпуклом множестве D, называется выпуклой
функцией тогда и только тогда, когда для
любых двух точек x(1) и x(2) принадлежащих
D, и любого числа L (0<=L<=1) выполняется
неравенство: f(Lx(1) +(1-L)x(2))<=Lf(x(1))+(1-L)f(x
Свойства выпуклых функций:
1.Хорда,
соединяющая две любые точки
кривой графика выпуклой
2.Выпуклая
функция лежит над своими
3.Тангенс угла наклона касательной, или первая производная f(x), возрастает или по крайней мере не убывает при увеличении x.
4.Вторая производная f(x) всегда не отрицательна на рассматриваемом интервале.
5.Для
выпуклой функции локальный
Определение: Градиент функции f(x1,x2,…,xn) определяется как вектор
grad
f(x1,…,xn)=(df/dx1,df/dx2,…,
Определение: Матрица Гессе (гессиан) для функции f(x1,…,xn) есть симметрическая матрица порядка n*n: Hf(x1,…,xn)=[d2f/dxidxj]= H(f).
Проверка функции на выпуклость: Функция f(x1,…,xn) выпуклая, если ее матрица Гессе положительно определена или положительно полуопределена для всех значений x1,x2,…,xn .
Для функции одной переменной: функция f(x) выпуклая, если ее вторая производная неотрицательна для всех значений x: d2f/dx2=>0, для всех x.
Если матрица Гессе Hf – положительно определенная матрица, то f называется строго выпуклой функцией и обладает единственной точкой минимума.
Проверка матриц на положительную определенность:
1)
Все диагональные элементы
2)
Все ведущие главные
Проверка
матриц на положительную
1)
Все диагональные элементы
2)
Все главные определители
Замечание: Чтобы установить, что данная матрица является отрицательно определенной (полуотрицательно определенной), следует умножить ее на -1 и проверить полученную матрицу на положительную определенность (полуположительную определенность).
Вогнутая функция. Функция f(x1,…,xn) является вогнутой функцией на множестве D тогда и только тогда, когда –f(x) есть выпуклая функция на D.
Проверка функции на вогнутость. Функция f(x1,…,xn) вогнутая, если ее матрица Гессе отрицательно определена, или отрицательно полуопределена для всех значений x1,…,xn.
Пример: Исследовать функцию на выпуклость.
f(x1,x2,x3)=3x12 +2x22 +x32 –2x1x2 –2x1x3 +2x2x3 –6x1 –4x2 –2x3
6x1 –2x2 –2x3 –6
grad(x1,x2,x3)= 4x2 –2x1 +2x3 –4
Hf (x1,x2,x3)=
Исследуем Hf.
- Hf –симметрическая матрица.
- Все диагональные элементы Hf положительны.
- Ведущие главные определители Н равны:
|6|>0
Следовательно, Hf – положительно определенная матрица. Отсюда следует, что f-выпуклая функция. Более того, f строго выпуклая функция и обладает единственной точкой минимума.
Методы исключения интервалов
Существует ряд одномерных методов поиска, ориентированных на нахождение точки оптимума внутри заданного интервала.
Это
методы поиска, позволяющие определить
оптимум функции одной
Все одномерные методы поиска, используемые на практике, основаны на предположении, что исследуемая функция в допустимой области обладает свойством унимодальности.
Для унимодальной функции f(x) сравнение значений f(x) в двух различных точках интервала поиска позволяет определить, в каком из заданных этими двумя точками подинтервалов точка оптимума отсутствует.
Правило исключения интервалов
Пусть функция f унимодальна на интервале a£x£b, а ее минимум достигается в точке x*.
Рассмотрим точки x1 и x2, расположенные в интервале таким образом, что a<x1<x2<b. Сравнивая значения функции в точках x1 и x2, можно сделать следующие выводы:
- Если f(x1)>f(x2), то точка минимума f(x) не лежит в интервале (a,x1), т.е. x*Î(x1,b)
2. Если f(x1)<f(x2), то точка минимума не лежит в интервале (x2,b), т.е. x*Î(a,x2)
3. Если f(x1)=f(x2), то можно исключить оба крайних интервала (a,x1) и (x2,b), при этом x*Î(x1,x2).
Согласно правилу исключения интервалов можно реализовать процедуру поиска, позволяющую найти точку оптимума путем последовательного исключения частей исходного ограниченного интервала.
Поиск завершается, когда оставшийся интервал уменьшается до достаточно малых размеров.
Достоинства этих методов:
- устраняется необходимость полного перебора всех допустимых точек.
- методы основаны лишь на вычислении значений функции.
(при
этом не требуется, чтобы
Метод
золотого сечения
В методе же золотого сечения мы будем выбирать расположение точек х1 и х2, рассекающих интервал, таким образом, чтобы на каждом шаге уменьшения интервала одна из этих точек совпадала с одной из аналогичных точек предыдущего шага, т.е. на каждом шагу уменьшения интервала фактически вводится только одна новая точка, для которой требуется произвести только одно вычисление значения целевой функции.
Такое рассечение интервала новой точкой может быть точно рассчитано. Забегая вперед, запишу эту пропорцию:
а х1 х2 b
Точки х1 и х2 расположены симметрично относительно середины интервала (a, b).
b-x1 x2-a -1+
= = » 0.618
b-a
b-a
2
Такое рассечение интервала и получило название золотого сечения.
Введем обозначения:
D1 = b-a – исходный интервал.
D2 – интервал, полученный после уменьшения интервала D1 отбрасыванием его левого или правого подинтервала.
DК+1 – интервал, полученный после уменьшения интервала DК.
Рассмотрим теперь метод золотого сечения формально. Золотым сечением отрезка называется деление отрезка на две неравные части так, чтобы отношение всего отрезка к большей части равнялось отношению большей части к меньшей.
Золотое сечение отрезка [a, b] производится двумя симметрично расположенными точками (х1 и х2).
Т.е. (b-a)/(b-x1)=(b-x1)/(x1-a)=g и (b-a)/(x2-a)=(x2-a)/(b-x2)=g.
Можно показать, что g = (1+Ö5)/2»1.618.
Примечательно то, что точка х1 в свою очередь производит золотое сечение отрезка [a, x2], т.е. (x2-a)/(x1-a) = (x1-a)/(x2-x1) = g.
Аналогично, точка х2 производит золотое сечение отрезка [x1, b].
Итак, метод золотого сечения состоит в том, что длины последовательных интервалов берутся в фиксированном отношении:
D1/D2 = D2/D3 = … =g.
Из соотношений
DК/DK+1 = DK+1/DK+2 = g и DK = DK+1 + DK+2
Получаем:
DK/DK+1 = (DK+1+DK+2)/DK+1=1+DK+2/DK+1
g = 1 + 1/g или g2 - g -1 = 0.
Корнем этого уравнения является золотое сечение.
g=(Ö5+1)/2 » 1.618 t = 1/g = (Ö5-1)/2 » 0.618.
Можно записать формулы для точек х1 и х2, производящих золотое сечение на интервале [a, b]:
x1 = a+(1-t)(b-a) x2 = a+t(b-a)
Алгоритм метода золотого сечения.
- Ввести a, b, e-точность вычисления, t=(Ö5-1)/2
- Вычислить:
x1 =b – (b-a)t; x2 =a + (b-a)t
- Вычислить:
y1 = f(x1); y2 = f(x2)
- если y1£y2, то для дальнейшего деления оставляют интервал [a, x2]
и выполняют следующее:
b: = x2; x2: = x1; y2: = y1; x1 := b-(b-a)t y1 := f(x1)
в противном случае (если y1 > y2), для дальнейшего деления оставляют интервал [x1, b] и выполняют следующее:
a := x1; x1 := x2; y1 := y2; x2 := a+(b-a)t; y2 :=f(x2);
- Сравнение длины интервала неопределенности с заданной точностью e:
Если (b-a)£e, то положить x* := (b-a)/2 (точка минимума), иначе (если (b-a)<e) перейти к п.4.
Поиск экстремумов функции нескольких переменных
В этом разделе будем рассматривать методы, используемые при поиске безусловных минимумов функций нескольких переменных.
Многомерная задача оптимизации формулируется следующим образом:
f(x)®min, xÎ Rn, Rn-n-мерное пространство
(т.е. ограничения на х отсутствуют),
где х=(x1, x2,…, xn)T – вектор управляемых переменных размерностью n, f - скалярная целевая функция.
Точка х является точкой глобального минимума, если для всех xÎ Rn, выполняется неравенство: Df = f(x)-f(x)³0 (1).
Точку глобального минимума будем обозначать х**.
Если формула (1) справедлива лишь в некоторой d-окрестности точки х, т.е. для всех х, таких, что ||x-x||<d, при заданном d>0, то х есть точка локального минимума. Ее будем обозначать х*. Норма (модуль, длина) вектора
||x||=Ö(x, x)=ÖxT x=Öx12 + x22 + … +xn2
(x, x)=xT x – скалярное произведение х на себя xT = (x1, x2, …, xn)
Если же выполняется Df = f(x) - f(x) £ 0, (2)
то х есть точка максимума (локального
или глобального в соответствии
с данными ранее определениями)
Исключение знака равенства из формул (1) и (2) позволяет определить точку строгого минимума или максимума.
В случае, когда Df принимает как положительные и отрицательные, так и нулевые значения в зависимости от выбора точек из d - окрестности, точка х представляет собой седловую точку.
Точка
х, в которой находится минимум
или максимум, или седловая точка,
должна удовлетворять условию
Ñf(x) = 0 (x – стационарная точка)
¶f ¶f ¶f T
Ñf(x) = ¶x1, ¶x2, …, ¶xn - градиент функции f(x) = f(x1, x2, …, xn)
Приведем
Квадратичной
A(x1, x2, …, xn) = A(x) = i=1ånj=1ån qijxixj = xTQx, где
x
x = x , Q(n*n) = [qij] – матрица.
…
x
Q будем считать симметрической матрицей.
Определения:
1. матрица Q является положительно определенной тогда и только тогда, когда xTQx > 0 для всех х ¹ 0.
2. матрица Q является положительно полуопределенной тогда и только тогда, когда значения квадратичной формы xTQz ³ 0, для всех х и существует вектор х ¹ 0 такой, что xTQz = 0.
3. матрица Q является отрицательно определенной тогда и только тогда, когда -Q есть положительно определенная матрица. Другими словами – тогда и только тогда, когда xTQx < 0 для всех х ¹ 0.
4. матрица Q является отрицательно полуопределенной тогда и только тогда, когда -Q есть положительно полуопределенная матрица.
5. матрица Q является неопределенной, если квадратичная форма xTQx может принимать как положительные, так и отрицательные значения.
Справедливы следующие утверждения:
1) Стационарная точка х есть точка минимума, если Hf(x) = Ñ2f(x) - положительно полуопределенная матрица.
Hf(x) = Ñ2f(x) = [¶2f/(¶xi¶xj)] – матрица Гессе (гессиан)
2) Стационарная точка х есть точка максимума, если Hf(x) = Ñ2f(x) - отрицательно полуопределенная матрица.
- Стационарная точка х есть седловая точка, если Hf(x) = Ñ2f(x) - неопределенная матрица.
Необходимые условия: для наличия в точке х* локального минимума необходимо, чтобы выполнялось равенство:
Ñf(x*) = 0 (чтобы точка х* была стационарной)
и матрица Hf(x*) = Ñ2f(x*) была положительно полуопределенной. (неотрицательно определенной) Hf(x) = Ñ2f(x) = [¶2f/(¶xi¶xj)] – матрица Гессе (гессиан).

- Классические стили в архитектуре Петербурга
- Классические теории бюрократии (М. Вебер, В. Вильсон, К. Маркс, «азиатская» модель)
- Классические теории и основы международной торговли
- Классические теории международной торговли
- Классические теории международной торговли и современность
- Классические теории международной торговли и современность
- Классические теории мотивации
- Классические концепции налогов и налогообложения, направления их развития
- Классические концепции налогов и налогообложения, направления их развития
- Классические методы анализа финансово-хозяйственной деятельности
- Классические методы построения портфеля ценных бумаг
- Классические модели ипотечного кредитования как результат эволюции товарно-денежных отношений на рынке недвижимости
- Классические системы международной торговли
- «Классические способы определения экстремумов, функций нескольких переменных