Ирина Эланс

Автор который поможет с любыми образовательными и учебными заданиями

Классические способы определения экстремумов, функций нескольких переменных

Министерство образования Ставропольского края Государственно-образовательного учреждения Среднего профессионального образования ГРК «Интеграл»

КУРСОВОЙ ПРОЕКТ

по дисциплине: «Математические методы»

тема: «Классические способы определения экстремумов, функций нескольких переменных»

Разработал Руководитель

Капаильская С.А.

Группа Дата___________ Дата____________ Оценка_________

Подпись_________ Подпись________

Георгиевск

2011г.

Содержание

Содержание 2

Введение 3

Классические методы поиска экстремума функции одной переменной 3

Определение глобального максимума или минимума функции одной переменной 6

Выпуклые и вогнутые функции 6

Методы исключения интервалов 10

Правило исключения интервалов 11

Поиск экстремумов функции нескольких переменных 15

Заключение 18

Литература 19

Введение

Во многих областях науки и в практической деятельности часто приходится сталкиваться с задачами поиска экстремума функции. Дело в том, что многие технические, экономические и т.д. процессы моделируются функцией или несколькими функциями, зависящими от переменных – факторов, влияющих на состояние моделируемого явления. Требуется найти экстремумы таких функций для того, чтобы определить оптимальное (рациональное) состояние, управление процессом. Так в экономике, часто решаются задачи минимизации издержек или максимизации прибыли – микроэкономическая задача фирмы. В этой работе мы не рассматриваем вопросы моделирования, а рассматриваем только алгоритмы поиска экстремумов функций в простейшем варианте, когда на переменные не накладываются ограничения (безусловная оптимизация), и экстремум ищется только для одной целевой функции.

В своем курсовом проекте я рассматриваю классические способы определения экстремумов функций нескольких переменных.

При решении задач использовалось необходимое и достаточное условие экстремумов, производные по направлению и градиент функции.

1.Пояснительная записка

Определение глобального максимума или минимума функции одной переменной

Пусть требуется максимизировать f(x) при ограничениях a<=x<=b, где a и b – установленные границы измерений переменной x. (Очевидно в этом случае проверку наличия локального оптимума необходимо проводить не только в стационарных точках, но и в граничных точках интервала). Алгоритм следущий:

Шаг 1: приравнять df/dx=0 и найти все стационарные точки.

Шаг 2: выбрать все стационарные точки, которые расположены а интервале [a,b]. Обозначим эти точки через x₁,x_2,…,x_n. Проверку наличия локального оптимума следует проводить только на множестве указанных точек, дополненном точками a и b.

Шаг 3:найти наибольшее значение f(x) из множества f(a),f(b),f(x₁),…,f(x_n). Это значение соответствует глобальному максимуму.

Выпуклые и вогнутые функции

Это важный класс унимодальных функций. Введем обозначение: x=(x₁,x₂,…,x_n)-n-мерный вектор.

Определение: Функция n мерных f(x), определенная на выпуклом множестве D, называется выпуклой функцией тогда и только тогда, когда для любых двух точек x⁽¹⁾ и x⁽²⁾ принадлежащих D, и любого числа L (0<=L<=1) выполняется неравенство: f(Lx⁽¹⁾ +(1-L)x⁽²⁾)<=Lf(x⁽¹⁾)+(1-L)f(x⁽²⁾).

Свойства выпуклых функций:

1.Хорда, соединяющая две любые точки кривой графика выпуклой функции, всегда проходит над (или выше) кривой в интервале между двумя этими точками.

2.Выпуклая функция лежит над своими касательными

3.Тангенс угла наклона касательной, или первая производная f(x), возрастает или по крайней мере не убывает при увеличении x.

4.Вторая производная f(x) всегда не отрицательна на рассматриваемом интервале.

5.Для выпуклой функции локальный минимум всегда является глобальным минимумом.

Определение: Градиент функции f(x₁,x₂,…,x_n) определяется как вектор

grad f(x₁,…,x_n)=(df/dx₁,df/dx₂,…,df/dx_n)^T.

Определение: Матрица Гессе (гессиан) для функции f(x₁,…,x_n) есть симметрическая матрица порядка n*n: H_f(x₁,…,x_n)=[d²f/dx_idx_j]= H(f).

Проверка функции на выпуклость: Функция f(x₁,…,x_n) выпуклая, если ее матрица Гессе положительно определена или положительно полуопределена для всех значений x₁,x₂,…,x_n .

Для функции одной переменной: функция f(x) выпуклая, если ее вторая производная неотрицательна для всех значений x: d²f/dx²=>0, для всех x.

Если матрица Гессе H_f – положительно определенная матрица, то f называется строго выпуклой функцией и обладает единственной точкой минимума.

Проверка матриц на положительную определенность:

1) Все диагональные элементы должны быть положительными.

2) Все ведущие главные определители должны быть положительными.

Проверка матриц на положительную полуопределенность:

1) Все диагональные элементы неотрицательны.

2) Все главные определители неотрицательны.

Замечание: Чтобы установить, что данная матрица является отрицательно определенной (полуотрицательно определенной), следует умножить ее на -1 и проверить полученную матрицу на положительную определенность (полуположительную определенность).

Вогнутая функция. Функция f(x₁,…,x_n) является вогнутой функцией на множестве D тогда и только тогда, когда –f(x) есть выпуклая функция на D.

Проверка функции на вогнутость. Функция f(x₁,…,x_n) вогнутая, если ее матрица Гессе отрицательно определена, или отрицательно полуопределена для всех значений x₁,…,x_n.

Пример: Исследовать функцию на выпуклость.

f(x₁,x₂,x₃)=3x₁² +2x₂²+x₃² –2x₁x₂ –2x₁x₃ +2x₂x₃ –6x₁ –4x₂ –2x₃

6x₁ –2x₂ –2x₃ –6

grad(x₁,x₂,x₃)= 4x₂ –2x₁ +2x₃ –4

2x₃ –2x₁ =2x₂ –2

H_f (x₁,x2,x3)=

Исследуем H_f.

H_f –симметрическая матрица.
Все диагональные элементы H_f положительны.
Ведущие главные определители Н равны:

|6|>0

Следовательно, H_f – положительно определенная матрица. Отсюда следует, что f-выпуклая функция. Более того, f строго выпуклая функция и обладает единственной точкой минимума.

Методы исключения интервалов

Существует ряд одномерных методов поиска, ориентированных на нахождение точки оптимума внутри заданного интервала.

Это методы поиска, позволяющие определить оптимум функции одной переменной путем последовательного исключения подинтервалов и, следовательно, путем уменьшения интервала поиска.

Все одномерные методы поиска, используемые на практике, основаны на предположении, что исследуемая функция в допустимой области обладает свойством унимодальности.

Для унимодальной функции f(x) сравнение значений f(x) в двух различных точках интервала поиска позволяет определить, в каком из заданных этими двумя точками подинтервалов точка оптимума отсутствует.

Правило исключения интервалов

Пусть функция f унимодальна на интервале a£x£b, а ее минимум достигается в точке x*.

Рассмотрим точки x₁ и x₂, расположенные в интервале таким образом, что a<x₁<x₂<b. Сравнивая значения функции в точках x₁ и x₂, можно сделать следующие выводы:

Если f(x₁)>f(x₂), то точка минимума f(x) не лежит в интервале (a,x₁), т.е. x*Î(x₁,b)

2. Если f(x₁)<f(x₂), то точка минимума не лежит в интервале (x₂,b), т.е. x*Î(a,x₂)

3. Если f(x₁)=f(x₂), то можно исключить оба крайних интервала (a,x₁) и (x₂,b), при этом x*Î(x₁,x₂).

Согласно правилу исключения интервалов можно реализовать процедуру поиска, позволяющую найти точку оптимума путем последовательного исключения частей исходного ограниченного интервала.

Поиск завершается, когда оставшийся интервал уменьшается до достаточно малых размеров.

Достоинства этих методов:

устраняется необходимость полного перебора всех допустимых точек.
методы основаны лишь на вычислении значений функции.

(при этом не требуется, чтобы исследуемые функции были дифференцируемы).

Метод золотого сечения

В методе же золотого сечения мы будем выбирать расположение точек х₁ и х₂, рассекающих интервал, таким образом, чтобы на каждом шаге уменьшения интервала одна из этих точек совпадала с одной из аналогичных точек предыдущего шага, т.е. на каждом шагу уменьшения интервала фактически вводится только одна новая точка, для которой требуется произвести только одно вычисление значения целевой функции.

Такое рассечение интервала новой точкой может быть точно рассчитано. Забегая вперед, запишу эту пропорцию:

а х₁ х₂ b

Точки х₁ и х₂ расположены симметрично относительно середины интервала (a, b).

b-x₁ x₂-a -1+

= = » 0.618

b-a b-a 2 .

Такое рассечение интервала и получило название золотого сечения.

Введем обозначения:

D¹ = b-a – исходный интервал.

D² – интервал, полученный после уменьшения интервала D¹ отбрасыванием его левого или правого подинтервала.

D^К+1 – интервал, полученный после уменьшения интервала D^К.

Рассмотрим теперь метод золотого сечения формально. Золотым сечением отрезка называется деление отрезка на две неравные части так, чтобы отношение всего отрезка к большей части равнялось отношению большей части к меньшей.

Золотое сечение отрезка [a, b] производится двумя симметрично расположенными точками (х₁ и х₂).

Т.е. (b-a)/(b-x₁)=(b-x₁)/(x₁-a)=g и (b-a)/(x₂-a)=(x₂-a)/(b-x₂)=g.

Можно показать, что g = (1+Ö5)/2»1.618.

Примечательно то, что точка х₁ в свою очередь производит золотое сечение отрезка [a, x₂], т.е. (x₂-a)/(x₁-a) = (x₁-a)/(x₂-x₁) = g.

Аналогично, точка х₂ производит золотое сечение отрезка [x₁, b].

Итак, метод золотого сечения состоит в том, что длины последовательных интервалов берутся в фиксированном отношении:

D¹/D² = D²/D³ = … =g.

Из соотношений

D^К/D^K+1 = D^K+1/D^K+2 = g и D^K = D^K+1 + D^K+2

Получаем:

D^K/D^K+1 = (D^K+1+D^K+2)/D^K+1=1+D^K+2/D^K+1

g = 1 + 1/g или g² - g -1 = 0.

Корнем этого уравнения является золотое сечение.

g=(Ö5+1)/2 » 1.618 t = 1/g = (Ö5-1)/2 » 0.618.

Можно записать формулы для точек х₁ и х₂, производящих золотое сечение на интервале [a, b]:

x₁ = a+(1-t)(b-a) x₂ = a+t(b-a)

Алгоритм метода золотого сечения.

Ввести a, b, e-точность вычисления, t=(Ö5-1)/2
Вычислить:

x₁ =b – (b-a)t; x₂=a + (b-a)t

Вычислить:

y₁ = f(x₁); y₂ = f(x₂)

если y₁£y₂, то для дальнейшего деления оставляют интервал [a, x₂]

и выполняют следующее:

b: = x₂; x₂: = x₁; y₂: = y₁; x₁ := b-(b-a)t y₁ := f(x₁)

в противном случае (если y₁ > y₂), для дальнейшего деления оставляют интервал [x₁, b] и выполняют следующее:

a := x₁; x₁ := x₂; y₁ := y₂; x₂ := a+(b-a)t; y₂ :=f(x₂);

Сравнение длины интервала неопределенности с заданной точностью e:

Если (b-a)£e, то положить x* := (b-a)/2 (точка минимума), иначе (если (b-a)<e) перейти к п.4.

Поиск экстремумов функции нескольких переменных

В этом разделе будем рассматривать методы, используемые при поиске безусловных минимумов функций нескольких переменных.

Многомерная задача оптимизации формулируется следующим образом:

f(x)®min, xÎ Rⁿ, Rⁿ-n-мерное пространство

(т.е. ограничения на х отсутствуют),

где х=(x₁, x₂,…, x_n)^T – вектор управляемых переменных размерностью n, f - скалярная целевая функция.

Точка х является точкой глобального минимума, если для всех xÎ Rⁿ, выполняется неравенство: Df = f(x)-f(x)³0 (1).

Точку глобального минимума будем обозначать х**.

Если формула (1) справедлива лишь в некоторой d-окрестности точки х, т.е. для всех х, таких, что ||x-x||<d, при заданном d>0, то х есть точка локального минимума. Ее будем обозначать х*. Норма (модуль, длина) вектора

||x||=Ö(x, x)=Öx^T x=Öx₁² + x₂²+ … +x_n²

(x, x)=x^Tx – скалярное произведение х на себя x^T= (x₁, x₂, …, x_n)

Если же выполняется Df = f(x) - f(x) £ 0, (2)

то х есть точка максимума (локального или глобального в соответствии с данными ранее определениями).

Исключение знака равенства из формул (1) и (2) позволяет определить точку строгого минимума или максимума.

В случае, когда Df принимает как положительные и отрицательные, так и нулевые значения в зависимости от выбора точек из d - окрестности, точка х представляет собой седловую точку.

Точка х, в которой находится минимум или максимум, или седловая точка, должна удовлетворять условию стационарности:

Ñf(x) = 0 (x – стационарная точка)

¶f ¶f ¶f ^T

Ñf(x) = ¶x₁, ¶x₂, …, ¶x_n - градиент функции f(x) = f(x₁, x₂, …, x_n)

Приведем некоторые сведения из линейной алгебры.

Квадратичной формой называется функция n переменных вида:

A(x₁, x₂, …, x_n) = A(x) = _i=1åⁿ_j=1åⁿ q_ijx_ix_j = x^TQx, где

x = x , Q_(n*n) = [q_ij] – матрица.

…

Q будем считать симметрической матрицей.

Определения:

1. матрица Q является положительно определенной тогда и только тогда, когда x^TQx > 0 для всех х ¹ 0.

2. матрица Q является положительно полуопределенной тогда и только тогда, когда значения квадратичной формы x^TQz ³ 0, для всех х и существует вектор х ¹ 0 такой, что x^TQz = 0.

3. матрица Q является отрицательно определенной тогда и только тогда, когда -Q есть положительно определенная матрица. Другими словами – тогда и только тогда, когда x^TQx < 0 для всех х ¹ 0.

4. матрица Q является отрицательно полуопределенной тогда и только тогда, когда -Q есть положительно полуопределенная матрица.

5. матрица Q является неопределенной, если квадратичная форма x^TQx может принимать как положительные, так и отрицательные значения.

Справедливы следующие утверждения:

1) Стационарная точка х есть точка минимума, если H_f(x) = Ñ²f(x) - положительно полуопределенная матрица.

H_f(x) = Ñ²f(x) = [¶²f/(¶x_i¶x_j)] – матрица Гессе (гессиан)

2) Стационарная точка х есть точка максимума, если H_f(x) = Ñ²f(x) - отрицательно полуопределенная матрица.

Стационарная точка х есть седловая точка, если H_f(x) = Ñ²f(x) - неопределенная матрица.

Необходимые условия: для наличия в точке х* локального минимума необходимо, чтобы выполнялось равенство:

Ñf(x*) = 0 (чтобы точка х* была стационарной)

и матрица H_f(x*) = Ñ²f(x*) была положительно полуопределенной. (неотрицательно определенной) H_f(x) = Ñ²f(x) = [¶²f/(¶x_i¶x_j)] – матрица Гессе (гессиан).

Классические способы определения экстремумов, функций нескольких переменных 📙 Курсовая → 🆔 103941