Динамическое программирование. 12
Содержание
Введение 3
1. Динамическое программирование 5
1.1 Задача динамического программирования 5
1.2 Общая структура динамического программирования 8
2. Задача о загрузке. Общие сведения 10
3. Практическая часть. Задача 12
Заключение 19
Список литературы 21
Введение
Работа над данным курсовым проектом позволяет закрепить знания по предмету «Экономико-математическое моделирование».
В наше время наука уделяет все большое внимание вопросам организации и управления, это приводит к необходимости анализа сложных целенаправленных процессов под углом зрения их структуры и организации; применение математических, количественных методов для обоснования решений во всех областях целенаправленной человеческой деятельности.
Целью исследования является выявление наилучшего способа действия при решение той или иной задачи. Для построения математической модели необходимо иметь строгое представление о цели функционирования исследуемой системы и располагать информацией об ограничениях, которые определяют область допустимых значений.
В моделях исследования операций переменные, от которых зависят ограничения и целевая функция, могут быть дискретными (чаще всего целочисленными) и континуальными (непрерывными). В свою очередь, ограничения и целевая функция делятся на линейные и нелинейные. Существуют различные методы решения данных моделей, наиболее известными и эффективными из них являются методы линейного программирования, когда целевая функция и все ограничения линейные. Для решения математических моделей других типов предназначены методы динамического программирования, целочисленного программирования, нелинейного программирования, многокритериальной оптимизации и методы сетевых моделей.
Практически все методы исследования операций порождают вычислительные алгоритмы, которые являются итерационными по своей природе. Это подразумевает, что задача решается последовательно (итерационно), когда на каждом шаге (итерации) получаем решение, постепенно сходящиеся к оптимальному решению.
Итерационная природа алгоритмов обычно приводит к объемным однотипным вычислениям. В этом и заключается причина того, что эти алгоритмы разрабатываются, в основном, для реализации с помощью вычислительной техники.
1. Динамическое программирование
- Задача динамического программирования
Большинство методов исследования операций связано в первую очередь с задачами вполне определенного содержания. Классический аппарат математики оказался малопригодным для решения многих задач оптимизации, включающих большое число переменных и/или ограничений в виде неравенств. Несомненна привлекательность идеи разбиения задачи большой размерности на подзадачи меньшей размерности, включающие всего по нескольких переменных, и последующего решения общей задачи по частям. Именно на этой идее основан метод динамического программирования.
Динамическое программирование (ДП) представляет собой математический метод, заслуга создания и развития которого принадлежит, прежде всего, Беллману. Метод можно использовать для решения весьма широкого круга задач, включая задачи распределения ресурсов, замены и управления запасами, задачи о загрузке. Характерным для динамического программирования является подход к решению задачи по этапам, с каждым из которых ассоциирована одна управляемая переменная. Набор рекуррентных вычислительных процедур, связывающих различные этапы, обеспечивает получение допустимого оптимального решения задачи в целом при достижении последнего этапа.
Происхождение названия динамическое программирование, вероятно, связано с использованием методов ДП в задачах принятия решений через фиксированные промежутки времени (например, в задачах управления запасами). Однако методы ДП успешно применяются также для решения задач, в которых фактор времени не учитывается. По этой причине более удачным представляется термин многоэтапное программирование, отражающий пошаговый характер процесса решения задачи.
Фундаментальным принципом, положенным в основу теории ДП, является принцип оптимальности. По существу, он определяет порядок поэтапного решения допускающей декомпозицию задачи (это более приемлемый путь, чем непосредственное решение задачи в исходной постановке) с помощью рекуррентных вычислительных процедур.
Динамическое программирование позволяет осуществлять оптимальное планирование управляемых процессов. Под «управляемыми» понимаются процессы, на ход которых мы можем в той или другой степени влиять.
Пусть
предполагается к осуществлению
некоторое мероприятие или
Сформулируем общий принцип, лежащий в основе решения всех задач динамического программирования («принцип оптимальности»):
«Каково бы ни было состояние системы S перед очередным шагом, надо выбрать управление на этом шаге так, чтобы выигрыш на данном шаге плюс оптимальный выигрыш на всех последующих шагах был максимальным».
Динамическое программирование – это поэтапное планирование многошагового процесса, при котором на каждом этапе оптимизируется только один шаг. Управление на каждом шаге должно выбираться с учетом всех его последствий в будущем.
При постановке задач динамического программирования следует руководствоваться следующими принципами:
- Выбрать параметры (фазовые координаты), характеризующие состояние S управляемой системы перед каждым шагом.
- Расчленить операцию на этапы (шаги).
- Выяснить набор шаговых управлений xi для каждого шага и налагаемые на них ограничения.
- Определить какой выигрыш приносит на i-ом шаге управление xi, если перед этим система была в состоянии S, т.е. записать «функцию выигрыша»:
- Определить, как изменяется состояние S системы S под влиянием управление xi на i-ом шаге: оно переходит в новое состояние
- Записать основное рекуррентное уравнение динамического программирования, выражающее условный оптимальный выигрыш Wi(S) (начиная с i-го шага и до конца) через уже известную функцию Wi+1(S):
Этому выигрышу соответствует условное оптимальное управление на i-м шаге xi(S) (причем в уже известную функцию Wi+1(S) надо вместо S подставить измененное состояние )
- Произвести условную оптимизацию последнего (m-го) шага, задаваясь гаммой состояний S, из которых можно за один шаг дойти до конечного состояния, вычисляя для каждого из них условный оптимальный выигрыш по формуле
- Произвести условную оптимизацию (m-1)-го, (m-2)-го и т.д. шагов по формуле (1.2), полагая в ней i=(m-1),(m-2),…, и для каждого из шагов указать условное оптимальное управление xi(S), при котором максимум достигается.
Заметим, что если состояние системы в начальный момент известно (а это обычно бывает так), то на первом шаге варьировать состояние системы не нужно - прямо находим оптимальный выигрыш для данного начального состояния S0. Это и есть оптимальный выигрыш за всю операцию
- Произвести
безусловную оптимизацию
управления, «читая» соответствующие рекомендации на каждом шаге. Взять найденное оптимальное управление на первом шаге ; изменить состояние системы по формуле (1.1); для вновь найденного состояния найти оптимальное управление на втором шаге х2* и т.д. до конца.
Данные
этапы рассматривались для
(если только выигрыши wi положительны). Эти задачи решаются точно так же, как задачи с аддитивным критерием, с той единственной разницей, что в основном уравнении (1.2) вместо знака «плюс» ставится знак «умножения»:
1.2 Общая
структура динамического программирования
Отыскание оптимальной стратегии принятия набора последовательных решений, в большинстве случаях, производится следующим образом: сначала осуществляется выбор последнего во времени решения, затем при движении в направлении, обратном течению времени, выбираются все остальные решения вплоть до исходного.
Для реализации такого метода необходимо выяснить все ситуации, в которых может происходить выбор последнего решения. Обычно условия, в которых принимается решение, называют «состоянием» системы. Состояние системы – это описание системы, позволяющее, учитывая будущие решения, предсказать ее поведение. Нет необходимости выяснять, как возникло то ил иное состояние или каковы были предшествующие решения. Это позволяет последовательно выбирать всего по одному решению в каждый момент времени. Независимо от того, отыскивают оптимальные решения с помощью табличного метода и последующего поиска или аналитическим путем, обычно быстрее и выгоднее производить выбор по одному решению в один момент времени, переходя затем к следующему моменту и т.д. К сожалению, таким методом можно исследовать не все процессы принятия решений. Необходимым условием применения метода динамического программирования является аддитивность цен всех решений, а также независимость будущих результатов от предыстории того или иного состояния.
Если число решений очень велико, то можно построить относительные оценки состояний так, чтобы оценки, отвечающие каждой паре последовательных решений, отличались друг от друга на постоянную величину, представляющую собой средний «доход» на решение. Также можно выполнять дисконтирование доходов от будущих решений. Необходимость в этом иногда появляется в том случае, когда решение принимаются редко, скажем раз в году. Тогда уже не нужно рассматривать последовательно 1,2,3…решения, чтобы достичь решения с большим номером. Вместо этого можно непосредственно оперировать функциональным уравнением, что, как правило, дает существенную выгоду с точки зрения сокращения объема вычислений
2.
Задача о загрузке.
Общие сведения.
Задача о загрузке – это задача о рациональной загрузке судна (самолета, автомашины и т.п.), которое имеет ограничения по объему или грузоподъемности. Каждый помещенный на судно груз приносит определенную прибыль. Задача состоит в определении загрузки судна такими грузами, которые приносят наибольшую суммарную прибыль.
Рекуррентное уравнение процедуры обратной прогонки выводится для общей задачи загрузки судна грузоподъемностью W предметов (грузов) n наименований. Пусть mi-количество предметов і-го наименования, подлежащих загрузке, ri-прибыль, которую приносит один загруженный предмет і-го наименования, wi-вес одного предмета і-го наименования. Общая задача имеет вид следующей целочисленной задачи линейного программирования.
Максимизировать z=r1m1+r2m2+…+rnmn.
при условии, что
w1m1+w2m2+…+wnmn
m1,m2,…,mn
Три элемента модели динамического программирования определяются следующим образом:
- Этап і ставится в соответствии предмету і-го наименования, і=1,2,…n.
- Варианты решения на этапе і описываются количеством mi предметов і-го наименования, подлежащих загрузке. Соответствующая прибыль равна rimi. Значение mi заключено в пределах от 0 до [W/wi], где [W/wi] – целая часть числа W/wi.
- Состояние xi на этапе і выражает суммарный вес предметов, решения о погрузке которых приняты на этапах і,і+1,...n. Это определение отражает тот факт, что ограничения по весу является единственным, которое связывает n этапов вместе.
Пусть fi(xi)-максимальная суммарная прибыль от этапов і,і+1,...,n при заданном состоянии xi. Проще всего рекуррентное уравнение определяется с помощью следующей двухшаговой процедуры.
Шаг 1. Выразим fi(xi) как функцию fi+1(xi+1) в виде
где fn+1(xn+1)=0.
Шаг 2. Выразим xi+1 как функцию xi для гарантии того, что левая часть последнего уравнения является функцией лишь xi. По определению xi-xi+1 представляет собой вес, загруженный на этапе і, т.е. xi-xi+1=wimi или xi+1=xi-wimi. Следовательно, рекуррентное уравнение приобретает следующий вид:
3.
Практическая часть.
Задача
Депутат
некоторого округа баллотируется на
следующий срок. Денежные средства
на предвыборную кампанию составляют
примерно 100000 руб. Хотя комитет по переизбранию
хотел бы провести кампанию во всех
пяти избирательных участках округа, ограниченность
денежных средств, предписывает по-другому.
Приведенная ниже таблица содержит данные
о числе избирателей и денежных средств,
необходимых для проведения успешной
кампании по каждому избирательному участку.
Каждый участок может либо использовать
все предназначенные деньги, либо вовсе
их не использовать. Как следует распределить
денежные средства?
| Участок | Число
избирателей, w |
Необходимые
средства (руб.), m |
| 1 | 3100 | 35000 |
| 2 | 2600 | 25000 |
| 3 | 3500 | 40000 |
| 4 | 2800 | 30000 |
| 5 | 2400 | 20000 |
По условию задачи максимальная сумма денежных средств на предвыборную кампанию не должна превышать 100000 руб., т.е. M = 100000 руб. Тогда m – необходимые средства по каждому участку, а w – число избирателей.
Построение экономико-математической модели:
- число шагов N в данной задаче следует принять равным количеству избирательных участков T, т.е. 5;
- фазовой переменной x является суммарная масса денежных средств на предвыборную кампанию после каждого шага управления. Ограничение: xi ≤ M;
- управляющая переменная r может быть равна либо 0 (т.е. участок вовсе не использует предназначенные денежные средства), либо 1 (участок использует все предназначенные деньги);
- функция процесса xi=fi(xi-1,ri), определяющая закон изменения состояния системы, для данной задачи представляется формулой xi = xi-1 + ri∙mi. Она имеет следующий смысл: суммарная масса денежных средств на предвыборную кампанию xi после шага с номером i равна суммарной массе денежных средств на предвыборную кампанию на предшествующем шаге xi-1 плюс сумма денежных средств на текущем шаге, равная ri∙mi;
- частный экономический эффект представлен формулой zi=ri∙wi, а целевая функция Z=z1+z2+z3+z4+z5.
Отметим, что в данной задаче выполняются основные допущения метода динамического программирования: отсутствие последействия и аддитивность результирующей целевой функции. Значит, можно непосредственно приступить к расчетам в соответствии с методом динамического программирования.
В данном курсовом проекте все получаемые при решении задачи таблицы приведены сразу окончательно заполненными.
Предварительный этап. Данный этап проводится в естественном порядке для i=1,2,3,4,5, причем заполняются только первая строка вспомогательной таблицы и четыре левых столбца основной таблицы. Заполнение второй строки вспомогательной таблицы и оставшихся столбцов основной таблицы производится на этапе условной оптимизации. B0(x0) выражает максимальное значение сумм частных целевых функций на шагах от 1 до 5. Эта функция вычисляется с учетом функции B1(x1), которая является максимальным значением сумм частных целевых функций на шагах от 2 до 5 и т.д.
i
= 1.
Вспомогательная
таблица соответствует
Таблица 3.1
Вспомогательная
таблица на шаге 1
| x0 | 0 |
| B0(x0) | 9200 |
Заполнение
основной таблицы проводится обычным
образом. Для заданного единственного
допустимого значения x0=0
выбираются все возможные значения управления
r1 и заносятся во второй столбец
таблицы. При этом r1 может
принимать только значения 1 или 0. По формулам,
приведенным выше, проводится расчет соответствующих
значений переменных x1 и z1.
Они заносятся в третий и четвертый столбцы.
Получается основная таблица.
Таблица 3.2
Основная таблица на шаге 1
| x0 | r1 | x1 | z1 | B1(x1) | z1+B1 | B0(x0) |
| 0 | 0
1 |
0
35000 |
0
3100 |
8900
6100 |
8900
9200 |
9200 |
i = 2.
На
втором шаге в первую строку вспомогательной
таблицы внесем все переменные
x1, рассчитанные на предшествующем
шаге и фигурирующие в третьем столбце
предыдущей основной таблицы:
Таблица 3.3
Вспомогательная таблица на шаге 2
| x1 | 0 | 35000 |
| B1(x1) | 8900 | 6100 |
Для заполнения основной таблицы будем последовательно выбирать все допустимые значения х1, внесенные во вспомогательную таблицу, и проводить соответствующие расчеты:
Таблица 3.4
Основная таблица на шаге 2
| x1 | r2 | x2 | z2 | B2(x2) | z2+B2 | B1(x1) |
| 0 | 0
1 |
0
25000 |
0
2600 |
8700
6300 |
8700
8900 |
8900 |
| 35000 | 0
1 |
35000
60000 |
0
2600 |
5900
3500 |
5900
6100 |
6100 |
Аналогичные расчеты производятся на остальных этапах решения.
i
= 3.
Таблица 3.5
Вспомогательная таблица на шаге 3
| x2 | 0 | 25000 | 35000 | 60000 |
| B2(x2) | 8700 | 6300 | 5900 | 3500 |
Таблица 3.6
Основная таблица на шаге 3
| x2 | r3 | x3 | z3 | B3(x3) | z3+B3 | B2(x2) |
| 0 | 0
1 |
0
40000 |
0
3500 |
5200
5200 |
5200
8700 |
8700 |
| 25000 | 0
1 |
25000
65000 |
0
35000 |
5200
2800 |
5200
6300 |
6300 |
| 35000 | 0
1 |
35000
75000 |
0
3500 |
5200
2400 |
5200
5900 |
5900 |
| 60000 | 0
1 |
60000
100000 |
0
3500 |
2800
0 |
2800
3500 |
3500 |

- Динамическое программирование
- Динамическое программирование
- Динамическое программирование
- Динамическое программирование
- Динамическое программирование
- Динамическое программирование
- Динамическое программирование
- Динамическое программироание II типа
- Динамическое программирование
- Динамическое программирование
- Динамическое программирование
- Динамическое программирование
- Динамическое программирование
- Динамическое программирование