Задача об оптимальном распределении ресурсов между отраслями на п лет
Прежде чем перейти к конкретным задачам, следует усвоить общую схему применения метода ДП.
Предположим, что все требования, предъявляемые к задаче методом ДП, выполнены. (Эти требования сформулированы в разд. 12.1). Построение модели ДП и применение метода ДП для решения сводится к следующим моментам:
1. Выбирают способ деления процесса управления на шаги.
2. Определяют параметры состояния ^ и переменные управления Х/с на каждом шаге.
3. Записывают уравнения состояний.
4. Вводят целевые функции к-го шага и суммарную целевую функцию.
Решая задач1^Ьное управление: Х*(х'х, Х\,..., Х'„). схемы по крэд ' с^едует По возможности придерживаться этой работает схе|ца ^^ Мере в начале изучения темы. Рассмотрим, как ресурсов мех^у примере задачи об оптимальном распределении > 12.2.Планируе уМя отраслями на п лет.
лет. Начальн^1е деятельность двух отраслей производства на п начале года, да Урсы sQ. Средства х, вложенные в I отрасль в размере qx(x)^ fi конце года прибыль/](jc) и возвращаются в равна fi(x), а Во^в Логично для II отрасли функция прибыли щенные сРеДства з а ~" q2^ ^2(x)<x)- В конце года все возвра-лями, новые Ср аНово перераспределяются между I и II отрас-вкладывается! т&а Не поступают, прибыль в производство не
Требуется р отраслями пр0Изв ^Делить имеющиеся средства s0 между двумя от обеих отраСле^ ^ства на п лет так, чтобы суммарная прибыль
Необходим а п лет оказалась максимальной.
а) построить"
б) решить 3а!ДеЛьДП для задачи и вычислительную схему; Л(х) - 0,6х, q^ ^Ну При уСЛ0ВИИ; что Sq = ЮООО ед., п = 4,
1 Последнце ycjj
ступают новые Сред Ия определяют вид уравнений состояний; если поэте можно легКо уЧе ва или часть прибыли вкладывается в производство,
ТК Toy, .,«.,------------------------------- .-------------------- ТТТ-Г______________________
| так как алгоритм метода ДП не изменяется.
| " °>7*> fr{x) = 0,5х, д2(х) = 0,8*.
Глава 12
Модели динамического программирования
Решение, а) Процесс распределения средств между двумя отраслями производства разворачивается во времени, решения принимаются в начале каждого года, следовательно, осуществляется деление на шаги: номер шага — номер года. Управляемая система — две отрасли производства, а управление состоит в выделении средств каждой отрасли в очередном году. Параметры состояния к началу к-го года — s/c-i (к=1, 2,..., п) — количество средств, подлежащих распределению. Переменных управления на каждом шаге две: хк — количество средств, выделенных I отрасли, и у/с — II отрасли. Но так как все средства s^-i распределяются, то y/c=sk-\~xk, и поэтому управление на к-м шаге зависит от одной переменной хп, т.е. Хк(хк, ty-i-х*).
Уравнения состояний
■**=fl(**)+0ifot-i-**) (12.13)
выражают остаток средств, возвращенных в конце к-го года.
Показатель эффективности к-го шага — прибыль, полученная в конце А:-го года от обеих отраслей:
/i(**)+/2fobi-**)- (12.14)
Суммарный показатель эффективности — целевая функция задачи — прибыль за п лет:
и
2 = ^Мхк)Ш*к-\-хк)- (12.15)
к=\
Пусть Zk(sjc-\) — условная оптимальная прибыль за п—к+1 лет, начиная с к-го года до л-го года включительно, при условии, что имеющиеся на начало к-го года средства s^-i в дальнейшем распределялись оптимально. Тогда оптимальная прибыль за п лет
Уравнения Беллмана имеют вид:
)= max Mx„)+f2(s„-l-x„)}, (12.16)
Q<Xk<,Sk_\
Z\Uk-\) = n max \f\(xk)+f2{Sk-\-xk)+Z*k+l(sk)}, (12.17)
(k=n-l, n-2, ..., 2).
б) Используем конкретные данные.
Уравнение состояний (12.13) примет вид:
sk=0,7xk+0,8(Sk-\-Xk), или sk=Q,Ssk-i-0,\xk. (12.18)
Целевая функция к-го шага (12.14)
0,6х*+0,5(^_1-х*)=0,1-^+0,5^-1. Целевая функция задачи
Z= 20Дул_, + 0Дхл. (12.19)
к=\
Функциональные уравнения
Zl(s3)= max {0,5^3+0,1x4}, (12.20)
0<JC4<53
и^(У= max {0,1^+0,5^1+ ^*+i fot)b (12.21)Проводим условную оптимизацию.
Д j IV ш а г. Используем уравнение
(12.20). Обозначим через Z4 функцию, стоящую в скобках, Zi, — 0,1x4+0,553; ОДуз^.—■—I функция Z$ — линейная, возрастаю-
щая, так как угловой коэффициент 0,1 больше нуля. Поэтому максимум достигается на конце интервала [0; 5з] *" (рис. 12.5). Следовательно, Zl{s^)=Q,bsi
Рис. 12.5" ПРИ х\ (Ъ)=*з-
III шаг. Уравнение:
ZUs2)= max {0,1х3+0,552+0,б5з}.
Найдем 5з из уравнений состояний (12.18): 5з = 0,852-0,1х3 и, подставив его выражение в правую часть уравнения, получим
ZUs2) = max {0,lx3+0,552+0,6(0,852-0,lx3)},
1 d<x2<s2
ZUs2)= max {0,04x3+0,9852}.
0<x3<j2
264
--------------------- „___________ .____________________ Глава 12
Как и в предыдущем случае, максимум достигается при x3=sy т.е. Z] (s2) = 1,02*2 при х] (s1)=s2.
II ш а г. Из уравнения состояния: ^2=0,8*! -0,1*2. Поэтому уравнение (12.20) при к=2 примет вид:
Z'2(si)= max {1,316*!-0,002x2}.
Линейная относительно х2 функция Ц Z2 = 1,316^-0,002x2 убывает на отрезке
—^ ■---------- '---- ► [0; s\], и поэтому ее максимум достигает-
х, сяприх2=0 (рис. 12.6):
РиС' 12-6 А (л)=1,316*, при х* (j,)=0.
I шаг. Ji=0,8jo-0,1x,. Уравнение (12.20) при А=1 имеет ввд: ' Z[{s0)= max {1,55285b—0,0316xi}.
Как и в предыдущем случае, максимум достигается в начале отрезка, т.е. п«-«шс
Z\ (s0) = 1,552850 при x,*(j0)=0. На этом условная оптимизация заканчивается. Используя ее результат и исходные данные, получим 2^ = Z,*(10000),
■^пах = 15528.
х\ = 0, у\ = s0 = 10000 (все средства выделяются II отрасли) -»
si =0,8-10000-0,1-0=8000 => х2 =0, у\ =^,=8000 (все средства выделяются II отрасли) -»
-► *2=0,8-8000-0-,1.0=6400 => х\ =6400, л*=0-> (все средства выделяются I отрасли) ->
-> ^=0,8-6400-0,1-6400=4480^ х;=4480, ^=0 (все средства выделяются I отрасли).
Оптимальная прибыль за 4 года, полученная от двух отраслей производства при начальных средствах 10000 ед., равна 15528 ед.
Модели динамического программирования
при условии, что I отрасль получает по годам (0; 0; 6400; 4480), а II отрасль — соответственно (10000; 8000; 0; 0)>
|