Принципът на оптималност и Белман уравнение

принцип оптималност първо се приготвя от Ричард Ernest Белман през 1953 г. (в тълкуването на Wentzel ES):

Каквато и да е състоянието на системата в резултат на редица стъпки, по време на следващата стъпка е да изберете органа за управление, така че да се съчетава с оптимален контрол при всички следващи стъпки, водещи до оптимално спечели всички останали стъпки, включително и тази.

RE Белман са формулирани и условията, при които принципът е вярно. Основната от изискване - процеса на управление трябва да бъде отворен цикъл, т.е. В тази стъпка, управлението трябва да има никакво влияние върху предишните стъпки.

Помислете за общия проблем за динамично програмиране, по-горе. На всяка стъпка, с изключение на последния, за който и да е държавна система SK-1 решение за управление на Хк трябва да бъде избран "с повишено внимание", тъй като този избор се отразява на последваща система състояние SK.

В последната стъпка въз основа на състоянието на системата Xn могат да се планират SN-1 управленски решения на местно ниво оптимално, т.е. да се пристъпи само от причините за тази стъпка.

Помислете за последния п-тата стъпка:

SN-1 - състояние на системата в началото на п-тия етап;

SN - крайното състояние на системата;

Xn - управление п-ти етап;

Съгласно принципа на оптималност, Xn трябва да бъдат избрани така, че за всяко състояние система зп-1 за да се получи оптимално обективната функция на този етап.

Означаваме оптимално (за максимално поемане сигурност) обективната функция - показател за ефективността на н-ия етап, при условие, че в началото на последната стъпка S системата е в произволно състояние зп-1. и управление е най-добрият в последната стъпка.

наречен условно максимум обективната функция в п-ия етап, и се определя по следната формула:

Максимизиране е над всички допустими контроли Xn.

решение Xn. където постигната. и тя зависи от SN-1 и наречен условно оптимално разтвор в п-ти етап. Ние го означаваме с.

(11.5) реши едномерна проблем на местно оптимизация на уравнението, ние определяме всички възможни състояния на функциите на SN-1 и два.

Да разгледаме две стъпки задача се допират до п-ти етап (n-1) х.

При всички състояния на SN-2. произволни административни решения XN-1 и оптимален контрол на N-ти етап цел стойността на функцията на последните две стъпки, се изчислява, както следва:

Съгласно принципа на оптималност Белман за всеки зп-2 разтвор трябва да бъде избран така, че заедно с оптимален контрол в последната (п TH) стъпка ще доведе до оптимума на обективната функция на последните две стъпки. Поради това е необходимо да се намери оптимален израз (11.6) за всички валидни административни решения Xn-1:

- наречен условно максимум целевата функция при оптимално управление на последните две стъпки. Трябва да се отбележи, че експресията в скоби във формула (11.6), зависи само от SN-2 и Xn-1. тъй като SN-1 може да се намери от състояние уравнение (11.1) с:

Xn-1, съответстващо управление (n-1) ти етап е означен и по условие оптимален контрол на (n-1) х.

условно Optima на обективната функция са дефинирани по същия начин за оптимален контрол (п к + 1) стъпки, като се излиза от к-тия до края, при условие, че началото на к-ти етап система е в състояние SK-1:

Xk к управление ия етап, при който максимум (11.8), е показана и се нарича условно оптимален контрол на к-ти етап.

Уравнения (11.5) и (11.8) се нарича повтарящи Белман уравнение (обратна верига). Процесът на решаване на тези уравнения се наричат принудена оптимизация.

В резултат на оптимизация ограничени получава две последователности:

. . .... - условно максимум целевата функция в последната, последните две, ..., н на стъпалата;

. . .... - условие за оптимално управление п-та, (п-1) -ти, ..., на първите стъпки.

С помощта на тези последователности, можете да се намери решение на проблема с динамично програмиране с п данни и s0:

Резултатът е оптимално решение на проблема с динамично програмиране :.

Спор по същия начин, ние можем да изградим пряк и ограничени възможности, схема за оптимизация:

Оптималното решение на проблема в този случай е, както следва:

По този начин, изграждане на модел на динамично програмиране и решението въз основа на неговите цели в общи линии може да се изрази като следните стъпки:

1. Избор на метода за разделяне на етапите на процеса контрол.

2. Определете състояние SK и контрол на променливите величини, параметри XK на всяка стъпка се записват състояние уравнение.

3. Въвеждане на целевата функция к ти етап а общата обективната функция, както и при условие и условно Optima оптималното управление на к-ти етап ().

4. Запишете в съответствие с обратната или напред схема рекурсия Белман уравнение и след принудена оптимизация получават две последователности: <> и <>.

5. Определяне на оптималната стойност на обективната функция и оптималното решение.

Свързани статии