Interested Article - Оптимальное управление

Оптимальное управление — это задача проектирования системы, обеспечивающей для заданного объекта управления или процесса закон управления или управляющую последовательность воздействий, обеспечивающих максимум или минимум заданной совокупности критериев качества системы .

Определение

Задача оптимального управления включает в себя расчет оптимальной программы управления и синтез системы оптимального управления. Оптимальные программы управления, как правило, рассчитываются численными методами нахождения экстремума функционала или решения краевой задачи для системы дифференциальных уравнений . Синтез систем оптимального управления с математической точки зрения представляет собой задачу нелинейного программирования в функциональных пространствах .

Для решения задачи определения программы оптимального управления строится математическая модель управляемого объекта или процесса, описывающая его поведение с течением времени под влиянием управляющих воздействий и собственного текущего состояния .

Если математическая модель управляемого объекта или процесса заранее неизвестна, то для её определения необходимо провести процедуру идентификации управляемого объекта или процесса

Математическая модель для задачи оптимального управления включает в себя: формулировку цели управления, выраженную через критерий качества управления; определение дифференциальных или разностных уравнений , описывающих возможные способы движения объекта управления; определение ограничений на используемые ресурсы в виде уравнений или неравенств .

Все задачи оптимального управления можно рассматривать как задачи математического программирования и в таком виде решать их численными методами.

При оптимальном управлении иерархическими многоуровневыми системами, например, крупными химическими производствами, металлургическими и энергетическими комплексами, применяются многоцелевые и многоуровневые иерархические системы оптимального управления. В математическую модель вводятся критерии качества управления для каждого уровня управления и для всей системы в целом, а также координация действий между уровнями управления .

Если управляемый объект или процесс является детерминированным, то для его описания используются дифференциальные уравнения. Наиболее часто используются обыкновенные дифференциальные уравнения вида x ˙ ( t ) = a [ x ( t ) , u ( t ) , t ] {\displaystyle {\dot {x}}(t)=a[x(t),u(t),t]} . В более сложных математических моделях (для систем с распределёнными параметрами) для описания объекта используются дифференциальные уравнения в частных производных . Если управляемый объект является стохастическим, то для его описания используются стохастические дифференциальные уравнения .

Для решения задач оптимального управления в условиях конфликта или неопределенности используется теория дифференциальных игр .

Если решение поставленной задачи оптимального управления не является непрерывно зависящим от исходных данных ( некорректная задача ), то такая задача решается специальными численными методами.

Для решения задач оптимального управления с неполной исходной информацией и при наличии ошибок измерений используется метод максимального правдоподобия .

Система оптимального управления, способная накапливать опыт и улучшать на этой основе свою работу, называется обучающейся системой оптимального управления .

Реальное поведение объекта или системы всегда отличается от программного вследствие неточности в начальных условиях, неполной информации о внешних возмущениях, действующих на объект, неточности реализации программного управления и т. д. Поэтому для минимизации отклонения поведения объекта от оптимального обычно используется система автоматического регулирования .

Иногда (например, при управлении сложными объектами, такими как доменная печь в металлургии или при анализе экономической информации) в исходных данных и знаниях об управляемом объекте при постановке задачи оптимального управления содержится неопределённая или нечёткая информация, которая не может быть обработана традиционными количественными методами. В таких случаях можно использовать алгоритмы оптимального управления на основе математической теории нечётких множеств ( нечёткое управление ). Используемые понятия и знания преобразуются в нечёткую форму, определяются нечёткие правила вывода принимаемых решений, затем производится обратное преобразование нечётких принятых решений в физические управляющие переменные.

Для решения задач оптимального управления очень большой размерности, не позволяющей их решать методами классической математики, используются методы ситуационного управления .

Для оптимального управления экономическими процессами применяются методы экономической кибернетики , теории игр , теории графов

Оптимальное управление детерминированными системами

Системы с сосредоточенными параметрами

Наиболее широко при проектировании систем управления детерминированными объектами c сосредоточенными параметрами, описываемыми обыкновенными дифференциальными уравнениями, применяются следующие методы: вариационное исчисление , принцип максимума Понтрягина и динамическое программирование Беллмана .

Задача оптимального управления

Сформулируем задачу оптимального управления:

  • Уравнения состояния: x ˙ ( t ) = a [ x ( t ) , u ( t ) , t ] {\displaystyle {\dot {x}}(t)=a[x(t),u(t),t]} (1).
  • Граничные условия x ( t 0 ) = x 0 {\displaystyle x(t_{0})=x_{0}^{*}} , x ( t 1 ) = x 1 {\displaystyle x(t_{1})=x_{1}^{*}} (2).
  • Минимизируемый функционал: η = t 0 t 1 F [ x ( τ ) , x ˙ ( τ ) , τ ] d τ , {\displaystyle \eta =\int _{t_{0}}^{t_{1}}F[x(\tau),{\dot {x}}(\tau),\tau ]d\tau ,} .

здесь x ( t ) {\displaystyle x(t)} — вектор состояния u ( t ) {\displaystyle u(t)} — управление, t 0 , t 1 {\displaystyle t_{0},t_{1}} — начальный и конечный моменты времени.

Задача оптимального управления заключается в нахождении функций состояния x ( t ) {\displaystyle x(t)} и управления u ( t ) {\displaystyle u(t)} для времени ( t 0 t t 1 ) {\displaystyle ({t_{0}}\leq {t}\leq {t_{1}})} , которые минимизируют функционал.

Вариационное исчисление

Рассмотрим данную задачу оптимального управления как задачу Лагранжа вариационного исчисления . Для нахождения необходимых условий экстремума применим теорему Эйлера-Лагранжа . Функция Лагранжа Λ {\displaystyle \Lambda } имеет вид: Λ = t 0 t 1 ( F [ x ( t ) , x ˙ ( t ) , t ] + λ 1 T ( t ) ( x ˙ ( t ) a [ x ( t ) , u ( t ) , t ] ) ) d t + l {\displaystyle \Lambda =\int _{t_{0}}^{t_{1}}(F[x(t),{\dot {x}}(t),t]+\lambda _{1}^{T}(t)({\dot {x}}(t)-a[x(t),u(t),t]))dt+l} , где l = λ 2 T ( x ( t 0 ) x 0 ) + λ 3 T ( x ( t 1 ) x 1 ) {\displaystyle l=\lambda _{2}^{T}(x(t_{0})-x_{0}^{*})+\lambda _{3}^{T}(x(t_{1})-x_{1}^{*})} — граничные условия. Лагранжиан L {\displaystyle L} имеет вид: L [ x ( t ) , x ˙ ( t ) , u ( t ) , λ ( t ) , t ] = F [ x ( t ) , x ˙ ( t ) , t ] + λ 1 T ( t ) ( x ˙ ( t ) a [ x ( t ) , u ( t ) , t ] ) {\displaystyle L[x(t),{\dot {x}}(t),u(t),\lambda (t),t]=F[x(t),{\dot {x}}(t),t]+\lambda _{1}^{T}(t)({\dot {x}}(t)-a[x(t),u(t),t])} , где λ 1 {\displaystyle \lambda _{1}} , λ 2 {\displaystyle \lambda _{2}} , λ 3 {\displaystyle \lambda _{3}} n-мерные вектора множителей Лагранжа .

Необходимые условия экстремума, согласно этой теореме, имеют вид:

  • стационарность по u: L ^ u = 0 {\displaystyle {\hat {L}}_{u}=0} , (3)
  • стационарность по x, уравнение Эйлера: L ^ x d d t L ^ x ˙ = 0 {\displaystyle {\hat {L}}_{x}-{\frac {d}{dt}}{\hat {L}}_{\dot {x}}=0} (4)
  • трансверсальность по x: L ^ x ˙ ( t 0 ) = l ^ x ( t 0 ) {\displaystyle {\hat {L}}_{\dot {x}}(t_{0})={\hat {l}}_{x(t_{0})}} , L ^ x ˙ ( t 1 ) = l ^ x ( t 1 ) {\displaystyle {\hat {L}}_{\dot {x}}(t_{1})=-{\hat {l}}_{x(t_{1})}} (5)

Необходимые условия (3-5) составляют основу для определения оптимальных траекторий. Написав эти уравнения, получаем двухточечную граничную задачу, где часть граничных условий задана в начальный момент времени, а остальная часть — в конечный момент. Методы решения подобных задач подробно разбираются в книге

Принцип максимума Понтрягина

Необходимость в принципе максимума Понтрягина возникает в случае, когда нигде в допустимом диапазоне управляющей переменной невозможно удовлетворить необходимому условию (3), а именно L ^ u = 0 {\displaystyle {\hat {L}}_{u}=0} .

В этом случае условие (3) заменяется на условие (6):

min u U L ( t , x ( t ) , x ˙ ( t ) , u ) = L ( t , x ^ ( t ) , x ˙ ( t ) , u ^ ) min u U ( F ( t , x ( t ) , u ) λ ( t ) a ( t , x ( t ) , u ) ) = f ( t ) λ ( t ) a ( t ) . {\displaystyle {\begin{aligned}\min _{u\in U}L(t,x(t),{\dot {x}}(t),u)&=L(t,{\hat {x}}(t),{\dot {x}}(t),{\hat {u}})\Longleftrightarrow \\&\Longleftrightarrow \min _{u\in U}\left(F(t,x(t),u)-\lambda (t)a(t,x(t),u)\right)=f(t)-\lambda (t)a(t).\end{aligned}}} (6)

В этом случае согласно принципу максимума Понтрягина величина оптимального управления равна величине управления на одном из концов допустимого диапазона. Уравнения Понтрягина записываются при помощи функции Гамильтона H {\displaystyle H} , определяемой соотношением H = F ( t , x ( t ) , u ) λ ( t ) a ( t , x ( t ) , u ) {\displaystyle H=F(t,x(t),u)-\lambda (t)a(t,x(t),u)} . Из уравнений следует, что функция Гамильтона H {\displaystyle H} связана с функцией Лагранжа L {\displaystyle L} следующим образом: L = H + λ ( t ) x ˙ ( t ) {\displaystyle L=H+\lambda (t){\dot {x}}(t)} . Подставляя L {\displaystyle L} из последнего уравнения в уравнения (3—5), получаем необходимые условия, выраженные через функцию Гамильтона:

  • уравнение управления по u: H ^ u = 0 {\displaystyle {\hat {H}}_{u}=0} , (7)
  • уравнение состояния: x ˙ = H ^ λ {\displaystyle {\dot {x}}=-{\hat {H}}_{\lambda }} , (8)
  • сопряжённое уравнение: λ ˙ = H ^ x {\displaystyle {\dot {\lambda }}=-{\hat {H}}_{x}} , (9)
  • трансверсальность по x: λ ( t 0 ) = l ^ x ( t 0 ) {\displaystyle \lambda (t_{0})={\hat {l}}_{x(t_{0})}} , λ ( t 1 ) = l ^ x ( t 1 ) {\displaystyle \lambda (t_{1})=-{\hat {l}}_{x(t_{1})}} (10)

Необходимые условия, записанные в такой форме, называются уравнениями Понтрягина. Более подробно принцип максимума Понтрягина разобран в книге .

Пример

Пусть требуется решить задачу минимизации функционала:

0 1 ( u 2 4 x ) d t {\displaystyle \int _{0}^{1}(u^{2}-4x)dt} , где d x d t = u {\displaystyle {\frac {dx}{dt}}=u} , 0 u 1 {\displaystyle 0\leqslant u\leqslant 1} , x ( 0 ) = 0 {\displaystyle x(0)=0} .

Функция Гамильтона в данном случае имеет вид:

H = λ u u 2 + 4 x {\displaystyle H=\lambda u-u^{2}+4x} .

Из условий 9) и 10) находим, что:

λ = 4 4 t {\displaystyle \lambda =4-4t} , t [ 0 , 1 ] {\displaystyle t\in [0,1]} .

Получаем:

H = ( 4 4 t ) u u 2 + 4 x {\displaystyle H=(4-4t)u-u^{2}+4x} .

Максимум этой функции по u {\displaystyle u} , 0 < u < 1 {\displaystyle 0<u<1} , достигается при u = u ( t ) {\displaystyle u=u^{*}(t)} , где

u ( t ) = { 1 , if 0 t 1 2 2 2 t , if 1 2 t 1 {\displaystyle u^{*}(t)={\begin{cases}1,&{\mbox{if }}0\leqslant t\leqslant {\frac {1}{2}}\\2-2t,&{\mbox{if }}{\frac {1}{2}}\leqslant t\leqslant 1\end{cases}}}

По условию, d x ( t ) d t = u ( t ) {\displaystyle {\frac {dx^{*}(t)}{dt}}=u^{*}(t)} . Значит:

x ( t ) = { t + c 1 , if 0 t 1 2 2 t t 2 c 2 , if 1 2 t 1 {\displaystyle x^{*}(t)={\begin{cases}t+c_{1},&{\mbox{if }}0\leqslant t\leqslant {\frac {1}{2}}\\2t-t^{2}-c_{2},&{\mbox{if }}{\frac {1}{2}}\leqslant t\leqslant 1\end{cases}}}

Из x ( 0 ) = 0 {\displaystyle x^{*}(0)=0} , получаем c 1 = 0 {\displaystyle c_{1}=0} . Из условия непрерывности x ( t ) {\displaystyle x^{*}(t)} в точке t = 1 2 {\displaystyle t={\frac {1}{2}}} найдем постоянную c 2 = 1 4 {\displaystyle c_{2}=-{\frac {1}{4}}} .

Таким образом:

x ( t ) = { t , if 0 t 1 2 2 t t 2 1 4 , if 1 2 t 1 {\displaystyle x^{*}(t)={\begin{cases}t,&{\mbox{if }}0\leqslant t\leqslant {\frac {1}{2}}\\2t-t^{2}-{\frac {1}{4}},&{\mbox{if }}{\frac {1}{2}}\leqslant t\leqslant 1\end{cases}}}

Можно проверить, что найденные x ( t ) {\displaystyle x^{*}(t)} и u ( t ) {\displaystyle u^{*}(t)} составляют оптимальное решение данной задачи

Где применяется

Принцип максимума особенно важен в системах управления с максимальным быстродействием и минимальным расходом энергии, где применяются управления релейного типа, принимающие крайние, а не промежуточные значения на допустимом интервале управления.

История

За разработку теории оптимального управления Л. С. Понтрягину и его сотрудникам В. Г. Болтянскому , Р. В. Гамкрелидзе , и Е. Ф. Мищенко в 1962 году была присуждена Ленинская премия .

Метод динамического программирования

Метод динамического программирования основан на принципе оптимальности Беллмана, который формулируется следующим образом: оптимальная стратегия управления обладает тем свойством, что каково бы ни было начальное состояние и управление в начале процесса, последующие управления должны составлять оптимальную стратегию управления относительно состояния, полученного после начальной стадии процесса . Более подробно метод динамического программирования изложен в книге

Достаточные условия оптимальности

Достаточные условия оптимальности управляемых процессов были получены в 1962 году В. Ф. Кротовым , на их основе были построены итерационные вычислительные методы последовательного улучшения, позволяющие находить глобальный оптимум в задачах управления .

Оптимальное управление системами с распределёнными параметрами

В задачах оптимального управления такими объектами, как проходная нагревательная печь, теплообменный аппарат , установка для нанесения покрытия, сушильный агрегат, химический реактор , установка для разделения смесей, доменная или мартеновская печь , коксовая батарея, прокатный стан , печь индукционного нагрева и т. д. управляемый процесс описывается дифференциальными уравнениями в частных производных, интегральными уравнениями и интегро-дифференциальными уравнениями.

Теория оптимального управления в этом случае разработана лишь для отдельных видов этих уравнений: эллиптического, параболического и гиперболического типа.

В некоторых простых случаях удается получить аналог принципа максимума Понтрягина.

Если решения систем уравнений имеют неустойчивости, точки разрыва, точки бифуркации, кратные решения, то для их получения используется ряд специальных методов .

Задача оптимального управления

  • Задана область определения управляемого процесса 0 x a , 0 y b {\displaystyle 0\leqslant x\leqslant a,0\leqslant y\leqslant b}
  • Уравнения, описывающие управляемый процесс: 2 Q i x y = f i ( x , y , Q , Q x , Q y , u ) ; ( 1 ) {\displaystyle {\frac {\partial ^{2}Q_{i}}{\partial x\partial y}}=f_{i}(x,y,Q,{\frac {\partial Q}{\partial x}},{\frac {\partial Q}{\partial y}},u);(1)} , где Q {\displaystyle Q} n {\displaystyle n} — мерный вектор, описываемый управляемый процесс, Q x {\displaystyle {\frac {\partial Q}{\partial x}}} n {\displaystyle n} — мерный вектор производных вектора Q {\displaystyle Q} по координате x {\displaystyle x} , Q y {\displaystyle {\frac {\partial Q}{\partial y}}} n {\displaystyle n} — мерный вектор производных вектора Q {\displaystyle Q} по координате y {\displaystyle y} , u {\displaystyle u} r {\displaystyle r} — мерный управляющий вектор.
  • Граничные условия для управляемого процесса: Q i ( 0 , y ) = ϕ i ( y ) ; Q i ( x , 0 ) = ψ i ( x ) ; i = 1 , . . . , n ; ( 2 ) {\displaystyle Q_{i}(0,y)=\phi _{i}(y);Q_{i}(x,0)=\psi _{i}(x);i=1,...,n;(2)}
  • Задача оптимального управления состоит в том, чтобы найти такое управление u ( x , y ) {\displaystyle u(x,y)} , при котором допустимое уравнениями ( 1 ) , ( 2 ) {\displaystyle (1),(2)} решение Q ( x , y ) {\displaystyle Q(x,y)} приводит к максимуму функционала J = i = 1 n c i Q i ( a , b ) {\displaystyle J=\sum _{i=1}^{n}c_{i}Q_{i}(a,b)} .
Принцип максимума для систем с распределёнными параметрами

С целью формулировки принципа максимума для систем с распределёнными параметрами вводится функция Гамильтона: H ( N , Q , d Q d x , d Q d y , u ) = i = 1 n N i f i ( x , y , Q , d Q d x , d Q d y , u ) {\displaystyle H(N,Q,{\frac {dQ}{dx}},{\frac {dQ}{dy}},u)=\sum _{i=1}^{n}N_{i}f_{i}(x,y,Q,{\frac {dQ}{dx}},{\frac {dQ}{dy}},u)} , где вспомогательные функции N 1 ( x , y ) , . . . , N n ( x , y ) {\displaystyle N_{1}(x,y),...,N_{n}(x,y)} должны удовлетворять уравнениям d N i d x d y = d H d Q i d d x d H d Q i x d d y d H d Q i y ( 2 ) {\displaystyle {\frac {dN_{i}}{dxdy}}={\frac {dH}{dQ_{i}}}-{\frac {d}{dx}}{\frac {dH}{dQ_{ix}}}-{\frac {d}{dy}}{\frac {dH}{dQ_{iy}}}(2)} и граничным условиям d N i d x = d H d Q i y {\displaystyle {\frac {dN_{i}}{dx}}=-{\frac {dH}{dQ_{iy}}}} при y = b ( 3 ) {\displaystyle y=b(3)} , d N i d y = d H d Q i x {\displaystyle {\frac {dN_{i}}{dy}}=-{\frac {dH}{dQ_{ix}}}} при x = a ( 4 ) {\displaystyle x=a(4)} , N i ( a , b ) = c i ( 5 ) {\displaystyle N_{i}(a,b)=-c_{i}(5)} .

Если u 0 ( x , y ) {\displaystyle u^{0}(x,y)} - оптимальное управление и Q 0 ( x , y ) , N 0 ( x , y ) {\displaystyle Q^{0}(x,y),N^{0}(x,y)} - получающиеся при оптимальном управлении функции, удовлетворяющие уравнениям ( 1 ) , ( 2 ) , ( 3 ) , ( 4 ) , ( 5 ) {\displaystyle (1),(2),(3),(4),(5)} , то функция H ( N 0 ( x , y ) , Q 0 ( x , y ) , d Q 0 ( x , y ) d x , d Q 0 ( x , y ) d y , u ) {\displaystyle H(N^{0}(x,y),Q^{0}(x,y),{\frac {dQ^{0}(x,y)}{dx}},{\frac {dQ^{0}(x,y)}{dy}},u)} , рассматриваемая как функция от аргумента u {\displaystyle u} достигает максимума в области ω {\displaystyle \omega } при u = u 0 ( x , y ) {\displaystyle u=u^{0}(x,y)} , то есть почти для всех точек ( x , y ) D {\displaystyle (x,y)\in D} выполняется равенство max u ω H ( N 0 ( x , y ) , Q 0 ( x , y ) , d Q 0 ( x , y ) d x , d Q 0 ( x , y ) d y , u ) = H ( N 0 ( x , y ) , Q 0 ( x , y ) , d Q 0 ( x , y ) d x , d Q 0 ( x , y ) d y , u ) {\displaystyle \max _{u\in \omega }H(N^{0}(x,y),Q^{0}(x,y),{\frac {dQ^{0}(x,y)}{dx}},{\frac {dQ^{0}(x,y)}{dy}},u)=H(N^{0}(x,y),Q^{0}(x,y),{\frac {dQ^{0}(x,y)}{dx}},{\frac {dQ^{0}(x,y)}{dy}},u)}


Если система ( 1 ) {\displaystyle (1)} является линейной системой вида d 2 Q i d x d y = k = 1 n [ m i k ( x , y ) d Q k d x + p i k ( x , y ) d Q k d y + q i k ( x , y ) Q k ] + f i ( u ) {\displaystyle {\frac {d^{2}Q_{i}}{dxdy}}=\sum _{k=1}^{n}{\Bigl [}m_{ik}(x,y){\frac {dQ_{k}}{dx}}+p_{ik}(x,y){\frac {dQ_{k}}{dy}}+q_{ik}(x,y)Q_{k}{\Bigr ]}+f_{i}(u)} , то выполняется теорема

Для оптимальности управления u ( x , y ) {\displaystyle u(x,y)} в линейном случае необходимо и достаточно, чтобы выполнялся принцип максимума.


Доказательство этих двух теорем смотри в книге .

Оптимальное управление линейными стохастическими системами

В этом случае управляемый объект или процесс описывается линейными стохастическими дифференциальными уравнениями . В этом случае решение задачи оптимального управления осуществляется на основе уравнения Риккати .

Задача оптимального управления

  • Система описывается линейными стохастическими дифференциальными уравнениями d x = A x d t + B u d t + d v , d y = C x d t + d e {\displaystyle dx=Axdt+Budt+dv,dy=Cxdt+de} , где x {\displaystyle x} n {\displaystyle n} -мерный вектор состояния, u {\displaystyle u} p {\displaystyle p} -мерный вектор управления, y {\displaystyle y} v {\displaystyle v} -мерный вектор наблюдаемых переменных, v ( t ) , e ( t ) {\displaystyle v(t),e(t)} — независимые винеровские процессы с нулевыми средними значениями и заданными ковариациями приращений, A , B , C {\displaystyle A,B,C} — матрицы.
  • Необходимо найти оптимальное управление, минимизирующее математическое ожидание функции потерь x T ( t 1 ) Q 0 x ( t 1 ) + t 0 t 1 [ x T ( t ) Q 1 x ( t ) + u T Q 2 u ( t ) ] d t ] {\displaystyle x^{T}(t_{1})Q_{0}x(t_{1})+\int _{t_{0}}^{t_{1}}[x^{T}(t)Q_{1}x(t)+u^{T}Q_{2}u(t)]dt]} .

См. также

Примечания

  1. Самойленко В. И., Пузырев В. А., Грубрин И. В. «Техническая кибернетика», учеб. пособие, М., изд-во МАИ , 1994, 280 с. ил., ISBN 5-7035-0489-9 , гл. 4 «Оптимальные системы управления динамическими объектами и процессами», с. 63-113;
  2. , с. 114.
  3. , с. 316.
  4. Растригин Л. А. Этот случайный, случайный, случайный мир. — М., Молодая гвардия, 1969. — С. 47 — 50
  5. Растригин Л. А. , Маджаров Н. Е. Введение в идентификацию объектов управления. — М. : Энергия, 1977. — 216 с.
  6. , с. 79—89.
  7. Коршунов Ю. М. «Математические основы кибернетики», учеб. пособие для вузов, 2-е изд., перераб. и доп., М., «Энергия», 1980, 424 с., ил., ББК 32.81 6Ф0.1, гл. 5 «Структура и математическое описание задач оптимального управления», c. 202;
  8. , с. 18.
  9. , с. 304—368.
  10. Месарович М., Мако Д., Ткахара И. Теория иерархических многоуровневых систем — М., Мир, 1973. — с. 344
  11. ↑ , с. 465—520.
  12. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. - М., Наука, 1974. - с. 24
  13. Васильев Ф. П. Методы решения экстремальных задач. — М.: Наука, 1981. — С. 159.
  14. , с. 351—368.
  15. Цыпкин Я. З. Основы теории обучающихся систем. — М.: Наука, 1970. — С. 252.
  16. Александров А. Г. Оптимальные и адаптивные системы. — М.: Высшая школа, 1989. — 263 с. ISBN 5-06-000037-0
  17. Методы робастного, нейро-нечёткого и адаптивного управления: Учебник / Под ред. Н. Д. Егупова, изд. 2-ое, стер., М., Изд-во МГТУ им Н. Э. Баумана, 2002, 744 с ил., ISBN 5-7038-2030-8 , тир. 2000 экз, ч. 2 «Нечёткое управление»
  18. Теплов Л. Что считать: популярные очерки по экономической кибернетике. — М., Московский рабочий, 1970. — 317 c.
  19. ↑ Э. М. Галеев, В. М. Тихомиров «Оптимизация: теория, примеры, задачи», М., «Эдиториал УРСС», 2000, 320 с., ISBN 5-8360-0041-7 , гл. 3 «Вариационное исчисление», п. 6 «Задача Лагранжа», с. 173—181;
  20. «Численные методы в теории оптимальных систем», Моисеев Н. Н. , «Наука», 1971, 424 стр. с илл., гл. 2 «Численные методы расчета оптимальных программ, использующие необходимые условия экстремума», с 80 — 155;
  21. Барбаумов В. Е., Ермаков В. И., Кривенцова Н. Н. Справочник по математике для экономистов. — М., Высшая школа, 1987. — с. 243
  22. Беллманн Р. «Динамическое программирование», ИЛ, М., 1960;
  23. «Численные методы в теории оптимальных систем», Моисеев Н. Н. , «Наука», 1971, 424 стр. с илл., гл. 3 «Прямые методы теории оптимального управления», с 156—265;
  24. Воронов А. А. Теория автоматического управления. Т. 1. — М.: Высшая школа, 1986, стр. 294—304.
  25. Васильев Ф. П. Численные методы решения экстремальных задач. — М.: Наука, 1988, стр. 522—530.
  26. Кротов В. Ф. Методы решения вариационных задач на основе достаточных условий абсолютного минимума. I—IV // Автоматика и телемеханика, 1962, т. 23, № 12, стр. 1571—1583; 1963, т. 24, № 5, стр. 581—598; 1963, т. 24, № 7, стр. 826—843; 1965, т. 26, № 1, стр. 24-41.
  27. Ж.-Л. Лионс Оптимальное управление системами, описываемыми уравнениями с частными производными, М., Мир, 1972, 412 c.
  28. ↑ Бутковский А. Г. Теория оптимального управления системами с распределенными параметрами, М., Наука, 1965
  29. Ж.-Л. Лионс Управление сингулярными распределенными системами, М., Мир, 1987, 367 c.
  30. К. Ю. Острем Введение в стохастическую теорию управления, М., Мир, 1973

Литература

  • Растригин Л. А. Современные принципы управления сложными объектами. — М.: Сов. радио, 1980. — 232 с., ББК 32.815, тир. 12000 экз.
  • Алексеев В. М., Тихомиров В. М. , Фомин С. В. Оптимальное управление. — М.: Наука, 1979, УДК 519.6, — 223 c., тир. 24000 экз.
  • Волгин Л. Н. Оптимальное дискретное управление динамическими системами. — М. : Наука, 1986. — 240 с.
  • Табак Д., Куо Б. Оптимальное управление и математическое программирование. — М. : Наука, 1975. — 279 с.
  • Моисеев Н. Н. Элементы теории оптимальных систем. — М. : Наука, 1975. — 526 с.
  • , Тихомиров В. М. Краткий курс теории экстремальных задач. — М. : МГУ, 1989. — 204 с. — ISBN 5-211-00313-6 .
  • Кротов В.Ф., Гурман В. И. Методы и задачи оптимального управления. — М. : Наука, 1973.
  • Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. — М. : Наука, 1976.
  • Болтянский В. Г. Оптимальное управление дискретными системами. — М. : Наука, 1973.
  • Бутковский А. Г. Теория оптимального управления системами с распределенными параметрами. — М. : Наука, 1965.
  • Бутковский А. Г. Методы управления системами с распределенными параметрами. — М. : Наука, 1975.
  • Будак Б. М., Васильев Ф. П. Приближенные методы решения задач оптимального управления. — М. : МГУ, 1969.
  • Олейников В. А., Зотов Н. С., Пришвин А. М. Основы оптимального и экстремального управления. — М. : Высшая школа, 1969. — 296 с.
  • Дегтярев Г. Л., Сиразетдинов Т. К. Теоретические основы оптимального управления упругими космическими аппаратами. — М. : Машиностроение, 1986. — 216 с.
  • Лернер А. Я. , Розенман Е. А. Оптимальное управление. — М. : Энергия, 1970. — 360 с.
  • Гурман В. И. , Тихомиров В. Н., Кириллова Ф. М. Оптимальное управление. — М. : Знание, 1978. — 144 с.
  • Болтянский В. Г. Математические методы оптимального управления. — М. : Наука, 1969. — 408 с.
  • Янг Л. Лекции по вариационному исчислению и теории оптимального управления. — М. : Мир, 1974. — 488 с.
  • Макаров И. М. , Лохин В. М. Манько С. В. Искусственный интеллект и интеллектуальные системы управления. — М. : Наука , 2006. — 333 с. — 1000 экз. — ISBN 5-02-033782-X .
  • Дончев А. Системы оптимального управления. Возмущения, приближения и анализ чувствительности. — М. : Мир, 1987. — 156 с. — 6700 экз.
  • В. А. Иванов, А. С. Ющенко. . — М. : Московский государственный технический университет имени Н. Э. Баумана , 2015. — 352 с. — ISBN 978-5-7038-4178-5 .
  • Кузин Л. Т. Основы кибернетики. — М. : Энергия, 1973. — 504 с. — 30 000 экз.
  • Фурсиков А. В. Оптимальное управление распределёнными системами. Теория и приложения. — Новосибирск: Научная книга, 1999. — 352 с. — 1000 экз. — ISBN 5-88119-017-3 .
  • Лионс Ж. Л. Управление сингулярными распределёнными системами. — Москва: Наука, 1987. — 368 с. — 3600 экз.
  • Хазен Э. М. Методы оптимальных статистических решений и задачи оптимального управления. — Москва: Советское радио, 1968. — 256 с. — 12 000 экз.
  • Лейтман Дж. Введение в теорию оптимального управления. — Москва: Наука, 1968. — 190 с. — 14 000 экз.
  • Саридис Дж. Самоорганизующиеся стохастические системы управления. — Москва: Наука, 1980. — 400 с. — 4000 экз.
  • А. А. Аграчев , Ю. Л. Сачков. . — Москва: ФИЗМАТЛИТ, 2004. — 391 с. — ISBN 5-9221-0532-9 .

Ссылки

Same as Оптимальное управление