Лямбда-исчисление
- 1 year ago
- 0
- 0
Вариацио́нное исчисле́ние — раздел анализа , в котором изучаются вариации функционалов . Наиболее типичная задача — найти функцию , на которой заданный функционал достигает экстремального значения.
Методы вариационного исчисления широко применяются в различных областях математики . Например, в дифференциальной геометрии с их помощью ищут геодезические линии и минимальные поверхности . В физике вариационный метод — один из мощнейших инструментов получения уравнений движения (см. например Принцип наименьшего действия ), как для дискретных, так и для распределённых систем, в том числе и для физических полей. Методы вариационного исчисления применимы и в статике (см. Вариационные принципы ).
Важнейшими понятиями вариационного исчисления являются следующие:
Никак не связана с вариационным вычислением совпадающая по названию вариация функции в анализе.
Термин варьирование ( варьировать ) — применяется в вариационном исчислении для обозначения нахождения вариации или вариационной производной (это аналог термина дифференцирование для случая бесконечномерного аргумента, являющегося предметом вариационного исчисления). Также нередко для краткости (особенно в приложениях) термин варьирование применяется для обозначения решения вариационной задачи, сводимой к нахождению вариационной производной и приравнивания её нулю.
Вариационная задача означает, как правило, нахождение функции (в рамках вариационного исчисления — уравнения на функцию), удовлетворяющей условию стационарности некоторого заданного функционала, то есть такой функции, (бесконечно малые) возмущения которой не вызывают изменения функционала по крайней мере в первом порядке малости. Также вариационной задачей называют тесно связанную с этим задачу нахождения функции (уравнения на функцию), на которой данный функционал достигает локального экстремума (во многом эта задача сводится к первой, иногда практически полностью). Обычно при таком употреблении терминов подразумевается, что задача решается методами вариационного исчисления.
Типичными примерами вариационной задачи являются изопериметрические задачи в геометрии и механике; в физике — задача нахождения уравнений поля из заданного вида действия для этого поля.
Ещё в античные времена появились первые вариационные проблемы, относящиеся к категории изопериметрических задач — например, задача Дидоны . Древнегреческим математикам уже было известно :
Первый вариационный принцип сформулировал для траекторий отражённых световых лучей Герон Александрийский в работе «Катоптрика» (I век н. э.) .
В средневековой Европе изопериметрическими задачами занимались И. Сакробоско (XIII век) и Т. Брадвардин (XIV век). После разработки анализа появились новые типы вариационных задач, в основном механического характера. Ньютон в « Математических началах натуральной философии » (1687) решает задачу: найти форму тела вращения , обеспечивающую наименьшее сопротивление при движении в газе или жидкости (при заданных размерах). Важной исторической задачей, давшей толчок к развитию современного варианта вариационного исчисления, стала задача о брахистохроне (1696). Её быстрое решение сразу несколькими математиками показало огромные возможности новых методов. Среди других задач стоит отметить определение формы цепной линии (то есть формы равновесия тяжёлой однородной нити, 1690 год). Общих методов решения вариационных задач в этот период ещё не существовало, каждая задача решалась с помощью остроумных (и не всегда безупречных) геометрических рассуждений.
Пьер Ферма сформулировал основной принцип геометрической оптики, в силу которого свет в неоднородной среде выбирает путь, занимающий наименьшее время. В 1746 году Мопертюи обобщил это правило, введя в науку первый принцип наименьшего действия .
Решающий вклад в развитие вариационного исчисления внесли Леонард Эйлер и Жозеф Лагранж . Эйлеру принадлежит первое систематическое изложение вариационного исчисления и сам термин (1766 год). Лагранж независимо получил (с 1755 года) многие основополагающие результаты и ввёл понятие вариации .
На этом этапе были выведены уравнения Эйлера — Лагранжа . Они представляют собой необходимое условие экстремума, ставшее аналитическим фундаментом вариационных методов. Вскоре, однако, выяснилось, что решения этих уравнений не во всех случаях дают реальный экстремум, и встала задача найти достаточные условия, гарантирующие экстремум. Первое глубокое исследование (второй вариации) предпринял Лежандр , однако Лагранж обнаружил в его работе ошибку. Результаты Лежандра уточнил и дополнил Якоби (1837), затем его ученик Гессе (1857) и позднее Вейерштрасс . Сейчас эти достаточные условия называются уравнениями Якоби .
Содержанием вариационного исчисления является обобщение понятия дифференциала и производной функции конечномерного векторного аргумента на случай функционала — функции, областью определения которой служит некое множество или пространство функций, а значения лежат в множестве вещественных, либо комплексных чисел.
Функционал ставит в соответствие каждой конкретной функции из его области определения — определённое число.
Нетрудно написать для функционала аналоги дифференциала и производной по направлению.
Аналогом дифференциала (первого дифференциала) является в вариационном исчислении вариация ( первая вариация ):
(как и в случае дифференциала имеется в виду линейная часть этого приращения, а выражаясь традиционным образом — выбирается бесконечно малой, и при вычислении разности отбрасываются бесконечно малые высших порядков). При этом — играющее роль дифференциала или малого приращения независимой переменной — называется вариацией .
Как видим, сама в свою очередь является функционалом, так как она, вообще говоря, различна для разных (также и для разных ).
Таким образом, это — в применении к функционалам — прямой аналог дифференциала функции конечномерного (в том числе одномерного) аргумента:
— точно так же понимаемого как линейная часть приращения функции при бесконечно малом приращении аргумента (или линейный член при разложении по степеням вблизи точки ).
( Производная Гато ) Производной функционала в точке по направлению , очевидно, будет
Этого в принципе уже достаточно для решения типичной вариационной задачи — нахождения «стационарных точек», то есть таких функций , для которых первая вариация или производная по направлению обращается в ноль для любой бесконечно малой или любой конечной . Именно эти «точки» в пространстве функций — то есть именно такие функции — являются кандидатами в экстремали (проверку того, действительно ли они являются экстремалями, то есть достигается ли на них локальный экстремум, надо делать отдельно, как и в случае функций конечномерного аргумента; интересно, что во многих задачах физики важнее найти не экстремали, а именно стационарные точки). В некоторых источниках встречается терминология, где экстремалями называются все стационарные точки функционала, а тип экстремали затем выясняется. Анализ стационарных точек основан на исследовании знака второй производной по направлению.
Для интегральных функционалов , которые являются очень важным для математики и приложений случаем, можно ввести не только аналог дифференциала и производную по направлению, но и производную Фреше — аналог конечномерного градиента , называемую вариационной производной .
То есть, в полной аналогии с конечномерным случаем, когда
где — обозначение градиента (или производной Фреше) функции , а — скалярное произведение; — оператор частной производной по -той координате, сумма представляет собой полный дифференциал .
Для функционала имеем
где — обозначение вариационной производной , а суммирование конечномерной формулы естественно заменено интегрированием.
Итак,
Иными словами, если можно представить вариацию
в виде
то есть вариационная производная по («по » здесь означает, что остальные аргументы или параметры не меняются; речевой оборот «по » можно опустить в случае, когда точно определено, функционалом от какой функции рассматривается , что на практике может быть не ясным из самой его формулы, в которую могут входить и другие параметры и функции — см. также ниже). То есть
Легко видеть, что это определение обобщается на любую размерность интеграла. Для -мерного случая верна прямо обобщающая одномерный случай формула:
Так же легко обобщается понятие вариационной производной на случай функционалов от нескольких аргументов :
Выражая бесконечно малую разность функции нескольких аргументов как полный дифференциал , получим:
Как это описано выше для первого порядка, можно ввести понятие второй вариации и второй вариационной производной функционала, а также -й вариации и -й вариационной производной :
Для функционалов, зависящих от нескольких функций, можно также ввести понятие смешанных вариационных производных разного порядка, например:
Здесь мы не будем останавливаться на этом подробно, всё делается полностью аналогично введению соответствующих дифференциалов и производных для функции конечномерного аргумента.
Функционал вблизи конкретной точки в пространстве функций раскладывается в ряд Тейлора , если, конечно, вариационные производные всех порядков существуют. Как и в конечномерных случаях, сумма конечного числа членов этого ряда даёт значение функционала с определённой точностью (соответствующего порядка малости) лишь при небольших отклонениях его аргумента (при бесконечно малых). Кроме того, как и в случае функций конечномерного аргумента, ряд Тейлора (сумма всех членов) может не сходиться к функционалу, в него разложенному, при любых ненулевых конечных смещениях, хотя такие случаи достаточно редки в приложениях.
Хотя задачи, к которым применимо вариационное исчисление, заметно шире, в приложениях они главным образом сводятся к двум основным задачам:
Очевидно, обе задачи тесно связаны, и решение второй сводится (при должной гладкости функционала) к решению первой, а затем проверке, действительно ли достигается локальный экстремум (что делается независимо вручную, или — более систематически — исследованием вариационных производных второго и, если все они одного знака и хотя бы одна из них равна нулю, то и более высокого порядка). В описанном процессе выясняется и тип экстремума. Нередко (например, когда функция стационарного функционала единственная, а все изменения функционала при любом большом возмущении имеют один и тот же знак) решение вопроса, экстремум ли это и какого он типа, заранее очевидно.
При этом очень часто задача (1) оказывается не менее или даже более важной, чем задача (2), даже когда классификация стационарной точки неопределённа (то есть она может оказаться минимумом, максимумом или седловой точкой, а также слабым экстремумом, точкой, вблизи которой функционал точно постоянен или отличается от постоянного в более высоком порядке, чем второй). Например, в механике (и вообще в физике) кривая или поверхность стационарной потенциальной энергии означает равновесие, а вопрос, является ли она экстремалью, связан лишь с вопросом об устойчивости этого равновесия (который далеко не всегда важен). Траектории стационарного действия отвечают возможному движению, независимо от того, минимально действие на такой траектории, максимально, или седловидно. То же можно сказать о геометрической оптике, где любая линия стационарного времени (а не только минимального, как в простой формулировке принципа наименьшего времени Ферма ) соответствует возможному движению светового луча неоднородной оптической среде. Есть системы, где вообще нет экстремалей, но стационарные точки существуют.
Способы нахождения условных экстремумов и условных стационарных точек (см. ниже) делают вариационное исчисление ещё более мощным орудием решения обеих задач.
Главным и обычным техническим приемом при нахождении вариационной производной интегрального функционала , в подынтегральное выражение которого входит не только значение функции в точке , но и значения её производных, то есть не только , но и , и так далее (в принципе могут входить производные любого порядка, хотя в практических задачах порядки выше второго, встречаются гораздо реже, а чаще всего порядок производных не выше первого; производные же какого-то порядка входят в практически интересные функционалы едва ли не всегда: например, такой функционал, как длина кривой , содержит производные первого порядка, а потенциальная энергия изогнутого упругого стержня — производные по меньшей мере второго порядка), служит интегрирование по частям. Оно, вслед за достаточно прозрачной и очевидной записью выражения вариации функционала прямо по рецепту, описанному в статье выше, позволяет достичь цели: нахождения вариационной производной.
Само выражение для вариации функционала выписывается достаточно прямо и просто. Но при этом возникает одно типичное неудобство , заключающееся в том, что при этом в выражении появляются под интегралом не только члены с , но и с . Это неудобство устраняется интегрированием по частям .
Рассмотрим это сначала на простом частном примере, а затем на общем.
Пример: Пусть требуется найти вариационную производную функционала
где штрихом обозначена производная по , и найти , для которых значение экстремально.
Нетрудно выписать
Очевидно, операцию взятия производной по свободно можно поменять местами с операцией . Тогда
Теперь, чтобы не стояло под знаком производной, мешающим вынести за скобки из обоих членов (оставшееся в скобках суть вариационная производная), надо в первом слагаемом воспользоваться интегрированием по частям:
Теперь можно опять превратить сумму интегралов в один и вынести за скобки :
оставив граничный член , стоящим отдельно.
Граничный член можно приравнять нулю , решив тем самым задачу нахождения вариационной производной (действительно, она по определению есть то, что стоит под интегралом в больших скобках, соответствовать определению мешает только граничный член). Объяснение факта равенства нулю граничного члена не слишком строго (см. примечание ), но ограничимся им, чтобы сосредоточить внимание на главном.
Для начала зафиксируем в граничных точках, тогда граничный член исчезнет, так как должно будет при такой фиксации обращаться в ноль при и . Для многих задач такая фиксация граничных условий имеет место изначально. При поиске экстремума и вариационной производной на классе функций с такими граничными условиями граничный член можно просто отбросить. Но если граничные условия не наложены самой задачей, их можно наложить искусственно, решить задачу для фиксированных условий, а затем среди множества решений для разных граничных условий можно выбрать оптимальное (это обычно не составляет труда). Короче говоря, решение задачи с обнулением граничного члена содержит в себе среди прочих и решение первоначальной задачи, нужно лишь сузить класс уже найденных решений, меняя и и подобрав среди них лучшее. (Более аккуратный и общий подход — см. ниже).
Таким образом, здесь под вариационной производной будем понимать вариационную производную по классу функций с фиксированными концами, которая (при поиске экстремали и в подобных задачах) будучи приравненной нулю, определяет поведение функции внутри отрезка . В этом смысле, для нашего примера имеем:
а необходимое условие экстремальности состоит в равенстве её нулю, то есть имеем уравнение для :
Решение этого дифференциального уравнения даст явный вид , но задача нахождения решений дифференциального уравнения лежит уже за рамками вариационного исчисления. Задача последнего ограничена получением такого уравнения и, возможно, дополнительных условий, ограничивающих класс допустимых решений.
Пример в более общей записи: Пусть требуется найти вариационную производную функционала (предыдущий пример есть частный случай этого и может служить к нему иллюстрацией):
где штрихом обозначена производная по , двумя штрихами — вторая производная по , и могут ещё иметься производные высших порядков, обозначенные многоточием, и найти , для которых значение экстремально. Здесь под L понимается некоторая (как правило, вполне определённая и конкретная для каждой конкретной задачи, как в примере выше, но здесь записанная для общности абстрактно) функция нескольких аргументов. Значения производных функции f в каждой точке области интегрирования (которая здесь обозначена как отрезок, но может представлять собой и всю числовую ось) подставляются как аргументы в L , после чего производится интегрирование по x .
Нетрудно выписать
где под частными производными итд подразумеваются просто частные производные функции L по её соответствующим аргументам, то есть в этой записи под понимаются просто соответствующие параметры (смысл же — нахождение бесконечно малой разности между
и
Очевидно, операцию взятия производной по свободно можно поменять местами с операцией , как это подробно разобрано в примере выше. Поэтому здесь мы просто не ставим скобок, указывающих порядок этих операций в выражениях итд.
Теперь, чтобы не стояло под знаком производной, мешающего вынести за скобки из всех членов подынтегрального выражения (оставшееся в скобках — и будет вариационная производная), надо (представив интеграл суммы как сумму интегралов) ко второму слагаемому применить интегрированием по частям, к третьему — применить интегрирование по частям два раза, к дальнейшим, содержащим высшие производные (которые тут обозначены многоточием) применять интегрирование по частям три и более раз, пока все штрихи не уйдут с и т. д.:
Теперь можно опять превратить сумму интегралов в один и вынести за скобки :
оставив граничный член стоящим отдельно. Граничный член можно приравнять нулю, как это описано и объяснено в частном примере выше, а также — более аккуратно — в отдельных параграфах ниже, посвященных отдельно вопросам, связанным с граничным членом.
Таким образом, здесь под вариационной производной будем понимать вариационную производную по классу функций с фиксированными концами, которая (при поиске экстремали и в подобных задачах) будучи приравненной нулю, определяет поведение функции внутри отрезка . В этом смысле, для нашего примера имеем:
а необходимое условие экстремальности состоит в равенстве её нулю, то есть имеем уравнение для :
Решение же такого дифференциального уравнения, как уже было сказано выше, в принципе дает явный вид , что, впрочем лежит за рамками вариационного исчисления, ограничивающегося получением дифференциального уравнения и, возможно, дополнительных условий, ограничивающих класс допустимых решений (в связи с анализом граничного члена).
В этом разделе рассматривается такой частный, но практически важный, случай применения обобщённых функций при решении вариационных задач, как использование дельта-функции Дирака .
Использование -функции (не следует путать её обозначение с символом вариации!), как и использование обобщённых функций вообще, позволяет значительно расширить класс функционалов, которые могут быть записаны в форме интегральных функционалов, и к которым, следовательно, применимы основные приёмы варьирования (описанные выше). При этом в число функционалов, записываемых в такой форме, попадают такие практически важные функционалы, как краевые функционалы , что сильно облегчает работу с ними и делает её систематичной.
Рассмотрим простой пример. Пусть надо найти функцию , минимизирующую функционал притом, что на неё наложены условия .
Для того, чтобы было удобно решать эту задачу, наложенные условия полезно записать в виде (в этом случае, суть функционалы). Не ограничиваясь этим, используя основное свойство дельта-функции, запишем и в интегральной форме:
Теперь можно (расширив область интегрирования в определении , хотя бы на бесконечно малую величину, за пределы отрезка ) свободно складывать и вычитать функционалы , что позволяет формально просто свести решение исходной задачи к задаче об условном экстремуме функционала (см. ), сводящейся к отысканию экстремума нового функционала с постоянными множителями , конкретные значения которых после решения задачи по отысканию минимума нужно подобрать, решив соответствующие алгебраические уравнения. Таким образом, граничные условия будут удовлетворены. А главное, функционал при этом будет иметь вполне прозрачную интегральную форму, удобную для варьирования.
Сходный приём удобен при наложении на искомую функцию не граничных условий, а условий удовлетворения некоторому уравнению в каждой точке .
Условным экстремумом называется экстремум не на всей области определения функции (функционала), а на определённом её подмножестве, выделяемом специально наложенным условием (или условиями). Обычно, речь идёт о выделении этим условием (условиями) подмножества области определения с меньшей размерностью, что для конечномерных областей имеет определённый наглядный смысл, но для бесконечномерных (каковы обычно области определения функционалов) налагаемые условия приходится рассматривать лишь абстрактно (что теоретически не мешает иметь в виду полезную аналогию с конечномерным случаем).
Пусть надо найти экстремум функционала при некотором наложенном условии.
Как обычно, тривиальный случай, когда наложенное условие сводится к явному выражению чего-то через что-то (например, если известно, что ), нет смысла специально рассматривать, так как это приводит просто к некоторому переписыванию функционала в новом виде (или даже к сведению функционала к функции конечного количества переменных).
Рассмотрения заслуживает случай, когда налагаемое в виде равенства нулю (в общем случае, константе) неких других функционалов (одного или нескольких), или наложение на искомую функцию уравнения, которому она должна удовлетворять.
Типичный случай первой задачи с одним наложенным условием — изопериметрическая задача (например, задача Дидоны ). Примером второго типа условия может быть наложение в некоторых физических задачах требования подчинению уравнению непрерывности (для стационарных задач — его стационарного варианта ).
Основные виды задачи на условный экстремум, которые имеет смысл рассмотреть, таковы:
(Третий тип условия выписан здесь не в самом общем виде, но для наших целей этого достаточно.)
К первым двум случаям практически прямо (на принятом сейчас нами уровне строгости нет смысла проводить тут границу между случаем функций конечномерного аргумента, и функционалами) применим метод неопределенных множителей Лагранжа . А именно, для нахождения условного экстремума при наложении соответствующих условий, нужно решить вариационную задачу для функционала в первом и во втором случае, а затем подобрать (решив уравнение в первом случае и N уравнений с частными производными по каждому из во втором) такие , которые реализуют минимум в найденном семействе функций f , для которого эти являются параметрами. То есть, что касается вариационного исчисления, то ключевым моментом является нахождение и приравнивание нулю вариации (или вариационной производной) для некоего нового функционала , для этих двух случаев:
Третий же случай рассмотрим здесь для интегрального функционала . Тогда нахождение условного экстремума сводится сначала к варьированию функционала
где — переменная, принадлежащая области интегрирования (одномерной или n -мерной), а — некая неопределенная функция x , которая войдет в уравнение, полученное после вычисления вариационной производной и приравнивания её нулю.
Обоснованием такого решения для случая 3 может служить представление для каждой точки из выполнения равенства в как приравнивание нулю функционала с использованием дельта-функции Дирака . Далее можно считать на рассматриваемом здесь неформальном уровне очевидным, что задача стала аналогичной варианту 2, и, после суммирования по всем , её решение сводится к описанному выше.
Таким образом, ключевой момент с точки зрения вариационного исчисления в нахождении условного экстремума третьего типа сводится к
Одним из основных классических результатов вариационного исчисления, имеющих огромное практическое значение, являются уравнения Эйлера — Лагранжа — дифференциальные уравнения, которым должна удовлетворять функция, являющаяся стационарной для довольно общего в своем классе и очень важного вида интегрального функционала (а значит и функция, на которой такой функционал достигает локального экстремума, также должна удовлетворять этим уравнениям).
Достаточно стандартным для получения уравнений Эйлера — Лагранжа является обычный путь с нахождением вариационной производной и приравнивании её нулю или практически совпадающий с ним способ выписывания вариации с использованием стандартных обозначений, как это описано выше.
Здесь же для расширения типов примеров приводится вывод уравнений Эйлера — Лагранжа с использованием производной функционала по направлению.
Для гладких функций вещественной переменной или конечномерного векторного аргумента максимум и минимум заданной функции может быть найден путём нахождения точек, в которых производная обращается в нуль (по крайней мере, это необходимое условие экстремума). Аналогично решение гладких задач вариационного исчисления может быть получено путём решения соответствующего уравнения Эйлера — Лагранжа.
Чтобы проиллюстрировать этот процесс, рассмотрим сначала конкретную задачу нахождения кратчайшей кривой на плоскости, соединяющей две точки и . Длина кривой определяется выражением
где
и где , и . Функция должна иметь хотя бы одну производную. Если — локальный минимум и — подходящая функция, обращающаяся в нуль в граничных точках и и имеющая хотя бы первую производную, тогда мы получим
для любого , близкого к 0. Следовательно, производная по (соответствующая, с точностью до ненулевого множителя, первой вариации , вычисленной через производную по направлению) должна обращаться в нуль при для любой функции . Таким образом,
при любом выборе функции . Если предположить, что имеет вторую непрерывную производную, тогда можно воспользоваться формулой интегрирования по частям :
После замены
получается
но первое слагаемое обращается в нуль, поскольку было выбрано таким образом, чтобы обращаться в нуль в точках и . Следовательно,
для любой дважды дифференцируемой функции , которая обращается в нуль на концах интервала. Это особый случай основной леммы вариационного исчисления:
для любой дифференцируемой функции , которая обращается в нуль на концах интервала. Поскольку есть произвольная функция в интервале интегрирования, можно сделать вывод, что . Тогда,
Из этого уравнения следует, что
Таким образом, экстремумом в нашей задаче являются отрезки прямых линий.
Подобные же вычисления можно провести и в общем случае , когда
и должна иметь две непрерывные производные. Повторяя рассуждения, находим экстремаль , принимаем , находим производную по , затем подставляем :
Наконец, в силу основной леммы вариационного исчисления можно заключить, что функция должна удовлетворять уравнению Эйлера — Лагранжа
В общем случае, это уравнение является обыкновенным дифференциальным уравнением второго порядка, решив которое, можно найти экстремаль .
Уравнение Эйлера — Лагранжа является необходимым , но не достаточным условием наличия экстремума. Дополнительные условия формулируются отдельно.