Вариационное исчисление
Вариационное исчисление, математическая дисциплина, посвященная отысканию экстремальных (наибольших и наименьших) значений функционалов - переменных величин, зависящих от выбора одной или нескольких функций. В. и. является естественным развитием той главы математического анализа, которая посвящена задаче отыскания экстремумов функций. Возникновение и развитие В. и. тесно связано с задачами механики, физики и т.д.
Одной из первых задач В. и. была знаменитая задача о брахистохроне (И. Бернулли, 1696): определить форму кривой, лежащей в вертикальной плоскости, по которой тяжёлая материальная точка, двигаясь под действием только одной силы тяжести и не имеющая начальной скорости, перейдёт из верхнего положения А в нижнее положение В за минимум времени. Эта задача сводится к отысканию функции у (х), доставляющей минимум функционалу
где а и b - абсциссы точек А и В.
Другой такой же "исторической" задачей является задача об отыскании пути, вдоль которого распространяется свет, идущий от источника света (точка А)к некоторой точке В, в среде с переменной оптической плотностью (то есть в среде, где скорость распространения v есть функция координат). Для решения этой задачи может быть использован, так называемый, Ферма принцип, согласно которому из всех кривых, соединяющих точки А и В, луч света распространяется вдоль той, по которой свет приходит из A в B за кратчайшее время. В простейшем случае, когда свет распространяется в плоскости, задача сводится к отысканию кривой y (x), доставляющей минимум функционалу
Из разрозненных задач подобного рода постепенно в 18 в. начало формироваться В. и. Но и после оформления В. и. в самостоятельную дисциплину она продолжала оставаться связанной с различными проблемами механики и физики. На протяжении 2-й половины 18 в. и всего 19 в. делались интенсивные попытки построить здание механики, опираясь на некоторые общие вариационные принципы (см. Вариационные принципы механики). Со 2-й половины 19 в. начинают разрабатываться различные вариационные принципы в механике сплошных сред, затем позднее в квантовой механике, электродинамике и т.д. Возникают вариационные принципы и в средах с диссипацией энергии. Исследования во всех подобных областях продолжают служить базой формирования новых задач В. и. и областью приложения её методов. Однако со временем появились и новые классы задач, далеко раздвинувших традиционные границы дисциплины и превративших В. и. в одну из наиболее обширных ветвей современной математики, включающей в себя, с одной стороны, самые абстрактные вопросы, относящиеся в равной степени к топологии и функциональному анализу, а с другой - разнообразные вычислительные методы решения технических или экономических задач.
Прямые методы. В. и. как самостоятельная научная дисциплина сформировалась в 18 в., главным образом благодаря работам Л. Эйлера.
Простейшей задачей В. и. называют задачу отыскания функции x (t), доставляющей экстремум функционалу
где F - непрерывная и дифференцируемая функция своих аргументов. При этом функция x (t) должна удовлетворять следующим условиям:
а) она должна быть кусочно дифференцируемой,
б) при t = to и t = T она должна принимать значения ? х (to) = х0, х (Т) = хт.?? ??(2)
Обе задачи, рассмотренные в начале статьи, являются частными случаями простейшей задачи В. и.
Первые вариационные задачи были задачами механики. Они были поставлены в 18 в. и, следуя традициям того времени, первый вопрос, на который надо было ответить, был вопрос о способе фактического отыскания функции x (t), реализующей минимум функционала (1).
Эйлер создал численный метод решения задач В. и., который получил название Эйлера метода ломаных. Этот метод был первым среди большого класса, так называемых, прямых методов; все они основаны на редукции задачи отыскания экстремума функционала к задаче отыскания экстремума функции многих переменных. Поскольку для получения решения с высокой точностью задачу приходится сводить к отысканию экстремума функции с большим числом переменных, она становится весьма сложной для ручного счёта. Поэтому долгое время прямые методы были вне основного русла, по которому направлялись усилия математиков, занимавшихся В. и.
В 20 в. интерес к прямым методам значительно усилился. Прежде всего были предложены новые способы редукции к задаче об экстремуме функции конечного числа переменных. Поясним эти идеи на простом примере. Рассмотрим снова задачу отыскания минимума функционала (1) при дополнит. условии x (to) = x (T) = 0???? (3)
и будем разыскивать решение задачи в форме
где jn (t) - некоторая система функций, удовлетворяющих условиям типа (3). Тогда функционал J (x) становится функцией коэффициентов ai: ? J = J (ai,..., aN),
и задача сводится к отысканию минимума этой функции N переменных. При известных условиях, наложенных на систему функций {jn}, решение этой задачи стремится при N ? ¥ к решению задачи (1) (см. Ритца и Галёркина методы).
Другая причина усиления интереса к прямым методам - это систематическое изучение конечноразностных методов в задачах математической физики, начавшееся с 20-х гг. 20 в. Применение ЭВМ превращает постепенно прямые методы в основной инструмент решения вариационных задач.
Метод вариаций. Второе направление исследований - это изучение необходимых и достаточных условий, которым должна удовлетворять функция x (t), реализующая экстремум функционала J (x). Его возникновение также связано с именем Эйлера. Предположим, что тем или иным способом построена функция x (t). Как проверить, является ли эта функция решением задачи? Первый вариант ответа на этот вопрос был дан Эйлером в 1744. В приведённой ниже формулировке этого ответа употребляется введённое в 60-х гг. 18 в. Ж. Лагранжем понятие вариации (отсюда название - В. и.), являющееся обобщением понятия дифференциала на случай функционалов.
Пусть x (t) - функция, удовлетворяющая условию (2), a h (t) - произвольная гладкая функция, удовлетворяющая условию h (to) = h (T) = 0. Тогда величина J (x + eh) = J*(e),
где e - произвольное действительное число будет функцией e. Вариацией dJ функционала J называют производную (dJ*/de)e = 0.
Для простейшей задачи В. и.
Разлагая полученное выражение в ряд по степеням e, получим
где о (e) - члены более высокого порядка. Так как h (to) = h (T) = 0, то, проведя интегрирование по частям во втором интеграле, найдём
Пусть теперь x (t) реализует экстремум. Тогда функция J*(e) имеет экстремум при e = 0. Поэтому величина dJ должна обратиться в нуль. Отсюда следует: для того чтобы функция x (t) доставляла экстремум функционалу (1), необходимо, чтобы она удовлетворяла уравнению
называемому уравнением Эйлера.
Это - дифференциальное уравнение 2-го порядка относительно функции x (t). Необходимое условие dJ = 0 может быть применено в ряде случаев для эффективного отыскания решения вариационной задачи, поскольку функция x (t) необходимо должна быть решением краевой задачи x (to) = xo, x (T) = xT для уравнения (4). Если найдено это решение и оно единственно, то найдено тем самым и решение исходной вариационной задачи. Если краевая задача допускает несколько решений, то достаточно вычислить значение функционала для каждого из решений краевой задачи и выбрать из них то, которому отвечает наименьшее значение J (x). Однако указанный путь обладает одним существенным недостатком: не существует универсальных способов решения краевых задач для обыкновенных (нелинейных) дифференциальных уравнений.
Уже во 2-й половине 18 в. круг задач, изучаемых В. и., значительно расширился. Прежде всего основные результаты, относящиеся к простейшей задаче В. и., были перенесены на общий случай интегральных функционалов вида
где x (t) - вектор-функция произвольной размерности, и на функционалы ещё более общего вида.
Условный экстремум. Задача Лагранжа. В конце 18 в. был сформулирован ряд задач на условный экстремум. Этим термином принято называть задачи отыскания функции x (t), доставляющей экстремум функционалу J (x) при каких-либо дополнительных условиях, кроме условий на концах интервала (t0, T). Простейшей задачей подобного вида является класс так называемых изопериметрических задач. Своим названием этот класс задач обязан следующей: среди всех замкнутых кривых данной длины найти ту, которая ограничивает максимальную площадь.
Значительно более сложной задачей является та, в которой ограничения носят характер дифференциальных уравнений. Эту задачу называют задачей Лагранжа; особое значение она приобрела в середине 20 в. в связи с созданием теории оптимального управления. Поэтому её формулировка даётся ниже на языке этой теории, возникшем после работ Л. С. Понтрягина и его учеников.
Пусть x (t) и u (t) - вектор-функции размерностей n и m соответственно, причём функция x (t), которую называют фазовым вектором, при t = to и t = T удовлетворяет граничным условиям: ? x (t0) Î e0, x (T) Î eT???? (5)
где e0 и eT - некоторые множества. Простейшим примером условий типа (5) являются условия (2). Функция x (t) и функция u (t), которую называют управлением, связаны условием ? dx/dt = f (x, u, t),???? (6)
где f - дифференцируемая вектор-функция своих аргументов. Рассматриваемая задача состоит в следующем: определить функции x (t) и u (t), доставляющие экстремум функционалу
Заметим, что и простейшая задача В. и. и изопериметрическая задача являются частным случаем задачи Лагранжа.
Задача Лагранжа имеет огромное прикладное значение. Пусть, например, уравнение (6) описывает движение какого-либо динамического объекта, например космического корабля. Управление u - это вектор тяги его двигателя. Множества e0 и eT - это две орбиты разных радиусов. Функционал (7) описывает расход горючего на выполнение маневра. Следовательно, задачу Лагранжа, применительно к данной ситуации, можно сформулировать следующим образом: определить закон изменения тяги двигателя космического аппарата, совершающего переход с орбиты e0 на орбиту eT за заданное время так, чтобы расход топлива на этот маневр был минимальным. ? Важную роль в теории подобных задач играет функция Гамильтона ? H (x, y, u) = (f, y) - F.
Здесь y - вектор, называется множителем Лагранжа (или импульсом), (f, y) означает скалярное произведение векторов f и y. Необходимое условие в задаче Лагранжа формулируется следующим образом: для того чтобы функции ?и ?были решением задачи Лагранжа, необходимо, чтобы ?была стационарной точкой функции Гамильтона Н (х, y, u), то есть, чтобы при
было ІH/Іu = 0, где y - не равное тождественно нулю решение уравнения Іy/t = -ІH/Іx = j(x, y, u, t).???? (8)
Эта теорема имеет важное прикладное значение, так как она открывает известные возможности для фактического нахождения векторов x (t) и u (t).
Развитие В. и. в 19 в. Основные усилия математиков в 19 в. были направлены на исследование условий, необходимых или достаточных для того, чтобы функция x (t) реализовала экстремум функционала J (x). уравнение Эйлера было первым из таких условий; оно аналогично необходимому условию
которое устанавливается в теории функций конечного числа переменных. Однако в этой теории известны ещё и другие условия. Например, для того, чтобы функция f (x) имела в точке ?минимум, необходимо, чтобы в этой точке было
каков бы ни был произвольный вектор h. Естественно поставить вопрос: в какой степени эти результаты переносятся на случай функционалов? Для того чтобы представить себе сложность, которая здесь возникает, заметим, что функция ?может реализовать минимум среди функций одного класса и не давать минимум среди функций другого класса и т.д.
Подобные вопросы послужили источником разнообразных и глубоких исследований А. Лежандра, К. Якоби, М. В. Остроградского, У. Гамильтона, К. Вейерштрасса и многих других. Эти исследования не только обогатили математический анализ, но и сыграли большую роль в формировании идей аналитической механики и оказали серьезное влияние на развитие разнообразных отделов теоретической физики.
Развитие В. и. в 20 в. В 20 в. возник целый ряд новых направлений В. и., связанных с интенсивным развитием техники, смежных вопросов математики и вычислительной техники. Одно из основных направлений развития В. и. в 20 в. - рассмотрение неклассических задач В. и., приведшее к открытию принципа максимума Л. С. Понтрягина.
Рассмотрим снова задачу Лагранжа: определить минимум функционала
при условии
фазовый вектор x (t) должен удовлетворять ещё некоторым граничным условиям.
В своей классической постановке условия задачи Лагранжа не предусматривают никаких ограничений на управление u (t). Выше (см. раздел Условный экстремум. Задача Лагранжа) подчёркивалась тесная связь между задачей Лагранжа и задачей управления. В рассмотренном там примере u (t) - тяга ракетного двигателя. Эта величина подчинена ограничениям: тяга двигателя не может превосходить некоторой величины, и угол поворота вектора тяги также ограничен. В данном конкретном примере компонента ui (i = 1,2,3) вектора тяги двигателя подчинена ограничениям
где а-i и a+i - некоторые заданные числа. Подобных примеров можно привести много.
Таким образом, в технике появилось много задач, которые сводятся к задаче Лагранжа, но при дополнительных ограничениях типа (10), записываемых в форме u Î Gu, где Gu - некоторое множество, которое, в частности, может быть замкнутым. Такие задачи получили название задач оптимального управления. В задаче Лагранжа можно исключить управление u (t) при помощи уравнения (8) и получить систему уравнений, которая содержит только фазовую переменную х и множитель Лагранжа j. Для теории оптимального управления должен был быть разработан специальный аппарат. Эти исследования привели к открытию принципа максимума Л. С. Понтрягина. Он может быть сформулирован в форме следующей теоремы: для того чтобы функции ?и ?были решением задачи оптимального управления чтобы они доставляли минимум функционалу (9)], необходимо, чтобы u (t) доставляла максимум функции Гамильтона
где y - множитель Лагранжа (импульс), который является ненулевым решением векторного уравнения
Принцип максимума позволяет свести задачу оптимального управления к краевой задаче для системы обыкновенных дифференциальных уравнений порядка 2n (n - размерность фазового вектора). Принцип максимума и в этом случае даёт более сильный результат, чем теорема Лагранжа, поскольку он требует, чтобы ?было не стационарным значением функции Гамильтона Н, а доставляло максимум Н.
Возможен и другой подход к тем же проблемам теории оптимального управления. Пусть s (х, t) - значение функционала (9) вдоль оптимального решения. Тогда для того чтобы функция ?была оптимальным управлением, необходимо (а в некоторых случаях и достаточно), чтобы функция s (х, t) удовлетворяла следующему дифференциальному уравнению с частными производными:
называемому уравнением Беллмана (см. Динамическое программирование).
Круг вопросов, которыми занимается В. и., непрерывно расширяется. В частности, всё большее и большее внимание уделяется изучению функционалов J (x) весьма общего вида, задаваемых на множествах Gx элементов из нормированных пространств. Для задач такого рода уже трудно использовать метод вариаций. Возникли новые методы, основанные на использовании понятия конуса в банаховых пространствах, опорных функционалов и т.д.
Уже в 19 в. была обнаружена глубокая связь между некоторыми проблемами теории уравнений с частными производными и вариационными задачами. П. Дирихле показал, что решение краевых задач для уравнения Лапласа эквивалентно решению некоторой вариационной задачи. Эта проблема привлекает к себе всё больше и больше внимания. Рассмотрим один пример.
Предположим, что имеется некоторое линейное операторное уравнение Ax = f,???? (11)
где х (x, h) - некоторая функция двух независимых переменных, обращающаяся в нуль на замкнутой кривой Г. При предположениях, естественных для некоторого класса задач физики, задача отыскания решения уравнения (11) эквивалентна отысканию минимума функционала
где W - область, ограниченная кривой Г.
уравнение (11) в этом случае является уравнением Эйлера для функционала (12). Редукция задачи (11) к (12) возможна, например, если А - самосопряжённый и положительно определённый оператор. Оператор Лапласа
удовлетворяет этим требованиям. Связь между проблемами для уравнений с частными производными и вариационными задачами имеет большое практическое значение. Она позволяет, в частности, устанавливать справедливость различных теорем существования и единственности и сыграла важную роль в кристаллизации понятия об обобщённом решении. Эта редукция очень важна также и для вычислит, математики, поскольку она позволяет использовать прямые методы вариационного исчисления.
В перечислении основных разделов современного В. и. нельзя не указать на глобальные задачи В. и., решение которых требует качественных методов. Искомое решение вариационной задачи удовлетворяет некоторому сложному нелинейному уравнению и краевым условиям. Естественно поставить вопрос о том, сколько решений допускает эта задача. Примером такой задачи является вопрос о количестве геодезических, которые можно провести между двумя точками на заданной поверхности. Проблема подобного рода относится уже к компетенции качественной теории дифференциальных уравнений и топологии. Последнее обстоятельство очень характерно. Методы, специфические для смежных дисциплин, топологии, функционального анализа и т.д., всё шире начинают применяться в В. и. В свою очередь, идеи В. и. проникают во всё новые области математики, и грань между В. и. и смежными областями математики теперь провести уже трудно.
Лит.: Лаврентьев М. А., Люстерник Л. А., Курс вариационного исчисления, 2 изд., М. - Л., 1950; Блисе Г. А., Лекции по вариационному исчислению, пер. с англ., М., 1950; Михлин С. Г., Вариационные методы в математической физике, М., 1957; Смирнов В. И., Курс высшей математики, 5 изд., т. 4, М., 1958; Гельфанд И. М., Фомин С. В., Вариационное исчисление, М., 1961; Математическая теория оптимальных процессов, М., 1969.
? Н. Н. Моисеев.