?

Log in

No account? Create an account
физическое мышление и уравнения лагранжа - Поклонник деепричастий [entries|archive|friends|userinfo]
Anatoly Vorobey

[ website | Website ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

Links
[Links:| English-language weblog ]

физическое мышление и уравнения лагранжа [апр. 19, 2016|10:42 pm]
Anatoly Vorobey
[Tags|]

(эта запись может быть интересна знающим физику и сочувствующим)

Физики думают как-то по-другому, и мне не удается проникнуть в этот загадочный мир.

Я пытаюсь немного лучше понять физику, начиная с классической механики, и начал читать (это уже вторая попытка) известный учебник Гольдштейна на английском языке. В таких случаях часто проявляется свойственный мне недостаток: излишняя дотошность и стремление понять каждый шаг и каждое утверждение. Обычно я наталкиваюсь на что-то непонятное близко к началу, и вместо того, чтобы плюнуть и пока что двигаться дальше, трачу кучу времени на бултыхание вокруг да около. Потому что упрямый, как осел. Даже смешно, как на этот раз тоже случилось по шаблону.

В первой же главе учебника сначала вкратце рассматриваются законы Ньютона, но потом автор быстро переходит к выводу из них формализма Лагранжа, точнее уравнений Эйлера-Лагранжа (я ниже приведу их форму). Вообще-то часто учебники механики, как я теперь знаю, не включают в себя этот вывод; вместо этого они начинают с вариацинного принципа наименьшего действия, как более фундаментального, и выводят уравнения Эйлера-Лагранжа из него. Так, например, в учебнике Ландау-Лифшица, и многих других. Но мне как раз понравилось, что Гольдштейн показывает эквивалентность этих двух подходов, и важные подробности - напр. то, куда деваются реакции связей и что нам дает право их игнорировать, записывая лагранжиан - понимаешь при этом куда лучше.

Если понимаешь вообще.

Потому что понять на том уровне, на котором мне хотелось, у меня все никак не получалось. Вместо того, чтобы плюнуть и читать дальше, я разозился и стал сравнивать описания этой конкретной темы в куче (под кучей я подразумеваю штук 20) разных учебников, задавать вопросы на форумах итд. Теперь, как мне кажется, я хорошо понимаю, как перейти от законов Ньютона и уравнениям Лагранжа, заодно перейдя в обобщенные координаты, совместимые с наложенными связями, и потеряв реакции связей. Но мне все равно остается непонятным мета-вопрос: почему нельзя было объяснить это понятнее? Напрашивается ответ: потому что физикам понятно именно так, как написано в их учебниках, потому что они думают по-другому; а мне, человеку с математическим складом мышления, нужно как-то стараться вписываться в то, как они думают. Но у меня не получается.



Я не буду здесь приводить весь вывод уравнений Эйлера-Лагранжа (по-русски их часто называют уравнениями Лагранжа второго рода) из второго закона Ньютона. Если есть интерес, могу об этом отдельно написать. Отмечу только одну частность: мне кажется неловким, что почти всегда в этой теме смешивают вместе переход к этим уравнениям в обобщенных координатах и использование так называемых "виртуальных перемещений" с принципом д'Аламбера, чтобы избавиться от реакций связей (англ. forces of constraint). Мне кажется, это можно сделать отдельно. Сначала перейти к уравнению в (произвольных) обобщенных координатах и с обобщенными силами:



для чего не нужно вообще рассматривать виртуальные перемещения, и это уравнение само по себе ценно, потому что обобщенные координаты часто упрощают анализ системы. А потом отдельно показать, что если есть система с голономными связями, то выбрав обобщенные координаты, которые обнуляют уравнения связей, мы можем воспользоваться виртуальной работой и принципом д'Аламбера, чтобы вычленить и выбросить из обобщенных сил то, что приходится на долю реакций связей. Тогда в уравнении остаются только активные силы, а если они консервативны, то можно заменить их на потенциалы и перейти к единому для всей системы лагранжиану . Мне кажется, что так объяснять было бы понятнее, но моему мнению в этом вопросе доверять совершенно нет смысла: месяц назад я все это вообще не понимал, и ни разу никому не пытался объяснить или преподать.

Однако этот педагогический вопрос меня занимает куда меньше, чем математические. Из этих последних в качестве самого яркого я напишу о так называемом "законе сокращения точек", который используется в процессе вывода уравнений Лагранжа. Если мы переходим от декартовых координат r к неким обобщенным координатам q, и у нас есть функции перехода



которые задают декартовы координаты в терминах обобщенных координат и времени (но не обобщенных скоростей!), то используя обычное правило дифференциирования сложной функции (каждая - функция от t) мы можем записать



И тут происходит следующий замечательный трюк: говорится что-то вроде: "мы видим, что это выражение линейно от ", или "если в этом выражении взять производную по ", или просто говорится, что очевидно, что из этого выражения сразу следует "закон сокращения точек":



и вот это меня совершенно повергло в ступор. Я не мог понять, как так можно: только что у нас была функция от времени, но сейчас мы притворяемся, будто это независимая формальная переменная, по которой мы берем производную. Как это одновременно укладывается в голове? То есть сначала я вообще долго не мог понять, как это может быть, , но потом это у меня вроде бы устоялось: да, лагранжиан рассматривается как функция формально независимых переменных положения и переменных скорости, так что можно брать производную по скорости, она действительно переменная, а не функция времени. Но если она не функция времени, что позволяет нам написать формулу дифференциирования сложной функции? Эта формула вообще не имеет смысла, если никак не связана с .

Сейчас мне все это кажется простым и близким к тривиальному, потому что понятно и устоялось в голове, но я помню, как месяц назад я не мог понять. И то, что мне остается непонятным до сих пор - это почему учебники один за другим не пытались это как-то объяснить. В итоге я сложил нужное мне объяснение из нескольких сетевых учебников и конспектов курсов. Но до этого я смотрел на эту тему в русских учебниках Айзермана, Ольховского, Гантмахера и Арнольда (знаменитые "Математические методы классической механики"), и в английских учебниках Гольдштейна, Саймона, Зоммерфельда, Тейлора, Клеппнера, Хосе-Салетана и многих других... английских всех уже не помню. Ни в одном из них не было нормального с моей точки зрения объяснения того, что тут происходит на математическом уровне.

Сложилось очень четкое ощущение того, что есть особое физическое мышление, которое недоступно мне с моим математическим начетничеством, в котором это действительно нормально и не требует никаких разъяснений. У меня не получается так думать, и нет доступа в этот мир.

Меж тем объяснение, о котором я говорю, мне не кажется особо длинным или формальным. Если бы я мог послать его себе на месяц в прошлое, оно бы выглядело примерно так:

"Мы знаем, что силы зависят от мгновенных значений координат и скоростей точек, или при переходе к обобщенным координатам от мгновенных значений обобщенных координат и обобщенных скоростей . И мы ожидаем, что уравнвния движения будут дифференциальными уравнениями второго порядка, в которых положения и скорости являются начальными условиями. Поэтому удобно ввести пространство из 2n+1 измерений, в котором есть n измерений и еще n измерений , независимых друг от друга, а также измерение времени (такое пространство называют иногда фазовым пространством или фазовым пространством скоростей, в отличие от конфигурационного пространства, где есть одни координаты ). Чтобы понять эту независимость, бывает полезно думать о точке фазового пространства, как о наборе начальных условий для уравнений движения системы; тогда интуитивно понятно, почему координаты-скорости не зависят от координат-положений. Дополнительная координата времени оказывается нужна, если силы зависят явным образом от времени.

На этом пространстве мы рассматриваем разные функции, как например лагранжиан является функцией на фазовом пространстве. Важно понять, что некоторые действия с этими функциями можно выполнять только после того, как задана траектория движения , которая является кривой в конфигурационном пространстве, и одновременно определяет кривую в фазовом пространстве, потому что скорости определяются очевидным образом как производные по времени от траектории . Как только мы фиксируем конкретную траекторию , она определяет скорости , и все функции на фазовом пространстве автоматически становятся фунцкиями только от времени t. До того, как мы зафиксировали траекторию, они не являются функциями от времени. Например, посмотрим на уравнение Лагранжа:



В чем смысл этого оператора d/dt? Его смысл следующий: "если вы возьмете некую траекторию , и с ее помощью представите как функцию от t, тогда производная этой функции минус , тоже как функция от t, тождественно равно нулю". Уравнение Лагранжа таким образом говорит: траектория движения должна быть такой, чтобы превратить уравнение в тождество. А оператор d/dt действует после того, как все представлено в виде функции от времени.

Обратите внимание, что для того, чтобы вычислить , нам не нужна была траектория , но для того, чтобы вычислить она необходима. Таким образом, если произвольная функция на фазовом пространстве, то есть действия, которые с можно производить "не на кривой", т.е. без траектории - вычислять ее значения, брать частные производные. А есть действия, которые производятся "на кривой": в частности, полная производная по времени .

Но теперь рассмотрим частный случай, когда функция зависит только от координат и времени, а не скоростей - что верно, в частности, для функций перехода от декартовых координат к обобщенным: . Тогда если мы подставим в эту фунцкию траекторию и возьмем производную по времени, то в ней не будет вторых производных, только первые. Это дает нам право сделать следующий трюк: определить формально оператор для таких функций "не на кривой", без траектории, через формулу:



В этой формуле не является функцией, а только независимой переменной в фазовом пространстве. Это не использование теоремы о дифференциировании сложной функции, это всего лишь произвольное определение некоей операции d/dt, которая до сих пор "не на кривой" не была определена. Но очевидно при этом, что если мы потом введем траекторию и применим ее к результату этой операции, то эффект будет ровно тот, что мы хотим. Важно понять вот что. Отношения между функциями и следующие. Они обе функции на фазовом пространстве, от 2n+1 переменных (хотя первая не зависит от обобщенных скоростей). В этом качестве вторая из них не является производной первой. Но вторая специально подобрана таким образом, что после выбора любой траектории , они обе становится функциями от t, и тогда вторая становится производной первой.

Этот трюк позволяет нам применять d/dt "заранее", до введения траектории, и гарантирует нам, что постольку, поскольку в конце концов мы все будем вычислять "на кривой", результат будет тот же. Следовательно, мы можем пользоваться этой искусственной функцией , и в частности действительно тривиальным, как теперь понятно, тождеством



мы можем называть эту "скоростью точки i", можем с ее помощью определять кинетическую энергию всей системы:



и с ее помощью Лагранжиан



И все это мы можем делать, поскольку все это делается для того, чтобы в итоге задать ограничения на траекторию и все эти функции будут в конечном итоге вычисляться "на кривой" ".


OK, это было, наверное, длинновато, мне надо учиться писать такие объяснения лаконичнее и менее дотошно. Однако если бы я месяц назад увидел что-то в этом роде, это мгновенно сняло бы все вопросы по поводу "закона сокращения точек" и вообще почти все оставшиеся сложности с этим выводом уравнений Лагранжа. Но при этом ни один учебник механики из всех, что я просмотрел, не пытается что-то подобное сказать (за исключением редких книг, которые вводят действительно математический подход, с дифференциальной геометрией и многообразиями - но это уже совсем другой уровень абстракции). Почему? Потому что это слишком математично, слишком дотошно? Наверное, потому, что у физиков есть доступ к их особому виду мышления, которое просто отвергает подобные объяснения и считает их ненужными.
СсылкаОтветить

Comments:
From: (Anonymous)
2016-04-19 08:39 pm
Это не совсем особое мышление, а просто другой порядок обучения.
Они на этом физическом примере (который они знают лучше) изучают математический аппарат.
Ты же - наоборот, зная математический аппарат (который знаешь лучше) пытаешься приложить его к физическому примеру.
(Ответить) (Thread)