Книга: Фейнмановские лекции по гравитации



Фейнмановские лекции по гравитации

Фейнмановские лекции по гравитации

Feynman

Lectures on

Gravitation


Richard P. Feynman

Fernando B. Morinigo • William G. Wagner


Edited by Brian Hatfield


With a Foreword by

John Preskill and Kip S. Thorne


Addison-Wesley Publishing Company

Advanced Book Program


Р.Ф.Фейнман

Ф.Б.Мориниго

У.Г.Вагнер



ФЕЙНМАНОВСКИЕ ЛЕКЦИИ

ПО ГРАВИТАЦИИ


под редакцией Б.Хатфилда



Введение Дж.Прескилла и К.С.Торна


Перевод

с английского языка

д.ф.-м.н. А.Ф.Захарова



Фейнмановские лекции по гравитации

Москва

«Янус-К»

2000


Фейнмановские лекции по гравитации

Издание осуществлено при финансовой поддержке Российского Фонда Фундаментальный Исследований согласно проекту 99-02-30023


ББК

33.313


Ф

36


УДК

530.12


Р. Ф.Фейнман, Ф.Б.Мориниго, У.Г.Вагнер.Фейнмановские лекции по гравитации. Перев. с англ. А.Ф.Захарова.- М.:«Янус-К», 2000.-296 с.

ISBN 5-8037-0049-5

Нобелевский лауреат, крупнейший американский физик-теоретик Ричард Фейнман известен не только как выдающийся учёный, внёсший огромный вклад в квантовую электродинамику, но и как талантливый педагог, на книгах которого воспитано не одно поколение физиков. Работы Фейнмана, в особенности его курсы лекций (например, "Фейнмановские лекции по физике”), хорошо известны в нашей стране. Несомненно, что знание основ общей теории относительности является необходимым не только для специалистов по теории поля и физике элементарных частиц, но и для астрономов. Предлагаемые лекции Р. Фейнмана по гравитации удачно сочетают оригинальный и яркий педагогический подход автора и точный отбор материала, который позволил кратко изложить основы теории гравитации с теоретико-полевой точки зрения.

Для специалистов, работающих в области теоретической физики и астрономии, для студентов и аспирантов физических и математических специальностей.



Научное издание

Ричард Ф.Фейнман, Фернандо Б.Мориниго, Уильям Г.Вагнер

Фейнмановские лекции по гравитации


Сдано в набор 30.12.99. Подписано в печать 19.04.2000.

Формат 60x88/16. Бумага офсетная N 1. Печать офсетная.

Уч.-изд. л. 20,2. Физ.п.л. 18,5. Тираж 1000. Заказ N 4119

ООО “Янус-К” 109316, г. Москва, ул. Стройковская, д. 12, корп. 2, пом. правления


Отпечатано в Производственно-издательском комбинате ВИНИТИ 140010, Люберцы, Октябрьский проспект, 403


«Янус-К»

Лицензия на издательскую деятельность ЛР N 064784 от 02.10.96

Оригинал-макет изготовлен А.Ф. Захаровым в пакете AMS-LATEX




ISBN 5-8037-0049-5


© 1995 by California Institute of Technology, Fernando B. Morinigo and William G. Wagner

© 1995 Foreword by Addison-Wesley Publishing Company

© А.Ф. Захаров, перевод, примечания, предисловие, 2000


Оглавление


Предисловие к русскому переводу

9


Предисловие

12


Квантовая гравитация

43


Лекция

1

56


1.1.

Полевое приближение гравитации

56


1.2.

Характеристики феномена гравитации

58


1.3.

Квантовые эффекты в гравитации

68


1.4.

О философских проблемах в квантовании макроскопических объектов

70


1.5.

Гравитация как следствие других полей

74


Лекция

2

76


2.1.

Постулаты статистической механики

76


2.2.

Трудности гипотетических теорий

81


2.3.

Обмен одним нейтрино

84


2.3.

Обмен двумя нейтрино

85


Лекция

3

90


3.1.

Спин гравитона

90


3.2.

Амплитуды и поляризации в электродинамике, типичной полевой теории

92


3.3.

Амплитуды для обмена гравитона

96


3.4.

Физическая интерпретация в терминах амплитуд

99


3.5.

Лагранжиан для гравитационного поля

103


3.6.

Уравнения гравитационного поля

104


3.7.

Определение символов

106


Лекция

4

108


4.1.

Связь между рангом тензора и знаком поля

108


4.2.

Тензор энергии-импульса для скалярной материи

110


4.3.

Амплитуды для рассеяния (скалярная теория)

112


4.4.

Подробные свойства плоских волн. Эффект Комптона

113


4.5.

Нелинейные диаграммы для гравитонов

115


4.6.

Классические уравнения движения гравитирующей частицы

117


4.7.

Орбитальное движение частицы вокруг звезды

120


Лекция

5

123


5.1.

Орбиты планет и прецессия Меркурия

123


5.2.

Замедление времени в гравитационном поле

126


5.3.

Космологические эффекты, связанные с замедлением времени. Принцип Маха

130


5.4.

Принцип Маха в квантовой механике

132


5.5.

Собственная энергия гравитационного поля

136


Лекция

6

138


6.1.

Билинейные члены тензора энергии-импульса

138


6.2.

Формулировка теории, справедливой во всех порядках

141


6.3.

Построение инвариантов по отношению к инфинитезимальным преобразованиям

143


6.4.

Лагранжиан теории, справедливой во всех порядках

147


6.5.

Уравнение Эйнштейна для тензора энергии-импульса

149


Лекция

7

151


7.1.

Принцип эквивалентности

151


7.2.

Некоторые следствия принципа эквивалентности

155


7.3.

Максимальные скорости хода часов в гравитационных полях

157


7.4.

Собственное время в общих координатах

160


7.5.

Геометрическая интерпретация метрического тензора

162


7.6.

Кривизна в двух и четырёх измерениях.

165


7.7.

Число величин, инвариантных под действием преобразований общего вида

167


Лекция

8

170


8.1.

Преобразования компонент тензора в неортогональных координатах

170


8.2.

Уравнения, определяющие инварианты

𝑔

μν

173


8.3.

О предположении, что пространство есть в точности плоское

175


8.4.

О соотношениях между различными подходами к теории гравитации

177


8.5.

Кривизна как величина, относящаяся к касательному пространству

179


8.6.

Кривизна как величина, относящаяся к произвольным координатам

182


8.7.

Свойства Великого Тензора Кривизны

184


Лекция

9

187


9.1.

Модификация электродинамики, требуемая принципом эквивалентности

187


9.2.

Ковариантные производные тензоров

188


9.3.

Параллельный перенос вектора

192


9.4.

Связь между кривизной и материей

197


Лекция

10

200


10.1.

Полевые уравнения гравитации

200


10.2.

Действие для классических частиц в гравитационном поле

205


10.3.

Действие для материальных полей в гравитационном поле

209


Лекция

11

217


11.1.

Кривизна в окрестности сферической звезды

217


11.2.

О связи между материей и кривизной

219


11.3.

Метрика Шварцшильда, поле вне сферической звезды

220


11.4.

Сингулярность Шварцшильда

222


11.5.

Размышления о понятии кротовой норы

226


11.6.

Проблемы теоретических исследований кротовых нор

228


Лекция

12

230


12.1.

Проблемы космологии

230


12.2.

Предположения, приводящие к космологическим моделям

233


12.3.

Интерпретация космологической метрики

236


12.4.

Измерения космологических расстояний

239


12.5.

О характеристиках закрытой или открытой вселенной

240


Лекция

13

243


13.1.

О роли плотности вселенной в космологии

243


13.2.

О возможности неоднородной и несферической вселенной

246


13.3.

Исчезновение галактик и сохранение энергии

248


13.4.

Принцип Маха и граничные условия

250


13.5.

Тайны на небесах

252


Лекция

14

255


14.1.

Проблема сверхзвёзд в общей теории относительности

255


14.2.

Значение решений и их параметры

258


14.3.

Некоторые численные результаты

260


14.4.

Планы и предположения для дальнейших исследований сверхзвёзд

264


Лекция

15

264


15.1.

Физическая топология решений Шварцшильда

264


15.2.

Орбиты частиц в поле Шварцшильда

265


15.3.

О будущем геометродинамики

268


Лекция

16

271


16.1.

Связь между полями вещества и гравитацией

271


16.2.

Завершение теории: простой пример гравитационного излучения

274


16.3.

Излучение гравитонов при распаде частиц

276


16.4.

Излучение гравитонов при рассеянии частиц

278


16.5.

Источники классических гравитационных волн

281


Список литературы

284


Предметный указатель

292


Предисловие к русскому переводу

В начале 90-х годов (когда в нашей стране издавалось крайне мало научных книг вообще и по общей теории относительности в частности) автору перевода стало известно о существовании машинописного издания записей лекций Р.Фейнмана по гравитации, прочитанных им в Калифорнийском Технологическом Институте. Автор этих лекций удостоен нобелевской премии за выдающийся вклад в развитие квантовой электродинамики и хорошо известен российскому читателю по многочисленным переводам его лекций. Его книги всегда вызывали большой интерес читателей и признание специалистов. Согласно опубликованному в начале 2000 г. опросу, определявшему 100 самых крупных физиков за всю историю науки, проведённому журналом ”Physics World” Британского Института Физики, Р.Фейнман занимает 7-ое место, вслед за Эйнштейном, Ньютоном, Максвеллом, Бором, Гейзенбергом и Галилеем, опережая таких учёных, как Дирак, Шрёдингер и Резерфорд [Wrig 2000*].1

1 Библиографические ссылки, отмеченные знаком ”звёздочка”, были добавлены в русский перевод книги.

Несмотря на то, что оригинальное машинописное издание Калифорнийского Технологического Института ”Лекций по гравитации” Р.Фейнмана было малодоступно и продавалось только в книжном магазине КАЛТЕХ’а (как рассказывается в предисловии к английскому изданию этой книги), оно имеется во многих институтских научных библиотеках в Европе и Америке, где работают специалисты по теории гравитации или в смежных разделах науки, а также в научных библиотеках многих западных специалистов, которые занимаются развитием или использованием методов теории гравитации. Более того, часто можно было услышать довольно высокую оценку использованного Р. Фейнманом оригинального подхода к изложению основ общей теории относительности, что в первую очередь связано, по-видимому, с тем, что (для специалистов, привыкших к геометрическому подходу) автору лекций удалось взглянуть нетрадиционным образом на теорию гравитации. Обсуждение некоторых философских и мировоззренческих вопросов, связанных с основаниями не только теории гравитации, но и физики в целом, усиливали интерес к записям этих лекций. При обсуждении этих записей невольно возникла ассоциация с тем живым интересом к другим лекциям Фейнмана [Feyn 63а, Feyn 67], который имел место в нашей стране в конце 60-х и начале 70-х годов, когда эти лекции читали и обсуждали самые широкие круги, начиная от старшеклассников, интересующихся физикой, и школьных учителей физики и заканчивая физиками-профессионалами. Нет сомнения, что под влиянием чтения этих книг многие школьники и студенты выбрали физику своей профессией.

За годы, прошедшие со времени прочтения этих лекций, теория гравитации перестала быть уделом исключительно релятивистов (сидящих, по словам Синга, в ”башне из слоновой кости” [Синг 63*]), а стала в большой степени наукой, тесно связанной с экспериментом и астрономическими наблюдениями. В качестве примеров можно привести исследование анизотропии фонового микроволнового (реликтового) излучения, что позволяет поставить ограничения на параметры используемых космологических моделей; наблюдения гравитационных линз и микролинзирования, что даёт нам возможность обнаружения скрытой массы [Заха 97*], [Заха 98*]. Заметим, что наблюдения последних лет дают указание на то, что вклад Λ-члена в критическую плотность вещества может иметь существенное значение. В самом начале следующего тысячелетия начнут работать крупные гравитационно-волновые детекторы - лазерные интерферометры: американский LIGO, франко-итальянский VIRGO, немецко-британский GEO, японский ТАМА и австралийский AIGO, а одним из самых перспективных источников гравитационного излучения являются такие релятивистские объекты, как двойные чёрные дыры и нейтронные звёзды. Основываясь на эволюционных расчётах, можно придти к выводу, что несмотря на то, что системы двойных чёрных дыр встречаются реже систем двойных нейтронных звёзд, системы двойных чёрных дыр являются существенно более мощными источниками гравитационного излучения, так что, возможно, более вероятно обнаружение гравитационно-волнового сигнала от системы двойных чёрных дыр [ЛПП 97*]. Читатель может ознакомиться с обширной литературой по астрофизическим аспектам детектирования гравитационных волн, используя, например, обзоры К. Торна [Thor 95*].

Сделаем некоторые замечания относительно используемых в лекциях обозначений. Некоторые из них нельзя признать удачными (что, видимо, было вызвано тем, что они использовались при прочтении лекций, а не при написании книги), например, иногда буква λ используется в одной и той же формуле или в соседних формулах одновременно и как множитель, и как индекс, по которому проводится суммирование. Однако подобные неудачные обозначения не исправлялись (исправлены только обнаруженные опечатки), тем самым сохранён авторский стиль и обозначения, использованные при чтении лекций.

Сделаем некоторые библиографические замечания, адресованные читателю русского перевода лекций Фейнмана, поскольку указанные библиографические ссылки в английском издании книги ориентированы на читателя, которому легко доступны указанные англоязычные издания. Нам представляется необходимым дополнить список литературы важными источниками, имеющимися на русском языке, а также другими важными ссылками, которые могут быть доступны российскому читателю.

С основами римановой геометрии и тензорного анализа можно ознакомиться по книгам Б.Л.Дубровина, С.П.Новикова и А.Т.Фоменко [ДНФ 86*] П.К.Рашевского [Раше 67*], Б.Шутца [Шутц 84*], Л.Эйзенхарта [Эйзе 48*], И.Сокольникова [Соко 71*]. Изложение основ теории поля (знание которых может помочь более глубоко освоить содержание фейнмановских лекций по гравитации) можно найти в учебнике Н.Н. Боголюбова и Д.В. Ширкова [БоШи 80*], ”проникнутое духом педагогического новаторства” изложение теории возмущений для квантованных полей имеется в лекциях [Фейн 78*], а доступное даже школьникам популярное изложение основ классической и квантовой электродинамики, в том числе фейнмановских диаграмм, приведено в небольшой брошюре Фейнмана [Фейн 88*].

Достаточно простое и ясное изложение основ общей теории относительности имеется в классическом учебнике Л.Д. Ландау и Е.М. Лифшица [LaLi 51], лекциях А.В. Беркова и И.Ю. Кобзарева [БеКо 89*], книгах П. Бергмана [Берг 47*], Р.Утиямы [Утия 79*], В. Паули [Паул 83*], Э. Шредингера [Шред 86*], однако более подробное и полное изложение теории можно найти в книгах Ч. Мизнера, К. Торна и Дж.А. Уилера [MTW 73], С. Вейнберга [Wein 72], Дж. Синга [Синг 63*], В.А. Фока [Фок 61*]. Эти книги удачно дополняет задачник [ЛППТ 79*]. Достаточно простое изложение принципов теории относительности, основанное на современном инвариантном геометрическом подходе, предложено в книге У. Бёрке [Бёрк 85*].

Сборник статей [Эйнш 79*] содержит подборку фундаментальных публикаций как самого А. Эйнштейна, так и других учёных, внёсших существенный вклад в развитие теории гравитации. Современное изложение теории чёрных дыр объектов можно найти в замечательных книгах С. Чандрасекара [Чанд 86*] и В.П. Фролова и И.Д. Новикова [FrNo 98*] (см. также [Заха 99*]), а теории чёрных дыр и других релятивистских объектов в книге С. Шапиро и С. Тьюколски [ШаТю 85*]. Краткое изложение космологии можно найти в книге А.Д.Долгова, Я.Б.Зельдовича и М.В.Сажина [ДЗС 88*] и в более популярной книге Д.Шамы [Шама 73*], а весьма обстоятельное изложение основ космологии - в книге Пибблса [РееЬ 93*].

Переводы статей по полевой теории гравитации таких классиков науки, как Дж.Бирхгоф, В.Тирринг, Дж.Калман, С.Дезер, Р.Фейнман, имеются в дискуссионном журнале ”Гравитация” [Грав 96*], где опубликован русский перевод статьи Р. Фейнман a [Feyn 63b]. Теоретико-полевой подход к изложению теории гравитации использован в работах группы А.А.Логунова [Логу 89*]. В этих работах рассмотрена, в частности, возможность того, что гравитон имеет массу, например 10-66 - 10-65 г, и в этом случае объекты типа чёрных дыр не образуются, а ненулевой массе гравитона соответствует ненулевое значение космологической постоянной, плотность которой составляет существенную часть критической плотности.

Несмотря на то, что в настоящее время на русском языке имеется довольно много содержательных книг по теории гравитации, не остаётся ни малейшего сомнения в том, что фейнмановские лекции по гравитации следует рекомендовать как учебное пособие для студентов, научных работников, желающих ознакомиться с основами теории гравитации, что позволит взглянуть свежим взглядом на общую теорию относительности.



Автор перевода благодарит Е.Ф.Захарову и А.А.Захарову за неоценимую помощь при работе над текстом перевода.

А.Ф. Захаров

Предисловие

В течение 1962-63 академического года Ричард Фейнман прочитал курс гравитации в Калифорнийском Технологическом Институте в городе Пасадина, США. Используя нетрадиционный подход к данному предмету, Р. Фейнман предназначал этот курс перспективным аспирантам и молодым докторам философии,1 для которых привычны методы релятивистской квантовой теории, в частности, фейнмановские диаграммы теории возмущений в квантовой электродинамике. Два молодых доктора философии Фернандо Б. Мориниго и Уильям Г. Вагнер записали этот курс лекций. Записи этого курса лекций были отпечатаны и их копии продавались в книжном магазине KAЛTEX’a в течение многих лет.

1 Учёная степень доктора философии в США обычно считается соответствующей степени кандидата наук в нашей стране. (Прим. перев.)

Эти записи лекций не были опубликованы, но были довольно широко распространены, и благодаря их уникальному и глубокому взгляду на основания физики они оказали огромное влияние на многих учёных, которые их прочитали. Мориниго и Вагнер проделали большую работу по сохранению в столь хорошем виде этой части научного наследства Р. Фейнмана. Теперь, благодаря усилиям Брайана Хатфилда, эти лекции наконец опубликованы и стали легко доступны более широкой аудитории. При подготовке записок лекций для публикации Хатфилд исправил небольшие ошибки и улучшил обозначения, но в целом он следовал оригинальному машинописному тексту, подготовленному Мориниго и Вагнером. (Только два коротких фрагмента полностью опущены в тексте книги.)2

2 Пропущенные фрагменты содержат неправильное выражение для действия вещества в заключении 8.7 (правильное выражение имеется в разделе 10.2) и некоторые неверные утверждения о ньютоновской теории звёздной устойчивости в третьем параграфе раздела 14.3.

Фейнман прочитал всего 27 лекций, по одной лекции в неделю в течении полного 1962-63 академического года. Слушатели встречали лектора на третьем этаже Лаборатории Ист Бридж КАЛТЕХ’а в крошечной аудитории, в которой было только два ряда стульев; не более, чем 15 слушателей посещали каждую лекцию. (По крайней мере, двое из студентов, посещавших эти лекции, Джеймс Бардин и Джеймс Хартль позднее внесли свой существенный вклад в теорию гравитации). Эти лекции записывались на магнитофон, но поскольку лекции читались в высшей степени неформально, Мориниго и Вагнер сочли необходимым существенным образом пересмотреть материал для того, чтобы выпустить записи лекций в читаемом виде. По большей части Вагнер работал над математической стороной изложения, а Мориниго работал над текстом. Получившиеся в результате лекции просматривались Фейнманом, он делал различные поправки и добавления, затем записи лекций распространялись среди студентов. Эти лекции были проникнуты духом Фейнмана, окроплены его шутками, но неминуемо его причудливое использование языка было только частично сохранено.

Только 16 лекций включены в эту книгу; они соответствуют, грубо говоря, первым 16 из 27 лекций, которые Фейнман прочитал. Мориниго и Вагнер подготовили записи всех 27 лекций, но в конце академического года Фейнман просмотрел и исправил только первые 11 лекций. Очевидно, что он отвлёкся на различные другие проекты и больше уже не возвращался к редактированию записей лекций. Таким образом, записи только первых 11 лекций распространялись среди студентов в течении 1962-63 годов и были размножены для продажи в книжном магазине КАЛТЕХ’а в последующие годы.

В июле 1971 года готовилось новое воспроизведение записей лекций для распределения через книжный магазин, и Фейнман разрешил включить в новое издание дополнительно ещё пять лекций. Новые лекции предварялись своеобразным ”отказом от ответственности”:


Широкий интерес к этим лекциям по гравитации привёл к третьему воспроизведению этих записей. Тогда, когда готовилось это издание, профессор Фейнман любезно разрешил включить ещё пять лекций. Эти лекции должны были продолжить предыдущие одиннадцать лекций, распространённых в 1962-63 годах, однако они никогда удовлетворительным образом не редактировались и не исправлялись так, чтобы профессор Фейнман мог считать, что они могут быть включены в текст лекций.

Эти лекции сохраняют их грубую форму: за исключением небольших ошибок, исправленных при копировании, они остаются в том же самом виде, в котором они были восемь лет назад: профессор Фейнман не проверял их. Выражается надежда, что читатель будет держать это в уме и рассматривать следующие лекции как рассказ о том, о чем профессор Фейнман размышлял в то время, а не воспринимать этот текст как разрешённое и полностью обработанное воспроизведение его работы.


Действительно, кажется верным, что Фейнман не исправлял детально новые лекции. Например, лекция 14 содержит неправильные утверждения (обсуждаемые ниже), и в 1971 году (или даже в течении нескольких недель после чтения этой лекции) он мог бы легко убедиться в том, что эти утверждения неправильны и проверить их. Таким образом, мы призываем читателя держать приведённый выше ”отказ от ответственности” в уме при чтении лекций 12 - 16.

Поскольку Фейнман никогда не разрешал распространение записей Мориниго и Вагнера последних 11 лекций, они не публикуются в этом томе. Эти последние лекции главным образом касаются радиационных поправок в квантовой гравитации и теории Янга - Миллса. Мы предполагаем, что Фейнман не хотел, чтобы они распространялись, поскольку он не был удовлетворён их содержанием.

Замечательно, что одновременно с этим курсом по гравитации, Фейнман также создавал и читал новаторский курс физики для студентов-второкурсников, который был увековечен как второй и третий том ” Фейнмановских лекций по физике” [Feyn 63а]. Каждый понедельник Фейнман читал свою лекцию для второкурсников утром и лекцию по гравитации после ланча. Позднее на неделе следовала вторая лекция для второкурсников и лекция для научных работников в исследовательских лабораториях Хьюджа в Малибу. Кроме педагогической нагрузки и его собственных научных исследований, Фейнман работал в экспертном совете по рассмотрению учебников для Калифорнийского государственного совета по образованию, т.е. был увлечён проблемами преподавания, что поглощало его целиком, как это красочно описано в книге ”Вы, конечно, шутите, мистер Фейнман?” [Feyn 85].1 Стивен Фраучи, принимавший участие в лекциях по гравитации в качестве молодого ассистента КАЛТЕХ’а, вспоминал позже, что ”Фейнман был полностью истощён” к концу 1962-63 академического года.

1 Русский перевод некоторых глав этой книги опубликован в УФН [Фейн 86*]. (Прим. перев.)

Курс Фейнмана никогда не был предназначен на то, чтобы быть достаточно полным введением в общую теорию относительности, и некоторые из этих лекций серьёзным образом устарели. Большая часть материала в лекциях 7-12 покрывается более систематическим и в значительной степени более детальным изложением в других книгах. Почему же эти лекции должны были бы быть сейчас опубликованы? Существует, по крайней мере, три серьёзных аргумента для подобной публикации. Во-первых, ещё не было подобного педагогического опыта столь необычного подхода к основаниям общей теории относительности, который впервые был предложен Фейнманом (среди других авторов). Этот подход, представленный в лекциях 3-6, развивает теорию безмассового поля спина 2 (гравитона), взаимодействующего с тензором энергии-импульса вещества, и демонстрирует, что усилия, направленные на то, чтобы сделать теорию самосогласованной, неизбежно приводят к эйнштейновской теории относительности. (Именно благодаря этому, записи лекций стали хорошо известными в физическом сообществе). Во-вторых, записи лекций содержат увлекательные отступления и отклонения по поводу оснований физики и других вопросов, что делает эти записи лекций поучительными и интересными для чтения. В-третьих, эти записи имеют историческую ценность. В то время, когда Фейнман читал эти лекции, он напряжённо размышлял в течении нескольких лет о фундаментальных проблемах гравитации, и представляется полезным иметь записи его размышлений и его точки зрения того времени. Некоторые из его взглядов кажутся нам сейчас, 32 года спустя, весьма проницательными, в то время как другие его гипотезы, естественно, кажутся наивными или неверными. В некоторых случаях его взгляды быстро эволюционировали в процессе чтения этих лекций. Это, в частности, верно для материала лекции 14 о релятивистских звёздах, о чем ниже мы поговорим несколько подробнее.

Эти лекции представляют особую ценность для того, чтобы обучить нас точке зрения Фейнмана на гравитацию, но они не являются самым удачным текстом для обучения начинающего студента современной геометрической формулировке общей теории относительности или вычислительному аппарату и приложениям теории. Такие книги, как написанные Волдом [Wald 84], Шутцем [Schu 85], и Мизнером, Торном и Уилером [MTW 73], решают эту педагогическую задачу значительно лучше. Даже догматически негеометрическая точка зрения, которую предпочитал Фейнман, более систематически и полно изложена Вейнбергом [Wein 72]. Но нет другого источника, который бы содержал уникальные размышления Фейнмана и его подход к основаниям данного предмета.

Эти записи лекций могут быть прочитаны на нескольких различных уровнях читателями, имеющими различный уровень начальной подготовки:


Для того, чтобы понять лекции полностью, читатели должны иметь продвинутый уровень подготовки в области теоретической физики. Фейнман предполагал, что для его аудитории привычны методы квантовой теории поля в такой степени, что эти знания позволяют получить информацию о том, как извлечь фейнмановские правила из действия и как использовать эти правила для того, чтобы вычислить древесные диаграммы. Тем не менее, эти методы теории поля серьёзным образом используются только в лекциях 2-4 и 16, и даже в них ключевые идеи могут схвачены без столь высокого уровня подготовки. Кроме того, другие лекции могут быть прочитаны более или менее независимо от этих лекций.

Читатели с солидной подготовкой по физике могут найти эти лекции в большой степени понятными для себя, благодаря педагогическому мастерству Фейнмана. Тем не менее, такие читатели должны обладать некоторым эвристическим умением ухватить некоторые более технические детали изложения.

Для почитателей Фейнмана, которые не имеют достаточного уровня подготовки по физике, эти лекции также содержат много ценного, хотя для того, чтобы извлечь это ценное потребуется значительное ознакомление с техническим материалом, который разбросан среди более земных интуитивных догадок и рассуждений.

Оставшаяся часть этого введения и следующий раздел, написанный Брайаном Хатфилдом, представляют собой краткое изложение лекций и обсуждение того, как они связаны с предшествующими исследованиями и последующим развитием теории. Как и сами лекции, это краткое изложение может быть прочитано на различных уровнях. Для того, чтобы помочь читателям, которые не имеют достаточного уровня подготовки в области теоретической физики, отмечены некоторые особенно технические разделы, которые читатели могут пропустить или только бегло просмотреть.1

1 В русском переводе эти фрагменты набраны более мелким шрифтом. (Прим. перев.)

Вывод полевого уравнения Эйнштейна

В период чтения этих лекций по гравитации Фейнман стремился к тому, чтобы проквантовать гравитацию, т.е. создать синтез общей теории относительности и фундаментальных принципов квантовой механики. В целом подход Фейнмана к общей теории относительности сформирован его желанием получить квантовую теорию гравитации настолько непосредственным образом, насколько это возможно. Для этой цели тонкости геометрического подхода кажутся отвлечением от основной темы; в частности, общепринятый геометрический подход к гравитации затемнён разговором об аналогии между гравитацией и электромагнетизмом.

Используя ретроспективный взгляд, мы можем получить классическую электродинамику Максвелла, исходя из того наблюдения, что фотон является безмассовой частицей спина 1. Вид квантовой теории безмассовой частицы со спином 1, взаимодействующей с заряженной материей, в большой степени ограничивается фундаментальными принципами такими, как Лоренц-инвариантность и сохранение вероятности. Самосогласованная версия квантовой теории - квантовая электродинамика определяется в классическом пределе классическими полевыми уравнениями Максвелла.

Ободрённый этой аналогией, Фейнман рассматривает квантовую теорию гравитации ”просто как другую квантовую теорию поля”, такую как квантовая электродинамика. Так, в лекциях 1 - 6 он задаёт вопрос: можем ли мы найти разумную квантовую теорию поля, описывающую безмассовые кванты со спином 2 (гравитоны), взаимодействующие с веществом в обычном плоском пространстве-времени Минковского? Классический предел такой квантовой теории должен был бы определяться уравнением поля эйнштейновской теории относительности. Поэтому, для того, чтобы убедиться в виде классической теории, Фейнман привлекает внимание к характерные особенности квантовой теории, которые должны лежать в основании теории. Геометрические идеи проникают в обсуждение Фейнмана только через ”чёрный вход” и развиваются первоначально как технические средства для того, чтобы помочь в построении приемлемой теории. Так, например, тензор кривизны (Римана), являющийся узловым пунктом общепринятой формулировки общей теории относительности, вводится Фейнманом первоначально (6.4) только как средство для построения членов в гравитационном действии, удовлетворяющем требуемым свойствам инвариантности. Действительно, только в лекции 9 (разделе 9.3) лекций Фейнман показывает, что кривизна имеет интерпретацию через параллельный перенос касательного вектора по искривлённому пространственно-временному многообразию.

Критической особенностью квантовой теории является то, что безмассовый гравитон со спином 2 имеет только два состояния спиральности. Таким образом, классическое гравитационное поле также должно иметь только две динамические степени свободы. Тем не менее, классическое гравитационное поле, которое соответствует частице со спином 2, является симметричным тензором ℎμν с десятью компонентами. На самом деле, четыре из этих компонент ℎ00, ℎ0𝑖 (при 𝑖 = 1,2,3) являются нединамическими связанными переменными, так что у нас остаётся только шесть динамических компонент ℎ𝑖𝑗 для того, чтобы описать состояния с двумя физическими спиральностями. Из-за того, что есть несоответствие между числом состояний частицы и числом полевых компонентов, следует, что квантовая теория поля и отсюда также и соответствующая классическая теория являются в большой степени теориями со связями.

Для того, чтобы разрешить это несоответствие, необходимо включить в теорию избыточность так, чтобы многие различные классические полевые конфигурации описывали одно и то же физическое состояние. Другими словами, это должна быть калибровочная теория. Для безмассового поля спина 2 может быть показано, что необходимый калибровочный принцип является условием общей ковариантности, что приводит к эйнштейновской теории.

В лекции 3 Фейнман построил квадратичное действие безмассового поля спина 2, которое линейным образом связано с сохраняющимся тензором энергии-импульса. Он объясняет калибровочную инвариантность результирующего линейного полевого уравнения в разделе 3.7 и даёт комментарий в разделе 4.5 о том, что можно сделать вывод о нелинейном самовзаимодействии поля, основываясь на требовании калибровочной инвариантности амплитуд рассеяния. Но Фейнман не доводит эту программу до конца. (Он только замечает, что это довольно трудно было бы сделать.) Вместо этого, он использует довольно отличный от этого подхода метод для того, чтобы получить эйнштейновское нелинейное классическое полевое уравнение, метод, основное внимание в котором сосредоточено на непротиворечивости. Так как линейное полевое уравнение для свободного безмассового поля со спином 2 с необходимостью имеет калибровочную инвариантность (для того, чтобы устранить ненужные состояния спиральности), общие модификации такого полевого уравнения (такие, как модификации, которые возникают тогда, когда поле спина 2 связано с материей) не допускают никаких решений. Новые члены в модифицированном уравнении должны удовлетворять нетривиальному условию непротиворечивости, которое существенным образом является требованием того, что новые члены удовлетворяют калибровочной симметрии. Это условие непротиворечивости оказывается достаточным при указании пути в направлении специфического эйнштейновского множества нелинейных связей и соответствующего нелинейного полевого уравнения.



Более подробно: задача, как она сформулирована в разделе 6.2, состоит в том, чтобы найти функционал действия, 𝐹[ℎ] для поля спина 2 такого, что гравитационное полевое уравнение


δ𝐹

δℎμν

=

𝑇

μν


(П.1)


согласуется с уравнением движения вещества. Здесь 𝑇μν есть тензор энергии-импульса вещества. В лекции 3 Фейнман находит квадратичное выражение для 𝐹, которое удовлетворяет согласованному линейному полевому уравнению до тех пор, пока сохраняется тензор энергии-импульса вещества (для случая специальной теории относительности) 𝑇μν. Беспокойство возникает тогда, когда поле ℎμν взаимодействует с веществом так, что вещество действует как источник ℎμν, уравнение движения вещества модифицируется гравитационными силами и величина 𝑇μν не оказывается более нулевой. Таким образом, полевое уравнение для ℎμν и уравнение движения вещества оказываются несовместными; эти уравнение не допускают одновременных решений. В этом состоит проблема непротиворечивости (линейной теории).

Используя требования того, что полевое уравнение удовлетворяется тензором ℎμν совместно с уравнением движения материи, Фейнман сделал вывод о том, что нелинейные поправки более высокого порядка должны быть добавлены к действию 𝐹. Требование непротиворечивости может быть облачено в форму принципа инвариантности, которому удовлетворяет действие, (с учётом этого принципа действие есть инвариант при общих координатных преобразованиях). После этого фейнмановский анализ стал довольно общепринятым и привёл к заключению о том, что достаточно общее согласованное полевое уравнение, которое включает в себя не более двух производных, есть уравнение Эйнштейна (с космологической постоянной).

Результирующие нелинейные поправки имеют приятную физическую интерпретацию. Без этих поправок гравитация не имеет связи сама с собой. Когда нелинейные поправки включаются в рассмотрение, источник для гравитационного поля (как он рассматривается в плоском пространстве-времени Минковского) есть полный тензор энергии-импульса, включающий вклад, обусловленный собственно гравитационным полем. Другими словами, удовлетворяется (сильный) принцип эквивалентности. Закон сохранения, удовлетворяемый энергией-импульсом вещества, становится эйнштейновским ковариантным законом, 𝑇μν=0, который в сущности допускает обмен энергией и импульсом между веществом и гравитацией.

Мы знаем из фейнмановских комментариев, сделанных в 1957 году на конференции в Чапел Хилл [DeWi 57], что уже тогда он работал над вычислениями, описанными в лекциях 2-6. Мюррей Гелл-Манн сообщал [Gell 89], что Фейнман и он обсуждали различные вопросы квантовой гравитации в течении рождественских каникул в 1954 - 55 годах, и что уже тогда Фейнман достиг ”значительного прогресса” в этой области.

Требование того, что единственная разумная теория взаимодействующего безмассового поля спина 2 является по существу общей теорией относительности (или хорошо аппроксимируется общей теорией относительности в низкоэнергетическом пределе), довольно часто высказывается и сегодня. (Например, доказывается, что так как теория суперструн содержит безмассовые частицы спина 2, это может быть теория гравитации). Фактически, Фейнман не был самым первым, кто высказал это требование.

Полевое уравнение для свободного безмассового поля спина 2 было выписано Фиртцем и Паули в 1939 году [FiPa 39]. С того времени идея рассмотрения эйнштейновской гравитации, как теории поля спина 2 в плоском пространстве, изредка встречалась в литературе. Тем не менее, насколько мы знаем, первая опубликованная попытка вывести нелинейные связи в теории Эйнштейна в рамках такого подхода появилась в работе Сурая Гупты в 1954 году [Gupt 54]. Гупта заметил, что действие в теории должно подчиняться нетривиальному условию непротиворечивости, которое удовлетворяется в общей теории относительности. Тем не менее, он не привёл никакого детального аргумента в пользу единственности полевого уравнения Эйнштейна.

Грубо говоря, аргумент Гупты состоит в следующем. Мы хотим построить теорию, в которой ”источник”, связанный с безмассовым полем спина 2, есть тензор энергии-импульса, включающий энергию-импульс самого поля спина 2. Если выбрать источник поля таким образом, что он есть тензор энергии-импульса 2𝑇μν теории свободного поля (которая квадратична по ℎ), то связь этого источника с тензором ℎμν приводит к появлению кубического члена в лагранжиане. Из этого кубического члена в лагранжиане может быть выведен соответствующий кубический член 3𝑇μν в тензоре энергии-импульса, который тогда включается в источник. Этим порождается член четвёртого порядка 4𝑇μν и так далее. Эта итерационная процедура порождает бесконечные ряды, которые могут быть просуммированы для того, чтобы получить полные нелинейные уравнения Эйнштейна. Гупта кратко описал эту процедуру, но на самом деле не довёл её до завершения. Первая полная (и особенно элегантная) версия была опубликована Дезером в 1970 году [Dese 70]. Дезер также заметил, что теория Янга-Миллса может быть выведена, исходя из подобного подхода.

За несколько лет до работы Гупты, Роберт Крайчман, тогда 18-летний студент Массачусетского Технологического Института, также изучал проблемы вывода общей теории относительности как непротиворечивой теории безмассового поля спина 2 в плоском пространстве. Он описал свои результаты в неопубликованной диссертации на степень бакалавра [Krai 47]. Крайчман продолжил исследования по этой проблеме в Институте Перспективных Исследований в 1949 - 1950 годах. Он вспоминает, что хотя он и получил некоторое одобрение от Брайса Де Витта, очень немногие из его коллег поддерживали его усилия. Эта группа определённо включала в себя самого Эйнштейна, который пришёл в ужас от такого подхода к гравитации, отвергавшего его собственное геометрическое понимание, полученное им в результате огромной проделанной работы. Крайчман не публиковал никакие из своих результатов до 1955 года [Krai 55, Krai 56], когда он наконец нашёл вывод, который его удовлетворил. В отличие от Гупты, Крайчман не предполагал, что гравитация взаимодействует с полным тензором энергии-импульса. Скорее всего он, как и Фейнман, выводил свой результат как следствие непротиворечивости полевых уравнений. Кажется вероятным, что Фейнман совершенно ничего не знал о работах Гупты и Крайчмана.

Мы должны были бы указать на то, что анализ Фейнмана весьма далёк от наиболее общего анализа, который можно было бы провести (анализ Фейнмана является существенно менее общим, чем анализ Крайчмана). Фейнман предполагал некоторый частный вид для действия вещества (которое соответствует действию для релятивистской частицы) и далее предполагал строго линейную связь поля вещества спина 2 (которая была бы невозможна для более общего действия для материи). В частности, отметим, что все физические предсказания теории не меняются, если проводится нелинейное локальное переопределение поля спина 2; мы вольны сделать замену ℎμν(𝑥) на ℎμν(ℎ(𝑥))=ℎμν(𝑥)+𝑂(ℎ(𝑥)²). Фейнман косвенным образом устранил эту свободу для того, чтобы делать подобные переопределения исходя из требования, что взаимодействие с материей должно быть линейно по ℎ. (Полевые переопределения рассматривались детально Боулваром и Дезером [BoDe 75].) Значительно более общий анализ условия непротиворечивости для полевого уравнения проводился позднее Волдом [Wald 86] и привёл его в конце концов к заключениям, аналогичным тем, к которым пришли Крайчман и Фейнман.

Совершенно другой подход к выводу формы гравитационного взаимодействия был разработан Вейнбергом [Wein 64а, Wein 64b]. Сделав весьма разумные предположения об аналитических свойствах амплитуд рассеяния при гравитон-гравитон взаимодействии, Вейнберг показал, что теория взаимодействующей безмассовой частицы со спином 2 может быть лоренц-инвариантной, только если частицы взаимодействуют с материей (включая взаимодействие с самой собой) с некоторой универсальной силой, другими словами, только если удовлетворяется сильный принцип эквивалентности. До известной степени аргументация Вейнберга - наиболее глубокая и мощная, так как свойство того, как гравитон взаимодействует с тензором энергии-импульса, выводится из других более общих принципов. Как только принцип эквивалентности установлен, можно продолжить построение эйнштейновской теории [Wein 72].

Наконец, существует вопрос о том, как должны быть исключены члены в лагранжиане, включающие в себя производные выше второго порядка от тензора ℎμν. В лекциях Фейнмана этому вопросу уделено очень мало внимания, за исключением замечания в разделе 6.2, что включение членов с двумя производными (или менее) приведёт к ”наипростейшей” теории. (См. также в разделе 10.3 связанное с этим замечание в слегка другом контексте.) Фейнман, по-видимому, не предвосхитил современную точку зрения [Wein 79], что члены с более высокими производными обязательно присутствуют в лагранжиане, но эти члены оказывают пренебрежимо малое влияние на предсказания теории, когда кривизна пространства-времени мала. Философия, лежащая в основе этой точки зрения, состоит в том, что лагранжиан эйнштейновской теории является просто ”эффективным лагранжианом”, который описывает низко-энергетическую феноменологию более фундаментальной теории - теории, которая могла бы включать в себя новые степени свободы (суперструны?) на масштабах длины порядка планковской длины 𝐿𝑃=(𝐺ℏ/𝑎²)½≃10-33 см. В эффективном лагранжиане допускаются все члены, согласованные с общими принципами, включая члены с произвольным числом производных. Тем не менее, основываясь на соображениях размерности, член с более высокими производными имеет коэффициент, пропорциональный более высокой степени 𝐿𝑃. Таким образом, в процессе, включающем в себя характерный радиус кривизны порядка 𝐿, члены в лагранжиане с четырьмя производными дают эффекты, которые подавлены по сравнению с эффектами, вызываемыми членами со второй производной, подавлены множителем порядка (Lp/L)2, который чрезвычайно мал для любых разумных процессов. В таком случае мы можем понять, почему усечённая теория, включающая только члены со второй производной и ниже, была бы в замечательном согласии с экспериментом.

С другой стороны, то же самое рассуждение также приводит к ожиданию появления ”космологического” члена (в котором нет производных) с коэффициентом порядка 1 в единицах 𝐿𝑃. То, что космологическая постоянная является фактически необычайно малой сравнительно с такими наивными ожиданиями, остаётся одной из великих неразрешённых тайн физики гравитации [Wein 89].

Геометрия

После проведения исследований в целях построения разумной теории, которая описывает взаимодействия безмассовых полей спина 2 в плоском пространстве, Фейнман не отказался от того, чтобы высказать восхищение (как в разделе 8.4), что получившаяся в результате теория имеет геометрическую интерпретацию: ”… этот факт состоит в том, что поле спина 2 имеет геометрическую интерпретацию; это не является чем-то легко объяснимым, это является просто удивительным.” В лекциях 8-10 при развитии теории используется геометрический язык, который является более традиционным, чем тот подход, который использовался в его более ранних лекциях.

В разделе 9.3 Фейнман замечает, что он не знает геометрической интерпретации тождества Бианки, и он кратко описывает, как можно было бы обнаружить этот геометрический смысл. Геометрическая интерпретация, которую он представляет, была в явном виде описана в работе французского математика Эли Картана в 1928 году [Cart 28]; тем не менее, она была неизвестна широким кругам физиков, даже кругам профессиональных релятивистов в 1962 году. Эта геометрическая интерпретация была высказана на языке дифференциальных форм, на котором Фейнман не говорил. Интерпретация Картана состояла в том, что ”граница границы равна нулю”, как было в конце концов извлечено из идей Картана Чарльзом Мизнером и Джоном Уилером в 1971 году, что сделало эту интерпретацию широко доступной; см. например, часть 15 монографии [MTW 73] на техническом уровне и часть 7 книги [Whee 90] на популярном уровне.

Космология

Некоторые из идей Фейнмана о космологии имеют современное звучание. Хороший пример - это его внимание к вопросу о происхождении материи. Идея о непрерывном образовании вещества в стационарной космологической модели серьёзно не раздражает его (он замечает в разделе 12.2, что в космологии Большого Взрыва существует проблема (причём довольно неприятная), как объяснить, откуда берётся вся материя в самом начале). В разделе 1.2 и вновь в разделе 13.3 он подчёркивает, что полная энергия вселенной могла бы быть в действительности равной нулю, и что образование вещества возможно, поскольку энергия покоя вещества на самом деле сокращается энергией гравитационного потенциала. ”Дух захватывает от мысли о том, что ничего не стоит образовать новую частицу…”. Это близко к популярному взгляду на то, что вселенная есть ”бесплатный обед”, ничто или почти ничто взрывается до космологического размера, проходя через чудо инфляции [Guth 81]. Фейнман беспокоился более о необходимости несохранения барионного числа, если вселенная возникает из ”ничего”.

Фейнман также выразил предпочтение для ”критического” значения плотности в разделе 13.1, и этот предрассудок довольно широко распространён сейчас [LiBr 90]. В разделе 13.2 он дал интересный (и качественно правильный) аргумент в поддержку того, что плотность близка к критической: он замечает, что существование скоплений и сверхскоплений галактик приводит к тому, что ”гравитационная энергия того же самого порядка, что и кинетическая энергия расширения, это позволяет мне предположить, что средняя плотность должна быть очень близка к критической плотности всюду.” В 1962 году это был довольно непривычный аргумент.

Очевидно, что уже в начале 60-х годов Фейнман признал необходимость новых фундаментальных принципов физики, которые могли бы обеспечить нас предварительным описанием начальных условий вселенной. В начале этих лекций, в разделе 2.1, он отклоняется на обсуждение оснований статистической механики, чтобы выразить убеждение в том, что второй закон термодинамики должен иметь космологическое происхождение. Отметим его утверждение ”…вопрос состоит в том, как в квантовой механике описать ту идею, что состояние вселенной в прошлом было чем-то особенным.” (Подобная интуитивная догадка также появилась в книгах ”Фейнмановскиелекции по физике” [Feyn 63а] и ”Характер физических законов” [Feyn 67], которые были датированы тем же самым периодом.) Таким образом, по-видимому, Фейнман предвидел то увлечение квантовой космологией, которое начало овладевать вниманием значительной части физического сообщества около двадцати лет назад. Он также выражает в разделах 1.4 и 2.1 неприемлемость копенгагенской интерпретации квантовой механики в космологическом контексте.

Сверхзвёзды

В 1962 - 63 годах, когда Фейнман читал свои лекции по гравитации, КАЛТЕХ был взволнован новыми открытиями ”сильных радиоисточников”.

В течение 30 лет астрономы были озадачены выяснением природы этих наиболее сильных из всех объектов, излучающих в радиодиапазоне. В 1951 году Уолтер Бааде [Baad 52] использовал новый оптический 200-дюймовый телескоп КАЛТЕХ’a на горе Паломар для того, чтобы открыть наиболее яркий из радиоисточников - Лебедь A (Cygnus А), который не являлся (как это ожидали астрономы) звездой в нашей собственной Галактике, но был связан с некоторой особенной, довольно удалённой галактикой. Двумя годами позже Р.К.Дженнисон и М.К.Дас Гупта [JeDG 53], изучая источник Лебедь А с помощью нового радиоинтерферометра в Джодрелл Бенк, Англия, открыли, что большая часть радиоволн приходит не от внутренней части галактики, а от двух гигантских полостей, расположенных с противоположных сторон от галактики, которые имеют размер около 200 000 световых лет и около 200 000 световых лет между этими полостями. Радиоинтерферометр КАЛТЕХ’а, расположенный в ущелье Оуэнса, вошёл в строй в конце 50-х годов, и в 1962-63 годах, времени чтения лекций Фейнмана, этот интерферометр использовался совместно с оптическим 200-дюймовым телескопом на горе Паломар для того, чтобы идентифицировать многие другие радиоисточники с двойными полостями. Некоторые, как и Лебедь А, размещены в центре галактик; другие объекты размещены на звездоподобных точечных источниках света (которые, как обнаружил 5 февраля 1963 сотрудник КАЛТЕХ’а Мартин Шмидт, имеют гигантские значения красного смещения [Schm 63], а позже в том же году Хонг Йи Чиу, назвал эти объекты квазарами). В 1962 году и в начале 1963 года, тогда как астрономы КАЛТЕХ’а соревновались друг с другом для того, чтобы провести новые и лучшие наблюдения этих странных объектов и проинтерпретировать их спектры, астрофизики соревновались в построении моделей этих объектов.1

1 Для ознакомления с дальнейшими историческими деталями, см., например, часть 9 [Thor 94] и ссылки в этой книге.

Одна особенно многообещающая модель была представлена летом 1962 года сотрудником Кембриджа Фредом Хойлом и сотрудником КАЛТЕХ’а Уильямом Фаулером [HoFo 63]. В рамках этой модели предполагается, что мощность для каждого сильного радиоисточника приходит от сверхмассивной звезды в центре галактики. Громадная величина энергии радиополостей (оценённая Джеоффри Бербиджем как 1058 - 1060 эрг, т.е. эквивалент энергии 104 - 106 солнечных масс) требует, чтобы эта система управлялась бы сверхмассивной звездой, имеющей массу ~ 106 - 109 солнечных масс. По сравнению с верхним пределом массы нормальных звёзд, равным ~ 100 солнечных масс, эти объекты Хойла - Фаулера были на самом деле ”сверхмассивными.” Эти объекты стали называться в некоторых кругах сверхзвёздами.

Где-то в начале 1963 года (вероятно в феврале или марте) Фред Хойл делал доклад на семинаре (SINS)1 в Лаборатории излучения (Лаборатории Келлога) КАЛТЕХ’а о модели сверхзвезды для сильных радиоисточников. Во время, когда задавали вопросы, Ричард Фейнман высказал возражение о том, что эффекты общей теории относительности должны были бы делать все сверхзвёзды неустойчивыми, по крайней мере, в том случае, если они невращающиеся. Они должны были бы коллапсировать для того, чтобы образовать то, что в настоящее время называется чёрными дырами.

1 ”Stellax Interiors and Nucleosynthesis” - ”внутреннее строение звёзд и нуклеосинтез” - серия семинаров, которые организовал и проводил Фаулер.

Хойл и Фаулер находились в сомнении, но в течение нескольких месяцев они и независимо от них Ико Ибен [Iben 63] (старший научный сотрудник в Лаборатории Келлога, в которой работал Фаулер) проверили и убедились в том, что Фейнман наиболее вероятно был прав. С. Чандрасекар из Чикагского Университета независимо открыл неустойчивость в рамках общей теории относительности и вполне определённым образом проанализировал эту неустойчивость.

По словам Хойла и Фаулера замечание Фейнмана было ”громом среди ясного неба”, полностью неожиданным и не имело видимого основания, за исключением изумительной физической интуиции Фейнмана. На Фаулера это произвело такое впечатление, что он описывал этот семинар и интуитивную догадку Фейнмана многим коллегам по всему миру, добавляя, тем самым, ещё одну (правдивую) историю к легенде Фейнмана.

На самом деле интуиция Фейнмана не возникала без труда. Здесь, как и где-нибудь в другом месте, эта интуиция основывалась на огромном объёме детальных вычислений, проводимых из-за любознательности Фейнмана. И в этом случае, в отличие от других, Фейнман оставил нам моментальный снимок его напряжённой работы, в результате которой им было сделано открытие: это лекция 14 в этом томе.

Мы собрали вместе обстоятельства, окружающие лекцию 14, главным образом основываясь на записках января 1963 года Ико Ибена и на его воспоминаниях, кроме того, на беседе между Фейнманом и Торном, произошедшей где-то в районе 1971 года, и фрагментах воспоминаний Джеймса Бардина, Стивена Фраучи, Джеймса Хартля и Уильяма Фаулера.

Где-то в конце 1962 года или в начале января 1963 года Фейнману должно было придти в голову, что на сверхзвёзды Хойла - Фаулера должны были бы оказывать сильное влияние силы общей теории относительности. Согласно запискам Ибена, Фейнман пришёл в его комнату в Лаборатории Келлога где-то до 18 января, поднял вопрос о том, как влияет общая теория относительности на сверхзвёзды, показал Ибену уравнения общей теории относительности, которые описывают структуру сверхзвезды и которые Фейнман выписал для самого себя, исходя из первых принципов, и спросил о том, как астрофизики, такие как Ибен, действуют при построении ньютоновских звёздных моделей из аналогичных ньютоновских уравнений. После этого обсуждения, Фейнман ушёл и вернулся где-то на неделе (21 - 25 января). "Фейнман ошарашил меня”, вспоминал Ибен, ”тем, что он пришёл и сказал мне, что он [уже] решил … уравнения. Он сказал мне, что он провёл некоторые консультации с компьютерной фирмой и решил эти уравнения в реальное время, как это должно было бы быть сделано на поколении компьютеров типа рабочей станции”.

В понедельник 28 января, имея только несколько дней для того, чтобы обдумать численные решения (и, предположительно, затратив достаточно много времени на различные другие дела, так как он должен был готовить лекцию для второкурсников в тот же самый понедельник), Фейнман прочитал лекцию 14 из этой книги. (Заметим, что это было всего за восемь дней до открытия Мартином Шмидтом красных смещений квазаров.)

Лекция 14 пришлась на середину усилий Фейнмана, направленных на то, чтобы представить себе, как должны вести себя сверхзвёзды, эта лекция была до того, как он осознал, что эффекты общей теории относительности дестабилизируют эти сверхзвёзды. Как результат, посвящённые интерпретации фрагменты лекции 14 (разделы 14.3 и 14.4) в большой степени неверны, но несмотря на это представляется интересным указать те пути, которые использовал Фейнман при своём интуитивном подходе к решению этой задачи.

Фейнман никогда не просматривал напечатанную Мориниго и Вагнером версию лекции 14; и в 1971 году, когда он одобрил лекции 12 - 16 для распространения, он скорее всего забыл, что часть лекции 14, связанная с интерпретацией, представляет собой отчёт о рассуждениях, которые однако не принесли достойного плода.

Фейнман начал свою лекцию 14 введением модели сверхзвезды, "которая очень проста, но может, тем не менее, обладать огромным множеством атрибутов реальных процессов. После того, как мы поймём, как обходиться с решением такой простой задачи, мы можем позаботиться об усовершенствованиях в модели.” (Усовершенствования - это учёт влияния электрон-позитронных пар, испускания нейтрино, ядерного горения, вращения, неустойчивостей - будут добавлены позднее в 1963 -64 годах Ибеном [Iben 63], Куртисом Майклом [Mich 63], Фаулером [Fowl 64] и Бардиным [Bard 65] при значительных обсуждениях с Фейнманом и постановке им некоторых задач.)

Поскольку цель Фейнмана состояла в изучении эффектов общей теории относительности, его модель сверхзвезды была полностью общерелятивистская, в отличие от предыдущих моделей Хойла - Фаулера, которые были ньютоновыми. С другой стороны, там, где Фаулер и Хойл включили в рассмотрение вклад и газа, и излучения в давление звезды и внутреннюю плотность энергии, Фейнман упрощает модель, игнорируя вклад газа в давление 𝑝газ и во внутреннюю энергию εгаз. Это представляется разумным, так как основное внимание Фейнмана сосредоточено на сверхзвезде с массой 𝑀=109𝑀sun, а Хойл и Фаулер показали, что в ньютоновском пределе сверхзвезды сильно радиационно-доминировали при


β

𝑝газ

𝑝излучение

=

газ

εизлучение

=


=

8,6


𝑀sun

𝑀


⎞½

3×10

-4


10⁹𝑀sun

𝑀


⎞½

.


(П.2)


(Здесь для простоты мы предполагаем, что газ является чистым водородом). Поскольку такие звёзды в большой степени являются конвективными, их энтропия на нуклон есть величина, не зависящая от радиуса, что означает в свою очередь, что величина β есть 8х(Постоянная Больцмана)/(энтропия на нуклон), есть также величина, не зависящая от радиуса; и этот факт остаётся справедливым и для общерелятивисткого случая, как отдавал себе в этом отчёт Фейнман, хотя уравнение (П.2) меняется на множитель порядка единицы.

Пренебрегая вкладом 𝑝газ и εгаз, Фейнман приступил в разделе 14.1 и 14.2 лекции 14 к построению общерелятивистских уравнений, описывающих структуру сверхзвёзд, он сообщает, что он проинтегрировал их численно и представил результаты в таблице 14.1. Эта таблица может быть проинтерпретирована с помощью уравнений (14.2.1), в которых параметр Фейнмана τ есть


τ

=

4/3

энтропия на нуклон

=


=


масса покоя нуклона

Постоянная Больцмана



β

6

1800β

,


(П.3)


так как Фейнман использует единицы, в которых масса покоя нуклона и температура 10⁹ °К кладутся равными единице.

При обсуждении моделей Фейнмана и его (неверной) интерпретации их, полезно было бы использовать рисунок П.1. Этот рисунок показывает некоторые признаки семейства моделей сверхзвёзд, которые построил Фейнман (толстая кривая), совместно с их продолжением на ультрарелятивистский режим (верхняя тонкая линия) и их продолжением на почти ньютоновский режим (нижняя тонкая линия) - эти продолжения были вычислены позднее Ибеном [Iben 63], Фаулером [Fowl 64], Бардиным [Bard 65] и Тупером [Тоор 66]. По вертикальной оси откладывается гравитационная энергия связи звезды со знаком ”минус”; по горизонтальной оси откладывается радиус звезды. В практически ньютоновском режиме (затенённая область кривой связи энергии), который Фейнман не исследует, нельзя пренебрегать величинами 𝑝газ и εгаз, энергия связи задаётся (как показал Фаулер [Fowl 64], как отклик на "гром среди ясного неба” Фейнмана) следующим тонким балансом между газовым давлением (первым членом) и эффектами общей теории относительности (второй член):


𝑀-𝑀rest

𝑀rest

≃-

8



2𝑀

𝑅


+

1,3


2𝑀

𝑅


⎞²

.


(П.4)


Здесь 2𝑀 - радиус Шварцшильда чёрной дыры с той же самой массой, что и масса сверхзвезды.

При интерпретации моделей в разделе 14.3 Фейнман начал с того, что спросил об эволюции сверхзвезды, состоящей из фиксированного количества нуклонов (т.е. фиксированной нуклонной массы покоя 𝑀rest), которая постепенно излучает тепловую энергию, что, тем самым, приводит к уменьшению полной массы 𝑀 и делает звезду более плотно связанной. Он обнаружил странную эволюцию: когда звезда излучает, её радиус увеличивается (движение вниз и направо по толстой кривой на рис. П.1) и её температура в центре уменьшается. Это противоречит поведению большей части других звёзд, которые, когда они излучают, сжимаются и нагреваются, в том случае, если в них не происходит горения термоядерного топлива. (Если вместо того, чтобы иметь дело с полностью релятивистской областью слева от точки минимума кривой связи, Фейнман сохранил бы учёт влияния газа и провёл вычисления в почти ньютоновской области справа, он обнаружил бы противоположное поведение: сверхзвезда должна была бы сжиматься и нагреваться, когда она излучает).

Фейнмановские лекции по гравитации

Рис. П.1. Энергия связи звезды, состоящей из водорода. На вертикальной оси слева отложена отрицательная величина относительной энергии связи, т.е. (𝑀-𝑀rest)𝑀rest, где 𝑀 - полная масса звезды и 𝑀rest - полная масса покоя всех нуклонов звезды; по горизонтальной (верхней) оси отложен радиус звезды в единицах радиуса Шварцшильда 2𝑀 чёрной дыры с той же самой массой. Масштабы, отложенные на левой оси и верхней оси, справедливы в белой области для сверхзвёзд любой массы, но в (почти ньютоновской) затенённой области только при 𝑀=10⁶𝑀sun На вертикальной правой оси отложена отрицательная величина от относительной энергии связи в единицах массы Солнца 𝑀sun; на нижней горизонтальной оси отложена величина 𝑅/2𝑀, умноженная на отношение β газового давления и полного давления. Правый и нижний масштабы оказываются справедливыми для сверхзвёзд любой массы в почти ньютоновский затенённой области, но они оказываются неверными в полностью релятивистской белой области. Вертикальный масштаб является арктангенсом, т.е. он почти линеен при |(𝑀-𝑀rest)𝑀rest|≲1, и логарифмическим при |(𝑀-𝑀rest)𝑀rest|≳1. Толстая часть кривой следует из вычислений Фейнмана, изложенных в лекции 14, тонкие части связаны с работами Ибена [Iben 63], Фаулера [Fowl 64], Бардина [Bard 65] и Тупера [Тоор 66].

Фейнман поставил вопрос о том, являются ли его модели сверхзвёзд устойчивыми. ”Устойчивость нашей звезды не изучена [количественно]”, подчёркивает он и затем продолжает представлять исходные рассуждения по данному вопросу: ”[Модели, которые имеют] одно и то же количество нуклонов и одно и то же значение τ [одно и то же значение энтропии], могут сравниваться как по значению радиуса, так и по температуре в центре. Факт, состоящий в том, что очевидно имеется минимальное значение радиуса [наиболее левый изгиб на рис. П.1], … является очень соблазнительным; звезда может иметь устойчивую конфигурацию”. Здесь Фейнман интуитивно идёт к методу анализа устойчивости, создание которого было завершено год или более спустя Джеймсом Бардиным, когда он стал аспирантом Фейнмана. Завершённая Бардиным версия аргумента Фейнмана [Bard 65, ВТМ 66] показала, что когда мы движемся вдоль кривой, описывающей энергию связи, ограничивая себя только фиксированными значениями массы 𝑀rest, энтропия меняется от одной модели к другой, за исключением области в окрестности каждого минимума или максимума связи, где конфигурация является стационарной. Это означает, что звезда обладает модой деформации с нулевой частотой для каждого значения минимума или максимума, модой, которая переносит сверхзвезду от одной равновесной модели к другой с тем же самым значением энтропии, энергии связи и массой покоя. Это в свою очередь означает, что одна мода радиальных колебаний меняет устойчивость в каждом экстремуме связи. Анализируя эти конфигурации и рассматривая моды собственных функций, которые должны иметь место, Бардин выводит, что если кривая связи поворачивается по часовой стрелке, когда по ней перемещаемся через экстремум, тогда эта мода становится неустойчивой; если эта кривая поворачивается против часовой стрелке, тогда эта мода становится устойчивой. (Это утверждение является справедливым вне зависимости от того направления, в котором мы движемся по кривой.) Анализ Бардина, приложенный к рис. П.1, показывает, что практически ньютоновские модели в нижнем правом углу (которые сжимаются, когда они излучают) являются устойчивыми, и они должны терять устойчивость и коллапсировать для того, чтобы образовать чёрную дыру, когда они достигают минимума кривой связи; эти модели за точкой минимума (включая все модели Фейнмана) обладают одной неустойчивой модой радиальной пульсации; эти модели за первым пиком в кривой связи (верхняя левая часть рис. П.1) обладают двумя неустойчивыми модами и т.д.

Фейнман, конечно, не отдавал себе в этом отчёт 28 января 1963 года; так что он приступил к лекции 14 для того, чтобы достичь понимания относительно устойчивости его моделей с помощью других методов. Он представляет себе, что взята одна из таких моделей сверхзвезды с барионной массой покоя 𝑀rest и затем этот объект раскалываем на две сверхзвезды, каждая из которых имеет массу покоя 𝑀rest/2, в то время как сохраняется фиксированным значение энтропии на один нуклон. ”Получим ли мы работу в результате этого процесса, или мы должны затратить работу для того, чтобы получить [звезду], расколотую на две части?” Из его таблицы 1 и уравнений (14.2.1а-14.2.1в) он выводит, что ”два объекта … должны были быть более массивными; требуется работа для того, чтобы расколоть такую систему. Это наводит на мысль о том, что звезда не могла бы выбрасывать вещество, но сохранялась бы в одном коме”, т.е. звезда могла бы быть устойчивой.

На первый взгляд это кажется убедительным аргументом. Тем не менее, на самом деле этот аргумент является обманчивым (как осознал Фейнман предположительно где-то между этой лекцией и семинаром Хойла). Эти две новые звезды, которые Фейнман образовал, расколов свою первоначальную звезду, находятся много выше толстой кривой энергии связи, изображённой на рис. П.1, т.е. они много более релятивисткие, чем первоначальная звезда. Тем не менее, имеются также две звёздных модели с теми же самыми значениями массы покоя и энтропии на нуклон, на устойчивой, почти ньютоновской ветви кривой связи в нижнем правом углу рис. П.1. Если первоначальная звезда разбивается на эти две звезды, то будет выделяться энергия, что правильно наводит на мысль о том, что первоначальная звезда является на самом деле неустойчивой. Фейнман пропустил эту аргументацию потому, что ни он, ни кто-либо 28 января 1963 ещё не знали вида кривой связи в затенённой области. Разумно сделать предположение, тем не менее, что он сделал достаточно много предположений, связанных с этим вопросом, до того, как на семинаре Хойла была замечена его ошибка.

Проведя неверный анализ устойчивости звёзд, Фейнман переходит в разделе 14.4 к тому, чтобы предложить направления дальнейших исследований сверхзвёзд. Он начинает с предложения вариационного принципа, с помощью которого можно построить равновесные модели полностью релятивистских, изэнтропических сверхзвёзд: "найти конфигурацию с наименьшей массой, исходя из заданного числа нуклонов” (и с заданной энтропией на нуклон). Два года спустя работающий в Париже Джон Кок [Cock 65] разработал, предположительно независимо от предложения Фейнмана, детальный вариационный принцип, эквивалентный фейнмановскому (в котором сохраняется масса и число нуклонов и максимизируется энтропия), и использовал этот принцип для построения общерелятивистских звёздных моделей.

Фейнман в разделе 14.4 продолжает свои рассуждения словами: ”После того, как мы исследовали статические решения, мы можем повернуть наше внимание к полной динамической задаче. Дифференциальные уравнения выглядят ужасающе”. Фактически, Фейнман выписал сам такие уравнения. Они впоследствии были выведены независимо и решены численно М.А. Подурцом [Podu 64] в СССР1 и Майклом Мейем и Ричардом Уайтом [MaWh 66] в США, с использованием потомков компьютерных алгоритмов, которые были разработаны для создания ядерного оружия. Этот результат хорошо известен: звёзды, которые испытывают релятивистскую неустойчивость Фейнмана - Чандрасекара, взрываются внутрь для того, чтобы образовать чёрные дыры.

1 Вид уравнений, решаемых по разностной схеме, которая была составлена В.Л.Загускиным, в работе М.А. Подурца следует признать неудачным из-за наличия в них корневой особенности, и их нельзя использовать в случаях, когда сжатие может смениться расширением. Впоследствии эта особенность была устранена более удачным выбором переменных [ННП 78*]. (Прим. перев.)

В течении примерно 10 лет после прочтения Фейнманом лекции 14 вращающиеся сверхзвёзды остаются сильным соперником на рынке всевозможных моделей квазаров и сильных радиоисточников, характеризующихся огромным энерговыделением. Постепенно в 1970-х годах модели, основанные на быстро вращающихся сверхмассивных чёрных дырах, приобрели господство; и сегодня сверхмассивные звёзды обычно рассматриваются как достаточно привлекательные, но нестационарные объекты в ядрах галактик, движущиеся (по эволюционной траектории) в сторону образования сверхмассивных чёрных дыр, что впоследствии приводит к их преобладанию над сверхмассивными звёздами [Thor 94].

Чёрные дыры

Понятие чёрной дыры только появлялось в начале 60-х годов, и взгляды Фейнмана могли быть слегка позади концепций, существовавших в то время. Таким образом, наиболее серьёзно устаревшими являются вероятно лекции 11 и 15, в которых рассматривается решение Шварцшильда и его приложения.

В некотором смысле то, что мы теперь называем чёрной дырой, уже было известно в 1916 году, когда Карл Шварцшильд нашёл своё решение полевого уравнения Эйнштейна [Schw 16]. Но в течении десятилетий большая часть физиков упорно сопротивлялись таким ”возмутительным” приложениям решения Шварцшильда. (Эта часть физиков включала в себя и самого Эйнштейна, который написал в 1939 году вызывающую сожаление статью, в которой доказывал, что чёрные дыры не могут существовать [Eins 39]). Даже замечательный и вполне определённый анализ (опубликованный также в 1939 году) гравитационного коллапса, проведённый Оппенгеймером и Снайдером [OpSn 39], оказывал удивительно малое влияние на научную общественность в течении многих лет. Оппенгеймер и Снайдер изучили коллапс сферически симметричной ”звезды” с однородной плотностью и нулевым давлением и заметили, что такой взрыв звезды внутрь, как это видит стационарный наблюдатель, который остаётся вне коллапсирующей звезды, будет медленно приближаться и, в конце концов, застынет, когда поверхность звезды приблизится к сфере Шварцшильда. Кроме того, они ясно показали, что никакого такого ”застывания” коллапса не видели бы наблюдатели, движущиеся вместе с коллапсирующей материей, такие наблюдатели должны были бы пересечь критическую поверхность за конечное собственное время, и с того времени они не могли бы послать сигнал, который мог бы достигнуть наблюдателя, находящегося вне коллапсирующей звезды. Это предельное отличие между описанием в двух различных системах отсчёта доказывается исключительно сложно для лёгкого восприятия. Эти два описания не были приведены в соответствие до 1958 года, когда Давид Финкельштейн [Fink 58] проанализировал решение Шварцшильда, используя координатную систему, что позволило наглядно представить себе одновременно мировые линии полевых частиц, которые падают внутрь критической поверхности, и мировые линии выходящих фотонов, которые застывают на критической поверхности. Этот анализ открыл необычную ”структуру причинности” пространства Шварцшильда: ничто, находящееся внутри ”горизонта”, не может избежать того, чтобы быть затянутым внутрь сферы всё меньшей и меньшей площади. Появившаяся картина указала (некоторым учёным), что как только звезда падает через критическую поверхность, её сжатие, которое приводит к образованию пространственно-временной сингулярности, становится неизбежным. То, что это на самом деле верно независимо от любых предположений, идеализирующих картину, таких как сферическая симметрия и нулевое давление, было доказано Роджером Пенроузом в 1964 году [Penr 65].

Таким образом, время чтения лекций Фейнмана по гравитации является неудачным. ”Золотая эпоха” исследований чёрных дыр только начиналась, в течение следующего десятилетия было достигнуто значительное понимание сути физики этого явления. Эти результаты, которые не могли быть предугаданы в 1962 - 63 году, полностью преобразовали изучение общей теории относительности и способствовали созданию новой дисциплины - релятивистской астрофизики.

В 1962 - 63 году взгляды Фейнмана на решение Шварцшильда находились под большим влиянием Джона Уилера. Уилер в течении многих лет считал, что заключения Оппенгеймера и Снайдера не могут вызывать доверия; он находил их физически неразумными. Даже в 1958 году он отстаивал то, что если при анализе гравитационного коллапса использовать более реалистичное уравнение состояние, то могут быть получены качественно отличные результаты [HWWh 58]. (Эта точка зрения оказалась менее надёжной, когда структура причинности геометрии чёрной дыры стала соответствующим образом понята). Постепенно, тем не менее, Уилер пришёл к тому, чтобы принять неизбежность гравитационного коллапса, приводящего к образованию чёрной дыры в соответствии с заключениями Оппенгеймера и Снайдера. (Этому сдвигу точки зрения Уилера способствовали результаты Мартина Крускала [Krus 60], который независимо от Финкельштейна, также прояснил структуру причинности чёрной дыры; фактически, столь значительная статья Крускала была в большой степени написана Уилером, хотя некоторые интуитивные догадки и вычисления принадлежали Крускалу). Но в течение тех лет, когда он был скептически настроенным, Уилер реагировал довольно специфическим способом, он редко упоминал результаты Оппенгеймера - Снайдера в своих публикациях. Это обнаруживается, когда в разделе 11.6 Фейнман делает замечание о том, что стоило бы поинтересоваться изучением коллапса пыли. Он кажется не знающим того, что Оппенгеймер и Снайдер детально изучили коллапс пыли 23 года тому назад! В разделе 15.1 он рассуждает, основываясь на (неверных!) размышлениях лекции 14, что звезда, образованная из ”реального вещества”, не может коллапсировать внутрь её критической поверхности.

Фейнман приводит несколько ссылок на программу ”геометродинамики”, которую Уилер развивал, начиная с середины 50-х годов, и всё ещё продолжал её развивать (может быть менее энергично) в 1962 году; см. [Whee 62]. Уилер и его соавторы надеялись проинтерпретировать элементарные частицы как геометрические объекты, возникающие из (квантовых версий) классических решений гравитационных полевых уравнений при отсутствии материи. Уилер в особенности был увлечён концепцией ”заряда без заряда”; он отмечал, что если силовые линии электрического поля захватываются нетривиальной топологией ”кротовой норы” в пространстве, то каждая горловина кротовой норы должна была бы появляться как точечный заряженный объект для наблюдателя, чьё разрешение оказывается недостаточным для того, чтобы ощутить эту малюсенькую горловину [MiWh 57]. Уилер подчёркивал, что решение Шварцшильда обладает пространственными сечениями, в которых две асимптотически плоских области связываются узкой горловиной, и таким образом, реализует модель геометрии кротовой норы, которую Уилер представлял себе.

Фейнман явным образом был влюблён в понятие кротовой норы, он описывает эти идеи кратко в разделе 11.5 и затем в разделах 15.1 и 15.3. Заметим, что Фейнман называет звезду, ограниченную внутри своего гравитационного радиуса, ”кротовой норой”; термин ”чёрная дыра” не был придуман (Уилером) до 1967 года. Для того, что мы называем теперь ”горизонтом” чёрной дыры, Фейнман использует более старый термин ”сингулярность Шварцшильда”. Это особенно неудачный оборот речи, поскольку при этом имеется риск внести путаницу с действительной сингулярностью, областью в центре чёрной дыры, где имеется бесконечная кривизна. Фейнман никогда подробно не обсуждает эту настоящую сингулярность.

К 1962 году структура причинности решения Шварцшильда была достаточно хорошо понята. Она достаточно хорошо пояснена Фаллером и Уилером в работе [FuWh 62], т.е. в работе, на которой, как упоминает Фейнман, основано изложение в разделе 15.1. (В этой работе, одной из очень немногих, цитируемых в лекциях Фейнмана, использовались координаты Крускала для того, чтобы построить полную, аналитически продолженную геометрию Шварцшильда, и представляется ”диаграмма Крускала”, которая явно демонстрирует свойства времениподобных и нулевых геодезических). Фейнман цитирует основной вывод: решение Шварцшильда не является на самом деле кротовой норой того рода, которым интересуется Уилер, поскольку горловина кротовой норы является на самом деле динамическим объектом и сожмётся до того, как любая частица сможет пересечь эту горловину. Тем не менее, в работе Фаллера и Уилера не упоминались никакие более широкие приложения этой структуры причинности для проблемы гравитационного коллапса, и Фейнман не демонстрирует понимание таких приложений.

Можно также увидеть из комментариев Фейнмана, сделанных в разделах 15.2 и 15.3, что он не понимал структуры причинности решения (”Райсснера - Нордстрема”), описывающего заряженную чёрную дыру, которая рассматривалась в работе Грейвса и Брилла 1960 года [GrBr 60]. Приведём замечание ”… не представляется немыслимым, что может оказаться, что отражённая частица вылетает наружу раньше, чем она влетает внутрь!”. Фактически, в аналитически продолженной геометрии геодезическая проходит в ”новую вселенную” за конечное собственное время скорее, чем выходит обратно из чёрной дыры (см., например, [НаЕ1 73]). Тем не менее, известно, что внутренняя часть этого решения является неустойчивой при действии общих возмущений [ChHa 82]; для ”реалистического” случая заряженной чёрной дыры, образуемой в процессе гравитационного коллапса, ситуация является качественно отличной и остаётся всё ещё не понятой до конца, хотя кажется в высшей степени вероятным, что ядро дыры является настолько сингулярным, что ничто не может перейти в ”новую вселенную”, по крайней мере в области общей теории относительности [BBIP 91].

Гравитационные волны

Очень давно в 1957 году на конференции в Чапел Хилле ещё было возможно проводить серьёзное обсуждение того, предсказывает ли теория Эйнштейна существование гравитационного излучения [DeWi 57]. Это недоумение возникло в значительной степени потому, что это довольно тонкая материя, как определить строго энергию, переносимую гравитационной волной, затруднение состоит в том, что гравитационная энергия не может быть выражена через интеграл локально измеряемой плотности.

На этой конференции в Чапел Хилле Фейнман направил этот вопрос в прагматическое русло, описывал, как антенна гравитационных волн могла бы быть в принципе сконструирована так, чтобы она могла бы поглощать энергию, ”переносимую” этой волной [DeWi 57, Feyn 57]. В лекции 16 он явным образом приводит к описанию варианта такого прибора, когда эти записки резко обрываются: ”Следовательно, мы покажем, что они [гравитационные волны] могут на самом деле нагревать стену, так что нет вопроса относительно содержания энергии в гравитационных волнах”. Вариант антенны Фейнмана был опубликован Бонди [Bond 57] вскоре после конференции в Чапел Хилле (заметим иронически, что когда-то Бонди высказывался скептически относительно реальности гравитационных волн), но Фейнман никогда ничего не публиковал на эту тему. Наилучшее оставшееся описание этой работы содержится в письме к Виктору Вайсскопфу, написанному в феврале 1961 года [Feyn 61]. Это письмо содержит кое-что из того же материала, что и был изложен в лекции 16, но затем Фейнман продвигается несколько дальше и выводит формулу для мощности, излучаемой в квадрупольном приближении (этот результат также цитировался на конференции в Чапел Хилле). Затем это письмо описывает фейнмановский детектор гравитационных волн: это просто две бусинки, свободно скользящие (но с малым трением) по твёрдому стержню. Когда волны проходят через стержень, атомные силы оставляют длину стержня фиксированной, но соответствующее расстояние между двумя бусинками осциллирует. Таким образом, две бусинки трут стержень, выделяя в результате тепло. (Фейнман включил это письмо в Вайсскопфу в материал, который он распространял среди студентов, слушающих его курс лекций).

Несмотря на то, что заключения Фейнмана могли казаться спорными некоторым участникам конференции в Чапел Хилле, эти выводы о гравитационных волнах едва ли были новыми. На самом деле, в классическом учебнике Ландау и Лифшица, который был написан на русском языке в 1939 году и появился в английском переводе в 1951 году [LaLi 51], имеется несколько разделов, посвящённых теории гравитационных волн. Их изложение было ясным и правильным, однако было проведено в характерной сжатой манере. В письме к Вайсскопфу Фейнман вспоминает конференцию 1957 года и комментирует её: ”Для меня было удивительным обнаружить, что целый день на конференции был посвящён этому вопросу и что ”эксперты” были смущены. Это обсуждение возникло из поисков тензоров, сохраняющих энергию и т.д., вместо того, чтобы спрашивать о том, ”могут ли эти волны производить работу?” ”.

На самом деле, несмотря на его глубокое почтение к Джону Уилеру, Фейнман испытывал в конце 50-х годов и начале 60-х нескрываемое презрение к сообществу специалистов по общей теории относительности. Это возможно наиболее резко выразилось в письме к его жене Гвенет, которое он написал с конференции в Варшаве в 1962 году [Feyn 88]:


Я ничего не получил на этой конференции. Я не узнал ничего нового. Поскольку в этой области нет экспериментов, эта область науки находится в неактивном состоянии, так что только очень немногие из лучших людей работают в ней. Результат состоит в том, что здесь имеется огромное количество дурмана и это сказывается неблагоприятным образом на моем артериальном давлении: такие бессмысленные вещи говорятся и серьёзным образом обсуждаются, что я спорю с участниками вне формальных сессий (скажем, на ланче) всякий раз, когда кто-либо задаёт мне вопрос или начинает мне рассказывать о своей ”работе”. Эта ”работа” всегда является: (1) полностью непонятной, (2) неясной и неопределённой, (3) кое-что правильно, что является ясным и самоочевидным, но что разрабатывается с помощью длинного и трудного анализа и представляется как важное открытие, или это (4) некоторая претензия, основанная на глупости автора, относительно некоторого очевидного и правильного факта, принятого и проверенного много лет назад; фактически, претензия, которая является неверной (это является хуже всего: никакие доводы не убедят глупца), (5) попытка сделать что-либо, вероятно, невозможна, но определённо не имеет никакой пользы, и эта попытка, как в конце концов обнаруживается, приводит к провалу или (б) очевидным образом является неверной. В эти дни проводится огромная ”деятельность в этой области”, но эта деятельность главным образом состоит в демонстрации того, что предыдущая ”деятельность” кого-то ещё приводит к ошибке или не приводит ни к чему полезному или приводит к чему-то, что подаёт надежды. Это выглядит как множество червяков, пытающихся вылезти из бутылки, переползающих один через другого. Это не потому, что задача трудна, это потому, что лучшие люди занимаются другими вещами. Напомни мне о том, чтобы не ездить больше ни на какие конференции по гравитации!


Столь экстремальная оценка не могла бы быть полностью оправдана даже в 1962 году, и не кажется вероятным, что это письмо отражает истинные ощущения Фейнмана со 100-процентной точностью. Брайс Де Витт, который принимал участие в конференциях в Чапел Хилле и Варшаве, предложил такой комментарий:


Я могу определённым образом симпатизировать реакции Фейнмана к конференции в Варшаве, потому что у меня были подобные ощущения. (У меня жив в памяти выход там его эмоций, которые выплеснулись в сторону Иваненко через самую изощрённую брань, какую я только слышал). Но те, кто опубликовал его частное письмо без описания полной картины, наносят ущерб исторической правде. Хотя он и думал, что некоторая часть дискуссии на конференции в Чапел Хилл не имела смысла (как впрочем думал и я), я считаю, что у него там было достаточно много полезно проведённого времени. Я помню, что он был довольно заинтересован, когда я показывал ему, что его интеграл по траекториям в искривлённом конфигурационном пространстве приводит к уравнению Шрёдингера со скалярным членом Риччи в нём. Специалисты, которые были на этой конференции (такие как Бонди, Хойл, Шиама, Мёллер, Розенфельд, Уилер), не являлись глупцами и достаточно умно вели беседу с Фейнманом. (Я сам выбирал участников конференции - это была закрытая конференция). Определённо, что опыт Фейнмана его участия на конференции в Чапел Хилле должен был оказать какое-то влияние на его намерение принять приглашение для участия в конференции в Варшаве (эта конференция была открытой). Даже на конференции в Варшаве он и я проводили обсуждения вне формальных сессий, и я пытаюсь не верить тому, что он на самом деле определил меня в одну из шести категорий, упоминаемых в его письме.


Однако, эмоциональные комментарии Фейнмана, могли ли бы они иметь или не иметь место в 1962 году, должны были бы вскоре прекратиться. Начиналась заря ”золотой эры” исследований чёрных дыр.

Философия

Замечательной особенностью этих лекций является то, что Фейнман часто обращается к философским вопросам. (Он обычно выказывал презрение к философам науки и к слову ”философский”, которое он любил насмешливо произносить как ”фило-ЗАВ-ский”, тем не менее, он почитается, по крайней мере, физиками за свои философские рассуждения). Например, в разделе 1.4 он рассуждает о том, действительно ли необходимо применять квантовую механику к макроскопическим объектам. (Аргумент, который он кратко описывает там для того, чтобы поддержать требование того, что квантование гравитации в действительности необходимо, был представлен на конференции в Чапел Хилле в 1957 году, где это вызвало оживлённую дискуссию). Другой пример - это его пристрастие к принципу Маха. Идея Маха, состоящая в том, что инерция возникает из взаимодействия тела с удалёнными телами, порождает неясное сходство с интерпретацией электродинамики, предложенной Фейнманом и Уилером, когда Фейнман был студентом [WhFe 45, WhFe 49], состоящей в том, что сила реакции излучения, действующая на ускоряющийся заряд, возникает от взаимодействия с удалёнными зарядами вместо того, чтобы возникать от взаимодействия с локальным электромагнитным полем. Так что не слишком удивительно, что в разделах 5.3 и 5.4 кажется, что Фейнман выражает симпатию ко взглядам Маха. Он нащупывает квантово-механическую формулировку принципа Маха в разделе 5.4 и вновь рассматривает принцип Маха в космологическом контексте в разделе 13.4. Нежелание Фейнмана в разделах 9.4 и 15.4 принять идею кривизны без источника вещества также отдаёт идеями Маха.

Философские размышления выходят на первый план в большом числе кратких отвлечений от основной темы. В разделе 8.3 Фейнман оценивает значение утверждений, что пространство является ”в действительности” искривлённым или плоским. В разделе 7.1 он объясняет, почему второй закон Ньютона не есть просто тавтология (а определение ”силы”). Он делает несколько попыток обсуждения строгости построения теории в разделе 10.1 (”факты составляют существо дела, а не доказательства”) и в разделе 13.3 (”нет такого способа показать математически, что физическое заключение является неверным или непоследовательным”). А в разделе 13.4 он подвергает сомнению то представление, что простота должна быть руководящим принципом в поиске истины о Природе: ”… простейшее решение, намного превосходящее все остальные решения, было бы такое решение, где нет ничего, так что не было бы совсем ничего во вселенной. Природа много более изобретательна, чем такая картина, так что я отвергаю то, чтобы носиться с мыслью о том, что Природа всегда должна быть просто устроена.”

Это также обнаруживается, когда Фейнман упрямо занимается обсуждением в разделах 2.3 и 2.4 бесперспективной идеи, состоящей в том, что гравитация вызвана обменом нейтрино. Это предметный урок того, как Фейнман понимает то, как учёный должен реагировать на появление нового экспериментального феномена: он должен всегда внимательно искать объяснение на языке известных принципов перед тем, как начать увлекаться рассуждениями о новых законах. Несмотря на это, в то же самое время Фейнман подчёркивает снова и снова важность сохранения скептицизма относительно принимаемых идей и сохранения мысли открытой для идей, которые ”падают хлопьями”. Квантовая механика может потерпеть неудачу (разделы 1.4 и 2.1), вселенная может быть неоднородной на больших масштабах (разделы 12.2 и 13.2), может оказаться, что верна модель стационарной вселенной (раздел 13.3), может быть оправдана интуиция Уилера относительно кротовых нор (раздел 15.3) и т.д.

Однопетлевая квантовая гравитация

Исследования Фейнмана в области квантовой гравитации привели его в конце концов к конструктивному открытию (которое, тем не менее, не описано в этой книге, за исключением краткого упоминания в разделе 16.2). Это открытие состоит в том, что поле ”духа” должно вводиться в ковариантную квантованную теорию для того, чтобы сохранить унитарность в однопетлевом порядке теории возмущений. Время этого открытия может быть установлено довольно точно. Фейнман докладывал этот результат в своём сообщении на конференции в Варшаве в июле 1962 года [Feyn 63b] и привёл комментарий относительно того, что проблема унитарности в однопетлевом порядке была ”полностью приведена в порядок только за неделю до того, как я приехал сюда”. Таким образом, все эти результаты получены им до того, как он читал лекции по гравитации.

Вычисляя однопетлевые амплитуды с использованием наивных ковариантных правил, Фейнман обнаружил, что вклады состояний нефизической поляризации гравитона не удаётся полностью сократить, что приводит к нарушению унитарности. Некоторое время он был не в состоянии решить эту загадку. Затем Мюррей Гелл-Манн посоветовал Фейнману, чтобы тот попытался проанализировать простейший случай безмассового поля теории Янга - Миллса (Гелл-Манн напоминает, что он высказал это предложение в 1960 году [Gell 89].) Фейнман обнаружил, что он мог бы решить эту проблему в теории Янга - Миллса в однопетлевом приближении, и затем, что можно использовать этот метод для гравитации. В своём сообщение в Варшаве Фейнман докладывает, что он решил проблему унитарности в однопетлевом приближении, но теперь он вновь застрял и не знает как обобщить этот метод на случай двух и более петлей. Тем не менее, он возражает: ”Джентльмены, у меня была всего одна неделя”. Однако он никогда не разрешил эту проблему.

Был интересный обмен мнениями во время, когда задавали вопросы по докладу Фейнмана в Варшаве [Feyn 63b],1 и Брайс Де Витт давил на Фейнмана для выяснения больших деталей относительно того, каким образом унитарность достигается в однопетлевом порядке, а Фейнман сопротивлялся. Но Де Витт настаивал, и наконец Фейнман смягчился и предложил длинное объяснение, предварив его комментарием ”Сейчас я покажу вам, что тоже могу написать уравнения, которые никто не сможет понять.” Это было забавно, поскольку в конце концов именно Де Витт [DeWi 67а, DeWi 67b] (а также независимо Фаддеев и Попов [FaPo 67]) решили проблему обобщения ковариантного квантования теории Янга - Миллса и гравитации на произвольный петлевой порядок. Стоит заметить, что собственная техника Фейнмана интегрирования по траекториям оказала решающее значение для получения этой общей формулировки и что наиболее полные результаты Де Витта и Фаддеева - Попова явным образом были вызваны построением Фейнмана для однопетлевого приближения.

1 Русский перевод этого доклада опубликован в журнале [Грав 96*]. (Прим. перев.)

Последние лекции Фейнмана по теории гравитации (которые не воспроизведены в этой книге) имеют отношение к петлевым поправкам в квантовой гравитации и теории Янга - Миллса. Он описывал результаты в однопетлевом приближении, которые докладывались в Варшаве, и его попытки обобщить эти результаты на более высокие порядки. По общему мнению эти лекции были переусложнены и трудны для того, чтобы следовать ходу их рассуждений, и иногда в лекциях очевидным образом ощущалось крушение планов. Мы предполагаем, что Фейнман испытывал замешательство от того, что проваливались его попытки найти удовлетворительную формулировку обобщения теории возмущений, поэтому он никогда не разрешал распространение записей этих лекций.

Фейнман написал детальный отчёт о своих результатах только много позднее [Feyn 72] в двух статьях для тома в честь 60-летнего юбилея Джона Уилера. Эти статьи никогда не были бы написаны, если бы не было постоянного приставания одного из нас (К. Торна). По взаимному соглашению Торн звонил Фейнману домой раз в неделю в заранее условленное время для того, чтобы напомнить ему, что необходимо поработать над статьёй для праздничного тома в честь Джона Уилера. Это продолжалось до тех пор, пока статьи не были полностью завершены. Было ясно, что Фейнман вернулся к квантовой гравитации только с некоторыми страданиями и сожалением.

Одна из целей Фейнмана состояла в том, чтобы навести порядок в вопросе о перенормируемости этой теории. На конференции в Варшаве он говорил, что он не уверен в том, что эта теория может быть перенормируема, но в разделе 16.2 он приводит более сильное утверждение: ”Я полагаю, что эта теория не перенормируема.” Даже это утверждение Фейнмана звучит сейчас для нас удивительно осторожно. В любом случае Фейнман всегда относился неохотно к тому, чтобы использовать перенормируемость в качестве критерия для оценки теории, и он открыто заявляет в разделе 16.2, что он не знает, является ли неперенормируемость ”действительно существенным возражением” .

Заключение

Любая книга по гравитации, подготовленная более 30 лет тому назад, неизбежно сегодня оказывается устаревшей, по крайней мере, в некоторых аспектах. Ясно, что эта книга не является исключением. Более того, мы считаем, что эти лекции не оправдали бы собственных ожиданий Фейнмана даже в то время, в которое они читались. У него была надежда, что чтение этого курса поможет привести его работу по квантовой гравитации к связному заключению, но этого не произошло. В конце академического года (1962 - 63) стало очевидным для студентов, что Фейнман чувствует себя обескураженным и расстроенным. Таким образом, в соответствии с собственными пожеланиями Фейнмана лекции (от 17 до 27), которые были нацелены на обсуждение вопросов квантовой гравитации, не включены в эту книгу.

Однако, мы думаем, что в этой книге, содержащей лекции 1 - 16, много того, что будет оценено по достоинству физиками, студентами, историками и почитателями Фейнмана. Более того, эти лекции очень веселы. Многие отрывки предлагают мимолётный взгляд великого ума, обладающего большой глубиной обсуждения проблемы, и бросающие вызов вопросы, возникающие из рассмотрения проблемы в истинном свете. Фейнман размышлял долго и напряжённо в течении нескольких лет, однако по этому вопросу он публиковал крайне мало. Это умные лекции и обладают характерной (для творчества Фейнмана) ясностью, и эти лекции являются содержательным добавлением к его уже опубликованному наследию, появление которых можно было бы приветствовать.

Мы благодарны Джиму Бардину, Стенли Дезеру, Брайсу Де Витту, Уилли Фаулеру, Стиву Фраутчи, Джуди Гудстейн, Джиму Хартлю, Ико Ибену, Бобу Крайчману, Чарльзу Мизнеру, Фернандо Мориниго, Джиму Пиблсу, Аллану Сеадеджу и Биллу Вагнеру за ценную помощь, которая была использована при подготовке этого предисловия.


КАЛТЕХ,

май 1995 года


Джон Прескилл и Кип С. Торн


Квантовая гравитация

Фейнман читал свои лекции по гравитации в КАЛТЕХ’e в 1962 - 63 годах, в конце того периода, на который он часто ссылался как на его ”фазу гравитации”. Основной мотивировкой для проведения исследований по гравитации в то время был его интерес к квантовой гравитации. Он говорил мне в 1980 году, что он думал в 50-х годах, что следствия квантовой гравитации могли быть тем ”куском торта”, который стоил того, чтобы над ним поработать. В конце концов, гравитация на самом деле слаба. После грандиозного успеха пертурбативной Квантовой Электродинамики, он рассчитывал, что нет особой нужды разрабатывать что-либо, что находится за пределами первого порядка теории возмущений. Конечно, он ожидал, что могли бы быть трудности при определении согласованной квантовой теории (например, величина гравитационной константы является препятствием для перенормировки). Тем не менее, его идея заключалась не в том, чтобы попытаться построить полную и согласованную теорию квантования и затем получить результаты, а вместо этого двигаться в другом направлении. Суть состоит в том, чтобы вычислить пертурбативные амплитуды для определённых процессов, таких как комптоновское рассеяние гравитоном, а затем биться над любыми интересными трудностями, которые могут возникать одна за другой. По определению ”интересные” трудности могут быть новыми и необычными проблемами, связанными с гравитацией, которые не возникали ранее в квантовой теории поля. Таким образом, первоначально Фейнман игнорировал ультрафиолетовые расходимости и вопросы перенормировки и только позже напряжённо размышлял над этими проблемами. В конце концов, отсутствие формулировки перенормируемости привело к отказу от пертурбативной квантовой теории. Но характерно, что ”план атаки” Фейнмана привёл его к важному открытию в теории поля, а именно к необходимости введения ковариантных духов для того, чтобы сохранить унитарность в однопетлевом приближении (см. обсуждение этого вопроса во введении, написанном Прескиллом и Торном).

Эти лекции появились более 30 лет назад. Мы можем посмотреть на некоторые аспекты анализа Фейнмана вопросов квантовой гравитации и взглянуть в тех направлениях, в которых были проведены исследования.

Связь геометрии и квантовой теории поля

Стандартный и исторический подход к классической гравитации состоит в том, чтобы начать с рассмотрения принципа эквивалентности и развивать в дальнейшем геометрическую точку зрения. Фейнман гордился тем, что он редко следовал стандартному подходу. В углу доски в своём служебном кабинете он написал ”Что я не могу создать, я не понимаю.” Это выражение фактически оставалось нетронутым в углу этой доски в течении более 7 лет. Я впервые увидел его в конце 1980 года, и оно всё ещё оставалось там в феврале 1988 года (см. [Feyn 89]). Таким образом, не удивительно, что Фейнман воссоздаёт общую теорию относительности, исходя не с геометрической точки зрения. Практическая сторона такого подхода состоит в том, что не стоит с самого начала изучать некоторые выкрутасы (”fancy-schmanzy”, как он любил называть это) дифференциальной геометрии для того, чтобы выучить физику гравитации. (На самом деле, существует только необходимость изучить некоторые аспекты квантовой теории поля). Тем не менее, когда конечной целью стала проблема квантования гравитации, Фейнман почувствовал, что геометрическая интерпретация как раз и находится у него на пути. С точки зрения теории поля можно было бы действительно избежать определения таких вещей, как физическое значение квантовой геометрии, флуктуирующая топология, пространственно-временная пена и т.д., а вместо этого посмотреть геометрическое понимание после квантования. (См., например, вопрос Сакса и ответ Фейнмана в работе [Feyn 63b]). Фейнман определённо чувствовал, что геометрическая интерпретация является ”удивительной” (раздел 8.4), но тот факт, что безмассовое поле спина 2 может интерпретироваться как метрика, было просто ”совпадением”, которое "может быть понято как представление некоторого вида калибровочной инвариантности”.

Сейчас у нас есть геометрическая интерпретация классических калибровочных теорий, таких к ах электродинамика и теория Янга-Миллса (см., например, [Yang 77]). Векторные потенциалы


𝐴

α

μ


являются коэффициентами связности на главном расслоённом пространстве, где структурная группа есть калибровочная группа (𝑈(1) для электромагнетизма, 𝑆𝑈(2) для полей Янга - Миллса и 𝑆𝑈(3) для классической хромодинамики). Напряжённости поля 𝐹μν (т.е. электрические и магнитные поля в электродинамике) являются компонентами кривизны, ассоциированными со связностями (потенциалами). Заряженное вещество, которое поле связывает, ассоциируется с векторным расслоением (см., например, [DrMa 77]). Отсюда следует, что интуитивная догадка Фейнмана о связи между геометрией и калибровочной инвариантностью оказывается правильной. С точки зрения фейнмановского интеграла по траекториям, квантовая электродинамика и квантовая хромодинамика равнозначно интегралам по пространству связностей на главном расслоённом пространстве. В то время, как может быть показано, что геометрическая интерпретация калибровочных полей не помогает решить проблемы квантовой электродинамики (КЭД) или квантовой хромодинамики (КХД) (т.е. адекватным образом вычислить или оценить эти интегралы), это несомненно приводит ко многим полезным интуитивным догадкам о топологических аспектах этих теорий (например, неоднозначность Грибова, инстантоны, вакуумный угол и топологически неэквивалентные вакуумы) и к построению новых калибровочных теорий типа Янга -Миллса с топологическими массами.

Спин гравитона и антигравитация

Выгодность теоретико-полевого развития теории гравитации состоит в том, что то, что (находящийся в оболочке) гравитон является безмассовым и имеет спин 2, получается непосредственно без того, чтобы начинать с полностью согласованной, полностью ковариантной теории, т.е. без привлечения Принципа Общей Ковариантности. Это выглядит как построение теории гравитации снизу вверх, вместо того, чтобы строить сверху вниз, используя полный геометрический аппарат. Развитие теории начинается в разделе 2.3 лекций и продолжается в разделах 3.1 - 3.4. Краткое изложение этого аргумента состоит в следующем.

В квантовой теории поля точечных частиц сила между двумя частицами передаётся путём обмена виртуальными (или безоболочечными) частицами. С каждой силой ассоциируется заряд. Заряженные частицы чувствуют силу путём связи или взаимодействия с частицами, которые переносят эту силу. Наиболее привычным примером является электродинамика. Частицы, которые чувствуют силу, переносят электрический заряд. Электромагнитная сила передаётся путём обмена фотонами со спином 1. Сами фотоны незаряжены и, следовательно, напрямую не взаимодействуют друг с другом. Получившиеся в результате полевые уравнения являются линейными. В КХД, теории сильного взаимодействия, построенной из калибровочной теории Янга - Миллса (сильное взаимодействие ответственно за сдерживание вместе нуклонов и, таким образом, за существование атомных ядер), этот заряд называется цветом. Фундаментальные частицы, которые чувствуют сильное взаимодействие, являются цветными кварками, а частицы, которые переносят силу, называются глюонами. Сами глюоны являются частицами с цветовым зарядом, отсюда следует, что в отличие от фотона, они могут напрямую взаимодействовать друг с другом, и результирующие полевые уравнения являются нелинейными. Заряд, связанный с гравитацией, есть масса, которая, как мы полагаем, исходя из специальной теории относительности, должна быть эквивалентна энергии. Так как мы знаем почти всё, что имеет энергию, то гравитация должна взаимодействовать со всем. Частица, которая переносит гравитационную силу, называется гравитоном. Так как гравитон имеет энергию, гравитоны должны непосредственно взаимодействовать друг с другом.

Если теория поля используется для описания гравитации, тогда эта теория должна воспроизводить Закон Всемирного Тяготения Ньютона в соответствующем статическом нерелятивистском пределе, т.е. мы должны вновь получить


𝐹

=-

𝐺𝑚₁𝑚₁

𝑟²


(K.1)


путём обмена гравитоном между частицами 1 и 2, разделёнными расстоянием 𝑟 в соответствующем пределе. Как хорошо известно, гравитационная сила - дальнодействующая (сила пропорциональна 1/𝑟², а потенциал пропорционален 1/𝑟), отсюда следует, что находящийся в оболочке или свободный изолированный гравитон должен быть безмассовым, точно также, как и для случая фотона. Однако, в отличие от случая электромагнетизма, одинаковые заряды в гравитации притягиваются.

Для того, что воспроизвести статическую силу, а не просто рассеяние, излучение или поглощение одиночного гравитона другой частицей должно оставлять обе частицы в одном и том же внутреннем состоянии. Это исключает возможность того, что гравитон переносит полуцелый спин (например, связанный с тем фактом, что он имеет вращение на угол 720° для того, чтобы возвратить себе назад волновую функцию спина 1/2). Следовательно, гравитон должен иметь целый спин. Далее, для того, чтобы решить, какие значения целого спина оказываются возможными, мы разберём два случая, когда частица 2 является идентичной частице 1 и когда частица 2 является античастицей частицы 1, так что будучи заряженными, эти частицы переносят одинаковый и противоположные заряды соответственно. Когда вычисляется потенциал для обоих случаев и взяты соответствующие пределы, мы находим, что когда частица, с помощью которой переносится взаимодействие, переносит целый нечётный спин, похожие заряды отталкиваются и противоположные заряды притягиваются, точно также, как в случае электродинамики. С другой стороны, когда частица, с помощью которой переносится взаимодействие, переносит чётный целый спин, то потенциал определяет универсальным образом притяжение (похожие заряды и противоположные заряды притягиваются). Отсюда следует, что спин гравитона должен быть равным 0, 2, 4,…

Для того, чтобы исключить возможность спина 0, мы замечаем, что эксперимент Этвеша и его недавние усовершенствования эмпирически показывают, что гравитация действительно взаимодействует с содержащейся в объектах энергией, отсюда следует, что на такие объекты, как фотоны, действует гравитация, например, они должны ”падать” в гравитационном поле. Если мы предполагаем, что частица, которая переносит взаимодействие, имеет спин 0, тогда мы теряем взаимодействие гравитации с фотоном со спином 1. Так как мы знаем, что фотон отклоняется массивным объектом, например Солнцем, то гравитон не может иметь спин 0.

На качественном языке теории поля функции Грина для распространения частицы, с помощью которой передаётся взаимодействие от частицы 1 к частицы 2 в импульсном пространстве, есть


Δ

~

1

𝑘²

,


скалярное поле,


Δ

~

ηνμ

𝑘²

,


векторное поле,


Δ

~

ηνμησρ

𝑘²

,


тензорное поле,


(K.2)


где 𝑘² есть квадрат 4-импульса, переносимого виртуальной частицей, осуществляющей перенос взаимодействия, и ηνμ есть метрика плоского пространства Минковского. Скалярное поле представляет спин 0, векторное поле спин 1 и соответствующим образом спроектированное тензорное поле представляет спин 2. Для вычисления амплитуды для обмена мы помещаем пропагаторы Δ между тензорами 𝑇νμ(1) и 𝑇αβ(2) для двух частиц. При обмене частицей со спином 0 пропагатор Δ₀ не содержит никаких множителей ηνμ в числителе для того, чтобы свернуть индексы 𝑇νμ(1) с индексами 𝑇αβ(2), отсюда следует, что мы должны сами свернуть индексы отдельно у этих тензоров энергии-импульса. Таким образом, при обмене частицей со спином 0 амплитуда пропорциональна величине


𝑇

μ

μ

(1)

1

𝑘²

𝑇

α

α

(2)

.


(K.3)


Другими словами, гравитон со спином 0 взаимодействует только со следом тензора энергии-импульса. Тем не менее, тензор энергии-импульса для электромагнитного поля в пространстве Минковского является бесследовым, отсюда следует, что скалярные гравитационные поля не связывают гравитацию со светом, так что гравитон не может быть частицей спина 0.

Так как гравитон не является бесспиновой частицей, то следующей возможностью является спин, равный 2. Классическим путём не найдено ничего такого, что позволило бы нам исключить случай спина, равный 2, так что привлекая правило ”если это работает, не ремонтируй это”, возможностями существования более высоких значений спина пренебрегаем. Тем не менее, несмотря на это мы ещё не совсем закончили (наше рассуждение). Общее тензорное поле содержит части, которые мы всё ещё хотим исключить. Например, антисимметричная часть ведёт себя как взаимодействие полей со спином 1 (напомним, что напряжённости электромагнитного поля 𝐹μν являются антисимметричными) и, следовательно, должна быть отброшена. Таким образом, остаётся симметричное тензорное поле.

В качестве резюме скажем, что гравитон безмассовый, поскольку гравитация является дальнодействующей силой, и он обладает спином 2 для того, чтобы он мог взаимодействовать с содержащейся в веществе энергией путём универсального взаимодействия.

В разделе 1.2 Фейнман кратко обсуждает поведение гравитации и антивещества, популярно называемого ”антигравитацией”. Был только один эксперимент, представляющий собой попытку непосредственно измерить поведение гравитации и антивещества для случая, когда частица и античастица не являются идентичными. Этот эксперимент, проводился В. Файербенком и Ф. Виттерборном [WiFa 67, FWML 74], и очевидно был инициирован комментарием Де Витта на конференции в Чапел Хилле в 1957 году (см. Предисловие, [DeWi 57]), где Файербенк принимал участие (см. также [NiGo 91], где также обсуждается этот вопрос), и это превосходный пример тех трудностей, с которыми сталкиваются в экспериментальной гравитационной физике. В разделе 1.2 Фейнман упоминает два из аргументов против антигравитации, основанные на обсуждении распада каона [Good 61] и на поляризации вакуума в КЭД [Schi 58, Schi 59]. Если бы пертурбативная программа проквантовать гравитацию (программа, которая представлялась Фейнманом в этих лекциях) принесла бы согласованную теорию, тогда этот вопрос был бы приведён в порядок, и здесь антигравитации бы не было. Так как пертурбативная теория квантовой гравитации исходит из пространства Минковского, то мы могли бы ожидать, что CPT - теорема оказывается справедливой во всех порядках и, следовательно, частица и античастица должны были бы иметь одну и ту же массу. К тому же, свойства гравитона, обсуждаемые выше, должны были бы не меняться, что привело бы к универсальности силы притяжения, включал антивещество.

К сожалению, пертурбативная теория не является согласованной теорией, и огромное количество творческой энергии было затрачено в целях поиска согласованной квантовой гравитации. Хотя мы ожидаем, что при низкой энергии, больших расстояниях, предел слабого поля квантовой гравитации был бы общей теорией относительности [Wein 64а, Wein 64b], Природа может потребовать для непротиворечивости гравитационных различий между веществом и антивеществом на очень маленьких расстояниях. Такие эффекты легко могут быть меньше, чем доступные в настоящее время экспериментальные пределы, и оставляют стороне аргументы против антигравитации, но это не значит, что мы когда-нибудь увидим что-либо ”падающим вверх”.

Калибровочная инвариантность и принцип эквивалентности

Другой выгодой использования теоретико-полевого подхода к теории гравитации является то, что мы приходим к Принципу Эквивалентности, фундаментальному принципу, лежащему в основании общей теории относительности, как к следствию калибровочной инвариантности. Так как мы строим теорию гравитации снизу вверх эта калибровочная инвариантность входит в теорию казалось бы безобидным образом.

Свободный гравитон является безмассовым и движется со скоростью света, так что мы никогда не сможем найти систему отсчёта, в которой бы он находился в покое. Следовательно, существует инвариантное понятие проектирования его спина на направление движения и направление, противоположное движению. Безмассовый гравитон должен появиться с двумя поляризациями или с двумя спиральностями и не более. В общем случае, поле симметричного тензора будет иметь более двух динамических степеней свободы. Следовательно, поле ранга 2 только с двумя степенями свободы не есть тензорное поле, и у нас появляется опасность потери Лоренц-инвариантности. Эта ситуация аналогична той, которая имеет место в электродинамике. Выход из этой дилеммы состоит в том, чтобы включить в теорию калибровочную инвариантность. Отсюда следует, что когда мы строим действие в пространстве Минковского для того, чтобы описать безмассовые гравитоны со спином 2, то мы будем должны ввести калибровочную симметрию для того, чтобы уменьшить число динамических степеней свободы до 2. Если мы не делаем этого, то квантовая теория не будет Лоренц-инвариантной. Действие, которое содержит необходимую калибровочную симметрию и в котором имеются до второй производной поля, есть действие Фирца - Паули [FiPa 39]. Этого оказывается достаточным для того, чтобы начать и продолжить построение общей теории относительности (см. краткое резюме во Введении). В конце концов, мы получаем Принцип Эквивалентности как результат калибровочной инвариантности. Калибровочная симметрия возникает с самого начала для того, чтобы квантовая теория свободного безмассового гравитона со спином 2 была лоренцевым инвариантом.

Сражение с бесконечностями

Не являлось секретом то, что объединение гравитации и квантовой механики должно быть сопряжено с огромными усилиями. Когда поле квантуется, каждая мода поля обладает энергией нулевой точки. Так как поле формируется бесконечным числом мод, вакуумная энергия квантового поля является бесконечной. От этой бесконечности легко отделаться нормальным упорядочиванием полевых операторов. Оправдание этому в том, что мы просто переопределяем нулевую точку масштаба энергии, который прежде всего является произвольным. Тем не менее, так как гравитация взаимодействует со всей энергией, то когда мы добавляем гравитацию, то мы не можем больше уйти от этого. Вакуумные флуктуации квантованных полей действительно порождают физические эффекты, так что даже если мы обрезаем некоторое количество мод, плотность энергии вакуума от энергии нулевых точек оставшихся мод может быть очень большой. Такая плотность вакуумной энергии будет появляться в теории гравитации как космологическая постоянная. Так как космологическая постоянная очень мала, то это составляет большую проблему [Wein 89].

Далее, константа гравитационного взаимодействия в единицах, где ℏ=𝑐=1, имеет размерность (энергия)-2. Теории, где константа взаимодействия имеет положительное значение, часто оказываются конечными, в то время как те теории, в которых константа является неопределённой величины, являются кандидатами на то, чтобы быть перенормируемыми. Теории с отрицательными значениями этих констант обычно имеют расходимости по всем местам, где требуется бесконечное число параметров для того, чтобы устранить все расходимости, и, следовательно, эти теории являются неперенормируемыми. Квантовая общая теория относительности попадает в эту последнюю категорию.

В процессе перенормировки, контрчлены порождаются для того, что сократить высокоэнергетические или ультрарелятивистские расходимости, которые встречаются в отдельных членах теории возмущений. Когда процесс перенормировки является успешным, контрчлены приводят к построению конечного эффективного действия, что может мыслиться как классическая полевая теория, которая содержит все квантовые эффекты (см., например, [Hatf 92]). Возможные контрчлены согласуются с симметриями исходного ”обнажённого” действия. Другими словами, внутренние симметрии сильно ограничивают типы контрчленов, которые могут порождаться и, следовательно, число соответствующих расходимостей. Таким образом, теории с большей симметрией, как правило, обладают лучшей сходимостью.

Имеется чрезвычайно много возможных контрчленов, которые согласуются с известными симметриями для пертурбативной квантовой гравитации, например, члены пропорциональные 𝑅², 𝑅μν𝑅μν, 𝑅³ и т.д. Лишь только была обнаружена необходимость введения ковариантных духов и стали известны ковариантные правила для вычисления членов теории возмущений до произвольного порядка ([DeWi 67а, DeWi 67b], [FaPo 67]), стало очевидным, что в полной мере будет иметь место закон Мёрфи для квантовой теории поля (если нет симметрии для того, чтобы ”убить” контрчлен, тогда будет иметь место расходимость), и теория наиболее вероятно будет неперенормируема. Проблеск надежды на таком пути появился, когда было показано, что чистая квантовая гравитация в однопетлевом приближении (первая квантовая поправка) является конечной [tHVe 74], [Kore 74]. Контрчлены для плотности лагранжиана есть


(1)

=

𝑔


1

120

𝑅²

+

7

20

𝑅

μν

𝑅

μν

,


(K.4)


На классическом уровне эти контрчлены обращаются в нуль для чистой гравитации, так как тогда мы имеем 𝑅=0 и 𝑅μν=0. Тем не менее, нет основания для того, чтобы чистая однопетлевая квантовая гравитация являлась бы конечной. Основание для того, чтобы теория являлась бы конечной, состоит в том, что ℒ(1) может исчезать в однопетлевом приближении при переопределении метрики, отсюда следует, что её эффекты не являются физически наблюдаемыми. Напомним, что для чистой гравитации вариационный принцип


δℒ(0)

δ𝑔μν

=

𝑅

μν

-

1

2

𝑅𝑔

μν

,


(К.5)


который, используя Принцип Наименьшего Действия, порождает классические полевые уравнения для чистой гравитации. Если мы переопределим метрику следующим образом:


𝑔

'

μν

=

𝑔

μν

+

εδ𝑔

μν

,

δ𝑔

μν

7

20

𝑅

μν

-

11

60

𝑅𝑔

μν

,


(К.6)


тогда


(0)

(𝑔)

+

(1)

(𝑔)

=

(0)

(𝑔')

+

𝒪(ε²)

,


(К.7)


где 𝒪(ε²) - двупетлевые процессы, отсюда следует, что однопетлевая теория является конечной. Когда материальные поля взаимодействуют с гравитацией, однопетлевая теория не является более конечной, даже на классическом уровне.

Надежда состояла в том, что имелся некоторый вид скрытой симметрии, что делало результат в однопетлевом приближении конечным, и что эта симметрия сможет представить чисто гравитационный сектор конечной теории. Тем не менее, компьютерное вычисление двупетлевых поправок дало расходящийся результат [GoSa 86], разрушающий эту надежду. Недавние обзоры по ультрафиолетовым расходимостям можно найти в работах [Wein 79] и [Alva 89].

Единственный способ получить улучшенное поведение теории в ультрафиолетовой области состоит в том, чтобы иметь больше симметрии, встроенной в теорию. Таким образом, обобщения или модификации общей теории относительности для того, чтобы улучшить квантовое поведение теории, основываются главным образом на дополнительных симметриях. Один из популярных подходов называется ”супергравитацией” (см., например, [vanN 81]). Этот подход основан на симметрии между бозонными и фермионными полями и называется ”суперсимметрией”. Когда суперсимметричная теория калибруется таким образом, что эта суперсимметрия становится локальной (различные преобразования суперсимметрии разрешаются в каждой точке пространства-времени), калибровочная инвариантность с необходимостью включает в себя Принцип Общей Ковариантности и, следовательно, гравитацию. По существу, каждое бозонное поле имеет суперсимметричного фермионного партнёра и обратно. Ультрафиолетовое поведение теории улучшается, поскольку часто обычный расходящийся бозонный (фермионный) вклад от петель сокращается фермионным (бозонным) вкладом суперпартнера. Другими словами, суперсимметрия строго ограничивает типы контрчленов, которые могут быть порождены. К сожалению, когда размерность пространства-времени равна 4, имеются ещё потенциальные контрчлены (начиная с семи петель в наилучшем случае). В то же самое время никто не знает наверняка какого-либо рода дополнительную или скрытую симметрию или какое-либо волшебство, возникающее для того, чтобы сделать теорию конечной.

В настоящее время наиболее многообещающим кандидатом теории квантовой гравитации является струнная теория. Струнная теория есть квантовая теория, в которой составной частью являются одномерные протяжённые объекты (как противопоставление точечным частицам в обычной квантовой теории поля), см., например, [GSW 87], [Hatf 92]). Если струнная теория используется для того, чтобы унифицировать все фундаментальный силы (т.е. это ”теория всего”), тогда основная идея состоит в том, что вещество делается из очень маленьких струн, чей размер порядка длины Планка. На обычных энергетических масштабах такие струны будут неразрешимы и неотличимы от точек. Унификация достигается в том, что все частицы, которые мы находим, являются только возбуждениями одной и той же струны. Одна мода осцилляций струны является безмассовой со спином, равным 2, и может идентифицироваться как гравитон, отсюда следует, что струнная теория с необходимостью содержит квантовую гравитацию. Такое возбуждение в струнной теории проистекает из открытия того, что существуют пертурбативные решения, которые математически самосогласованы или свободны от аномалий, и оказываются конечными порядок за порядком в рядах теории возмущений.

Интуитивно улучшенное ультрафиолетовое поведение струнной теории возникает потому, что струнная теория включает в себя гигантскую симметрию (модулярную инвариантность). Теория струн модифицирует гравитацию точечной частицы на малом расстоянии путём обмена состояниями массивной струны, что подобно тому, как теория электрослабого взаимодействия улучшает ультрарелятивистское поведение старой 4-фермионной теории слабого взаимодействия путём замены 4 - фермионной вершины с заменой массивных калибровочных бозонов 𝑊± и 𝑍⁰. Константа связи в старой теории Ферми обладает отрицательной величиной массы, и эта теория неперенормируема. Калибровочная теория электрослабого взаимодействия заменяет эту связь безразмерными константами связи, связанными с обменом бозоном, и теория становится перенормируемой. Струнная теория также вводит новую константу связи, натяжение струны 𝑇, которое в обычных единицах эквивалентно обратному квадрату длины 𝐿=√𝑐ℏ/π𝑇. Напомним, что единственный масштаб длины, который может быть построен с помощью гравитационной постоянной 𝐺, ℏ и скоростью света 𝑐, это планковский масштаб 𝐿𝑃=√𝐺ℏ/𝑐³. Естественный выбор единиц для струны делает скорость света и натяжение струны безразмерными, 𝑐=1 и 𝑇=1/π. В этих единицах (исключая ℏ из приведённых выше выражений для 𝐿 и 𝐿(𝑃), гравитационная константа будет безразмерной, 𝐺=(𝐿(𝑃)/𝐿)².

Одним любопытным свойством теории струн, которое сильно отличает её от теории точечных частиц, состоит в том, что размерность пространства-времени не является внутреннем свойством самой теории. На самом деле, размерность пространства-времени есть свойство частного решения. Свободные от аномалий решения при 𝑁=1 мировом листе суперсимметрии могут быть найдены при размерности пространства-времени 𝐷 меньшей или равной, чем так называемая критическая размерность 𝐷𝑐, которая равна быть может 10.

К сожалению, в то время как отдельные члены в рядах теории возмущений являются конечными, сумма ряда расходится [GrPe 88]. И в то время, как теория струн является вероятно единственной в своём роде, решения этой теории определённо не являются такими. Не существует пертурбативного механизма для того, чтобы выбрать частное решение или выбрать правильный вакуум. В этом смысле, пертурбативная формулировка теории струн теряет свою предсказательную силу. Подобно этому, мир не является суперсимметричным при обычных значениях энергии. Нет такого пертурбативного механизма, чтобы выбрать решения, которые бы допускали несуперсимметричные низкоэнергетичные спектры.

Непертурбативная гравитация

В настоящее время оказывается, что нет согласованной и конечной пертурбативной формулировки квантовой гравитации. При определении пертурбативного разложения в общем случае мы должны сделать выбор, какая фоновая метрика на пространственно-временном многообразии будет выбираться для того, чтобы, используя эту метрику, начать развивать теорию возмущений. При непертурбативной формулировке квантовой гравитации все аспекты пространства-времени должны были бы определяться из решений этой теории. Например, предполагается, что в теории струн движение струн через пространство-время определяет то, какова есть метрика пространства-времени. Отсюда следует, что можно было бы предпочесть, чтобы метрика пространства-времени не появлялась бы при формулировке теории. На этом основании и для того, чтобы обойти проблемы, упомянутые выше, в настоящее время проводятся поиски непертурбативной формулировки теории струн.

При отсутствии надежд, связанных с пертурбативной квантовой гравитацией, вновь возник интерес к определению того, имеет ли смысл непертурбативная квантовая гравитация, основанная на общей теории относительности. Возможно несогласованности вводятся пертурбативной формулировкой. Канонический подход к квантовой обшей теории относительности с использованием уравнение Уилера-Де Витта и канонических переменных зашёл в тупик, что обусловлено сложностью уравнений, которые должны быть решены. Недавно, однако, переформулировка общей теории относительности на языке новых переменных [Asht 86, Asht 87] привела к новому петлевому представлению квантовой общей теории относительности [JaSm 88], [RoSm 88], где уравнения много проще для решения, и некоторое продвижение вперёд было достигнуто. Эти новые переменные имеют прямую родственную связь между общей теорией относительности и теорией Янга - Миллса, что возможно может быть использовано.

Последнее замечание: Фейнман и индексы

Фейнман однажды говорил мне, что постановка знаков минус, множителей 𝑖, 2 и π правильным образом является чем-то таким, о чем стоит беспокоиться только тогда, когда настаёт время опубликования результата. Видимо, правила для индексов и общепринятые стандартные соглашения также попадают в эту категорию. От начала до конца в первых шести лекциях, фактически каждый индекс опускается (см. также [Feyn 63b]). Тем самым производятся необычные обозначения такие, что 𝑥μ=(𝑡,𝑧,𝑦,𝑥) и 𝑥μ=(𝑡,-𝑧,-𝑦,-𝑥). Игнорирование правила индексов не будет допустимо, когда пространство-время не является более плоским. Я отрегулировал использование индексов таким образом, чтобы стандартные правила индексов выполнялись, и использовал практически стандартный символ ημν для метрики Минковского (Фейнман использовал δμν).

В Пасадине у Фейнмана был фургон, на боках которого и сзади были нарисованы фейнмановские диаграммы. Изображение этого фургона приведено в книге [Syke 94]. Когда я впервые увидел этот фургон в 1981 году на стоянке вблизи Аудитории Бекмана в КАЛТЕХ’е, я не знал, что он принадлежит Фейнману. Потребовалось всего несколько секунд, чтобы понять, что этот фургон принадлежал Фейнману потому, что (1) номерной знак содержал неправильно написанное слово QUANTUM, которое было написано как ”QANTUM”,1 и (2) диаграмма на задней стороне фургона, единственная диаграмма с обозначениями, имела все индексы в нижнем положении. Фейнман утверждал, что КЭД уже имеет свой номерной знак и что слово QUANTUM является слишком длинным. (С другой стороны, я помню, что Фейнман довольно часто писал слово ”gauge” ("калибровка”) как ”guage”). На этой диаграмме величина ημν была пропущена у пропагатора для фотона, отсюда следует, что гамма-матрицы, связанные с вершинами, должны были размечаться с одним индексом вверху и одним индексом внизу. Заглянув в одно из окон фургона и увидев там сзади кипу сена, моё подозрение, что этот фургон принадлежит Фейнману, подтвердилось.

1 Занятно было бы заметить, что если перевести эту историю на русский язык, то у Фейнмана на номерном знаке вместо слова ”КВАНТ” было написано слово ”КАНТ”, хотя, конечно, всем известно, что фамилия этого крупнейшего философа на немецком (и английском) языке пишется иначе. (Прим. перев.)

Брайен Хатфилд

Лекция 1

1.1. Полевое приближение гравитации

В этой серии лекций обсудим гравитацию во всех её аспектах. Фундаментальный закон гравитации, открытый Ньютоном, утверждает, что гравитационные силы пропорциональны гравитирующим массам и обратно пропорциональны квадратам расстояний. Этот закон впоследствии был модифицирован Эйнштейном так, чтобы он стал релятивистским. Изменения, которые необходимо сделать для того, чтобы теория была релятивистская, фундаментальны. Нам известно, что массы частиц не являются постоянными в теории относительности, таким образом, фундаментальный вопрос заключается в том, как изменение массы меняет закон гравитации.

Эйнштейн сформулировал свой закон гравитации в 1911 г., тем самым, предмет нашего обсуждения не нов, и физические результаты, которые мы должны объяснить, впервые были замечательно объяснены уже самим Эйнштейном. Поэтому обычный курс теории гравитации начинается с установления основных законов теории, т.е. так, как это было сделано Эйнштейном. Такая процедура, однако, не является универсальной, и по педагогическим соображениям в настоящих лекциях будет использоваться несколько другой подход для изложения теории. В настоящее время студенты-физики знают кое-что о квантовой теории, мезонах и других элементарных частицах, которые не были известны в то время, когда Эйнштейном была создана общая теория относительности. Физика в большой степени состояла из теории гравитации и электродинамики, и именно электродинамика вызвала к жизни создание теории относительности, так что проблема состояла в том, чтобы внести теорию гравитации в общую канву открытий, сделанных при изучении электродинамики.

Эйнштейновская теория гравитации, которая, как утверждается, явилась величайшим открытием в теоретической физике, заключается в красивых соотношениях, связывающих гравитационные эффекты с геометрией пространства, что было довольно увлекательной идеей. Видимая простота гравитационных и электрических сил, например состоящая в том, что и те, и другие следуют закону обратных квадратов, который может понять любой ребёнок, приводит к тому, чтобы у каждого из этих ”детей” появилась мечта о том, что когда он подрастёт, он найдёт дорогу к геометризации электродинамики. Таким образом, поколения физиков делали попытки создания так называемых единых теорий поля, которые могли бы объединить гравитацию и электродинамику в рамках единой теории. Ни одна из созданных теорий не была успешной, и мы не будем обсуждать их в этих лекциях. Большая часть из этих теорий являлась просто математическими игрушками, создаваемыми математически мыслящими людьми, у которых было довольно слабое знание физики, большая часть из этих теорий непонимаема. Сам Эйнштейн также работал над этими теориями, и его сочинения на эту тему, по крайней мере, имеют некоторый смысл, тем не менее, успешной теории поля, которая бы объединяла гравитацию и электродинамику, не существует.

В случае создания подобной единой теории такой успех был бы кратковременным, поскольку в настоящее время в физике заключено существенно больше, чем только электродинамика и гравитация, и нам нужно было бы побеспокоиться об объединении мезонов, каонов и нейтрино и всех других тридцати и более элементарных частиц, которые сейчас известны. Таким образом, подобное объединение электродинамики и гравитации не было бы таким великим достижением, как это представлялось ранее, поскольку в мире есть много другого, кроме электричества и гравитации.

Наш педагогический подход является наиболее близким для теоретиков, специалистов в физике элементарных частиц, которые довольно часто используют различные поля, так что для них довольно просто понять, что вселенная образована двадцатью девятью или тридцатью одним полями, объединёнными в одном уравнении; феномен гравитации добавляет ещё одно поле в общий ”котёл”; это такое поле, которое было пропущено при предыдущих рассмотрениях; гравитационное поле является только одним из тридцати других, поэтому объяснение гравитации состоит в объяснении трёх процентов всех известных полей.

Мы даже можем описать наш подход, пользуясь приёмами научной фантастики. Представим себе, что в некоторой малой области вселенной, скажем, на такой планете, как Венера, живут учёные, которые знают всё о других тридцати полях во вселенной, которые уже знают всё, что знаем мы о нуклонах, мезонах и др., но не знают о гравитации. И вдруг производится новый замечательный эксперимент, который показывает, что большие незаряженные массы притягиваются друг к другу с очень-очень слабой силой. И что стали бы тогда делать венериане для того, чтобы объяснить этот замечательный дополнительный экспериментальный факт? Они вероятно попытались бы интерпретировать новый эксперимент в терминах теории поля, что было бы для них весьма привычным.

1.2. Характеристики феномена гравитации

Рассмотрим некоторые экспериментальные факты, которые венерианский теоретик должен был бы обсудить при создании теории, объясняющей этот новый замечательный эксперимент.

Фейнмановские лекции по гравитации

Рис. 1.1.

Прежде всего фактом является то, что сила притяжения определяется законом обратных квадратов расстояний. Что касается наших знаний об этом законе, то он известен очень-очень точно на основании изучения орбит планет. Кроме того, мы знаем, что сила пропорциональна массам объектов. Этот факт был известен Галилео Галилею, который обнаружил, что все тела падают с одинаковым ускорением. Насколько хорошо нам это известно? В принципе, что надо делать, абсолютно ясно; сначала мы определяем массу как инерцию данного объекта, которую мы измеряем, прикладывая к ней известные силы и измеряя ускорения. Затем мы измеряем притяжение, обусловленное гравитацией, например взвешиванием, и затем сравниваем результаты. Такие эксперименты, измеряющие силы и ускорения, должны были бы быть очень трудными для их проведения с достаточной точностью, однако имеются другие пути проверки закона Галилея с точностью до 10⁻⁸, один из которых был проделан Этвешем. Такой эксперимент может быть реализован путём сравнения гравитационной силы Земли с центробежной силой, обусловленной вращением Земли. Ясно, что возникновение центробежной силы представляет собой чистый эффект инерции. В принципе гиря отвеса, находящегося на некоторой широте, не равной 0° или 90°, направлена не на центр Земли. Действительно, гиря отвеса не направлена к центру также и потому, что Земля имеет несферическую форму, но все эти факторы могут быть учтены при проведении сравнения сил. В любом случае, при некотором промежуточном значении широты (не совпадающим с экваториальным или полярным) гиря отвеса отклоняется в направлении, которое определяется результатом действия гравитационной и центробежной силы. Если же сделать гирю отвеса из некоторого другого материала, который имеет другое отношение инерциальной и гравитационной массы, то отвес мог бы отклониться на несколько отличный от первоначального угол. Мы можем, таким образом, сравнивать различные вещества; например, если сделать первую гирю из меди, а вторую из водорода (конечно, может оказаться трудным изготовить гирю из чистого водорода, однако без труда её можно было бы изготовить из полиэтилена), мы можем проверить постоянство инерциальной и гравитационной массы.

В реальном эксперименте не измеряются разности столь малых углов, а измеряются вращающие моменты; такие малые вращающие моменты являются более удобными для измерений потому, что кварцевые нити обладают для этого весьма подходящими свойствами, являясь достаточно тонкими и в то же время способными выдерживать достаточно большую нагрузку. Как это обычно делается, два тела, сделанные из двух различных материалов, подвешиваются на концах стержня, а стержень подвешивается в своей средней точке; если компоненты сил, перпендикулярные гравитационным силам, не равны, то имеется некоторый результирующий вращающий момент, который может быть измерен. Опубликованные результаты недавнего эксперимента Дикке показали, что эффекта нет, и сделан вывод, что отношение инерциальной массы к гравитационной является константой с точностью 10⁻⁸ для самых различных веществ от кислорода до свинца.

Подобный эксперимент может быть проведён путём сравнения гравитационной силы, обусловленной влиянием Солнца, с инерциальными силами, связанными с нашим орбитальным движением вокруг Солнца. Находясь на Земле, мы вовлечены во вращение в пространстве с фантастической скоростью вдоль орбиты Земли, и единственная причина не замечать этого движения состоит в том, что все другие объекты, нас окружающие, также движутся по той же орбите; если бы гравитационное притяжение не было бы в точности то же самое для различных объектов, то эти объекты должны были бы стремиться к тому, чтобы иметь различные орбиты, и существовали бы эффекты, которые были бы связаны с этими различиями. Общий эффект выглядел бы как наличие небольшой силы в направлении Солнца. Такой эффект искался через попытки обнаружения некоторой суточной осцилляции, которая могла бы быть найдена по поведению баланса закручивающего момента для пары масс в ночное и дневное время. Естественно отличия были измерены, некоторые из этих отличий были обусловлены тем, что различные стороны здания имеют различные температуры - трудность проведения таких экспериментов с очень маленькими эффектами заключается в том, что необходимо быть уверенными, что измеряется на самом деле то, о чем идёт речь, а не что-либо иное. Тем не менее, можно сделать заключение из этих экспериментов, что все объекты также хорошо сбалансированы на своих орбитах, как и Земля, с точностью 10⁻⁸. Такая точность 10⁻⁸ уже может сообщить нам множество очень интересных вещей; например энергия связи в ядре порядка б Мэв на нуклон, а массы нуклонов порядка 940 Мэв, или, грубо говоря, энергия связи порядка одного процента общей энергии. Тогда точность 10⁻⁸ говорит нам, что отношение инерциальной и гравитационной массы энергии связи является константой с точностью 10⁻⁶. Мы можем даже проверить отношение энергии связи для электронов, находящихся на нижних уровнях, поскольку 10⁻⁸ массы нуклона составляет порядка 9 эв. Если в дальнейших экспериментах будет достигнута точность 10⁻¹⁰, что, как предполагается, будет сделано в ближайшем будущем, мы будем иметь пяти процентную точность на возможный диапазон значений энергии химической связи, которая порядка двух вольт.

С такой же точностью у нас есть также проверка гравитационного поведения антиматерии. Поразительное сходство электрических и гравитационных сил, заключающееся в зависимости от расстояний по закону обратных квадратов, заставило некоторых учёных придти к заключению, что было бы замечательно, если бы антиматерия отталкивала материю; они говорят, что поскольку в электричестве тела с одинаковым зарядом отталкиваются, а противоположные притягиваются, то было бы замечательно, если бы в гравитации похожие тела притягивались, а непохожие отталкивались; и единственный кандидат для гравитационной ”непохожести” - антиматерия. Но с точностью 10⁻⁸ мы можем проверить гравитационное поведение поправок к энергии взаимодействия 𝐾-электронов в свинце, обусловленной поляризацией вакуума, которая включает виртуальные пары и антивещество. Можно сказать, что в данном случае нет абсолютно никаких свидетельств, которые заставляли бы предположить, что материя и антиматерия отличаются в проявлении гравитационных эффектов. Более того, все свидетельства, экспериментальные и даже некоторые теоретические, оказывается демонстрируют то, что гравитационные эффекты определяются количеством энергии, вовлечённым в гравитацию, и следовательно, так как и материя, и антиматерия характеризуется положительными значениями энергии, гравитация не делает различия между ними.

Другой аргумент следует из того факта, что свет ”падает” в гравитационном поле в соответствии с соотношениями, которые определяются нашей теорией; свет отклоняется Солнцем на измеряемую величину, которая будет вычислена в дальнейшем. Но фотон является своей собственной античастицей, так что мы должны заключить, что и частицы, и античастицы в этом случае ведут себя одинаково с точки зрения гравитации. Может быть забавным упражнением для некоторых людей попытаться построить теорию, в которой фотоны, исходящие из электрона, отличаются от фотонов, исходящих от позитронов. Но так как нет абсолютно никаких свидетельств того, что такая теория необходима для объяснения какого-либо явления, то довольно мало смысла заключено в попытке создания подобной теории; она должна была бы объяснять все известные эффекты также хорошо, как и существующая теория, и очень вероятно, что можно будет показать, что новая теория неверна, поскольку некоторые новые эффекты, предсказываемые новой теорией, не будут обнаружены при экспериментах.

Наиболее прямое свидетельство того, что материя и антиматерия действительно ведут себя идентично по отношению к гравитационным эффектам, приходит из экспериментов по распаду 𝐾₀ и 𝐾₀, проведённых в Массачусетском Технологическом Институте (MIT). Сам по себе этот эксперимент не без своих собственных недостатков, но его результаты возможно могут быть использованы для того, чтобы исключить теорию, в которой возможно было бы неодинаковое поведение материи и антиматерии. Эти аргументы были приведены М. Гудом [Good 61].

Предположим, что гравитация действует на 𝐾₀ и 𝐾₀, в противном случае данный аргумент не работает. Эти две частицы являются античастицами друг для друга. Итак посмотрим, что происходит, если одна из них притягивается, а другая отталкивается гравитацией. Эти частицы имеют две моды распада, которые могут описываться как


𝐾₁

=

1

√2

(

𝐾₀

+

𝐾₀

),


𝐾₂

=

1

√2

(

𝐾₀

-

𝐾₀

).


Амплитуды для распада по этим модам интерферируют, эксперимент обнаружил эту интерференцию и установил значение Δ𝑚 разности масс такое, что Δ𝑚<ℏ/(10⁻¹⁰ 𝑐). Эта величина не согласуется с идеей, что вещество притягивается, а антивещество отталкивается, поскольку данный эксперимент проводился в гравитационном поле Земли, и если гравитационный потенциал есть φ, то имеется увеличение или уменьшение массы для одной моды 𝑚φ и -𝑚φ для другой, и такая разность масс была бы больше, чем ограничение, полученное в эксперименте MIT. Если мы рассмотрим гравитационный потенциал не Земли, а Солнца, который больше Земного, или рассмотрим даже Галактический потенциал, то получим всё более и более лучшие пределы на степень того, насколько гравитационное взаимодействие должно быть одинаковым для материи и антиматерии. Однако подобная аргументация может быть отвергнута теми, кто считает, что антиматерия отталкивается, но для этого ими должно быть признано, что 𝐾₀ и 𝐾₀ не являются гравитирующими частицами, а для этого уже требуется ввести новое специальное предположение. Очевидно, что любой единичный экспериментальный факт может быть проигнорирован, если мы готовы придумать особенную причину тому, почему данный эксперимент должен показывать такой результат, какой наблюдается.

Известно также, что одиночные свободные нейтроны падают в гравитационном поле так, как это ожидается. Этот факт известен с превосходной точностью, поскольку он должен учитываться при создании нейтронных интерферометров; медленные нейтроны из реактора могут коллимироваться в узкие пучки и детектироваться на некотором расстоянии от него, которое порядка нескольких сотен футов. Обнаружено, что они падают в гравитационном потенциале Земли так же, как и любые другие частицы, которые мы можем измерить. Резюмируя вышесказанное, можно утверждать, что первый изумительный факт, связанный с гравитацией, заключается в том, что отношение инерциальной и гравитационной массы постоянно, где бы мы его ни проверяли.

Второй изумительный факт, связанный с гравитацией, заключается в том, что это взаимодействие очень слабое. Сила гравитационного взаимодействия настолько слаба, что если венериане называют взаимодействия при β-распаде ”слабыми” взаимодействиями, то открытие гравитации вызвало бы гигантские затруднения. Очевидно, что гравитация играет очень важную роль в нашей жизни, хотя силы гравитации, действующие на наше тело, сравнимы с силами мускулов наших ног; а это значит, что гравитационные силы очень слабы сравнительно с другими силами, существующими между частицами. Это сравнение предположительно более универсально, чем сравнение сил гравитации с силой человека. Давайте для примера вычислим отношение гравитационной и электрической силы между двумя электронами. Тогда получаем следующий результат:


𝐹гравит

𝐹электр

=

1

4.17×10⁴²

,


Другими словами, сила гравитации действительно слаба. Подобное сравнение на языке отношения сил является более значимым, чем обычное сравнение на языке констант взаимодействия; например, часто говорят, что электромагнитные силы являются ”слабыми”, потому, что величина 𝑒/ℏ𝑐 - мала, а именно 1/137. Но ссылка на значение константы 1/137 не является слишком значимой, т.к. мы могли бы также хорошо представить, что более значимой величиной для ссылки являлся бы безразмерный заряд электрона, который равен √(4π²/ℏ𝑐), что выглядит весьма отлично от величины 1/137, но имеет то же самое физическое содержание. Таким образом, когда говорится, что слабое взаимодействие (взаимодействие при β-распаде) должно быть слабым потому, что сила взаимодействия есть ”малая величина” 𝐺𝑀𝑝=10⁻⁵, мы можем спросить, почему в данное соотношение включается масса протона? Если слабое взаимодействие передаётся с помощью некоторого мезона, называемого в настоящее время 𝐵-мезоном, то может быть более естественным учесть в предыдущем соотношении массу 𝐵-мезона, которая может быть много больше, чем масса нуклона, достаточная для того, чтобы константа взаимодействия была весьма отличной от ”малой” константы 10⁻⁵.

Все другие поля, которые нам известны, являются много более сильными, чем гравитация, что приводит к тому предположению, что гравитация никогда не может быть объяснена как некоторая поправка, как некоторые члены, которыми ранее пренебрегали в теории, которая бы объединяла все другие поля, которые нам известны. Число 10⁴² так чрезвычайно велико, что появляется весьма заманчивая перспектива поискать другие большие числа, которые могут быть связаны с этим числом. Подобная идея первоначально была предложена А. Эддингтоном [Eddi 31, Eddi 36, Eddi 46].1 Существование одного большого числа весьма загадочно, в случае существования двух таких чисел ситуация была бы ещё хуже, и ситуация могла бы быть улучшена для нас, если бы эти числа были связаны так, что большая величина одного приводила бы к большой величине другого; существование же одной большой величины могло бы быть объяснено значительно более просто, чем двух больших чисел. Эддингтон предположил, что 10⁴²=2¹³⁷, однако некоторые части его книги настолько непонятны, что можно было бы сказать, что книга Эддингтона не содержит полезной теории, поскольку изложение крайне туманно. Мы будем искать объяснения большого числа 10⁴² в другом направлении. Мы знаем о других таких больших числах, например числе атомов или частиц в нас, но как и ранее, нам бы хотелось уйти от нашей человеческой природы при проведении подобных сравнений. Интересно, что гравитационные силы играют определяющую роль для движения таких огромных объектов, как галактики, так что можно было бы поискать связь между величиной гравитационных сил и размером вселенной.

1 Интересное обсуждение возможности совпадения больших чисел и некоторых других вопросов, рассматриваемых в лекции, приведено в книге П.Девиса [Деви 85’]. (Прим. перев.)

В настоящее время размер вселенной очень большой, и её границы нельзя считать хорошо известными, однако можно определить некоторую величину, которая называется радиусом вселенной. Существует наблюдательный факт, что свет, приходящий от удалённых звёзд и галактик, сдвигается в сторону более низких частот, как будто они разбегаются от нас со скоростями, пропорциональными расстояниям от нас до этих объектов. Этот факт может быть объяснён в рамках так называемой теории Большого Взрыва Вселенной. Как мы увидим, теория гравитации очень важна при рассмотрении космологических моделей, и мы будем обсуждать их позднее в нашем курсе. Однако сейчас предположим, что галактики образованы из материи, которая начала двигаться из некоторого пятна в Большом Взрыве; тогда пропорциональность между скоростью от центра и расстоянием получается довольно естественно, поскольку вещество, которое находится дальше, движется быстрее. Такая пропорциональность имеет вид 𝑅/𝑉=𝑇, где 𝑇 - время, прошедшее с момента такого гипотетического взрыва. Это время (обратная величина которого известна как постоянная Хаббла) характеризуется величиной порядка 13×10¹⁰ лет. Ошибка в этой величине составляет довольно существенную часть, несколько лет назад для этой величины приводилось значение 2×10¹⁰ лет. Ошибки определения этой величины связаны с ошибками определения расстояний; допплеровские сдвиги измеряются значительно проще, чем расстояния до далёких галактик.

Эта константа описывает время жизни вселенной; не обязательно мы должны верить в то, что вселенная образовалась 𝑇 лет назад, скорее эта величина характеризует фундаментальную размерность вселенной, причём значительно в большей степени, чем величина 𝑒²/𝑚𝑐² представляет ”радиус электрона”. Аналогично, величина 𝑇𝑐 описывает некоторую длину, которая может называться ”радиусом” вселенной. Посмотрим, как можно было бы получить коэффициент порядка 10⁴² каким-либо образом из постоянной Хаббла. Мы можем взять для примера отношение времени, которое требуется свету, чтобы пройти расстояние, равное комптоновской длине волны электрона ℏ/𝑚𝑐² или протона ℏ/𝑀𝑝𝑐², к постоянной Хаббла, кроме того, мы надеемся, что эта величина представляет собой нечто более значительное, чем просто некоторое количество секунд в нашей человеческой шкале измерений. Эти времена равны соответственно ℏ/𝑚𝑐²=10⁻²¹ с, или ℏ/𝑀𝑝𝑐²=10⁻²⁴ с, время жизни вселенной 𝑇=10¹⁷ сек, таким образом, это отношение порядка 10⁴¹ для протонов, и можно сказать, пользуясь подобными соотношениями, что эта величина находится не слишком далеко от отношения электрических и гравитационных сил для протона, которое примерно равно 10³⁶. Если мы рассмотрим электроны, то это отношение равно 10³⁸, что также не слишком близко к величине 10⁴², но мы должны иметь в виду, что мы пустились на самые смелые размышления с целью посмотреть на то, получим ли мы хоть какие-то осмысленные результаты. Можно напомнить такой факт, что П. Дирак [Dira 37, Dira 38] пытался построить некоторую теорию гравитации, в которой гравитационная константа была бы в точности этой величины. Одна из трудностей такой теории состоит в том, что необходимо вводить зависимость от времени силы гравитации, так как вселенная всё время стареет в единицах времени, соответствующих комптоновской длине волны. Однако очень трудно определить, что значит сказать, что силы гравитации зависят от времени, в то время как всё остальное ”остаётся тем же самым”. Так как эти значимые величины являются безразмерными отношениями некоторых физических величин, то эту ситуацию можно было бы описывать, предполагая, что электрический заряд зависит от времени, так что теория на самом деле, не является хорошо определённой. В данный момент попытаемся взглянуть поверх этих трудностей теории и посмотреть, хотя бы интуитивно, какие мы можем вывести следствия из зависимости от времени гравитационной константы. Некоторые учёные говорят, что этот факт может помочь объяснить землетрясения, поскольку, когда гравитационные силы слабеют, Земля слегка вытягивается, и могут возникать трещины. Однако, альтернативная теория, в которой рассматриваются токи в магме, находящейся внутри Земли, лучше описывает то, почему землетрясения происходят в высоко локализованных областях Земной коры. Итак, приятным является то, что некоторые выводы могут использоваться в теории землетрясений.

Можно было бы попытаться опровергнуть идею об изменении гравитационной постоянной 𝐺, основываясь на следствиях теории звёзд; мы не будем детально изучать звёзды, однако вкратце можно сказать, какие процессы в них происходят. Вещество звезды падает к центру, выделяемая гравитационная энергия нагревает вещество до температуры, при которой происходят ядерные реакции, а в результате давление сохраняет звезду в состоянии равновесия, энергетические потери компенсируются энерговыделением при ядерных реакциях, и давление не позволяет веществу коллапсировать дальше. Если мы предполагаем, что гравитационная константа зависит от времени и имела большее значение в прошлом, мы должны предположить, что скорость энерговыделения в прошлом была выше для того, чтобы компенсировать больший вес; детальное рассмотрение показывает, что мы могли бы ожидать, что светимость звезды зависит от гравитационной постоянной как 𝐺⁶; качественно, если постоянная больше, то больше и центральная температура, необходимая, чтобы силы газового давления поддерживали больший вес вещества, так что ядерные реакции происходят с большим энерговыделением. Мы можем спросить, какое влияние всё это могло бы оказать на наше Солнце и отсюда на поверхностную температуру Земли; мы утверждаем, что имеются некоторые ограничения на поверхностную температуру Земли, исходя из того факта, что на нашей планете жизнь существует (по крайней мере, в каком-то виде) уже 10⁹ лет. Если гравитационная константа раньше была больше, то светимость Солнца была бы больше, согласно закону 𝐺⁶, и орбита Земли должна была бы быть ближе к Солнцу, чем сейчас. В этом случае световой поток, падающий на Землю, должен был бы быть пропорционален 𝐺⁸. Сейчас мы можем сделать некоторую оценку земной температуры; получить точную оценку довольно трудно, потому что плохо известна отражающая способность поверхности Земли (альбедо), достаточно трудно учесть влияние облаков и другие усложнения подобного рода, но мы можем получить оценку, основываясь на предположении, что Земля является чёрным телом. Чёрное тело испускает энергию, зависящую от температуры поверхности как 𝑇⁴, и поскольку Земля вращается, температура приходит в равновесие с энергией, получаемой от Солнца. Если сравнить полученные оценки с имеющимися данными об измеренных температурах поверхностей планет, то это сравнение показывает, что простая оценка оказывается весьма точной (во всех тех случаях, когда поверхностная температура известна). Итак, мы можем использовать эту оценку для получения оценки температуры земной поверхности миллиард лет тому назад, предполагая, что гравитационная константа была в то время на 8% больше. Энергия, падающая на поверхность Земли, связана с температурой в соответствии с законом 𝑇⁴, эта энергия связана с гравитационной постоянной как 𝐺⁸, таким образом температура поверхности Земли пропорциональна 𝐺² и на 16%, или на 48°С, была выше миллиард лет тому назад, чем сейчас.

Теперь можно спросить геофизиков и биохимиков, что было бы, если бы температура Земной поверхности была бы такая, как 75°С. Эта температура ещё не достаточно высока, чтобы моря закипели, так что мы ещё не можем отвергнуть полностью такую теорию. Можно предположить, что жизнь действительно зародилась при такой температуре воды. Известны некоторые места на Земле, такие как горячие источники в Йеллоустоне, где некоторые бактерии живут в воде при аналогичных температурах. Это была бы довольно странная жизнь, которая могла бы существовать при таких температурах; найденные древнейшие ископаемые остатки не демонстрируют никаких особенностей, которые могли бы быть разумным свидетельством существования таких больших температур, тем не менее, насколько я знаю, мы не можем предъявить решающего свидетельства против более высокой температуры в более ранние времена.

Существенно большая светимость звёзд в том случае, если бы гравитационная постоянная была больше в прошлом, поменяла бы эволюционные масштабы времени некоторых звёзд. Я знаю, что некоторые астрономы пытаются увидеть, согласуются ли эти выводы с наблюдениями, но я не знаю, получили ли они на этот счёт строгое заключение.

Другое замечательное совпадение, связывающее гравитационную константу с размером вселенной, получается из рассмотрения полной энергии. Полная гравитационная энергия всех частиц вселенной есть что-то вроде 𝐺𝑀𝑀/𝑅 где 𝑅=𝑇𝑐 и 𝑇 - хаббловское время. На самом деле, если вселенная является сферой с постоянной плотностью, необходимо учесть множитель 3/5, но мы будем пренебрегать им, поскольку наша космологическая модель не во всем хорошо известна. Мы сравним эту величину с общей массой вселенной, 𝑀𝑐². И вдруг, о чудо! Мы получаем замечательный результат, 𝐺𝑀²/𝑅=𝑀𝑐², так что полная масса вселенной равна нулю.1 На самом деле, мы не знаем ни плотности вещества, ни радиуса во вселенной с достаточной точностью для того, чтобы говорить о равенстве, но тот факт, что эти два больших числа должны были бы иметь одинаковые порядки величин, представляет собой поистине замечательное совпадение. Отсюда можно придти к весьма смелой мысли, что это ”ничто” рождает новые частицы, так как мы можем создать их в центре вселенной, где имеется отрицательная гравитационная энергия, равная 𝑀𝑐².

1 Другое решение этого уравнения 𝑀=𝑐³𝑇/𝐺 (Прим. перев.)

В этих оценках именно плотность вселенной является наиболее трудным для определения параметром. Мы можем видеть звёзды и галактики, видеть их достаточно много, но не иметь ясной идеи о том, насколько много тёмных звёзд находится там, звёзд, в которых перестали идти реакции ядерного горения. Не знаем мы и плотность межзвёздного газа. У нас имеются некоторые мысли о том, как оценить плотность натрия в пространстве между галактиками, основываясь на измерении поглощения излучения в линиях 𝐷, испускаемого удалёнными звёздами. Однако натрий возможно составляет лишь небольшую часть общей массы, и нам необходимо знать плотность водорода. Путём изучения движения спиральных рукавов галактик, шаровых скоплений, выясняется, что галактики имеют в своих центрах большое количество скрытой массы. Всё это не позволяет получить надёжную оценку средней плотности во вселенной. А.Эддингтон для своих оценок в 20-х годах использовал значение 1 атом водорода в см³ для галактик. Радиоастрономы, которые недавно изучили Галактику в ”свете водорода”, привели несколько меньшую оценку, скажем 0.7 атома водорода в см³. Нет никаких достоверных данных о плотности межгалактического вещества; космологи предполагают величины в 10⁵ меньшие, чем галактическая плотность, 10 атомов водорода в кубическом метре. Пользуясь этой оценкой, мы получаем чрезвычайно интересный результат, что полная энергия вселенной равна нулю. Почему так должно быть, является одной из величайших тайн - и, следовательно, одним из важнейших вопросов физики. После всего этого можно задать вопрос, что мы должны были бы изучать в физике, если подобные тайны не являются столь важными, чтобы их исследовать.

Все приведённые выше размышления о возможных связях между размером вселенной, количеством частиц и гравитацией не оригинальны и обсуждались ранее. Учёные, обсуждавшие подобные предположения, делятся на два типа: или это очень серьёзные математики, играющие в игры, заключающиеся в построении математических моделей, или скорее всего шутники, забавляющиеся тем, что обращают внимание на некие забавные численные курьёзы со смутной надеждой на то, что всё это возможно когда-нибудь и будет иметь какой-то смысл.

1.3. Квантовые эффекты в гравитации

В следующих нескольких лекциях мы начнём строить квантовую теорию гравитации. Было бы весьма полезно для нас держать в уме, что могли бы представлять из себя любые наблюдательные эффекты в такой теории. Вначале давайте рассмотрим гравитацию как теорию возмущений на атоме водорода. Ясно, что дополнительное притяжение между электроном и протоном приводит к малому изменению в энергии связи водорода; мы можем вычислить это изменение энергии из теории возмущений и получить значение ε. Известна зависящая от времени волновая функция атома водорода ψ=exp(-𝑖𝐸𝑡) где 𝐸 - такая величина, которая соответствует частоте порядка 10¹⁶ Гц. Теперь для того, чтобы наблюдать какие-либо эффекты, обусловленные влиянием ε, мы должны были бы ждать какое-то время до тех пор, пока истинная волновая функция могла бы быть отличима от невозмущённой волновой функции, например на 2π в фазе. Однако величина ε настолько мала, что для этого необходимо ждать время в 100 раз большее, чем возраст вселенной 𝑇. Таким образом, гравитационные эффекты в атомах ненаблюдаемы.

Рассмотрим другую возможность, когда атом удерживается только гравитационными силами. Например, мы хотели бы иметь два нейтрона в связанном состоянии. Когда мы вычисляем радиус Бора такого атома, то получаем, что он должен быть равным 10⁸ световых лет, и энергия связи должна быть равна 10⁻⁷⁰P.1 Таким образом, надежда обнаружить влияние гравитационных эффектов на системах, которые являются достаточно простыми для того, чтобы можно было провести вычисления в квантовой механике, слишком мала.

1 Напомним, что внесистемная единица 1 Ридберг выражается следующим образом: 1Р= 13.6 эВ. (Прим. перев.)

Другое предсказание квантовой механики и гравитации должно бы состоять в том, что гравитационная сила могла бы передаваться виртуальным обменом некоторыми частицами, которые обычно называются гравитонами. Следовательно, мы могли бы ожидать, что при определённых обстоятельствах мы могли бы видеть гравитоны, подобно тому, как мы можем наблюдать фотоны. Я хотел бы напомнить, что хотя свет наблюдался существенно раньше в истории человечества (возможно впервые Адамом), до 1898 г. не было осознанного понимания того, что это электромагнитные волны, а квантовые аспекты этих волн наблюдались ещё позже. Мы наблюдаем гравитацию в том смысле, что мы знаем, что она влияет на Землю, но классические гравитационные волны до сих пор не наблюдались; это не является несогласованным с нашими ожиданиями, поскольку гравитация настолько слаба, что нет эксперимента, который мог бы быть сделан сегодня и быть достаточно чувствительным, чтобы обнаружить гравитационные волны, по крайней мере, от таких ожидаемых сильнейших источников, которые могут быть рассмотрены, как быстро вращающиеся двойные звёзды. Квантовый аспект гравитационных волн в миллион раз дальше от порога детектирования, поэтому видимо нет даже надежды наблюдать гравитон.

1.4. О философских проблемах в квантовании макроскопических объектов

Фейнмановские лекции по гравитации

Рис. 1.2.

Экстремальная слабость квантовых гравитационных эффектов могла бы теперь поставить некоторые философские проблемы; может быть природа пытается сказать нам что-либо новое, может быть мы не должны пытаться квантовать гравитацию. Возможно ли, что мы не должны настаивать на единообразии природы, чтобы всё могло бы быть проквантовано? Возможно ли, чтобы было так, что гравитация не квантуется, а всё остальное в мире квантуется? Существуют некоторые аргументы, которые были приведены в прошлом, что мир не может быть полуклассическим и полуквантовым. Теперь постулат, который определяет квантово-механическое поведение, заключается в том, что существует амплитуда для различных процессов. Не может быть, следовательно, чтобы частица, которая описывается амплитудой, такая как электрон, имела взаимодействие, которое описывается не амплитудой, а вероятностью. Мы рассмотрим дифракционный эксперимент с двумя щелями и вставим гравитационный детектор, который, как мы предполагаем, является классическим, который в принципе может сказать нам, через какую щель прошёл электрон (рис. 1.2). Представим себе, что детектор ещё не получил сигнал, говорящий нам, через какую щель прошёл электрон; положение электрона описывается амплитудой, половина которой проходит через верхнюю щель, а половина через нижнюю. Если гравитационное взаимодействие передаётся полем, то отсюда следует, что гравитационное поле должно было бы также иметь амплитуду; половина которой соответствует гравитационному полю электрона, проходящему через каждую щель. Но всё это в точности характеристика квантового поля, которое должно было бы описываться амплитудой предпочтительнее, чем вероятностью! Таким образом, кажется, что должно быть невозможным нарушить квантовую природу полей.

Несмотря на эти аргументы, мы хотели бы быть свободными от предубеждений. Ведь всё ещё остаётся возможность, что квантовая теория абсолютно не гарантирует, что гравитация должна быть квантуема. Я хочу, чтобы здесь я был правильно понят, отсутствие предубеждений не значит отсутствие всяких убеждений. Я имею ввиду, что возможно, если мы рассматриваем альтернативные теории, которые не кажутся нам a priori оправданными, и мы вычисляем, что бы имели, если бы такая теория была верна, возможно было бы неожиданным открытием, что такой путь в действительности существует! Мы никогда не сделаем это открытие с позиции, что ”конечно, всегда необходимо наслаждаться возможностью сомнений”, а действовать и вычислять только с одним предубеждением. Рассуждая в этом духе, я хотел бы предположить, что квантовая механика не выполнима при больших расстояниях и для больших объектов. Теперь следите за моими утверждениями, я не говорю, что квантовая механика будет не выполняться на больших расстояниях, я только сказал, что это не является несогласованным с тем, что мы знаем. Если такая несостоятельность квантовой механики связана с гравитацией, то умозрительно рассуждая, мы могли бы ожидать, что это происходит для масс таких, что 𝐺𝑀²/ℏ𝑐, или 𝑀~10⁻⁵ г, что соответствует приблизительно 10¹⁸ частиц. Квантовая механика даёт довольно глупые ответы для объектов такого размера; если мы вычислим вероятность того, что песчинка перепрыгнула через стену, то получим такие ответы как 10⁻²⁶⁰⁰⁰⁰, которые представляются довольно нелепыми. Следовательно, мы не должны пренебрегать рассмотрением того, что возможно квантовая механика не верна для больших масштабов и не выполнима для объектов нормального (немикроскопического) размера. В этой связи мы могли бы обсудить, как теория наблюдения и измерения создаёт некоторые проблемы. Для примера давайте поговорим о придуманном Шрёдингером парадоксе кота. Это не настоящий парадокс в том смысле, что имеется два различных ответа при использовании соответствующих логических рассуждений, это означает, что необходимо отметить наличие философской трудности в квантовой механике, и каждый физик должен решить, какой ответ он предпочитает.

Представим себе закрытый ящик, в который помещён живой кот и подвешено ружьё; причём кот размещён таким образом, что если ружьё выстрелит, то кот умрёт. Ружьё выстреливает с помощью счётчика Гейгера, который считает частицы от радиоактивного распада; предположим, что источник такой, что мы ожидаем один отсчёт в час. Имеется следующий вопрос: Какова вероятность того, что кот остался жив спустя один час, если мы оставили его запертым в ящике?

Ответ, получаемый из квантовой механики чрезвычайно прост; имеется два возможных конечных состояния, которые мы рассматриваем; амплитуда равна


Амплитуда =


1

√2

ψ


(кот жив)

+


1

√2

ψ


(кот мёртв).


Когда мы думаем об этом ответе, то у нас появляется ощущение, что кот не видит эти вещи таким же образом; он не чувствует, что у него 1/√2 жизни и 1/√2 смерти, а чувствует или одно, или другое. Итак, то, что может соответствующим образом описываться амплитудой внешнего наблюдателя, не обязательно описывается аналогичной амплитудой, когда наблюдатель составляет часть этой амплитуды. Таким образом, внешний наблюдатель обычной квантовой механики находится в выделенном положении. Для того, чтобы убедиться в том, жив кот или мёртв, он делает маленькую дырочку в ящике и наблюдает; и только после этого он делает своё измерение, что система находится в хорошо определённом конечном состоянии; но ясно с точки зрения внутреннего наблюдателя, что результаты такого измерения внешнего наблюдателя определяются вероятностью, но не амплитудой. Таким образом, мы видим, что при традиционном описании квантовой механики мы имеем встроенное в теорию расхождение между описанием, включающим внешнего наблюдателя, и описанием без наблюдения.

Такого рода парадокс возникает всякий раз, когда мы рассматриваем усиление атомного события, так что мы узнаем, как это событие влияет на вселенную в целом. Традиционное описание общей квантовой механики всего мира чудовищно сложной волновой функцией (которая описывает всех наблюдателей), удовлетворяющей уравнению Шрёдингера


𝑖

∂Ψ

∂𝑡

=

𝐻ψ

,


приводит к невероятно сложной бесконечности амплитуд. Если я играю в азартные игры в Лас Вегасе и собираюсь поставить некоторые деньги на номер 22 в рулетке, и ближайшая ко мне девушка выливает на меня свой напиток, потому что она увидела кого-то, кого она знает, и я останавливаюсь перед тем, как сделать ставку, и приходит число 22 на рулетке, я могу увидеть, что всё течение вселенной для меня зависело от того факта, что некоторый маленький фотон попадёт в нервное окончание сетчатки глаза девушки. Таким образом, вся вселенная бифурцирует на каждом атомном событии. В настоящее время некоторые учёные, которые настаивают на том, чтобы свести всю квантовую механику к букве, удовлетворены подобной картиной; так как нет внешнего наблюдателя для волновой функции, описывающей вселенную в целом, они утверждают, что правильное описание мира включает в себя все амплитуды, которые, таким образом, бифурцируют в каждом атомном событии. Но тем не менее, мы, которые являемся частью такой вселенной, знаем, какой путь вселенной бифурцировал для нас, так что можем следовать треку нашего прошлого. Теперь философский вопрос для нас состоит в том, что когда мы делаем наблюдение нашего трека в прошлом, становится ли результат нашего наблюдения реальным в том смысле, что конечное состояние было бы определено, если бы внешний наблюдатель сделал бы наблюдение? Всё это весьма смущает, особенно когда мы считаем, что даже хотя мы можем согласованно рассматривать себя всегда в качестве внешнего наблюдателя, когда мы смотрим на весь остальной мир, остальной мир в то же самое время наблюдает нас, и очень часто мы согласны с тем, что мы видим друг в друге. Означает ли это, что мои наблюдения становятся реальными только тогда, когда я наблюдаю наблюдателя, наблюдающего, как что-либо происходит? Это ужасная точка зрения. Серьёзно ли вы обдумываете мысль, что без наблюдателя нет реальности? Какого наблюдателя? Любого наблюдателя? Является ли наблюдателем муха? Является ли звезда наблюдателем? Отсутствует ли реальность во вселенной за 10⁹ лет до н.э., т.е. до зарождения жизни? Или являетесь ли вы тем самым наблюдателем? Тогда нет реальности в мире после вашей смерти? Я знаю большое число респектабельных физиков, которые покупают страховку на случай смерти. Какой философией была бы понята вселенная без человека?

Для того, чтобы придать некий смысл рассуждениям, мы должны относиться без предубеждений к вероятности того, что для достаточно сложных процессов амплитуды становятся вероятностями. Факт, что именно амплитуды добавляются, может быть обнаружен только процессами, которые детектируют разность фаз и интерференцию. Теперь фазовые соотношения для очень сложных объектов могли бы быть чудовищно сложны, так что наблюдать интерференцию можно было бы только в том случае, если фазы всех частей сложного объекта эволюционируют очень, очень точным образом. Если существует некоторый механизм, с помощью которого эволюция фазы слегка изменяется, так что не является абсолютно точной, тогда наши амплитуды становятся вероятностями для очень сложных объектов. Но можно быть уверенным, что если фазы действительно имели такое встроенное в теорию смещение, должны были бы быть некоторые следствия, связанные с этим смещением. Если одно такое следствие состояло бы в существовании гравитации самой по себе, не было бы квантовой теории гравитации, что было бы ужасающей идеей для остальных лекций.

Всё это представляет собой весьма смелые рассуждения, и бесполезно продолжать их дискутировать; однако мы всегда должны помнить о том, что существует некоторая вероятность того, что квантовая механика может не выполняться, так как у нас есть определённые трудности с философскими предрассудками относительно измерений и наблюдений.

1.5. Гравитация как следствие других полей

Вернёмся к построению теории гравитации, как это могли бы сделать наши друзья венериане. В общем случае, мы ожидаем, что должны быть две школы мысли о том, как работать с этим новым феноменом. Имеются следующие возможности:

Что гравитация - новое поле, номер 31.

Что гравитация - следствие чего-то, что мы уже знаем, но что мы ещё точно не вычислили.

Мы рассмотрим кратко вторую точку зрения для того, чтобы посмотреть, какие в этом случае имеются возможности. Факт универсального притяжения может напомнить нам ситуацию в молекулярной физике; мы знаем, что все молекулы притягиваются друг к другу с силой, которая на больших расстояниях ведёт себя как 1/𝑟⁶. Этот факт мы понимаем в терминах дипольных моментов, которые индуцируются флуктуациями в распределении заряда молекул. То, что это универсальный закон, хорошо известно из того факта, что все вещества могут конденсироваться при соответствующем охлаждении. Итак, одна возможность состоит в том, что гравитация может быть некоторым притяжением, обусловленным подобными флуктуациями в чем-либо, мы пока не знаем в чем, возможно обладающим зарядом.

Если мы беспокоимся о том факте, что квантовая механика не выполнима тогда, когда очень часто возникают бесконечности при суммировании по всем состояниям, мы могли бы поискать связь между гравитацией, размером вселенной и неприменимостью квантовой механики. Бесконечности всегда появляются, когда мы суммируем все дроби ∑𝑛1/(𝐸-𝐸𝑛). Теперь мыслится так, что если мы должны рассмотреть всю вселенную, то мы не должны суммировать по всем виртуальным состояниям обычным образом, а мы должны суммировать только те виртуальные состояния, для которых мы можем взять достаточно энергии из остальной части вселенной. Теория, которая не могла бы разрешать виртуальные состояния, если энергия нарушения больше, чем общая энергия вселенной, была бы слегка отличной от той, которая предполагает, что общая энергия бесконечна. Здесь были бы отличия от обычной теории, но я подозреваю, что ничто другое, кроме как гравитация, не может быть следствием из такой теории.

Мы могли бы рассмотреть вопрос о том, могут ли гравитационные силы возникать вследствие виртуального обмена частицей, которую мы уже знаем, такой как нейтрино. Всё-таки при поверхностном взгляде взаимодействие имеет правильные свойства, так как нейтрино - незаряженная частица с нулевой массой, то это взаимодействие должно было бы зависеть от расстояния как 1/𝑟, и это взаимодействие будет очень слабым.

В следующей лекции мы будем заниматься этой нейтринной теорией гравитации и обнаружим, что такая теория неприменима. Тогда мы начнём строить теорию гравитации как 31-ое поле, которое должно быть обнаружено.

Лекция 2

2.1. Постулаты статистической механики

При построении возможных вариантов нашей теории гравитации мы должны остерегаться от слишком поспешного принятии (без достаточных на то оснований) многих из предрассудков нынешнего научного мировоззрения. В предыдущей лекции мы увидели, что имеется что-то не вполне удовлетворительное в том, что вероятности появляются при нашей интерпретации вселенной. Если мы действительно думаем, что вселенная описывается великой волновой функцией без внешнего наблюдателя, то ничто не может быть когда-либо вероятностью, так как никакого измерения даже не может быть сделано! Это обстоятельство физики имеют ввиду, несмотря на экспериментальное свидетельство оправданности подобного описания для подобластей вселенной, которые могут для наших целей довольно детально описываться волновыми функциями, амплитуды которых представляют вероятности результатов измерений.

Подобным образом, существуют трудности с описанием статистической механики в простом учебнике; хотя этот пример не слишком близко связан с теорией гравитации, но он связан с космологическими вопросами, которые мы будем обсуждать ниже. Довольно часто постулируют a priori, что все состояния равновероятны. Этот постулат не является истиной в нашем мире, как мы видим его. Этот мир не описывается правильно физикой, в которой предполагается выполнение этого постулата. В мире живут люди - не физики - такие как геологи, астрономы, историки, биологи, которые готовы поставить высокую ставку на то, что когда мы наблюдаем ещё ненаблюдаемую область вселенной, мы найдём определённую организацию, которая не предсказывается физикой, которой мы призываем верить. В соответствии с нашим опытом как наблюдателей, мы обнаруживаем, что если мы заглянем в книгу с заглавием на обложке ”Наполеон”, то действительно, шансы на то, что внутри книги будет что-либо о Наполеоне, очень велики. Мы определённо не ожидаем найти систему в термодинамическом равновесии, когда мы открываем эти страницы. Но физики не нашли способа, как учесть подобные шансы для ненаблюдаемых областей вселенной. Современные физики никогда не могли бы предсказать так же хорошо, как геолог, шансы на то, что когда мы взглянем внутрь определённых камней, мы найдём ископаемое топливо.

Подобным образом, историки астрономии и астрономы находят, что всюду во вселенной, которую мы наблюдаем, мы видим звёзды, которые горячее внутри и холоднее снаружи, т. е. системы, которые, на самом деле, весьма далеки от термодинамического равновесия.

Фейнмановские лекции по гравитации

Рис. 2.1.

Мы можем понять насколько невероятна такая ситуация с точки зрения обычных предсказаний термодинамики, путём рассмотрения простых упорядочений. Рассмотрим ящик в качестве вселенной, в которой имеется два типа частиц, белые и чёрные. Предположим, что в определённой области вселенной, подобной маленькому углу ящика, мы видим, что все белые частицы отделены от чёрных частиц диагональю (точнее плоскостью, проходящей через диагонали на противоположных сторонах, см. рис. 2.1). Априорная вероятность того, что такая картина имеет место, должна быть очень, очень мала, и мы должны, исходя из наших нынешних предубеждений, приписать этому состоянию статистическую флуктуацию, которая довольно невероятна. Что мы предсказываем для остальной части вселенной? Это предсказание состоит в том, что если мы взглянем на другую область, то мы должны были бы наиболее вероятно найти, что эта другая область имеет значительно менее упорядоченное распределение белых и чёрных частиц. Но фактически, мы такого не обнаруживаем, и в каждой новой области мы наблюдаем то же самое упорядочение, как и в предыдущем случае. Так, если я сяду в свою машину и поеду в горы, которые я до этого никогда не видел, я найду деревья, которые выглядят в точности также, как те деревья, которые я знаю. Если рассматриваются системы с экстремально большим количеством частиц, то вероятности таких наблюдений в терминах обычной статистической механики фантастически малы.

Наилучшим объяснением флуктуации, которая наблюдается, является то только, что многое флуктуировало, и что остальное находится в случайном состоянии. Если все состояния равновероятны a priori, и если найден кусочек мира, который столь односторонен, то остальная часть мира должна была бы быть равномерно перемешана, поскольку тогда была бы меньше флуктуация. Можно было бы возразить, что события и структуры коррелированы; они все имели одно и тоже прошлое! Но это другая теория, чем та, которая лежит в основании описания вселенной в рамках статистической механики. Это та противоположная теория, которая утверждает, что в прошлом мир был более организован, чем сейчас, и что наиболее вероятное состояние не есть состояние равновесия, а некоторое особое состояние, которое динамически эволюционирует. В этом заключается общепризнанное предположение, которое принимается всеми историками, палеонтологами и другими.

Вероятностные аргументы могут быть использованы как тест для теории и могут быть применены следующим образом. Предположим, что на априорной основе мы хотим приписать очень, очень низкие шансы той гипотезе, что вселенная не должна описываться как тщательно подобранная флуктуация от полного хаоса, характеризующего термодинамическое равновесие; например, предположим, что априорная вероятность представления, что все состояния равновероятны, есть 1-10⁻¹⁰⁰. Затем давайте опишем число упорядоченных состояний в соответствии с некоторой схемой; например, предположим, что мы перечислим все состояния, которые упорядочены менее, чем миллионом слов. Теперь мы определим оставшуюся априорную вероятность 10⁻¹⁰⁰. для гипотезы, что вселенная эволюционирует от одного из этих специально упорядоченных состояний в прошлом. Другими словами, мы предполагаем, что все состояния равновероятны, но хотим допустить возможность того, что наблюдательные тесты могут опровергнуть гипотезу равновесия.

Теперь мы начинаем делать наблюдения мира вокруг нас и мы наблюдаем состояния с описываемым порядком. Каждый из нас этим утром видел, что земля была внизу, а воздух был вверху, но одного такого наблюдения достаточно, чтобы увеличить шансы для упорядоченных состояний в апостериорном суждении о вероятности начальной ситуации. И если мы делаем всё больше и больше наблюдений, это увеличение в конце концов достигнет даже 10⁻¹⁰⁰ способом, который может вычисляться в соответствии с теоремой: если априорная вероятность ситуации 𝐴 есть 𝑃𝑎 и если априорная вероятность ситуации 𝐵 есть 𝑃𝑏, и если сделано наблюдение, которое более вероятно, если 𝐴 имеет место, и менее вероятно, если 𝐵 имеет место, то апостериорная вероятность 𝐴 увеличивается отношением, по которому результат измерения является более вероятным, если 𝐴 имеет место.

Если делается наблюдение угла вселенной, причём наблюдение макроскопическое, то можно обнаружить, что это состояние весьма далеко от равновесия. Шансы на то, что это может быть флуктуация, экстремально малы; требуется только одиночное наблюдение макроскопического порядка, чтобы уменьшить вероятность до 10⁻²⁰⁰⁰, для которой только 5000 молекул должны быть упорядочены. Таким образом, совершенно очевидно, что только специальные состояния могли бы порождать огромную степень упорядочения, которую мы видим в мире.

Как тогда работает термодинамика, если её постулаты вводят в заблуждение? Фокус состоит в том, что мы всегда упорядочиваем объекты таким образом, что мы не делаем эксперименты над объектами, когда мы их находим, а только после того, как мы выбрасываем все те ситуации, которые могли бы привести к нежелательным упорядочениям. Если мы должны проводить эксперименты над газами, которые первоначально помещены в металлический кан, мы должны заботиться о том, чтобы ”дождаться того момента, когда термодинамическое равновесие установится” (как часто мы слышали эту фразу!), и мы выбрасываем все те ситуации, в которых что-либо случается с аппаратурой, что электричество отключается вследствие того, что сгорел предохранитель, или что кто-либо ударил по кану молотком. Мы никогда не проводим экспериментов над вселенной, как таковой, но скорее мы контролируем обстоятельства, чтобы подготовить более тщательно системы, над которыми мы экспериментируем.

Более удовлетворительный способ представления постулатов статистической механики может быть следующим. Предположим, что мы действительно знаем все детали (классической) системы, такие как масса газа, с бесконечной точностью; это означает, что мы знаем положения и скорости всех частиц в некоторый момент времени 𝑡=0. Тогда мы можем (игнорируя действительные трудности в практике) вычислять точно, если мы знаем законы природы в точности, и узнать поведение и состояние всех других частиц в любой момент времени в будущем. Но сейчас предположим, что имеется некоторая небольшая неопределённость в наших измерениях или в нашем знании какого-либо одного фактора, который включён в вычисление, положение, скорости любой выделенной частицы или в небольшой неопределённости в точность, с которой мы знаем взаимодействие частиц. Не имеет значения (за исключением контрпримеров, построенных математиками), с чем связана эта неопределённость. Если такая неопределённость существует, мы должны будем описать финальное состояние усреднением этой неопределённости, и если прошло достаточно большое время, которое будет короче, чем наиболее длинное время неопределённости и наиболее длинное время системы, предсказания измерений будут очень близки к тем, которые даются канонической теорией термодинамического равновесия.

Если для примера мы нарисуем скорость молекулы номер 6 в момент времени 𝑡=30 мин. как функцию любой другой начальной переменной в системе, например, такой как начальное положение или скорость частицы номер 133, мы найдём экстремально сложную кривую с очень, очень тонкими деталями, которые должны усредняться к ” равновесным” результатам, как только мы усредняем по начальной конечной неопределённости выбранной переменной в данной задаче. Другими словами, распределение начальных значений в рассматриваемом диапазоне должно быть очень похоже на ”равновесное” распределение (рис. 2.2).

Фейнмановские лекции по гравитации

Рис. 2.2.

Физически удовлетворительное обсуждение термодинамики и статистической физики может быть достигнуто, если признать, что проблема состоит в том, чтобы определить условия в системе, в которой различные события происходят при очень различных скоростях. Только если эти скорости существенно различны, термодинамика может быть использована. Таким образом, термодинамика должна различить медленные и быстрые процессы. Когда мы говорим о термодинамическом равновесии для нашей массы газа, мы не ждём бесконечное время, а ждём время достаточно продолжительное по сравнению с некоторым классом взаимодействий (например, молекулярных столкновений), который и производит тот тип равновесия, который мы рассматриваем. При изучении кислорода в металлическом кане, мы не ждём так долго, чтобы стенки кана могли бы окислиться или чтобы металл испарился бы в пространство, как в конце концов должно было бы произойти, так как он имеет конечное давление пара, также как мы не рассматриваем всех ядерных реакций, которые время от времени (в согласии с нашей теорией) имеют место для сталкивающихся молекул.

Мы должны быть внимательны при интерпретации этих результатов наших теорий, когда они исследуются с полной математической строгостью. У нас нет физической строгости, которая была бы достаточно хорошо определена. Если имеется что-либо слегка неправильное в нашем определении рассматриваемых теорий, тогда полная математическая строгость может трансформировать эти ошибки в нелепые выводы.

Вопрос заключается в том, как в квантовой механике описать ту идею, что состояние вселенной в прошлом было каким-то особенным. Очевидный путь состоит в том, чтобы сказать, что волновая функция мира (если таковая существует) была определённой ψ₀ при 𝑡=-(возраст вселенной). Но это означает, что волновая функция ψ в настоящее время говорит нам не только о нашем мире, но в равной степени и обо всех других возможных вселенных, которые могли эволюционировать из того же самого начала. Это парадокс кота на большом масштабе. Эквивалентно представляется ”наш мир” плюс все другие мёртвые коты, чья смерть была квантовой контролируемой случайностью. Из этого ”наш мир” может быть получен ”редукцией волнового пакета”. Каков механизм этой редукции? Вы должны или предположить, что наблюдаемые создания делают что-либо, не описываемое квантовой механикой (т.е. уравнением Шрёдингера), или что все возможные миры, которые могли бы эволюционировать из прошлого, являются одинаково ”реальными”. Это не значит сказать, что тот или иной выбор является ”плохим”, но значит только отметить, что я верю, что теперешняя квантовая механика подсказывает тот или иной выбор.

2.2. Трудности гипотетических теорий

При построении новой теории мы должны побеспокоиться о том, чтобы добиться того, чтобы построенные теории были точными, дающими описание, из которого могут быть сделаны определённые заключения. Мы не хотим следовать моде, которая позволила бы нам менять детали теории в любом месте, в котором мы найдём, что теория противоречит экспериментам или нашим начальным постулатам. Любая неясная теория, которая не является полным абсурдом, может быть поправлена более неясным разговором в каждом случае, в котором возникают несогласованности - и если мы начинаем верить в такой разговор более, чем в (экспериментальное) доказательство, мы будем находиться в плачевном состоянии. Нечто подобного рода происходит с вариантами единой теории поля. Например, может быть, что одна такая теория говорила, что имеется тензор 𝐽μν, который ”ассоциируется” с электромагнитным тензором. Но что значит такое ”ассоциирование”? Если мы устанавливаем, что эти два объекта идентичны, то такая теория предсказывает неверные эффекты. Но если мы не уточнили, что значит ”ассоциировано”, мы не знаем, что сказано. И разговор о том, что такая ”ассоциация” означает ”предлагать” некоторое новое соотношение, приводит в никуда. Такие неверные предсказания приписываются неверным ”предложениям” скорее, чем неверной теории, и люди сохраняют намерение добавлять новую часть некоторого антисимметричного тензора, которое могло бы как-нибудь устранить недостатки теории. Такой умозрительный разговор заслуживает доверия не больше, чем разговор исследователей чисел, которые ищут случайные соотношения между определёнными величинами, которые должны были бы непрерывно модифицироваться в том случае, если бы значения этих величин измерялись всё с большей и большей точностью сначала первоначально выбранных величин, а затем всё более и более мелких долей этих величин для того, чтобы предлагаемые соотношения не отставали от всё более и более малых неопределённостей в измеряемых величинах.

В этой связи я хотел бы рассказать анекдот, который был частью беседы, произошедшей после коктейля в Париже несколько лет тому назад. Это случилось в то время, когда все дамы таинственным образом исчезли, и я столкнулся лицом к лицу со знаменитым профессором, который торжественно сидел в кресле, окружённый своими студентами. Он спросил: ”Скажите мне, профессор Фейнман, почему Вы уверены в том, что фотон не имеет массы покоя?” Я ответил: ”Конечно, это зависит от массы; очевидно, что если эта масса бесконечно мала, то этот эффект нигде не мог бы проявиться, и я не мог бы опровергнуть его существование, но я был бы рад обсудить, что эта масса не является равной определённой конечной величине. Но условие обсуждения состоит в том, что после того, как я дам аргументы о невозможности такого значения массы, должно быть против правил менять значение массы”. Тогда профессор выбрал значение 10⁻⁶ массы электрона.

Мой ответ состоял в том, что, если мы согласны с тем, что масса фотона связана с частотой как ω=√𝑘²+𝑚², фотоны с различными длинами волн должны были бы путешествовать с различными скоростями. Тогда при наблюдении затменной двойной звезды, которая от нас достаточно удалена, мы должны были бы наблюдать затмение в голубом и красном диапазоне в различное время. Поскольку ничего подобного не наблюдается, мы можем положить верхний предел на эту массу, который, если использовать числа, порядка 10⁻⁹ массы электрона. Мой ответ был переведён профессору. Тогда он захотел узнать, чтобы я сказал, если бы он сказал 10⁻¹² массы электрона. Переводивший студент был смущён таким вопросом, я протестовал, что это против наших правил, но согласился попробовать снова.

Если фотоны имеют малую массу, одинаковую для всех фотонов, большие относительные различия от поведения безмассовых фотонов ожидаются в тех случаях, когда длина волны больше. Так что из резкости известного отражения импульсов радара, мы можем положить верхний предел на массу фотона, который несколько лучше, чем предел, получаемый из аргумента двойной затменной звёздной системы. Оказывается, что эта масса должна быть меньше 10⁻¹⁵ массы электрона.

После этого, профессор снова захотел изменить значение массы и сделать её равной 10⁻¹⁸ массы электрона. После этого вопроса все студенты забеспокоились, я запротестовал, поскольку он нарушает правила, делая эту массу всё меньше и меньше, я не смог бы привести аргументы в некотором случае. Тем не менее, я попытался снова. Я спросил его, согласен ли он с тем, что если фотон имеет малую массу, то из аргументов теории поля потенциал фотона зависит от расстояния как exp(-𝑚𝑟)/𝑟. Он согласился. Тогда Земля имеет статическое магнитное поле, которое, как известно, продолжается в пространство на некоторое расстояние (что известно из поведения космических лучей), на расстояние, по-крайней мере, равное нескольким Земным радиусам. Но это значит, что масса фотона должна быть величиной меньшей, чем та, которая соответствует длине распада порядка 8000 миль или 10⁻²⁰ массы электрона. В этом месте, к моему облегчению, беседа закончилась.

Мы не должны поступать подобным образом при попытках построить теорию гравитации из известных полей, модифицируя величины взаимодействий или вводя новые постулаты в каждом месте, в котором мы обнаружим трудности; мы должны быть готовы выдвинуть определённые теории, использующие известное поведении наших полей, и подготовится к тому, чтобы отвергнуть их, если они окажутся неадекватными.

2.3. Обмен одним нейтрино

Посмотрим можем ли мы получить силу, чем либо похожую на гравитацию, обменом одним нейтрино. Эти пробные теории, которые мы обсуждаем, неточно сформулированы и не полностью исследованы потому, что они не кажутся подходящими, когда мы делаем первые несколько оценок. Может быть, возможно преодолеть эти трудности, которые заставляют нас отвергнуть эти оценки, но я чувствую, что предпочтительнее упорно придерживаться тех правил, относительно которых мы договорились, что мы должны пытаться дать объяснение в терминах известных свойств частиц без каких бы то ни было новых постулатов. Это мне не удалось.

Фейнмановские лекции по гравитации

Рис. 2.3.

Обмен нейтрино может обладать потенциалом, который зависит от расстояния как 1/𝑟, поскольку его масса равна нулю. Но так как нейтрино имеет полуцелый спин, одиночный обмен не приводит к статической силе, поскольку после одиночного обмена источник нейтрино не находится больше в том же самом состоянии, в котором он был первоначально. Для того, чтобы получить из обмена силу, а не только рассеяние, необходимо, чтобы диаграмма, включающая этот обмен, могла бы интерферировать с диагональными членами в амплитуде рассеяния, что состоит в том, что произошло бы добавление к амплитуде, которая соответствует тому, что ничего не происходит (2.3). Таким образом, возможность обмена одним нейтрино управляется тем фактом, что половина единицы углового момента не может быть испущена объектом, который остаётся в том же самом внутреннем состоянии, в котором находился исходно.

Фейнмановские лекции по гравитации

Рис. 2.4.

Бесспиновый мезон с нулевой массой мог бы привести к потенциалу, пропорциональному 1/𝑟. Наиболее просто вычислить дополнительную энергию взаимодействия в координатном пространстве по сравнению с импульсным пространством. Импульсный пропагатор для такой частицы был бы 1/𝑘². Нейтринный пропагатор имеет вид 1/𝑘 или 𝑘/𝑘², таким образом имеет более высокую степень 𝑘 в числителе; было бы даже ещё труднее связать такой пропагатор с силой типа гравитационной. Для мезона с нулевым спином мы вычисляем диаграмму, интегрируя по всем возможным моментам времени, в которые происходит испускание, и по всем моментам времени захвата, в которые происходит захват мезона, пропагатор δ+=1/(𝑡²-𝑟²+𝑖ε) (рис. 2.4), дополнительная энергия есть (опуская множители)


𝐸

𝑖𝑑𝑡

𝑡²-𝑟²+𝑖ε

1

𝑟

.


(2.3.1)


В последнем соотношении интегрирование проводится только по времени испускания (или только по времени захвата); повторное интегрирование вводит временной множитель, который представляет нормальное опережение фазы, так что он не представляет энергии взаимодействия.

Мы не установили точно только, как мы ожидаем, чтобы массы появились как множители, но имеется весьма мало смысла делать это, поскольку мы не знаем никаких бесспиновых нейтрино. Эта теория убивается половиной единицы углового момента, переносимого при взаимодействии.

2.4. Обмен двумя нейтрино

Фейнмановские лекции по гравитации

Рис. 2.5.

Может быть мы всё ещё можем получить теорию гравитации путём обмена двух нейтрино, так что они могут иметь диагональные расчётные элементы. Нет ясного пути, идя по которому, можно увидеть, почему энергия взаимодействия между двумя большими объектами должна была бы быть в точности пропорциональна их массам, хотя очевидно, что она была бы, по крайней мере, грубо пропорциональна числу частиц в каждом из них. Оставляя в стороне это обстоятельство (или возвращаясь назад, если что-либо работает не так, как следует), мы будем говорить, что взаимодействие двух объектов пропорционально произведению 𝑚₁⋅𝑚₂, умноженному на взаимодействие одной пары частиц. Мы продвигаемся много дальше, чем в предыдущем случае, но делаем это несколько более аккуратно, поскольку результаты более интересные. Амплитуда того, что испускается пара нейтрино за время 𝑑𝑡 есть 𝐺'𝑑𝑡. Амплитуда того, что одно нейтрино испускается из одной точки в другую равна 1/(𝑡²-𝑟²+𝑖ε) Мы введём массы взаимодействующих частиц 𝑚₁, 𝑚₂ говоря, что эти массы должны представлять общее число частиц так, что энергия между двумя массами равна


𝐸

=

𝑚₁

𝑚₂

𝐺'²

𝑖𝑑𝑡

(𝑡²-𝑟²+𝑖ε)²

.


(2.4.1)


Этот интеграл может быть весьма легко взят, либо вычислением вычетов в полюсах или простым дифференцированием интеграла (2.3.1), так что энергия равна


𝐸

=

𝑚₁

𝑚₂

𝐺'²π

2


1

𝑟²

,


(2.4.2)


где 𝑟 расстояние, разделяющее частицы. Таким образом, мы обнаруживаем, что обмен двумя нейтрино приводит значение энергии, которое неправильно зависит от расстояния. Это заключение приводит к выводу, что теория выглядит безнадёжно. Но надежда возникает вновь, если мы анализируем ситуацию несколько дальше. Оказывается, что мы можем получить член, который зависит как 1/𝑟, рассмотрением обмена между тремя массами. Три частицы могут обмениваться двумя нейтрино между любыми из трёх пар и новым способом (рис. 2.5). Положим, что первое испускание имело место при 𝑡=0, а другие вершины имели место в моменты времени 𝑡 и 𝑠. Тогда во взаимодействие вовлечена была бы энергия


𝐺'³

𝑚₁

𝑚₂

𝑚₃

𝑖²

𝑑𝑠 𝑑𝑡

(𝑠²-𝑟₁₂)(𝑡²-𝑟₂₃)[(𝑠-𝑡)²-𝑟₃₁]

.


(2.4.3)


Этот интеграл может быть вычислен последовательным интегрированием в каждом из полюсов и результат равен


𝐸

=-

𝐺'³

𝑚₁

𝑚₂

𝑚₃

π²

1

(𝑟₁₂-𝑟₂₃-𝑟₁₃)𝑟₁₂𝑟₂₃𝑟₁₃

.


(2.4.4)


Если одна из масс, скажем масса номер 3, существенно удалена, так что 𝑟₁₃ много больше, чем 𝑟₁₂, то мы, действительно, получаем, что взаимодействие между массами номер 1 и номер 2 обратно пропорционально величине 𝑟₁₂.

Что же такое масса 𝑚₃? Это, очевидно, может быть некоторая эффективная средняя величина по всем другим массам во вселенной. Влияние удалённых масс, сферически распределённых вокруг масс 1 и 2, проявилось бы как интеграл по средней плотности; мы бы имели


𝐸

=-

𝐺'³𝑚₁𝑚₂π²

𝑟₁₂

4πρ(𝑅)𝑅²𝑑𝑅

2𝑅³

,


(2.4.5)


где 𝑅 - большое значение расстояния 𝑅≈𝑟₁₂≈𝑟₂₃ Для простой оценки мы можем взять плотность, равной константе внутри сферы; мы выполним интегрирование от некоторого начального значения радиуса, которое, тем не менее, достаточно большое по сравнению со значением 𝑟₁₂. Вклад всех масс вне сферы с этим минимальным значением радиуса является чем-то типа


𝐸

=-

𝑚₁𝑚₂

𝑟₁₂

2π³

𝐺'³

ln


𝑅₀

𝑅𝑖


ρ

.


(2.4.6)


Этот логарифм является некоторой величиной, которая не может быть многим больше, чем 50 или 100, так как характерное значение внешнего радиуса может быть равно 𝑇𝑐=10¹⁰ световых лет 10²⁸ см. Такая энергия действует подобно гравитации; можем ли мы опровергнуть это? Да, и двумя способами. Во-первых, величина этого логарифмического члена становится сравнимой с величиной всей силы (2.4.2), пропорциональной 1/𝑟³, на расстояниях больших, чем те, на которых ньютоновский закон гравитации уже проверен. Более того, если мы рассматриваем влияние Солнца на гравитационное взаимодействие между Землёй и Луной, мы обнаруживаем, что это влияние должно было бы приводить к наблюдаемым отклонениям в орбитальном движении, так как расстояние от Земли до Солнца меняется при движении Земли вдоль своей орбиты. Мы оцениваем этот эффект следующим образом. Мы хотим сравнить вклад Солнца во взаимодействие Земля - Луна со вкладом всех остальных звёзд. Это влияние зависит от массы и обратно пропорционально кубу расстояния. Для логарифма меньшего, чем 1000, вклад Солнца превосходит в 10¹² вклад звёзд для любой разумной оценки плотности звёзд! Таким образом, мы можем пренебречь вкладом звёзд. Но таких больших возмущений, которые бы соответствовали изменению эффективной гравитационной константы, которое бы возникало от ±2 процентной вариации расстояния между Землёй и Солнцем, не наблюдалось в системе Земля - Луна.

Фейнмановские лекции по гравитации

Рис. 2.6.

Но можно ли всё-таки спасти эту теорию? Представляется, что процессы более высокого порядка могли бы снять эти трудности, например процесс, включающий 4 нейтринных линии или даже более высокие порядки, мог бы быть вычислен. Ясно, что член, изображённый на рис. 2.6, мог бы дать вклад порядка 𝑚₃², т.е. квадрата числа частиц окружающих масс, и, следовательно, влияние удалённой туманности могло бы значительно превзойти влияние Солнца. Этот факт мог бы быть ещё более справедливым для более высоких порядков теории. Мы должны, следовательно, суммировать диаграммы различных порядков, типа изображённых на рис. 2.7.

Фейнмановские лекции по гравитации

Рис. 2.7.

Тем не менее, насколько я могу судить из статистики Ферми, члены различных порядков оказываются противоположными по знаку и никакого удовлетворительного результата не получается.

Чтобы объяснить эту идею более формально, мы полагаем, что в теории (где есть, скажем, скаляр ψ) с квадратичной связью ψφ²ψ математическое ожидание для произведения двух полевых переменных φ(1)φ(2) в состоянии при наличии многих туманностей может определяться соотношением


〈φ(1)φ(2)〉

=

δ

+

(𝑆₁₂²)

+

𝐶


(2.4.7)


где первый член есть обычный вакуумный член, а 𝐶 возникает от взаимодействия с удалённой туманностью. Величина 𝐶 практически не зависит от 1 и 2, если они (1 и 2) близки по сравнению с радиусом вселенной.

Тем не менее, я думало, что для спина 1/2 не может возникать 𝐶. Для фотонов такой член, даже если он возникает, не имел бы желаемого эффекта, т.к. насколько я могу видеть, этот член не является квадратичным для связи фотонов.

Итак, теория с двойной нейтринной парой не привела к плодотворному результату. Однако, мы научились кое-чему, работая с этой теорией от начала до конца, что представляет собой весьма замечательную идею. Если мы построим теорию гравитации, основанную на взаимодействии трёх тел, в которой одно тело достаточно далеко удалено от других двух тел, закон 1/𝑟 будет выполняться, если квант поля имеет целый спин, и величина потенциала будет пропорциональна количеству вещества в удалённом теле. Эти туманности, которые до сих пор не влияли на наши физические законы, могут играть важную роль в гравитационном взаимодействии!

Тем не менее, для того, чтобы построить такую теорию, мы должны были бы предположить существование бозона с нулевой массой, который взаимодействует квадратично со всей остальной материей во вселенной, и должны были бы вернуться к вопросу, почему сила в точности пропорциональна массе. Но кажется, что нет смысла следовать по такому извилистому пути, когда мы не достигли цели с использованием известных частиц. Если предположить существование новой частицы, мы можем построить абсолютно хорошую теорию, предполагая существование частицы с нулевой массой и со спином 2, которая взаимодействует линейно с веществом.

Лекция 3

3.1. Спин гравитона

Ранее мы обсуждали с точки зрения воображаемых венерианских учёных возможные интерпретации гравитации на языке известных полей. Мы предполагаем, что эти учёные знают общие свойства различных вариантов теории поля; они пытаются отыскать поля, обладающие характеристиками гравитации. Для того, чтобы сделать различие между разными возможностями, нам необходимо вспомнить следующие свойства гравитации; что большие массы притягивают с силой, пропорциональной инерции и обратно пропорциональной квадрату расстояния; также, что масса и инерция характеризуют значение энергии, так что энергия связи атомов и ядер имеет гравитационное поведение, аналогичное энергии покоя.

Мы можем представить себе, что одна группа теоретиков, специалистов по теории поля, пыталась интерпретировать гравитацию в терминах известных частиц, как мы это делали на предыдущей лекции, и эта попытка провалилась. Другая группа теоретиков, специалистов по теории поля, начала выводить некоторые свойства нового поля, которое вело бы себя как гравитация.

Во-первых, обнаруживается, что гравитация обладает дальнодействием, что автоматически означает, что энергия взаимодействия зависит от расстояния как 1/𝑟. Не существует другой подобной возможности в теории поля. Это поле переносится посредством обмена частицей, которую ниже будем называть гравитоном. Она должна иметь массу 𝑚=0, так что сила, пропорциональная 1/𝑟², следует из из данного взаимодействия. Следующая догадка, которую мы должны сделать перед тем, как мы сможем начать работать в теории поля, состоит в том, что необходимо определить спин гравитона. Если спин равен 1/2 или полуцелый, то мы столкнёмся с трудностями, которые обсуждались в последней лекции (разделе 2.3), и где не было обнаружено интерференции между амплитудами одиночного обмена и не было обмена взаимодействием. Таким образом, спин гравитона должен быть целым, т.е. некоторое число из последовательности 0, 1, 2, 3, 4, … . Любое из этих значений спина давало бы взаимодействие, пропорциональное 1/𝑟, так как радиальная зависимость определяется исключительно массой. Для того, чтобы выбрать между различными возможными значениями спина, мы должны посмотреть на более тонкое различия между эффектами, обусловленными гравитонами с различными значениями спина. Мы можем себе представить, что наша группа теоретиков, специалистов по теории поля, разделила между собой эту работу так, что одни вывели возможные заключения из гипотезы, что спин равен нулю, другие анализировали возможность того, что спин равен 1, другие, что спин равен 2, 3 или даже 4. Затраты труда, связанные с обсуждением деталей теории для более высоких значений спина, значительно больше, чем для более низких значений спина, так что мы будем обсуждать эти значения в порядке возрастания.

Теория, в которой спин частицы равен 1, в большой степени то же самое, что и электродинамика. Нет ничего такого, что запрещало бы существование двух полей со спином 1, но гравитация не может быть одним из этих полей, потому что одно из следствий спина 1 заключается в том, что одинаковые заряды отталкиваются, а противоположные притягиваются. Это фактически свойство всех теорий с нечётным спином; и наоборот, обнаружено, что теории с чётным спином описывают силы притяжения, так что нам надо рассматривать только значения спинов 0 или 2 и возможно 4, если теория со спином 2 окажется неудовлетворительной; нет нужды работать с более сложными вариантами теории до той поры, пока не обнаружено, что более простые теории оказываются неадекватными.

Фейнмановские лекции по гравитации

Рис. 3.1.

Отклонение теорий гравитации со спином гравитона, равным 0, делается на основании гравитационного поведения энергии связи. Мы не намереваемся обсуждать здесь все детали до конца; мы приведём аргументы по аналогии, а затем приступим напрямую к построению теории со спином гравитона, равным 2. Зададим следующий вопрос: каково притяжение между движущимися объектами; больше оно или меньше, чем для статических объектов? Мы можем, например, вычислить взаимное притяжение двух масс газа; экспериментальное исследование гравитации приводит к выводу, что эта сила больше в том случае, если газ горячее (рис. 3.1).

Мы знаем, как это происходит в электродинамике. Электрические силы не меняются при случайном движении частиц. Теперь энергия взаимодействия пропорциональна ожидаемому значению оператора γ𝑡, который равен 1/√1-𝑣²/𝑐². Так как потенциал, следующий из этого оператора, не является зависимым от скорости, то коэффициент пропорциональности должен быть √1-𝑣²/𝑐². Это означает, что энергия взаимодействия, следующая из оператора1, соответствующего полю со спином 0, была бы пропорциональна √1-𝑣²/𝑐². Другими словами, теория со спином гравитона, равным 0, предсказывала бы, что взаимодействие между массами горячего газа было бы меньше, чем для холодного газа. Аналогичным способом может быть показано, что теория со спином гравитона, равным 2, приводит к энергии взаимодействия, которая имеет 1/√1-𝑣²/𝑐² в знаменателе, что согласуется с экспериментальными результатами о влиянии на гравитацию энергии связи. Таким образом, теория со спином гравитона 0 должна быть отвергнута, и нам необходимо рассматривать спин гравитона 2 для того, чтобы иметь теорию, в которой взаимодействие будет пропорционально величине энергии.

3.2. Амплитуды и поляризации в электродинамике, типичной полевой теории

Сейчас наша программа состоит в том, чтобы построить теорию со спином гравитона 2 по аналогии с другими теориями поля, которые у нас есть. В этом месте мы могли бы перейти на взгляд Эйнштейна на теорию гравитации, так как он получил правильную теорию, но будет более поучительно и проще для нас изучить свойства теории, если мы поддерживаем фантазию венерианских учёных для того, чтобы предположить свойства правильной теории. Поэтому, предполагая, что многие учёные сегодня могут придти к правильной теории гравитации, мы отнюдь не умаляем достижение Эйнштейна. В настоящее время у нас есть ретроспективный, хорошо развитый формализм, которого не было пятьдесят лет назад, и у нас есть указание Эйнштейна на правильное направление теории. Очень трудно представить себе, чтобы мы делали, если бы мы не знали того, что мы знаем, когда мы знаем то, что знаем, но давайте продвинемся дальше и сделаем предположения о правильной теории по аналогии с электродинамикой.

В теориях со скалярным, векторным и тензорным полями (другой способ обозначения спина 0, 1, 2) поля описываются скалярной, векторной или тензорной потенциальными функциями


Спин

0

𝑋

Скалярный потенциал


Спин

1

𝐴

μ

Векторный потенциал


Спин

2

μν

Симметричный тензорный потенциал


Другая теория могла бы следовать из предположения, что тензор - антисимметричный; это не привело бы к чему-то, напоминающему гравитацию, скорее к теории, напоминающей электромагнетизм; шесть независимых компонент антисимметричного тензора могли появиться как два пространственных вектора.

Фейнмановские лекции по гравитации

Рис. 3.2.

Источник электромагнетизма - векторный ток 𝑗μ, который связывается с векторным потенциалом уравнением


𝐴

μ

=-

1

𝑘²

𝑗

μ

.


(3.2.1)


Сделаем преобразование Фурье и используем импульсное представление. Оператор Даламбера в импульсном представлении есть просто 𝑘². Вычисление амплитуд в электромагнетизме делается с помощью пропагаторов, связывающих токи, способом, изображённым диаграммами, такими, как на рис. 3.2. Вычислим амплитуды для таких процессов как функцию релятивистских инвариантов, и ограничим наш ответ, как предписывается законами сохранения импульса и энергии. Суть электромагнетизма состоит в детальном описании взаимодействия между током и полем, т.е. 𝑗μ𝐴μ; на языке источников это становится взаимодействие между двумя токами


-𝑗'

μ

1

𝑘²

𝑗

μ

.


(3.2.2)


Координатные оси могут быть выбраны таким образом, что вектор 𝑘μ может быть выражен как


𝑘

μ

=

(ω,𝑘,0,0)

.


(3.2.3)


Заметим, что мы используем упорядочение индекса 4, 3, 2, 1 так, что


𝑥

μ

=

(𝑡,𝑧,𝑦,𝑥)

,

𝐴

μ

=

(𝐴₄,𝐴₃,𝐴₂,𝐴₁)

.


(3.2.4)


Тогда ток-ток взаимодействие, когда незаряженные частицы имеют 4-импульс 𝑘μ задается соотношением


-𝑗'

μ


1

𝑘²


𝑗

μ

=

-1

ω²-𝑘²

(

𝑗'₄𝑗₄

-

𝑗'₃𝑗₃

-

𝑗'₂𝑗₂

-

𝑗'₁𝑗₁

).


(3.2.5)


Закон сохранения заряда, который утверждает, что четыре-дивергенция тока равна нулю, в пространстве импульсов становится ограничением


𝑘

μ

𝑗

μ

=

0.


(3.2.6)


В этой специальной системе координат, которую мы выбрали, это ограничение связывает третий и четвёртый компонент этих токов соотношениями


ω𝑗⁴

-

𝑘𝑗³

=

0,


или


𝑗³

=

ω

𝑘

𝑗⁴

.


(3.2.7)


Если мы подставляем выражение для 𝑗₃ в выражение амплитуды (3.2.5), мы получаем, что


-𝑗'

μ


1

𝑘²


𝑗

μ

=

𝑗'₄𝑗₄

𝑘²


1

ω²-𝑘²

(

𝑗'₁𝑗₁

+

𝑗'₂𝑗₂

).


(3.2.8)


Теперь мы можем дать интерпретацию двум членам этого уравнения. Четвёртый компонент тока есть просто плотность заряда; в этой ситуации, когда у нас есть стационарные заряды, это единственный ненулевой компонент. Первый член не зависит от частоты, и когда мы делаем обратное преобразование Фурье для того, чтобы преобразовать выражение в пространство взаимодействия, мы находим, что полученное соотношение представляет мгновенно действующий кулоновский потенциал


(𝐹.𝑇.⁻¹)


𝑗'₄𝑗₄

𝑘²


=

𝑒²

4π𝑟

δ(𝑡-𝑡')

.


(3.2.9)


Это выражение всегда представляет собой главный член в пределе малых скоростей. Этот член кажется мгновенным, но это только потому, что разделение на два члена, которое мы сделали, очевидно, не является ковариантным. Общее взаимодействие на самом деле ковариантная величина; второй член представляет поправки к мгновенному кулоновскому взаимодействию.

Во взаимодействие между двумя токами всегда вовлечены виртуальные фотоны. Мы можем узнать кое-что о свойствах реальных фотонов из анализа полюсов амплитуды взаимодействия, которая имеет место при ω±𝑘. Конечно, любой фотон, который участвует в физическом эффекте, может рассматриваться как виртуальный фотон, так как он не наблюдается до тех пор, пока не произойдёт взаимодействие, так что наблюдаемые фотоны никогда не характеризуются соотношением ω±𝑘. Тем не менее, нет трудностей в приближении к этому пределу; физически мы знаем фотоны, которые приходят от Луны или Солнца, для которых относительная разница между величинами ω и 𝑘 очень, очень мала. Если мы полагаем, что мы наблюдаем фотоны от удалённых галактик, которые находятся от наблюдателя на расстоянии в миллионы световых лет, мы понимаем, что это должно придать тот физический смысл, чтобы думать, что мы близки к полюсу так, что для этих фотонов не может быть никакого физического эффекта не являющимся похожим на полюсный член. Вычет полюсного члена при ω=𝑘 есть сумма двух членов, каждый из которых есть произведение двух множителей. Кажется, что существует один тип фотонов, которые взаимодействуют с токами 𝑗₁ и 𝑗'₁ и другой тип фотонов, которые взаимодействуют с токами 𝑗₂ и 𝑗'₂ Пользуясь обычным языком, мы описываем данную ситуацию, говоря, что имеются две независимые поляризации для фотонов.

Круговая поляризация есть ничто иное, как линейные комбинации плоскополяризованных фотонов, соответствующих разделению суммы произведений (𝑗'₁𝑗₁+𝑗'₂𝑗₂) в различном базисе, таким образом мы имеем


(𝑗'₁𝑗₁+𝑗'₂𝑗₂)

=

1

√2

(𝑗₁+𝑖𝑗₂)

1

√2

(𝑗'₁+𝑖𝑗'₂)*

+


+

1

√2

(𝑗₁-𝑖𝑗₂)

1

√2

(𝑗'₁-𝑖𝑗'₂)*

.


(3.2.10)


По-прежнему, мы видим здесь, что имеется два типа фотонов. Преимущество такого разделения становится очевидным, когда мы рассматриваем вращение координатной системы вокруг направления движения фотона 3. Фотоны с круговой поляризацией вращаются вокруг себя, потому что они меняют только фазу при повороте системы координат на угол θ эти фазы равны exp(𝑖θ) и exp(-𝑖θ).

Квантово-механические правила, описывающие поведение систем под действием вращения, говорят нам, что системы, имеющие такое свойство, находятся в состоянии с определённым значением углового момента; фотоны, которые меняют фазу как exp(𝑖θ), имеют проекцию углового момента 1, а фотоны с изменением фазы exp(-𝑖θ) - проекцию, которая равна -1.

Мы могли бы ожидать, что если фотоны имеют спин, равный 1, то мог бы существовать третий тип фотонов, имеющих проекцию спина, равную 0. Тем не менее, может быть показано, что для релятивистской теории частиц с нулевой массой покоя разрешены только два состояния проекции, имеющие максимальное и минимальное значения проекции вдоль направления распространения. Этот общий результат, справедливый для частиц с любым спином, был доказан Вигнером. Мы не будем приводить здесь это доказательство, но просто для тех случаев, которые нас интересуют, фотона сейчас и гравитона ниже, покажем существование этих двух состояний точным разделением этого взаимодействия.

Можно было бы возразить, что мы показали существование двух состояний для токов, которые являются операторами источника в большей степени, чем для самих фотонов. Но одно влечёт за собой другое, так как амплитуда процесса испускания фотон с круговой поляризацией -1 задаётся оператором тока (𝑗'₁-𝑖𝑗'₂)/√2 и т.д. Если мы вращаем систему координат, то амплитуда для процесса излучения не должна бы меняться, так что, мы приходим к требованию соответствующего изменения фазы для самих фотонов. Действительная поляризация фотонов, возможно, наилучшим образом определяется проекциями векторного потенциала в выделенных направлениях, таких как 𝑒μ (𝑒μ - единичный вектор). Взаимодействие такого фотона с током 𝑗μ, т.е. амплитуда поглощения или испускания такого фотона задаётся соотношением


-𝑒

μ

𝑗

μ

=

(проекция

𝑗

μ

вдоль

𝑒

μ

)


(3.2.11)


3.3. Амплитуды для обмена гравитона

Выпишем амплитуды для обмена гравитоном по простой аналогии с электродинамикой. Мы должны будем обратить особое внимание на мгновенные нерелятивистские члены, так как только эти члены выявляются в существующих экспериментальных наблюдениях гравитации. Полная теория даёт нам как члены, описывающие мгновенное взаимодействие (аналогичное кулоновскому взаимодействию), так и поправки, которые появляются как запаздывающие волны; мы должны будем разделить эти запаздывающие эффекты для вычислений наблюдаемых эффектов.

Мы предполагаем, что оператор Даламбера в импульсном пространстве есть 𝑘² по простой аналогии с уравнением (3.2.1) мы ожидаем, что тензор поля устанавливает соотношение с тензором источника следующим образом


μν

=

1

𝑘²

𝑇

μν

.


(3.3.1)


Какое это может быть взаимодействие? Так как электродинамика описывает токи, предположим, что тензоры источника появляются в энергии взаимодействия следующим образом


𝑇'

μν


1

𝑘²


𝑇

μν

.


(3.3.2)


Теперь наша задача состоит в том, чтобы описать частные характеристики тензора 𝐓 так, чтобы воспроизводились характеристики гравитации. A priori возможно, что тензор 𝐓 включает в себя градиенты, который и есть вектор 𝐤. Если в тензор включены только градиенты, то в результирующей теории нет монополей; простейшими объектами могут быть диполи. Мы хотим, чтобы тензор 𝐓 был таким, как в нерелятивистском пределе, а плотность энергии появлялась по аналогии с плотностями заряда 𝑇₄₄. Как хорошо известно, мы имеем в электромагнетизме тензор давления, чья компонента 𝑇₄₄ является в точности плотностью энергии электромагнитного поля. Следовательно, очень вероятно, что имеется некоторый общий тензор, чей компонент 𝑇₄₄ является плотностью полной энергии; это будет задавать ньютоновский закон гравитации в пределе малых скоростей, энергия взаимодействия при этом


-𝑇'₄₄𝑇₄₄

𝑘²

.


(3.3.3)


Затем, для того, чтобы иметь правильную релятивистскую теорию, необходимо следовать тому, чтобы амплитуда включала в себя полный тензор 𝐓, как мы предполагали в соотношении (3.3.2).

Имеется свойство этого тензора, которое мы не ещё упомянули. След симметричного тензора - инвариантная величина, не обязательно равная нулю. Таким образом, при вычислениях, основываясь на симметричном тензоре с ненулевым следом, мы могли бы взять теорию, которая есть смесь теорий со спином равным 0 и со спином равным 2. Если мы выписываем теорию, использующую этот тензор, мы найдём, когда мы придём к разделению взаимодействия на его поляризации, что очевидно имеется три поляризации вместо двух, которые допустимы для безмассовой частицы со спином 2. Для того, чтобы быть более точными, мы можем получить кроме взаимодействия (3.2.2) другую возможную инвариантную форму, пропорциональную 𝑇μμ(1/𝑘²)𝑇νν. Мы попытаемся установить соотношения между этими двумя инвариантами таким образом, чтобы не было обмена реальными гравитонами с угловым моментом, равным нулю.

Выпишем в точности все различные члены следующим образом


𝑇'

μν

1

𝑘²

𝑇

μν

=

1

ω²-𝑘²

(

𝑇'₄₄𝑇₄₄

-

2𝑇'₄₃𝑇₄₃

-

2𝑇'₄₂𝑇₄₂

-


-

2𝑇'₄₁𝑇₄₁

+

2𝑇'₂₃𝑇₂₃

+

2𝑇'₃₁𝑇₃₁

+


+

2𝑇'₂₁𝑇₂₁

+

𝑇'₃₃𝑇₃₃

+

𝑇'₂₂𝑇₂₂

+

𝑇'₁₁𝑇₁₁

).


(3.3.4)


В электродинамике мы получили упрощение, используя закон сохранения заряда. Здесь мы получаем упрощение, используя закон сохранения энергии, который может быть выражен в импульсном пространстве следующим образом


𝑘

μ

𝑇

μν

=

0.


(3.3.5)


В нашей обычной системе координат, где компоненты 𝑘¹ и 𝑘² равны нулю, получаем связь компонентов нашего тензора с индексами 3 и 4


ω𝑇

=-

𝑘𝑇

.


(3.3.6)


Используя это соотношение для исключения компонентов с индексом 3, мы находим, что амплитуда разделяется на часть, описывающую мгновенное взаимодействие, имеющую характерный числитель 𝑘², и запаздывающую часть со знаменателем (ω²-𝑘²). Для ”мгновенного” члена мы получаем


-

1

𝑘²


𝑇'₄₄𝑇₄₄

1

-

ω²

𝑘²


-

2𝑇'₄₁𝑇₄₁

-

2𝑇'₄₂𝑇₄₂

,


(3.3.7)


и для ”запаздывающего” члена


1

ω²-𝑘²

(

𝑇'₁₁𝑇₁₁

+

𝑇'₂₂𝑇₂₂

+

2𝑇'₂₁𝑇₂₁

).


(3.3.8)


Трансверсальные компоненты тензора 𝐓 предположительно независимы, так что они представляют сумму трёх независимых произведений или трёх поляризаций. Мы видим, что такая теория содержит смесь спина 0 и спина 2. Для того, чтобы исключить часть, соответствующую спину нуль, мы должны добавить к нашей амплитуде член вида


α

𝑇'

ν

ν


1

𝑘²


𝑇'

μ

μ

.


(3.3.9)


В ”запаздывающем” члене добавляются компоненты тензора следующим образом


α

1

ω²-𝑘²

(

𝑇'₁₁

+

𝑇'₂₂

)(

𝑇₁₁

+

𝑇₂₂

).


Мы можем выбрать параметр α так, что ”запаздывающий” член содержит только сумму двух независимых произведений. Соответствующее значение параметра α равно -½ для того, чтобы сделать запаздывающий член равным


1

ω²-𝑘²



1

2

(

𝑇'₁₁

-

𝑇'₂₂

)(

𝑇₁₁

-

𝑇₂₂

)+

2𝑇'₁₂𝑇₁₂

.


(3.3.10)


Имеется два направления поляризации, которые порождаются этими комбинациями элементов тензора


1

√2

(

𝑇₁₁

-

𝑇₂₂

)


и


2

(

𝑇₁₁

).


(3.3.11)


Различная нормализация есть результат симметрии нашего тензора; мы можем восстановить симметрию, записывая


2

(

𝑇₁₁

)

=

1

√2

(

𝑇₁₁

-

𝑇₂₂

).


(3.3.11a)


Следовательно, возможное решение типа плоской волны, представляющее наш гравитон, имеет вид


μν

=

𝑒

μν

exp(𝑖𝑘

σ

𝑥

σ

)

,


(3.3.12)


где тензор поляризации 𝑒μν имеет следующие ненулевые компоненты


𝑒₁₁

=

1

√2

,

𝑒₂₂

=-

1

√2

,

𝑒₁₂

=

𝑒₂₁

=

1

√2

.


(3.3.13)


Наше взаимодействие в общем виде


𝑇'

μν

1

𝑘²

𝑇

μν

-

1

2

𝑇'

μ

μ

1

𝑘²

𝑇

ν

ν


может быть записано как 𝑇'στ𝑃στ,μν𝑇μν, где 𝑃στ,μν пропагатор для гравитона описывается следующим соотношением:


𝑃

στ,μν

=

1

2

(

η

μσ

η

ντ

+

η

μτ

η

νσ

-

η

μν

η

στ

)

1

𝑘²

.


Для простоты мы обычно будем предпочитать записывать этот пропагатор как простой множитель 1/𝑘² и представлять взаимодействие виртуальными гравитонами, испущенными источником с амплитудой


μν

=

1

𝑘²


𝑇

μν

-

1

2

η

μν

𝑇

σ

σ


и со связью ℎμν𝑇'μν для поглощения.

Амплитуда для излучения реального гравитона поляризации 𝑒στ, если 𝑒σσ, как в соотношении (3.3.13), задаётся внутренним (скалярным) произведением 𝑒στ𝑇στ.

3.4. Физическая интерпретация в терминах амплитуд

Фейнмановские лекции по гравитации

Рис. 3.3.

Поляризация гравитона есть тензорная величина. Мы можем наглядно представить это понятие с помощью картинок, подобных тем, которые мы использовали в описании давлений; мы рисуем стрелки, показывающие направление, которое ассоциировано с нормалью к поверхности, к осям координат. В этой плоскости, перпендикулярной направлению распространения, мы имеем два давления, изображённые на рис. 3.3. Имеется только две возможности для квадрупольного давления; давления, представляемые стрелками, направленными к началу координат (или от начала координат), представляют собой тип давления в жидкости, которое соответствует спину, равному нулю. ”Давления” (в действительности вращения), представляемые всеми стрелками, поворачивающимися в направлении по часовой стрелке (или против часовой стрелки), соответствует спину 1.

Фейнмановские лекции по гравитации

Рис. 3.4.

Давление, представленное на рис. 3.3(a), может относится к осям, которые повёрнуты на угол 45° от исходных осей координат; в этом случае картинка на рис. 3.4 есть ничто иное, как то же самое давление, изображённое на рис. 3.3(a), повёрнутое на угол 45°. Отсюда мы находим, что эти поляризации поворачиваются одна в другую при повороте осей на угол 45°. Если мы поворачиваем на угол 90°, то каждая поляризация переходит в себя; стрелки меняют своё направление, но мы должны думать об осциллирующей зависимости от времени, которая связана с этими поляризациями. Двигаясь этим путём, мы видим, что полное вращение на угол 360° соответствует двум полным циклам фазы - спин равен двум. Существуют две ортогональных линейных комбинации этих двух поляризаций, чьи изменения вращательной фазы ведут себя как exp(2𝑖θ) и exp(-2𝑖θ). Это просто различное разделение ”запаздывающего” члена; методом проб и ошибок мы можем просто представить эти две части


1

4

(

𝑇'₁₁

-

𝑇'₂₂

+

𝑖2𝑇'₁₂

)(

𝑇₁₁

-

𝑇₂₂

-

𝑖2𝑇₁₂

)+


+

1

4

(

𝑇'₁₁

-

𝑇'₂₂

-

𝑖2𝑇'₁₂

)(

𝑇₁₁

-

𝑇₂₂

+

𝑖2𝑇₁₂

).


(3.4.1)


Эти части характеризуются спином 2, проекция ±2 тензоров очевидна, когда мы сравниваем форму этих произведений с произведением гармонических многочленов; мы знаем, что (𝑥±𝑖𝑦)(𝑥±𝑖𝑦) очевидно характеризуются спином 2 и проекцией ±2; эти произведения равны 𝑥𝑥-𝑦𝑦±2𝑖𝑥𝑦, которые имеют ту же структуру, что и члены в соотношении (3.4.1). Таким образом, мы приходим к выводу, что при α=-1/2, наши гравитоны имеют только две возможных поляризации. Эта возможно правильная теория, эквивалентная теории поля спина 2, которую ранее рассматривали теоретики Паули и Фирц и выразили на языке полевых лагранжианов [FiPa 39].

Мы подходим к теории со спином 2, исходя из аналогий с теорией со спином 1; таким образом мы без объяснений предполагаем существование гравитонных плоских волн; так как плоские волны фотона представляются полюсами пропагатора, и пропагатор гравитона также имеет полюсы ω=±𝑘. Но соответствующие наблюдательные свидетельства отсутствуют; мы не наблюдали ни гравитонов; ни даже классических гравитационных волн.

Имеются некоторые проблемы, которыми мы пренебрегли полностью в настоящее время, но к которым мы вернёмся позднее. Источники электромагнетизма сохраняются, и энергия также сохраняется, которая есть источник гравитации. Но это сохранение совершенно другого характера, так как фотон - незаряжен, следовательно, он не является источником самого себя, тогда как гравитон содержит энергию, равную ℏω, и следовательно, он сам является источником гравитонов. Мы говорим об этом, как о нелинейности гравитационного поля.

В электромагнетизме мы можем вывести полевые уравнения (уравнения Максвелла), которые несогласованы, если заряд не сохраняется. До сих пор мы избегали обсуждения полевого уравнения для гравитации, поскольку мы беспокоились только об амплитудах, но не о самих полях. Также нам необходимо уже обсудить, является ли теория, которую мы можем написать, зависимой от калибровки, и можем ли мы написать вообще полевое уравнение, соответствующее максвелловским уравнениям ∂𝐹μν/∂𝑥ν=𝑗μ

Имеются некоторые физические свойства нашей теории, которые могут быть обсуждены без полевых уравнений, просто из рассмотрения формы взаимодействия. Запишем полное выражение, соответствующее α=-1/2:


2

𝑇'

μν


1

𝑘²


𝑇

μν

-

1

2

𝑇'

ν

ν


1

𝑘²


𝑇

μ

μ

=


=-

1

𝑘²


𝑇'₄₄𝑇₄₄

1

-

ω²

𝑘²


+

𝑇₄₄

(

𝑇'₁₁

+

𝑇'₂₂

)+


+

𝑇'₄₄

(

𝑇₁₁

+

𝑇₂₂

)-

4𝑇'₄₁𝑇₄₁

-

4𝑇'₄₂𝑇₄₂

-


-

1

𝑘²-ω²

[(

𝑇'₁₁

-

𝑇'₂₂

)(

𝑇₁₁

-

𝑇₂₂

)+

4𝑇'₁₂𝑇₁₂

].


(3.4.2)


(Если потребуется, то член (ω²/𝑘²)𝑇'₄₄𝑇₄₄ может заменяться на 𝑇'₄₃𝑇₄₃ или на (𝑇₄₄𝑇'₃₃ + 𝑇₃₃𝑇'₄₄)). Мы уже обсудили запаздывающий член и его поляризации. Теперь проанализируем первый член. Тензор 𝐓 - тензор давления; для медленных частиц пространственные компоненты порядка 𝑣/𝑐, так что ньютоновский закон представляется только одним своим произведением 𝑇₄₄𝑇'₄₄. Другие произведения представляют собой что-то подобное магнетизму. Заметим, что при таком разделении они появляются как члены, описывающие мгновенное взаимодействие. Запаздывающие эффекты, движущиеся волны появляются только при чётных степенях 𝑣/𝑐.

Мы можем думать, что члены, описывающие мгновенное взаимодействие типа магнитного, могли бы давать наблюдаемые эффекты, например, могло бы быть небольшое изменение в гравитационном взаимодействии между двумя колёсами, если мы вращаем их всё быстрее и быстрее. Рассматриваемая теория действительно предсказывает подобные эффекты, но практически подобные силы не только были бы очень, очень малы, но они также были бы скрыты множеством других эффектов. Магнитные силы, такие как притяжение между двумя проводящими ток проволочками, достаточно просто наблюдать только потому, что эффекты кулоновского взаимодействия взаимно уничтожаются очень, очень точно при наличии равных величин положительного и отрицательного зарядов. Но все гравитационные силы притягивающие, так что нет надежды на подобное взаимное уничтожение этих сил. Для вращающихся колёс трудность была бы в том, что упругое давление вещества вносило бы добавку в члены, описывающие энергию взаимодействия, колеса бы управлялись слегка по разному и т.д. В добавление к этому, мы можем думать, что обычное гравитационное взаимодействие довольно трудно измерить, и что эффекты типа магнитных могут быть меньше на некоторое отношение (𝑣/𝑐)² такое, как отношение магнитных сил к кулоновским. Силы между проволочками, проводящими ток, порядка грамма веса, в то время как кулоновские взаимодействия между частицами в проволочках (в случае, если бы они взаимно не уничтожались) порядка миллиардов миллионов тонн.

Возможно пронаблюдать эффекты, обусловленные таким членом типа магнитного, если мы рассмотрим гравитационное взаимодействие частиц, движущихся со скоростью света или с близкой к ней скоростью. Предположим, что 𝑇'μν обусловлен стационарным источником, таким как Солнце, так что остаётся только компонент 𝑇'₄₄, и мы рассмотрим гравитационное взаимодействие между Солнцем и быстрой частицей, которая движется со скоростью 𝑣, близкой к скорости света 𝑐, так что её тензор давления имеет компоненты, такие как 𝑇₁₁=(𝑣²/𝑐²)𝑇₄₄. Затем в соотношении (3.4.2) мы видим, что энергия взаимодействия больше, чем обусловленная только 𝑇₄₄ на множитель 1+𝑣²/𝑐² или на множитель 2 для фотона. Таким образом, так как фотон движется в сильном гравитационном поле, то он движется как частица, обладающая большей энергией, чем можно было бы предсказать, исходя из ньютоновской теории. Отклонение луча света звезды тогда, когда луч проходит вблизи поверхности Солнца, в два раза больше, чем величина, получаемая при анализе изменения импульса в рамках ньютоновской теории гравитации. Земляне провели подобный эксперимент и обнаружили, что наблюдаемая величина угла отклонения больше, чем величина, получаемая в рамках ньютоновской теории, на множитель, который очень близок к 2. И хотя данный наблюдательный факт достаточно несовершенен и не во всем согласован, он предполагает действительный эффект в направлении, предсказываемом нашей теорией.1

1 B 1970-х годах были проведены наблюдения по измерению отклонений гравитационным полем Солнца положений радиоисточников с помощью радиоинтерферометров с очень большой базой и предсказания ОТО были подтверждены с точностью до 1 - 3 % процентов [Заха 97*]. (Прим. перев.)

В этом месте мы могли бы приступить к вычислению в деталях таких эффектов, как и рассмотренный выше, а также многих других задач, таких как комптоновское рассеяние гравитонов, эффектов, связанных с движением Меркурия вокруг Солнца, для того, чтобы найти порядки величин гравитационных эффектов и определить, какие эксперименты могли бы быть возможными. Тем не менее, возможно предпочтительнее приступить к описанию самого гравитационного поля на языке полевого лагранжиана и полевых уравнений, чем на языке амплитуд.

3.5. Лагранжиан для гравитационного поля

Теперь мы будем изучать нашу теорию на языке лагранжиана, исследуя сами поля, а не просто амплитуды. Сначала вновь рассмотрим ситуацию в электродинамике. Здесь действие есть


𝑆

𝐸

=-

𝑑τ


1

4



∂𝐴μ

∂𝑥ν

-

∂𝐴ν

∂𝑥μ




∂𝐴μ

∂𝑥ν

-

∂𝐴ν

∂𝑥μ


+

𝑗

μ

𝐴

μ

.


(3.5.1)


Именно из такого лагранжиана мы в конце концов выводим полевые уравнения; мы хотим получить гравитационный аналог соотношения 𝐴μ=-(1/𝑘²)𝑗μ.

Нетрудно сделать предположение о форме второго члена, описывающего взаимодействие. Мы предполагаем, что этот член равен -λℎμν𝑇μν. Здесь аналогия для членов, в которые вовлечены производные, не так очевидна; просто имеется слишком много индексов, которые могут быть переставлены слишком большим числом способов. Мы будем должны написать общую форму для лагранжиана, как сумму по всем возможным способам записи полевых производных, подставляя произвольные коэффициенты перед каждым членом, т.е. записывая его следующим образом:


𝑎


∂ℎμν

∂𝑥σ

∂ℎμν

∂𝑥σ


+

𝑏


∂ℎμσ

∂𝑥ν

∂ℎμν

∂𝑥σ


+

𝑐


∂ℎμμ

∂𝑥ν

∂ℎσν

∂𝑥σ


+… .


(3.5.2)


Наша теория не будет полна до тех пор, пока мы не придумаем некоторый критерий для определения значений коэффициентов 𝑎, 𝑏, 𝑐, 𝑑, 𝑒, ….

Возможно мы можем сделать предположение по некоторой аналогии с электромагнетизмом. Если мы вычисляем вариацию общего лагранжиана (3.5.1) по отношению к 𝐴, мы получаем дифференциальное уравнение, связывающее поля и ток


∂𝑥ν


∂𝑥ν

𝐴

μ

-

∂𝑥ν


∂𝑥μ

𝐴

ν

=

𝑗

μ

.


(3.5.3)


Для экономии записи далее мы будем показывать такие дифференцирования (градиенты), просто указывая индексы координат после запятой; уравнение, которое приведено выше, имеет следующий вид:


𝐴

μ,ν

-

𝐴

ν,μ

=

𝑗

μ

.


(3.5.4)


Закон сохранения заряда выражается вычислением дивергенции 𝑗μ, равной нулю. Но мы можем заметить, что уравнения Максвелла для этого поля несогласованы, за исключением закона сохранения заряда, и что градиент от выражения в левой части соотношения (3.5.4) тождественно равен нулю. С использованием правильного лагранжиана электромагнитного поля, закон сохранения заряда может быть выведен как следствие полевых уравнений. Так как левая часть уравнения (3.5.4) удовлетворяет этому тождеству, его дивергенция также равна нулю:


𝐴

μ,ν

,νμ

-

𝐴

ν,μ

,νμ

=

0.


(3.5.5)


Подобное условие используется для того, чтобы определить величину коэффициентов 𝑎, 𝑏, 𝑐, 𝑑, 𝑒, … относительно друг друга. Мы будем выписывать общий лагранжиан, выводить дифференциальные полевые уравнения путём вариации лагранжиана и требовать, что, так как дивергенция тензора 𝐓 обращается в нуль, полевые величины, которые равны этому тензору, должны иметь дивергенцию, которая равна нулю тождественно. Это условие будет влиять на однозначный выбор значений коэффициентов. Мы проведём ниже алгебраические вычисления подробно, устанавливая значения коэффициентов таким образом, что полевые уравнения согласованы, если только


𝑇

μν

=

0.


(3.5.6)


3.6. Уравнения гравитационного поля

Вывод уравнений начнём с выписывания всех возможных произведений нашего полевого тензора ℎμν. На каждом шагу имеют место значительные упрощения, если мы используем симметрию тензора ℎμν при комбинации различных членов. Если два тензорных индекса отличны от индекса производной, мы имеем два различных произведения


1.

μν,σ

μν,σ


2.

μν,σ

μσ,ν


Если имеются два индекса, которые равны, мы можем иметь три возможных произведения


3.

μν

σ

μ,σ


4.

μν

σ

σ,μ


5.

ν

ν,μ

σ

σ,μ


Не все пять произведений необходимо рассматривать, произведение п. 2 может быть опущено, поскольку оно может быть преобразовано в произведение п. 3 интегрированием по частям. Таким образом, предполагаем, что лагранжиан имеет следующий вид


𝑆

=

𝑑τ

𝑎

μν,σ

μν,σ

+

𝑏

μν

σ

μ,σ

+

𝑐

μν

σ

σ,ν

+


+

𝑑

ν

ν,μ

σ

σ,μ

-

λ

𝑇

μν

μν

.


(3.6.1)


Теперь мы вариируем эту сумму четырёх произведений по отношению к тензору ℎαβ для того, чтобы получить дифференциальное уравнение, связывающее полевые производные с тензором источника 𝑇αβ. Таким образом, приходим к следующему результату (необходимо помнить, что δℎαβ симметричен по индексам α, β, так что симметричная часть его коэффициентов должна быть равна нулю)


𝑎2

αβ,σ

+

𝑏

(

ασ,β

+

βσ,α

)

+


+

𝑐

(

σ

σ,αβ

+

η

αβ

μν

,νμ

)

+

𝑑2

η

αβ

σ

σ,μ

μ

=-

λ𝑇

αβ

.


(3.6.2)


Мы берём производную каждого из этих членов по отношению к индексу β, тогда требование, что дивергенция левой части должна быть равна нулю, приводит к следующему уравнению


2𝑎

αβ,σ

,σβ

+

𝑏

ασ,β

,σβ

+

𝑏

βσ,α

,σβ

+

𝑐

σ

σ

,αβ

β

+


+

𝑐

μν

,μν

α

+

2𝑑

σ

σ,μ

,μα

=

0.


(3.6.3)


Теперь объединяем члены с одним и тем же множителем и берём значение соответствующего коэффициента равным нулю; получаем следующие соотношения, которые включают в себя перестановку и смену индексов:


αβ,σ

,σβ

(2𝑎+𝑏)

=

0,


βσ,α

βσ

(𝑏+𝑐)

=

0,


σ

σ,β

αβ

(𝑐+2𝑑)

=

0.


(3.6.4)


Если мы выбираем масштаб для наших результатов такой, что 𝑎=½, мы получаем


𝑎

=

1

2

,

𝑏

=

-1

,

𝑐

=

1

,

𝑑

=-

1

2

.


(3.6.5)


Предположительно, теперь мы получили правильный лагранжиан для гравитационного поля. Как следствие из этого лагранжиана мы получим в конце концов полевое уравнение.

3.7. Определение символов

Манипуляции с тензорными величинами становятся всё более скучными в той работе, которой мы занимаемся; и для того, чтобы не увязнуть в алгебре со многими индексами, могут быть разработаны некоторые упрощающие приёмы. В настоящее время не очевидно, что определения, которые мы делаем, полезны; подтверждение этому проявится в их более позднем использовании.

Определим оператор ”черта” для произвольного тензора второго ранга следующим образом:


𝑋

μν

=

1

2

(

𝑋

μν

+

𝑋

νμ

)-

1

2

η

μν

𝑋

σ

σ

.


(3.7.1)


Для симметричного типа, такого как 𝐡, это правило проще, потому что два члена в первой скобке равны


μν

=

μν

-

1

2

η

μν

σ

σ

,


(3.7.2а)



μν

=


μν

.


(3.7.2б)


Заметим, что оператор ”черта” является своим собственным обратным оператором для симметричного тензора.

Определим также использование неиндексированного тензорного символа, чтобы представить его след


=

Th(𝐡)

=

σ

σ

,


σ

σ

=-

.


(3.7.3)


Используя такие обозначения, можно записать полевые уравнения (3.6.2) с учётом (3.6.5) в симметризованном варианте


μν,σ

-

2

μσ,ν

=-

λ

𝑇

μν

.


(3.7.4)


Для того, чтобы получить соотношение для 𝑇μν, мы просто берём оператор ”черта” от обеих частей последнего уравнения.

Следующим шагом мы попробуем найти что-либо аналогичное свойствам калибровочной инвариантности электродинамики для того, чтобы упростить решение уравнения (3.7.4). В электродинамике полевые уравнения имеют вид:


𝐴

μ,ν

-

𝐴

ν

,νμ

=

𝑗

μ

,


(3.7.5)


следствие которых состоит в возможности описания полей так же хорошо на языке нового четыре вектора 𝐴'μ, получаемого из вектора 𝐴μ добавлением градиента скалярной функции 𝑋


𝐴'

μ

=

𝐴

μ

+

𝑋

.


(3.7.6)


Какое свойство было бы аналогичным свойством тензорного поля? Мы предполагаем, что следующее свойство может быть справедливым: (мы должны быть внимательны для того, чтобы сохранить наши тензоры симметричными) подстановка


ℎ'

μν

=

μν

+

𝑋

μ,ν

+

𝑋

ν,μ


(3.7.7)


в левую часть уравнения (3.7.4) не меняет вид этого уравнения. Доказательство этого факта оставляем в качестве упражнения.

С использованием свойства калибровочной инвариантности, было бы проще получить уравнения для полей в определённой калибровке, что более подходяще, что-то типа лоренцевой калибровки в электродинамике. По аналогии с выбором


𝐴

ν

=

0,


(3.7.8)


мы сделаем следующий выбор (который будем называть условием Лоренца)


μσ

=

0.


(3.7.9)


Таким образом, получаем полевые уравнения, связывающие оператор ”черта” от тензора 𝐓 с полями


μν,σ

=-

𝑘²

μν

=-

λ

𝑇

μν

,


(3.7.10)


или решая ℎμν=(λ/𝑘²)𝑇μν. Немедленно получаем, что амплитуда взаимодействия такого тензора 𝐡 с другим источником 𝑇'μν от λℎμν𝑇'μν в лагранжиане, имеет следующее выражение


λ²

𝑇'

μν


1

𝑘²


𝑇

μν

.


Итак, мы получили в точности то, что мы получили прежде при обсуждении амплитуд непосредственно.

Лекция 4

4.1. Связь между рангом тензора и знаком поля

Мы хотели бы вывести некоторые полезные общие свойства полей, используя свойства лагранжевой плотности. Для гравитационного поля мы определим в данном месте константу взаимодействия и нормализацию плоских волн, которые мы будем отныне использовать. Мы положим


λ

=

8π𝐺

.


(4.1.1)


Здесь, 𝐺 - обычная гравитационная постоянная в естественных единицах (ℏ=𝑐=1); квадратный корень включается в определение с тем, чтобы константа λ стала аналогична заряду электрона 𝑒 в электродинамике, что предпочтительнее того, чтобы подобная величина была пропорциональна квадрату заряда. Множитель √8π служит для того, чтобы исключить не относящиеся к делу множители из большей части полезных соотношений. Для того, чтобы представить плоско-волновые гравитоны, мы будем использовать поля


μν

=

𝑒

μν

exp(𝑖𝑘⋅𝑥)

,


(4.1.2)


с вектором поляризации 𝑒μν, нормализованным таким образом, что


𝑒

μν

𝑒

μν

=

1.


(4.1.2)


Действие, которое описывает общую энергию полей гравитации, вещество и взаимодействие между веществом и гравитонами, имеет следующий вид


𝑆

=

1

2

𝑑𝑉

μν,λ

μν,λ

-2

μλ

μν


(поля)


+

𝑑𝑉

(

μν

𝑇

μν

)


(член взаимодействия)


+

𝑆

𝑀


(материя).


(4.1.4)


Мы можем вывести из лагранжианов полей некоторые важные свойства, например, мы можем понять, почему гравитация притягивает как частицы, так и античастицы, в то время как в электричестве одинаковые заряды отталкиваются, а противоположные притягиваются. Может быть показано, что это свойство связано со знаком лагранжиана, так что если мы изменим знак лагранжиана 𝑆→-𝑆, сила меняет знак. Знак констант взаимодействия λ или 𝑒, или 𝑔 не даёт отличий в теории, так как он появляется в квадрате в любой диаграмме, которая представляет поправку к энергии; всегда вовлечены две вершины. Мы можем поменять знак энергии, соответствующей диаграмме такой, как изображённой на рис. 4.1, только, если мы можем ввести множитель 𝑖 в каждой вершине, например, если мы должны использовать поля 𝑖φ вместо φ.

Фейнмановские лекции по гравитации

Рис. 4.1.

Тем не менее, поля φ должны представлять соответствующие плоские волны, которые согласовано определены так, что установившиеся волны в большой коробке имеют положительные значения энергии и квантово-механические осцилляторы, которые представляют эти установившиеся волны, ведут себя правильно. Скалярные поля имеют плоские волны


φ

=

𝑎

exp(𝑖𝑘⋅𝑥)

.


(4.1.5)


Амплитуда 𝑎 для квантового поля появляется как координата квантово-механического осциллятора. Если значения кинетической энергии таких осцилляторов, которые пропорциональна 𝑎̇², должны представлять положительные значения энергии, мы обязаны записать нашу теорию последовательным образом, и замена φ→𝑖φ была бы ошибкой.

Для электромагнитных волн именно компоненты в трансверсальном направлении, перпендикулярном направлению распространения, ограничиваются при подобном рассмотрении. Отрицательный знак появляется в связанной энергии потому, что энергия включает в себя пространственные индексы в скалярное произведение двух векторов, которое мы определили как


𝐴

μ

𝐵

μ

=

𝐴₄𝐵₄

-(

𝐴₃𝐵₃

+

𝐴₂𝐵₂

+

𝐴₁𝐵₁

).


(4.1.6)


Знак кулоновских сил связан со знаком временных компонент в лагранжиане. Для гравитационных волн также имеются трансверсальные компоненты, которые заключены в определённые пределы, а при свёртке по двум индексам (или даже по чётному числу индексов) знаки сокращаются, знак временных компонентов ℎ₄₄ противоположен случаю, рассматриваемому в случае электричества, и мы имеем притяжение.

4.2. Тензор энергии-импульса для скалярной материи

Прежде, чем мы сможем вычислять наблюдаемые эффекты и делать предсказания другие, чем закон ”обратных квадратов”, и то, что ”одинаковые тела” притягиваются с силой, пропорциональной его энергии, мы должны определить, как материя определяет тензор давления 𝑇μν. Сначала мы проведём в некоторых деталях вычисления, основанные на простейшем предположении, что материя может быть представлена скалярной функцией φ. Позднее нам понадобится рассматривать функции более высокого ранга; возможно в конце курса мы рассмотрим вещество со спином ½, поскольку такое вещество имеет свойства, существенно отличающиеся от вещества, характеризующегося целым спином. Для исследования свойств материи с целыми значениями спина 1 и 2 требуются более сложные алгебраические преобразования, однако никаких принципиальных нововведений привлекать не требуется.

Как сделать обобщение плотности энергии-импульса для скалярного поля φ. Если заглянуть в книгу Вентцеля [Went 49] по теории поля, мы обнаружим, что предлагается следующая процедура. Предположим, что лагранжиан зависит от полей и их производных


=

ℒ(

ψ

𝑖

ψ

𝑖

).


(4.2.1)


Компонент с индексами {44} тензора энергии-импульса должен представлять плотность энергии, которая есть гамильтониан. Поэтому используя обычное классическое описание для выражения гамильтониана из лагранжиана


𝐻

=

𝑞̇

∂𝐿

∂𝑞̇

-

𝐿

,


(4.2.2)


получаем следующее соотношение


𝑇

μ

ν

=

ψ

𝑖

∂ℒ

∂ψ𝑖

-

δ

μ

ν

.


(4.2.3)


Это правило не является корректным в общем случае. Во-первых, оно не обязательно приводит к выражению, симметричному по индексам μ и ν. Если тензор 𝑇μν - несимметричен, то результирующая теория - патологическая (например, нет способа определить угловой момент в таком поле). Закон сохранения энергии в общем случае не выполняется, поскольку в дивергенцию включены члены, которые не являются больше равными


𝑇

μν

𝑇

νμ

.


(4.2.4)


В нашем частном скалярном случае правило (4.2.3) действительно приводит к тому, чтобы получить удовлетворительную симметричную форму. Мы получаем лагранжиан и действие


𝑆

(Скалярная материя)


=

1

2

𝑑𝑉

(

φ

φ

-

𝑚²φ²

),


(4.2.5)


который даёт следующее выражение для тензора давления


𝑇

μν

=

φ

φ

-

1

2

η

μν

φ

φ

+

1

2

𝑚²φ²η

μν

.


(4.2.6)


С учётом тензора давления для скалярной материи (4.2.6) член, описывающий взаимодействие в лагранжиане, имеет следующий вид:


-λℎ

μν

𝑇

μν

=-

λ

μν

φ

φ

-

1

2

μν

η

μν

(

φ

φ

-

𝑚²φ²

)

.


(4.2.7)


В наших компактных обозначениях, использующих оператор ”черта”, последнее соотношение может быть переписано следующим образом:


μν

φ

φ

+

1

2

𝑚²φ²

.


(4.2.8)


Теперь мы можем использовать член, описывающий взаимодействие, для того, чтобы получить амплитуды для рассеяния при обмене гравитоном.

4.3. Амплитуды для рассеяния (скалярная теория)

Фейнмановские лекции по гравитации

Рис. 4.2.

Амплитуда рассеяния, соответствующая обмену одним гравитоном, представлена на диаграмме, изображённой на рисунке 4.2, и может быть записана из исследования диаграммы, так как мы знаем форму пропагатора и для каждой вершины у нас есть член, описывающий взаимодействие, задаваемое лагранжианом (4.2.7). Заменим градиенты компонентами 4-импульса в импульсном представлении


𝑖φ

=

𝑝

ν

,


(4.3.1)


так что член, описывающий взаимодействие, становится следующим для одной из вершин



¹𝑝μ²𝑝ν


-

1

2

η

μν

(

¹𝑝

σ

²𝑝

σ

-

𝑚²

)

.


(4.3.2)


Мы пишем подчёркивание под произведением 𝑝μ𝑝ν для того, чтобы напомнить, что мы должны использовать соответствующим образом симметризованную версию, так как ℎμν - симметричен. Более точно,


𝐴μ𝐵ν


1

2

[

𝐴

μ

𝐵

ν

+

𝐴

ν

𝐵

μ

].


(4.3.3)


Для второй вершины нам также необходима ”черта” для выражения, которое имеет следующий вид



³𝑝μ⁴𝑝ν


-

1

2

𝑚²η

μν

.


(4.3.4)


Тогда полное выражение для амплитуды есть следующее



³𝑝μ⁴𝑝ν


-

1

2

𝑚²η

μν


1

𝑞²



¹𝑝μ²𝑝ν


-

1

2

η

μν

(

¹𝑝

σ

²𝑝

σ

-

𝑚²

)

.


(4.3.5)


Выбранные обозначения (”черты”, ”подчёркивания” и т.п.) приведут к упрощениям в алгебраических манипуляциях в более сложных вычислениях, которые необходимо будет выполнять, так что стоит ими воспользоваться.

Наша теория дала нам выражение для амплитуды гравитационного рассеяния одной частицы другой. Для того, чтобы вычислить что-нибудь, что имеет измеримую величину, мы должны придти к очень большим значениям массы, и для того, чтобы наблюдать эффект, который не определяется ньютоновским законом, нам необходимо использовать движения со скоростями, близкими к скорости света. Мы можем, например, вычислить угол отклонения тела малой массы, движущегося с очень большой скоростью (𝑣≈𝑐), которое отклоняется звездой, такой как Солнце. Здесь нам необходимо обосновать замену суммы амплитуд от всех частиц в звезде одной амплитудой, соответствующей массе 𝑀; подобная замена является аппроксимацией, но она даёт правильный ответ в первом порядке некоторого типа. Такой угол больше, чем его величина в рамках ньютоновской теории, и отличается на множитель (1+𝑣²/𝑐²).

Нельзя говорить о том, что этот результат соответствует отклонению света Солнца, потому что фотон не является скалярной частицей, отсюда следует, что он не может представляться скалярным массовым полем φ. Для рассеяния двух идентичных частиц такая амплитуда должна содержать обменный член, но для случая звезды - частицы, очевидно, не идентичны.

В нашей теории до сих пор не рассматривалась возможность того, что мы могли бы добавить член с нулевой дивергенцией к нашему тензору давления 𝑇μν; это соответствовало бы другому распределению в пространстве масс и давлений. Этот и связанные с ним вопросы в дальнейшем будут подробно обсуждаться. Даже для скалярной материи, как мы увидим, у нас есть действительная двусмысленность при определении тензора энергии-импульса 𝑇μν. Эта трудность также возникает в электродинамике, когда мы пытаемся записать взаимодействие фотонов с заряженными векторными мезонами.

4.4. Подробные свойства плоских волн. Эффект Комптона

Мы можем изучить свойства гравитационных волн в отсутствии материи; вариируя лагранжиан, получим уравнение


μν,λ

-

2

μσ,ν

=

0,


(4.4.1)


которое аналогично уравнению Максвелла в пустом пространстве. Если мы используем решения типа плоских волн


μν

=

𝑒

μν

exp(𝑖𝑞⋅𝑥)

,


(4.4.2)


то уравнение принимает следующий вид


𝑞²

𝑒

μν

-

𝑞

ν

𝑞

σ

𝑒

σμ

-

𝑞

μ

𝑞

σ

𝑒

σν

=

0.


(4.4.3)


Мы интересуемся случаями, когда 𝑞²≠0 и 𝑞²=0. Если 𝑞²≠0, мы можем разделить на 𝑞² и переставить члены уравнения так, что


𝑒

μν

=

𝑞

ν


1

𝑞²

𝑞

σ

𝑒

σμ

+

𝑞

μ


1

𝑞²

𝑞

σ

𝑒

σν

.


(4.4.4)


Такое разделение вектора на два слагаемых в точности выражает вектор 𝑒μν как симметризованный градиент


𝑒

μν

=

χ

μ,ν

+

χ

ν,μ

.


(4.4.5)


Ранее мы обсудили, как калибровочная инвариантность гравитационного поля означает, что добавление члена такого вида не приводит к отличиям в физике явления. Отсюда следует, что всегда можно добавить некоторый член к 𝑒μν так, что 𝑒μν=0. Мы будем называть такие волны с 𝑞²≠0 ”калибровочными волнами”; эти волны не связаны ни с какими физическими эффектами и могут быть всегда устранены калибровочным преобразованием.

Если 𝑞²=0, то из уравнения (4.3.3) следует, что


𝑞

σ

𝑒

μν

=

0.


(4.4.6)


Это так называемые свободные волны должны удовлетворять лоренцеву калибровочному условию. Дело не только в выборе


μν

=

0


(4.4.7)


для удобства в случаях, в которых волна не свободна. Этот факт имеет свой электромагнитный аналог, для фотонов величина 𝑞μ𝑒μ должна быть равна нулю.

Мы можем вывести действительный вид тензора поляризации 𝑒μν в системе координат такой, что 4-вектор импульса равен


𝑞

μ

=

(ω,ω,0,0)

.


(4.4.8)


Если мы выбираем


𝑒'

μν

=

𝑒

μν

+

𝑞

μ

χ

ν

+

𝑞

ν

χ

μ


(4.4.9)


и требуем, что 𝑒'μν должна иметь компоненты только в трансверсальном направлении, мы получаем систему уравнений, которая может быть разрешена и получен ответ


𝑒'₁₁

=-

𝑒'₂₂

=

1

√2

,

𝑒'₁₂

=

𝑒'₂₁

=

1

√2

.


(4.4.10)


Для того, чтобы получить соотношения (4.4.10), заметим, что из уравнения (4.4.6) следует, что 𝑒μ4=-𝑒μ3, так что только компоненты с индексами 4, 1 и 2 являются независимыми. Компоненты с индексом 4 могут быть удалены, если требуется, с помощью преобразования (4.4.9). Например, 𝑒'₁₄=𝑒₁₄+ωχ₁, тогда выберем χ₁=-𝑒₁₄/ω, χ₂=-𝑒₂₄/ω. Тогда 𝑒'₄₃=𝑒₄₃+ωχ₄-ωχ₃, выберем χ₃-χ₄=-𝑒₃₄/ω тогда 𝑒'₄₃=𝑒'₄₃=𝑒'₄₄=𝑒'₃₃=0. Выбирая χ₄=-𝑒₄₄/2ω, сделаем следующую величину равной нулю 𝑒'₄₄=𝑒₄₄+2ωχ₄=0. Тогда, так как величина 𝑒'₄₄ также равна нулю, то след 𝑒'σσ равен нулю, следовательно, равны нулю также и 𝑒'₃₃ и 𝑒'₁₁+𝑒'₂₂ Поэтому остались ненулевыми среди величин 𝑒'μν только компоненты с индексами μ,ν = 1 или 2 и для них 𝑒'₁₁=-𝑒'₂₂ Имеется только две линейно независимые нормализованные комбинации (4.4.10).

Фейнмановские лекции по гравитации

Рис. 4.3.

Амплитуда для комптоновского рассеяния гравитона частицей массы 𝑚 соответствует диаграммам, изображённым на рис. 4.3. Поляризации гравитона представляются тензором 𝑒μν; для скалярной массы компоненты импульса в каждой вершине -¹𝑝μ, (¹𝑝ν+¹𝑞ν) = (²𝑝ν+²𝑞ν) и ²𝑝μ. На языке этих величин мы имеем для первой диаграммы


4λ²

²

𝑒

μν

²𝑝

μ

(

²𝑝

ν

+

²𝑞

ν

)-

1

2

𝑚²η

μν


1

(¹𝑝+¹𝑞)²-𝑚²

×


×

¹

𝑒

αβ

¹𝑝

α

(

²𝑝

β

+

²𝑞

β

)-

1

2

𝑚²η

αβ

.


(4.4.11)


Пропагатор написан таким образом, что подходит для скалярной частицы. Некоторые ограничения в этой формуле следуют из ограничения для плоских волн 𝑞²=0 и 𝑞ν𝑒νμ.

4.5. Нелинейные диаграммы для гравитонов

Из калибровочной инвариантности мы ожидаем, что замена ¹𝑒μν на ¹𝑒μν+¹𝑞μ𝑎ν+¹𝑞ν𝑎μ не должна бы влиять на комптоновскую амплитуду. Однако прямая подстановка показывает, что это утверждение не является верным. Что же ошибочно в наших рассуждениях?

Фейнмановские лекции по гравитации

Рис. 4.4.

При комптоновском рассеянии фотонов электронами имеется третья диаграмма, изображённая на рис. 4.4, которая неаналогична ни одной из диаграмм, изображённых на рис. 4.3. Эта диаграмма соответствует квадратичному взаимодействию в 𝐴², которое появляется в лагранжиане для того, чтобы сделать теорию калибровочно инвариантной. По аналогии с ситуацией в электродинамике мы могли бы полагать, что при рассмотрении только пары диаграмм, изображённых на рис. 4.3, мы делали приближение к правильному описанию путём линеаризации. Существование амплитуды с квадратичным взаимодействием, соответствующим диаграмме, изображённой на рис. 4.3, может быть выведено в электродинамике требованием того, чтобы калибровочная подстановка


𝑒'₁

=

𝑒₁

+

𝑞𝑎


(4.5.1)


не должна была бы приводить к изменению в амплитуде в заданном порядке. Такая процедура состоит просто в приравнивании членов одного и того же порядка амплитуд, полученных из 𝑒₁ и 𝑒'₁, с коэффициентами перед каждым членом, которые должны быть определены. Может быть возможно вывести форму квадратичного члена гравитона аналогичным способом, но это пока ещё не было сделано, поскольку самовзаимодействие гравитона делает анализ довольно сложным во втором порядке, и мы получим правильные выражения, используя другой подход.

Может быть интересным попытаться вывести эти члены, применяя прямой подход, так что сделаем несколько замечаний об этом.

Фейнмановские лекции по гравитации

Рис. 4.5.

Если мы рассматриваем добавление к комптоновскому рассеянию не только амплитуд, таких, какие представлены на рис. 4.4, но также амплитуд, соответствующих диаграмме, изображённой на рис. 4.5, у нас вероятно не будет условий для того, чтобы определить все неизвестные параметры более полной теории. Если мы рассмотрим взамен нашей задачи комптоновское рассеяние виртуального гравитона, мы можем увеличить число регулируемых величин, и может быть возможно вновь получить правильную теорию. Включённые в анализ диаграммы могут быть типа изображённых на рис. 4.6, и мы могли бы попытаться сделать сумму калибровочно инвариантной. На самом деле, мы будем решать эти проблемы другим способом, тем не менее, такой подход может быть полезным для того, чтобы изучить детали нашей полевой теории, подходя к решению различными путями.

Фейнмановские лекции по гравитации

Рис. 4.6.

4.6. Классические уравнения движения гравитирующей частицы

Для того, чтобы вычислить некоторые классические эффекты в нашей теории, например, орбиты планет, движущихся вокруг звезды, нам необходимо свести нашу квантовую теорию к её классической форме. Это возможно сделать, выписывая классическую теорию, как результат вариационного принципа на интеграле по траекториям, который заключает в себя действия или временной интеграл от лагранжиана. Движение, описываемое частицей, задаётся минимумом интеграла по траекториям, например, для свободной частицы это минимум интеграла


-

(𝑑𝑠)²

=-

𝑑𝑥

μ

𝑑𝑥

μ

=-


𝑑𝑥μ

𝑑α


𝑑𝑥μ

𝑑α


⎞½

𝑑α

.


(4.6.1)


Что-то должно быть добавлено к интегральному выражению для того, чтобы представить гравитационные эффекты. Имеется более, чем один вариационный принцип, который может дать классическую теорию, так что мы будем использовать вариационный принцип, который даёт более удобные интегралы по траекториям (фактически, принцип, приводящий к уравнению Клейна - Гордона методом интегрирования по траекториям в квантовой механике). Для заряженных частиц мы можем получить уравнения движения, вариируя интеграл


-

𝑚

2

𝑑α


𝑑𝑥μ

𝑑α




𝑑𝑥μ

𝑑α


-

𝑒

𝑑α

𝐴

μ

(𝑥)


𝑑𝑥μ

𝑑α


.


(4.6.2)


После того, как мы проделаем некоторые преобразования, приходим к следующему соотношению


𝑚

𝑑²𝑥μ

𝑑α²

=

𝑒𝐹

μν


𝑑𝑥ν

𝑑α


,


(4.6.3)


где 𝐹μν есть ротор от вектора 𝐴μ. Из этого уравнения, умножая на 𝑑𝑥μ/𝑑α, так как тензор 𝐹μν - антисимметричен, мы находим, что


𝑑

𝑑α



𝑑𝑥μ

𝑑α


𝑑𝑥μ

𝑑α



обращается в нуль, или


𝑑𝑥μ

𝑑α


𝑑𝑥μ

𝑑α

=


𝑑𝑠

𝑑α


⎞²


есть константа, так что величина α пропорциональна собственному времени (и мы можем взять её равным собственному времени, если 𝑚₀ есть масса покоя частицы). Далее мы должны включить наш тензор 𝑇μν в подынтегральное выражение соответствующим образом для того, чтобы получить правильные гравитационные уравнения. В электродинамике вектор, связанный с полем, есть просто производная смещения по отношению к 4-скаляру, т.е. скорость (𝑑𝑥μ/𝑑α) Мы предполагаем, что тензор 𝑇μν есть не что иное, как тензор, порождённый двумя такими скоростями, и подбираем мультипликативную константу так, что компонента с индексами 44 правильно описывает плотность энергии. Мы полагаем


𝑇

μν

=

𝑚₀


𝑑𝑥μ

𝑑α




𝑑𝑥μ

𝑑α


,


(4.6.4)


где α=𝑠=”собственное время”. Компонент с индексами 44 есть на самом деле плотность энергии; он имеет множитель 1/√1-𝑣²/𝑐² для того, чтобы учесть увеличение энергии со скоростью, и другой множитель для того, чтобы учесть одновременное сокращение объёма из-за лоренцева сжатия.

Следовательно, интеграл от лагранжиана или действие, которое должно быть провариировано, имеет следующий вид:


𝑚₀

=

-

1

2

𝑑α


𝑑𝑥μ

𝑑α




𝑑𝑥μ

𝑑α


𝑑α

μν

(𝑥)


𝑑𝑥μ

𝑑α




𝑑𝑥ν

𝑑α



.


(4.6.5)


Введём новый тензор для того, чтобы записать действие в более компактном виде


𝑔

μν

(𝑥)

=

η

μν

+

μν

(𝑥)

,


(4.6.6)


так что действие может быть записано в виде


𝑚₀

=

-

1

2

𝑑α

𝑔

μν

(𝑥)

𝑥'

μ

𝑥'

ν

.


(4.6.7)


Начиная с последнего соотношения и ниже, обозначаем производную по отношению к параметру α знаком ”штрих”. Поскольку мы вариируем функционал (действие) по отношению к координатам траектории, мы получаем два равных члена от каждого из множителей 𝑥'μ, 𝑥'ν и один от тензора 𝑔μν; уравнение движения имеет вид


-

𝑑

𝑑α

(

𝑔

σν

𝑥'

ν

)

+

1

2


∂𝑔μν

∂𝑥σ

𝑥'

μ

𝑥'

ν

=

0.


(4.6.8)


Существуют другие способы записи уравнений, которые могут быть иногда полезны. Сначала мы перегруппируем члены, в которых имеются две скорости, с одной стороны равенства


𝑔

σν

𝑥''

ν

=


1

2


∂𝑔μν

∂𝑥σ

-

∂𝑔σν

∂𝑥ν


𝑥'

μ

𝑥'

ν

.


(4.6.9)


Теперь мы расщепляем второй член на две равные части и переобозначаем индексы суммирования μ↔ν одной части для того, чтобы получить комбинацию, которая задаётся специальным символом, поскольку он часто повторяется


[μν,σ]

=

1

2



∂𝑔μσ

∂𝑥ν

+

∂𝑔νσ

∂𝑥μ

-

∂𝑔μν

∂𝑥σ


.


(4.6.10)


Уравнение движения, выраженное через такую скобку (называемую ковариантными коэффициентами связности), становится довольно простым


𝑔

σν

𝑥''

ν

=-

[μν,σ]

𝑥'

μ

𝑥'

ν

.


(4.6.11)


Имеется одно следствие этого уравнения, которое немедленно получается дифференцированием по параметру α произведения 𝑔μν𝑥'μ𝑥'ν


∂α

(

𝑔

μν

𝑥'

μ

𝑥'

ν

)

=2

𝑔

μν

𝑥'

μ

𝑥''

ν

+

∂𝑔μν

∂𝑥σ

𝑥'

μ

𝑥'

ν

𝑥'

σ

.


(4.6.12)


Если мы перепишем произведение 𝑔μν𝑥''ν в первом члене в правой части его выражением (4.6.9) и переобозначим индексы суммирования, мы находим, что производная тождественно равна нулю. Таким образом, произведение 𝑔μν𝑥'μ𝑥'ν есть скалярная константа. Если мы определим новый параметр 𝑠 следующим соотношением


𝑔

μν

𝑥'

μ

𝑥'

ν

=


𝑑𝑠

𝑑α


⎞²

,


то 𝑠 - аналог собственного времени для задач гравитации. Так как 𝑑𝑠/𝑑α есть константа, мы выберем её равной единице и обозначим ниже все производные по переменной 𝑠 точкой. В частности, тогда


𝑔

μν

𝑥̇

μ

𝑥̇

ν

=

1.


(4.6.13)


4.7. Орбитальное движение частицы вокруг звезды

Уравнение движения может быть записано через полевой тензор следующим образом (что следует из соотношения (4.6.8))


𝑑

𝑑𝑠

(

η

σν

𝑥̇

σ

+

σν

𝑥̇

σ

)=

λ

∂ℎμσ

∂𝑥ν

𝑥̇

μ

𝑥̇

σ

.


(4.7.1)


Перед решением уравнения движения следует заметить, что нам необходимы соответствующие выражения для гравитационных полей. Мы интересуемся этими выражениями в области, где нет источников массы. Таким образом, полевое уравнение


μν,λ

λ

-

2

μλ,ν

=

λ

𝑇

μν


(4.7.2)


может быть решено способом, аналогичным решению уравнения Максвелла, если мы используем лоренцеву калибровку ℎμλ=0. Вспоминая определение даламбертиана □=(∂/∂𝑡)²-∇², получаем


μν

=-

λ

𝑇

μν

.


(4.7.3)


Для гравистатического случая, когда временная зависимость имеет нулевую частоту, мы должны иметь ньютоновский закон для силы; компонент 𝑇₄₄ пропорционален массе. Другие компоненты равны нулю. Полевой тензор есть


₄₄

=-

λ𝑀

4π𝑟

,

=

0,

(ν,μ≠4,4).


(4.7.4)


Тензор без черты получается вычислением оператора ”черты” от обеих частей


μν

=

μν

-

1

2

σ

σ

η

μν

=



-

λ


𝑀

𝑟


если

μ=ν

,


0

в противном случае


(4.7.5)


Подставляем такой полевой тензор в уравнения движения и используем следующие обозначения


φ

=

2λℎ₄₄

,


ψ

=

2λℎ₃₃

=

2λℎ₂₂

=

2λℎ₁₁

.


(4.7.6)


Для данного случая ясно, что φ=ψ=-2𝑀𝐺/𝑟, но в последней лекции мы будем иметь возможность рассмотреть случай, для которого это неверно, так что мы останавливаемся на таком различии в выражении, но предполагаем, что величины φ и ψ являются функциями только 𝑟.

Процедура решения уравнений, описывающих орбиты, аналогична методу решения уравнений для ньютоновского поля. Мы разделяем уравнения на пространственные координаты и временные координаты, исключаем время и параметр α для того, чтобы получить дифференциальное уравнение, связывающее бесконечно малые перемещения по радиальной и угловой координате. Мы исходим из четырёхмерного уравнения (4.7.1). Пространственные координаты (ν=3,2,1) ведут себя согласно следующему уравнению


𝑑

𝑑𝑠

(-

𝑥̇

+

ψ𝑥̇

)=

1

2



∂φ

∂𝑥

𝑡̇²

+

∂ψ

∂𝑥

(

𝑥̇²

+

𝑦̇²

+

𝑧̇²

)

.


(4.7.7)


Уравнение для времени имеет вид


𝑑

𝑑𝑠

(

𝑡̇

+

φ𝑡̇

)=

0.


(4.7.8)


Мы имеем интеграл движения, следующий из уравнения (4.6.13)


𝑥̇

μ

𝑥̇

μ

+

μν

𝑥̇

μ

𝑥̇

ν

=

1,


(4.7.9)


которое приводит для нашего случая к следующему соотношению


𝑡̇

(1+φ)

-

(1-ψ)

(

𝑥̇²

+

𝑦̇²

+

𝑧̇²

)=

1.


(4.7.10)


Из уравнения для времени (4.7.8) следует, что


(1+φ)

𝑑𝑡

𝑑𝑠

=

𝐾,


(4.7.11)


где 𝐾 есть константа (пропорциональная энергии). Это соотношение используется для исключения производной 𝑑𝑡/𝑑𝑠 из уравнения для пространственных компонент (4.7.7). Так как величины φ, ψ зависят только от 𝑟, правая часть уравнения (4.7.7) ориентирована по оси 𝑥. Из этого следует, что


𝑑

𝑑𝑠

[

(1-ψ)

(𝑥̇𝑦-𝑦̇𝑥)

]=

0.


Таким образом, если мы предполагаем, что движение происходит полностью в плоскости 𝑧=0 и используем полярные координаты 𝑟, θ в плоскости 𝑥𝑦, мы имеем дополнительную константу движения 𝐿, связанную с угловым моментом


(1-ψ)

𝑟²θ̇

=

𝐿.


(4.7.12)


Уравнение для радиального движения может быть получено из уравнения (4.7.10), записанного в полярных координатах


𝐾²

1+φ

-

(1-ψ)

(𝑟²θ̇²+𝑟̇²)

=

1.


(4.7.13)


Меняя производную (𝑑𝑟/𝑑θ) на отношение (𝑑𝑟/𝑑𝑠) и (𝑑θ/𝑑𝑠), мы получаем дифференциальное уравнение для орбиты


𝐾²

1+φ

-

𝐿²

(1-ψ)𝑟⁴




𝑑𝑟

𝑑θ


⎞²

+

𝑟²

=

1.


(4.7.14)


Традиционная подстановка 𝑢=1/𝑟 приводит к уравнению, которое можно удобно рассмотреть, анализируя малые возмущения ньютоновских уравнений



𝑑𝑢

𝑑θ


⎞²

+

𝑢²

=


𝐾²

1+φ

-1


1-ψ

𝐿²

.


(4.7.15)


Мы полагаем, что φ=ψ=-2𝑀𝐺/𝑟=-2𝑀𝐺𝑢. Для нерелятивистских движений 𝐾 близка к 1 и 𝐾²/(1+φ)-1=𝐾²-1+2𝑀𝐺𝑢, если величина φ предполагается малой, так что в пределе малых значений φ,ψ правая часть уравнения (4.7.15) как раз и есть 𝐿⁻²(𝐾²-1+2𝑀𝐺𝑢). Это выражение такое же, как и в ньютоновской теории, где правая часть уравнения равна (𝐸+2𝑀𝐺𝑢)𝐿⁻². где 𝐸 - энергия частицы. В релятивистском случае имеются модификации, где мы не пренебрегаем членами более высокого порядка. Их мы обсудим в следующей лекции.

Лекция 5

5.1. Орбиты планет и прецессия Меркурия

Поскольку мы уже достигли некоторого прогресса в развитии более сложных теорий, мы должны взглянуть на более тонкие детали наших предсказаний для того, чтобы иметь критерии для оценки нашей теории. У нас есть полевая теория, которая сводится к ньютоновской теории в статическом пределе и включает в себя полное содержание энергии, и оказывается способной правильно предсказывать ”падение” фотонов в поле звезды. Экспериментальное свидетельство, которое заставит нас отказаться от ньютоновского приближения, касается прецессии перигелия планеты Меркурий. Мы продолжаем вычисление орбит планет. Начнём с уравнения



𝑑𝑢

𝑑θ


⎞²

+

𝑢²

=


𝐾²-1-φ

1+φ




1-ψ

𝐿²


,


𝑢

=

1

𝑟

,

𝐾

=

(1+φ)

𝑑𝑡

𝑑𝑠

,

𝑟


𝑑θ

𝑑𝑠


=

𝐿

=

(1-ψ)𝑟²

𝑑θ

𝑑𝑠

,


(5.1.1)


где символы φ и ψ представляют собой диагональные элементы тензора ℎμν, φ=2λℎ₄₄ и ψ=2λℎ𝑖𝑖, 𝑖=1,2,3. Согласно нашей теории, которую мы разработали к настоящему времени, мы имеем φ=ψ=-2𝐺𝑀/𝑟=-2𝐺𝑀𝑢. Однако, как мы вскоре увидим, наша теория неверна, и, чтобы не проделывать всю работу вновь после исправления теории, мы запишем


φ

=

α(-2𝐺𝑀𝑢)

+

𝑎(-2𝐺𝑀𝑢)²

+

…,


ψ

=

β(-2𝐺𝑀𝑢)

+

𝑏(-2𝐺𝑀𝑢)²

+

…,


(5.1.2)


в наших уравнениях, но для того, чтобы найти следствия нашей существующей теории, мы должны положить 𝑎=𝑏=0 и α=β=1 в этих формулах в самом конце. В случае нашей скалярной теории α=β=1 и φ=-2𝐺𝑀/𝑟 Предположим, что потенциал φ в естественных единицах нашей задачи 𝑚𝑐 много меньше 1, так что мы можем разложить множитель 1/(1+φ) в ряд по φ тогда уравнение движения принимает следующий вид:



𝑑𝑢

𝑑θ


⎞²

+

𝑢²

=

1

𝐿²

(𝐾²-1-φ)

(1-φ+φ²-…)

(1-ψ)

.


(5.1.3)


Перепишем теперь правую часть этого уравнения как ряд по степеням 𝑢. Сохраняя только первый и второй степени малого потенциала, 2𝐺𝑀𝑢 и 𝐾²-1, мы имеем



𝑑𝑢

𝑑θ


⎞²

+

𝑢²

=

𝐴

+

𝐵𝑢

+

𝐵𝑢²

+

…,


(5.1.4)


где


𝐴

=

1

𝐿²

(𝐾²-1)

;

𝐵

=

2𝐺𝑀

𝐿²

[

(𝐾²-1)

(α+β)+α

];


𝐶

=

(2𝐺𝑀)²

𝐿²

[

𝐾²α²

+

𝐾²αβ

-

𝐾²α

-

(𝐾²-1)𝑏

].


Продифференцируем по переменной θ; после сокращения общих множителей уравнение принимает такой вид, для которого довольно просто найти возмущённые решения


𝑑²𝑢

𝑑θ²

+

𝑢

=

1

2

𝐵

+

𝐶𝑢

+

+… .


(5.1.5)


Когда 𝐶=0, это уравнение имеет решения типа простых конических сечений ньютоновских теорий. Переменная 𝑢 испытывает гармонические осцилляции около точки 𝐵/2 как функция θ. Для эллиптических орбит частота равна 1, так что радиальная координата 𝑟 возвращается к своему начальному значению при изменении значения угла θ на 2π движение в точности циклическое. Когда 𝐶 не равно нулю, частота равна ω=√1-𝐶. Угловой период в этом случае больше, так что перигелий поворачивается при угловом изменении 𝑇=2π/ω=2π(1+𝐶/2+…). Угол π𝐶 представляет прецессию перигелия за один планетарный год, так как 𝐶≪1.

Для нерелятивистской планеты мы получаем значение прецессии довольно просто; нерелятивистский предел имеет место, когда общая энергия 𝐾 близка к 1 (в естественных единицах 𝑚𝑐²). В этом случае легко показывается, что уравнение (5.1.5) сводится в точности к ньютоновскому уравнению, как это и должно быть. То, что наша теория должна иметь правильный нерелятивистский предел, является более важным, чем то, что она даст правильное значение для прецессии! Когда 𝐾²-1≈0, прецессия за планетарный год равна


π𝐶

=

(α²+𝑎+αβ)

4π𝑀²𝐺²𝐿⁻²

.


(5.1.6)


При существующей теории α=β=1, 𝑎=0, эта величина получается равной 57 секунд дуги в столетие (в земных годах) для планеты Меркурия. Для других планет эти значения значительно меньше, как например, 4 секунды дуги в столетие для случая рассмотрения орбиты Земли. Астрономические наблюдения для прецессии перигелия Меркурия дают значение 5270ʺ дуги в столетие. Однако, почти вся эта величина может быть объяснена влиянием возмущений вследствие влияния других планет. Когда же аккуратно делаются поправки (с использованием чисто ньютоновской теории), отличие между наблюдаемой и вычисленной прецессией оказывается равным 41±2 секунд. Наша теория даёт ответ, который, очевидно, слишком велик (по сравнению с отличием между наблюдаемым значением прецессии и вычисленной величиной в рамках ньютоновской теории), и множитель, который характеризует различие между отличием наблюдаемой и вычисленной (в рамках ньютоновской теории) прецессией и вычисленным нами в рамках слабого приближения эйнштейновской теории гравитации смещением перигелия, имеет значение порядка 4/3.1

1 В последнее время достигнуто существенно более точное соответствие предсказаний ОТО и наблюдений. Так, например, в книге Вейнберга [Wein 72] приведены следующие данные: предсказание в рамках ОТО даёт значение 43.03ʺ/столетие, а различие наблюдений и предсказания в рамках ньютоновской теории гравитации даёт результат 43.11±0.45ʺ/столетие. (Прим. перев.)

Результаты оказались настолько близки, что перед тем, как заняться уточнением нашей теории, мы могли бы тщательно проверить наблюдательные данные и вычисления для того, чтобы быть уверенными в том, что эти различия действительно имеют место. Такая проверка была проводилась неоднократно, и величина для отличия наблюдаемой и предсказываемой в рамках ньютоновской теории прецессии Меркурия осталась прежней (т.е. равной 41±2ʺ). Мы могли бы рассмотреть возможность физических объяснений. Если бы имелась ненаблюдаемая до сих пор планета внутри орбиты Меркурия, или если бы Солнце имело существенно квадрупольное распределение массы, так что оно было бы более сплюснуто, то дополнительная прецессия могла бы иметь место. Когда мы действительно делаем оценки для того, чтобы понять, насколько же велика должна быть такая деформация, мы приходим к величинам, которые много больше тех, которые могли бы быть приняты как физически разумные. Солнце вращается слишком медленно для того, чтобы иметь квадрупольный момент достаточной величины. Были сделаны также оценки для того, чтобы объяснить расхождение наличием внутренних планет, и было показано, что подобное объяснение также не является удовлетворительным. Отсюда мы должны заключить, что наша теория неверна.

Перед обсуждением того, что неверно в нашей нынешней теории, мы можем использовать анализ орбит для того, чтобы получить количественный результат для отклонения очень быстрых частиц при прохождении их вблизи Солнца. Релятивистский предел получается, когда 𝐾²≫1, т.е. полная энергия много больше, чем энергия покоя. Импульс равен √𝐾²-1. В пределе 𝐾≫1 можно показать, что уравнения могут быть приведены к виду, аналогичному тому, который имеет место в ньютоновской теории, за исключением того, что потенциал умножается на величину (β+α). Так как β=α, то наши предсказания для угла отклонения в общем случае дают величину, которая в два раза больше, чем величина угла, получаемая в ньютоновской теории.

Численное предсказание состоит в том, что очень быстрые частицы (𝑣=𝑐), проходящие вблизи поверхности Солнца, должны бы отклоняться на угол 1.75ʺ. Были проведены измерения отклонения лучей света, испускаемого звёздами, при прохождении лучей вблизи поверхности Солнца, и полученные результаты оказались обнадёживающе близки к теоретическим предсказаниям. Наблюдения в принципе являются прямыми, но достаточно сложно увидеть какие бы то ни было звёзды, когда на небо выходит Солнце, не говоря о том, что оно должно быть достаточно близко к этим звёздам. Для анализа берутся изображения областей неба и сравниваются с изображениями, которые получаются в течение полного солнечного затмения. Когда поле звёзд, наблюдаемое во время солнечного затмения, налагается на исходное поле звёзд, наблюдаемое тогда, когда Солнце находится вдали от этого поля звёзд, то можно определить сдвиг от Солнца положений звёзд, который тем больше, чем ближе было исходное положение к солнечному диску (на небесной сфере). Анализ данных может быть достаточно продолжительным; два таких эксперимента давали значения, соответствующие отклонениям 2.01 и 1.70 секунд дуги для света, проходящего вблизи поверхности Солнца, так что предсказание для угла отклонения, равного 1.75 секундам, вообще говоря, согласуется с этими наблюдениями.1

1 Наблюдения с помощью методов радиоинтерферометрии подтвердили формулу Эйнштейна для отклонения лучей света с точностью до 1% [Заха 97*, Coun 74*, Foma 76*]. (Прим. перев.)

5.2. Замедление времени в гравитационном поле

На настоящий момент у нас имеется теория, которая, очевидно, согласуется с наблюдениями за исключением того, что мы переоценили величину прецессии орбит планет на множитель порядка 4/3. Мы можем представить, как и венерианские теоретики, что пока идёт обсуждение остаточных возмущений или пока делаются более точные измерения, разумно продолжить развитие теории в её нынешней форме для того, чтобы обнаружить некоторые новые эффекты, которые могли бы быть проверены, или обнаружить скрытые противоречия теории.

Если мы сравниваем дифференциальные уравнения движения частиц в электрическом и гравитационном полях, мы обнаруживаем, что уравнения движения в гравитационном поле имеет качественно отличный новый признак; не только градиенты, но и сами потенциалы появляются в уравнениях движения


Электромагнетизм:


𝑑²𝑥μ

𝑑𝑠²

=-

𝑒

𝑚₀



∂𝐴μ

∂𝑥ν

-

∂𝐴ν

∂𝑥μ



𝑑𝑥ν

𝑑𝑠

,


Гравитация:


𝑑

𝑑𝑠


𝑔

αβ

𝑑𝑥β

𝑑𝑠


=

1

2


∂𝑔μν

∂𝑥α


𝑑𝑥μ

𝑑𝑠


𝑑𝑥ν

𝑑𝑠

.


(5.2.1)


Таким образом, даже хотя дифференциальные уравнения для самих полей весьма близки, существует различие в их интерпретации. Например, эти уравнения не говорят одно и то же в области с постоянным потенциалом и в области с нулевым потенциалом, хотя ускорения в обоих случаях равны нулю. Во вселенной вклад в потенциал, обусловленный удалёнными скоплениями,1 должен быть практически постоянным по большим областям пространства, так что используем такое приближение.

1 Мы будем пользоваться термином ”скопления” наряду с используемым Фейнманом словом ”nebulae” - ”туманности”, что ранее обозначало всякий неподвижный на небе объект. (Прим. перев.)

Вернёмся к формулировке теории в терминах лагранжиана и вариационного принципа для того, чтобы увидеть новые соотношения с величайшей простотой и общностью. Будем предполагать, что в некоторой подобласти пространства гравитационный тензор 𝑔μν не зависит от координат и имеет следующее значение


𝑔₄₄

=

1+ε

;

𝑔₁₁

=

𝑔₂₂

=

𝑔₃₃

=

-1.


(5.2.2)


Мы предполагаем отрицательный потенциал, обусловленный влиянием удалённых масс, ε<0. Имеем следующее выражение для действия


-

𝑚₀

2

𝑑α

𝑔

μν

𝑑𝑥μ

𝑑α


𝑑𝑥ν

𝑑α

=


=-

𝑚₀

2

𝑑α

(1+ε)


𝑑𝑡

𝑑α


⎞²

-


𝑑𝑥

𝑑α


⎞²

-


𝑑𝑦

𝑑α


⎞²

-


𝑑𝑧

𝑑α


⎞²


.


(5.2.3)


Очевидно, что простая подстановка 𝑡'=𝑡√1+ε восстанавливает выражение для интервала в его предыдущей алгебраической форме. Ясно, что влияние постоянного потенциала подобно изменению масштаба времени так, чтобы заставить физические процессы протекать более медленно в областях более низкого гравитационного потенциала.

Аргумент на языке только свободных частиц не является значимым, поскольку мы не можем утверждать, что скорость, при которой ничего не происходит, может меняться. Мы должны взглянуть на поведение взаимодействующих частиц. С этой целью мы продолжаем использование нашей теории скалярного вещества; интеграл действия равен


1

2

𝑑⁴𝑥

(

φ

φ

-

𝑚²φ²

)-

λ

𝑑⁴𝑥

μν

𝑇

μν

,


(5.2.4)


где


𝑇

μν

=

φ

∂ℒ

∂φ

-

η

μν

.


(5.2.4')


Мы можем явно разделить пространственные производные и производные по времени в градиентах и также выделить время в элементе объёма 𝑑⁴𝑥. Мы предполагаем, что поправки ε меньше 1, так что разложение разрешено, и мы получаем следующее выражение для интеграла действия


1

2

𝑑³𝑥

𝑑𝑡



∂φ

∂𝑡


⎞²


1-

ε

2


-

(∇φ)²

1+

ε

2


-

𝑚²φ²

1+

ε

2



.


(5.2.5)


Снова оказывается, что при 𝑑𝑡'=𝑑𝑡=√1+ε/2≈𝑑𝑡(1+ε/2) действие возвращается к своей первоначальной алгебраической форме. Ясно, что замедление времени имеет место для наших скалярных мезонов, представляемых φ. Можно показать, что замедление времени должно иметь место для всех взаимодействий, безотносительно к точной природе лагранжиана. Мы можем доказать с помощью формулы Вентцеля (5.2.4') для 𝑇μν. Гравитационное взаимодействие может быть явно отделено от остальной части лагранжиана, какой бы он ни был


ℒ(общ)

=

ℒ₀

-

λℎ

μν

𝑇

μν

.


(5.2.6)


При использовании выражение (5.2.4') и 𝑔μν из (5.2.2) так, что λℎ₄₄, полный лагранжиан равен ℒ-(ε/2)𝑇₄₄ или


ℒ(общ)

=

ℒ(1+ε/2)

-

∂ℒ

∂ψ,𝑡

ψ

,𝑡

(ε/2)

.


(5.2.7)


Предположим поэтому, что полный лагранжиан (включающий наш постоянный гравитационный потенциал) включает в себя только поле ψ и его градиенты. Интеграл действия, выраженный через переменную 𝑡', по крайней мере, в первом порядке по ε, равен


Действие


=

𝑑³𝑥

𝑑𝑡'

ℒ(ψ

,𝑡'

,ψ,ψ

,𝑥

)

,


(5.2.8)


так как ψ,𝑡'=(1+ε)ψ,𝑡,


Действие


=

𝑑³𝑥

(1+ε)

½

𝑑𝑡

ℒ((1+ε)

ψ

,𝑡

,ψ,ψ

,𝑥

)

.


Результат всего этого состоит в том, что любые члены в лагранжиане, в которые включены градиенты по времени ψ,𝑡 имеют свои собственные множители √1+ε, так что подстановка 𝑡'=𝑡√1+ε в точности воспроизводит влияние постоянного гравитационного поля. Следовательно, вся физика остаётся той же самой, за исключением замедления времени.

Гравитационные потенциалы отрицательны, так что часы должны были бы идти медленнее в том случае, если они приближаются ближе к массивному объекту, такому как звезда. Можно было бы задать вопрос о том, имеется ли возможность того, что величина (1+ε) будет отрицательной, так как ε=-2𝐺𝑀/𝑟 Практически такой вопрос никогда не возникает, поскольку величина 𝐺 очень мала. Для звезды с солнечной массой мы бы имели ε=-1, только если эта масса была бы сосредоточена внутри сферы с радиусом порядка 1.5 километров. Тем не менее, математическая возможность ε<-1 имеется в нашей теории, и мы будем обсуждать ниже возможность того, как даже в улучшенной теории возникают подобные трудности.

Таким образом, мы имеем новое предсказание наших гравитационных теорий, часы должны были бы идти более медленно в областях с более низким гравитационным потенциалом. Земляне провели такой эксперимент, в котором производилось испускание фотонов вблизи поверхности Земли с высоты 24 метров. Фотоны испускались на вершине и поглощались на дне; использовались предельно узкие линии, открытые Мёссбауэром, связанные с ядерными переходами в кристаллах. Небольшое изменение в частоте, связанное с падением фотонов в гравитационном поле (1 часть из 10¹⁵), компенсируется искусственным эффектом Допплера. Когда поглощение, как функция относительных скоростей кристаллов, используется для того, чтобы определить сдвиг частоты, то результаты согласуются с теоретическими предсказаниями в пределах экспериментальной неопределённости порядка десяти процентов. Часы, которые идут более медленно в этом случае, являются ядерным устройством, которое производит фотоны с определёнными частотами; относительная разность в частотах часов на вершине и на дне есть (Δω/ω) = (ε/2) = разность гравитационного потенциала, делённая на 𝑐².

Такое предсказание сдвига частоты в действительности не требует приведённой техники нашей теории гравитации, так как это подразумевается в экспериментальных результатах Этвеша, что гравитационные силы (потенциалы) пропорциональны величине энергии. Таким образом, сдвиг частоты соответствует доли гравитационной энергии в энергии фотона. Согласно Этвешу, возбуждённое ядро тяжелее на величину (𝐸₀/𝑐²)𝑔, если 𝐸₀ - энергия возбуждения, поскольку, как мы знаем из ядерных экспериментов, его масса равна 𝑀+𝐸₀/𝑐², если 𝑀 - масса в положении, когда ядро находится на поверхности Земли. Если возбуждённое ядро поднимается на высоту ℎ, оно содержит энергии на величину 𝐸₀+(𝐸₀/𝑐²)𝑔ℎ+𝑀𝑔ℎ больше, чем невозбуждённое ядро, находящееся на нулевой высоте. Если мы возбуждаем ядро, находящееся в более низком положении, требуется только энергия 𝐸₀. После того, как более высоко расположенное ядро совершило переход, его полная энергия должна была бы превосходить полную энергию более низко расположенного ядра только на величину 𝑀𝑔ℎ. Так как частота фотона связана с энергией соотношением 𝐸=ℏω частота испущенного фотона есть ω=ω₀(1+𝑔ℎ/𝑐²). Таким образом, очевидно, что сдвиг частоты требуется из закона сохранения энергии. Если такого сдвига частоты не было бы в подобной ситуации, мы могли бы сконструировать вечный двигатель, используя такие ядерные переходы. Мы возбуждаем ядро на вершине башни фотонами с энергией 𝐸₀, но мы получаем механическую энергию (𝑀+𝐸₀/𝑐²)𝑔ℎ при опускании возбуждённого ядра. Так как поднятие невозбуждённого ядра требует затраты энергии только 𝑀𝑔ℎ, то мы получаем (𝐸₀/𝑐²)𝑔ℎ высвобождаемой энергии на каждом цикле! Тогда наша теория не является непротиворечивой, и это наводит на мысль, что сдвиг частоты, требуемый законом сохранения энергии, должен рассматриваться как общее свойство всех физических процессов, т.е. они протекают более медленно в областях с более низкими значениями гравитационного потенциала.

Здесь нет ничего похожего на ”парадокс близнецов” в специальной теории относительности. Человек на вершине горы живёт и стареет быстрее, чем мы, мы видим его движущимся быстрее. Когда он смотрит на нас, он видит нас, движущимися медленнее, чем он. Это не похоже на замедление времени при больших относительных скоростях, когда каждый наблюдатель видит другого движущимся медленнее. Однако не существует пути значительного увеличения нашего времени жизни, двигаясь в Долину Смерти, так как скорости изменения старения меняются очень мало. Тем не менее, мы должны были бы быть значительно более внимательными в будущем, говоря о возрасте объектов, таких как Земля, так как центр Земли должен бы быть на день или два моложе, чем её поверхность.

5.3. Космологические эффекты, связанные с замедлением времени. Принцип Маха

Ранее мы заметили, что вселенная могла бы быть приближённо описана как сферически симметричное распределение массы, и чтобы гравитационные потенциалы были бы возможно такой величины, что значения гравитационной энергии были бы равны энергии покоя частиц вблизи центра. Если бы это было так, и если наша формула для замедления времени была бы правильной, то физические процессы должны были бы остановиться в центре вселенной, так как время там не шло бы совсем. Это не только физически неприемлемое предсказание; так как мы могли бы ожидать, что вещество вблизи края вселенной должно было бы взаимодействовать быстрее, то свет от удалённых галактик должен был бы иметь фиолетовое смещение. На самом деле, хорошо известно, что он сдвинут в сторону более низких, более красных частот. Таким образом, наша формула для замедления времени очевидно нуждается в том, чтобы быть обсуждённой в дальнейшем в связи с анализом возможных моделей вселенной. Последующая дискуссия является чисто качественной и предназначена только для того, чтобы стимулировать более мудрые мысли по этому поводу.

Возможно, что поправки к нашей простой формуле могли бы придти от пространственных элементов тензора ℎμν. Мы рассмотрели только компонент ℎ₄₄ могло бы быть так, что если бы мы включили в рассмотрение ℎ₁₁ и ℎ₂₂ и ℎ₃₃, мы могли бы предсказать не просто замедление времени, но и некоторое одновременное сжатие вдоль пространственных осей, что позволило бы разрешить каким-либо образом обсуждаемые трудности. Другая возможность состоит в том, что 1, которая появляется в формуле для замедления времени, есть ошибка в рассуждении. Мы записали формулу, которая применяется только в том случае, когда разности потенциалов φ много меньше 1, так что константа 1 может каким-либо образом представлять нормализованный вклад в распределение массы удалённых скоплений. Другими словами, мы вывели, что гравитационные поправки к общей энергии частицы есть поправки к её инерции. Это предположение является концептуально простым обобщением того рассуждения, при котором предполагается, что возможно частицы не имеют собственной инерции, так что вся инерция представляет сумму гравитационных взаимодействий с остальной частью вселенной. Мы немедленно приходим к количественным трудностям. Предположим, что мы пытаемся сказать, что вблизи Солнца одиночная планета имеет полную потенциальную энергию, которая есть сумма потенциала Солнца и приближающегося к константе распределения, обусловленного влиянием оставшегося вещества


φ

=

φ

(Солнце)

+

φ

(вещество).


(5.3.1)


У нас нет возможности идентификации φ(удалённое вещество) с 1, так как поправка φ(Солнце) может быть с противоположным знаком.

Хотя показано, что эта не слишком усложнённая попытка обсуждения провалилась, может быть стоит обсудить этот вопрос более детально. Идея, что инерция представляет эффекты взаимодействия с распределением удалённого вещества, была впервые высказана Эрнстом Махом в XIX веке, и это была одна из тех мощных идей, которые Эйнштейн держал в голове при создании своей теории гравитации.

Мах чувствовал, что концепция абсолютного ускорения относительно ”пространства” не имеет глубокого смысла; что вместо этой концепции обычные абсолютные ускорения классической физики должны быть перефразированы как ускорения относительно распределения удалённого вещества. Подобно этому, понятие вращения должно быть вращением относительно чего-либо, ”абсолютное вращение” также является понятием, лишённым смысла. Когда мы рассматриваем это понятие, как фундаментальное предположение или постулат, оно известно как принцип Маха. Возможно, что эта концепция сама по себе может привести к глубоким физическим результатам, многие из которых могут быть получены на том же самом пути, что и принцип относительности, связывающий системы отсчёта с постоянной относительной скоростью, который использовался Гюйгенсом как инструмент для того, чтобы вывести законы, описывающие столкновения биллиардных шаров. Предположим, что мы наблюдаем лобовое столкновение, так что биллиардные шары, имеющие равные и противоположно направленные импульсы, затем меняют значения своих импульсов на противоположное. Гюйгенс представил этот же самый эксперимент, как проводимый на лодке, имеющей постоянную скорость относительно берега. Используя принцип относительности, Гюйгенс получил правильный закон для столкновения гладких биллиардных шаров, имеющих произвольные начальные скорости.

Принцип Маха глубоко бы изменил законы механики, так как обычная механика предполагает, что неускоренное прямолинейное движение должно быть ”естественным” движением в отсутствии сил. Когда ускорения определяются как ускорения относительно других объектов, траектория частицы при ”отсутствии ускорения” зависит от распределения других объектов в пространстве, и определение сил между объектами изменялось бы всякий раз, когда бы мы меняли распределение других объектов в пространстве.

5.4. Принцип Маха в квантовой механике

Утверждение принципа Маха для квантовой теории включает в себя новые эффекты, так как мы не можем говорить о прямолинейных траекториях; мы увидим, что надлежащее утверждение включает в себя до некоторой степени развитие понятия ” время”.

У Маха была проблема, связанная с тем, как частица ”знает”, что она ускоряется. Мах думал, что это обусловлено влиянием распределения удалённых масс, таким влиянием, что ускорение относительно них требует силы. С появлением квантовой механики новый ”абсолют” стал определимым; абсолютный масштаб длины или времени. 10²⁴ атомов водорода при нулевой энергии в кубе имеют как раз некоторый определённый абсолютный размер, молекула 𝑁𝐻₃ вращается с определённым временем между циклами.1 В вакууме два одинаковых фотона, сталкивающихся друг с другом, не делают ничего особенного до тех пор, пока длина волны не станет меньше, чем 2π⋅3.68×10⁻¹¹ см, когда могут быть образованы пары электронов. Как фотоны ”знают”, каковы их длины волн в абсолютных единица с тем, чтобы решить, образовывать ли им пары? Каждый объём пространства должен содержать естественную меру размера (или времени).

1 Обсуждение некоторых простейших свойств молекулы аммиака, основанное на квантово-механическом подходе, можно найти в ”Фейнмановских лекциях по физике” [Feyn 63а] (т. 8 русского перевода, 1966, с. 145). (Прим. перев.)

Принимая философию Маха, мы могли бы сказать, что вышесказанное есть нонсенс, что размер не есть абсолют, если нет ничего, с чем можно было бы его сравнить. Это могло бы быть влияние ”туманностей”, которое определяет масштаб времени в каждой точке пространства. Скажем, комптоновская длина волны относительно размера Вселенной зависит от того, как много ”туманностей” находится в ней. Если они частично удалены, то масштаб длины должен был бы предположительно меняться.

Мы предположим, следовательно, что естественный масштаб времени, скажем, величина ℏ/𝑚𝑐² (или любая другая комбинация для других фундаментальных частиц, а мы предполагаем, что все они пропорциональны некоторой единице длины) определяется некоторой удалённой ”туманностью”. Теперь мы покажем, что инерциальная система отсчёта также автоматически определяется этой ”туманностью” , и феномен инерции для ускорений относительно этой ” туманности” может быть понят, если принимается ”определяющий длину принцип”. Следовательно, принцип Маха эквивалентен утверждению, что фундаментальные единицы длины и времени в точке есть результат влияния удалённой ”туманности”.

Фейнмановские лекции по гравитации

Рис. 5.1.

Предположим, что частица находится в покое, тогда в квантовой механике она характеризуется следующей зависимостью от времени exp(-𝑖𝑚𝑐²𝑡/ℏ). Принцип инерции есть утверждение о том, что временной масштаб не зависит от координаты 𝑥; классические траектории интерпретируются так, чтобы следовать нормальным линиям постоянной фазы. В пространстве двух измерений мы рисуем линии постоянной фазы перпендикулярно оси времени, как на рис. 5.1.

Фейнмановские лекции по гравитации

Рис. 5.2.

Если временные масштабы в различных частях пространства не являются теми же самыми, то линии постоянной фазы в таких диаграммах являются кривыми и соответствующие классические траектории - кривые, соответствующие ускоренному движению по направлению к области с меньшим масштабом, как показано на рис. 5.2. Так как звёзды производят такое уменьшение характерного времени для фазы, они должны вызывать ускорения. В квантовой механике плоско-параллельные решения существуют, когда поверхности постоянной фазы параллельны; если этого нет, то волновые пакеты будут стремиться следовать градиенту фазы. Теперь, если удалённая ”туманность” определяет в основном этот масштаб и если нет ближайших звёзд, масштаб ℏ/𝑚𝑐² будет почти равным в двух ближайших точках 1 и 2, потому что 1 и 2 находятся практически на одинаковом расстоянии от всех ”туманностей”. Следовательно, естественная частота (разделение линий постоянной фазы) в точках 1 и 2 была бы практически равной. Таким образом, если частица первоначально имела бы равную фазу в точках 1 и 2, это всегда было бы так, и это состояние оставалось бы в покое, не ускорялось бы (более точно, длинный волновой пакет оставался бы в покое). Неравные начальные фазы дают наклонные линии, постоянная наклона по времени связана с постоянной скоростью. Отсутствие ускорения есть следствие наличия естественной временной шкалы, которая одинакова во всех точках в области пространства. Это постоянство понятно, если ”туманности” определяют естественную шкалу для области пространства очень малой по сравнению с размерами распределения влияющих ”галактик” (размерами вселенной), никаких вариаций в масштабе не могло бы ожидаться.

Имеются некоторые числовые совпадения, которые мы можем упомянуть здесь для того, чтобы навести на мысль о том, как ”естественные” масштабы длины могут быть в некотором смысле извлечены из космологии. Такое совпадение не содержит в себе ”теорию”, как таковую, оно просто используется для того, чтобы проиллюстрировать связь, которая могла бы быть в конце концов предсказана подробной теорией. Мы предполагаем, что в некоторой системе временных единиц, которые ”естественны” для вселенной, соответствующий инвариант (элемент длины) для частицы, находящейся в покое, есть


(𝑑𝑠)²

=

𝑔₄₄

(𝑑𝑡)²

.


(5.4.1)


Координатная временная единица 𝑡 должна быть (𝑅/𝑐), где 𝑅 - радиус вселенной. Мы предполагаем, что атомные единицы определяются 𝑑𝑠, мы серьёзно берём в качестве абсолютного размера 𝑔μν, тогда одна единица 𝑑𝑠 является фундаментальной длиной. Какова фундаментальная длина? Все масштабы длины пропорциональны, но мы попробуем использовать комптоновскую длину волны ℏ/𝑀𝑐. Тогда 𝑠 от 1 означает одну осцилляцию волновой функции протона, a 𝑡 от 1 - масштаб, равный размеру Вселенной.

Предположим затем, что вклад в величину 𝑔₄₄, обусловленный каждым протоном, есть просто 1/𝑟 (𝑟 есть в координатных единицах радиус вселенной). Тогда удалённые ”туманности”, которые имеют 𝑁₀ протонов и которые удалены на характерное расстояние 𝑅=1, дают вклад в величину 𝑔₄₄ порядка 𝑁₀. В окрестности звезды на расстоянии 𝑟, содержащей 𝑛 протонов, элемент дуги имеет следующий квадрат:


(𝑑𝑠)²

=

𝑁₀

+

𝑛

𝑟


(𝑑𝑡)²

.


(5.4.2)


Совпадение состоит в том, что если 𝑇 - возраст вселенной, то он численно связан со временем протона (ℏ/𝑀𝑝𝑐²)≈𝑇√𝑁₀. Вместе с другим совпадением, о котором уже было упомянуто, что 2𝑀всел𝐺/𝑅≈1, когда мы вновь переходим к произвольной системе единиц, такой как сантиметры и секунды, получаем


(𝑑𝑠)²

=

𝑁₀

+

2𝑚𝐺

𝑟


(𝑐𝑑𝑡)²

,


(5.4.3)


где 𝑚 - масса звезды, грубо говоря 𝑚=𝑛𝑀𝑝. За исключением катастрофического появления знака (+) вместо знака (-), этот результат идентичен ”правильному” выражению для длины дуги. Мы преуспели в получении правильных размеров путём жонглирования космологическими числами.

Вероятно, в таком совпадении нет какого-либо глубокого значения. Одно положение, которое неверно, состоит в том, что мы предположили вклад (1/𝑟) от каждой протонной массы, но зависимость (1/𝑟) есть правильное выражение для поправок к полной энергии, обусловленной влиянием близких частиц, и это выражение, возможно, неверно для частиц в удалённых галактиках. Другая серьёзная трудность состоит в том, что мы не пытались учесть эффекты, связанные с другими членами тензора ℎμν например ℎ₁₁ Однако такое жонглирование служит тому, чтобы показать, как теории гравитации неизбежно приводят к рассмотрению вовлечённых в теорию времени и инерции; мы получаем представление о том, как взаимодействие, выраженное через число удалённых частиц, может привести к наблюдаемой инерции такого объекта, как протон. Во всяком случае, делается намёк на то, что абсолютная величина тензора ℎμν взята серьёзно; эта величина может иметь смысл. Плоское пространство может быть ℎ₄₄=-ℎ₁₁=-ℎ₂₂=-ℎ₃₃=ξ, где ξ - имеющее глубокий смысл число, которое не берётся просто равным 1.

5.5. Собственная энергия гравитационного поля

Вернёмся к менее спекулятивной и более точной материи. При развитии и проведении модификаций нашей полевой теории мы пренебрегали тем, чтобы проверить, является ли наша теория внутренне непротиворечивой. Мы написали полный лагранжиан, имеющий полевой член, член, описывающий материю, и член, характеризующий взаимодействие. Мы получили полевое уравнение, используя условие, что дивергенция тензора энергии-импульса должна быть равна нулю. Такая процедура очевидно некорректна, так как мы написали тензор давления, который не включал в себя энергию самого гравитационного поля. Таким образом, наша нынешняя теория не выдерживает критики с точки зрения физики, так как энергия вещества не сохраняется.

Мы попробуем исправить этот теоретический недостаток путём поиска нового тензора, который складывается со старым тензором 𝑇μν. который мог бы разрешить эту проблему, так что


(

𝑇

μν

+

χ

μ,ν

)

=

0,


(5.5.1)


и в то же самое время полная энергия поля правильно учтена. Как мы найдём этот член? Мы могли бы попытаться построить правильный полный тензор, используя формулу Вентцеля и полный лагранжиан. Результат даёт несимметричный тензор, если мы проведём его симметризацию, проведём также вычисления, то оказывается, что выражение для прецессии перигелия Меркурия получается неверным. Это другой пример эмпирического определения физических теорий: теории, не возникающие из некоторого рода вариационного принципа, такого как принцип минимального действия, могут в конечном счёте приводить к волнениям и противоречиям.

Сделаем попытку другого рода согласно общей линии нашего построения, заключающегося в испытаниях различных теорий в последовательном порядке увеличения сложности. Физически мы знаем, что мы пытаемся описать нелинейный эффект: гравитационное поле образовано энергией, энергия этого поля есть источник других полей. Здесь мы можем приступить к получению важного результата. Конечно возможно, что такая нелинейность может приниматься в расчёт для малого остаточного отличия в прецессии перигелия Меркурия. Мы будем требовать, чтобы полевые уравнения получались из вариации некоторого действия, и будем задавать себе вопрос о том, какого вида член должен быть добавлен к лагранжиану для того, чтобы получить член, похожий на член χμν чтобы придти к уравнению движения


μν,σ

-

2

μ

σ

,νσ

=-

λ(

𝑇

μ,ν

+

χ

μ,ν

),


(5.5.2)


и такого, что соотношение (5.5.1) оказывается выполненным? Как может выглядеть выражение χμν, если оно представляет вид гравитационной энергии? Несомненно, что, по крайней мере, частично эта величина пропорциональна квадратам полевых сил; это есть произведение двух градиентов потенциалов. Возможно, поэтому, χμν есть сумма членов, похожих на ℎμσνλ + т.д., каждый из которых с двумя компонентами ℎ и двумя производными.

Мы будем требовать, чтобы наши уравнения были выводимы из вариационного принципа такого, как наименьшее действие. Когда мы вариируем эти произведения, мы уменьшаем число компонент ℎ, так что для лагранжиана, который используется для вычисления вариации действия, требуется связывающий член третьего порядка по ℎμν, который будем называть 𝐹³; мы будем пытаться сделать преобразования так, что вариация 𝐹³ приводит к члену χμν


δ𝐹³

δℎμν

=

λχ

μν

.


(5.5.3)


Алгебраическое выражение 𝐹³ должно быть таким, чтобы оно включало в себя произведения трёх компонентов ℎ и имело два индекса, по которым берётся производная. Типичный член 𝐹³ может быть вида


𝐹³

=

𝑎

μν

μσ,λ

σλ

+

… .


(5.5.4)


Когда мы записываем все возможные такие произведения, мы находим, что их 24. Мы могли бы в дальнейшем уменьшить это число, замечая, что некоторые члены могут быть сведены к комбинациям других интегрированием дважды по частям, эти соображения приводят нас к тому, чтобы записать 18 различных и независимых выражений. Следовательно, мы приходим к выражению для χμν через компоненты ℎ и 18 независимых констант.

Дальнейшая процедура очевидна. Мы пытаемся определить константы, исходя их условия, что


(

𝑇

μν

+

χ

μν

)

=

0.


(5.5.5)


Эти условия дают множество более, чем 18 уравнений для 18 констант. Тем не менее, оказывается, что все уравнения совместны и 18 констант определяются однозначно. Когда мы сделаем это, у нас будет уточнённая теория, которая правильно учитывает энергию самого гравитационного поля во втором порядке по ℎμν.

Лекция 6

6.1. Билинейные члены тензора энергии-импульса

Наша нынешняя теория линейна в том смысле, что мы написали уравнение относительно гравитационного поля ℎμν связывающего его с тензором давления 𝑇μν


μν,λ

-

2

μλ,ν


=-

λ𝑇

μν

.


(6.1.1)


Но мы определили 𝑇μν, выразив его только через распределение материи, как будто на материю не действует гравитация, как будто энергия гравитационного поля сама по себе не является источником полей. Эффекты, связанные с влиянием гравитации на материю, которые мы хотели бы включить в рассмотрение, могут быть проиллюстрированы рассмотрением того, что может произойти, когда мы соединяем массы объектов 1 и 2 вместе в присутствии третьего объекта. Часть работы, которая произведена, может пойти на нагревание третьего объекта, так что энергия не сохраняется при рассмотрении только масс объектов 1 и 2 и полей, которые они порождают. Таким образом, энергия не сохранялась бы, если бы мы рассматривали только подсистемы; ящики, показанные штриховыми линиями на рис. 6.1, не имели бы одинаковый вес. Нелинейный эффект, обусловленный влиянием энергии поля, является более знакомым; мы вычислили поля, обусловленные распределением массы, как первое приближение; следующее приближение состоит в том, чтобы включить поля первого порядка как источники, и так мы приходим к самосогласованному решению.

Фейнмановские лекции по гравитации

Рис. 6.1.

Мы построим новый тензор давления из нашего старого тензора добавлением члена, который будет выводим из той части лагранжиана, которой пренебрегали ранее, и который обозначим 𝐹³, путём вариации


new

𝑇

μν

=

old

𝑇

μν

+

χ

μν

,

λχ

μν

=

δ𝐹³[ℎ]

δℎμν

,


(6.1.2)


и надеемся, что эти трудности будут устранены, по крайней мере, в более высоких порядках по ℎμν

Так как мы пытаемся построить χμν для того, чтобы устрашить тот недостаток тензора энергии-импульса old𝑇μνo𝑇μν, связанный с сохранением энергии o𝑇μν≠0, мы получаем намёк на структуру χμν, вычисляя дивергенцию o𝑇μν. Дивергенция χμν взаимно уничтожила бы ненулевую часть этой дивергенции o𝑇μν, по крайней мере, в первом ненулевом порядке. Для того, чтобы вычислить эту дивергенцию, мы сначала перепишем тензор o𝑇μν для движущейся частицы в новой форме, которая выглядит сначала непривычной, но с которой проще проводить преобразования. На языке интеграла по скалярному параметру, который также может быть собственным временем 𝑠 (мы обозначаем точками производные по собственному времени 𝑠), получаем следующее выражение для этого тензора


o

𝑇

μν

(𝑥)

=

𝑚₀

𝑑𝑠δ⁴

(𝑥-𝑧(𝑠))

𝑧̇

μ

𝑧̇

ν

.


(6.1.3)


То, что это выражение для тензора o𝑇μν эквивалентно тому, которое было использовано ранее, может быть проверено сравнением соответствующих членов действия


λ

𝑑⁴𝑥

o

𝑇

μν

(𝑥)

μν

(𝑥)

=

λ

𝑚₀

𝑑𝑠

μν

(𝑧)

𝑧̇

μ

𝑧̇

ν

.


(6.1.4)


Существует простой физический путь для интерпретации смысла δ-функции в соотношении (6.1.3); в этом выражении попросту утверждается то, что нет энергии взаимодействия, за исключением того места, где на самом деле находится частица. Возможно проще понять, насколько удачно подобраны эти выражения, переписывая обычную электродинамику на том же самом языке; член в лагранжиане, описывающий взаимодействие, есть объёмный интеграл от -𝑗μ𝐴μ а 𝑗μ связывается со скоростью частицы следующим образом:


𝑗

μ

(𝑥)

=

𝑒

𝑑𝑠δ⁴

(𝑥-𝑧(𝑠))

𝑧̇

μ

,

𝑆(внутр)

=-

𝑒

𝑑𝑠

𝐴

μ

(𝑧)

𝑧̇

μ

.


(6.1.5)


Параллелизм с нашими гравитационно-полевыми выражениями (6.1.3) и (6.1.4) очевиден.

Вычислим дивергенцию o𝑇μν из соотношения (6.1.3). Сначала проверим, что δ-функция симметрична по переменным 𝑥 и 𝑧, так что производная по переменной 𝑥ν может быть заменена (со знаком "-") производной по переменной 𝑧ν. Тогда мы будем использовать следующее тождество


𝑧̇

ν

∂𝑧ν

ƒ[𝑧(𝑠)]

=

𝑑

𝑑𝑠

ƒ[𝑧(𝑠)]


(6.1.6)


для того, чтобы получить выражение для дивергенции тензора o𝑇μν


o

𝑇

μν

=

𝑚₀

𝑑𝑠δ⁴

(𝑥-𝑧(𝑠))

𝑧̈

μ

.


(6.1.7)


Мы видим, что эта дивергенция есть плотность ускорения. Здесь мы будем предполагать, что мы уже правильно включили в наш лагранжиан все взаимодействия, отличные от гравитации, так что ускорение 𝑧̈μ представляет влияние гравитации, задаваемое уравнением движения


𝑔

μλ

𝑧̈

μ

=-

1

2

[

𝑔

μλ,ν

+

𝑔

νλ,μ

-

𝑔

μν,λ

]

𝑧̇

μ

𝑧̇

ν

=-

[μν,λ]

𝑧

𝑧̇

μ

𝑧̇

ν

.


(6.1.8)


Нижний индекс 𝑧 на скобке напоминает нам, к какой переменной относятся индексы. Теперь умножим дивергенцию, полученную в соотношении (6.1.7), на 𝑔μλ(𝑥) и заменим 𝑔μν𝑧̈μ на -[μν,λ]𝑧𝑧̇μ𝑧̇ν. Заметим, что из-за наличия δ-функции величина [μν,λ]𝑧 приводит к тому же эффекту, что и [μν,λ]𝑥. Это означает, что знак скобки может быть вынесен за знак интеграла, приводя нас к выражению, в которое включена только дивергенция o𝑇μν и исходный тензор o𝑇μν:


𝑔

σλ

(𝑥)

o

𝑇

σν

(𝑥)

=-

[μν,λ]

o

𝑇

μν

(𝑥)

.


(6.1.9)


Это точное уравнение, которому должен удовлетворять тензор o𝑇μν. В настоящем время мы используем его только в первом порядке малости по ℎ. Мы можем разделить тензор 𝑔σλ на два слагаемых ησλ+2λℎσλ и получить уравнение,1 которое говорит нам, что дивергенция o𝑇μν начинается с линейного члена по константе связи λ:


o

𝑇

λν

=-

[μν,λ]

o

𝑇

μν

-

σλ

o

𝑇

σν

,


(6.1.10)


1 При переводе мы не меняли не очень удачные обозначения Фейнмана, когда λ обозначает одновременно как индекс, так и множитель, т.е. две совершенно различные величины. (Прим. перев.)

так как знак ”скобка” включает в себя производные, которые делают нулевой порядок ημν тензора 𝑔μν не играющим никакой роли.

Когда мы сравниваем это соотношение с требованием, что новый тензор new𝑇μνn𝑇μν должен иметь нулевую дивергенцию,


n

𝑇

μν

=

o

𝑇

μν

+

χ

μν

,


(6.1.11)


и если мы предполагаем, что само выражение для χμν - билинейно по полям, мы видим, что дивергенция χμν должна иметь следующее выражение:


χ

μν

=

[σν,μ]

o

𝑇

σν

+

𝒪(λ²)

… .


(6.1.12)


Знание дивергенции не определяет для нас χμν. У нас есть дополнительное требование, используя которое мы надеемся вывести χμν из вариации 𝐹³ по отношению к ℎμν, согласно соотношению (6.1.2). Если мы возьмём 𝐹³ как сумму по всем возможным независимым произведениям, включающим в себя всевозможные трилинейные произведения полевых компонент и два независимых индекса, по которым берутся производные, то эти два требования определяют величину 𝐹³ однозначно. Мы не будем проводить здесь определение 18 констант, но отметим, что это результат больших и трудоёмких алгебраических вычислений


𝐹³

=-

λ

αβ

γδ

αβ,γδ

+

γ

β

γα

αβ,δ

-


-

2ℎ

αβ

βδ

αγ

,γδ

+

2

αβ

σα

τβ

+


+


1

2

αβ

αβ

+

1

4

α

α

β

β

στ

,στ

.


(6.1.13)


Теперь для нас оказывается возможным, используя метод малых возмущений, вычислить все эффекты, которые рассматривались ранее. Для случая движения планет включение выражения для 𝐹³ в интеграл от лагранжиана приводит к следующим выражениям φ и ψ, которые должны быть использованы для вычислений орбит:


φ

=

Φ

+

1

2

Φ²


ψ

=

Φ

-

3

8

Φ²


Φ

=-

2𝑀𝐺/𝑟

.


(6.1.14)


Эти поправки приводят к полному согласию нашей теории с наблюдениями по прецессии перигелия Меркурия, так что последнее оставшееся расхождение между теорией и наблюдениями исчезает.

6.2. Формулировка теории, справедливой во всех порядках

Мы достаточно преуспели в нашей задаче, которую мы поставили перед собой в самом начале, построить полевую теорию гравитации по аналогии с другими хорошо известными полевыми теориями, которые бы адекватно описывали все известные характеристики феномена гравитации. Таким образом, наша воображаемая венерианская точка зрения оказалась плодотворной. Имеются некоторые слабые места в нашей теории; мы могли бы представить себе, что самые трудолюбивые венерианские теоретики могли бы не удовлетвориться теорией, в которой оставлены неопределёнными эффекты третьего порядка малости, и некоторые из них могли бы продолжить исследование функций 𝐹⁴ и 𝐹⁵ и т.д., которые должны быть добавлены к интегралу от лагранжиана для того, чтобы сделать теорию согласованной в более высоких порядках. Этот подход есть невероятно сложная процедура вычисления ненаблюдаемых поправок, и мы не будем соревноваться с нашими воображаемыми венерианами в этом отношении.

В физических теориях подчас возникает такая ситуация, что хотя поправки более высокого порядка в полном разложении удручающе скучно вычислять, возможно построить теорию, в которой суммируются все поправки более высокого порядка, для того, чтобы получить ответ, который является достижимым. Таким образом, представим себе честолюбивого и самоуверенного венерианина, который решил сделать попытку вывести полное разложение для функции 𝐹=𝐹²+𝐹³+𝐹⁴+𝐹⁵+… Мы будем искать функционал 𝐹 описывающий действие, которое должно быть провариировано, по следующим эмпирическим причинам: по-видимому, не существует достаточно удовлетворительной теории, которая не является выводимой с использованием вариационного принципа, первый этап применения которого заключается в выписывании функционала, связанного с лагранжианом или гамильтонианом (обе формулировки являются эквивалентными) .

В настоящее время нет определённости относительно того, отражают ли неуспехи нелагранжевых теорий некоторую фундаментальную истину о природе. Возможно, что фундаментальная истина может быть в том, что физические процессы происходят согласно принципу минимальной фазы и что действия в классической физике или квантовой физике есть выражения для этой фазы, которые верны в некотором приближении. Амбициозная попытка облечь гравитацию в нелагранжеву формулировку была сделана Бирхгоффом [Birk 43]. Он сохранил линейные уравнения для полей, но изменил уравнения движения для частиц. Полученная в результате классическая теория была совершенно удовлетворительна, но она не позволяла непротиворечивого квантования. Было показано, что волновое движение волновых пакетов не следует постулированным классическим уравнениям, но следует уравнениям Эйнштейна! Кажется вероятным, что эта попытка квантования открыла некоторую скрытую несогласованность в этих полевых уравнениях.

Следовательно, мы будем искать полный функционал 𝐹,


𝐹

=

𝐹²

+

𝐹³

+

𝐹⁴

+

… ,


(6.2.1)


который определяется из требования того, что результирующее уравнение есть уравнение движения


δ𝐹

δℎμν

=

λ𝑇

μν

,


(6.2.2)


которое автоматически имеет следствием условие на дивергенцию 𝑇μν (6.1.9). Функционал 𝐹 должен, следовательно, удовлетворять следующему дифференциальному функциональному уравнению:


𝑔

σλ


δ𝐹

δℎσν


⎠,ν

+

[μν,λ]


δ𝐹

δℎμν


=

0,


(6.2.3)


которое мы должны решить. Это в общем случае представляет чрезвычайно трудную задачу, и нет процедуры для получения решений таких уравнений. Мы должны будем положиться на нашу изобретательность в придумывании функционалов, которые есть решения в том смысле, что они удовлетворяют уравнению (6.2.2) при подстановке в него. Нет единственного общего решения этого уравнения, даже если мы добавим, что для малого значения ℎ мы будем выбирать такое решение, главные члены которого 𝐹² и 𝐹³ выводятся нами другими методами. Тем не менее, имеется очевидное ”наипростейшее” решение (включающее наименьшее число производных метрического тензора 𝑔μν - только две производных). Мы выбираем это решение. Когда этот выбор сделан, мы придём к теории, которая идентична эйнштейновской. С этого места мы откажемся от венерианской точки зрения и приступим к изучению теории гравитации с земной точки зрения, которая была изложена Эйнштейном.

6.3. Построение инвариантов по отношению к инфинитезимальным преобразованиям

Для того, чтобы решить задачу построения решений, удовлетворяющих уравнению (6.2.3), мы преобразуем это уравнение в некоторое эквивалентное утверждение о свойствах функционала 𝐹. Вначале заметим, что уравнение (6.2.3) есть векторное уравнение. Если мы возьмём скалярное произведение этого уравнения с произвольным вектором 𝐴λ(𝑥). и проинтегрируем по всему пространству, то мы получим уравнение, которое выглядит несколько иначе


𝑑τ

𝐴

λ

(𝑥)

𝑔

σλ

(𝑥)


δ𝐹

δℎσν


⎠,ν

+

𝐴

λ

(𝑥)

[σν,λ]


δ𝐹

δℎσν



=

0.


(6.3.1)


Если функционал 𝐹 удовлетворяет уравнению (6.3.1) для произвольного вектора 𝐴λ, тогда этот функционал удовлетворяет уравнению (6.2.3). Теперь мы можем проинтегрировать по частям первый член в подынтегральном выражении, так что мы избавляемся от градиента по отношению к ν. Мы получаем, что


𝑑τ


δ𝐹

δℎσν



-(

𝐴

λ

(𝑥)

𝑖

λσ

(𝑥)

)

+

[σν,λ]

𝐴

λ

(𝑥)

=

0.


(6.3.2)


Мы поместили черту под дифференциалом 𝑑τ для того, чтобы он напоминал нам, что мы должны взять усреднение этого интеграла, и в соответствующем интеграле, имеющем индексы σ и ν, происходит чередование индексов, а так как тензор ℎσν - симметричен, то имеющее смысл математическое тождество получается только в том случае, если скобка также симметрична по индексам σ и ν. Мы можем проинтерпретировать это уравнение (6.3.2) другим способом. Мы замечаем, что если мы делаем замену в первом порядке в тензоре ℎ, скажем, пусть ℎσν меняется на ℎσνσν то величина функционала 𝐹 меняется следующим образом:


𝐹[ℎ

σν

σν

]

=

𝐹[ℎ

σν

]

+

ξ

σν

δ𝐹

δℎσν

+

… .


(6.3.3)


Следовательно, наше уравнение (6.3.2) говорит нам, что для инфинитезимального ξσν и в форме, появляющейся в уравнении (6.3.2), величина 𝐹 остаётся неизменным.

Пусть тензорное поле ℎμν меняется инфинитезимальным преобразованием 𝐴λ на тензор ℎ'μν. Выражаем ℎ'μν согласно правилу, подразумеваемому в соотношении (6.3.2), как показано в следующем соотношении (мы должны помнить, что надо симметризовать выражение по индексам σν и использовать явное выражение для [σν,λ]):


ℎ'

σν

=

σν

-

1

2

𝑔

σν,λ

𝐴

λ

-

𝑔λσ𝐴λ


.


(6.3.4)


Положим для удобства -λ𝐴νν и запишем уравнение через 𝑔μν вместо ℎμν следующим образом:


𝑔'

σν

=

𝑔

σν

+

𝑔

σλ

ζ

λ

+

𝑔

νλ

ζ

λ

+

ζ

λ

𝑔

σν,λ

.


(6.3.5)


Тогда наша задача становится следующей: найти выражение для функционала 𝐹 от метрики 𝑔μν такое, что при инфинитезимальных преобразованиях, описываемых соотношениями (6.3.5), которые меняют тензор 𝑔μν на тензор 𝑔'μν, функционал 𝐹 не меняется в первом порядке малости по ζλ при любом ζλ(𝑥). Методы для решения уравнений, аналогичных исследуемому нами, были разработаны математиками1, работающими в дифференциальной геометрии (фактически очень близкая задача решается в дифференциальной геометрии), итак мы будем предполагать, как и хорошо образованные венерианские физики, что книги, дающие нам намёки на то, как приступить к решению, являются доступными.

1 См., например, книгу Веблена [Vebl 27].

Фактически, можно проверить, что преобразование, определяемое соотношением (6.3.5), есть преобразование тензорного поля при инфинитезимальном преобразовании координат 𝑥λ=𝑥'λλ. Однако, мы будем продолжать играть в нашу игру и попытаемся вывести наши результаты как венериане, не осознающие никакой геометрической интерпретации. Конечно, мы будем возвращаться назад и обсуждать геометрическую точку зрения при обсуждении точки зрения Эйнштейна.

Теперь приступим к нахождению желаемого инвариантного выражения для 𝐹. Для того, чтобы найти это выражение, полезно определить матрицу, которая обратна 𝑔μν, используя верхние индексы вместо нижних, что оказывается в данном случае предпочтительным, т.е.


𝑔

μν

𝑔

νσ

=

δ

μ

σ

,


(6.3.6)


где теперь


δ

μ

σ


- правильный символ Кронекера, который равен 1, если μ=σ, и нулю, если μ≠σ.

Обратная к матрице 𝐴'=𝐴+𝐵, если 𝐵 - инфинитезимальна, задаётся следующим выражением:


1

𝐴'

=

1

𝐴

-

1

𝐴

𝐵

1

𝐴

+

1

𝐴

𝐵

1

𝐴

𝐵

1

𝐴

- … .


(6.3.7)


Так как вектор ζλ инфинитезимален, мы можем легко построить тензор, обратный к тензору 𝑔'σν, согласно правилу, выраженному в соотношении (6.3.7)


𝑔'

αβ

=

𝑔

αβ

-

ζ

α

𝑔

νβ

-

ζ

β

𝑔

να

-

ζ

λ

𝑔

ασ

𝑔

βν

𝑔

σν,λ

+ … .


(6.3.8)


Теперь исследуем кратко один инвариант, который может быть легко найден, для того, чтобы понять используемые методы, а в следующем разделе построим более сложный инвариант, который приведёт нас к нашей полной теории.

Рассмотрим, как меняется определитель матрицы, если мы слегка меняем матрицу. Мы используем следующее выражение для определителя:


Det 𝐴

=

exp(Tr log 𝐴)

.


(6.3.9)


Мы не будем останавливаться здесь для обсуждения доказательства такого равенства;1 однако для того, чтобы показать, что оно выглядит разумным, мы могли бы заметить, что это утверждение становится тривиальным справедливым утверждением в случае, если матрица записала в диагональном виде:


Det 𝐴

=

𝐴₁₁

𝐴₂₂

𝐴₃₃

=


=

exp(

log 𝐴₁₁

+

log 𝐴₂₂

+…

)=

exp(Tr log 𝐴)

.


(6.3.10)


1 Это равенство является простым следствием из утверждения о существовании матричного логарифма невырожденной матрицы, которое доказано, например, в книгах [Гант 88*, Белл 76*]. (Прим. перев.)

Теперь мы применяем правило, выраженное соотношением (6.3.9), для вычисления определителя матрицы (𝐴+𝐵), где 𝐵 - инфинитезимальная матрица. Нам необходимо вычислить матричный логарифм матрицы 𝐴+𝐵; соответствующее разложение имеет вид


Det

𝐴

1

+

1

𝐴

𝐵


=

Det 𝐴⋅Det

1

+

1

𝐴

𝐵

=


=

Det 𝐴

exp

Tr

log

1

+

1

𝐴

𝐵



=


=

Det 𝐴

exp

Tr

1

𝐴

𝐵

.


(6.3.11)


Теперь мы используем это правило для того, чтобы вычислить определитель 𝑔'μν и взять логарифм результирующего выражения


log(-Det 𝑔')

=

log(-Det 𝑔)

+

λ

+

ζ

λ

𝑔

σν,λ

𝑔

σν

.


(6.3.12)


Произведение матриц 𝑔 в последнем члене может быть связано с определителем следующим образом:


𝑔

σν,λ

𝑔

σν

=

[log(-Det 𝑔)]


(6.3.13)


Наше достижение состоит в том, что мы получили новое соотношение, в которое включены ξλ и его градиенты совместно с числами, но не матрицами. Мы положим 𝐶=log(-Det 𝑔) и перепишем получившееся в результате уравнение как


𝐶'

=

𝐶

+

λ

+

𝐶

ζ

λ

.


(6.3.14)


Если бы это выражение было бы полной производной, мы могли бы проинтегрировать по всему пространству для того, чтобы получить наш инвариант. Вид последних двух членов наводит на мысль, что exp(𝐶/2) есть интегрирующий множитель. Следовательно, мы ищем инвариант вида exp(α𝐶'), регулируя соответствующим образом параметр α. Так как вектор ξλ - инфинитезимален, то разложение, в котором сохранены только первые члены, даёт


exp(α𝐶')

=

exp[α(

𝐶

+

λ

+

𝐶

ζ

λ

)]

=


=

exp(α𝐶)

+

exp(α𝐶)

(

2αζ

λ

+

α𝐶

ζ

λ

).


(6.3.15)


Второй член этого выражения имеет вид, который может быть преобразован в полную производную; мы замечаем, что


exp(α𝐶)ζ

λ

⎠,λ

=

exp(α𝐶)

ζ

λ

+

α𝐶

ζ

λ

exp(α𝐶)

,


(6.3.16)


что есть такая же величина, как и второй член выражения для (6.3.15) при α=1/2. Когда мы интегрируем выражение (6.3.15) по всему пространству, то при α=1/2 интеграл от второго члена обращается в нуль, и мы приходим к равенству


𝑑τ

exp(𝐶'/2)

=

𝑑τ

exp(𝐶/2)

.


(6.3.17)


Инвариантное решение, выраженное через матрицу 𝑔μν, есть, следовательно,


o

𝐹

=

𝑑τ

-Det 𝑔

.


(6.3.18)


6.4. Лагранжиан теории, справедливой во всех порядках

Инвариант o𝐹, полученный в предыдущем разделе, есть на самом деле решение дифференциального функционального уравнения (6.2.3), но это не есть то решение, которое необходимо для нашей теории, так как это решение не включает в себя производные. В данном разделе мы будем строить решение, необходимое для нашей теории, аналогичным методом. Успех этих манипуляций основан на нахождении точной дивергенции, которая может быть интегрирована по всему пространству.

Исходная точка наших рассуждений есть вновь уравнение (6.3.5), в которое включены вектор ζλ и его первые производные. Используемое нами правило есть следующее: мы надеемся найти комбинации 𝑔μν и их производные, причём эти комбинации не включают в себя ζ (или, по-крайней мере, полный дифференциал от этой величины), когда они преобразуются. Мы имеем в уравнении (6.3.5) первые производные ζ. Если мы вычисляем 𝑔'μν,σ, то появляются вторые производные, такие как ζλ,σν и т.п. Выглядит это так, как будто сложность даже увеличилась. Но если производная самого высокого порядка есть ζλ,σν и этот порядок появляется только в одном отдельном члене, мы можем исключить этот член путём вычитания члена с переставленными индексами. (На самом деле, в нашем случае мы не будем делать этого, выражение для ζλ,σν само по себе автоматически симметрично, но мы делаем аналогичную манипуляцию с более высокими производными.) Тогда сначала образуем выражение 𝑔'μν,σ, которое даёт вторые производные ζ вида ζλ,σν, но имеется две таких производных, ζλ,νσ и ζλ,μσ. Мы попытаемся преобразовать их, комбинируя с другими производными, такими как 𝑔'μσ,ν. Получается, что мы можем избавиться от двух членов, но появляется равное число новых членов, так что никакого упрощения не достигается. Но когда мы рассмотрим третье возможное упорядочение индексов 𝑔'νσ,μ, мы получаем путём сложений и вычитаний новое соотношение, в котором два члена могут добавляться, потому что они являются такими же. Одна трудность состоит в том, что так как мы вычисляем производные произведений, число членов стремительно растёт, например


𝑔'

μν,σ

=

𝑔

μν,σ

+

𝑔

μλ,σ

ζ

λ

+

𝑔

μλ,σ

ζ

λ

+

𝑔

μλ

ζ

λ

,νσ

+


+

𝑔

νλ

ζ

λ

,μσ

+

ζ

λ

𝑔

μν,λσ

+

ζ

λ

𝑔

μν,λ

,


(6.4.1)


но когда все операции сложения и вычитания, жонглирования индексами проведены, выполнена симметризация, мы находим


[μν,σ]'

=

[μν,σ]

+

[μλ,σ]

ζ

λ

+

[νλ,σ]

ζ

λ

+


+

[μν,λ]

ζ

λ

+

ζ

λ

[μν,σ]

-

𝑔

σλ

ζ

λ

,μν

,


(6.4.2)


где появляется только одна вторая производная ζλ,μν. Теперь мы должны избавиться от компонент метрического тензора с нижними индексами, умножая на обратную матрицу. Сначала введём новое обозначение, которое упростит преобразования. Мы положим


𝑔

τσ

[μν,σ]

=

Γ

τ

μν

.


(6.4.3)


Если мы умножаем соотношение (6.4.2) на 𝑔στ для того, чтобы отделить оставшуюся вторую производную, то соотношение принимает вид, где используются новые символы (называемые коэффициентами голономной связности или символами Кристоффеля)


Γ

τ

μν

'

=

Γ

τ

μν

+

Γ

τ

μλ

ζ

λ

+

Γ

τ

νλ

ζ

λ

-

Γ

λ

μν

ζ

τ

+


+

Γ

τ

μν,λ

ζ

λ

-

ζ

τ

,μν

.


(6.4.4)


Это соотношение автоматически симметрично по μν. Для того, чтобы продвинуться дальше в наших рассуждениях, продифференцируем ещё раз. Если мы дифференцируем это соотношение по новому индексу ρ и вычитаем соответствующее уравнение, имеющее переставленные индексы ρ и ν, то только следующие члены остаются не сокращёнными при этом вычитании


Γ

τ

μν,ρ

'

-

Γ

τ

μρ,ν

'

=

Γ

τ

μλ,ρ

ζ

λ

+

Γ

τ

νλ,ρ

ζ

λ

+

Γ

τ

μν,ρλ

ζ

λ

+


+

Γ

τ

ρλ

ζ

λ

,μν

-

Γ

λ

μν

ζ

τ

,λρ

-


- минус члены, где индексы ν и ρ переставлены.


(6.4.5)


Теперь трюк заключается в том, чтобы избавиться от двух вторых производных. Они умножаются на индексы Кристоффеля. Но в соотношении (6.4.4) мы имеем выражение, которое даёт как раз ζλ,μν. Мы будем использовать это выражение для того, чтобы заместить члены на те, которые стоят в соотношении (6.4.5). Это может быть выполнено путём вычисления произведения двух соотношений, таких как (6.4.4); мы видим, что индексы у символов Кристоффеля Γ одного члена такие же, как и индексы у ζ в другом члене; так что взяв произведения двух соотношений (6.4.4), одно из которых берётся со множеством индексов (τρλ), другое со множеством (λμν), переставляя (τ,μ,ν) и складывая с соотношением (6.4.5), вторые производные сокращаются.

Введём новую величину 𝑅τμνρ, определённую следующим образом


𝑅

τ

μνρ

=

Γ

τ

μν,ρ

+

Γ

τ

ρλ

Γ

λ

μν

-

Γ

τ

μρ,ν

-

Γ

τ

νλ

Γ

λ

μρ

.


(6.4.6)


Заметим, что этот тензор явно антисимметричен по индексам ρ и ν. Используя это обозначение, получаем наконец следующее соотношение


𝑅'

τ

μνρ

=

𝑅

τ

μνρ

+

ζ

λ

𝑅

τ

μλρ

+

ζ

λ

𝑅

τ

μνλ

+


+

ζ

λ

𝑅

τ

λνρ

+

ζ

τ

𝑅

λ

μρν

+

ζ

λ

𝑅

τ

μνρ,λ

.


(6.4.7)


То, что мы должны теперь делать, это обращаться с этим уравнением так же, как мы обращались с уравнением (6.3.5), которое имеет ту же самую форму, исключая то, что тензор в последнем соотношении предпочтительнее включать тензор 𝑅τμνρ, а не 𝑔σν. Процедура, полностью аналогичная той, которая была рассмотрена ранее, приводит к ответу для инвариантной величины 𝐹:


𝐹

=-

1

2λ²

𝑑τ

𝑔

μν

𝑅

τ

μνρ

-Det 𝑔

αβ

.


(6.4.8)


Эта величина, как мы увидим ниже, есть часть действия в теории, справедливой во всех порядках.

6.5. Уравнение Эйнштейна для тензора энергии-импульса

Функционал 𝐹, который был только что выведен, даёт результаты в венерианской теории гравитации, идентичные тем, которые были получены Эйнштейном. Если мы делаем разложение функционала, когда гравитационные поля слабы, мы получаем главные члены нашего разложения такие же, как 𝐹² и 𝐹³ в нашей более ранней теории. Мы можем сказать, следовательно, что наша венерианская точка зрения была успешна в достижении нашей цели построения самосогласованной теории гравитации посредством успешных логических шагов, предполагаемых по аналогии, но без видимого требования сверхчеловечески острой интуиции. Сам Эйнштейн, конечно, пришёл к тому же самому лагранжиану, но без помощи развитой теории поля, и я должен допустить, что у меня даже нет идеи, как он отгадал конечный результат. У нас было достаточно волнений при получении нашей окончательной теории, но я чувствую, что он создал свою теорию, плавая под водой, будучи с завязанными глазами и с руками, находящимися сзади! Тем не менее теперь, когда мы пришли к эквивалентной теории, мы откажемся от венерианской точки зрения и обсудим земную точку зрения согласно Эйнштейну.

Будем использовать следующее стандартное обозначение для трёх тензоров, выведенных из нашего тензора 𝑅τμνρ, умножением на тензор 𝑔αβ и свёртыванием:


𝑔

τσ

𝑅

τ

μνρ

=

Антисимметричен по индексам


(σμ)

и

(νρ)

,


𝑅

τ

μντ

=

𝑅

μν

,


𝑔

μν

𝑅

μν

=

𝑅.


(6.5.1)


Величина 𝑅σμνρ есть тензор (тензор Римана). Он антисимметричен при перемене индексов ν и ρ, также антисимметричен при перемене σ и μ и симметричен, если пара (σμ) меняется с (νρ). 𝑅μν (тензор Риччи) - симметричен.

Вариация функционала 𝐹, описываемого соотношением (6.4.8), по отношению к 𝑔μν приводит к следующему соотношению:


2

δ𝐹

δ𝑔μν

=-

1

λ²


δ(√-𝑔𝑅)

δ𝑔μν

=-

1

λ²

-𝑔

𝑅

μν

-

1

2

𝑔

μν

𝑅

,


(6.5.2)


где 𝑔≡Det 𝑔μν. Последняя величина в соотношении (6.5.2) есть тензор энергии-импульса нашей теории (см. соотношение (6.2.2)) и удовлетворяет следующему соотношению


𝑔

σλ

𝑇

λν

=-

[μν,σ]

𝑇

μν

 (или

𝑇

λν

=-

Γ

λ

μν

𝑇

μν

),


(6.5.3)


если сделана замена 𝑇μν как мы требовали это сделать. Отсюда следует, что полные уравнения гравитационного поля, правильные во всех порядках, являются следующими:


-𝑔

𝑅

μν

-

1

2

𝑔

μν

𝑅

=

λ²

𝑇

μν

,


(6.5.4)


где 𝑇μν - наш тензор энергии вещества. Это уравнение и есть уравнение, полученное Эйнштейном.

Лекция 7

7.1 Принцип эквивалентности

В наших нынешних планах будет описание относительности и гравитации с точки зрения, которая в большей степени находится в согласии с подходом Эйнштейна. Мы надеемся, что, рассматривая теорию с различных выгодных точек зрения, мы лучше поймём теорию в целом. Теория гравитации, как она рассматривалась в рамках идей Эйнштейна, есть нечто настолько удивительно волнующее, что мы будем испытывать искушение попытаться сделать так, чтобы все остальные поля выглядели как гравитация, что является пожалуй предпочтительнее, чем продолжать исследование гравитации с венерианского направления, делающего гравитацию похожей на другие поля, которые нам привычны. Мы будем сопротивляться этому искушению.

Истоки подхода Эйнштейна должны быть найдены в физике, известной во время создания им теории гравитации, в электродинамике и ньютоновской механике. Чувствуется, что идея, преобладающая в мыслях Эйнштейна во время создания им его теорий, заключалась в том, что все разделы физики должны были бы быть согласованы; он нашёл путь, чтобы уладить лоренц-инвариантность классической электродинамики с видимой галилеевой инвариантностью ньютоновской механики, и много новых физических результатов было достигнуто после этого. Аналогично, именно загадочный феномен гравитации привёл Эйнштейна к теории гравитации, когда он преобразовал этот феномен в физический принцип.

Центральная идея гравитации, наиболее убедительный факт о том, как она действует, состоит в том, что вес и масса в точности пропорциональны, так что все объекты ускоряются гравитацией в точности с одной и той же скоростью независимо от состава вещества, из которого состоят эти тела. Эксперимент Этвеша показал, как центробежная сила добавляется к гравитационной силе так, что результат неотличим от чисто гравитационного эффекта. Возможно такие эксперименты навели Эйнштейна на мысль о том, что может быть такой физический принцип, который заставляет ускорения имитировать гравитацию во всех отношениях. Совершенно очевидно, что механические эксперименты, проводимые внутри ускоряющегося ящика, дают результаты, которые неотличимы от результатов, которые могли бы быть получены в том случае, если ящик находился в покое, но имелось бы гравитационного поле. Во времена Эйнштейна не было прямых проверок этого факта, но теперь нам хорошо знакома невесомость в спутниках, которая возникает вследствие того, что гравитационная сила и центробежная оказываются одинаковыми по абсолютной величине и противоположными по знаку. Возможность возникновения подобного рода невесомости есть суть принципа эквивалентности.

Перед тем, как мы извлечём полезную физику из этой идеи, мы должны иметь утверждение, которое является более точным и которое включает в себя определённые измеряемые величины. Более точное утверждение, которое имело бы смысл в рамках ньютоновской механики, могло бы включать в себя силы, действующие на стационарные объекты. Если мы осуществляем движение ящика с постоянным ускорением 𝑔, то на все тела, которые находятся в ящике, должна действовать сила, которая в точности пропорциональна весу; например, силы давления на подставки или силы натяжения пружины, поддерживающей эти тела внутри ящика, являются теми же самыми, что и силы, вызываемые однородным гравитационным полем, характеризуемым ускорением 𝑔. Так как сила давления на подставку не является напрямую измеряемой величиной, то возможно предпочтительнее рассуждать о весе тел, подвешенных на пружинах. Смещения от величины длины пружины в нерастянутом состоянии для заданных масс, подвешенных на заданных пружинах, должны быть в точности равны, когда (1) ящик находится в стационарном гравитационном поле, характеризуемом ускорением 𝑔, или (2) ящик ускоряется с постоянным ускорением 𝑔 в области, где гравитационное поле равно нулю, как показано на рис. 7.1.

Фейнмановские лекции по гравитации

Рис. 7.1.

Это утверждение принципа эквивалентности является более физическим, но мы пока говорим на элементарном уровне без определения природы сил более точно. Возможно ли сделать физически значимые утверждения без определения природы сил? Мы можем напомнить ситуацию в механике Ньютона. Часто говорится, что второй закон Ньютона


𝐹

𝑥

=

𝑚𝑥̈

,


(7.1.1)


есть просто определение сил, так что этот закон не несёт в себе никакой реальной физики, поскольку содержит в себе рассуждение, проводимое по логическому кругу. Но очевидно, что теория Ньютона целиком не является логическим кругом, так как она правильно предсказывает орбиты Луны и планет. Что Ньютон имел в виду, говоря нам, что мы должны вычислять силы в соответствии с (7.1.1), было то, что если существует ускорение, мы должны оглядеться по сторонам в поисках какой-либо физической причины, которая вызывает такую силу. Будущее физики лежит в нахождении того, как окружение объекта связано с силами, которые мы подставляем в левую часть уравнения (7.1.1) так, чтобы соответствовать наблюдаемым ускорениям.

Когда Ньютон приходит к своему третьему закону


𝐹

(действие)

=-

𝐹

(противодействие),


(7.1.2)


он делает физическое утверждение, так как он приводит детальные характеристики связи между силами и физическими объектами. Ньютоновский закон гравитации есть другая детальная характеристика того, как окружение объекта связывается с его ускорениями. Второй закон Ньютона задаётся в духе ”cherehez la femme”: Если мы видим силу, то мы должны искать ”виновный” объект, который вызывает эту силу.

Аналогичным способом наша простая формулировка принципа эквивалентности даёт физическое утверждение о том, как окружение влияет на тела; оно не зависит от правильности второго закона Ньютона (7.1.1). Окружение в этом случае состоит из масс, которые образуют гравитационные поля, или внешние силы создают ускорения.

Невозможно полностью исключить гравитационные эффекты однородными ускорениями. Представим себе ящик на орбите земли, т.е. спутник. Так как гравитационное поле не является однородным, имеется только одна точка вблизи центра масс спутника, где гравитационные эффекты в точности скомпенсированы ускорением. Если мы удаляемся достаточно далеко от центра масс, гравитационное поле Земли меняет или свою величину, или направление, так что будут существовать малые нескомпенсированные компоненты гравитационных сил. Если ящик не очень велик, эти дополнительные силы очень близки к пропорциональности расстоянию от центра этого ящика и имеют квадрупольный характер, как показано на рис.7.2(а). Силы, подобные этим, вызывают приливы на Земле, так что мы можем называть их приливными силами. Мы можем рассмотреть также ящик, который помещён в подобное неоднородное поле, но не ускоряется, как показано на рис.7.2(б). Принцип эквивалентности говорит нам теперь, что мы можем создать ситуацию, физически неотличимую от той, которая происходит внутри спутника, если мы поместим большие массы достаточно далеко, так что мы накладываем однородное поле, которое в точности компенсирует гравитацию в центре ящика.

Фейнмановские лекции по гравитации

Рис. 7.2.

Попробуем посмотреть, как мы могли бы сделать ещё лучшее утверждение эквивалентности: одно гравитационное поле внутри ускоряемого ящика эквивалентно другому гравитационному полю и другому ускорению ящика. Мы можем исключить гравитацию в любой отдельной точке и в любой отдельный момент времени; в некоторой малой области, окружающей данную точку, остаточные отличия должны быть пропорциональны расстоянию от точки, где ускорения скомпенсированы. Становится очевидным, что при создании нашей теории мы будем рассматривать преобразования, которые можем символически записать как


(гравитация)'

=

(гравитация)

+

(ускорение).


(7.1.3)


Вследствие этой возможности, мы не будем способны сказать в любом абсолютном смысле, что один эффект является гравитационным или вызывается силами инерции; невозможно определить ”истинную” гравитацию, так как мы не можем даже точно определить, какая часть наблюдаемой силы вызывается гравитацией и какая обусловлена действием сил инерции. Оказывается верным то, что мы не можем имитировать гравитацию ускорениями всюду, что проявляется в том случае, когда мы рассматриваем ящики больших размеров. Тем не менее, рассматривая преобразования (7.1.3) в инфинитезимальных областях, мы надеемся узнать, как описать эту ситуацию в дифференциальном виде; только затем мы будем беспокоиться о граничных условиях или описании гравитации в больших областях пространства.

В специальной теории относительности проводится интенсивное использование инерциальных систем отсчёта, которые движутся друг относительно друга с постоянной скоростью и прямолинейно. Но, как только мы допускаем существование гравитирующих масс всюду во Вселенной, концепция такого истинного неускоренного движения становится невозможной, поскольку всюду будут гравитационные поля.

Если мы проводим эксперименты внутри ящика, который не находится в свободном падении, то будет возможно определить наличие сил типа гравитации, например, экспериментами с применением пружин. Тем не менее, мы не можем сказать, находясь внутри ящика, ускоряемся ли мы относительно ”туманности”, или эти силы обусловлены массами, находящимися в окрестности ящика. Именно этот характерный факт о гравитационных силах даёт намёк на постулат, который в конце концов приводит нас к полной теории.

Мы постулируем: будет невозможно посредством какого бы то ни было эксперимента, проводимого внутри такого ящика, детектировать различие между ускорением относительно ”туманности” и гравитацией. Таким образом, ускоряющийся ящик в некотором гравитационном поле неотличим от покоящегося ящика в некотором другом гравитационном поле, если наблюдатель находится внутри ящика.

Это звучит так похоже на рассуждения Эйнштейна, так напоминает его постулат специальной теории относительности! Мы знаем, что принцип эквивалентности работает для пружин (как мы знали, что специальная теория относительности работает для электродинамики) и мы распространяем его по соглашению на какие бы то ни было эксперименты. Мы привыкли использовать такие процедуры к настоящему времени, но каким удивительным являлся этот принцип в 1911 году - таким удивительным человеком был Эйнштейн.

7.2. Некоторые следствия принципа эквивалентности

Принцип эквивалентности говорит нам о том, что свет отклоняется (от прямолинейного движения) в гравитационном поле. Величина этого отклонения, когда свет проходит заданное расстояние в области однородного гравитационного поля, может быть очень легко вычислена путём анализа движения света в ускоряемом ящике; если ящик ускоряется, то свет движется по прямой линии в неускоряемой системе отсчёта, т. е. рассматривается простая кинематика для вычисления траектории света внутри ящика. Для такого эксперимента необходимы только источник света и детектор, и ряд разрезов для того, чтобы определить траекторию движения света, как проиллюстрировано на рис. 7.3.

Фейнмановские лекции по гравитации

Рис. 7.3.

Мы не можем использовать такие простые средства для вычисления отклонения света звездой, поскольку поле звезды неоднородно; подобное простое вычисление было бы неверным на множитель, равный 2, если мы просто используем ньютоновские потенциалы; для правильного вычисление необходимо использовать соответствующие релятивистские поля.

Принцип эквивалентности также говорит нам о том, что ход часов изменяется гравитацией. Свет, который испускается из вершины ускоряемого ящика, будет выглядеть смещённым в фиолетовую часть, если мы смотрим на него со дна ящика. Давайте проделаем некоторые вычисления, соответствующие малым скоростям. Время, за которое свет проходит от верха ящика до дна, составляет в первом приближении ℎ/𝑐 где ℎ - высота ящика на рис. 7.3. В то же самое время дно ящика приобрело небольшую дополнительную скорость 𝑣=𝑔ℎ/𝑐. Чистый эффект состоит в том, что приёмник движется относительно излучателя, так что частота смещается


𝑓

поглощ

=

𝑓

испущ

(1+𝑣/𝑐)

=

𝑓

испущ

(1+𝑔ℎ/𝑐)

.


(7.2.1)


Таким образом, приёмник на дне получит фотон с частотой, отличной от частоты, с которой испускался фотон. Заметим, что это заключение не зависит от энергии 𝐸=𝑚𝑐² и существования энергетических уровней, что необходимо было постулировать в соответствии с аргументами, которые были приведены ранее. Это заключение основано на ожидаемом поведении классических объектов; вычисление следует из геометрии и кинематики и даёт прямое физическое предсказание, следующее из постулата эквивалентности. Как и ранее, этот вывод не является парадоксом; часы выглядят более голубыми на вершине ящика, человек, живущий на вершине ящика, выглядит более голубым, чем человек, живущий на дне ящика. Аналогично предыдущему, мы можем вычислить сдвиг частоты для света, испускаемого человеком, живущим внизу. Так как в этом случае приёмник удаляется от источника, человек, живущий внизу, выглядит краснее, когда его рассматривают сверху.

Один из способов описания этой ситуации состоит в том, чтобы сказать, что время течёт быстрее на вершине ящика; течение времени различно при различных гравитационных потенциалах, так что течение времени не одинаково в различных частях нашего мира. Как велико это различие хода времени может быть в различных точках пространства? Для того, чтобы вычислить это различие, мы сравниваем ход времени с абсолютными временными интервалами, определёнными через собственное время 𝑑𝑠. Предположим, что имеется два события, происходящие на вершине, о которых сообщается, что они разделены временем 𝑑𝑡, тогда


φ

=

𝑔ℎ

;

𝑑𝑠

=

𝑑𝑡

(1+φ/𝑐²)

,


(7.2.2)


в пределе малых скоростей. Величина φ есть просто разность потенциалов между положением событий и точкой отсчёта. Более точное вычисление даёт нам выражение, которое может быть использовано при всех скоростях


𝑑𝑠

=

𝑑𝑡

1+2φ/𝑐²

.


(7.2.3)


Вновь мы должны напомнить, что мы не просто используем ньютоновские потенциалы в этом выражении; наше определение φ должно быть релятивистски точным.

7.3. Максимальные скорости хода часов в гравитационных полях

Теперь, поскольку мы заключили, что гравитационные эффекты приводят к тому, что часы идут быстрее в областях с более высоким потенциалом, мы можем поставить забавный вопрос. Мы знаем, что часы должны идти быстрее, если мы перемещаем их вверх от поверхности Земли. С другой стороны, когда мы перемещаем их, они должны замедляться, вследствие влияния эффектов специальной теории относительности. Вопрос состоит в том, как мы должны были бы передвигать часы вверх и вниз вблизи поверхности Земли, чтобы сделать эту разницу по времени как можно больше? Для простоты рассмотрим эту задачу в предположении, что Земля имеет однородное гравитационное поле и рассматривается движение только в одном измерении. Ясно, что эта задача имеет решение. Если мы движемся очень быстро, со скоростью света, часы не обгоняют наземные часы вовсе, и мы получаем время меньшее, чем время наземных часов. Если мы поднимаем часы на очень небольшую высоту и держим их там, то будет некоторый избыток времени по сравнению с наземными часами. Ясно, что имеется некоторый оптимальный путь движения часов так, чтобы этот избыток времени был наибольшим для заданного интервала времени на Земле. Правила состоят в том, что мы должны принести часы назад для того, чтобы сравнить их с показаниями наземных стационарных часов.

Фейнмановские лекции по гравитации

Рис. 7.4.

Мы дадим ответ немедленно, хотя было бы хорошим упражнением проделать вычисление во всех деталях. Для того, чтобы сделать так, чтобы движущиеся часы ушли вперёд наибольшим образом в заданный интервал наземного времени, скажем за один час, мы должны бросить их вверх с такой скоростью, чтобы они свободно падали всё время и вернулись назад ровно через один час. См. рис. 7.4. Задача будет более сложной, если мы попытаемся проделать это в большем числе измерений, однако получается тот же самый ответ; если мы хотим сделать так, чтобы часы вернулись назад, но на другое место на Земле, мы должны осуществить движение часов по баллистической траектории. Такой же самый ответ получается для случая неоднородного гравитационного поля. Если мы должны ”выстрелить” часами с одного спутника Земли на другой, то истинная орбита часов это та, которая соответствует максимальному собственному времени.

При работе с подобными задачами возникает некоторое беспокойство, поскольку мы не сделали точных определений. Например, решения типа свободного падения не обязательно являются единственными; задача о баллистическом движении ”пушечного ядра” в общем случае имеет два решения, что означает, что два значения угла и два значения начальной скорости будут давать максимум (орбита спутника может проходить длинный путь вокруг Земли). Тем не менее, любое из этих решений соответствует максимуму времени пролёта для движущихся часов. Имеется ли для этих траекторий относительный максимум или абсолютный не столь важно для наших целей, но что важно, так это то, что эти решения наводят на мысль о том, как мы можем получить механику из вариационного принципа.

Чтобы понять значение максимальной величины времени пролёта, мы можем рассмотреть, что происходит в пределе малых скоростей. Время пролёта есть интеграл от 𝑑𝑠, который представляет скорость тикания этих часов. В нерелятивистском пределе интеграл, который должен быть максимизирован, есть


𝑑𝑠

=

𝑡₁

𝑡₀

𝑑𝑡

1

+

φ

𝑐²

-

𝑣²

2𝑐²

+ …

,


(7.3.1)


при


1-𝑣²/𝑐²

1

-

𝑣²

2𝑐²

.


Первый член интегрируется по разности времени в заданной системе отсчёта (𝑡₁-𝑡₀). Другие два члена могут быть переписаны, чтобы иметь вид, который должен быть очень привычным, умножая на массу частицы и меняя знак, получим


𝑑𝑠

=

(𝑡₁-𝑡₀)

-

1

𝑚𝑐²


𝑡₁

𝑡₀

𝑑𝑡


1

2

𝑚𝑣²

-

𝑚φ

.


(7.3.2)


Для того, чтобы максимизировать это выражение для фиксированной величины интервала времени (𝑡₁-𝑡₀), мы берём минимум интеграла в правой части последнего соотношения. Но этот интеграл есть не что иное, как классическое действие для частицы массы 𝑚 в гравитационном потенциале φ. Мы видим, что требование того, что собственное время должно иметь максимальное значение, эквивалентно принципу наименьшего действия в классическом пределе.

Эти результаты наводят нас на мысль о том, как мы могли бы получить закон механики (эквивалентный, грубо говоря, второму закону Ньютона), который бы был релятивистским. Этот принцип состоит в том, что вариация ∫𝑑𝑠 должна быть равна нулю, т.е.


δ

2

1

𝑑𝑠

=

0.


(7.3.3)


Именно Эйнштейн высказал гипотезу, что этот принцип будет описывать движение в присутствии гравитационных полей. С использованием этого принципа была решена задача нахождения уравнений движения, задаваемого этим полем. Оставшаяся проблема сейчас состоит в том, чтобы связать потенциал φ, который появляется в этом выражении, с окружающей средой. Это было огромной проблемой до Эйнштейна. Как мы можем получить правильное выражение для потенциала φ? Что происходит, если мы используем неверную теорию гравитации, как если бы мы работали в системе, в которой имеются центробежные силы, но мы не знали бы этого? Мы видели, что гравитационные силы запутанно смешены с силами инерции, так что мы не можем сделать универсально правильного разделения на эти две силы.

Догадка Эйнштейна и состояла в том, что в подобных ситуациях не должно иметь значения, рассматриваем ли мы универсально правильное значение потенциала φ или нет; если этот потенциал корректно определён, то описание физики должно быть независимо от того, каким частным образом мы разделили инерциальные и гравитационные эффекты. Таким образом, для того, чтобы сконструировать формулу для φ, которая бы удовлетворяла этому свойству, мы должны изучить очень тщательно способ, пользуясь которым, интервал собственного времени 𝑑𝑠 выражается в различных координатных системах, когда мы применяем преобразования такие, которые мы символически записывали как ”гравитация' = гравитация + ускорение”. Такое изучение может позволить нам построить выражение для 𝑑𝑠, которое является инвариантным при всех возможных преобразованиях.

7.4. Собственное время в общих координатах

Для того, чтобы получить формулу Эйнштейна для (𝑑𝑠)², мы должны рассмотреть системы отсчёта, которые не только ускоряются, но также находятся под действием сил, которые искажают их форму произвольным образом. Мы хотим получить общую формулу для координат, которая аналогична определению координатных систем, вращающихся друг относительно друга


𝑥'

=

𝑥

cos ω𝑡

+

𝑦

sin ω𝑡

,

𝑧'

=

𝑧,


𝑦'

=

𝑦

cos ω𝑡

-

𝑥

sin ω𝑡

,

𝑡'

=

𝑡,


(7.4.1)


Мы описываем ускорение общего вида и растяжение произвольного вида, устанавливая, как каждая из четырёх координат одной системы зависит от всех координат другой системы


𝑥

=

𝑥(

𝑥',𝑦',𝑧',𝑡'

),


𝑧

=

𝑧(

𝑥',𝑦',𝑧',𝑡'

),


𝑦

=

𝑦(

𝑥',𝑦',𝑧',𝑡'

),


𝑡

=

𝑡(

𝑥',𝑦',𝑧',𝑡'

).


(7.4.2)


Рассмотрим вначале ситуацию, которая возникает, когда φ=0. В этом случае мы знаем, что собственное время в нескрученной системе есть просто (здесь мы положим 𝑐=1)


(𝑑𝑠)²

=

(𝑑𝑡)²

-

(𝑑𝑥)²

-

(𝑑𝑦)²

-

(𝑑𝑧)²

.


(7.4.3)


Для того, чтобы описать собственное время в штрихованных координатах, мы просто переписываем дифференциалы следующим образом:


𝑑𝑥

μ

=

∂𝑥μ

∂𝑥'α

𝑑𝑥'

α

,

(𝑑𝑠)²

=

η

μν

𝑑𝑥

μ

𝑑𝑥

ν

.


(7.4.4)


Это определяет метрический тензор 𝑔'αβ, который содержит описание длины дуги 𝑑𝑠 в произвольным образом скрученной и ускоренной системе


(𝑑𝑠)²

=

η

μν

∂𝑥μ

∂𝑥'α


∂𝑥ν

∂𝑥'β

𝑑𝑥'

α

𝑑𝑥'

β

=

𝑔'

αβ

𝑑𝑥'

α

𝑑𝑥'

β

.


(7.4.5)


Заметим, что 𝑔'αβ представляет десять функций координат (𝑥',𝑦',𝑧',𝑡'), так как имеется десять билинейных произведений 𝑑𝑥α𝑑𝑥β. Метрический тензор - симметричен. Как только мы имеем эти десять функций точно определёнными, то нахождение траекторий, для которых собственное время достигает максимума, должно будет представлять собой чисто математическое упражнение.

Что же происходит, когда гравитация не равна нулю? В простом случае, который мы рассматривали в предыдущем разделе, мы нашли, что собственное время задаётся чем-то вроде следующего соотношения


(𝑑𝑠)²

=

(1+2φ/𝑐²)

(𝑑𝑡)²

-

(𝑑𝑥)²

-

(𝑑𝑦)²

-

(𝑑𝑧)²

.


(7.4.6)


Это выражение только слегка отличается от случая, когда гравитационное поле равно нулю. Именно Эйнштейну принадлежала идея о том, что полное описание гравитации могло бы быть всегда определено метрическим тензором 𝑔αβ, таким как


(𝑑𝑠)²

=

𝑔

αβ

𝑑𝑥

α

𝑑𝑥

β

.


(7.4.7)


Случай нулевого поля соответствует частной простой форме для метрического тензора 𝑔αβαβ. При изменении координатной системы новый метрический тензор задаётся соотношением:


𝑔'

αβ

=

∂𝑥μ

∂𝑥'α


∂𝑥ν

∂𝑥'β

𝑔

μν

.


(7.4.8)


Как и ранее, движение частиц задаётся требованием, чтобы собственное время достигало максимального значения на траектории движения. Если возможно, используя некоторый разумный способ выбора преобразований, привести тензор к виду 𝑔'αβαβ, тогда мы можем сделать заключение, что гравитационного поля нет и что также нет и ускорения. Но это не может быть сделано в общем случае, так как общий тензор 𝑔αβ представляет десять предположительно независимых функций, и только четыре функции могут быть точно определены при преобразовании координат (7.4.2). Только при очень специфических условиях ускорения могут устранить все недиагональные члены всюду и привести этот тензор к виду ημν. Если же на самом деле имеется некоторое вещество в окружающей среде, приведение этого тензора к виду ηαβ невозможно. В этом случае все возможные тензоры 𝑔αβ, связываемые соотношениями (7.4.8), будут эквивалентны, так как ни один из них не приводит к очень простым выражениям для (𝑑𝑠)².

Каковы же наши успехи в изучении характера описания гравитационных сил? В ньютоновской теории соответствующее положение есть утверждение, что сила задаётся градиентом скалярной функции


Ньютоновская гравитация:


𝑚𝑥̈

=

𝐹

𝑥

,

𝐹

𝑥

=-

∇φ

,


Теория Эйнштейна:


δ

𝑑𝑠

=

0,


(𝑑𝑠)²

=

𝑔

μν

𝑑𝑥

μ

𝑑𝑥

ν

.


(7.4.9)


Вторая часть теории соответствует точному определению того, как потенциалы (φ или 𝑔μν) связаны с веществом. В ньютоновской теории мы имеем


Δ

φ

=

4π𝐺ρ

.


(7.4.10)


В конце концов мы придём к точному определению тензора 𝑔μν, выраженному через характеристики вещества. Основная идея состоит в том, что поскольку материя есть физическая категория, в то время как системы координат нет, вещество должно быть описано таким образом, чтобы результаты решения уравнения движения не зависели от какого-либо специального выбора системы координат, тем самым ожидается, что имеющие физический смысл свойства тензора 𝑔μν должны быть инвариантными величинами при произвольных преобразованиях.

7.5. Геометрическая интерпретация метрического тензора

Тензор 𝑔μν может иметь геометрическую интерпретацию. Для приобретения необходимой интуиции мы будем изучать вкратце значение метрического тензора в случае двух измерений, чтобы понять какие инварианты включены в теорию. В случае однородных гравитационных полей мы видели, что тензор 𝑔μν описывает, как масштаб времени отличается при различных положениях точки в пространстве. В более широком смысле этот тензор представляет, как масштабы меняются от точки к точке не только во времени, но также и при изменении пространственных координат. В ортогональных декартовых координатах двумерная длина дуги 𝑑𝑠 задаётся следующим соотношением


(𝑑𝑠)²

=

(𝑑𝑥)²

+

(𝑑𝑦)²

.


(7.5.1)


Если использовать на плоскости полярные координаты, то длина дуги задаётся соотношением:


(𝑑𝑠)²

=

(𝑑𝑟)²

+

𝑟²

(𝑑θ)²

.


(7.5.2)


Очевидно, что не имеет значения, какие символы мы используем для координат, и физика на плоскости должна быть одинакова независимо от того, используем мы декартовы координаты или полярные координаты для описания геометрии на плоскости. Это означает, что если мы находим, что описание длины дуги в некоторой системе, которую мы выбрали, корректно задаётся соотношением:


(𝑑𝑠)²

=

𝑦²

(𝑑𝑥)²

+

(𝑑𝑦)²

.


(7.5.3)


нет глубокого смысла в том, что кажется, будто длина 𝑥 меняется при изменении координаты 𝑦, поскольку простое координатное преобразование сохраняет декартово выражение для длины дуги (7.5.1).

Теперь рассмотрим более интересный случай. Представим себе, что мы - жуки, ползающие по полу, который, как мы всегда предполагали, замощён квадратными кафельными плитками, и всю нашу жизнь мы думали, что геометрия пола правильно задаётся подсчётом плиток и использованием евклидовского правила (7.5.1), что интервалы 𝑑𝑥 или 𝑑𝑦 соответствуют величине длины плитки. Но некоторые остроумные жуки начали проверять это, используя линейки, и после серии измерений пришли к результату, что измеренные длины дуг соответствуют количеству плиток следующим образом:


(𝑑𝑠)²

=

(𝑑𝑥)²+(𝑑𝑦)²

1+𝑎𝑟²

,


(7.5.4)


где 𝑟²=𝑥²+𝑦² Предположим, что эти остроумные жуки очень тщательно измеряли отношение длины окружности к величине радиуса круга, прикладывая свои линейки вдоль кривых с постоянным значением 𝑟 и от центра круга вдоль одной из осей. Их результаты дали бы следующие значения:


Длина окружности


=

𝑑𝑠

=

0


𝑟 𝑑θ

(1+𝑎𝑟²)

=

2π𝑟

(1+𝑎𝑟²)

,


Радиус круга


=

𝑟

0

𝑑𝑠

⎪𝑦=0

=

𝑟

0


𝑑𝑥

(1+𝑎𝑥²)

=

𝑏

arctg


𝑟

𝑏


=

𝑅,


(7.5.5)


где 𝑏²=1/𝑎. Экспериментальный результат для отношения длины окружности к радиусу должен был бы давать в этом случае


1

𝑅


2π𝑏 tg(𝑅/𝑏)

1+tg²(𝑅/𝑏)

=

sin(𝑅/𝑏)

(2𝑅/𝑏)

.


(7.5.6)


Это отношение становится равным 2π только в пределе, когда радиус окружности стремится к нулю. Именно это измеряемое соотношение и является существенным физическим результатом.

Эта частная модель, которую мы обсудили, имеет простую геометрическую интерпретацию, но мы снова подчёркиваем, что именно экспериментальные результаты очень важны и они полностью зависят от правильной формулы для длины дуги; и вовсе не имело бы значения, что мы не можем привести простую формулу геометрического смысла, который мы можем легко представить.

Мы можем сказать, что всё это время жуки живут на поверхности сферы, не зная этого. Теперь, когда мы предположили это, мы легко понимаем, почему наши измерения окружностей давали частный результат, приведённый в соотношении (7.5.6). Если сфера имеет радиус (𝑏/2), то результат, данный соотношением (7.5.6), представляет отношение длины окружности круга к длине вдоль поверхности меридиана, как показано на рис. 7.5.

Фейнмановские лекции по гравитации

Рис. 7.5.

Наша предыдущая точка зрения на гравитацию может быть сравнима с той, которая могла бы проводится более консервативными жуками. Кафельные плитки являются ”реальными” квадратами, но линейки изменяются, если мы двигаем их от места к месту, поскольку имеется поле, которое может привести к этому эффекту. Наша более новая геометрическая точка зрения будет состоять в том, что мы не можем определять ”кафельные плитки”, как ”реальные” квадраты; мы живём в мире, который, вообще говоря, неевклидов, имеет кривизну, которая измеряется проведением подходящих экспериментов. Нет нужды думать о процессах, как происходящих в пространстве, которое есть истинно евклидово, так как нет ничего физического, что могло бы быть даже измерено в этом воображаемом пространстве. Кафельные плитки просто представляют нанесение координатных меток, и любое другое нанесение меток может быть также произведено, как и предыдущее.

7.6. Кривизна в двух и четырёх измерениях

Инвариантной величиной, которая характеризует геометрию способом, не зависящим от специального выбора системы координат, является кривизна. Очень просто представить себе смысл кривизны, когда мы рассматриваем двумерную поверхность: плоское неискривлённое пространство, такое как плоскость, или искривлённое пространство, такое как кривая поверхность. Хотя в нашей последующей работе нам понадобится работать с кривизной аналитически, сейчас следует немного поработать с двумерной геометрией, которую мы можем очень просто представить; определения кривизны в более высоких измерениях есть точные аналоги определения кривизны поверхности.

В общем случае длина дуги на двумерной поверхности задаётся соотношением


(𝑑𝑠)²

=

𝑔₁₁

(𝑑𝑥)²

+

2𝑔₁₂

𝑑𝑥

𝑑𝑦

+

𝑔₂₂

(𝑑𝑦)²

.


(7.6.1)


Хотя очевидно, что три функции 𝑔𝑎𝑏 включены в это выражение, инвариантная геометрия определяется только одной функцией координат; оказывается, что мы имеем определённую свободу в выборе координат, например, мы можем сделать их ортогональными; мы обладаем достаточной свободой для того, чтобы наложить два условия на функции 𝑔𝑎𝑏, для этого у нас есть две функции, с помощью которых мы можем делать координатные преобразования. В частности, всегда можно выбрать координаты таким образом, что


1.

𝑔₁₂

=

0,


2.

𝑔₂₂

=

𝑔₁₁.


Это означает, что для целей изучения геометрических измерений на двумерной поверхности наиболее общим выражением для длины дуги является следующее соотношение:


(𝑑𝑠)²

=

ƒ(𝑥,𝑦)

(𝑑𝑥)²

+

(𝑑𝑦)²

.


(7.6.2)


С одной точки зрения, функция ƒ(𝑥,𝑦) представляет собой множитель, на который меняются линейки, когда мы движемся по поверхности. С другой точки зрения, она очевидно определяет кривизну пространства.

Забавный пример физической ситуации, которая в точности соответствует этим геометриям, придуман одним из студентов Робертсона. Представим себе, что человек делает измерения с помощью линейки на раскалённой пластине, которая в некоторых местах горячее, чем в других. Линейка растягивается или сжимается в зависимости от того, где делаются измерения, в более горячих или более холодных областях на плоскости; очевидно, что соответствующая функция ƒ(𝑥,𝑦) определяется локальной температурой и коэффициентом теплового расширения линейки.

Локальная кривизна поверхности в точке может быть определена с помощью некоторого математического критерия, включающего в себя предельный случай измерений, проделываемых со всё более и более маленькими объектами. Мы могли бы, например, выбрать для сравнения отношения длины окружности к радиусу, отношения площадей кругов к квадратам радиусов; для случая сферических поверхностей эти отношения отличаются от тех, которые получаются на плоской поверхности, на множители (sin θ)/θ, где θ - отношение измеряемого радиуса к радиусу сферы. В пределе всё меньших и меньших кругов эта величина отличается от единицы на величину, пропорциональную площади круга. Этот коэффициент пропорциональности есть 1/𝑅² для сферы (умноженный на 3). Это число (коэффициент, характеризующий изменение площади при отклонении длины окружности от 2π) подходит для описания локальной кривизны, известной как Внутренняя Кривизна или также как Гауссова Средняя Кривизна Площади сферической поверхности, поскольку математика всех этих понятий восходит к Гауссу.

Мы можем легко рассмотреть другие кривые поверхности. Например, легко увидеть, что цилиндрическая поверхность имеет нулевую кривизну, так как цилиндрическая поверхность может быть развёрнута на плоскость без растяжения, очевидно, что отношение длины окружности к радиусу должно быть в точности равно 2π. Для более сложных случаев, если поверхности гладкие, они должны выглядеть как или параболоиды, или как гиперболические параболоиды по инфинитезимальным областям, в которых мы определили внутреннюю кривизну.

Эти поверхности описываются двумя линейными параметрами, радиусами кривизны в двух перпендикулярных плоскостях. В этом случае внутренняя кривизна определяется соотношением 1/(𝑅₁𝑅₂). Эта величина положительная, если поверхность параболическая, или отрицательная, если поверхность - гиперболический параболоид. Мы видим, что эта величина даёт правильное значение кривизны для специальных случаев сферических поверхностей и цилиндрических поверхностей; для сферы оба радиуса равны; для цилиндра один радиус равен бесконечности.

Кривизна четырёхмерного пространства будет определяться аналогичным математическим критерием. Тем не менее, мы едва ли можем ожидать, что мы окажемся в состоянии мысленно построить такие простые картинки и мы должны будем полагаться главным образом на аналитические методы, поскольку наша интуиция вероятно будет нас обманывать. Очень трудно думать о четырёхмерном пространстве специальной теории относительности, даже обладая хорошей интуицией, я считаю, что очень трудно наглядно представить то, что достаточно близко к нему, поскольку имеется знак минус в сигнатуре метрики. А представить себе такое пространство с кривизной было бы ещё труднее. Кривую двумерную поверхность удобно представлять, как кривую поверхность, погружённую в трёхмерное пространство. Но аналогичное описание для кривизны трёхмерного пространства требует концептуального погружения в пространство с шестью измерениями, а проделывая эту процедуру для четырёх измерений, мы должны думать о четырёхмерном пространстве, которое погружено в десятимерный мир. Таким образом, кривизна пространства-времени значительно сложнее, чем кривизна поверхности.

7.7. Число величин, инвариантных под действием преобразований общего вида

В четырёхмерной геометрии имеются двадцать коэффициентов, которые описывают кривизну способом, аналогичным тому, которым одна величина 1/(𝑅₁𝑅₂) описывает внутреннюю кривизну двумерной поверхности. Эти двадцать величин определяют физически значимые свойства тензора 𝑔μν то же, что мы должны сделать, так это упростить тензор 𝑔'μν разумным выбором координат, таким же способом, каким стало возможным определить геометрию двух измерений одной функцией ƒ(𝑥,𝑦) в соотношении (7.6.2).

Мы видели, что вообще говоря, мы не можем устранить гравитационные поля суперпозицией ускорений, за исключением одной точки. Так как кривизна может быть задана точным определением того, что происходит в инфинитезимальной области вокруг заданной точки, целесообразно изучить соответствующим образом в какой степени может быть упрощён тензор 𝑔μν. По аналогии с двумерным случаем мы можем полагать, что возможно выбрать координаты (называемые нормальными координатами Римана) таким образом, что пространство вокруг этой точки - плоское, за исключением членов второго порядка малости от расстояния до этой точки. Другими словами, кривая поверхность отрывается от плоскости, которая является касательной к этой поверхности, причём отклонение поверхности от плоскости характеризуется величиной, которая квадратична от значений координат, измеряемых от точки касания; мы ожидаем, что аналогичная ситуация имеет место в четырёхмерном пространстве.

Давайте подсчитаем, сколько величин мы можем точно определить при преобразованиях и насколько мы можем упростить 𝑔'μν, если мы делаем разложение в ряд функции 𝑔'μν в окрестности некоторой точки 𝑥₀. Пусть любая точка в пространстве есть 𝑥 тогда имеется следующее разложение в ряд Тейлора функции 𝑔'μν в окрестности точки 𝑥₀


𝑔'

μν

(𝑥)

=

𝑔'

μν

(𝑥₀)

+

𝑔'

μν,τ

(𝑥₀)

(

𝑥

τ

-

𝑥

τ

0

)+


+

1

2

𝑔'

μν,τσ

(𝑥₀)

(

𝑥

τ

-

𝑥

τ

0

)(

𝑥

σ

-

𝑥

σ

0

)+…

.


(7.7.1)


Мы должны вычислить метрический тензор 𝑔'μν(𝑥₀) и его производные согласно правилу, выраженному соотношением (7.4.8), это приводит к


𝑔'

αβ

(𝑥₀)

=


∂𝑥μ

∂𝑥'α

∂𝑥ν

∂𝑥'β

𝑔

μν

⎦𝑥₀

,


𝑔'

αβ,τ

(𝑥₀)

=



∂𝑥μ

∂𝑥'α

∂𝑥ν

∂𝑥'β

𝑔

μν,τ

⎦𝑥₀

+


+


2


∂²𝑥μ

∂𝑥'α∂𝑥'τ

∂𝑥ν

∂𝑥'β

𝑔

μν

⎦𝑥₀

,


𝑔'

αβ,τσ

(𝑥₀)

=



∂𝑥μ

∂𝑥'α

∂𝑥ν

∂𝑥'β

𝑔

μν,τσ

⎦𝑥₀

+


+


2


∂³𝑥μ

∂𝑥'α∂𝑥'τ∂𝑥'σ

∂𝑥ν

∂𝑥'β

𝑔

μν

⎦𝑥₀


+ другие члены.

(7.7.2)


Мы видим, что для упрощения 𝑔'μν мы рассматриваем только разложение до второго порядка малости, мы должны выбрать наши преобразования таким образом, чтобы частные производные, появляющиеся в соотношениях (7.7.2), имели определённые значения. Мы можем точно определить следующие величины в нашем преобразовании


1.

Шестнадцать величин



∂𝑥μ

∂𝑥'α


⎦𝑥₀

.


2.

Сорок величин



∂²𝑥μ

∂𝑥'α∂𝑥'β


⎦𝑥₀

.


3.

Восемьдесят величин



∂³𝑥μ

∂𝑥'α∂𝑥'β∂𝑥'γ


⎦𝑥₀

.


(7.7.3)


(Заметим, что порядок производных не имеет значения.) Другая сторона медали состоит в том, что количество величин и производных метрического тензора является следующим:


1.

Имеется 10 компонент

𝑔'

μν

(𝑥₀).


2.

Имеется сорок первых производных

𝑔'

μν

(𝑥₀,τ).


3.

Имеется сто вторых производных

𝑔'

μν

(𝑥₀,τσ).


(7.7.4)


Сначала мы можем попытаться сделать так, чтобы выполнялось равенство 𝑔'μν(𝑥₀)=ημν. Это соотношение включает в себя только первые производные [∂𝑥μ/∂𝑥'α]𝑥₀. У нас есть 10 условий, которым необходимо удовлетворить с помощью 16 свободных параметров. Мы можем легко удовлетворить этим условиям, и у нас останется ещё свободными 6 степеней свободы. Эти шесть параметров являются параметрами специальной теории относительности, преобразований Лоренца и вращений (вектор скорости, ось вращения и угол), которые могут определять преобразования, оставляющие ημν неизменным. Далее мы можем сделать так, чтобы все 40 производных 𝑔'μν,τ(𝑥₀) в точности обращались в нуль, используя сорок величин



∂²𝑥μ

∂𝑥'α∂𝑥'β


⎦𝑥₀

.


Производная 𝑔μν появляется в уравнении движения для минимального действия ∫𝑑𝑠. То, что эти производные могут в некоторой точке обращаться в нуль, означает, что все гравитационные силы могут быть устранены в любой выделенной точке пространства и в некоторый момент времени выбором подходящих ускорений.

Получившийся в конце концов результат состоит в том, что остаются двадцать линейных комбинаций вторых производных типа 𝑔'μν,τσ, которые не могут быть устранены таким преобразованием. Это те величины, которые должны описывать детальное поведение приливных сил. В следующей лекции мы приступим к построению этих двадцати величин через компоненты тензора 𝑔μν, заданные в какой бы то ни было системе координат, которую мы выбрали для исходного анализа.

Лекция 8

8.1. Преобразования компонент тензора в неортогональных координатах

В большей части предыдущих рассуждений можно было использовать упрощённое обозначение для суммирования тензорных компонент, поскольку мы всегда имели дело с координатными системами, которые были ортогональны. В частности, мы всегда использовали правило суммирования по повторяющимся индексам


𝐴

μ

𝐵

μ

=

𝐴₄𝐵⁴

-

𝐴₃𝐵³

-

𝐴₂𝐵²

-

𝐴₁𝐵¹

.


(8.1.1)


В ортогональных координатных системах эти суммы являются инвариантными скалярными величинами; хорошо знакомый частный случай представляет собой суммирование, которое определяет собственное время в специальной теории относительности


(𝑑𝑠)²

=

(𝑑𝑡)²

-

(𝑑𝑥)²

-

(𝑑𝑦)²

-

(𝑑𝑧)²

.


(8.1.2)


Для более общих координатных систем, рассматриваемых нами теперь, которые ускоряются, скручиваются и сжимаются, собственное время определяется через произведения координатных смещений и метрический тензор (7.4.7); мы видим, что конструкция скалярных инвариантов следует правилу, которое более сложно, чем правило, задаваемое соотношением (8.1.1). Координатные смещения являются прототипами того, что мы будем называть контравариантными компонентами вектора. Для удобства обозначений будем записывать компоненты с помощью верхних индексов, например 𝑑𝑥μ. Что является важным, так это закон преобразования этих контравариантных векторных компонентов при изменении системы координат. Для координатных интервалов этот закон описывается следующим соотношением:


𝑑𝑥'

μ

=

∂𝑥'μ

∂𝑥α

𝑑𝑥

α

.


(8.1.3)


Определим векторную функцию, которая представляет собой набор четырёх переменных, которые имеют характер координатных смещений и преобразуются таким же самым образом, как мы меняем координаты


𝐴

μ

(𝑥')

=

∂𝑥'μ

∂𝑥α

𝐴

α

(𝑥)

.


(8.1.4)


Мы называем величины 𝐴μ контравариантными компонентами вектора. Мы можем очень легко распространить эти определения на тензоры более высокого ранга; например, тензор есть функция, которая преобразуется таким же самым образом, как и скалярное произведение двух векторов, т.е.


𝑇

μν

(𝑥')

=

∂𝑥'μ

∂𝑥α


∂𝑥'ν

∂𝑥β

𝑇

αβ

.


(8.1.5)


Когда мы сравниваем закон преобразования для метрического тензора с определением (8.1.5), мы видим, что 𝑔μν не есть величина такого же рода, так как производные появляются в ”перевёрнутом виде”. Тем не менее, мы определили матрицу, которая является обратной к матрице 𝑔μν,


𝑔

να

𝑔

αβ

=

δ

ν

β

.


(8.1.6)


Нетрудно показать, что эта обратная матрица на самом деле составляет контравариантный тензор, так что и надлежит записывать его с двумя индексами, как мы и предчувствовали.

Аналогично предыдущему, нетрудно показать, что суммы


𝑔

μν

𝑑𝑥

μ

𝑑𝑥

ν

=

(𝑑𝑠)²


(8.1.7)


и 𝑔μν𝐴μ𝐴ν являются скалярными инвариантами; это происходит потому, что производные появляются в правильном порядке в одном случае и в ”перевёрнутом виде” в другом случае, так что после суммирования получаются δ-символы Кронекера.

Это наводит на мысль, что мы можем использовать метрический тензор 𝑔μν Для того, чтобы определить векторные компоненты иного рода, имеющие другой закон преобразования


(а)


𝐴

β

=

𝑔

αβ

𝐴

α

,


(б)


𝐴

β

(𝑥')

=

∂𝑥μ

∂𝑥'β

𝐴

μ

(𝑥)

,


(8.1.8)


которые мы будем называть ковариантными компонентами вектора. Скалярные инварианты, которые могут быть порождены суммированием, есть


𝐴

β

𝐵

β

.


(8.1.9)


При преобразованиях с индексами, которые мы проводим, будет важно следить за верхними и нижними индексами; в общем случае, будут допустимы суммирования только по одному нижнему и одному верхнему индексу. Например, в специальном случае ортогональных координат специальной теории относительности собственное время может быть теперь записано, как


(𝑑𝑠)²

=

η

μν

𝑑𝑥

μ

𝑑𝑥

ν

.


(8.1.10)


Тензор ημν - диагональный и имеет компоненты (1,-1,-1,-1).

Всякий раз, когда векторная величина появляется в физической задаче, например векторный потенциал в электродинамике, эта величина будет появляться в качестве или ковариантного, или контравариантного вектора. Но мы можем всегда построить один из другого, используя метрический тензор; мы можем всегда опустить или поднять индексы по своему желанию, умножая на величины 𝑔μν или на компоненты матрицы, обратной к этой матрице. Можно построить тензоры, которые были бы частично ковариантны, частично контравариантны; такие тензоры имеют несколько верхних индексов, несколько нижних, и важно записать эти индексы таким образом, чтобы не было вопроса относительно их порядка


𝑔

μα

𝑇

μν

=

𝑇

α

ν


(8.1.11)


Для специального типа симметрических тензоров 𝑔μν или 𝑔μν мы можем ослабить это правило, так как поднятие или опускание индекса производит просто δ-символ Кронекера


𝑔

μα

𝑔

αν

=

δ

μ

ν

=

δ

μ

ν

.


(8.1.12)


Мы не будем утомлять себя тем, чтобы вновь рассматривать доказательства этих соотношений, поскольку они получены много лет тому назад и могут быть найдены во множестве книг. Все они использовались Эйнштейном, который придумал эти обозначения, что упростило работу с ними, и он является ”надёжным малым” (”reliable guy”), когда придумывает подобные штуки. Перемещение индексов, поднятие их или опускание, есть нечто мнемонические, так как это соответствует перемещению индексов в производных, которые определяют эти преобразования, в соотношениях (8.1.3), (8.1.4), (8.1.5) и (8.1.8).

Нет фундаментального физического различия между ковариантными и контравариантными компонентами вектора; они имеют одинаковое физическое содержание и меняется только их представление. Для случая двух измерений мы можем легко показать графически, как представления векторов отличаются. Так как преобразования определяются как инфинитезимальные перемещения, нам нет нужды беспокоиться о кривизне пространства; всё, что здесь заключено, это наличие ортогональности или её отсутствие. Если оси координат не пересекаются под прямым углом, то имеется два способа проектирования физического смещения на оси: или перпендикулярно на ось, или параллельно другим осям, как показано на рис. 8.1. Мы видим, что тензорные компоненты описывают отсутствие ортогональности координат в заданной точке.

Фейнмановские лекции по гравитации

Рис. 8.1.

8.2. Уравнения, определяющие инварианты 𝑔μν

Теперь, когда у нас есть лучшее понимание роли метрического тензора, мы можем приступить к изучению того, какие величины могут быть построены из него, причём величины, остающиеся инвариантными при инфинитезимальных координатных преобразованиях.

То, что мы собираемся сделать сейчас, в точности совпадают с тем, что мы делали некоторое время назад при построении лагранжиана. Предположим, что мы делаем небольшое изменение в координатах


𝑥

μ

=

𝑥'

μ

+

ζ

μ

(𝑥')

,


(8.2.1)


где предполагаются, что ζμ достаточно малы, так что нам необходимо сохранять только члены первого порядка малости по ζμ. Тогда для производных справедливы следующие соотношения


∂𝑥α

∂𝑥'μ

=

δ

α

μ

+

∂ζα

∂𝑥'μ

.


(8.2.2)


Когда мы вычисляем новые компоненты 𝑔'μν мы получаем произведение двух таких производных


𝑔'

μν

(𝑥')

=

𝑔

αβ

(𝑥'+ζ)

δ

α

μ

+

∂ζα

∂𝑥'μ



δ

β

ν

+

∂ζβ

∂𝑥'ν


.


(8.2.3)


Если мы оставляем только члены нулевого порядка и первого порядка малости по ζμ, то получаем


𝑔'

μν

(𝑥')

=

𝑔

μν

(𝑥')

+

𝑔

αν

∂ζα

∂𝑥'μ

+

𝑔

μβ

∂ζβ

∂𝑥'ν

+

∂𝑔μν

∂𝑥'σ

ζ

σ

.


(8.2.4)


Новые компоненты 𝑔'μν равны старым компонентам 𝑔μν плюс некоторые члены порядка ζμ Когда теперь мы спрашиваем, какие функции 𝑔μν допускаются, если настаиваем, чтобы их форма осталась инвариантной, мы видим, что мы приходим к той же самой задаче, которую решили в лекции 6. Математическая задача является той же самой как и тогда, когда мы пытались найти лагранжиан, который приводил к сохраняющемуся тензору энергии-импульса.

Таким образом, имеется более чем одна точка зрения, которая приводит к одному и тому же уравнению и которая имеет то же самое физическое содержание. Мы обнаружили, что преобразование, которое возникло тогда, когда мы искали лагранжиан для гравитации, появляется также в решении чисто геометрической задачи. Мы предполагаем, следовательно, что некоторые физические и геометрически звучащие критерии эквивалентны; самосогласованность предыдущего подхода, к которому мы пришли, исходя из требования равной нулю дивергенции, должна быть эквивалентна тому условию, которое мы накладываем сейчас. В чем состоит физическая значимость инвариантов 𝑔μν?

Уравнения движения могут быть выведены из вариационного принципа


δ

𝑑𝑠

=

δ

𝑔

μν

(𝑥)

𝑑𝑥

μ

𝑑𝑥

ν

⎞½

=

0.


(8.2.5)


Эти вычисления могут быть проведены до конца путём введения параметра 𝑢 так что квадратный корень под интегралом становится более точно определённой величиной


𝑑𝑢

𝑔

μν

(𝑥)

𝑑𝑥μ

𝑑𝑢


𝑑𝑥ν

𝑑𝑢


⎞½

.


(8.2.6)


Когда решение вариационной задачи проведено до конца, получается следующее уравнение геодезических


𝑑²𝑥ν

𝑑𝑠²

=-

Γ

μ

στ


𝑑𝑥σ

𝑑𝑠


𝑑𝑥τ

𝑑𝑠

,


(8.2.7)


где


Γ

μ

στ

=

𝑔

μν

[στ,ν]

.


Так как вид этого уравнения остаются неизменным при изменении метрического тензора при произвольном преобразовании, то эти уравнения должны быть инвариантами метрики 𝑔μν, которая содержит в себе физику данной проблемы.

8.3. О предположении, что пространство есть в точности плоское

Давайте попробуем обсудить, что мы узнали при выяснении того, что различные подходы, которые мы использовали, приводят к одним и тем же результатам. Точка зрения, которой мы до сих пор придерживались, состоит в том, что пространство описывается как пространство специальной теории относительности, которое для удобства мы будем называть галилеевым. В таком галилеевом пространстве могут существовать гравитационные поля ℎμν, которые приводят к тому, что линейки меняются в своей длине и скорости хода часов увеличиваются или уменьшаются. Так что говоря о результатах экспериментов мы вынуждены делать различия между масштабами действительных измерений, физическими масштабами и масштабами, с использованием которых написана эта теория, т.е. галилеевыми масштабами.

Теперь положение состоит в том, что именно физические координаты должны всегда воспроизводить одни и те же результаты. Может быть удобным для того, чтобы написать теорию в начале, предположить, что измерения делаются в пространстве, которое в принципе галилеево, но после того, как мы получим предсказываемые реальные эффекты, мы видим, что галилеево пространство не имеет смысла.

Это приводит к тому, что для нас не имеет смысла заявлять, что выбор координат, который сделал кто-либо другой, является сумасшедшим и бестолковым просто потому, что этот выбор не выглядит для нас галилеевым. Если он настаивает на трактовке такого выбора как галилеева и приписывает кривизну полям, он также абсолютно оправдывается, и это наше пространство выглядит бестолковым для него. Для любого физического результата получается один и тот же ответ независимо от того, какое исходное нанесение меток задано для положений объектов. Следовательно, мы видим, что это может быть философское улучшение, если мы могли бы сформулировать нашу теорию от начала таким способом, что нет галилеева пространства, которое входит в точное определение физики; мы всегда имеем дело с физическим пространством действительных измерений.

Мы можем снова порассуждать о человеке, который делает измерения с помощью физической линейки на раскалённой пластине. Линейка очевидно меняет длину при её передвижении от более горячих областей к более холодным. Но всё это имеет смысл только потому, что мы знаем нечто, что может измерять расстояния без такой зависимости от температуры, а именно свет. Если мы с помощью световых измерений можем вписать ”истинно евклидову” координатную систему на пластину, человек на раскалённой пластине мог бы оценить для нас величину температурного поля, т.е. поля, которое могло бы описывать, как линейка меняет свою длину при передвижении её по раскалённой пластине. Если, тем не менее, мы обманываем его и вписываем искажённую систему координат на пластине, но продолжаем говорить ему, что система координат евклидова, он даст описание другого температурного поля. Но нет способа, с помощью которого мы могли бы одурачить его, вписывая произвольные координатные системы на пластине, так что мы будем всегда менять результаты физических измерений, которые он проделывает полностью самостоятельно. Пока он использует только длины линеек в приведённых расстояниях, он будет всегда приходить к одним и тем же ответам независимо от того, к каким бы сумасшедшим температурным полям он мог бы придти, используя координаты, которые мы могли бы ему определить.

Эта ситуация совершенно ясна для случая раскалённой пластины, как для евклидова, так и неевклидова пространства, но только потому, что мы предположили, что тепло не оказывает влияния на световые измерения. Для случая гравитации, однако, мы знаем, что нет масштаба, который бы не искажался, т.е. нет такого ”света”, который бы не искажался гравитацией, и с помощью которого мы могли бы определить галилееву координатную систему. Таким образом, все координатные системы эквивалентны, и они отличаются только тем, что различные величины для полей необходимы для описания скорости хода часов или масштабов длин. Как только мы сконцентрировались на описании физических измерений, координатная система, используемая вначале, исчезает, так как она служит только для удобной расстановки меток, как метки в книгохранилище.

Есть один случай, в котором имеет смысл галилеева или евклидова координатная система, это предельный случай нулевой гравитации или предельный случай однородной температуры на раскалённой пластине. В этом случае физические и евклидовы расстояния описываются одной и той же геометрией. Если мы первоначально исходили из искривлённого нанесения меток положений, то мы могли бы обнаружить, что некоторое координатное преобразование не позволяет нам описать измерения без использования поля. Это существенное упрощение, но вновь это упрощение не обусловлено внутренней справедливостью евклидова описания геометрии, но тем фактом, что она соответствует определённой физической ситуации, которая обладает определённой физической простотой.

Если силы равны нулю всюду, то и символы Γ должны быть равны нулю всюду. Если эти силы не всюду равны нулю, то нет возможности определения ”наилучшей” системы координат. Однако возможно сделать их локально равными нулю (согласно принципу эквивалентности!).

8.4. О соотношениях между различными подходами к теории гравитации

Одна из своеобразных особенностей теории гравитации состоит в том, она имеет и полевую интерпретацию, и геометрическую интерпретацию. Так как эти интерпретации на самом деле являются двумя аспектами одной и той же теории, мы могли бы предположить, что венерианские учёные, после развития их полной полевой теории гравитации, могли бы в конце концов придти к геометрической точке зрения. Мы не можем быть абсолютно уверены в этом, так как никто никогда ещё не смог объяснить индуктивное рассуждение, никто не смог объяснить как продолжить анализ, когда мы знаем очень мало, для того, чтобы знать существенно больше.

В любом случае истина состоит в том, что поле спина 2 имеет геометрическую интерпретацию; это не является чем-то легко объяснимым, это удивительный факт. Геометрическая интерпретация не является действительно необходимой или существенной для физики. Возможно, что такое полное совпадение может быть понято как представление некоторого рода калибровочной инвариантности.

Возможно, что отношения между этими двумя точками зрения на гравитацию могли бы стать ясными после того, как мы обсудим третью точку зрения, исходя из которой, мы должны исследовать общие свойства полевых теорий при преобразованиях. Такая точка зрения будет рассматриваться нами много позже, мы обсуждаем этот вопрос здесь для того, чтобы получить ощущения тех возможных направлений, которые должны быть учтены при попытках понять, как гравитация может быть и геометрией, и полем.

Давайте сейчас и рассмотрим, что такое калибровочная инвариантность. Как обычно утверждается в электродинамике, это означает, что если мы заменяем векторный потенциал 𝐴 на


𝐴'

=

𝐴

+

∇𝑋

,


(8.4.1)


уравнения поля и физические эффекты остаются неизменными, выраженными через новый векторный потенциал 𝐴'. Этот факт может быть связан со свойством фазовой инвариантности амплитуд. Давайте теперь посмотрим, что происходит с квантово-механическими амплитудами; совершенно ясно, что если мы используем


ψ'

=

exp(𝑖𝑎)

ψ

,


при вычислении вероятности, то ничего не меняется в предсказываемой физике. В общем константа 𝑎 не приводит к появлению различий в предсказаниях. Что же происходит, если вместо константы о мы используем функцию 𝑋, которая меняется от точки к точке в пространстве? Уравнения всегда включают в себя градиенты ψ, которые есть


∇ψ'

=

exp(𝑖𝑋)

(

∇ψ

+

𝑖ψ∇𝑋

).


(8.4.2)


Однако оператор (∇-𝑖𝐴') оставляет функцию такой, что она изменилась только по фазе


(∇-𝑖𝐴')ψ'

=

exp(𝑖𝑋)

(∇-𝑖𝐴)ψ

.


(8.4.3)


Так что если имеется векторное поле, которое взаимодействует так, как мы предполагали, уравнения являются инвариантными при зависящих от пространства-времени фазовых преобразованиях этих ψ полей.

Теория векторного мезона Янга - Миллса является попыткой распространить идею калибровочного преобразования рассмотрением таким же способом инвариантности ядерного взаимодействия при изменении изотопического спина. Если амплитуда протона представляется величиной ψ, тогда


ψ'

=

exp(𝑖𝒓⋅𝒂)

ψ

,


(8.4.4)


описывает объект, который частично является протоном, частично нейтроном. Если 𝒂 есть постоянный вектор в изоспиновом пространстве, то инвариантность ядерных сил по отношению к изменениям изотопического спина означает, что новый объект ψ' действует во всех ядерных реакциях как ψ. Предложение Янга и Миллса состоит в том, что поле должно быть добавлено к лагранжиану таким способом, чтобы пространственно-зависимая фазовая замена (𝒂→𝑿) не приводила к различиям в уравнениях.

Как такие идеи могут быть связаны с гравитацией? Уравнения физики являются инвариантными, когда мы делаем координатные замены с любыми постоянными значениями 𝑎μ


𝑥'

=

𝑥

μ

+

𝑎

μ

.


(8.4.5)


Для того, чтобы сделать формально более похожими фазовые и изоспиновые преобразования, можно было бы воспользоваться импульсным представлением, так что оператор сдвига есть


exp(𝑖𝑝

μ

𝑎

μ

)

.


С другой стороны, возможно исследовать, каким образом уравнения физики могут быть сделаны инвариантными в том случае, когда мы допускаем зависящие от координат в пространстве переменные смещения (𝑎μ→ζμ) Исследование будет проводиться для более полного лагранжиана; новые члены, которые необходимы, являются в точности теми же самыми, что и для гравитационного поля. Таким образом, гравитация является тем полем, которое соответствует калибровочной инвариантности по отношению к преобразованиям смещения.

8.5. Кривизна как величина, относящаяся к касательному пространству

Мы можем рассмотреть данный вопрос геометрически, как Эйнштейн, и обратиться к кривизне и таким понятиям, которые выражаются на языке предельного перехода для величины радиуса и длины окружности. Только для того, чтобы показать, что подобный подход не является слишком сложным, мы используем его. Теперь, когда мы осознаем, что мы делаем, мы можем сделать более общие координатные преобразования. Мы говорили о том, каково было число производных. У нас была возможность сказать, что мы можем положить


𝑔

0

μν

=

η

μν


(8.5.1)


путём соответствующего выбора шестнадцати первых производных ∂𝑥α/∂𝑥'ν. Мы предполагаем также, что мы можем выбрать сорок вторых производных (∂²𝑥α/∂𝑥'μ∂𝑥'ν) таким образом, что все первые производные


𝑔

0

μν


равны нулю. Тогда имеется восемьдесят выбранных третьих производных и сотня вторых производных величины 𝑔μν. Есть двадцать линейных комбинаций этих вторых производных, причём эти комбинации могут иметь геометрическое определение. Они не могут быть устранены преобразованием координат. То, что мы будем искать - это выражение для двадцати таких величин на языке исходных величин 𝑔μν. Мы делаем данную процедуру в три шага, возвращаясь назад, так сказать. Сначала мы предполагаем, что выбрали первые и вторые производные (в выбранной точке путём преобразования к римановым нормальным координатам) таким образом, что


𝑔

0

μν

=

η

μν


и


𝑔

0

μν,σ

=

0,


и находим выражение для двадцати величин. Затем мы будем беспокоиться о том, как мы можем добиться выполнения этих условий и так выбрать новые координаты, исходя из произвольных начальных координат, чтобы получить эти двадцать величин через исходные величины 𝑔μν.

Фейнмановские лекции по гравитации

Рис. 8.2.

Сначала мы обсудим геометрически определяемые величины в терминах координат в касательном пространстве в точке. То, что мы делаем в пространстве с четырьмя измерениями, аналогично следующей ситуации в двумерном пространстве. Искривлённое пространство можно рассматривать как поверхность и сравнить геометрию поверхности в данной точке с геометрией, рассматриваемой с касательной плоскости, как показано на рис. 8.2. Исходные координат ты на искривлённом пространстве вообще говоря неортогональны и не являются соответствующим образом ориентированными для того, чтобы допустить простейшее описание геометрии на языке инварианта 1/(𝑅₁𝑅₂) Первый шаг состоит в том, чтобы определить эту внутреннюю кривизну на языке исходной геометрии.

Только вторые производные начинают описывать в данной точке отклонение искривлённого пространства от плоского. Величины, характеризующие кривизну пространства, являются в точности мерой рассогласования между поверхностью и касательной плоскостью. Эти величины дают описание самого существенного характера пространства в заданной точке. Так как мы включили в рассмотрение только первые, вторые и третьи производные координат, то мы имеем достаточно общее преобразование в следующем виде:


𝑥

α

=

𝑥'

α

+

1

2

𝑎

α

μν

𝑥'

μ

𝑥'

ν

+

1

6

𝑏

α

μνσ

𝑥'

μ

𝑥'

ν

𝑥'

σ

.


(8.5.2)


Наша задача состоит в том, чтобы выбрать двадцать существенных комбинаций. Для первых производных мы имеем следующие выражения:


∂𝑥α

∂𝑥'μ

=

δ

α

μ

+

𝑎

α

μν

𝑥'

ν

+

1

2

𝑏

α

μνσ

𝑥'

ν

𝑥'

σ

.


(8.5.3)


В этом частном касательном пространстве метрические тензоры могут быть записаны в достаточно общем виде как


𝑔'

αβ

=

η

αβ

+

1

2

𝑥'

σ

𝑥'

τ

𝑔

0

'

αβ,στ

,


𝑔

αβ

=

η

αβ

+

1

2

𝑥

σ

𝑥

τ

𝑔

0

αβ,στ

.


(8.5.4)


Верхний индекс ”0” означает то, что рассматриваемая величина берётся в точке касания 𝑥₀. Мы получаем соответствующие инвариантные комбинации, рассматривая то, что мы имеем две произвольные системы координат в касательном пространстве, и требуем, что одни и те же формулы должны выполняться в обоих случаях. Так как эти пространства - касательные, то производные координат могут отличаться только квадратичными членами, так что


𝑎

α

μν

=

0.


(8.5.5)


Тогда необходимо только подставить одно преобразование в другое. Подставляя закон преобразования используя соотношения (8.5.3) для производных, находим


𝑔'

αβ

=

𝑔

μν

∂𝑥μ

∂𝑥'α


∂𝑥ν

∂𝑥'β

=


=

η

αβ

+

1

2

(

𝑔

0

αβ,στ

+

η

αν

𝑏

ν

βστ

+

η

βν

𝑏

ν

αστ

)

𝑥'

σ

𝑥'

τ

.


(8.5.6)


Для вторых производных величин имеем следующие соотношения


𝑔'

0

αβ,στ

=

𝑔

0

αβ,στ

+

𝑏

αβστ

+

𝑏

βαστ

,


(8.5.7)


где


𝑏

αβστ

η

αν

𝑏

ν

βστ

.


Теперь, когда мы имеем эти соотношения, мы хотим получить линейные комбинации вторых производных компонентов метрики, которые не имели бы величин 𝑏αβστ. Мы используем тот факт, что величины 𝑏αβστ полностью симметричны по их трём последним индексам, в то время как 𝑏αβ,στ симметричны только по индексам στ. Переставим индексы (β↔σ) и, вычитая соответствующие выражения, получим


𝑔'

0

αβ,στ

-

𝑔'

0

ασ,βτ

-

𝑔

0

αβ,στ

+

𝑔

0

ασ,βτ

=

𝑏

βαστ

-

𝑏

σαβτ

.


(8.5.8)


Индексы (ατ) входят абсолютно симметрично в правую часть этого соотношения, но это утверждение не обязательно для левой части. Следовательно, при антисимметрировании по индексам (α-τ) мы получаем следующее соотношение


𝑅

ατβσ

=

1

2

(

𝑔

0

αβ,στ

-

𝑔

0

ασ,βτ

-

𝑔

0

τβ,σα

+

𝑔

0

τσ,βα

),


(8.5.9)


величину, которая равна самой себе в штрихованной системе координат. Таким образом, имеется двадцать линейных комбинаций, которые мы искали. Эта величина не является тензором; она не является достаточно общей; она определяется только в месте, в котором обращаются в нуль результирующие поля. Эти линейные комбинации являются несократимыми частями гравитационного тензора, теми, которые не могут быть устранены преобразованием системы координат. Они представляют чисто приливные силы. Таким образом, теперь мы имеем определённый рецепт для нахождения кривизны. Сначала найти преобразование (к римановым нормальным координатам), которое связывает величины 𝑔μν с величинами ημν, причём первые производные компонент 𝑔μν равны нулю. Тогда выраженные через преобразованные компоненты 𝑔μν величины, определяющие кривизну, задаются соотношениями (8.5.9). Эти соотношения остаются теми же самыми в любой координатной системе. Оставшаяся задача состоит в том, чтобы выразить 𝑅ατβσ через исходные произвольные координаты и исходные компоненты 𝑔μν.

8.6. Кривизна как величина, относящаяся к произвольным координатам

Вывод выражений для кривизны через общие координаты происходит наиболее гладким образом при использовании способа, состоящего в последовательном восхождении по ступенькам к искомому результату. Далее, мы снимаем ограничение на первые производные (которые теперь могут быть не равными нулю), но оставляем координаты локально ортогональными; тогда выражения 𝑔μν и 𝑔'μν следующие


𝑔

αβ

=

η

αβ

+

𝑔

0

αβ,μ

𝑥

μ

+

1

2

𝑔

0

ασ,μν

𝑥

μ

𝑥

ν

,


𝑔'

αβ

=

η

αβ

+

1

2

𝑔'

0

αβ,στ

𝑥'

σ

𝑥'

τ

.


(8.6.1)


Величина 𝑔' есть та же самая, что и была ранее с нулевыми первыми производными. Так как мы уже выбрали вторые производные, нам необходимо только рассмотреть преобразование типа


𝑥

α

=

𝑥'

α

+

1

2

𝑎

α

μν

𝑥'

μ

𝑥'

ν

.


(8.6.2)


Кубические члены не будут влиять на правильность приводимого ниже результата. Выражение для первых производных


∂𝑥α

∂𝑥'μ

=

δ

α

μ

+

α

α

μν

𝑥'

ν


(8.6.3)


вставляем в уравнение, выражающее 𝑔' через 𝑔,


η

αβ

+

1

2

𝑔'

0

αβ,στ

𝑥'σ

𝑥'τ

=

η

αβ

+(

𝑔

0

αβ,σ

+

𝑎

βασ

+

𝑎

αβσ

)

𝑥'

σ

+


+

𝑥'

σ

𝑥'

τ

𝑎

ρ

ασ

𝑎

ρβτ

+

𝑎

ρ

ατ

𝑔

0

ρβ,σ

+

𝑎

ρ

βτ

𝑔

0

ρα,σ

+


+

1

2

𝑎

ρ

στ

𝑔

0

αβ,ρ

+

1

2

𝑔

αβ,στ

,


(8.6.4)


где 𝑎αβσαμ𝑎μβσ Члены, соответствующие первым производным, будут равными нулю при следующем выборе 𝑎αμν:


𝑎

βασ

+

𝑎

αβσ

=-

𝑔

0

αβ,σ

.


(8.6.5)


Нам необходимо решить это уравнение таким образом, чтобы 𝑎αμν было выражено через


𝑔

0

αβ,σ


исходной системы координат. Эта процедура делается с использованием обычных приёмов; вычитаем уравнение, полученное перестановкой (α,σ), затем собираем подобные члены и т.д., и получаем следующее соотношение:


𝑎

σαβ

=-

1

2


𝑔

0

σα,β

+

𝑔

0

σβ,α

-

𝑔

0

αβ,σ


=-

[αβ,σ]⁰

.


(8.6.6)


Из соотношения (8.6.4) видно, что


𝑔'

0

αβ,στ


есть (удвоенное) выражение в квадратных скобках в правой части соотношения (8.6.4) с заменой 𝑎σαβ в соответствии с соотношением (8.6.6). Эти величины


𝑔'

0

αβ,στ


теперь могут быть заменены на


𝑔

0

αβ,στ


в соотношении (8.5.9) для того, чтобы найти компоненты кривизны, выписанные через старые координаты (ограниченные только тем, что они должны быть локально ортогональными), следующим образом:


𝑅

ατβσ

=

1

2

(

𝑔

αβ,στ

-

𝑔

ασ,βτ

-

𝑔

τβ,αβ

+

𝑔

τσ,αβ

)+


+

[ρσ,α]

η

ρλ

[τβ,λ]

-

[ρβ,α]

η

ρλ

[τσ,λ]

.


(8.6.7)


Осталось только ортогонализировать первоначально произвольные координаты. Это может быть сделано линейным преобразованием:


𝑥

α

=

𝐿

α

μ

𝑥'

μ

.


(8.6.8)


Всё, что осталось нам сделать, состоит в том, чтобы выбрать


𝑔'

0

αβ

=

η

αβ

,


(8.6.9)


и переписать все соотношения ещё раз. Производные при выбранном преобразовании определяются матрицей 𝐿αμ, и мы имеем


𝑔'

μν

=

𝐿

α

μ

𝐿

β

ν

𝑔

αβ

=

η

μν

.


(8.6.10)


Среди соотношений, которые могут быть получены, имеется следующее соотношение:


η

αβ

𝐿

α

σ

𝐿

β

μ

=

𝑔

σμ

.


(8.6.11)


Что же происходит с различными членами? Поскольку


∂𝑥'α

=

∂𝑥μ


∂𝑥μ

∂𝑥'α

=

𝐿

μ

α

∂𝑥μ

,


(8.6.12)


то, следовательно, (в последующих соотношениях латинские индексы соответствуют штрихованным координатам)


𝑔'

𝑚𝑛,𝑠𝑡

=

𝐿

σ

𝑠

𝐿

τ

𝑡

𝐿

μ

𝑚

𝐿

ν

𝑛

𝑔

μν,στ

,


(8.6.13)


𝑎'

𝑟𝑚𝑛

=

𝐿

ρ

𝑟

𝐿

μ

𝑚

𝐿

ν

𝑛

𝑎

ρμν

,


(8.6.14)


η

𝑟𝑞

𝑎'

𝑟𝑚𝑛

𝑎'

𝑞𝑠𝑡

=

η

𝑟𝑞

𝐿

ρ

𝑟

𝐿

λ

𝑞

𝐿

μ

𝑚

𝐿

ν

𝑛

𝐿

σ

𝑠

𝐿

τ

𝑡

𝑎

ρμν

𝑎

λστ

.


(8.6.15)


Когда мы вставляем эти соотношения в выражения для компонент 𝑅, мы получаем, что 𝑅 не является более инвариантом. Окончательное выражение для 𝑅 (при выводе которого используется соотношение (8.6.11)) имеет следующий вид:


𝑅

ατβσ

=

1

2

(

𝑔

αβ,στ

-

𝑔

ασ,βτ

-

𝑔

τβ,ασ

+

𝑔

τσ,αβ

)+


+

[ρσ,α]

𝑔

ρλ

[τβ,λ]

-

[ρβ,α]

𝑔

ρλ

[τσ,λ]

,


(8.6.16)


а закон преобразования имеет вид:


𝑅'

𝑚𝑛𝑠𝑡

=

𝐿

μ

𝑚

𝐿

ν

𝑛

𝐿

σ

𝑠

𝐿

τ

𝑡

𝑅

μνστ

.


(8.6.17)


8.7. Свойства Великого Тензора Кривизны

Хотя величины 𝑅μνστ не являются инвариантами, они образуют тензор, как можно было бы заключить из закона преобразования (8.6.17). Легко можно показать, что тензор определяется только двадцатью величинами, как мы ранее и утверждали. Выражения (8.5.9) были получены путём антисимметризации по индексам (α,τ) и впоследствии по (β,σ). Имеются следующие симметрии для компонент тензора:


𝑅

ατβσ

=-

𝑅

ταβσ

,

(а)


=-

𝑅

ατσβ

,

(б)


=+

𝑅

βσατ

.

(в)


(8.7.1)


Следующее алгебраическое соотношение содержится неявно в соотношении (8.5.9) (и, следовательно, в соотношении (8.6.16)):


𝑅

ατβσ

+

𝑅

αστβ

+

𝑅

αβστ

=

0.


(8.7.2)


Давайте посчитаем число независимых компонент тензора кривизны. Первый индекс может не быть равным второму, третий не может быть равным четвёртому. Только антисимметричные комбинации могут быть не равны нулю - мы напоминаем, что имеется шесть возможно ненулевых компонент для антисимметричного тензора второго ранга, так что за исключением симметрии, связанной с перестановкой первой пары и второй пары, здесь имелось бы 36 компонентов; последняя же симметрия (8.7.1в) уменьшает это число до (6 × 7)/2 = 21. Алгебраическое соотношение, определяемое (8.7.2), содержит только одно нетривиальное ограничение. Если два индекса являются одинаковыми, то соотношение (8.7.2) является тождеством, поскольку имеются симметрии в соотношениях (8.7.1). Например,


𝑅

1τ1σ

+

𝑅

1στ1

+

𝑅

11στ

=

𝑅

1τ1σ

-

𝑅

1τ1σ

+

0

=

0.


(8.7.3)


Так что все индексы должны быть различными для того, чтобы это алгебраическое соотношение имело смысл. Но когда все индексы различны (1,2,3,4), то имеется только одно дополнительное уравнение. Итак, в общем случае имеется только двадцать независимых компонент Великого Тензора Кривизны (Тензора Римана).

То, в чем мы нуждаемся для построения нашей теории, это не тензор, а полностью инвариантная величина, которая может быть подставлена в лагранжиан. (Вместо этого, Эйнштейн говорил, что Тензор Энергии-Импульса равен другому тензору, которые получается из тензора кривизны.) Принцип наименьшего действия должен включать в себя интеграл по всему пространству, который должен быть полностью инвариантным под действием преобразований. Подынтегральное выражение должно быть мировой скалярной величиной


𝑑𝑥

𝑑𝑦

𝑑𝑧

𝑑𝑡


(Скаляр) = (Скалярный инвариант).


(8.7.4)


Мы получим такой скаляр, поднимая индексы тензора кривизны и свёртывая по парам верхних и нижних индексов. Мы можем, например, поднять первый индекс


𝑔

αλ

𝑅

ατβσ

=

𝑅

λ

τβσ

.


(8.7.5)


Но если в этом месте мы проведём свёртывание по первой паре индексов, то эта величина, к сожалению, обращается в нуль


𝑅

τ

τβσ

0.


(8.7.6)


То, что необходимо сделать сначала, состоит в уменьшении ранга тензора и свёртывании по первому и последнему индексам


𝑔

ασ

𝑅

ατβσ

=

𝑅

τβ

.


(8.7.7)


(Заметим, что одну и ту же букву 𝑅 удобно использовать для всех тензоров, получаемых из тензора кривизны.) Этот тензор второго ранга (тензор Риччи) - симметричен. Затем мы вновь уменьшаем ранг тензора для того, чтобы получить нашу скалярную величину (”скалярную кривизну”) для подынтегрального выражения


𝑔

ασ

𝑔

τβ

𝑅

ατβσ

=

𝑔

τβ

𝑅

σ

τβσ

=

𝑅

σβ

βσ

=

𝑅.


(8.7.8)


Теперь интеграл по объёму от этого скаляра не является инвариантом, поскольку элемент объёма не является скаляром; величина 𝑑𝑥𝑑𝑦𝑑𝑧𝑑𝑡 меняется при изменении координат, причём это изменение определяется определителем матрицы 𝐿αμ. Таким образом, интеграл от инварианта есть


𝑑𝑥

𝑑𝑦

𝑑𝑧

𝑑𝑡

𝑅

-𝑔

.


(8.7.9)


Это выражение определяет действие Эйнштейна—Гильберта для пустого пространства [Hilb 15].

Лекция 9

9.1. Модификация электродинамики, требуемая принципом эквивалентности

Принцип Эквивалентности постулирует, что ускорение будет неотличимым от гравитации в каком бы то ни было эксперименте. В частности, ускорение не может быть отличимо от гравитации по наблюдению электромагнитного излучения. В этом месте у нас возникает некоторое беспокойство, так как мы унаследовали предрассудок, что ускоренно движущийся заряд должен излучать, тогда как мы не ожидаем, что заряд, находящийся в гравитационном поле, излучает. Тем не менее, это обусловлено не ошибкой в нашем утверждении эквивалентности, а тем фактом, что закон, описывающий мощность излучения ускоренно движущегося заряда


𝑑𝑊

𝑑𝑡

=

2

3


𝑒²

𝑐³

𝑎²

,


(9.1.1)


вводит нас в заблуждение. Обычно этот закон выводится из вычисления потока из теоремы Пойнтинга вдали от заряда, и это справедливо только для круговых движений или, по крайней мере, движений, для которых характерен бесконечный рост во времени (как имеет место для постоянного ускорения). Этого закона оказывается недостаточно для того, чтобы сказать нам, ”когда” электромагнитная энергия излучается. Ответ на этот вопрос может определяться только путём нахождения силы радиационного трения, которая есть (2/3)⋅(𝑒²/𝑐³)𝒂̇. Работа против этой силы представляет собой потери энергии. Для постоянного ускорения эта сила равна нулю. Вообще говоря, работа, совершаемая против этой силы, может быть записана в виде


𝑑𝑊

𝑑𝑡

=-

2

3


𝑒²

𝑐³

𝒗⋅𝒂̇

=

2

3


𝑒²

𝑐³

𝒂⋅𝒂

-

2

3


𝑒²

𝑐³


𝑑

𝑑𝑡

(𝒗⋅𝒂),


(9.1.2)


дающая правильное выражение для 𝑑𝑊/𝑑𝑡 Для круговых или ограниченных движений средний вклад последнего члена по достаточно большому времени мал или равен нулю (через один цикл, так как величина 𝒗⋅𝒂 сохраняет своё значение, то его вклад равен нулю) и для вычисления мощности излучения достаточно более простого соотношения (9.1.1).

Конечно, в гравитационном поле законы электродинамики Максвелла должны быть модифицированы для того, чтобы удовлетворить принцип относительности. В конце концов законы Максвелла предсказывают, что фотон должен двигаться по прямой линии, и обнаружено, что фотон искривляется звездой ("падает на звезду”). Ясно, что некоторое взаимодействие между гравитацией и электродинамикой должно быть включено в более точную формулировку законов электричества для того, чтобы сделать их согласованными с принципом эквивалентности.

Мы не будем завершать построение нашей теории гравитации до тех пор, пока мы не обсудим такие модификации электродинамики, а также механизмы излучения, приёма и поглощения гравитационных волн.

9.2. Ковариантные производные тензоров

В предыдущей лекции мы видели, как понятие кривизны возникает при обсуждении геометрических измерений. Мы можем получить более интересное представление о том, как четырёхмерная кривизна будет влиять на наш взгляд на физику, рассматривая более удачное приближение, которое состоит в том, чтобы определить кривизну как величину, описывающую, что происходит с вектором при перемещении его в пространстве. Давайте представим вновь наш двумерный мир. Если мы используем плоские евклидовы координаты, то постоянное векторное поле, существующее в пространстве, описывается постоянными компонентами. Если мы используем некоторые другие координаты, в общем случае искривлённые, постоянное векторное поле описывается компонентами, которые меняются от точки к точки. Хорошо знакомый пример состоит во введении на плоскости полярных координат, в которых постоянный вектор описывается компонентами


(

𝐴 cosθ

+

𝐵 sinθ

)=

𝐹

𝑟

,


(

𝐵 cosθ

-

𝐴 sinθ

)=

𝐹

θ

.


(9.2.1)


Первое, что мы должны сделать состоит в том, чтобы получить соотношения, которые позволят нам сравнить физически значимое различие между тензором в данной точке и его значением в окружающих точках. По сути дела мы хотим описать изменение тензора, которое до известной степени исключало бы изменения компонентов, вызываемые произвольным выбором координат. Например, мы хотим сравнить вектор в точке 𝑥μ с другим вектором, находящимся в точке, характеризуемой инфинитезимальным смещением 𝑑𝑥μ от заданной точки, перенесением одного из векторов, остающегося постоянным (более точно, остающегося параллельным самому себе) в некоторую другую точку.

Для скалярной функции (тензора нулевого ранга) подобная проблема не составляет проблем. Обычное градиентное преобразование определяется соотношением


∂φ

∂𝑥'ν

=

∂𝑥σ

∂𝑥'ν


∂φ

∂𝑥σ

,


(9.2.2)


так что градиент скаляра есть очевидно ковариантный вектор. Тем не менее, обычные градиенты векторов или тензорных величин более высокого порядка не являются тензорами; в этом случае в законе преобразования имеются члены, зависящие от случайности при выборе координат. Мы выводим соответствующее выражение для производной путём рассмотрения, как такие объекты выглядят в касательном пространстве. Так как касательное пространство - плоское, производные компонентов не содержат членов, обусловленных искривлением координат, и градиенты векторов по отношению к плоским координатам являются тензорами. Мы получим соотношение для этих тензоров в любых координатах, делая обратное преобразование от плоского пространства к произвольным координатам. Как обычно, мы употребляем разложения для того, чтобы получить такие соотношения. (”Штрихованные” координаты соответствуют плоскому пространству.) Пусть


𝑥

ν

=

𝑥'

ν

+

1

2

𝑎

ν

στ

𝑥'

σ

𝑥'

τ

+

… ,


∂𝑥ν

∂𝑥'μ

=

δ

μ

ν

+

𝑎

ν

στ

𝑥'

σ

+

… .


(9.2.3)


Используя первые члены разложения, получим


𝐴

μ

(𝑥)

=

∂𝑥ν

∂𝑥'μ

𝐴'

ν

(𝑥')

.


Поскольку мы можем переписать выражение для производной, используя соотношение (9.2.3), то получим


𝐴

μ

(𝑥)

=

𝐴'

μ

(𝑥')

+

𝑎

ν

μλ

𝑥'

λ

𝐴'

ν

(𝑥')

+

… .


(9.2.4)


Теперь возьмём градиент этого выражения по отношению к произвольным координатам и вычислим эту величину в начале координат



∂𝐴μ

∂𝑥σ


⎠₀


=


∂𝑥'τ


𝐴'

μ

(𝑥')

+

𝑎

ν

μλ

𝑥'

λ

𝐴'

ν

(𝑥')

⎠₀



∂𝑥'τ

∂𝑥σ


⎠₀


=


∂𝐴'μ(𝑥')

∂𝑥'σ

+

𝑎

ν

μσ

𝐴'

ν

(𝑥')

.


(9.2.5)


Именно поскольку эта величина берётся в начале координат, все члены, линейные по 𝑥', равны нулю. Таким образом, мы получаем производную ”для плоского пространства” на языке произвольных координат



∂𝐴μ

∂𝑥σ

-

𝑎

ν

μσ

𝐴

ν

=

∂𝐴'μ

∂𝑥'σ

.


(9.2.6)


Если теперь мы запишем 𝑎νμσ через метрические тензоры, то мы получаем соотношение для ”более правильной” производной. Эта величина является тензором и известна как ковариантная производная вектора 𝐴τ. Для того, чтобы отличить эту производную от градиентов, мы будем использовать точку с запятой для обозначения ковариантного дифференцирования


𝐴

μ;τ

∂𝐴μ

∂𝑥τ

-

Γ

σ

μτ

𝐴

σ

.


(9.2.7)


Доказательство того, что эта величина есть тензор, достаточно утомительно, но очень просто; всё, что для этого требуется, состоит в том, чтобы преобразовать все координаты к координатам в плоском пространстве, непосредственно вычислить производную и затем проверить полученный закон преобразования. Правило для дифференцирования контравариантного вектора аналогично предыдущему


𝐴

μ

∂𝐴μ

∂𝑥σ

-

Γ

σ

μτ

𝐴

τ

.


(9.2.8)


Последнее соотношение может быть доказано более просто, если мы исходим из соотношения (9.2.7) и используем метрический тензор для поднятия и опускания индексов; перестановка метрических тензоров приводит к тому, что величина Γ меняет знак. Для того, чтобы вычислять ковариантную производную тензора, имеющего много индексов, получаем следующее правило


𝑇

μν

ρ;σ

∂𝑇μνρ

∂𝑥λ

+

Γ

μ

λσ

𝑇

σν

ρ

+

Γ

ν

λσ

𝑇

μσ

ρ

-

Γ

σ

λσ

𝑇

μν

σ

.


(9.2.9)


Другими словами, каждый индекс приводит к тому, что добавляется член, который включает в себя Γ и сам тензор. Вряд ли нужно какое-либо другое мнемоническое правило; ковариантная производная вычисляется одинаково для верхних и нижних индексов, причём вычисление производной для верхних индексов идентифицируется со знаком "+", а для нижних индексов со знаком "-", тем самым только это и надо запомнить.

Наиболее хорошо известный пример таких преобразований - это формула для ротора вектора в сферических координатах; эти формулы всегда включают в себя обычные производные, умноженные на величины компонентов этого вектора.

Полезно ещё одно соотношение для ковариантных производных. Так как ковариантные производные метрического тензора равны нулю, как легко может быть показано,


𝑔

μν

=

0,


(9.2.10)


то следующее правило применимо для произведения


(𝐴

μ

𝐵

ν

)

=

𝐴

μ

𝐵

ν

+

𝐴

μ

𝐵

ν

.


(9.2.11)


Для того, чтобы показать, что подобные соотношения действительно связывают тензорные величины, всегда допустимо так выбрать координаты, чтобы сделать доказательство проще; тензоры являются такими математическими величинами, что тензорные соотношения, доказанные в одной координатной системе, остаются справедливыми для всех других координат. Последнее соотношение легко может быть доказано при использовании перехода к плоскому касательному пространству; ковариантная производная равна обычной производной в таком пространстве.

Одно из действий кривизны состоит в том, что вторая ковариантная производная не коммутирует с первой. Мы можем явно вычислить такие величины путём повторяющегося использования соотношения (9.2.9). Сначала получаем, что


𝐴

μ

;σ;τ

=

[𝐴

μ

]

=

∂[𝐴μ]

∂𝑥τ

+

Γ

μ

τλ

[𝐴

λ

]

-

Γ

λ

στ

[𝐴

μ

]

,


(9.2.12)


и повторное дифференцирование даёт нам


𝐴

μ

;σ;τ

=

∂²𝐴μ

∂𝑥τ∂𝑥σ

+

∂𝑥τ


Γ

μ

σλ

𝐴

λ

+


+

Γ

μ

τλ



∂𝐴λ

∂𝑥σ

+

Γ

λ

σρ

𝐴

ρ

-

Γ

λ

στ



∂𝐴μ

∂𝑥λ

+

Γ

μ

λρ

𝐴

ρ

.


(9.2.13)


Некоммутативность порядка операций взятия ковариантных производных видна, когда мы вычисляем их разность


𝐴

μ

;στ

-

𝐴

μ

;τσ

=

Γ

μ

σρ,τ

-

Γ

μ

τρ,σ

+

Γ

μ

τλ

Γ

λ

ρσ

-

Γ

μ

σλ

Γ

λ

ρτ


𝐴

ρ

.


(9.2.14)


Множитель, на который умножается вектор 𝐴ρ, должен быть тензором, поскольку величина в левой части последнего соотношения является разностью тензоров. Этот множитель в точности является тензором кривизны, так что


𝐴

μ

;στ

-

𝐴

μ

;τσ

=

𝑅

μ

ρστ

𝐴

ρ

.


(9.2.15)


9.3. Параллельный перенос вектора

Тот факт, что тензор кривизны появляется в связи с вычислением второй ковариантной производной, служит нам той путеводной нитью, которая позволяет нам дать другую полезную геометрическую интерпретацию кривизны. Свойство некоммутативности вторых производных представляет собой предел разности векторов в том случае, если мы вначале перемещаем его вдоль оси σ, затем вдоль оси τ или сначала вдоль оси τ, затем вдоль оси σ. Если координаты плоские, то для постоянного вектора нет отличий. Если мы имеем искривлённое пространство и если мы делаем такие перемещения в различном порядке, то мы находим некоторый результирующий вектор. Значимость подобных рассмотрений для получения физических утверждений становится очевидной, когда мы осознаем, что мы не имеем физического способа определения ”подлинно постоянного” векторного поля, за исключением того, чтобы сказать, что это такое векторное поле, чьи компоненты имеют нулевые производные в касательном пространстве.

Фейнмановские лекции по гравитации

Рис. 9.1.

Как кривизна появляется при рассмотрении переноса вектора, остающегося параллельным самому себе при перемещении его по поверхности, хорошо иллюстрируется в сферической геометрии. Мы будем представлять себе, что мы переносим маленький вектор с северного полюса по меридиану до экватора, затем вдоль экватора на угол θ и возвращаем его назад на северный полюс, как показано на рис. 9.1, причём всегда переносим вектор таким образом, чтобы он оставался параллельным самому себе и был направлен на юг. Когда мы возвращаем вектор назад на северный полюс, мы видим, что наш вектор повернулся на угол θ. Кривизна 𝐾 поверхности определяется через угол, на который вектор поворачивается в том случае, если мы рассматриваем перенос этого вектора вдоль инфинитезимальной замкнутой траектории. Для поверхности


δθ

=

(Площадь внутри замкнутой кривой)

𝐾

.


(9.3.1)


Для случая треугольника на сферической поверхности этот угол в точности есть превышение (над величиной 180°) суммы углов треугольника. Для сферической поверхности эта кривизна просто равна 1/𝑅².

Обобщённое определение кривизны многомерной поверхности будет даваться через изменение вектора при его переносе вдоль замкнутой кривой, причём при таком переносе, который оставляет вектор параллельным самому себе. Так как ориентация траектории, лежащей на определённой плоскости, зависит от двух осей координат, то мы видим, что кривизна в общем случае является тензором четвёртого ранга. В трёхмерном пространстве мы могли бы разбить сферическую поверхность проведением ”радиально” внешней части от точки для заданного измеренного расстояния вдоль наикратчайших измеренных траекторий (геодезических). Компоненты кривизны вдоль различных направлений должны бы соответствовать незначительному отклонению от 2π длин больших кругов сферической поверхности.

Наглядное представление понятия кривизны на языке более простого пространства, погружённого в пространство с более высокой размерностью, требует введения одного дополнительного измерения для каждого независимого компонента метрического тензора. Для двумерных пространств имеется три компонента метрики, и отсюда следует, что достаточно трёх измерений. Для трёх измерений метрический тензор имеет шесть независимых компонентов и для четырёх измерений имеется десять независимых компонентов.

Определение компонентов кривизны на языке изменения вектора при переносе его вдоль траектории является более общим, чем определение через дефекты в окружностях, которое не воспроизводит все признаки кривизны.

Фейнмановские лекции по гравитации

Рис. 9.2.

Связь со второй ковариантной производной может быть легко вычислена, когда мы рассматриваем последовательные перемещения вектора, сохраняя его параллельным самому себе. Так как мы проходим вдоль траектории на рис. 9.2, разность в этом векторе, получающаяся при прохождении вдоль этой траектории, должна быть


δ²

𝐴

μ

=

𝑅

μ

νστ

𝐴

ν

Δ

𝑥

σ

Δ

𝑥

τ

.


(9.3.2)


Так как кривизна есть тензор, антисимметричный по индексам (σ,τ), билинейные произведения Δ₁𝑥σΔ₂𝑥τ могут быть заменены на величину ½(Δ₁𝑥σΔ₂𝑥τ - Δ₁𝑥τΔ₂𝑥σ), которые являются половиной компонентов площади параллелограмма. Индексы тензоров имеют значение, которое нетрудно описать словесно; если мы рассматриваем перемещение векторов вдоль небольшой петли в плоскости (στ), компонент μ вектора меняется на величину, пропорциональную сумме по другим компонентам 𝐴ν, 𝑅μντσ𝐴μ и площади петли.

Мы уже очень много говорили о перемещении вектора параллельно самому себе, не делая это понятие математически определённым. При использовании более интуитивных терминов, это просто означает, что мы переносим конец стрелки и основание стрелки на некоторое равное смещение так близко, как только мы можем вдоль прямой линии, которая есть геодезическая. Математическое определение может быть наилучшим образом понято путём рассмотрения уравнения геодезических


𝑑²𝑥μ

𝑑𝑠²

=-

Γ

μ

νσ


𝑑𝑥ν

𝑑𝑠


𝑑𝑥σ

𝑑𝑠

.


(9.3.3)


Ясно, что вектор (𝑑𝑥μ/𝑑𝑠) вдоль геодезической представляет тангенциальную скорость Δ𝑡μ вдоль геодезической, которая есть "физическая” прямая линия. Вторая производная (𝑑²𝑥μ/𝑑𝑠²) представляет собой изменение этой скорости за интервал времени Δ𝑠


Δ

𝑠


𝑑²𝑥μ

𝑑𝑠²


=

Δ

𝑡

μ

=-

Γ

μ

νσ

𝑡

ν

Δ

𝑥

σ

.


(9.3.4)


Это изменение пропорционально самому вектору 𝑡ν и перемещениям Δ𝑥σ. Определение параллельного переноса аналогично; мы говорим, что вектор 𝐴'μ есть результат переноса параллельно самому себе


𝐴'

μ

=

𝐴

μ

+

δ𝐴

μ

,


где


δ𝐴

μ

=-

Γ

μ

σν

𝐴

σ

Δ

𝑥

ν

.


(9.3.5)


Легко может быть показано, что когда мы перемещаем множество векторов вдоль замкнутой кривой, перемещал каждый из них параллельно самому себе, соотношения между векторами не меняется, так что целое пространство, определённое множеством векторов, поворачивается при движении вдоль петли, это задаёт полное изменение, вызванное перемещениями. Доказательство этого утверждения состоит в проверке того, что все инвариантные скаляры


𝐵

μ

𝐴

ν

𝑔

μν

,


(9.3.6)


остаются неизменными. Это означает, что длины векторов и углы между векторами сохраняются. Единственное преобразование, которое допускает это, выглядит как поворот целого пространства.

Фейнмановские лекции по гравитации

Рис. 9.3.

Возможно, что топологические свойства пространства не полностью определяются локальной кривизной. Например, мы получили, что длины векторов сохраняются и углы между векторами сохраняются, когда мы переносим пространство параллельно самому себе. Всё же нет гарантии, что для длинной замкнутой траектории отражение недопустимо, также как и вращение. Двумерный пример таких отражений (например, неориентируемая поверхность) имеет место в ленте Мёбиуса (рис. 9.3). Если мы возьмём два вектора, один из которых параллелен, другой перпендикулярен центральной линии ленты Мёбиуса, и обойдём один раз ленту, двигаясь налево от вертикальной пунктирной линии, показанной рис. 9.3, то пространство не переходит само в себя, а испытывает отражение, обусловленное ”скрученностью” поверхности, а не просто поворот.

Теперь, когда мы определили такое понятие, как перенос вектора параллельно самому себе, мы можем получить важную формулу для тензора кривизны при движении по траектории 𝐴𝐵𝐶𝐷 на рис. 9.2. Разности в векторах при каждом инфинитезимальном перемещении задаются символами Кристоффеля Γ. Но так как эти разности не являются в точности теми же самыми вдоль (𝐴𝐵) и (𝐶𝐷), и даже, если бы эти перемещения были бы противоположны одно другому, вектор не вернулся бы к своей исходной величине. Мы можем понять, каким образом символы Кристоффеля оказываются вовлечены в доказательство этого факта. Выполняя алгебраические преобразования, приходим к соотношению (9.2.14).

Можно показать, что тензор кривизны удовлетворяет тождеству Бианки


𝑅

μ

σαβ;γ

+

𝑅

μ

σβγ;α

+

𝑅

μ

σγα;β

=

0.


(9.3.7)


Сейчас без подготовки я не стал бы говорить о геометрическом значении тождества Бианки. Имеется обычное уравнение электродинамики, которое может быть записано в виде, идентичном виду тождества Бианки, за исключением числа измерений. Тензор поля задаётся через векторный потенциал следующим соотношением:


𝐹

μν

=

∂𝐴μ

∂𝑥ν

-

∂𝐴ν

∂𝑥μ

,


(9.3.8)


другими словами 𝐹μν - ротор некоторого вектора. Но свойства содержащиеся в утверждении, что 𝐹μν есть ротор, эквивалентным образом также хорошо описываются тождеством


𝐹

μν,σ

+

𝐹

νσ,μ

+

𝐹

σμ,ν

=

0.


(9.3.9)


которое имеет вид, похожий на тождество Бианки. Свойства ротора могут быть связаны с криволинейным интегралом, если мы используем теорему Стокса1


Γ

𝑮

𝑑𝒓

=

(rot 𝑮)

𝑑𝑺

,


(9.3.10)


где интеграл в правой части соотношения представляет собой поверхностный интеграл по любой поверхности, ограниченной замкнутой кривой Γ.

1 Мы используем более распространённое обозначение в отечественной литературе для ротора (”rot”), а не ”curl”, как в лекциях Фейнмана (Прим. перев.)

Для случая гравитации аналогия может быть следующая: криволинейный интеграл представляет изменение вектора, когда мы перемещаем его, оставляя параллельным самому себе, вдоль замкнутой кривой Γ. Такое общее изменение возможно связывается с интегралом по любой двумерной гиперповерхности, ограниченной кривой Γ. Доказательство такого утверждения может быть получено по аналогии с доказательством теоремы Стокса, в котором рассматривается разделение конечной поверхности инфинитезимальной сеткой, например, как показано на рис. 9.4; показывается, что сумма вкладов от любой инфинитезимальной сетки равна криволинейному интегралу. Когда рассматривается аналогия для этой ситуации в пространстве более высоких размерностей, то мы можем лучше понять значение тождества Бианки для описания сущности кривизны пространства.

Фейнмановские лекции по гравитации

Рис. 9.4.

9.4. Связь между кривизной и материей

Мы видели, как эффекты, связанные с действием гравитационных полей, могут быть описаны в рамках нашей геометрической интерпретации через тензор кривизны 𝑅μνστ. Осталась только одна задача, состоящая в том, чтобы связать тензор кривизны с источниками гравитации, материи и энергии. Первое, что мы делаем для этого, мы производим свёртку тензора кривизны по первому и последнему индексам и получаем тензор, который называется тензором Риччи


𝑅

νσ

=

𝑅

μ

νσμ

.


(9.4.1)


В этом соотношении указан единственный способ, каким можно свернуть один раз тензор кривизны. Следующий намёк приходит из рассмотрения обобщённого закона сохранения энергии и импульса, который гласит, что свёрнутая ковариантная производная или, иначе говоря, ковариантная дивергенция тензора энергии-импульса, должна быть равна нулю.

Мы ищем вид соотношения, включающего в себя тензор Риччи таким образом, что его свёрнутая ковариантная производная является тождественным нулём. Ответ получается из свёртывания дважды тождества Бианки (9.3.7). Свёртывание по индексам (μβ) приводит к выражению, включающему в себя тензоры Риччи


𝑅

σα;γ

-

𝑅

σγ;α

+

𝑅

μ

σγα;μ

=

0.


(9.4.2)


Свёртывая по индексам (σ,α), мы получаем


𝑅

-

𝑅

σ

γ;σ

-

𝑅

μ

γ;μ

=

0.


(9.4.3)


Таким образом, тензорная величина, которая имеет нулевую ковариантную производную, есть


𝑅

μ

γ

-

1

2

𝑔

μ

γ

𝑅

⎠;μ

=

0.


(9.4.4)


Гипотеза Эйнштейна состояла в том, что эта величина в точности есть тензор энергии-импульса. Для того, чтобы записать это в эйнштейновской форме, мы просто поднимаем один индекс для того, чтобы записать дважды ковариантный тензор


𝐺

μν

=

𝑅

μν

-

1

2

𝑔

μν

𝑅

=

λ²

𝑇

μν

,


𝐺

μν

=

0.


(9.4.5)


Первое уравнение (9.4.5) определяет полный закон гравитации Эйнштейна; т.е. это отправная точка всей нашей работы. 𝐺μν часто называется тензором Эйнштейна.

После того, как мы установили связь между тензором энергии-импульса и тензором кривизны, возникает интересный вопрос. Наша интуиция могла бы предполагать, что если повсюду в пространстве нет материи и давлений, геометрия должна бы быть плоской, описываемой метрикой Минковского специальной теории относительности. Тем не менее, оказалось возможным получить решения такие, что


𝑇

μν

=

0


всюду и, несмотря на это,


𝑅

σ

ρτν

0.


(9.4.6)


Наиболее интересным из таких решений является решение А.Тауба. Это решение наиболее интересно, поскольку оно не зависит от времени. Тем не менее, могут быть другие решения такой задачи, так мы можем спросить, можем ли мы иметь гравитацию без того, чтобы имелись источники?

Ответ на этот вопрос вероятно будет аналогичным ответу, который даётся на аналогичный вопрос в электродинамике. Если разрешается зависимость от времени, то уравнения допускают существование полей без источников (т.е. движущиеся волны), до сих пор мы никогда не сталкивались с физическими трудностями, предполагая, что всё наблюдаемое излучение действительно приходит от заряженных источников, которые и испускают это излучение. Можно построить статические поля, например, имеющие потенциалы


φ

=

𝑥,


φ

=

𝑥²

+

𝑦²

-

2𝑧²

,


(9.4.7)


которые являются бездивергентными, а потому не имеют источников. Обычная интерпретация таких решений состоит в том, что такие поля вызываются зарядами, лежащими вне некоторого объёма, внутри которого соотношения (9.4.7) оказываются справедливыми, и для этого требуется всё большее и большее количество заряда, находящегося вне рассматриваемой области для того, чтобы сделать такого рода решения приемлемыми, когда мы пытаемся увеличить объём, в котором выполнены приведённые выше решения.

Не проверяя в деталях решения А. Тауба, я полагаю, что он столкнулся с аналогичной ситуацией. Для того, чтобы объяснить наличие кривизны в отсутствии материи, мы должны взять предельный случай решений, которые имеют ясную физическую интерпретацию на малых областях, и затем разрешить этим областям стать бесконечно большими. Цена, которая при этом должна быть заплачена, состоит в том, чтобы неограниченно отсрочить объяснение растущего количества "внешней” материи, которая нам требуется.

Лекция 10

10.1. Полевые уравнения гравитации

Мы нашли тензор, называемый тензором кривизны, который определяется исходя из того, что происходит, когда мы переносим векторы по некоторой замкнутой кривой в нашем пространстве. Поскольку эта величина является тензором, мы можем использовать её для того, чтобы образовать величины, которые должны быть использованы при написании ковариантных уравнений. Мы не получили никакой физики, просто записывая эти уравнения, тем не менее, мы должны точно определить связь этих уравнений с реальным материальным миром. То, что сделал Эйнштейн, состоит в том, что он попросту предположил, что такая связь есть. Не существует способа вывести эту связь из более фундаментальных принципов. Каждая возможная гипотеза имеет свои характерные свойства, поэтому возможно для более позднего исследователя предположить наличие некоторого критерия, который бы делал выбор единственным, но это по сути дела некий обман.

Некоторая подсказка, которая может помочь нам, состоит в том, что гравитация взаимодействует с плотностью энергии, так что поскольку плотность энергии в теории относительности есть компонент (44) тензора второго ранга, то в уравнениях нам необходимо иметь тензор второго ранга. Кривизна является тензором четвёртого ранга, так что мы сворачиваем его (по верхнему и нижнему индексу) один раз и используем тензор Риччи. Первая гипотеза Эйнштейна состояла в том, что тензор энергии-импульса попросту равен тензору Риччи λ²𝑇μν=𝑅μν. Тем не менее, возможен другой выбор; мы можем добавить к тензору Риччи метрический тензор, умноженный на скалярную кривизну (свёрнутый тензор Риччи). Таким образом, получаем то, что в конце концов выбрал Эйнштейн:


𝑅

μν

-

1

2

𝑔

μν

𝑅

=

λ²𝑇

μν

.


(10.1.1)


Существует хороший аргумент в пользу того, почему такой выбор лучше. Если мы вычислим ковариантную дивергенцию уравнения (10.1.1), то ответ состоит в том, что эта величина тождественно равна нулю. Это означает, что закон сохранения энергии есть попросту следствие вида уравнения (10.1.1). Если мы положим тензор энергии-импульса равным только вектору Риччи (а не тензору Эйнштейна), то закон сохранения энергии был бы тогда физическим постулатом, который принёс бы больше информации и привёл бы к меньшей свободе. В действительности выбор метрических тензоров не является однозначным; когда мы работаем с ними, у нас есть возможность свободы выбора четырёх функций, соответствующих четырём функциям, которые описывают общее преобразование, задающее новые координаты через старые. Так как закон сохранения энергии есть тождество, то выбор четырёх функций в метрике является полностью свободным.

Насколько хорошо выбор Эйнштейна соответствует Природе? Как мы получаем тензор 𝑇μν и каково значение этих уравнений и кривизны? Для того, чтобы ответить на эти вопросы, мы поработаем с этими уравнениями некоторое время. Прежде всего мы попытаемся понять связь этих уравнений с остальной физикой и с вариационными принципами.

Для того, чтобы записать принцип действия в релятивистском виде, нам необходим интеграл, который есть скалярный инвариант. Мы выбираем, что действие для гравитационного поля есть


𝑆

𝑔

=-

1

2λ²

𝑑⁴𝑥

𝑅√

-𝑔

.


(10.1.2)


В тех выражениях, которые мы выписываем, мы обозначаем 𝑑⁴𝑥=𝑑𝑥𝑑𝑦𝑧𝑑𝑡. Действие 𝑆𝑔 есть скаляр, поскольку 𝑅 есть скаляр и √-𝑔𝑑⁴𝑥 есть скаляр. Мы можем показать последнее, исходя из рассмотрения того, что собственное время есть скалярный инвариант


(𝑑𝑠)²

=

𝑔

μν

𝑑𝑥

μ

𝑑𝑥

ν

.


(10.1.3)


Вследствие того, что 𝑔μν есть симметричный тензор, мы всегда можем ввести вращение таким образом, что тензор будет диагональным; в этом случае


(𝑑𝑠)²

=

𝐷(𝑑𝑡)²

-

𝐶(𝑑𝑧)²

-

𝐵(𝑑𝑦)²

-

𝐴(𝑑𝑥)²

.


(10.1.4)


Отсюда мы видим, что элемент объёма 𝑑⁴𝑥 не является инвариантом; должным образом выбранный инвариантный элемент объёма есть


𝐴𝐵𝐶𝐷

𝑑𝑥'

𝑑𝑦'

𝑑𝑧'

𝑑𝑡'

=

-𝑔

𝑑⁴𝑥'

,


(10.1.5)


где 𝑔'=Det 𝑔'μν. Если мы делаем ортогональные преобразования, то 𝑑⁴𝑥=𝑑⁴𝑥' и также определитель Det 𝑔μν равен Det 𝑔'μν. Таким образом, общее выражение для инвариантного элемента объёма есть


-𝑔

𝑑⁴𝑥

.


(10.1.6)


Величина √-𝑔 есть скалярная плотность. Это означает, что её изменение при координатном преобразовании получается умножением на якобиан преобразования


-𝑔'

=


∂𝑥μ

∂𝑥'ν


-𝑔

.


(10.1.7)


Тензор кривизны появляется тогда, когда мы вычисляем вариацию величины 𝑆𝑔 по отношению 𝑔μν


δ𝑆𝑔

δ𝑔μν

=

1

2λ²

-𝑔

𝑅

μν

-

1

2

𝑔

μν

𝑅

.


(10.1.8)


Это происходит из-за того, что мы можем использовать интеграл от 𝑅 как действие гравитационной части полной задачи.

Позвольте мне отметить, что поскольку этот тензор давления появляется при таком подходе из вариационного принципа, его ковариантная дивергенция с необходимостью равна нулю (это утверждение впервые, я считаю, было отмечено Эддингтоном). Мы увидели эту связь с другого направления, заключающегося в том, что мы могли бы вывести вариационный принцип при условии, что мы исходим из тензора с нулевой дивергенцией. Доказательства, которые мы предлагаем, не являются строгими; мы не беспокоимся о строгости, поскольку факты составляют существо дела, а не их доказательства. Физика может развиваться без доказательств, но мы не можем продолжать развивать теорию без фактов. Доказательства полезны в том смысле, что они являются хорошими упражнениями; если факты верны, тогда доказательства являются предметом игры с корректным использованием алгебры.

Мы хотим показать, что если функционал


𝑆

𝑔

=

𝑑⁴𝑥

[𝑔

μν

]

,


(10.1.8')


есть инвариант при координатных преобразованиях, тогда ковариантная дивергенция вариации 𝑆𝑔 по отношению 𝑔μν тождественно равна нулю. Делая инфинитезимальное преобразование и переходя к штрихованным координатам 𝑥μ→𝑥'μ,


𝑥

μ

=

𝑥'

μ

+

μ

(𝑥')

,


(10.1.9)


изменение 𝑔μν задаётся соотношением


𝑔

μν

𝑔'

μν

(𝑥')

=

𝑔

μν

(𝑥')

+

α

𝑔

μα

(𝑥')

+

α

𝑔

να

(𝑥')

+


+

α

𝑔

μν,α

(𝑥')

.


(10.1.10)


Выражая действие в новых координатах, опуская штрихи у переменных, по которым ведётся интегрирование, инвариантное действие выражается в виде


𝑆

𝑔

=

𝑑⁴𝑥

[𝑔'

μν

]

=

𝑑⁴𝑥

[𝑔

μν

]

+


+

𝑑⁴𝑥

δ∑

δ𝑔μν

(

α

𝑔

μα

+

α

𝑔

να

+

α

𝑔

μν,α

).


(10.1.11)


Когда мы производим интегрирование по частям второго слагаемого в правой части этого выражения, мы преобразуем его к выражению, которое включает в себя функциональные производные функции ∑. Мы кладём его равным нулю, так как мы знаем, что изменение в действии должно быть равно нулю при любом ℎα вследствие вида функции ∑


∂𝑥μ



δ∑

δ𝑔μν

𝑔

να

-

1

2


δ∑

δ𝑔μν


∂𝑔μν

∂𝑥α

=

0.


(10.1.12)


Обозначим 𝒢μν вариацию величины 2λ²𝑆𝑔 по отношению к 𝑔μν:


𝒢

μν

=

2λ²

δ𝑆𝑔

δ𝑔μν

.


(10.1.13)


Величина 𝒢μν есть контравариантная тензорная плотность второго ранга. Используя это определение, уравнение (10.1.12) можно переписать в виде


𝑔

αμ

𝒢

μν

⎠,ν

-

1

2

𝑔

μν,α

𝒢

μν

=

0,


(10.1.14)


которое эквивалентно утверждению, что ковариантная дивергенция 𝒢μν равна нулю


𝒢

μν

=

0.


(10.1.15)


Для демонстрации эквивалентности некоторых соотношений, включающих в себя ковариантные производные, удобно использовать некоторые соотношения, которые мы приведём сейчас для того, чтобы в дальнейшем их использовать. Вначале вычислим свёрнутые символы Кристоффеля.

Используя определение, получим


Γ

μ

εμ

=

𝑔

μσ

[με,σ]

=

1

2

𝑔

μσ

[

𝑔

σμ,ε

+

𝑔

σε,μ

-

𝑔

με,σ

].


(10.1.16)


Второй и третий члены взаимно сокращаются, так как тензор 𝑔μν - симметричен. Оставшийся член содержит обратную матрицу 𝑔μν умноженную на градиент 𝑔μν. Из хорошо известной теоремы об определителях следует, что алгебраическое дополнение 𝑀μν матрицы 𝑔μν связывается с соответствующим элементом обратной матрицы соотношением


𝑔

μν

=

𝑀μν

𝑔

,


(10.1.17)


и таким образом


𝑔

=

𝑔

μν,λ

𝑀

μν

=

𝑔

μν,λ

𝑔

μν

𝑔

.


(10.1.18)


Следовательно,


𝑔

μν

𝑔

μν,λ

=

[log(-𝑔)]

,


(10.1.19)


и свёрнутый символ Кристоффеля равен следующему соотношению


Γ

μ

εμ

=

[log(-𝑔)]

=

1

√-1

(√

-1

)

.


(10.1.20)


Кроме того, имеются следующие полезные формулы для ковариантных производных. Для скалярных функций ковариантные градиенты оказываются равными обычным градиентам


φ

=

φ

.


(10.1.21)


Для контравариантного вектора ковариантная дивергенция есть


𝐴

ν

1

√-𝑔


-𝑔

𝐴

ν

⎠,ν


(10.1.22)


Ковариантный ротор оказывается равным обычному ротору


𝐴

μ;ν

-

𝐴

ν;μ

=

𝐴

μ,ν

-

𝐴

ν,μ


(10.1.23)


Для тензоров второго ранга ответы оказываются различными (в зависимости от симметрии), для антисимметричных тензоров


𝐹

μν

=

1

√-𝑔


-𝑔

𝐹

μ

⎠,ν


если


𝐹

μν

=-

𝐹

μν

.


(10.1.24а)


Для симметричных тензоров


𝑇

ν

μ;ν

=

1

√-𝑔


𝑇

μ

ν

-1

⎠,ν

-

1

2

𝑔

αβ,μ

𝑇

αβ

,


если


𝑇

μν

=

𝑇

νμ

.


(10.1.24б)


Используя эти соотношения, путём прямых вычислений можно получить, что соотношения (10.1.14) и (10.1.15) эквивалентны. Таким образом, мы видим, что инвариантность действия приводит к построению тензорной плотности, которая автоматически имеет нулевую ковариантную дивергенцию. Так как ковариантная производная метрического тензора 𝑔μν обращается в нуль, то ковариантная производная (√-𝑔) также обращается в нуль. (Заметим для точности, что обычная производная (√-𝑔) есть не то же самое, что ковариантная производная, поскольку √-𝑔 есть скалярная плотность, а не скаляр). Тензор, ассоциированный с тензорной плотностью 𝒢μν также является бездивергентным,


𝐺

μν

=

𝒢μν

√-𝑔

,

𝐺

μν

=

0.


(10.1.25)


В этой связи нам следует прояснить некоторое положение, которое достаточно кратко, но иногда оказывается довольно запутанным. В лекции 6 мы работали с функциональными уравнениями (например, соотношение (6.2.3) того же вида, что и соотношение (10.1.2)); решения этих уравнений являются в действительности тензорными плотностями, а не тензорами. Тензорная плотность 𝒯μν удовлетворяет уравнению


𝒯

μν

=-

Γ

μ

αβ

𝒯

αβ

,


(10.1.26)


где 𝒯μν=√-𝑔𝑇μν, но тензор энергии-импульса 𝑇μν удовлетворяет следующему соотношению


𝑇

μν

=-

Γ

μ

αβ

𝑇

αβ

-

1

2𝑔

𝑔

𝑇

μα

.


(10.1.27)


10.2. Действие для классических частиц в гравитационном поле

Следующее, что мы обсудим, это то, как записать общий закон физики, который описывает не только гравитационные поля, но также и вещество. Мы предполагаем, что такой закон может быть выведен из принципа наименьшего действия; математическая формулировка которого состоит в том, что вариация действия равна нулю


δ𝑆

=

δ

𝑑⁴𝑥

ℒ[

𝑔

μν

,

𝐴

μ

, …]


(10.2.1)


Плотность лагранжиана ℒ содержит различные виды полей, например, поле тензора гравитации 𝑔μν, электромагнитное поле 𝐴μ и, если вещество есть скаляр, поле вещества скаляра φ. Когда мы вариируем это действие по отношению к различным полям, мы получаем уравнения распространения для соответствующих полей. Мы написали одну часть этого действия; давайте обозначим ту часть действия, которая ранее была пропущена, через 𝑆𝑚 которая зависит от полей материи φ и электромагнитных полей 𝐴μ и всех других полей, какие мы только знаем. Когда мы вычисляем вариацию от действия


𝑆

=

𝑆

𝑔

+

𝑆

𝑚

=-

1

2λ²

𝑑⁴𝑥

-𝑔

𝑅

+

𝑆

𝑚

,


(10.2.2)


по отношению к 𝑔μν, мы получаем следующее уравнение:


δ𝑆𝑔

δ𝑔μν

=

1

2λ²

-𝑔

𝑅

μμ

-

1

2

𝑔

μν

𝑅

=-

δ𝑆𝑚

δ𝑔μν

.


(10.2.3)


Тензорная плотность энергии-импульса вещества 𝒯μν должна быть вариационной производной 𝑆𝑚


𝒯

μν

=-

2

δ𝑆𝑚

δ𝑔μν

,


(10.2.4)


в том случае, если тензор 𝑇μν должна быть источником гравитационного поля. Теперь нам понадобится несколько примеров тензора 𝑇μν. Если мы не можем вычислить тензор 𝑇μν, исходя из некоторого физического принципа, тогда нет теории гравитации, так как мы не знаем, каким образом поля связываются с любым другим объектом.

Существуют некоторые требования непротиворечивости, подобные тем, которые мы находим в электродинамике. Для того, чтобы решить уравнения Максвелла, нам необходимо иметь токи. Это должны быть сохраняющиеся токи, а не просто произвольные токи. Сохраняющиеся токи источника, имеющие столь важное значение, получаются путём решения некоторых других задач физики, описываемых некоторым независимым законом, таким как Закон Ома, или Закон Гука, или уравнение Шрёдингера для таких и подобных систем. Если у нас не было таких других законов, то теория электромагнитных полей была бы бесполезной и не имела бы никакого значения.

Для гравитации ситуация более сложная. В тензоре 𝑇μν заключено и движение материи, отсюда следует, что у нас должен быть закон, которому следует материя, включая закон Ома и закон Гука; но также тензор 𝑇μν будет заключать в себе поля гравитации 𝑔μν, обстоятельство, которое запутывает подобные задачи существенно в большей степени, чем в электромагнетизме. Вообще говоря, невозможно написать каким-либо согласованным образом тензор 𝑇μν за исключением вакуума, если не решена уже полная запутанная задача. Беспокойство вызвано тем, что любое точно определённое выражение для тензора 𝑇μν не будет давать решение подобной задачи, за исключением специальных случаев метрического тензора 𝑔μν; полное релятивистское решение должно было бы выполняться вне зависимости от частного выбора координат и кривизны. Даже для очень простых задач у нас нет идей относительно того, каким путём надо следовать, чтобы записать правильным образом тензор 𝑇μν. Мы не знаем, как записать тензор 𝑇μν для того, чтобы описать вращающийся стержень, так что мы не можем вычислить в точности излучение им гравитационных волн. Мы не можем вычислить тензор 𝑇μν для системы, состоящей из Земли и Луны, поскольку приливные силы и силы упругости Земли существенно влияют на гравитационные поля. Если мы предположим, что Земля абсолютно твёрдая, то эти уравнения окажутся несогласованными. Если мы предположим, что Земля есть точка, то уравнения окажутся слишком сингулярными для того, чтобы иметь решения. И несмотря на это, материальный шар с заданной жёсткостью, такой как Земля, будет вращаться вокруг Луны другой массы и жёсткости вне зависимости от того, являются ли рассматриваемые уравнения точно определёнными.

В этом месте теория гравитации оказывается достаточно уязвимой, поскольку одна часть уравнения теории гравитации является замечательно красивой и геометрической, а другая часть нет, она содержит всю ”грязь” закона Гука и других законов, которые определяют поведение материи, которые не являются ни красивыми, ни геометрическими. Очень многие физики оказались настолько загипнотизированными красотой одной части этих уравнений, что они игнорируют другую часть. Тем самым, у них нет физики, которую необходимо было бы исследовать.

Мы должны провести некоторое изучение для того, чтобы понять возможные виды для действия, соответствующего вкладу материи 𝑆𝑚 В качестве исходной точки полезно рассмотреть классические пределы. Если мы правильно запишем классическое действие, то обычно не очень трудно увидеть, каким образом можно обобщить формулы, чтобы они стали инвариантными при произвольных координатных преобразованиях. Удобный способ породить такие обобщённые формулы состоит в том, чтобы возвратиться назад к локально падающей (свободно падающей) касательной координатной системе, разгадать, как добавить в качестве множителей 𝑔μν и 𝑅μν так, чтобы всё выражение оказалось инвариантом. Например, свободная частица, на которую не действуют силы, характеризуется действием


𝑆

𝑚

=-

𝑚₀

2

𝑑𝑠

𝑑𝑧μ

𝑑𝑠


𝑑𝑧μ

𝑑𝑠

.


(10.2.5)


Этот пример иллюстрирует процедуру решения подобных задач; обнаруживается обычно, что такой подход оказывается весьма плодотворным. Мы записываем выражения такими, как они выглядят в плоских координатах, переходим к криволинейным координатам и видим, в какие места входят величины 𝑔μν Часто бывает очевидно, какая общая форма будет приводить к результатам в плоском пространстве. Если 𝑧μ(𝑠) - орбита частицы, которая свободно падает, то соответствующее слагаемое в действие есть


𝑆

𝑚

=-

𝑚₀

2

𝑑⁴𝑥

𝑑𝑠

δ⁴(𝑥-𝑧(𝑠))

𝑔

μν

𝑑𝑧μ

𝑑𝑠


𝑑𝑧ν

𝑑𝑠

.


(10.2.6)


Тензорная плотность энергии-импульса 𝒯μν получается путём варьирования этого слагаемого действия по отношению 𝑔μν что даёт


𝒯

μν

=

𝑚₀

𝑑𝑠

δ⁴(𝑥-𝑧(𝑠))

𝑑𝑧μ

𝑑𝑠


𝑑𝑧ν

𝑑𝑠

.


(10.2.7)


Аналогия с результатами в электродинамике является настолько сильной, что этот результат не выглядит неожиданным. У нас нет волнений, связанных с противоречивостью определения 𝒯μν. Поскольку мы исходили из инвариантных выражений, тензорная плотность 𝒯μν удовлетворяет соответствующему условию на ковариантную производную.

Интересно исследовать связь между уравнениями движения и бездивергентным тензором энергии-импульса с противоположной точки зрения. При записывании действия мы по существу утверждали, что частица движется вдоль геодезической. Таким образом, результирующая тензорная плотность энергии-импульса является бездивергентной. Теперь мы хотим показать обратное. Предположим, что тензор 𝒯μν - ненулевой только в нитеобразной области пространства-времени. Тогда мы можем показать, что эта нитеобразная область есть на самом деле геодезическая при условии, что мы предполагаем нечто эквивалентное сферической симметрии частицы, когда мы смотрим на неё с очень близкого расстояния. Идея состоит в том, чтобы начать с рассмотрения условия, которое связывает обычную дивергенцию 𝒯μν с самой тензорной плотностью 𝒯μν, и произвести интегрирование по частям для того, чтобы преобразовать интегрирование по объёму в интегрирование по пространству


𝑑⁴𝑥

𝒯

μ

ν

=

1

2

𝑑⁴𝑥

𝑔

αβ,μ

𝒯

αβ

.


(10.2.8)


Если тензорная плотность 𝒯μν равна нулю всюду, за исключением нитеобразной области, вклад в поверхностный интеграл равен нулю за исключением тех мест, где нить пересекает поверхность, и которые соответствуют импульсу частицы ”до” и ”после”, если эти поверхности берутся в постоянный момент времени. Преобразуя этот результат к дифференциальной форме, в конце концов получаем результат, заключающийся в том, что движение следует уравнению геодезических:


𝑑²𝑧μ

𝑑𝑠²

+

Γ

μ

αβ


𝑑𝑧α

𝑑𝑠


𝑑𝑧β

𝑑𝑠

=

0.


(10.2.9)


Возможность такого вывода приводит к утверждению, что уравнения Эйнштейна одновременно определяют движение материи и гравитационных полей. Это утверждение вводит в заблуждение и совершенно не выглядит так замечательно, как это может показаться с первого взгляда. Давайте вспомним, что если у нас есть свободная частица, движущаяся сама по себе вдали от каких-либо других тел, тогда законы сохранения энергии и количества движения определяют полностью её движение. В теории гравитации свободно падающая частица становится эквивалентной свободной частице, так что вновь наличие закона сохранения энергии оказывается достаточным для того, чтобы полностью определить движение. Но обычная физическая ситуация не является настолько простой, как описанная выше. Когда мы имеем нечто большее, чем только гравитация и частица, уравнения движения не следуют только из законов сохранения энергии и импульса. В электродинамике сохранение заряда должно содержаться в каждом решении уравнений Максвелла, так что можно сказать, что этот закон сохранения есть следствие уравнений Максвелла. Но это условие не даёт всего необходимого для того, чтобы построить уравнения движения для зарядов, полей, которые они задают, и сил, с которыми эти заряды действуют друг на друга. Подобно этому в теории гравитации имеет место сохранение энергии и количества движения, но этого не достаточно, чтобы определить движение планет и Луны для случая, когда эти объекты не являются точками, и законы физики, отличные от закона сохранения энергии, требуются для того, чтобы уяснить их поведение в гравитационном поле.

10.3. Действие для материальных полей в гравитационном поле

Следующее, что мы рассмотрим - подготовим переход к квантовой теории. Если скалярные частицы описываются скалярным полем φ, тогда соответствующий вклад в действие есть


𝑆

𝑚

=

1

2

𝑑⁴𝑥

(

φ

φ

-

𝑚²φ²

).


(10.3.1)


Легко может быть сделано обобщение на случай криволинейных координат; мы предполагаем, что


𝑆

𝑚

=

1

2

𝑑⁴𝑥

-𝑔

(

𝑔

μν

φ

φ

-

𝑚²φ²

).


(10.3.2)


Это выражение является очевидным образом инвариантным при произвольных координатных преобразованиях, это есть одно из налагаемых на него требований, и приводится к соответствующему выражению для плоского пространства. Тем не менее, мы можем выписать другие выражения, которые являются идеально правильными инвариантами, квадратичными по полям φ, и которые включают в себя тензор кривизны. Все эти выражения обращаются в нуль в том случае, когда пространство становится плоским. Возможно, что действие должно содержать пропорции α и β соответствующих членов, например,


𝑑⁴𝑥

-𝑔

𝑅φ²

𝑑⁴𝑥

-𝑔

(

𝑅

μν

φ

φ

).


(10.3.3)


Мы видим, что действие, которое мы записываем, не является единственным. Первое слагаемое, которое мы записали, должно здесь присутствовать, так как только оно и приводит к правильному результату для плоского пространства. И нет экспериментального свидетельства о приливных силах и т.д. и т.п., что могло бы быть причиной для включения или невключения других слагаемых, таких как в выражении (10.3.3). Единственная разумная вещь, которую мог бы сделать физик теперь, состоит в том, чтобы выбрать некоторые слагаемые, которые являются ”проще”, чем другие слагаемые, пренебречь более сложными членами в действии и посмотреть, какого рода теорию он получил в результате. В некотором смысле возможно производные есть более сложные объекты, чем просто поля, поэтому член с множителем β является более сложным, поскольку он содержит четыре производных, две в полях и две в тензоре 𝑅μν. Слагаемое с множителем α содержит только две производных, тем не менее обе производных по полю 𝑔μν. Однако трудно определить усложнение теории, которое было бы сделано недвусмысленным образом; всегда возможно провести интегрирование по частям, так что производные исчезают в одном месте и вновь появляются в другом - простота, которая очевидна в случае, если начать формулировать теорию с одной исходной точки, может не соответствовать простоте, которая получилась бы, если теорию формулировали бы, исходя из другой начальной точки. Если нами используется построение квантовой механики, исходя из уравнения Шрёдингера, то простейшее действие, по-видимому, должно быть таким, которое соответствует α=0. Но так как мы начали формулировать квантовую механику, задаваемую через интегралы по траекториям, то простейшее действие кажется должно быть таким, которое соответствует α=1/6. Каждая из возможностей выбора значения а кажется наипростейшей с соответствующей точки зрения. Я не знаю никакого удовлетворительного способа определить величину α и считаю, что определение действия для скалярного поля является неоднозначным.1

1 Современное рассмотрение этой проблемы, включающее в себя обсуждение проблемы спектра атома водорода см. в [Klei 89].

Значение члена, такого как член со множителем β в соотношении (10.3.3), состоит в том, что он характеризует то, должны ли мы иметь дело с частицей, которая может чувствовать гравитационное поле вне области, достаточно большой по сравнению с той, которая характеризуется локальной кривизной. Если частица имеет структуру, которая в некотором смысле инфинитезимально мала, тогда она не может чувствовать кривизну. Но если, что скорее всего, частица, двигаясь, совершает движение типа штопора в окрестности своего положения, то член, включающий в себя локальную кривизну, может быть очень хорошо представлен.

Мы приведём пример, рассматривая ситуацию в электродинамике, как иное исходное положение приводит к иному ответу достаточно безобидным путём. Здесь принцип минимального электромагнитного взаимодействия приводит к замене


∂𝑥μ


∂𝑥μ

-

𝑖𝑒

𝐴

μ


(10.3.4)


в лагранжиане. Предположим теперь, что перед тем, как мы сделали такую замену, мы записали интеграл от лагранжиана следующим образом:


𝑆

=

𝑑𝑉

ψ

γ

μ

∂𝑥μ

ψ

-

𝑑𝑉

ψ

𝑚ψ

+


+

ε

𝑑𝑉

ψ

(

γ

μ

γ

ν

-

γ

ν

γ

μ

)

∂𝑥μ


∂𝑥ν

ψ

.


(10.3.5)


Последнее слагаемое не записывается при обычном изложении теории, поскольку оно тождественно равно нулю, причём потому, что оно в точности равно нулю, не может быть никакого твёрдого и надёжного правила относительно того, как отбросить этот член. Тем не менее, когда мы делаем замену градиента в соответствии с соотношением (10.3.4) для того, чтобы включить электромагнетизм, результирующий лагранжиан оказывается не тем же, каким он был до преобразования; лагранжиан имеет дополнительное слагаемое,


ε

γ

μ

γ

ν

𝐹

μν

.


(10.3.6)


где 𝐹μν=𝐴μ,ν-𝐴μ,ν Этот член есть член аномального момента, открытого Паули. (Впервые это было сообщено мне Вентцелем.)

Электродинамика частиц спина 1 усложняется также аномальными квадрупольными моментами. Очевидно, не существует более простого выражения для лагранжиана, который можно записать, так что в теоретических работах должны представляться вычисления с альтернативными теориями, которые соответствуют различным аномальным моментам.

В нашей теории гравитации ситуация аналогична. Это как если бы частица обладала аномальным моментом инерции, добавляемым к обычному моменту инерции, обусловленному распределением массы.

В электромагнетизме подобные неоднозначности не появляются при описании частиц с нулевым спином - они впервые появляются при описании частиц со спином 1/2. С другой стороны, в гравитации трудности возникают даже при обсуждении простейшего случая скалярных частиц. Не существует решения для преодоления таких трудностей - мы должны признать, что множество альтернативных теорий (различных значений α) оказывается возможным.

Движение частицы в заданном гравитационном поле описывается уравнением, которое получается, когда мы вариируем действие по отношению к полю φ. В зависимости от того, как мы переходим к квантовой механике, различные варианты действия приводят к простейшим результатам. Таким образом, мы не можем доказать, что что-либо проще, если это не приводит к одновременной простоте при решении множества различных задач. Для различных задач необходимо выбрать различные значения а для того, чтобы упростить решение, или для того, чтобы отказаться от производных. Если положить α=0, то тогда мы приходим к ковариантной простоте только в том смысле, что требуется меньше алгебраических вычислений при таком исходном положении. При этом нет какой-либо подразумеваемой физической простоты, так как все значения α приводят к различным степеням сложности или в той, или в другой задаче.

Давайте приступим к получению уравнений движения поля материи φ. Исходя из соотношения (10.3.2), мы можем использовать следующие вариации обратной матрицы и квадратного корня от детерминанта:


δ𝑔

μν

=-

𝑔

μα

𝑔

νβ

δ𝑔

αβ

,


δ(√

-𝑔

)

=

1

2

-𝑔

𝑔

αβ

δ𝑔

αβ

,


(10.3.7)


для того, чтобы получить следующее выражение для 𝒯μν:


𝒯

μν

=

-2

δ𝑆𝑚

δ𝑔μν

=

-𝑔

φ

φ

-

1

2

-𝑔

𝑔

μν

(

φ

φ

-

𝑚²φ²

)-


-𝑔

𝑅

μν

-

1

2

𝑔

μν

𝑅

φ²

-

4αφφ

-𝑔

δ𝑅

δ𝑔μν,β

.


(10.3.8)


Далее мы вычисляем вариацию по отношению к полю φ и кладём вариацию равной нулю для того, чтобы получить нечто, что является аналогичным уравнению Клейна - Гордона


-𝑔

𝑔

μν

φ

⎠μ

+

-𝑔

𝑚²φ

+

2α𝑅

-𝑔

φ

=

0.


(10.3.9)


Получим уравнение, в котором тензоры появляются путём деления на скалярную плотность √-𝑔


1

√-𝑔


-𝑔

𝑔

μν

φ

⎠μ

+

𝑚²φ

+

2α𝑅

φ

=

0.


(10.3.10)


Используя соотношения (10.1.20) и (10.1.21), мы видим, что последнее уравнение может быть переписано в виде


φ

;μμ

+

(

𝑚²

+

2α𝑅

)

φ

=

0.


(10.3.11)


Связь с уравнением Клейна - Гордона может быть замечена при рассмотрении случая α=0; обычный даламбертиан просто заменён на его ковариантный аналог, ковариантный даламбертиан.

Предшествующие шаги дали нам вполне определённую теорию, поскольку мы точно определили, как движется материя и какой есть тензор источника. Легко проверить, что для тензора, который мы выписали, ковариантная дивергенция 𝒯μν равна нулю, трюк здесь состоит в том, чтобы использовать каждый раз, когда это необходимо, сами полевые уравнения. Таким образом, ход рассуждений оказывается последовательным, все соответствующие тензоры являются бездивергентными, и это оказывается достаточно существенным, чтобы в рассуждениях исходить из этого. Для того, чтобы построить более полную теорию, мы добавляем дополнительные члены к действию так, чтобы представить другие известные поля. Мы записали сначала действие в плоском пространстве, так как мы знаем это; исходя из некоторого вида критерия, мы выберем наипростейшую форму для действия, которое есть инвариант. Требование, что действие должно быть инвариантом, приводит к ковариантным уравнениям для полей. Это не является ограничением на то, какие известные поля мы можем включить в рассмотрение, поскольку все известные законы физики могут быть ковариантным образом записаны. Дифференциальные законы обладают этим свойством. Любой закон, записанный как дифференциальное уравнение, может быть легко преобразован к ковариантной форме; мы предполагаем, что в касательном пространстве этот закон оказывается тем же самым, каким мы его знаем, затем мы вращаем и растягиваем координаты. Результирующие уравнения включают в себя производные полей вплоть до второй производной метрического тензора.

Как только мы проделали эти выкладки сначала в дифференциальной форме, затем в ковариантной форме, тогда мы можем использовать нашу теорию для того, чтобы вычислить, например, уравнение движения вещества в звезде. Рассмотренные процессы могут описываться законами, характеризующими непрозрачность, законами рассеяния и т.д. Что не является допустимым, так это использование законов, которые могли бы нарушить сохранение энергии. Мы не можем, например, сказать ”до свидания” тем нейтрино, которые образовались; эти нейтрино теряют энергию из-за наличия гравитационного потенциала, когда они покидают звезду, и последовательная теория не может быть написана, если мы пренебрегаем этим эффектом и влиянием плотности энергии нейтрино на модификацию гравитационного поля. Следовательно, не будет достаточным записать интегральные уравнения диффузии со свободными траекториями с конечным средним, но мы должны следовать уравнениям движения частиц диффузии, которые описываются полными законами, записанными в виде дифференциальных уравнений.

Для того, чтобы сделать выражения для нас проще, запишем здесь подынтегральную функцию в выражении для действия для полей непосредственно через метрический тензор. Наши предыдущие выражения выглядят проще, поскольку они определяются через комбинации метрического тензора, но этот вид часто оказывается более полезным


-𝑅

-𝑔

=-

√-𝑔

2

𝑔

νλ,σ

𝑔

μρ,τ

(

𝑔

νλ

𝑔

στ

𝑔

μρ

-

𝑔

νμ

𝑔

λρ

𝑔

στ

+


+2

𝑔

μν

𝑔

λτ

𝑔

σρ

-2

𝑔

τμ

𝑔

ρσ

𝑔

νλ

)

+


+

-𝑔

𝑔

νσ,μ

(

𝑔

σν

𝑔

ρν

-

𝑔

μν

𝑔

ρσ

)

⎦,ρ

.


(10.3.12)


Последний член есть производная, поэтому его интегрирование в выражении для действия даёт в результате нуль, так что часто мы можем вполне обоснованно выбросить этот член из рассмотрения. Для многих задач будет достаточно записать действие как интеграл от первого члена, обозначаемого как 𝐻, так что


δ𝑆

𝑔

=-

1

2λ²

δ

𝑑⁴𝑥

𝐻

,


где


𝐻

=

-𝑔

𝑔

μν

Γ

ρ

νσ

Γ

σ

ρμ

-

Γ

ρ

μν

Γ

σ

ρσ


.


(10.3.13)


Теперь мы снова готовы построить квантовую теорию, после того как мы имеем теорию с эйнштейновской точки зрения. Эта теория является более полной, чем та, которую мы обсуждали с венерианской точки зрения - мы имеем полный лагранжиан, включающий взаимодействие с материей, и который оказывается правильным во всех порядках. Если мы ограничим наше рассмотрение вселенной, которая содержит только гравитационные поля и скалярную материю, то теория поля получается путём анализа разложений через константу взаимодействия:


𝑔

μν

=

η

μν

+

μν

.


(10.3.14)


В этом лагранжиане члены, которые квадратичны, соответствуют просто пропагаторам, члены, включающие в себя произведения двух φ и одного ℎ, и члены, включающие в себя три ℎ и два φ, соответствуют диаграммам, которые показаны на рис. 10.1. Таким путём мы приходим к предписанию для вычисления амплитуд квантовой механики для движения материи после того, как мы начали рассмотрение с геометрической точки зрения.

Фейнмановские лекции по гравитации

Рис. 10.1.

Когда придёт время, мы будем пользоваться классической теорией для того, чтобы обсудить движение классических моментов и обсудить космологические вопросы, и мы будем использовать квантовую теорию для того, чтобы вычислить излучение гравитационных волн. Третья альтернативная точка зрения на гравитацию будет представлена после того, как мы обнаружим пути, пользуясь которыми, мы приходим к выводу, что квантово-механическая теория запутывает нас.

Рассматривая эти члены в действии, мы могли бы проанализировать, почему полевое слагаемое может не включать в себя определённую пропорцию Λ величины ∫𝑑⁴𝑥√-𝑔. Эта величина должна быть интегралом, пропорциональным объёму Вселенной, который предположительно есть константа. Получившееся в результате уравнение для такого поля ведёт себя до некоторой степени так же, как если бы гравитоны имели массу и универсальный источник. Рассмотрение предельно большого радиуса действия гравитационных сил делает довольно бессмысленным введение такого слагаемого в действие, даже если бы это приводило к согласованной теории. Уравнения движения, получающиеся из подобного рассмотрения, есть


𝐺

μν

=

Λ𝑔

μν

+

λ²𝑇

μν

.


(10.3.15)


Постоянная Λ известна как ”космологическая постоянная”. Эйнштейн хотел, чтобы Вселенная была замкнутой, так что он определил эту постоянную как значение, которое допускает для такой Вселенной стационарные решения. Позднее Эйнштейн ссылался на введение космологической постоянной как на свою Великую Ошибку; хотя он выбрал её значение равным нулю, он мог бы придти к заключению, что Вселенная могла бы расширяться (или сжиматься). И только позднее Хабблом было открыто, что удалённые галактики движутся от нас и Вселенная расширяется. С того времени, как такое изменение эйнштейновской теории вселенной было введено, космология была ”испорчена” трудностями, связанными с определением значения космологической постоянной. Я согласен со второй гипотезой Эйнштейна и думаю, что значение Λ=0 является наиболее вероятным.

Лекция 11

11.1. Кривизна в окрестности сферической звезды

Теперь мы обратим внимание на нахождение решений уравнений Эйнштейна для некоторых случаев, которые представляют физический интерес. Оказывается, что имеется очень небольшое число наблюдений, связанных с гравитацией, которые не могут быть адекватно объяснены ньютоновской теорией гравитации, и имеются только два решения уравнений Эйнштейна, которые пытались найти.1 Одно из них есть решение, которое описывает гравитационное поле в окрестности звезды (которое должно точно определять отклонение луча света и прецессию орбиты Меркурия). Другое решение связано с описанием распределений массы, близких к однородным, и тем самым, это есть решение, которое представляет интерес при рассмотрении космологических моделей.

1 В настоящее время известно очень много точных решений уравнений Эйнштейна. Например, большое число точных решений можно найти а книге [КШМХ 82*]. (Прим. перев.)

Если мы предполагаем наличие сферической симметрии, мы ожидаем, что метрический тензор будет давать в результате выражение возможно следующего вида для квадрата интервала собственного времени


(𝑑𝑠)²

=

𝐴(𝑑𝑡)²

+

𝐵𝑑𝑟𝑑𝑡

-

𝐶(𝑑𝑟)²

-


-

𝐷

(𝑑θ)²

+

sin²θ

(𝑑φ)²

𝑟²

,


(11.1.1)


где символы 𝐴, 𝐵, 𝐶, 𝐷, обозначают функции, которые могут зависеть от координат (𝑟,𝑡) но не от (θ,φ). Такое решение допускает динамические решения, в которых движение материи является чисто радиальным.

Можно уменьшить число неизвестных функций, сделав разумный выбор новых координат. Например, заменим масштаб координаты 𝑟 согласно следующему правилу:


𝑟'

=

𝐷(𝑟,𝑡)

𝑟

,


(11.1.2)


получившееся в результате выражение (𝑑𝑠)² через 𝑟' и 𝑑𝑟' вместо 𝑟 и 𝑑𝑟 имеет тот же самый вид, но новая функция 𝐷 есть в точности 𝐷=1. Таким образом, функция 𝐷 оказывается излишней, так как 𝐷=1 соответствует нашей задаче без потери общности.

Второе преобразование делается путём замены масштаба времени. Мы положим


𝑡'

=

𝑡'(𝑡,𝑟)


(11.1.3)


Используя это преобразование, мы вводим новую функцию, которая может быть выбрана так, что коэффициент при произведении 𝑑𝑟𝑑𝑡' равен нулю. Это означает, что если положить 𝐵=0, то потери общности не происходит.

Обычно с этого места, чтобы продвинуться в вычислениях, принято работать не с функциями 𝐴 и 𝐶, а с новыми функциями ν и λ, которые определяются следующим образом:


𝐴

=

𝑒

ν

,

𝐶

=

𝑒

λ

,


(11.1.4)


(в этих обозначениях мы следуем Шварцшильду). Метрический тензор является диагональным, и если мы выберем обозначения индексов (1,2,3,4) для координат (𝑟,θ,φ,𝑡), то компоненты метрического тензора являются следующими:


𝑔₄₄

=

𝑒

ν

,

𝑔₁₁

=-

𝑒

λ

,

𝑔₂₂

=-

𝑟²

,

𝑔₃₃

=-

𝑟²

sin²θ

.


(11.1.5)


Поскольку тензор является диагональным, элементы обратного тензора являются обратными элементами соответствующих компонентов более точно имеем следующие выражения:


𝑔⁴⁴

=

𝑒

,

𝑔¹¹

=-

𝑒

,

𝑔²²

=-

1

𝑟²

,

𝑔³³

=-

1

𝑟²sin²θ

.


(11.1.6)


Теперь может быть проведено вычисление элементов тензора кривизны. Эти вычисления напрямую приводят к цели, однако они скучны и утомительны, поскольку в символах Кристоффеля имеется достаточно много производных и должно быть вычислено довольно много сумм.

Когда всё это проделано, то компоненты тензора кривизны могут быть вычислены через функции ν и λ и их производные по отношению ко времени 𝑡 и радиальной координате 𝑟. Для того, чтобы запись была более экономной, мы используем штрихи и точки для обозначения производных следующим образом:


ν'

=

∂ν

∂𝑟

,

ν̇

=

∂ν

∂𝑡

,


и т.д.


(11.1.7)


Точные выражения для тензора Римана являются следующими:


𝑅⁴²₄₁

=-

𝑒


1

2

ν''

+

1

4

(ν)²

-

1

4

λ'ν'

+

𝑒


1

2

λ̈

+

1

4

(λ̇)²

-

1

4

λ̇ν̇


𝑅⁴²₄₂

=

𝑅⁴³₄₃

=-

1

2𝑟

ν'𝑒


𝑅²¹₂₁

=

𝑅³¹₃₁

=

1

2𝑟

λ'𝑒


𝑅³²₃₂

=-

1

𝑟²


𝑒

-

1


𝑅⁴²₁₂

=

𝑅⁴³₁₃

=-

1

2𝑟

λ̇𝑒


(11.1.8)


Все остальные компоненты равны нулю, за исключением тех, которые могут быть получены тривиальной перестановкой индексов некоторого элемента в соотношениях (11.1.8).

11.2. О связи между материей и кривизной

Именно тензоры, которые выводятся из тензора кривизны, связаны с тензором энергии-импульса. Комбинации, включающие в себя тензор кривизны и необходимые нам в дальнейшем, есть следующие


𝐺

μ

ν

=

𝑅

μ

ν

-

1

2

𝑔

μ

ν

𝑅

.


(11.2.1)


Компоненты тензора 𝐺μν имеют довольно простое выражения через суммы элементов 𝑅μνστ. Например, диагональные элементы есть


𝐺⁴₄

=

𝑅¹²₁₂

+

𝑅¹³₁₃

+

𝑅²³₂₃

,


𝐺¹₁

=

𝑅⁴²₄₂

+

𝑅⁴³₄₃

+

𝑅³²₃₂

.


(11.2.2)


Другими словами, каждый из этих компонентов включает в себя сумму по таким элементам 𝑅μνστ, в индексы которых не включён диагональный индекс. Для недиагональных элементов мы также получаем очень простые выражения. Например,


𝐺⁴₁

=

𝑅²⁴₁₂

+

𝑅³⁴₁₃

,

𝐺²₁

=

𝑅³²₁₃

+

𝑅⁴²₁₄

,


(11.2.3)


и по аналогии с этими компонентами мы можем легко записать соответствующие выражения для других компонентов.

Простота выражений рассмотренных сумм может навести нас на мысль об интерпретации кривизны через характеристики распределения вещества. Мы ранее обсудили кривизну двумерной поверхности через относительное изменение длины окружности или площади круга по отношению к их величинам в плоском пространстве через измеренную величину их радиуса:


Длина окружности

=

2π𝑟

(1-

𝐾×

площадь)


(11.2.4)


где 𝐾 - коэффициент. Для трёхмерного мира изменение длины окружностей зависит от плоскости, на которой рисуются круги, о которых идёт речь, но можно определить среднюю кривизну посредством измерения отличия от 4π𝑟² площади сферы радиуса 𝑟. Получаемый результат должен быть следующим


площадь


=

4π𝑟²

1

+

1

9

𝑟²𝑅

,


(11.2.5)


где 𝑅 - скаляр, получаемый двойной свёрткой тензора кривизны.

Связь этой идеи с теорией гравитации может быть получена, если мы попытаемся придать концептуальное значение сумме 𝑅¹²₁₂+𝑅²³₂₃+𝑅¹³₁₃, что есть компонент тензора 𝐺⁴₄, который равен компоненту 44 тензора энергии-импульса.

Эта сумма есть в точности то, что мы должны называть средней кривизной трёхмерного пространства, которое перпендикулярно оси времени. Таким образом, мы можем дать словесную интерпретацию теории гравитации следующим образом: рассмотрим небольшую трёхмерную сферу с заданной площадью поверхности. Её действительный радиус превышает радиус, вычисляемый в евклидовой геометрии (√площадь/4π), на величину, которая пропорциональна количеству вещества внутри этой сферы (𝑟-√площадь/4π=𝐺/3𝑐²𝑚внутри) (один ферми на 4 миллиарда метрических тонн).

Эта интерпретация используется прямо для компонента 44, который есть плотность вещества (или энергии) для вещества внутри этой сферы. Другие компоненты тензора кривизны правильно выводятся, когда мы требуем, чтобы один и тот же результат получался в любой координатной системе независимо от её скорости.

11.3. Метрика Шварцшильда, поле вне сферической звезды

Выражения для компонентов тензора 𝐺μν через функции ν и λ являются следующими


𝐺⁴₄

=

1

𝑟

λ'𝑒

-

1

𝑟²

(𝑒

-1)

=

1

𝑟²


𝑑

𝑑𝑟


𝑟

(𝑒

-1)

,


𝐺¹₁

=-

1

𝑟

ν'𝑒

-

1

𝑟²

(𝑒

-1)

,


𝐺⁴₁

=

1

𝑟

λ̇𝑒

,


𝐺¹₄

=-

1

𝑟

λ̇𝑒

,


𝐺²₂

=

𝑒

2𝑟

(λ'-ν')

-

𝑒

4

(2ν''+(ν')²-λ'ν')

+


+

𝑒

4

(λ̈+(λ̇)²-λ̇ν̇)

.


(11.3.1)


Только выражение для компонента 𝐺²₂ является громоздким, но так происходит, что его точное выражение редко бывает необходимо использовать. Важное положение состоит в том, что дивергенция этого тензора должна быть равна нулю. Если мы имеем выражение для других компонентов, то требование обращения в нуль дивергенции часто помогает избежать использования точного выражения для 𝐺²₂. В этом месте могут быть предложены следующие упражнения.

Доказать, что если нет материи внутри сферы радиуса 𝑏 и распределение материи вне этой сферы является сферически симметричным, то пространство внутри сферы - плоское с метрикой 𝑔μνμν.

Доказать, что если тензор энергии-импульса 𝑇μν известен всюду внутри сферы радиуса 𝑏, то каким бы он ни был вне этой сферы, это не повлияет на физику внутри сферы радиуса 𝑏. (Предполагается, что вне этой сферы тензор энергии-импульса характеризуется сферически симметричным распределением.)

Решение вне сферически симметричного распределения массы получается, если мы положим 𝑇μν=0=𝐺μν и решим получившиеся дифференциальные уравнения.

Мы начнём с того, что заметим, что 𝐺⁴₄ зависит только от λ. Так как 𝐺⁴₄ равен нулю, то мы получаем


𝑟(𝑒

-1)

=

constant

=

-2𝑚

.


(11.3.2)


Множитель 2 взят для удобства, так что постоянная величина 𝑚 есть полная масса звезды, умноженная на ньютоновскую гравитационную постоянную. Если внутри сферы радиуса 𝑎, где находится вся масса, нет особенностей, то постоянная должна быть равна


𝑎

0

𝑑𝑟

𝑟²

𝐺⁴₄

=

2𝑚

.


(11.3.3)


Мы уверены, что зависимость от времени отсутствует, поскольку


𝐺¹₄

=

0

=-

1

𝑟

λ̇

𝑒

,


так что λ вообще не зависит от времени. Последняя задача состоит в том, чтобы получить выражение для ν. Мы делаем это, приравнивая 𝐺¹₁ и 𝐺⁴₄, так как обе эти величины равны нулю. Отсюда приходим к выводу, что


ν'

=-

λ'

,


(11.3.4)


которое может происходить только в том случае, если функция ν имеет следующий вид:


ν

=-

λ

+

ƒ(𝑡)

,


(11.3.5)


где ƒ(𝑡) - произвольная функция времени. Тем не менее, так как функция ν появляется в коэффициенте при величине (𝑑𝑡)² в метрике следующим образом:


𝑒

ν

(𝑑𝑡)²

=

𝑒

𝑒

ƒ(𝑡)

(𝑑𝑡)²

,


мы можем исключить множитель exp(ƒ(𝑡)), изменяя масштаб временной координаты. Другие элементы метрического тензора не изменяются при такой замене, так как в них включена только функция λ(𝑟). Полученный результат известен как метрика Шварцшильда


(𝑑𝑠)²

=

1

-

2𝑚

𝑟


(𝑑𝑡)²

-

(𝑑𝑟)²

1-2𝑚/𝑟

-

𝑟²

(

sin²θ(𝑑φ)²)

+

(𝑑θ)²

).


(11.3.6)


Интересно, что полученная метрика не зависит от времени, хотя мы никогда не говорили о том, что мы ищем статическое решение. Отсутствие зависимости от времени метрики Шварцшильда следует из предположения о сферической симметрии и того, что мы рассматриваем метрику в области с нулевой плотностью давления.

Для случая реальной звезды такой, как Солнце, точной сферической симметрии нет, поскольку имеется вращение и поскольку имеется утолщение (балдж) на экваторе. Тем не менее, эти отличия вызывают лишь небольшие отклонения от случая сферической симметрии. Если имеется световой поток от звезды, то будут появляться другие поправки, поскольку плотность энергии не будет равной нулю в пространстве вне звезды. Тем не менее, решение Шварцшильда достаточно точно описывает ситуацию с Солнцем, так что прецессия перигелия Меркурия задаётся правильно в пределах ошибок измерения.

11.4. Сингулярность Шварцшильда

Метрика, представленная в соотношении (11.3.6), имеет особенность при 𝑟=2𝑚. Для того, чтобы узнать, является ли эта особенность, причиняющей беспокойство и имеющей физический смысл, мы должны посмотреть, соответствует ли эта особенность физическому значению измеряемого радиуса от начала координат (что не есть то же самое, что наша координата 𝑟)


𝑅

=

ƒ(𝑟)

.


(11.4.1)


Мы получаем ответ, рассматривал эту метрику с использованием другого подхода. Мы могли бы предположить, что правильное описание сферически симметричной метрики должно было бы иметь следующий вид:


(𝑑𝑠)²

=

𝐻(𝑅)

(𝑑𝑡)²

-

𝐹(𝑅)

(

(𝑑𝑥)²

+

(𝑑𝑦)²

+

(𝑑𝑧)²

),


(11.4.2)


где 𝑅²=𝑥²+𝑦²+𝑧². Метрика Шварцшильда приводится к такому виду путём подстановки


𝑟

=

𝑅

+

𝑚²

4𝑅

+

𝑚

,


(11.4.3)


используя которую, получаем следующее выражение


(𝑑𝑠)²

=


⎝ 1 -

𝑚

2𝑅

⎞²

⎝ 1 +

𝑚

2𝑅

²


(𝑑𝑡)²

-

1

+

𝑚

2𝑅


⎞⁴

(

(𝑑𝑥)²

+

(𝑑𝑦)²

+

(𝑑𝑧)²

).


(11.4.4)


Особенность в интервале собственного времени исчезла. Мы видим, что это было следствием особенности в определении радиальной координаты 𝑟. Тем не менее, метрика (11.4.4) выделяет частное значение радиуса 𝑅=𝑚/2 как положение, в котором обращается в нуль коэффициент при (𝑑𝑡)². Нам ещё следует исследовать, что происходит с физическими процессами в этой точке.

Эти результаты не нуждаются ни в каком непосредственном наблюдательном следствии. Когда мы подставляем величины, соответствующие массе Солнца, мы находим, что такой критический радиус существовал бы, если бы масса Солнца была сосредоточена внутри сферы, имеющей радиус, равный всего 1.5 км. Тем не менее, хотя очевидно эта ситуация не будет иметь место в Солнечной системе, разумно исследовать это критическое значение радиуса как свойство нашей теории.

Физическая интерпретация этого особого значения радиальной координаты связана со скоростью, на которой процессы, происходящие вблизи Солнца, проявлялись бы для удалённых наблюдателей. Ранее мы вычислили, как свет из областей с более низким гравитационным потенциалом сдвигается вниз по частоте, так что все объекты выглядят краснее. Радиус 𝑅=𝑚/2 соответствует потенциалу, который настолько низок, что свет не был бы достаточно энергичен для того, чтобы покинуть звезду, так что никакой свет не достиг бы наблюдателя, который находится на большом расстоянии от звезды.

Мы можем увидеть, происходит ли что-либо катастрофическое с геометрией пространства в этой точке, в точности вычисляя компоненты тензора кривизны. Получено, что эти компоненты равны


𝑅¹²₁₂

=

𝑅¹³₁₃

=-

𝑚/𝑟³

,


𝑅²³₂₃

=

2𝑚/𝑟³

,


𝑅⁴¹₄₁

=

2𝑚/𝑟³

,


𝑅⁴²₄₂

=

𝑅⁴³₄₃

=-

𝑚/𝑟³

.


(11.4.5)


Мы видим, что пространство в этой критической точке - гладкое. Такая ”особенность ” не может быть ничем иным как результатом частного способа выбора координат. В нашем примере с жуком, ползающим по поверхности сферы, была особенность в описании сферы при пересечении экватора. Но конечно, в физическом смысле (предполагается, что) пространство является в точности таким же гладким в окрестности этой особенности, как всюду на действительной сфере.

Результат, который мы только что по