Необыкновенная формула доктора Эйлера [1 ed.] 9785970608234, 9780691118222

Пол Нахин признается, что к написанию этой книги его подтолкнуло «восхищение Эйлером не только как математиком, но и как

780 100 18MB

Russian Pages 406 Year 2020

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Необыкновенная формула доктора Эйлера [1 ed.]
 9785970608234, 9780691118222

  • Commentary
  • Vector PDF

Table of contents :
Содержание
Вступительное слово от издательства
О чем эта книга, что нужно знать для ее чтения и ПОЧЕМУ вам следует прочитать ее
Предисловие
Предисловие. Когда математика вошла в моду?
Введение
Глава 1. Комплексные числа
1.1. «Тайна» √-1
1.2. Теорема Кэли–Гамильтона и формула Муавра
1.3. Рамануджан находит сумму ряда
1.4. Поворот векторов и отрицательные частоты
1.5. Неравенство Коши–Шварца и знак «падение камней»
1.6. Правильные n-угольники и простые числа
1.7. Последняя теорема Ферма и разложение комплексных чисел на множители
1.8. Разрывный интеграл Дирихле
Глава 2. Путешествия в страну векторов
2.1. Обобщенное гармоническое блуждание
2.2. Полет птиц при дующем ветре
2.3. Параллельный бег
2.4. Кошки-мышки
2.5. Решение задачи о бегущей собаке
Глава 3. Иррациональность π²
3.1. Иррациональность p
3.2. Уравнение R(x) = B(x)ex + A(x), D-операторы, обратные операторы и коммутативность операторов
3.3. Нахождение A(x) и B(x)
3.4. Значение R(pi)
3.5. Последний шаг (наконец-то!)
Глава 4. Ряды Фурье­
4.1. Функции, колеблющиеся струны и волновое уравнение
4.2. Периодические функции и сумма Эйлера
4.3. Теорема Фурье­ для периодических функций и теорема Парсеваля
4.4. Разрывные функции, явление Гиббса и Генри Уилбрэхэм
4.5. Дирихле вычисляет квадратичную сумму Гаусса
4.6. Гурвиц и изопериметрическое неравенство
Глава 5. Интегралы Фурье­
5.1. Импульсная «функция» Дирака
5.2. Интегральная теорема Фурье­
5.3. Формула плотности энергии Рэлея, свертка  и автокорреляционная функция
5.4. Некоторые интересные спектры
5.5. Суммирование Пуассона
5.6. Взаимное распространение и принцип неопределенности
5.7. Харди и Шустер и их оптический интеграл
Глава 6
Глава 6. Электроника и √-1
6.1. Зачем нужна эта глава?
6.2. Линейные стационарные системы, свертка (снова), передаточные функции и каузальность
6.3. Теорема о модуляции, синхронные радиоприемники и как сделать речевой скремблер
6.4. Теорема дискретизации и умножение путем дискретизации и фильтрации
6.5. Еще о трюках, основанных на преобразовании Фурье­ и фильтрах
6.6. Односторонние преобразования, аналитический сигнал и однополосная радиосвязь
Эйлер – человек, математик и физик
Примечания
Благодарности
Предметный указатель

Citation preview

Пол Дж. Нахин

Необыкновенная формула доктора Эйлера

Dr. Euler's Fabulous Formula C U R E S M A N Y M AT H E M AT I CA L I L L S

PAUL J. NAHIN

PRINCETON UNIVERSITY PRESS PRINCETON AND OXFORD

Необыкновенная формула доктора Эйлера ИЗЛЕЧИВАЕТ МНОГИЕ М АТ Е М АТ И Ч Е С К И Е Н Е ДУ Г И

ПОЛ ДЖ. НАХИН

Москва, 2020

УДК 530.1 ББК 22.31 Н12

Н12

Нахин П. Дж. Необыкновенная формула доктора Эйлера  / пер. с англ. А. А. Слинкина. – М.: ДМК Пресс, 2020. – 406 с.: ил. ISBN 978-5-97060-823-4 Пол Нахин признается, что к написанию этой книги его подтолкнуло «восхищение Эйлером не только как математиком, но и как физиком и  инженером». На многочисленных примерах автор показывает, как одна из основных формул комплексного анализа – формула Эйлера, – являясь безупречным стандартом математической красоты, возникает в различных разделах математики, физики и техники. Доказательство иррациональности числа p, представление колебания струны на диа­ грамме, геометрия импульсной функции и даже создание речевого скремблера – все эти столь разные темы объединяет использование формулы великого математика. В заключительной части приводится биографическая справка об Эйлере, включающая малоизвестные факты из его жизни. Издание предназначено для широкого круга читателей – любителей математики и физики.

УДК 530.1 ББК 22.31 Original English language edition published by Princeton University Press 41 William Street, Princeton, New Jersey 08540. Copyright © 2006 by Princeton University Press. Russian­language edition copyright © 2020 by DMK Press. All rights reserved. Все права защищены. Любая часть этой книги не может быть воспро­ изведена в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав.

ISBN 978­0­691­11822­2 (анг.) ISBN 978­5­97060­823­4 (рус.)

© 2006 by Princeton University Press © Оформление, издание, перевод, ДМК Пресс, 2020

Посвящается Патрисии Энн, прекрасной и удивительной, как формула Эйлера

В юношеском дневнике за апрель 1933 года, незадолго до своего пятнад­ цатого дня рождения, Ричард Фейнман (1918–1988), будущий лауреат Но­ белевской премии по физике, оставил заметку, относящуюся к основной теме этой книги. Обратите внимание на разложение в ряд экспоненты, синуса и косинуса – сразу под фразой «most remarkable result in math» («Самый замечательный результат в математике». – Прим. перев.). На сле­ дующей строке начинается стандартный вывод формулы Эйлера (ее еще называют тождеством Эйлера) eiu = cos(u) + i sin(u), из которой «замечатель­ ный результат» получается, если положить u  = p. (В качестве источника Фейнман пользовался десятитомным справочником «The Science History of the Universe», впервые опубликованным в 1909 году.) Хотя Фейнман за­ помнился в первую очередь как физик, он был еще и талантливым мате­ матиком, и в книге «Характер физических законов» (1965) писал: «Тем, кто не знает математики, трудно постичь подлинную, глубокую красоту природы… Если вы хотите узнать Природу, оценить ее красоту, то нуж­ но понимать язык, на котором она разговаривает». Фейнман, безусловно, согласился бы с одним из рабочих названий этой книги: «Комплексные числа реальны!» (фотография публикуется с разрешения отдела архивов Калифорнийского технологического института.)

Да простит мне Бог, наблюдающий за правильным употреблением математических символов – в рукописи, в печати и на доске, – этот и многие другие мои грехи. Герман Вейль, с 1933 по 1952 год профессор математики в Институте перспективных исследований, цитата из книги «Классические группы», Принстон, 1946, стр. 289. Книга была издана в СССР: Вейль Г. Классические группы. Их инварианты и представления / пер. Д. А. Райкова. М.: ГИИЛ, 1947. С. 387.

Содержание

Вступительное слово от издательства ......................................... 10 О чем эта книга, что нужно знать для ее чтения и ПОЧЕМУ вам следует прочитать ее........................................... 12 Предисловие. Когда математика вошла в моду? ................... 15 Введение ................................................................................................... 20 Глава 1. Комплексные числа ............................................................ 32

1.1. 1.2. 1.3. 1.4. 1.5. 1.6. 1.7.

«Тайна» –1 .......................................................................................... 32 Теорема Кэли–Гамильтона и формула Муавра ................................. 38 Рамануджан находит сумму ряда ....................................................... 47 Поворот векторов и отрицательные частоты .................................... 53 Неравенство Коши–Шварца и знак «падение камней» .................... 57 Правильные n­угольники и простые числа ....................................... 62 Последняя теорема Ферма и разложение комплексных чисел на множители ...................................................................................... 72 1.8. Разрывный интеграл Дирихле ............................................................ 82

Глава 2. Путешествия в страну векторов .................................... 87

2.1. 2.2. 2.3. 2.4. 2.5.

Обобщенное гармоническое блуждание ........................................... 87 Полет птиц при дующем ветре ........................................................... 90 Параллельный бег ................................................................................ 93 Кошки­мышки ................................................................................... 102 Решение задачи о бегущей собаке.................................................... 108

Глава 3. Иррациональность p2 ...................................................... 111

3.1. Иррациональность p.......................................................................... 111 3.2. Уравнение R(x) = B(x)ex + A(x), D­операторы, обратные операторы и коммутативность операторов ................... 114 3.3. Нахождение A(x) и B(x) ...................................................................... 120 3.4. Значение R(pi) .................................................................................... 125 3.5. Последний шаг (наконец­то!) ........................................................... 130

СОДЕРЖАНИЕ

9

Глава 4. Ряды Фурье........................................................................... 132 4.1. Функции, колеблющиеся струны и волновое уравнение................ 132 4.2. Периодические функции и сумма Эйлера ....................................... 147 4.3. Теорема Фурье для периодических функций и теорема Парсеваля ........................................................................................... 157 4.4. Разрывные функции, явление Гиббса и Генри Уилбрэхэм ............. 180 4.5. Дирихле вычисляет квадратичную сумму Гаусса............................ 190 4.6. Гурвиц и изопериметрическое неравенство ................................... 197 Глава 5. Интегралы Фурье ............................................................... 203 5.1. Импульсная «функция» Дирака ........................................................ 203 5.2. Интегральная теорема Фурье ........................................................... 214 5.3. Формула плотности энергии Рэлея, свертка  и автокорреляционная функция ...................................................... 221 5.4. Некоторые интересные спектры ...................................................... 240 5.5. Суммирование Пуассона ................................................................... 260 5.6. Взаимное распространение и принцип неопределенности........... 268 5.7. Харди и Шустер и их оптический интеграл ..................................... 278 Глава 6. Электроника и  –1 ............................................................ 290 6.1. Зачем нужна эта глава? ..................................................................... 290 6.2. Линейные стационарные системы, свертка (снова), передаточные функции и каузальность .......................................... 291 6.3. Теорема о модуляции, синхронные радиоприемники и как сделать речевой скремблер ..................................................... 305 6.4. Теорема дискретизации и умножение путем дискретизации и фильтрации ..................................................................................... 317 6.5. Еще о трюках, основанных на преобразовании Фурье и фильтрах.......................................................................................... 321 6.6. Односторонние преобразования, аналитический сигнал и однополосная радиосвязь .............................................................. 322 Эйлер – человек, математик и физик ........................................ 340 Примечания ........................................................................................... 363 Благодарности ...................................................................................... 401 Предметный указатель ..................................................................... 403

Вступительное слово от издательства

Отзывы и пожелания Мы всегда рады отзывам наших читателей. Расскажите нам, что вы думаете об этой книге – что понравилось или, может быть, не понравилось. Отзывы важны для нас, чтобы выпускать книги, ко­ торые будут для вас максимально полезны. Вы можете написать отзыв на нашем сайте www.dmkpress.com, зайдя на страницу книги и оставив комментарий в разделе «Отзы­ вы и рецензии». Также можно послать письмо главному редактору по адресу [email protected]; при этом укажите название книги в теме письма. Если вы являетесь экспертом в  какой­либо области и  заинте­ ресованы в  написании новой книги, заполните форму на нашем сайте по адресу http://dmkpress.com/authors/publish_book/ или на­ пишите в издательство по адресу [email protected].

Список опечаток Хотя мы приняли все возможные меры для того, чтобы обеспечить высокое качество наших текстов, ошибки все равно случаются. Если вы найдете ошибку в одной из наших книг – возможно, ошиб­ ку в  основном тексте или программном коде, – мы будем очень благодарны, если вы сообщите нам о ней. Сделав это, вы избавите других читателей от недопонимания и  поможете нам улучшить последующие издания этой книги. Если вы найдете какие­либо ошибки в коде, пожалуйста, сооб­ щите о  них главному редактору по адресу [email protected], и мы исправим это в следующих тиражах.

ВСТУПИТЕЛьНОЕ СЛОВО ОТ ИЗДАТЕЛьСТВА

11

Нарушение авторских прав Пиратство в  интернете по­прежнему остается насущной пробле­ мой. Издательство «ДМК Пресс» очень серьезно относится к вопро­ сам защиты авторских прав и лицензирования. Если вы столкне­ тесь в интернете с незаконной публикацией какой­либо из наших книг, пожалуйста, пришлите нам ссылку на интернет­ресурс, что­ бы мы могли применить санкции. Ссылку на подозрительные материалы можно прислать по адре­ су [email protected]. Мы высоко ценим любую помощь по защите наших авторов, благодаря которой мы можем предоставлять вам качественные материалы.

О чем эта книга, что нужно знать для ее чтения и ПОЧЕМУ вам следует прочитать ее

Все сколько­нибудь важное основано на математике. – Роберт Хайнлайн. «Звездный десант» (1959)

Несколько лет назад издательство Принстонского университета выпустило мою книгу «An Imaginary Tale: The Story of » (1998), в которой описано мучительно долгое и непростое открытие ком­ плексных чисел. Будучи по духу исторической, та книга все же со­ держала много математики. На самом деле так много, что мне при­ шлось опустить ее, иначе книга оказалась бы в два раза толще. Так вот, эта книга – та самая «вторая половина», которую я вынужден был опустить в 1998 году. Здесь тоже есть кое­какие исторические сведения, но акцент сделан на более продвинутых математиче­ ских рассуждениях (впрочем, не выходящих за пределы очерчен­ ного ниже уровня подготовки), на тех вещах, которые, на мой взгляд, было бы справедливо назвать «завлекательной стороной» комплексных чисел. Конечно, обе книги в чем­то пересекаются, но всюду, где возможно, я старался ссылаться на «An Imaginary Tale» (AIT) и не повторяться. Для чтения этой книги необходима математическая подготовка в объеме двух курсов технического или физического вуза. То есть два года изучения математического анализа, один курс по диф­ ференциальным уравнениям и, пожалуй, предварительное зна­ комство с  матричной алгеброй и  элементарной теорией вероят­

О ЧЕМ ЭТА КНИГА, ЧТО НУЖНО ЗНАТь ДЛЯ ЕЕ ПРОЧТЕНИЯ

13

ностей. Студенты третьего курса математических специальностей, безусловно, имеют необходимые знания! Признаю, что эти требо­ вания оставляют за бортом немало читателей, имеющих хорошее образование в  других областях. Такие люди обычно разделяют взгляды британского премьер­министра Уинстона Черчилля, ко­ торый в своей автобиографии «Мои ранние годы» писал: «Однажды я прочувствовал математику, словно обозрел ее всю, все ее глубины раскрылись передо мной, вся ее бездонность. Подобно тому как многие наблюдают за прохождением Венеры или шествием лорда­мэра, я наблюдал за полетом величины через бесконечность и сменой ее знака с плюса на минус. Я понял, почему это происходит и как один шаг влечет за собой все другие. Похоже на политику. Но озарение пришло после плотного ужина – и мне было не до него!»

Уверен, Черчилль пытался пошутить, но другие, столь же откро­ венно признающие незнание математики, похоже, не слишком обеспокоены этим. Взять, к  примеру, рецензию известной писа­ тельницы Джойс Кэрол Оутс на роман Э. Л. Доктороу «Град Божий» (New York Review of Books, March 9, 2000, p. 31). Оутс (профессор Принстонского университета и лауреат Пулитцеровской премии) писала: «Науки о  Вселенной и  дисциплины, основным языком которых является математика, а  не обычная речь, непостижимы даже неплохо образованному нематематику». Не согласен с этим. Разве полное невежество в предмете, который каждый год препо­ дают миллиону первокурсников и второкурсников колледжей (мате­ матики на уровне этой книги), не должно заставить хоть немного задуматься? Не согласятся с  Оутс и  некоторые ее коллеги по литературно­ му цеху. Новеллист Ребекка Голдштейн писала в 1993 году в своей книге «Strange Attractors»: «Математика и музыка – языки, на ко­ торых разговаривает Бог. Говоря на них, … вы говорите напрямую с Богом». Мне также приходят на ум такие великие американские поэты прошлого, как Генри Лонгфелло и Эдна Сент­Винсент Мил­ лей. Это Миллей принадлежит часто цитируемая строка из сбор­ ника сонетов 1923 года «The Harp­Weaver»: «Один Евклид взирал на Красоту без маски». Но именно Лонгфелло уже давным­давно предельно откровенно ткнул пальцем в тот пробел в знаниях, кото­ рый без тени смущения признают многие образованные в осталь­ ных отношениях умы. В первых абзацах главы 4 романа «Кавана», написанного в 1849 году, мечтательный и погруженный в размыш­

14

О ЧЕМ ЭТА КНИГА, ЧТО НУЖНО ЗНАТь ДЛЯ ЕЕ ПРОЧТЕНИЯ

ления школьный учитель мистер Черчилль и его жена Мэри ведут такую беседу в его кабинете: – Я вот [говорит Мэри] не понимаю, как можно сделать математику поэтической. Нет в ней никакой поэзии. – А  [восклицает мистер Черчилль], это огромная ошибка! В  науке о  числах есть что­то божественное. Подобно Господу, она вмещает море в сложенной горсти. Она измеряет землю, взвешивает звезды, освещает Вселенную; она – закон, порядок и красота. А мы вообра­ жаем – по крайней мере, большинство из нас, – будто ее высшее до­ стижение и последний предел – двойная запись в бухгалтерии. Мы так преподаем – потому она и кажется такой прозаичной.

И вы, раз уж читаете эту книгу, конечно, оцените и согласитесь со словами этого мистера Черчилля!

ПРЕДИСЛОВИЕ Когда математика вошла в моду?

Этот вопрос, заданный в  редакционной статье[1] газеты «Бостон Глоб» за 2002 год, отражает тот факт, что идея красоты в матема­ тике перекочевала из замкнутого населенного преимущественно мужчинами мира покуривающих трубку и  потягивающих шерри математиков в  твидовых пиджаках и  вельветовых брюках, со­ бирающихся на свой еженедельный послеполуденный семинар в колледже, в «реальный мир» водителей грузовиков, подростков и пенсионеров, которые хотят немного поразвлечься дождливым вечерком. Вы поймете, что я имею в виду, если посмотрите фильм «Человек­паук 2» (2004), а точнее небрежное замечание Тоби Магу­ айра в роли голливудского супергероя о найденном Бернулли ре­ шении знаменитой задачи о кривой скорейшего спуска под дей­ ствием силы тяжести. Аргументируя свое заявление, редакционная статья в  «Глоб» приводит цитаты из трех пьес и одного фильма как примеры это­ го знаменательного интеллектуального сдвига. В пьесе «Копенга­ ген» мы видим театральную постановку спора между физиками Нильсом Бором и Вернером Гейзенбергом о квантовой механике. Гейзенберг, в  честь которого назван принцип неопределенности в  природе (мы обсудим его в  главе 5), в  какой­то момент своего первоначального осмысления новой квантовой теории говорит: «Мир чисто математических конструкций. Я слишком возбужден, не могу спать». Затем он, согласно описанию в «Глоб», «при первых лучах восхода выбегает на берег моря и взбирается на выступаю­ щую в море скалу, о которую бьется прибой». Напоминает сцену, которую все мы не раз видели в фильмах 1930–1940­х годов, как раз перед тем (или после того), как героиню укладывают в постель. Эротическую связь между математическим озарением и оргазмом просто невозможно отрицать[2].

16

ПРЕДИСЛОВИЕ. КОГДА МАТЕМАТИКА ВОШЛА В МОДУ?

Затем автор статьи переходит к обсуждению пьес «Доказатель­ ство» (в которой зубодробительные формулы аттестуются как «красивые»), «Q.E.D.»* (о физике­теоретике Ричарде Фейнмане, который часто говорил об удивительном свойстве математики оказываться корнем любой осмысленной интерпретации приро­ ды) и о получившем Оскар в 2001 году фильме Рона Ховарда «Игры разума». Это фильм о  жизни математика из Принстонского уни­ верситета Джона Нэша, несколько искаженной взглядом художни­ ка. Он был признан лучшим голливудским фильмом, потому что смог рассказать неискушенной публике (начиная с тинейджеров), в чем заключалась работа Нэша по теории игр. Странно, что «Глоб» не упомянула фильм 1997 года «Умница Уилл Хантинг» (странно, потому что в фильме играли Бен Аффлек и Мэтт Даймон, оба ро­ дом из Бостона), в котором в первых кадрах на экране строка за строкой появляются интегральные уравнения Фурье. В этом филь­ ме, тоже получившем Оскара, главным героем является математи­ ческий гений, работающий ночным уборщиком в Массачусетском технологическом институте. В  фильме «Проклятый путь» (2002) киллер, которого играет Том Хэнкс, одержим отрицанием идеи о красоте математики и находит общий язык со своим сыном на почве ненависти к математике. Но, как любят говорить поэты, лю­ бовь и ненависть – две стороны одной медали, и математика даже в этом полном насилия фильме становится эмоциональной связу­ ющей нитью между двумя мужчинами. Но еще раньше примеров, упомянутых в  «Глоб», математики играли заметные роли в  целом ряде известных фильмов[3]. По­ смотрите такие фильмы, как «Соломенные псы» (1971) , «Теперь мой ход» (1980), «Выстоять и сделать» (1987), «Тихушники» (1992), «У зеркала два лица» (1996), «Контакт» (1997), «Пи» (1998) и «Эниг­ ма» (2002), – и вы согласитесь с «Глоб» – математика (которую часто приравнивали к крайней степени эксцентричности) действительно вошла в моду! Даже телевидение не осталось в стороне – в 2005 го­ ду вышел сериал «4исла» (англ. «Numb3rs»), где главными героями являются агент ФБР и  его брат  – математический гений, помо­ гающий раскрывать преступления (техническим консультантом фильма был профессор математики из Калтеха, а многочисленные «атмосферные» сцены были призваны воспроизвести дух, царя­ щий в научном сообществе). *

Что и требовалось доказать. – Прим. перев.

ПРЕДИСЛОВИЕ. КОГДА МАТЕМАТИКА ВОШЛА В МОДУ?

17

«Глоб» полагала, что такое проникновение математики в  поп­ культуру произошло, потому что «притягательность математики и науки в том, что они апеллируют к познанию непостижимого». Включение науки в эту фразу само по себе любопытно, потому что многие физики считают вершиной красоты уравнения (обратите внимание на множественное число) эйнштейновской теории гра­ витации. Для них источником красоты является не математика как таковая, а  элегантное выражение физической реальности в  виде уравнений. Для них математика  – зримая плоть, это правда, но только физика – душа – и источник – красоты. Один из лауреатов Нобелевской премии по физике 1933 года, Поль Дирак, – выдаю­ щийся представитель этой точки зрения. Дирак (1902–1984) из­ вестен многими замечаниями по поводу красоты в технике[4]; на­ пример, в ответ на вопрос (заданный в 1955 году в Москве) о его взглядах на философию физики он написал на доске «Физические законы должны обладать математической красотой». Эту доску до сих пор российские физики хранят как дань уважения. Конечно, по мере того как физики узнают больше о физике, их уравнения меняются. Никто, даже Эйнштейн, не защищен от этой эволюции. Как гравитационная теория Ньютона уступила место эйнштейновской, так и теория Эйнштейна должна будет уступить место новым идеям, совместимым – в отличие от уравнений Эйн­ штейна  – с  квантовой механикой. Таким образом, эйнштейнов­ ская физика на некотором фундаментальном и  очень глубоком уровне «неверна» (или, более вежливо, «ей чего­то недостает») и, стало быть, корректна лишь приближенно. Но означает ли это, что математическая красота уравнений теории Эйнштейна куда­то пропала? Я так не думаю. Во введении я  расскажу о  воззрениях разных авторов на то, что делает теории (и их уравнения) красивыми, но один момент там не упомянут, потому что здесь для этого более подходящее место. Я  полагаю, что теория Эйнштейна сохраняет красоту, хотя, как мы теперь знаем, она не вполне корректна, по той причине, что стала результатом дисциплинированных рассуж­ дений. Да, Эйнштейн создал новую физику, но сделал он это не как придется. Он выстраивал свою теорию в рамках строгих огра­ ничений. Например, физические законы природы должны быть одинаковы для всех наблюдателей, независимо от их движения во Вселенной. Я думаю, что теория, удовлетворяющая такому широ­ кому ограничению, просто обязана быть красивой.

18

ПРЕДИСЛОВИЕ. КОГДА МАТЕМАТИКА ВОШЛА В МОДУ?

Уродливы, на мой взгляд, те теории или картины, которые не подчиняются никаким ограничениям, в основе которых нет дис­ циплины. Например, только по этому критерию я ставлю Нормана Рокуэлла выше Джексона Поллока как художника. Без сомнения, это вызовет чуть ли не смертельные конвульсии у большинства це­ нителей современного искусства, которые обзовут меня культур­ ным неандертальцем (так считает моя жена, занимающаяся исто­ рией искусств), но всякий, кто, увидев результат расплескивания краски по холсту[5], – а этим каждый день занимаются двухлетние ребятишки в тысячах детских садов (да что там, я и сам делаю то же самое, когда крашу потолок!) – назовет это искусством, боль­ ше того  – изящным искусством, страдает галлюцинациями или, по крайней мере, сильно дезориентирован (по моему скромно­ му мнению). Чтобы уж довести свою точку зрения до логическо­ го завершения, я захожусь от смеха, воображая себе поклонников Джексона Поллока, которые в  священном восторге разражаются возгласами при виде хаоса, образуемого краской, капающей на пол Сикстинской капеллы, не обращая внимания на роспись по­ толка, выполненную Микеланджело методично, умело и  дисцип­ линированно. Поклонники Поллока могут возразить мне, сказав, что его работы красивы, потому что он все­таки придерживался дисциплины – «дисциплины» никогда не быть связанным дисцип­ линой! Я слыхал такой аргумент и прежде от студентов колледжа и признаюсь, что пока не нашел на него достойного ответа, кроме закатывания глаз. В этой книге золотым стандартом математической красоты яв­ ляется одна из основных формул комплексного анализа – формула Эйлера, т. е. тождество eiq = cos(q) + i sin(q), где i = . В частности, при q = p получается формула eip = -1, или, как ее обычно запи­ сывают, eip + 1 = 0. Мне кажется, что это компактное выражение – квинтэссенция красоты. Я нахожу тождество eip + 1 = 0 красивым, потому что оно справедливо даже при наличии очень сильного по­ тенциального ограничения. Равенство точное; левая часть не «поч­ ти» и не «приблизительно» равна 0, она равна нулю в точности. Тот факт, что пять чисел, каждое из которых было открыто абсолютно независимо от других и роль которых в математике невозможно переоценить, оказываются связаны таким простым соотношени­ ем, – это чудо. Это красиво. И в отличие от физики, химии или тех­ ники наших дней, которые почти наверняка покажутся архаичны­ ми инженерам в далеком будущем, формула Эйлера по­прежнему

ПРЕДИСЛОВИЕ. КОГДА МАТЕМАТИКА ВОШЛА В МОДУ?

19

будет казаться даже самым премудрым математикам, ушедшим от нас на десятки тысяч лет вперед, красивой и вызывающей восхи­ щение, нисколько не потускневшей от времени. Великий немецкий математик Герман Вейль (1885–1955) однаж­ ды заявил, наполовину в шутку: «В своей работе я всегда стремил­ ся объединить истину с красотой, но если нужно выбирать между тем и  другим, я  обычно выбираю красоту». Не бросайте книгу, и я попытаюсь продемонстрировать, что имел в виду Вейль, пока­ зав по­настоящему красивые (сексапильные?) вычисления с ком­ плексными числами, многие из которых основаны в том числе и на формуле Эйлера.

Введение

Как сонет Шекспира, выражающий самую сущность любви, как картина, обнажающая красоту человеческого тела, от­ нюдь не ограничиваясь поверхностным впечатлением, так формула Эйлера проникает в самые глубины бытия. – Кит Девлин о формуле eip + 1 = 0[1]

Живший в XIX веке математик из Гарвардского университета Бен­ джамин Пирс (1809–1880) производил сильное впечатление на студентов. Один из них спустя много лет после смерти Пирса пи­ сал: «Появление профессора Бенджамина Пирса, с длинной гривой седых волос, растрепанной бородой с проседью и глазами, необыч­ но ярко блестевшими из­под мягкой фетровой шляпы, когда он быстро, но не слишком грациозно пересекал двор колледжа, очень точно отвечало бытующему среди нас мнению, что мы лицезрим настоящего живого гения, в облике которого присутствуют черты пророка»[2]. Тот же самый бывший студент далее вспоминает, что во время одной лекции «он вывел соотношение, связывающее p, e и i, , которое, очевидно, сильно занимало его воображение»[3]. Он уронил мелок и тряпку, сунул руки в карманы, несколько минут созерцал формулу, а затем обернулся к аудитории и очень медлен­ но и  внушительно сказал: «Джентльмены, вне всяких сомнений, эта формула абсолютно парадоксальна, мы не понимаем ее и  не можем осознать, что она означает, но мы ее доказали, а значит, она должна быть истинной». Как всякий хороший преподаватель, Пирс почти наверняка стре­ мился к драматичности («Мы едва могли следовать за его мыслью, но сели попрямее и приняли к сведению»), но с этими словами он

ВВЕДЕНИЕ

21

зашел слишком далеко. Конечно, мы можем понять то, что Пирс всегда называл «таинственной формулой», и, безусловно, знаем, что она означает. И тем не менее она остается чудесным и очень красивым выражением, и, сколь бы хорошо мы ее ни «понимали», это не уменьшает восторг, испытываемый при взгляде на нее. Как говорится в одном лимерике (эту стихотворную форму математи­ ки особенно любят): e raised to the pi times i, And plus 1 leaves you nought but a sigh. This fact amazed Euler That genius toiler, And still gives us pause, bye the bye*. В этом лимерике затрагивается сразу несколько предметов, которые нам вскоре предстоит обсудить. Что такое e, пи и i, и кто такой Эйлер? Мне трудно поверить, что в мире найдется хотя бы один грамотный человек, никогда не слышавший о трансцендент­ ных числах e = 2.71828182… и pi = p = 3.14159265… и о мнимом числе i = . Что касается Эйлера, то он, безусловно, был одним из величайших математиков всех времен и  народов. Составлять списки «величайших» сегодня стало модно, и я готов побиться об заклад, что в списке, составленном любым современным матема­ тиком, уроженец Швейцарии Леонард Эйлер (1707–1783) занял бы одно из первых пяти мест (конкуренцию ему составили бы Архи­ мед, Ньютон и Гаусс, но оцените, какова компания!). Ну а теперь, прежде чем пускаться в объяснение особенностей e, p и  , не сказать ли пару слов о дерзком заявлении, которое я по­ зволил себе в предисловии, назвав выражение eip + 1 = 0 «квинтэс­ сенцией красоты»? Это не пустые слова, и на самом деле у меня есть «официальное право» на такое мнение. В номере ежеквартального журнала Mathematical Intelligencer, спонсируемого престижным из­ дательством книг и журналов по математике Springer­Verlag, вы­ шедшем осенью 1988 года, было открыто голосование за самую красивую математическую теорему. Читателей Intelligencer, а едва *

e, возведенное в степень пи ай, Плюс 1 будет ноль, чистый ноль – проверяй. Эйлер был в изумленье. С его­то уменьем, Да и мы до сих пор говорим только «вай». – Прим. перев.

22

ВВЕДЕНИЕ

ли не все они – математики, работающие в академических учреж­ дениях и  в  промышленности, попросили выставить 24 теоремам из предложенного списка оценки от 0 до 10, причем 10 означала «наиболее красивая», а 0 – «наименее красивая». Помимо eip + 1 = 0, в список входили такие основополагающие теоремы, как: (a) множество простых чисел бесконечно; (b) не существует рационального числа, квадрат которого ра­ вен 2; (c) число p трансцендентно; (d) любое непрерывное отображение замкнутого единичного круга в себя имеет неподвижную точку. Выдающийся список, ничего не скажешь. Результаты 68 полученных ответов были объявлены в  летнем выпуске за 1990 год. Максимальную среднюю оценку 7.7 получило уравнение eip + 1 = 0. Для сравнения: теорема (a) получила оцен­ ку 7.5, (b) – 6.7, (c) – 6.5 и (d) – 6.8. Наименьшую среднюю оценку 3.9 получил результат из теории чисел, доказанный гениальным индийским математиком Рамануджаном. Итак, вот официальный вывод: eip + 1 = 0 – самое красивое уравнение в математике! (Наде­ юсь, читатели в большинстве своем понимают, что я говорю это не всерьез, и не будут заваливать меня гневными письмами с объяс­ нением того, почему их любимое уравнение не в пример красивее.) Конечно, приведенные выше формулировки несколько небреж­ ны, ведь eip + 1 = 0 вообще­то не уравнение. Уравнением (с одной переменной) называется математическое выражение вида f(x) = 0, например x2  + x  - 2  = 0, которое истинно лишь для некоторых значений переменной, а именно для решений уравнения. Так, для приведенного выше квадратного уравнения f(x) обращается в ноль только при x = -2 и x = 1. Однако в выражении eip + 1 = 0 нет ника­ кого x, так что это не уравнение. Но это и не тождество, как, напри­ мер, тождество Эйлера eiq = cos(q) + i sin(q), где q – произвольный угол, а не только p радиан. Действительно, тождеством (с одной переменной) называется утверждение, верное для любого значе­ ния переменной. Но в выражении eip + 1 = 0 вообще нет перемен­ ных, а только пять констант. (Тождество Эйлера – главное в этой книге, и мы докажем его в главе 1.) Итак, eip + 1 = 0 и не уравнение, и не тождество. Тогда что же это? Это формула или теорема. Но нам важнее не семантика, а вопрос, поднятый мной в пре­ дисловии, – красота. Что могли бы означать слова о том, что мате­

ВВЕДЕНИЕ

23

матическое утверждение «красиво»? На этот вопрос я отвечаю так: что могли бы означать слова о том, что спящий котенок, парящий орел, лошадь, скачущая во весь опор, или смеющийся ребенок, или … красивы? Самый простой ответ – красота в глазах смотрящего (полагаю, это и  есть окончательное «объяснение» популярности капельных картин Джексона Поллока), но я  думаю (по крайней мере, в  математическом смысле), что можно копнуть и  глубже. Например, автор опроса в Intelligencer (Дэвид Уэллс, автор многих популярных работ по математике) внес несколько хороших пред­ ложений о том, что делает математическое выражение красивым. Чтобы считаться красивым, пишет Уэллс, математическое ут­ верждение должно быть простым, кратким, важным и очевидным, когда оно уже высказано, но таким, что мимо него легко пройти, т. е. неожиданным. (Похожий перечень ранее был сформулирован Э. Х. Хантли (H. E. Huntley) в вышедшей в 1970 году книге «The Di­ vine Proportion»*.) Я думаю, что тождество Эйлера (и следствие из него, eip  + 1  = 0) удовлетворяет всем четырем критериям, и  по­ лагаю, что, прочитав книгу до конца, вы будете думать так же. Но с этим согласны не все, что не должно вызывать удивления – с  любым утверждением кто­нибудь да не согласен! Например, французский математик Франсуа Ле Лионне (François Le Lionnais) (1901–1984) начал с высокой оценки, написав, что eip + 1 = 0 …устанавливает между важными для математики числами 1, p и  e [по какой­то причине Ле Лионне опустил числа 0 и i] связь, которая в свое время казалась фантастической. Было общепризнано, что это «самая важная формула в математике»[4].

Но затем следует неожиданная развязка, тортом в лицо: «В наши дни внутренние причины такой взаимосвязи стали настолько оче­ видны [!], что эта формула кажется если не малосодержательной, то, по крайней мере, совершенно естественной». Что ж, позавидуем Франсуа и  его великому дару провидения (или лучше сказать, заднему уму?), но подобное утверждение мы с полным правом можем встретить с таким же скептицизмом, ка­ кой выказывает большинство математиков, когда кто­то говорит, что способен «видеть геометрические формы в  четвертом изме­ рении». Это ему только кажется. Он, конечно, «видит что­то», не будем спорить, но я  сильно сомневаюсь, что видит он истинную *

Божественная пропорция. – Прим. перев.

24

ВВЕДЕНИЕ

геометрию гиперпространства. Когда вы прочтете эту книгу до конца, формула eip + 1 = 0 станет для вас «очевидной», но назвать ее малосодержательной? Да никогда! В этот момент для полноты картины я должен упомянуть вели­ кого английского математика Г. Х. Харди (G. H. Hardy) (1887–1947), у  которого был очень странный взгляд на красоту в  математике: чтобы быть красивой, математика должна быть бесполезной! Это условие недостаточно, но крайний пурист Харди считал его необ­ ходимым. Это эпатажное утверждение он высказал в  своей зна­ менитой книге «Апология математика», вышедшей в  1940 году. Я не могу поверить, что сегодня найдется математик (хоть какой пурист), который разделил бы высокомерие Харди. На самом деле я думаю, что хорошо известный интерес Харди к рядам и интегра­ лам Фурье, т. е. к той области математики, без которой к 1940 го­ ду уже не могли обходиться практические, «с грязью под ногтями» инженеры­электрики (мы убедимся в этом в главах 5 и 6), сам по себе доказывает, что эти слова были неправдой даже в тот момент, когда он их писал. Продолжая разговор о  странных воззрениях Харди на этот предмет, скажу, что он называл физиков Джеймса Клерка Максвелла (1831–1879) и  Дирака «настоящими» матема­ тиками. Это забавно, потому что уравнения электромагнитного поля Максвелла – как раз то, что делает возможными еще как по­ лезные радиоустройства и сотовые телефоны, а Дирак очень ценил свое обучение на факультете электротехники, считая, что имен­ но оно вдохновило его на очень нестрогое введение импульсной «функции»* в квантовую механику[5]! В качестве контрапункта математической красоты будет, навер­ ное, полезно привести хотя бы краткий пример математического уродства. Рассмотрим данное в 1976 году «доказательство» теоре­ мы о  четырех красках для планарных карт. Теорема утверждает, что четырех красок необходимо и достаточно для раскраски любой планарной карты, так чтобы страны, имеющие общую границу, были разного цвета[6]. Эта проблема, поставленная в 1852 году, не поддавалась никаким атакам, пока два математика из Иллиной­ ского университета не запрограммировали компьютер для ав­ томатической «проверки» многих сотен особых случаев. Детали сейчас неважны – я хочу лишь сказать, что именно на это доказа­ * В отечественной литературе больше распространено название «дель­ та­функция Дирака». – Прим. перев.

ВВЕДЕНИЕ

25

тельство математики чаще всего ссылаются, когда их просят при­ вести пример самого уродливого в математике. Если вам кажется, что это слишком грубое слово, то позвольте заверить, что я употре­ бил его не первым. Те самые два программиста из Иллинойса рас­ сказывали о реакции своего друга­математика, узнавшего, что они воспользовались компьютером[7]: «Господь никогда не должен был допустить, чтобы лучшее доказательство такой красивой теоремы было настолько уродливо». Хотя почти все математики не сомневаются в результате, поч­ ти никому не нравится способ, каким он был получен, поскольку выполняемые компьютером вычисления скрывают детали так называемого «решения». Как писал английский математик Огас­ тес де Морган (1806–1871), впервые сформулировавший пробле­ му четырех красок, в своей книге «Budget of Paradoxes»: «Для до­ казательства нужен человек, который может его дать, и человек, который может воспринять» (выделено мной). Здесь нет ни сло­ ва об автоматической машине, выполняющей сотни миллионов промежуточных вычислений (требующих несколько недель ра­ боты на суперкомпьютере), которые ни один человек не сможет осилить[8]. Прежде чем оставить тему доказательств с помощью компьюте­ ра, я должен признать, что в одном случае такой подход все­таки может приводить к красивой математике. Представьте, что, в от­ личие от проблемы четырех красок, компьютер нашел один или несколько контрпримеров, опровергающих гипотетическую тео­ рему. Затем эти контрпримеры может уже традиционным спо­ собом проверить любой заинтересованный человек. Подобный пример, связанный с Эйлером, восходит еще к 1769 году[9]. Опро­ вержение утверждения путем предъявления контрпримера – быть может, самый убедительный из всех методов (тот факт, что контр­ пример был найден компьютером, уже не имеет значения, коль скоро контрпример налицо), и математики в целом согласны, что это красивая техника. Есть, конечно, немало красивых математических утверждений, которые, на мой взгляд, могли бы составить конкуренцию формуле eip + 1 = 0, но отсутствовали в списке Intelligencer. Просто для при­ мера рассмотрим сначала бесконечный ряд

26

ВВЕДЕНИЕ

Это так называемый гармонический ряд, а  вопрос заключается в том, конечна или бесконечна его сумма S, т. е. сходится ряд или расходится? Почти все, кто видит его в  первый раз, думают, что S должна быть конечна (математики говорят, что S существует), поскольку каждый следующий член меньше предыдущего. Дей­ ствительно, члены стремятся к нулю, и это условие в самом деле необходимо для сходимости ряда к конечной сумме, но его не до­ статочно. Чтобы ряд сходился, члены должны не только стремить­ ся к нулю, но и стремиться достаточно быстро, а в случае гармони­ ческого ряда это не так (кстати, если знаки членов гармонического ряда чередуются, то сумма конечна и равна ln(2)). Таким образом, мы имеем красивое и неожиданное утверждение

известное примерно с 1350 года. Эту теорему, на мой взгляд, сле­ довало включить в список Intelligencer[10]. Кстати говоря, доказательство этой красивой теоремы – пример красивого математического рассуждения. Ниже приведено не ори­ гинальное доказательство (которое тоже изящно, но более широко известно, поэтому я не хочу его повторять[11]). Сначала предполо­ жим, что гармонический ряд сходится, т. е. что сумма S – какое­то конечное число. Тогда

Поэтому

Это означает, что сумма только нечетных членов равна поло­ вине полной суммы. Следовательно, сумма только четных членов

ВВЕДЕНИЕ

27

тоже должна быть равна половине S, а значит, предположение о су­ ществовании S привело нас к выводу, что

Но это равенство, очевидно, неверно, т.  к. каждый член сум­ мы в левой части больше соответственного члена в правой части (1 > 1/2, 1/3 > 1/4, 1/5 > 1/6, L). Поэтому наше исходное предположе­ ние о существовании S неверно, а значит, S не существует, и гармо­ нический ряд расходится. Это красивое рассуждение называется доказательством от противного. Самый знаменитый пример доказательства от противного  – данное Евклидом доказательство теоремы (a) из списка Intelligen­ cer. Помню, что, впервые увидев (еще в средней школе) эту демон­ страцию бесконечности множества простых чисел, я был очарован ее элегантностью и  красотой. Для меня доказательства от про­ тивного стали одним из характерных признаков красивого мате­ матического рассуждения. Когда Эндрю Уайлс (1953) в  1995  году наконец­то «добил» последнюю теорему Ферма, он воспользо­ вался доказательством «от противного». И  доказательство ирра­ циональности p2 с помощью формулы Эйлера, которое я приведу в главе 3, тоже ведется «от противного». Однако знаменитую интеллектуалку, обладательницу «самого высокого в мире IQ» Мэрилин вос Савант такой способ рассужде­ ний не впечатляет, она отвергает любое доказательство от против­ ного. В  своей скандально (и бесславно) известной книге, посвя­ щенной доказательству Уайлса, она пишет: Но как вообще можно что­то действительно доказать от противно­ го? Взять, к примеру, мнимые числа. Квадратный корень из +1 – ве­ щественное число, потому что +1 ´ +1 = +1; однако квадратный ко­ рень из -1 – мнимое число, потому что -1, помноженное на -1, тоже равно +1, а не -1. Налицо противоречие. [Где здесь «противоречие», я не вижу и представления не имею, почему она так говорит.] Тем не менее против него никто не возражает, и мнимые числа используют­ ся повсеместно. Но как же мы можем оправдать их использование, чтобы доказать противоречие?

Разумеется, это, как написали два рецензента книги, пример «бес­ смысленного рассуждения» (характеризуя ее книгу, употребляли также слово drivel – околесица)[12], и  позвольте заверить, что дока­ зательство от противного – самая что ни на есть законная техника.

28

ВВЕДЕНИЕ

Представьте мое удивление, когда я читаю, что два весьма ува­ жаемых математика называют такую демонстрацию «аргументом умника»! Очевидно, они шутили, но фраза меня задела. Я не буду приводить здесь доказательство бесконечности множества прос­ тых чисел, данное Евклидом (его можно найти в любом учебнике теории чисел), но позвольте мне повторить, что написали Филип Дэвис (Philip Davis) и  Рубен Херш (Reuben Hersh) в  получившей известность книге «The Mathematical Experience», вышедшей в 1981 году, по поводу традиционного доказательства от против­ ного теоремы (b) из списка Intelligencer. Чтобы доказать иррацио­ нальность числа , предположим, что оно рационально. То есть предположим (как сделал Пифагор в VI веке до н. э.), что существу­ ют два целых числа m и n таких, что

Можно также считать, что m и n не имеют общих делителей, по­ тому что если бы таковые были, то мы могли бы просто сократить их и назвать то, что останется, m и n. Возводя в квадрат, получаем, что 2n2 = m2, и, значит, m2 четно. Но тогда и само m четно, потому что нельзя получить четное чис­ ло путем возведения в квадрат нечетного (любое нечетное число имеет вид 2k + 1 для некоторого целого k, а (2k + 1)2 = 4k2 + 4k + 1 – тоже нечетное число). Но раз m четно, то должно существовать такое целое r, что m  = 2r. Следовательно, 2n2  = 4r2, или n2  = 2r2, а это значит, что n2 четно. Но тогда и n четно. Таким образом, мы пришли к выводу, что m и n должны быть четными, если целые m и n вообще существуют. Но в самом начале мы предположили, что у m и n нет общих делителей (и, в частности, не является общим делителем число 2), поэтому наше предположение о том, что m и n существуют, привело к логическому противоречию. Стало быть, m и  n не существуют! До чего красивое доказательство – в  нем ис­ пользуется только идея о том, что множество целых чисел можно разбить на два непересекающихся подмножества – четных и  не­ четных чисел. Однако Дэвид и Херш не разделяют моего мнения и, помимо ха­ рактеристики «от умника», утверждают, что в этом доказательстве есть еще одна проблема: «акцент на логическую неотвратимость, который выглядит тяжеловесно и кропотливо». Но позвольте, такая проблема просто обязана быть у  любого доказательства! Однако

ВВЕДЕНИЕ

29

удивительно для меня другое – что именно они выдают за лучшее доказательство. Оно повторяет предыдущее до шага, на котором устанавливается, что 2n2 = m2. Затем, говорят они, представим, что m и n разложены в произведение простых множителей. Тогда m2 состояло бы из последовательности пар простых чисел (потому что m2 = m · m), и то же самое можно сказать о n2. А теперь процитирую кульминационный момент: Но (ага!) в произведении 2n2 у 2 нет пары. Противоречие.

Гм. В чем же противоречие? А дело в том, что они воспользова­ лись (хотя явно об этом не упоминают) «основной теоремой ариф­ метики», согласно которой разложение любого целого числа (мы говорим об обыкновенных целых числах) в произведение простых чисел единственно. Они даже признают это, отмечая: «На самом деле мы опустили некоторые формальные детали». Да уж! Дэвис и Херш заявляют, что их доказательству отдадут предпо­ чтение перед пифагоровым «девять из десяти профессиональных математиков, потому что оно вызывает больший эстетический восторг». Быть может, они и правы, но лично я думаю, что неупо­ мянутая единственность разложения на множители  – довольно большой зияющий провал, через который трудно перешагнуть. Для обыкновенных чисел доказать это нетрудно, но все же нетри­ виально и уж вовсе неочевидно. На самом деле нетрудно создать другие подмножества вещественных чисел, для которых это ут­ верждение вообще неверно[13]! Поэтому это «ага!» вызывает у меня очень большие сомнения. Нет сомнений, что для него требуется куда больше, чем идея четности и нечетности, которой вполне до­ статочно в доказательстве, данном Пифагором. В качестве второго примера красивого математического выра­ жения, которым мы обязаны Эйлеру, рассмотрим разложение си­ нуса в бесконечное произведение:

Не нужно быть большим специалистом по математике, чтобы «осознать», что это весьма удивительное утверждение (и, навер­ ное, многие сочтут его «красивым»). Я  думаю, его способен оце­ нить любой старшеклассник, изучавший только алгебру и триго­ нометрию. А  чтобы проиллюстрировать его важность, скажу, что от него всего несколько шагов до такой формулы:

30

ВВЕДЕНИЕ

которая сама по себе  – образец математической красоты (ниже в этой книге я покажу, как ее вывести другим, не эйлеровым спо­ ¥

собом)[14]. Неудачные попытки вычислить сумму ån=1(1/n2) при­ водили в отчаяние математиков, начиная еще с итальянца Пьетро Менголи (Pietro Mengoli) (1625–1686), который первым формально поставил эту задачу в 1650 году, хотя наверняка многие математи­ ки и до него размышляли об этом естественном обобщении гармо­ нического ряда. И наконец, в 1734 году Эйлер решил эту задачу[15]. Все это красивые вещи, но все­таки я думаю, что eip + 1 = 0 лучше всех. Отчасти это связано с тем, что разложение sin(x) в бесконеч­ ное произведение можно вывести благодаря тесной связи между sin(x) и i = , которую устанавливает тождество Эйлера (снова см. примечание 14). И позвольте мне закончить это краткое эссе допущением, что, быть может, математическая красота – действительно в  глазах смотрящего, как и  красота живописи Джексона Поллока. Напри­ мер, в  1935 году английский математик Дж. Н. Ватсон в  конце своего президентского послания Лондонскому математическому обществу писал, что одна конкретная формула вызвала в нем «тре­ пет, неотличимый от того, что я  испытал, когда ступил в  Новую ризницу Капеллы Медичи и узрел перед собой строгую красоту че­ тырех скульптур, символизирующих День, Ночь, Вечер и Утро, ко­ торые Микеланджело поставил над гробницами Джулиано Медичи и Лоренцо Медичи»[16]. О да, это действительно трепет! В серии лекций, прочитанных перед публикой в Парижском му­ зее науки в начале 1980­х годов, математик из Йельского универ­ ситета Серж Ленг (Serge Lang) попытался объяснить, что он счи­ тает красивой математикой, прибегнув к  не столь патетическим образам, как Ватсон[17]. Он не давал формального определения, но несколько раз сказал, что, видя красоту, всегда распознает ее по «мурашкам по спине». Фраза Ленга напоминает мне о судье Вер­ ховного суда США Поттере Стюарте, который в решении 1964 года по делу о порнографии написал свою крылатую фразу: он не мо­ жет определить, что это такое, но «узнает, когда увидит». Быть мо­ жет, на другом конце интеллектуального спектра дело обстоит так же, как с красивой математикой.

ВВЕДЕНИЕ

31

Способность оценить красивую математику – это привилегия, и есть много образованных в другом отношении людей, которые, как это ни грустно, не понимают, что упускают нечто очень цен­ ное. В автобиографических воспоминаниях, которые Чарльз Дар­ вин в 1876 году написал для своих детей, он так выражал свои чув­ ства по этому поводу: Три года, проведенных мною в Кембридже, были в отношении ака­ демических занятий полностью затрачены впустую… Я пытался за­ няться математикой и  даже отправился для этого в  Бармут летом 1828 г. с  частным преподавателем… но занятия мои шли крайне вяло. Они вызывали у  меня отвращение главным образом потому, что я не в состоянии был усмотреть какой­либо смысл в первых ос­ нованиях алгебры. Это отсутствие у меня терпения было очень глу­ пым, и впоследствии я глубоко сожалел о том, что не продвинулся по крайней мере настолько, чтобы уметь хотя бы немного разбираться в великих руководящих началах математики, ибо люди, овладевшие ею, кажутся мне наделенными каким­то добавочным орудием разума [выделено мной][18].

Лимериком я  начал этот раздел, лимериком же хочу и  закон­ чить. Думаю, что если вы прочтете эту книгу до конца, то, в  от­ личие от профессора Пирса, согласитесь со следующими строками (впрочем, я подозреваю, что первые две к вам не относятся!): I used to think math was no fun, ‘Cause I couldnʼt see how it was done. Now Eulerʼs my hero For I now see why zero, Equals epi + 1*. Ну и хватит дурной поэзии. Перейдем к чему­нибудь получше. Займемся математикой комплексных чисел.

*

Я­то думал, что математика как стрихнин, Не видал в ней ни смысла, ни первопричин. Только Эйлер­король Объяснил мне, что ноль Равен epi + 1. – Прим. перев.

ГЛАВА 1 Комплексные числа

1.1. «Тайна» √-1 Много лет назад один выдающийся математик написал следую­ щие слова, которые некоторым читателям могут показаться не­ сколько неожиданными: Недавно я встретил человека, который сказал, что не верит не то что в квадратный корень из минус единицы, но и в минус единицу. И та­ кое мнение не редкость. Наверняка есть много людей, которые не видят ничего странного в  , но воротят нос от . А все потому, что думают, будто первое могут наглядно представить себе как нечто существующее в физическом мире, а второе – нет. Но на самом деле  – куда более простая концепция[1].

Я говорю «несколько неожиданными», потому что в книге «An Imaginary Tale» уделил много места описанию путаницы по этому поводу, царившей в  умах многих очень умных мыслителей про­ шлых веков. Нетрудно понять, что смущало первооткрывателей в  вопросе о  . В множестве обыкновенных вещественных чисел у каждого положительного числа есть два вещественных квадратных корня (а у  нуля всего один). Но у  отрицательного вещественного числа нет вещественного квадратного корня. Так, чтобы найти решение уравнения x2 + 1 = 0, мы должны «выйти за пределы» множества вещественных чисел в  более широкую область комплексных чи­ сел. Именно это расширение и  стало камнем интеллектуального преткновения на пути к  пониманию того, что значит, что «решает» уравнение x2 + 1 = 0. Однако мы можем вообще обойти

« ТАЙНА » –1

33

это расширение[2], если взглянем на проблему с совершенно новой (отнюдь не очевидной) точки зрения. мнимая

y¢ b

y a вещественная

x¢ x Рис. 1.1.1. Поворот вектора

В разделе математики, который называется теорией матриц и который начал разрабатываться в 1850 году, формально иллюст­ рируется (я так думаю), что мог иметь в виду цитированный выше автор. На рис. 1.1.1 мы видим вектор комплексного числа x + iy, который составляет угол a с положительным направлением веще­ ственной оси, и  другой вектор, полученный поворотом первого на угол b против часовой стрелки, – он представляет комплексное число x¢  + iy¢. Конечно, оба вектора имеют одинаковую длину r, . По рисунку сразу следует, что поэтому x  = r cos(a) и  y  = r sin(a), а  значит, пользуясь формулами синуса и косинуса суммы углов, получаем: x¢ = r cos(a + b) = r[cos(a)cos(b) - sin(a)sin(b)]; y¢ = r sin(a + b) = r[sin(a)cos(b) + cos(a)sin(b)]. Теперь заменим в этих уравнениях x¢, y¢ на r cos(a) и r sin(a) со­ ответственно. Тогда x¢ = x cos(b) - y sin(b); y¢ = y cos(b) + x sin(b) = x sin(b) + y cos(b). Если записать эту пару уравнений в матричном виде, то полу­ чим:

34

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

где R(b) – двумерный матричный оператор поворота (в главе 3 при доказательстве иррациональности p2 мы встретим еще один опе­ ратор – дифференцирования). Это означает, что вектор­столбец под воздействием оператора R(b) (т. е. при умножении на него[3]) поворачивается против часовой стрелки на угол b и  переходит в вектор­столбец

.

Поскольку поворот против часовой стрелки на угол b = 90° – то же самое, что умножение x + iy на i, получается, что i = можно ассоциировать с такой матрицей R(90°) размера 2´2:

Означает ли это, что мы можем с полным основанием назвать ее мнимой матрицей? Чтобы понять, почему это имеет смысл, а это и в самом деле имеет очень большой смысл, напомним, что единич­ ная матрица размера 2´2

обладает тем свойством, что для любой матрицы A размера 2´2 AI = IA = A. То есть I играет в матричной арифметике ту же роль, что 1 в арифметике обыкновенных вещественных чисел. Вся «тай­ на» заключается в  том, что это число, являющееся корнем уравнения i2 = -1, определенного над множеством обыкновенных вещественных чисел, само этому множеству не принадлежит. Но на множестве матриц размера 2´2 такой «тайны» нет, поскольку квадрат «мнимой» матрицы (самой что ни на есть обыкновенной матрицы 2´2) равен

« ТАЙНА » –1

35

То есть в отличие от обыкновенных вещественных чисел, в мно­ жестве матриц 2´2 имеется элемент, квадрат которого равен еди­ ничной матрице со знаком минус, а  единичная матрица играет в этом множестве роль единицы. Мы можем еще продолжить аналогию с вещественными числа­ ми, определив нулевую матрицу 2´2 0 =

, – при умножении

любой матрицы 2´2 на 0 получается 0. Кроме того, для любого ве­ щественного числа a, отличного от нуля, имеет место равенство (1/a) a = 1 (число 1/a является обратным к a), и точно так же мы на­ зываем матрицу A-1 обратной к A, если AA-1 = A-1A = I. (Из этой нотации сразу вытекает, что A0 = I.) Но не следует заходить с ана­ логией между матрицами 2´2 и обыкновенными вещественными числами слишком далеко. Между ними есть существенные разли­ чия. Например, для числа 1 существуют два квадратных корня -1 и 1. И для его матричного аналога I матрицы -I и I тоже являются квадратными корнями (мы говорим, что матрица S является квад­ ратным корнем из A, если S2 = SS = A). Но для I существует еще бесконечно много квадратных корней! В этом легко убедиться, за­ писав S в виде

а затем приравняв S2 = -I:

Таким образом, a, b и c могут быть любыми вещественными чис­ лами, удовлетворяющими условию a2 + bc = 1. На самом деле они даже не обязаны быть вещественными. Если a  = , то bc  = -1, и этому условию удовлетворяют, например, b = c = i. Следователь­ но, матрица

36

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

тоже является квадратным корнем из I. Но еще более удивитель­ ным, чем бесконечное число квадратных корней, является тот факт, что произведение двух ненулевых матриц может быть равно нулю! В  множестве вещественных чисел нет ничего подобного. В качестве примера этого поразительного явления предлагаю вам убедиться, что произведение матриц

равно 0, хотя A ¹ 0 и B ¹ 0. Матрицы совсем не похожи на числа. Это может показаться просто жонглированием символами, но на самом деле все гораздо серьезнее. И вот почему. Предположим, что мы последовательно применили два поворота к произвольно­ му вектору

: сначала на угол b, а затем на угол a, т. е.

Результат должен быть таким же, как при одном повороте на угол a + b, и при этом не важно, какой поворот был первым. Это зна­ чит, что оператор поворота R должен обладать следующими двумя свойствами: R(a)R(b) = R(a + b); R(a)R(b) = R(b)R(a). Второе утверждение означает, что R обладает весьма специаль­ ным свойством коммутативности (снова см. примечание 3). Но именно в первом утверждении скрыт по­настоящему элегантный результат. Оно говорит, что если последовательно выполнить n по­ воротов на один и тот же угол b, то получится такой же результат, как при одном повороте на угол nb. То есть для любого целого n (положительного, отрицательного или равного нулю) имеет место тождество Rn(b) = R(nb), представляющее собой матричную форму формулы Муавра (я ско­ ро объясню, что это значит). Иначе говоря,

« ТАЙНА » –1

37

Интересен частный случай при n = -1: R-1(b) = R(-b). Это означает, что R(-b) – обращение оператора R(b). Вообще го­ воря, вычисление обратной матрицы – нетривиальное занятие, но матрица поворота является исключением из этого правила. Ведь обращением поворота против часовой стрелки на угол b является просто поворот на тот же угол по часовой стрелке (или, эквива­ лентно, поворот против часовой стрелки на угол -b). Таким об­ разом,

Мы можем проверить, что эта матрица обладает надлежащим поведением, выполнив прямое вычисление:

Оставляю вам проверку того, что R(b)R-1(b) = I. Матрица

поворачивает вектор

на угол b

против часовой стрелки. То же самое получается при умножении вектора на eib  = cos(b)  + i  sin(b). Следовательно, матричное тож­ дество, обведенное выше рамочкой, просто означает, что (eib)n  = einb (что вряд ли вызовет удивление!), а формула Эйлера принима­ ет вид: [cos(b) + i sin(b)]n = cos(nb) + i sin(nb), т. е. мы получили хорошо известную формулу Муавра. Так что складывается впечатление, что введение матричной нотации не

38

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

дало ничего такого, чего мы не знали. Это не совсем так (чуть ниже я объясню, почему); но пока возникает интересный вопрос: можно ли, не привлекая физическое понятие поворота, доказать матема­ тическое тождество

Ответ утвердительный, по крайней мере при положительном целом n, хотя все равно придется обратиться к комплексным чис­ лам. Случаи n = 0 и 1, разумеется, тривиальны. Чисто математическое доказательство, которое я  представлю в следующем разделе, основано на, быть может, самой известной теореме матричной алгебры – теореме Кэли–Гамильтона, назван­ ной в честь английского математика Артура Кэли (1821–1895) и ир­ ландского математика Уильяма Роуэна Гамильтона (1805–1865). В частности, о Кэли, который в математике был таким пуристом, что сама мысль о физических аргументах вызвала бы у него отвра­ щение, великий физик Джеймс Клерк Максвелл (в честь которого названы «уравнения электромагнитного поля Максвелла») писал: «Душа которого, слишком огромная для вульгарного пространства, обитала в n измерениях».

1.2. Теорема Кэли–Гамильтона и формула Муавра Формулировка теоремы Кэли–Гамильтона обманчиво проста. Она применима ко всем квадратным матрицам любого размера (n´n, где n – любое положительное целое число), но для нас представ­ ляет интерес только случай n = 2. Начнем с того, что определите­ лем произвольной матрицы A размера 2´2 называется следующее число:

т. е. определитель A  – это разность произведений элементов на двух диагоналях. Далее определим характеристический полином A как полином от скалярного параметра l, вычисляемый по формуле

ТЕОРЕМА КЭЛИ–ГАМИЛьТОНА И ФОРМУЛА МУАВРА

39

p(l) = det(A - lI). Уравнение p(l)  = 0 называется характеристическим уравнени­ ем A. Например, если A =

, то имеем

, и, следовательно, характеристический полином A имеет вид

т. е. p(l) = l2 - 4l - 5. Решения характеристического уравнения p(l) = 0 называются характеристическими числами, или собствен­ ными значениями A. В  этом примере, поскольку l2  - 4l  - 5  = (l  - 5)(l  + 1), A имеет два характеристических числа: l  = 5 и l = -1. После этих вступительных слов мы готовы сформулировать тео­ рему Кэли–Гамильтона: любая квадратная матрица A удовлетво­ ряет своему собственному характеристическому уравнению, т.  е. подстановка A вместо l в уравнение p(l) = 0 дает p(A) = 0. В на­ шем примере теорема Кэли–Гамильтона утверждает, что A2 - 4A 5I = 0, в чем вы легко сможете убедиться самостоятельно. На са­ мом деле для случая 2´2 вообще легко выполнить алгебраические преобразования в общем виде и показать, что характеристическое уравнение

действительно обращается в тождество, если подставить A вместо l. Именно это и проделал сам Кэли. Он доказал теорему не для всех положительных n, а только (в 1858 году) для n = 2 и n = 3, проведя все алгебраические выкладки (в случае n = 3 повозиться придется гораздо дольше, чем при n = 2). Имя Гамильтона было добавлено, потому что он не поленился выполнить еще более сложные вы­ кладки для случая n = 4. Но для произвольного n «алгебраические выкладки», очевидно, путь в никуда. Доказательство в общем слу­

40

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

чае требует более серьезного математического аппарата, чем я го­ тов представить в этой книге (да нам­то все равно нужен только случай 2´2), поэтому я просто отсылаю вас к любому достаточно полному учебнику линейной алгебры и теории матриц. Ну хорошо, а  нам­то чем полезна теорема Кэли–Гамильтона? Одно из основных ее применений в прикладной математике, тех­ нике и физике – вычисление больших степеней матрицы. Зная A, легко непосредственно вычислить A2, A3 и A4 (если A не слишком большая), но даже для матрицы размера 2´2 просьба вычислить A3973 заставит призадуматься. А  такие вычисления не редкость, например марковские цепи в  теории вероятностей и  теория ав­ томатического управления в  технике[4]. Конечно, современные компьютеры позволяют вычислять большие степени матрицы легко и быстро (пакет MATLAB, который использовался для созда­ ния всех графиков в этой книге, вычисляет A3973 для матрицы 2´2 в мгновение ока). Но нас­то интересует математическое решение (которое затем можно будет использовать для выведения матрич­ ной формы формулы Муавра для целого n ³ 0). Для матрицы 2´2 характеристический полином квадратично зависит от l, поэтому характеристическое уравнение p(l) = 0 мож­ но записать в общем виде l2 + a1l + a2 = 0, где a1 и a2 – константы. Таким образом, по теореме Кэли–Гамильтона, A2 + a1A + a2I = 0. Теперь разделим ln на l2 + a1l + a2. В общем случае мы получим частное в виде полинома степени n - 2 и остаток – полином степе­ ни не больше 1 (такое рассуждение, очевидно, не проходит для n < 2, и это ограничение означает, что наш метод, хотя и математически чистый, все же не такой общий, как физическая идея поворота из предыдущего раздела, у которой такого ограничения нет), т. е.

где r(l) = b2l + b1, а b2 и b1 – постоянные. Иначе говоря,

Это полиномиальное тождество относительно l, и  еще одна теорема матричной алгебры утверждает, что после замены l мат­ рицей A тождество сохранится, но уже матричное. (Доказать ее не­ трудно, но я  лишь ограничусь замечанием, что это утверждение

ТЕОРЕМА КЭЛИ–ГАМИЛьТОНА И ФОРМУЛА МУАВРА

41

правдоподобно, а  за формальным доказательством отсылаю вас к учебнику линейной алгебры.) Таким образом, An = (A2 + a1A + a2I)q(A) + b2A + b1I. Но поскольку A2 + a1A + a2I = 0 в силу теоремы Кэли–Гамиль­ тона, то An = b2A + b1I. Осталось только определить постоянные b1 и b2, а это уже совсем просто. Вот как это делается. Вернемся к тождеству в рамке выше, которое выполняется для всех l, и  подставим в  него оба характеристических числа l1 и  l2 (для которых, по определению, l2 + a1l + a2 = 0). Тогда

Из этих уравнений легко выразить b1 и b2 через l1 и l2, оставляю эти алгебраические преобразования вам. В результате получим

Таким образом, в случае 2´2 общее выражение для An прини­ мает вид

Возникает вопрос: что будет, если l1 = l2 (тогда в формуле по­ является деление на 0). Но с  этим легко разобраться, записав l1 = l2 + e и устремив e к нулю. Как бы то ни было, нам нужно лишь доказать формулу Муавра, а в этом случае, как мы увидим ниже, l1 ¹ l2, так что эта проблема к нам не относится. Мы же имеем ,

42

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

и, следовательно,

поэтому характеристическое уравнение det(A - lI) = 0 принимает вид [cos(b) - l]2 + sin2(b) = 0, что сводится к l2 - 2l cos(b) + 1 = 0. Из этого квадратного уравнения мы находим характеристические числа l1 = cos(b) - i sin(b) и l2 = cos(b) + i sin(b). Далее, по формуле Эйлера, мы можем переписать l1 и l2 в виде l1 = e-ib, l2 = eib. Под­ ставляя эти экспоненты в общую формулу для An, получаем:

Далее, sin{(n - 1)b} = sin(nb)cos(b) - cos(nb)sin(b). Поэтому

ТЕОРЕМА КЭЛИ–ГАМИЛьТОНА И ФОРМУЛА МУАВРА

43

И таким образом:

Вот мы и доказали формулу Муавра в матричной форме для не­ отрицательного целого n, не прибегая к физическим поворотам. На самом деле довольно просто обобщить формулу Муавра с не­ отрицательных на все целые числа, оставаясь в рамках чисто мате­ матических рассуждений. (Напомним, что автоматическое вклю­ чение отрицательных степеней – самое привлекательное свойство рассуждения с использованием поворота.) Покажем один из воз­ можных способов. Сначала напишем

Поскольку cos(-b) = cos(b) и sin(-b) = -sin(b) (говорят, что ко­ синус и синус – соответственно четная и нечетная функции), то

Теперь, воспользовавшись тем, что k  = (-1)(-k) для любого k, получаем

и подстановка обведенного рамкой выражения дает

Это верно для любого целого k (положительного, отрицательного или равного нулю). В частности, если k отрицательно, то -k поло­ жительно, и правая часть равна (по формуле Муавра, которую мы уже доказали для положительных показателей степени) cos(kb) + i sin(kb). То есть для любого k < 0 (а значит, и для всех целых k)

44

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

что и требовалось доказать. Формула Муавра – мощный аналитический инструмент, и одно ее применение я хотел бы показать прямо сейчас. Применяя фор­ мулу бинома к левой части формулы Муавра, получаем , и, следовательно, подставляя правую часть формулы Муавра, имеем

Приравнивая вещественные и мнимые части обеих сторон этого тождества, получаем

и

ТЕОРЕМА КЭЛИ–ГАМИЛьТОНА И ФОРМУЛА МУАВРА

45

Поэтому

или

Этот результат говорит, что мы можем записать tg(kb) в  виде отношения двух полиномов от tg(b) с  целыми коэффициентами. Заметим, что поскольку

 = 0 для любых положительных j и k та­

ких, что j > k, это выражение сводится к  очевидно правильному tg(b) = tg(b) в частном случае k = 1. А в случае k = 2 получаем

что согласуется с формулами синуса и косинуса двойного угла:

Однако уже для k = 5 (например) мы получаем не столь очевид­ ную формулу

46

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

Этот результат при желании нетрудно подтвердить прямыми алгебраическими преобразованиями для любого b. y 2

150°

1 30° -

2 30°

1 x

Рис. 1.2.1. Треугольник с углами 30°, 60° и 90° («сторона, противолежащая углу 30°, равна половине гипотенузы»)

Например, для треугольника с  углами 30°, 60° и  90° из школь­ ной программы геометрии известно, что tg(30°) = 1/  = /3 (см. рис. 1.2.1) и что tg(150°) = -tg(30°) = - /3. Наша формула дает то же самое, потому что tg(5 · 30°) равно

Благодаря этому успеху складывается впечатление, что ком­ плексные числа вообще и формула Муавра в частности дают нам весьма мощный инструмент. В  оставшейся части этой главы мы рассмотрим несколько очень разных задач, которые, надеюсь, это впечатление усилят.

РАМАНУДЖАН НАХОДИТ СУММУ РЯДА

47

1.3. Рамануджан находит сумму ряда В 1912 году индийский гений­самоучка Сриниваса Рамануджан (1887–1920) использовал комплексные числа и  формулу Эйлера для решения «интересной» задачи, опубликованной в  выпуске журнала «Journal of the Indian Mathematical Society» за предыду­ щий год. Эпитет «интересный» – зачастую дело вкуса, но для нас эта задача интересна, потому что в свое время «заинтересовала» гения[5]. Задача заключалась в том, чтобы выразить функцию

в замкнутой форме. Вот как ее решил Рамануджан. Если ввести «очевидное» вспомогательное определение

то в силу формулы Эйлера мы сможем написать

где z = eix. Эту сумму можно записать в виде:

Из начального курса математического анализа известно разло­ жение ln(1 + x) в ряд Маклорена

В выводе этой формулы предполагается, что x – вещественное число, но если допустить, что она имеет место и для комплексных z (в конце раздела мы немного поговорим об этом допущении), то получим

48

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

и, значит,

или

Точно так же

и, значит,

или

Таким образом,

РАМАНУДЖАН НАХОДИТ СУММУ РЯДА

49

Поскольку z = eix, то 1/z = e-ix и 1/z2 = e-i2x, так что мы получаем

Теперь

Таким образом,

поэтому, приравнивая вещественные части, получаем найденный Рамануджаном ответ

50

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

(Приравнивание мнимых частей, конечно, дает сумму ряда Q(x).) Однако на этот результат следует наложить ограничение: он верен только в  интервале -p < x < p, на котором аргумент логарифма неотрицателен. Сумма Рамануджана, прямое вычисление

Сумма первых 200 членов ряда для каждого значения x

0.5

0.5

0.4

0.4

0.3

0.3

0.2

0.2

0.1

0.1

0

0

–0.1

–0.1

–0.2

0

1 2 x (от 0.01 до 3.14 шагами по 0.01)

Сумма Рамануджана по его формуле

3

–0.2

0

1 2 x (от 0.01 до 3.14 шагами по 0.01)

3

Рис. 1.3.1. Сумма Рамануджана

Конечно, возникает главный вопрос: «правилен» ли результат Рамануджана? «Правильный» означает, что если вычислить пра­ вую и левую части формулы для одного и того же значения x, то получится один и тот же результат. В конце концов, начинали­то мы с вещественных значений x, а потом перешли в комплексную об­ ласть. Не будет ли тут какой­нибудь проблемы? Это легко прове­ рить с помощью компьютера, и на рис. 1.3.1 показаны результаты вычисления обеих функций. На левом графике вычислялась сумма первых 200 членов исходного ряда для каждого из 314 значений x (от 0.01 до 3.14 шагами по 0.01). На правом графике для тех же x вычислялось значение, которое дает формула Рамануджана. Оба графика практически идентичны – наложение одного на другой не

РАМАНУДЖАН НАХОДИТ СУММУ РЯДА

51

показывает видимых глазу различий. Конечно, эта иллюстрация не является доказательством[6], но только самый строгий пурист останется неудовлетворенным! Я думаю, это чрезвычайно убеди­ тельная демонстрация полезности комплексных чисел и, в частно­ сти, формулы Эйлера. Использование тождества Эйлера для нахождения суммы ряда – не просто дешевый трюк. Ниже приведен еще один пример тако­ го использования для суммирования знаменитого ряда[7]. Начнем с тождества

Таким образом,

Если снова допустить, что разложение ln(1 + x) в степенной ряд остается справедливым и для комплексных чисел (наше доверие к этому допущению немного повысилось после успешного реше­ ния задачи Рамануджаном), то при x = e-i2u имеем

Пока рассмотрим только интеграл:

Теперь по формуле Эйлера имеем e-ipn  = cos(pn)  - i sin(pn)  = cos(pn), потому что sin(pn) = 0 для всех целых n. Поскольку cos(pn) = (-1)n для всех целых n, имеем

52

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

Подставляя это в последнее выражение для

[2cos(u)]du, по­

лучаем

Мы совершенно точно можем утверждать, что

[2cos(u)]du –

вещественное число, т. к. подынтегральное выражение веществен­ но на всем интервале интегрирования. И  согласовать это с  уста­ новленным выше фактом, согласно которому этот интеграл чисто мнимый, можно только одним способом – интеграл должен быть равен нулю. Таким образом,

и этот результат был доказан самим Эйлером (другим способом), а  в  разделе 4.3 мы докажем его еще раз – третьим способом. Ну и заодно, коль скоро мы теперь знаем, что

то получается красивый результат:

ПОВОРОТ ВЕКТОРОВ И ОТРИцАТЕЛьНыЕ ЧАСТОТы

53

1.4. Поворот векторов и отрицательные частоты Формула Эйлера позволяет нам записать вещественные функции от времени cos(wt) и  sin(wt) в  терминах комплексных экспонент (пока что w – произвольная постоянная, но, как мы вскоре увидим, у нее есть простая физическая интерпретация). Итак:

У этих аналитических выражений, которые, признаем, выглядят довольно абстрактно, есть очень элегантная геометрическая ин­ терпретация. eiwt – это вектор в комплексной плоскости длины 1, а wt – угол, который он составляет с положительным направлением вещественной оси, т. е. направлением в сторону от 0 до 1. С увели­ чением времени угол wt увеличивается, т. е. вектор поворачивается (или вращается) вокруг начала координат в комплексной плоско­ сти против часовой стрелки. Он совершает полный оборот, когда wt = 2p радиан. Если это происходит в момент t = T, то w = 2p/T, т. е. измеряется в радиан/с. Поэтому w называют угловой частотой вращения вектора. Если измерять частоту в оборотах (или периодах) в секунду, что, вероятно, является более естественной единицей, и обозначать v, то v = 1/T (T называют периодом вращения), а w = 2pv. В механи­ ке v обычно находится в диапазоне от 0 до нескольких тысяч или десятков тысяч[8], а  в  электронике может варьироваться от 0 до частоты гамма­излучения (1020 Гц[9]). Например, частоты обычно­ го радиовещания в диапазонах AM и  FM составляют порядка 106 и 108 Гц соответственно. Единственное различие между eiwt и e-iwt заключается в том, что угол вектора e-iwt равен -wt, т. е. e-iwt вращается в противоположном направлении – по часовой стрелке, и это, наконец, позволяет нам понять, что означает cos(wt) в терминах комплексных экспонент. Мнимые компоненты обоих векторов одинаковы по абсолютной величине и  противоположны по направлению (направлены вер­ тикально вверх и  вертикально вниз), поэтому в  каждый момент времени мнимые компоненты взаимно уничтожаются. Однако ве­

54

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

щественные компоненты этих векторов в каждый момент време­ ни одинаковы и по абсолютной величине, и по направлению (т. е. всегда складываются). Таким образом, векторное сложение обеих экспонент приводит к  колебанию только и  исключительно вдоль вещественной оси. Для получения cos(wt) их сумма делится попо­ лам, потому что вещественная компонента каждого отдельного вращающегося вектора сама равна cos(wt). Та же картина имеет место для записи sin(wt) в комплексно­экспоненциальной форме, только теперь векторное сложение eiwt и e-iwt производится так, как показано на рис. 1.4.1b, который показывает, что колебание про­ исходит вдоль мнимой оси, и, стало быть, деление на 2i дает ве­ щественное значение sin(wt). (Отметим, что вектор e-iwt выглядит именно так, как показано, поскольку -e-iwt = -cos(wt) + i sin(wt), т. е. его вещественная компонента противоположна вещественной компоненте eiwt, а мнимая компонента равна мнимой компоненте eiwt). мнимая eiwt wt 0

wt

вещественная e-iwt

мнимая -e-iwt

eiwt wt

wt 0

вещественная

Рис. 1.4.1. Векторы, вращающиеся против часовой стрелки на комплексной плоскости

Вместо того чтобы говорить, что eiwt и e-iwt вращаются с положи­ тельной угловой частотой w, а затем уточнять, по часовой стрел­

ПОВОРОТ ВЕКТОРОВ И ОТРИцАТЕЛьНыЕ ЧАСТОТы

55

ке или против, инженеры и  математики зачастую просто пишут e-iwt = ei(-w)t и говорят, что вектор eiwt вращается с положительной частотой, а e-iwt – с отрицательной. Поначалу это ставит студентов в тупик – как что­то может изменяться с частотой, меньшей нуля? Конечно, для вещественных функций от времени такое невозмож­ но. А вот для комплексных – вполне. Выражения cos(wt) и sin(wt) через комплексные экспоненты мо­ гут стать ключом к  решению задач, которые решить по­другому было бы трудно, и  в  главе 4 я  буду говорить об этом очень по­ дробно. А пока хотел бы привести простой, но впечатляющий при­ мер того, что можно сделать благодаря такому подходу. Вычислим следующий интеграл (в книге «An Imaginary Tale» это предложено в качестве задачи, оставленной без решения), а потом я расскажу, почему он представляет исторический интерес:

Так как , мы имеем

А поскольку (i)2n = (

По формуле бинома

)2n = ((

)2)n = (-1)n и 22n = 4n, то имеем

56

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

Поскольку (-1)2n = 1, имеем

и, значит,

Теперь займемся интегралом в правой части. Если k ¹ n, то

потому что для нижнего предела q = 0 ei2(k-n)q = e0 = 1 и для верхне­ го предела q = p тоже ei2(k-n)q = ei(k-n)2p = eцелое кратное 2pi = 1. Но если k = n, то приведенная выше формула неверна, потому что получа­ ется деление на ноль. Поэтому положим k = n до интегрирования. Тогда при k = n подынтегральное выражение сводится к единице, и интеграл оказывается равен

Итак,

Таким образом,

НЕРАВЕНСТВО КОШИ–ШВАРцА И ЗНАК «ПАДЕНИЕ КАМНЕЙ»

57

В силу симметрии sin2n(q) на промежутке от 0 до p ясно, что уменьшение интервала интегрирования до [0, p/2] уменьшает зна­ чение интеграла вдвое, т. е.

Это выражение часто называют интегралом Валлиса в честь анг­ лийского математика Джона Валлиса (1616–1703). Забавно, пото­ му что Валлис этот интеграл не вычислял! Тем не менее с интегра­ лом связывают его имя, потому что интегралы вида

sinn(q)dq

можно использовать для вывода знаменитой формулы Валлиса для вычисления p:

хотя ее гораздо проще вывести из найденного Эйлером выраже­ ния синуса в виде бесконечного произведения[10].

1.5. Неравенство Коши–Шварца и знак «падение камней» Рассуждение, основанное на аналитической геометрии и  ком­ плексных числах, можно использовать для вывода одного из самых полезных инструментов математического анализа – неравенства Коши–Шварца*. Как писал один автор много лет назад, «это [не­ равенство] – исключительно мощное оружие. Есть немало случаев, когда люди, знавшие и  вспомнившие об этой формуле, блеснули на поле, где их менее удачливые собратья потерпели бесславное поражение»[11]. В конце данного раздела, когда мы овладеем этим инструментом, я покажу занятный пример того, что имел в виду этот автор, – как неравенство Коши–Шварца позволяет получить решение на казалось бы пустом месте. Еще раз мы воспользуемся им в главе 5. Вывод неравенства краток и элегантен. Если f(t) и g(t) – произ­ вольные вещественные функции вещественной переменной t, то * В отечественной литературе его называют неравенство Коши–Буня­ ковского или Коши–Буняковского–Шварца. – Прим. перев.

58

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

нет сомнений, что для любой вещественной постоянной l и любых двух постоянных U и L (одна или обе могут быть бесконечностью) имеет место неравенство

Действительно, будучи вещественным значением, возведен­ ным в квадрат, подынтегральное выражение всюду неотрицатель­ но. Мы можем раскрыть его и записать интеграл в виде:

А поскольку все эти три определенных интеграла – постоянные (обозначим их значения a, b и c), то левая часть просто является квадратной функцией от l:

где

У этого неравенства есть простая геометрическая интерпре­ тация: график h(l) (парабола) нигде не пересекает ось l, а может лишь касаться ее. В  точке, где неравенство «больше или равно» превращается в равенство h(l) = 0, ось l является горизонтальной касательной к параболе. Это, в свою очередь, означает, что урав­ нение al2 + 2bl + c = 0 не может иметь вещественных решений (разве что двойной корень), поскольку вещественному решению соответствовала бы точка пересечения с  осью l. Таким образом, оба решения этого квадратного уравнения должны быть комплекс­ но сопряженными числами:

НЕРАВЕНСТВО КОШИ–ШВАРцА И ЗНАК «ПАДЕНИЕ КАМНЕЙ»

59

а условием комплексности l (или наличия двойного вещественно­ го корня в случае b2 - ac = 0) является неравенство b2 £ ac. Таким образом, из неравенства h(l) ³ 0 вытекает, что

А это и есть неравенство Коши–Шварца[12]. В качестве простого примера возможностей, которые открыва­ ет этот результат, рассмотрим следующую задачу. Предположим, что я  взобрался на вершину башни высотой 400 футов и  уронил с  нее камень. Предположим еще, что мы договорились игнори­ ровать такие «мелкие» детали, как сопротивление воздуха. Тогда если обозначить y(t) расстояние (от моей руки), которое камень уже пролетел, и считать, что в момент начала падения камня t = 0, а ускорение силы тяжести (приблизительно 32 фут/c2) обозначить g, то скорость камня v(t) = dy/dt = gt = 32t фут/с (я измеряю время в секундах). Это установил еще Галилей много веков назад. Итак (s обозначает фиктивную переменную интегрирования):

Если камень достигает земли в момент t = T, то 400 = 16T 2, или T = 5 с. Теперь ответ на вопрос «какова средняя скорость падения кам­ ня» кажется тривиальным. Чтобы пролететь 200 футов, понадоби­ лось 5 секунд, и я подозреваю, что 9999 людей из 10 000 ответят: «Это просто. Нужно разделить 400 футов на 5 секунд, и получится 80 фут/с». Но что ответит один из десяти тысяч? Он ответит – толь­ ко что вычисленная нами величина называется средним по времени:

Интеграл равен полной площади под кривой v(t) на отрезке от t = 0 до t = T, и если мы допустим, что скорость была постоянной и равной Vtime, то графиком скорости будет прямая линия, фигура

60

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

под ней на отрезке от t = 0 до t = T – прямоугольник, и из приве­ денной выше формулы следует, что его площадь такая же, как под кривой v(t). И действительно, поскольку v(t) = 32t, имеем

что совпадает с первоначальным ответом. А затем, пока мы все киваем, соглашаясь с  этой мудреной де­ монстрацией того, что было «очевидно» с  самого начала, этот странноватый чудак неожиданно огорошивает нас: «Но есть и еще один способ вычислить среднюю скорость камня, и он дает другой результат!» Давайте, говорит он, будем смотреть на падение камня не во времени, а в пространстве. То есть будем говорить о зависи­ мости скорости не от времени v(t), а от расстояния – v(y). Но, конеч­ но, в обоих случаях единицей измерения будет фут/с. Если общее пройденное камнем расстояние равно L (в нашем случае 400 фу­ тов), то мы можем говорить о среднем по пространству

Поскольку t  =

  = 1/4

, то v(y)  = 32(1/4

)  = 8

. При

y = 400 футов это означает, что v(400 футов) = 8  = 160 фут/с в конце падения, и это совпадает с результатом предыдущего вы­ числения v(5 секунд) = 160 фут/с. Следовательно, для нашего па­ дающего камня

Можно было бы посвятить некоторое время обсуждению смысла этого результата, но я лишь хочу отметить, что Vtime £ Vspace. И хотя мы проанализировали лишь очень частную задачу, можно пока­ зать, что при любом характере зависимости v(t) от t (и v(y) от y), даже если учесть сопротивление воздуха, которым мы пренебрег­

НЕРАВЕНСТВО КОШИ–ШВАРцА И ЗНАК «ПАДЕНИЕ КАМНЕЙ»

61

ли, справедливо неравенство Vtime £ Vspace. Конечно, это очень об­ щее утверждение, и доказать его можно весьма изящно, восполь­ зовавшись неравенством Коши–Шварца (которое, собственно, и является темой этого раздела!). Вот как это делается. Положим g(t)  = v(t)/T и  f(t)  = 1. Тогда согласно неравенству Коши–Шварца

Воспользуемся спецификой нотации дифференцирования:

При подстановке в интеграл выше нужно будет изменить преде­ лы интегрирования, согласовав их с переменной интегрирования, т. е. с y. Поскольку y = 0 при t = 0 и y = L при t = T, имеем

Но L = ∫0 v(t)dt, и потому T

Таким образом,

и, следовательно, Vtime £ Vspace, как и утверждалось.

62

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

В приведенном выше рассуждении нет никаких предположений о деталях поведения v(t) или v(y), так что наш результат носит весь­ ма общий характер. Без использования неравенства Коши–Швар­ ца вывести его было бы гораздо сложнее, но не забывайте, как мы пришли к этому неравенству – с помощью рассуждений, принци­ пиально зависящих от понятия комплексного числа.

1.6. Правильные n-угольники и простые числа В книгу «An Imaginary Tale» я  включил обсуждение уравнения zn - 1 = 0. Одно его решение, z = 1, очевидно, и это означает, что (z - 1) должно быть делителем zn - 1. На самом деле, как я упомя­ нул в AIT, прямым умножением легко проверить, что

Второй сомножитель называется круговым полиномом, или поли­ номом деления круга, и в AIT я мельком упомянул, что его название ассоциируется с построением правильных n­угольников. Там я не стал развивать эту тему, а сейчас сделаю это из­за связи круговых полиномов с одним из величайших триумфов математики, а также из­за их связи с  одной весьма поучительной ошибкой. Но чтобы подготовить почву, я хотел бы сначала напомнить несколько эле­ ментарных вещей, относящихся к уравнению zn - 1 = 0. Формально «решить» уравнение zn  - 1  = 0 «легко». Решения имеют вид z = 11/n, и одним из них (как уже было отмечено), оче­ видно, является 1. Но поскольку у уравнения степени n имеется n решений, то должно быть еще n - 1, и формула Эйлера подсказы­ вает, каковы они. Поскольку 1 = ei2pk, где k – произвольное целое число, мы можем написать

где k – произвольное целое число (при k = 0 получаем решение 1). При  = 1, 2, …, n - 1 получаются остальные n - 1 решений, в общем случае комплексных (если только n не является четным числом, тогда при k = n/2 мы получаем еще одно вещественное решение, но об этом позже). Решение для любого другого целого значения k совпадает с одним из этих n решений; например, при k = n полу­ чается то же решение, что при k = 0.

ПРАВИЛьНыЕ n­УГОЛьНИКИ И ПРОСТыЕ ЧИСЛА

63

Уже сейчас видно, что эти решения обладают рядом интересных свойств. Во­первых, все они по абсолютной величине равны 1, т. е. |ei(real)|  = 1. Поэтому все решения уравнения zn  - 1  = 0 лежат на окружности радиуса 1 с центром в начале координат. Во­вторых, решения равномерно расставлены по этой окружности с постоян­ ным угловым расстоянием 2p/n радиан. Я хочу процитировать вы­ шедшую в  1895 году книгу Феликса Клейна «Знаменитые задачи элементарной геометрии» (сегодня Клейн (1849–1925), пожалуй, наиболее известен открытием односторонней замкнутой поверх­ ности – бутылки Клейна, – которая существует только в простран­ стве размерности не ниже 3 и встречается во многих научно­фан­ тастических рассказах). В этой книге Клейн пишет: Рассмотрим в z­плоскости (z = x + iy) окружность радиуса 1. Разде­ лить эту окружность на n равных частей, начиная с  z  = 1, – то же самое, что решить уравнение zn - 1 = 0. У этого уравнения имеется корень z = 1. Исключим его из рассмотре­ ния, разделив обе части на z - 1, геометрически это все равно, что игнорировать начальную точку разбиения. Тогда получается урав­ нение zn-1 + zn-2 + L + z + 1 = 0, которое можно назвать уравнением деления окружности.

Заметим, кстати, что решением является не только z = 1 для лю­ бого целого n, но и z = -1, если n четное. Это очевидно, поскольку (-1)четное  - 1  = 1  - 1  = 0, но и  наша общая формула говорит то же самое. Если n четное, то существует такое целое m, что n = 2m. Тогда

а значит, при k = m = 1/2n имеем

Таким образом, для четных n существует два вещественных ре­ шения уравнения zn - 1 = 0 (±1) и n - 2 комплексных. Для нечет­ ных n существует одно вещественное решение (+1) и n - 1 ком­ плексных. В любом случае число комплексных решений четно. Это

64

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

подводит нас к  третьему общему наблюдению касательно реше­ ний уравнения zn - 1 = 0. Поскольку число комплексных корней всегда четно и эти корни равномерно расставлены по окружности с центром в начале коор­ динат, то в силу симметрии половина корней находится в верхней части окружности, а половина – в нижней. Также из соображений симметрии мы можем заключить, что каждый корень в  верхней половине является комплексно сопряженным с  корнем в  ниж­ ней половине (и наоборот). Например, в случае n = 5 мы говорим о корнях уравнения z5 - 1 = 0. Поскольку n нечетно, единственный вещественный корень равен +1, а остальные четыре комплексные. Вот эти комплексные корни:

Первые два корня расположены на верхней половине окружно­ сти, последние два – на нижней. При этом z1 и z4, а также z2 и z3 – взаимно сопряженные пары (все эти утверждения становятся оче­ видны при взгляде на рис. 1.6.1). Теперь мы готовы привести первый пример в этом разделе. Но сначала немного истории. 30 марта 1796 года немецкий гений Карл Фридрих Гаусс (1777–1855) за месяц до своего девятнадцатого дня рождения сделал удивительное открытие. Это открытие, настолько ошеломительное, что убедило его избрать в качестве жизненного пути математику, заключалось в возможности построить правиль­ ный 17­угольник только с  помощью циркуля и  линейки. Данный результат сразу же был признан «важным», потому что до Гаусса в задаче о возможности (или невозможности) построения правиль­ ных многоугольников не было никакого прогресса на протяжении 2000 лет. То есть не было ничего нового со времен Евклида! В «Началах» Евклида можно найти построения правильного треугольника, квадрата, пятиугольника и  15­угольника. Кроме того, почти очевидно, что если мы умеем строить правильный n­угольник, то сможем построить и правильный 2n­угольник – до­ статочно просто провести биссектрисы центральных углов, об­ разованных прямыми, соединяющими вершины многоугольника

ПРАВИЛьНыЕ n­УГОЛьНИКИ И ПРОСТыЕ ЧИСЛА

65

с его центром. Например, имея 3­, 4­, 5­ или 15­угольник, легко по­ лучить 6­, 8­, 10­, 12­, 20­, 30­, 40­, 10 000­угольник и т. д. Но всё это многоугольники с четным числом вершин, а вот можно ли постро­ ить еще какой­нибудь многоугольник с нечетным числом вершин, кроме тех, что были известны Евклиду двадцать веков назад, до Гаусса никто не знал. y z1

z2 144° 72°

z0 +1

216°

z3

x

288°

z4 Рис. 1.6.1. Решения уравнения z5 - 1 = 0

Но Гаусс не выполнил фактического построения 17­угольника. Он только показал, что это можно сделать. Что это значит? Взгляни­ те на рис. 1.6.2, где показаны вершины правильного 17­угольника (естественно, равномерно расставленные) на единичной окружно­ сти с центром в начале координат (точке O). Две соседние верши­ ны обозначены P и S, а центральный угол между ними q. Точка T на радиусе OS получена опусканием перпендикуляра из P на OS. Ясно, что cos(q) = T, т. е., поскольку q = 2p/17 радиан, T = cos(2p/17). И вот что сделал Гаусс. Он показал, что отрезок T, т. е. cos(2p/17), можно построить с помощью циркуля и линейки. Но если положение точ­ ки T определено, то остается лишь восставить перпендикуляр из T,

66

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

чтобы найти P. Это, в свою очередь, определяет длину всех сторон 17­угольника, а  уж провести циркулем окружность для нахожде­ ния всех остальных вершин – и вовсе плевое дело.

P 1 O

q

T

S

cosq

Рис. 1.6.2. Правильный 17­угольник Гаусса

Но что означают слова «cos(2p/17) допускает построение»? А  просто то, что эту величину можно записать в  виде конечного выражения, включающего только операции сложения, вычитания, деления пополам и извлечения квадратного корня, поскольку все их можно выполнить с помощью циркуля и линейки[13]. Конкрет­ но, Гаусс показал, что

Вы сами легко проверите, что обе части действительно рав­ ны (по крайней мере, с  точностью до 16 знаков после запятой) 0.93247222940436. Это впечатляющее выражение определяет и по­ следовательную процедуру построения правильного 17­угольника

ПРАВИЛьНыЕ n­УГОЛьНИКИ И ПРОСТыЕ ЧИСЛА

67

циркулем и линейкой. Начав с отрезка единичной длины (радиуса окружности), мы легко продлим его до длины 17, извлечем квад­ ратный корень… Ну и так далее. Деление на 8 – это три последо­ вательных деления пополам, а деление на 16 требует еще одного деления пополам. Не слишком элегантно, но точку T мы все­таки определим[14]. После того как Гаусс доказал возможность построения правиль­ ного 17­угольника, стало понятно, что можно построить также 34­, 68­, 136­угольник и т. д. В своем труде «Disquisitiones Arithmeticae»*, опубликованном в 1801 году, Гаусс высказал предположение, что необходимым и достаточным условием возможности построения правильного n­угольника является представимость n в виде

где k – произвольное неотрицательное целое число (k = 0, 1, 2, 3, L), а F – различные простые числа Ферма, названные в честь гени­ ального французского математика Пьера Ферма (1601–1665). Чис­ ла Ферма имеют вид , где p – неотрицательное целое число. Если Fp оказывается простым, то мы имеем простое число Ферма. Сам Ферма показал, что при p = 0, 1, 2, 3, 4 действительно получаются простые числа, т. е. все числа

простые. Начиная с 1640 года Ферма полагал, что все Fp простые, и до конца жизни утверждал, что может это доказать. Но на самом деле никакого доказательства у него быть не могло, т. к. уже сле­ дующее число F5 простым не является: в  1732 году Эйлер нашел делители[15] числа F5 = 232 + 1. * «Арифметические исследования». Имеется русский перевод: Га­ усс К. Ф. Труды по теории чисел. М.: Изд­во АН СССР, 1959. – Прим. перев.

68

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

Античные построения Евклида для n = 3 и 5, очевидно, не про­ тиворечат приведенной выше формуле Гаусса – им соответствуют случаи k = 0, F0 и k = 0, F1. 17­угольнику самого Гаусса соответствует случай k = 0, F2. (Понятно, что только при k = 0 получаем нечетные значения n.) Хотя Гаусс утверждал, что его формула дает необходи­ мое и достаточное условие возможности построения n­угольника, сам он доказал только достаточность. Необходимость же была до­ казана лишь в 1837 году, когда французский математик и инженер Пьер Ванцель (1814–1848) установил, что если нечетные простые делители n не являются различными простыми числами Ферма, то правильный n­угольник построить невозможно. Так, например, мы теперь понимаем, что все попытки построить циркулем и ли­ нейкой правильный 7­угольник будут тщетны. Чуть более тонким является случай правильного 9­угольника, поскольку для k  = 0 можно написать 9 = 20 · 3 · 3 = 20 · F0 · F0. Но здесь нарушено условие Гаусса, согласно которому все делители F должны быть различны. Поэтому правильный 9­угольник тоже нельзя построить. После 17­угольника Гаусса следующий правильный n­угольник с простым n[16] – это 257­угольник, который наконец был построен в 1832 году немецким математиком Ф. Ю. Ришело (1808–1875). Если вы думаете, что только сумасшедший стал бы пытаться построить n­угольник с  бóльшим числом сторон, то ошибаетесь. Как писал профессор Клейн в своей книге «Famous Problems»: «Построению правильного многоугольника с 65 537 сторонами профессор Гермес из Лингена посвятил 10 лет жизни, исследуя все корни, получен­ ные методом Гаусса. Его труд хранится в архивах математического семинара в Гёттингене». Клейн имеет в виду немецкого школьно­ го учителя Иоганна Густава Гермеса (1846–1912), и  его рукопись 1894 года действительно по сей день хранится в  Гёттингенском университете. В заметке, опубликованной в вебе (5 декабря 2002), математик из университета Сан­Франциско Джон Стиллуэлл (John Stillwell), хорошо известный своими историческими исследовани­ ями предмета, поведал следующее занятное послесловие к  исто­ рии о рукописи Гермеса: Когда в  июле этого кода я  посетил Гёттинген, она все еще была там, и  в  довольно хорошем состоянии. Она хранится в  библиоте­ ке математического института, в специально для нее изготовлен­ ном чемодане, который называется «Koffer». Рукопись переплетена и  занимает примерно 200 больших листов размером со страницу

ПРАВИЛьНыЕ n­УГОЛьНИКИ И ПРОСТыЕ ЧИСЛА

69

газетного таблоида. Очевидно, Гермес сначала записывал результа­ ты на черновиках, а затем очень методично перенес их на страни­ цы книги. Почерк у него невероятно разборчивый (по сегодняшним стандартам), а  в  некоторых местах настолько мелкий, что невоо­ руженным глазом почти невозможно прочитать. Он также соста­ вил очень подробное описание построения циркулем и линейкой 15­угольника с кучей дополнительных окружностей; для чего – мне не вполне понятно. Я не представляю, что подвигло Гермеса на этот труд, но это не полный бред. По свидетельству коллег по Гёттинге­ ну, он был знаком с основами алгебраической теории чисел и, похо­ же, использовал ее в своих исследованиях, но не пришел к каким­ то определенным результатам. Вы не найдете выражение корня из единицы 65 537­й степени в терминах квадратных корней, на что я надеялся.

Конечно, остается еще задача построения самого большого (с наибольшим числом сторон) из ныне известных правильных нечетноугольников (возможно, существуют и  большие, перечи­ тайте примечания 15 и  16): с  F0F1F2F3F4  = 3 · 5 · 17 · 257 · 65 537  = 4 294 967 295 сторонами. Разумеется, визуально его нельзя будет отличить от окружности! Не думаю, что кто­нибудь рискнет за­ няться анализом этого случая, но, когда речь идет о «маньяках» от математики, ни в чем нельзя быть уверенным. Итак, вот вам вся история о допускающих построение n­угольниках. Но как все­таки Гаусс доказал, что 17­угольник допускает построение? Я полагаю, что ответить на этот вопрос лучше всего, показав, как его подход работает на более простом примере n = 5, посколь­ ку за деталями следить будет проще, а рассуждение переносится на случай n = 17. Для начала взгляните на рис. 1.6.3, где показан пятиугольник, вписанный в  единичную окружность с  центром в начале координат. Одна вершина лежит на горизонтальной оси, а остальные обозначены r, r2, r3 и r4, где r = eiq, а q = 2p/5 радиан – угол, который радиус­вектор r составляет с горизонтальной осью (разумеется, вершину на горизонтальной оси можно обозначить r0  = 1). Эти вершины равномерно расставлены по окружности и, потому, как было сказано в начале этого раздела, являются реше­ ниями уравнения z5 - 1 = 0:

И не забудем, что r5 = (ei2p/5)5 = ei2p = 1.

70

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

Далее, следуя по стопам Гаусса, составим две суммы A и B:

r = x + iy

r2

1 y

q x

1

r3

r4 Рис. 1.6.3. Правильный пятиугольник

Тогда AB = (r + r4)(r2 + r3) = r3 + r4 + r6 + r7. Но поскольку r6 = r · r5 = r · 1 = r и r7 = r2 · r5 = r2 · 1 = r2, то имеем AB = r + r2 + r3 + r4. Далее вспомним, что вообще такое r, r2, r3, r4 и 1 – это векторы в комплексной плоскости, все они имеют единичную длину и ис­ ходят из начала координат. Можете ли вы сказать, чему равна их сумма? Понимаете ли, что раз их длины и углы между ними одина­ ковы, то сумма равна нулю? То есть 1 + r + r2 + r3 + r4 = 0, откуда, конечно, следует, что r + r2 + r3 + r4 = -1. Таким образом,

ПРАВИЛьНыЕ n­УГОЛьНИКИ И ПРОСТыЕ ЧИСЛА

71

AB = -1. Заметим также, что A + B = r + r2 + r3 + r4, а это в точности то же самое, что AB! Итак, A + B = -1. Систему из этих двух уравнений легко решить относительно A и B; нам нужно знать только A:

В обозначениях рис.  1.6.3 мы видим, что координаты r и  r4 (разумеется, комплексно сопряженные) равны x + iy и x - iy соот­ ветственно. Из первоначального определения A имеем A = r + r4 = (x + iy) + (x - iy) = 2x, и, следовательно,

Вспомнив наше обсуждение допускающих построение (циркулем и линейкой) величин, вы сразу поймете, что x и есть такая величи­ на (разумеется, x равно cos(q) = cos(2p/5)). Таким образом, нужно сначала отложить x на горизонтальном радиусе, начиная от начала координат, затем восставить из полученной точки перпендикуляр, и точки его пересечения с окружностью дадут две вершины, соот­ ветствующие r и r4. А тогда мы уже легко построим весь пятиуголь­ ник! Это построение правильного 5­угольника циркулем и линейкой можно обобщить на правильный 17­угольник. Конечно, процеду­ ра несколько сложнее, но не безумно. Рассуждения аналогичны[17]. В  действительности Гаусс обобщил этот анализ на любой пра­ вильный Fp­угольник, где Fp – простое число Ферма, т. е. показал, что cos(2p/Fp) можно выразить, не прибегая ни к  чему сложнее

72

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

квадратных корней. Так, в  этом разделе мы уже убедились, что cos(2p/F1)  = cos(2p/5) и  cos(2p/F2)  = cos(2p/17) можно записать таким образом. (В случае cos(2p/F0)  = cos(2p/3) даже квадратных корней не нужно, потому что cos(2p/3) = -1/2, очевидно, допуска­ ет построение.) А  как насчет двух оставшихся (быть может, по­ следних) случаев: F3 = 257 и F4 = 65 537? Как выразить cos(2p/257) и cos(2p/65 537) через квадратные корни? Доказано, что реально применить метод Гаусса к  этим двум случаям выше человеческих сил. Но с  разработкой электронных компьютеров массивные вычисления перестали быть препятст­ вием. И действительно, программист Майкл Тротт (Michael Trott) написал для пакета Mathematica программу[18], реализующую метод Гаусса, которая вычисляет символические выражения для cos(2p/Fp). Сначала он протестировал код на выражениях для пер­ вых трех простых чисел Ферма, и результат совпал с известными фактами. Для F3 = 257 программа тоже успешно завершилась. Но осталась одна проблема – получающееся выражение оказалось та­ ким огромным, что его невозможно напечатать! Программа по­ казала, что выражение для cos(2p/257) содержит свыше пяти ты­ сяч квадратных корней и  занимает более 1  300  000 байт памяти (1.3 мегабайта), т. е. больше, чем все текстовые файлы, составляю­ щие эту книгу. Для cos(2p/65 537) результаты получились бы просто астрономическими – на что и  указал профессор Стиллуэлл в  за­ метке о рукописи Гермеса.

1.7. Последняя теорема Ферма и разложение комплексных чисел на множители В этом разделе я  хочу продолжить рассказ о  связи между ком­ плексными и  простыми числами, преимущественно в  истори­ ческом контексте. Начну с  задачи, которая, наверное, является самой знаменитой в  математике,  – последней теоремы Ферма, которая называется так не потому, что это последнее, что Ферма записал перед смертью, а потому, что это последняя из его гипо­ тез, остававшаяся недоказанной до 1995 года. История этой задачи настолько хорошо известна, что и повторять бы не стоило, но для полноты картины я все­таки конспективно перескажу ее. В 1670 году, спустя пять лет после смерти отца, сын Ферма Саму­ эль собрался напечатать новое издание «Арифметики» Диофанта

ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА И РАЗЛОЖЕНИЕ КОМПЛЕКСНыХ ЧИСЕЛ НА МНОЖИТЕЛИ

73

(ок. 250 года до н. э.). На самом деле оно было не просто переиз­ данием, потому что включало заметки, сделанные старшим Ферма на полях принадлежавшего ему экземпляра. Ферма записал на по­ лях много утверждений и гипотез и часто заявлял, что нашел дока­ зательство, – но не приводил его. Все эти утверждения и гипотезы были успешно проанализированы более поздними математиками, но обычно они оказывались по­настоящему трудными проблема­ ми. Приведу один пример и начну с цитаты из знаменитой био­ графической книги Э. Т. Белла «Men of Mathematics»*, вышедшей в 1937 году: Каждый, кто возился с числами, испытывал, вероятно, замешатель­ ство перед тем любопытным фактом, что 27 = 25 + 2. Суть заключена здесь в том, что 27 и 25 – точные степени, именно 27 = 33 и 25 = 52. Следовательно, мы замечаем, что уравнение y3 = x2 + 2 имеет реше­ ние в целых числах x и y; решение это таково: y = 3, x = 5. В качестве теста превосходства своего ума читатель может взять доказательство того, что единственная пара целых чисел, удовлетворяющих уравне­ нию. Такое доказательство не является легким. Оно, хотя и кажется детской вещью, требует бóльших способностей мышления, чем для постижения теории относительности (стр. 68 русского издания).

Вы, наверное, подумали, что это чересчур сильное утверждение, и, признаюсь, моя первая реакция на слова Белла была скептиче­ ской. Но теперь я  полагаю, что был неправ, и  скоро вы со мной согласитесь. Возможно, он и повинен в некотором преувеличении, но не слишком сильном. Продолжаю цитировать Белла: Уравнение y3 = x2 + 2 с ограничением, что его решение x и y – целые числа, есть неопределенное уравнение (т.  к. здесь больше неизвест­ ных, чем уравнений, именно два неизвестных x и y и одно связыва­ ющее их уравнение)… Без ограничения целочисленности нетрудно указать бесчисленное множество решений. Так можно придать x любое значение и затем определить y путем извлечения кубическо­ го корня из x2  + 2… Решение y  = 3, x  = 5 отыскивается подбором; сложность задачи состоит в доказательстве того, что нет никаких дру­ гих целых чисел x и y, удовлетворяющих уравнению. Ферма доказал, что их нет, но, как обычно, умолчал о своем доказательстве, которое нашли только много лет спустя после его смерти.

Белл не сообщил своим читателям, что доказательство было найдено Эйлером; оно появилось в  его книге «Алгебра», вышед­ *

Белл Э. Т. Творцы математики. М.: Просвещение, 1979.

74

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

шей в 1770 году, и в нем используются комплексные числа при раз­ ложении полиномов на множители. Ниже в этом разделе я приведу его, и вы убедитесь, что хотя оно исключительно изобретательное, некоторые его аспекты не понимал и сам Эйлер. На самом деле для их полного осмысления понадобилось еще почти сто лет. Еще одна заметка Ферма на полях «Арифметики» зажгла зна­ менитое пламя, горевшее свыше трехсот лет, пока в 1995 году его наконец не потушил Эндрю Уайлс. Вот текст этой заметки: Невозможно разложить куб на два куба, биквадрат на два биквадра­ та и  вообще никакую степень, большую квадрата, на две степени с тем же показателем. Я нашел этому поистине чудесное доказатель­ ство, но поля книги слишком узки для него[19].

То есть Ферма утверждал, что для любого целого n > 2 не су­ ществует решения уравнения xn + yn = zn в целых числах. В случае же n = 2 решений бесконечно много, как показал еще Пифагор! Действительно ли Ферма нашел доказательство? Точно никто не знает, но, поскольку в  доказательстве Уайлса[20] используются высшие разделы математики, открытые уже после смерти Фер­ ма, большинство математиков полагают, что в  какой­то момент он думал, что нашел доказательство, но потом обнаружил в  нем ошибку. Не подозревая, какой фурор вызовет публикация заме­ ток на полях его сыном, Ферма поленился впоследствии добавить опровержение или хотя бы просто зачеркнуть заметку (возможно, к тому времени он уже забыл про нее). Ферма действительно рас­ полагал элегантным доказательством для частного случая n  = 4, так называемым методом «бесконечного спуска». Обычно оно да­ тируется 1637 годом (это доказательство он таки записал в конце своего экземпляра «Арифметики», и его можно найти в любом хо­ рошем учебнике теории чисел). Также полагают, что он знал до­ казательство для случая n = 3 (хотя его так и не нашли), посколь­ ку к 1638 году он бросил вызов другим математикам, предложив решить уравнение x3  + y3  = z3. Это особенно интересно, так как является еще одной причиной полагать, что в 1638­м Ферма знал, что его заметка на полях была неправильной – если бы у него было общее доказательство для всех целых n, то к чему тратить время на частные случаи? После смерти Ферма прогресс шел по пути доказательства все новых частных случаев. В  1753 году Эйлер опубликовал доказа­ тельство для n = 3, оно содержало небольшой дефект, впоследствии

ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА И РАЗЛОЖЕНИЕ КОМПЛЕКСНыХ ЧИСЕЛ НА МНОЖИТЕЛИ

75

исправленный другими математиками. Он также прозорливо за­ метил, что его доказательство для n = 3 не имеет ничего общего с доказательством Ферма для n = 4 – в них были применены со­ вершенно разные подходы. Случай n  = 5 был решен в  1825 году совместными усилиями двадцатилетнего немецкого математика Лежёна Дирихле (1805–1859) – это была его первая опубликован­ ная работа! – и французского математика Адриена Мари Лежанд­ ра (1752–1833). В 1832 году Дирихле также доказал теорему Фер­ ма для n = 14. А в 1839­м французский математик Габриэль Ламе (1795–1870) сделал то же самое для n = 7. Этот последний результат особенно примечателен, поскольку он сделал доказательство Ди­ рихле для n = 14 «менее интересным». И вот почему. Предположим, что существуют целочисленные решения в слу­ чае n = 14, т. е. такие целые x, y и z, что x14 + y14 = z14. Это уравнение можно записать в  виде (x2)7  + (y2)7  = (z2)7. Если положить A  = x2, B = y2, C = z2, то, конечно, A, B и C будут целыми, потому что тако­ вы x, y и z, и мы имели бы A7 + B7 = C7. Но из доказательства Ламе следует, что это невозможно. Поэтому предположение о существо­ вании целочисленных решений для случая n  = 14 было ложным, а следовательно, доказательство Дирихле для этого случая – пря­ мое следствие доказательства Ламе для случая n = 7. То же рассуж­ дение проходит и для случая n = 6: если бы существовали целочис­ ленные решения уравнения x6 + y6 = z6, которое можно записать в виде (x2)3 + (y2)3 = (z2)3, то существовали бы и целочисленные ре­ шения уравнения A3 + B3 = C3, что, как доказал Эйлер, невозможно. Любопытно, что считающийся авторитетным «Словарь биографий ученых» приписывает французскому математику Жозефу Лиувил­ лю (1809–1882) сделанное в 1840 (!) году наблюдение о том, что из неразрешимости уравнения xn + yn = zn сразу же вытекает неразре­ шимость уравнения x2n + y2n = z2n. Трудно поверить, что этот факт (который устанавливается приведенными выше рассуждениями) не был известен до 1840 года. Доказательство Ламе для случая n  = 7 было очень сложным, и  дальнейшая охота за доказательствами для отдельных значе­ ний n, очевидно, никогда не закончилась бы  – целых чисел­то бесконечно много! Конечно, никто и не собирался перебирать все возможные значения n. Довольно быстро стало понятно, что рас­ сматривать нужно только простые n. Это легко показать, опираясь только на тот факт, что любое целое n ³ 3 либо является простым, либо делится на нечетное простое число, либо делится на 4. Дей­

76

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

ствительно, очевидно, что при делении целого числа на 4 получа­ ется остаток 0, 1, 2 или 3. Если остаток равен 0, то мы имеем слу­ чай делимости на 4. Для остальных трех случаев будем рассуждать следующим образом. Обозначая k некоторое целое число, имеем: если остаток равен  1, то число имеет вид 4k + 1, это нечетное число;  2, то число имеет вид 4k + 2 = 2(2k + 1), это четное число;  3, то число имеет вид 4k + 3, это нечетное число. В двух случаях, когда число нечетно, оно является либо нечет­ ным простым числом, либо составным числом и тогда может быть разложено в произведение нечетных простых чисел. В любом слу­ чае число делится на нечетное простое (быть может, на себя же). В случае, когда число четно, множитель 2k + 1 (разумеется, нечет­ ный) является либо простым числом, либо составным числом, ко­ торое можно разложить в произведение нечетных простых чисел. В любом случае множитель 2k + 1 (а значит, и само число) делится на нечетное простое число. И на этом предварительное утвержде­ ние о делимости доказано. Теперь предположим, что m – произвольное целое число (боль­ шее или равное 3). Как мы только что видели, m делится либо на 4, либо на нечетное простое число (быть может, само на себя, если m простое). В первом случае существует такое целое k, что m = 4k, так что уравнение xm + ym = zm принимает вид x4k + y4k = z4k или (xk)4 + (yk)4 = (zk)4. Или, полагая, как и раньше, A = xk, B = yk, C = zk, мы получаем, что A, B и  C – целочисленные решения уравнения A4  + B4  = C4. Но это невозможно в  силу доказательства Ферма для случая n = 4. Во втором случае, когда m делится на нечетное простое число, мы имеем m = kp, где p – это простое число, а k – некоторое целое. Тогда уравнение xm  + ym  = zm принимает вид (xk)p + (yk)p = (zk)p, и, как и прежде, мы нашли целочисленные реше­ ния A, B, C уравнения Ap + Bp = Cp. Ответ на вопрос, возможно это или нет, дает все та же последняя теорема Ферма, только теперь мы знаем, что степень p – простое число. Поскольку Ламе доказал теорему для p  = 7, следующий инте­ ресный случай – p = 11. Но теперь энтузиазма по поводу «обгры­ зания проблемы по краям» поубавилось, нужен был более общий подход. Довольно рано (в 1823 году) такой шаг был предпринят французской женщиной­математиком Софи Жермен (1776–1831). Она установила, что если p – простое число такое, что 2p + 1 тоже простое (как в случае p = 11), то при некоторых условиях гипотеза

ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА И РАЗЛОЖЕНИЕ КОМПЛЕКСНыХ ЧИСЕЛ НА МНОЖИТЕЛИ

77

Ферма истинна. Такие числа p называются простыми числами Жер­ мен, и до сих пор вопрос о том, конечно их число или нет, остается открытым (если конечно, то ее результат совсем не так интересен). Это был большой шаг вперед, но все еще далеко от разрешения ос­ новного вопроса, поставленного последней теоремой Ферма. Все доказательства частных случаев имели одну общую черту: в  каком­то месте они опирались на нахождение некоторого раз­ ложения многочлена на множители. Например, для n = 3 это тож­ дество x3 + y3 = (x + y)(x2 - xy + y2), для n = 7 – тождество (x + y + z)7 (x7 + y7 + z7) = 7(x + y)(x + z)(y + z)[(x2 + y2 + z2 + xy + xz + yz)2 + xyz(x  + y  + z)]. С  увеличением n такие тождества становятся все сложнее находить, поскольку вид тождества для одного n ничего не говорит о том, каким будет следующее. Напомним, что именно это наблюдение сделал Эйлер, когда обнаружил, что его доказа­ тельство для случая n  = 3 не имеет ничего общего с доказатель­ ством Ферма для случая n = 4. На заседании Парижской Академии наук в марте 1847 года Ламе заявил, что наконец­то решил задачу для всех показателей степени. Ламе заметил, что существует очень прямой и  общий способ разложить xn  + yn на n линейных множи­ телей, если мы готовы использовать комплексные числа. Как вы помните из обсуждения правильных n­угольников в предыдущем разделе, уравнение Xn - 1 = 0 имеет n корней 1, r, r2, L, rn-1, где r = e2p/n, т. е.

Теперь положим X = -x/y, тогда

или

или, что то же самое,

78

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

Как было сказано выше, нужно рассмотреть только случай, когда n – нечетное простое число (слово нечетное тут важно), а посколь­ ку (-1)нечетное = -1, то, сокращая yn в обеих частях, получаем:

Наконец­то мы получили общее разложение на множители (для нечетных n):

И все бы хорошо, но затем Ламе допустил ошибку. Ламе утверждал, что, поскольку правая часть является степенью n, то в  силу этого тождества все сомножители посередине (т.  е. (x + y), (x + ry) и т. д.), если они взаимно просты (что бы это ни озна­ чало в области комплексных чисел), должны сами по отдельности быть n­ми степенями. На множестве обыкновенных целых чисел это действительно так. То есть если целое число является n­й сте­ пенью, т. е. равно Nn, где N – целое, то можно написать N n = N · N · N L N, где N повторено n раз. Если теперь разложить N на простые множители, из теоремы о единственности разложения для целых чисел следует, что это можно сделать только одним способом, т. е. N = p1p2 L pr, где некоторые pi могут совпадать (т. е. сомножите­ ли могут повторяться). Таким образом, в произведении N · N · N L N каждый простой множитель будет встречаться n раз (по одному для каждого N), так что N n будет равно p1np2n L prn, и каждый такой множитель действительно является n­й степенью. Но в общем случае разложения xn + yn на комплексные множите­ ли, предложенного Ламе, это неверно. И действительно, как только Ламе изложил свою идею, Лиувилль сразу же опроверг ее имен­ но на этом основании. Разложение на комплексные множители не было новостью, и  Лиувилль напомнил Ламе о том, что Эйлер использовал такое же разложение несколько десятилетий назад. И как Ламе собирается узнать, что сомножители «взаимно прос­ ты», спросил Лиувилль. Впоследствии стало известно, что тре­ мя годами ранее, в 1844 году, немецкий математик Эрнст Куммер (1810–1893) доказал (правда, в  малопонятной публикации), что единственность разложения на комплексные множители не име­ ет места именно для тех полиномов[21], с помощью которых, как думал Ламе, удастся доказать последнюю теорему Ферма. Миру

ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА И РАЗЛОЖЕНИЕ КОМПЛЕКСНыХ ЧИСЕЛ НА МНОЖИТЕЛИ

79

пришлось еще 150 лет подождать решения, которое, как ошибочно думал Ламе, уже найдено. А когда оно, наконец, появилось, то было достигнуто совсем другими средствами. И в заключение этого раздела я хочу показать, как на множестве комплексных чисел может не выполняться свойство единственно­ сти разложения на простые множители. Единственность разложе­ ния не обязана нарушаться – например, в 1832 году Гаусс показал, что система комплексных чисел вида a + ib, где a и b – обыкновенные целые числа (так называемые гауссовы целые числа) обладает свой­ ством единственности разложения, но для каждой новой системы это свойство необходимо проверять. Один из способов обобщить гауссовы целые числа – рассмотреть все системы комплексных чи­ сел вида a + ib , где D – целое число, среди делителей которого нет полных квадратов (при D = 1 мы, конечно, получаем гауссовы целые числа, а случай D = 2 встречается в данном Эйлером дока­ зательстве гипотезы Ферма, касающейся целочисленных решений уравнения y3 = x2 + 2, которое я представлю в конце этого обсуж­ дения). Единственность разложения нарушается при D  = 6, что я  сейчас продемонстрирую на конкретном примере[22]. Итак, на­ чиная с этого момента, нас будут интересовать числа вида a + ib , где a и b – обыкновенные целые числа. Это множество я обозначу S. Очевидно, что все обыкновенные целые числа принадлежат S, нужно только положить b = 0. При сложении и умножении любых двух чисел из S мы получаем также число из S. Это довольно очевидно[23], но на всякий случай приведу доказательство:

А как насчет деления? Если A и B – любые два целых числа из S, то говорят, что A делит B, если в S существует такое целое число C, что B = AC. Таким образом, естественно возникает вопрос о прос­ тых числах в S. Чтобы разобраться, что такое простое число (в S), определим норму целого числа A из S, N(A). Знак ≜ ниже означает «по опре­ делению»:

80

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

Таким образом, норма A – это просто квадрат абсолютной ве­ личины A, и понятно, что N(A) – обыкновенное неотрицательное целое число. Норма позволяет нам ввести порядок на множестве комплексных чисел S. В отличие от обыкновенных вещественных чисел, которые упорядочены от -¥ до +¥ (от меньших к большим), не существует естественных причин сказать (например), что -3 + i3 больше (или меньше), чем 2  - i7. Обыкновенные вещественные числа располагаются на вещественной прямой, и порядок зависит от расстояния до начала координат. Абсолютная величина (в квад­ рате) обобщает эту идею с одномерной вещественной прямой на двумерную комплексную плоскость – упорядочение основывается на квадрате расстояния от комплексного числа до начала коор­ динат. Норма обладает тремя интересными нам свойствами, все они оказываются очевидными после пятисекундного размышления (знак Þ означает «влечет за собой»): (a) N(A) = 0 Þ A = 0 (т. е. a = 0 и b = 0); (b) N(A) = 1 Þ A = ±1 (т. е. a = ±1 и b = 0). Наконец, если B – также целое число из S, то (c) N(AB) = N(A)N(B). Это просто означает, что абсолютная величина произведения двух комплексных чисел равна произведению их абсолютных ве­ личин. А теперь посмотрим, какое отношение все это имеет к прос­ тым числам в S. Мы знаем, что все простые множители обыкновенного состав­ ного числа меньше этого числа и больше 1. И точно так же можно сказать, что все простые множители непростого целого числа A из S должны иметь норму, большую 1 и  меньшую нормы A. То есть если B = AC и B не является простым числом в S, то 1 < N(A) < N(B) и  1 < N(C) < N(B). В  противном случае B является простым. Это обобщение определения простого числа в множестве обыкновен­ ных целых чисел. Приведем несколько примеров. Является ли 10 простым числом в S? Нет, потому что 10 = 5 · 2 и обе нормы N(5) = 25, N(2) = 4 больше 1 и меньше N(10) = 100. Тут все просто! А число 2 – оно является простым в S? Предположим, что это не так и у него имеется два делителя A и B. Тогда 2 = AB, поэтому N(2)  = 4  = N(AB)  = N(A)N(B). Чтобы 2 не было простым числом, необходимо, чтобы N(A) и N(B) были больше 1 и меньше 4. Вспоминая, что норма – обыкновенное неотрицательное целое

ПОСЛЕДНЯЯ ТЕОРЕМА ФЕРМА И РАЗЛОЖЕНИЕ КОМПЛЕКСНыХ ЧИСЕЛ НА МНОЖИТЕЛИ

81

число, мы приходим к  выводу, что это возможно, только когда N(A) = N(B). Но это означает, что N(A) = 2 = a2 + 6b2, а данное урав­ нение не имеет решений в целых числах (что очевидно). Поэтому 2 – простое число в  S. Ну а  как насчет 5 – оно простое или нет? На этот вопрос мы ищем ответ таким же способом, предположив, что 5 не простое и записывается в виде 5 = AB. Тогда N(5) = 25 = N(A)N(B), и разложить 5 на множители можно, только если N(A) = N(B) = 5. А это значит, что N(A) = a2 + 6b2 = 5, что для целых чисел a и b невозможно. Значит, число 5 – тоже простое в S. И еще только один пример. Является ли число 2 + i простым в S (почему я выбрал именно это целое число, скоро станет ясно)? Снова предположим, что оно не простое и  записывается в  виде 2 + i  = AB. Тогда N(2 + i ) = 10 = N(AB) = N(A)N(B). Существует только две возможности: N(A) = 2, N(B) = 5 или N(A) = 5, N(B) = 2. Но мы уже показали, что в S не существует целых чисел с такими нормами. Поэтому 2 + i не может быть разложено на два мно­ жителя A и B и, стало быть, является простым в S. А теперь достаем из шляпы кролика. Выше мы видели, что 10 = 5 · 2, т. е. 10 является произведением двух простых чисел 5 и 2. Но ведь 10 = (2 + i ) · (2 + i ), т. е. является произведением двух других простых чисел. Свойство единственности разложения в S не имеет места[24]. Наконец, вот как Эйлер предвосхитил попытки не только Ламе, но и всех остальных применить комплексное разложение к реше­ нию проблем теории чисел. Напомним, что в 1770 году Эйлер по­ казал, что единственным целочисленным решением уравнения y3 = x2 + 2 является y = 3, x = 5. Для этого он воспользовался си­ стемой комплексных чисел a  + ib (в середине XVIII века она, безусловно, казалась загадочной почти всем). Эйлер разложил правую часть на множители

и утверждал (так же бездоказательно, как позднее Ламе), что каж­ дый множитель должен быть кубом, потому что их произведение – куб. В  частности, Эйлер решил, что должны существовать целые числа a и b такие, что

82

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

Поэтому

или

Приравнивая мнимые части этого равенства, получаем

Числа b и 3a2 - 2b2 целые, и их произведение равно 1. Это воз­ можно, только если b = ±1 и 3a2 - 2b2 = ±1, причем оба сомножи­ теля должны иметь одинаковый знак. Если b = +1, то 3a2 - 2b2 = 1, или 3a2 - 2 = 1, или 3a2 = 3, или a = ±1. А если b = -1, то имеем -(a2 - 2b2) = 1, или 3a2 - 2  = -1, или 3a2 = 1, что невозможно ни для какого целого a. Таким образом, b = +1 и a = ±1. Итак, приравнивая вещественные части равенства, обведенного рамкой, мы видим, что x = a3 - 6ab2 = a3 - 6a, поскольку b = +1. Если a = +1, то x = 1 - 6 = -5, а если a = -1, то x = -1 + 6 = +5. По­ скольку в исходное уравнение x входит в квадрате, знак x не играет роли; мы видим, что x = +5 – единственное положительное реше­ ние (а поэтому y3 = 27 или y = 3). Поэтому, говорит Эйлер, урав­ нение y3 = x2 + 2, как и предполагал Ферма, имеет единственное положительное решение (x, y) = (5, 3). Это убедительный анализ, но Эйлер (как и Ламе впоследствии) упустил из виду вопрос о един­ ственности разложения и необоснованно утверждал, что если про­ изведение двух комплексных чисел является кубом, то и каждый сомножитель должен быть кубом.

1.8. Разрывный интеграл Дирихле В начале последнего раздела этой главы я хочу, чтобы вы взглянули на следующее математическое выражение и честно спросили себя, мог ли кто­нибудь придумать его. Лично я думаю, что это равен­ ство до такой степени странное, что ни у кого просто не хватило бы

РАЗРыВНыЙ ИНТЕГРАЛ ДИРИХЛЕ

83

воображения для подобного подвига! Этот факт мог быть установ­ лен только в результате открытия. Вот это выражение, в котором w просто является фиктивной переменной интегрирования (пока):

где sgn(x) (произносится «сигнум x») – разрывная знаковая функция:

Поразительная формула в рамочке очень пригодится нам в гла­ ве 5, когда мы доберемся до импульсной функции и  преобразо­ вания Фурье, а  пока нас просто интересует, как ее вывести с  по­ мощью формулы Эйлера. Но напоследок сделаем одно замечание относительно функции sgn(x): формально можно написать

Если это непонятно, нарисуйте график функции abs(x) и посмот­ рите, чему равен его наклон при x < 0 и  x > 0. Таким образом, формально мы имеем любопытное выражение (которое вы долж­ ны тщательно осмыслить, потому что мы еще столкнемся с  ним в очень интересном вычислении в разделе 5.4):

Подумайте, сможете ли вы «объяснить» себе, почему оно не ли­ шено смысла. Начнем вычисление eiwx/wdw с  трюка  – определения функ­ ции g(y) в виде интеграла:

84

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

Вероятно, вам не очевидно, откуда взялась функция g(y); это и вправду не очевидно – потому и трюк! Мне неизвестна история данного подхода, но, как видите, он работает! Кто­то в прошлом оказался очень, очень умным. Если продифференцировать g(y), воспользовавшись правилом Лейбница для дифференцирования интеграла[25], то получим

или

Этот интеграл нетрудно взять, достаточно дважды применить интегрирование по частям. Получается

Если теперь проинтегрировать это выражение, то получим

где C – произвольная постоянная. Мы могли бы вычислить C, если бы знали значение g(y) в  какой­нибудь точке y. Немного пораз­ мыслив, вы поймете, что g(¥) = 0 (вспомните об интерпретации интеграла как площади под кривой, о том, как выглядит график sin(s)/s, и о том, как ведет себя e-sy при y ® ¥ для любого s ³ 0)[26]. Таким образом,

или C = p/2. Следовательно,

Полагая y = 0, мы получаем (поскольку tg-1(0) = 0) важный ре­ зультат (который первым вывел – вы ведь не удивлены, правда? – Эйлер):

РАЗРыВНыЙ ИНТЕГРАЛ ДИРИХЛЕ

85

Эта формула постоянно встречается в  математике, физике и технике. В последнем результате скрыт бриллиант, который сразу и  не видно. Но его легко вытащить на свет божий, и получится именно то, за чем мы охотимся. Если выполнить замену переменной s = kw, где k – некоторая постоянная (и, следовательно, ds = k dw), то при k > 0 получим

или

а не только для k = 1. Это довольно любопытно, но мы еще не за­ кончили. Предположим теперь, что k < 0, т. е. k = -l, где l > 0. Тогда

То есть мы получили (после замены l на k > 0, но это тривиаль­ ное изменение обозначений)

или, заменив k на x, чтобы привести обозначения в соответствие с первоначальными, имеем поистине замечательную формулу

86

ГЛАВА 1. КОМПЛЕКСНыЕ ЧИСЛА

Этот интеграл называется разрывным интегралом Дирихле. Он назван в  честь того же Дирихле, которого мы упоминали в  пре­ дыдущем разделе в  связи с доказательством последней теоремы Ферма для n = 5 и n = 14. Он получил этот результат до 1837 года. Поскольку подынтегральное выражение в интеграле Дирихле яв­ ляется четной функцией от w, то, воспользовавшись функцией sgn, можно написать

т. к. продолжение интервала интегрирования с [0, ¥) до (-¥, +¥) просто удваивает величину интеграла. На последнем шаге мы вновь применим формулу Эйлера. По­ скольку cos(wx)/w – четная функция от w, имеем

и потому

с чего мы и начали этот раздел. Конечно, при выводе мы использо­ вали довольно хитрые приемы, но результат правилен. Его можно проверить с помощью теоремы Коши об интегрировании на ком­ плексной плоскости (т. е. так называемого интеграла по контуру, см. конец примечания 12), все это подробно излагается во многих учебниках повышенного типа[27]. В разделе 5.4 мы увидим, как этот результат приносит большую пользу.

ГЛАВА 2 Путешествия в страну векторов

2.1. Обобщенное гармоническое блуждание Как отмечалось в первом разделе главы 1, один из фундаменталь­ ных интеллектуальных прорывов в  историческом понимании физического смысла i = наступил с осознанием того, что ум­ ножение на комплексное число тесно связано с поворотом на ком­ плексной плоскости. То есть умножение вектора, представляющего комплексное число, на eiq эквивалентно повороту этого вектора на угол q против часовой стрелки. Тут уместны дополнительные пояс­ нения, поскольку это элегантное свойство комплексных экспонент часто приносит серьезные дивиденды, давая возможность в  эле­ ментарных терминах сформулировать очень сложные проблемы. Например, в книге «An Imaginary Tale» я показал, как использовать идею поворота для решения загадки об «охоте за сокровищами» из знаменитой вышедшей в 1947 году книги Георгия Гамова «Раз, два, три… бесконечность»[1]. Эта глава посвящена гораздо более сложным проблемам, чем в книге Гамова, но и их удастся решить, в частности, благодаря идее о том, что «умножение – это поворот». Для разогрева, чтобы привыкнуть к  рассуждениям о  векторах в  терминах комплексных чисел и  особенно комплексных экспо­ нент, рассмотрим следующую задачу. Человек выходит из начала прямоугольной системы координат. Первый шаг единичной длины он делает в положительном направлении вещественной оси. Затем поворачивается против часовой стрелки на (положительный) угол q и делает второй шаг половинной длины. Потом снова поворачи­ вает на угол q и делает третий шаг длиной одна треть. Этот процесс продолжается бесконечно (к примеру, следующим будет шаг дли­

88

ГЛАВА 2. ПУТЕШЕСТВИЯ В СТРАНУ ВЕКТОРОВ

ной одна четверть после еще одного поворота на угол q). Если угол поворота q = 90°, то его путь будет выглядеть, как показано в левой верхней части рис. 2.1.1. Угол поворота 90°

Угол поворота 30°

Угол поворота 1°

Расстояние между конечной точкой и началом координат

5 4 3 2 1 0

0

100

200

300

Угол поворота (в градусах)

Рис. 2.1.1. Блуждание по комплексной плоскости

Первый шаг блуждания – вектор длины 1, составляющий нуле­ вой угол с  вещественной осью, т.  е. eiq  = 1. Второй шаг – вектор длины 1/2, составляющий угол q с  вещественной осью, т.  е. 1/2eiq. Третий шаг – вектор длины 1/3, составляющий угол 2q с веществен­ ной осью, т. е. 1/3ei2q. И так далее. Таким образом, если обозначить p(q) вектор «конечного положения» путника (назовем его конечной точкой), то

ОБОБщЕННОЕ ГАРМОНИЧЕСКОЕ БЛУЖДАНИЕ

89

Например, если q = 90° = p/2 радиан, то по формуле Эйлера

Для данного конкретного значения q это выражение можно вы­ числить в конечной форме. Из разложения ln(1 + x) (см. раздел 1.3) в ряд Маклорена мы знаем, что второй ряд равен 1/2ln(2), потому что

. Что же касается первого

ряда, то еще с  1671 года известно, что его сумма равна p/4 (этот результат мы выведем в главе 4). Поэтому расстояние от конечной точки путника до начала координат (при q = p/2) равно

Для q = 0 и q = 2p радиан (0° и 360°) очевидно, что путник движет­ ся вдоль положительной вещественной полуоси, так что конечная точка находится в  бесконечности; эти два частных случая я  буду называть гармоническими блужданиями[2]. Для всех q ¹ 0, 2p ясно, что физически обобщенное блуждание представляет собой спи­ раль, сходящуюся к конечной точке, которая удалена на конечное расстояние от начала координат (в правой верхней части рис. 2.1.1 показана эта спираль для угла q = 30°, а в левой нижней части – для q = 1°). Таким образом, |p(q)| < ¥ для всех q ¹ 0, 2p. Так как

то сходимость спирали означает, что обе эти суммы сходятся для всех q ¹ 0, 2p. Сейчас это очевидно из геометрической интерпрета­ ции сумм как вещественной и мнимой частей спирального блуж­ дания, но я полагаю, что доказать сходимость для почти всех q чис­ то аналитическими средствами было бы нетривиально.

90

ГЛАВА 2. ПУТЕШЕСТВИЯ В СТРАНУ ВЕКТОРОВ

Блуждания на рис. 2.1.1 изображены в разных масштабах. Чем меньше угол, тем больше спираль, как показано на графике в пра­ вой нижней части этого рисунка (очевидно ли вам априори, что этот график должен быть симметричен относительно вертикаль­ ной линии, соответствующей углу поворота 180°[3]?). Легко дога­ даться, что угол q = 180° дает блуждание, при котором расстояние от конечной точки до начала координат минимально, поскольку это блуждание сводится к колебаниям взад­вперед на веществен­ ной оси. При q = 180° мы имеем

и график в правой нижней части рис. 2.1.1 подтверждает, что эта величина действительно равна минимальному расстоянию от ко­ нечной точки до начала координат.

2.2. Полет птиц при дующем ветре В этом разделе комплексных чисел вообще не будет (хотя присут­ ствует понятие вектора); это «разогрев» для следующего раздела, где комплексные числа таки используются для решения похожих (но более сложных) задач[4]. Для начала предположим, что птица летит по прямой из точки A в точку B, а затем обратно в A. Расстоя­ ние между A и B равно d. Скорость птицы относительно земли при отсутствии ветра равна V. Очевидно, что время полета туда и об­ ратно в условиях безветрия равно T = 2d/V. Теперь предположим, что из A в B дует ветер со скоростью W (< V). Когда птица летит из A в B по ветру, ее скорость относительно земли равна V + W, а когда она летит обратно против ветра, скорость равна V  - W, поэтому полное время полета равно

ПОЛЕТ ПТИц ПРИ ДУЮщЕМ ВЕТРЕ

91

причем равенство достигается при W = 0. Таким образом, наличие ветра увеличивает время полета туда и обратно[5]. Предположим далее, что птица летит при таком же ветре (кото­ рый называется векторным полем), но не по прямой, взад­вперед, а по некоторой заранее заданной замкнутой двумерной траекто­ рии, которую мы обозначим C. Это означает, что теперь птица ле­ тит то по ветру, то против ветра, а еще и под постоянно изменяю­ щимся углом к ветру. Что тогда можно сказать о влиянии ветра на общее время полета? Как выясняется, очень много. Представим, что птица всегда пытается лететь вдоль прямой, проходящей через ее тело от хвоста до кончика клюва, а  вектор скорости относительно земли при отсутствии ветра равен V. Аб­ солютная величина V постоянна, но направление, конечно, из­ меняется. Если бы ветра не было, то этот вектор действительно определял бы направление движения птицы. Но если присутствует вектор скорости ветра W (будем считать его постоянным по ве­ личине и направлению в любой точке), составляющий некоторый угол с V, то мгновенное направление движения птицы определя­ ется векторной суммой V и  W. То есть движение птицы опреде­ ляется вектором скорости v = V + W, касательным к траектории C. Предположим, что мгновенный угол между W и v равен 0 (ко­ нечно, он изменяется в  зависимости от положения птицы на C). Из теоремы косинусов следует соотношение между v = |v|, V = |V| и W = |W| (см. рис. 2.2.1) V 2 = W 2 + v 2 - 2Wv cos(q), или v 2 - [2W cos(q)]v + W 2 - V 2 = 0.

v V (вектор, направленный от хвоста к клюву) q W (вектор ветра) Рис. 2.2.1. Птица и ветер

92

ГЛАВА 2. ПУТЕШЕСТВИЯ В СТРАНУ ВЕКТОРОВ

Это уравнение легко решить относительно v:

Очевидно, необходимо наложить требование V ³ W, чтобы квадратный корень был вещественным для всех q. На самом деле мы требуем строгого неравенства (V > W), чтобы всегда было v > 0. Это означает, что птица всегда летит вперед вдоль C, даже если ве­ тер дует прямо навстречу (а на замкнутой траектории такое обяза­ тельно случится в какой­то точке). Из того же требования следует, что нужно оставить только решение со знаком плюс, чтобы было v > 0 для всех V. Таким образом,

Дифференциал времени, необходимого птице, чтобы пролететь дифференциальный отрезок ds траектории C, равен dt = ds/v. Сле­ довательно, полное время облета C равно

где окружность в  символе ∮C означает, что мы складываем все дифференциалы времени ds/v по мере того, как птица летит по замкнутому контуру C. Итак,

Проекция дифференциала длины ds на (фиксированное) на­ правление скорости ветра равна cos(q)ds. Поскольку контур C зам­ кнутый (птица в конечном итоге возвращается в начальную точ­ ку), общая сумма всех бесконечно малых проекций должна быть равна нулю. Это значит, что ∮Ccos(q)ds = 0 и, следовательно,

ПАРАЛЛЕЛьНыЙ БЕГ

93

Но последний интеграл – это полное время полета по замкну­ тому контуру C в  отсутствие ветра, поэтому если ветер есть, то птица будет облетать C дольше. Это обобщает полученный ранее результат, когда птица летела либо по ветру, либо против ветра по прямому пути туда и обратно. Из этого результата есть забавное (и, я  думаю, неожиданное) следствие в  «реальном мире» спорта. На соревнованиях по лег­ кой атлетике есть общее правило – рекорд не засчитывается, если дул слишком сильный ветер (в лучшем случае ставится звездочка, означающая «при попутном ветре»). Причины кажутся очевид­ ными для таких дисциплин, как метание диска, молота и  копья, а  также для бега на короткие дистанции (если ветер дует в  спи­ ну атлета). Но наш результат показывает, что эта «очевидность» обманчива для дисциплин, где требуется пробежать целое число кругов по дорожке (любой формы). Действительно, если рекорд в  таком состязании установлен при постоянном ветре, дующем в любом направлении, то он должен быть засчитан, потому что при отсутствии ветра атлет показал бы еще лучший результат. Итак, с подготовительными примерами мы покончили, и теперь я  хочу продемонстрировать векторную задачу, в  которой ком­ плексные числа и  вращение векторов помогут найти ответ даже более удивительный, чем в примере выше.

2.3. Параллельный бег Недавно опубликованная математическая статья начинается сле­ дующим пассажем[6]: Все началось в тот день, когда я трусил по дорожке со своим верным псом Бродькой. Правда, на самом деле Бродька вовсе не бродит ту­ да­сюда. Он отлично выдрессирован и всегда бежит справа от меня ровно на ярд впереди. Если я  меняю направление плавно, то он идеально корректирует скорость и траекторию, так чтобы остаться в этом положении… Но в тот день наша тропинка была не прямой, а извилистой. Мы пробежали по ней несколько раз [см. рис. 2.3.11].

94

ГЛАВА 2. ПУТЕШЕСТВИЯ В СТРАНУ ВЕКТОРОВ

Место старта и финиша

Рис. 2.3.1. Прогулочная тропинка сложной формы

Поскольку обход тропинки на рисунке осуществляется по часо­ вой стрелке, очевидно, что Бродька (который бежит по внутрен­ нему параллельному пути справа от хозяина) пробегает меньшее расстояние. Затем автор заметки (разумеется, профессор мате­ матики) задает вопрос: «На сколько больше Бродьки я пробежал?» Ответ на этот вопрос почти всегда является неожиданностью для человека, который слышит его впервые, – настолько он прост. По­ казанная на рисунке дорожка выглядит такой запутанной и пере­ плетающейся – трудно поверить, что ответ будет гораздо проще. Однако мы можем предугадать ответ, рассмотрев для начала почти тривиальный частный случай. На рис. 2.3.2 показаны траектории двух бегунов, которые начи­ нают и заканчивают параллельную пробежку в одно и то же вре­ мя, причем один бежит по внутренней дорожке, проходящей по сторонам треугольника. Внешний бегун всегда находится на фик­ сированном расстоянии d от внутреннего. Чтобы удовлетворить этому требованию даже тогда, когда внутренний бегун находится в вершинах (A, B, C), внешний должен бежать по дуге окружности радиуса d. Поскольку бегуны стартуют и  финишируют одновре­ менно, необходимо, чтобы внешний бегун выполнял такие «по­ вороты» мгновенно (что едва ли возможно!), но это возражение мы пропустим мимо ушей (понятно, что всё это из­за того, что бегущий по сторонам треугольника меняет направление не «глад­ ко»). Нас ведь интересует только разность расстояний, пройден­ ных обоими бегунами. Глядя на рисунок, сразу можно сделать два наблюдения. Во­первых, на прямых участках оба бегуна преодоле­ ли одно и то же расстояние. Во­вторых, внешний бегун пробежал

ПАРАЛЛЕЛьНыЙ БЕГ

95

одну полную окружность радиуса d, выполнив три поворота (по­ скольку q + b + g = 360°). Общая длина поворотов и есть источник дополнительного расстояния, пройденного внешним бегуном. Поэтому внешний бегун пробежал ровно на 2pd больше внутрен­ него, и это значение не зависит от длины стороны треугольника. А единственное, что важно, – параметр d, постоянное расстояние между двумя бегунами. g

C

A q

B d

b

Рис. 2.3.2. Параллельный бег по треугольной дорожке

А хорошо было бы, если бы этот результат сохранился и для тро­ пинки сложной формы на рис. 2.3.1? Но так оно и есть (обычно!). При выполнении очень общих условий разность расстояний, прой­ денных собакой и  ее хозяином, равна произведению дистанции между ними на полный угол поворота вектора, касательного к тра­ ектории бегущего. Приведенный выше результат для треугольной дорожки на рис. 2.3.2, конечно, является частным случаем, в кото­ ром полный угол поворота касательного вектора, очевидно, равен 2p (касательный вектор совершает один полный поворот на пути от старта к финишу).

96

ГЛАВА 2. ПУТЕШЕСТВИЯ В СТРАНУ ВЕКТОРОВ

Как можно доказать, что разность пройденных расстояний за­ висит только от дистанции и  угла поворота, касательного к  тра­ ектории вектора? С треугольной дорожкой проблем не возникло, потому что у  нее очень простая геометрия. Но в  общем случае дорожка может быть куда более сложной, с извивами и петлями. И как же учесть эту потенциальную сложность? Ключом являются комплексные числа и интерпретация поворота вектора как умно­ жения на i = . Для начала взглянем на рис. 2.3.3, где показан некоторый учас­ ток траектории C нашего бегуна (до собаки тоже доберемся чуть позже). Точка O является началом координат, а вектор r(t), соеди­ няющий O с точкой на C, определяет положение бегуна в момент t. Вектор r(t) составляет угол q(t) с горизонтальной осью, проходящей через O. Таким образом, если x(t) и y(t) – координаты бегуна в мо­ мент t, то имеем

T(t)

N(t) f(t)

r(t) q(t) O C траектория бегуна Рис. 2.3.3. Определение обозначений

Вектор скорости бегуна равен r¢(t), где штрих обозначает диф­ ференцирование по t:

ПАРАЛЛЕЛьНыЙ БЕГ

97

Абсолютная величина вектора скорости – это скорость бегуна. Если проинтегрировать ее по t вдоль пути C, то получится пройден­ ное расстояние:

И наконец, единичный касательный вектор к C обозначается T(t), где

Эта формула верна, потому что вектор скорости r¢(t) является касательным к C, поэтому деление r¢(t) на его же абсолютную ве­ личину дает вектор единичной длины, направленный так же, как r¢(t). Следовательно, r¢(t) = T(t) |r¢(t)|. (Заметим, что вектор T(t) без­ размерный.) И наконец, чтобы закончить с предварительным определением системы обозначений, представим себе, что мы повернули вектор r¢(t) на 90° против часовой стрелки и получили вектор, перпенди­ кулярный (нормальный) к T(t). То есть умножим r¢(t) на i – получит­ ся ir¢(t) = i[x¢(t) + iy¢(t)] = -y¢(t) + ix¢(t). Разделив этот вектор на его длину, мы получим единичный нормальный вектор N(t) (показан­ ный на рис. 2.3.3), который направлен влево от бегуна:

Как и T(t), этот вектор безразмерный. N(t), конечно, нужен нам, для того чтобы написать математическое выражение, определяю­ щее положение собаки. Поскольку собака находится справа от бе­ гуна, вектор ее положения равен

где a представляет постоянную дистанцию между собакой и  хо­ зяином (в исходной постановке задачи a равно одному ярду).

98

ГЛАВА 2. ПУТЕШЕСТВИЯ В СТРАНУ ВЕКТОРОВ

Далее, не пытаясь объяснить прямо сейчас, зачем нужно следую­ щее вычисление (скоро вы это поймете), найдем выражение q¢(t), скорости изменения угла между вектором положения бегуна и го­ ризонтальной осью. Так как

дифференцирование по t дает (напомним, что q, x и  y являются функциями от t)

Но

поэтому

то есть

Зачем мы это сделали? Вопрос разумный, потому что вообще­то сама величина q¢ для решения поставленной задачи нам не нужна. Напомним, что для решения нужно знать полный угол поворота вектора, касательного к траектории (а q – угол вектора положения бегуна). То есть нас интересует не q(t), а f(t) – угол между T(t) и го­ ризонтальной осью. Но не переживайте – все это сделано не без причины. А причина в том, что вычислить q¢(t) просто, а зная q¢(t),

ПАРАЛЛЕЛьНыЙ БЕГ

99

мы легко найдем и  f¢(t). И  вот как. Начнем с того, что выпишем выражение, определяющее T(t):

где

Таким образом,

Задумаемся, что мы здесь имеем. А имеем мы вектор с компо­ нентами c(t)x¢(t) и c(t)y¢(t), который составляет угол f(t) с горизон­ тальной осью. Но ранее мы вычислили q¢(t)  – производную угла, который составляет с горизонтальной осью вектор с компонента­ ми x(t) и y(t). Разница только в компонентах. Поэтому мы можем подставить c(t)x¢(t) и c(t)y¢(t) вместо x(t) и y(t) в уравнение для q¢(t) и получить f¢(t). Таким образом,

или

Теперь вспомним, что

Получаем

100

ГЛАВА 2. ПУТЕШЕСТВИЯ В СТРАНУ ВЕКТОРОВ

что после несложных алгебраических преобразований сводится к

то есть

Вспомним также, что вектор положения собаки, которая всегда находится справа от бегуна на постоянной дистанции, равен d(t) = r(t) - aN(t). Таким образом d¢(t) = r¢(t) - aN¢(t) = r¢(t) + af¢(t)T(t). Однако ранее мы получили r¢(t) = T(t) |r¢(t)|, и, следовательно, d¢(t) = T(t)|r¢(t)|  + af¢(t)T(t) = {|r¢(t)|  + af¢(t)}T(t). Скорость собаки равна абсолютной величине d¢(t), т. е. |d¢(t)| = |{|r¢(t)| + af¢(t)}T(t)|, а т. к. абсолютная величина произведения равна произведению аб­ солютных величин, то |d¢(t)| = |{|r¢(t)| + af¢(t)}| |T(t)|. Теперь вспомним, что T(t) – единичный касательный вектор к C, т. е. |T(t)| = 1, и, наконец, получаем |d¢(t)| = |{|r¢(t)| + af¢(t)}|. Теперь сделаем предположение, обоснование которого я отложу до завершения анализа: что |r¢(t)| + af¢(t)| ³ 0 для всех t. Тогда ско­ рость собаки принимает вид |d¢(t)| = |r¢(t)| + af¢(t), где – не забывайте – скорость бегуна равна |r¢(t)|. Если проинтег­ рировать скорость на любом временном интервале, то получится расстояние, пройденное за это время. Поэтому, обозначив расстоя­ ния, пройденные бегуном и  собакой за время от 0 до , соответ­ ственно LR и LD, получаем

ПАРАЛЛЕЛьНыЙ БЕГ

101

В начале пробежки f(0) = 0. Взглянув на рис. 2.3.1, мы увидим, что на пути от старта к финишу касательный вектор к C сделал пол­ тора оборота по часовой стрелке, т.  е. f( )  = -3p. Так что если a равно одному ярду, то LR = LD + 1 · {0 - (-3p)} = LR + 3p. Таким образом, бегун преодолел на 3p ярдов больше, чем собака. И последний момент: как быть с  предположением о  том, что |r¢(t)| + af¢(t)| ³ 0? Его физический смысл станет ясен, если вспом­ нить, что радиус кривизны R(t) в  любой точке траектории бегуна равен

Понятие радиуса кривизны (введенное Ньютоном еще в 1671 го­ ду) определено в  каждой точке кривой – это радиус окружности, которая «наиболее тесно прилегает» к кривой в данной точке. Ве­ личина, обратная радиусу кривизны, называется кривизной. На­ пример, прямую линию можно считать окружностью бесконечно­ го радиуса, поэтому кривизна прямой равна величине, обратной бесконечности, т. е. нулю. А окружность, «наиболее тесно прилега­ ющая» к данной окружности, – это сама данная окружность, сле­ довательно, радиус кривизны окружности равен ее радиусу, а по­ скольку радиус окружности постоянен, то постоянна и кривизна. Вывод приведенной выше формулы для R(t) можно найти в любом учебнике математического анализа. Радиус кривизны может быть как положительным, так и отрица­ тельным; он отрицателен, когда траектория поворачивает по часо­ вой стрелке, и положителен при повороте против часовой стрелки. (и вспоминая об­ Поскольку, как мы уже знаем, |r¢(t)| = веденное рамкой выражение для f¢(t)), сразу получаем, что

102

ГЛАВА 2. ПУТЕШЕСТВИЯ В СТРАНУ ВЕКТОРОВ

Если |r¢(t)| + af¢(t) < 0, то |r¢(t)| < -af¢(t). Абсолютная величина, конечно, не может быть отрицательной, поэтому условие |r¢(t)|  + af¢(t) < 0 эквивалентно тому, что 0 < |r¢(t)| < -af¢(t). (Так  как из физического смысла a вытекает, что a > 0, это означает, что f¢(t) < 0.) Из левой части этого двойного неравенства следует, что R(t) < 0, а из правой части – что -a < R(t). Таким образом, -a < R(t) < 0. Как видим, R(t) отрицательно, поэтому условие |r¢(t)| + af¢(t) < 0 означает, что бегун поворачивает по часовой стрелке (в направ­ лении собаки) с  радиусом кривизны, меньшим разделяющей их дистанции (по мере того как радиус кривизны уменьшается, по­ ворот становится круче). Если такое происходит, то наш простой результат уже неприменим, об этом писал и автор задачи (см. еще раз примечание 6). Я поворачивался бы к Бродьке так резко, что он не успел бы компен­ сировать это замедлением. Вместо этого ему пришлось бы провер­ нуться на месте вокруг своей оси (быть может, не на полный круг), чтобы сохранить идеальную дистанцию до меня. Наша простая формула (разности расстояний, преодоленных бегуном и  его соба­ кой) в этом случае неприменима. Читателю предлагается подумать, что будет, если, например, я стану бегать по кругу радиусом мень­ ше ярда, а Бродька будет сохранять дистанцию один ярд, оставаясь справа от меня.

Последнее предложение – само по себе хорошая задача. Автор не дал ответа, но его нетрудно найти, поэтому я оставляю вам воз­ можность поразмыслить самостоятельно (ответ приведен в  по­ следнем разделе этой главы).

2.4. Кошки-мышки В предыдущем разделе мы использовали идею комплексного век­ тора для решения задачи о параллельном беге. Те же идеи можно применить к решению исторически важной задачи о преследова­ нии. Предположим, что мышка внезапно натолкнулась на дрем­ лющую кошку и, испугавшись, начала бежать по кругу с центром в  месте нахождения кошки (мыши не отличаются глубоким ин­

КОШКИ­МыШКИ

103

теллектом!). Кошка просыпается и, обнаружив, что обед рядом, пускается в погоню. Кошке интересен вопрос: смогу ли я поймать мышь? Мышь, естественно, обеспокоена похожим вопросом: смо­ гу ли я убежать от кошки? Математическая постановка подобных задач восходит к 1732 го­ ду, когда французский математик и гидрограф Пьер Бугер (1698– 1758) опубликовал свой анализ весьма животрепещущей на тот день проблемы  – определить траекторию, которую должен вы­ брать пиратский корабль, преследующий торговое судно, идущее по прямой на всех парусах. Но мы вернемся к нашей голодной кош­ ке и ее добыче (траектория движения которой – окружность – бо­ лее сложна, чем траектория торгового судна). Как мы увидим, для математического анализа проблемы кошки и  мышки очень по­ лезными окажутся комплексные числа, ассоциированные с ними векторы и формула Эйлера. Но сначала несколько предположений. Обозначив кошку и мышку соответственно C и M, примем за на­ чальный момент (t  = 0) время пробуждения кошки. Далее будем считать, что радиус окружности, по которой бежит мышь, равен единице. Это не ограничивает общность, поскольку мы вправе из­ мерять длины в  любых единицах. Будем рассматривать систему координат, в  которой мышь (точка M) в  момент t  = 0 находится в  точке с  координатами (1, 0) и  бежит по кругу против часовой стрелки с  постоянной единичной скоростью. Повторим, все эти предположения никак не ограничивают общность анализа – что касается предположения о  скорости, так мы просто будем выра­ жать скорость кошки (которая тоже считается постоянной) в еди­ ницах, равных скорости мыши: скорость «медленной» кошки меньше единицы, а скорость «быстрой» – больше. И последнее предположение: мы должны выбрать стратегию, которой кошка придерживается во время погони. В предположе­ нии, что жизненный принцип кошки  – делать то, что приносит немедленное удовольствие, будем считать, что киска выбирает стратегию чистого преследования, т. е. в каждый момент времени бежит прямо в направлении места, где сейчас находится мышка. Стало быть, вот что мы имеем: C – точка, преследующая M, такова, что вектор скорости C всегда указывает на текущее положение M, и векторы скорости C и M постоянны. Абсолютная величина век­ тора скорости C  – это скорость кошки s, а  абсолютная величина вектора скорости мыши, конечно, равна 1. Если обозначить m(t) положение мыши в момент t, то будем иметь

104

ГЛАВА 2. ПУТЕШЕСТВИЯ В СТРАНУ ВЕКТОРОВ

что согласуется с  нашим предположением о  том, что в  момент t = 0 мышь находится в точке (1, 0). Заметим также, что по мере увеличения t угол m(t) тоже увеличивается, т.  е. m(t) вращается против часовой стрелки. И наконец, вектор скорости мыши равен

так что скорость мыши действительно постоянна, потому что

Что касается кошки, запишем ее вектор положения в виде c(t) = x(t) + iy(t). Тогда, как показано на рис. 2.4.1, из геометрии задачи следует, что вектор из C в M должен быть равен eit - c(t). Поскольку C всегда бежит в направлении M, вектор скорости C всегда указывает на M, и, как мы только что показали, этот вектор равен eit - c(t). Чтобы вычислить абсолютную величину вектора скорости кошки, снача­ ла заметим, что единичный вектор (напомним, что в предыдущем разделе мы договорились, что длина единичного вектора равна 1) в направлении от C к M – это просто вектор eit - c(t), поделенный на его длину:

Поскольку вектор скорости кошки должен иметь длину s, мы мо­ жем записать его в виде

Воспользуемся формулой Эйлера, чтобы раскрыть eit:

КОШКИ­МыШКИ

105

M eit – c(t) eit C c(t)

Рис. 2.4.1. Геометрия преследования мышки кошкой

Если теперь приравнять вещественные и мнимые части, то по­ лучится такая система двух дифференциальных уравнений:

где

106

ГЛАВА 2. ПУТЕШЕСТВИЯ В СТРАНУ ВЕКТОРОВ

Аналитически решить эту систему и  найти x(t) и  y(t), по­види­ мому, невозможно, во всяком случае я  этого не умею! Но с  по­ мощью компьютера не так уж трудно получить численные ре­ зультаты для любого заданного s – понадобится только хороший язык программирования (например, MATLAB) и не бог весть какой сложный подход к  аппроксимации производных отношениями очень малых (но ненулевых) приращений, т. е. для фиксированно­ го малого значения Dt имеем

Таким образом, для заданных начальных значений t, x и  y мы запишем пару дифференциальных уравнений в виде

а затем вычислим новые значения x, y и t по формулам

Если повторить этот процесс достаточно много раз (в предполо­ жении, что ошибки округления накапливаются не сильно), то мож­ но будет нанести значения x и  y и  увидеть траекторию кошки[7]. Одновременно можно нанести траекторию мышки, поскольку мы уже знаем ее положение в каждый момент времени (на окружно­ сти). Два таких графика показаны на рис.  2.4.2 и  2.4.3, в  каждом Dt = 0.001 секунды. Рисунок 2.4.2 соответствует «быстрой» кошке, которая бегает в 1.05 раза быстрее мышки; эта кошка в конечном итоге поймает мышку (программе для MATLAB потребовалось 2500  итераций для генерации этого рисунка, так что модельное время преследования равно 2.5 секунды). А рис. 2.4.3 показывает, что «медленная» кошка, скорость которой составляет 0.9 от ско­ рости мышки, никогда не догонит мышь – ее траектория быстро становится круговой, так что она всегда будет отставать от мышки.

КОШКИ­МыШКИ

1.2 1.0 0.8 0.6

y 0.4 0.2 0 –0.2 –0.8

–0.6

–0.4

–0.2

0

0.2

0.4

0.6

0.8

x

Кошка бежит в 1.05 раза быстрее мышки Рис. 2.4.2. «Быстрая» кошка преследует мышь

0.8 0.6 0.4 0.2

y

0 –0.2 –0.4 –0.6 –0.8 –1.0

–0.5

0

0.5

1.0

Скорость кошки составляет 0.9 скорости мышки Рис. 2.4.3. «Медленная» кошка преследует мышь

x

107

108

ГЛАВА 2. ПУТЕШЕСТВИЯ В СТРАНУ ВЕКТОРОВ

2.5. Решение задачи о бегущей собаке Пусть человек бежит по круговой траектории (с центром в начале координат) радиуса A, а его собака держит дистанцию 1 ярд, оста­ ваясь справа от него. Параметрические уравнения круговой траек­ тории бегуна можно записать в виде x(t) = -A cos(t), y(t) = A sin(t). Эти уравнения описывают бег по часовой стрелке по окружно­ сти радиуса A, который начинается (в момент t = 0) в точке x = -A, y = 0 и позже возвращается в исходную точку. Пользуясь уравне­ ниями, выведенными в разделе 2.3, мы можем записать вектор по­ ложения человека в виде r(t) = -A cos(t) + iA sin(t) = A[-cos(t) + i sin(t)], и потому r¢(t) = A[sin(t) + i cos(t)], из чего следует, что |r¢(t)| = 0. А также следует, что

и, значит,

И наконец, вектор положения собаки d(t) = r(t) - aN(t) (напом­ ним, a = 1 ярд), поэтому

Изучая этот последний результат при разных значениях A, мы обнаруживаем очень интересное поведение. Во­первых, если A > 1 (человек бежит по «большому» кругу), то для множителя (1 - 1/A) имеют место неравенства 0 < (1 - 1/A) < 1, и собака просто бежит (оставаясь всегда в  одном ярде справа от хозяина) по меньшему кругу, целиком находящемуся внутри первого. Если мы теперь бу­ дем уменьшать A, то при A = 1 d(t) = 0, т. е. собака не бежит вовсе, а  просто топчется на месте, оставаясь в  начале координат! Если

РЕШЕНИЕ ЗАДАЧИ О БЕГУщЕЙ СОБАКЕ

109

же A < 1, то -¥ < (1 - 1/A) < 0. Раз этот множитель отрицателен, то d(t) направлен противоположно r(t): характер задачи внезапно и кардинально изменился, потому что при A < 1 человек и собака уже не бегут вместе: они находятся по разные стороны от начала координат! Например, в частном случае A = 1/2, когда d(t) = -r(t), мы имеем не параллельный бег, а преследование: человек и собака бегут по одному и тому же кругу, разделенные половиной окруж­ ности (не совсем ясно, кто кого преследует!), и  при этом собака по­прежнему находится справа от человека на расстоянии одного ярда. Случай еще меньшего A (A < 1/2) показан на рис. 2.5.1, тут радиус окружности, по которой бежит человек, равен A, а той, по которой бежит собака,  – |A(1  - 1/A)|. Абсолютная величина нужна, пото­ му что радиус всегда должен быть неотрицательным, а величина 1 - 1/A отрицательна. Заметим, что при A < 1

поэтому расстояние между бегуном и его собакой по­прежнему со­ ставляет один ярд, поскольку A + (1 - A) = 1. Но, пожалуй, самое удивительное заключается в том, что теперь по большему кругу бе­ жит собака, а не человек! И наконец, при дальнейшем уменьшении A вплоть до обращения в ноль мы видим, что теперь остановил­ ся в начале координат и топчется на месте, поворачиваясь вокруг своей оси, человек (как собака в  случае A  = 1). При A  = 0 собака бежит по кругу (радиуса 1 ярд) вокруг неподвижного (крутящегося на месте) человека. Из всего сказанного мы заключаем, что наш первоначальный результат – что расстояние, пройденное человеком, больше прой­ денного собакой на 2p, умноженное на количество оборотов по ча­ совой стрелке, совершаемых вектором T(t), – неверен при A < 1. Для круговой траектории количество оборотов T(t), очевидно, равно 1 при любом A; и  наша формула показывает, что полное расстояние, преодоленное человеком, на 2p ярдов больше, чем преодоленное собакой, для любого A. Но при A < 1 мы видим, что человек пробегает расстояние LR = 2pA, а собака – LD = 2p(1 - A). Таким образом, LR - LD = 2pA - 2p(1 - A) = 4pA - 2p = 2p(2A - 1),

110

ГЛАВА 2. ПУТЕШЕСТВИЯ В СТРАНУ ВЕКТОРОВ

т. е. меньше 2p, т. к. A < 1. На самом деле при A < 1/2LR - LD < 0, т. е. большее расстояние пробегает собака, а не человек (что ясно вид­ но на рис. 2.5.1).

человек A

1–A

собака A < 1/2 Рис. 2.5.1. Геометрия бега человека по «маленькому» кругу (A < 1/2)

ГЛАВА 3 Иррациональность p2

3.1. Иррациональность p Все новые и  новые знаки числа p ищут уже несколько веков, но вопрос о  его иррациональности, похоже, встал лишь во времена Эйлера. Только в 1761 году швейцарский математик Иоганн Лам­ берт (1728–1777) наконец доказал, что p действительно иррацио­ нально. Доказательство Ламберта основывалось на том факте, что tg(x) иррационально, если x ¹ 0 рационально. Поскольку tg(p/4) = 1 иррациональным не является, значит, p/4 не может быть рацио­ нальным, а  потому и  p должно быть иррациональным. Ламберт, который некоторое время работал вместе с Эйлером в Берлинской академии наук Фридриха Великого, начал доказательство с того, что вывел разложение[1] tg(x) в непрерывную дробь:

Однако вывод Ламберта был далеко не безупречен, а по­настоя­ щему строгое математическое доказательство было опубликова­ но только в  1808 году в  седьмом издании книги «Элементы гео­ метрии» французского математика Адриена Мари Лежандра (1752–1833). Лежандр доказал, что иррационально не только p, но и p2. Ну а если p2 иррационально, то таковым же должно быть и p. иррационально, но его квадрат, (Обратное неверно, например

112

ГЛАВА 3. ИРРАцИОНАЛьНОСТь p2

очевидно, нет.) Действительно, если бы p было рационально, т. е. существовали бы такие целые p и q, что p = p/q, то p2 = p2/q2, а это тоже отношение двух целых чисел, и, стало быть, p2 было бы ра­ циональным. Но коль скоро доказано, что p2 иррационально, то мы получили противоречие, следовательно, само p не может быть рациональным. Лежандр подозревал, что иррациональность p фундаментально отлична от иррациональности , и  написал в  своей книге: «Ве­ роятно, p даже не принадлежит множеству алгебраических ир­ рациональностей (как ), но строго доказать это утверждение, по­видимому, очень трудно»[2]. И действительно, лишь в 1882 году немецкий математик Фердинанд Линдеман (1852–1939) пока­ зал, что p трансцендентно (с помощью формулы Эйлера). Задача о трансцендентности удивительна тем, что большинство вещест­ венных чисел трансцендентны[3], но, как ни странно, доказать трансцендентность конкретного числа обычно очень трудно (что и отметил Лежандр для p). Это осознал немецкий математик Давид Гильберт (1862–1943), который в 1900 году представил математи­ ческому миру список 23 нерешенных проблем. Под номером семь в этом знаменитом списке[4] значится изучение проблемы транс­ цендентности и, в частности, определение характера числа . В 1920 году российский математик Александр Гельфонд (1906– 1968) добился некоторого прогресса, доказав трансцендентность чисел вида ab, где a ¹ 0 или 1, но является алгебраическим, а b = i , где c – положительное целое число, не являющееся полным квад­ ратом. В  1930 году его коллега Родион Кузьмин (1891–1949) рас­ пространил это утверждение на случай, когда b = вещественно. Таким образом, результат Кузьмина дает положительный ответ на конкретный вопрос Гильберта – трансцендентно. И  наконец, в 1936 году немецкий математик Карл Зигель (1896–1981) показал, что ab (a ¹ 0 или 1, но является алгебраическим, а  b не является вещественным и  рациональным) всегда трансцендентно[5]. Важ­ ный частный случай – a  = i (это алгебраическое число, см. при­ мечание 2) и b = -2i (очевидно, не вещественное число). Тогда i-2i должно быть трансцендентным. Но по формуле Эйлера

Таким образом, ep трансцендентно (природа «похожих» чисел, например pe, pp, ee, e + p и pe, по­прежнему неизвестна).

ИРРАцИОНАЛьНОСТь p

113

А теперь, прежде чем переходить к математике, немного фило­ софии. Так ли важно, что число p иррационально? Нужно ли физи­ кам или инженерам знать его значение с большим числом знаков, чем, скажем, 3.14159265 (или даже совсем грубого приближения, которому часто учат в  школе, – 22/7)? Пожалуй, нет. Как говорит водопроводчик в книге «Kandelmanʼs Krim»: Ныне водопроводчиками признано и вбивается в головы всех уче­ ников, что длина окружности трубы находится путем умножения ее диаметра на p… Конечно, я прекрасно знаю, что p иррационально, но на работе p равно 31/7 или 3, если я тороплюсь[6].

Но вопрос об иррациональности – это не вопрос точности, а са­ кральная проблема. Как писал один математик в книге, рассчитан­ ной на непрофессиональную аудиторию[7]: Какая разница, рационально p или иррационально? Математик, столкнувшийся с  [этим] вопросом, находится примерно в  том же положении, что композитор, которому задает вопрос человек, ли­ шенный слуха. Почему мы выбираем какие­то наборы нот, и все му­ зыканты их повторяют, а другие отбрасываем как бесполезные? На этот ответ трудно ответить – можно лишь сказать, что в этих нотах скрыта гармония, приятная нашему слуху. Конечно, какие­то части математики приносят практическую пользу. [Далее упоминается применение логарифмов, дифференциальных уравнений и линей­ ных операторов.] Но так называемые чистые математики занима­ ются этой наукой не ради них [практических приложений]. Практи­ чески знание о том, что p иррационально, может быть, и не важно[8], но если мы можем это узнать, то не узнать было бы совершенно не­ выносимо.

Доказательство иррациональности p нечасто приводится в учеб­ никах для младших курсов, но это легко сделать, не выходя за рам­ ки начальных понятий анализа и формулы Эйлера. В следующих нескольких разделах я пойду по стопам Лежандра и докажу более сильный результат, чем иррациональность p, хотя буду применять более современные методы, а не те, что использовал сам Лежандр. (Из этого результата сразу будет вытекать, что найденная Эйле­ ром сумма обратных квадратов натуральных чисел, равная p2/6, иррациональна). Представленное мной доказательство (от про­ тивного) по существу совпадает с приведенным в небольшой, но замечательной книжке Карла Зигеля «Трансцендентные числа», изданной в  1946 году. Эта книжка – отпечатанный репринт кур­ са лекций, прочитанного Зигелем в  Принстонском университете

114

ГЛАВА 3. ИРРАцИОНАЛьНОСТь p2

весной 1946 года, и  заметки (очень) краткие! Зигель обращался к аспирантам и профессорам математики, поэтому часто пропус­ кал промежуточные шаги, необходимые для перехода от одного уравнения к другому, считая, что они очевидны аудитории[9]. Не­ которые их этих пропусков поистине гигантского размера. Я вос­ полнил все пробелы. Итак, начнем.

3.2. Уравнение R(x) = B(x)ex + A(x), D-операторы, обратные операторы и коммутативность операторов Мы знаем, что разложение ex в степенной ряд имеет «бесконеч­ ную степень», т. е. в  нем не существует члена с  наибольшей сте­ пенью n. Предположим, однако, что мы хотим аппроксимировать ex в окрестности x = 0 отношением двух конечных полиномов, сте­ пени n каждый. То есть мы хотим найти такие полиномы A(x) и B(x) степени n, что для x » 0

Имея в виду эту цель, начнем с определения функции R(x):

Это означает, что R(x) будет «мала» для x » 0, если правильно выбрать A(x) и B(x). В следующем разделе я воспользуюсь резуль­ татами этого, чтобы решить показанное выше уравнение относи­ тельно A(x) и B(x). Поскольку A(x) и B(x) имеют степень n, мы можем записать

и после прямого перемножения и разложения ex в ряд получаем:

УРАВНЕНИЕ R (x) = B (x)ex + A (x), D ­ ОПЕРАТОРы, ОБРАТНыЕ ОЕРАТОРы

115

Предположим далее, что мы хотим, чтобы R(x) начиналась чле­ ном x2n+1, т. е. потребуем, чтобы коэффициенты при первых 2n + 1 членах R(x) обращались в  ноль. Это означает, что при x ® 0 R(x) убывает с той же скоростью, что x2n+1 (что, конечно, быстрее, чем просто x). Это требование позволяет оценить, насколько хорошо мы выбрали A(x) и B(x). Чем быстрее убывает R(x) при x ® 0 (чем больше n), тем лучше аппроксимация ex. Приравнивая первые 2n + 1 коэффициентов к R(x) нулю, получаем

и так далее. Обратите внимание, что это дает 2n  + 1 уравнений относительно 2n+2 коэффициентов A(x) и  B(x), т.  е. неизвестных больше, чем уравнений, так что коэффициенты A(x) и  B(x) недо­ определены требованием об обращении в ноль первых 2n + 1 чле­ нов R(x). Поэтому ясно, что должно существовать решение, содер­ жащее n + 1 коэффициентов a и n + 1 коэффициентов b. Мы сможем найти общие формулы для A(x) и B(x) (в следующем разделе), после того как сообщим предварительные результаты об операторе дифференцирования. Определим этот оператор, обо­ значаемый D, следующим образом: если n – положительное целое число, то Dnf(x) означает взятие n­й производной функции f(x). То есть на самом деле мы имеем бесконечное множество операторов, определенных формулой

Поскольку дифференцирование – линейная операция, ясно, что если c1 и c2 постоянны, то

Мы можем распространить определение Dnf(x) на случай непо­ ложительного целого n (n £ 0), сделав два наблюдения. Во­первых, если n  = 0, то, поскольку ноль дифференцирований не изменяет f(x), «должно быть»

116

ГЛАВА 3. ИРРАцИОНАЛьНОСТь p2

т. е. формально мы можем считать, что оператор D0 эквивалентен умножению на единицу. В  действительности мы будем считать, что операторная функция от D, например g(D) = 1 + D, эквивалент­ на единичной, если применяется 0 раз, т.  е. g(D)0  = (1  + D)0  = 1. Во­вторых, поскольку (d k/dx k){d jf/dx j} = d k+jf/dx k+j, где k и j – по­ ложительные целые числа, то формально мы имеем DkD jf(x)  = Dk+jf(x); ниже мы обобщим это равенство на все целые k и j, в т. ч. отрицательные. Ну а какой смысл можно было приписать D-1? Нельзя же продиф­ ференцировать меньше нуля раз, так? Формально D-1D1 = D0 = 1, поэтому D-1 должно быть математической операцией, «отменяю­ щей» действие D1. То есть D-1 – оператор, обратный к D1, и, стало быть, D-1 должен быть интегрированием. Поэтому определим

Здесь t – конечно, просто фиктивная переменная интегрирова­ ния. Говорят, что два оператора коммутируют, если порядок их при­ менения безразличен. То есть если операторы D1 и  D-1 комму­ тируют, то должно иметь место тождество D1D-1f(x) = D-1D1f(x). Однако легко показать, что для этих двух операторов это в общем случае не так. Из правила Лейбница дифференцирования интег­ рала[10] имеем

тогда как

УРАВНЕНИЕ R (x) = B (x)ex + A (x), D ­ ОПЕРАТОРы, ОБРАТНыЕ ОЕРАТОРы

117

Таким образом, D1D-1 ¹ D-1D1, если только не окажется, что f(0)  = 0. По ходу доказательства иррациональности p2 мы уви­ дим, что все тщательно организовано таким образом, что это ус­ ловие коммутативности D1 и D-1 всегда выполняется, пусть даже в общем случае это не так. Только нужно будет аккуратно работать лишь с такими функциями f, для которых f(0) = 0. Ну, а  что бы могло означать D-2? Можно предположить, что -2 D  – это два интегрирования, и да, это действительно так. Но есть один хитрый трюк, который позволит свести два интегрирования к одному. Это один из пунктов, который Зигель никак не проком­ ментировал в своей книге, поэтому расскажу, как это делается. Для начала напишем

Далее, если положить

(оба интеграла равны, потому что мы всего лишь переименовали переменную интегрирования t в s), то

У двойного интеграла есть очень изящная геометрическая ин­ терпретация, показанная на рис. 3.2.1. Здесь представлено интег­ рирование f (вертикальными полосками) по двумерной треуголь­ ной области. Чтобы убедиться в  этом, подумайте, что «говорит» нотация двойного интеграла: выбрать значение t из интервала от 0 до x (внешний интеграл), а затем для этого t, проинтегрировать f(s) от s = 0 до s = t (внутренний интеграл), а это есть интегриро­ вание по вертикальному пути (полоске шириной dt). При выборе нового значения t мы просто выбираем новый вертикальный путь интегрирования (полоску), а когда t изменяется от 0 до x, эти по­ лоски складываются в треугольную область. Но из того же рисунка видно, что проинтегрировать f по той же области можно также, разрезая ее на горизонтальные полос­

118

ГЛАВА 3. ИРРАцИОНАЛьНОСТь p2

ки (шириной ds), для чего следует записать двойной интеграл . Поскольку мы можем вынести f(s) из­под знака внутреннего интеграла (внутренняя переменная интегрирова­ ния – t, а не s), имеем:

и, как мы и  обещали, D-2 оказывается одномерным интегралом, как и D-1. А как насчет D-3? Можно ли повторить эти рассуждения и для D-3? Можно! s x s=t

Область интегрирования 0

x

Рис. 3.2.1. Область интегрирования для D-2

Поскольку D-3f(x) = D-1D-2f(x), имеем

где

Поэтому

t

УРАВНЕНИЕ R (x) = B (x)ex + A (x), D ­ ОПЕРАТОРы, ОБРАТНыЕ ОЕРАТОРы

119

а применяя те же рассуждения, что и  выше, получаем, что этот двойной интеграл равен

Внутренний интеграл легко берется (сделав замену переменной u = t - s, мы увидим, что он равен 1/2(x - s)2). Таким образом,

Продолжая в том же духе (или воспользовавшись математиче­ ской индукцией), вы убедитесь, что в общем случае получается та­ кой результат:

До сих пор мы ничего не сказали о природе f(x). Далее для опре­ деленности мы ограничимся только функциями вида f(x) = elxP(x), где l – постоянная, а  P(x) – полином, для которого P(0)  = 0 (это означает, что f(0) = 0, поэтому D1 и D-1 коммутируют). Это доволь­ но специальная функция, но, как выяснится, ее вполне достаточно для доказательства иррациональности p2. Тогда

и, наконец, если упростить нотацию и обозначать D1 просто D, то

120

ГЛАВА 3. ИРРАцИОНАЛьНОСТь p2

Продолжая в том же духе, мы можем написать:

или

С помощью математической индукции легко показать, что в об­ щем случае

Мы разработали математический механизм, необходимый для решения уравнения R(x)  = B(x)ex  + A(x) относительно A(x) и  B(x), чем и займемся в следующем разделе.

3.3. Нахождение A(x) и B(x) Продифференцировав уравнение R(x) = B(x)ex + A(x) n + 1 раз, по­ лучаем

Поскольку A(x) (по предположению, сделанному в начале преды­ дущего раздела) имеет степень n, то Dn+1A(x) = 0, и, следовательно, в  силу последней обведенной рамкой формулы из предыдущего раздела (при l = 1) имеем

НАХОЖДЕНИЕ А (x) И B (x)

121

Отсюда сразу же следует, что (1 + D)n+1B(x) = e-xDn+1R(x). Поскольку выше мы предположили, что R(x) начинается членом x2n+1, можно записать R(x) = r1x2n+1 + r2x2n+2 + L. Таким образом,

плюс члены степени n + 1 и выше, поэтому, полагая r0 = (2n + 1) (2n)L(n + 1)r1, имеем

а это просто r0 xn плюс члены степени n + 1 и выше. Поскольку мы предположили, что B(x) – полином степени n, то (1 + D)n+1B(x) – тоже полином степени n, т. к. оператор (1 + D)n+1, в силу формулы бинома, есть сумма операторов D в разных степе­ нях, точнее

а это просто сумма оператора (1)n+1 = 1 (при j = 0) и операторов вида

(при 1 £ 5 £ n + 1). Оператор Dj, будучи применен

к  B(x), понижает степень B(x) на j (т.  е. по крайней мере на еди­ ницу), а оператор 1 вообще не изменяет B(x). Следовательно, по­ скольку B(x) имеет степень n, (1 + D)n+1B(x) тоже имеет степень n. Поэтому мы можем оставить только старший член e-xDn+1R(x), так как степень всех остальных больше (разумеется, коэффициенты при остальных членах должны быть равны нулю, поскольку в по­ линоме (1 + D)n+1B(x) нет членов степени выше n). Таким образом, (1 + D)n+1B(x) = r0xn. Теперь мы можем разрешить это уравнение относительно B(x), применив оператор (1  +  D)-n-1 к  обеим ча­ стям (и воспользовавшись тем фактом, что (1 + D)-n-1(1 + D)n+1 = (1 + D)0 = 1). Получаем

122

ГЛАВА 3. ИРРАцИОНАЛьНОСТь p2

A(x) находится почти так же. Начинаем с альтернативной фор­ мы уравнения R(x), полученной умножением на e-x, т. е. R(x)e-x = B(x) + A(x)e-x, и дифференцируем ее n + 1 раз:

или, поскольку Dn+1B(x)  = 0 (напомним, по предположению, B(x) имеет степень n),

Из последней, обведенной рамкой формулы в предыдущем раз­ деле, полагая l = -1, получаем

или

Теперь, как и раньше, (-1 + D)n+1A(x) – полином степени n, по­ тому что, по предположению, таковым является A(x) (просто по­ вторяем рассуждение, использованное для B(x)). Поэтому нас интересуют только члены степени n (или ниже), порожденные (-1 + D)n+1R(x). Поскольку полином R(x), по предположению, начи­ нается членом x2n+1, то только оператор Dn+1 в биномиальном раз­ ложении (-1 + D)n+1 порождает член xn, т. е., как и раньше, Dn+1R(x) равен r0xn плюс члены степени n + 1 и выше (коэффициенты при которых, разумеется, должны быть нулевыми). Итак, мы оставляем только член r0xn и пишем (-1 + D)n+1A(x) = r0xn. И наконец:

Таким образом, мы нашли A(x) и B(x) с точностью до общего мас­ штабного коэффициента r0. Конкретное значение r0 не важно, по­ тому что A(x) и B(x) встречаются в нашей аппроксимации ex толь­ ко в виде отношения, поскольку, по предположению, сделанному в начале предыдущего раздела, при x ® 0

НАХОЖДЕНИЕ А (x) И B (x)

123

Поэтому масштабный коэффициент r0 сокращается. Несущест­ венность его значения – следствие недоопределенности A(x) и B(x), о  которой я  упоминал выше. Итак, без ограничения общности (и с изрядным выигрышем в простоте) мы можем положить прос­ то r0 = 1, тогда получается

Я почти уверен в вашей реакции на оба этих выражения: «Ух ты, вот это прогулочка! Я проследил за всеми шагами и теперь пони­ маю, откуда взялись выражения A(x) и B(x). Но по­прежнему не по­ нимаю, что они означают!» Это вполне разумный вопрос, поэтому я ненадолго отвлекусь от доказательства иррациональности p2 (мы прошли примерно полпути). Прежде я хочу показать, что означа­ ют эти формулы. Говоря, что выражения A(x) и B(x) являются «ре­ шениями», мы имеем в виду, что для любого значения n (положи­ тельного целого числа) можно вычислить конкретные полиномы, а  именно A(x) и  B(x). В  нашем доказательстве иррациональности p2 это на самом деле не понадобится, но я думаю, что умение де­ лать это ценно по двум важным причинам. Во­первых, я полагаю, что, убедившись в том, что найденные нами полиномы A(x) и B(x) действительно достигают поставленной цели (т. е. -A(x)/B(x) » ex для x » 0), вы обретете уверенность в правильности заключенных в рамку выражений, а также в том, что наши манипуляции с опера­ торами и вправду имеют какой­то смысл. А во­вторых, в ходе вы­ числения конкретных полиномов выясняется, что они обладают очень специфическим свойством, которое абсолютно необходимо, чтобы завершить доказательство иррациональности p2. Для начала отступим на шаг назад, к выражениям, выведенным до формул, заключенных в рамку, а именно (полагая r0 = 1): (-1 + D)n+1A(x) = xn, (1 + D)n+1B(x) = xn. Теперь предположим, что n  = 1. Тогда A(x)  = a0  + a1x и  B(x)  = b0 + b1x, и потому (-1 + D)2(a0 + a1x) = x, (-1 + D)2(b0 + b1x) = x.

124

ГЛАВА 3. ИРРАцИОНАЛьНОСТь p2

Следовательно, (1 - 2D + D2)(a0 + a1x) = x, (1 + 2D + D2)(b0 + b1x) = x, и, выполнив все операции, получаем

Приравнивая коэффициенты при одинаковых степенях в обеих частях этих выражений, находим, что a1  = 1 и  a0  - 2a1  = 0. Сле­ довательно, a0 = 2a1 = 2. И точно так же b1 = 1 и b0 + 2b1 = 0, т. е. b0 = -2b1 = -2. Итак, A(x) = 2 + x, B(x) = -2 + x, и наша аппроксимация принимает вид:

Посмотрим, насколько хороша эта аппроксимация (очевидно, что в точке x = 0 она точна). При x = 0.1 – это «малое» число, но не слишком малое – имеем

тогда как

Мы наблюдаем совпадение с e0.1 с точностью до трех знаков пос­ ле запятой – не так плохо. А для n = 2 аппроксимация должна быть еще лучше. Можете повторить весь процесс и убедиться, что A(x) = -12 - 6x - x2, B(x) = 12 - 6x + x2, и, следовательно, аппроксимация при x = 0.1

ЗНАЧЕНИЕ R (pi)

125

Имеет место совпадение с e0.1 с точностью до семи знаков после запятой, а это уже очень впечатляет! Наконец, вы, наверное, обратили внимание, что при n = 1 и n = 2 коэффициенты полиномов были целыми числами. Немного пораз­ мыслив над тем, как вычислялись A(x) и B(x), вы поймете, что так будет при любом значении n. Мы воспользуемся этим свойством, особенно для полинома A(x), в конце доказательства.

3.4. Значение R(pi) Следующий наш шаг – вычислить значение R(x) для x = pi. Этот шаг ни в коем случае не очевиден, но вскоре вы увидите, зачем он ну­ жен. Согласно первому заключенному в рамку равенству в начале предыдущего раздела:

Воспользовавшись формальным выражением B(x) в последнем заключенном в рамку равенстве из предыдущего раздела, имеем

и, следовательно,

В ходе обсуждения в разделе 3.2 мы вывели формулу , и в случае f(x) = exxn получаем

Этот интеграл можно привести к более удобному виду, выпол­ нив замену переменной u = s/x. Тогда du = (1/x)ds, следовательно, ds = x(du). Таким образом,

126

ГЛАВА 3. ИРРАцИОНАЛьНОСТь p2

или

Этот результат можно подвергнуть дальнейшему преобразова­ нию, выполнив еще одну замену переменной t  = 1  - u (так что dt = -du). Тогда

или

Заметим, что выражение для R(x) в рамке 2 можно переписать (просто переименовав фиктивную переменную интегрирования u в t) в виде

Складывая последние два выражения R(x) (и поделив на 2), по­ лучаем

Но

ЗНАЧЕНИЕ R (pi)

127

так что

Если теперь положить x = pi, то множитель вне интеграла (фак­ ториал игнорируем) примет вид:

А выражение под знаком интеграла (после нескольких примене­ ний формулы Эйлера) преобразуется следующим образом:

И наконец­то мы получили

Я говорю «наконец­то», потому что вычислять этот интеграл мы не собираемся. Наверное, при этом известии вы сначала испытали облегчение (выглядит­то он пугающе), а потом шок (так зачем же мы положили столько трудов на его вывод?). На самом деле для доказа­ тельства иррациональности p2 нам нужны два наблюдения относи­ тельно R(pi). Во­первых, что очевидно, эта величина вещественна. А во­вторых, R(pi) ¹ 0, поскольку на всем интервале интегрирова­ ния подынтегральное выражение (для любого целого n) положи­ тельно (за исключением двух концов, в которых оно равно нулю). Поэтому и  сам интеграл отличен от нуля. Само R(pi) может быть отрицательно или положительно в зависимости от четности n, но его знак роли не играет. Важно лишь, что R(pi) ¹ 0. Почему так, мы скоро увидим, но сначала установим еще один результат. Напомним выражение, с которого мы начали анализ. Оно обве­ дено рамкой в начале раздела 3.2, и здесь мы его повторим:

128

ГЛАВА 3. ИРРАцИОНАЛьНОСТь p2

Отсюда сразу следует, что B(-x)e-x + A(-x) = R(-x), а умножив на ex, получаем

Далее вспомним выражение R(x) в рамке 1. Вот оно:

Таким образом,

После замены переменной t = -s (и, стало быть, ds = -dt) имеем

или, поскольку (-1)n(-1)n = (-1)2n = 1 и помещая ex под знак ин­ теграла, получаем

Выполнив еще одну замену переменной u = x - t (du = -dt), по­ лучаем

ЗНАЧЕНИЕ R (pi)

129

, и после тривиального переименования переменной интегрирова­ ния u в s:

Сравнив этот результат с выражением R(x) в рамке 5, мы сразу же замечаем, что exR(-x) = -R(x). Подставляя данный результат в выражение в рамке 4, получаем A(-x)ex + B(-x) = -R(x). Вспоминая равенство в рамке 3, мы имеем пару выражений:

Вычитая второе из первого, получаем

а это может быть справедливо для всех x, только если B(x) + A(-x) и B(-x) + A(x) по отдельности обращаются в ноль. Таким образом, мы имеем условия B(x) = -A(-x) и B(-x) = -A(x). Теперь стало оче­ видно, что это эквивалентные утверждения, и, значит, то, что мы считали двумя условиями, – на самом деле просто альтернативные формы одного условия. Полагая x = pi в выражении B(x)ex + A(x) = R(x), получаем B(pi)epi + A(pi) = R(pi), или, поскольку, согласно формуле Эйлера epi = -1, -B(pi) + A(pi) = R(pi). Но B(pi) = -A(-pi), поэтому A(-pi) + A(pi) = R(pi). Но поскольку R(pi) ¹ 0: A(-pi) + A(pi) ¹ 0.

130

ГЛАВА 3. ИРРАцИОНАЛьНОСТь p2

3.5. Последний шаг (наконец-то!) Выражение A(x) + A(-x) равно сумме следующих двух полиномов (у каждого целые коэффициенты, как было сказано в  конце раз­ дела 3.3):

где знак члена ±anxn во втором полиноме зависит от того, четно n (плюс) или нечетно (минус). Таким образом, A(x) + A(-x) = 2a0 + 2a2x2 + 2a4x4 + L, и последний член равен 2an-1 xn-1, если n нечетно, и 2anxn, если чет­ но. Это означает, что A(x)  + A(-x) можно рассматривать как по­ лином от переменной u (= x2) степени (n  -  1)/2, если n нечетно, или степени n/2, если четно. В математике принято обозначать ⌈m⌉ целую часть вещественного числа (например, ⌈7.3⌉ = 7), так что сте­ пень A(x) + A(-x) по переменной u в общем случае равна ⌈n/2⌉, т. е. где u = x2 и все коэффициенты ai целые. Теперь предположим, что p2 рационально, т. е. существуют такие целые p и q, что p2 = p/q. Тогда, полагая в предыдущем равенстве x = pi (u = -p2), получаем

Умножая обе части на целое число q⌈n/2⌉, мы сразу видим, что q⌈n/2⌉ {A(pi) + A(-pi)} должно быть целым, потому что все члены в правой части целые. То есть должно существовать ненулевое целое число (потому что, как было показано в  предыдущем разделе, A(pi)  + A(-pi) = R(pi) ¹ 0), которое я обозначу j (оно может быть как по­ ложительным, так и отрицательным), такое, что

Взяв абсолютные величины обеих частей этого равенства, полу­ чаем

ПОСЛЕДНИЙ ШАГ (НАКОНЕц­ТО!)

131

Остался всего один шаг. Имеем:

Мы знаем, что когда n стремится к бесконечности:

и

Отсюда следует, что каково бы ни было целое q, всегда можно подобрать n настолько большое, что q⌈n/2⌉|R(pi)| < 1. Следовательно, для некоторого целого j мы приходим к выводу, что 1 > q⌈n/2⌉|R(pi)| = |j| > 0. Иными словами, 1 > |j| > 0. Но между 0 и 1 нет целых чисел, т.  е. мы пришли к  противоречию. Стало быть, исходное предпо­ ложение о том, что p2 = p/q было неверным, т. е. таких целых p и q не существует, и, следовательно, p2 иррационально. Все доказано.

ГЛАВА 4 Ряды Фурье

4.1. Функции, колеблющиеся струны и волновое уравнение Эта глава целиком посвящена тригонометрическим рядам, удов­ летворяющим определенным условиям и получившим общее на­ звание рядов Фурье  – в  честь французского математика Жозефа Фурье (1768–1830), хотя изучать такие ряды начали задолго до его рождения[1]. И, как вы, должно быть, уже догадываетесь, формула Эйлера будет играть в этой истории не последнюю роль. В качестве прелюдии к рассказу зададимся фундаментальным вопросом: что такое функция? Современный ученый, отвечая на этот вопрос, скажет, что функ­ ция f(t) – это просто правило, сопоставляющее значению t значение f, т. е. функция отображает t в f. Правило отображения (функция) может быть задано аналитической формулой, но это необязательно. Это может быть, к примеру, просто таблица или список (возможно, бесконечный) чисел: мы находим значение t в левой колонке и бе­ рем соответствующее значение f из правой. Но в XVIII веке не все соглашались с такой широкой трактовкой. В частности, француз­ ский математик Жан Лерон ДʼАламбер (1717–1783) придерживал­ ся строгой интерпретации, согласно которой функция должна быть выразима с помощью обычных средств алгебры и математическо­ го анализа. Но не все математики той поры были настолько не­ преклонны. Эйлер, к примеру, исповедовал гораздо более широкие взгляды. Хотя поначалу Эйлер разделял точку зрения ДʼАламбера, в конечном итоге он пришел к выводу, что функция определена, если мы просто можем нарисовать график f(t) относительно t. Эта

ФУНКцИИ, КОЛЕБЛЮщИЕСЯ СТРУНы И ВОЛНОВОЕ УРАВНЕНИЕ

133

разница в трактовке привела к знаменитой полемике в математи­ ческой физике, что, в свою очередь, стало причиной формальной разработки рядов Фурье. Прежде чем переходить к этой полемике, я хотел бы сказать, что хотя либеральная точка зрения Эйлера на функции имеет под со­ бой веские основания, она таит в себе и поразительные сюрпризы. Например, слова «нарисовать кривую» означают, что почти в каж­ дый момент времени определено направление кончика карандаша, которым производится рисование. То есть почти в  каждой точке к  кривой можно провести касательную, а  это значит, что почти в  каждой точке существует производная. (Если имеется конечное число точек, в которых у кривой нет производной, как, например, у функции f(t) = |t|, которая не имеет производной в точке t = 0, то мы, конечно, все равно сможем нарисовать ее). Однако в 1872 го­ ду немецкий математик Карл Вейерштрасс (1815–1897) показал, что бывают функции, которые всюду непрерывны, но нигде не дифференцируемы, т. е. касательной нельзя провести ни в одной точке, хотя нарисовать кривую, не отрывая карандаша от бумаги, можно. Эта функция представляет собой тригонометрический ряд (хотя, как мы увидим позже, не ряд Фурье): она определяется вы­ bncos(anpx), где b – фиксированное положительное ражением число, меньшее 1, а a – фиксированное нечетное число такое, что ab > 1 + (3/2)p. У бесконечной суммы Вейерштрасса много того, что инженеры называют «высокочастотными составляющими», – именно в этом и заключается физическая причина отсутствия производной. («Вы­ сокочастотная» функция, по определению, быстро изменяется при изменении независимой переменной.) То есть, поскольку 1 + (3/2)p » 5.7, условия ab > 5.7 и b < 1 означают, что a не может быть мень­ ше 7 (первое нечетное число, большее 5.7). Частоты слагаемых увеличиваются как an, поэтому, если b лишь немного меньше еди­ ницы (т. е. амплитуда bn уменьшается не слишком быстро при воз­ растании n), то частоты слагаемых возрастают как 7n, т. е. быстро становятся очень большими. С другой стороны, если выбрать не­ большое b, чтобы амплитуды быстро убывали при возрастании n, то наименьшее возможное n даже больше 7, поэтому частоты рас­ тут еще быстрее, чем 7n. Так что вне зависимости от того, велико b или мало, мы не можем избежать появления высокочастотных со­ ставляющих в функции Вейерштрасса. Именно эти составляющие в пределе при n ® ¥ и являются причиной того, что сумма имеет

134

ГЛАВА 4. РЯДы ФУРьЕ

бесконечное число локальных экстремумов («пиков и  впадин») в любом конечном – сколь угодно малом – интервале изменения x, и именно поэтому производная не существует ни в одной точке. При построении этой очень необычной функции Вейерш­ трасс вдохновлялся функцией, которую еще раньше придумал гениальный немецкий математик Г. Ф. Б. Риман (1826–1866)  – (sin(n2x)/n2). Риман полагал (но не дал доказательства), что эта функция ни в одной точке не имеет производной[2]. Эта функ­ ция гораздо проще функции Вейерштрасса; впрочем, по рис. 4.1.1 видно, что «проще» в  данном случае  – понятие относительное, т.  к. и  функция Римана ведет себя ужасно; на рисунке показаны три частичные суммы на интервале 0 < x < p: только первый член (штриховая линия), первые три члена (пунктирная линия) и пер­ вые 18 членов (сплошная линия). 1.4 1.2 1.0 0.8 0.6 0.4 0.2 0 –0.2

0.5

1.0

1.5

2.0

2.5

3.0

3.5

x Рис. 4.1.1. Функция Римана

После этого вступления мы готовы обсудить происхождение ря­ дов Фурье; все началось с физической задачи, возникшей в связи с  музыкальными инструментами, в  которых имеются колеблю­ щиеся части, например рояльные или скрипичные струны. Во­

ФУНКцИИ, КОЛЕБЛЮщИЕСЯ СТРУНы И ВОЛНОВОЕ УРАВНЕНИЕ

135

прос звучит так: как будет вести себя натянутая идеально упругая струна (с закрепленными концами) с однородным распределени­ ем массы по длине после приведения ее в  движение? В  некото­ рых частных случаях анализ был проведен еще в 1728 году швей­ царским математиком Иоганном Бернулли (1667–1748), который изучал движение невесомой нити, вдоль которой равномерно рас­ пределено конечное число точечных масс (так называемая идеаль­ ная нагруженная струна). Но основной вклад в эту историю внесли ДʼАламбер (в 1747 году), Эйлер (в 1748 году) и сын Иоганна Дани­ ил (в 1753 году). И, как мы увидим, хотя ДʼАламбер и Эйлер были «в  основном правы», они также запутались в  вопросе о  том, что такое функция. А «самым правым» из трех оказался Даниил (1700– 1782). Но сначала, чтобы понять позиции всех трех участников, мы должны рассмотреть одно из самых знаменитых физических урав­ нений – одномерное волновое уравнение. Представим себе идеально упругую натянутую струну, непо­ движно лежащую на оси x, и  пусть ее концы закреплены в  точ­ ках x  = 0 и  x  = 1. Упругость означает, что струна не подвержена сдвигающей и изгибающей силе (действующим перпендикулярно струне), а только силам, действующим вдоль нее (растягивающим). Слово натянутая означает, что неподвижная струна уже испыты­ вает встроенное ненулевое напряжение, которое мы обозначим T. Предположим далее, что масса единицы длины натянутой струны постоянна и равна r. Теперь представим, что в момент t = 0 струна подвергается очень небольшому изгибанию, так что она уже не ле­ жит на оси x, хотя концы остаются закрепленными. Говоря, что из­ гибание очень небольшое, мы имеем в виду, что напряжение в каж­ дой точке струны не изменяется в  результате очень небольшого изменения длины деформированной струны. Деформированная струна показана на рис.  4.1.2, где мы видим также очень малый участок струны от x до x + Dx. Форма струны описывается уравне­ нием y = y(x, t), где y – отклонение струны от горизонтальной оси в произвольной точке x в момент времени t (заметим, что незави­ симых переменных две) притом, что начальное отклонение задано и равно y(x, 0) = f(x). Это относящееся ко времени требование назы­ вается начальным условием. Второе начальное условие заключает­ ся в том, что мы отпускаем деформированную струну из состояния покоя, т. е. ∂y/∂t|t=0 = 0 для всех x. То есть мы моделируем случай оттянутой струны. Берется частная производная, потому что y(x, t) – функция не одной, а двух независимых переменных. Усло­

136

ГЛАВА 4. РЯДы ФУРьЕ

вие закрепленности концов означает также, что y(0, t) = y(1, t) = 0 для всех t ³ 0; это относящиеся к пространству требования, назы­ ваемые граничными условиями. y

0

x x + Dx

l

Рис. 4.1.2. Вибрирующая струна

Ученые, которые первыми приступили к анализу данной зада­ чи, хотели вычислить y(x, t) для всех x в интервале от 0 до 1 и всех t > 0. Для этого необходимо было составить уравнение, которое за­ тем можно было бы решить при заданных начальных и граничных условиях. Это дифференциальное уравнение в частных производ­ ных (поскольку независимых переменных больше одной) называ­ ется одномерным (имеется всего одна пространственная перемен­ ная x) волновым уравнением (почему, мы скоро увидим), и вывести его довольно просто. Покажем, как это делается. Рассмотрим короткий участок струны на рис.  4.1.2 подробнее. На рис. 4.1.3 показано, что на него действуют только две силы (если бы мы учитывали еще и вес участка, то к ним добавилась бы сила притяжения, но это осложнение я сейчас проигнорирую). Изоли­ рованный участок струны, представленный на рис. 4.1.3, инжене­ ры и математики называют диаграммой свободного тела (free­body diagram)*. Он полностью описывает «внешний мир с  точки зре­ ния участка струны». Буквой a обозначен угол между касательной к струне и горизонталью (очевидно, что a = a(x, t)), а a1 и a2 – зна­ чения a в левом и правом концах участка струны соответственно. Силы, действующие на участок струны, – это напряжения на каж­ дом конце, равные по абсолютной величине (T), но направленные * В отечественной школе теоретической механики нет аналога этому термину. Мысленное разделение силовой схемы на составные части рас­ сматривается как процесс, которому не дается отдельного определения. – Прим. перев.

ФУНКцИИ, КОЛЕБЛЮщИЕСЯ СТРУНы И ВОЛНОВОЕ УРАВНЕНИЕ

137

под углами a1 и a2, которые, вообще говоря, различны, потому что струна изогнута. a2

y

T a1

Dm = rDx

T 0

x

x + Dx

Рис. 4.1.3. Диаграмма свободного тела для изолированного участка струны

В силу предположения о  небольших колебаниях амплитуды можно считать, что длина участка струны почти равна Dx, так что его масса равна Dm  = rDx. Вертикальное движение струны, т. е. колебание, описывается вторым законом Ньютона, знамени­ тым «сила равна произведению массы на ускорение»[3], где под «силой» понимается суммарная вертикальная составляющая сил, действующих на участок струны. Эта «суммарная вертикальная со­ ставляющая», как видно по рис. 4.1.3, равна T sin(a2) - T sin(a1) = T[sin(a2) - sin(a1)]. В силу предположения о малой амплитуде си­ нус в этом выражении можно заменить тангенсом (почему жела­ тельна именно такая замена, мы скоро увидим), поэтому, т. к. вер­ тикальное ускорение равно ∂2y/∂t2, мы можем записать

или

Если теперь перейти к пределу при Dx ® 0, то второй сомножи­ тель в правой части как раз и будет определением частной произ­ водной tg(a) по x, т. е.

138

ГЛАВА 4. РЯДы ФУРьЕ

Для завершения вывода остается лишь заметить, что из геомет­ рии рис. 4.1.3 вытекает, что

Теперь мы видим, почему было выгодно заменить синус танген­ сом, – ведь теперь мы, наконец, получили описание колеблющейся струны в  виде дифференциального уравнения в  частных произ­ водных второго порядка:

Множитель T/r особенно интересен из­за единиц, в которых он измеряется. Анализ размерности показывает, что единицей изме­ рения T/r является

т. е. T/r – это скорость (чего­то) в квадрате. Но чего именно? На этот вопрос мы ответим чуть позже. А пока просто обозначим  = c (единица измерения такая же, как у скорости), так что уравнение колеблющейся струны принимает форму, которая обычно приво­ дится в учебниках:

Это то уравнение, которое решили ДʼАламбер (который вывел его в 1747 году) и Эйлер. Они пришли в общем­то к одному и тому

ФУНКцИИ, КОЛЕБЛЮщИЕСЯ СТРУНы И ВОЛНОВОЕ УРАВНЕНИЕ

139

же ответу (функции y(x, t)), но дали ему совершенно различные ин­ терпретации. Решение ДʼАламбера понять нетрудно. Основное предположение состоит в том, что y(x, t) дважды дифференцируема по x и t. В этом предположении мы сразу же произведем замену переменных:

То есть

Заметим, что u и v так же, как x и t, – независимые переменные, поскольку знание u, как и знание v, ничего не говорит о значениях x и t, и наоборот. Следовательно, по правилу дифференцирования сложной функции:

Дифференцируя еще раз и снова применяя то же правило, полу­ чаем

или, используя первый результат для ∂y/∂v,

(Я предполагаю, что ∂2y/∂t∂x = ∂2y/∂x∂t, т. е. что результат не зави­ сит от порядка дифференцирования. Это не всегда так, но в данном

140

ГЛАВА 4. РЯДы ФУРьЕ

случае это предложение не станет причиной неприятностей.) По­ следнее выражение в фигурных скобках, разумеется, равно нулю, потому что y по определению удовлетворяет уравнению колеблю­ щейся струны, и, значит,

Это уравнение тривиально интегрируется (именно поэтому была произведена замена переменных x и t на u и v), и мы полу­ чаем y(u, v) = f(u) + y(v), где f и  y  – дважды дифференцируемые (но в  остальном произ­ вольные) функции от u и v. Таким образом, общее решение волно­ вого уравнения имеет вид: y(x, t) = f(ct - x) + y(ct + x). Теперь понятно, откуда взялось прилагательное волновое, а так­ же физический смысл c. Если имеется функция y(x) и  x0 > 0, то y(x0 + x) – это просто y(x), сдвинутая влево на x0 (x0 < 0, сдвиг произ­ водится вправо). Поэтому y(ct + x) – это y(x), т. е. значение y(ct + x) в момент t = 0 – сдвинутое влево на величину ct. Поэтому форма y(x) сдвинулась на расстояние ct за время t (т.  е. со скоростью c). Движущуюся форму чаще называют волной, и  это объясняет как название «волновое уравнение», так и физический смысл c. То же рассуждение применимо к  f(ct  - x), только волна в  этом случае движется вправо со скоростью c. Вот теперь мы, наконец, готовы заняться математикой. Точная постановка задачи об оттянутой струне, стоявшей перед ДʼАламбером, такова: решить уравнение

при граничных условиях (1) у(0, t) = 0, (2) у(l, t) = 0

ФУНКцИИ, КОЛЕБЛЮщИЕСЯ СТРУНы И ВОЛНОВОЕ УРАВНЕНИЕ

141

и начальных условиях (3) ∂у/∂t|t=0 = 0, (4) у(x, 0) = f(x). Применение (1) к приведенному выше общему решению (фор­ мула в рамочке) дает f(ct) + y(ct) = 0. Это означает, что f = -y, и, следовательно, общее решение сво­ дится к y(x, t) = f(ct - x) + f(ct + x). Если к этой формуле применить (2), то получим f(ct - l) = f(ct + l), а поскольку это верно для любого t, то является тождеством от­ носительно t. Из этого результата вытекает очень интересное следствие: f должна быть периодической функцией от времени (значения, принимаемые ей на некотором конечном интервале протяженностью T, затем повторяются бесконечно). Более подроб­ но мы будем обсуждать периодические функции в следующем раз­ деле, но уже сейчас скажу, что функция s(t) называется периодиче­ ской с периодом T, если существует такое T > 0, что s(t) = s(t + T) для всех t (именно подобную ситуацию мы имеем для f). Для нас важно, что разность между аргументами s(t) и s(t + T) и есть период. Следовательно, поскольку аргументы f(ct  - l) и  f(ct  + l) отлича­ ются на 2l, то 2l равно значению cT (где T – период f), т. е. период f равен 2l/c; это время, необходимое волне для перемещения от одного конца струны до другого и обратно. Можно было бы продолжать в том же духе и применить к обще­ му решению граничные условия (3) и (4), но я не стану этого делать. В  этот момент ДʼАламбер ясно показал периодическую природу решений (и, естественно, мы и  вправду наблюдаем его, глядя на колеблющуюся струну), поэтому решил, что нашел решение; оно изящно выражалось в виде дважды дифференцируемой функции, обладающей хорошим поведением. Но Эйлер возразил на это, за­ метив, что струну можно привести в движение из начального со­ стояния, не являющегося дважды дифференцируемым, например оттянуть так, как показано на рис. 4.1.4. Поэтому, заключил Эйлер, решение ДʼАламбера является недостаточно общим. И  как будто

142

ГЛАВА 4. РЯДы ФУРьЕ

этих сложностей недостаточно, спустя всего несколько лет Даниил Бернулли решил волновое уравнение совершенно другим способом и нашел решение, которое и выглядело совершенно иначе. Как вы до­ гадываетесь, все это сильно озадачивало и  имело далеко идущие последствия в математике, которые мы наблюдаем и по сей день. f(x) = y(x, 0)

0

x

Рис. 4.1.4. Начальное отклонение струны, не являющее дважды дифференцируемым во всех точках

Решение волнового уравнения, найденное Бернулли, можно получить путем разделения переменных, т.  е. предположив, что y(x, t) = X(x)T(t). На самом деле это стандартный подход, исполь­ зуемый практически во всех учебниках по дифференциальным уравнениям в  частных производных, изданных за последние сто пятьдесят лет. X(x) и T(t) – функции, зависящие только от x и t со­ ответственно (например, xt, очевидно, допускает разделение, а xt – нет). Подстановка этого выражения y(x, t) в  волновое уравнение дает:

или

Поскольку левая часть зависит только от x, а правая часть – толь­ ко от t, равны они могут быть для всех x и t лишь в одном случае – когда обе равны одной и той же постоянной, которую мы обозна­ чим k. Таким образом,

ФУНКцИИ, КОЛЕБЛЮщИЕСЯ СТРУНы И ВОЛНОВОЕ УРАВНЕНИЕ

143

Когда математик видит функцию, пропорциональную своей производной (или второй производной, как в данном случае), ему на ум сразу приходит идея экспоненты. Поэтому для решения обо­ их наших уравнений рассмотрим общее уравнение вида

и предположим, что Z(z) = Ceaz, где C и a – постоянные. Тогда

так что общее решение имеет вид

где A и B – постоянные. Итак, для наших функций X(x) и T(t) имеем (полагая a = k для X и a = kc2 для T):

так что

Применяя граничное условие (1), y(0, t) = 0, имеем для всех t ³ 0:

а это означает, что либо A2 = B2 = 0 (этот случай мы отвергаем, по­ скольку он дает тривиальное решение y(x, t) = 0), либо A1 + B1 = 0

144

ГЛАВА 4. РЯДы ФУРьЕ

(его мы принимаем, потому что получающееся решение не триви­ ально). Таким образом, B1 = -A1 или, опуская индексы,

Теперь граничное условие (2), у(l, t) = 0, дает

опять­таки для всех t ³ 0. Тут возникает повод для тревоги, потому что выполнить требуемое невозможно (!), если не считать триви­ альных случаев A = 0 и (или) A2 = B2 = 0 (они тривиальны, потому что ведут к решению y(x, t) = 0, которое, конечно же, удовлетворяет начальному условию (3), но не удовлетворяет начальному условию (4), если только не рассматривать физически неинтересный случай f(x) = 0, т. е. неколеблющейся струны). Но наше недоумение разре­ шится, как только мы осознаем, что молчаливо предполагали, что произвольная постоянная k положительна. Однако этого нигде не требуется; предположим, напротив, что k < 0, и заменим на i , где теперь k > 0. Тогда

и теперь равенство y(l, t) = 0 приводит к нетривиальным выводам. Применение формулы Эйлера к  первому выражению в  скобках дает , и, следовательно, для всех t

откуда следует, что l  = np, где n – произвольное ненулевое целое число. Так что наша «произвольная» постоянная k вовсе не так произвольна, а может принимать значения

ФУНКцИИ, КОЛЕБЛЮщИЕСЯ СТРУНы И ВОЛНОВОЕ УРАВНЕНИЕ

145

Если теперь включить 2i в постоянную A, то получим

Таким образом,

и, следовательно, применение начального условия (3) дает, что для всех x

Это справедливо, если A = 0 (этот случай мы отвергаем, потому что он ведет к тривиальному решению y(x, t) = 0), или A2 = B2. По­ этому, снова опуская индексы, получаем

или, собирая все постоянные в одну, которая может быть различ­ ной при разных значениях n и потому обозначается cn, получаем

Наше самое общее решение является суммой этих частных ре­ шений по n, т. е.

Это выражение можно немного упростить, заметив, что для лю­ бой пары n = ±k сумму двух соответствующих членов можно за­ писать в виде:

146

ГЛАВА 4. РЯДы ФУРьЕ

Поэтому, просто переопределив произвольные постоянные и за­ метив, что слагаемое, соответствующее n = 0, обращается в ноль, мы можем начать суммирование с n = 1 и написать, как сделал Бер­ нулли:

Это было бы решением, если бы мы знали, чему равны произ­ вольные коэффициенты cn (которых бесконечно много!). Для от­ вета на данный вопрос можно начать с применения оставшегося начального условия (4), y(x, 0) = f(x). При этом получается

– поразительный результат, означающий, что мы могли бы (если бы знали значения cn) путем сложения бесконечного количества синусоид разной амплитуды получить произвольную функцию f(x), которая, как мы помним, описывает форму оттянутой струны пе­ ред ее отпусканием. Отложим ненадолго вопрос о значениях cn. Сначала я хочу ска­ зать, что Эйлеру решение Бернулли совсем не понравилось, и он аргументировал это тем, что совершенно абсурдно даже думать о  том, что в  результате сложения бесконечного количества не­ четных периодических функций (синусов) можно получить произ­ вольное начальное отклонение струны f(x), потому что f(x) в общем случае не является ни нечетной, ни периодической. Найденное Бернулли разложение в тригонометрический ряд, говорил Эйлер, не может быть правильным в  общем случае (но может оказаться таковым для конкретной f(x)). К чести Бернулли, он твердо стоял на своем и твердил, что что бы там ни говорили признанные мастера вроде Эйлера и  ДʼАламбера (который соглашался с  возражением Эйлера), его решение правильно. В разделе 4.3 я объясню, почему

ПЕРИОДИЧЕСКИЕ ФУНКцИИ И СУММА ЭЙЛЕРА

147

возражения Эйлера утратили силу, после того как было правильно осмыслено понятие функции. И в  заключение этого раздела хочу отметить забавный факт – именно не поверивший Эйлер сделал последний шаг и  показал, как вычислить cn (для разложения конкретной f(x) в тригономет­ рический ряд, которое Эйлер считал осмысленным). В статье, на­ писанной в 1777 году (но опубликованной только в 1793­м), Эйлер вычислил коэффициенты cn, применив подход, который с тех пор стал стандартным. Но детали я отложу на потом, когда мы дойдем до работы Фурье, а пока нам нужно ближе познакомиться с перио­ дическими функциями в общем виде.

4.2. Периодические функции и сумма Эйлера В предыдущем разделе мы видели, что история разложения функ­ ций в  тригонометрический ряд началась задолго до Фурье. На­ пример, французский математик Шарль Боссю (1730–1814) на­ писал целую серию таких рядов с  конечным числом членов (n), а в 1733 году Даниил Бернулли взял формулу Боссю и просто устре­ мил n к бесконечности. Бернулли не отличался вниманием к стро­ гости манипуляций (это общая черта математиков XVIII века и Эй­ лера в частности), и его результаты обретают смысл, только если согласиться с абсурдным допущением о том, что sin(¥) и cos(¥) равны нулю[4]. Однако и до Бернулли мы можем найти следы при­ косновения Эйлера к рядам Фурье. Например, в письме к другу, написанном в 1744 году, Эйлер сде­ лал такое примечательное утверждение:

Вероятно (почти наверняка)? это был первый «ряд Фурье», хотя, конечно, Эйлер так его не называл, потому что до рождения Фурье оставалось еще 24 года. Но этот бросающийся в глаза анахронизм (в конце раздела я покажу, как Эйлер вывел этот ряд Фурье за мно­ го лет до самого Фурье) сопровождает насущный технический во­ прос – а  правилен ли этот результат? Например, похоже, что при t = 0 имеет место проблема, поскольку формула Эйлера вроде бы утверждает, что p/2 = 0 (надо полагать, все мы согласны, что это не

148

ГЛАВА 4. РЯДы ФУРьЕ

так). Ключ к пониманию того, что здесь происходит, дает понятие периодической функции, с него­то я и начну. Если x(t) – периодическая функция с основным периодом T (ко­ торый мы будем считать вещественным числом), то она удовле­ творяет условию x(t) = x(t + T), -¥ < t < ¥, где T – наименьшее возможное положительное значение, т. е. T > 0. (Требование T  >  0 исключает случай, когда x(t) постоянно; эту функцию нельзя назвать периодической, потому что не существу­ ет наименьшего T > 0 такого, что x(t) = x(t + T), т. к. для любого T > 0 найдется меньшее T > 0, например T, деленное пополам, удовле­ творяющее тому же условию.) Проще говоря, периодическая функ­ ция бесконечно «повторяется» в обоих направлениях, когда неза­ висимая переменная (в нашем случае t) стремится к ±¥. Наверное, из всех таких функций самые очевидные  – синус и косинус; например, x(t) = sin(t) периодична с периодом T = 2p. Заметим, что sin(t) = sin(t + k2p) для всех t при любом целом по­ ложительном k, но мы рассматриваем наименьшее такое k (k = 1) в  определении основного периода T. Понятие периодичности на­ столько просто, что легко попасть в  ловушку и  счесть его почти тривиальным. Поверьте мне, это далеко не так! Вот ответьте: яв­ ляется ли сумма двух периодических функций периодической? Большинство людей тут же брякнет «да, конечно», не задумавшись ни на секунду, но правильный ответ: «по­разному бывает». Иногда да, иногда нет. Например, cos(t) и  cos(t ) периодичны, первая – с периодом 2p, вторая – с периодом 2p/ . Но их сумма неперио­ дична. Действительно, предположим, что существует такое T, что

Это должно быть верно для всех t и, в частности, для t = 0, т. е.

Поскольку максимальное значение косинуса равно 1, отсюда следует, что cos(T)  = cos(T )  = 1. То есть должно существовать два таких (очевидно, различных) целых числа m и n, что T = 2pn и T  = 2pm. Но тогда

ПЕРИОДИЧЕСКИЕ ФУНКцИИ И СУММА ЭЙЛЕРА

149

, рационально. Но это неверно! (См. об­ и, следовательно, число суждение данного вопроса во введении.) Итак, мы имеем проти­ воречие, возникшее из­за предположения (как мы теперь знаем, ложного) о том, что у функции x(t) есть период T. На рис. 4.2.1 изо­ бражены графики cos(t), cos(t ) и их суммы. Как видим, сумма во­ все не выглядит периодической. Общее правило (в справедливости которого вы убедитесь, немного поразмыслив): сумма периодиче­ ских функций является периодической, если попарные отношения периодов – рациональные числа (т. е. все периоды соизмеримы). 1.0

cos(t)

0.5 0 –0.5 –1.0

0

2

4

6

8

10

12

14

16

18

20

8

10

12

14

16

18

20

12

14

16

18

20

1.0

cos( 2t)

0.5 0 –0.5 –1.0

0

2

2.0

4

6

сумма первых двух графиков

1.0 0 –1.0 –2.0

0

2

4

6

8

10

Время

Рис. 4.2.1. Сумма двух периодических функций, не являющаяся периодической

Вот еще один «простой» вопрос на тему периодичности. Может ли сумма двух периодических функций x1(t) и x2(t) быть периодиче­ ской с периодом, меньшим, чем периоды слагаемых? То есть если T1 и T2 – периоды функций x1(t) и x2(t) соответственно, а x1(t) + x2(t)

150

ГЛАВА 4. РЯДы ФУРьЕ

периодична с периодом T, то может ли быть так, что T < min(T1, T2)? Ответ утвердительный (что часто удивляет излишне «быстрых разумом» студентов). Пример показан на рис. 4.2.2. x1(t)

период = Т

t x2(t)

период = Т

t x1(t) + x2(t)

период = 1/2Т

t Рис. 4.2.2. Две периодические функции, сумма которых периодична, но имеет меньший период

Иногда студенты думают, что последний пример «нечестный», потому что в нем требуется, чтобы две импульсные функции были точно выровнены, так что импульсы одной функции находятся точно посередине между импульсами другой. Если бы не такое идеальное выравнивание, то сумма все равно была бы периоди­ ческой, но с таким же периодом, как у функций­слагаемых. Тогда вот вам еще более поразительный пример двух функций с одина­ ковым фиксированным основным периодом, сумма которых имеет сколь угодно малый период. Предположим, что N – произвольное положительное целое число, и определим x1(t) и x2(t) следующим образом:

ПЕРИОДИЧЕСКИЕ ФУНКцИИ И СУММА ЭЙЛЕРА

151

Очевидно, что x1(t) и x2(t) периодичны с основным периодом 1, не зависящим от величины N. Но рассмотрим их сумму

Эта сумма имеет основной период T, где 2NpT = 2p, т. е. T = 1/N. Таким образом, T можно сделать сколь угодно малым, если взять достаточно большое N. И еще один вопрос: может ли изменяющаяся со временем функ­ ция x(t) удовлетворять условию x(t) = x(t + T) для всех t и тем не менее не иметь основного периода (напомним, что условие T > 0 исключает постоянные функции из числа периодических)? Этот вопрос немного труднее, но ответ снова утвердительный. Вот при­ мер. Определим x1(t) и x2(t) следующим образом:

152

ГЛАВА 4. РЯДы ФУРьЕ

Очевидно, что x1(t)  – вполне «респектабельная» функция, т.  е. мы можем нарисовать ее график на бумаге. С  другой стороны, x2(t) весьма своеобразна (попробуйте прикинуть ее график!), по­ скольку между любыми двумя рациональными числами находит­ ся бесконечно много иррациональных (и наоборот). Тем не менее x1(t) и x2(t) периодичны с одинаковым основным периодом T = 1 (просто воспользуйтесь определением периодичности). А  теперь рассмотрим их сумму, которую можно записать в виде

Эта функция удовлетворяет условию периодичности s(t) = s (t + T) для любого рационального числа T, но основного периода у нее не существует, потому что не существует наименьшего положительно­ го рационального числа. Конечно, приведенные примеры специ­ ально составлены для демонстрации странного поведения; инже­ неры и математики называют их патологическими. А теперь, чтобы закончить этот раздел, я покажу, как Эйлер при­ шел к тригонометрическому ряду, с  которого мы начали это об­ суждение. В конце мы увидим объяснение загадочному поведению в точке t = 0, из которого, на первый взгляд, следует, что p/2 = 0! Кроме того, это вычисление  – прекрасный пример гениальной изобретательности Эйлера, которая, хоть часто и приносила успех, иногда заставляет современных математиков хмурить брови. Эй­ лер начал с геометрической прогрессии S(t) = eit + ei2t + ei3t + L, а затем, не задаваясь вопросами сходимости (например, S(0)  = 1 + 1 + 1 + L = ¥), «просуммировал» ее обычным способом, т. е. умножил обе части на eit и получил eitS(t) = ei2t + ei3t + L, и, следовательно, S(t) - eitS(t) = eit. Таким образом,

ПЕРИОДИЧЕСКИЕ ФУНКцИИ И СУММА ЭЙЛЕРА

153

Затем, воспользовавшись своей собственной формулой, давшей название этой книге, он раскрывает комплексные экспоненты

и, наконец, получает

Далее, возвращаясь к исходной геометрической прогрессии S(t), он снова пользуется своей формулой и пишет S(t) = cos(t) + cos(2t)  + L + i{sin(t) + sin(2t) + L}, потом приравнивает вещественные части этого выражения и вы­ ражения для S(t), заключенного в рамку: cos(t) + cos(2t) + cos(3t) + L = -1/2. Затем (будучи гением!) он почленно проинтегрировал это ра­ венство и получил

где C – произвольная постоянная неопределенного интегрирова­ ния. Чтобы найти C, Эйлер заметил, что если подставить t  = p/2 в последнее выражение, то получится

Выражение в левой части равно p/4 (мы пользовались этим фак­ том в разделе 2.1 и выведем его ниже в этой главе), а это означает, что C должно быть равно p/2. Поэтому, как пишет Эйлер своему другу:

154

ГЛАВА 4. РЯДы ФУРьЕ

На эту формулу можно только смотреть, раскрыв рот, испы­ тывая смесь ужаса и восторга (примерно в равных частях). Такое мог написать только гений или студент, плохо изучавший мате­ матический анализ! В следующем разделе я продемонстрирую со­ временный вывод данной формулы, но прямо сейчас мы можем проделать с ней нечто, о чем Эйлер мог лишь мечтать, – выполнив несколько миллионов операций на компьютере, на что уйдет все­ го несколько секунд, построить график левой части (просуммиро­ вав синусы) в виде функции от t, а затем сравнить его с графиком (p - t)/2. Результаты – для увеличивающегося числа членов частич­ ных сумм – показаны на рис. с 4.2.3 по 4.2.6. Даже беглый взгляд на эти графики позволяет сделать несколько важных наблюдений: (1) ряд Эйлера – периодическая функция с периодом 2p; (2) этот ряд – нечетная функция; (3) в интервале 0 < t < 2p ряд действительно аппроксимирует функцию (p - t)/2; (4) ряд совершает резкие скачки от крайнего отрицательного значения в  конце предыдущего периода к  крайнему поло­ жительному в начале следующего; (5) глядя на период 0 < t < 2p, где ряд аппроксимирует функцию (p  - t)/2, мы видим, что с  увеличением количества членов частичной суммы аппроксимация улучшается не везде. (Что означают эти колебания в окрестности t = 0 и t = 2p и почему они не исчезают при добавлении новых членов?) Наблюдения (1) и (2) не должны вызывать удивления – ведь все члены ряда являются синусоидами (которые по отдельности не­ четны), а их периоды попарно соизмеримы. Наблюдение (3) дейст­ вительно представляет интерес, поскольку, похоже, подтверждает (безумные) вычисления Эйлера, при условии что мы добавим ого­ ворку о том, что ряд аппроксимирует (p - t)/2 только в интервале 0 < t < 2p. И наконец, наблюдения (4) и (5) самые любопытные, это поведение Эйлер полностью упустил из виду, как и  все, кто шел вслед за ним на протяжении многих десятков лет, включая самого Фурье. Наблюдения (1), (2) и (3) будут более подробно рассмотрены

ПЕРИОДИЧЕСКИЕ ФУНКцИИ И СУММА ЭЙЛЕРА

155

2.0 1.5

Частичная сумма x(t)

1.0 0.5 0 –0.5 –1.0 –1.5 –2.0 –10

–5

0

Время

5

10

15

Рис. 4.2.3. Сумма первых пяти членов ряда Эйлера 2.0 1.5

Частичная сумма x(t)

1.0 0.5 0 –0.5 –1.0 –1.5 –2.0 –10

–5

0

Время

5

10

Рис. 4.2.4. Сумма первых десяти членов ряда Эйлера

15

156

ГЛАВА 4. РЯДы ФУРьЕ

2.0 1.5

Частичная сумма x(t)

1.0 0.5 0 –0.5 –1.0 –1.5 –2.0 –10

–5

0

Время

5

10

15

Рис. 4.2.5. Сумма первых двадцати членов ряда Эйлера 2.0 1.5

Частичная сумма x(t)

1.0 0.5 0 –0.5 –1.0 –1.5 –2.0 –10

–5

0

Время

5

10

Рис. 4.2.6. Сумма первых сорока членов ряда Эйлера

15

ТЕОРЕМА ФУРьЕ ДЛЯ ПЕРИОДИЧЕСКИХ ФУНКцИЙ И ТЕОРЕМА ПАРСЕВАЛЯ

157

в  следующем разделе. А  наблюдениям (4) и  (5) мы посвятим от­ дельный раздел 4.4 не только потому, что с ними связана весьма интересная математика, но и  чтобы рассказать чарующую исто­ рию о талантливом, но почти позабытом (до сего дня) математике.

4.3. Теорема Фурье для периодических функций и теорема Парсеваля В декабре 1807­го, спустя двадцать пять лет после смерти Даниила Бернулли (в течение которых вопросы, связанные с тригонометри­ ческими рядами, оставались по преимуществу предметом споров), Жозеф Фурье представил Парижской академии наук поразитель­ ную работу. В ней он утверждал, что любую функцию можно запи­ сать в виде такого ряда. На самом деле он пошел даже дальше (и эту позицию, как мы знаем, много раньше занимал Бернулли). Фурье особо отмечал, что вопреки точке зрения Эйлера с помощью бес­ конечного числа нечетных синусоид можно представить функции, не являющиеся нечетными, и то же самое относится к тригономет­ рическим рядам из косинусоид. На самом деле (согласно Фурье) саму синусоиду можно выразить в виде суммы бесконечного числа косинусоид. Как это выглядит, я покажу в следующем разделе. Эти высказывания Фурье побудили его соотечественника, пре­ старелого мэтра французской математики Жозефа Луи Лагранжа (1736–1813), заявить – в очень резких выражениях, – что утвержде­ ния Фурье попросту невозможны. Такое отношение Лагранжа не­ удивительно – ведь на заре своей карьеры, полвека назад, он был на стороне ДʼАламбера и  Эйлера в  споре о  найденном Бернулли решении волнового уравнения в виде тригонометрического ряда. Лагранж, вероятно, воспринял заявления Фурье о тригонометри­ ческих рядах как дежавю. Заявления Фурье были основаны на его работе, связанной с од­ ним физическим дифференциальным уравнением в  частных производных – уравнением теплопроводности, которое он изучал в одномерной, двумерной и трехмерной формах. Как и волновое уравнение, оно решается методом разделения переменных. В од­ номерном случае оно имеет вид

158

ГЛАВА 4. РЯДы ФУРьЕ

где u(x, t) – температура теплопроводящего (тонкого) стержня в точ­ ке x в момент t[5]. Разумеется, в каждой конкретной задаче это фун­ даментальное уравнение сопровождается начальными и  гранич­ ными условиями, как и волновое уравнение. Физические свойства материала стрежня (теплоемкость, площадь поперечного сечения и  теплопроводность) заключены в  постоянной k. Это уравнение называют также уравнением диффузии, потому что оно описывает распространение, или диффузию, многих физических величин (не только тепла) в пространстве и во времени. Например, в трехмер­ ной форме оно описывает распространение капли чернил в  воде или распространение ложки сливок либо растворение кусочка са­ хара в чашке кофе. Уравнение диффузии было с блеском использо­ вано в 1850­х годах шотландским математиком Уильямом Томсо­ ном (1824–1907), впоследствии лордом Кельвином, для описания того, как электричество «распространяется» по очень длинному телеграфному кабелю (конкретно, по трансатлантическому кабе­ лю, связывающему Англию и Северную Америку[6]). Томсон одним из первых выразил восхищение работой Фурье – его первая работа, написанная, когда ему было всего пятнадцать лет, была посвящена рядам Фурье. Впоследствии Томсон использовал уравнение тепло­ проводности в попытке вычислить возраст Земли с помощью мето­ дов рациональной науки, а не на основании Библии. В той ранней статье он назвал теорию Фурье «математической поэмой»[7]. Как уже было сказано, не всех убедила статья Фурье 1807 года[8], тем не менее его критики объявили вопрос о теории теплопровод­ ности темой Академического конкурса по математике 1812 года. Вероятно, это было сделано, чтобы побудить Фурье прояснить и обобщить свои идеи, и если так, то это сработало – Фурье пред­ ставил работу на конкурс и получил премию. Увы, его критики так и не были убеждены, и новая работа не была опубликована. Тогда в 1822 году Фурье опубликовал свою работу в виде книги «Theórie analytique de la chaleur», после чего стало невозможно отмахнуться от сделанного им. Именно эта книга попала в руки юного Уилья­ ма Томсона и так вдохновила его. Труд Фурье огромен по объему и охвату материала, отдать ему должное в ограниченном объеме этой книги не представляется возможным, поэтому я остановлюсь только на самых драматических с точки зрения математики аспек­ тах[9]. Далее в  этом разделе предполагается, что имеется функ­ ция f(t), определенная на некотором интервале конечной длины. И только на этом интервале нас интересует, что «делает» f(t).

ТЕОРЕМА ФУРьЕ ДЛЯ ПЕРИОДИЧЕСКИХ ФУНКцИЙ И ТЕОРЕМА ПАРСЕВАЛЯ

159

Во­первых, без ограничения общности можно предположить, что функция f(t) определена на интервале 0 < t < L, – будем прос­ то считать, что момент времени t  = 0 и  есть начало интервала, а  масштаб («единицу измерения времени») выберем так, что­ бы интервал заканчивался в момент L. Или, если предпочитаете, можно отобразить произвольный конечный интервал a < t < b на 0 < t < L с помощью простого линейного преобразования

которое переводит t = a в t = 0, а t = b в t = L. Во­вторых  – и  этим прозрением мы целиком обязаны Фурье, поскольку ни Эйлер, ни ДʼАламбер, ни Бернулли, ни Лагранж, ни кто­либо еще до Фурье этого не заметил,  – мы можем продол­ жить определение f(t) с интервала 0 < t < L на интервал -L < t < L, определив f(t) на интервале -L < t < 0 как угодно. Действитель­ но, поскольку нас интересует только поведение f(t) на интервале 0 < t < L, какая разница, как ведет себя продолженная функция на интервале -L < t < 0? Никакой. А смысл продолжения в том, что если сделать это с умом, то мы пожнем результаты в виде порази­ тельной математической простоты. ценные, кстати, результаты. (Примеры я  скоро приведу.) Есть два специальных способа про­ должения f(t) на -L < t < 0: четное (как на рис. 4.3.1) и нечетное (как на рис. 4.3.2).

–L

0

L

t

Рис. 4.3.1. Четное продолжение f(t)

И последний шаг. Будем считать поведение f(t) на интервале -L < t < L одним периодом периодического продолжения уже про­ долженной функции f(t), т.  е. продолжим f(t) на весь интервал -¥ < t < ¥. Таким образом, мы имеем периодическую функцию с периодом T = 2L, и, согласно Фурье, это периодическое продол­

160

ГЛАВА 4. РЯДы ФУРьЕ

жение f(t) (которое мы в дальнейшем и будем иметь в виду, говоря об f(t)) можно записать в виде тригонометрического ряда:

где все коэффициенты a и b постоянны, а w0 = 2p/T (эта величи­ на называется основной частотой). Сейчас очень удобно записать эту сумму в терминах комплексных экспонент, потому что с ними, вообще говоря, удобнее работать, чем с  синусами и  косинусами. Итак, воспользуемся формулой Эйлера:

–L

0

L

t

Рис. 4.3.2. Нечетное продолжение f(t)

Далее, считая, что индекс k изменяется от -¥ до ¥, мы можем записать f(t) в виде

где все ck – постоянные (в общем случае комплексные). Действитель­ но, если f(t) – вещественная функция t, а так оно обычно и будет (но

ТЕОРЕМА ФУРьЕ ДЛЯ ПЕРИОДИЧЕСКИХ ФУНКцИЙ И ТЕОРЕМА ПАРСЕВАЛЯ

161

не всегда – далее мы приведем красивый пример «вещественного значения» комплексной функции), то, поскольку число, сопряжен­ ное вещественному, равно ему самому (комплексно сопряженным числом x + iy, обозначаемым (x + iy)*, называется число x - iy), мы видим, что каковы бы ни были коэффициенты ck, должно выпол­ няться равенство

Это, в свою очередь, означает, что ck = c-k (нужно только прирав­ нять коэффициенты при одинаковых экспонентах в обеих частях равенства). И  еще заметим, что для k  = 0 мы имеем c*0  = с0, т.  е. для любой вещественной f(t) коэффициент c0 обязательно вещест­ венный. Итак, все приготовления остались позади, и больше нельзя укло­ няться от вопроса, чему же равны коэффициенты Фурье – значе­ ния ck. На самом деле определить их нетрудно. Для любого целого k от -¥ до ¥ (скажем, k = n) умножим обе части выражения f(t) в рамочке на e-w0t и проинтегрируем по периоду, т. е. по любому интервалу длины T. Тогда

Последний интеграл легко взять. Мы будем по отдельности рас­ сматривать два случая: n ¹ k и n = k. Сначала если n ¹ k, то

162

ГЛАВА 4. РЯДы ФУРьЕ

Но поскольку w0T = 2p, а k - n целое, то, по формуле Эйлера, име­ ем ei(k-n)w0T = 1, поэтому интеграл равен нулю. С другой стороны, если n = k, то интеграл принимает вид

Объединяя оба случая, получаем

Таким образом,

И вот наконец­то мы получили элегантную формулу коэффици­ ентов Фурье:

Как я  упоминал в  конце раздела 4.1, этим подходом к  нахож­ дению коэффициентов разложения периодической функции f(t) в тригонометрический ряд мы обязаны Эйлеру[10]. Вот теперь мы можем понять, как современный аналитик вы­ вел бы ряд, открытый Эйлером в 1744 году и упомянутый в пре­ дыдущем разделе. Как показывают приведенные там графики (см. рис. с 4.2.3 по 4.2.6), Эйлер фактически работал с периодиче­ ской функцией с периодом T = 2p (один такой период – интервал 0 < t < 2p). Поэтому мы имеем w0 = 1 (из w0T = 2p) и, следовательно, в интервале 0 < t < 2p

где

ТЕОРЕМА ФУРьЕ ДЛЯ ПЕРИОДИЧЕСКИХ ФУНКцИЙ И ТЕОРЕМА ПАРСЕВАЛЯ

163

В случае n = 0 все просто:

В случае n ¹ 0 первый интеграл в выражении для cn равен

поскольку e-i2pn = 1 для любого целого n. Следовательно, наша фор­ мула cn сводится к

Применяя интегрирование по частям (или просто обратившись к таблице интегралов), находим, что для любой постоянной a

Полагая a = -in, получаем

или, т. к. e-i2pn = 1,

164

ГЛАВА 4. РЯДы ФУРьЕ

Таким образом, в интервале 0 < t < 2p имеем:

Суммируя попарно (n = ±1, ±2, ±3, L), имеем

а это и есть выражение, которое Эйлер привел в своем письме от 1744 года. Конечно, в нашем выводе нет блестящих (но безумных) эскапад, присутствующих в выводе Эйлера, который был показан в предыдущем разделе. И отметим один бонус, который мы полу­ чили «задаром»: если положить t = p/2, то окажется, что

или

и мы узнаем ряд Лейбница, названный по имени немецкого мате­ матика Готфрида Лейбница (1646–1716), – ранее мы привели его в этой книге без доказательства. С рядом Эйлера можно проделать парочку очень интересных вещей. Во­первых, проинтегрировав обе части от 0 до x, получаем

ТЕОРЕМА ФУРьЕ ДЛЯ ПЕРИОДИЧЕСКИХ ФУНКцИЙ И ТЕОРЕМА ПАРСЕВАЛЯ

165

Как показал Эйлер в 1734 году (и мы чуть позже тоже выведем это): , и потому

Полагая x = p/2, получаем

или

или

166

ГЛАВА 4. РЯДы ФУРьЕ

и, наконец, такую красивую формулу:

В ее правильности легко убедиться с  помощью компьютера (p2/12  = 0.82246703342411, а  сумма первых десяти тысяч членов знакочередующегося ряда равна 0.822467028442461). Теперь вернемся к  заключенному в  рамку выражению для cos(nx)/n2 и проинтегрируем его от 0 до u:

или

Полагая u = p/2, получаем

И эту формулу легко проверить: p3/32 = 0.96894614625937, а сум­ ма первых десяти тысяч членов знакочередующегося ряда равна 0.96894614619687. Эта формула особенно интересна, потому что чему равна сумма обратных кубов всех целых чисел, до сих пор неизвестно: ,

ТЕОРЕМА ФУРьЕ ДЛЯ ПЕРИОДИЧЕСКИХ ФУНКцИЙ И ТЕОРЕМА ПАРСЕВАЛЯ

167

а она вроде бы должна быть тесно связана с  вычисленной нами знакочередующейся суммой обратных кубов нечетных чисел. Но как говаривал Граучо Маркс: «close, but no cigar»*. Продолжать в этом духе можно было бы бесконечно: интегрировать и подстав­ лять интересные значения независимой переменной, получая тем самым бесконечно много все более экзотических формул, в  т.  ч. сумм все более высоких обратных степеней целых чисел. Но я на этом остановлюсь и перейду к другим темам. f(t) один период +1

–3p/2

–p –p/2

0

p/2 p

3p/2

t

–1 Рис. 4.3.3. Прямоугольная волна

Исторически важный пример (к которому мы еще вернемся в следующем разделе) – периодическая функция, определенная на одном периоде следующим образом:

Ее график показан на рис. 4.3.3 (полагаю, всем понятно, почему инженеры, физики и  математики называют эту функцию прямо­ угольной волной). Согласно Фурье (при T = 2p и w0 = 1): *

Выражение означает «близко, но недостаточно близко». – Прим. перев.

168

ГЛАВА 4. РЯДы ФУРьЕ

В данном случае коэффициенты особенно легко вычисляются, потому что для n = 0 мы имеем

а для n ¹ 0

Таким образом,

ТЕОРЕМА ФУРьЕ ДЛЯ ПЕРИОДИЧЕСКИХ ФУНКцИЙ И ТЕОРЕМА ПАРСЕВАЛЯ

169

Заметим, что подстановка t = 0 (это означает, что f = +1) снова дает нам ряд Лейбница. На рис.  4.3.4 показана частичная сумма (с десятью членами) этого ряда Фурье, и, как и в случае ряда Эйле­ ра, мы снова наблюдаем странные колебания в окрестности резких переходов. 1.5

Частичная сумма f(t)

1.0

0.5

0

–0.5

–1.0

–1.5 –8

–6

–4

–2

Время

0

2

4

6

Рис. 4.3.4. Частичная сумма разложения прямоугольной волны в ряд Фурье (с 10 членами)

В этом ряду Фурье кроется знаменитый результат. Поскольку f 2(t) = 1, то для всех t:

Теперь предположим, что мы почленно интегрируем обе части этого равенства от 0 до 2p (при возведении в квадрат левой части мы получаем квадраты всех слагаемых плюс все возможные попар­ ные произведения). Применяя легко доказываемую формулу

170

ГЛАВА 4. РЯДы ФУРьЕ

(просто замените косинусы эквивалентными выражениями в тер­ минах комплексных экспонент и проинтегрируйте), мы приходим к следующему результату:

или

То есть мы вычислили сумму обратных квадратов нечетных чи­ сел:

Далее, поскольку все целые числа можно разбить на два мно­ жества: четные и нечетные, то сумму обратных квадратов всех це­ лых чисел можно записать в виде:

или

откуда сразу же вытекает результат Эйлера, принесший ему все­ мирную славу (правда, его вывод не основывался на рядах Фурье):

Как вы помните, я пользовался этим результатом ранее в дан­ ном разделе, и мы можем легко «проверить» его:

ТЕОРЕМА ФУРьЕ ДЛЯ ПЕРИОДИЧЕСКИХ ФУНКцИЙ И ТЕОРЕМА ПАРСЕВАЛЯ

171

тогда как сумма первых десяти тысяч членов ряда равна 1.64483407184807. Наконец, вот поистине впечатляющее применение ряда Фурье. Пусть f(t) = cos(at), -p < t < p, где a – произвольное вещественное, нецелое число (почему нецелое, скоро станет понятно). Если пред­ ставить себе, что мы периодически продолжили эту функцию f(t) на всю ось -¥ < t < ¥ с периодом 2p, то w0 = 1 и

где

172

ГЛАВА 4. РЯДы ФУРьЕ

Таким образом,

или

или

или

У этого последнего выражения просто уйма замечательных частных случаев. Например, при t = 0 получаем

что при a = 1/2 сводится к . Это легко «проверить» численно; сумма первых десяти тысяч членов ряда в  правой части равна 3.14159264859029, это почти точно равно p. Если же положить t = p, то, поскольку cos(pn) = (-1)n (а (-1)n(-1)n= (-1)2n = 1), имеем:

или, если записать в другом виде, получим такой ошеломительный результат:

ТЕОРЕМА ФУРьЕ ДЛЯ ПЕРИОДИЧЕСКИХ ФУНКцИЙ И ТЕОРЕМА ПАРСЕВАЛЯ

173

Прежде чем переходить к другим примерам разложения в  ряд Фурье, я хочу показать исключительно полезную формулу, имею­ щую место для всех рядов Фурье. Для начала определим так назы­ ваемую энергию функции f(t) на периоде

Корнями это понятие уходит в физику, но мы будем рассматри­ вать его просто как определение. (Вскоре вы убедитесь, что это ис­ ключительно полезное определение, потому что позволяет легко выполнять чудесные вычисления.) Далее подставим разложение f(t) в ряд Фурье в интеграл энергии. Написав f 2(t) = f(t) · f(t) и при­ меняя разные индексы суммирования для каждого экземпляра f(t), получаем:

Как мы уже видели при выводе общей формулы коэффициентов Фурье, этот последний интеграл равен нулю для m и n таких, что m + n ¹ 0, и равен T (периоду), если m + n = 0, т. е. m = -n. Таким образом, наш результат сводится к так называемой формуле Парсе­ валя, названной в честь французского математика Марка­Антуана Парсеваля (1755–1836):

где я воспользовался тем фактом, что c-k = c*k, если f(t) – веществен­ ная функция. Этот результат часто записывают в альтернативной форме, которая получается, если заметить, что |c-k| = |ck|:

174

ГЛАВА 4. РЯДы ФУРьЕ

Здесь W/T называется мощностью функции f(t), поскольку в фи­ зике мощность – это энергия в единицу времени. Приведем поистине впечатляющее применение формулы Пар­ севаля. Пусть f(t) = e-t на интервале 0 < t < 2p, и продолжим это определение на всю вещественную ось -¥ < t < ¥, тогда интервал 0 < t < 2p будет одним периодом. Получившуюся периодическую функцию можно разложить в ряд Фурье (напомним, что w0T = 2p, так что в этой задаче w0 = 1):

где

Этот интеграл легко берется:

Таким образом, , и потому

ТЕОРЕМА ФУРьЕ ДЛЯ ПЕРИОДИЧЕСКИХ ФУНКцИЙ И ТЕОРЕМА ПАРСЕВАЛЯ

175

По формуле Парсеваля это равно

то есть

И вот совершенно неожиданно получается такой красивый ре­ зультат:

В разделе 5.5 я покажу еще более красивое обобщение. Конечно, можно усомниться в «правильности» этого результата, и два таких простых для вычисления выражения просто взывают о численной проверке:

а если вычислить сумму по n от -100 000 до 100 000 (в числе 100 000 нет ничего особенного, я просто взял «достаточно большое» чис­ ло, чтобы получить хорошую аппроксимацию истинного значения суммы), то получим

И хотя этот пример чудесен, я хочу показать еще одно примене­ ние формулы Парсеваля, которое, на мой взгляд, превзойдет его по красоте. Сначала обобщим наше определение энергии перио­

176

ГЛАВА 4. РЯДы ФУРьЕ

дической функции на периоде на комплексные функции. Один из способов сделать это, сохранив саму энергию вещественной (т. е. оставаясь одной ногой в «реальном мире»), – написать:

При вещественной f(t) это определение сводится к предыдуще­ му. При таком обобщенном определении энергии мы имеем

а поскольку сопряженное суммы равно сумме сопряженных и со­ пряженное произведения равно произведению сопряженных, то

Снова, поскольку этот интеграл равен нулю для m и n таких, что m - n ¹ 0, и равен T, если m - n = 0 (т. е. m = n), имеем

т. е. опять получаем формулу Парсеваля. Обратите внимание, что в этом выводе нигде не использовался тот факт, что c-k  = c*k, и  это хорошо, поскольку для комплексных функций это неверно! На самом деле это очень интересно, по­ тому что коль скоро мы показали, что формула Парсеваля имеет место для комплексных функций (а вещественные функции явля­ ются частным случаем комплексных), то использование равенства c-k = c*k в предыдущих рассуждениях для вещественных функций было избыточным требованием к  коэффициентам Фурье. Следо­ вательно, для анализа проблемы в общем случае нужно меньше ус­ ловий, чем в частном случае! Да, пути богов математики зачастую неисповедимы.

ТЕОРЕМА ФУРьЕ ДЛЯ ПЕРИОДИЧЕСКИХ ФУНКцИЙ И ТЕОРЕМА ПАРСЕВАЛЯ

177

Теперь предположим, что f(t) = eiat на интервале -p < t < p, где a – произвольная вещественная постоянная, не являющаяся це­ лым числом (почему нужно это условие, скоро станет ясно), и пе­ риодически продолжим f(t) на всю вещественную ось -¥ < t < ¥. При этом мы получаем комплексную периодическую функцию с периодом 2p. Поскольку w0 = 1, по теореме Фурье имеем

где

Если предположить, что a – произвольная вещественная посто­ янная, не являющаяся целым числом, то мы видим, что это вы­ ражение для ck всегда определено (т. е. ни для какого целого k зна­ менатель не обращается в ноль), и формула для коэффициентов ck имеет место для всех целых k. Энергия нашей комплексной функции равна

По формуле Парсеваля

Или, сделав замену переменной a = u/p, получаем:

178

ГЛАВА 4. РЯДы ФУРьЕ

Поскольку sin2(u - kp) = sin2(u) для всех целых k, то

где второе равенство справедливо, поскольку суммирование про­ изводится по всем целым k, положительным и  отрицательным. И наконец, положив u = pa, получаем

– красивое тождество (известное еще Эйлеру в 1740 году, но полу­ ченное им другими средствами)[11].

Подстановка конкретных значений a дает конкретные, допус­ кающие проверку случаи. Например, если a = 1/2, то

Лично мне это совсем не кажется «очевидным», да и у вас, на­ верное, возникают сомнения, а? Но численные проверки дают

и

Ну что ж, меня это убеждает! Надеюсь, и вас тоже. Но все может быть. И закончить данный раздел я  хотел бы признанием, что я  со­ знательно (быть может, чересчур охотно) ничего не говорил о схо­ димости рядов Фурье, которыми с таким азартом манипулировал. Существуют достаточные условия сходимости; так называемые сильные условия Дирихле, сформулированные в 1829 году. Если f(t) –

ТЕОРЕМА ФУРьЕ ДЛЯ ПЕРИОДИЧЕСКИХ ФУНКцИЙ И ТЕОРЕМА ПАРСЕВАЛЯ

179

периодическая функция, то частичные суммы ее ряда Фурье схо­ дятся к f(t) для всех t (кроме точек разрыва), если она абсолютно интегрируема и (1) f(t) имеет конечное число конечных разрывов на периоде и (2) f(t) имеет конечное число экстремумов на периоде. Эти условия называются сильными, потому что известно, что они не являются необходимыми, т. е. существуют функции f(t), не удовлетворяющие сильным условиям, для которых ряд Фурье тем не менее сходится для всех t (кроме точек разрыва). Сильные ус­ ловия достаточно мягкие, так что все функции, с которыми стал­ кивается инженер в «реальной жизни», им удовлетворяют. (Функ­ ции, не удовлетворяющие сильным условиям Дирихле, настолько странные, что по праву называются патологическими. Например, на рис.  4.3.5 показан один период функции f(t)  = t * sin(l/t), име­ ющей бесконечное число экстремумов на интервале 0 < t < 1; на самом деле число ее экстремумов бесконечно в любом конечном интервале 0 < t < e при сколь угодно малом e!) В 1904 году венгер­ ский математик Липот Фейер (1880–1959) открыл условия сходи­ мости, более слабые, чем сильные условия Дирихле, но даже они сильнее необходимых и  достаточных условий, а  такие условия до сих пор неизвестны. 1.0

f(t) = t ´ sin(1/t)

0.8 0.6 0.4 0.2 0 –0.2 –0.4

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

Время Рис. 4.3.5. Один период функции, нарушающей сильные условия Дирихле

0.9

1

180

ГЛАВА 4. РЯДы ФУРьЕ

4.4. Разрывные функции, явление Гиббса и Генри Уилбрэхэм Вот теперь мы готовы кое­что сказать о странных колебаниях, ко­ торые не желают убираться из ряда Эйлера для (p - t)/2. Как видно на рис. с 4.2.3 по 4.2.6, увеличение количества членов ряда Фурье улучшает аппроксимацию частичными суммами на большей части периода 0 < t < 2p, но не в правой окрестности точки t = 0 и не в левой окрестности t  = 2p. Такое колебательное поведение (ин­ женеры­электрики называют его «звоном») на самом деле харак­ терно для ряда Фурье любой разрывной периодической функции в окрестности точки разрыва (мы видели его и при аппроксима­ ции прямоугольной волны частичными суммами ряда Фурье на рис. 4.3.4), но, как ни странно, эти колебания ускользали от внима­ ния математиков на протяжении многих лет после работ Фурье[12]. Кроме одного. Но это я забегаю вперед. Думается мне, что история этого един­ ственного исключения и  есть самая интересная часть «рассказа о колебаниях», и я приберегу ее напоследок (в конце этого раздела приведены исторические сведения, публикуемые впервые). Традиционно рассказ о том, как эти колебания в конце концов были замечены, начинается в 1898 году с письма[13] в британский научный журнал Nature, написанного американцем Альбертом Майкельсоном (1852–1931), деканом физического факультета Чи­ кагского университета. В  этом письме Майкельсон спорил с тем, что рядом Фурье можно представить разрывную функцию. Вот что он пишет во вступительных предложениях: Во всех изложениях рядов Фурье, которые мне встречались, явно ут­ верждается, что ряд может представить разрывную функцию. Сама идея о  том, что реальный разрыв можно заменить суммой непре­ рывных кривых [отдельных членов ряда], так разительно расходится с понятием физиков о количестве, что, мне кажется, стоит потратить время, чтобы дать элементарное описание проблемы в  настолько простой форме, дабы математики могли сразу указать на противо­ речие, если оно присутствует.

В частности, Майкельсон не верил, что ряд Фурье для периоди­ чески продолженной функции f(t) = t, -p < t < p, может сходиться к нулю в точках разрыва (нечетных кратных p). Эти нули представ­ ляли бы собой «изолированные точки», и  Майкельсон приводил

РАЗРыВНыЕ ФУНКцИИ, ЯВЛЕНИЕ ГИББСА И ГЕНРИ УИЛБРЭХЭМ

181

аргументы, которые, по его мнению, доказывали, что это чушь. Ответ[14] был опубликован неделей позже за подписью О. Э. Х. Ла­ ва (1863–1940), тогда профессора математики в Кембриджском уни­ верситете. Лав корректно указал на математические ошибки в рас­ суждениях Майкельсона, начав некоторые предложения такими оборотами, как «Не обосновано, что…» и «Примененные процессы некорректны…», и  закончив замечанием, что Майкельсон начал свой анализ с  ряда, который даже не сходится! Через несколько недель Майкельсон ответил короткой заметкой, в которой писал, что его не убедили. Сразу вслед за его письмом, в том же номере Nature, было опубликовано письмо нового корреспондента, аме­ риканского специалиста по математической физике Дж. У. Гибб­ са (1839–1903) из Йельского университета, а также новое письмо Лава[15]. Лав снова попытался указать на упущения Майкельсона, да и Гиббс критиковал его рассуждения. Ответа от Майкельсона не последовало, а спустя несколько месяцев Гиббс написал историче­ ское итоговое письмо[16], которое часто цитируют в современных учебниках. Остальные письма в Nature забыты всеми, кроме исто­ риков науки. Это короткое письмецо, которое, по словам Гиббса, было на­ писано, только чтобы «исправить небрежность» и  «печальную оплошность», допущенную им в  первом письме, содержало не­ взначай оброненное, но от того не менее знаменательное утверж­ дение о том, что по мере увеличения количества членов в частич­ ной сумме ряда Фурье разрывной функции амплитуда колебаний уменьшается всюду, кроме окрестности точки разрыва. А  в  ней частичные суммы оказываются то больше, то меньше исходной функции, причем амплитуда отклонения не убывает при увели­ чении количества членов в частичной сумме. С увеличением ко­ личества членов уменьшается длительность интервала колеба­ ний, но не их максимальная амплитуда. И, взглянув еще раз на рис.  4.2.3–4.2.6, вы увидите именно то поведение, которое опи­ сывает Гиббс. Затем, не приведя ни вывода, ни объяснения, Гиббс просто ут­ верждает, что максимальное отклонение связано с  некоторым интегралом: когда t приближается к  p слева, максимальная ам­ плитуда ряда Фурье периодически продолженной функции f(t) = t равна не p, а 2 нение равно

(sin(u)/u du). А в процентном отношении откло­

182

ГЛАВА 4. РЯДы ФУРьЕ

или, более общо, ряд Фурье любой разрывной функции в  окрест­ ности точки разрыва превышает исходную функцию примерно на 17.9  % от полной величины скачка. Это число можно найти в  бес­ численных учебниках по технике, математике и  физике. И  если в них приводится хоть какая­нибудь цитата (а чаще всего не при­ водится), то именно из второго письма Гиббса в Nature, а сам факт отклонения называется «явлением Гиббса». Явление Гиббса отсутствует в рядах Фурье непрерывных перио­ дических функций. Например, рассмотрим функцию f(t)  = sin(t) в интервале 0 £ t £ p. Эта функция равна 0 в обоих концах, поэто­ му если мы продолжим ее по четности на интервал -p £ t £ 0, т. е.

а затем периодически на всю ось -¥ < t < ¥, то будем иметь пе­ риодическую функцию, которая непрерывна всюду. Если теперь построить графики частичных сумм ряда Фурье, то мы увидим, что явления Гиббса нет. И кроме того, ее ряд Фурье будет состоять из одних косинусов (поскольку мы выбрали четное продолжение), так что мы подтвердили заявление Фурье о том, что sin(t) (в интер­ вале 0 £ t £ p) можно представить в терминах бесконечного числа косинусов. Эту задачу легко поставить и  решить формально: по­ скольку T = 2p (и w0T = 2p, как всегда), то w0 = 1, и, следовательно, обозначив f(t) периодическую функцию на всей вещественной оси -¥ < t < ¥, будем иметь

где

РАЗРыВНыЕ ФУНКцИИ, ЯВЛЕНИЕ ГИББСА И ГЕНРИ УИЛБРЭХЭМ

183

Почти всегда – и в этом случае тоже – удобно сначала выразить sin(t) через комплексные экспоненты, тогда после несложных ал­ гебраических преобразований (оставляю их вам) получаем:

Подставляя этот результат в сумму, равную f(t), получаем

или, если положить n = 2k, где k = 1, 2, 3, ... (и, стало быть, n = 2, 4, 6, ...), получим

Если я нигде не ошибся, то эта сумма должна быть равна sin(t) в интервале 0 £ t £ p. Для проверки я построил графики несколь­ ких частичных сумм этого ряда Фурье, они показаны на рис. 4.4.1– 4.4.4 (для одного, пяти, десяти и двадцати первых членов). И ко­ нечно же, графики выглядят «тем более похожими» на sin(t), чем больше членов ряда Фурье мы суммируем. И никаких следов явле­ ния Гиббса нет и в помине (поскольку нет разрывов). И напоследок отмечу, что этот ряд Фурье имеет важные прило­ жения в электронике и в математике. Эта периодически продол­ женная всюду непрерывная функция называется выпрямленной двухполупериодной синусоидальной волной. Такой сигнал генериру­ ют некоторые электрические схемы, преобразующие переменный ток, текущий в настенных розетках, в пульсирующий постоянный ток. Затем можно «сгладить» и получить незатухающую волну, ко­ торая обычно необходима для правильной работы электронного оборудования, в т. ч. радио и компьютеров. Переписка в  Nature вскоре подошла к  концу. Сначала было опубликовано письмо французского математика Анри Пуанкаре (1854–1912) в защиту Майкельсона (в котором, кстати, были при­ ведены неправильные значения разрывного интеграла Дирихле). И наконец, отвечая Пуанкаре, Лав в последний раз попытался объ­ яснить положение вещей Майкельсону[17]. В этом Лав, как я пони­

184

ГЛАВА 4. РЯДы ФУРьЕ

1.2

Частичная сумма f(t)

1.0

0.8

0.6

0.4

0.2 –8

–6

–4

–2

0

2

4

6

Время Рис. 4.4.1. Разложение синуса на косинусы (один член) 1.4

Частичная сумма f(t)

1.2

1.0

0.8

0.6

0.4

0.2

0 –8

–6

–4

–2

0

2

4

Время Рис. 4.4.2. Разложение синуса на косинусы (пять членов)

6

РАЗРыВНыЕ ФУНКцИИ, ЯВЛЕНИЕ ГИББСА И ГЕНРИ УИЛБРЭХЭМ

185

1.0 0.9

Частичная сумма f(t)

0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 –8

–6

–4

–2

0

2

4

6

Время Рис. 4.4.3. Разложение синуса на косинусы (десять членов) 1.0 0.9

Частичная сумма f(t)

0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 –8

–6

–4

–2

0

2

4

Время Рис. 4.4.4. Разложение синуса на косинусы (двадцать членов)

6

186

ГЛАВА 4. РЯДы ФУРьЕ

маю, не преуспел, но важно понять, что и Майкельсон в этом деле вовсе не был невеждой. Просто он разделял общее заблуждение с математиками того времени, которые также не до конца пони­ мали поведение рядов Фурье разрывных функций. На самом деле Майкельсон был первоклассным экспериментатором мирово­ го уровня, именно «эксперимент Майкельсона–Морли» с  приме­ нением фантастического оптического интерферометра доказал, что эфир не оказывает никакого ощутимого влияния на скорость света, откуда следует постоянство скорости света во всех инерци­ альных системах отсчета (фундаментальная аксиома специальной теории относительности Эйнштейна). За эту работу Майкельсон получил в 1907 году Нобелевскую премию по физике. Нет, невеж­ дой он точно не был. Именно озадачивающие результаты, показанные еще одним фантастическим экспериментальным прибором, в конструирова­ нии и изготовлении которого он принимал участие, побудили его написать первое письмо в Nature. В статье, опубликованной в пре­ дыдущем (1898) году, Майкельсон (с соавтором С. У. Страттоном) описал удивительное механическое устройство. Вот что они писа­ ли во вступлении[18]: Каждый, кому доводилось вычислять или графически строить ре­ зультат большого количества простых гармонических колебаний, ощущал потребность в какой­нибудь простой и вместе с тем доста­ точно точной машине, которая экономила бы время и усилия.

Сегодня у всех у нас есть такие машины – наши персональные компьютеры, на которых работают такие программы для научных расчетов, как MATLAB или Mathematica, но во времена Майкель­ сона была лишь машина, сконструированная Уильямом Томсоном в 1880­х годах для прогнозирования приливов[19]. Фактически гар­ монический анализатор приливов изобрел брат Уильяма Джеймс Томсон, а  теоретические детали они опубликовали в  журнале Proceedings of the Royal Society за 1876 и 1878 годы. Предвосхищая вступительные слова Майкельсона и  Страттона, Уильям писал в  1882  году, что «цель этой машины [гармонического анализа­ тора приливов] – заменить мозги медью». (Поскольку микросхе­ мы современных компьютеров сделаны из кремния, я  полагаю, было бы справедливо перефразировать Томсона, сказав, что наши компьютеры «заменяют умников песком»!) Анализатор приливов отдаленно напоминает силовой агрегат современного автомоби­

РАЗРыВНыЕ ФУНКцИИ, ЯВЛЕНИЕ ГИББСА И ГЕНРИ УИЛБРЭХЭМ

187

ля[20] и выглядит весьма внушительно, но, как писали Майкельсон и Страттон в статье 1898 года, детали конструкции изобретатель­ ных братьев Томсонов в  конце концов приводили к  накоплению ошибок, которое сводило на нет всю пользу от увеличения коли­ чества членов в частичной сумме ряда Фурье (анализатор прили­ вов мог складывать 15 членов). После загадочных слов «несколько лет назад одному из нас при­ шло в  голову… что большинство недостатков существующих ма­ шин [существовал только анализатор приливов] на практике мож­ но устранить» (нет даже намека на то, кто из соавторов был тем «одним»), Майкельсон и Страттон сообщают: Примерно год назад [1897] была сконструирована машина [на их новом принципе сложения гармонических функций] с 20 элемента­ ми [т. е. позволявшая складывать столько гармонических функций], и полученные результаты так обнадеживали, что было решено [по­ строить] представленную машину с восьмьюдесятью [!] элементами.

В анализаторе Томсона использовался гибкий шнур, проходя­ щий через сложную систему неподвижных и  подвижных блоков. Точность машины ограничивалась растяжением шнура. С другой стороны, в  машине Майкельсона–Страттона[21] использовались зубчатые передачи, спиральные пружины, коробки передач и экс­ центрические колеса – детали, которые (на первый взгляд) гораз­ до меньше подвержены накоплению ошибок. И  действительно, в конце статьи они пишут, что «вполне реализуемой задачей вы­ глядит увеличение количества элементов до нескольких сотен или даже тысячи с пропорциональным повышением [точности]». (Как видим, физика «больших машин» началась не в XX веке констру­ ированием циклотронов – Майкельсон и Страттон были первыми еще в XIX!). Гармонические анализаторы Томсона и  Майкельсона–Страт­ тона автоматически рисовали результат суммирования чернила­ ми на бумаге, и  в  статье 1898 года Майкельсон и  Страттон при­ вели особенно впечатляющие результаты, на некоторых из них (графиках теоретически разрывных функций) отчетливо видно явление Гиббса. Теперь вы можете понять причины, побудившие Майкельсона начать свое первое письмо в  Nature цитированны­ ми выше строками, – графики, построенные его машиной, не были разрывными, даже при 80 членах. Задумывался ли он вообще о ко­ лебаниях с обоих концов резких, почти вертикальных переходов,

188

ГЛАВА 4. РЯДы ФУРьЕ

вычерчиваемых пером при прохождении математических разры­ вов, не ясно – наверное, он считал это кумулятивным эффектом многочисленных мелких, но неизбежных погрешностей в  работе машины. Письмо Майкельсона было результатом физических экс­ периментов, которые вступали в  противоречие с  ожиданиями, диктуемыми чистой математикой. Этот факт интересен сам по себе, потому что полемика в  Nature в  конечном итоге заставила математиков предпринять дополнительное изучение того, что же на самом деле означает разложение периодической функции в ряд Фурье. Но самую интересную часть этой истории я вам еще не рас­ сказал. Ответ на вопрос Майкельсона и открытие Гиббсом любопытного поведения ряда Фурье в  окрестности точки разрыва были пред­ восхищены и опубликованы за пятьдесят лет до того, в 1848 году, ныне забытым англичанином Генри Уилбрэхэмом (1825–1883), в  то время двадцатидвухлетним студентом Тринити­колледжа в  Кембридже. Статья Уилбрэхэма[22] начинается следующим пас­ сажем: Фурье в своем Трактате после обсуждения уравнения

говорит, что если считать x абсциссой, а y ординатой, то оно [урав­ нение] будет представлять геометрическое место отрезков прямых, которые равны p [по длине], параллельны оси x, расположены на рас­ стоянии p/4 от нее попеременно то выше, то ниже нее и соединены перпендикулярами, которые сами являются честью геометрическо­ го места, определяемого этим уравнением. Некоторые авторы, впо­ следствии рассматривавшие это уравнение, утверждали, что та часть отрезков, перпендикулярных оси x, которая удовлетворяет уравне­ нию, заключена между пределами ±p/4. Следующее вычисление по­ кажет, что эти пределы ошибочны.

В уравнении, которое приводит Уилбрэхэм, мы узнаем функцию прямоугольной волны, которая была проанализирована в преды­ дущем разделе и привела к рис. 4.3.4. На следующих двух страницах Уилбрэхэм вывел, что откло­ нение ряда Фурье в  точке разрыва пропорционально интегралу (sin(u)/u)du, т. е. тому самому интегралу, который Гиббс привел без вывода. Кроме того, статья Уилбрэхэма содержит ряд кропотли­

РАЗРыВНыЕ ФУНКцИИ, ЯВЛЕНИЕ ГИББСА И ГЕНРИ УИЛБРЭХЭМ

189

во вычисленных и  нарисованных вручную частичных сумм ряда Фурье прямоугольной волны; на этих графиках ясно видны коле­ бания, показанные на рис. 4.3.4, т. е. явление Гиббса было описано в печати, когда Гиббсу было всего девять лет. Тем не менее, когда американский математик Максим Бохер (1867–1918), работавший преподавателем в Гарварде, наконец в 1906 году дал полный ма­ тематический анализ поведения рядов Фурье в  точках разрыва (все еще понятия не имея об Уилбрэхэме), он ввел в употребление термин явление Гиббса для описания описанного поведения, и это название закрепилось в литературе. Как могла произойти такая грандиозная ошибка, спросите вы? Уилбрэхэм, очевидно, был талантливым математиком, но его та­ лант не воплотился в  академической карьере и  многочисленных опубликованных статьях, книгах и других формах профессиональ­ ного признания, которые могли бы принести ему известность. И  действительно, поиск по каталогу научных работ Королевско­ го общества находит только семь опубликованных работ Уилбрэ­ хэма, первая из которых – статья по рядам Фурье, а  последняя – изящно написанная статья 1857 года по актуарной математике, появившаяся в журнале Assurance Magazine[23]. Поэтому я хотел бы закончить этот раздел рассказом о том, что мне удалось узнать об этом давно забытом почти математике, самая первая опублико­ ванная работа которого на пятьдесят лет опередила его время[24]. Генри Уилбрэхэм родился 25 июля 1825 году в  обеспеченной семье и  был предпоследним из пяти братьев. Его отец Джордж (1779–1852) десять лет исполнял обязанности в парламенте, а мать леди Анна (умерла в 1864 году) была дочерью первого графа Фор­ тескью, так что они вращались в  высшем обществе. Например, в  октябре 1832 года родители Генри были в  одной из карет, со­ провождавших королевскую процессию на церемонию открытия тринадцатилетней принцессой Викторией (которая спустя пять лет станет королевой) моста Гросвенор Бридж (в то время самого большого однопролетного моста в  мире). После окончания элит­ ной школы Харроу Уилбрэхэм был принят в  Тринити­колледж Кембриджского университета в  октябре 1841 года, вскоре после своего шестнадцатилетия[25]. Он получил степень бакалавра ис­ кусств в 1846­м, а степень магистра искусств – в 1849 году. В тече­ ние нескольких лет (по меньшей мере до 1856 года) он был членом Тринити, а где­то после 1856 года оставил академическую карьеру по неизвестным причинам.

190

ГЛАВА 4. РЯДы ФУРьЕ

В 1864 году он женился на Мэри Джейн Мэрриот (умерла в 1914 году), у них было семеро детей (один дожил до 1954 года). К 1875 году он не работал как математик, а занимал должность на­ чальника судебной канцелярии в  канцлерском суде Манчестера. И  это была единственная должность (наряду с  бывшим членом Тринити), упомянутая в его завещании, когда он скончался (от ту­ беркулеза) 13 февраля 1883 года на 57­м году жизни. Он оставил семью хорошо обеспеченной, поскольку, помимо иного ценного имущества, на его пенсионном счету было свыше 37 000 фунтов. А потом мир, за исключением нескольких историков, забыл Генри Уилбрэхэма[26]. Когда началась полемика в  Nature, Уилбрэхэм был мертв уже больше пятнадцати лет, и  всю его работу, проделанную полвека назад, пришлось открывать заново. Если бы его статья не исчез­ ла из поля зрения ученых почти сразу же после публикации, то, быть может, развитие анализа Фурье происходило бы намного быстрее. Например, лишь в 1906 году Бохер наконец доказал, что если периодическая функция f(t) разрывна в точке t = t0, то в этой точке ряд Фурье функции f(t) сходится к 1/2[f(t0-) + f(t0+)], где f(t0-) и f(t0+) – значения f(t) «непосредственно до» и «непосредственно после» точки разрыва соответственно.

4.5. Дирихле вычисляет квадратичную сумму Гаусса В этом, предпоследнем разделе главы я покажу красивое приложе­ ние рядов Фурье, незнакомое большинству инженеров и физиков, потому что оно относится к абстрактной теории чисел; даже ма­ тематики могут не встретиться с ним до аспирантуры. Этот ана­ лиз вдвойне интересен для нас не только потому, что в  нем ис­ пользуются ряды Фурье и  формула Эйлера, но и  потому, что эта задача несколько лет не давалась самому великому Гауссу. В конце концов, он решил ее, применив теоретико­числовые рассужде­ ния, в 1805 году, когда Фурье только начинал свою работу. А спус­ тя тридцать лет (в 1835 году) Дирихле (который уже появлялся на страницах этой книги в разделах 1.7 и 1.8) воспользовался мето­ дом Фурье и вывел результат Гаусса совершенно новым и элегант­ ным способом. Постановка задачи проста. Мы хотим вычислить функцию G(m) (G в честь Гаусса), опреде­ ленную следующим образом:

ДИРИХЛЕ ВыЧИСЛЯЕТ КВАДРАТИЧНУЮ СУММУ ГАУССА

191

Гаусс столкнулся с этим выражением при изучении правильных n­угольников (см. раздел 1.6). Часто в определении G(m) фигуриру­ ют положительные экспоненты

но это всего лишь тривиальная вариация. Оба определения G(m) являются взаимно сопряженными. Это значит, что если мы знаем ответ для одного варианта G, то знаем и для другого; я еще вернусь к этому вопросу в конце анализа. G(m) называется квадратичной суммой Гаусса из­за k2 в  пока­ зателе степени, и именно эта квадратичность делает задачу труд­ ной[27]. Будь это просто k, мы имели бы обычную геометрическую прогрессию, с которой легко работать (вы сами можете показать, что в этом случае сумма равна нулю). И геометрически понятно, что сумма нулевая, потому что это сумма m ³ 2 векторов равной длины, исходящих из начала координат и  равномерно распреде­ ленных по окружности. Но стоит заменить k на k2, как равномер­ ность углового распределения исчезает, и  проблема становится крепким орешком. Конечно, нет никаких причин останавливаться на k2. На самом деле математики обобщили сумму Гаусса на показатель kp, где p – любое целое положительное число. Суммы Гаусса изучались по меньшей мере (насколько мне известно) до p = 24[28]. Но, проявив великую и  достойную восхищения сдержанность, я  ограничусь оригинальной квадратичной суммой Гаусса. Для начала кратко повторим, что мы сделали в  предыдущих разделах этой главы, и отольем это в ту форму, которая нам здесь понадобится. Предположим, что f(t)  – периодическая функция с периодом 1. Тогда ее разложение в ряд Фурье с комплексными экспонентами (напомним, что w0T = 2p и при T = 1 имеем w0 = 2p) имеет вид

192

ГЛАВА 4. РЯДы ФУРьЕ

где коэффициенты Фурье равны

Вот и все напоминание – я же говорил, что оно будет кратким! Теперь вопрос: что взять в качестве f(t)? Хитроумная идея Дирихле заключалась в том, чтобы определить f(t) следующим образом. Рассмотрим такую функцию g(t): , – и будем считать, что она описывает поведение периодической функции f(t) на одном полном периоде. Тогда наша периодическая f(t) – это просто продолжение g(t) в обе стороны до бесконечности. Отметим – это очень важно, – что G(m) = g(0) = f(0). Легко видеть, что, положив t = 0 в определении f(t), мы получим

Теперь осталось только найти выражение коэффициентов Фурье ck для f(t), подставить это выражение в сумму и вычислить резуль­ тат. Может показаться, что мы просто заменили исходную сумму G(m) другой, но такая замена нам очень выгодна – как выясняется, со второй суммой работать гораздо проще. Убедимся в этом. Подставляя выражение f(t) на одном периоде, то есть g(t), в инте­ грал, определяющий коэффициент Фурье, мы получаем

где я заменил индекс k на n в коэффициентах c, потому что k ис­ пользуется в качестве индекса суммирования под знаком интегра­ ла. Это «всего лишь» вопрос обозначений, но путать индексы не следует. Продолжаем:

ДИРИХЛЕ ВыЧИСЛЯЕТ КВАДРАТИЧНУЮ СУММУ ГАУССА

193

С помощью простых алгебраических преобразований легко убе­ диться (и я рекомендую вам сделать это), что

и, значит,

или, поскольку ei2pnk = 1, в силу формулы Эйлера (т. к. n, k и их про­ изведение – целые числа), имеем

Теперь произведем замену переменной u = k + t + 1/2mn. Тогда

Это выражение можно сильно упростить, сделав почти три­ виальное наблюдение:

Поэтому ,

194

ГЛАВА 4. РЯДы ФУРьЕ

и, поскольку раньше мы уже показали, что G(m) =

,

Еще раз подчеркнем очевидную, но важную деталь: в этом вы­ ражении m и n – целые числа; m > 1 и -¥ < n < ¥. Рассмотрим по­ ведение mn2/4 в первом показателе степени. Точнее, рассмотрим два случая: n четное и n нечетное. В первом случае все просто:2если n четное (L , -4, -2, 0, 2, 4, L), то mn2/4 целое и, значит, ei2pmn /4 = 1. Второй случай несколько сложнее. Если n нечетно (L, -3, -1, 1, 3, L), то существует такое целое l, что n = 2l + 1 и, следовательно, mn2/4 = m(2l + 1)2/4 = m(4l2 + 4l + 1)/4 = ml2 + ml + m/4, а это озна­ чает, что mn2/4 – целое число плюс дробная часть, зависящая толь­ ко от m. Эта дробная часть, естественно, может принимать только четыре значения: 0 (если m кратно 4), 1/4, 2/4 или 3/4. Рассматривая все их поочередно, получаем: 2  если дробная часть равна 0, то ei2pmn /42  = 1;  если дробная часть равна 1/4, то ei2pmn2/4 = i;  если дробная часть равна 2/4, то ei2pmn2/4 = -1;  если дробная часть равна 3/4, то ei2pmn /4 = -i. Для таких случаев есть стандартная нотация, которую матема­ тики называют арифметикой по модулю. Если m, q и r – целые числа такие, что

то это кратко записывают в виде m º r mod 4 и произносят «m срав­ 2 нимо с r по модулю 4». Итак, если h = ei2pmn /4, то для нечетного n имеем:

ДИРИХЛЕ ВыЧИСЛЯЕТ КВАДРАТИЧНУЮ СУММУ ГАУССА

195

Таким образом, наше последнее выражение для G(m) можно за­ писать в виде:

Но раньше мы показали, что же легко показать, что но для

и точно так , и то же самое вер­

Таким образом,

или, используя формулу Эйлера очевидным способом,

Оба эти интеграла называются интегралами Френеля, хотя пер­ вым их вычислил Эйлер еще в 1781 году, пользуясь комплексными числами[29]. Нам достаточно знать, что их можно найти в  любой достаточно полной таблице определенных интегралов:

Итак, при a  = 2p/m мы имеем (поскольку подынтегральные функции четные):

196

ГЛАВА 4. РЯДы ФУРьЕ

Таким образом,

И наконец,

Например, если m = 93, то m º 1 mod 4, и наша формула говорит:

Чтобы напрямую вычислить сумму, достаточно нескольких на­ жатий клавиш MATLAB, и в результате получается 9.64365076099295. (Различие начинается в  12­м знаке после запятой, это просто ошибка округления.) Да здравствует Гаусс! И наконец, если в определении G(m) использовать сопряженную форму, то, как и было обещано, получаем:

Вы, наверное, догадываетесь, что Гаусс испытал восхищение, увидев красивое новое решение старой задачи Мастера, найден­ ное Дирихле. Он восхищался и другими блестящими вкладами Ди­ рихле в  математику. В  письме от 2 ноября 1838 году Гаусс писал Дирихле (в Берлинскую Академию наук): «благодарю Вас за при­ сылку Ваших прекрасных работ». И  действительно, работы были настолько хороши, что в  знак признания заслуг Дирихле в  мире

ГУРВИц И ИЗОПЕРИМЕТРИЧЕСКОЕ НЕРАВЕНСТВО

197

математики он был избран преемником Гаусса в Гёттингене, когда тот умер в 1855 году.

4.6. Гурвиц и изопериметрическое неравенство Заголовок последнего раздела данной главы отсылает нас к древ­ ней задаче: как с помощью забора фиксированной длины огоро­ дить максимальную площадь. Задача никак не давалась на про­ тяжении буквально тысяч лет, потому что ответ (забор нужно выстроить в форме окружности) очевиден, но доказать его очень трудно. Задача ставила в  тупик самых блестящих математиков в течение многих веков. Я уже рассказывал историю изоперимет­ рического неравенства в  другом месте и  привел доказательство средствами вариационного исчисления[30], поэтому здесь я  прос­ то сформулирую задачу и  покажу, как она элегантно решается с  помощью рядов Фурье. Доказательство с  применением рядов Фурье сравнительно новое (1901), нашел его немецкий математик Адольф Гурвиц (1859–1919). Изопериметрическая задача состоит из двух частей: (i) площадь внутри замкнутой простой (т.  е. несамопересека­ ющейся) кривой с заданным периметром L не превосходит площади круга с длиной окружности L; (ii) окружность – единственная простая замкнутая кривая, для которой достигается максимум площади. Если обозначить кривую C, а ограничиваемую ей площадь A, то изопериметрическое неравенство математически записывается в виде

причем равенство достигается тогда и  только тогда, когда C  – окружность. Прежде чем приступать к доказательству, хочу отметить, что та­ кие задачи математики называют масштабируемыми. Это означа­ ет, что неравенство имеет место для любого значения L, поэтому если мы сможем доказать его для какого­то L, то сможем масшта­ бировать результат на любое другое значение. Чтобы убедиться в этом, предположим, что кривая C¢ имеет такую же форму, как C,

198

ГЛАВА 4. РЯДы ФУРьЕ

а периметр ее в l раз больше, чем у C, (т. е. L¢ = lL). Полагаю, что ваша интуиция не будет возражать, когда я скажу, что если L¢ = lL, то A¢ = l2A. Иными словами, L = L¢/l и A = A¢/l2. Тогда наше исходное утверждение означает, что

или

Таким образом, масштабный коэффициент l¢ > 0 не влияет на справедливость неравенства, а значит, мы вправе доказывать его для любого удобного нам L без ограничения общности. Как мы увидим, особенно удобно значение L = 2p (в этом случае изопери­ метрическое неравенство сводится к A £ p). Для начала я  установлю предварительный результат, кото­ рый понадобится нам в  доказательстве Гурвица. Интересно, что и  в  нем используются методы Фурье, а  конкретно формула Пар­ севаля. Пусть f(t) – вещественная периодическая функция с перио­ дом T = 2p и средним значением 0. Тогда при w0 = 1 (т. к. w0T = 2p) мы можем написать

В предположении, что почленное дифференцирование этого ряда дает ряд Фурье функции f ¢(t)= df/dt, имеем

где c¢k = ikck. Далее, у нас имеется общая формула коэффициентов

и, в частности, c0, очевидно, равно среднему значению f(t), кото­ рое, по предположению, равно нулю (заметим, что c¢0 = 0, даже если c0 ¹ 0). По теореме Парсеваля (см. раздел 4.3) мы знаем, что

ГУРВИц И ИЗОПЕРИМЕТРИЧЕСКОЕ НЕРАВЕНСТВО

199

и что

Очевидно, что

и, таким образом, мы получили искомый промежуточный резуль­ тат: если для вещественной функции f(t) с  периодом 2p среднее значение равно нулю, то

Этот результат называется неравенством Виртингера, поскольку обычно его связывают с именем австрийского математика Виль­ гельма Виртингера (1865–1945). Вот теперь мы можем приступить к  доказательству Гурвица. Представим, что мы расположили C относительно системы коор­ динат, и обозначим P самую правую точку пересечения C с осью x (рис. 4.6.1). Будем считать, что L, периметр C, равен 2p (как я уже говорил, это допущение не приводит к  ограничению общности). Начав с  P, обойдем C против часовой стрелки и  будем измерять координаты x и y как функцию от длины дуги s, отделяющей нас от P. Понятно, что функции x(s) и  y(s) периодические с  перио­ дом 2p (один полный проход вдоль C увеличивает s от 0 до 2p, и x(0) = x(2p), y(0) = y(2p), потому что при s = 2p мы возвращаемся в исходную точку P). Из курса математического анализа мы зна­ ем, что дифференциал длины дуги ds удовлетворяет соотношению (ds)2 = (dx)2 + (dy)2, так что

200

ГЛАВА 4. РЯДы ФУРьЕ

y

s>0

C

s=0 0

P

x s = 2p

Рис. 4.6.1. Геометрия изопериметрической задачи

Все это можно выразить математически (я заменил переменную s на t, просто чтобы уравнения выглядели более знакомо), памятуя о том, что w0 = 1, поскольку w0T = 2p и T = 2p:

И наконец, без ограничения общности я буду считать (физиче­ ски это очевидно), что мы всегда можем расположить оси коор­ динат, так что центр тяжести периметра C окажется на оси y, а это означает, что

т.  е. среднее x(t) равно нулю. Как вы скоро увидите, смысл этого действия в том, чтобы для x(t) и x¢(t) можно было выписать нера­ венство Виртингера. Из курса анализа известно[31], что площадь, ограниченная кри­ вой C, равна

ГУРВИц И ИЗОПЕРИМЕТРИЧЕСКОЕ НЕРАВЕНСТВО

201

Поэтому

Так как x¢2 + y¢2 = 1, то

или

Из неравенства Виртингера следует, что первый интеграл неот­ рицателен, а  второй интеграл, очевидно, неотрицателен, потому что подынтегральное выражение – полный квадрат. Таким обра­ зом, 2(p – A) ³ 0 или A £ p, откуда вытекает первая часть изопе­ риметрического неравенства. Заметим, что если C окружность, то A = p. Чтобы доказать вторую часть, мы должны показать, что из A = p следует, что C – окружность. Сделать это нетрудно. Если A  = p, то 2(p  - A)  = 0, и  каждый из этих двух неотрица­ тельных интегралов должен быть равен нулю. Но второй интеграл может обращаться в ноль, только если y¢ = x для всех t. Если объ­ единить этот вывод с уравнением x¢2 + у¢2 = 1, то получим

Таким образом,

или

202

ГЛАВА 4. РЯДы ФУРьЕ

или

Это равенство можно переписать в виде

или

откуда

Интегрирование дает

где K – произвольная постоянная, или (y + K)2 = 1 - x2, откуда, наконец, получаем x2 + (y + K)2 = 1, т. е. уравнение окружности с центром x = 0, y = -K радиуса 1 (пло­ щадь, ограниченная такой окружностью, конечно же, равна p), и  на этом вторая часть изопериметрического неравенства дока­ зана. Напоследок одно замечание: вы, возможно, удивляетесь, почему центр окружности расположен именно в точке x = 0, хотя координата y может быть любой. Напомним, однако, что мы на­ чали анализ с предположения о том, что центр тяжести периметра C лежит на оси y (это дало возможность воспользоваться неравен­ ством Виртингера), а в силу симметрии окружности это означает, что абсцисса центра C должна быть равна нулю.

ГЛАВА 5 Интегралы Фурье

5.1. Импульсная «функция» Дирака В этом коротком вступительном разделе я хочу расстаться с Фурье и  перескочить на столетие вперед к  Полю Дираку, английскому физику и математику, о котором я когда­то давно упоминал в пре­ дисловии. Сегодня его имя прочно связано с  понятием импульс­ ной функции (ее также часто называют дельта­функцией Дирака), которая очень пригодится нам – как и формула Эйлера – в следую­ щем разделе, посвященном преобразованию Фурье. Импульс (ско­ ро я определю, что это такое) – одно из важнейших технических средств в  руках физика или инженера; сам Дирак получил обра­ зование инженера­электрика (диплом с  отличием первой степе­ ни в выпуске Бристольского университета 1921 года). Но его док­ торская диссертация была по математике – несмотря на то что он получил Нобелевскую премию по физике, он занимал должность лукасовского профессора математики к Кембридже (и лишь гораз­ до позже стал профессором физики во Флоридском государствен­ ном университете в Таллахасси). Лукасовским профессором в свое время был также Исаак Ньютон, а теперь им является знаменитый физик Стивен Хокинг*. Отдавая предпочтение ясности (надеюсь!) перед строгостью, скажу, что импульс – это нечто, происходящее «сразу и целиком». (Когда игрок в  бейсбол бьет за пределы поля, он прикладывает * Оригинальное издание книги вышло в 2006 году. Стивен Хокинг умер 14 марта 2018 года. В настоящее время (2019 год) эту должность занимает Майкл Кейтс. – Прим. перев.

204

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

импульсивную силу к  мячу.) Представление самого Дирака об им­ пульсе показано на рис. 5.1.1, где мы видим узкий сигнал длитель­ ностью a и высотой 1/a с центром в точке t = 0. Этот сигнал, кото­ рый я буду называть f(t), равен нулю для всех |t| > a/2. Для любого a > 0 очевидно, что f(t) ограничивает единичную площадь, и это вполне обыкновенная, корректно определенная функция. f(t) 1/a

–1/2a

0

1/2a t

Рис. 5.1.1. Импульс ненулевой ширины с единичной площадью

Но представим далее, что мы умножаем f(t) на некоторую почти произвольную (мы требуем только, чтобы она была непрерывной) функцию f(t), а  затем интегрируем произведение по всем t, т.  е. определим интеграл

Теперь устремим a к  нулю. Это означает, что высота f(t) будет бесконечно расти, а интервал интегрирования (длительность f(t)) бесконечно уменьшаться. Поскольку f(t) непрерывна, я  полагаю физически очевидным, что f(t) не может изменяться слишком сильно на интервале интегрирования. Действительно, при a ® 0 мы можем считать f(t) постоянной на всем интервале, т. е. равной f(0), и вынести ее из­под знака интеграла. Тогда

Предел f(t) при a ® 0 показан на рис. 5.1.2 как попытка проил­ люстрировать тот факт, что наш самый что ни на есть обыкно­

ИМПУЛьСНАЯ «ФУНКцИЯ» ДИРАКА

205

венный сигнал «становится» бесконечно высоким пиком нулевой длительности, ограничивающим единичную площадь. Поскольку нарисовать бесконечно высокий пик мне не под силу, я  просто изобразил направленную вверх стрелку с меткой «1», означающей, что пик ограничивает единичную площадь (а не то, что высота пика равна 1, – она бесконечна!). Этот пик называется импульсом единичной силы. Формально мы можем записать предел f(t) в виде

что означает, что импульс имеет место в точке t = 0. d(t) =

f(t)

1

0

t

Рис. 5.1.2. Импульсная «функция» Дирака

Когда этот объект находится на странице сам по себе, обнажен­ ный и беззащитный, он выглядит очень странно, но под знаком ин­ теграла он ведет себя вполне разумно; например, как мы только что видели, для любой непрерывной функции f(t)

На самом деле ничего особенного в моменте t = 0 нет, мы можем поместить импульс в  любую точку на временной оси, например t = t0, просто написав d(t - t0). Тогда, в силу тех же рассуждений, что и выше, если f(t) – произвольная непрерывная функция, то ;

206

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

это называется фильтрующим свойством импульсной функции. В  конце раздела я  покажу изумительное применение данного свойства. Такого рода рассуждения многими аналитиками XIX века от­ вергались как «полная чушь». И должен признать, не без причины. В частности, когда я выносил 1/a из­под знака интеграла при вы­ числении I = f(t)f(t)dt, оставляя внутри только f(t), я рассмат­ ривал a как постоянную. Поскольку сама операция интегрирова­ ния определяется через переход к пределу, я, по сути дела, поменял порядок двух пределов. «Гм, – скажет скептик, вопросительно изо­ гнув бровь, – а откуда вы знаете, что эта операция математически корректна»? «Гм, – отвечу я, – я не знаю и даже понимаю, что за­ частую это не так. Но, будучи по натуре авантюристом, я не оста­ новлюсь в нерешительности, а буду идти вперед, пока не случится что­то математически ужасное, означающее, что я зашел слишком далеко». Вот так к этому относился и Дирак[1]. Дирак, конечно, знал о нестрогости своего обращения с импуль­ сами. (Чтобы напомнить о несколько сомнительном происхожде­ нии импульса, его часто называют «сингулярной» функцией.) Вот что писал Дирак в  своей новаторской статье 1927 года (опубли­ кованной, когда ему было всего 25 лет), представляя импульсную функцию физикам[2]: Конечно, строго говоря, d(x) не является настоящей функцией от x, ее можно рассматривать только как предел некоторой последователь­ ности функций. Но все равно d(x) можно использовать так, будто это настоящая функция, практически для всех целей квантовой меха­ ники, не получая при этом некорректных результатов. Можно также использовать производные от d(x), а именно d¢(x), d²(x), L, еще более разрывные и менее «настоящие», чем сама d(x).

Много лет спустя Дирак отдал дань своему инженерному образо­ ванию, благодаря которому он научился порывать с излишне огра­ ничительной верностью абсолютной математической строгости[3]. Я попытаюсь объяснить, какое влияние оказала на меня инженерная подготовка. Я не применял эти конкретные знания в работе, но они очень сильно изменили мой взгляд на мир. Прежде меня интересо­ вали только точные уравнения. Но полученное мной инженерное образование научило меня терпимее относиться к  приближениям, и  я  стал видеть, что теории, основанные на приближениях, иногда содержали в себе удивительную красоту… Я думаю, что если бы не

ИМПУЛьСНАЯ «ФУНКцИЯ» ДИРАКА

207

это инженерное образование, я не добился бы никаких успехов в ра­ боте, которой занимался впоследствии… В своей дальнейшей работе я продолжал пользоваться в основном нестрогой математикой ин­ женеров и думаю, что в  большинстве моих последующих работ вы обнаружите нестрогую математику… Чистый математик, который хочет во всем добиваться абсолютной точности, вряд ли далеко про­ двинется в физике (курсив мой).

Не надо думать, что все это  – просто заметание неряшливой математики под ковер. Под математику импульсов было подве­ дено прочное основание, с  тех пор как Дирак впервые начал их использовать. Значительная часть ранней работы была проделана советским математиком Сергеем Соболевым (1908–1989), но, по общему признанию, центральной фигурой в  этом грандиозном предприятии стал французский математик Лоран Шварц (1915– 2002), опубликовавший две книги «Theory of Distributions» (1950, 1951). За свою работу по теории распределений Шварц в 1950 году был удостоен филдсовской медали, которую часто называют «Но­ белевской премией в математике». Теперь, наконец, мы подошли к  центральной идее импульса. Если воспользоваться представлением об интеграле функции как о  площади области, ограниченной графиком этой функции, то должно быть понятно, что

где s – конечно, просто фиктивная переменная интегрирования. Если t < 0, то импульс (единичной площади) не находится в  ин­ тервале интегрирования – d(s) расположена в точке s = 0, – поэто­ му интеграл равен нулю, тогда как при t > 0 импульс находится внутри интервала интегрирования, и потому интеграл равен пло­ щади импульса, т. е. единице. Такая функция, равная нулю для t < 0 и единице для t > 0, называется единичной ступенчатой функци­ ей (поскольку, как видно на рис. 5.1.3, ее график выглядит как по­ перечное сечение ступеньки). Единичная ступенчатая функция, обозначаемая u(t), имеет разрыв в точке t  = 0, и  я  буду избегать (до раздела 5.3) вопроса о том, чему «равно» u(0). Таким образом,

208

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

и потому, дифференцируя обе части, мы формально получаем, что импульс единичной площади – это производная единичной сту­ пенчатой функции:

u(t)

1

0

t

Рис. 5.1.3. Единичная ступенчатая функция

Интуитивно это имеет смысл, потому что u(t) постоянна всюду, кроме точки t = 0, где она делает скачок величиной 1 за нулевое время (а теперь вспомните определение производной). Эта об­ разная связь между единичной и  импульсной функциями почти наверняка была подсказана Дираку его образованием в  области электротехники, где он впервые столкнулся со ступенчатой функ­ цией в  книгах по электрическим схемам и  теории электромаг­ нитного поля, написанных английским математиком и  инжене­ ром­электриком Оливером Хевисайдом (1850–1925). И до сих пор ступенчатую функцию инженеры и математики иногда называют функцией Хевисайда (и обозначают H(t) в память о нем). Этот шаг нам уже встречался ранее, вернитесь к разделу 1.8, где мы вывели разрывный интеграл Дирихле:

ИМПУЛьСНАЯ «ФУНКцИЯ» ДИРАКА

209

Там я воспользовался функцией sgn(x), чтобы записать правую часть более компактно, но с тем же успехом можно было использо­ вать и ступенчатую функцию:

Теперь давайте формально продифференцируем обе части:

где при выводе последнего интеграла мы воспользовались обыч­ ным предположением о  возможности поменять порядок диффе­ ренцирования и интегрирования. Так как косинус – четная функ­ ция, при продолжении интеграла с  области (0, ¥) на (-¥, ¥) результат удваивается:

Так как синус – нечетная функция, то , и, следовательно, по формуле Эйлера

Таким образом, мы получили поистине поразительный резуль­ тат:

Поразительность заключается в  том, что попытка вычислить интеграл вообще не имеет смысла, т. к. eiwt не стремится ни к како­

210

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

му пределу при |w| ® ¥. Вещественная и мнимая части eiwt посто­ янно осциллируют, никогда не приближаясь к каким­то конечным значениям. И единственный способ извлечь из этого хоть какой­то смысл – интерпретировать правую часть выражения в рамке (ин­ теграл) просто как последовательность напечатанных закорючек, означающих то же самое, что напечатанные закорючки в левой ча­ сти (импульс). Всякий раз, встретив закорючки, стоящие в правой части, мы заменяем их на d. Наверное, все это «жонглирование символами» оставило вас в некотором недоумении, поэтому позвольте мне закончить этот раздел примером, который, надеюсь, убедит вас в том, что это не просто безумие. Рассмотрим периодическую функцию, показан­ ную на рис. 5.1.4, которая состоит только из единичных импульсов. Промежуток между соседними импульсами равен единице, т.  е. f(t) периодическая с периодом T = 1. Эту функцию часто называ­ ют периодическим цугом импульсов (и мы еще встретимся с  ней, когда дойдем до важной теоремы дискретизации). Ряд Фурье этой функции f(t) формально (с w0 = 2p, поскольку, напомним, w0T = 2p) имеет вид

где

f(t)

–3

–2

–1

0

1

2

3

Рис. 5.1.4. Периодический цуг импульсов

t

ИМПУЛьСНАЯ «ФУНКцИЯ» ДИРАКА

211

Интервал интегрирования (длины T = 1) может быть выбран где угодно, но я  положу его равным -1/2 < t < 1/2, чтобы сразу было видно, чему этот интеграл равен. При таком выборе интервала интегрирования в него – прямо в середину – попадает ровно один импульс – тот, что находится в точке t = 0. Если бы я выбрал интер­ вал от 0 до 1, то в него попало бы два импульса, по одному на каж­ дом конце. Или не попало бы? Быть может, это были бы два «полу­ импульса», что бы это ни означало. Благодаря выбору интервала -1/2 < t < 1/2 мы ненавязчиво избегаем этой неприятной неодно­ значности и находим, что

вследствие фильтрующего свойства импульса. Таким образом,

Для всех t мнимая часть f(t) обращается в  ноль (и это хорошо, поскольку мы начинали с чисто вещественной функции f(t)). Дей­ ствительно, выписывая сумму в правой части и объединяя в пары симметричные члены, мы получаем

поскольку каждое заключенное в  фигурные скобки слагаемое тождественно равно нулю для всех t (и, разумеется, sin(0)  = 0). Итак, наша функция f(t) равна

Но верно ли это? Так же, как и в предыдущих случаях, поступим прагматично – просто вычислим и построим график правой части и посмотрим,

212

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

как он выглядит. Если обведенный рамкой результат имеет хоть какой­то смысл, то мы должны увидеть, как частичные суммы ряда в правой части начинают все больше напоминать периодический цуг импульсов. На рис. 5.1.5–5.1.7 показаны три частичные суммы (первых пяти, десяти и двадцати членов соответственно), и дей­ ствительно мы видим «выстраивание импульсов». Косинусы скла­ дываются (конструктивно интерферируют) при целых значениях t и  деструктивно интерферируют при всех остальных. Конечно, эти графики ничего не доказывают, но я думаю, они убедительны и дают основания полагать, что в нашем жонглировании символа­ ми все­таки есть смысл. И последнее замечание об импульсах. На рис. 5.1.1 показано, что импульсоподобная функция, которую сам Дирак использовал для объяснения концепции импульса, четна. Мы можем формально доказать, что и  d(t) обладает этим свойством. На самом деле это почти тривиально. Если f(t), как обычно, произвольная непрерыв­ ная функция, то

в силу фильтрующего свойства. Но если сделать замену перемен­ ной s = -t, то и

Поэтому мы говорим, что d(t) и  d(-t) эквивалентны (или, ме­ нее строго, равны), т.  к. они порождают один и  тот же результат при применении к любой непрерывной f(t) под знаком интеграла. Итак, d(t) = d(-t), т. е. d(t) четна. Мы воспользуемся этим важным результатом в конце следующего раздела.

ИМПУЛьСНАЯ «ФУНКцИЯ» ДИРАКА

213

12 10

Частичная сумма f(t)

8 6 4 2 0 –2 –4 –3

–2

–1

0

Время

1

2

3

4

Рис. 5.1.5. Первые пять членов ряда Фурье цуга импульсов 25

Частичная сумма f(t)

20

15

10

5

0

–5 –3

–2

–1

0

Время

1

2

3

Рис. 5.1.6. Первые десять членов ряда Фурье цуга импульсов

4

214

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

50

Частичная сумма f(t)

40

30

20

10

0

–10 –3

–2

–1

0

Время

1

2

3

4

Рис. 5.1.7. Первые двадцать членов ряда Фурье цуга импульсов

5.2. Интегральная теорема Фурье Ряд Фурье – это математическое описание периодической функции f(t) (как обычно, мы считаем, что t представляет время). Но что, если функция, определенная на интервале -¥ < t < ¥, не перио­ дическая? Поскольку область определения функции уже «съела» всю бесконечную ось t, мы не можем воспользоваться привычным периодическим продолжением – продолжать­то некуда. Поэтому ряд Фурье не подходит. Но есть еще один дьявольски изобретатель­ ный трюк. Что, если просто считать, что непериодическая функция f(t) имеет бесконечно длинный период, т. е. все­таки является перио­ дической (когда t пробегает интервал от -¥ до +¥, мы наблюдаем время, в котором нам довелось жить)? Хитроумно – нет, по чести говоря, просто безумно – но это стандартный подход едва ли не во всех встречавшихся мне учебниках для инженеров. При таком под­ ходе берут уравнения ряда Фурье

ИНТЕГРАЛьНАЯ ТЕОРЕМА ФУРьЕ

215

, и изучают, что с  ними происходит, если «математически» устре­ мить T к бесконечности. Быть может, «изучают» – слишком мягкое слово. На самом деле мы устраиваем игрища с обоими уравнениями ряда Фурье – бес­ церемонно, мало обращая (или вообще не обращая) внимания на обоснование манипуляций. Но – и это важно понимать – если все получилось, то это уже не имеет значения. Коль скоро мы имеем результат, к которому стремились (т. е. ответ на вопрос «что про­ исходит, когда T ® ¥?»), можно забыть, как он был получен, и рас­ сматривать его просто как определение. А сделать это мы можем, потому что результат – интеграл Фурье – имеет глубокий физиче­ ский смысл, и тем самым Природа говорит нам, что хотя получили мы его несколько «небрежно», сам результат все­таки хорош. И во многих книгах об интеграле Фурье, написанных математиками, принят точно такой образ действий. Ну что ж, давайте­таки посмотрим, что происходит при T ® ¥. Сначала заметим, что kw0 в  показателе степени под интегралом, определяющим ck, изменяется на w0, когда k увеличивается на еди­ ницу. Если обозначить это изменение Dw, то Dw  = w0. Далее, по­ скольку w0 = 2p/T, то при T ® ¥ будет w0 ® 0, т. е. w0 становится бесконечно малым, поэтому мы можем писать dw, а не Dw, т. е. при T  ®  ¥ изменение основной частоты становится дифференциаль­ ным. То есть мы получили первый результат

Отсюда также следует, что при T ® ¥ k(2p/T) ® kdw. Поскольку dw, по определению, бесконечно мало, когда k изменяется от -¥ до +¥, kdw «должно вести себя» как непрерывная переменная, ко­ торую мы обозначим w, т. е.

Если вы готовы принять все это, то продолжим и перепишем вы­ ражение для ck (в случае, когда T ® ¥ и интегрирование произво­ дится по периоду, симметричному относительно t = 0) в виде

216

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

или, если мы определим интеграл в квадратных скобках, назвав его преобразованием Фурье функции f(t), и  будем обозначать F(w), то получим

где

У преобразования Фурье много замечательных математических свойств и крайне полезная физическая интерпретация, и обо всем этом мы будем говорить далее в данной главе. Наконец, чтобы завершить эту линию «рассуждений», подста­ вим полученный результат для limT®¥ck обратно в  формулу для f(t):

Конечно, в этой формуле намешано всего понемножку: одни ее части написаны в предположении, что T ® ¥, а другие – так, будто T по­прежнему конечно. На самом деле таков же и последний шаг этого рассуждения, поскольку при T ® ¥ суммирование превра­ щается в интегрирование (и, «конечно», kw0 ® w), и мы приходим к обратному преобразованию Фурье, которое применяется к само­ му преобразованию Фурье и позволяет получить f(t) по F(w):

ИНТЕГРАЛьНАЯ ТЕОРЕМА ФУРьЕ

217

Оба обведенных рамкой выражения называются интегральной парой преобразования Фурье. В  отличие от рядов Фурье, которые использовались задолго до Фурье, преобразование Фурье принад­ лежит только ему и впервые было описано в его работах. Симво­ лически мы будем записывать взаимно однозначное соответствие между функцией f(t) и ее преобразованием Фурье F(w) в виде f(t) « F(w). Двойная стрелка показывает, что каждая сторона однозначно определяется другой стороной. По соглашению, функцию от вре­ мени всегда записывают слева, а функцию от частоты (ее преоб­ разование) – справа. В  таком виде f(t) и  F(w) называются просто парой Фурье. Многие «чистые» математики приходят в ужас от предыдущего «вывода», и должен признаться, что хотя я именно так знакомил своих студентов с  преобразованием Фурье в  течение последних тридцати лет, я  всегда испытывал при этом некое чувство вины. Конечно, не такое сильное, чтобы остановиться, – я ведь ничтоже сумняшеся изменяю порядок интегрирования в  двойном инте­ грале. Я  уповаю (быть может, зря) на недавние слова одного ма­ тематика[4]: «В математике, как и в жизни, добродетель не всегда вознаграждается, а порок не всегда наказуем» (курсив мой). И тем не менее всегда полезно знать, как можно сделать нечто разными способами, поэтому я представлю альтернативный подход к паре преобразований Фурье, который, быть может, будет немного про­ ще переварить. Вспомним «поразительное выражение» d(x) из предыдущего раздела:

Из него сразу следует, что

Теперь возьмем произвольную функцию h(x) и  воспользуемся фильтрующим свойством импульса:

218

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

Таким образом,

Ну а  последний шаг уже очевиден – запишем это в  виде пары интегралов: внутреннего

и внешнего

А это не что иное, как все та же пара преобразований Фурье (только h(x) заменяет f(t)). Вот и все! Преобразование Фурье вещественной функции f(t) в общем слу­ чае является комплексной функцией, но может быть какой угодно. Ограничения, впрочем, существуют. Например, легко показать, что функция |F(w)|2 всегда четная. Интересует нас это потому, что величина |F(w)|2 тесно связана с физической интерпретацией F(w) (1/2p)|F(w)|2 называется энергетическим спектром f(t). Почему, мы узнаем в следующем разделе, а пока я хочу продемонстрировать четность |F(w)|2 для любой вещественной f(t). Пользуясь формулой Эйлера, можно написать

Если прямо записать F(w) как комплексную величину: F(w) = R(w) + iX(w),

ИНТЕГРАЛьНАЯ ТЕОРЕМА ФУРьЕ

219

то получим

и

где R(w) и X(w) – вещественные функции w (потому что f(t) вещест­ венная). Поскольку cos(wt) – четная, а sin(wt) – нечетная функция, то

То есть R(w) четная, а X(w) нечетная, поэтому R2(w) и X2(w) чет­ ные, и так как |F(w)|2 = R2(w) + X2(w), то |F(w)|2 (равно как и  |F(w)|) четная. Если, напомню, f(t) вещест­ венная. Если мы наложим дополнительные ограничения на f(t), поми­ мо вещественности, то сможем больше сказать и о F(w). Например, если f(t) четная (нечетная), то из определения интегралов R(w) и X(w) понятно, что F(w) чисто вещественная (мнимая) (я восполь­ зуюсь этим наблюдением в конце раздела). А в главе 6 я покажу, что если f(t) – каузальная функция (любая f(t), обладающая тем свой­ ством, что f(t) = 0 для t  0) постоянная, а u(t) – ступенчатая функция, опреде­ ленная в предыдущем разделе. Преобразование Фурье f(t) равно

224

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

т. е. мы имеем такую пару Фурье:

Следовательно, |F(w)|2  = 1/(s2  + w2), и, по формуле плотности энергии Рэлея, имеем

или

Мы можем записать это в виде:

или

После замены переменной x = w/s (следовательно, dw = sdx) по­ лучаем

ФОРМУЛА ПЛОТНОСТИ ЭНЕРГИИ РЭЛЕЯ, СВЕРТКА

225

и, наконец,

Конечно, это просто частный случай общего неопределенного интеграла ∫(dx/(1 + x2)) = tg-1(x). Но здесь нам интересно исполь­ зовать для вывода этого результата теорию преобразования Фурье, потому мы можем использовать эту пару Фурье для ответа на за­ гадку, которую я упомянул в разделе 5.1, – каково «значение» u(0) ступенчатой функции в  точке t  = 0? До сих пор мы считали это «значение» неопределенным, но на самом деле теория преобра­ зования Фурье говорит, что u(0) не может быть чем угодно. Что­ бы убедиться в  этом, воспользуемся обратным преобразованием Фурье и запишем

Тогда, полагая t = 0, получаем

Второй интеграл равен нулю, потому что его подынтегральное выражение – нечетная функция w, и, значит, u(0) имеет веществен­ ное (это как раз неудивительно!) значение, равное

Но совсем недавно мы показали, что этот интеграл равен (p/s), поэтому u(0)  = 1/2. Вспоминая, как ведет себя ряд Фурье в  точке разрыва, этот результат следует признать ожидаемым; u(0) равно среднему значений u(t) по обе стороны от точки разрыва t = 0.

226

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

Пример 3. Рассмотрим функцию

Тогда

Следовательно,

Согласно формуле Рэлея,

или

ФОРМУЛА ПЛОТНОСТИ ЭНЕРГИИ РЭЛЕЯ, СВЕРТКА

227

или

В интеграле в правой части сделаем замену переменной x = w/a (dw = adx). Тогда

или, воспользовавшись результатом из примера 2,

Таким образом,

или

– очень красивый результат, вывести который без формулы плот­ ности энергии Рэлея было бы куда труднее. (Заметим, что в случае m = 0 он сводится к выведенному ранее более простому интегралу.) При выводе последнего результата мы неявно предполагали, что m > 0, поскольку начали с определения f(t) на интервале 0 < t < m. Проверьте сами, что если проделать это вычисление для функции f(t) = eat на интервале m < t < 0 (в этом случае m < 0), то получится результат

В общем случае – для любого m – можно написать такое выра­ жение:

228

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

У формулы плотности энергии Рэлея есть прямое математи­ ческое следствие, имеющее весьма интересную физическую ин­ терпретацию. Если f(t) имеет конечную энергию (ограничение, которому удовлетворяют почти все функции времени, представля­ ющие интерес для инженеров, – исключениями являются импульс и ступенчатая функция, но об этом чуть ниже), то формула Рэлея говорит, что

Но это может быть справедливо, только если lim|w|®¥|F(w)|2 = 0, поскольку иначе интеграл по w равен бесконечности. (Я замечал, что иногда студентам нужно немного подумать, чтобы переварить это: предположим, напротив, что lim|w|®¥|F(w)|2 = e > 0, где e сколь угодно мало, но отлично от нуля; поскольку интеграл по w берется от -¥ до ¥, то площадь под кривой |F(w)|2 была бы бесконечна). На самом деле |F(w)|2 должно не просто стремиться к нулю при |w|®¥, но и делать это достаточно быстро, т. е. быстрее, чем 1/|w|, чтобы интеграл по w существовал (если |F(w)|2 будет убывать лишь со скоростью 1/|w|, то интеграл все равно будет логарифмически рас­ ходиться). То есть, чтобы энергия f(t) была конечной, F(w) должно убывать настолько быстро, чтобы lim|w|®¥w|F(w)|2 = 0. Математики называют это утверждение леммой Римана–Лебега в  честь фран­ цузского математика Анри Лебега (1875–1941) и, конечно, Римана. Для инженера­электрика оно означает, что спектральная плот­ ность энергии «реальной» функции от времени должна «спадать к нулю» с достаточно высокой скоростью при увеличении частоты. Заметим, что в каждом из наших трех примеров лемма Римана– Лебега действительно выполняется. Кстати, такое же рассуждение в  случае теоремы Парсеваля для периодической функции f(t) ко­ нечной мощности показывает, что limn®¥|cn|2 = 0, где cn – коэффи­ циенты разложения f(t) в комплексный ряд Фурье. В этом случае инженер­электрик сказал бы, что спектр мощности f(t) «спадает к нулю» при увеличении частоты.

ФОРМУЛА ПЛОТНОСТИ ЭНЕРГИИ РЭЛЕЯ, СВЕРТКА

229

Формула плотности энергии Рэлея  – частный случай гораздо более общего результата, к  которому можно прийти, задавшись вопросом: если m(t) и  g(t) – две функции от времени с  преобра­ зованиями Фурье M(w) и  G(w) соответственно, то каково преоб­ разование Фурье их произведения m(t)g(t)? Когда мы доберемся до главы 6, вы увидите, что произведение двух функций от вре­ мени имеет огромное значение для работы речевых скремблеров и радио. А пока оно интересует нас с чисто математической точ­ ки зрения. По определению, преобразование Фурье произведения m(t)g(t) равно

где g(t) записано в  форме обратного преобразования Фурье (во внутреннем интеграле я обозначил переменную интегрирования u, а не w, чтобы избежать путаницы с внешним w). Если поменять по­ рядок интегрирования, преобразование m(t)g(t) предстанет в виде:

или поскольку внутренний интеграл равен M(w - u), то мы имеем такую пару преобразований Фурье:

Интеграл справа встречается в математике и технике так часто, что получил отдельное название – сверточный интеграл. В общем случае, если имеются две произвольные функции x(t) и y(t), то их объединение в виде x(t)y(t - t)dt называется сверткой и обо­ значается x(t) * y(t). (В следующей главе мы будем много говорить о свертке и некоторых ее применениях в электронике.) Итак, нашу пару можно записать в виде:

230

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

Внимание: символ * в верхнем индексе обозначает комплексное сопряжение, а в середине строки – свертку. И поскольку безразлич­ но, какую функцию называть m(t), а какую – g(t), операция свертки коммутативна (это легко доказать и формально, сделав очевидную замену переменной в подынтегральном выражении). Таким обра­ зом, с тем же успехом можно записать m(t)g(t) « (1/2p)M(w) * G(w). В частном случае m(t) = g(t) имеем , и этот частный случай служит прекрасным примером того, как чисто математический результат может пролить свет на многие физические явления. Предположим, что g(t) – то, что инженеры называют первичным сигналом с  ограниченной полосой, понимая под этим, что вся энергия g(t) сосредоточена в конечном интер­ вале частот |w| £ wm (это объяснение термина «с ограниченной по­ лосой»). (А термин «первичный» (baseband) означает, что центр этого интервала находится в точке w = 0.) Это, конечно, означа­ ет, что G(w) = 0 для |w| > wm. Преобразование Фурье функции g2(t) (которое говорит, где сосредоточена энергия g2(t)) равно, как мы только что выяснили,

Это выражение, разумеется, равно нулю, если подынтегральное выражение равно нулю, т. е. если w настолько положительно (или настолько отрицательно), что G(u)G(w - u) = 0. Но, по определению, очевидно, что G(u) ¹ 0, только если -wm £ u £ wm, (см. заштрихо­ ванный интервал в верхней части рис. 5.3.1). А G(w - u) ¹ 0, только если -wm £ w - u £ wm, т. е. если -wm - w £ -u £ wm - w, т. е. если wm + w ³ u ³ -wm + w, т. е. если -wm + w £ u £ wm + w (см. заштри­ хованный интервал в нижней части рис. 5.3.1). Теперь представим себе, что мы увеличиваем w, сдвигая нижний заштрихованный ин­ тервал вправо. Мы получим перекрытие двух заштрихованных ин­

ФОРМУЛА ПЛОТНОСТИ ЭНЕРГИИ РЭЛЕЯ, СВЕРТКА

231

тервалов (а значит, ненулевое подынтегральное выражение), при условии что -wm + w £ wm, т. е. w £ 2wm. А если уменьшать w (сдви­ гая нижний заштрихованный интервал влево), то перекрытие двух заштрихованных интервалов (а значит, ненулевое подынтеграль­ ное выражение) получится при условии, что -wm £ wm  + w, т.  е. -2wm £ w. Таким образом, подынтегральное выражение не равно нулю, если |w| £ 2wm. Это означает, что если вся энергия g(t) со­ средоточена в интервале частот |w| £ wm, то энергия g2(t) сосредо­ точена в интервале |w| £ 2wm. В главе 6 мы увидим, как это заклю­ чение полезно для построения весьма интересного электронного устройства. G(u)

–wm

0

wm

u

G(w – u)

–wm + w

0

wm + w

u

Рис. 5.3.1. Подынтегральное выражение в сверточном интеграле

В последнем примере мы обошли детали вычисления сверточ­ ного интеграла. А теперь я хочу показать именно детали, для чего нам придется вернуться к предыдущему разделу этой главы. Пусть имеется такая функция от времени (определенная для всех t)

где a > 0. Можно было бы определить F(w), просто подставив f(t) в определение преобразования Фурье, но наш результат о свертке дает элегантную (и более короткую) альтернативу. Если положить

232

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

g(t) = e-a|t| и h(t) = cos(t), то, как мы знаем, можно написать

Поскольку |t| = t для t > 0 и |t| = -t для t < 0, имеем

Кроме того,

Напомним, что в конце раздела 5.2 мы вывели результат

Таким образом,

и (поскольку, не забываем, импульс – четная «функция»)

Поэтому H(w) = pd(1 - w) + pd(1 + w) ,

ФОРМУЛА ПЛОТНОСТИ ЭНЕРГИИ РЭЛЕЯ, СВЕРТКА

233

откуда сразу же получается

Несмотря на устрашающий вид, этот интеграл легко вычисляет­ ся в силу фильтрующего свойства импульсных функций в подын­ тегральном выражении. То есть мы имеем пару

Вот так­то! Этот результат снова встретится нам в  разделе 5.6 как иллюстрация знаменитого принципа неопределенности. Поскольку в  предыдущих вычислениях мы сворачивали функ­ ции от w, эти результаты часто называют свертками по частоте, или свертками в  частотной области. Обратите внимание, что в  нашем общем результате о  преобразовании m(t)g(t) w – произ­ вольная переменная, и, в частности, положив w = 0, получаем

или

Далее, поскольку

ясно, что M(-u) = M *(u). Следовательно,

234

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

И наконец, если положить в этой формуле m(t) = g(t), то M(w) = G(w) и, следовательно,

где в  последнем интеграле я  заменил переменную интегрирова­ ния u на w, чтобы придать более знакомый вид формуле, которая есть не что иное, как формула плотности энергии Рэлея. Прежде чем вернуться к формуле Рэлея, поговорим еще немно­ го о полученном результате m(t)g(t) « M(w) * G(w). Может возник­ нуть вопрос, что является «обращением» этой пары. То есть как выглядит преобразование m(t)g(t)? ценитель симметрии мог бы рассуждать так: коль скоро умножению во временной области со­ ответствует свертка в частотной области, то свертке во временной области должно соответствовать умножение в  частотной. И  это правда! И доказать это легко. Поскольку , преобразование m(t) * g(t) равно

или, меняя порядок интегрирования,

Теперь положим во внутреннем интеграле t  = t  - u (dt  = dt), тогда преобразование примет вид

ФОРМУЛА ПЛОТНОСТИ ЭНЕРГИИ РЭЛЕЯ, СВЕРТКА

235

А это, как и было заявлено, означает, что m(t) * g(t) « M(w)G(w). Рассматривая, как и  раньше, частный случай m(t)  = g(t), полу­ чаем m(t) * m(t) « M 2(w). Завершая этот раздел, я  хочу показать результат, связанный с  этим последним частным случаем. А  он, в  свою очередь, тесно связан с  одной из самых знаменитых теорем в  анализе Фурье. И, чтобы подогреть ваш интерес, хочу заранее предупредить, что открыл ее не математик, а физик Альберт Эйнштейн. Начну с определения автокорреляции вещественной функции f(t):

Обратите особое внимание, что Rf (t) – функция t, а не t. Я говорю это, потому что приведенный выше интеграл несколько напоми­ нает свертку

которая является функцией t, а не t. (Эти два интеграла действи­ тельно выглядят очень похоже – мы привыкли считать, что t – это время, а t тоже измеряется в единицах времени, но что такое t?) Однако между ними есть существенная разница. Возможно, вы со­ мневаетесь в  этом. В  конце концов, вспомнив наши трюки с  за­ меной символов, вы можете возразить, что оба выражения можно сделать функциями от одной и  той же переменной  – например, в определении Rf (t) можно просто заменить t на t и t на t. Смысл равенства не изменится, но теперь мы имеем

236

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

Вот сейчас единственная разница между выражениями стала вполне очевидной: в Rf (t) подынтегральное выражение содержит множитель f(t - t), а в f(t) * f(t) – множитель f(t - t). Но так ли су­ щественно простое изменение знака аргумента f, спросите вы? Скоро мы увидим, что очень существенно. Что такое Rf (t) с физической точки зрения? Rf (t) – это мера сход­ ства f(t) со своей же сдвинутой версией (t – это временной сдвиг!), поэтому она и называется корреляцией. Префикс авто, естествен­ но, появился потому, что производится сравнение f(t) с самой со­ бой. Хотя я не буду развивать здесь эту тему, Rf (t) можно обобщить на измерение сходства f(t) с любой функцией g(t) (тоже веществен­ ной) следующим образом:

Тогда при g = f Rfg(t) = Rff (t), а это не что иное, как Rf (t). Rfg(t) называется перекрестной корреляцией, и это все, что я скажу о ней в этой книге. И хотя я не стану вдаваться и в технические прило­ жения автокорреляции тоже, не вижу причин не сказать о том, что она чрезвычайно важна для конструирования электронных схем обработки сигналов, которые способны «извлекать» информа­ ционный сигнал, буквально забитый случайным шумом. Но для сколько­нибудь глубокого знакомства с  этой темой необходимо было бы погрузиться с головой в теорию стохастических процес­ сов, что увело бы нас слишком далеко от предмета этой книги. Вскоре я приведу конкретный пример вычисления Rf (t), но сна­ чала установим следующие три (на самом деле их гораздо больше) фундаментальных общих свойства Rf (t). (i) Rf (0) ³ 0. Для доказательства нужно просто подставить t  = 0 в  определение, тогда получится Rf (0)  = f 2(t)dt, и  понятно, что эта величина неотрицательна. Rf (0)  – это энергия f(t). (ii) Rf (t) четная, т.  е. Rf (-t)  = Rf (t). Для доказательства запи­ шем Rf (-t) = f(t)f(t + t)dt и сделаем замену переменной

ФОРМУЛА ПЛОТНОСТИ ЭНЕРГИИ РЭЛЕЯ, СВЕРТКА

s  = t  + t (ds  = dt). Тогда Rf (-t)  =

237

f(s  - t)f(s)ds, или, пе­

реименовав переменную интегрирования s в  t, получаем Rf (-t) = f(t - t)f(t)dt = Rf (t). (iii) Rf (0) ³ |Rf (t)|. То есть Rf (t) достигает максимума при нулевом временном сдвиге[5]. Для доказательства сначала запишем {f(t) ± f(t - t)}2dt ³ 0 – это очевидно, поскольку подынтег­ ральное выражение неотрицательно. Раскрывая скобки, по­ лучаем

Или Rf (0) ± 2Rf (t) + Rf (0) ³ (0), или Rf (0) ³ ±Rf (t), откуда сра­ зу следует, что Rf (0) ³ |Rf (t)|. В качестве примера, иллюстрирующего эти свойства, рассмот­ рим функцию f(t) = e-tu(t), где u(t) – единичная ступенчатая функ­ ция. То есть f(t) = 0 для t < 0 и f(t) = e-t для t > 0. Тогда

Чтобы подойти к следующему шагу анализа, вспомним, как «ра­ ботает» ступенчатая функция: поскольку u(t) = 0 для t < 0 и u(t) = 1 для t > 0, то u(t - t) = 0 для t < t и u(t - t) = 1 для t > t. Но так как, для того чтобы подынтегральное выражение было отлично от нуля, нужно, чтобы обе ступенчатые функции были равны 1, наше выражение для Rf (t) принимает две разные формы в зависимости от того, больше t нуля или меньше. Точнее,

238

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

Оба интеграла легко вычислить.

Rf (t) 1/

2

0

t

Рис. 5.3.2. Автокорреляционная функция

Мы можем объединить оба выражения в одну формулу, справед­ ливую для всех t:

График этой функции показан на рис.  5.3.2. На графике вид­ ны все три установленных выше свойства. Заметим, что limt®±¥ Rf (t) = 0, что означает, что e-tu(t) «все меньше и меньше похожа на себя» при увеличении временного сдвига t. И закончить эту тему я хочу демонстрацией огромной разницы между автокорреляцией и автосверткой. Напомним, что в преды­ дущем разделе мы вывели сверточную пару f(t) * f(t) « F 2(w). Теперь вычислим преобразование Фурье автокорреляционной функции (далее я будут записывать Rf как функцию от t). По опре­ делению, преобразование Фурье Rf (t) равно

ФОРМУЛА ПЛОТНОСТИ ЭНЕРГИИ РЭЛЕЯ, СВЕРТКА

239

где я изменил порядок интегрирования. Во внутреннем интеграле сделаем замену переменной s = t - t (ds = -dt). Тогда преобразо­ вание Rf (t) равно

Внутренний интеграл просто равен F *(w), поэтому преобразова­ ние Rf (t) равно

То есть мы имеем корреляционную пару Rf (t) « |F(w)|2, что очень сильно отличается от F 2(w), полученной нами для свертки. |F(w)|2 – это квадрат абсолютной величины F(w), тогда как F 2(w) – квадрат самой F(w). |F(w)|2 всегда вещественна, а F 2(w) в общем слу­ чае комплексна. А теперь в  завершение большой сюрприз. Заметим, что с точ­ ностью до множителя 2p Rf (t) и спектральная плотность энергии образуют пару Фурье! Этот удивительный результат называет­ ся теоремой Винера–Хинчина в  честь американского математи­ ка Норберта Винера (1894–1964), который открыл ее в  1930 году, и советского математика Александра Хинчина (1894–1959), неза­ висимо открывшего ее в  1934 году. На самом деле оба этих уче­ ных следовали по стопам физика­теоретика Альберта Эйнштейна (1879–1955), который установил этот факт в 1914 году (в работе, об­ народованной на заседании Швейцарского физического общества в  Базеле в  феврале того же года)[6]. Но, как и  статью Уилбрэхэма 1848 года, математики не замечали эту работу до празднования столетия Эйнштейна в 1979 году – спустя 65 лет после написания.

240

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

Сегодня мы отдаем дань Эйнштейну как творцу революционной теории гравитации, но, как показывает это математическое от­ крытие, все технические предметы, к которым Эйнштейн прика­ сался в юности, обращались в золото.

5.4. Некоторые интересные спектры На протяжении всего обсуждения энергии функции от времени я  избегал вопроса о  существовании, т.  е. вопроса о том, действи­ тельно ли значение интеграла f 2(t)dt конечно. На самом деле очень полезная единичная ступенчатая функция, очевидно, имеет бесконечную энергию, т. к.

Что это означает применительно к  преобразованию Фурье функции u(t)? Чтобы сохранить согласованность нотации, я  буду обозначать это преобразование U(w), т. е. u(t) « U(w). Но существу­ ет ли вообще U(w)? Ведь если просто подставить u(t) в определение U(w), то получим . Отличная загадка  – что могло бы означать e-i¥? А  как насчет импульсной функции, которая выглядит еще более загадочно? Ка­ кой смысл можно было бы приписать выражению d2(t)dt? Вы можете возразить, что в  силу фильтрующего свойства импульса можно написать

но это в предположении, что нашу функцию f(t) (введенную в на­ чала раздела 5.1) можно положить равной d(t), что выходит далеко за рамки декларированной мной ранее математической природы f(t), например того факта, что она непрерывна в точке t = 0 (чего о d(t) точно не скажешь!). Однако, как ни странно, именно для им­

НЕКОТОРыЕ ИНТЕРЕСНыЕ СПЕКТРы

241

пульсной функции, а не для с виду добропорядочной ступенчатой, вычислить преобразование Фурье проще. Сделать это можно сле­ дующим образом. Преобразование Фурье d(t - t0), импульса в точке t = t0, по опре­ делению (и в силу фильтрующего свойства) равно

В частности, для t0  = 0 мы имеем поразительно простую пару Фурье d(t) « 1. А для любого t0 квадрат абсолютной величины преобразования Фурье d(t - t0) равен |e-iwt0|2, что по формуле Эйлера равно 1, т. е. не зависит от частоты. Спектральная плотность энергии d(t - t0) для любого t0 равна просто 1/2p, -¥ < w < ¥. Энергия импульса во вре­ менной области равномерно распределена между всеми частотами. Теперь ясно, что полная энергия импульса бесконечна, поскольку, по формуле плотности энергии Рэлея, мы можем выразить ее в виде

Мы уже много раз встречали импульсы во временной области, но возникает встречный вопрос: какая зависящая от времени функ­ ция соответствует d(w), импульсу в частотной области? Чтобы от­ ветить на этот вопрос, нужно просто подставить d(w) в формулу об­ ратного преобразования Фурье, при этом получается пара

а в  силу фильтрующего свойства импульса это дает нам важный результат

242

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

Этот чисто математический результат имеет физическую ин­ терпретацию. Функцию во временной области 1/2p, которая всюду постоянна, инженеры­электрики называют постоянным сигналом постоянного тока. По­другому такой сигнал можно представлять себе как сигнал нулевой частоты, т. е. не изменяющийся во време­ ни. А это означает, что вся энергия такого сигнала сосредоточена в единственной частоте w = 0. А что это вам напоминает? Импульс, да­да, импульс в точке w = 0. Импульс в нулевой частоте ассоции­ руется с  зависящей от времени функцией, вся энергия которой равномерно распределена во времени от минус до плюс бесконеч­ ности. Очевидно, ее энергия бесконечна, поскольку

Возможно, вам показалось, что справиться с  импульсом было несложно. Так, может быть, несложно будет и вычислить U(w), пре­ образование Фурье единичной ступенчатой функции u(t)? Мож­ но, например, взглянуть на вычисление, проделанное нами для f(t) = e-stu(t) (пример 2 в предыдущем разделе), где мы нашли, что ее преобразование Фурье равно F(w) = 1/(s + iw). И сделать вывод, что раз

то должно быть

А значит,

и, по формуле Рэлея, энергия единичной ступенчатой функции равна

НЕКОТОРыЕ ИНТЕРЕСНыЕ СПЕКТРы

243

а это ровно то, что мы вычислили в начале этого раздела. Однако это вычисление не может быть правильным. И вот почему. Формула U(w)  = 1/iw с  очевидностью говорит, что U(w) чисто мнимая, что, в свою очередь, означает (как было показано в раз­ деле 5.2), что u(t) «должна быть» нечетной функцией от t – каковой u(t), безусловно, не является. На первый взгляд, налицо глубокое противоречие, и  похоже, что вычисление U(w) привело нас туда, откуда мы начали, т.  е. никуда,  – что же происходит? А  вот что: формула U(w) = 1/iw почти правильна, но ей «кое­чего не хватает». «Чего же?» – спросите вы, а ответ на удивление прост – импульса. Покажем это. Ключевая идея – выразить u(t) через функцию sgn(t), с которой мы впервые встретились в разделе 1.8. Тогда мы написали

Теперь очевидно (я уже делал это в разделе 5.1 при обсуждении разрывного интеграла Дирихле), что можно записать * Таким образом, U(w), преобразование u(t), является суммой преобразований 1/2 и  1/2sgn(t). Как мы видели, имеет место пара 1/ p « d(w), поэтому преобразование 1/ равно pd(w). А преобразо­ 2 2 вание sgn(t) равно 2/iw, этот результат можно проверить, подста­ вив 2/iw в интеграл обратного преобразования Фурье:

Этот интеграл, как показано в  самом конце раздела 1.8, равен pi · sgn(t). Итак, во временной области функции 2/iw соответствует функция 1/pi[pi · sgn(t)] = sgn(t). Вот и все. Таким образом,

244

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

И вот она, последняя пара, которая нас интересовала:

Здесь стоит ненадолго остановиться и подумать, зачем нам нуж­ на d(w). Интуитивно понятно, что «среднее» значение u(t) равно 1/2 (0 при -¥ < t < 0 и +1 при 0 < t < ¥), и это источник pd(w). В пре­ образование функции sgn(t) не входит d(w), поскольку ее среднее значение равно нулю (-1 при -¥ < t < 0 и  +1 при 0 < t < ¥). С чисто мнимой функцией 2/iw, самой по себе, все в порядке для нечетной sgn(t). Но для u(t) и sgn(t) необходимы 1/iw и 2/iw соответ­ ственно из­за внезапных скачков в точке t = 0, т. е. для обеих функ­ ций нужна энергия при произвольно высоких частотах, чтобы поддержать разрывное поведение во времени. Обратите внимание на форму этих членов: 1/iw, умноженное на абсолютную величину скачка (1 для u(t) и 2 для sgn(t)). Теперь мы можем использовать полученный результат для U(w), любопытный сам по себе, для вывода еще более любопытной пары преобразований Фурье. То есть сейчас мы можем ответить на сле­ дующий интригующий математический вопрос (который, как мы увидим в главе 6, имеет важное практическое значение для теории радиосвязи): какая функция во временной области соответствует ступенчатой функции в частотной области? Иными словами, что должно быть в левой части пары ? « u(w)? Чтобы не было никаких недомолвок относительно нотации, уточним: u(w) ¹ U(w). U(w)  – это преобразование единичной ступенчатой функции во времен­ ной области, т. е. u(t) « U(w), тогда как u(w) – единичная ступенча­ тая функция в частотной области (u(w) = 1 при w > 0 и u(w) = 0 при w < 0). Такая функция называется односторонним спектром, вся ее энергия сосредоточена только в положительных частотах. И вряд ли вы удивитесь, когда выяснится, что во временной области тако­ му спектру соответствует весьма необычная функция. Для ответа на поставленный вопрос мне потребуется еще один теоретический результат. Пусть имеется пара g(t) « G(w). Тогда из формулы обратного преобразования Фурье имеем

НЕКОТОРыЕ ИНТЕРЕСНыЕ СПЕКТРы

245

Если теперь заменить t на -t в обеих частях (при этом равенство сохранится), то получим

Если снова использовать прием с заменой символов, как в пре­ дыдущем разделе, т. е. заменить все w на t, а все t на w, то получим

или

Но этот интеграл – просто преобразование Фурье функции G(t), и мы получили следующий замечательный результат, который на­ зывается принципом двойственности: если g(t) « G(w), то G(t) « 2pg(-w). Вот теперь все готово. Поскольку мы недавно установили, что

то, согласно принципу двойственности, имеем

Конечно, это не совсем то, что нам нужно, ведь нас интересует функция во временной области, соответствующая u(w), а не u(-w). Но мы почти у цели, потому что осталось сделать только послед­ нее, совсем простое наблюдение. Если f(t) – произвольная функ­ ция, то, разумеется (в предположении, что интеграл существует),

246

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

Таким образом,

Теперь сделаем замену переменной v = -t. Тогда

а это просто преобразование Фурье f(-t) – последний интеграл по­ лучается тривиальным переименованием переменной интегриро­ вания v в t. То есть мы имеем общую пару f(-t) « F(-w). Возвращаясь к  нашему «почти» правильному результату для u(-w), получаем (после замены w на -w и t на -t):

Или, вспоминая, что d(t) четная, мы имеем экзотическую (друго­ го слова не подберешь) пару, обведенную ниже рамкой. Это и есть ответ на вопрос, какая функция во временной области соответ­ ствует единичной ступенчатой функции в частотной области:

На мой взгляд, эта пара, включающая комплексную функцию от времени, далеко не очевидна! Данный раздел назван «интересные спектры» (и мы действи­ тельно видели несколько очень интересных примеров), и, чтобы закончить его, я  хочу показать анализ двух весьма любопытных сигналов. Первый пример в  какой­то степени надуман. Большой практической ценности он не представляет, но зато является ла­ биринтом чарующих математических загадок, по которому нас проведет теория Фурье. Напротив, второй пример представляет огромный практический интерес для инженеров­электриков. В первом примере мы изучим функцию g(t)  = |t|, о  которой я просил вас подумать еще в разделе 1.8 (где предлагал убедиться в том, что sgn(t) = (d/dt) |t|). Наш вопрос звучит так: как распреде­

НЕКОТОРыЕ ИНТЕРЕСНыЕ СПЕКТРы

247

лена энергия g(t) в частотной области? Очевидно, что энергия сиг­ нала g(t) = |t| бесконечна, но, как мы увидим, он совсем не похож на другие сигналы с бесконечной энергией, которые встречались нам ранее (ступенчатая и импульсная функции). Конечно, первым делом мы хотим вычислить преобразование Фурье функции g(t) – и сразу же сталкиваемся с трудностями. То есть столкнемся, если просто подставим |t| в интеграл преобразования Фурье и развер­ нем его по формуле Эйлера

или, поскольку первое подынтегральное выражение в правой ча­ сти четно, а второе – нечетно, получаем . Раз так, попробуем другой подход. Он тоже работает не до кон­ ца, но почти. А уже следующая попытка исправит все недочеты. Мы знаем преобразование Фурье функции sgn(t), т. е.

Нельзя ли использовать это, для того чтобы подобраться к G(w), преобразованию Фурье |t|? Можно, но почти, как я уже сказал. Мы сделаем это, воспользовавшись так называемой теоремой о  диф­ ференцировании по времени. Если имеется пара f(t) « F(w), то, по определению обратного преобразования Фурье,

Дифференцирование по t дает

а это значит, что если f(t) « F(w), то df/dt « iwF(w). (Мы снова вос­ пользуемся этой теоремой в  разделе 5.6, при обсуждении прин­

248

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

ципа неопределенности.) Конечно, мы предполагаем, что f(t) диф­ ференцируема, но поскольку производная |t| существует не везде (точнее, не существует в точке t = 0), то не стоит удивляться, если мы столкнемся с проблемой, пусть даже небольшой. Итак, пристег­ нем ремни и посмотрим, что произойдет. Чтобы все было предельно ясно, обозначим T интегральный оператор, применение которого к функции f(t) эквивалентно пре­ образованию Фурье от нее: T{f(t)} = F(w). Например, теорема о дифференцировании по времени сводится просто к[7]

Итак,

или

т. е. мы имеем пару |t| « -2/w2. Похоже, мы решили проблему. Но так же не может быть! И  вот почему. Преобразование Фурье g(t), конечно, равно

но для w = 0 мы имеем

Однако наш результат говорит, что

НЕКОТОРыЕ ИНТЕРЕСНыЕ СПЕКТРы

249

Увы, бесконечность не с тем знаком. Выражение -2/w2 на самом деле верно для всех w, кроме w = 0, где, как и при первой попытке преобразовать ступенчатую функцию u(t), по­прежнему «чего­то не хватает». Попробуем еще один подход, чтобы найти это «что­то». Напомню, что в  разделе 1.8 я  просил подумать о  следующей формуле:

Ее очень легко вывести, если по отдельности рассмотреть два случая: t > 0 и t  0, то s > 0 на всем интервале интегрирования, поэтому имеем

Случай t < 0 лишь немногим сложнее. Положим l = -t (конечно, l > 0), тогда

На всем интервале интегрирования s отрицательно, поэтому

Таким образом, как мы и предполагали, для всех t имеем

Теперь вспомним результат из раздела 1.8 о  разрывном инте­ грале Дирихле:

250

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

Объединяя это с только что полученным результатом для |t|, по­ лучаем

Изменение порядка интегрирования дает

Теперь, чтобы вернуться к исходной задаче о вычислении пре­ образования Фурье функции |t|, подставим это интегральное пред­ ставление[8] |t| в интеграл преобразования Фурье. Получаем

где я переименовал переменную интегрирования во внутреннем интеграле с w на a, чтобы избежать путаницы с независимой пере­ менной w во внешнем интеграле. Меняя порядок интегрирования, получаем

Внутренний интеграл можно записать в виде

Первый интеграл справа – это наше «удивительное утвержде­ ние» из раздела 5.1, а именно

НЕКОТОРыЕ ИНТЕРЕСНыЕ СПЕКТРы

251

Заменяя x на w, получаем

и заменяя w на -w, получаем

Таким образом, наш внутренний интеграл равен

Оставшийся интеграл справа  – это просто преобразование Фурье cos(at), и следующее вычисление уже должно стать для вас рутинным применением формулы Эйлера:

И окончательно внутренний интеграл равен

а если подставить это в  обведенное рамкой выражение для G(w), то получим

252

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

Первый член – это импульс в точке w = 0 бесконечной силы! На­ помним, что у любого импульса бесконечная высота, а множитель da/a2  = 4 da/a2  = ¥  – это площадь, или сила, импульса. Так что мы имеем мегамощный импульс! Впрочем, так, конеч­ но, и должно быть, потому что вы, наверное, помните, какую роль играла d(t) в преобразованиях sgn(t) и u(t), – там в качестве коэф­ фициентов силы, на которые умножалась d(w) (0 и 1/2 соответствен­ но), выступали средние значения функции от времени. А что такое «среднее значение» |t| на всей временной оси? Бесконечность. Этот огромный импульс и есть то самое «кое­что», за которым мы охо­ тились. Он находится в точке w = 0 и потому является именно тем, что необходимо для превращения -¥, которую мы получили в ка­ честве G(0) из почти правильной G(w) = -2/w2, в +¥, которой G(0) в действительности равно. Оставшиеся два интеграла в  последнем выражении для G(w) равны -2/w2, мы уже вычисляли это раньше. Таким образом, в силу фильтрующего свойства импульса имеем 2

И наконец­то мы получили пару

– действительно любопытный спектр. Энергия |t|, как было сказано в начале этого анализа, бесконеч­ на, но приведенная выше пара говорит, что эта энергия распреде­ лена по диапазону частот весьма своеобразно. Если мы находимся не в  точке w  = 0, то спектральная плотность энергии равна 4/w4 и, следовательно, для любого w1 > 0, сколь угодно малого (но не нулевого), полная энергия по всем w (кроме сколь угодно малой «дырки» -w1 < w < w1), по формуле Рэлея, равна

НЕКОТОРыЕ ИНТЕРЕСНыЕ СПЕКТРы

253

То есть в любом интервале частот (даже бесконечной ширины), не включающем точку w  = 0, количество энергии конечно. А  вся бесконечная энергия |t| сосредоточена в бесконечно малом интер­ вале частот вокруг w  = 0 – разительный контраст с  бесконечной энергией «простого» импульса, которая, как мы выяснили раньше в этом разделе, равномерно распределена по всем частотам. В качестве второго и  последнего примера любопытных спект­ ров рассмотрим очень интересную проблему, которая возникает в радиотехнике при анализе элементарного сигнала s(t) = sin(wct), -¥ < t < ¥. Слушая радио, вы слышите информационный сигнал (речь или музыку), который «наложен» на так называемый несущий сигнал – нашу синусоидальную функцию s(t) с частотой wc. (В гла­ ве 6 я уточню, что значит «наложен», и мы увидим, что и в этом вопросе теория Фурье и  комплексные числа весьма полезны.) В коммерческом AM­радиовещании величина vc = wc /2p называ­ ется несущей частотой, а ее значение (измеряемое в герцах) раз­ лично для каждой радиостанции в  одной и той же зоне приема, чтобы избежать взаимных помех в  приемнике. Если, например, несущая частота станции равна 1.27 МГц (мегагерц), т. е. 1270 кГц (килогерц), то ведущий обычно объявляет что­то вроде «вы слу­ шаете радио на частоте AM двенадцать семьдесят». Возникает естественный вопрос: где сосредоточена энергия несущего сигна­ ла? Конечно, это не тайна за семью печатями – энергия сосредо­ точена в несущей частоте. Но математика тут вовсе не очевидна. Однако изобретательное применение теории Фурье поможет нам ответить на этот вопрос. По формуле Эйлера

поэтому преобразование Фурье s(t) равно

254

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

Из проделанного выше мы знаем, что

а поскольку импульс четен, имеем:

и

Таким образом,

Преобразование Фурье sin(wct) чисто мнимое, поскольку вещест­ венная функция sin(wct) нечетная, и  это преобразование состо­ ит всего из двух импульсов, один в точке w = wc, а другой в точке w = -wc. Стало быть, для формального ответа на поставленный вопрос «где сосредоточена энергия несущего сигнала?» нужно рассмот­ реть спектральную плотность энергии (1/2p) |S(w)|2. Согласен, на­ глядно представить это довольно сложно из­за импульсного ха­ рактера S(w). Как выглядит квадрат импульса? Поскольку сами импульсы находятся в  точках ±wc, кажется очевидным, что и  их «квадраты» (а значит, и энергии) тоже находятся в ±wc. Но как вы­ глядит спектральная плотность энергии? Вот хитроумный способ подойти к  ответу. Вместо того чтобы вычислять преобразование синусоидального несущего сигнала, который «включен» в каждый момент времени (что почти так же нереалистично, как |t|, – надеюсь, вы согласны? – и на самом деле именно из­за этого возникают два импульса), представим себе, что имеется синусоида, которая «включена» в течение ровно N полных

НЕКОТОРыЕ ИНТЕРЕСНыЕ СПЕКТРы

255

периодов. Преобразование такого сигнала свободно от импуль­ сов. Тогда мы сможем изучить, где сосредоточена энергия, и  по­ смотреть, что происходит при N ® ¥. Такой сигнал называется синусоидальным пакетом, и на рис. 5.4.1 показан пакет для N = 6. Пакетные сигналы специально генерируются так называемыми импульсными радиолокаторами, которые передают очень короткие импульсы электромагнитной энергии на очень высокой частоте, а  затем принимают эхо­сигналы, указывающие на присутствие цели и расстояние до нее (пропорциональное временной задерж­ ке между передачей импульса и приемом эхо­сигнала). Анализи­ руя последовательные эхо­сигналы, радиолокатор может сопро­ вождать цель. Например, если радиолокатор работает на частоте 10  ГГц (гигагерц)  – он называется «3­сантиметровой РЛС», по­ скольку трем сантиметрам равна длина электромагнитной волны с частотой 10 ГГц, – и если длительность импульса равна 1 микро­ секунде, то N = 10 000 периодов.

t

Рис. 5.4.1. Синусоидальный пакет с шестью периодами

Длительность одного полного периода равна 2p/wc. Определим следующую функцию

256

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

т. е.

Преобразование Фурье функции sb(t) равно (мы снова пользуем­ ся формулой Эйлера)

Теперь рассмотрим два случая: N четно и N нечетно. Если N чет­ но, то по формуле Эйлера eiNp = e-iNp = 1, и потому

НЕКОТОРыЕ ИНТЕРЕСНыЕ СПЕКТРы

257

или

С другой стороны, если N нечетно, то eiNp = e-iNp = -1, и потому

или

Таким образом, для любого неотрицательного целого N спект­ ральная плотность энергии (СПЭ) синусоидального пакета длиной N периодов равна

На рис. 5.4.2–5.4.5 показана СПЭ (без постоянного масштабного коэффициента 2/wс2p) для N = 1, 2, 5, 10 соответственно на норми­ рованном интервале частот -2 £ w/wc £ 2. (Заметим, что графики

258

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

3.0

Относительная СПЭ

2.5

2.0

1.5

1.0

0.5

0 –2.0

–1.5

–1.0

–0.5

0

0.5

1.0

1.5

2.0

w/wс Рис. 5.4.2. Синусоидальный пакет с одним периодом 12

Относительная СПЭ

10

8

6

4

2

0 –2.0

–1.5

–1.0

–0.5

0

0.5

1.0

1.5

w/wс Рис. 5.4.3. Синусоидальный пакет с двумя периодами

2.0

НЕКОТОРыЕ ИНТЕРЕСНыЕ СПЕКТРы

259

0

2.0

70

Относительная СПЭ

60

50

40

30

20

10

0 –2.0

–1.5

–1.0

–0.5

0.5

1.0

1.5

w/wс Рис. 5.4.4. Синусоидальный пакет с пятью периодами 250

Относительная СПЭ

200

150

100

50

0 –2.0

–1.5

–1.0

–0.5

0

0.5

1.0

w/wс Рис. 5.4.5. Синусоидальный пакет с 10 периодами

1.5

2.0

260

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

четные, как и должно быть для вещественной sb(t).) Очевидно, что при возрастании N СПЭ действительно становится все больше по­ хожей на два импульса в точках, где w/wc = ±1. На мой взгляд, уди­ вительно, насколько быстро СПЭ приближается к двум импульсам, ведь N = 10 – «относительно малое» число, а в случае вышеупомя­ нутого импульсного радиолокатора, для которого N = 10 000, СПЭ будет практически неотличима от импульсной СПЭ настоящей (но «нереалистичной») синусоиды, которая простирается в обе сторо­ ны бесконечно.

5.5. Суммирование Пуассона В этом коротком разделе я покажу красивую и неожиданную связь между функцией от времени и ее преобразованием Фурье. В этом результате, называемом формулой суммирования Пуассона, скры­ та ирония – он назван в честь французского математика Симео­ на Дени Пуассона (1781–1840), который был одним из самых жестких критиков Фурье. Пусть функция f(t) определена на всей вещественной оси -¥ < t < ¥. На основе f(t) построим другую функцию g(t):

Из определения сразу видно, что эта функция периодична с пе­ риодом T = 1. Это легко показать и формально:

и если здесь выполнить замену индекса суммирования n = k + 1, то получим

Разумеется, это рассуждение проходит, потому что прибавление единицы переводит множество всех целых чисел в себя. Но если g(t) периодическая, то ее можно разложить в ряд Фурье, где (см. главу 4) w0 = 2p, т. к. T = 1:

СУММИРОВАНИЕ ПУАССОНА

261

где

Если в  интеграле сделать замену переменной s  = t  + k, то ds = dt и

т. к. eink2p = 1 при целых n и k. Тогда, поскольку , имеем

Так как f(t) « F(w), где

мы видим, что cn = F(2pn), и потому

262

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

Это равенство выполняется тождественно для всех t, и, в частно­ сти, для t = 0 мы получаем замечательную формулу суммирования Пуассона, которую он вывел[9] в 1827 году:

Формула выглядит скромно, но я приведу три примера, которые убедят вас в том, что это первоначальное впечатление неправиль­ но. Пример 1. Пусть f(t) определена следующим образом, где a – произвольное положительное число: f(t) = e-a|t|, a > 0. Тогда

Поэтому, по формуле суммирования Пуассона,

Если расписать сумму в левой части, то получим

СУММИРОВАНИЕ ПУАССОНА

263

Но выражение в  скобках – просто геометрическая прогрессия, сумма которой равна . Таким образом,

или после простых алгебраических преобразований (которые я оставляю вам) получаем

Это обобщение результата, выведенного в разделе 4.3:

который является частным случаем при a = 2p. Конечно, у ново­ го результата бесконечно много других частных случаев, по одному для каждого a > 0. Например, если a = p, то

Выражение в правой части равно 6.850754, и это легко «прове­ ряется» прямым вычислением самой суммы (частичная сумма для -10 000 £ n £ 10 000 равна 6.850734). Кто мог бы даже подумать о такой чудесной формуле? Пример 2. С  помощью общей формулы можно получить кра­ сивое обобщение результата, полученного в  разделе 4.3. Точнее, теперь мы можем вычислить сумму

264

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

отличающуюся от рассмотренной в разделе 4.3 чередованием зна­ ков. Для этого заметим, что

и что

Кроме того,

Таким образом,

и после простых алгебраических преобразований получаем очень красивую формулу

Для «подтверждения», как обычно, выполняем прямое вычис­ ление; правая часть равна 0.27202905498213, а  частичная сумма в левой части при -100 000 £ n £ 100 000 равна 0.27202905508215.

СУММИРОВАНИЕ ПУАССОНА

265

Пример 3. Третий и последний пример в этом разделе я начну с вычисления преобразования Фурье так называемого колокольно­ го импульса

То есть f(t) – экспонента с квадратичным показателем степени. По определению:

Кажется, что вычислить этот интеграл трудно, но он уступает следующей хитроумной атаке. Дифференцирование по w дает

Теперь проинтегрируем правый интеграл по частям, т.  е. вос­ пользуемся классической формулой математического анализа:

2

Положим u = e-iwt и dv = te-at , тогда du = -iwe-iwtdt и v = -(1/2a) e , поэтому -at2

2

т. к. lim|t|®¥ e-at e-iwt = 0. Но этот последний интеграл равен F(w), поэтому мы имеем простое дифференциальное уравнение перво­ го порядка для F(w):

266

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

или

Интегрирование обеих частей дает

где ln(С) – произвольная константа неопределенного интегриро­ вания. Потенцируя, получаем 2

F(w) = Сe-w /4a. Для вычисления постоянной C заметим, что C = F(0), т. е.

Этот определенный интеграл можно вычислить элементарным (но очень изобретательным) способом[10]; он равен . Итак, мы имеем весьма интересную пару

которая говорит, что преобразование Фурье колокольного импуль­ са во временной области имеет точно такой же вид в  частотной области, т. е. экспонента с показателем степени, квадратично за­ висящим от w. Краткое отступление: хотя в рассматриваемом примере это не главное (а будет главным в следующем разделе), отметим получен­ ный по ходу симпатичный результат. Наша пара говорит, что

а затем, согласно формуле Эйлера, поскольку интеграл чисто ве­ щественный (т. к. таковой является правая часть), получаем

СУММИРОВАНИЕ ПУАССОНА

267

Я полагаю, что прийти к  этому заключению напрямую было бы нелегко. Конечно, то же самое рассуждение показывает, что 2 e-at sin(wt)dt = 0, но это мы и так знали, потому что подынте­ гральная функция нечетна. Заметим также, что в частном случае a = 1/2 найденная выше пара сводится к

2

а это значит, что с  точностью до множителя функция e-(t /2) является своим собственным преобразованием Фурье[11]. Теперь, располагая парой, обведенной рамкой, применим к ней формулу суммирования Пуассона. Получаем

или

Обе суммы должны показаться вам хотя бы смутно знакомыми – они имеют вид квадратичной суммы Гаусса, которую мы изучали в разделе 4.5. Не стану углубляться в эту связь, но на самом деле обе суммы в  рамке – частные случаи гораздо более общей темы тета­функций, которую первым начал систематически изучать не­ мецкий математик Карл Якоби (1804–1851) в  своем написанном в  1829  году шедевре «Fundamenta nova theoriae functionurn ellip­ ticarum» («Новые основания теории эллиптических функций»). Тета­функции[12] тесно связаны со многими глубокими пробле­ мами аналитической теории чисел. Одно чисто вычислительное применение нашего результата в рамочке заключается в том, что при численных расчетах одна сумма может оказаться предпочти­

268

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

тельнее другой в зависимости от a. Если a «мало», то сумма справа сходится быстрее суммы слева, а если «велико», то наоборот.

5.6. Взаимное распространение и принцип неопределенности В 1927 году немецкий физик­теоретик Вернер Гейзенберг (1901– 1976) опубликовал свой знаменитый принцип неопределенности в квантовой механике (далее КМ). Мы не станем глубоко вдавать­ ся в КМ в этой книге, но несколько общефилософских замечаний, возможно, помогут обосновать излагаемую ниже математику. КМ – это вероятностная физика. До появления КМ «классические» физики­теоретики предсказывали, что должно (или не должно) произойти в данной ситуации. С другой стороны, КМ принимает экспериментальный факт: в  микромире в  данной ситуации воз­ можно несколько (быть может, много) исходов, поэтому КМ дает только вероятности различных исходов. Следовательно, матема­ тическим основанием КМ, как вы, наверное, догадались, является теория вероятностей. В теории вероятностей применяется следующая терминология и обозначения: если X (случайная величина) обозначает величину, значение которой поддается измерению, но не детерминировано (при каждом измерении X получается другое значение), то с X ас­ социирована функция fX(x), называемая функцией плотности веро­ ятности (ФПВ), такая, что (i) fX(x) ³ 0, -¥ < x < ¥, fX(x)dx равен вероятности попадания значения X в интер­ вал a £ x £ b. Следствием (ii) является условие нормировки: (iii) fX(x)dx = 1, устанавливающее очевидный факт: значение

(ii)

X обязательно находится где­то в интервале -¥ < x < ¥. В теории вероятностей изучаются различные способы вычис­ ления fX(x) по имеющейся информации о природе X, но здесь мы будем просто предполагать, что все вычисления уже проделаны и fX(x) известна. Если это так, то с ее помощью можно вычислить различные величины, описывающие X, например среднее и сред­ ний квадрат X, записываемые в виде числяется по формуле

и 

соответственно.

вы­

ВЗАИМНОЕ РАСПРОСТРАНЕНИЕ И ПРИНцИП НЕОПРЕДЕЛЕННОСТИ

269

Без ограничения общности можно предполагать, что равно нулю (вместо вычисления мы можем считать, что работаем со случайной величиной X- , среднее которой, по построению, рав­ но нулю, потому что (напомним, что  – не число, а функция от x)

Если среди значений X нет таких, которые сильно отклоняются от , то  – хорошая мера «типичного» значения X при большом количестве измерений. Если разброс X относительно среднего значения велик, то мера уже не очень хороша. Полезной величи­ ной, измеряющей качество меры , является дисперсия X, запи­ сываемая в виде , – среднее квадрата отклонения X от (возведение в квадрат предотвращает взаимное уничтожение положительных и отрицательных отклонений). То есть в предпо­ ложении, что  = 0, имеем

Заметим, что всегда sX > 0. Мы подходим к цели этого введения. Другой способ интерпре­ тации sX – мера нашей неуверенности в значении X (неопределен­ ности X) (заметим, что sX измеряется в тех же единицах, что X). Мы считаем, что (равное нулю) – среднее значение X. «Неболь­ шая» дисперсия sX означала бы, что, «вероятно», является хоро­ шей оценкой X (т. е. неуверенность в значении X низкая), тогда как «большая» sX означает, что мы сильно не уверены в фактическом значении X, т. е. с высокой вероятностью X может значительно от­ личаться от среднего значения 0. В КМ существует много связанных пар вероятностных величин, и принцип неопределенности Гейзенберга утверждает, что произ­ ведение неопределенностей двух величин такой пары не меньше

270

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

некоторой положительной постоянной. Классический пример свя­ занной пары, часто встречающийся в учебниках физики, – поло­ жение и импульс частицы; если обозначить sX неопределенность положения, а sY – неопределенность импульса, то существует по­ стоянная c > 0 такая, что sXsY ³ c. Популярной формулировкой этого принципа является фраза «невозможно одновременно точно измерить положение и импульс частицы». При измерении значений пары приходится жертвовать точностью измерения одной величины, чтобы повысить точность измерения другой. То же самое мы можем проделать с парой Фурье g(t) « G(w), т. е. мы можем связать «неопределенность» положения g(t) во времен­ ной области с «неопределенностью» положения G(w) в частотной области (а эта функция, как мы помним, определяет, как распре­ делена энергия g(t) по частотам). Под «положением во временной области» g(t) мы понимаем тот факт, что обычно «значительная» часть g(t) находится в некотором интервале времени (быть может, даже простирающемся в бесконечность), и то же самое относится к «значительной» части G(w) в частотной области. Вообще говоря, оба интервала изменяются противоположно друг другу, т.  е. если сигнал имеет место в  очень узком временном интервале, то для его преобразования Фурье характерно присутствие в  очень ши­ роком интервале частот. Крайнее проявление такого поведения – импульсная функция d(t), которая занимает нулевое время, но ее преобразование Фурье имеет одинаковую амплитуду на всей бес­ конечной оси w. Эту инверсную связь называют взаимным распро­ странением (reciprocal spreading). На рис. 5.6.1 показано взаимное распространение на примере пары преобразований Фурье, выве­ денной в разделе 5.3:

На верхних двух графиках представлена функция от времени и ее преобразование для a = 0.2 («быстрое» затухание во времени), а на двух нижних – то же самое при a = 0.05 («медленное» затуха­ ние во времени). По мере того как функция от времени становится «менее локализованной», ее преобразование становится «более локализованным».

a = 0.2

0.5

–0.5

a = 0.2

0

–0.5

–10

0

Время, c

1.0

10

a = 0.05

0.5 0 –0.5 –1.0 –20

271

0.5

0

–1.0 –20

1.0

Преобразование Фурье

1.0

–10

0

Время, c

10

20

–1.0 –2

–1

0

w, радиан/с

25

Преобразование Фурье

Функция от времени

Функция от времени

ВЗАИМНОЕ РАСПРОСТРАНЕНИЕ И ПРИНцИП НЕОПРЕДЕЛЕННОСТИ

20

1

2

a = 0.05

20 15 10 5 0 –2

–1

0

w, радиан/с

1

2

Рис. 5.6.1. Взаимное распространение

На следующий год (1928) после появления статьи Гейзенбер­ га немецкий математик Герман Вейль (1885–1955) опубликовал элегантный математический вывод принципа неопределенности в книге «Теория групп и квантовая механика» (на английском язы­ ке опубликована издательством Dover в 1931 году*). В показанном ниже выводе принципа неопределенности с помощью интеграла Фурье используется неравенство Коши–Шварца, которое мы дока­ зали в разделе 1.5. Этот вывод основан на изложении Вейля, хотя в своей книге Вейль, похоже, отдает пальму первенства австрий­ скому физику Вольфгангу Паули (1900–1958). Пусть g(t) – произвольная вещественная (непериодическая) функ­ ция от времени, где g(t) « G(w). Тогда, обозначив W  = g2(t)dt энергию g(t), мы видим, что

g2(t)/W dt = 1 и что g2(t)/W ³ 0 для

всех t. То есть g2(t)/W «ведет себя» как ФПВ случайной величины. * Перевод на русский вышел в издательстве «Наука» в 1986 году. – Прим. перев.

272

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

Продолжая эту аналогию, определим неопределенность g(t) во временной области как

То есть мы рассматриваем время как случайную величину, кото­ рая принимает значения в интервале -¥ < t < ¥ – и потому имеет «среднее значение» 0! – с ФПВ (g2(t)/W. (Напомним, это аналогия.) Точно так же из формулы плотности энергии Рэлея мы имеем W = 1/2p |G(w)|2dw и, следовательно, |G(w)|2/(2pW)dw = 1, где |G(w)|2/(2pW) ³ 0 для всех w. Таким образом, |G(w)|2/(2pW) «ведет себя» как ФПВ случайной величины, которая принимает значения в интервале -¥ < w < ¥ – и потому имеет «среднее значение» 0. Как и в случае st, определим

и назовем это неопределенностью в частотной области. Тогда во­ прос ставится так: что можно сказать о произведении stsw? Для ответа на этот вопрос я хочу сначала напомнить неравен­ ство Коши–Шварца из раздела 1.5: если h(t) и s(t) – вещественные функции от времени, то в предположении, что все интегралы су­ ществуют, справедливо неравенство

Равенство имеет место, когда h(t) пропорционально s(t), т.  е. h(t)  = ks(t), где k – некоторая постоянная; при соблюдении этого условия обе части, очевидно, равны k2  { s2(t)dt}2. Если вы вер­ нетесь к выводу этого неравенства, то увидите, что в нотации раз­ дела 1.5 равенство означало, что

ВЗАИМНОЕ РАСПРОСТРАНЕНИЕ И ПРИНцИП НЕОПРЕДЕЛЕННОСТИ

273

а это возможно, только если полный квадрат под знаком интеграла тождественно равен нулю, т. е. f(t) = -lg(t), а это и означает, что функции f(t) и g(t) пропорциональны. Я воспользуюсь данным на­ блюдением в конце анализа. Теперь введем следующие определения:

Тогда в силу неравенства Коши–Шварца

Глядя на интеграл в левой части, можно записать

и в таком виде этот интеграл вычисляется по частям. В формуле

положим u = t и dv = d(g2(t)/2)dt/dt. Тогда du = dt и v = 1/2 g2(t) и, сле­ довательно,

Если мы предположим, что при |t|®¥ функция g(t) ® 0 быстрее, чем 1/ (это не очень быстро), то lim|t|®¥tg 2(t) = 0, и потому

Итак, с левой частью неравенства Коши–Шварца, заключенно­ го в рамку, мы разобрались. Теперь обратимся к двум интегралам в правой части.

274

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

С первым все просто: по определению имеем

Да и  второй интеграл немногим сложнее. Вспоминая теорему о дифференцировании по времени из раздела 5.5, имеем если g(t) « G(w), то dg/dt « iwG(w), и по формуле плотности энергии Рэлея:

Полученный результат означает, что для существования ин­ теграла по w должно иметь место равенство lim|w|®¥w2|G(w)|2 = 0, а  это более сильное требование, чем просто lim|w|®¥w|G(w)|2  = 0 (выполнение этого условия требуется в лемме Римана–Лебега из раздела 5.3). Так, для примера 1 из раздела 5.3 это требование не выполнено. Там мы вывели пару Фурье для импульса

и выяснили, что

Таким образом, поскольку энергия f(t) равна W = t, имеем

Этот результат для sw2, конечно, имеет место, потому что

ВЗАИМНОЕ РАСПРОСТРАНЕНИЕ И ПРИНцИП НЕОПРЕДЕЛЕННОСТИ

275

Если взять все три полученных результата и подставить их в не­ равенство Коши–Шварца, то получим

или

или, наконец, принцип неопределенности в  теории интеграла Фурье:

На мой взгляд, этот результат совершенно неочевиден. Возникает естественный вопрос: как улучшить нижнюю грани­ цу произведения stsw? Рассмотрим конкретный пример и посмот­ рим, что получится. Пусть g(t) = e-|t|/T, где T > 0 и -¥ < t < ¥. Энергия g(t) равна

Таким образом,

276

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

где правая часть равна T 2/2 (предоставляю вам самостоятельно выполнить интегрирование по частям или, что даже проще, найти эти интегралы в таблице), т. е.

Для вычисления sw можно было бы просто подставить G(w) в фор­ мулу

если бы мы знали G(w). Напомним, однако, альтернативное выра­ жение для s2w, которое в этом случае использовать гораздо проще. Если вы вернетесь к паре дифференцирования по времени, кото­ рой мы воспользовались для вывода выражения s2w, то увидите, что там фигурировало также выражение

В нашей задаче этот интеграл легко берется. Имеем

поэтому (поскольку W = T)

То есть

ВЗАИМНОЕ РАСПРОСТРАНЕНИЕ И ПРИНцИП НЕОПРЕДЕЛЕННОСТИ

277

Таким образом,

Это действительно больше нашей теоретической нижней грани­ цы 0.5 (и существенно – более чем на 41 %). Без сомнения, тут же возникает очевидный вопрос: а  бывает ли вообще, что stsw равно 0.5? Ответ утвердительный. Чтобы stsw было равно 1/2, неравенство Коши–Шварца должно обращаться в равенство, а это, как мы заметили раньше (в прежней нотации), бывает, когда h(t) = ks(t), где k – постоянная,

То есть

или, обозначая C постоянную неопределенного интегрирования, ln{g(t)} - ln(С) = 1/2kt2. При C = 1 (такой выбор не ограничивает общность, потому что мы всегда можем переопределить масштаб амплитуды) имеем ln{g(t)} = 1/2kt2, или, вводя новую постоянную k вместо «старой» 1/2k, получаем 2

g(t) = ekt , и понятно, что для существования у g(t) преобразования Фурье не­ обходимо, чтобы k  0 (и, конечно, (x) = -f(x) для x < 0), можно записать

После замены переменной s = -x первый интеграл принимает вид

где последнее равенство следует из того, что (-s)  = - (s), по­ скольку функция , по построению, нечетна. Таким образом,

или, т. к.  = f для положительного аргумента (заметим, что оба ин­ теграла действительно берутся по положительным интервалам), то, используя ту же переменную в качестве переменной интегри­ рования, получаем

286

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

Энергия (x) равна, с  одной стороны,

2

(x)dx  = 2

а с другой (по аналогии с формулой Рэлея) – 1/2p

f 2(x)dx,

| (w)|2dw. По­

скольку | (w)|2 четна (т. к. (x) вещественная), мы можем также записать энергию в виде 1/p

| (w)|2dw, и, значит,

А вот теперь перейдем от любой функции f(x) к конкретным C(x) и S(x). У нас имеются их определения

которые имеют место для всех x ³ 0. Выполним их нечетное про­ должение (так же, как выше для произвольной f(x)) на область x < 0. Если определить две вещественные функции f(w) и y(w) в виде

то, как показано выше (см. рамку 1), преобразования Фурье C(x) и S(x) равны

Тогда из результата в рамке 2 имеем

и аналогично

ХАРДИ И ШУСТЕР И ИХ ОПТИЧЕСКИЙ ИНТЕГРАЛ

287

Таким образом, для интеграла Харди–Шустера имеем

Найти f(w) и y(w) можно интегрированием по частям. Так, для f(w)   =

C(x)sin(wx)dx, где C(x)  =

cos(t2)dt, вспомним, что

udv = (uv|0¥) vdu и положим u = C(x). Тогда du/dx = cos(x2). Точно так же, если dv = sin(wx)dx, то v = -cos(wx)/w. Таким образом,

или, поскольку C(¥) = 0,

Так как C(0) = вестно, что

cos(t2)dt = 1/2

и из таблиц интегралов из­

то, полагая a = 1 и b = 1/2w, получаем

Таким образом,

Для y(w) вычисления почти такие же. Предоставляю вам воспол­ нить детали и приведу лишь окончательный результат:

288

ГЛАВА 5. ИНТЕГРАЛы ФУРьЕ

Итак,

Таким образом,

Этот интеграл (подынтегральное выражение которого прекрас­ но ведет себя в точке w = 0 – см. примечание 8, где обсуждалось поведение похожего подынтегрального выражения) тоже можно взять по частям. В стандартной формуле положим u = 1 - cos(1/4w2), тогда du = 1/2w sin(1/4w2)dw. Кроме того, положим dv = dw/w2, т. е. v = -1/w. Тогда

ХАРДИ И ШУСТЕР И ИХ ОПТИЧЕСКИЙ ИНТЕГРАЛ

289

Теперь положим t = 1/2w, dt = 1/2dw, и, наконец, получаем резуль­ тат Харди

Что думал об этом Шустер? Насколько мне известно, он никогда не комментировал решение Харди в печати, но я не был бы удив­ лен, если бы он не стал восполнять пробелы, как сделал я. Шустер знал Харди как блестящего аналитика (Харди получил королев­ скую медаль от Лондонского королевского общества в  1920 году, а Шустер был членом этого общества с 1879 года и секретарем в пе­ риод с 1912 по 1919 год). Скорее всего, он был доволен, что его ги­ потезу подтвердил эксперт, и на этом поставил точку. Но, с другой стороны, нельзя исключать, что Шустер все­таки восполнил недо­ стающие детали – полагаю, он вполне мог это сделать. На самом деле он свободно владел теорией Фурье. Например, в книге Шусте­ ра «Введение в оптику» (все ее издания вышли еще до статьи Хар­ ди, а посвящена она, кстати, другу Шустера лорду Рэлею) имеется достойное обсуждение преобразования Фурье и формулы плотно­ сти энергии Рэлея. Быть может, я несправедлив к Харди, но от его статьи у  меня сложилось впечатление, что он расценивал задачу как сущую безделицу, которую можно походя решить, изучая за утренней чашечкой чая результаты крикетных матчей в выпуске «Таймс». «Пусть физики попробуют превзойти это!» – вот какое по­ слание я  вижу (конечно, неосознанно, поскольку по любым мер­ кам Харди был благожелательным человеком – но все­таки ничто человеческое не было ему чуждо).

ГЛАВА 6 Электроника и  -1

6.1. Зачем нужна эта глава? До сих пор в  данной книге рассматривались только математи­ ческие вопросы в  интересах самой математики. Но поскольку я предпринял этот труд вследствие восхищения Эйлером не толь­ ко как математиком, но и как физиком и инженером, мне кажется уместным закончить его главой о некоторых технических приме­ нениях математики комплексных чисел, в разработке которой он поучаствовал. Многочисленные прикладные работы Эйлера по­ казывают, что он принимал очень близко к сердцу девиз Берлин­ ской академии наук (членом которой состоял с 1741 по 1766 год): «theoria cum praxi», что я  со своими скромными познаниями в латыни перевожу как «теория с практикой». Ни один инженер не сказал бы лучше. (Девиз этот, должен вам сказать, выдвинул математик  – Лейбниц, который основал Берлинскую академию в 1700 году.) Во времена Эйлера еще не было электричества, если не считать разрядов молний в  небесах, но я  продемонстрирую здесь неко­ торые изумительные приложения комплексных чисел в электро­ нике, которые, думается мне, Эйлеру понравились бы. Я  выбрал именно их, потому что я все­таки инженер­электрик (но не пред­ полагаю, что и вы тоже, – для чтения этой главы знание электрони­ ки не понадобится). Собственные прикладные работы Эйлера по кораблестроению, артиллерийской баллистике и гидравлике тоже примечательны, но о  них уже много писали раньше[1] – а  я  хочу сделать нечто иное.

ЛИНЕЙНыЕ СТАцИОНАРНыЕ СИСТЕМы, СВЕРТКА (СНОВА), ПЕРЕДАТОЧНыЕ ФУНКцИИ

291

6.2. Линейные стационарные системы, свертка (снова), передаточные функции и каузальность Электронные системы конструируются из поразительно сложных крохотных деталей, созданных с помощью не менее сложных про­ изводственных процессов с  целью точно реализовать некоторые взаимосвязи между током и напряжением. Эти детали, по большей части состоящие из широко распространенного в  природе крем­ ния (на любом пляже его килотонны, правда, связанного в виде пе­ ска), ведут себя как резисторы, конденсаторы, транзисторы, дио­ ды и другие приборы с не менее странными названиями, которые являются частью обыденного лексикона инженеров­электриков. Этим инженерам платят большие деньги за то, что они знают, как электроны прокладывают себе путь в  схемах, состоящих из мил­ лионов микроскопических кусочков кремния, схемы, в  которых количество взаимосвязей уже приближается к количеству связей в мозге человека. Все это чрезвычайно мудреные вещи, зачастую близкие к волшебству, но нам они не понадобятся. Вместо этого мы будем работать с не зависящими от технологии блок­схемами. Такие схемы вы можете увидеть на доске в кабине­ те руководителя проекта (я называю их схемами управленческого уровня). Иногда они называются просто схемами входа­выхо­ да. Простейшая[2] такая схема – одиночный блок, показанный на рис.  6.2.1, где x(t) – вход, а  y(t) – выход. Что означает h(t) внутри блока, я скоро расскажу. В принципе, мы, конечно, можем описать поведение любого блока математически, просто представив урав­ нение, которое выражает y(t) как функцию x(t). Например, если бы блок был интегрирующим устройством, то мы могли бы написать

x(t)

h(t)

y(t)

Рис. 6.2.1. Простейшая блок­схема

Но в этой главе мы ограничимся только блоками, которые инже­ неры­электрики называют линейными стационарными системами

292

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

(ЛСС). Слово линейный в ЛСС означает, что применим принцип су­ перпозиции, а  это, в  свою очередь, означает, что (стрелка вправо обозначает отношение влечет): если x1(t) ® y1(t) и если x2(t) ® y2(t), то c1x1(t) + c2x2(t) ® c1y1(t) + c2y2(t) для любых постоянных c1 и c2 (быть может, комплексных). Слово стационарная означает, что: если x(t) ® y(t), то x(t - t0) ® y(t - t0). Иными словами, если вход ЛСС сдвинуть во времени на t0, то вы­ ход также сдвинется во времени на t0. А что же такое h(t) на рис. 6.2.1? Это так называемая импульсная характеристика блока. То есть если x(t) = d(t), то y(t) = h(t). Выход блока равен h(t), когда на его вход подается импульс единичной силы d(t). Далее я покажу, что h(t) представляет полную информа­ цию о  содержимом блока. То есть если мы знаем h(t), то можем вычислить выход y(t) для любого входа x(t). Одна из причин, по которым импульсная характеристика блока «содержит всю инфор­ мацию» о внутренней структуре блока, состоит в том, что энергия импульса (как мы показали в главе 5) равномерно распределена по всем частотам от -¥ до +¥. Все, что находится внутри блока, най­ дет какую­то энергию в  импульсном входе на любой частоте, на которой устройство необходимо возбудить. Иначе говоря, внутри блока нет ничего такого, что не давало бы вклад в общий отклик на выходе. Более мелодраматично эту мысль можно выразить, сказав, что внутри блока нет ничего, что «хранилось бы в секрете», – все находящееся в нем «рассказывает» о себе при возбуждении вход­ ным импульсом. Едва ли не первое, что учится делать студент факультета электро­ техники, – вычислять h(t) для ЛСС­блока, если известна детальная внутренняя структура блока (например, принципиальная схема). Мы не будем этим заниматься, а просто предположим, что h(t) уже известна. Пойдем еще дальше и представим, что мы подали на вход блока сигнал d(t), а затем измерили выходной сигнал, – по опреде­ лению, это и есть h(t). Конечно, возникает вопрос: как практически можно подать сигнал d(t), коль скоро его энергия бесконечна? Как сгенерировать d(t)? Законный вопрос, но на него есть простой от­ вет (о котором я расскажу ниже в этом разделе). Конечно, на бума­

ЛИНЕЙНыЕ СТАцИОНАРНыЕ СИСТЕМы, СВЕРТКА (СНОВА), ПЕРЕДАТОЧНыЕ ФУНКцИИ

293

ге не составляет никакого труда подать импульс математически. Например, что такое h(t) для интегрирующего устройства? Ничего сложного: если x(t) = d(t), то

т. е. h(t) = u(t). Импульсной характеристикой такого интегрирую­ щего устройства является единичная ступенчатая функция. Теперь для начала я хочу убедить вас, что, зная h(t) – не важно, откуда (теоретически или экспериментально), – мы действительно можем вычислить y(t) для любого x(t). Допустим, что на вход блока на рис. 6.2.1 подается цуг импульсов переменной силы (равномер­ но распределенных во времени), которая задается произвольной функцией s(t), как показано на рис. 6.2.2. То есть если временной интервал между соседними импульсами равен D, то мы можем за­ писать x(t) в виде

s(t)

D t D Рис. 6.2.2. цуг импульсов, разделенных одинаковыми временными интервалами D

Вы должны ясно понять, что это означает: s(kD) · D – это сила, или площадь, импульса в момент t = kD. (Высота любого импульса бесконечна в силу самой концепции импульса.) Поскольку x(t) по­ дается на вход ЛСС­блока, то в силу принципа суперпозиции и ста­ ционарности мы можем записать выход в виде (поскольку импульс единичной силы в момент t = kD порождает выход h(t - kD)):

294

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

Теперь будем рассуждать так, как в разделе 5.2 при выводе ин­ теграла Фурье из ряда Фурье. То есть представим, что D ® 0. Тогда (i) kD «превращается» в  непрерывную переменную, которую мы будем обозначать r; (ii)

«превращается» в 

(iii) D «превращается» в dt. Наши выражения для x(t) и y(t) превращаются в

Благодаря фильтрующему свойству импульса уравнение x(t) сводится просто к x(t) = s(t). Подставив этот результат в уравнение y(t), получаем искомый ответ:

где второе равенство образуется тривиальной заменой перемен­ ной в  первом интеграле. Иными словами, если вспомнить раз­ дел 5.3, то получается, что выход y(t) ЛСС­блока с входом x(t) и им­ пульсной характеристикой h(t) равен свертке по времени x(t) и h(t), т. е. y(t) = x(t) * h(t). Этот результат – золотая жила информации. Например, мы теперь можем ответить на вопрос, как экспери­ ментально измерить h(t) без генерации входного сигнала d(t), ко­ торый сгенерировать невозможно. Предположим, что вместо этого мы сгенерировали единичную ступенчатую функцию x(t)  = u(t), что очень просто. (Ступенчатая функция, как и импульс, – сигнал с бесконечной энергией, но, в отличие от импульса, нам не нуж­ но подавать всю эту энергию в один момент, а можно распреде­ лить на бесконечный интервал времени.) Отклик блока (который

ЛИНЕЙНыЕ СТАцИОНАРНыЕ СИСТЕМы, СВЕРТКА (СНОВА), ПЕРЕДАТОЧНыЕ ФУНКцИИ

295

вполне логично называется откликом на ступенчатый входной сигнал) равен

Дифференцируя по t, сразу же получаем

То есть импульсная характеристика ЛСС­блока – это просто про­ изводная (легко вычисляемая) отклика на ступенчатый входной сигнал. Что может быть проще? В качестве второго примера применения сверточного интеграла вспомним результат из раздела 5.3, где мы вычисляли преобразо­ вание Фурье интеграла свертки по времени Y(w) = X(w)H(w). Этот результат настолько важен, что я заключил его в рамку там и здесь. Отсюда сразу же получаем, что

Поскольку, в силу формулы плотности энергии Рэлея, 1/2p|X(w)|2 2 2p|Y(w)|  – спектральные плотности энергии входного и выход­ ного сигнала соответственно, то имеем и 1/

Роль, которую H(w) (преобразование Фурье импульсной характе­ ристики) играет в изучении ЛСС­блоков, невозможно переоценить.

296

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

Она настолько важна, что получила специальное название: H(w) называется передаточной функцией ЛСС­блока, поскольку опреде­ ляет (как в интеграле выше), как энергия входного сигнала пере­ дается выходному сигналу. Любая частота, при которой H(w) = 0, является частотой, при которой на выходе нет никакой энергии (пусть даже на входе при этой частоте энергии полно). Мы еще уви­ дим, насколько полезно это понимание при построении электрон­ ных систем. До сих пор я не сказал ничего конкретного о природе h(t). По­ этому, прежде чем завершить этот раздел, я хочу ввести понятие каузальной h(t). Математически это просто означает, что h(t)  = 0 для t < 0. Но у этого условия есть глубокая физическая интерпрета­ ция. Импульсная характеристика h(t) ЛСС­блока является выходом блока, потому что входом является d(t) – сигнал, присутствующий только в момент времени t = 0. Ни у какого блока, который мож­ но построить из реального оборудования, существующего в  из­ вестном нам мире, не может быть импульсной характеристики, которая существует до момента t = 0, отсюда и термин каузальная (причинно обусловленная). То есть импульсный входной сигнал – причина выходного сигнала h(t). Блок, импульсная характеристика которого h(t) ¹ 0 для t < 0, называется опережающим, потому что он «опережает» поступление импульса (в момент t = 0) и, стало быть, начинает генерировать отклик еще до t = 0, т. е. при t < 0. (Именно поэтому другое название некаузального блока, который начина­ ет реагировать на еще не поступивший входной сигнал, – машина времени!) Наложение ограничения на h(t), очевидно, повлияет на природу ее преобразования Фурье, передаточную функцию H(w). А вот что неочевидно, так это насколько велико такое влияние, – оно очень весомо. Сейчас я объясню, почему. Для начала явно выделим вещественную и мнимую части ком­ плексной в  общем случае функции H(w) и  назовем их соответ­ ственно R(w) и X(w). Имеем: H(w) = R(w) + iX(w). Кроме того, я запишу саму h(t) в виде суммы четной и нечетной функций: h(t) = he(t) + ho(t). Чтобы доказать, что это всегда возможно, для любой h(t), проще всего выписать he(t) и ho(t) в явном виде (доказательство построе­

ЛИНЕЙНыЕ СТАцИОНАРНыЕ СИСТЕМы, СВЕРТКА (СНОВА), ПЕРЕДАТОЧНыЕ ФУНКцИИ

297

нием  – лучший вид доказательства). По определению четности и нечетности имеем: he(-t) = he(t); ho(-t) = -ho(t). Таким образом, h(-t) = he(-t) + ho(-t) = he(t) - ho(t). Если теперь сложить и вычесть h(t) и h(-t), то получим

откуда следует, что he(t) и ho(t) существуют для любой h(t). Далее, поскольку h(t) по условию каузальна, т.  е. h(t)  = 0 для t < 0, то

и

Отсюда получаем he(t) = ho(t), если t > 0; he(t) = -ho(t), если t < 0, что, конечно, можно записать и так: ho(t) = he(t), если t > 0; ho(t) = -he(t), если t < 0. И наконец, каждую из этих пар утверждений можно записать очень компактно, обойдясь без явных условий на t:

298

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

he(t) = ho(t)sgn(t); ho(t) = he(t)sgn(t). Поскольку h(t) = he(t) + h0(t), можно записать H(w) = He(w) + Ho(w). А так как he(t) четная (по определению), то He(w) чисто вещест­ венная. И коль скоро ho(t) нечетная (по определению), то Ho(w) чис­ то мнимая (см. раздел 5.2). Таким образом, должны выполняться равенства He(w) = R(w); Ho(w) = iX(w). Теперь вспомним пару преобразований Фурье, выведенную в разделе 5.4:

Объединяя это с  теоремой о  свертке в  частотной области из раздела 5.3 и применяя оба равенства в рамке, имеем:

и

Или

и

Эти два уравнения показывают, что для каузального ЛСС­блока R(w) и X(w) взаимно определяют друг друга. Интегралы, связыва­

ЛИНЕЙНыЕ СТАцИОНАРНыЕ СИСТЕМы, СВЕРТКА (СНОВА), ПЕРЕДАТОЧНыЕ ФУНКцИИ

299

ющие R(w) и X(w), называются преобразованиями Гильберта[3], это название ввел в оборот наш старый друг Г. Х. Харди. Харди впервые опубликовал это преобразование на английском языке в 1909 году, но, когда впоследствии узнал, что немецкому математику Давиду Гильберту (помните, мы говорили о нем в разделе 3.1?) оно было известно еще в  1904 году, начал называть его преобразованием Гильберта. Впрочем, даже Гильберт был не первым – это преобра­ зование появилось в 1873 году в докторской диссертации русского математика Юлиана Васильевича Сохоцкого (1842–1927). Заме­ тим, что преобразование Гильберта, в отличие от преобразования Фурье, не меняет область определения. То есть оно принимает функцию от w и преобразует ее в другую функцию от w (а преобра­ зование Фурье, напомним, преобразует функцию от w в функцию от t, и наоборот). Интегралы в преобразовании Гильберта, связывающие вещест­ венную и мнимую части передаточной функции каузального бло­ ка, можно было бы назвать локальными ограничениями, потому что они показывают, как определяются значения R(w) и  X(w) для любого конкретного w. Можно также вывести глобальные ограни­ чения на R(w) и X(w) для каузальной h(t). Для этого поступим сле­ дующим образом. Применив формулу плотности энергии Рэлея к парам Фурье he(t) « R(w); ho(t) « iX(w), получаем (напомним, что R(w) и X(w) – вещественные функции w):

Ранее мы показали, что для каузальной h(t) имеет место равен­ ство he(t) = ho(t)sgn(t), поэтому he2(t) = ho2(t). Поэтому оба интеграла по времени (в левой части) равны, и, значит, равны и оба интегра­ ла по частоте:

300

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

а это показывает, как интегральное (глобальное) поведение R(w) зависит от интегрального (глобального) поведения X(w) – и наобо­ рот – для каузальной h(t). Теперь должно быть ясно, что каузальность  – очень сильное ограничение на ЛСС­блоки, которые можно построить в виде ре­ ального оборудования, а  не просто жонглировать символами на бумаге. В  действительности, каким бы изощренным не выгляде­ ло сверхсекретное электронное устройство на бумаге, оно должно подчиняться «фундаментальному» закону причинности, если мы и вправду собираемся реализовать его «в железе»[4]. Если удается показать, что предлагаемое устройство нарушает закон причин­ ности (т.  е. что импульсная характеристика опережающая), то устройство не может быть осуществлено аппаратно. Инженеры­ электрики говорят, что такое устройство нереализуемо. Проще го­ воря, выходной сигнал не должен появляться раньше, чем будет подан входной. Это может показаться настолько очевидным, что не заслуживает упоминания, но на самом деле некоторые схемы, которые на бумаге выглядят вполне убедительно, не являются кау­ зальными. Как бы мы ни старались, их невозможно сконструиро­ вать в  рамках той электротехники, которую мы знаем. И, чтобы избавить себя от нескончаемых поисков несуществующего, важно знать, по каким признакам можно определить, реализуема ли тео­ ретическая бумажная конструкция. Чтобы продемонстрировать, как это работает, я детально рассмотрю конкретный пример. В электронике есть важная теоретическая схема – идеальный по­ лосовой фильтр с единичным усилением, который пропускает энер­ гию, сконцентрированную в определенном интервале частот, и не пропускает всю остальную энергию входного сигнала. График абсолютной величины передаточной функции такого идеального фильтра показан на рис. 6.2.3 (он называется фильтром с единич­ ным усилением, потому что абсолютная величина его передаточ­ ной функции H(w) равна 1 для тех частот, на которых происходит передача энергии). Говорят, что график на рис. 6.2.3 идеализиро­ ванный, потому что |H(w)| = 0 там, где не равна 1, т. е. из­за верти­ кального спада в точках, где H(w) изменяет значение. В реальных фильтрах спад не вертикальный. Ширина полосы этого идеального фильтра равна 2Dw, а интервал частот, в котором фильтр пропускает энергию, называется полосой пропускания; это интервал wc - Dw < |w| < wc - Dw, где wc – средняя частота полосы пропускания. Разберемся в том, что точно означа­

ЛИНЕЙНыЕ СТАцИОНАРНыЕ СИСТЕМы, СВЕРТКА (СНОВА), ПЕРЕДАТОЧНыЕ ФУНКцИИ

301

ет этот график. Предположим, что wc - Dw < |w| < wc - Dw, и на вход подается сигнал cos(wt)  = (eiwt  + e-iwt)/2. Тогда половина энергии входного сигнала приходится на частоту +w, а другая половина – на частоту -w, и  cos(wt) «проходит» через фильтр без ослабления, поскольку eiwt/2 «проходит», т. к. |H(w)| = 1 в правой части оси w на рис. 6.2.3, а e-iwt/2 «проходит», т. к. |H(w)| = 1 в левой части оси w на том же рисунке. |H(w)|

1 –wc –wc – Dw

wc –wc + Dw

0

wc – Dw

wc + Dw

w

Рис. 6.2.3. Абсолютная величина передаточной функции идеального полосового фильтра с единичным усилением

Конечно, знания |H(w)| недостаточно, чтобы полностью описать идеальный полосовой фильтр, поскольку отсутствует информация о фазе. То есть в общем случае H(w) – комплексная функция, поэто­ му H(w) = |H(w)|eiq(w), где q(w) называется фазовой функцией H(w). Для определения фазовой функции инженеры­электрики налагают на идеальный фильтр дополнительное ограничение – нулевое фазовое искажение. Говорят, что в фильтре имеет место фазовое искажение, если для прохождения через фильтр (от входа к выходу) энергиям разной частоты требуется разное время. Физически нулевое фазо­ вое искажение означает, что форма входного сигнала не изменя­ ется при прохождении через идеальный полосовой фильтр, если вся энергия сигнала сосредоточена в полосе пропускания фильтра. Рассмотрим далее конкретную частоту w, принадлежащую по­ лосе пропускания фильтра. Предположим, что вся энергия про­ ходит через фильтр с  одной и  той же временной задержкой t0. Поскольку ни абсолютная величина, ни форма входного сигнала не изменяются фильтром с  единичным усилением, то входной сигнал eiwt будет испытывать только задержку на время t0. То есть выходной сигнал будет равен eiw(t-t0)  = eiwt  e-iwt0. Но в  силу самого определения передаточной функции H(w) выходной сигнал равен H(w)eiwt. Таким образом, H(w) = e-iwt0, где w – произвольная частота,

302

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

принадлежащая полосе пропускания. (По определению идеаль­ ного полосового фильтра H(w)  = 0, если w не принадлежит поло­ се пропускания.) Итак, идеальный полосовой фильтр с  нулевым фазовым искажением имеет отрицательную фазовую функцию, линейно зависящую от частоты (как показано на рис.  6.2.4), т.  е. q(w) = -wt0 для wc - Dw < |w| < wc + Dw. q(w)

wc – Dw –wc – Dw –wc –wc + Dw

0

wc + Dw wc

w

Рис. 6.2.4. Фазовая функция идеального полосового фильтра

Можно показать, что такой идеальный фильтр невозможно сконструировать на практике, потому что его импульсная характе­ ристика h(t) ¹ 0 для t < 0. Для этого выпишем интеграл обратного преобразования Фурье:

После взятия интегралов и применения формулы Эйлера полу­ чаем

а после простых тригонометрических и алгебраических преобра­ зований (выполните их самостоятельно) эта формула принимает вид:

ЛИНЕЙНыЕ СТАцИОНАРНыЕ СИСТЕМы, СВЕРТКА (СНОВА), ПЕРЕДАТОЧНыЕ ФУНКцИИ

303

Как «выглядит» h(t)? Для построения графика предположим, что t0 = 1, wc = 50 и  Dw = 5. На рис. 6.2.5 показан график h(t) при таких значениях (на интервале -4 £ t/t0 £ 3), и, как и следовало ожидать, максимальный отклик имеет место в момент t = t0; видно также, что h(t) весьма «активна» при t < 0. 4

Импульсная характеристика

3 2 1 0 –1 –2 –3 –4 –4

–3

–2

–1

0

1

2

3

Время (в единицах t0) Рис. 6.2.5. Импульсная характеристика идеального полосового фильтра

Итак, идеальный полосовой фильтр построить невозможно. Тем не менее он настолько полезен инженерам­электрикам при обду­ мывании электронных систем, что они все равно используют его – по крайней мере, на бумаге. Как именно, мы увидим ниже в этой главе. В 1933 году в процессе сотрудничества американского мате­ матика Норберта Винера (вспомните теорему Винера–Хинчина из раздела 5.3) и английского математика Реймонда Пэли (1907–1933) было установлено необходимое и достаточное условие, при кото­ ром |H(w)| является абсолютной величиной передаточной функции каузального фильтра: должен быть конечен так называемый инте­ грал Винера–Пэли:

304

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

В случае идеального полосового фильтра, для которого |H(w)| = 0 почти для всех w, интеграл Винера–Пэли, очевидно, не является конечным, поэтому такая функция не может быть абсолютной ве­ личиной передаточной функции. Во втором томе своей автобио­ графии Винер писал об этой совместной работе: Пэли с  энтузиазмом набросился на задачу. Однако в  ходе работы выяснилось, что у  меня есть перед ним некоторые преимущества: в отличие от него, я с самого начала понимал, что наша задача име­ ет также самое непосредственное отношение к электротехнике [ис­ точником вдохновения для значительной части трудов Винера по математике было его сотрудничество с  коллегами по факультету электротехники МТИ]. Давно было известно, что острота, с которой электрический фильтр вырезает полосу частот, не может быть без­ граничной, хотя физики и инженеры не знали глубоких математи­ ческих причин, определяющих такое положение вещей. При реше­ нии задачи, представлявшейся Пэли чем­то вроде очень красивой и трудной шахматной головоломки, ничем не связанной с реальным миром, я заодно показал, что ограничения, в рамках которых рабо­ тали инженеры­электрики, – это именно то, что не дает будущему оказывать влияние на прошлое[5].

Последнее предложение, наверное, покажется загадочным мно­ гим читателям автобиографии (а это очень увлекательное чтение – Винер был весьма необычным человеком), но, конечно, он имел в  виду опережающую импульсную характеристику некаузальной электрической схемы. Интеграл Пэли–Винера ничего не говорит о фазе передаточной функции; он лишь сообщает, что если |H(w)| удовлетворяет интегральному критерию, то существует такая фа­ зовая функция, которая в сочетании с |H(w)| определяет передаточ­ ную функцию некоторого каузального фильтра. Но кое­что критерий Винера–Пэли все же говорит, а именно что невозможно построить не только идеальный полосовой фильтр, но и  идеальный фильтр нижних частот, идеальный фильтр верхних частот и  идеальный полосно­заграждающий фильтр (абсолютные величины их передаточных функций показаны на рис. 6.2.6). Но, как и идеальный полосовой фильтр, эти три фильтра настолько полезны при обдумывании задачи, что инженеры­электрики часто предпо­ лагают, что такие нереализуемые фильтры все­таки существуют.

ТЕОРЕМА О МОДУЛЯцИИ, СИНХРОННыЕ РАДИОПРИЕМНИКИ

Фильтр нижних частот

|H(w)|

–w0

0

Фильтр верхних частот

Полосно­заграждающий фильтр

–w0 + Dw

w

w0

w

w0

w

|H(w)|

0

–w0

w0

|H(w)|

0

–w0

–w0 – Dw

305

w0 – Dw

w0 + Dw

Рис. 6.2.6. Абсолютные величины передаточных функций идеального фильтра нижних частот, фильтра верхних частот и полосно­заграждающего фильтра

6.3. Теорема о модуляции, синхронные радиоприемники и как сделать речевой скремблер В электротехнике часто бывает полезно сдвинуть энергию сигнала вверх или вниз по частоте. Теория Фурье  – бесценный инструмент, позволяющий понять, как это можно реализовать в электронных схемах. Но сначала, чтобы заинтересовать вас ма­ тематикой, приведенной в этом разделе, я хочу продемонстриро­ вать один простой пример, доказывающий важность этой задачи. Думаю, каждый читатель данной книги согласится, что радио – чу­ десное изобретение. Но, быть может, не так широко известно, что смещение частоты – неотъемлемая часть радио. И вот почему.

306

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

Распространенное коммерческое применение радиосвязи (ра­ дио с амплитудной модуляцией, или AM­радио) позволяет работать многим передатчикам в одной географической зоне. А почему они не конфликтуют друг с другом? То есть почему мы среди несколь­ ких вещающих станций можем выбрать ту, которую хотим слушать? Чтобы не вдаваться в сложности, предположим, что Алиса говорит в свой микрофон на станции A, а Боб – в свой микрофон на станции B. Поскольку произносимые ими звуки генерируются одним и тем же процессом (колебания голосовых связок), энергии обоих голосо­ вых сигналов будут сосредоточены примерно в одной и той же об­ ласти частот (обычно от нескольких десятков до нескольких тысяч герц). Это значит, что интервалы частот, занятые электрическими сигналами, исходящими от микрофонов Алисы и Боба, одинаковы. Этот общий интервал так называемых звуковых частот определя­ ет групповой спектр, т. е. голоса Алисы и Боба порождают энергию в ограниченной основной полосе частот (см. раздел 5.3). Подача первичного электрического сигнала с  микрофона пря­ мо на антенну не приведет к  эффективному излучению энергии в пространство; уравнения электромагнитного поля Максвелла го­ ворят, что для эффективного согласования антенны со средой рас­ пространения физический размер антенны должен быть сравним с длиной излучаемой волны (тут вам придется поверить мне на сло­ во). Например, при групповой частоте 1 кГц длина волны электро­ магнитного излучения составляет примерно 300 км – многовато. Поэтому, чтобы получить антенну разумного размера, необходимо уменьшить длину волны, т. е. увеличить частоту. В коммерческом AM­радио для этого сдвигают групповой спектр сигнала микро­ фона в диапазон AM­радиовещания, занимающий частоты от 500 до 1500 кГц. (Каждая радиостанция получает от Федеральной комис­ сии по связи* (FCC) лицензию, которая дает право сдвигать часто­ ту на такую величину, чтобы диапазоны, используемые разными радиостанциями в одной географической зоне, не пересекались.) Например, на частоте 1000 кГц длина волны в тысячу раз короче, чем на частоте 1 кГц, и составляет примерно 300 метров. Если ан­ тенна нашей станции четвертьволновая, то ее высота будет равна примерно 76 м (когда в следующий раз будете проезжать мимо пе­ * В России этим занимается Федеральная служба по надзору в  сфере связи, информационных технологий и массовых коммуникаций (Роском­ надзор). – Прим. перев.

ТЕОРЕМА О МОДУЛЯцИИ, СИНХРОННыЕ РАДИОПРИЕМНИКИ

307

редатчика местной AM­радиостанции, обратите внимание – при­ мерно такую антенну и увидите). x1(t) y(t) = x1(t)x2(t) x2(t) Рис. 6.3.1. Символ умножителя на блок­схемах

Итак, предположим, что первичный сигнал Алисы на станции A мы сдвигаем вверх до 900 кГц, а первичный сигнал Боба на стан­ ции B – до 1100 кГц. Тогда радиоприемник мог бы выбрать, какой сигнал слушать, с помощью настраиваемого полосового фильтра, т.  е. регулируемого[6] полосового фильтра, средняя частота кото­ рого может быть совмещена с частотой 900 или 1100 кГц (ширина полосы фильтра для AM­радио составляет 10 кГц). Обращаю ваше внимание на то, что смещение частоты используется в  радиове­ щании по двум причинам: (1) чтобы сместить групповой спектр вверх в  область радиочастот и тем самым добиться эффективно­ го излучения энергии и  (2) чтобы разделить групповые спектры радиостанций за счет использования разных смещений частоты и  тем самым дать полосовому фильтру возможность выбирать конкретную станцию. На стороне приемника мы должны сместить частоту вниз, чтобы энергия сигнала выбранной станции попала в диапазон частот, воспринимаемых нашим ухом. Это смещение частоты вверх и вниз, как мы увидим, достигается простым умножением – но, как мы вскоре убедимся, реализовать прямое умножение в электронной схеме не так­то просто. Придет­ ся проявить изобретательность, и путь нам осветит теория Фурье. Чтобы понять, что математическое умножение действительно со­ ответствует смещению частоты, предположим сначала, что имеет­ ся схема с двумя входами x1(t) и x2(t) и одним выходом y(t), который равен произведению обоих входов, как показано на рис. 6.3.1. (Вы понимаете, что такая схема не может быть ЛСС­блоком[7]?) Теперь предположим, что x1(t) = m(t), первичный голосовой сигнал, гене­ рируемый микрофоном, а q(t) = cos(wct), где wc – частота, которую радиостанция получила от FCC (так называемая несущая частота). Вопрос: где (в частотной области) сосредоточена энергия сигнала y(t) = m(t)cos(wct)?

308

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

Для ответа на этот вопрос нам, естественно, нужно вычислить преобразование Фурье функции y(t). Итак,

Таким образом, преобразование Фурье выхода умножителя – это преобразование первичного сигнала, смещенного вверх и  вниз на частоту wc. Этот фундаментальный результат, называемый теоремой о модуляции или о гетеродине[8], показан на рис. 6.3.2, где энергия m(t) сосредоточена в интервале частот -wm £ w £ wm (как было сказано выше, wm – это максимальная частота первичного сигнала m(t), при которой энергия еще есть и составляет несколько килогерц). |M(w)|

–wm

0 wm

w

|Y(w)|

–wc

wc w

0 –wc – wm

–wc + wm

wc – wm

wc + wm

Рис. 6.3.2. Преобразование Фурье первичного сигнала и его гетеродинированного варианта

ТЕОРЕМА О МОДУЛЯцИИ, СИНХРОННыЕ РАДИОПРИЕМНИКИ

309

Информация, содержащаяся в первичном сигнале m(t), перво­ начально с центром в w = 0, «перенеслась» в w = wc, и теперь мы понимаем, почему w называется несущей частотой. Умножение на стороне радиопередатчика осуществляется так называемым мо­ дулятором (я еще вернусь к нему в разделе 6.4), а выход умножи­ теля y(t) подается на антенну (после усиления до мощности, кото­ рая на коммерческих AM­радиостанциях в США может достигать 50 000 Вт). Примечание: треугольник, которым я обозначаю пре­ образование m(t), – просто метафора настоящего преобразования, которое может иметь совсем не треугольную форму (но, конечно, поскольку функция m(t) вещественная, мы точно знаем, что |M(w)| четная). Для нас важно только то, что полоса частот M(w) ограни­ чена. После того как выбор диапазона на стороне приемника завер­ шен, частота смещается вниз в основной диапазон, для чего можно применить еще одно умножение на cos(wct), что приводит к сдви­ гу преобразования Y(w) на рис.  6.3.2 вверх и  вниз на wc, поэтому часть энергии этого нового сигнала будет сосредоточена в диапа­ зоне с центром в 2wc, а остальная часть – вокруг w = 0 (это, понят­ ное дело, исходный первичный сигнал). Затем энергию первичного сигнала можно селектировать фильтром нижних частот, который отфильтрует энергию в окрестности 2wc (на практике эта операция фильтрации производится автоматически, потому что механиче­ ски «массивный» динамик просто не способен реагировать на вы­ сокую частоту 2wc, которая в коммерческом AM­радио превышает 1 МГц). Весь этот процесс на стороне приемника в электротехнике называется обнаружением, или демодуляцией. На самом деле, по­ скольку такой вид радиоприемника зависит от наличия того же сигнала cos(wct), что используется передатчиком (любое откло­ нение по частоте от wc и/или появление сдвига по фазе, т.  е. ис­ пользование сигнала cos(wct + q), где q ¹ 0, приведет к серьезным проблемам[9]), он называется синхронным демодулятором (или син­ хронным детектором). Считая, что r(t) обозначает принятый сиг­ нал (спектр которого похож на спектр переданного сигнала y(t)), на рис.  6.3.3 изображена блок­схема приемника с демодуляцией. (Кружочек с загогулинкой внутри представляет схему генератора колебаний, которая порождает синусоидальный сигнал частоты wc, – сконструировать такую схему нетрудно.)

310

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

r(t) Фильтр нижних частот

пропорционален m(t)

cos(wct)

Рис. 6.3.3. Радиоприемник с синхронной демодуляцией

Блок­схема радиоприемника на рис.  6.3 выглядит просто, но внешность обманчива. Требование о том, что синусоида, локально генерируемая на стороне приемника, должна почти точно совпа­ дать по частоте и фазе с синусоидой, генерируемой передатчиком (который может быть удален на тысячи километров), не то чтобы невыполнимо, но построить такой синхронный приемник было бы очень дорого. Поэтому для коммерческого AM­радиовещания этот вариант непривлекателен. В действительности же современ­ ные AM­радиоприемники настолько дешевы, что никто их даже не чинит – если приемник ломается, его выбрасывают и покупа­ ют новый. Поэтому для обнаружения передаваемого первичного сигнала применяется не синхронная демодуляция, а другие мето­ ды[10]. Однако если найдется кто­то, желающий заплатить за до­ полнительную сложность синхронной демодуляции, то открыва­ ются кое­какие почти волшебные возможности, пример которых я рассмотрю в разделе 6.5. Все это, конечно, замечательно, но предполагает, что в  нашем распоряжении имеется схема умножителя. А так ли это? Вообще­ то нет, построить такую схему, работающую на радиочастотах, очень трудно. Так что же, все, что я рассказывал, – бессмысленный трёп? Вовсе нет. Просто нужно с умом подойти к реализации умно­ жения (добиться этого, ничего не умножая на деле). Чтобы объ­ яснить эту загадочную фразу, давайте немного умерим амбиции и рассмотрим частный случай – схему, которая порождает квадрат единственного входного сигнала (см. примечание 7). Из такого устройства возведения в квадрат можно сделать умножитель, если предположить, что имеется также схема сложения  – сумматор (показана на рис. 6.3.4 в виде кружочка со знаком суммы; почему в эту схему включен также полосовой фильтр, мы вскоре увидим).

ТЕОРЕМА О МОДУЛЯцИИ, СИНХРОННыЕ РАДИОПРИЕМНИКИ

311

На вход устройства возведения в квадрат подается сигнал m(t) + cos(wct), поэтому на выходе получается сигнал s(t) = [m(t) + cos(wct)]2 = m2(t) + 2m(t)cos(wct) + cos2(wct), который включает искомое произведение m(t)cos(wct). Выход s(t) включает и еще два члена, которые, на первый взгляд, все портят. Но, на наше счастье, можно организовать работу так, чтобы пол­ ностью отделить (по частоте) энергию нужного нам произведения от энергии остальных членов. Тогда если мы подадим s(t) на вход подходящего полосового фильтра, то сигнал y(t) на выходе этого фильтра будет содержать только энергию произведения, т.  е. y(t) будет пропорционален m(t)cos(wct). m(t)

+

Устройство возведения в квадрат

å +

s(t)

Полосовой фильтр

y(t)

cos(wct)

Рис. 6.3.4. Умножение путем возведения в квадрат и фильтрации

Теперь рассмотрим каждую из трех составляющих сигнала s(t) по очереди. Проще всего разобраться с  членом 2m(t)cos(wct). По теореме о гетеродине энергия этого члена просто равна энергии m(t), сдвинутой вверх и вниз по оси w в точки w = ±wc. Член cos2(wt) можно с помощью тригонометрической формулы косинуса двой­ ного угла преобразовать в эквивалентную форму (а затем вычис­ лить ее преобразование Фурье):

Это означает, что вся энергия cos2(wt) сосредоточена в трех час­ тотах: w = 0 и w = ±2wc. (Преобразования Фурье постоянной и чис­ той синусоиды мы вычислили в разделе 5.4. Там я анализировал функцию sin(wct), а не cos(wct), но вычисления такие же, а результа­ ты различаются тривиальным образом.) И наконец, из раздела 5.3 и теоремы о свертке в частотной области мы знаем, что преобра­ зование Фурье m2(t) равно

312

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

m2(t) « M(w) * M(w). Тогда мы продемонстрировали (с помощью рис. 5.3.1), что пре­ образование Фурье m2(t) сосредоточено в  ограниченном интер­ вале частот |w| £ 2wm. Все эти выводы изображены на рис.  6.3.5, где я показал энергии отдельных составляющих для случая, когда энергия гетеродинированного первичного сигнала (нужное нам произведение) не перекрывается с энергиями двух остальных чле­ нов. По рисунку видно, что именно такая ситуация возникает, если 2wm < wc - wm, т. е. wc > 3wm. В AM­радио это условие удовлетворя­ ется с большим запасом, поскольку, как я уже говорил, wc больше 500 кГц, тогда как wm составляет всего несколько килогерц. Таким образом, если выход устройства возведения в квадрат s(t) подать на вход полосового фильтра, показанного на рис.  6.3.4 (с шири­ ной полосы 2wm = 10 кГц в случае AM­радио) со средней частотой wc, то энергия выходного сигнала фильтра и будет энергией, ассо­ циированной с произведением m(t)cos(wct) (и только этой энерги­ ей). Мы реализовали умножение с помощью возведения в квадрат и  фильтрации и  использовали для этого схему, работу которой можно понять только с привлечением теории Фурье. |S(w)|

–wm –2wc

–wc

–2wm

wm 0

wc

2wc

w

2wm wc – wm

Рис. 6.3.5. Как распределена энергия выходного сигнала s(t) устройства возведения в квадрат на рис. 6.3.4

Но, несмотря на элегантность, схема на основе возведения в  квадрат и  фильтрации – не самый простой способ реализации умножителя. В AM­радиопередатчике умножение реализовано го­ раздо изобретательнее – как именно это сделано, я покажу в сле­ дующем разделе, а пока поразмыслите сами. Можете ли вы при­

ТЕОРЕМА О МОДУЛЯцИИ, СИНХРОННыЕ РАДИОПРИЕМНИКИ

313

думать еще более простой (и гораздо более дешевый) метод, чем на рис. 6.3.4? Не торопитесь заглядывать вперед, а сначала хотя бы немного подумайте. На помощь снова придет теория Фурье. В завершение этого раздела я  хочу показать, как все рассмот­ ренные в этой главе идеи можно применить для конструирования электронного речевого скремблера, персонального портативного устройства, обеспечивающего умеренный уровень безопасности при разговоре по открытым телефонным каналам. Это устройство (его блок­схема показана на рис. 6.3.6, ФВЧ и ФНЧ означают соот­ ветственно фильтр верхних частот и фильтр нижних частот) кре­ пится на динамик и наушники обычного телефона (почему и туда, и  сюда, мы скоро увидим). Оно достаточно сложное, чтобы защи­ титься от «случайного» подслушивания разговора, но все же не позволит предотвратить перехват законными средствами борьбы с преступностью, имеющимися в распоряжении даже местного от­ деления полиции. Эта схема скремблера довольно старая, она по­ явилась сразу после Первой мировой войны. Сначала она исполь­ зовалась в коммерческих целях на радиотелефонной линии между Лос­Анджелесом и отелем с казино, расположенным на острове Сан­ та­Каталина. Когда (в 1958 году) я жил в городке близ Лос­Анджелеса и ходил в школу, это место ненадолго прославилось благодаря песне «26 миль» группы «Four Preps», входившей в список топ­10: Twenty­six miles across the sea, Santa Catalina is a­waitinʼ for me*. (Сейчас 2004 год, я нахожусь в Нью­Гэмпшире, работаю над книгой и напеваю эту песенку. А за окном зима и температура ниже нуля. Ну, это так, ностальгия!) Оба фильтра на этом рисунке идеальные, спад с 20 кГц до нуля строго вертикальный. На вход скремблера подается голосовой первичный сигнал m(t), ограниченный полосой шириной 5 кГц (это можно гарантировать, применив к входному сигналу первый фильтр нижних частот). Слева направо на этой схеме показаны сигналы x1(t), x2(t), x3(t) и, наконец, (скремблированный) выход­ ной сигнал y(t). А  на рис.  6.3.7 показаны абсолютные величины их преобразований Фурье (согласно формуле Рэлея, они говорят нам, «где находится энергия»). Эти схематичные рисунки следуют непосредственно из теоремы о гетеродине и информации о пере­ *

Двадцать шесть миль по волнам, И Санта­Каталина радуется нам. – Прим. перев.

314

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

даточных функциях фильтров. Как следует по рисунку, в  выход­ ном сигнале скремблера энергетический спектр входного сигнала инвертирован, т.  е. входная энергия на частоте v кГц (напомним, w = 2pv) в выходном сигнале присутствует на частоте (5 - v) кГц. Этого уже достаточно, чтобы сделать разговор непонятным слу­ чайному любителю подслушивать. |H1(n)|

–20

m(t)

0

20

x1(t)

|H2(n)|

n (кГц)

H1(n) (ФВЧ)

cos(2p´20´103t)

Генератор синусоидальных колебаний с частотой 20 кГц

–20

x2(t)

0

x3(t)

20

n (кГц)

H2(n) (ФНЧ)

y(t)

cos(2p´25´103t)

Генератор синусоидальных колебаний с частотой 25 кГц

Рис. 6.3.6. Речевой скремблер

Но, конечно, встает очевидный вопрос. Мы не хотим ставить в тупик всех вообще; как нас поймет человек на другом конце про­ вода? Ясно, что ему нужен дескремблер. Поскольку наш скремблер просто инвертирует энергетический спектр входного сигнала, то возникает забавная идея – а  не является ли скремблер своим собственным дескремблером (если инвертировать уже инверти­ рованное, то должно получиться то, с чего начинали)? И действи­ тельно, если взять скремблированный выходной спектр Y(v) на рис. 6.3.7 (сигнал, приходящий в наушник телефонной трубки на другом конце линии) и подать его на вход скремблера, то мы при­ дем к рис. 6.3.8, подтверждающему нашу догадку. Таким образом,

ТЕОРЕМА О МОДУЛЯцИИ, СИНХРОННыЕ РАДИОПРИЕМНИКИ

|M(n)|

–5

n (кГц)

0 5

|X1(n)|

–25 –20 –15

0

15 20 25

n (кГц)

20 25

n (кГц)

|X2(n)|

–25 –20

0

|X3(n)|

–50 –45

–5

0 5

45 50 n (кГц)

|Y(n)|

–5

0 5

Рис. 6.3.7. Скремблирование входного сигнала

n (кГц)

315

316

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

|M(n)|

–5

n (кГц)

0 5

|X1(n)|

–25 –20 –15

0

15 20 25

n (кГц)

20 25

n (кГц)

|X2(n)|

–25 –20

0

|X3(n)|

–50 –45

–5

0 5

45 50 n (кГц)

|Y(n)|

–5

0 5

Рис. 6.3.8. Дескремблирование входного сигнала

n (кГц)

ТЕОРЕМА ДИСКРЕТИЗАцИИ И УМНОЖЕНИЕ ПУТЕМ ДИСКРЕТИЗАцИИ

317

собеседник просто пользуется точно таким же скремблером, ко­ торый одновременно является дескремблером. Это делает схему, показанную на рис.  6.3.6, особенно привлекательной. Как вы ду­ маете, без теории Фурье смогли бы вы понять, как это устройство работает? Лично я сомневаюсь.

6.4. Теорема дискретизации и умножение путем дискретизации и фильтрации Ну что, вы подумали, как еще можно реализовать умножение, не умножая? Прежде чем рассказывать о хитроумном способе, кото­ рый применяется для генерации сигнала в AM­радиопередатчике, я выведу знаменитый результат (известный с 1930­х годов), кото­ рый называется теоремой дискретизации и обычно приписывается американскому инженеру­электрику Клоду Шеннону (1916–2001) и  советскому инженеру­электронику В. А. Котельникову (1908– 2005), хотя основную идею можно проследить до статьи француз­ ского математика Коши, написанной в 1841 году. На рис. 6.4.1 показана концептуально очень простая идея меха­ нической дискретизации функции m(t); мы видим вращающийся пе­ реключатель, который совершает полный оборот каждые T секунд, и на каждом обороте переключатель ненадолго соединяется с m(t). Если обозначить время контакта t, то можно будет записать дис­ кретизированную версию m(t), присутствующую на проводе справа от переключателя, в  виде ms(t)  = m(t)s(t), где s(t) также показана на рисунке (предполагается, что когда переключатель не соединен с m(t), имеет место равенство ms(t) = 0; это математическое пред­ положение легко удовлетворить в реальной электрической схеме, но вникать в инженерные детали у нас нет необходимости). Поскольку s(t) – периодическая функция, мы можем разложить ее в ряд Фурье. Тогда, обозначая ws = 2pvs = 2p/T так называемую частоту дискретизации, получаем

При желании мы могли бы вычислить коэффициенты ck, но, как вскоре станет ясно, для получения искомого результата в  этом нет необходимости. Однако обратите внимание, что на рис. 6.4.4

318

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

я изобразил функцию s(t) четной, а это означает, что все ck вещест­ венные; данный вывод нам в  дальнейшем не понадобится, но, быть может, он позволит легче «увидеть», что происходит. Главный вопрос звучит так: где в частотной области сосредоточена энергия ms(t)? m(t)

m(t)s(t)

s(t) 1 –T

0

T

t

t Рис. 6.4.1. Механический дискретизатор

Как обычно, для ответа на этот вопрос мы вычисляем преобра­ зование Фурье ms(t) « Ms(w):

В последнем интеграле мы узнаем M(w - kws), поэтому

Этот обманчиво простой результат говорит, что преобразова­ ние ms(t) – это просто преобразование m(t), повторенное бесконеч­ но влево и вправо по оси частот с интервалами, равными частоте дискретизации ws.

ТЕОРЕМА ДИСКРЕТИЗАцИИ И УМНОЖЕНИЕ ПУТЕМ ДИСКРЕТИЗАцИИ

319

Теперь предположим, что m(t) – первичный сигнал с ограничен­ ной полосой частот, т. е. |M(w)| = 0 при |w| > wm. На рис. 6.4.2 пока­ зано, как выглядит |Ms(w)| для такого сигнала, с дополнительным предположением, что сдвинутые по частоте копии M(w) не пере­ крываются. Очевидно, что так обстоит дело, когда wm< ws - wm, т. е. ws > 2wm. Если это условие не удовлетворяется (отметим, что время контакта t не играет никакой роли), то соседние копии M(w) бу­ дут перекрываться. Инженеры­электрики говорят, что имеет мес­ то алиасинг* дискретизированного сигнала, поскольку энергия на одной частоте смешивается с энергией на другой частоте, т. е. если рассматривать частоту как «имя» энергии на этой частоте, то в об­ ласти перекрытия энергия выступает под разными «именами» – имеет место совмещение имен. |M(w)|

–wm 0 wm

c–2 –2ws

c–1 –ws

|Ms(w)| c0

–wm 0 wm ws – wm

w

c1

c2 2ws

ws

w

ws + wm

Рис. 6.4.2. Где сосредоточена энергия m(t) и ms(t)

Особо отметим, что хотя ms(t) – дискретизированная по времени версия m(t), т. е. большую часть времени переключатель не «смот­ рит» на m(t), все равно ms(t) содержит всю информацию о  m(t). То есть полное знание ms(t) эквивалентно полному знанию m(t). Чтобы убедиться в этом, заметим, что, зная ms(t), мы можем пол­ ностью восстановить m(t), просто пропустив ms(t) через фильтр нижних частот, и тем самым выбрать копию преобразования M(w) *

От англ. alias – совмещение имен. – Прим. перев.

320

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

с центром в w = 0. Конечно, мы не можем это сделать, если произ­ водили дискретизацию недостаточно быстро, чтобы предотвра­ тить перекрытие соседних копий M(w). Этот результат и называ­ ется теоремой дискретизации – если сигнал m(t) с ограниченной полосой частот дискретизировать с  частотой, превышающей[11] удвоенную максимальную частоту, на которой еще имеется энер­ гия в сигнале m(t), то в процессе дискретизации информация не теряется. Этот математический результат у  большинства людей поначалу вызывает потрясение, поскольку противоречит интуи­ ции, но тем не менее это так – на бумаге и в реальных электрон­ ных системах. Но каким бы удивительным ни был этот результат, нужен нам не он. Нас больше интересуют две копии M(w) с центрами в точ­ ках w = ±ws. Если селектировать эти две копии с помощью поло­ сового фильтра и  если ассоциировать ws с тем, что в  нашем AM­ передатчике называется wc, то, как было показано в разделе 6.3, выходной сигнал полосового фильтра имеет энергию m(t)cos(wct) (масштабированную с  коэффициентом |c1|). Вот наконец­то мы и  перемножили m(t) и  cos(wct) действительно простым спосо­ бом – нужно лишь брать отсчеты m(t) с помощью механического переключателя, вращающегося с  частотой больше 500 кГц (пол­ миллиона оборотов в секунду), и пропустить результат через по­ лосовой фильтр. Да­да. Требуется построить нечто механическое, совершаю­ щее полмиллиона оборотов в  секунду! Главное  – не оказаться рядом с  этой штукой. На самом деле вместо простого для пони­ мания механического переключателя на рис.  6.4.1 в  реальных AM­передатчиках используется электрический переключатель, в котором нет подвижных деталей, – его можно сделать на осно­ ве высокочастотного трансформатора (чуть более сложный ана­ лог тех жужжащих черных цилиндров, которые можно видеть на мачтах энергосбытовых компаний, подающих ток частотой 60 Гц в жилые кварталы) и нескольких диодов (полупроводниковых или устаревших ламповых). Это схема, которую я в предыдущем разде­ ле назвал модулятором. Она, конечно, на такая дешевая, как песок под ногами, но и не особенно дорогая. Обсуждение схемной реа­ лизации модуляторов можно найти в  любой технической книге, посвященной радиосвязи[12].

ЕщЕ О ТРЮКАХ, ОСНОВАННыХ НА ПРЕОБРАЗОВАНИИ ФУРьЕ И ФИЛьТРАХ

321

6.5. Еще о трюках, основанных на преобразовании Фурье и фильтрах Хотя радиоприемники с синхронной демодуляцией относительно дороги, они все же используются. Почему? Потому что обладают техническими свойствами, которые в  некоторых случаях оправ­ дывают высокую цену. В этом коротком разделе я расскажу об од­ ном таком свойстве. Из обсуждения AM­радио в  разделе 6.3 вам, наверное, запомнилось, что первичные сигналы разных радио­ станций должны передаваться на разной несущей частоте w, что­ бы владелец приемника мог селектировать нужный ему сигнал и слушать его без помех. Именно так и обстоит дело в коммерче­ ском AM­радиовещании на практике. Но одна несущая частота вполне может «нести» более одного первичного сигнала. Многим кажется, что это противоречит фундаментальному принципу «как должно быть», но я докажу, что это можно сделать, приведя самое лучшее из всех возможных доказательств  – продемонстрировав реальные схемы (конечно, в виде блок­схемы) синхронного пере­ датчика и  приемника, которые проделывают этот удивительный фокус – сначала помещают два первичных сигнала на одну и ту же несущую, а затем разделяют их, не создавая помех. И нам не при­ дется писать ни одного уравнения – весь путь покажут диаграммы Фурье. Обозначим наши первичные сигналы и  их преобразования m1(t) « M1(w) и  m2(t) « M2(w). Чтобы вы не забывали о  том, что делают передатчик и  приемник, я  буду использовать стандарт­ ный треугольник для M1(w), а для M2(w) – другую фигуру, как по­ казано на рис. 6.5.1. Заметим, однако, что обе кривые – для M1(w) и для M2(w) – четные, поскольку m1(t) и m2(t) вещественные. В обо­ их случаях я пометил верхнюю и нижнюю боковые полосы частот преобразований; например, M1U – верхняя боковая полоса (w > 0) M1(w), а  M2L – нижняя боковая полоса (w < 0) M2(w). Тогда схема синхронного передатчика на рис. 6.5.2 генерирует сигнал y(t), в ко­ тором оба первичных сигнала помещены на одну и ту же несущую частоту wc. Вертикальный спад идеального ФНЧ (фильтра нижних частот) и идеального ФВЧ (фильтра верхних частот) находится на частоте w = wc.

322

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

|M1(w)| M1U

M1L

–wm

0

|M2(w)|

M2L

–wm

0

w

wm

M2U

wm

w

Рис. 6.5.1. Распределение энергии по частоте для двух разных первичных сигналов

В схеме передатчика я  указал все точки, где имеется энергия. Как легко видеть, |Y(w)|, хотя и  является интересным сплавом боковых полос m1(t) и  m2(t), тем не менее остается четной, как и должно быть, поскольку функция y(t) вещественная. И наконец, на рис.  6.5.3 показана схема радиоприемника с  синхронной де­ модуляцией, которая разделяет перемешанные сигналы. Входной сигнал слева – это масштабированный переданный сигнал y(t), по­ казанный на рис.  6.5.2. И  снова вертикальный спад всех идеаль­ ных фильтров в приемнике расположен в точке w = wc. Как и при анализе речевого скремблера в разделе 6.3, все эти рисунки сразу следуют из теоремы о гетеродине (никаких уравнений не нужно) и поведении идеальных фильтров.

6.6. Односторонние преобразования, аналитический сигнал и однополосная радиосвязь В этом последнем разделе последней главы книги я хочу показать, как с помощью рассуждений в духе Фурье можно объяснить одно особенно красивое приложение математики комплексных чисел в электронике. Когда выше мы обсуждали синхронное радио, вы,

323

ОДНОСТОРОННИЕ ПРЕОБРАЗОВАНИЯ, АНАЛИТИЧЕСКИЙ СИГНАЛ

без сомнения, заметили, что в некоторых местах схем была показа­ на только половина преобразованного сигнала (еще раз посмотри­ те на рис. 6.5.2 и 6.5.3). Это объясняется присутствием идеального фильтра верхних или нижних частот, вертикальный спад которого расположен как раз в  нужном месте, чтобы отфильтровать ниж­ нюю или верхнюю боковую полосу вещественного сигнала. В силу симметрии верхней и  нижней боковых полос вещественного сигнала отбрасывание одной боковой полосы не приводит к  по­ тере информации. А для отбрасывания боковых полос есть веская практическая причина. Если энергия первичного вещественного сигнала с  ограниченной полосой частот сосредоточена в  области положительных частот от нуля до wm (интервал шириной wm), то

–wс

m1(t)

0

w



–wс

0



w

ФНЧ +

cos(wс t) m2(t)

+

y(t)

å

ФBЧ

–wс

–wс

0



w

–wс

0

0





w

w

Рис. 6.5.2. Синхронный передатчик, посылающий два первичных сигнала на одной несущей частоте

324

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

0

–wс



w –2wс

–wс

0



0

2wс

w

w ФВЧ

m1(t)

ФНЧ

cos(wс t)

ФНЧ

0



w

0

w

m2(t)

ФНЧ

–2wс –wс

0

0

2wс

w

w

Рис. 6.5.3. Приемник с асинхронной демодуляцией, восстанавливающий два первичных сигнала на одной несущей без помех

после гетеродинирования до несущей частоты wc энергия сигнала будет сосредоточена в интервале от wc - wm до wc + wm (интервал шириной 2wm, т. е. в два раза шире основной полосы). Если, однако, мы передаем только одну боковую полосу, то вся энергия сигна­ ла оказывается снова сосредоточена в интервале (положительных частот) шириной wm. То есть передача только одной боковой по­ лосы экономит спектр частот – это основная особенность так на­ зываемой однополосной радиосвязи (ОПР). Понятно, что получить (т. е. обнаружить) ОПР­сигнал просто (по крайней мере, на бума­ ге): нужно умножить принятый сигнал на cos(wct), а затем приме­ нить фильтр нижних частот. (Конечно, тут возникают обычные для

ОДНОСТОРОННИЕ ПРЕОБРАЗОВАНИЯ, АНАЛИТИЧЕСКИЙ СИГНАЛ

325

синхронного приемника трудности – как сгенерировать на сторо­ не приемника почти точную копию сигнала cos(wct), используемого удаленным передатчиком.) Самый очевидный способ сгенерировать ОПР­сигнал – это, как уже было отмечено, применить к гетеродинированному первично­ му сигналу фильтр верхних частот (чтобы отфильтровать нижнюю боковую полосу) или фильтр нижних частот (чтобы отфильтровать верхнюю боковую полосу). Именно такой метод использовал аме­ риканский инженер Джон Р. Карсон (1887–1940) в начале XX века. Карсон, работавший в компании American Telephone and Telegraph Company, искал возможность одновременно передавать больше сообщений по медным кабелям AT&T (у которых полоса пропус­ кания гораздо уже, чем у  современных волоконно­оптических кабелей). Подумав о  симметрии преобразования вещественного сигнала и  осознав, что передача одновременно верхней и  ниж­ ней полос избыточна, он пришел к выводу, что достаточно пере­ давать только одну из них (любую). Карсон подал заявку на патент, в которой описывался подход к генерации ОПР­сигнала на основе фильтрации, в 1915 году (и получил патент в 1923 году), а в некро­ логе по случаю его смерти в  возрасте 54 лет в  газете «Нью­Йорк таймс» было особо отмечено это изобретение. Простая схема Карсона для генерации ОПР­сигнала посредством фильтрации одной боковой полосы быстро прижилась; к 1918 году она использовалась на телефонной линии, соединявшей Балтимор с Питтсбургом, а к 1927 году был введен в эксплуатацию коммер­ ческий радиоканал на основе ОПР, связывающий Нью­Йорк с Лон­ доном (с использованием электроники, которая могла гетероди­ нировать первичный сигнал с  шириной полосы 2.7 кГц в  любое место интервала от 41 кГц до 71 кГц; в этой системе передавалась только нижняя боковая полоса). Но при всей очевидности у этого метода все же были проблемы. Он прекрасно работает, если имеет­ ся фильтр верхних или нижних частот с вертикальным спадом на несущей частоте, что, разумеется, невозможно. Реальный фильтр либо допускает небольшое «просачивание» отфильтрованной бо­ ковой полосы, либо вынужден отфильтровывать часть нужной бо­ ковой полосы, чтобы полностью отфильтровать ненужную. Гораздо элегантнее грубой фильтрации была бы прямая генера­ ция ОПР­сигнала по заданному первичному сигналу ограничен­ ной ширины. И такой метод существует. Он называется методом сдвига фазы и был изобретен коллегой Карсона Ральфом В. Л. Харт­

326

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

ли (1888–1970). Получив физическое образование, Хартли за время своей долгой карьеры в Bell Telephone Laboratories (эта компания была создана AT&T в 1925 году как исследовательское подразде­ ление) внес большую лепту в электронику и теорию информации. Хартли подал заявку на патент в 1925 году (и получил его в 1928 го­ ду), его изобретение – красивое применение теории Фурье. Анализ генератора сигналов Хартли (я буду рассматривать верхнюю бо­ ковую полосу) мы начнем с того, что обозначим (как обычно) m(t) наш первичный сигнал с ограниченной шириной полосы и выпи­ шем пару преобразований Фурье m(t) « M(w), где M(w) = 0 при |w| > wm. Далее определим новую пару, которую я буду записывать в виде z+(t) « Z+(w), где Z+(w) = M(w)u(w), а u(w) – единичная ступенчатая функция в  частотной области. То есть Z+(w)  = 0 при w < 0, как показано на рис.  6.6.1a. Очевидно, что Z+(w) – не симметричное преобразование (оно называется односторонним), поэтому z+(t) не является вещественной функцией от времени. Но для нас это не проблема, потому что на самом деле мы не собираемся генериро­ вать z+(t) – эта задача все равно невыполнима, - z+(t) просто слу­ жит промежуточным математическим объектом в вычислениях. Теперь вспомним экзотическую пару преобразований Фурье, описанную в разделе 5.4:

Поскольку Z+(w) = M(w)u(w) – умножение в  частотной области, то, как мы знаем из раздела 5.3, z+(t) образована сверткой во вре­ менной области m(t) и функции от времени, парной к u(w), т. е.

или, воспользовавшись фильтрующим свойством импульса для вычисления первого интеграла, получаем

ОДНОСТОРОННИЕ ПРЕОБРАЗОВАНИЯ, АНАЛИТИЧЕСКИЙ СИГНАЛ

a)

327

Z+(w)

0 wm

–wc

b)

w

wc

Z+(w – wc)

0

c)

wc

wc + wm

w

Z–(w)

–wm

d)

0

w

Z–(w + wc)

–wc – wm –wc

e)

0

w

Z+(w – wc) + Z–(w + wc)

–wc – wm –wc

0

wc

wc + wm

w

Рис. 6.6.1. Построение сигнала с верхней боковой полосой, генерируемого ОПР­модулятором Хартли

Эта странная на вид комплексная функция времени называется аналитическим сигналом, название было предложено в  1946 году

328

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

инженером­электриком родом из Венгрии Деннисом Габором (1900–1979) (в 1971 году он получил Нобелевскую премию по фи­ зике за работы по голографии) для описания любой функции от времени с  односторонним преобразованием. Вернувшись к  раз­ делу 6.2, вы увидите, что второй интеграл (вместе с множителем 1/p) – это то, что мы назвали преобразованием Гильберта m(t); бу­ дем обозначать его (t). Таким образом,

Очевидно, что z+(t)  – сигнал в  основной полосе, достаточно взглянуть на Z+(w), – и мы можем сдвинуть его энергию по оси час­ тот в  w  = wc, умножив z+(t) на eiwct. Математически это выглядит так:

Этот сложный на вид комплексный сигнал во временной обла­ сти имеет несимметричное преобразование Фурье, показанное на рис. 6.6.1b. Чтобы получить вещественный сигнал, который можно сгене­ рировать физически (и передать в виде радиосигнала с помощью антенны), нам, конечно, необходимо симметричное преобразова­ ние. Для этого повторим всю проделанную выше работу, но на этот раз с отрицательными частотами. То есть напишем z-(t) « Z-(w), где Z-(w)  = M(w)u(-w), как показано на рис.  6.6.1c. Поскольку из раздела 5.4 нам известно, что

то имеем

ОДНОСТОРОННИЕ ПРЕОБРАЗОВАНИЯ, АНАЛИТИЧЕСКИЙ СИГНАЛ

329

Таким образом, если сдвинуть энергию z-(t) вниз по оси частот в точку w = -wc (см. рис. 6.6.1d), умножив z-(t) на e-iwct, то получим (проверьте самостоятельно)

Теперь понятно, зачем мы это сделали: если сложить преобра­ зования, показанные на рис. 6.6.1b и 6.6.1d, то получится симмет­ ричное ОПР­преобразование на рис.  6.6.1e. Симметрия означа­ ет, что это преобразование вещественной функции от времени, и действительно в выражении

мнимая часть равна нулю, и это подсказывает, как именно следу­ ет сконструировать ОПР­генератор Хартли, если мы умеем гене­ рировать сигнал (t). На рис. 6.6.2 показано, как реализовать это выражение (блок с  надписью «90°» представляет схему, которая сдвигает фазу сигнала cos(wсt), чтобы получить требуемый сигнал sin(wсt), – такую схему, работающую только на одной частоте wс, сконструировать легко). Блок с некаузальной импульсной характе­ ристикой h(t) = 1/pt – это, конечно, именно тот блок, который «из­ готавливает» (t), – его часто называют преобразователем Гильбер­ та – и, ясное дело, создать такой некаузальный блок невозможно. m(t) cos(wct)

h(t) = 1/pt

+ å

90°

+

ОПР­сигнал (верхняя боковая полоса)

sin(wct)

Рис. 6.6.2. Генератор ОПР­сигнала Хартли

330

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

Так что же, все это просто затянувшаяся шутка? Ведь раз мы не можем построить преобразователь Гильберта, значит, все сказан­ ное выше – математическая сказка. Конечно, вы понимаете, что ответ должен быть, иначе Хартли не получил бы патент. Если ко­ ротко, то ответ заключается в аппроксимации h(t), но тогда, естест­ венно, возникает следующий вопрос: как аппроксимировать неог­ раниченную и разрывную (при |t| ® 0) импульсную характеристику? Точный ответ, на мой взгляд, весьма неожиданный, и по мере его изложения вы поймете, почему метод Хартли называется «сдви­ гом фазы», или многофазным методом. Для любой вещественной функции от времени x(t) определим аналитическую функцию

Поскольку z(t) аналитическая, мы можем записать ее в виде

из которой, по теореме о  свертке во временной области, можно записать

Это не должно вызывать удивления: т. к. z(t) по построению ана­ литическая, мы знаем, что у нее должно быть одностороннее пре­ образование. Но заметим, что в силу определения z(t) можно также написать

где (t) « (w), т. е. (w) – преобразование Фурье от преобразова­ ния Гильберта x(t). Объединяя оба выражения для Z(w), получаем

откуда сразу следует, что

ОДНОСТОРОННИЕ ПРЕОБРАЗОВАНИЯ, АНАЛИТИЧЕСКИЙ СИГНАЛ

331

Передаточной функцией преобразователя Гильберта является H(w), где (w) = X(w)H(w), поэтому

Отсюда видно, что |H(w)| = 1 для -¥ < w < ¥, т. е. преобразова­ тель Гильберта не изменяет амплитуду входного сигнала при лю­ бой частоте (поэтому его часто называют универсальным* фильт­ ром), но изменяет его фазу. Действительно, все отрицательные частотные составляющие сдвигаются по фазе на +90° (поскольку передаточная функция равна +i для w < 0), а все положительные – на -90° (так как передаточная функция равна -i для w > 0). Ну и что? Чтобы понять физический смысл вышесказанного, возьмем ка­ кую­нибудь конкретную частотную составляющую x(t), назовем ее w0. Тогда с точностью до некоторого (несущественного) амплитуд­ ного коэффициента можно записать эту составляющую x(t) в виде cos(w0t  + q0)  = (ei(w0t  + q0)  + e-i(w0t  + q0))/2, где q0 – некоторая произ­ вольная фаза, которую я включил только для того, чтобы показать, что ее значение в конечном итоге не играет никакой роли. Теперь представим, что мы задерживаем эту составляющую во времени на одну четверть периода (схема временной задержки концептуально не сложнее куска провода, а задержка пропорциональна его дли­ не). Если период равен T и если cos(w0t + q0) – входной сигнал схемы задержки, то на ее выходе мы увидим сигнал cos[w0(t - T/4) + q0]. А поскольку w0T = 2p, то T/4 = p/2w0, так что выходной сигнал схе­ мы задержки равен

* В отечественной литературе чаще употребляется термин фазовый фильтр. – Прим. перев.

332

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

Поскольку e-ip/2 = -i и eip/2 = i, то, как видим, экспонента с по­ ложительной частотной составляющей умножается на -i, а  с  от­ рицательной – на +i. Стало быть, преобразование Фурье входного сигнала при w > 0 умножается на -i, а при w < 0 – на +i, поэтому наша простая схема задержки и является преобразователем Гиль­ берта. Вот так просто. Но если все так просто, то почему мы не можем построить преоб­ разователь Гильберта? Из­за чего такая примитивная вещь, как схе­ ма задержки на четверть периода, может оказаться некаузальной? Проблема в том, что эта схема должна реализовывать задержку не для одной частоты (как блок с надписью 90° на рис. 6.6.2), а для всех частот. Но, хотя построить такую схему для всех частот невозможно, мы теперь покажем, как ее аппроксимировать в частотной области (а это вовсе не очевидно, если взглянуть на неограниченную раз­ рывную импульсную характеристику преобразователя Гильберта во временной области). На самом деле нам нужен сдвиг фазы на 90° только в  конечном интервале частот, занятом нашим первич­ ным сигналом m(t) с  ограниченной шириной полосы, вся энергия которого сосредоточена в  интервале |w| £ 5wm. Такую схему мож­ но построить, более того, для этого нужно иметь лишь несколько общедоступных компонент (резисторов и конденсаторов), которые легко купить в любом магазине радиодеталей за сущие копейки[13]. Теперь я должен сообщить вам, что представленное выше ма­ тематическое изложение не имеет никакого отношения к  исто­ рической правде. Например, в  классической работе, описываю­ щей ОПР­радиоканал Нью­Йорк–Лондон, уровень математики не поднимается выше простых тригонометрических тождеств[14]. Да и по прошествии нескольких десятков лет ничего не изменилось; например, в  декабре 1956 года Институт радиоинженеров (IRE) посвятил целый выпуск своих трудов единственной теме ОПР­ радиосвязи, но в  нем нет ни одного упоминания аналитических сигналов. Я думаю, из этого факта можно сделать два вывода: (1) пионеры радио были очень умными людьми, не нуждавшимися в математике комплексных чисел для изобретения своих схем (но, безусловно, понять их работу с помощью комплексных чисел го­ раздо легче), и (2) даже инженерам с более аналитическим скла­ дом ума потребовалось очень много времени, чтобы оценить по­ лезность аналитических сигналов. У преобразования Гильберта есть одна «проблема»  – трудно «увидеть», что это преобразование делает с функцией от времени.

ОДНОСТОРОННИЕ ПРЕОБРАЗОВАНИЯ, АНАЛИТИЧЕСКИЙ СИГНАЛ

333

(Разрывность подынтегрального выражения отнюдь не помогает интуиции!) Например, очевидно ли вам, что преобразование Гиль­ берта переводит постоянную в ноль? Прямое вычисление любого конкретного преобразования Гильберта почти всегда оказывается упражнением на изобретательность; быть может, именно «ядо­ витые вычисления» так долго мешали радиоинженерам взять на вооружение аналитические сигналы. Но пакеты программ типа MATLAB, которые начали разрабатываться в  1980­х годах, вы­ качали весь яд из вычислений, и  современные инженеры таких трудностей не испытывают. Так, на рис. 6.6.3 показаны результа­ ты построенных с  помощью MATLAB преобразований Гильберта двух сигналов (самый обыкновенный импульс и не столь распро­ страненный двухпериодный синусоидальный пакет, возведенный в четвертую степень)[15].

Преобразование Гильберта сигнала

Сигнал во времени

3 2 1 0 –1 –1

0

1

2

3

2 1 0 –1 –2 –3 –2

Время (в секундах)

0

2

4

Время (в секундах)

2

Преобразование Гильберта сигнала

Сигнал во времени

1.0 0.5

1 0

0

–0.5

–1 –1

0

1

2

Время (в секундах)

3

–1.0 –2

0

2

4

Время (в секундах)

Рис. 6.6.3. Преобразования Гильберта, вычисленные компьютером

Отступление. На самом деле мы работаем с аналитическими сиг­ налами с самого начала этой книги. Ведь eiw0t – функция от времени,

334

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

энергия которой сосредоточена только в  положительной частоте w = w0, т. е. eiw0t – одностороннее преобразование. Поэтому, посколь­ ку eiw0t = cos(w0t) + i sin(w0t), функция sin(w0t) должна быть преобра­ зованием Гильберта cos(w0t). Ну, а что, по вашему мнению, является преобразованием Гильберта sin(w0t) (это не cos(w0t))? Сможете ли вы доказать, что (t) = -x(t), т. е. что повторное применение пре­ образования Гильберта дает исходную функцию с обратным знаком (и, следовательно, преобразованием Гильберта sin(w0t) является -cos(w0t))? Доказать это просто, если вспомнить про передаточ­ ную функцию преобразователя Гильберта[16]. На рис.  6.6.4 показан результат (вычисленный с помощью компьютера) взятия преобра­ зования Гильберта от преобразования Гильберта синусоидального пакета, изображенного на рис.  6.6.3; ну и  конечно, получился тот же пакет с обратным знаком, а небольшие отклонения объясняются накоплением ошибок округления после большого количества вычис­ лений, а также обрезанием промежутка времени для первого преоб­ разования Гильберта, поскольку для точного воспроизведения исход­ ной функции от времени (точнее, этой функции с обратным знаком) второе преобразование Гильберта должно было бы знать все первое преобразование – от минус до плюс бесконечности). Дважды примененное преобразование Гильберта (см. рис. 6.6.3)

0.4

0.2

0

–0.2

–0.4

–0.6

–0.8

–1.0 –2

–1

0

1

2

3

Время (в секундах) Рис. 6.6.4. Иллюстрация тождества

 = -x(t)

4

ОДНОСТОРОННИЕ ПРЕОБРАЗОВАНИЯ, АНАЛИТИЧЕСКИЙ СИГНАЛ

335

Но хотя в выпуске IRE Proceedings за 1956 год не было аналити­ ческих сигналов, в нем было кое­что другое: сообщение о новом, уже третьем способе генерации ОПР­сигналов, вообще не требу­ ющем аппроксимации некаузального преобразователя Гильбер­ та[17]. Его автором был Дональд К. Уивер мл. (1924–1998), тогда профессор факультета электротехники в колледже штата Монтана (ныне университет штата Монтана) в  Бозмене. Потрясающее от­ крытие Уивера (оно включено во все известные мне учебники по системам связи) доказывает, что никогда нельзя быть уверенным в том, что даже хорошо изученная тема полностью исчерпана. Ге­ нератор ОПР­сигналов Уивера (показан на рис. 6.6.5) в настоящее время является основной схемой модуляции, а для объяснения его работы достаточно просто проследить, «куда девается энергия», применив преобразования Фурье, простое умножение комплекс­ ных чисел и теорему о модуляции/гетеродине. ФНЧ

m(t)

cos(wct) +

cos(w0t) w0 = 1/2wm 90°

90°

sin(w0t)

+

å

ОПР­сигнал (верхняя боковая полоса)

sin(wct)

ФНЧ Рис. 6.6.5. Генератор ОПР­сигнала Уивера

На рис. 6.6.6a показана абсолютная величина уже привычного нам первичного сигнала с  ограниченной полосой m(t), которая, конечно же, симметрична, поскольку функция m(t) веществен­ ная. Как и  прежде, wm  – самая верхняя частота, на которой m(t) еще имеет энергию. Вы, наверное, сразу обратили внимание, что в схеме Уивера четыре гетеродина. Сначала энергия m(t) сдвига­ ется вверх и  вниз по оси частот дважды  – один раз на верхнем пути на рис. 6.6.5 посредством умножения на cos(w0t) и второй раз на нижнем пути посредством умножения на sin(w0t). (Инженеры­ электрики обычно называют эти пути каналами, при этом верхний канал называется синфазным, а нижний – квадратурным, но я буду

336

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

называть их просто верхним и нижним путями.) Частота w0 равна на жаргоне инженеров­электриков w0 называется частотой поднесущей звукового сопровождения. Чтобы понять оставшуюся часть рис. 6.6.6, важно помнить теорему о гетеродине. На верхнем пути схемы Уивера, когда мы первый раз умножаем на cos(1/2wmt), преобразование выхода этого умножителя  – я  буду обозначать F{x(t)} преобразование Фурье произвольной функции от времени x(t) – равно 1/ w : 2 m

или, иными словами, преобразование m(t) сдвигается вверх по оси частот на 1/2wm и умножается на 1/2 и сдвигается вниз по оси частот на 1/2wm и  умножается на 1/2. Почти, но не совсем так же обстоит дело на нижнем пути, где мы сначала умножаем на sin(1/2wmt). Пре­ образование выхода первого умножителя на этом пути равно

или, иными словами, преобразование m(t) сдвигается вверх по оси частот на 1/2wm и умножается на 1/2i и сдвигается вниз по оси частот на 1/2wm и умножается на -1/2i. Эти коэффициенты 1/2 при умножении на косинус и  ±1/2i при умножении на синус критически важны для понимания того, как работает схема Уивера. На рис.  6.6.6b показано преобразование основной полосы со сдвигом вверх и вниз на верхнем пути после первого умножения. Как легко заметить, обе боковые полосы m(t) теперь перекрыва­ ются. Согласен, это странно, но скоро вы поймете, к чему все идет. Рядом с  каждым сдвинутым преобразованием я  поставил «1/2», чтобы показать коэффициент умножения. На рис.  6.6.6с показан выход фильтра нижних частот (я предполагаю, что это идеаль­ ный фильтр с  вертикальным спадом на частотах w  = ±1/2wm)[18].

ОДНОСТОРОННИЕ ПРЕОБРАЗОВАНИЯ, АНАЛИТИЧЕСКИЙ СИГНАЛ

337

a)

–wm

b)

1/

2

w

wm 1/

2

Используем коэффициент 1/2 для сдвига косинуса вверх и вниз

–3/2wm –1/2wm 0 1/2 wm 3/2 wm

c)

d)

0

1/

1/

2

w

2

–1/2wm 0 1/2 wm 1/

4

1/

w 1/

4

1/ 4

4

w –wc

– 1/

2wm

–wc +

1/

0

2wm

–1/2i

e)

–1/2wm 1/ i 2

+ wс

1/

2 wm

–3/2wm –1/2wm 0 1/2 wm 3/2 wm –1/2i

f)

g)

1/

w

2i

–1/2wm 0 1/2 wm –1/4

1/

+ wс

Используем коэффициент 1/2i для сдвига синуса вверх и множитель -1/2i для сдвига вниз

w 1/

4

–1/4

4

w –wc – 1/2wm h)

–wc + 1/2wm

0 d) + g)

1/ 2

–1/2wm + wс

1/

2 wm + wс

1/ 2

w –wc

– 1/

2wm

–wc +

1/

2wm

0

–1/2wm

+ wс

Рис. 6.6.6. Как работает схема Уивера

1/

2 wm

+ wс

338

ГЛАВА 6. ОПРЕДЕЛЕННОСТь И –1

А  на рис.  6.6.6d показаны два сдвинутых вверх и  вниз преобра­ зования на верхнем пути после второго умножения (частота wc, разумеется, много больше wm; это частота, на которой происходит эффективное излучение энергии антенной). Здесь опять имеет место умножение на 1/2, поэтому на рис. 6.6.6d я поставил «1/4» ря­ дом с каждым сдвинутым преобразованием (поскольку, осмелюсь предположить, 1/2 · 1/2 = 1/4). Начиная с  рис. 6.6.6e весь процесс повторяется для нижнего пути, только после первого умножения мы имеем коэффициент 1/ i для сдвинутого вверх преобразования и  -1/ i для сдвинутого 2 2 вниз. На рис. 6.6.6f показан выходной сигнал фильтра нижних час­ тот на нижнем пути, а на рис. 6.6.6g – два сдвинутых вверх и вниз преобразования после второго умножения на нижнем пути. Во второй раз мы умножали сдвинутое вверх преобразование на 1/2i, а сдвинутое вниз – на -1/2i, что объясняет появление надписи «1/4» (-1/2i · -1/2i = -1/4, 1/2i · -1/2i = 1/4 и 1/2i · 1/2i = -1/4). Наконец, как показано на рис.  6.6.5, сигналы (т. е. преобразо­ вания) на верхнем и нижнем путях складываются (см. рис. 6.6.6d и  6.6.6g), в  результате чего получается рис.  6.6.6h  – преобразо­ вание выходного сигнала схемы Уивера. Части с  коэффициента­ ми  +1/4 и  -1/4 взаимно уничтожаются, а  с  коэффициентами  +1/4 и +1/4 складываются. В результате остается только верхняя боковая полоса исходного m(t); нижняя же боковая полоса сократилась. Какую операцию выполнять на практике – сложение или вычита­ ние, – выбирается буквально щелчком переключателя. Схема Уивера – одно из самых красивых известных мне приме­ нений комплексных чисел в  электротехнике, я  думаю, что и  сам Эйлер, занимавшийся как чистой, так и прикладной математикой, был бы ей доволен. Как я уже отмечал, открытие Уивером метода генерации ОПР­сигнала застало инженеров врасплох. Это напо­ минает мне чудесный пассаж из статьи, посвященной открытию Эйлером гамма­функции – обобщения факториала с неотрицатель­ ных чисел на все вещественные[19]: Георгий Гамов, выдающийся физик, цитируя Лапласа, писал, что когда расширяется известная территория предмета, расширяются и его границы. Очевидно, Лаплас представлял себе круг, расширяю­ щийся на всю бесконечную плоскость. Гамов говорит об этом в кон­ тексте физики и представляет круг, который в процессе расширения

ОДНОСТОРОННИЕ ПРЕОБРАЗОВАНИЯ, АНАЛИТИЧЕСКИЙ СИГНАЛ

339

покрывает сферическую поверхность. Когда круг расширяется, его граница сначала расширяется, а затем сужается. Автор этой работы согласен с Гамовым в том, что касается математики. Но в целом вы­ вод таков: каждое поколение находило что­то новое и интересное, относящееся к гамма­функции.

Вот и  я думаю, что, читая Эйлера, всегда можно наткнуться на что­то новое. И пожалуй, этим замечанием вполне можно закон­ чить книгу.

Эйлер – человек, математик и физик

Все совершается по предначертанию Бога: каждый человек в каждую минуту своей жизни поставлен в наилучшие усло­ вия. Счастлив тот, кто это понимает и умеет этим как следует пользоваться! – Леонард Эйлер, чья жизнь служит подтверждением его слов (из «Писем к немецкой принцессе», в трех томах, 1786–1772)*

Не иссякает поток биографий известных (а для пущего развлече­ ния публики лучше даже – скандально известных) представителей поп­культуры, но до сих пор нет ни одной подробной (в виде книги) биографии Эйлера, написанной на английском языке. Есть биогра­ фия на немецком (1929), на французском (1927) и еще две, сравни­ тельно недавние биографии на других языках (1948, 1982), но все они устарели в силу появления обширной литературы о наследии Эйлера, написанной уже после их выхода из печати. Сам Эйлер на­ писал так много, что для биографа стало бы колоссальным подви­ гом написать, с полным пониманием предмета, обо всем, что он сделал. Эйлер создал больше, чем любой другой математик в исто­ рии. При жизни было опубликовано более пятисот (!) его книг и статей (и еще больше после смерти), а его работы – треть всего, что было опубликовано в  Европе по математике, теоретической *

Эйлер Л. Письма к немецкой принцессе. СПб.: Наука, 2002.

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

341

физике и  инженерной механике с  1726 по 1800 год. Кроме того, существует еще один, столь же огромный массив сохранившихся личных писем (почти 3000 писем, написанных и  полученных от сотен разных адресатов), более тысячи страниц записных книжек и внушительные по объему дневники, которые он вел без переры­ вов, начиная с учебы в колледже и до самой смерти. Решительно настроенный биограф должен был бы все это прочесть. Тем не менее в  журналах встречается немало (в большинстве своем) прекрасных, по размеру сопоставимых с эссе биографиче­ ских очерков одного из величайших когда­либо живших матема­ тиков. Некоторые из них послужили мне источниками и образца­ ми. Но они во многом повторяются, и, чтобы не загромождать это эссе многочисленными ссылками, я просто перечислил основные источники в одном примечании[1]. В тех случаях, когда не цитиру­ ется какой­то конкретный автор, я не давал ссылок. Быть может, к  2107 году (четырехсотлетнему дню рождения Эйлера) наконец выйдет солидная биография Эйлера на английском языке, которую наши внуки смогут почитать, уютно устроившись прохладным ве­ черком в кресле перед камином. В жизни Эйлера можно выделить четыре этапа: рождение и юность, проведенная в Швейцарии, первое пребывание в России в Императорской Российской академии наук в Санкт­Петербурге, отъезд из России на 25 лет, в  течение которых он работал в  но­ вой академии наук Фридриха Великого в Берлине, и возвращение в  Санкт­Петербургскую Академию по приглашению Екатерины Великой, где он работал до самой смерти. О каждом этапе я рас­ скажу отдельно. Семья Эйлера в 1594 году поселилась в Базеле, немецкоговоря­ щем городе Швейцарии, население которого составляло примерно 15 000 человек. В основном его предки были ремесленниками, но отец Эйлера, Пауль (1670–1745), был дипломированным теоло­ гом (в 1693 году окончил теологический факультет Базельского университета) и  протестантским священником. Пауль отличался широтой интеллектуальных интересов; во время учебы в универ­ ситете он посещал лекции по математике, которые читал Якоб Бернулли (1655–1705) – один из основателей теории вероятностей. В его доме Пауль жил и подружился еще с одним обитателем дома, братом Якоба Иоганном Бернулли (1667–1748), которому спустя много лет суждено было сыграть важную роль в  жизни первого сына Пауля.

342

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

В двадцать три года Пауль окончил университет и  после не­ долгого служения в  сиротском приюте был назначен пастором в церкви рядом с университетом. Это приносило ему достаточный доход, и в апреле 1706 года он сочетался браком с Маргарет Бру­ кер, тоже дочерью священника. Спустя год, 15 апреля 1707 года, родился их первый ребенок, сын Леонард (Эйлер рос с двумя млад­ шими сестрами, но его единственный брат – Иоганн Генрих, кото­ рый, следуя семейной традиции, стал художником, – родился уже после того, как Эйлер в возрасте двенадцати лет, если не раньше, покинул отчий дом и приступил к своему первому формальному обучению). Через год после его рождения семья Эйлера переехала в деревню Рихен в нескольких километрах, где и прошло детство Эйлера. Жизнь семьи протекала не в  роскоши. В  новом доме пастора было всего две комнаты: кабинет и комната, в которой прожива­ ла вся семья. Но благодаря такой простой жизни в деревне вмес­ те с  любящими и  образованными родителями Эйлер не стал ни снобом, ни болваном. На всю жизнь он сохранил спокойное рас­ положение духа, уверенную практичность и  глубокую религиоз­ ность. Он находился под сильным влиянием родителей, и первое его образование было домашним. Мать наставляла его в  класси­ ческих предметах (Эйлер был, вероятно, одарен фотографической памятью и  мог наизусть процитировать 9500 стихов «Энеиды»!), а  отец преподавал основы математики. В  коротком неопублико­ ванном автобиографическом очерке, надиктованном старшему сыну в 1767 году, Эйлер вспоминал, что его самой первой книгой по математике – почти наверняка врученной отцом – было ста­ рое (1553 года) издание учебника по алгебре и арифметике, и он добросовестно решил все 434 включенные в него задачи. Но воз­ можности родителей были ограничены, поэтому, видя, что юный Эйлер рос необычно одаренным мальчиком, они решили, что ему необходимо более формальное образование. Его отправили обрат­ но в Базель, где он жил со своей овдовевшей бабушкой (со стороны матери), обучаясь в базельской латинской школе. По мысли Пауля, такое образование должно было направить сына по стопам отца и сделать из него теолога. Поступление в базельскую латинскую школу должно было стать потрясением для только что приехавшего из деревни юноши. Те­ лесные наказания практиковались там регулярно и  в  изобилии; никто бы не сказал, что на розгах экономили, и бывало, что нера­

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

343

дивого школяра избивали до крови. А если не наказывали учите­ ля, то это делали сами ученики, и кулачные бои в классах переме­ жались нападениями родителей на наставников! Любопытно, что единственный предмет, который, быть может, примирил бы Эйле­ ра с такой жестокостью, – математику – в школе не преподавали. Поэтому родители Эйлера сочли необходимым нанять частного учителя для сына, который каким­то образом ухитрился выбрать­ ся из латинской школы целым и невредимым. Осенью 1720 года, в  возрасте тринадцати лет, Эйлер поступил в Базельский университет. В то время столь юные студенты были не редкостью, да и заведение это нельзя было назвать местным эк­ вивалентом Принстона. В университете обучалась всего­то сотня студентов, а преподавательский состав насчитывал девятнадцать плохо оплачиваемых и  по большей части второсортных (но, как мы увидим, были и исключения) профессоров. Неудивительно, что Эйлер выделялся на общем фоне, и в июне 1722 года он с отличи­ ем окончил университет, написав диплом в похвалу умеренности. Затем, в июне 1724 года, в возрасте всего семнадцати лет, он полу­ чил степень магистра философии, защитив написанную на латыни диссертацию о сравнении философских взглядов Декарта и Нью­ тона. Вряд ли все это может считаться надлежащим образованием для человека, который уже скоро станет величайшим математи­ ком своего времени, но поворотное событие в интеллектуальном развитии Эйлера еще не наступило. За два года до рождения Эйлера скончался Якоб Бернулли, обучавший математике его отца. Его место профессора матема­ тики в  Базеле занял младший брат Иоганн, старый друг Пауля, с которым он вместе брал пансион в доме Якоба. (А младший сын Иоганна, Иоганн II [1710–1790], был другом Эйлера и вместе с ним получил степень магистра в 1724 году.) Пусть даже многие колле­ ги братьев Бернулли по Базельскому университету были посред­ ственностями, Якоб и Иоганн к таковым точно не относились. Оба были хорошо известными в  Европе математиками, и  хотя Эйлер никогда не встречался с Якобом, Иоганн оказал на него огромное влияние. Иоганн Бернулли мог бы работать в  куда более престижном месте, чем Базельский университет, который считался заштатным учебным заведением. На самом деле он отклонил несколько за­ манчивых предложений занять кафедру в  Голландии, поскольку так хотела семья его жены. Но из того, что он находился в Базеле,

344

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

не следовало, что он обязан был его любить. Он и не любил – из­ вестно, что он был скор на расправу со своими студентами, кото­ рым преподавал элементарную математику. Однако он предлагал частные уроки тем немногим, кто подавал надежды, и Эйлер стал членом этой группы избранных – тот факт, что Бернулли был зна­ ком с его отцом, конечно, не повредил – где­то в 1725 году, быть может, благодаря дружбе с  Иоганном II, а  через него и  со стар­ шими сыновьями Бернулли, Николаем (1695–1726) и  Даниилом (1700–1782), – Эйлер привлек внимание базельского профессора математики. В своей автобиографии 1767 года Эйлер вспоминал: Вскоре я  был представлен знаменитому профессору Иоганну Бер­ нулли… Конечно, он был очень занят и  наотрез отказался давать мне частные уроки, но он дал мне куда более ценный совет – читать трудные математические книги самостоятельно и изучать их со всем усердием. В случае каких­либо затруднений мне было разрешено по­ сещать его по субботам после обеда, и он любезно объяснял то, что я не мог понять… это, несомненно, лучший метод преуспеть в мате­ матических предметах.

Прежде чем подпасть под влияние Бернулли, Эйлер, послушный желанию отца, посвятил себя изучению теологии, иврита и  гре­ ческого языка, готовясь к жизни священника. Но когда Бернулли осознал, какие надежды подает его юный ученик, он все же убедил Пауля, что его сыну следует пойти по стопам Иоганна. Это многое говорит о любви Пауля к своему сыну и участии в его судьбе – ведь, несмотря на большое личное разочарование, он отошел в сторону, позволив сыну отдаться делу, которого он так жаждал. О все воз­ раставшем восхищении Бернулли расцветающим гением Эйлера можно судить по тому, как он обращался к своему бывшему уче­ нику в  письмах: с  1728 года и  до самой своей смерти Бернулли приветствовал его сначала «Весьма ученому и искусному юноше» (1728), затем последовательно – «Прославленному и ученому мужу» (1729), «Прославленному и самому проницательному из всех мате­ матиков» (1730), «Несравненному Л. Эйлеру, королю математиков» (1745). Иоганн Бернулли был далеко не чужд профессиональной конкуренции и даже зависти, распространявшейся в том числе на брата Якоба и его собственных сыновей[2], но, кажется, ни едино­ го раза он не поставил под сомнение превосходство Эйлера как математика. Было совершенно очевидно, что Эйлер был ученым совершенно другого класса (а ведь и  сам Бернулли принадлежал к мировой математической элите).

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

345

Достигнув возраста зрелости – девятнадцати лет (!), – Эйлер за­ вершил формальное образование и начал думать о начале акаде­ мической карьеры. Он надеялся остаться в Базеле рядом с семьей и, когда в сентябре 1726 года умер профессор физики, подал заявку на освободившееся место. Иоганн Бернулли был в восторге от пер­ спективы работать вместе с Эйлером и поощрял его в этом начи­ нании. В качестве приложения к заявке Эйлер подготовил то, что мы сейчас назвали бы докторской диссертацией. Называлась она «Dissertatio physica de sono» («Физическая диссертация о  звуке»). Этому короткому, всего шестнадцать страниц, труду было сужде­ но стать знаменитым, ученые цитировали его на протяжении ста лет. По существу, это была исследовательская работа по акустике, и  заканчивалась она обсуждением шести специализированных физических проблем, которые в то время были предметом горя­ чих споров. Например, одна из них, ставшая теперь классической и включенная практически во все учебники физики для младших курсов вузов, где изучают математический анализ,  – что будет с камнем, брошенным в прямую сквозную шахту, проходящую че­ рез центр Земли, если не учитывать сопротивление воздуха и дви­ жение Земли[3]? Попытка получить кафедру в Базеле провалилась – Эйлер прос­ то был слишком молод, – но открылась другая, куда более привле­ кательная возможность, опять­таки благодаря дружбе с Иоганном Бернулли (и с  его сыновьями Николаем и  Даниилом). Примерно тогда же, когда Эйлер подал заявку на место профессора, он по­ лучил предложение места в новой Императорской Академии наук в Санкт­Петербурге. Основанная Петром Великим в 1724 году, за год до смерти, Академия стала частью стараний Петра улучшить систему образования и  поощрить развитие западной научной мысли в крестьянской России. Российская Академия была создана по образцу научных академий в Берлине и Париже, а не по образ­ цу Лондонского королевского общества, которое, по мнению Пет­ ра, было слишком независимым. Российская Академия напрямую подчинялась государству. Но этот момент не волновал Эйлера, пока он не прибыл на место. После смерти Петра покровительни­ цей Академии стала его вдова императрица Екатерина I (не путать с Екатериной II, которую также называют Великой), разделявшая желание покойного улучшить образование в России. Приглашение Эйлера в  Россию стало возможным благодаря хитрости его базельского наставника Иоганна Бернулли, на ко­

346

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

торого сначала пал выбор Академии. Отклоняя приглашение, он порекомендовал вместо себя любого из двух своих старших сыно­ вей, которые – конечно же! – не могли расстаться друг с другом. Поэтому в  1725 году в  Россию отправились Николай (на кафедру математики) и Даниил (на кафедру физиологии), а Эйлер обзавел­ ся двумя друзьями «внутри» Санкт­Петербурга. Они пообещали своему юному другу, что при первой же возможности выдвинут его кандидатуру. Эта возможность представилась довольно скоро и  совершенно неожиданно, когда летом 1726 года Николай вне­ запно умер от аппендицита. Даниил занял кафедру математики, освободившуюся после смерти брата, а  Эйлера рекомендовал на вакантное место на кафедре физиологии. Так и  получилось, что осенью 1726 года Эйлер получил предложение приехать в Санкт­ Петербургскую Академию наук, но для изучения не математики, а физиологии! В ноябре Эйлер принял приглашение; для молодого человека оно было совсем неплохим: небольшая зарплата сочеталась с бес­ платным жильем, отоплением и  освещением, ну и  компенсаци­ ей дорожных расходов. Помимо Даниила Бернулли, коллегой по Санкт­Петербургу должен был стать швейцарский математик Якоб Герман (1678–1733), троюродный брат матери Эйлера. Эйлер по­ ставил единственное условие – отсрочить отъезд до весны 1727 го­ да. В  письме о  принятии предложения он указывает в  качестве причины задержки плохую погоду, но истинных причин было две. Во­первых, он, конечно, хотел остаться в Базеле, где окончательное решение о замещении вакансии на кафедре физики еще не было принято. А во­вторых, в предположении, что с этой работой ниче­ го не получится (как оно и случилось), Эйлеру нужно было время, чтобы подучить анатомию и физиологию и не приехать в Россию полным невеждой. Столько времени Эйлер потратил в юности на изучение «ненужных вещей»! Академический 1726–1727 год стал для Эйлера «пережидани­ ем», но, будучи Эйлером, он не просто надеялся, скрестив пальцы, на возможное место на кафедре физики в Базеле, изучая в это вре­ мя анатомию на случай, если придется ехать в Россию. В 1727 году он также написал и отправил на конкурс в Парижскую Академию наук работу по определению наилучшего размера и  места уста­ новки мачт на судах, где в качестве критерия «лучшего» выступало достижение максимальной толкающей силы ветра без опрокиды­ вания судна. Удивительно, что Эйлер, которому еще не исполни­

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

347

лось и двадцати, все­таки занял второе место, уступив лишь Пьеру Бугеру, профессору, который уверенно шел к признанию ведущим французским экспертом по морскому делу. На самом деле выдви­ нутая на конкурс задача специально была подобрана так, чтобы Бугер получил огромное преимущество перед конкурентами  – ведь он работал над ней в  течение многих лет. Наверное, Эйлер был раздосадован поражением – впоследствии он выигрывал кон­ курс Парижской Академии двенадцать раз, – но на самом деле по­ беда Бугера обернулась благом. Если бы Эйлер победил, то, возмож­ но, получил бы работу в Базеле и отказался от поездки в Россию, где в конечном итоге обрел возможность всецело посвятить себя академическим занятиям. В  апреле 1727­го, перешагнув двадца­ тилетний рубеж, Эйлер уехал в Россию и никогда больше не оста­ навливал свой взгляд на Базеле. После изнурительного, занявшего семь недель путешествия – на корабле, в повозке и пешком – Эйлер прибыл в Санкт­Петербург (тогдашнюю столицу России) в  конце мая – только чтобы узнать о  смерти Екатерины. Будущее Российской Академии внезапно оказалось под угрозой. Новый царь Петр II был двенадцатилетним мальчиком, а истинная власть в России принадлежала придворным. Родовая знать, которой нравилась прежняя крестьянская Россия, невежественная и покорная, терпеть не могла всех этих иностран­ цев  – немецких, швейцарских и  французских интеллектуалов, приглашенных в Академию, поэтому лишила Академию финансо­ вой поддержки. Академия оказалась на грани финансового краха, когда бояре вернули императорский двор в Москву и прихватили с  собой президента Академии, которому было поручено обучать юного царя. Многие академики впали в отчаяние и поскорее вер­ нулись домой. Но не Эйлер. Его занятия анатомией и второе место на парижском конкурсе по размещению мачт наконец­то окупи­ лись – они привлекли к нему внимание российского флота, и ему было предложено место военного врача. Хотя Академия шла ко дну, по крайней мере кораблю Эйлера удалось остаться на плаву, быть может, даже буквально! С медицинским назначением да еще «док­ торской» диссертацией о звуке в придачу мы с полным основани­ ем можем называть его «доктором» Эйлером! Неразбериха в Академии продолжалась до 1730 года, когда пос­ ле смерти Петра II на трон взошла императрица Анна Иоанновна, принеся с  собой некоторую стабилизацию политической обста­ новки. Дальний родственник Эйлера Якоб Герман подал в отставку

348

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

и вернулся домой в Швейцарию, но Даниил Бернулли заменил Гер­ мана в должности профессора математики в Академии. Спустя два года Анна вернула столицу в Санкт­Петербург. После этого жизнь Эйлера наладилась, и в возрасте 23 лет он стал профессором физи­ ки. Когда в 1733 году Бернулли ушел в отставку, чтобы занять мес­ то профессора в Базеле, Эйлер в результате выборов заменил его в роли главного математика Санкт­Петербургской Академии. Его личная жизнь тоже приняла счастливый оборот после брака с уро­ женкой Швейцарии Катариной Гзель (1707–1773), дочерью худож­ ника, преподававшего в школе при Академии. На свадьбу Эйлеру преподнесли шутливое стихотворение, которое, кстати, дает неко­ торое представление о том, как преданность Эйлера математике воспринималась окружающими: В том усомниться мог ли кто­то, Что Эйлер удивит весь мир, Что только цифры и расчёты Его единственный кумир? Теперь совсем в другом он мире, Где чувства, счастье и любовь. И то, что дважды два – четыре, Доказывать придётся вновь! Кумиром Эйлера были не только цифры и расчеты: первый из тринадцати детей Эйлера родился в конце следующего года. Счастливый в  браке, первый среди математиков Санкт­Петер­ бурга, Эйлер мог быть доволен жизнью. Президент Академии и ее секретарь, уроженец Пруссии Кристиан Гольдбах, были его близ­ кими друзьями, а  работа казалась надежной. И  пока он занимал­ ся только своей математикой, российские политические интриги обходили его стороной. Жизнь Эйлера наконец­то «устаканилась», и начался первый период его невероятно продуктивной карьеры. Например, в письме, датированном 1 декабря 1729 года, Гольдбах привлек внимание Эйлера к одной гипотезе Ферма (о том, что число n 22 является простым для всех неотрицательных целых n). К 1732 го­ ду (а может быть, и раньше) Эйлер показал, что эта гипотеза ложна, разложив на множители число, получающееся при n = 5. В тот же период, в 1729–1730 годы, Эйлер открыл, как обобщить факториал с неотрицательных целых чисел на все вещественные с помощью интегральной гамма­функции. Раньше выражение (-1/2)! не имело смысла, а благодаря Эйлеру мы знаем[4], что (-1/2)! = .

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

349

К 1735­му Эйлер разрешил проблему, которая ставила в тупик всех математиков – включая базельских профессоров математики Якоба и  Иоганна Бернулли – почти сто лет. Он вычислил точное 1/ns – сейчас мы называем ее дзета­функци­ значение z(s) = ей – не только для s = 2 (оригинальная постановка), но и для всех четных s. Это удивительное вычисление принесло Эйлеру извест­ ность во всей Европе, поскольку новость распространилась по все­ му математическому миру. Престарелый наставник Эйлера в  Ба­ зеле, Иоганн Бернулли, был так тронут, что помянул своего брата, который долго пытался, но так и  не смог сделать то, что сделал Эйлер, и умер, не увидев элегантного решения, до которого дожил Иоганн, словами: «ах, если бы мой брат был еще жив». В 1735 го­ ду Эйлер определил число, которое было названо самым важным 1/n - ln(n)}, в математическом анализе после p и e, – limn®¥{ постоянную Эйлера, или гамма, – и  вычислил ее значение с точ­ ностью до пятнадцати (!) десятичных знаков. В  век ручных вы­ числений это само по себе было впечатляющим достижением. Но в 1735­м были не только славные победы – он чуть не умер от лихорадки. Впрочем, выздоровев, он вскоре вернулся к обычному ритму работы; так, в 1737­м он обнаружил красивую связь между простыми числами и  дзета­функцией, которая позволила найти новое доказательство бесконечности множества простых чисел – первое со времен Евклида[5]. Также в  1730­е годы Эйлер начал свое фундаментальное ис­ следование теории экстремумов. В  «обыкновенном» исчислении бесконечно малых Ньютона и Лейбница мы учимся находить зна­ чения переменной x, доставляющие локальный минимум или мак­ симум заданной функции f(x). В  вариационном исчислении про­ исходит переход на следующий уровень сложности: какая функция f(x) доставляет локальный экстремум J{f(x)}, где J (так называемый функционал) является функцией от функции f(x)? Одним из первых, кто занимался такого вида вариационными задачами, был Иоганн Бернулли, который в 1696 году сформулировал знаменитую зада­ чу о  брахистохроне: какова форма проволоки (соединяющей две заданные точки в  вертикальной плоскости), по которой должна двигаться точечная масса под действием силы тяжести без тре­ ния, чтобы время спуска из самой высокой точки в самую низкую было минимально? Еще старше классическая изопериметрическая задача: какая замкнутая несамопересекающаяся кривая заданной

350

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

длины ограничивает максимальную площадь? Все «знали», что это окружность, но никто не мог это доказать! Эти две задачи[6] и дру­ гие, похожие на них, решались с помощью специальных методов, своих для каждой задачи. Общей теории не существовало. Пока этим не занялся Эйлер. В 1740­м он закончил первый вари­ ант книги «Метод нахождения кривых линий, обладающих свой­ ствами максимума либо минимума» (издана в  1744 году после отъезда из Санкт­Петербурга в Берлин). В ней впервые был сфор­ мулирован принцип наименьшего действия, о  котором я  еще ска­ жу несколько слов ниже. Одна фраза в  приложении к  этой книге открывает отношение Эйлера к религии и глубокую притягатель­ ность, которой обладали для него подобные задачи: «Так как зда­ ние всего мира совершенно и возведено премудрым Творцом, то в мире не происходит ничего, в чем не был бы виден смысл какого­ нибудь максимума или минимума». Но в  Санкт­Петербурге дело не исчерпывалось чистой мате­ матикой. В 1736 году выходит его двухтомная книга по механике («Механика, или Наука о движении в аналитическом изложении»), в которой активно использовались дифференциальные уравнения. Эта работа почти сразу была признана достойным преемником ньютоновского шедевра 1687 года «Математические начала нату­ ральной философии»; например, Иоганн Бернулли утверждал, что книга раскрыла «гений и проницательность» Эйлера. Впрочем, не все думали так же. Особенно стоит отметить английского специа­ листа по вооружению Бенджамина Робинса (1707–1751), который считал использование дифференциальных уравнений признани­ ем поражения (неумением поставить эксперимент) и  примером некритичного подчинения вычислениям. Удивительно странная позиция, на современный взгляд! Робинс вовсе не был глупцом – он изобрел баллистический маятник, который по сей день изуча­ ют студенты­первокурсники физических факультетов, – но даже в 1730­х годах приверженцы точки зрения Робинса составляли не­ значительное меньшинство. Эйлер и Робинс опять скрестили шпа­ ги через несколько лет по поводу написанного Робинсом текста, и на этот раз Робинс снова недооценил Эйлера и оказался в мень­ шинстве. В этом коротком эссе я даже отдаленно не могу воздать должное тому, что Эйлер совершил во время своего первого пребывания в  Санкт­Петербурге, и  мои комментарии затрагивают лишь слу­ чайную выборку его технических достижений, а  можно было бы

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

351

привести десятки других. Но я хочу также отметить, что он сослу­ жил важную практическую службу России своими астрономиче­ скими наблюдениями в  Санкт­Петербургской обсерватории. Эта работа сыграла немалую роль в становлении научной картографии в России, где до того она пребывала в жалком по тогдашним стан­ дартам состоянии. Именно в  тот период Эйлера снова настигла старая, почти убившая его когда­то лихорадка – он начал терять зрение в правом глазу. В 1740 году он писал Гольдбаху: «География фатальна для меня», – полагая, что причиной затруднений было напряжение глаз, необходимое для исправления карт суши. (В на­ стоящее время считается, что причиной абсцесса, скорее всего, была ранее перенесенная лихорадка.) К тому времени, когда было написано письмо Гольдбаху, Эйлер почти ослеп на правый глаз. Из­за развившейся позднее катаракты на левом глазу последние двенадцать лет жизни он был полностью слепым. В Санкт­Петербурге Эйлер работал также над практическими инженерными задачами, в т. ч. проектированием военных кораб­ лей и их ходкостью, снова используя дифференциальные уравне­ ния для изучения движения тел в жидкости. Все эти работы он свел воедино в книге «Морская наука», почти законченной в 1738 году, когда еще жил в  Санкт­Петербурге, но опубликованной только в 1749 году, когда он уже находился в Берлине. В том же году путь Эйлера пересекся, фигурально выражаясь, с путем человека, с которым он будет находиться в крайне непри­ язненных отношениях через несколько лет. Этот эпизод стал обме­ ном колкостями, а в роли «другой стороны» выступал Вольтер, одна из самых значимых фигур в литературе того времени и такой же мастер анонимных писем, каким Эйлер был в математике. Воль­ тер – псевдоним, взятый в 1719 году французским поэтом и писа­ телем Франсуа­Мари Аруэ (1694–1778), который во время ссылки в  Лондон с  1726 по 1729 год (замена тюремному заключению за обмен оскорблениями с  человеком, занимавшим в  обществе бо­ лее высокое положение, чем Вольтер) увлекся теориями Ньютона. Вольтер присутствовал на похоронах Ньютона в  1727  году, всю оставшуюся жизнь вспоминал об этом потрясшем его событии и  энергично взялся за написание книги, которая стала знамени­ той популяризацией философии Ньютона (Élements de la philoso­ phie de Newton) и вышла в 1738 году. В то время конфликт между физикой Ньютона и  метафизикой Лейбница был горячей темой, и Вольтер в своих «Элементах» возносил хвалы Ньютону, а позже

352

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

(в 1759 году) в  знаменитой сатире «Кандид» создал пародию на Лейбница (которого вывел под именем доктора Панглосса). «Кан­ дид» – это атака на высказанную Лейбницем точку зрения, что мы живем в «лучшем из миров» и что все в этом мире «к лучшему»: высказывание Эйлера, сделанное эпиграфом к этому эссе, вызвало бы у Вольтера глубочайшее презрение. Но в  чуть было не произошедшем в  1738 году столкновении с  Эйлером полем боя была наука, а  не литература. Несмотря на изящество прозы «Элементов», очевидно, что у Вольтера не было глубокого понимания математических и научных идей Ньютона. По словам одного писателя, «Элементы» раскрыли математику Ньютона другим, но только не самому автору[7]. В аналитических рассуждениях Вольтер, какой бы великой ни была его проза, не мог тягаться с  Эйлером. Несостоявшееся столкновение с  Эйле­ ром стало результатом конкурса на премию Парижской акаде­ мии наук, объявленного в 1736 году с предполагаемым вручением в 1738 году. Перед участниками была поставлена задача обсудить природу огня. В то время еще не было понятия «химическая ре­ акция», и  философы по­прежнему толковали об аристотелевских элементах: воздухе, земле, воде и огне, – считая их фундаменталь­ ными сущностями. Это тоже была, скажу без всякой иронии, го­ рячая тема. По­видимому, очаровавшись наукой, Вольтер решил, что может и  сам заниматься наукой, хотя не получил никакого формального образования. Но скромность не относилась к досто­ инствам Вольтера. Работа Эйлера поделила первое место с другой, но и  Вольтер удостоился уважительного упоминания, так же как и его любовница Эмили дю Шатле (1706–1749), которая, по общему мнению, разбиралась в науке и математике куда лучше Вольтера. Например, она подготовила первый французский перевод «Начал» Ньютона, который был опубликован после ее смерти. Роман Эмили и Вольтера начался в 1733 году и продолжался до ее преждевременной смерти после рождения ребенка (отцом ко­ торого не был ни Вольтер, ни ее муж). Эмили была умной женщи­ ной, пользовавшейся услугами частных учителей по математике и физике. Это важно для нашей истории об Эйлере, потому что од­ ним из ее наставников (и еще одним любовником) был француз­ ский математик и  астроном Пьер Луи де Мопертюи (1698–1759), который в 1736 году возглавил экспедицию для измерения формы Земли, а в 1738 году издал книгу «La figure de la terre», поддержав мнение о том, что наша планета сплющена у полюсов, благодаря

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

353

чему приобрел известность как «сплющиватель Земли». Другим наставником был Иоганн Самуэль Кёниг (1712–1757), который также три года учился в Базеле у старого учителя Эйлера Иоганна Бернулли. Беря уроки у Кёнига, дю Шатле написала книгу «Institu­ tions de physique» (изданную в 1740 году), в которой рассматривала философские идеи Декарта, Ньютона и Лейбница, а также природу пространства, материи, силы и  свободы воли. Кёниг и  дю Шатле переругались из­за этой книги, которую Кёниг считал простым пе­ ресказом того, чему ее учил. В частных беседах с другими людьми он, по существу, обвинил ее в краже своей интеллектуальной соб­ ственности. Спустя десять лет Кёниг предъявил аналогичное обви­ нение Мопертюи, в результате чего Вольтер, Мопертюи и Кёниг за­ теяли ссору, которую называли одной из самых позорных страниц в истории науки. Эйлер тоже оказался втянутым в нее, и ни один из четырех не смог выйти сухим из воды. События, которые в конечном итоге привели к конфликту, на­ чали разворачиваться в середине 1740 года, когда новый прусский монарх Фридрих II (Великий) попытался переманить Эйлера из Санкт­Петербурга к себе – в обретшую новую жизнь Берлинскую академию наук[8]. Фридрих не знал и не ценил математику, но же­ лал иметь Эйлера в кругу своих приближенных, так как знал, что другие считают его гением. Эйлер был просто ценным призом, который следовало приобрести для украшения двора (нельзя ска­ зать, что о  таком способе комплектования профессорско­препо­ давательского состава в наши дни не слыхивали). Да и вообще, вся Академия, по крайней мере на первых порах, затевалась как по­ казуха: в письме Вольтеру, датированному июлем 1737 года, Фрид­ рих писал, что «король должен содержать Академию наук, как по­ мещик – свору собак». Поначалу Эйлер отклонил предложение из Берлина, но спустя несколько месяцев императрица Анна умерла, оставив наслед­ ником младенца, что ввергло Россию в  очередную политиче­ скую смуту и привело к тому, что на всех «иностранцев» в Санкт­ Петербургской Академии снова стали поглядывать с враждебным подозрением. Тогда Эйлер (по настоянию жены) вернулся к при­ глашению короля. Он сообщил Фридриху, на каких условиях готов перебраться в  Берлин, и  в  феврале 1741 года сделка состоялась. Официально Эйлер подал в отставку по состоянию здоровья – он заявил, что нуждается в  более умеренном климате и  к  тому же опасается за свое зрение. Академия сделала вид, что удовлетво­

354

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

рилась этой причиной, и Эйлер покинул Россию по­дружески (что впоследствии сыграло ему на руку). Настоящая же причина от­ крылась вскоре после прибытия в Берлин в конце июля 1741 года, когда мать Фридриха, озадаченная тем, почему Эйлер не хочет от­ вечать на любые вопросы подробно, наконец напрямую спросила его о причине такой сдержанности, даже робости в словах. Эйлер ответил так же прямо: «Мадам, это потому, что я только что при­ был из страны, где излишне разговорчивых вешают». Когда Эйлер прибыл в  Берлин, новая академия Фридриха еще только формировалась – даже президент еще не был назначен. За год до того Фридрих предложил эту должность другому человеку, но тот отказался. Поэтому Эйлер, по крайней мере по собственному разумению, был кандидатом на пост, но таковым был и Мопертюи, которого также пригласил (по рекомендации Вольтера) в  Берлин франкофил Фридрих. И лишь спустя много лет, пережив много ра­ зочарований, Эйлер понял, что такой светский сноб, как Фридрих, никогда не согласился бы, чтобы простой швейцарский бюргер стал во главе академии, каким бы блестящим мыслителем он ни был и каких бы успехов ни добился. Всюду, где возможно, – а это значит, когда не требовалось особой компетентности, – Фридрих ставил на должности в  правительстве и  в  армии дворян и  никог­ да людей простого звания, сколько угодно талантливых. В  глазах короля Эйлеру не делало чести и то, что он не умел поддерживать остроумную беседу и  не писал стихов на французском. (Фридрих был так одержим французской культурой, что в 1744 году приказал, чтобы все ученые записки Берлинской академии публиковались на французском, а не на привычной латыни и даже не на немецком.) Да и сам факт, что Эйлер был математиком, играл против него. Фридрих, еще будучи крон­принцем (в январе 1738 года), писал Вольтеру – с которым переписывался уже два года – о своем плане развития академии: «снова поднять на должный уровень фило­ софию, историю, поэзию, музыку. Что до математики, признаюсь вам, что я ее недолюбливаю; она сушит разум». Со временем взгля­ ды короля не изменились. Спустя много лет (в январе 1770 года) он писал Жану ДʼАламберу – французскому математику, которого Фридрих хотел видеть во главе Берлинской академии: «Алгебра­ ист, запершись в  своем кабинете, не видит ничего, кроме цифр и пропозиций, которые не оказывают никакого действия на нрав­ ственный мир. Улучшение нравов гораздо полезнее для общества, чем все вычисления Ньютона».

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

355

Вот таким был человек, перед которым наивный Эйлер склонил голову. О своем берлинском назначении он писал другу: «Я могу заниматься всем, чем хочу [о своих технических исследовани­ ях]… Король называет меня профессором, и я считаю себя счаст­ ливейшим человеком в мире». Впоследствии Эйлер изменил свое мнение. Все пошло не так, как планировалось, когда почти одно­ временно с прибытием Эйлера в Берлин Фридрих отправился на войну с вторгнувшейся в его земли Австрией. Его мысли были за­ няты не академией и не возможной ролью Эйлера в ней. Вопрос о президенте так и оставался подвисшим в течение пяти лет! Пе­ реписка короля с Мопертюи показывает, что кандидатура Эйлера вообще никогда не рассматривалась; больше чем за год до приезда Эйлера в письме, датированном июнем 1740 года, Фридрих писал французу: «…желаю видеть Вас здесь, Вы сможете привести нашу академию в форму, которую только Вы способны придать ей. Так приезжайте же, приезжайте и  привейте этому дичку ветвь нау­ ки, чтобы он начал плодоносить. Вы показали человечеству фор­ му Земли; теперь покажите Королю, как сладостно иметь в  сво­ ем распоряжении человека, подобного Вам (курсив мой)». Когда Мопертюи наконец принял предложение в 1746 году, он оказался, по словам самого Фридриха, «папой Академии». Эйлер в качестве утешительного приза получил должность первого заместителя Мопертюи и директора математического отделения академии. Берлинские годы Эйлера стали временем ошеломительных успехов. Список его достижений поистине огромен (он подгото­ вил 380 работ, из которых 275 были опубликованы!). Назову лишь несколько: анализ поддерживаемых правительством лотерей, пособий и пенсий – это легло в основу трудов Эйлера по теории вероятностей; перевод с  английского на немецкий вышедшей в  1742  году книги вышеупомянутого Бенджамина Робинса «Но­ вые принципы стрельбы»  – работы, представлявшей огромный интерес для короля­воина Фридриха (Робинс был ужасно недо­ волен Эйлером, поскольку тот включил в  перевод дополнитель­ ные материалы, в  пять раз превышающие объем оригинальной работы!); книга «Введение в анализ бесконечно малых» (в которой он четко формулирует то, что я в этой книге называю «формулой Эйлера») – текст, который один выдающийся историк[9] матема­ тики поставил в  один ряд с  «Началами» Евклида; исследования по технологии изготовления оптических линз, зубчатых передач и гидравлических турбин; и наконец (только в этом перечне) мно­

356

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

гочисленные работы по дифференциальной геометрии, гидроди­ намике и движении Луны и планет. На берлинский период жиз­ ни Эйлера пришелся расцвет его выдающихся интеллектуальных и физических дарований. Хотя в желанном президентстве Эйлеру было отказано, он тем не менее обладал широкими административными правами и обязан­ ностями в академии. Он исполнял функции президента во время отлучек Мопертюи, комплектовал кадры академии, осуществлял надзор над обсерваторией и  ботаническими садами и  контроли­ ровал многочисленные финансовые вопросы (самым важным из которых была публикация календарей, карт и  альманахов, про­ дажа которых составляла весь доход академии). И в связи с этим Эйлер довольно рано узнал, что хотя в математике Фридрих был пустым местом, деньги считать он умел. В  январе 1743­го Эйлер написал королю, что сборы можно поднять, распространив про­ дажи альманахов на территорию только что покоренной Австрии. Фридрих ответил так: «Я полагаю, что, привыкнув работать с аб­ страктными величинами в алгебре, Вы погрешаете против обык­ новенных правил счета. Иначе Вы никогда не вообразили бы, что такой огромный доход можно получить от продажи альманахов». Спустя двадцать лет вопрос о доходе от альманахов вбил послед­ ний клин между Эйлером и королем. Личное мнение Фридриха об Эйлере, представление о  кото­ ром дает приведенный выше ответ, более открыто выражено в  переписке с  другими корреспондентами. Например, в  октябре 1746  года в  письме к  брату король назвал Эйлера необходимым членом академии благодаря его выдающимся способностям, но отметил, что такие люди, как Эйлер, на самом деле не более, чем «дорические колонны в  архитектуре. Это лишь основание, под­ держивающее всю конструкцию». То есть годятся, чтобы держать крышу, но не более того. Качество, которым обладали Вольтер и  Мопертюи, которое полностью отсутствовало у  Эйлера и  ко­ торое Фридрих ценил больше всего,  – это умение вести легкую, остроумную беседу и переписку (часто не чурающуюся злословия). Неумение Эйлера сочинить менуэт или цветистую поэму в глазах короля было фатальным недостатком. Несмотря на все это, жизнь Эйлера при дворе Фридриха кажется полной, как и его все возрас­ тавшее финансовое благополучие. Так, с 1750 года его овдовевшая мать живет вместе с ним, а в 1753­м у него хватило средств купить имение на окраине Берлина, в котором она вела хозяйство.

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

357

Но затем, в 1751 году, мы видим начало конца надеждам Эйлера на пожизненную карьеру в Берлине. Несколькими годами раньше, только­только став президентом академии, Мопертюи провозгла­ сил то, что он назвал новым научным принципом, а именно прин­ цип наименьшего действия[10]. Тот факт, что Эйлер сформулировал, по существу, те же идеи в  1744 году, казалось, ускользнул от его внимания, и Мопертюи включил принцип наименьшего действия в свою книгу «Essai de cosmologie». В ней он писал: «И вот он, этот принцип, столь мудрый, столь достойный Всевышнего: всякий раз, как в Природе происходит какое­либо изменение, количество действия [термин, определенный Мопертюи очень расплывчато], затраченного на это изменение, является наименьшим из возмож­ ных». Несмотря на то что Мопертюи сначала предъявил притяза­ ния на место президента, которое так желал получить Эйлер, а за­ тем на техническую идею, которую Эйлер математически отточил задолго до преимущественно теологического обоснования, данно­ го Мопертюи, и которую по праву считал своей, Эйлер по­прежнему поддерживал Мопертюи. А потом явился Самуэль Кёниг[11]. Кёниг, который с 1749 года был библиотекарем при император­ ском дворе в  Гааге, был выдвинут Мопертюи на выборах в  Бер­ линскую академию, состоявшихся в 1749 году. Тем не менее впо­ следствии Кёниг обвинил Мопертюи в  том, что тот украл идею принципа наименьшего действия из письма, написанного Лейбни­ цем в октябре 1707 года швейцарскому математику Якобу Герма­ ну (дальнему родственнику Эйлера, находившемуся вместе с ним в Санкт­Петербурге с 1727 по 1730 год), копию которого Кёниг яко­ бы видел. Обвинение президента Берлинской академии в плагиа­ те было серьезным делом, и, естественно, Кёнига попросили пред­ ставить доказательства. Кёниг не смог предъявить копию, а среди сохранившихся писем Лейбница к  Герману не нашлось оригина­ ла. Специально сформированному академическому комитету под предводительством Эйлера было поручено разобраться, и он при­ шел к выводу, что мошенником был Кёниг. (Современные истори­ ки в большинстве своем сходятся в том, что Кёниг был прав и что такое письмо Лейбница существовало, но оно не найдено и по сей день.) Но это еще не конец истории. Вольтер, который еще раньше цапался с Мопертюи сначала из­за склоки с заполнением вакан­ сии в академии, а затем из­за отказа Мопертюи засвидетельство­ вать ложное алиби, чтобы помочь Вольтеру избежать ответствен­ ности за махинации с ценными бумагами (!), решил, что настал час

358

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

поквитаться с бывшим другом. Он заявил, что Мопертюи раньше побывал в доме умалишенных и, по его мнению, до сих пор болен! Быть может, предположил Вольтер, Кёниг и не мошенник вовсе. Когда Фридрих открыто стал на сторону Мопертюи, Вольтер был уязвлен отпором короля и решил отплатить. «У меня нет скипет­ ра, – писал он. – Но у меня есть перо». Результатом стал памфлет «Диатриба доктора Акакия», в котором едва завуалированный Мо­ пертюи выставлен откровенным идиотом: в конце концов он был «сведен» к  принципу наименьшего действия, т.  е. смерти, пулей, энергия которой была пропорциональна квадрату скорости! Диа­ триба сделала Мопертюи посмешищем всей Европы, и он не смог снести насмешек. В 1753 году Мопертюи уехал во Францию и лишь на следующий год по просьбе Фридриха вернулся, поскольку за время его отсутствия в академии воцарился хаос. Но в 1756 году уехал снова, и уже навсегда. Однако и Эйлеру, поддержавшему Мо­ пертюи, этот эпизод не принес ничего хорошего. В продолжение Диатрибы Вольтер вставил ехидное замечание по поводу Эйлера, назвав его по имени. В одном месте Мопертюи и Кёниг подписы­ вают воображаемый мирный договор, в котором имеется следую­ щий пассаж: Наш генерал­лейтенант Л. Эйлер настоящим через нас открыто заяв­ ляет I., что он никогда не изучал философию, и искренне раскаивает­ ся в том, что по нашей вине ошибочно пришел к заключению, что ее можно понять, не изучая, и что в будущем он будет довольствоваться славой математика, заполнившего вычислениями больше листов бу­ маги, чем кто­либо другой.

Хотя говорят, что король до слез хохотал, читая жестокую шутку Вольтера (и тем показал, что ценит сатирическое остроумие больше, чем дружбу), тем не менее книга Вольтера нанесла публичное оскор­ бление главе академии Фридриха. Король приказал спалить все эк­ земпляры Диатрибы на костре, и Вольтер тоже счел необходимым срочно вернуться во Францию. Как и Мопертюи, он больше никогда не приезжал в Берлин. Убийца разделил участь со своей жертвой. К отчаянию Эйлера, после падения Мопертюи король так и  не обратил взоры на Эйлера как на следующего президента акаде­ мии, хотя это было бы логично. Фридрих, очевидно, предпочитал опозоренного француза одноглазому швейцарскому математику, хотя именно Эйлер удерживал королевскую академию от полного распада. Просто не было духовной связи между королем и  полу­ слепым человеком, которого он в  насмешку (за спиной Эйлера)

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

359

называл «ограниченным циклопом». И снова академия несколько лет жила без президента, а Эйлер де­факто пребывал в этой роли. Затем, в 1763 году, Фридрих предложил пост президента француз­ скому математику Жану ДʼАламберу, который отказался от этой чести. Как будто предложение данной должности другому челове­ ку было еще недостаточным оскорблением Эйлера, через год после отказа ДʼАламбера приехать в Берлин король назначил президен­ том самого себя! Вероятно, обида, нанесенная Эйлеру, была очень велика. Но все же он оставался в Берлине еще два года. А оконча­ тельное решение уехать стало следствием еще одного оскорбления со стороны Фридриха. В конце 1763 года король полагал, что доход, который приносила академии продажа альманахов, можно увеличить, изменив адми­ нистративное устройство академии. Это означало, что Эйлер не будет стоять во главе, а получит лишь один голос в комитете. Эйлер написал письмо в знак протеста, на которое король ответил резко и нелюбезно. Фридрих стоял на своем – Эйлер был недвусмыслен­ но «понижен». Эйлер был сыт таким обращением по горло и начал искать выход. Далеко ходить не пришлось. Его путь из Берлина был проложен много лет назад. В начале июля 1763 года Эйлер получил письмо от Григория Теплова, асессора Академической канцелярии, с предложением занять пост директора математического отделе­ ния Санкт­Петербургской Академии, а также устроить всех его сы­ новей. Эйлер быстро написал в ответ: Я бесконечно признателен за щедрые предложения, переданные Вами по распоряжению Ее Императорского Величества, и был бы счастлив, если бы мог принять их немедленно… Если бы … г­н ДʼАламбер или другой француз принял пост президента [Берлинской] академии, то ничто не остановило бы меня от немедленной подачи прошения об отставке, и мне не смогли бы отказать ни под каким предлогом. По­ нятно, что все осудили бы меня за подчинение такому президенту… Однако г­н ДʼАламбер не только отказался от этого предложения, но и  совершил ошибку, горячо рекомендовав[12] меня королю, и  если бы я пожелал подать прошение сейчас, то встретил бы самый реши­ тельный отказ. Это поставило бы меня в весьма трудное положение, в котором мне было бы едва ли возможно предпринять дальнейшие шаги (курсив мой).

Слова Эйлера, похоже, указывают на то, что, сочиняя это пись­ мо, он все еще полагал, что имеет шанс стать президентом ака­ демии. Но к  1766 году эти надежды окончательно испарились,

360

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

и  Эйлер вернулся к  предложению из Санкт­Петербурга. Выказав себя упорным переговорщиком, он получил все, что просил, вклю­ чая, наконец­то, должность директора Санкт­Петербургской ака­ демии. Чтобы получить разрешение на отъезд из Берлина, понадо­ билось четыре письменных прошения Фридриху, но в мае 1766­го король все же смилостивился и отпустил Эйлера, а в июне Эйлер со всей семьей отправился в Россию. Об их безрадостном расста­ вании король в  конце июля писал ДʼАламберу: «Г­н Эйлер, кото­ рый чуть ли не до безумия любит Большую и  Малую Медведицу, отправился на север, чтобы понаблюдать их родичей на свободе». В качестве замены Эйлеру в должности директора математическо­ го отделения Берлинской академии ДʼАламбер рекомендовал ро­ дившегося в Италии француза Жозефа Лагранжа (1736–1813), и тот принял предложение. В июльском письме ДʼАламберу король по­ благодарил его за помощь в подыскании замены Эйлеру и заодно допустил последний оскорбительный выпад (который почему­то считал смешным) в  адрес Эйлера, написав: «Я Ваш должник, по­ скольку благодаря Вашему попечению и  рекомендации заменил полуслепого математика математиком с обоими глазами, что осо­ бенно порадует членов анатомического отделения моей акаде­ мии». Вот таким остроумцем был Фридрих. Последний период жизни Эйлера – семнадцать лет, проведен­ ных в Санкт­Петербурге, – был полной противоположностью бер­ линскому периоду. В  Санкт­Петербурге он был знаменитостью, и больше всех им восхищалась сама императрица. Но его личная жизнь не была устлана розами. Вскоре после прибытия он почти ослеп на оставшийся глаз, а неудачная операция по удалению ка­ таракты[13] привела к полной потере зрения. В тот же год сгорел его дом; он избежал серьезных травм, быть может, даже гибели только благодаря героическим усилиям спасателей. А  в  конце 1773 года умерла его жена; через три года он снова женился на единокров­ ной сестре первой жены. Но эти события не сказались на мощном интеллекте Эйлера, его научная продуктивность по­прежнему была огромной. Примерно половина написанного на протяжении всей жизни приходится на период после возвращения в  Санкт­ Петербург. Начал он изданием того, что сегодня мы назвали бы бестселлером,  – знаменитых «Писем к  немецкой принцессе»[14]. Эта работа берет свое начало в  уроках, в  форме писем, которые Эйлер давал пятнадцатилетней троюродной сестре Фридриха. Эти письма охватывают широкий круг тем, включая естествознание,

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

361

философию и физику. Письма имели огромный успех и выдержали множество изданий на французском, английском, немецком, рус­ ском, голландском, шведском, итальянском, испанском и датском языках. К более специальным работам, выполненным в России, от­ носятся другие книги и статьи по алгебре, геометрической оптике, математическому анализу и  применению теории вероятностей к страховому делу. Быть может, настоящая слава, «предел свершений», приходит тогда, когда народ складывает о тебе истории. В случае Эйлера есть знаменитый пример такого рода. Процитирую известного истори­ ка математики: Говорят, что когда французский философ Дени Дидро посетил Им­ ператорский двор, он говорил очень свободно и преподал молодым придворным изрядную порцию своего кипучего атеизма. А  затем Дидро сообщили, что один ученый математик располагает алгебраи­ ческим доказательством существования Бога и  готов предъявить его на глазах всего двора, если тот пожелает его выслушать. Дидро согласился. Тогда Эйлер выступил вперед и сурово и в высшей сте­ пени убежденно произнес: «Monsieur, a + bn/n = x, donc Dieu existe: répondez!»* Дидро, для которого алгебра была все равно что древне­ еврейский язык, смутился и пришел в замешательство, что вызвало взрывы смеха со всех сторон. Он испросил разрешения вернуться во Францию, которое было милостиво дано[15].

Эта история нелепа от начала до конца – Дени Дидро (1713–1784) вовсе не был невеждой в математике, а вообразить, что такой чело­ век, как Эйлер, стал бы участвовать в этом глупейшем розыгрыше, совершенно невозможно. Современные историки убедительно до­ казали, что всё это – просто сказка, возможно, пущенная в оборот Фридрихом (который сильно не любил Дидро) или одним из его прихвостней[16]. Эйлер прожил долгую, невероятно продуктивную жизнь, но все когда­то приходит к концу – он умер 18 сентября 1783 года. В по­ священной ему статье в «Словаре биографий ученых» его послед­ ние часы описываются так: Первую половину дня Эйлер провел как обычно. Он дал урок мате­ матики внуку, проделал мелом на двух досках какие­то вычисления, относящиеся к движению воздушных шаров, затем обсудил [с дву­ мя коллегами] недавнее открытие планеты Уран. Примерно в  пять *

Месье, a + bn/n = x, так что Бог существует: отвечайте!

362

ЭЙЛЕР – ЧЕЛОВЕК, МАТЕМАТИК И ФИЗИК

часов пополудни его хватил апоплексический удар, и, прежде чем потерять сознание, он успел лишь произнести «Я умираю». Он умер около одиннадцати часов вечера.

Эйлер (как его называли, зримое воплощение анализа) завершил свои вычисления и был похоронен с большой помпой. Он упокоил­ ся в Александро­Невской лавре в Санкт­Петербурге[17] под огром­ ным надгробным камнем, поставленным в 1837 году. Его могила находится неподалеку от могил великих русских композиторов – Мусоргского, Римского­Корсакова и Чайковского. Конец настиг Эйлера внезапно, но я  думаю, что даже если бы ему предшествовало какое­то знамение, Эйлер как глубоко рели­ гиозный человек упокоился бы с миром. После слов, приведенных в эпиграфе к этому эссе, Эйлер продолжает: «Представление о Все­ вышнем, столь же возвышенное, как и утешительное, должно укре­ пить в  нашем сердце самые высокие добродетели и  подготовить нас к  блаженству вечной жизни». Очевидно, Эйлер верил, что за гробовой доской что­то существует, и как утешительно представ­ лять его с  вернувшимся зрением, с  пером в  руке, завершающим вычисления открывшегося ему, наконец, значения z(3). Но пусть даже не так. Эйлер никогда не умрет. Блеск его ума, ясность его мысли живут всюду в математике[18].

Примечания

Ряд цитат из моей книги «An Imaginary Tale: The Story of » (Princeton University Press, 1998) приводится в следующих приме­ чаниях. Чтобы не разгромождать данный раздел, вместо названия книги будет использоваться аббревиатура «AIT».

Предисловие 1. Boston Globe. 2002. 16 мая. С. A16. 2. Моя ассоциация эротики с техническим творчеством не слу­ чайна. См., например, статью Артура Миллера (Arthur I. Miller) «Эротика, эстетика и волновое уравнение Шрёдингера» в сборни­ ке «Это должно быть красиво: великие уравнения современной науки» (под ред. Грэма Фармело) (Granta Books, 2002). Ирландский математик и физик­теоретик Джон Л. Синг (John L. Synge) (1897– 1995) тоже глухо намекал на этот аспект в своем исполненном пре­ лестного юмора и  в  то же время поучительном фантастическом романе «Kandelmanʼs Krim» (издательство Jonathan Cape, 1957, стр. 115). Там есть один персонаж (Орк), который в длинной беседе с другими по поводу математики замечает: «Я возвращаюсь к на­ шему недавнему спору о  страсти и  сексе… Вы должны признать, что восхождение с этого уровня к теме квадратного корня из ми­ нус единицы необходимо как­то объяснить». Книгу Синга стоит прочесть всем, кто интересуется математикой, а особенно тем, кто планирует ее преподавать. 3. Использование математики в фильмах, для того чтобы создать у зрителя определенный образ персонажа, – идея не новая. Напри­ мер, в  фильме 1951 года «No Highway in the Sky» герой (Джеймс Стюарт) – по задумке режиссера, парень со странностями – откры­ вает, что усталость металла (и появляющиеся в результате трещи­ ны) может стать причиной крушения самолета. Чтобы мы поняли, что он не совсем «обычный», уже в начале фильма сообщается, что

364

ПРИМЕЧАНИЯ

он много времени размышлял над какой­то заумной штукой под названием «проблема Гольдбаха». (Так и  слышится, как зрители в кинотеатре 1950­х годов дружно затаили дыхание, а затем в тем­ ноте то там, то здесь раздаются исполненные священного ужаса восклицания «Боже мой!») Кстати, проблема Гольдбаха действи­ тельно существует и носит имя прусского математика Кристиана Гольдбаха (1690–1764). Изложенная в письме 1742 года к Эйлеру, эта проблема формулируется очень просто: каждое четное чис­ ло, большее 2, можно записать в виде суммы двух простых чисел. Вычисления на компьютере показали, что это верно для всех чет­ ных чисел до 1014, но верно ли это в общем случае, по­прежнему неизвестно. В 2000 году британское издательство Faber and Faber объявило о  награде в  миллион долларов за решение проблемы Гольдбаха тому, кто до 15 марта 2002 года представит доказатель­ ство и опубликует его до 15 марта 2004 года в авторитетном мате­ матическом журнале. Это был рекламный трюк, чтобы привлечь внимание к  публикации романа Апостолоса Доксиадиса «Дядя Петрос и проблема Гольдбаха». В условиях конкурса была двойная уловка: во­первых, к участию допускались только лица, легально проживающие в Соединенном Королевстве или США, так что сам Гольдбах (если бы вдруг воскрес) не смог бы претендовать на приз, а во­вторых, издательство приглашало принять участие в конкур­ се, почти стопроцентно обреченном на провал (и таки да, доказа­ тельство не найдено до сих пор), если исходить из романа, в кото­ ром старый математик оценивает свою жизнь как прожитую зря, поскольку всю ее потратил на тщетные попытки доказать гипотезу Гольдбаха! 4.  Авторитетной работой о  Дираке и  его взглядах на красоту в математике является книга Helge Kragh «Dirac: A Scientific Biog­ raphy» (Cambridge University Press, 1990). 5. Метод Поллока более точно называется «льющейся техникой», поскольку он просто давал каплям краски стекать с кисти или из дырки, пробитой в  дне подвешенной жестянки, а  сам в  это вре­ мя перемещал кисть или жестянку над холстом, положенным на землю. В случае жестянки всю «творческую» работу совершала ме­ ханическая система, управляемая гравитацией. Рокуэлл тонко по­ смеялся над этим механистическим способом «рисования», когда создал обложку для номера журнала «The Saturday Evening Post» за 1962 год – см. печатную форму работы «Знаток» (The Connois­ seur) на стр. 357 биографического романа Laura Claridge «Norman

ПРИМЕЧАНИЯ

365

Rockwell: A Life» (Random House, 2001). Дополнительные сведения о  «математике» в  картинах Поллока см. в  статье: Richard P. Tay­ lor. Order in Pollackʼs Chaos // Scientific American. December 2002. С. 117–121.

Введение 1. K. Devlin. The Most Beautiful Equation // Wabash Magazine, Win­ ter/Spring, 2002. 2. American Mathematical Monthly. 1925. Янв. С.  5–6. Одним из сыновей Пирса был философ и логик Чарльз Сандерс Пирс (1839– 1914), личная и  профессиональная жизнь которого сложилась очень непросто. Спустя несколько лет после его смерти в  одной из его книг была найдена записка, в которой он так отозвался об отце: «Он … испытывал суеверное почтение к “квадратному кор­ ню из минус единицы”». А  своего брата Джеймса Миллса Пирса (1834–1906), который, как и  отец, был профессором математики ». в  Гарварде, Ч. С.  Пирс объявил «суеверным почитателем … Очевидно, для мужчин из рода Пирса квадратный корень из ми­ нус единицы был еще и корнем личных конфликтов. См. American Mathematical Monthly. 1927. Дек. С. 525–527. 3.  Тождество, записанное на доске Пирсом, эквивалентно eip + 1 = 0. Нужно просто сначала возвести обе части в степень i, получим eip/2  = i, а  затем в  квадрат (получим eip  = i2). Поскольку i2 = -1, эквивалентность установлена. 4. Эссе Ле Лионне можно найти в  сборнике: Great Currents of Mathematical Thought, vol. 2 (Dover, 1971). С. 121–158. 5. Дополнительные сведения о Дираке и его импульсной функ­ ции см. в  разделе 5.1. «Объяснение» того, почему вся математи­ ка рано или поздно приносит «пользу», см. в  шуточном рассказе Алекса Касмана (профессора математики Чарльсонского колледжа в Южной Каролине) «Unreasonable Effectiveness», опубликованном в апрельском номере журнала Math Horizons за 2003 год. Еще один контпример к критерию «бесполезности» Харди дает нам теория простых чисел. Сам Харди был очарован простыми числами и, ко­ нечно, думал, что их изучение – пример чистой математической красоты. И если бы он был жив, то без сомнения пришел бы в ужас, узнав, что они лежат в  основе многих современных криптогра­ фических систем, которыми сегодня пользуются практически все (например, при передаче зашифрованных правительственных со­

366

ПРИМЕЧАНИЯ

общений или финансовых транзакций, совершаемых при оплате банковской картой товаров в интернете). 6. Разница между достаточным и необходимым условием – в его силе. Достаточное условие по меньшей мере так же сильно, как необходимое, т. е. может требовать больше, чем необходимое. На­ пример, десяти миллионов красок, безусловно, достаточно – при таком изобилии у картографа не возникнет никаких проблем. То есть десять миллионов красок – больше, чем необходимо. Но абсо­ лютно необходимо только четыре краски, т. е. не существует кар­ ты, которую нельзя было бы раскрасить четырьмя красками, но существуют такие, для которых трех не хватит. Должно быть по­ нятно, что необходимого условия может быть недостаточно для гарантии того, что стоит на кону. Необходимое и достаточное усло­ вие дает нужный баланс между «слишком много» и «недостаточ­ но». Как ни странно, для карт на поверхностях более сложных, чем плоскость, теорема о раскраске карт имеет вполне традиционные (не прибегающие к помощи компьютера) доказательства. Напри­ мер, семи красок необходимо и достаточно для раскраски любой карты на поверхности тора (бублика). Есть даже изящное доказа­ тельство того, что для любой карты на плоскости достаточно пяти красок. Но все еще не существует «красивого» доказательства того, что четырех красок необходимо и достаточно для раскраски лю­ бой планарной карты. Полную историю теоремы о  четырех кра­ сках можно найти в  книге: Robin Wilson. Four Colors Suffice: How the Map Problem Was Solved (Princeton University Press, 2003). Бо­ лее строгое изложение имеется в книге: Thomas L. Saaty and Paul C. Kainen. The Four­Color Problem: Assaults and Conquest (McGraw­Hill, 1977). Авторы (на стр. 8) приводят изумительную историю о Герма­ не Минковском (1864–1909), преподававшем математику молодо­ му Эйнштейну в цюрихе. Великий математик Герман Минковский однажды сказал своим студентам, что гипотеза о четырех красках не решена только потому, что ей занимались лишь третьесортные математики. «Я верю, что смогу ее доказать», – заявил он. Спустя много лет он признал: «Небеса разгневались на меня за высоко­ мерие, мое доказательство тоже содержит ошибку». 7. K. Appel and W. Haken. The Four Color Proof Suffices // Mathemati­ cal Intelligencer 8, no. 1, 1986. С. 10–20. 8. Пространное эссе о  компьютерном доказательстве теоремы о  четырех красках (а также о  компьютерах и  истине вообще) см. в  кн.: Donald MacKenzie. Mechanizing Proof: Computing, Risk, and

ПРИМЕЧАНИЯ

367

Trust (MIT Press, 2001). Еще больше материалов о  компьютерах, проблеме четырех красок, а  заодно о  недавнем использовании компьютеров для «разрешения» знаменитой старой проблемы (гипотезы Кеплера о  плотнейшей упаковке шаров в  трехмерном пространстве) можно найти в книге: George G. Szpiro. Keplerʼs Con­ jecture: How Some of the Greatest Minds in History Helped Solve One of the Oldest Math Problems in the World (John Wiley, 2003), особенно в главе 13 «Но является ли это доказательством?». 9. Эйлер полагал, что уравнение x4 + y4 + z4 = w4 не имеет решений в целых числах. Вероятно, он пришел к этому выводу, заметив, что уравнение x2 + y2 = w2 имеет решения в целых числах, x3 + y3 = w3 не имеет (это, конечно же, частный случай последней теоремы Ферма, обсуждаемой в главе 1), но x3 + y3 + z3= w3 имеет (напри­ мер, 33 + 43 + 53 = 63). Поэтому Эйлер заключил, что в общем слу­ чае, для того чтобы сумма n­х степеней была равна n­й  степени, необходимо по меньшей мере n слагаемых. Так, при n = 5 это озна­ чает, что в левой части должно быть по меньшей мере 5 слагаемых, т.  е. уравнение имеет вид x5  + y5  + z5  + u5  + v5= w5. В  1966 году прямым перебором на компьютере было доказано, что это утверж­ дение ложно, поскольку имеется контрпример 275 + 845 + 1105 + 1335 = 1445. 10. Ряд расходится фантастически медленно; так, сумма первых десяти миллиардов членов равна всего 23.6. На ту же тему есть еще более неожиданный результат: если ограничиться только обрат­ ными простыми числами, то ряд все равно будет расходиться. Это дает еще один, отличный от античного доказательства Евклида, способ убедиться, что множество простых чисел бесконечно. На­ шел его Эйлер (см. AIT. С.  150–152). В  1919 году норвежский ма­ тематик Вигго Брун (Viggo Brun) (1885–1978) показал, что сумма обратных простых чисел­близнецов (разность которых равна 2) конечна (что, к  сожалению, не решает вопрос о  том, конечно ли множество простых чисел­близнецов, – одну из самых знамени­ тых нерешенных задач в математике). Кстати, эта сумма, назван­ ная постоянной Бруна, равна

и именно при вычислении B на компьютере в  1994 году Томас Найсли (Thomas Nicely), профессор математики Линчбургского колледжа в  штате Вирджиния, обнаружил злосчастный дефект

368

ПРИМЕЧАНИЯ

в  алгоритме деления в  математическом сопроцессоре для Intel Pentium® (на самом деле компания Intel еще раньше обнаружила эту ошибку самостоятельно, но сочла ее «несущественной»). На­ пример, при вычислении 4 195 835/3 145 727 получился результат 1.33373906…, хотя правильным является результат 1.33382044…. Этот случай лишь усилил испытываемые многими сомнения от­ носительно силы доказательства, основанного на громоздких компьютерных вычислениях. 11. Его можно найти, например, в AIT. С. 146–147. 12. См.: Marilyn vos Savant. The Worldʼs Most Famous Math Problem (St. Martinʼs Press, 1993). С. 60–61. Рецензия, цитированная в этом тексте, принадлежит Найджелу Бостону и Эндрю Грэнвиллу (Nigel Boston and Andrew Granville. Adcan Mathematical Monthly. May 1995. С. 470–473). Несколько более сдержанна рецензия Ллойда Милли­ гэна и Кеннета Ярнелла (Lloyd Milligan and Kenneth Yarnall, Mathe­ matical Intelligencer 16, no. 3, 1994. С.  66–69). Но даже там книга вос Савант характеризуется как поверхностная и  изобилующая искажениями фактов. Эти рецензенты прямо (и, на мой взгляд, справедливо) объясняют высокий IQ вос Савант тем, что она прос­ то не знает, о чем говорит. Очень трудно при виде высокомерного невежества сохранять спокойствие. Поэтому позвольте мне просто процитировать адресованный вос Савант комментарий австра­ лийского математика Альфа ван дер Поортена (Alf van der Poorten), приведенный в его книге «Заметки о последней теореме Ферма» (Notes on Fermatʼs Last Theorem. Wiley­Interscience, 1996. С.  27): «крыша поехала» (up a gum tree). Так, по словам ван дер Поортена, говорят преподаватели, когда слышат «бессмысленный бред». 13.  Быть может, самый элементарный пример подмножества вещественных чисел, для которых разложение на множители не единственно, – множество положительных четных чисел 2, 4, 6, 8, 10, … . Произведение любых двух элементов этого множества также принадлежит этому множеству (поскольку произведение двух чет­ ных чисел четно). Некоторые числа из этого множества можно раз­ ложить на множители (например, 4 = 2 - 2 и 12 = 6 · 2), но не все, потому что не всегда существуют меньшие целые числа, принадле­ жащие тому же множеству, произведение которых равно данному числу. Например, не раскладываются на множители числа 2, 6, 10, 18 и 30. Те целые числа, которые нельзя разложить на множители, будут простыми в  этом множестве. Разложение в  произведение простых чисел в этом множестве не единственно, что доказывает

ПРИМЕЧАНИЯ

369

контрпример: 60 = 6 · 10 = 2 · 30. Одной этой иллюстрации (180 = 18 · 10 = 6 · 30 – другой пример) достаточно, чтобы убедиться в том, что единственность разложения нужно формально доказывать для каждой новой области чисел. Аргументировать что­то единствен­ ностью разложения в множестве обыкновенных целых чисел, по­ тому что это, мол, «интуитивно очевидно», заведомо неправильно. В главе 1 расскажу о знаменитом эпизоде в математике XIX века, когда некий излишне поспешный математик совершил такую же роковую ошибку, пытаясь доказать «последнюю теорему» Ферма для комплексных чисел. 14. О том, как Эйлер разложил синус в это произведение и вы­ числил суммы обратных квадратов целых чисел, можно прочитать в AIT, стр. 155–156 и 148–149 соответственно. В главе 4 я выведу эту знаменитую сумму еще одним способом, с помощью комплексных рядов Фурье. . 15. На самом деле Эйлер изучал дзета­функцию Мы говорили, что ряд z(1) расходится, а  Эйлер показал, что z(2) равно p2/6. Он также сумел вычислить z(s) для всех четных зна­ чений s. Значения z(s) для всех без исключения нечетных s до сих пор неизвестны. Значения z(s) для всех четных s иррациональны, а для нечетных s иррациональность установлена только для одно­ го конкретного значения; в математическом мире стало сенсаци­ ей, когда в 1979 году французский математик Роже Апери (Roger Apéry) (1916–1994) сумел доказать иррациональность z(3) (не зная его истинного значения). Затем в 2000 году французский матема­ тик Танги Ривоаль (Tanguy Rivoal) показал, что z(s) иррационально для бесконечного числа нечетных s (но каких именно, неизвестно). В 2001 году он существенно уточнил это утверждение, показав, что в интервале от 5 до 21 существует по меньшей мере одно нечет­ ное s, для которого z(s) иррационально. В том же году российский математик Вадим Зудилин сузил этот диапазон до множества не­ четных чисел между 5 и 11. 16. Вот формула, вознесшая Ватсона к таким вершинам поэти­ ческих восторгов:

370

ПРИМЕЧАНИЯ

Должен признать, она и вправду внушает священный трепет. 17. Эти лекции изданы в виде книги «The Beauty of Doing Math­ ematics: Three Public Dialogues» (Springer­Verlag, 1985). 18. Один из друзей Чарльза Дарвина писал об этом великом ес­ тествоиспытателе XIX века: «У него … не было естественной склон­ ности к математике, и он бросил заниматься ей, не овладев даже первой частью алгебры, а особенно ему не давались иррациональ­ ные числа и теорема о биноме». цитируется по первому тому изда­ ния «Life and Letters of Charles Darwin» (Basic Books, 1958), стр. 146. Прочитав это, мы, пожалуй, будем более склонны поверить, что следующее определение математика действительно принадлежит Дарвину: «слепец, ищущий в темной комнате черную кошку, кото­ рой там нет».

Глава 1. Комплексные числа 1. Из книги «Mathematics for the General Reader», написанной в  1943 году британским математиком Эдуардом Чарльзом Титч­ маршем, который много десятков лет преподавал в  Оксфорде. Не все согласны с  тем, что   – «простая концепция». Напри­ мер, в  новелле Роберта Музиля «Молодой Тёрлесс», написанной в 1906 году, два школьника, только что вышедших из класса после урока математики, заканчивают обсуждение тайны , и один из них говорит: Почему объяснить­то невозможно? Думается мне, все дело в том, что в этом случае творцы математики перемудрили. Почему бы, в конце концов, вещи, лежащей за пределами нашего интеллекта, не сыграть с интеллектом шутку? Но я не стану ломать над этим голову: все рав­ но такие вещи никогда и никуда не ведут.

Очень интересный психологический анализ этого литературно­ го произведения имеется в книге: Harry Goldgar. The Square Root of Minus One: Freud and Robert Musilʼs Törless. Comparative Literature (Spring 1965). С. 117–132. Вот что Голдгар пишет о смятении глав­ ного персонажа: Визит к  молодому магистру математики ничего не прояснил; тот просто сказал Тёрлессу, что он все поймет позже, а пока порекомен­ довал почитать Канта, в котором мальчик, конечно, разобраться не может. И  потому «мнимые числа», «квадратный корень из минус единицы» представляются Тёрлессу, да и нам тоже, иррациональны­

ПРИМЕЧАНИЯ

371

ми силами внутри него; с этого момента и до конца книги они ста­ новятся символом бессознательного.

2. «Загадка» до конца, пожалуй, не разгадана и сегодня. На­ пример, Айзек Азимов рассказывал забавную историю о  споре с профессором социологии, который заявил, что «математики – это мистики, поскольку верят в числа, не имеющие никакого отраже­ ния в реальности». Когда Азимов спросил, какие числа профессор имеет в виду, тот ответил: «Квадратный корень из минус едини­ цы. Его не существует. Математики называют его мнимым. Но при этом верят, что он каким­то мистическим образом существует». См. эссе Азимова «The Imaginary That Isnʼt» в сборнике «Adding a Dimension: Seventeen Essays on the History of science» (Double day 1964), стр.  60–70. Исторически, как я  пишу в  AIT, настоящей за­ гадкой для ранних мыслителей было другое: почему у некоторых кубических уравнений корни, очевидно, вещественные, но выража­ ются в терминах таинственного . Когда в этой книге я в качест­ ве отправной точки использую квадратное уравнение x2 + 1  = 0, я отклоняюсь от исторической правды. 3. Я  предполагаю, что вы знакомы с  умножением матриц. Ну а если это не так, то вот вкратце что нужно знать: если A и B – мат­ рицы размера 2´2, то

Это означает, что элемент в позиции (j, k) матрицы­произведе­ ния является произведением j­го вектора­строки A и  i­го векто­ ра­столбца B:

. Говорят, что A и B ком­

мутативны, если AB  = BA. Это свойство принимается как само собой разумеющееся для множества обыкновенных вещественных чисел, но для матриц, вообще говоря, неверно; например, если A =

и B =

, то AB =

, но BA =

. И наконец,

умножение матрицы на число c означает, что на это число умножа­ ются все элементы матрицы, т. е.

372

ПРИМЕЧАНИЯ

4. В  теории автоматического управления часто встречается странный зависящий от времени объект eAt, который называется матрицей перехода состояний (матрица A получается из уравне­ ний, описывающих, как система управления переходит из одного состояния в другое). Возведение e в матричную степень – как ин­ тересно! И что бы это могло значить? А вот что: поскольку elt = 1 + lt + (lt)2/2! + (lt)3/3! + …, то подстановка A вместо l и I вместо 1 дает матрицу

Теперь вы понимаете, почему специалистам по теории управ­ ления так интересно вычисление сколь угодно больших степеней матрицы. Идея такого определения eAt принадлежит американско­ му математику Уильяму Генри Метцлеру (1863–1943), он высказал ее в статье 1892 года, где подставлял A в разложение в ряд любой трансцендентной функции, например:

На A налагалось только одно ограничение: ее элементы должны быть постоянны, т. е. A ¹ A(t). 5.  История жизни Рамануджана одновременно окрыляющая и трагическая. Великий английский математик Г. Х. Харди, кото­ рый привез Рамануджана в Кэмбридж, чтобы тот мог учиться ма­ тематике «надлежащим образом», как­то написал, что открытие индийского гения стало единственным романтическим эпизодом в его (Харди) жизни. Хорошее описание жизни и работ Рамануджа­ на можно найти в книге: Robert Kanigel. The Man Who Knew Infinity. Scribnerʼs, 1991. 6. Эти и другие построенные компьютером графики были соз­ даны в программе MATLAB. Я не силен в программировании, по­ этому и  мой код не блещет изощренностью (просто вычисления в лоб), но мощь MATLAB более чем компенсирует мои скромные способности. Так, для построения обоих графиков потребовалось

ПРИМЕЧАНИЯ

373

свыше 334 000 операций с плавающей точкой, и на ПК с процессо­ ром частотой 800 МГц это заняло чуть меньше секунды. 7.  Dennis C. Russell. Another Eulerian­Type Proof // Mathematics Magazine. December 1991. С. 349. 8. Частоты в электронике гораздо выше, чем в механике, потому что в электронных схемах колеблются крохотные носители заряда (например, электроны) с очень малой массой. В механических же системах речь обычно идет о сравнительно массивных металличе­ ских предметах, совершающих колебательное движение. Напри­ мер, для получения тяги, необходимой для вывода на орбиту, цент­ робежный топливный турбонасосный агрегат высокого давления (442 атмосферы), питающий три главных двигателя космическо­ го челнока, должен нагнетать жидкий кислород в таком бешеном темпе – свыше 3 кубометров в секунду, – что его внутренние детали совершают примерно 600 оборотов/с. Высокооборотный автомо­ бильный двигатель (примерно такого же размера, как турбонасос) в режиме, когда стрелка на тахометре достигает красной отметки (т. е. близко к взрыву), совершает «всего лишь» 100 оборотов/с. 9. Термин «периоды в секунду» официально заменен на герц, со­ кращенно Гц, в честь немецкого физика Генриха Герца (1857–1894). В  1887 году Герц экспериментально обнаружил электромагнит­ ные волны на микроволновых частотах примерно в диапазоне от 50´106 до 500´106 периодов в  секунду (ой, я  хотел сказать от 50 до 500 Мгц), что было предсказано максвелловской теорией элект­ ромагнетизма за 15 лет до того. У  этой «игры в  названия» есть странные черты. В  электротехнике для измерения угловой часто­ ты по­прежнему используются радианы в секунду – почему их так и  не переименовали? На самом деле время от времени все­таки предлагается новое название: штейнмец, в  честь американского инженера­электрика немецкого происхождения Чарльза Протеуса Штейнмеца (Charles Proteus Steinmetz) (1865–1923). В использова­ нии Sz вместо радиан в секунду и Hz вместо периодов в секунду есть приятная симметрия, но и некоторая ирония (обратите вни­ мание на латинские инициалы Штейнмеца – C. P.) – один период в секунду (Cycle per Period) должен был бы назваться штейнмецем, а один радиан в секунду – герцем. 10. См. вывод формулы Валлиса из разложения синуса в  бес­ конечное произведение в  AIT, стр.  155–156. О  том, как вывести формулу Валлиса с помощью интеграла Валлиса, см.: E. Hairer and G.  Wanner. Analysis by Its History. Springer, 1996 (2­е изд. испр.).

374

ПРИМЕЧАНИЯ

С. 233–234. В статье: Joseph Wiener. Integrals of cos2n(x) and sin2n(x) // American Mathematical Monthly. Январь 2000. С.  60–61  – тот же подход, что в тексте, применен к нахождению интегралов sin2n(q) и cos2n(q) по любому интервалу, а не только по интервалу от 0 до 2p. Тогда интеграл Валлиса оказывается частным случаем более об­ щих результатов Винера. 11.  Ralph Palmer Agnew. Differential Equations. 2­е изд. McGraw­ Hill, 1960. С. 370. 12. Это неравенство названо в честь французского математика Огюстена Луи Коши (1789–1857) и немецкого математика Германа Шварца (1843–1921), которые открыли разные его формы. Одна­ ко в том виде, в каком это неравенство выведено в книге, первым его опубликовал русский математик Виктор Яковлевич Буняков­ ский (1804–1889). Прежде Буняковский работал в  Париже, где изучал у Коши методы комплексного анализа (обсуждается в AIT, стр. 187–221). 13. Если дан отрезок прямой любой длины, то второй отрезок, длина которого равна квадратному корню из длины первого, лег­ ко построить с помощью циркуля и линейки; см. AIT, стр. 31–32, 243. Полагаю, у вас не вызывает сомнений, что остальные опера­ ции тоже выполнимы. Для построения можно даже поступить проще, не прибегая к  общему подходу. Имея отрезок единичной длины, восставим к нему перпендикуляр из одного какого­нибудь конца. С помощью циркуля поставим на этом перпендикуляре за­ сечку, отмечающую отрезок длины 4. В прямоугольном треуголь­ нике, катеты которого совпадают с этими двумя отрезками, гипо­ тенуза имеет как раз нужную нам длину, . Но для остальных квадратных корней необходима общая процедура построения. 14. Элегантное построение 17­угольника приведено в  книге: H. S. M. Coxeter. Introduction to Geometry. 2­е изд. Wiley, 1969. С. 27 (Имеется русский перевод первого издания: Кокстер Г. С. М. Введе­ ние в геометрию. М.: Наука, 1966. Оно принадлежит английскому математику Герберту Ричмонду (1863–1948) и было опубликовано в 1893 году.) 15. F5 = 232 + 1 = 4 294 967 297, и Эйлер разложил его в произве­ дение двух простых чисел: 641 · 6 700 417. С помощью современных компьютеров F5 можно разложить на множители в долю секунды, но для Ферма оно было слишком велико. Даже во времена Эйле­ ра это вычисление было нетривиальным. (Как это было сделано, можно прочесть в книге: William Dunham. Journey Through Genius:

ПРИМЕЧАНИЯ

375

The Great Theorems of Mathematics. John Wiley, 1990. С. 229–234.) Но пусть даже F5 не простое число Ферма, не могут ли быть простыми числа Fp для p > 5? Если это так, то следующее простое число Ферма после F4 должно быть поистине огромным, потому что известно (по состоянию на май 2003­го), что Fp не простые для всех p от 5 до 32. Шестое простое число Ферма по сей день неизвестно. В 1844 году немецкий математик Ф. Г. Эйзенштейн (1823–1852) предположил, что простых чисел Ферма бесконечно много, но этот вопрос до сих пор остается открытым. Впрочем, его послужной список в области гипотез о  простых числах не внушает доверия; он предполагал также, что все числа в последовательности простые, однако уже четвертое число, равное F16, является, как нам известно, составным. 16. Следующим допускающим построение нечетноугольником, конечно же, является 51­угольник (51 = F0F2). Если существует все­ го пять простых чисел Ферма, то общее количество допускающих построение нечетноугольников легко подсчитать; оно равно коли­ честву способов составить произведения (без повторений) прос­ тых чисел Ферма, содержащих один множитель, два множителя, три множителя и т. д. Воспользовавшись биномиальными коэффи­ циентами, получаем, что эта величина равна

17.  Пошаговое описание выполненного Гауссом построения правильного 17­угольника см. в книге: Arthur Gittleman. History of Mathematics. Charles E. Merrill, 1975. С. 250–252. 18. Michael Trott. cos(2p/257) à la Gauss // Mathematics in Educa­ tion and Research 4, no. 2, 1995. С. 31–36. Подробности построения 257­угольника можно найти в статье: Christian Gottlieb. The Simple and Straightforward Construction of the Regular 257­gon // Mathema­ tical Intelligencer, Winter 1999. С. 31–36. Название статьи («Простое и прямолинейное построение правильного 257­угольника») содер­ жит в себе иронию, поскольку автор завершает эссе словами «Же­ лаю удачи читателю, который захочет проделать это построение от начала до конца». 19. «Арифметика» Диофанта – это сборник 130 задач, опублико­ ванных в 13 томах. Казалось, что она навсегда пропала, когда сго­

376

ПРИМЕЧАНИЯ

рела легендарная Александрийская библиотека, но спустся много веков обнаружился арабский перевод шести томов. Принадлежав­ ший Ферма экземпляр уцелевшей части «Арифметики» – это пере­ вод с  греческого на латынь, выполненный Клодом Баше. Задача, побудившая Ферма оставить самую знаменитую из своих заметок на полях, касается представления заданного квадрата числа в виде суммы других квадратов. 20. Любопытно отметить, что в  снятом в  1989 году эпизоде фильма «Звездный путь: Следующее поколение», действие кото­ рого происходит в XXIV веке, мы узнаем, что Жан­Люк Пикар ищет отдых от своих обязанностей капитана космического корабля, пы­ таясь доказать последнюю теорему Ферма. Своему заместителю, командору Райкеру, он объясняет: «Меня это бодрит. Расставляет все по местам. Мы в своем высокомерии решили, что нам сам черт не брат, а  между тем не можем распутать простой узелок, кото­ рый завязал французский математик­любитель [Ферма по роду занятий был юристом], работавший даже без компьютера». К со­ жалению для Голливуда, реальность такова, что эти тонкие чувства оказались «исторически» неверными, поскольку, как все мы знаем, Уайлс опередил Пикара на несколько столетий. Но эта романтика кое­что говорит о славе последней теоремы Ферма (плюс, конечно, тот факт, что она является обобщением теоремы Пифагора, о ко­ торой у  большинства людей остались смутные воспоминания со времени учебы в школе). Математические методы, придуманные для доказательства Последней теоремы, красивые и  мощные, но сам результат не слишком важен (если вообще важен) для даль­ нейшего развития математики. Великий Гаусс отказывался рабо­ тать над этой задачей, потому что считал ее принципиально не­ интересной. И  действительно, другие, очень похожие гипотезы существуют в математике дольше, и некоторые даже решены без того всеобщего ажиотажа, который сопутствовал достижению Уайлса. Возьмем, к  примеру, гипотезу Каталана. Названная по имени бельгийского математика Эжена Каталана (1814–1894), она утверждает, что уравнение xm - yn = 1 имеет единственное решение в целых числах: 32 - 23 = 1. То есть 8 и 9 – единственные после­ довательные степени. Каталан высказал эту гипотезу в 1844 году, но корнями она уходит в куда более давние времена. Средневеко­ вый французский математик и астроном рабби Леви бен Гершом (1288–1344) доказал (примерно в 1320 году), что если 3m - 2n = 1, то m  = 2 и  n  = 3. В  1738  году Эйлер установил обратное: если

ПРИМЕЧАНИЯ

377

x3 - y2 = 1, то x = 2 и y = 3. После Эйлера были доказаны другие частные результаты, но доказательство для общего случая мате­ матикам не давалось. И вдруг в апреле 2002 года румынский мате­ матик Преда Михайлеску (работавший в Падерборнском универ­ ситете в  Германии) представил миру элегантное доказательство. Это была работа высочайшего калибра, первоклассное по любым меркам интеллектуальное достижение, которое было восторженно встречено математиками всего мира. И тем не менее я сильно со­ мневаюсь, что кто­нибудь слышал упоминание о нем в телевизи­ онном шоу (разве что в каком­нибудь выпуске научно­популярной программы NOVA или еще чего­то в этом роде). 21.  Набросок доказательства того, что разложение полиномов Ламе на множители не единственно, можно найти в  книге: Ian Stewart and David Tall. Algebraic Number Theory and Fermatʼs Last Theorem. A. K. Peters, 2002. С. 122–124. 22. На самом деле разложение чисел вида a + ib единствен­ но только при следующих значениях D: 1, 2, 3, 7, 11, 19, 43, 67, 163. О том, почему налагается требование об отсутствии полных квад­ ратов среди делителей, см. Stewart and Tall, стр. 61–62. 23. Математик сказал бы, что числа из S «принадлежат мнимому квадратичному полю Q( ) и что они образуют кольцо». 24. Даже в тех системах комплексных чисел, где единственность разложения имеет место, возможны сюрпризы. Например, в мно­ жестве обыкновенных целых чисел 5 – простое число. Но в систе­ ме гауссовых целых чисел это уже не так. Действительно, 5 можно представить в виде произведения двух других гауссовых целых чи­ сел: 5 = (1 + i2)(1 - i2). Внимательный читатель найдет и еще одно разложение: 5 = (2 + i)(2 - i). Нетрудно показать – так же, как это сделано в тексте, – что 1 + i2, 1 - i2, 2 + i и 2 - i – простые гауссовы числа (с нормой N(a + ib) = a2 + b2), поэтому вроде бы получается, что мы получили два разных разложения 5 на простые множители. Но ведь мы раньше сказали, что для гауссовых целых чисел раз­ ложение единственно. Эта «загадка» разрешается просто: я сказал вам не все – разложение единственно с точностью до порядка (как и в случае обыкновенных целых чисел) и до множителей, называ­ емых единицами. В случае обыкновенных целых чисел единицами являются ±1, а в случае гауссовых целых чисел – ±1 и ±i. Легко за­ метить, что i(2 - i) = 1 + i2. Я говорю это только для того, чтобы вы знали, что у «загадки» есть ответ. Если хотите узнать подробнее, обратитесь к книге Stewart and Tall, стр. 76–79.

378

ПРИМЕЧАНИЯ

25. Правило Лейбница для дифференцирования интеграла име­ ет вид

Если пределы интегрирования не зависят от переменной диф­ ференцирования (t), то последние два члена равны нулю, поэтому производная интеграла равна интегралу от производной. Но в об­ щем случае это не так, и нужны все три члена. Вы можете найти вывод правила Лейбница для неискушенных в моей книге: The Sci­ ence of Radio. 2­е изд. Springer­Verlag, 2001. С. 415–418. 26. Можно математически доказать, что g(¥) = 0:

Поскольку e-uy ³ 0 для всех вещественных u и y, а |sin(u)/u| £ 1, имеем

Таким образом,

, откуда и  вытекает нужный нам

результат. 27. См., например: Bernard Friedman. Lectures on Applications­ Oriented Mathematics. Holden­Day, 1969. С. 17–20.

Глава 2. Путешествия в страну векторов 1. См. AIT. С. 92–94. 2. Насколько мне известно, эта задача раньше нигде не встре­ чалась, так что я вправе назвать ее по собственному усмотрению. Я называю ее обобщенным гармоническим блужданием, потому что при q = 0 p = 1 + 1/2 + 1/3 + 1/4 + … , т. е. получается гармонический ряд. В AIT я  рассматриваю похожее блуждание, для которого по­ следовательность шагов после поворотов имеет вид 1, 1/2, 1/4, 1/8, … (см. AIT. С. 107–109). Это блуждание оказывается гораздо проще, чем здесь; в AIT я не дал ему никакого специального названия, но

ПРИМЕЧАНИЯ

379

поскольку данный пример считаю своим порождением, то ныне нарекаю его обобщенным гармоническим блужданием, по очевид­ ным причинам. 3. Эта симметрия не предполагалась при генерации графика. График был построен для углов, изменяющихся в полном диапа­ зоне от 0 до 360°, а затем наличие симметрии расценивалось как частичная проверка правильности кода для MATLAB. 4. На обсуждение в  этом разделе меня навела задача, которую много лет назад Т. Г. Мэттьюс опубликовал в  журнале American Mathematical Monthly, октябрь 1944, стр.  475, и  ее решение (най­ денное Гордоном Пэллом) в  следующем году (тот же журнал, де­ кабрь 1945, стр. 584–585). Мэттьюс и Пэлл работали в университете Макгилла, где Пэлл в то время был молодым математиком, а впо­ следствии сделал выдающуюся карьеру. О  Мэттьюсе мне ничего неизвестно, знаю только, что в то время в университете Макгилла секретарем был некий Т. Г. Мэттьюс. 5. Этот результат часто ставит в  тупик студентов, которые не­ доумевают, почему поправки на ветер при полете туда и обратно не взаимоуничтожаются. Дело в том, что время полета по ветру (с большей скоростью) меньше времени полета против ветра (с мень­ шей скоростью). Гораздо более полное рассмотрение подобных проблем можно найти в статье: M. S. Klamkin and D. J. Newman. Flight in an Irrotational Wind Field // SIAM Review, апрель 1962. С. 155–156. 6. Эта статья и  подсказала мне основную тему данного разде­ ла: R. Bruce Crofoot. Running with Rover // Mathematics Magazine, октябрь 2002. С. 311–316. Полезно также ознакомиться со статьей: Junpei Sekino. The Band Around a Convex Set // College Mathematics Journal, март 2001. С. 110–14. 7. На самом деле в MATLAB имеется много очень мощных реша­ телей дифференциальных уравнений. Если бы меня интересовало получение максимально точного ответа, я бы воспользовался од­ ним из них, а не своим написанным на скорую руку кодом (кото­ рый в учебниках по дифференциальным уравнениям называется методом Эйлера еще с 1768 года). Но я хотел просто показать вид ожидаемого решения.

Глава 3. Иррациональность p2 1. Элегантное обсуждение непрерывных дробей и, в частности, вывод разложения tg(x), найденного Ламбертом, а также доказа­

380

ПРИМЕЧАНИЯ

тельство иррациональности tg(x) для всех ненулевых рациональ­ ных x см. в  книге: E. Hairer and G. Wanner. Analysis by Its History Springer, 1996. 2­е испр. изд. С. 68–79. 2. Если дан многочлен конечной степени n > 1 с целыми коэф­ фициентами

то его корни (n значений x, удовлетворяющих этому уравнению) называются алгебраическими числами. Например, поскольку i = является корнем уравнения x2 + 1 = 0 (здесь n = 2), то i – алгеб­ раическое число. К  алгебраическим относятся все рациональные и многие (но не все) иррациональные. Иррациональные числа, не являющиеся алгебраическими, называются трансцендентными. В 1873 году французский математик Шарль Эрмит (1822–1901) до­ казал, что число e трансцендентное. (В 1737 году Эйлер доказал иррациональность e.) 3. Ivan Niven. Irrational Numbers // American Mathematical Society, 1954. 4.  Для молодого математика самый быстрый путь к  известно­ сти и славе – решить проблему из списка Гильберта. Некоторые из них все еще не решены, и  горшок «золотой репутации» остается соблазнительной приманкой. См.: Jeremy J. Gray. The Hilbert Chal­ lenge (Oxford, 2000) и Benjamin H. Yandell. The Honors Class: Hilbertʼs Problems and Their Solvers (A. K. Peters, 2002). 5. В этой работе есть забавный момент. В 1919 году Зигель при­ сутствовал в аудитории, где Гильберт высказал уверенность в том, что  – «трансцендентное или, по крайней мере, иррациональ­ ное число», но добавил, что не думает, что проживет достаточно долго, чтобы увидеть доказательство. 6. цитируется по роману: John L. Synge. Kandelmanʼs Krim. Jona­ than Cape, 1957. С. 52–53. См. примечание 2 к предисловию. 7. E. C. Titchmarsh. Mathematics for the General Reader. Dover, 1981. С.  196. Почти мистическая аура, окружающая p, может вы­ звать дрожь в  коленках даже у  опытных математиков и  сугубо практичных физиков. Мой любимый пример такого рода – пассаж из хорошо известного эссе Ричарда Фейнмана «What is Science», «Physics Teacher», сентябрь 1969, стр.  313–320. В  нем он вспоми­ нает, как в детстве был озадачен присутствием p в формуле резо­ нансной частоты некоторых электрических схем. «Где же окруж­

ПРИМЕЧАНИЯ

381

ность?» (с которой мы привыкли ассоциировать p) в таких схемах, спрашивал он себя. Эту ностальгическую историю он заканчи­ вает словами (стр. 315) «в душе я так до конца и не понимаю, где та окружность, из которой взялось p». Ну, это просто Фейнман во всей красе. Конечно, он задолго до 1969 года знал, «откуда взялось p» и «где та окружность». Да и вы знаете, если внимательно чита­ ли раздел  1.4. Там говорилось, что между частотой, измеренной в радианах в секунду (w) и в герцах (v), имеется связь w = 2pv (вот оно, это канальское p!), а «окружность», которую разыскивал юный Фейнман, – это просто круговая траектория, описываемая конца­ ми двух вращающихся против часовой стрелки экспоненциальных векторов, комбинация которых образует вещественные сигналы переменного тока sin(wt) и cos(wt). 8. А быть может, и не совсем так. В туповатом эпизоде «Звезд­ ного пути» под названием «Волк в  овчарне», снятом в  1967 году, м­р Спок находит замечательное практическое применение ир­ рациональности p, чтобы изгнать дьявольскую электромагнитную силу, захватившую корабельный компьютер. Для этого он просит компьютер найти последнюю цифру p, но «последней цифры», естественно, нет, и этот парадокс (по какой­то не вполне внятной причине) изгоняет дьявольскую силу из электрических цепей. Еще более таинственная загадка, связанная с иррациональностью p и e, заключена в вопросе из следующего стишка: Пи уходит в бесконечность… И над e то же проклятье. Но вот интересно: что будет больше, Если записать их задом наперед? Не столь глупый рассказ о  пи много лет назад был опублико­ ван в математическом журнале: João Filipe Queiró. The Strange Case of Mr. Jean D. // Mathematical Intelligencer, 5, no. 3, 1983. С. 78–80. В нем преподавателю математики снится кошмарный сон, в ко­ тором с помощью компьютера обнаруживается, что после пяти­ миллионной цифры десятичная запись p начинает повторяться. То есть p рационально! Но в конце профессор, естественно, про­ сыпается. 9. Совершенно другое доказательство иррациональности p2, тоже доступное студентам младших курсов (но без использования фор­ мулы Эйлера), можно найти в потрясающей книге: George F. Sim­ mons. Calculus Gems. McGraw­Hill, 1992. С. 283–284. Представленное

382

ПРИМЕЧАНИЯ

в ней доказательство выглядит короче того, что я выбрал, но это потому, что много шагов пропущено, как в книге Зигеля. См. так­ же: D. Desbrow. On the Irrationality of p2 // American Mathematical Monthly, декабрь 1990. С. 903–906. 10. См. примечание 25 к главе 1.

Глава 4. Ряды Фурье 1. Источниками для исторического экскурса в первых трех раз­ делах этой главы мне послужили: Edward B. Van Vleck. The Influence of Fourier Series upon the Development of Mathematics // Science, ян­ варь 23, 1914. С. 113–124; H. S. Carslaw. Introduction to the Theory of Fourierʼs Series and Integrals. Macmillan, 1930. С. 1–19; Carl B. Boyer. Historical Stages in the Definition of Curves // National Mathematics Magazine, March 1945. С.  294–310; Rudolph E. Langer. Fourierʼs Se­ ries: The Genesis and Evolution of a Theory // American Mathematical Monthly, август­сентябрь 1947 (доп.). С. 1–86; Israel Kleiner. Evolu­ tion of the Function Concept: A Brief Survey // College Mathematics Journal, сентябрь 1989. С. 282–300. 2.  Природа дифференцируемости функции Римана была уста­ новлена лишь относительно недавно, и  оказалось, что Риман был неправ  – эта функция не дифференцируема почти всюду, но есть точки, в  которых производная все­таки существует. См.: Joseph Gerver. The Differentiability of the Riemann Function at Certain Rational Multiples of p // American Journal of Mathematics, январь 1970. С. 33–55. 3.  На самом деле Ньютон сформулировал свой второй закон движения в  следующем, более общем виде: «сила равна скоро­ сти изменения импульса», т. е. F = d(mv)/dt = m dv/dt + v dm/dt, где v  = dx/dt – скорость массы m (и, значит, dv/dt – ускорение). Если dm/dt = 0, то это сводится к хорошо известному «сила равна про­ изведению массы на ускорение». Но, например, на этапе запуска ракеты необходимо использовать более общую формулировку, по­ скольку масса ракеты изменяется со временем; по мере сгорания топлива и избавления от продуктов горения в виде выхлопа мас­ са ракеты убывает. Однако в нашей задаче о колеблющейся стру­ не можно использовать упрощенную формулировку (если только масса струны не изменяется, как, например, может быть в случае хлопковой нити, колеблющейся во влажном воздухе, – она впиты­ вает влагу и со временем становится тяжелее).

ПРИМЕЧАНИЯ

383

4. Единственное, что можно сказать о sin(¥) и cos(¥), – это то, что они могут быть равны 0, но с тем же успехом могут быть любым значением от -1 до +1. Дело в том, что limt®±¥sin(t) и limt®±¥cos(t) не существуют. Старое, но все еще завораживающее историческое (в  работе Фурье возникает снова) и  математическое обсуждение этой темы можно найти в статье: J. W. L. Glaisher. On sin ¥ and cos ¥ // Messenger of Mathematics, 1871. С. 232–244. Глейшер был плодови­ тым (свыше 400 статей) и  талантливым ученым, занимавшимся многими связанными с  математикой вопросами. В  основном он писал для квалифицированных математиков, но часто попадаются и  работы, понятные непрофессионалу. Всю свою профессиональ­ ную жизнь он преподавал в  Кэмбридже и  с  1884 по 1886  год был президентом Лондонского математического общества. 5. Я не собираюсь выводить уравнение теплопроводности в этой книге. Вывод волнового уравнения я  привел, поскольку это пер­ вое уравнение теоретической физики, решение которого было найдено в  виде бесконечного тригонометрического ряда. Вывод уравнения теплопроводности можно найти в любом учебнике по дифференциальным уравнениям в частных производных. Старый, но остающийся одним из лучших учебников с многочисленными примерами – книга R. V. Churchill «Fourier Series and Boundary Value Problems», выдержавшая много изданий и впервые опубликован­ ная в 1941 году. 6. Выполненный Томсоном анализ диффузии в телеграфном ка­ беле предвосхитил открытие фундаментальных уравнений элект­ ромагнетизма, так называемых уравнений Максвелла электро­ магнитного поля (названных в честь доброго друга Томсона и его соотечественника Джеймса Клерка Максвелла), но при некоторых ограничениях диффузионный анализ дает удовлетворительные результаты. См. мою книгу «Оливер Хэвисайд» (Johns Hopkins Uni­ versity Press, 2002), особенно главу 3 «Первая теория электрическо­ го телеграфа». 7. Статьи Томсона о рядах Фурье и о возрасте Земли опубликова­ ны в сборниках «Mathematical and Physical Papers» (Cambridge Uni­ versity Press, 1882 и 1890), статья «On Fourierʼs Expansions of Func­ tions in Trigonometrical Series» (1841) – на стр.  1–6 тома 1, а  «On the Secular Cooling of the Earth» (1862)  – на стр.  295–311 тома 3. Современный взгляд на историю применения Томсоном матема­ тики при анализе возраста Земли см. в моей статье «Kelvinʼs Cool­ ing Sphere: Heat Transfer Theory in the 19th Century Debate over the

384

ПРИМЕЧАНИЯ

Age­of­the­Earth» в  сборнике «History of Heat Transfer» (American Society of Mechanical Engineers, 1988), стр. 65–85. 8. Неопубликованная работа Фурье 1807 года пропала, была вновь найдена в  конце 1880­х годов и  теперь доступна в  ориги­ нальном виде на французском языке с бесценными исторически­ ми комментариями на английском; см. I. Grattan­Guinness. Joseph Fourier; 1768–1830. MIT Press, 1972. 9. Книга «Analytical Theory of Heat» была издана на английском в  1878 году и  снабжена представляющими огромный историче­ ский интерес комментариями переводчика Александра Фрима­ на, сотрудника колледжа св. Иоанна в  Кэмбридже. Спустя почти два столетия после выхода в свет книга Фурье все еще поражает, ее должен прочитать любой студент, серьезно занимающийся ма­ тематикой и  физикой. Репринтное издание вышло в  издатель­ стве Dover Publications в 1955 году. (На русский язык данная книга («Аналитическая теория тепла») не переводилась. – Прим. перев.) 10. На самом деле Фурье использует этот современный подход к вычислению коэффициентов разложения в ряд, но только в ка­ честве последней своей техники. Сначала он применил чрезвы­ чайно сложную процедуру перехода к  пределу, основанную на дифференцировании. Например, чтобы найти коэффициенты в три­ гонометрическом уравнении 1 = c1cos(y) + c3cos(3y) + c5cos(5y) + …, он сначала дифференцировал его четное число раз (n) и получал бесконечную последовательность уравнений 0 = c1cos(y) + 32c3cos(3y) + 52c5cos(5y) + … 0 = c1cos(y) + 34c3cos(3y) + 54c5cos(5y) + … … 0 = c1cos(y) + 3nc3cos(3y) + 5nc5cos(5y) + … … Затем, полагая y  = 0, он получал систему бесконечного числа линейных алгебраических уравнений от бесконечного числа коэф­ фициентов. Чтобы ее решить, он брал первые m уравнений в пред­ положении, что наибольшее внимание нужно уделить первым m коэффициентам. Найдя первые m коэффициентов, он определял их предельные значения, устремляя m к  ¥. Все это иначе, как странным, не назовешь. Профессор ван Влек (см. примечание  1) писал: «Фурье пользуется своей математикой с  восхитительной

ПРИМЕЧАНИЯ

385

свободой и  наивностью физика или астронома, который верит в  математическое провидение». Позже он пользовался методом Эйлера, не указывая автора, и, очевидно, его уведомили о приори­ тете Эйлера, поскольку где­то в 1808 или 1809 году Фурье в письме неназванному корреспонденту (вероятно, Лагранжу) объяснялся: «Я виноват в том, что не знал математика, который первым при­ менил этот метод [метод Эйлера нахождения коэффициентов три­ гонометрического ряда], поскольку должен был бы сослаться на него». См.: John Herivel. Joseph Fourier: The Man and the Physicist. Oxford University Press 1975. С. 318–319. 11. AIT. С. 155–157. 12. Подробный очерк истории математики, описываемой в этом разделе, имеется в  работе: Edwin Hewitt and Robert E. Hewitt. The Gibbs­Wilbraham Phenomenon: An Episode in Fourier Analysis // Ar­ chive for History of Exact Sciences 21, 1979. С. 129–160. Раньше очень краткое сообщение на эту тему встречалось в  статье: Fred Ustina. Henry Wilbraham and Gibbs Phenomenon in 1848 // Historia Mathe­ matics 1, 1974. С. 83–84. Но в работе Хьюитта содержится обстоя­ тельное математическое обсуждение, включая события, имевшие место уже в XX веке. Впрочем, ни в той, ни в другой статье ничего не сказано о самом Уилбрэхэме. 13. Nature, октябрь 6, 1898. С. 544–545. 14. Nature, октябрь 13, 1898. С. 569–570. 15. Nature, декабрь 29, 1898. С. 200 (письма Майкельсона и Гиб­ бса); С. 200–201 (письмо Лава). 16. Nature, апрель 27, 1899. С. 606. 17. Nature, май 18, 1899. С. 52 (письмо Пуанкаре) и июнь 1, 1899. С. 100–101 (последнее письмо Лава). 18. A New Harmonic Analyzer // American Journal of Science, январь 1898. С.  1–14. Соавтором Майкельсона был физик из Чикагского университета Сэмюэл Уэсли Страттон (1861–1931), который затем стал директором­учредителем Национального бюро стандартов, а также президентом МТИ (1923–1930). 19. The Tide Gauge, Tidal Harmonic Analyzer, and Tide Predictor // Kelvin Mathematical and Physical Papers. Cambridge University Press, 1911. Т. 6. С. 272–305 (первоначально эта статься была опубликова­ на в 1882 году). 20. См. изображение анализатора приливов в  книге: Crosbie Smith and M. Norton Wise. Energy and Empire: A Biographical Study of Lord Kelvin. Cambridge University Press, 1989. С. 371.

386

ПРИМЕЧАНИЯ

21. Фотография гармонического анализатора Майкельсона­ Страттона приведена на фронтисписе книги: J. F. James. A Studentʼs Guide to Fourier Transforms: With Applications in Physics and Engi­ neering. Cambridge University Press, 1995. 22. Henry Wilbraham. On a Certain Periodic Function // Cambridge and Dublin Mathematical Journal 3, 1848. С. 198–201. Текст из Трак­ тата Фурье, который цитирует Уилбрэхэм, можно найти в  Дувр­ ском репринте (см. примечание 9) на стр. 144. 23. Henry Wilbraham. On the Possible Methods of Dividing the Net Profits of a Mutual Life Assurance Company Amongst the Members. На самом деле дата публикации этой статьи – октябрь 1856 года. Полное название журнала «Journal of the Institute of Actuaries and Assurance Magazine». 24. Будучи большим поклонником Индианы Джонса, хотел бы я  сказать, что мои открытия – результат путешествий по всему миру, в которых мне не раз с трудом удавалось избежать гибели (приправленные, разумеется, легкомысленным флиртом с  кра­ сивыми и загадочными женщинами, которых странным образом привлекал полноватый седобородый профессор электротехники в очках с толстыми стеклами). Увы, все свои детективные изыс­ кания я проводил, сгорбившись в кресле перед экраном компью­ тера дома или на работе. Важный ключ предоставил мне сам Генри, написав после своего имени в статье 1848 года «бакалавр искусств, Тринити­колледж, Кембридж». В  ответ на отправлен­ ное по электронной почте письмо в  справочный отдел библио­ теки Тринити­колледжа я получил дату его рождения, имена ро­ дителей, а также даты поступления и окончания школы (спасибо Джонатану Смиту из Тринити). Затем я (электронно) отправился в Принстонский университет, в котором хранится экземпляр ка­ талога научных работ Королевского общества и где по моей прось­ бе нашли все опубликованные работы Генри (спасибо Митчеллу К. Брауну из физико­математической библиотеки Принстонского Файн­холла). Затем в один прекрасный день я наткнулся на сайт, посвященный историческому описанию медных мемориаль­ ных досок во всех церквях Англии и Уэльса. Там я нашел записи о родителях Генри и о самом Генри; надпись на его доске содер­ жит год смерти (спасибо английскому историку Уильяму Лэку за поддержание этого сайта). А  зная эту дату, я  уже смог получить копию завещания Генри, которое начиналось с  подтверждения того, что это действительно «бывший член Тринити­колледжа»,

ПРИМЕЧАНИЯ

387

а также копию его свидетельства о  смерти (благодарю архивис­ тов графств Чешир и Честер – Уилбрэхэм похоронен на кладби­ ще церкви св.  Девы Марии в  Уиверхэме, графство Чешир,  – за быструю отправку копии завещания и Управление записи актов гражданского состояния за очень быстрый ответ на мой запрос о копии свидетельства о смерти). 25. Школа Харроу, находящаяся в Лондоне, имеет долгую и слав­ ную историю. Основанная в 1752 году по указу королевы Елизаве­ ты I, она гордится длинной чередой знаменитых учеников, в т. ч. лордом Байроном и Уинстоном Черчиллем. Многие молодые чи­ татели этой книги почти наверняка знакомы со школой Харроу, сами того не подозревая, – там велись съемки школы чародейства и волшебства Хогвартс, в которой учился Гарри Поттер. На самом деле класс профессора заклинаний Флитвика – это кабинет четвер­ того класса в школе Харроу, на стенах и партах которого каждый ученик до 1847 года по традиции вырезал свое имя. А раз так, то и имя Генри Уилбрэхэма должно быть где­то там, и если читателю доведется побывать в Харроу и найти имя Генри, пожалуйста, дай­ те мне знать (а еще лучше отправьте фотографию)! 26. В  1914 году немецкий математик и  историк науки Генрих Буркхардт (1861–1914) опубликовал огромную энциклопедиче­ скую статью об истории тригонометрических рядов и  интегра­ лов до 1850 года, и работа Уилбрэхэма 1848 года была в ней упо­ мянута. Но снова никто не обратил на нее внимания; например, тремя годами позже шотландский математик Горацио Карслоу (1870–1954) опубликовал в журнале American Journal of Mathemat­ ics статью о явлении Гиббса с замечанием, что «самое удивитель­ ное – что его присутствие в рядах Фурье оставалось незамеченным так долго». Бедняга Уилбрэхэм так и не был признан до 1917 года. И лишь в 1925 году Карслоу и американский математик Чарльз Мур (1882–1967) (написавший докторскую диссертацию под руковод­ ством Бохера) одновременно опубликовали исторические заметки в имевшем широкую аудиторию математическом журнале Bulletin of the American Mathematical Society, отдавая приоритет Уилбрэ­ хэму. Правда, на памяти о нем это никак не сказалось – почти во всех учебниках по электротехнике и  математике Уилбрэхэм по­ прежнему не упоминается. 27. Рассказ о том, как сам Гаусс решил эту задачу без примене­ ния рядов Фурье, можно найти в книге: Trygve Nagell. Introduction to Number Theory. John Wiley, 1951. С. 177–180.

388

ПРИМЕЧАНИЯ

28. Хорошее пособие по многообразным возможностям, свя­ занным с  этими суммами, см. в  статье: Bruce R. Berndt and Ro­ nald J. Evans. The Determination of Gauss Sums // Bulletin of the Ame­ rican Mathematical Society, сентябрь 1981. С. 107–129. 29. См.: AIT. С.  175–180. Интегралы Френеля названы в  честь французского физика и  математика Огюстена Жана Френеля (1788–1827), который столкнулся с ними в 1818 году при изучении природы света. Мы еще встретимся с ними в разделе 5.7. 30. См. мою книгу «When Least Is Best» (Princeton University Press, 2004), стр. 251–257. 31. Эта формула приводится во многих учебниках математиче­ ского анализа. Если вы хотите посмотреть, как она выводится дву­ мя разными способами, обратитесь к  книге «When Least Is Best» (см. примечание 30), стр. 352–358.

Глава 5. Интегралы Фурье 1. См., например: Kevin Davey. Is Mathematical Rigor Necessary in Physics? // British Journal for the Philosophy of Science, сентябрь 2003. С. 439–463. Дэви отвечал на этот вопрос (нужна ли матема­ тическая строгость в  физике?) «пожалуй, нет» и  тем наверняка заслужил бы одобрение Дирака. Размышляя об успешном исполь­ зовании импульсов и интегралов Дираком, я вспоминаю о знаме­ нитом замечании, которое математик из Виргинского универси­ тета Э. Дж. Макшейн (1904–1989) обронил в своем президенском послании на ежегодном собрании Американского математическо­ го общества в  1963 году: «В этом мире есть оптимисты, которые думают, что любой символ, начинающийся знаком интеграла, не­ пременно означает нечто такое, что обладает всеми свойствами, которые они хотели бы видеть у  интеграла. Конечно, это очень раздражает нас, строгих математиков. Но еще больше раздражает то, что частенько они получают правильный ответ». Полный текст послания Макшейна «Integrals Devised for Special Purposes» опуб­ ликован в журнале Bulletin of the American Mathematical Society 69, 1963, стр.  597–627. Как и  Дирак, Макшейн получил степень бака­ лавра по электротехнике. 2. Paul Dirac. The Physical Interpretation of Quantum Mechanics // Proceedings of the Royal Society of London A113, январь 1, 1927. С. 621–641.

ПРИМЕЧАНИЯ

389

3. Paul Dirac. The Man and His Work. Cambridge University Press, 1998. С. 3. 4.  John Stalker. Complex Analysis: Fundamentals of the Classical Theory of Functions. Birkhsuser, 1998. С. 120. Профессор Сталкер го­ ворил о корректности изменения порядка двух бесконечных сум­ мирований. 5. В том, что касается этого свойства, я  хотел бы сделать одно уточнение. Если f(t) периодическая с периодом T, то Rf (t) тоже пе­ риодическая с периодом T, и, стало быть, Rf (t) достигает максиму­ ма не только при t = 0, но и при t = ±kT, где k – любое целое число. Обычно это формулируют следующим образом: если существует постоянное T > 0 такое, что Rf (0) = Rf (T), тогда Rf (t) периодическая с периодом T. Это довольно легко доказать (с помощью неравенства Коши– Шварца, которое мы вывели в разделе 1.5); если f(t) и g(t) – произ­ вольные вещественные функции, то

Если положить g(t) = f(t - t + T) - f(t - t), то это неравенство принимает вид

Левая часть равна [Rf (t - T) - Rf (t)]2. Интеграл в правой части равен

т. е. Rf (0) - Rf (T) - Rf (T) + Rf (0) = 2Rf (0) - 2Rf (T). Таким образом,

390

ПРИМЕЧАНИЯ

где равенство нулю следует из того, что по условию Rf (0)  = Rf (T). Левая часть (полный квадрат) не может быть отрицательной, поэтому неравенство обращается в  равенство. Это значит, что [Rf (t - T) - Rf (t)]2 = 0, т. е. Rf (t - T) = Rf (t) для всех t. Но это и есть определение периодичности с периодом T, что и требовалось до­ казать. 6.  Захватывающее обсуждение приоритета Эйнштейна в  исто­ рии с  теоремой Винера–Хинчина можно найти в  написанной А. М. Яглом в 1985 году статье «О работе Эйнштейна 1914 г. по тео­ рии беспорядочно флуктуирующих рядов наблюдений», первона­ чально опубликованной на русском языке, а затем переведенной на английский и напечатанной в журнале IEEE ASSP Magazine, ок­ тябрь 1987, стр. 7–11. 7. Заметим, что спектральная плотность энергии (СПЭ) df/dt равна 1/2p|iwF(w)|2 = w2(1/2p)|F(w)|2, т. е. СПЭ функции f(t), умножен­ ной на в w2. Это означает, что СПЭ df / dt больше, чем СПЭ f(t), если |w| > 1, т.  е. дифференцирование по времени увеличивает энер­ гию высокочастотных сигналов, т. е. «шум». Именно по этой при­ чине инженеры не используют электронные дифференцирующие устройства при построении аналоговых компьютерных схем для решения дифференциальных уравнений (хотя многие считают, что это было бы «естественно»). Причина теперь очевидна – если в схеме присутствует шум (а полностью избавиться от шума прак­ тически невозможно), то дифференцирующее устройство только сделает шум хуже. Поэтому схемы для решения дифференциаль­ ных уравнений основаны на интегрирующих устройствах (которые подавляют высокочастотный шум). 8. Заметим, что подынтегральное выражение в  интегральном представлении |t| хорошо себя ведет для всех w, в т. ч. при w = 0. Вспомним разложение cos(x) в ряд Фурье

поэтому

ПРИМЕЧАНИЯ

391

или

или

или

А поскольку |w|®¥, то очевидно, что подынтегральное выраже­ ние стремится к  нулю, как 1/w2, поскольку абсолютная величина числителя никогда не превосходит 2 при любом w или t. Следова­ тельно, подынтегральное выражение «не вытворяет ничего стран­ ного» при всех значениях w, в т. ч. w = 0. 9. Мы, конечно, могли бы подставить любое значение t и полу­ чить некую «формулу суммирования Пуассона». При t  = 0 полу­ чается классический результат. При его выводе Пуассон действи­ тельно использовал ряды Фурье, но совершенно не так, как мы. На самом деле его результат был более общим, чем приведенный в тексте книги. См.: Математика XIX века. Т. 3 / под ред. А. Н. Кол­ могорова и А. П. Юшкевича. 10. См. вывод мощью замены переменной

в  AIT, стр.  177–178. Затем с  по­ получаем

11.  Колокольный импульс – не единственная функция, являю­ щаяся своим собственным преобразованием Фурье. Этим свой­ ством обладает целый класс функций, основанных на полиномах Эрмита. См.: Athanasious Papoulis. The Fourier Integral and Its App­ lications. McGraw­Hill, 1962 (в частности, см. задачи 6 и 7 на стр. 76 и их решения на стр. 78). 12. На эту тему есть очень интересная небольшая книжка: Ri­ chard Bellman. A Brief Introduction to Theta Functions. Holt, Rinehardt and Winston, 1961. 13. Arthur Schuster. On the Total Reflexion of Light. Proceedings of the Royal Society of London, 107A, 1925. С. 15–30.

392

ПРИМЕЧАНИЯ

14. E. C. Titchmarsh. Godfrey Harold Hardy, 1877–1947. Obituary No­ tices of Fellows of the Royal Society of London 6, 1949. С. 447–470. 15. Все работы Харди, написанные им одним или в соавторстве, собраны в семи томах, насчитывающих в совокупности 5000 стра­ ниц: Collected Papers of G. H. Hardy. Oxford University Press, 1979. 16. Эта статья «A Definite Integral Which Occurs in Physical Optics» была опубликована в журнале Proceedings of the London Mathemat­ ical Society, vol. 24 (1925), но проще найти ее в томе 4 «Собрания сочинений» (см. примечание 15), стр. 522–523.

Глава 6. Электроника и  -1 1. См., например: Michael Eckert. Euler and the Fountains of Sans­ souci // Archive for History of Exact Sciences 56, 2002. С.  451–468; C. Truesdell. Eulerʼs Contribution to the Theory of Ships and Mecha­ nics. An Essay Review // Centaurus 26, 1983. С.  323–335; A. J. Aiton. The Contributions of Newton, Bernoulli and Euler to the Theory of the Tides // Annals of Science 11, 1956. С.  206–223; J. A. Van den Broek. Eulerʼs Classic Paper ‘On the Strength of Columnsʼ // American Journal of Physics, июль­август 1947. С. 309–318. 2. Когда­то у меня был начальник, который и вправду нарисовал для меня на своей доске схему, изображенную на рис. 6.2.1, только вместо x(t) написал слово «задача», вместо y(t) – «ответ», а вместо h(t) – «решение». Затем он указал на решение и сказал своему юно­ му, только что принятому на работу сотруднику: «Иди и добудь его, тигр!» (Чтобы стать руководителем проекта, вы должны научиться нести такую пургу, не краснея.) Я только что окончил университет и, не имея опыта, не мог сказать, шутит он или нет. Да и до сих пор не уверен, что это было. 3. Иногда их называют также соотношениями Крамерса–Крони­ га в  честь голландского физика Хендрика Крамерса (1894–1952) и  американского физика Ральфа Кронига (1904–1995), которые столкнулись с  преобразованием Гильберта в  1920­х годах при изучении спектров рентгеновского излучения, рассеивающегося на атомных решетчатых структурах кристаллов. Выражения, вы­ веденные в тексте, – не единственный способ их записи. Альтер­ нативная форма основана на следующем наблюдении: поскольку h(t) вещественная, мы знаем (это объяснялось в разделе 5.1), что R(-w)  = R(w) и  X(-w)  = -X(w). Следовательно, первый интеграл в преобразовании Гильберта можно записать в виде

ПРИМЕЧАНИЯ

393

В первом интеграле в правой части сделаем замену переменной s = -t. Тогда

Таким образом,

Повторив это рассуждение для второго интеграла в преобразо­ вании Гильберта (сделайте это самостоятельно), находим

4. По крайней мере, мы думаем, что закон причинности фун­ даментален. Он не является следствием других известных физи­ ческих законов, поэтому, быть может, причинность не является непререкаемым требованием. Мы просто полагаем, что это так, наблюдая за кажущимся поведением мира. Ложность этой веры была бы продемонстрирована, если бы была построена машина времени – см. мою книгу «Time Machines: Time Travel in Physics, Metaphysics, and Science Fiction» (Springer­Verlag, 1999) . 5. Norbert Wiener. I Am a Mathematician: The Later Life of a Prodigy. MIT Press, 1956. С.  168–169 (Винер Н. Я – математик. Дальнейшая жизнь вундеркинда. R&C Dynamics, 2001). Вывод интеграла Пэли– Винера выходит далеко за рамки этой книги, но если вам интересно, можете почитать, как это делается, в книге: Athanasious Papoulis. The Fourier Integral and Its Applications. McGraw­Hill, 1962. С. 215–217.

394

ПРИМЕЧАНИЯ

6. Это объяснение, теоретически верное, не совсем точно совпа­ дает с тем, как на самом деле работает радиоприемник AM­диапазо­ на. По практическим соображениям, имеются некоторые отличия (например, полосовой фильтр выбора диапазона не настраивае­ мый). Если вам интересны детали работы AM­радио, обратитесь к моей книге «The Science of Radio» (2­е изд. Springer­Verlag, 2001). 7. Допустим, что мы объединили два входа умножителя и  тем самым свели умножитель к частному случаю устройства для воз­ ведения в квадрат с одним входом. Тогда выход схемы на рис. 6.3.1 равен y(t) = x2(t), где x1(t) = x2(t) = x(t). Удвоение входа ЛСС­блока должно удваивать его выход, но выход устройства для возведения в квадрат, очевидно, учетверяется. 8. Математически этот результат был, конечно, известен задолго до изобретения AM­радио, но название теоремы предложил аме­ риканский инженер­электрик Реджинальд Фессенден (1866–1932), который в  1901 году запатентовал идею умножения для исполь­ зования в радиосхемах. Слово гетеродин происходит от греческих слов heteros (внешний) и dynamic (сила). Фессенден рассматривал входной сигнал cos(wct) как «внешнюю силу», генерируемую самой схемой радиоприемника (на самом деле радиоинженеры называ­ ют эту часть AM­радиоприемника местным генератором колеба­ ний, или местным гетеродином). 9. Дело вот в чем. Синхронный приемник на рис. 6.3.3 показы­ вает конечный обнаруженный сигнал на выходе фильтра нижних частот, который пропорционален m(t), что нам и  нужно. Однако если сигнал местного генератора колебаний сдвинут по фазе от­ носительно удаленного генератора колебаний на передатчике, то выход умножителя равен r(t)cos(wct + q), или поскольку принятый сигнал r(t) пропорционален m(t)cos(wct), то выход умножителя про­ порционален m(t)cos(wct)cos(wct + q) = 1/2m(t)[cos(q) + cos(2wct)]. То есть выход фильтра нижних частот пропорционален не m(t), а m(t) cos(q). Поэтому сдвиг по фазе проявляется в приемнике с синхрон­ ной демодуляцией как коэффициент ослабления амплитуды. Это, конечно, не фатальная проблема (если только q не равно 90°, по­ скольку в этом случае на выходе фильтра нижних частот не будет никакого сигнала). Вы можете возразить, что если q ¹ 90°, то ослаб­ ление можно компенсировать, просто «увеличив громкость». Про­ блема в том, что q почти наверняка будет изменяться во времени. Такой приемник можно будет слушать, только постоянно подкру­ чивая регулятор громкости. Его никто не купит! Похожая пробле­

ПРИМЕЧАНИЯ

395

ма возникает при рассогласовании частоты (убедитесь в этом са­ мостоятельно). С исторической точки зрения, интересно отметить, что еще в  1930 году был выдан по крайней мере один патент на схему синхронизации несущей частоты, удивительно похожий на метод, используемый в  наши дни (для читателей с  техническим складом ума скажу, что это была схема автоматической фазовой подстройки частоты с отрицательной обратной связью). 10. В реальном AM­радиоприемнике первичный сигнал восста­ навливается невероятно простой (и дешевой) схемой, которая на­ зывается детектор огибающей и позволяет не выполнять послед­ нее умножение на cos(wct). Снова отсылаю вас к своей книге «The Science of Radio», стр. 59–60. 11. Я  считаю необходимым объяснить слово «превышающий». Это означает, что для восстановления m(t) по ms(t) посредством фильтрации нижних частот необходимо условие ws > 2wm, а  не ws ³ 2wm. Глядя на рис. 6.4.2, может показаться, что это пустяк, по­ тому что при ws = 2wm различные копии спектра лишь касаются, но не перекрываются. Может показаться, что это не проблема (если не считать теоретической невозможности построить реальный фильтр нижних частот с  вертикальным спадом, который мог бы селектировать копию M(w) с центром в w = 0), но что, если в m(t) присутствуют импульсы при w  = ±wm? Это имело бы место, если бы m(t) содержал синусоидальную компоненту с частотой w = wm. Тогда на частоте ws  = 2wm были бы импульсы в  соседних копиях M(w), наложенные друг на друга. Чтобы избежать этого, мы должны настоять на выполнении условия ws > 2wm. По­другому это можно увидеть, рассуждая непосредственно в терминах временной обла­ сти. Предположим, что m(t) – чистая синусоида с частотой w = wm. Если взять отсчет такого сигнала m(t) при ws = 2wm, то может слу­ читься, что каждый «взгляд» на m(t) приходится на момент, когда m(t) проходит через ноль, т. е. все значения ms(t) равны 0! Очевид­ но, что по такому «всюду нулевому» ms(t) невозможно восстано­ вить ненулевой сигнал m(t). И чтобы избежать подобной теорети­ ческой возможности, мы снова должны настаивать на выполнении условия ws > 2wm. 12. См. «The Science of Radio» (см. примечание 6), стр. 248–249. 13. См., например: Sidney Darlington. Realization of a Constant Phase Difference // Bell System Technical Journal, January 1950. С. 941– 944; Donald K. Weaver, Jr. Design of RC Wide­Band 90­Degree Phase­ Difference Network // Proceedings of the IRE, April 1954. С. 671–676.

396

ПРИМЕЧАНИЯ

В  статье Уивера приведен пример схемы (с шестью резисторами и  шестью конденсаторами), которая для любого входного сигна­ ла частотой от 300 Гц до 3 кГц генерирует два выходных сигнала, разность фаз которых отклоняется от 90° не более чем на 1.1° (он отмечает, что конструировал и  более сложные схемы, в  которых отклонение от 90° не превышало 0.2° в том же интервале частот). Компьютерную модель схемы Уивера можно найти в  книге «The Science of Radio» (см. примечание 6), стр. 275. 14. Raymond Heising. Production of Single Sideband for Trans­Atlan­ tic Radio Telephony // Proceedings of the IRE, июнь 1925. С. 291–312. 15. Рисунок 6.6.3 создан с  помощью функции hilbert(x) из па­ кета MATLAB, принимающей комплексный вектор x, веществен­ ная часть которого заполняется исходной функцией от времени, и помещает преобразование Гильберта этой вещественной части в мнимую часть x. Таким образом, MATLAB создает аналитический сигнал. Имея окончательный вариант x, легко построить такие графики, как на рис. 6.6.3. Для всех графиков на рис. 6.6.3 времен­ ной шаг равен 0.001 с. На машине с  процессором частотой 3 ГГц построение графиков заняло 0.11 секунды (при этом было выпол­ нено два миллиона операций с плавающей точкой). 16. Если , то, как мы знаем,

Поскольку

,

То есть  = -X(w) для всех w. Иными словами, преобразова­ ние Фурье равно -X(w), а следовательно,  = -x(t), что и тре­ бовалось доказать. 17. Donald K. Weaver, Jr. A Third Method of Generation and Detecti­ on of Single­Sideband Signals // Proceedings of the IRE, декабрь 1956. С. 1703–1705. (Этот тот же Уивер, который упоминался в примеча­ нии 13.) 18. В учебниках по электротехнике при обсуждении схемы Уиве­ ра часто можно встретить условие, согласно которому m(t) должна иметь ненулевой зазор вокруг точки w  = 0, в  котором нет энер­

ПРИМЕЧАНИЯ

397

гии (правда, не всегда объясняется, почему). Это условие наложил сам Уивер. Если это так, то фильтр нижних частот не обязан иметь вертикальный спад, что было бы большим плюсом схемы Уиве­ ра (помимо устранения необходимости в  преобразователе Гиль­ берта). В работе 1956 года Уивер описал реальную электрическую схему конкретного генератора ОПР­радиосигнала (wс = 2p · 106 Гц) с зазором без энергии в полосе -300 Гц < w < 300 Гц (отсутствие энергии на таких низких частотах не сказывается на разборчи­ вости речи или качестве музыки) и wm = 2p · 3300 Гц. В его схеме w0 располагалось в середине интервала с ненулевой энергией, т. е. w0 = 2p((300 + 3300)/2) = 2p · 1800 Гц. 19.  Philip J. Davis. Leonhard Eulerʼs Integral: A Historical Profile of the Gamma Function // American Mathematical Monthly, декабрь 1959. С. 849–869.

Эйлер – человек, математик и физик 1. David Brewster. A Life of Euler // Letters of Euler on Different Sub­ jects in Natural Philosophy Addressed to a German Princess. J.&J. Har­ per, 1833; J. J. Burckhardt. Leonhard Euler, 1707–1783 // Mathematics Magazine, ноябрь 1983. С. 262–273; статья А. П. Юшкевича об Эйле­ ре в: Dictionary of Scientific Biography, vol. 4. С. 467–484; C. Truesdell. Leonhard Euler, Supreme Geometer 1707–1783 // Irrationalism in the Eighteenth Century / под ред. Harold E. Pagliaro. Press of Case Western Reserve University, 1972. С.  51–95; Ronald Calinger. Leonhard Euler: The Swiss Years // Methodology and Science, vol. 162, 1983. С. 69–89; Ronald Calinger. Leonhard Euler: The First St. Petersburg Years (1727– 1741) // Historia Mathematica, май 1996. С. 121–166. 2. Дополнительные сведения об этой стороне личности Бернул­ ли см. в моей книге «When Least is Best» (Princeton University Press, 2004), стр. 211, 244–245. 3. Один историк (Кэлинджер, 1983 – см. примечание 1) говорит, что Эйлер «дал первый правильный ответ» на этот вопрос и  что «Эйлер отверг оба существовавших тогда мнения: что камень либо остановится в  центре Земли, либо продолжит движение дальше. Взамен он доказал, что он отскочит от центра и вернется по той же траектории на поверхность». Странно, ведь это неверный ответ! Приводится ссылка на обсуждение того, что эта задача поставила в  тупик даже великого Ньютона, но это обсуждение лишь пока­ зывает, что «загадка» касалась природы силы притяжения внут­

398

ПРИМЕЧАНИЯ

ри Земли. Если R – радиус Земли, а r – расстояние между камнем и центром Земли, то, как всем известно, сила тяжести обратно про­ порциональна квадрату r, если r ³ R. К 1685 году Ньютон знал, что сила тяжести прямо пропорциональна r (если считать Землю равно­ мерно плотным шаром), если r