Д.ПОЙА

МАТЕМАТИКА И ПРАВДОПОДОБНЫЕ РАССУЖДЕНИЯ

Д.ПОЙА

МАТЕМАТИКА И ПРАВДОПОДОБНЫЕ РАССУЖДЕНИЯ

Перевод с английского И. А. ВАЙНШТЕЙНА

Под редакцией

С. А. ЯНОВСКОЙ

ИЗДАНИЕ ВТОРОЕ, ИСПРАВЛЕННОЕ

ИЗДАТЕЛЬСТВО «НАУКА»

ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ

Москва 1975

51

П 47

УДК 510

MATHEMATICS AND PLAUSIBLE REASONING

Vol I

INDUCTION AND ANALOGY IN MATHEMATICS

Vol II

PATTERNS OF PLAUSIBLE INFERENCE

B, G. Polya

PRINCETON UNIVERSITY PRESS PRINCETON, NEW JERSEY 1954

Данная книга обращена прежде всего к тем, кто изучает математику, — начиная от учащихся старших классов и студентов и кончая специалистами в различных областях, которым приходится встречаться с применением математических методов исследования. Читатель узнает, какими путями добываются новые факты в математике, с какой степенью доверия следует относиться к той или иной математической гипотезе — одним словом, перед ним раскрывается подлинный процесс математического творчества. (Автор особенно подчеркивает общность путей открытия истин для всех естественных наук.) Благодаря этому книга является также незаменимым пособием для преподавателей математики всех ступеней. Увлекательность изложения, обилие исторических иллюстраций, а также предпринятая автором попытка построения теории правдоподобных (индуктивных) умозаключений делают книгу интересной и для профессионала-математика.

ОГЛАВЛЕНИЕ

Предисловие редактора перевода ....................... 9

Предисловие.................................. 14

Советы читателю................................ 21

Том I

ИНДУКЦИЯ И АНАЛОГИЯ В МАТЕМАТИКЕ

Глава I. Индукция.............................. 25

1. Опыт и представление.................... 25

2. Наводящие контакты .................... 26

3. Подкрепляющие контакты.................. 28

4. Индуктивный подход.................... 30

Примеры и примечания к главе I............... 31

[12. Да и нет. 13. Опыт и поведение. 14. Логик, математик, физик и инженер.]

Глава II. Обобщение, специализация, аналогия.............. 34

1. Обобщение, специализация, аналогия и индукция .... 34

2. Обобщение.......................... 34

3. Специализация........................ 35

4. Аналогия........................... 35

5. Обобщение, специализация и аналогия .......... 37

6. Открытие по аналогии.................... 39

7. Аналогия и индукция.................... 43

Примеры и примечания к главе II.............. 45

Первая часть .......................... 45

[1. Правильное обобщение. 5. Крайний частный случай. 7. Ведущий частный случай. 10. Частный случай-представитель. 11. Аналогичный случай. 18. Великие аналогии. 19. Выясненные аналогии. 20. Цитаты.]

Вторая часть .......................... 51

[21. Предположение Э. 44. Возражение и первый шаг к доказательству. 45. Второй шаг к доказательству. 46. Опасности аналогии.]

Глава III. Индукция в пространственной геометрии ........... 56

1. Многогранники....................... 56

2. Первые подкрепляющие контакты............. 58

3. Еще подкрепляющие контакты .............. 59

4. Суровое испытание..................... 60

5. Подтверждения и подтверждения............. 62

6. Совсем не похожий случаи ................ 63

7. Аналогия.......................... 63

8. Разбиение пространства.................. 65

9. Видоизменение задачи................... 66

10. Обобщение, специализация, аналогия .......... 66

11. Одна аналогичная задача ................. 67

12. Серия аналогичных задач................. 68

13. Много задач иногда легче решить, чем только одну . . 69

14. Предположение....................... 69

15. Предсказание и подтверждение.............. 70

16. Снова и лучше....................... 71

17. Индукция подсказывает дедукцию; частный случай подсказывает общее доказательство.............. 72

18. Еще предположения.................... 73

Примеры и примечания к главе III.............. 74

[21. Индукция: приспособление ума, приспособление языка. 31. Работа Декарта о многогранниках. 36. Дополнительные телесные углы, дополнительные сферические многоугольники.]

Глава IV. Индукция в теории чисел.................... 80

1. Целочисленные прямоугольные треугольники....... 80

2. Суммы квадратов....................... 83

3. О сумме четырех нечетных квадратов........... 84

4. Исследование примера.................... 85

5. Составление таблицы наблюдений............. 86

6 Каково правило?....................... 86

7. Природа индуктивного открытия.............. 89

8. О природе индуктивных доводов.............. 90

Примеры и примечания к главе IV.............. 92

[1. Обозначения. 26. Опасности индукции.]

Глава V. Разные примеры индукции.................... 97

1. Разложения.......................... 97

2. Приближения......................... 99

3. Пределы ........................... 101

4. Попытка опровергнуть ................... 101

5. Попытка доказать...................... 103

6. Роль индуктивной фазы................... 105

Примеры и примечания к главе V.............. 106

[15. Объясните наблюдаемые закономерности. 16. Классифицируйте наблюдаемые факты. 18. В чем различие?]

Глава VI. Одно более общее утверждение................. 111

1. Эйлер............................. 111

2. Мемуар Эйлера........................ 111

3. Переход к более общей точке зрения........... 120

4. Схематический очерк мемуара Эйлера........... 121

Примеры и примечания к главе VI.............. 122

[1. Производящие функции. 7. Одна комбинаторная задача плоской геометрии. 10. Суммы квадратов. 19. Другая рекуррентная формула. 20. Другой Наиболее Необычайный Закон Чисел, Относяшийся к Суммам их Делителей. 24. Как Эйлер упустил открытие. 25. Обобщение теоремы Эйлера о о(n).]

Глава VII. Математическая индукция ................... 128

1. Индуктивная фаза...................... 128

2. Фаза доказательства..................... 130

3. Исследование переходов................... 130

4. Техника математической индукции............. 132

Примеры и примечания к главе VII............. 137

[12. Доказать больше иногда легче. 14 Уравновесьте вашу теорему/ 15, Перспектива. 17. Равны ли любые n чисел?]

Глава VIII. Максимумы и минимумы.................... 141

1. Схемы............................. 141

2. Пример............................ 142

3. Схема касательной линии уровня ............. 144

4. Примеры........................... 146

5. Схема частного изменения.................. 148

6. Теорема о среднем арифметическом и среднем геометрическом и ее первые следствия ............... 150

Примеры и примечания к главе VIII............. 152

Первая часть .......................... 152

[1. Наименьшие и наибольшие расстояния в плоской геометрии. 2. Наименьшие и наибольшие расстояния в пространственной геометрии. 3. Линии уровня на плоскости. 4. Поверхности уровня в пространстве. 11. Принцип пересекающей линии уровня. 22. Принцип частного изменения. 23. Существование экстремума. 24. Видоизменение схемы частного изменения: бесконечный процесс. 25. Другое видоизменение схемы частного изменения: конечный процесс. 26. Графическое сравнение.]

Вторая часть .......................... 157

[33. Многоугольники и многогранники. Площадь и периметр. Объем и поверхность. 34. Прямая призма с квадратным основанием. 35. Прямой цилиндр. 36. Произвольная прямая призма. 37. Прямая двойная пирамида с квадратным основанием. 38. Прямой двойной конус. 39. Произвольная прямая двойная пирамида. 43. Приложение геометрии к алгебре. 45. Приложение алгебры к геометрии. 51. Прямая пирамида с квадратным основанием. 52. Прямой конус. 53. Произвольная прямая пирамида. 55. Ящик без крышки. 56. Корыто. 57. Обломок. 62. Почтовая задача. 63. Задача Кеплера.]

Глава IХ. Физическая математика ..................... 161

1. Оптическая интерпретация................. 161

2. Механическая интерпретация................ 165

3. Новая интерпретация.................... 167

4. Открытие брахистохроны Иоганном Бернулли...... 171

5. Открытие Архимедом интегрального исчисления..... 173

Примеры и примечания к главе IX.............. 177

[3. Треугольник с минимальным периметром, вписанный в данный треугольник. 9. Транспортный центр четырех точек в пространстве. 10. Транспортный центр четырех точек на плоскости. 11 Транспортная сеть для четырех точек. 12. Разверните и выпрямите. 13. Бильярд. 14. Геофизическое исследование. 23. Кратчайшие линии на многогранной поверхности. 24. Кратчайшие (геодезические) линии на кривой поверхности. 26. Построение посредством сгибания бумаги. 27. Бросается кость. 28. Всемирный потоп. 29. Не слишком глубоко. 30. Полезный крайний случай. 32. Вариационное исчисление. 33. От равновесия поперечных сечений к равновесию тел. 38. Ретроспективный взгляд на Метод Архимеда.]

Глава Х. Изопериметрическая задача.................... 185

1. Индуктивные доводы Декарта............... 185

2. Скрытые доводы....................... 186

3. Физические доводы..................... 187

4. Индуктивные доводы лорда Рэлея............. 187

5. Выведение следствий..................... 188

6. Подтверждение следствий.................. 191

7. Очень близко......................... 195

8. Три формы изопериметрической теоремы......... 196

9. Приложения и вопросы................... 198

Примеры и примечания к главе X.............. 199

Первая часть .......................... 199

[1. Взгляд назад. 2. Могли бы вы вывести какую-либо наешь этого результата иначе? 3. Заново с большими подробностями. 7. Можете ли вы воспользоваться этим методом для решения какой-нибудь другой задачи? 8. Более сильная форма изопериметрической теоремы.]

Вторая часть .......................... 200

[16. Палка и веревка. 21. Две палки и две веревки. 25. Задача Дидоны в пространственной геометрии. 27. Биссекторы плоской области. 34. Биссекторы замкнутой поверхности. 40. Фигура многих совершенств. 41. Аналогичный случай. 42. Правильные многогранники. 43. Индуктивные доводы.]

Глава XI. Другие виды правдоподобных доводов............. 206

1. Предположения и предположения ............. 206

2. Суждение по родственному случаю............. 206

3. Суждение по общему случаю................ 208

4. Более простое предположение предпочтительнее..... 210

5. Фон.............................. 212

6. Неисчерпаем......................... 215

7. Обычные эвристические допущения ............ 216

Примеры и примечания к главе XI.............. 217

[16. Общий случай. 19. Никакая идея не является действительно плохой. 20. Несколько обычных эвристических допущений. 21. Вознагражденный оптимизм. 23. Числовые выкладки и инженер.]

Заключительное замечание к первому тому................. 224

Том II

СХЕМЫ ПРАВДОПОДОБНЫХ УМОЗАКЛЮЧЕНИЙ

Предисловие ко II тому ........................... 227

Глава XII. Несколько бросающихся в глаза схем............. 229

1. Подтверждение следствия.................. 229

2. Последовательное подтверждение нескольких следствий . 231

3. Подтверждение невероятного следствия.......... 233

4. Умозаключение по аналогии................ 236

5. Углубление аналогии.................... 237

6. Затушеванное умозаключение по аналогии........ 239

Примеры и примечания к главе XII............. 240

[14. Индуктивное умозаключение по бесплодным усилиям.]

Глава XIII. Дальнейшие схемы и первые связи между схемами .... 244

1. Исследование следствия.................. 244

2. Исследование возможного основания........... 245

3. Исследование противоречащего предположения..... 246

4. Логические термины.................... 246

5. Логические связи между схемами правдоподобных умозаключений ......................... 250

6. Затушеванное умозаключение............... 251

7. Таблица........................... 253

8. Комбинация простых схем................. 253

9. Об умозаключении по аналогии.............. 254

10. Уточненное умозаключение ................ 255

11. О последовательных подтверждениях........... 258

12. О соперничающих предположениях............ 258

13. О судебном доказательстве ................ 260

Примеры и примечания к главе XIII............. 266

Первая часть .......................... 266

[9. Об индуктивном исследовании в математике и в физических науках. 10. Пробные общие формулировки.]

Вторая часть .......................... 271

[11. Более личное, более сложное. 12. Существует прямая, соединяющая две данные точки. 13. Существует прямая, проходящая через данную точку в данном направлении. Проведение параллели. 14. Наиболее очевидный случай может оказаться единственным возможным случаем. 15. Установление моды. Сила слов. 16. Это слишком невероятно, чтобы быть всего лишь совпадением. 17. Совершенствование аналогии. 18. Новое предположение. 19. Еще одно новое предположение. 20. Что типично?]

Глава XIV. Случай. Неизменное соперничающее предположение .... 281

1. Случайные массовые явления............... 281

2. Понятие вероятности.................... 283

3. Применение мешка и шаров................ 287

4. Исчисление вероятностей. Статистические гипотезы . . . 290

5. Непосредственное предсказание частот.......... 292

6. Объяснение явлений.................... 298

7. Оценка статистических гипотез.............. 301

8. Выбор между статистическими гипотезами........ 306

9. Оценка нестатистических предположений ........ 313

10. Оценка математических предположений......... 326

Примеры и примечания к главе XIV............. 329

Первая часть .......................... 329

Вторая часть .......................... 330

[19. О понятии вероятности. 20. Как не следует истолковывать понятие вероятности, основанное на частоте. 24. Вероятность и решение задач. 25. Правильный и неправильный. 26. Фундаментальные правила исчисления вероятностей. 27. Независимость. 30. Перестановки и вероятность. 31. Сочетания и вероятность. 32. Выбор соперничающего статистического предположения. Пример. 33. Выбор соперничающего статистического предположения. Общие замечания.]

Глава XV. Исчисление вероятностей и логика правдоподобных рассуждений ............................... 338

1. Правила правдоподобных рассуждений.......... 338

2. Один аспект доказательного рассуждения........ 341

3. Соответствующий аспект правдоподобного рассуждения 342

4. Один аспект исчисления вероятностей. Трудности . . . 346

5. Один аспект исчисления вероятностей. Попытка .... 348

6. Исследование следствия.................. 349

7. Исследование возможного основания........... 353

8. Исследование противоречащего предположения..... 354

9. Исследование одного за другим нескольких следствий . 355 10. О косвенных уликах.................... 358

Примеры и примечания к главе XV............. 359

[4. Вероятность и правдоподобность. 5. Правдоподобие и правдоподобность. 6. Попытка Лапласа связать индукцию с вероятностью. 7. Почему не количественно? 8. Бесконечно малые правдоподобности? 9. Правила допустимости.]

Глава XVI. Правдоподобные рассуждения в изобретении и обучении . . 371

1. Предмет настоящей главы.................. 371

2. Рассказ о маленьком открытии............... 371

3. Процесс решения....................... 374

4. Deus ex machina....................... 375

5. Эвристическое оправдание.................. 377

6. Рассказ о другом открытии................. 378

7. Несколько типичных указаний............... 382

8. Индукция в изобретении.................. 383

9. Несколько слов преподавателю............... 388

Примеры и примечания к главе XVI............. 391

[1. Преподавателю: некоторые типы задан. 7. Qui nimium probat, nihil probat. 8. Близость и правдоподобность. 9. Вычисления и правдоподобные рассуждения. 13. Формальное доказательство и правдоподобные рассуждения.]

Решения.................................... 398

Глава I (398). Глава II (399). Глава III (405). Глава IV (410). Глава V (414). Глава VI (417). Глава VII (420). Глава VIII (423). Глава IX (434). Глава X (440). Глава XI (446). Глава XII (450). Глава XIII (452). Глава XIV (455). Глава XV(460), Глава XVI (461).

Библиография................................. 463

ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА

В применении к такой строгой науке, как математика, имеют ли смысл индукция (конечно, неполная), аналогия, наблюдение, гипотеза, эксперимент, короче говоря, методы, которыми пользуется каждый естествоиспытатель?

Ответу на этот вопрос посвящена книга известного математика и замечательного педагога Д. Пойа.

Советскому читателю, интересующемуся математикой, автор хорошо известен по книге Г. Полиа и Г. Сеге, Задачи и теоремы из анализа, ч. I и II, второе издание которой вышло у нас в 1956 г. Уже в этой книге авторы ставили перед собой задачу указать начинающему математику пути к математическому творчеству, научить его способам, позволяющим лучше разбираться в трудных математических вопросах, открывать математические теоремы, решать задачи. Впоследствии Пойа написал на ту же тему популярную книжку «Как это решить?»1), рассчитанную на учителей математики и учащихся. Настоящая книга, изданная в двух томах в Принстоне (США) в 1954 г., представляет собою итог многолетней работы автора, научной и педагогической, над вопросами о путях математического творчества.

Исследование такого рода естественно отличается от обычных математических работ. Оно основано на наблюдении и обобщении, на попытках проникнуть в творческую лабораторию великих математиков, придумать и поставить подходящий эксперимент. Иными словами, методы исследования здесь, собственно, те же, что и вообще в естествознании. И самое замечательное, что основной итог, к которому приходит Пойа и который он убедительно обосновывает, состоит как раз в том, что в своем математическом творчестве математик так же пользуется наблюдением и обобщением, гипотезой и экспериментом, как это делает всякий естествоиспытатель. Больше

1) См. Д. Пойа, Как решать задачу, второе издание, М., 1961. См. также книгу Д. Пойа, Математическое открытие, М., 1970. — Прим. перев.

того, автор считает даже, что индуктивные, т. е. основанные на вышеперечисленных методах1), рассуждения легче изучать в области математики, чем в какой-либо другой области.

В соответствии с такой установкой автора первая часть книги содержит большое число примеров разных степеней трудности (начиная от самых элементарных), обучающих пользованию индукцией и аналогией в математике. Многие из них заимствованы непосредственно из творчества великих математиков, особенно из трудов Леонарда Эйлера, 250-летие со дня рождения которого отмечалось в текущем году2). Обращение к трудам Эйлера звучит при этом особенно убедительно, поскольку Эйлер не только с непревзойденным до сих пор успехом пользовался индуктивными методами в математике, но и откровенно сообщал читателю пути, которыми шел в своем математическом творчестве.

Вторая часть книги содержит попытку сформулировать правила индуктивного («правдоподобного») рассуждения наподобие логических правил вывода. К каждому из этих правил автор приходит, начиная с конкретных примеров, заимствованных из математики, физики, астрономии, из судебной практики и даже из медицины. Для теоретического обоснования этих правил Пойа привлекает теорию вероятностей, просто и популярно излагая в этой связи нужный ему материал из этой области. Если первая часть книги представляет особый интерес именно в связи с математикой, то вторая относится преимущественно к вопросам индуктивной логики и ее применений в любых областях науки и жизни. Книга написана так, что даже в тех случаях, когда автор предполагает знакомство с математикой, читатель, не обладающий специальными математическими знаниями, тем не менее легко может уследить за основной мыслью автора. Ее могут поэтому с успехом читать люди самых разнообразных специальностей. К тому же вторую часть можно читать совершенно независимо от первой. Но читатель, который начнет со второй части и затем обратится к первой, увидит, сколь интересный материал содержится именно в первой части.

Я позволю себе сделать здесь несколько замечаний по поводу методологических установок автора. Попыткам использовать теорию веро-

1) В отличие от индуктивных в более узком смысле слова, автор называет их «правдоподобными» —plausible —рассуждениями.

2) Предисловие С А. Яновской написано в 1957 г. —Прим. перев.

ятностей для обоснования индуктивной логики, истолковав вероятность как степень правдоподобности (или вводя термин вероятность в различных смыслах: «вероятность-один» как степень правдоподобности и «вероягность-два» основанную на понятии частоты, см. R. Carnap, Logical Foundations of Probability, Chicago, 1950), посвящена в настоящее время большая литература. В книге Пойа мы не найдем строгого обоснования выдвигаемой им теории. Но ряд моментов в ней звучит весьма убедительно для читателя-материалиста. Автор озабочен прежде всего не субъективной, а объективной оценкой степени правдоподобности того или иного аргумента. Он подчеркивает, что, хотя к правдоподобностям применимы некоторые правила, заимствованные из теории вероятностей, правдоподобности нельзя все же рассматривать как числа. Достоверно истинное высказывание имеет, правда, максимальную правдоподобность (которую можно назвать «единицей», а достоверно ложное — минимальную «нуль»), но тем не менее могут существовать и несравнимые (по силе доводов) правдоподобности (в качестве таковых автор приводит, например, правдоподобности: а) теоремы Гольдбаха о сумме двух нечетных простых чисел и б) утверждение, что викинги высадились на американском материке за несколько сот лет до Колумба). Правдоподобности1) образуют, таким образом, лишь частично упорядоченное множество, почему их и нельзя оценивать числами, множество которых линейно упорядочено2). (В соответствии с этим отличием правдоподобности от вероятности автор—к сожалению, весьма неопределенно — говорит о различии «качественной» и «количественной» теории вероятностей.) Отметим, наконец, что статистические закономерности, основанные на обычном понятии вероятности (как «частоты дальнего действия»), Пойа отнюдь не противополагает— в качестве единственно

1) Их можно рассматривать, например, как модальности. (Модальности типов «необходимо», «возможно» и др. ввел, как известно, в рассмотрение еще Аристотель. В настоящее время им посвящена в логике большая литература. См., например, книгу von Wright G. H., An Essay in Modal Logic, 1951.)

2) На стр. 366 (и соседних) автор приводит ряд примеров, свидетельствующих о том, к каким нелепым (и даже противоречивым) выводам может приводить иногда приписывание правдоподобностям числовых значений. О теории вероятностей как о теории правдоподобностей, образующих частично упорядоченную систему, см., например, в книге Г. Биркгофа, Теория структур, М., 1952, стр. 275, где имеются ссылки и на другую литературу.

приемлемых — причинным закономерностям (как это часто делается в философской идеалистической литературе), а, наоборот, учит употреблять статистические методы для обоснования причинных («физических») закономерностей — для исключения возможности случайного совпадения.

Но манера автора трактовать его «качественную» теорию вероятностей—пусть хотя бы лишь из побуждений сделать изложение доступным для читателя, не знакомого с понятием частично упорядоченного множества, — звучит уже отнюдь не материалистически. Так, на стр. 348 автор начинает с того, что констатирует невозможность приписать Р {А} — правдоподобности утверждения А в глазах м-ра Кто-нибудь— определенное числовое значение, после чего предлагает тем не менее рассматривать Р {А} как определенную дробь

числового значения которой мы, однако, не знаем (и знать не можем!). Именно это незнание конкретного числового значения и должно здесь отличать у автора «качественный» подход к теории вероятностей от «количественного», между тем как рассмотрение Р (А} как «определенной положительной дроби» должно помочь распространить на правдоподобности нужные автору законы и правила теории вероятностей. В дальнейшем (см. особенно разделы: «7. Почему не количественно?» и «8. Бесконечно малые правдоподобности?» примечаний к главе XV) автор вносит, правда, необходимые уточнения. Однако зачем, хотя бы на время, создавать у читателя впечатление, будто допускается существование каких-то вещей в себе (определенных числовых оценок правдоподобности), принципиально непознаваемых? Ведь из дальнейшего ясно, что автор отнюдь не считает Р {А} числом!

Аналогичные замечания можно было бы сделать и в применении к некоторым другим местам книги. Иногда оговаривая их в примечаниях редактора, мы, однако, не ставили перед собой задачи оговорить все места, по повод, которых редактору хотелось бы высказать какие-либо критические замечания.

В отличие от большинства математических книг книгу Пойа можно читать как увлекательную беллетристику. Но над ней можно и серьезно работать. Указания о том, как работать над этой книгой, читатель найдет в предисловии автора и в его советах читателю.

На этот счет мне хотелось бы только заметить следующее. Во второй части каждой главы автор предлагает задачи и темы для самостоятельной работы читателя— от самых легких до очень трудных. При первом чтении, конечно, можно не решать полностью задач, предлагаемых автором, но чтобы правильно понять его мысль, изложенную в первой части главы, необходимо обычно уже при первом чтении возможно внимательнее просмотреть и материал, помещенный во второй ее части (а при более внимательном чтении необходимо ознакомиться и с предлагаемыми автором решениями). Вопреки некоторым рекомендациям автора, повторяю, что и читатель, мало знакомый с математикой, может начинать чтение со II тома книги (посвященного логике правдоподобных умозаключений и теории вероятностей), принимая на время на веру вещи, предполагающие более специальные математические знания.

Над вопросом о том, возможна ли теория, предметом которой являются не математические доказательства, а способы догадываться о таких доказательствах, открывать математические истины и решать математические задачи, люди бьются еще со времен античной древности. Вопросы этого рода не могут не интересовать каждого математика, каждого преподавателя математики или обучающегося ей. Будем же надеяться, что книга Пойа будет полезна и доставит удовольствие широкому кругу советских читателей.

С. А. Яновская

ПРЕДИСЛОВИЕ

Эта книга имеет различные тесно связанные между собой цели. В первую очередь она предназначена для того, чтобы помочь учащимся и преподавателям математики в одном важном вопросе, которому обычно не уделяют должного внимания. Однако в известном смысле она представляет и философский этюд. Она является также продолжением и требует продолжения. Я последовательно коснусь этих ее особенностей.

1. Строго говоря, все наши знания за пределами математики и доказательной логики (которая фактически является ветвью математики) состоят из предположений1). Конечно, существуют предположения и предположения. Есть в высшей степени достойные и надежные предположения, например, те, которые выражены в некоторых общих законах физики. Бывают другие предположения, не являющиеся ни надежными, ни достойными, и некоторые из них способны привести вас в ярость, когда вы прочитаете их в газете. И между теми и другими существуют всякого рода предположения, предчувствия и догадки.

Мы закрепляем свои математические знания доказательными рассуждениями, но подкрепляем свои предположения правдоподобными рассуждениями. Математическое доказательство является доказательным рассуждением, а индуктивные доводы физика, косвенные улики юриста, документальные доводы историка и статистические доводы экономиста относятся к правдоподобным рассуждениям.

Различие между этими двумя типами рассуждений велико и многообразно. Доказательное рассуждение надежно, неоспоримо и окончательно. Правдоподобное рассуждение рискованно, спорно и условно.

1) В действительности и в доказательной логике мы не обходимся без предположений. Мы предполагаем, например, что индивидуальные объекты, к которым относятся наши рассуждения, остаются строго неизменными, пока мы рассуждаем о них; что любые два высказывания, сколь длинными они ни были бы, всегда можно объединить —например, с помощью союзов «и», «или», «если... то» — в новое высказывание; что в таких-то наших рассуждениях можно свободно пользоваться законом исключенного третьего, и т. п. Из этого не следует, однако, будто все наши знания состоят только из предположений. Ведь даже во всякой относительной истине всегда имеется момент абсолютной истины. И чем иным может быть надежное предположение, как не оправдывающимся на практике, т. е. в конечном счете ведущим к истине. — Прим. ред.

Доказательные рассуждения пронизывают науки как раз в той же мере, что и математика, но сами по себе (как и сама по себе математика) не способны давать существенно новые знания об окружающем нас мире. Все новое, что мы узнаем о мире, связано с правдоподобными рассуждениями, являющимися единственным типом рассуждений, которым мы интересуемся в повседневных делах. Доказательное рассуждение имеет жесткие стандарты, кодифицированные и выясненные логикой (формальной, или доказательной логикой), являющейся теорией доказательных рассуждений. Стандарты правдоподобных рассуждений текучи, и нет никакой теории таких рассуждений, которая могла бы по ясности сравниться с доказательной логикой или обладала бы сравнимой с ней согласованностью.

2. Заслуживает нашего внимания другой момент, касающийся этих двух типов рассуждений. Всякий знает, что математика предоставляет прекрасную возможность научиться доказательным рассуждениям, но я утверждаю также, что в обычных учебных планах учебных заведений нет предмета, который давал бы сравнимую возможность научиться правдоподобным рассуждениям. Я обращаюсь ко всем, кто обучается математике, элементарной или высшей, и заинтересован в овладении ею, и говорю: «Конечно, будем учиться доказывать, но будем также учиться догадываться».

Это звучит немного парадоксально, и я должен подчеркнуть несколько обстоятельств, чтобы избежать возможных недоразумений.

Математика рассматривается как доказательная наука. Однако это только одна из ее сторон. Законченная математика, изложенная в законченной форме, выглядит как чисто доказательная, состоящая только из доказательств. Но математика в процессе создания напоминает любые другие человеческие знания, находящиеся в процессе создания. Вы должны догадаться о математической теореме, прежде чем ее докажете; вы должны догадаться об идее доказательства, прежде чем проведете его в деталях. Вы должны сопоставлять наблюдения и следовать аналогиям; вы должны пробовать и снова пробовать. Результат творческой работы математика —доказательное рассуждение, доказательство; но доказательство открывается с помощью правдоподобного рассуждения, с помощью догадки. Если обучение математике в какой-то степени отражает то, как создается математика, то в нем должно найтись место для догадки, для правдоподобного умозаключения.

Как мы сказали, существует два типа рассуждений: доказательное рассуждение и правдоподобное рассуждение. Замечу, что они не противоречат друг другу; напротив, они друг друга дополняют. В строгом рассуждении главное —отличать доказательство от догадки, обоснованное доказательство от необоснованной попытки. В правдоподобном рассуждении главное — отличать одну догадку от другой, более разумную догадку от менее разумной. Если вы вдумаетесь в это отличие, то оба типа рассуждений могут стать более ясными.

Серьезный человек, изучающий математику, намеревающийся сделать математику делом своей жизни, должен учиться доказательным рассуждениям; это его профессия и отличительный признак его науки. Однако для настоящего успеха он должен учиться и правдоподобным рассуждениям; это тот тип рассуждений, от которого будет зависеть его творческая работа. Человек, занимающийся математикой как вспомогательным предметом или как любитель, также должен получить некоторое знакомство с доказательными рассуждениями; может быть, у него не будет особой надобности непосредственно их применять, но он должен овладеть стандартом, с которым он мог бы сравнивать всевозможные, выдвигаемые в качестве доказательств доводы, встречающиеся ему в современной жизни. Но во всех его начинаниях ему будут нужны правдоподобные рассуждения. Во всяком случае, человеку, изучающему математику и желающему проявить себя в этой области, какими бы ни оказались его дальнейшие интересы, следует попытаться научиться обоим типам рассуждений, доказательному и правдоподобному.

3. Я не верю, что существует абсолютно гарантированный метод, позволяющий научить догадываться. Во всяком случае, если такой метод и существует, то мне он не известен, и уж, конечно, я не претендую на то, чтобы изложить его на последующих страницах. Действенное применение правдоподобных рассуждений есть практический навык, и ему, как и всякому другому практическому навыку, учатся путем подражания и практики. Я попытаюсь сделать все от меня зависящее, чтобы помочь читателю, очень желающему научиться правдоподобным рассуждениям, но все, что я могу предложить, это только примеры для подражания и возможность попрактиковаться.

В этой книге я часто буду обсуждать математические открытия, большие и малые. Я не могу рассказать подлинную историю того, как происходило открытие, потом, что этого в действительности никто не знает. Однако я попытаюсь придумать правдоподобную историю того, как открытие могло произойти. Я попытаюсь выявить мотивы, лежащие в основе открытия, правдоподобные умозаключения, которые к нему привели, короче, все, что заслуживает подражания. Конечно, я попытаюсь убедить читателя; это моя обязанность как преподавателя и как автора. Однако я буду с читателем совершенно честен в том, что действительно существенно: я буду стараться убедить его только в том, что мне представляется истинным и полезным.

За каждой главой следуют примеры и примечания. Примечания относятся к вопросам, слишком техническим или слишком тонким для текста главы, или к вопросам, лежащим несколько в стороне от главной линии рассуждения. Некоторые из упражнений дают читателю возможность заново рассмотреть детали, только намеченные в тексте. Однако большая часть упражнений дает возможность читателю вывести свои собственные правдоподобные заключения.

Перед тем как взяться за какую-нибудь более трудную задачу, предложенную в конце главы, читателю следует внимательно прочитать соответствующие части главы и, кроме того, бегло просмотреть соседние задачи; то или другое может содержать ключ. Чтобы обеспечить читателя такими ключами (или скрыть их от него) с наибольшей пользой для обучения, большое внимание было уделено не только содержанию и форме предлагаемых задач, но и их расположению. Фактически на расстановку этих задач ушло значительно больше времени и заботы, чем можно было бы себе представить или посчитать нужным, глядя со стороны.

Чтобы охватить широкий круг читателей, я пытался проиллюстрировать каждый важный вопрос как можно более элементарным примером. Однако в нескольких случаях я был вынужден взять не слишком элементарный пример, чтобы подкрепить утверждение достаточно убедительно. В действительности я чувствовал, что должен привести и примеры, имеющие исторический интерес, и примеры, обладающие настоящей математической красотой, и примеры, иллюстрирующие параллелизм методов в других науках или в повседневной жизни.

Следует добавить, что многие из приведенных рассказов получили свою окончательную форму в результате своего рода неформального психологического эксперимента. Я обсуждал предмет с несколькими различными студенческими группами, часто прерывая свое изложение вопросами вроде следующего: «Хорошо, а что бы вы сделали в такой ситуации?». Некоторые места, включенные в текст книги, были подсказаны ответами моих слушателей или моя первоначальная версия изменялась каким-нибудь другим образом под влиянием реакции моей аудитории.

Короче говоря, я пытался употребить весь свой опыт исследователя и преподавателя, чтобы дать читателю подходящую возможность для разумного подражания и для самостоятельной работы.

4. Примерами правдоподобных рассуждений, собранными в этой книге, можно воспользоваться и для другой цели: они могут пролить некоторый свет на философскую проблему, являющуюся предметом оживленных споров: проблему индукции. Вот главный вопрос: существуют ли для индукции правила? Некоторые философы говорят: «Да», большинство ученых думает: «Нет». Чтобы обсудить этот вопрос с пользой, следует иначе его поставить. Кроме того, его следует толковать иначе, с меньшей зависимостью от традиционного буквоедства или от новомодного формализма, но в более тесном контакте с практикой ученых. Заметим прежде всего, что индуктивное рассуждение есть частный случай правдоподобного рассуждения. Заметим также (современные авторы почти забыли это, но некоторые старые, такие как Эйлер и Лаплас, ясно осознавали), что роль индуктивных доводов в математическом исследовании сходна с их ролью в физическом исследовании. После этого вы сумеете обнаружить, что некоторые сведения об индуктивных рассуждениях

возможно получить путем наблюдения и сравнения примеров правдоподобных рассуждений в математических вопросах. И таким образом открывается дверь для индуктивного исследования индукции.

Когда биолог пытается исследовать какую-нибудь общую проблему, скажем, генетики, ему очень важно выбрать какой-нибудь специальный вид растения или животного, вполне пригодный для экспериментального изучения его проблемы. Когда химик намеревается исследовать какую-нибудь общую проблему, касающуюся, скажем, скорости химических реакций, ему очень важно выбрать какие-нибудь специальные вещества, на которых было бы удобно проделать эксперименты, уместные в его проблеме. Выбор подходящего экспериментального материала чрезвычайно важен для индуктивного исследования любой проблемы. Мне кажется, что математика в некоторых отношениях является наиболее подходящим экспериментальным материалом для изучения индуктивных рассуждений. Это изучение вызывает необходимость некоторого рода психологических экспериментов: вы должны испытать на опыте, какое влияние на вашу веру в рассматриваемое предположение оказывают различные виды доводов. Благодаря своей неотъемлемой простоте и ясности, математические объекты подходят для этого рода психологического эксперимента гораздо лучше, чем объекты из любой другой области. На следующих страницах читатель будет иметь полную возможность в этом убедиться.

С точки зрения философии, я думаю, лучше рассматривать более общую идею правдоподобного рассуждения вместо частного случая индуктивного рассуждения. Мне кажется, что собранные в этой книге примеры постепенно подготовляют определенный и вполне удовлетворительный аспект правдоподобного рассуждения. Однако я не хочу навязывать свои взгляды читателю. Фактически я даже не формулирую их в первом томе; я хочу, чтобы примеры говорили сами за себя. Первые четыре главы второго тома посвящены более явному общему рассмотрению правдоподобных рассуждений. Здесь я формально устанавливаю схемы правдоподобных умозаключений, возникающие из приведенных примеров, пытаюсь систематизировать эти схемы и обозреть некоторые из их взаимных связей и их связей с идеей вероятности.

Я не знаю, заслуживает ли содержание этих четырех глав право называться философией. Если это философия, то это, несомненно, немудреный вид философии, больше имеющий дело с пониманием конкретных примеров и конкретного поведения людей, чем с толкованием общностей. Я еще меньше, конечно, знаю, какой окажется окончательная оценка моих взглядов. Однако я чувствую довольно сильную уверенность в том, что мои примеры могут быть полезны для любого разумного, непредубежденного человека, изучающего индукцию или правдоподобные рассуждения, который желает сформировать свои взгляды в тесном контакте с наблюдаемыми фактами.

5. Эта работа о Математике и Правдоподобных рассуждениях, которую я всегда рассматривал как целое, естественно распадается на две части: Индукция и Аналогия в Математике (том I) и Схемы Правдоподобных Умозаключений (том II). Для удобства изучающих они выпускаются отдельными томами1). Том I полностью независим от тома II, и я думаю, что многие учащиеся захотят его тщательно продумать перед тем, как читать том II. В нем —большая часть математического «мяса» этого сочинения, и он поставляет «данные» для индуктивного исследования индукции в томе II. Некоторые читатели, более умудренные и опытные в математике, захотят, быть может, непосредственно перейти к тому II, и для них будет удобно иметь его отдельно. Для облегчения ссылок нумерация глав в обоих томах сплошная. Я не снабдил книгу указателем, так как указатель заставил бы сделать терминологию более жесткой, чем это желательно в такого рода сочинении. Я уверен, что оглавление дает удовлетворительный путеводитель по книге.

Эта работа является продолжением моей более ранней книги How to Solve It2). Читателю, интересующемуся предметом, следует прочитать обе книги, но порядок не имеет большого значения. Настоящий текст составлен так, что его можно читать независимо от предыдущей работы. Фактически в этой книге имеется лишь несколько прямых ссылок на прежнюю и при первом чтении на них можно не обращать внимания. Однако косвенные ссылки на предыдущую книгу имеются почти на каждой странице и почти в каждом предложении некоторых страниц. В сущности эта работа дает многочисленные упражнения и некоторые более серьезные иллюстрации к предыдущей, в которой ввиду ее размера и элементарного характера не было для них места.

Настоящая книга связана также со сборником задач по анализу, принадлежащим Г. Сеге и автору (см. библиографию). Задачи в этом сборнике тщательно сгруппированы в таком порядке, что они взаимно подкрепляют друг друга, дают ключи друг другу, в совокупности охватывают определенную тему и предоставляют читателю возможность попрактиковаться в различных ходах, важных в решении задач. В подходе к задачам настоящая книга следует методу изложения, начало которому было положено в упомянутом сборнике, и эта связь имеет не столь уж малое значение.

Две главы во втором томе настоящей книги имеют дело с теорией вероятностей. Первая из этих глав отчасти связана с элементарным изложением исчисления вероятностей, написанным автором несколько лет тому назад (см. библиографию). Лежащие в основании взгляды на вероятность и отправные пункты — те же самые, в остальном соприкосновения мало.

1) В русском издании оба тома объединены в одной книге. — Прим. перев.

2) См. Д. Пойа, Как решать задачу. Все ссылки в дальнейшем делаются на 2-е издание этой книги, М., 1961.

Некоторые из взглядов, изложенных в этой книге, были выражены ранее в моих статьях, указанных в библиографии. В текст книги были включены обширные выдержки из статей №№ 4, 6, 8, 9 и 10. Я приношу признательность и мою глубокую благодарность издателям American Mathematical Monthly, Etudes de Philosophie des Sciences en Hommage à Ferdinand Gonseth и Proceedings of the International Congress of Mathematicians 1950, которые любезно дали разрешение воспроизвести эти выдержки.

Многие части этой книги были изложены в моих лекциях, некоторые—несколько раз. В некоторых местах и в некоторых отношениях я сохранил тон устного изложения. Я не думаю, что такой тон вообще желателен при печатном изложении математики, но в настоящем случае это может быть подходящим или по крайней мере простительным.

6. Последняя глава второго тома настоящей книги, имеющая дело с Изобретением и Обучением, в более явной форме связывает содержание с прежней работой автора и указывает на возможное продолжение.

Действенное применение правдоподобных рассуждений играет существенную роль в решении задач. Настоящая книга пытается проиллюстрировать эту роль на многих примерах, но остаются другие стороны решения задач, нуждающиеся в подобной иллюстрации.

Многие вопросы, затронутые здесь, нуждаются в дальнейшей разработке. Мои взгляды на правдоподобные рассуждения следовало бы сопоставить со взглядами других авторов, исторические примеры следовало бы рассмотреть более тщательно, взгляды на изобретение и обучение следовало бы изучить, насколько это возможно, методами экспериментальной психологии1), и так далее. Остаются другие такого рода задачи, но некоторые из них могут оказаться неблагодарными.

Эта книга не учебник. Однако я надеюсь, что со временем она окажет влияние на обычное изложение в учебниках и выбор их круга вопросов. Задача заново написать обычные учебники, придерживаясь намеченного направления, не должна быть неблагодарной.

7. Я хочу выразить свою признательность Издательству Принстонского университета за тщательное печатание и особенно г-ну Герберту С. Бэйли младшему, директору Издательства, за сочувственную помощь в некоторых вопросах. Я много обязан также г-же Присилле Фейген за перепечатку рукописи на машинке и д-ру Юлиусу Г. Барону за его любезную помощь при чтении корректур.

Стэнфордский университет, Дьердь Пойа

май 1953 г.

1) Исследовательская работа в этом направлении была предпринята в Отделении психологии Стэнфордского университета в рамках проекта, руководимого Э. Р. Хильгардом и субсидируемого Научно-исследовательским управлением ВМС США.

СОВЕТЫ ЧИТАТЕЛЮ

Параграф 2 гл. VII в той же главе VII цитируется как § 2, но как § 7.2 в любой другой главе. Пункт (3) § 5 гл. XIV в той же главе XIV цитируется как § 5 (3), но как § 14.5 (3) в других главах. На пример 26 гл. XIV мы ссылаемся в той же главе, как на пример 26, но как на пример 14.26 в остальных главах.

Для чтения существенных частей текста может быть достаточно некоторого знания элементарной алгебры и геометрии. Почти для всего текста и большей части примеров и примечаний достаточно хорошего знания элементарной алгебры и геометрии и некоторого знания аналитической геометрии и математического анализа, включая пределы и бесконечные ряды. Однако в нескольких эпизодических замечаниях в тексте, в некоторых предлагаемых задачах и в отдельных примечаниях предполагаются более глубокие знания. Обычно в этих случаях делается какое-нибудь предупреждение.

Более подготовленный читатель, пропустивший те отделы, которые кажутся ему слишком элементарными, может потерять больше, чем менее подготовленный читатель, который пропустит отделы, показавшиеся ему слишком сложными.

Некоторые (не очень трудные) детали доказательств часто без предупреждения опускаются. Должным образом подготовленный к этой возможности читатель, обладающий хорошими критическими навыками, не должен от этого пострадать.

Некоторые из задач, предложенных для решения, очень легки, но некоторые довольно трудны. Наводящие соображения, которые могут облегчить решение, заключены в квадратные скобки [ ]. Правильный путь решения могут подсказывать соседние задачи. Особое внимание следует обратить на вводные замечания, предшествующие примерам в некоторых главах или же первой или второй части таких примеров.

Решения иногда очень кратки: они предполагают, что перед тем как просмотреть напечатанное решение, читатель предпринял серьезные попытки справиться с задачей собственными силами.

Читатель, затративший на задачу большие усилия, даже если ему и не удалось ее решить, может извлечь из этого пользу. Например, он может заглянуть в решение, попытаться выделить то, что ему кажется ключевой идеей, отложить книгу и затем попытаться разработать решение.

В некоторых местах эта книга изобилует чертежами или дает небольшие промежуточные шаги вывода. Цель этого — сделать наглядной эволюцию фигуры или формулы: см., например, рис. 16.1—16.5. Однако нет такой книги, которая содержала бы достаточно фигур или формул. Читатель может захотеть прочитать какое-нибудь место «в первом приближении» или более тщательно. Во втором случае, у него под рукой должны быть бумага и карандаш: он должен быть готов написать или начертить любую формулу или фигуру, приведенную или только упомянутую в тексте. Поступая таким образом, он получит лучшую возможность увидеть эволюцию фигуры или формулы, понять, как различные детали способствуют окончательному результату, и запомнить весь процесс в целом.

ИНДУКЦИЯ И АНАЛОГИЯ В МАТЕМАТИКЕ

Том I

I. ИНДУКЦИЯ

Покажется немало парадоксальным приписывать большое значение наблюдениям даже в той части математических наук, которая обычно называется чистой математикой, так как существует распространенное мнение, что наблюдения ограничиваются физическими объектами, которые воздействуют на наши чувства. Поскольку мы должны относить числа к одному лишь чистому разуму, мы едва ли можем понять, как наблюдения и квазиэксперименты могут быть полезны в исследовании природы чисел. Однако в действительности, как я здесь покажу, приведя очень веские доводы, свойства чисел, известные сегодня, по большей части были открыты путем наблюдения и открыты задолго до того, как их истинность была подтверждена строгими доказательствами. Имеется даже много свойств чисел, с которыми мы хорошо знакомы, но которые мы все еще не в состоянии доказать: только наблюдения привели нас к их познанию. Отсюда мы видим, что в теории чисел, которая все еще очень несовершенна, наши самые большие надежды мы можем возлагать на наблюдения; они непрерывно будут вести нас к новым свойствам, которые позже мы будем стараться доказать. Этот вид знания, которое подкрепляется только наблюдениями и все еще не доказано, следует тщательно отличать от истины; оно, как мы обычно говорим, приобретается индукцией. Однако мы видели случаи, когда простая индукция вела к ошибке. Поэтому мы должны проявлять большую осторожность, чтобы не принять за истинные такие свойства чисел, которые мы открыли путем наблюдения и которые подкрепляются одной лишь индукцией. В действительности мы должны пользоваться таким открытием, как возможностью более точно исследовать эти открытые свойства и доказать их или опровергнуть; в обоих случаях мы можем научиться кое-чему полезному. —Эйлер1)

1. Опыт и представление. Опыт вносит изменения в человеческие представления. Мы учимся, исходя из опыта, или, вернее, должны учиться, исходя из опыта. Наилучшим возможным образом воспользоваться опытом — одна из великих задач человека, а трудиться для ее решения — подлинное призвание ученых.

Ученый, заслуживающий этого имени, старается извлечь из данного опыта наиболее правильное представление и накопить наиболее подходящий опыт для того, чтобы установить правильное представление о данном вопросе. Метод, с помощью которого ученый имеет дело с опытом, обычно называется индукцией. Особенно ясные примеры метода индукции можно найти в математическом исследовании. В следующем параграфе мы приступаем к рассмотрению одного простого примера.

1) Euler, Specimen de usu observationum in mathesi pura, Opera Omnia, ser. 1, vol. 2, p. 459.

2. Наводящие контакты. Индукция часто начинается с наблюдения. Натуралист может наблюдать жизнь птиц, кристаллограф — формы кристаллов. Математик, интересующийся теорией чисел, наблюдает свойства чисел 1, 2, 3, 4, 5, ...

Если вы хотите наблюдать жизнь птиц так, чтобы была некоторая возможность получить интересные результаты, то вы должны быть в какой-то степени знакомы с птицами, интересоваться птицами, вы должны даже, пожалуй, любить птиц. Точно так же, если вы хотите наблюдать числа, вы должны интересоваться ими и в какой-то степени быть знакомы с ними. Вы должны различать четные и нечетные числа, должны знать квадраты 1, 4, 9, 16, 25, ... и простые числа 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, ... (лучше выделить 1 как «единицу» и не причислять ее к простым числам). Даже со столь скромными знаниями вы смогли бы подметить кое-что интересное.

Случайно вы наталкиваетесь на соотношения

и замечаете между ними некоторое сходство. Вам приходит в голову, что числа 3, 7, 13 и 17 являются нечетными простыми числами. Сумма двух нечетных простых чисел есть обязательно четное число; действительно, числа 10, 20 и 30 —четные. А что можно сказать о других четных числах? Ведут ли они себя подобным же образом? Первое четное число, являющееся суммой двух нечетных простых чисел, есть, конечно,

Двигаясь дальше, находим, что

Всегда ли так будет продолжаться? Как бы то ни было, частные случаи, которые мы наблюдали, наводят на мысль об общем утверждении: любое четное число, большее чем 4, представимо в виде суммы двух нечетных простых чисел. Поразмыслив об исключительных случаях — числах 2 и 4, которые не могут быть расщеплены в сумму двух нечетных простых чисел, мы можем предпочесть следующее менее непосредственное утверждение: любое четное

число, не являющееся, ни простым числом, ни квадратом простого числа, представимо в виде суммы двух нечетных простых чисел.

Итак, нам удалось сформулировать предположение. Мы нашли это предположение с помощью индукции. Иными словами, оно возникло у нас в результате наблюдения, было указано отдельными частными примерами.

Эти указания являются довольно легковесными; у нас есть лишь очень слабые основания верить в свое предположение. Мы можем, однако, найти некоторое утешение в том факте, что Гольдбах, математик, впервые высказавший это предположение немногим более двухсот лет тому назад, не обладал для этого сколько-нибудь более серьезными основаниями.

Справедливо ли предположение Гольдбаха? Никто сегодня не может ответить на этот вопрос. Несмотря на огромные усилия, затраченные на выяснение этого вопроса некоторыми великими математиками, предположение Гольдбаха сегодня, как это было и в дни Эйлера, является одним из тех «многих свойств чисел, с которыми мы хорошо знакомы, но которые мы все еще не в состоянии доказать» или опровергнуть.

Взглянем теперь назад и попытаемся уловить в предыдущем рассуждении такие шаги, которые могли бы быть типичными для процесса индукции.

Сначала мы подметили некоторое сходство. Мы осознали, что 3, 7, 13 и 17 —простые, а 10, 20 и 30 — четные числа и что три соотношения 3 + 7= 10, 3+17 = 20, 13+17 = 30 аналогичны между собой.

Следующим шагом было обобщение. От четырех чисел 3, 7, 13 и 17 мы перешли ко всем нечетным простым числам; от 10, 20 и 30 —ко всем четным числам, а затем —к возможному общему соотношению

четное число = простому числу + простое число.

Мы пришли, таким образом, к отчетливо сформулированному общему утверждению, которое, однако, является только предположением, только пробным утверждением. Это значит, что утверждение ни в какой степени не является доказанным, никак не может претендовать на истинность, оно является только попыткой подойти к истине.

Это предположение имеет, однако, некоторые наводящие точки соприкосновения, контакта с опытом, с «фактами», с «действительностью». Оно верно для некоторых конкретных чисел 10, 20, 30, а также для 6, 8, 12, 14, 16.

Этими замечаниями мы в общих чертах обрисовали первую стадию процесса индукции.

3. Подкрепляющие контакты. Не стоит слишком уж верить в любое недоказанное предположение, даже если оно было предложено большими авторитетами, даже если оно возникло у вас самих. Нужно попытаться доказать его или опровергнуть; нужно его испытать.

Мы испытаем предположение Гольдбаха, если исследуем какое-нибудь новое четное число и выясним, является ли оно суммой двух нечетных простых чисел или нет. Исследуем, например, число 60. Выполним «квазиэксперимент», как выражается Эйлер. Число 60 четное, но является ли оно суммой двух простых чисел? Верно ли, что

60 = 3 + простое число?

Нет, число 57 не простое. Имеет ли место

60 = 5+простое число?

Ответ снова будет «Нет»: число 55 не простое. Если так будет продолжаться и дальше, то предположение будет подорвано. Но следующее испытание дает

60 = 7 + 53,

и 53 — простое число. Предположение подтвердилось еще в одном случае.

Противоположный результат решил бы судьбу предположения Гольдбаха раз и навсегда. Если, испытывая все простые числа до данного четного числа, например 60, вы ни в одном случае не приходите к разложению его в сумму двух простых чисел, то тем самым вы безвозвратно подрываете предположение. Подтвердив предположение в случае числа 60, вы не можете прийти к столь же определенному заключению. Вы, безусловно, не докажете теорему с помощью единственного подтверждения. Естественно, однако, истолковать такое подтверждение, как благоприятный признак, говорящий в пользу предположения, делающий его более правдоподобным, хотя, конечно, остается вашим личным делом, какой вес вы придадите этому благоприятному признаку.

Возвратимся на минуту к числу 60. После того как были испытаны простые числа 3, 5 и 7, мы можем испытать остающиеся простые числа до 30. (Очевидно, нет необходимости идти дальше 30=60/2, так как одно из двух простых чисел, сумма которых равна 60, должно быть меньше 30.) Мы получим, таким образом, все разложения 60 в сумму двух простых чисел:

60 = 7 + 53= 13 + 47= 17 + 43= 19 + 41 = 23 + 37 = 29 + 31.

Мы можем действовать систематически и исследовать четные числа одно за другим, как только что исследовали число 60. Результат

мы можем записать в виде следующей таблицы:

Предположение подтверждается во всех случаях, которые мы здесь рассмотрели. Каждое подтверждение, удлиняющее таблицу, усиливает предположение, делает его в большей мере внушающим доверие, увеличивает его правдоподобие. Конечно, никакое число таких подтверждений не могло бы его доказать.

Нам нужно исследовать собранные наблюдения, сравнить их и сопоставить, нужно поискать какой-то ключ, быть может скрытый за ними. В нашем случае очень трудно обнаружить в таблице какой-либо ключ, который мог бы оказать нам существенную помощь. Тем не менее, рассматривая таблицу, мы можем яснее осознать смысл предположения. Таблица показывает, сколькими способами входящие в нее четные числа могут быть представлены как сумма двух простых чисел (6 —одним, 30 —тремя). Число таких представлений четного числа 2n кажется «неправильно возрастающим» вместе с л. Предположение Гольдбаха выражает надежду, что как бы далеко мы ни расширяли таблицу, число представлений никогда не упадет до 0.

Среди исследованных нами частных случаев мы можем различать две группы: те, которые предшествовали формулировке предположения, и те, которые были рассмотрены после нее. Первые навели на предположение, вторые подкрепили его. И те и другие создают некоторого рода контакт между предположением и «фактами». Таблица не делает различия между «наводящими» и «подкрепляющими» точками соприкосновения.

Посмотрим теперь снова на предыдущее рассуждение и попытаемся заметить в нем черты, типичные для процесса индукции.

Высказав предположение, мы пытались выяснить, является ли оно верным или ошибочным. Наше предположение было утверждением общего характера, возникшим из некоторых частных примеров,

в которых оно оказалось верным. Мы исследовали еще несколько частных случаев. Поскольку обнаружилось, что предположение справедливо для всех рассмотренных примеров, наша вера в него возросла.

Мы делали, как мне кажется, только то, что обычно делают разумные люди. Поступая таким образом, мы, по-видимому, принимаем принцип: предположительное общее утверждение становится более правдоподобным, если оно подтверждается для нового частного случая.

Не этот ли принцип лежит в основе процесса индукции?

4. Индуктивный подход. В нашей личной жизни мы часто цепляемся за иллюзии. Иными словами, мы не смеем исследовать некоторые представления, которые легко могли бы быть опровергнуты опытом, потом, что боимся нарушить свое душевное равновесие. Возможны обстоятельства, в которых не является неразумным цепляться за иллюзии, но в науке мы нуждаемся в совершенно ином подходе, в индуктивном подходе. Этот подход имеет целью приспособление наших представлений к нашему опыту в такой степени, в какой это возможно. Он требует беспрекословного предпочтения для того, что фактически существует. Он требует готовности к подъему от наблюдений к обобщениям и готовности к спуску от наиболее широких обобщений к наиболее конкретным наблюдениям. Он требует говорить «быть может» и «возможно» с тысячей различных оттенков. Он требует многих других вещей, и особенно следующих трех.

Во-первых, мы должны быть готовы пересмотреть любое из наших представлений.

Во-вторых, мы должны изменить представление, когда имеются веские обстоятельства, вынуждающие его изменить.

В-третьих, мы не должны изменять представления произвольно, без достаточных оснований.

Эти принципы звучат довольно тривиально. Но нужны довольно необычные достоинства, чтобы их придерживаться.

Первый принцип требует «мужества ума». Вам нужно мужество, чтобы пересмотреть ваши представления. Галилей, бросивший вызов предрассудку своих современников и авторитету Аристотеля, являет собой великий пример мужества ума.

Второй принцип требует «честности ума». Оставаться верным моему предположению, ясно опровергнутому опытом, только потому, что это мое предположение, было бы нечестно.

Третий принцип требует «мудрой сдержанности». Изменить представление без серьезного исследования, например только ради моды, было бы глупо. Но мы не имеем ни времени, ни сил серьезно исследовать все наши представления. Поэтому будет мудро посвятить нашу повседневную работу, наши вопросы и наши живые сомнения тем представлениям, которые мы можем разумно надеяться исправить.

«Не верь ничему, но сомневайся только в том, в чем стоит сомневаться».

Смелость ума, честность ума и мудрая сдержанность —моральные достоинства ученого.

ПРИМЕРЫ И ПРИМЕЧАНИЯ К ГЛАВЕ I

1. Догадайтесь, в соответствии с каким правилом выбираются члены последовательности

11, 31, 41, 61, 71, 101, 131, ....

2. Рассмотрите таблицу:

Догадайтесь, к какому общему закону подводят эти примеры; выразите его в подходящих математических обозначениях и докажите.

3. Рассмотрите значения последовательных сумм

Имеется ли простое правило?

4. Рассмотрите значения последовательных сумм

1, 1+8, 1+8 + 27, 1 + 8 + 27 + 64, ...

Имеется ли простое правило?

5. Три стороны треугольника имеют соответственно длины /. m и л. Числа /, m и n — целые положительные, l^m^n. Найдите число различных треугольников указанного вида для данного л. (Возьмите л=1, 2, 3, 4, 5, ...) Найдите общий закон, управляющий зависимостью числа треугольников от л.

6. Три первых члена последовательности 5, 15, 25, ... (чисел, оканчивающихся на 5) делятся на 5. Делятся ли на 5 и следующие члены?

Три первых члена последовательности 3, 13, 23, ... (чисел, оканчивающихся на 3) являются простыми числами. Будут ли простыми числами и следующие члены?

7. С помощью формальных вычислений находим

Естественно возникают два предположения относительно следующих коэффициентов степенного ряда, стоящего в правой части: (1) все они отрицательны; (2) все они простые числа. Одинаково ли эти два предположения заслуживают доверия?

8. Положим

Мы найдем, что для

Сформулируйте предположение.

9. Великий французский математик Ферма рассмотрел последовательность

5, 17, 257, 65 537, ...

с общим членом 22*+1. Он заметил, что первые четыре члена (указанные здесь), соответствующие л=1, 2. 3 и 4. являются простыми числами. Он предположил, что следующие члены также являются простыми числами. Хотя он и не доказал этого, он чувствовал такую уверенность в справедливости своего предположения, что бросил вызов Валлису и другим английским математикам, предлагая его доказать. Однако Эйлер нашел, что уже следующий член, 232+1, соответствующий л = 5, не является простым числом: он делится на 6411). См. цитату из Эйлера в начале этой главы: «Однако мы видели случаи, когда простая индукция вела к ошибке».

10. Проверяя предположение Гольдбаха для 2л = 60, мы последовательно испытывали простые числа р до л = 30. Однако мы могли бы также испытывать простые числа р' между л = 30 и 2л=60. Какой прием скорее всего окажется более выгодным для больших л?

11. В словаре вы найдете среди объяснений слов «индукция», «эксперимент» и «наблюдение» предложения вроде следующих:

«Индукция есть выведение общего закона из частных случаев, или предъявление фактов, чтобы доказать общее утверждение». «Эксперимент есть прием для проверки гипотез».

«Наблюдение есть точное прослеживание и регистрирование явлений в том виде, как они появляются в природе, по отношению к причине и результату или взаимным связям».

Применимы ли эти описания к нашему примеру, рассмотренному в §§ 2 и 3?

12. Да и нет. Математик, подобно натуралисту, проверяя некоторые следствия предполагаемого общего закона с помощью нового наблюдения, обращается с вопросом к Природе: «Я подозреваю, что этот закон верен. Верен ли он?» Если следствие ясно опровергается, то закон не может быть верен. Если следствие ясно подтверждается, то имеется некоторое указание, что закон может быть верен. Природа может ответить «Да» или «Нет», но она шепчет один ответ и громогласно произносит другой; ее «Да» условно, ее «Нет» определенно.

13. Опыт и поведение. Опыт вносит изменения в поведение человека. Вместе с тем опыт вносит изменения в человеческие представления. Поведение человека и его представления не независимы. Поведение часто является результатом представлений, представления —это потенциальное поведение. Однако вы можете видеть поведение другого человека, но не можете видеть его представлений. Поведение легче наблюдать, чем представления. Каждый знает поговорку: «Кто обжегся на молоке, тот дует на воду»2), выражающую как раз то, что мы сказали: опыт вносит изменения в поведение человека.

Впрочем, он вносит изменения и в поведение животных.

Неподалеку от моего дома есть гадкая собака, которая лает и бросается на людей безо всякого повода. Но я обнаружил, что довольно легко могу себя защитить. Если я нагибаюсь и делаю вид, что поднимаю камень, то собака с визгом убегает. Так себя ведут не все собаки, и легко догадаться, какого рода опыт явился причиной такого поведения этой собаки.

Медведь в зоопарке «служит», т. е., когда вблизи находится наблюдатель, он становится в смешную позу, которая довольно часто побуждает наблюдателя бросить в клетку кусок сахара. Медведь, живущий на воле, вероятно, никогда не принимает такой нелепой позы, и легко представить, какого рода опыт привел к тому, что медведь из зоопарка научился «служить».

Полное исследование индукции должно было бы, возможно, включать и изучение поведения животных.

1) Eu1er, Opera Omnia, ser, 1, vol. 2, p. 1—5. Hardy G. H. and Wright E. М., An Introduction to the Theory of Numbers, p. 14—15.

(См. также А. Эйлер, Письма к ученым, М. — А., 1963, стр. 283—285.— Прим. перев.)

2) В оригинале «а burnt child dreads the fire» — Прим. перев.

14. Логик, математик, физик и инженер. «Взгляни на этого математика, — сказал логик. —Он замечает, что первые девяносто девять чисел меньше сотни, и отсюда с помощью того, что он называет индукцией, заключает, что все числа меньше сотни».

«Физик верит,— сказал математик, —что 60 делится на все числа. Он замечает, что 60 делится на 1, 2, 3, 4, 5 и 6. Он проверяет несколько других чисел, например 10, 20 и 30, взятых, как он говорит, наугад. Так как 60 делится и на них, то он считает экспериментальные данные достаточными».

«Да, но взгляни на инженера, —возразил физик.— Инженер подозревает, что все нечетные числа простые. Во всяком случае, 1 можно рассматривать как простое число, доказывает он. Затем идут 3, 5 и 7, все, несомненно, простые. Затем идет 9 —досадный случай; 9, по-видимому, не является простым числом. Но 11 и 13, конечно, простые. Возвратимся к 9, —говорит он, —я заключаю, что 9 должно быть ошибкой эксперимента».

Совершенно очевидно, что индукция может привести к ошибке. Однако замечательно, что индукция иногда приводит к истине, хотя, по-видимому, возможность появления ошибки так подавляюще велика. Должны ли мы начать с изучения очевидных случаев, когда индукция не удается, или с изучения тех замечательных случаев, когда индукция приводит к успеху? Изучение драгоценных камней, понятно, более привлекательно, чем изучение обычных голышей, и, более того, именно драгоценные камни в гораздо большей степени, чем голыши, привели минералогов к чудесной науке кристаллографии.

II. ОБОБЩЕНИЕ, СПЕЦИАЛИЗАЦИЯ, АНАЛОГИЯ

И я больше всего дорожу Аналогиями, моими самыми верными учителями. Они знают все секреты Природы, и ими меньше всего следует пренебрегать в Геометрии. —Кеплер

1. Обобщение, специализация, аналогия и индукция. Взглянем снова на пример индуктивного рассуждения, который мы разобрали довольно подробно (§§ 1.2, 1.3). Мы начали с того, что подметили аналогию трех соотношений:

3 + 7 = 10, 3+ 17 = 20, 13+ 17 = 30,

мы обобщили, поднявшись от 3, 7, 13 и 17 ко всем простым, а от 10, 20 и 30 ко всем четным числам, затем мы снова специализировали, спустившись к испытанию отдельных четных чисел, как например 6, или 8, или 60.

Этот первый пример крайне прост. Он совершенно правильно иллюстрирует роль обобщения, специализации и аналогии в индуктивном рассуждении. Однако мы собираемся привести менее скудные, более яркие иллюстрации, и до этого нам нужно рассмотреть обобщение, специализацию и аналогию, эти великие источники открытия, ради них самих.

2. Обобщение есть переход от рассмотрения данного множества предметов к рассмотрению большего множества, содержащего данное. Например, мы делаем обобщение, когда переходим от рассмотрения треугольников к рассмотрению многоугольников с произвольным числом сторон. Мы делаем обобщение и когда переходим от изучения тригонометрических функций острого угла к изучению тригонометрических функций произвольного угла.

Можно заметить, что в этих двух примерах обобщение осуществлялось в двух характерно различных направлениях. В первом примере, в переходе от треугольников к многоугольникам с n сторонами, мы заменяем постоянную переменной, фиксированное число 3 произвольным числом n (ограниченным только неравенством л^З). Во втором примере, в переходе от острых углов к произвольным углам а, мы отбрасываем ограничение, именно ограничение 0°<а< <90°.

Мы часто делаем обобщение, переходя от одного лишь предмета к целому классу, содержащему этот предмет.

3. Специализация есть переход от рассмотрения данного множества предметов к рассмотрению меньшего множества, содержащегося в данном. Например, мы специализируем, когда переходим от рассмотрения многоугольников к рассмотрению правильных многоугольников, и специализируем еще дальше, когда переходим от правильных многоугольников с n сторонами к правильному, т. е. равностороннему треугольнику.

Эти два последовательных перехода осуществлялись в двух характерно различных направлениях. В первом переходе, от многоугольников к правильным многоугольникам, мы ввели ограничение, именно потребовали, чтобы все стороны и все углы многоугольника были равны. Во втором переходе мы заменили переменный предмет конкретным, поставили 3 вместо переменного целого числа n.

Очень часто мы производим специализацию, переходя от целого класса предметов к одному предмету, содержащемуся в этом классе. Например, когда мы хотим проверить некоторое общее утверждение относительно простых чисел, мы выбираем какое-нибудь простое число, скажем 17, и исследуем, справедливо ли это общее утверждение или нет именно для этого числа 17.

4. Аналогия. В понятиях обобщения и специализации нет ничего неясного или сомнительного. Однако, приступая к рассмотрению аналогии, мы становимся на менее прочное основание.

Аналогия есть некоторого рода сходство. Она, можно сказать, есть сходство, но на более определенном и выражаемом с помощью понятий уровне. Однако мы можем выразиться несколько более точно. Существенное различие между аналогией и другими видами сходства заключается, как мне кажется, в намерениях думающего. Сходные предметы согласуются между собой в каком-то отношении. Если вы намереваетесь свести это отношение, в котором они согласуются, к определенным понятиям, то вы рассматриваете эти сходные предметы как аналогичные. Если вам удается добраться до ясных понятий, то вы выяснили аналогию.

Сравнивая молодую женщину с цветком, поэты ощущают, я надеюсь, некоторое сходство, но обычно они не имеют в виду аналогии. Действительно, они едва ли намериваются покинуть мир эмоций и свести это сравнение к чему-то измеримому или определимому с помощью понятий.

Рассматривая в музее естественной истории скелеты различных млекопитающих, вы можете обнаружить, что все они страшны. Если в этом все сходство, которое вы между ними обнаружили, то вы видите не такую уж сильную аналогию. Однако вы можете подметить удивительно много говорящую аналогию, если рассмотрите руку человека, лапу кошки, переднюю ногу лошади, плавник кита и крыло летучей мыши —эти столь различно используемые органы, как состоящие из сходных частей, имеющих сходное отношение друг к другу.

Последний пример иллюстрирует наиболее типичный случай выясненной аналогии; две системы аналогичны, если они согласуются в ясно определенных отношениях соответствующих частей.

Например, треугольник на плоскости аналогичен тетраэдру в пространстве. На плоскости 2 прямые линии не могут образовать ограниченную фигуру, а 3 могут образовать треугольник. В пространстве 3 плоскости не могут образовать ограниченное тело, а 4 могут образовать тетраэдр. Отношение треугольника к плоскости такое же, как отношение тетраэдра к пространству, поскольку и треугольник и тетраэдр ограничены минимальным числом простых ограничивающих элементов. Отсюда аналогия.

Одно из значений греческого слова «аналогиа», от которого происходит слово «аналогия», есть «пропорция». Действительно, система двух чисел 6 и 9 «аналогична» системе двух чисел 10 и 15, поскольку отношения соответствующих членов этих двух систем согласуются:

6:9=10: 15.

Пропорциональность, или согласованность отношений соответствующих частей, которую мы интуитивно видим в геометрически подобных фигурах, является наводящим на размышления случаем аналогии.

Вот другой пример. Мы можем рассматривать треугольник и пирамиду, как аналогичные фигуры. С одной стороны, возьмите прямолинейный отрезок, а с другой — многоугольник. Соедините все точки отрезка с точкой, не лежащей на содержащей отрезок прямой, и вы получите треугольник. Соедините все точки многоугольника с точкой, не лежащей в плоскости многоугольника, и вы получите пирамиду. Таким же образом мы можем рассматривать как аналогичные фигуры параллелограмм и призму. Действительно, перемещайте отрезок или многоугольник параллельно самому себе в направлении прямой, пересекающей содержащую его прямую или плоскость, и первый опишет параллелограмм, а второй —призму. У нас может возникнуть искушение выразить это соотношение соответствия между плоскими фигурами и пространственными телами с помощью некоторого рода пропорции, и если на этот раз мы не устоим от искушения, то придем к рис. 2.1. Этот рисунок видоизменяет обычный смысл некоторых символов (: и = ) в том же направлении, в котором смысл слова «аналогиа» на протяжении истории языка был видоизменен от «пропорции» к «аналогии».

Последний пример поучителен еще и в другом отношении. Аналогия, особенно неполностью выясненная аналогия, может иметь не один смысл. Так, сравнивая плоскую и пространственную геометрию, мы сначала нашли, что треугольник в плоскости аналогичен тетраэдру в пространстве, а затем, что треугольник аналогичен пирамиде. Обе аналогии разумны, каждая имеет значение в своем месте. Между плоской и пространственной геометрией имеется несколько аналогий, а не всего лишь одна привилегированная аналогия.

Рис. 2.2 показывает, как начиная от треугольника мы можем подняться к многоугольнику с помощью обобщения, спуститься к равностороннему треугольнику с помощью специализации или перейти к различным пространственным телам с помощью аналогии — имеются аналогии во все стороны.

И запомните: не пренебрегайте смутными аналогиями. Однако, если вы хотите, чтобы они заслуживали уважение, попытайтесь их выяснить.

5. Обобщение, специализация и аналогия часто сотрудничают в решении математических задач1). Возьмем в качестве примера доказательство наиболее известной теоремы элементарной математики, теоремы Пифагора. Доказательство, которое мы изложим, не является новым. Оно принадлежит самому Евклиду (Евклид VI, 31).

(1) Рассмотрим прямоугольный треугольник со сторонами а, b и с, из которых первая, а, является гипотенузой. Мы хотим доказать, что

(А)

Рис. 2.1. Соотношения аналогии на плоскости и в пространстве.

Рис. 2.2. Обобщение, специализация, аналогия.

1) Этот параграф с небольшими изменениями воспроизводит заметку автора в Amer. Math. Monthly, 55 (1948), 241-243.

Эта цель наталкивает нас на мысль построить на трех сторонах нашего треугольника квадраты. И таким образом мы приходим к довольно знакомой части 1 нашей составной фигуры (рис. 2.3). (Читатель должен вычерчивать части этой фигуры по мере того, как они появляются в нашем рассуждении, чтобы видеть, как она возникает.)

(2) Открытия, даже очень скромные открытия, требуют, чтобы что-то было подмечено, осознана какая-то связь. Мы сумеем открыть доказательство, которое будет приведено ниже, если заметим аналогию между знакомой частью I нашей составной фигуры и едва ли менее знакомой частью II: тот же самый прямоугольный треугольник, что и в I, разбивается в II на две части высотой, опущенной на гипотенузу.

(3) Возможно, вы не улавливаете аналогии между I и II. Эта аналогия, однако, может быть сделана ясной с помощью совместного обобщения фигур I и II, выраженного в III. Там мы снова находим тот же самый прямоугольный треугольник, и на трех его сторонах построены три многоугольника, подобные друг другу, но в остальном произвольные.

(4) Площадь квадрата, построенного на гипотенузе в 1, равна а2. Площадь неправильного многоугольника, построенного на гипотенузе в III, можно считать равной Ха2; множитель À определяется как отношение двух данных площадей. Но тогда из подобия трех многоугольников, построенных на сторонах a, b и с треугольника в III, следует, что их площади соответственно равны Ка2, Kb2 и Ас2.

Теперь, если бы уравнение (А) было верно (как устанавливается теоремой, которую мы хотим доказать), то было бы верно также и следующее:

(В)

Действительно, нужно лишь очень небольшое применение алгебры, чтобы из (А) вывести (В). Теперь (В) представляет обобщение исходной теоремы Пифагора: если три подобных многоугольника построены на трех сторонах прямоугольного треугольника, то многоугольник, построенный на гипотенузе, равен по площади сумме двух других.

Поучительно заметить, что это обобщение равносильно частному случаю, от которого мы отправлялись. В самом деле, мы можем

Рис. 2.3.

уравнения (А) и (В) вывести одно из другого путем умножения или деления на À (которое, как отношение двух площадей, отлично от 0).

(5) Общая теорема, выраженная в (В), равносильна не только частному случаю (А), но и любому другому частному случаю. Следовательно, если бы какой-нибудь такой частный случай оказался очевидным, то общий случай был бы доказан.

Так вот, пытаясь найти полезную специализацию, поищем подходящий частный случай. И действительно, II представляет такой случай. В самом деле, прямоугольный треугольник, построенный на своей собственной гипотенузе, как хорошо известно и как легко видеть, подобен двум другим треугольникам, построенным на двух его катетах. И, очевидно, площадь всего треугольника равна сумме площадей двух его частей. Таким образом, теорема Пифагора доказана.

Предыдущее рассуждение чрезвычайно поучительно. Случай является поучительным, если мы можем научиться на нем чему-нибудь, приложимому к другим случаям, и тем более поучительным, чем шире границы возможных приложений. И вот на предыдущем примере мы можем научиться употреблению таких фундаментальных мыслительных операций, как обобщение, специализация и восприятие аналогий. Возможно, не существует открытий ни в элементарной, ни в высшей математике, ни даже, пожалуй, в любой другой области, которые могли бы быть сделаны без этих операций, в особенности без аналогии.

Предыдущий пример показывает, как от частного случая (от случая, представленного фигурой I) с помощью обобщения мы можем подняться к более общей ситуации (к фигуре III) и с помощью специализации вновь спуститься отсюда к аналогичному случаю (к фигуре II). Он демонстрирует также тот факт, столь обычный в математике и тем не менее столь поражающий начинающего или философа, хотя он как будто и знает, что общий случай может быть логически равносилен частному случаю. Наш пример просто и наглядно показывает, как обобщение, специализация и аналогия естественно сочетаются в усилии достигнуть желаемого решения. Заметьте, что, для того чтобы полностью понять предыдущее рассуждение, нужен лишь минимум предварительных знаний.

6. Открытие по аналогии. Аналогия, по-видимому, имеет долю во всех открытиях, но в некоторых она имеет львиную долю. Я хочу проиллюстрировать это примером, не совсем элементарным, но имеющим исторический интерес и производящим значительно более сильное впечатление, чем любой вполне элементарный пример, который я могу себе представить.

Яков Бернулли, швейцарский математик (1654—1705), современник Ньютона и Лейбница, открыл суммы нескольких бесконечных рядов, но ему не удалось найти сумму ряда чисел, обратных

квадратам:

«Если кому-либо удастся, — писал Бернулли, — найти то, что до сих пор не поддавалось нашим усилиям, и если он сообщит это нам, то мы будем очень ему обязаны».

Эта задача привлекла внимание другого швейцарского математика, Леонарда Эйлера1) (1707—1783), который родился, как и Яков Бернулли, в Базеле и был учеником Иоганна Бернулли (1667—1748), брата Якова. Он нашел различные выражения для искомой суммы (определенные интегралы, другие ряды), но ни одно из них его не удовлетворяло. Одним из этих выражений он воспользовался, чтобы вычислить сумму с точностью до семи знаков (1,644934). Но это только приближенное значение, а его целью было найти точное. В конце концов он открыл его. Аналогия привела его к чрезвычайно дерзкому предположению.

(1) Начнем с обозрения нескольких элементарных алгебраических фактов, существенных в открытии Эйлера. Если уравнение я-й степени

имеет n различных корней

то многочлен, стоящий в его левой части, может быть представлен как произведение n линейных множителей,

Сравнивая члены с одной и той же степенью х в обеих частях этого тождества, выводим хорошо известные соотношения между корнями и коэффициентами уравнения, простейшим из которых является

мы находим его, сравнивая члены с хп~1.

Разложение на линейные множители можно представить по-другому. Если ни один из корней a1, a2, ал не равен 0, или (что то же самое) если а0 отлично от нуля, то мы имеем также

1) Более 30 лет своей жизни Эйлер провел в России, где опубликовал в изданиях Петербургской Академии наук, членом которой он являлся, большую часть своих работ. — Прим. перев.

Существует еще другой вариант. Предположим, что уравнение степени 2л имеет вид

и 2л различных корней Тогда

и

(2) Эйлер рассматривает уравнение

или

Левая часть имеет бесконечное число членов, она «бесконечной степени». Поэтому не удивительно, говорит Эйлер, что имеется бесконечное число корней

Эйлер отбрасывает корень 0. Он делит левую часть уравнения на х, линейный множитель, соответствующий корню 0, и получает таким образом уравнение

с корнями

Мы встречались с аналогичной ситуацией раньше, в (1), когда рассматривали последний вариант разложения на линейные множители. Эйлер по аналогии заключает, что

Эго тот самый ряд, который не поддавался усилиям Якова Бернулли, но это было дерзкое заключение.

(3) Эйлер очень хорошо знал, что его заключение было дерзким. «Метод был новым и никогда еще не использовался для такой цели»,— писал он десять лет спустя. Он сам видел некоторые возражения, и многие возражения были выдвинуты его друзьями-математиками, когда они оправились после первого восхищенного изумления.

Однако у Эйлера были свои основания верить в это открытие. Прежде всего числовое значение для суммы ряда, которое он вычислил раньше, до последнего знака согласовалось с л2/6. Сравнивая следующие коэффициенты в его выражении sinx в виде произведения, он нашел сумму другого замечательного ряда, а именно ряда чисел, обратных четвертым степеням:

Снова он исследовал числовое значение и снова нашел согласие.

(4) Эйлер испытал свой метод и на других примерах. Ему удалось при этом вновь получить сумму я2/6 для ряда Якова Бернулли с помощью различных видоизменений своего первого подхода. Ему удалось также заново открыть своим методом сумму важного ряда, принадлежащего Лейбницу.

Остановимся на последнем вопросе. Рассмотрим, следуя Эйлеру, уравнение

Оно имеет корни

Каждый из этих корней является, однако, двойным корнем. (Кривая y=sinx не пересекает при этих абсциссах прямую у=1, а касается ее. Производная левой части, но не вторая производная, при этих значениях х обращается в нуль.) Следовательно, уравнение

имеет корни

и заключение Эйлера по аналогии приводит к разложению на линейные множители:

Сравнивая коэффициенты при х в обеих частях равенства, получаем

Это—знаменитый ряд Лейбница; дерзкий прием Эйлера привел к уже известному результату. «Для нашего метода, — говорит Эйлер,— который может некоторым казаться недостаточно надежным, здесь обнаруживается великое подтверждение. Поэтому мы вообще не должны сомневаться в других результатах, выведенных тем же методом».

(5) Однако Эйлер продолжал сомневаться. Он и дальше производил числовые проверки, описанные выше в (3), исследовал все больше рядов и все больше десятичных знаков и во всех подвергавшихся исследованию случаях находил согласие. Он испытывал и другие подходы, и наконец ему удалось не только приближенно, но и точно подтвердить значение n2/6 для суммы ряда Якова Бернулли. Он нашел новое доказательство. Это доказательство, хотя и скрытое и остроумное, опиралось на более обычные соображения и было принято как совершенно строгое. Итак, наиболее бросающееся в глаза следствие открытия Эйлера было убедительно подтверждено. Эти доводы, по-видимому, убедили Эйлера в том, что его результат правилен1).

7. Аналогия и индукция. Мы хотим узнать что-нибудь о природе изобретательных и индуктивных рассуждений. Что мы можем почерпнуть из только что приведенного рассказа?

(1) Решающий шаг Эйлера был дерзким. С точки зрения строгой логики он был явной ошибкой: Эйлер применил правило к такому случаю, для которого правило не было установлено; правило, относящееся к алгебраическим уравнениям, он применил к уравнениям неалгебраическим. С точки зрения строгой логики шаг Эйлера не был оправдан. Однако он был оправдан аналогией, аналогией с наиболее плодотворными достижениями растущей науки, которую через несколько лет он сам назвал «Анализом Бесконечного». Другие

1) Значительно позже, почти через десять лет после своего первого открытия, Эйлер возвратился к этому вопросу, ответил на возражения, до некоторой степени завершил свой первоначальный эвристический подход и дал новое, существенно иное доказательство. См. Euler, Opera Omnia, ser. 1, vol. 14, p. 73—86, 138—155, 177—186, также 156—176, где содержится заметка Пауля Штеккеля об истории этой задачи. (См. также А. Эйлер, Письма к ученым, М. —Л., 1963, стр. 179—193, 212—215, 227—228. — Прим. перев.).

математики, до Эйлера, переходили от конечных разностей к бесконечно малым разностям, от сумм с конечным числом членов к суммам с бесконечным числом членов, от конечных произведений к бесконечным произведениям. И таким же образом Эйлер перешел от уравнений конечной степени (алгебраических уравнений) к уравнениям бесконечной степени, применяя к бесконечному правила, установленные для конечного.

Эта аналогия, этот переход от конечного к бесконечному, окружен ловушками. Как избежал их Эйлер? Он был гением, ответят некоторые, и, конечно, это вовсе не объяснение. Эйлер имел серьезные основания верить в свое открытие. Имея хоть сколько-нибудь здравого смысла, мы можем понять эти основания без сверхъестественной проницательности, свойственной гениям.

(2) Основания Эйлера для веры в это открытие, кратко изложенные выше1), не являются доказательными. Эйлер не возвращается к исследованию оснований своего предположения2), своего дерзкого перехода от конечного к бесконечному; он только изучает его следствия. Он рассматривает подтверждение любого такого следствия как аргумент в пользу своего предположения. Он принимает и приближенные и точные подтверждения, но, по-видимому, придает больше веса последним. Он изучает также следствия тесно связанных аналогичных предположений3) и рассматривает подтверждение такого следствия как аргумент в пользу своего предположения.

Основания Эйлера в действительности были индуктивными. Изучение следствий предположения и оценка его на основе такого изучения —это типичный индуктивный прием. В научном исследовании, как и в обычной жизни, мы верим, или должны были бы верить, в предположение больше или меньше в соответствии с тем, лучше или хуже его обозримые следствия согласуются с фактами.

Короче говоря, Эйлер, по-видимому, рассуждает таким же образом, как обычно рассуждают разумные люди, ученые или неученые. Он, по-видимому, принимает некоторые принципы:

Предположение становится более правдоподобным после подтверждения любого нового следствия.

И:

Предположение становится более правдоподобным, если становится более правдоподобным аналогичное предположение.

Не этого ли рода принципы лежат в основе процесса индукции?

1) В § 6 (3), (4), (5). Собственное краткое изложение Эйлера см. в Opera Omnia, ser. 1, vol. 14, p. 140.

2) Представления sin x в виде бесконечного произведения.

3) Особенно произведение для 1 — sin д:.

ПРИМЕРЫ И ПРИМЕЧАНИЯ К ГЛАВЕ II

Первая часть

1. Правильное обобщение.

А. Найдите три числа х, у и г, удовлетворяющие следующей системе уравнений:

Если вам нужно решить А, то какое из трех следующих обобщений может лучше способствовать решению: В, С или D?

В. Найдите три неизвестных из системы трех уравнений.

С. Найдите три неизвестных из системы трех уравнений, первые два из которых линейны, а третье второй степени.

D. Найдите n неизвестных из системы n уравнений, первые n— 1 из которых линейны.

2. Даны произвольно расположенные точка и «правильная» пирамида с шестиугольным основанием. (Пирамида называется «правильной», если ее основание есть правильный многоугольник, через центр которого проходит высота пирамиды.) Найдите плоскость, которая проходит через данную точку и делит пополам объем данной пирамиды.

Чтобы помочь вам, я задаю вопрос: Каково правильное обобщение?

3. А. Три прямые, не лежащие в одной плоскости, проходят через одну и ту же точку О. Проведите через О плоскость, одинаково наклоненную к этим трем прямым.

В. Три прямые, не лежащие в одной плоскости, проходят через одну и ту же точку. Точка Р находится на одной из этих прямых; проведите через Р плоскость, одинаково наклоненную к этим трем прямым.

Сравните задачи А и В. Могли бы вы воспользоваться решением одной при решении другой? В чем состоит их логическая связь?

4. А. Вычислите интеграл

В. Вычислите интеграл

где р — данное положительное число.

Сравните задачи А и В. Могли бы вы воспользоваться решением одной при решении другой? В чем состоит их логическая связь?

5. Крайний частный случай. Два человека сидят за столом обычной прямоугольной формы. Один кладет на стол пенс, затем то же самое делает другой и так далее, поочередно. Подразумевается, что каждый пенс лежит на столе своей плоскостью и не налегает на какую-нибудь ранее положенную монету. Тот игрок, который кладет на стол последнюю монету, забирает деньги. Какой из игроков должен выиграть, если каждый играет наилучшим образом?

Это старинная, но превосходная головоломка. Мне довелось однажды наблюдать за действительно выдающимся математиком, когда ему была предложена эта головоломка. Он начал с того, что сказал: «Допустим, что стол так мал, что он покрывается одним пенсом. Тогда, очевидно, должен выиграть первый игрок». Иными словами, он начал с рассмотрения крайнего частного случая, в котором решение очевидно.

Из этого частного случая вы можете получить полное решение, если представите себе стол постепенно расширяющимся и вмещающим все больше и больше монет. Может быть, еще лучше обобщить задачу и подумать о столах

различных форм и размеров. Если вы подметите, что стол имеет центр симметрии и что правильное обобщение могло бы состоять в рассмотрении столов с центром симметрии, то получите решение или по крайней мере окажетесь к нему очень близко.

6. Постройте общую касательную двух данных окружностей.

Чтобы помочь вам, я задаю вопрос: Существует ли более доступный крайний частный случай?

7. Ведущий частный случай. Площадь многоугольника равна A, его плоскость образует с др\той плоскостью угол а. Многоугольник ортогонально проектируется на вторую плоскость. Найдите площадь проекции.

Заметьте, что форма многоугольника не дана. Однако имеется бесконечное разнообразие возможных форм. Какую форму следовало бы рассмотреть? Какую форму следовало бы рассмотреть вначале?

Существует одна форма, с которой особенно легко иметь дело: прямоугольник, основание которого параллельно линии / пересечения плоскости проектируемой фигуры с плоскостью проекции. Если а —основание такого прямоугольника, b— его высота и, следовательно, его площадь ab, то соответствующие величины для проекции будут а, fr cos а и ab cos а. Если площадь такого прямоугольника равна А, то площадь его проекции равна v4cosa.

Этот частный случай прямоугольника с основанием, параллельным /, не только особенно доступен; он является ведущим частным случаем. Другие случаи следуют из него; решение задачи в ведущем частном случае включает в себя решение задачи в общем случае. Действительно, отправляясь от прямоугольника с основанием, параллельным /, мы можем распространить правило «площаль проекции равна A cos а» последовательно на все другие фигуры. Сначала на прямоугольные треугольники с катетом, параллельным / (разбивая на две равные части тот прямоугольник, с которого мы начали;. Затем на любой треугольник со стороной, параллельной / (соединяя два прямоугольных треугольника); наконец, на произвольный многоугольник (разбивая его на треугольники только что упомянутого вида). Мы можем даже перейти к фигурам с криволинейными границами (рассматривая их как пределы многоугольников).

8. Угол с вершиной в центре круга вдвое больше угла с вершиной на окружности, опирающегося на то же основание, т. е. на ту же дугу. (Евклид III, 20.)

Если дан угол с вершиной в центре, то угол с вершиной на окружности еще не определен, его вершина может иметь различные положения'. Каким является «ведущее частное положение» в обычном доказательстве теоремы (доказательстве Евклида)?

9. Основная в теории аналитических функций теорема Коши утверждает, что интеграл от функции комплексного переменного вдоль произвольной замкнутой кривой равен нулю, если в области, ограниченной этой кривой, функция регулярна. Мы можем рассмотреть частный случай теоремы Коши, когда замкнутая кривая есть треугольник, как ведущий частный случай доказав теорему для треугольника, мы легко сумеем последовательно распространить ее на многоугольники (соединяя треугольники) и кривые (рассматривая их как пределы многоугольников). Обратите внимание на аналогию с задачами 7 и 8.

10. Частный случай-представитель. Вам нужно решить какую-нибудь задачу о многоугольниках с n сторонами. Вы чертите пятиугольник, решаете задачу для него, изучаете ваше решение и замечаете, что оно в такой же мере годится в общем случае для любого я, как и в частном случае n=Б. Тогда вы можете назвать я —5 частным случаем-представителем: он представляет вам общий случай. Конечно, для того чтобы быть действительно представителем, случай n = Б не должен иметь никаких специфических упрощений, которые могли бы ввести вас в заблуждение. Частный случай-представитель должен быть не проще, чем общий случай.

Частные случаи-представители частно удобны в преподавании. Мы можем доказать теорему об определителях n-го порядка, тщательно рассматривая определители всего лишь 3-го порядка.

11. Аналогичный случай. Задача состоит в проектировании самолетов так, чтобы опасность перелома черепа в случае аварии была наименьшей. Врач, изучающий эту задачу, экспериментирует с яйцами, разбивая их при различных условиях. Что он делает? Он видоизменил первоначальную задачу и изучает теперь вспомогательную задачу разбивания яиц вместо разбивания черепов. Связь между двумя задачами — первоначальной и вспомогательной — аналогия. С механической точки зрения голова человека и куриное яйцо в общих чертах аналогичны: голова и яйцо состоят из жесткой хрупкой оболочки, содержащей студенистое вещество.

12. Если две прямые в пространстве пересекаются тремя параллельными плоскостями, то соответствующие отрезки пропорциональны.

Чтобы помочь вам найти доказательство, я задаю вопрос: Существует ли более простая аналогичная теорема?

13. Четыре диагонали параллелепипеда имеют общую точку, являющуюся серединой каждой из них.

Существует ли более простая аналогичная теорема?

14. Сумма любых двух плоских углов трехгранного угла больше, чем третий плоский угол.

Существует ли более простая аналогичная теорема?

15. Рассмотрите тетраэдр как тело, аналогичное треугольнику. Перечислите понятия пространственной геометрии, аналогичные следующим понятиям плоской геометрии: параллелограмм, прямоугольник, квадрат, биссектриса угла. Сформулируйте теорему пространственной геометрии, аналогичную следующей теореме плоской геометрии: биссектрисы трех углов треугольника пересекаются в одной точке, являющейся центром окружности, вписанной в треугольник.

16. Рассмотрите пирамиду как тело, аналогичное треугольнику. Перечислите тела, аналогичные следующим плоским фигурам: параллелограмм, прямоугольник, круг. Сформулируйте теорему пространственной геометрии, аналогичную следующей теореме плоской геометрии: площадь круга равна площади треугольника, основание которого имеет ту же длину, что и окружность, и высота которого равна радиусу.

17. Придумайте теорему пространственной геометрии, аналогичную следующей теореме плоской геометрии: высота равнобедренного треугольника проходит через середину основания.

Какое пространственное тело вы рассматриваете как аналогичное равнобедренному треугольнику?

18. Великие аналогии. (1) Предыдущие примеры 12—17 подчеркивают аналогию между плоской и пространственной геометрией. Эту аналогию можно рассматривать со многих точек зрения и поэтому часто она неоднозначна и не всегда имеет ясные очертания, но она является неисчерпаемым источником новых идей и новых открытий.

(2) Числа и фигуры являются не единственными объектами математики. Математика принципиально неотделима от логики и имеет дело со всеми объектами, которые могут быть объектами точной теории1). Числа и фигуры,

1) На самом деле под «точной теорией» обычно понимается теория, которая может быть арифметизирована так, что теоремы этой теории превращаются в теоремы арифметики. Объявление предметом математики любых объектов, «которые могут быть объектами точной теории», таким образом, не выводит на самом деле за пределы энгельсовского определения математики как науки о количественных отношениях и пространственных формах действительного мира (см. Энгельс Ф., Анти-Дюринг, стр. 37, Госполитиздат, 1953; БСЭ, II изд., статья «Математика»). —Прим. ред.

однако, являются наиболее обычными объектами математики, и математики любят иллюстрировать факты, касающиеся чисел, свойствами фигур, а факты, касающиеся фигур, свойствами чисел. Поэтому существуют бесчисленные виды аналогии между числами и фигурами. Некоторые из этих видов очень ясны. Так в аналитической геометрии мы изучаем точно определенное соответствие между алгебраическими и геометрическими объектами и отношениями. Но многообразие геометрических фигур неисчерпаемо, как неисчерпаемо и многообразие возможных операций над числами; столь же неисчерпаемы и возможные соответствия между этими многообразиями.

(3) Изучение пределов и предельных процессов вводит иной вид аналогии, которую можно назвать аналогией между бесконечным и конечным. Так бесконечные ряды и интегралы в различных отношениях аналогичны конечным суммам, пределами которых они являются; дифференциальное исчисление аналогично исчислению конечных разностей; дифференциальные уравнения, особенно линейные однородные уравнения, до некоторой степени аналогичны алгебраическим уравнениям, и так далее. Важной относительно новой ветвью математики является теория интегральных уравнений; она дает удивительный и прекрасный ответ на вопрос: что в интегральном исчислении является аналогом системы n линейных уравнений с n неизвестными? Аналогия между бесконечным и конечным вызывает особый интерес потому, что она имеет своеобразные трудности и ловушки. Она может вести к открытию или к ошибке; см. пример 46.

(4) Галилей, открывший параболическую траекторию брошенных тел и количественный закон их движения, сделал также великие открытия в астрономии. С помощью своего только что изобретенного телескопа он открыл спутников Юпитера. Он заметил, что эти спутники, обращающиеся вокруг планеты Юпитер, аналогичны Луне, обращающейся вокруг Земли, а также аналогичны планетам, обращающимся вокруг Солнца. Он открыл также фазы Венеры и подметил их сходство с фазами Луны. Эти открытия, воспринятые как великое подтверждение гелиоцентрической теории Коперника, горячо обсуждались в то время. Странно, что Галилей не заметил аналогии между движением небесных тел и движением брошенных тел, которую вполне возможно осознать интуитивно. Траектория брошенного тела обращена своей вогнутостью к земле, и то же самое имеет место для траектории Луны. Ньютон настаивал на этой аналогии: «... брошенный камень под действием собственного веса отклоняется от прямолинейного пути, по которому он должен был бы следовать под влиянием только начального броска, и вынужден описать кривую линию в воздухе, и ... наконец, упасть на землю; и чем больше скорость, с которой он брошен, тем дальше он пролетит, прежде чем упадет на землю. Поэтому мы можем предположить, что при соответственно возрастающей скорости он опишет дуги в 1, 2, 5, 10, 100, 1000 миль, прежде чем упадет на землю, пока, наконец, покинув пределы Земли, он не должен будет перейти в пространство, не коснувшись ее»1). См. рис. 2.4.

Меняясь непрерывно, траектория камня переходит в траекторию Луны. И как камень и Луна связаны с Землей, так спутники Юпитера связаны с Юпитером или Венера и другие планеты с Солнцем. Без ясного понимания этой аналогии мы можем только очень несовершенно понять открытие Ньютоном всемирного тяготения, которое до сих пор мы можем рассматривать как величайшее когда бы то ни было сделанное научное открытие.

19. Выясненные аналогии. Аналогия часто является смутной. Ответ на вопрос, что чему аналогично, часто неоднозначен. Смутность аналогии не уменьшает ее интереса и полезности; однако те случаи, когда понятие аналогии

1) См. Sir Isaac Newton's Mathematical Principles of Natural Philosophy and his System of the World, Berkeley, 1946, p. 551. [В русских изданиях Начал Ньютона перевод работы «The System of the World» (Система мира) отсутствует. —Прим. перев.]

достигает ясности логических или математических понятий, заслуживают специального рассмотрения.

(1) Аналогия есть сходство отношений. Это сходство имеет ясный смысл, если отношения управляются одними и теми же законами. С этой точки зрения сложение чисел аналогично умножению чисел в той степени, в какой сложение и умножение подчиняются одним и тем же правилам. И сложение и умножение коммутативны и ассоциативны,

И то и другое допускает обратную операцию; уравнения

сходны, поскольку каждое из них допускает решение и не более чем одно решение. (Чтобы иметь возможность установить последнее правило без исключения, мы должны допустить отрицательные числа при рассмотрении сложения и исключить случай а = 0 при рассмотрении умножения.) В этой связи вычитание аналогично делению; действительно, решениями вышеуказанных уравнений соответственно являются

Рис. 2.4. От траектории камня к траектории Луны. Из «Системы мира» Ньютона.

Далее, число 0 аналогично числу 1; действительно, прибавление 0 к любому числу, как и умножение любого числа на 1, не меняет этого числа,

Эти законы —одни и те же для различных классов чисел; мы можем рассматривав здесь рациональные числа, или действительные числа, или комплексные числа. Вообще, системы объектов, подчиняющиеся одним и тем же основным законам (или аксиомам), можно рассматривать как аналогичные между собой, и этот вид аналогии имеет вполне ясный смысл.

(2) Сложение действительных чисел аналогично умножению положительных чисел еще и в другом смысле. Любое действительное число г есть логарифм некоторого положительного числа р,

(Если мы рассматриваем десятичные логарифмы, то г = —2 при р = 0,01.) В силу этого соотношения каждому положительному числу соответствует совершенно определенное действительное число, и каждому действительному числу— совершенно определенное положительное число. При этом соответствии сложение действительных чисел соответствует умножению положительных чисел. Если

то любое из следующих двух соотношений влечет за собой другое:

Формула слева и формула справа рассказывают один и тот же рассказ на двух разных языках. Назовем одно из соответствующих чисел переводом другого; например, назовем действительное число г (логарифм р) переводом р, а р оригиналом для г. (Мы могли бы поменять местами слова «перевод» и «оригинал», но должны были сделать выбор, и после этого мы придерживаемся нашего выбора.) В этой терминологии сложение выступает как перевод умножения, вычитание —как перевод деления, 0 —как перевод 1, коммутативный закон и ассоциативный закон для сложения действительных чисел понимаются как переводы этих законов для умножения положительных чисел. Перевод, конечно, отличается от оригинала, но он является правильным переводом в следующем смысле: из любого соотношения между элементами оригинала мы можем с непреложностью вывести соответствующее соотношение между соответствующими элементами перевода, и наоборот. Такой правильный перевод, т. е. взаимно однозначное соответствие, сохраняющее законы некоторых соотношений, на техническом языке математика называется изоморфизмом. Изоморфизм есть вполне выясненный вид аналогии.

(3) Третий тип вполне выясненной аналогии есть то, что математики называют на техническом языке гомоморфизмом (или многозначным изоморфизмом). Подробное изложение примера или точное описание этого понятия заняло бы слишком много времени, но мы можем попытаться понять следующее приближенное описание. Гомоморфизм есть своего рода систематически сокращенный перевод. Оригинал не только переводится на другой язык, но и сокращается, так что то, что получается в конечном счете после перевода и сокращения, оказывается систематически равномерно сжатым в половину, или одну треть, или в какую-либо другую долю первоначальной протяженности. Тонкости при таком сокращении могут быть потеряны, но все, что есть в оригинале, чем-то представлено в переводе, и в уменьшенном масштабе соотношения сохраняются.

20. Цитаты.

«Посмотрим, не могли ли бы мы удачно придумать какую-либо другую общую задачу, которая содержит первоначальную задачу и легче поддается решению. Так, когда мы разыскиваем касательную в данной точке, мы представляем себе, что просто разыскиваем прямую, пересекающую данную кривую

в данной точке и в некоторой другой точке, удаленной на данное расстояние от данной точки. После решения этой задачи, которую всегда можно легко решить с помощью алгебры, мы находим касательную как частный случаи, именно частный случай, когда данное расстояние минимально, сводится к точке, исчезает» (Лейбниц).

«Как часто случается, общая задача оказывается легче, чем была бы частная задача, если бы мы пытались решить ее непосредственно, в лоб» (Лежен-Дирихле, Дедекинд).

«[Может оказаться полезным] свести род ко всем его отдельным видам, и таким образом к немногим видам, однако наиболее полезно свести род к одному наименьшему виду» (Лейбниц).

«Правильно в философии рассматривать сходство, даже в вещах, далеко отстоящих друг от друга» (Аристотель).

«Сравнения имеют огромное значение, поскольку они сводят неизвестные отношения к известным отношениям.

Правильное понимание есть, наконец, схватывание отношений (un saisir de rapports). Но мы понимаем отношения более отчетливо и более ясно, когда осознаем, что они одни и те же в широко отличающихся случаях и между совершенно разнородными объектами» (Шопенгауэр).

Вам не следует, однако, забывать, что существует два рода обобщений: один дешевый, а другой ценный. Легко обобщить путем разрежения, важно обобщить путем сгущения. Развести немного вина большим количеством воды дешево и легко. Приготовить очищенный и сгущенный экстракт из некоторых хороших составных частей значительно труднее, но ценно. Обобщение путем сгущения сжимает в одно понятие большого размаха несколько идей, казавшихся ранее разбросанными. Так, теория групп сводит к общему выражению идеи, рассеянные перед тем в алгебре, теории чисел, анализе, геометрии, кристаллографии и других областях. В настоящие дни более моден, чем прежде, другой род обобщения. Он разводит маленькие идеи большой терминологией. Автор обычно предпочитает даже эти маленькие идеи брать у кого-либо другого, воздерживаясь от добавления какого-либо собственного наблюдения, и избегает решения каких-либо задач, за исключением нескольких задач, возникающих из трудностей его собственной терминологии. Было бы очень легко привести пример, но я не хочу наживать врагов1).

Вторая часть

Все примеры и примечания этой второй части связаны с § 6 и между собой. Многие из них прямо или косвенно ссылаются на пример 21, который следует прочитать вначале.

21. Предположение Э. Мы рассматриваем равенство

как предположение; мы называем его «предположением .9». Следуя Эйлеру, мы хотим исследовать это предположение индуктивно.

Индуктивное исследование предположения включает в себя сопоставление его следствий с фактами. Мы часто будем «предсказывать, исходя из 3, и подтверждать». «Предсказание, исходя из Э» означает выведение в предположении, что Э верно. «Подтверждение» означает выведение без этого предположения. Факт «находится в согласии с 3», если он (легко) может быть выведен из предположения, что Э верно.

1) Полиа Г. и Сеге Г., Задачи и теоремы из анализа, М., 1956, т. 1, стр. 12.

В дальнейшем мы будем считать известными элементы математического анализа (которые, с формальной точки зрения, были полностью известны Эйлеру во время его открытия), включая строгое понятие предела (относительно которого Эйлер никогда не достигал полной ясности). Мы будем пользоваться только такими предельными процессами, которые могут быть оправданы (большая часть из них совсем легко), но не будем входить в детали оправданий.

22. Мы знаем, что sin (—х) =—sin х. Находится ли этот факт в согласии 3?

23. Предскажите, исходя из 3, и подтвердите значение бесконечного произведения

24. Предскажите, исходя из 3, и подтвердите значение бесконечного произведения

25. Сравните примеры 23 и 24 и сделайте обобщение.

26. Предскажите, исходя из 3, значение бесконечного произведения

27. Покажите, что предположение 3 равносильно утверждению

28. Мы знаем, что 8.п(х+я) =—sin*. Находится ли этот факт в согласии с 3?

29. Метод § 6 (2) приводит к предположению

Покажите, что это не только аналог, но и следствие предположения 3.

30. Мы знаем, что

Находится ли этот факт в согласии с 3?

31. Предскажите, исходя из 3, и подтвердите значение бесконечного произведения

32. Предскажите, исходя из 3, и подтвердите значение бесконечного произведения

33. Сравните примеры 31 и 32 и сделайте обобщение.

34. Мы знаем, что соэ(—x)—cosx. Находится ли этот факт в согласии с 3?

35. Мы знаем, что соз(*+я) =—cosx. Находится ли этот факт в согласии с 3?

36. Выведите из 3 произведение для 1 — sinx, предположение о котором мы сделали в § 6 (4).

37. Выведите из 3, что

38. Выведите из 3, что

и найдите суммы бесконечных рядов, появляющихся в качестве коэффициентов в правой части.

39. Выведите из 3, что

и найдите суммы бесконечных рядов, появляющихся в качестве коэффициентов в последнем выражении. 40. Покажите, что

откуда получается второй вывод для суммы ряда в левой части равенства.

41 (продолжение). Попытайтесь найти третий вывод, зная, что

42 (продолжение). Попытайтесь найти четвертый вывод, зная, что

43. Эйлер (Opera Omnia, ser. 1, vol. 14, p. 40, 41) пользовался формулой

справедливой для 0 < х < 1, чтобы численно найти сумму ряда в левой части.

(a) Докажите эту формулу.

(b) Какое значение х наиболее выгодно для вычисления суммы ряда, стоящего в левой части?

44. Возражение и первый шаг к доказательству. Нет оснований a priori допускать, что sin х может быть разложен на линейные множители, соответствующие корням уравнения

Но если бы даже мы допустили это, остается возражение: Эйлер не доказал, что

— все корни этого уравнения. Мы можем убедиться (рассматривая кривую ^ = sinх), что нет других действительных корней, однако Эйлер никоим образом не исключил возможность существования комплексных корней.

Это возражение было выдвинуто Даниилом Бернулли (сыном Иоганна, 1700—1788). Эйлер ответил на это рассмотрением

есть многочлен (степени л, если n нечетное).

Покажите, что Рп (х) не имеет комплексных корней.

45. Второй шаг к доказательству. Предполагая, что n в примере 44 нечетно, разложите Рп (х)/х на множители так, чтобы его k-Pi множитель для каждого фиксированного k (k = \, 2, 3, ...) приближался к

когда n стремится к со.

46. Опасности аналогии. Коротко говоря, аналогия между конечным и бесконечным привела Эйлера к великому открытию. Однако его путь проходил по самому краю возможной ошибки. Вот пример, показывающий опасность в задаче меньшего масштаба.

Ряд

сходится. Его сумма / грубо может быть оценена с помощью первых двух

членов: Теперь,

В этом ряде существует всего один член с данным четным знаменателем (он отрицателен), но два члена с данным нечетным знаменателем (один положительный, а другой отрицательный). Соединим вместе члены с одним и тем же нечетным знаменателем

Но 21Ф1 потому, что 1^=0. Где ошибка и как можно предохранить себя от ее повторения?

III. ИНДУКЦИЯ В ПРОСТРАНСТВЕННОЙ ГЕОМЕТРИИ

В самой математике главные средства достигнуть истины — индукция и аналогия. — Лаплас1)

1. Многогранники. «Сложный многогранник имеет много граней, углов и ребер». Какое-нибудь туманное замечание такого рода легко приходит в голову почти всякому, кто имел какое-либо соприкосновение с пространственной геометрией. Не так много людей, однако, захотят сделать серьезное усилие, чтобы углубиться в это замечание и отыскать за ним какую-нибудь более точную информацию. Правильно было бы ясно различить участвующие величины и задать какой-нибудь определенный вопрос. Обозначим поэтому число граней, число вершин и число ребер многогранника соответственно через Г, В и Р (начальные буквы соответствующих слов) и поставим такой четкий вопрос: «Всегда ли верно, что число граней возрастает, когда возрастает число вершин? Непременно ли Г возрастает вместе с В?»

Для начала мы едва ли можем сделать что-либо лучшее, чем исследовать примеры, конкретные многогранники. Так, для куба (тело I на рис. 3.1)

Г=6, В = 8, Р=12.

Или для призмы с треугольным основанием (тело II на рис. 3.1)

Г=5, Я=6, Р=9.

Раз уж мы выбрали такой путь, нам, естественно, нужно просмотреть и сравнить различные тела, например, те, которые показаны на рис. 3.1. Именно, помимо уже упомянутых I и II, здесь изображены следующие тела: призма с пятиугольным основанием (III), пирамиды с квадратным, треугольным и пятиугольным основаниями (IV, V, VI), октаэдр (VII), «башня с крышей» (VIII, пирамида, поставленная на верхнюю грань куба, как на основание) и «усеченный куб» (IX). Сделаем маленькое усилие воображения и представим себе эти тела одно за другим достаточно ясно, чтобы сосчитать грани, вершины и ребра. Найденные числа записаны в следующей таблице:

1) Лаплас, Опыт философии теории вероятностей, М, 1908, стр. 7.

Многогранники

г

в

р

I куб ..............

6

8

12

II трехгранная призма

5

6

9

III пятигранная призма . . . . ,

7

10

15

IV четырехгранная пирамида . .

5

5

8

V трехгранная пирамида . . . .

4

4

6

VI пятигранная пирамида . . . .

6

6

10

VII октаэдр ..... .......

8

6

12

VIII «башня»............

9

9

16

IX «усеченный куб».......

7

10

15

Наш рис. 3.1 имеет некоторое поверхностное сходство с минералогической выставкой, а вышеприведенная таблица до некоторой степени сходна с записной книжкой, в которую физик вносит результаты своих экспериментов. Мы исследуем и сравниваем тела и числа в нашей таблице, как минералог или физик исследовали бы свои с большим трудом собранные образцы и данные. У нас есть теперь кое-что в руках, чтобы иметь возможность ответить на наш первоначальный вопрос «Возрастает ли В вместе с Г?» В самом деле, ответ будет «Нет»; сравнивая куб и октаэдр (I и VII), мы видим, что один имеет больше вершин, а другой больше граней.

Рис. 3.1. Многогранники.

Итак, наша первая попытка установить общую закономерность не удалась.

Мы можем, однако, попробовать что-нибудь другое. Возрастает ли Р вместе с Г? Или с В? Чтобы систематически ответить на эти вопросы, мы перестроим свою таблицу. Запишем наши многогранники в таком порядке, чтобы Р возрастало, когда мы последовательно читаем строки сверху вниз.

Многогранники

Г

в

р

Трехгранная пирамида .......

4

4

6

Четырехгранная пирамида .....

5

5

8

Трехгранная призма ........

5

6

9

Пятигранная пирамида ......

6

6

10

Куб................

6

8

12

Октаэдр...............

8

6

12

Пятигранная призма........

7

10

15

«Усеченный куб»..........

7

10

15

«Башня»...............

9

9

16

Рассматривая наши более удобно расположенные данные, мы легко можем заметить, что никакой закономерности предполагаемого типа не существует. Когда Р возрастает от 15 до 16, 5 падает от 10 до 9. С другой стороны, когда мы переходим от октаэдра к пятигранной призме, Р возрастает от 12 до 15, но Г падает от 8 до 7. Ни Г ни В не возрастают неизменно вместе с Р.

Нам снова не удалось найти общую закономерность. Но не хотелось бы признать, что наша первоначальная идея была совершенно ошибочной. Некоторое ее видоизменение могло бы еще оказаться правильным. Ни Г ни В не возрастают вместе с Р по отдельности; это верно, но они, по-видимому, возрастают «в совокупности». Разглядывая свою хорошо составленную таблицу, мы можем подметить, что Г и В возрастают «совместно»: сумма Г+В возрастает, когда мы читаем строки сверху вниз. А затем мы внезапно можем заметить более точную закономерность: во всей таблице

Г+В = Р + 2.

Это соотношение подтверждается во всех девяти случаях, записанных в нашей таблице. Кажется невероятным, чтобы такая упорная закономерность оказалась простым совпадением. Итак, мы пришли к предположению, что не только в наблюдавшихся нами случаях, но и в любом многограннике число граней, увеличенное на число вершин, равно числу ребер, увеличенному на два.

2. Первые подкрепляющие контакты. Натуралист, прошедший хорошую школу, нелегко допускает предположение. Даже если предположение кажется правдоподобным и в нескольких случаях подтвердилось, он будет в нем сомневаться и собирать новые наблюдения или придумывать новые эксперименты, чтобы его проверить.

Именно это можем сделать и мы. Мы собираемся исследовать и другие многогранники, подсчитать их грани, вершины и ребра и сравнить Г+В и Р + 2. Эти числа могут быть равны или нет. Будет интересно выяснить, что же имеет место в действительности.

Рассматривая рис. 3.1, мы можем заметить, что уже исследовали три из правильных многогранников, куб, тетраэдр и октаэдр (I, V и VII). Исследуем оставшиеся два, икосаэдр и додекаэдр.

Икосаэдр имеет 20 граней, все они треугольники, и, таким образом, Г'=20. 20 треугольников имеют вместе 3 × 20 = 60 сторон, причем каждое ребро икосаэдра является общей стороной двух треугольников. Следовательно, число ребер равно 60/2 = 30 = Р. Аналогично мы можем найти В. Мы знаем, что вокруг каждой из вершин икосаэдра группируется по 5 его граней. 20 треугольников вместе имеют 3 × 20 = 60 углов, причем 5 углов имеют общую вершину. Следовательно, число вершин равно 60/5 = 12 = В.

Додекаэдр имеет 12 граней, все они пятиугольники, причем вокруг каждой вершины группируется по 3 пятиугольника. Отсюда, как и прежде, заключаем, что

Мы можем теперь прибавить к нашей таблице на стр. 58 еще две строки:

Многогранники

Г

В

Р

Икосаэдр.......

20

12

30

Додекаэдр......

12

20

30

Наше предположение, что Г+В = Р + 2, подтверждается в обоих случаях.

3. Еще подкрепляющие контакты. Благодаря предыдущим подтверждениям, наше предположение стало ощутимо более правдоподобным; но доказано ли оно теперь? Никоим образом. В подобной ситуации скрупулезный натуралист чувствовал бы удовлетворение успехом своего эксперимента, но продолжал бы придумывать дальнейшие эксперименты. Какой многогранник следовало бы нам испытать теперь?

Дело в том, что наше предположение к настоящему времени так хорошо подтвердилось, что подтверждение еще в одном только случае лишь немного прибавило бы к нашей уверенности, возможно так мало, что едва ли стоило бы труда выбирать многогранник и подсчитывать его части. Не могли ли бы мы найти более стоящий путь испытания нашего предположения?

Рассматривая рис. 3.1, мы можем заметить, что все тела в верхнем ряду имеют одинаковую природу: они — призмы. Точно так же все тела во втором ряду — пирамиды. Наше предположение верно

для трех призм и трех пирамид, изображенных на рис. 3.1; но верно ли оно для всех призм и пирамид?

Если призма имеет n боковых граней, то она имеет всего я+2 грани, 2n вершин и Зл ребер. Пирамида с n боковыми гранями имеет всего л+1 грань, л+1 вершину и 2л ребер. Итак, мы можем добавить еще две строки к нашей таблице на стр. 58:

Многогранники

Г

В

Р

Пирамида с n боковыми гранями . . .

n+1

2n

Призма с л боковыми гранями ....

n + 2

2n

3n

Наше предположение, утверждающее, что Г+/? = Р+2, оказалось верным не только еще для одного или двух многогранников, но для двух бесконечных серий многогранников.

4. Суровое испытание. Последнее замечание значительно увеличивает нашу уверенность в своем предположении, но, конечно, не доказывает его. Что же нам делать? Нужно ли продолжать испытывать дальнейшие частные случаи? Наше предположение, по-видимому, довольно хорошо выдерживает простые испытания. Поэтому нам следовало бы подвергнуть его какому-нибудь суровому, придирчивому испытанию, имеющему хорошие шансы его опровергнуть.

Взглянем снова на нашу коллекцию многогранников (рис. 3.1). Там имеются призмы (1, II, III), пирамиды (IV, V, VI), правильные многогранники (I, V, VII); но мы уже исчерпывающим образом рассмотрели все эти типы тел. Что там есть еще? Рис. 3.1 содержит также «башню» (VIII), которая получается, если к верхнему основанию куба пристроить «крышу». Здесь мы можем ощутить возможность обобщения. Возьмем вместо куба любой многогранник, выберем любую грань этого многогранника и пристроим к ней «крышу». Пусть первоначальный многогранник имел Г граней, В вершин и Р ребер и пусть выбранная его грань имеет n сторон. Мы пристраиваем к этой грани пирамиду с n боковыми гранями и таким образом получаем новый многогранник. Сколько граней, вершин и ребер имеет новый многогранник «с крышей»? При этой операции одна грань (выбранная) теряется, а n новых появляются (n боковых граней пирамиды), так что новый многогранник имеет Г—1 + я граней. Все вершины многогранника принадлежат и новому многограннику, но одна вершина (вершина пирамиды) прибавляется, и, таким образом, новый многогранник имеет В+1 вершину. Все ребра старого многогранника принадлежат и новому, но прибавляется n ребер (боковые ребра пирамиды), и, таким образом, новый многогранник имеет Р + я ребер.

Подведем итог. Первоначальный многогранник имел соответственно Г, В и Р граней, вершин и ребер, тогда как новый мно-

гогранник с «крышей» имеет

Г+п-1, В+1 и Р + п

частей соответствующего типа. Согласуется ли это с нашим предположением?

Если выполняется соотношение Г+В = Р+2, то, очевидно, соотношение

(Г+п-1)+(В+1)=(Р+п) + 2

также выполняется. Иными словами, если оказывается, что наше предположение подтверждается в случае первоначального многогранника, то оно должно подтверждаться и в случае нового многогранника с «крышей». Наше предположение выдерживает «пристройку крыши», и, таким образом, оно прошло действительно очень суровое испытание. Существует такое неисчерпаемое разнообразие многогранников, которые можно получить из уже исследованных с помощью повторных «пристроек крыши», и мы доказали, что наше предположение для них всех верно.

Кстати, последнее тело нашего рис. 3.1, «усеченный куб» (IX), открывает путь для аналогичных рассмотрений. Вместо куба «усечем» любой многогранник, отсекая произвольно выбранную вершину. Пусть первоначальный многогранник имеет соответственно

Г, В и Р

граней, вершин и ребер и пусть n — число ребер, выходящих из выбранной нами вершины. Отсекая эту вершину, мы вводим одну новую грань (имеющую n сторон), n новых ребер, а также n новых вершин, но теряем одну вершину. Подведем итог: новый, «усеченный» многогранник имеет соответственно

Г+1, В + n—1 и Р + п

граней, вершин и ребер. Теперь, из

Г+В=Р+2

следует

(Г+1) + (В + n-\) = (Р + п. + 2,

т. е. наше предположение достаточно прочно для того, чтобы выдержать «усечение». Оно прошло еще одно суровое испытание.

Предыдущие замечания естественно рассматривать как очень сильный аргумент в пользу нашего предположения. Мы можем уловить в них даже нечто другое: первый намек на доказательство. Начиная с каких-либо простых многогранников, как тетраэдр или куб, для которых предположение выполняется, мы можем с помощью пристройки крыши и усечения получить огромное разнообразие других многогранников, для которых предположение также выполняется.

Сможем ли мы получить все многогранники? Тогда у нас было бы доказательство ! Кроме того, могут существовать и другие операции, которые подобно усечению и пристройке крыши сохраняют предполагаемое соотношение.

5. Подтверждения и подтверждения. Процесс мышления опытного натуралиста несущественно отличается от процесса мышления обычного человека, но он более основателен. И обычного человека и ученого к предположениям приводит несколько наблюдений, и оба они обращают внимание на позднейшие случаи, которые могли бы оказаться в согласии с предположением или нет. Случаи, находящиеся в согласии, делают предположение более вероятным, противоречащие случаи его опровергают, и здесь начинается отличие: обыкновенные люди обычно более склонны разыскивать случаи первого типа, а ученый— случаи второго типа. Причина этого состоит в том, что каждый человек имеет некоторую долю самомнения —как обычный человек, так и ученый,— но разные люди ценят в себе разные качества. М-р Кто-нибудь не любит признаваться даже самому себе, что он ошибся, и поэтому ему не нравятся противоречащие случаи, он их избегает, он даже склонен, когда они встречаются, находить им такое объяснение, из которого бы вытекало, что они предположению не противоречат. Ученый, наоборот, вполне готов признать ошибочное предположение, но он не любит оставлять вопросы нерешенными. И вот случай, находящийся в согласии, окончательно вопрос не разрешает, а противоречащий случай разрешает. Ученый, старающийся найти окончательное решение, разыскивает случаи, которые могли бы опровергнуть предположение, и чем больше эта возможность, тем они ему приятнее. Следует отметить важный момент. Если случай, грозивший опровергнуть предположение, в конце концов оказался с ним в согласии, то предположение выходит из испытания значительно окрепшим. Чем больше опасность, тем больше чести; прохождение через наиболее серьезное испытание дает наиболее высокое признание, наиболее сильное экспериментальное подтверждение предположения. Имеются примеры и примеры, подтверждения и подтверждения. Пример, который с большей вероятностью способен опровергнуть предположение, во всяком случае подводит предположение ближе к решению, чем пример, делающий это с меньшей вероятностью, и это объясняет предпочтение ученого.

Теперь мы можем заняться нашей собственной конкретной задачей и посмотреть, как применить предыдущие замечания к «экспериментальному исследованию многогранников», которые мы предприняли. Каждый новый случай, в котором подтверждается соотношение Г+ В = Р-f2, увеличивает уверенность, что это соотношение верно вообще. Однако мы уже устали от однообразной последовательности подтверждений. Случай, мало отличающийся от ранее исследованных

случаев, если он находится в согласии с предположением, конечно увеличивает нашу уверенность, но увеличивает мало. Действительно, мы легко поверим до испытания, что рассматриваемый случай будет вести себя так же, как и предыдущие случаи, от которых он отличается лишь немногим. Мы хотим не только другого подтверждения, но подтверждения другого типа. В самом деле, вновь просматривая различные фазы нашего исследования (§§ 2, 3 и 4), мы можем заметить, что каждая из них давала такой тип подтверждения, который существенно превосходил полученные ранее, В каждой фазе предположение подтверждалось для более обширного многообразия случаев, чем в предыдущей.

6. Совсем не похожий случай. Поскольку важно разнообразие, поищем какой-нибудь многогранник, совсем не похожий на те, которые мы исследовали до сих пор. Так мы можем напасть на мысль рассмотреть в качестве многогранника раму для картины. Возьмем очень длинный треугольный стержень, отрежем от него четыре куска, приладим эти куски в концах и соединим их в рамообразный многогранник. На рис. 3.2 рама положена на стол так, что все ребра, которые уже были на неразрезанном стержне, лежат горизонтально. Имеется 4 раза по 3, т. е. 12 горизонтальных ребер, и также 4 раза по 3 негоризонтальных ребра, так что общее число ребер равно Р = 12+ 12 = 24. Сосчитав грани и вершины, находим, что Г=4х3=12 и 5 = 4х Х3=12. Теперь сумма Г+£ = 24 отлична от суммы Р+2 = 26. Наше предположение, взятое в полной общности, оказалось неверным!

Мы можем, конечно, сказать, что не намеревались установить предположение в такой общности, что мы все время имели в виду многогранники выпуклые, или, так сказать, «сферообразные», а не «баранкообразные», как рама для картины. Но это отговорки. Фактически мы должны изменить свою позицию, а с нею и свое первоначальное утверждение. Вполне возможно, что удар, который мы получили, в конце концов окажется благотворным и приведет нас в конечном счете к исправленной и более точной формулировке нашего предположения. Но как бы то ни было, это был удар по нашей уверенности.

Рис. 3.2. Баранкообразный многогранник

7. Аналогия. Пример «рамы для картины» убил наше предположение в его первоначальной форме, но оно может быть немедленно возрождено в исправленной (и, будем надеяться, улучшенной) форме, с важным ограничением.

Тетраэдр является выпуклым телом, и таким же является куб, и такими же являются другие многогранники в нашей коллекции (рис. 3.1), и такими же являются все многогранники, которые мы можем из них получить с помощью усечения и «умеренной» пристройки крыш (пристройки достаточно ровных крыш к их различным граням). Во всяком случае, не существует опасности, что эти операции могли бы от выпуклого, или «сферообразного» многогранника привести к «баранкообразному» телу.

Замечая это, мы вводим уточнение, которое здесь очень нужно. Мы высказываем предположение, что для любого выпуклого многогранника между числами граней, вершин и ребер имеет место соотношение Г + £ = Р + 2. (Можно было бы даже предпочесть ограничиться «сферообразными» многогранниками, но мы не хотим здесь останавливаться на определении значения этого термина.)

Это предположение имеет некоторые шансы быть верным. Тем не менее наша уверенность была поколеблена, и мы хотели бы найти какое-нибудь новое подкрепление для своего предложения. Мы не можем надеяться на большую помощь от дальнейших подтверждений. Кажется, что мы исчерпали наиболее очевидные источники. Однако мы можем еще надеяться на некоторую помощь от аналогии. Существует ли какой-нибудь более простой аналогичный случай, который мог бы оказаться поучительным?

Многоугольники аналогичны многогранникам. Многоугольник есть часть плоскости, как многогранник — часть пространства. Многоугольник имеет некоторое число В вершин (вершин его углов) и некоторое число Р ребер (или сторон). Очевидно,

В = Р.

Однако это соотношение, справедливое для выпуклых многоугольников, кажется слишком простым и проливает мало света на более сложное соотношение

Г+В = Р+2,

которое, как мы подозреваем, справедливо для выпуклых многогранников.

Если мы по-настоящему заинтересованы рассматриваемым вопросом, то мы, естественно, пытаемся подвести эти соотношения поближе друг к другу. Существует остроумный способ, позволяющий это сделать. Сначала нужно расположить рассматриваемые числа в естественном порядке. Многогранник трехмерен, его грани (многоугольники) двумерны, его ребра одномерны и его вершины (точки), конечно, нульмерны. Мы можем теперь переписать наши равенства, располагая величины в порядке возрастания размерности. Соотношение для многоугольников, написанное в виде

В-Р+1 = 1,

становится сравнимым с соотношением для многогранников, записанным в виде

В-Р + Г-1 =1.

Единица в левой части равенства для многоугольников соответствует единственному имеющемуся двумерному элементу — внутренности многоугольника. Единица в левой части равенства для многогранников соответствует единственному имеющемуся трехмерному элементу — внутренности многогранника. Числа в левой части равенства, подсчитывающие соответственно элементы нульмерные, одномерные, двумерные и трехмерные, расположены в своем естественном порядке и имеют чередующиеся знаки. Правая часть равенства в обоих случаях одинакова; аналогия кажется полной. Поскольку первое равенство для многоугольников, очевидно, верно, то аналогия увеличивает нашу уверенность во втором равенстве для многогранников, предположение о котором мы сделали.

8. Разбиение пространства. Мы переходим теперь к другому примеру индуктивного исследования в пространственной геометрии. В своем предыдущем примере мы отправлялись от общего, до некоторой степени туманного замечания. Нашей отправной точкой теперь будет конкретная, имеющая ясные очертания задача. Рассмотрим простую, но не слишком знакомую задачу пространственной геометрии: На сколько частей пространство делится пятью плоскостями?

На этот вопрос легко ответить, если пять данных плоскостей параллельны между собой; в этом случае пространство, очевидно, делится на 6 частей. Этот случай, однако, является слишком специальным. Если наши плоскости находятся в «общем положении», то никакие две из них не будут параллельны и будет иметься значительно больше частей, чем 6. Нашу задачу нужно сформулировать более точно, добавив существенный пункт: На сколько частей пространство делится пятью плоскостями при условии, что эти плоскости находятся в общем положении?

Идея «общего положения» интуитивно совершенно понятна; плоскости находятся в таком положении, когда они не связаны специальными соотношениями, когда они заданы независимо, выбраны наугад. Было бы нетрудно сделать этот термин совершенно точным с помощью формального определения, но мы этого не будем делать по двум причинам. Во-первых, изложение не должно быть слишком формальным. Во-вторых, оставляя понятие несколько неясным, мы ближе подходим к позиции натуралиста, который часто вынужден начинать с не совсем ясных понятий, но уточняет их по мере продвижения.

9. Видоизменение задачи. Сосредоточим внимание на нашей задаче. Нам даны 5 плоскостей в общем положении. Они разрезают пространство на определенное число частей. (Мы можем представить себе сыр, рассеченный на куски пятью прямолинейными разрезами острого ножа.) Нам нужно найти число этих частей. (На сколько частей разрезается сыр?)

Кажется трудным сразу увидеть все части, на которые пространство разбивается пятью плоскостями. (Может быть, невозможно их «увидеть». Как бы то ни было, не перенапрягайте своего воображения, лучше попытайтесь думать. Ваш разум может повести вас дальше, чем ваше воображение.) Но почему именно пять плоскостей? Почему не любое число плоскостей? На сколько частей пространство делится четырьмя плоскостями? Тремя плоскостями? Или двумя плоскостями? Или всего лишь одной плоскостью?

Мы подошли здесь к случаям, доступным нашей геометрической интуиции. Одна плоскость, очевидно, делит пространство на 2 части. Две плоскости, если они параллельны, делят пространство на 3 части. Мы должны, однако, отбросить это специальное расположение; 2 плоскости, находящиеся в общем положении, пересекаются и делят пространство на 4 части. Три плоскости, находящиеся в общем положении, делят пространство на 8 частей. Чтобы ясно понять этот последний, более трудный случай, можно представить себе две вертикальные стены внутри здания, пересекающие одна другую, и горизонтальное перекрытие, поддерживаемое балками, пересекающее обе стены и образующее вокруг точки, где оно пересекается со стенами, одновременно пол четырех комнат и потолок других четырех комнат.

10. Обобщение, специализация, аналогия. Наша задача относится к 5 плоскостям, но вместо того, чтобы рассматривать 5 плоскостей, сначала мы занялись 1, 2 и 3 плоскостями. Не потратили ли мы свое время зря? Совсем нет. Исследуя более простые аналогичные случаи, мы готовились к нашей задаче. Мы попробовали свои силы на этих более простых случаях; мы выяснили необходимые понятия и познакомились с тем типом задач, с которым должны встретиться.

Даже путь, который привел нас к этим более простым аналогичным задачам, типичен и заслуживает внимания. Сначала мы перешли от случая 5 плоскостей к случаю любого числа плоскостей, скажем n плоскостей: мы произвели обобщение. Затем от n плоскостей мы вернулись к 4 плоскостям, к 3 плоскостям, к 2 плоскостям, к всего лишь одной плоскости, т. е. в общей задаче мы положили л = 4, 3, 2, 1: мы произвели специализацию. Но задача о делении пространства, скажем, тремя плоскостями аналогична нашему первоначальному вопросу относительно пяти плоскостей. Итак, мы пришли к аналогии обычным путем, вступительным обобщением и последующей специализацией.

11. Одна аналогичная задача. Как обстоит дело со следующим случаем четырех плоскостей?

Четыре плоскости, находящиеся в общем положении, определяют различные части пространства, одна из которых ограничена, заключена между четырьмя треугольными гранями и называется тетраэдром (см. рис. 3.3). Эта конфигурация напоминает нам три прямые линии на плоскости, находящиеся в общем положении и определяющие различные части плоскости, одна из которых ограничена, заключена между тремя прямолинейными отрезками и является треугольником (см. рис. 3.4). Нам нужно установить число частей пространства, определяемых четырьмя плоскостями. Попробуем свои силы на более простой аналогичной задаче: На сколько частей плоскость делится тремя прямыми? Многие из нас увидят ответ немедленно, даже не вычерчивая фигуры, и каждый может его увидеть, пользуясь грубым наброском (см. рис. 3.4). Искомое число частей равно 7.

Мы нашли решение более простой аналогичной задачи; но можем ли мы воспользоваться этим решением для своей первоначальной задачи? Да, можем, если будем разумно обращаться с аналогией двух конфигураций. Нам следует так подойти к разбиению плоскости тремя прямыми, чтобы после этого мы смогли тот же самый подход применить к разбиению пространства четырьмя плоскостями.

Итак, посмотрим снова на разбиение плоскости тремя прямыми, ограничивающими треугольник. Одна часть конечна— это внутренность треугольника. А бесконечные части имеют с треугольником или общую сторону (имеются три такие части), или общую вершину (имеются также три части этого типа). Таким образом, число всех частей равно 1 + 3 + 3=7.

Рис. 3.3. Пространство, разделенное четырьмя плоскостями.

Рис. 3.4. Плоскость, разделенная тремя прямыми.

Теперь рассмотрим разбиение пространства четырьмя плоскостями, ограничивающими тетраэдр. Одна часть конечна, это внутренность те.раэдра. Бесконечная часть может иметь общую грань (двумерный элемент границы) с тетраэдром (имеются 4 такие части), или общее ребро (одномерный элемент границы; имеются 6 частей этого типа), или общую вершину (нульмерный элемент границы; имеются 4 части этого типа, показанные на рис. 3.3). Таким образом, число всех частей равно 1 + 4 + 6+4=15.

Мы пришли к этому результату с помощью аналогии, и воспользовались аналогией типичным, важным способом. Сначала мы придумали более легкую аналогичную задачу и решили ее. Затем, чтобы решить первоначальную более трудную задачу (о тетраэдре), мы воспользовались новой более легкой аналогичной задачей (о треугольнике) как моделью; при решении более трудной задачи мы следовали образцу решения более легкой задачи. Но прежде чем сделать это, мы должны были пересмотреть решение более легкой задачи. Мы перестроили его, переделали в новый образец, пригодный для подражания.

Выделить аналогичную более легкую задачу, решить ее, переделать ее решение так, чтобы оно могло служить в качестве модели, и, наконец, добиться решения первоначальной задачи, следуя только что созданной модели,— этот метод непосвященному может казаться окольным, но он часто применяется в математических и нематематических научных исследованиях.

12. Серия аналогичных задач. Однако наша первоначальная задача все еще не решена. Она относится к разбиению пространства пятью плоскостями. Какова аналогичная задача для двух измерений? Разбиение пятью прямыми? Или четырьмя прямыми? Для нас лучше, быть может, рассмотреть эти задачи в полной общности: разбиение пространства n плоскостями и разбиение плоскости n прямыми. Эти разбивающие прямые должны, конечно, находиться в общем положении (никакие 2 не параллельны и никакие 3 не имеют общей точки).

Если мы привыкли пользоваться геометрической аналогией, то можем сделать еще один шаг и рассмотреть деление прямой линии n различными точками. Хотя эта задача совсем тривиальна, она может оказаться поучительной. Мы легко видим, что прямая делится одной точкой на 2 части, двумя точками на 3, тремя точками на 4 и вообще n точками на /1+1 различных частей.

Опять-таки, если мы привыкли обращать внимание на крайние случаи, то можем рассмотреть неразделенное пространство, плоскость или прямую и считать его «разбиением, осуществленным 0 разбивающих элементов».

Составим следующую таблицу, исчерпывающую все наши результаты, полученные до сих пор.

Число делящих элементов

Число частей при делении

пространства плоскостями

плоскости прямыми

прямой точками

0

1

2

3

4

п

1

2

4

8

15

1

2

4

7

1

2

3

4

5

13. много задач иногда легче решить, чем только одну. Мы собирались решить задачу, относящуюся к разбиению пространства пятью плоскостями. Мы ее еще не решили, но поставили много новых задач. Каждое незаполненное в нашей таблице место соответствует открытому вопросу.

Этот прием накопления новых задач непосвященному может показаться глупым. Но некоторый опыт в решении задач может научить нас, что много задач вместе иногда решить легче, чем всего лишь одну из них, если это большое число задач хорошо согласовано, а одна задача сама по себе изолирована. Наша первоначальная задача выступает теперь в качестве одной из задач в серии нерешенных задач. Но дело в том, что все эти нерешенные задачи образуют серию: они хорошо расположены, сгруппированы вместе, находятся в тесной аналогии между собой и с несколькими уже решенными задачами. Если мы сравним теперешнее положение нашего вопроса, хорошо включенного в серию аналогичных вопросов, с его исходным положением, когда он был еще полностью изолирован, то мы, естественно, будем склонны поверить, что было сделано некоторое продвижение.

14. Предположение. Посмотрим на результаты, представленные в нашей таблице, как натуралист смотрит на коллекцию своих образцов. Эта таблица бросает вызов нашей изобретательности, нашей способности наблюдать. Сумеем ли мы обнаружить какую-нибудь связь, какую-нибудь закономерность?

Рассматривая второй столбец (деление пространства плоскостями), мы можем заметить, что в последовательности 1, 2, 4, 8, ... имеется ясная закономерность; мы видим здесь последовательные степени числа 2. Но что за разочарование! Следующий член в этом столбце 15, а не 16, как мы ожидали. Наша догадка была не так уж хороша; нужно поискать что-нибудь другое.

В конечном счете мы можем случайно наткнуться на сложение двух рядом расположенных чисел и заметить, что в таблице имеется их сумма. Мы подмечаем своеобразную связь: число из таблицы мы

получаем, складывая два других числа: число, расположенное над ним, и число, находящееся справа от последнего. Например, числа

8 7 15

связаны соотношением

8 + 7=15.

Это замечательная связь, поразительный ключ. Кажется невероятным, чтобы эта связь, которую мы можем наблюдать во всей таблице, так далеко вычисленной, могла быть результатом простой случайности.

Итак, эта ситуация наводит на мысль, что замеченная закономерность распространяется и за пределы наших наблюдений, что еще не найденные числа таблицы связаны в точности так же, как и уже вычисленные. И, таким образом, мы приходим к предположению, что закон, на который мы наткнулись случайно, справедлив всегда.

Если это так, то мы можем решить свою первоначальную задачу. Складывая расположенные рядом числа, мы можем продолжить нашу таблицу до тех пор, пока не достигнем числа, которое хотим получить:

В таблице, как она здесь перепечатана, появились два новых числа, набранных жирным шрифтом и вычисленных путем сложения, 11 = 7+4, 26=15+11. Если наша догадка правильна, то число частей, на которые пространство разбивается пятью плоскостями, находящимися в общем положении, должно равняться 26. Кажется, мы решили предложенную задачу. Или по крайней мере нам удалось уловить правдоподобное предположение, подкрепляемое всеми до сих пор собранными наблюдениями.

15. Предсказание и подтверждение. В предыдущем мы в точности следовали типичному образу действий натуралиста. Если натуралист наблюдает поразительную закономерность, которая не может быть разумно приписана простой случайности, то он делает предположение, что эта закономерность продолжается и за пределами его фактических наблюдений. Принятие такого предположения часто является решающим шагом в индуктивном исследовании.

Следующим шагом может быть предсказание. На основании своих ранее сделанных наблюдений и их согласия с предполагаемым зако-

ном натуралист предсказывает результат своего следующего наблюдения. Многое зависит от исхода этого следующего наблюдения. Окажется ли предсказание верным или нет? Мы находимся точно в таком же положении. Мы нашли, или, точнее, догадались, или предсказали, что число областей, на которые плоскость разбивается четырьмя прямыми, находящимися в общем положении, равно 11. Так ли это? Правильно ли наше предположение?

Исследуя грубый набросок (см. рис. 3.5), мы можем убедиться, что наша догадка была хорошей, что число 11 действительно есть правильное число. Это подтверждение нашего предсказания дает индуктивные доводы в пользу правила, на основании которого мы сделали свое предсказание Успешно выдержав испытание, наше предположение вышло из него окрепшим.

16. Снова и лучше. Мы убедились, что число 11 верно, рассматривая фигуру и подсчитывая число частей. Да, 4 прямые, находящиеся в общем положении, по-видимому, делят плоскость на 11 частей. Но проделаем это снова и проделаем лучше. Мы подсчитали эти части каким-то образом. Подсчитаем их снова и подсчитаем так, чтобы быть уверенными в том, что избежали путаницы, и ошибок, и ловушек, расставленных специальными положениями прямых.

Начнем с того факта, что 3 прямые определяют точно 7 частей плоскости. Мы имеем некоторые основания верить, что 4 прямые определяют 11 частей. Почему ровно на 4 части больше? Почему в этой связи появляется число 4? Почему проведение новой прямой увеличивает число частей ровно на 4?

Выделим на рис. 3.5 одну прямую и перечертим ее пунктиром (см. рис. 3.6). Новая фигура не слишком отличается от старой по виду, но она выражает совсем другой подход. Мы рассматриваем выделенную прямую как новую, а три другие прямые как старые. Старые прямые рассекают плоскость на 7 частей. Что происходит, когда добавляется новая прямая?

Новая прямая, начерченная наугад, должна пересекать каждую старую прямую и притом в разных точках. Это дает 3 точки. Эти

Рис. 3.5, Плоскость, разделенная четырьмя прямыми.

Рис. 3,6. Переход от трех прямых к четырем.

3 точки делят новую прямую на 4 отрезка. Каждый отрезок разрезает старую часть плоскости, делает две новых части из одной старой. Вместе 4 отрезка новой прямой создают 8 новых частей и упраздняют 4 старых части — число частей возрастает ровно на 4. Вот причина того, что число частей теперь ровно на четыре больше, чем оно было раньше:

7 + 4=11.

Этот путь получения числа 11 убедителен и ярко освещает рассматриваемую задачу. Мы можем усмотреть теперь основание для закономерности, которую мы наблюдали и на которой основывали свое предсказание этого числа 11. Мы начинаем подозревать, какое объяснение скрывается за фактами, и наша вера в то, что наблюдаемая закономерность всегда справедлива, чрезвычайно усилилась.

17. Индукция подсказывает дедукцию; частный случай подсказывает общее доказательство. Мы все время тщательно указывали на параллелизм между нашими рассуждениями и образом действий натуралиста. Мы начали с частной задачи, как натуралист может начать со ставящего в тупик наблюдения. Мы продвигались вперед с помощью пробных обобщений, отмечая доступные частные случаи, наблюдая поучительные аналогии. Мы попытались угадать некоторую закономерность и ошиблись, попытались снова и сделали это лучше. Нам удалось предложить общий закон, который подкреплялся всеми экспериментальными данными, бывшими в нашем распоряжении. Мы подвергли испытанию еще один частный случай и нашли согласие с предполагаемым законом, авторитет которого выиграл от такого подтверждения. Наконец, мы заметили основание для этого общего закона, своего рода объяснение, и наша вера значительно усилилась. Исследование натуралиста может проходить в точности через те же самые фазы.

Существует, однако, место, где дороги математика и натуралиста резко расходятся. Наблюдение является высшим авторитетом для натуралиста, но не для математика. Подтверждение во многих хорошо выбранных примерах есть единственный способ подкрепления предполагаемого закона в естественных науках. Подтверждение во многих хорошо выбранных примерах может быть очень полезно в качестве поощрения, но никогда не может доказать предполагаемый закон в математических науках. Рассмотрим наш собственный конкретный случай. Исследование различных частных случаев и сравнение их привело нас к предположению об общем правиле, из которого следует, что решением нашей первоначально предложенной задачи является число 26. Достаточны ли все наши наблюдения и подтверждения для доказательства этого общего правила? Или могут ли они доказать частный результат, что решением нашей задачи действительно является 26? Ни в малейшей степени. Для математика с жесткими

стандартами число 26 есть только определенная догадка, и подозреваемое общее правило не может быть доказано никаким количеством экспериментальных подтверждений. Индукция делает свои результаты вероятными, она никогда их не доказывает.

Можно, однако, заметить, что индуктивное исследование может быть в математике полезно в другом отношении, о котором мы еще не упоминали. Тщательное наблюдение частных случаев, которые приводят нас к общему математическому результату, может также подсказать его доказательство. Из внимательного исследования частного случая может возникнуть общее понимание.

В самом деле, это действительно произошло с нами уже в предыдущем параграфе. Общее правило, которое мы открыли с помощью индукции, относится к двум расположенным рядом числам в нашей таблице, как например 7 и 4, и к их сумме, которая в этом случае равна 11. Далее, в предыдущем параграфе мы ясно увидели геометрическое значение чисел 7, 4 и 11 в нашей задаче и при этом поняли, почему там возникает соотношение 7 + 4= 11. Мы фактически имели дело с переходом от 3 прямых, делящих плоскость, к 4 таким прямым. Однако в числах 3 и 4 нет никаких особых достоинств; точно так же мы могли бы перейти от любого целого числа к следующему, от n к я+1. Рассмотренный частный случай может представлять нам всю ситуацию (пример 2.10). Я предоставляю читателю удовольствие полностью извлечь общую идею из частного наблюдения предыдущего параграфа. При этом он может дать формальное доказательство для индуктивно открытого правила, по крайней мере насколько это относится к двум последним столбцам.

Всё же, чтобы завершить доказательство, мы должны не только рассмотреть разбиение плоскости прямыми, но и разбиение пространства плоскостями. Мы можем, однако, надеяться, что если мы в состоянии разобраться с разбиениями плоскости, то аналогия поможет нам разобраться и с разбиениями пространства. Снова я предоставляю читателю удовольствие извлечь пользу из совета, который дает аналогия.

18. Еще предположения. Мы не исчерпали еще тему о разбиениях плоскости и пространства. Осталось еще сделать несколько маленьких открытий, и они вполне доступны индуктивным рассуждениям. Нас легко может привести к ним тщательное наблюдение и сделанное с пониманием сопоставление частных примеров.

Мы можем пожелать найти формулу для числа частей, образуемых при разбиении плоскости n прямыми, находящимися в общем положении. Фактически у нас уже есть формула в простейшем аналогичном случае: n различных точек делят прямую на я+1 отрезков. Эта аналогичная формула, частные случаи, записанные в нашей таблице, наше индуктивно открытое общее правило (которое мы почти доказали), все наши результаты, полученные до сих пор, могут помочь

нам решить эту задачу. Я не вхожу в детали. Я просто отмечу решение, которое можно найти, следуя только что сделанным намекам, разными способами.

Число частей, на которые прямая делится n различными точками, равно /г+l. Число частей, на которые плоскость делится n прямыми, находящимися в общем положении, равно

Читатель может вывести последнюю формулу или по крайней мере проверить ее в простейших случаях, для /г = 0, 1, 2, 3, 4. Я также предоставляю читателю удовольствие открыть третью формулу того же типа для числа частей пространства. Делая это маленькое открытие, читатель может расширить свой опыт индуктивных рассуждений в математических вопросах и почувствовать ту приятную помощь, которую оказывает нам аналогия при решении задач, больших или малых.

ПРИМЕРЫ И ПРИМЕЧАНИЯ К ГЛАВЕ III

Формула Г + £ = Р + 2, предположение о которой мы высказали в § 1, принадлежит Леонарду Эйлеру. Мы называем ее «формулой Эйлера», рассматриваем как предположение и исследуем различными способами в примерах 1—10, иногда индуктивно, а иногда с целью найти доказательство. Мы возвращаемся к ней в примерах 21—30 и 31—41. Перед тем как приняться за какой-нибудь пример в этих разделах, прочтите соответственно примеры 21 и 31.

1. Две пирамиды, расположенные по разные стороны от их общего основания, вместе образуют «двойную пирамиду». Октаэдр есть частный случай двойной пирамиды; общее основание —квадрат. Имеет ли место формула Эйлера для произвольной двойной пирамиды?

2. Возьмите выпуклый многогранник с Г гранями, В вершинами и Р ребрами, выберите внутри него точку О (например, его центр тяжести), опишите шар с центром О и спроектируйте многогранник из центра О на поверхность шара. Эта проекция переводит Г граней в Г областей или «стран» на поверхности шара, любое из ребер она переводит в граничную линию, разделяющую две соседние страны, и любую из В вершин —в «угол» или общую границу трех или более стран («угол трех стран», или «угол четырех стран», и т. д.). Эта проекция дает граничные линии особенно простой природы (дуги больших кругов), но, очевидно, справедливость формулы Эйлера для такого подразделения поверхности шара на страны не зависит от точной формы граничных линий; на числа Г, В и Р не оказывает влияния непрерывная деформация этих линий.

(1) Меридиан есть половина окружности большого круга, соединяющая два полюса, южный и северный. Параллель есть пересечение поверхности шара с плоскостью, параллельной экватору. Поверхность шара делится m меридианами и р параллелями на Г стран. Вычислите Г, В и Р. Имеет ли место формула Эйлера?

(2) Проекция октаэдра из его центра на поверхность шара является частным случаем ситуации, описанной в (1). Для каких значений m и р?

3. Случай играет некоторую роль в открытии. Индуктивное открытие, очевидно, зависит от наблюдаемого материала. В § 1 мы встретились с несколькими многогранниками, но случайно могли бы натолкнуться и на другие. Вероятно, мы не пропустили бы правильные многогранники, но наш перечень мог бы появиться в таком виде:

Многогранники

Г

В

Р

Тетраэдр .................

4

4

6

Куб....................

6

8

12

Октаэдр..................

8

6

12

Пятигранная призма...........

7

10

15

Пятигранная двойная пирамида ....

10

7

15

Додекаэдр.................

12

20

30

Икосаэдр.................

20

12

30

Наблюдаете ли вы какую-нибудь закономерность? Можете ли вы ее объяснить? Какова связь с формулой Эйлера?

4. Попытайтесь обобщить соотношение между двумя многогранниками, наблюдаемое в таблице примера 3. [Соотношение, описанное в решении примера 3 в (2), слишком «узко» и «детально». Возьмите, однако, куб и октаэдр в описанной там ситуации, окрасьте ребра одного красной, а другого синей краской и спроектируйте их из их общего центра Р на поверхность шара, как описано в примере 2. Затем сделайте обобщение.]

5. Было бы достаточно доказать формулу Эйлера в частном случае: для выпуклых многогранников, имеющих только треугольные грани. Почему? [§ 4..]

6. Было бы достаточно доказать формулу Эйлера в частном случае: для выпуклых многогранников, имеющих только трехгранные вершины. Почему? !§4.]

7. При доказательстве формулы Эйлера мы можем ограничиться плоскими фигурами. Действительно, представьте себе, что Г—1 граней многогранника сделаны из картона, а одна грань из стекла; назовем эту грань «окном». Вы смотрите через окно внутрь многогранника, причем ваши глаза находятся так близко к окну, что вам видна вся внутренность многогранника. (Это может оказаться неосуществимым, если многогранник не является выпуклым.) То, что вы видите, вы можете интерпретировать как плоскую фигуру, начерченную на оконном стекле: вы видите подразделение окна на более мелкие многоугольники. В этом подразделении имеется Л/2 многоугольников, п. прямых граничных линий (некоторые внешние, некоторые внутренние) и Д/0 вершин.

(1), Выразите Д/0, п. и Д/2 через Г, В к Р.

(2) Если для Г, В и Р имеет место формула Эйлера, то какая формула имеет место для Л/0, A/t и Д/2?

8. Прямоугольник имеет I см в длину и m см в ширину; / и m —целые числа. Прямоугольник подразделяется на 1m равных квадратов прямыми, параллельными его сторонам.

(1) Выразите Д/0, п. и Д/2 (определенные в примере 7) через I н m.

(2) Справедливо ли соотношение примера 7 (2) в этом случае?

9. Примеры 5 и 7 наводят на мысль, что нам нужно было бы исследовать подразделение треугольника на п. треугольников с Д/0—3 вершинами внутри подразделяемого треугольника. Вычисляя суммы всех углов в этих Л/2 треугольниках двумя различными способами, вы можете доказать формулу Эйлера.

10. § 7 наводит на мысль распространить формулу Эйлера на случай четырех и большего числа измерений. Как мы могли бы сделать такое распространение осязаемым? Как можно было бы ясно его себе представить?

Пример 7 показывает, что случай многогранника может быть сведен к подразделению плоского многоугольника. Аналогия подсказывает, что случай четырех измерений можно свести к подразделению многогранника в нашем видимом трехмерном пространстве. Если мы хотим действовать индуктивно, то должны исследовать какие-нибудь примеры такого подразделения. По аналогии с примером 8 возникает следующий пример.

Ящик (т. е. прямоугольный параллелепипед) имеет измерения /.тип; эти три числа целые. Ящик подразделяется на 1mn равных кубов плоскостями, параллельными его граням. Пусть Д/0. Nlt Д/2 и Д/3 обозначают соответственно число вершин, ребер, граней и многогранников (кубов), образующих подразделение.

(1) Выразите A70, Nlt п. и iV3 через l, m и n.

(2) Существует ли соотношение, аналогичное равенству (2) в решении примера 7?

П. Пусть Ln обозначает число частей, на которые плоскость делится n прямыми линиями, находящимися в общем положении. Докажите, что L„ + 1 = Ln + (n+1).

12. Пусть Sn обозначает число частей, на которые пространство делится n плоскостями в общем положении. Докажите, что Sn + 1 — Sn+Ln.

13. Проверьте предполагаемую формулу

для n = 0, 1, 2, 3, 4.

14. Догадайтесь, какова должна быть формула для Sn, и убедитесь, что она верна для л = 0, 1, 2, 3, 4, 5.

15. Сколько частей из тех 11, на которые плоскость делится четырьмя прямыми, находящимися в общем положении, являются конечными? [Сколько бесконечными?]

16. Обобщите предыдущую задачу?

17. Сколько частей из тех 26, на которые пространство делится пятью плоскостями, являются бесконечными?

18. Пять плоскостей проходят через центр шара, но в других отношениях их положение является общим. Найдите число частей, на которые поверхность шара делится этими пятью плоскостями.

19. На сколько частей делится плоскость пятью попарно пересекающимися окружностями, находящимися в общем положении?

20. Обобщите предыдущие задачи.

21. Индукция: приспособление ума, приспособление языка. Индукция имеет результатом приспособление нашего ума к фактам. Когда мы сравниваем наши идеи с наблюдениями, то может иметь место согласие или несогласие. Если имеет место согласие, то мы чувствуем большую уверенность в своих идеях; если имеет место несогласие, то мы видоизменяем свои идеи. После повторных видоизменений наши идеи могут несколько лучше соответствовать фактам. Первые наши идеи о новом предмете почти обязаны быть ошибочными, по крайней мере частично; индуктивный процесс дает нам возможность исправить их, приспособить их к действительности. Наши примеры показывают этот процесс в малом масштабе, но довольно ясно. В § I после двух или трех ошибочных предположений мы в конечном счете пришли к правильному предположению. Вы можете сказать, что мы пришли к нему случайно. «Однако такие случаи встречаются только людям, которые их заслуживают», —как однажды сказал Лагранж, когда обсуждалось одно несравненно более великое открытие Ньютона.

Приспособление ума может в большей или меньшей степени совпадать с приспособлением языка; как бы то ни было, одно идет рука об руку с другим. Прогресс науки отмечается прогрессом терминологии. Когда физики начинали говорить об «электричестве» или врачи об «инфекции», эти термины были туманными, неясными, путаными. Термины, которыми ученые пользуются сегодня, как например «электрический заряд», «электрический ток» «грибковая инфекция», «вирусная инфекция», являются несравненно более ясными и более определенными. Но между этими двумя терминологиями лежит огромное количество наблюдений, искусных экспериментов, а также несколько великих открытий. Индукция изменила терминологию, выяснила понятия. Мы можем проиллюстрировать и эту сторону процесса, т. е. индуктивное выяснение понятий, подходящим небольшим математическим примером. Вот ситуация, не столь уж нечастая в математическом исследовании: теорема уже сформулирована, но мы должны придать более точный смысл терминам, в которых она сформулирована, чтобы сделать ее безукоризненно правильной. Это, как мы увидим, может быть удобно сделано с помощью индуктивного процесса.

Обратимся снова к примеру 2 и его решению. Мы говорили о «подразделении поверхности шара на страны», не предлагая формального определения этого термина. Мы надеялись, что формула Эйлера останется справедливой, если Г, Р и В обозначают число стран, граничных линий и углов в таком подразделении. Однако мы снова полагались на примеры и грубое описание h не дали формального определения для Г, Р и В. В каком точном смысле следовало бы нам взять эти термины, чтобы сделать формулу Эйлера безукоризненно правильной? Вот наш вопрос.

Мы будем называть подразделение сферы (т. е. поверхности шара) с соответствующим истолкованием символов Г, Р и В «нормальным», если имеет место формула Эйлера, и «ненормальным», если эта формула не имеет места. Приведите примеры подразделений, которые могли бы помочь нам обнаружить какое-нибудь ясное и простое различие между «нормальными» и «ненормальными» случаями.

22. Полная поверхность шара состоит только из одной страны. Нормально ли это? (Мы подразумеваем: «нормально» с точки зрения формулы Эйлера.)

23. Поверхность шара делится точно на две страны, западное полушарие и восточное полушарие, разделенные большим кругом. Ненормально ли это?

24. Две параллели делят сферу на три страны. Нормально это или ненормально?

25. Три меридиана делят сферу на три страны. Нормально это или ненормально?

26. Назовите подразделение сферы m меридианами и р параллелями «подразделением (m, p)»; ср. пример 2 (1). Является ли крайний случай (0, р) нормальным или ненормальным?

27. Является ли крайний случай (m, 0) нормальным или ненормальным? (Ср. пример 26.)

28. Какие подразделения (m, р) (ср. пример 26) могут быть порождены процессом, описанным в примере 2? (Проектирование выпуклого многогранника на сферу, за которой следует непрерывная деформация границ, оставляющая неизменным число стран и число граничных линий вокруг каждой страны.) Какие условия относительно тир характеризуют такие подразделения?

29. Что ненормально в примерах, в которых не имеет места формула Эйлера? Какие геометрические условия, делающие более точным смысл Г, ß и Р, обеспечили бы выполнение формулы Эйлера?

30. Приведите еще примеры, иллюстрирующие ответ на пример 29.

31. Работа Декарта о многогранниках. Среди рукописей, оставленных Декартом, имелись короткие заметки об общей теории многогранников. Копия этих заметок (сделанная рукой Лейбница) была обнаружена и опубликована в 1860 г., более чем через двести лет после смерти Декарта; см. Oeuvres vol. 10, p. 257—276. Эти заметки посвящены вопросу, тесно связанному с теоремой Эйлера: хотя заметки не устанавливают этой теоремы в явной форме, они содержат результаты, из которых она немедленно следует.

Рассмотрим вместе с Декартом выпуклый многогранник. Назовем любой угол любой грани этого многогранника поверхностным углом и пусть обозначает сумму всех поверхностных углов. Декарт вычисляет 2а двумя различными способами, и теорема Эйлера немедленно получается из сравнения двух выражений.

Нижеследующие примеры дают читателю возможность восстановить некоторые из выводов Декарта. Мы будем пользоваться следующими обозначениями: Гп обозначает число граней с n ребрами, Bn — число вершин, в которых оканчиваются n ребер, так что

Мы продолжаем обозначать символом Р число всех ребер многогранника.

32. Выразите число всех поверхностных углов тремя различными способами: соответственно через Г8, Г4, Г5, ... , через ß8, ß4, ß5. ... и через Р.

33. Вычислите У]а Для пяти правильных многогранников: тетраэдра, куба, октаэдра, додэкаэдра и икосаэдра.

34. Выразите 2а чеРез ^з» га> Г5> ...

35. Выразите ^а через Р и Г.

36. Дополнительные телесные углы, дополнительные сферические многоугольники. Мы называем телесным углом то, что чаще называется многогранным углом.

Пусть два выпуклых телесных угла имеют одинаковое число граней и общую вершину, но не имеют никаких других общих точек. Каждой грани одного телесного угла соответствует ребро другого, и эта грань перпендикулярна соответствующему ребру. (Это отношение между двумя телесными углами взаимно: ребро е, линия пересечения двух соседних граней первого телесного угла, соответствует грани /' второго телесного угла, если /' ограничена двумя ребрами, соответствующими двум вышеупомянутым граням.) Два телесных угла, находящихся в этом взаимном отношении, называются дополнительными телесными углами. (Это название не является обычным, но два обыкновенных дополнительных угла можно перевести в аналогичное взаимное положение.) Каждый из двух дополнительных телесных углов называется дополнением другого.

Сфера радиуса 1, описанная из общей вершины двух дополнительных телесных углов, как из центра, пересекается ими по двум сферическим многоугольникам, и эти многоугольники называются дополнительными.

Рассмотрим два дополнительных сферических многоугольника. Пусть alt а2у .... CLn обозначают стороны первого многоугольника, a1, a2, ал —его углы, А — его площадь, Р —его периметр и пусть а[, a[v ..., а'п> а1, а'г ... , a'tb

А\ Р' обозначают соответствующие части другого многоугольника. Тогда, если обозначения выбраны подходящим образом

это хорошо известно и легко проверить. Докажите, что

[примите как известное, что площадь сферического треугольника с углами a, ß и у равна «сферическому избытку» a+ß+Y— л (радиус сферы равен 1)].

37. «Как в плоской фигуре все внешние углы вместе равны 4 прямым углам, так в пространственном теле все внешние телесные углы вместе равны 8 прямым углам». Попытайтесь интерпретировать это замечание, найденное в заметках Декарта, как теорему, которую вы можете доказать. (См. рис. 3.7.)

38. Выразите 2 a через ß.

39. Докажите теорему Эйлера.

40. Начальное замечание § 1 туманно, но может навести на мысль о некоторых точных утверждениях. Вот одно, не рассмотренное нами в § 1: «Если любая из трех величин Г, В и Р стремится к со, то и две другие величины должны стремиться к со». Докажите следующие неравенства, имеющие место

Рис. 3.7. Внешние углы многоугольника.

для произвольных выпуклых многогранников, и дайте еще более точную информацию:

Может ли в этих неравенствах достигаться равенство? Для какого вида многогранников может оно достигаться?

41. Существуют выпуклые многогранники, все грани которых являются многоугольниками одного и того же типа, т. е. многоугольниками с одинаковым числом сторон. Например, все грани тетраэдра являются треугольниками, все грани параллелепипеда— четырехугольниками, все грани правильного додекаэдра—пятиугольниками. «И так далее», быть может хочется вам сказать. Однако, такая простая индукция может ввести в заблуждение: не существует выпуклых многогранников, все грани которых были бы шестиугольниками. Попытайтесь это доказать. [Пример 31.]

IV. ИНДУКЦИЯ В ТЕОРИИ ЧИСЕЛ

В теории чисел довольно часто случается, что благодаря какой-то неожиданной удаче наиболее изящные новые истины возникают с помощью индукции. —Гаусс1)

1. Целочисленные прямоугольные треугольники2). Треугольник со сторонами 3, 4 и 5 является прямоугольным треугольником, так как

Это простейший пример прямоугольного треугольника, стороны которого измеряются целыми числами. Такие «целочисленные прямоугольные треугольники» играли важную роль в истории теории чисел; даже древние вавилоняне открыли некоторые из их свойств.

Вот одна из наиболее очевидных задач, касающаяся таких треугольников:

Существуют ли целочисленные прямоугольные треугольники, гипотенузой которых является данное число n?

Сосредоточим свое внимание на этой задаче. Мы разыскиваем треугольник, гипотенуза которого измеряется данным целым числом п. а катеты какими-то целыми числами х и у. Можно принять, что х обозначает больший из двух катетов. Следовательно, для данного n мы разыскиваем два целых числа х и у, такие, что

Мы можем подойти к задаче с помощью индукции, и, если только мы не владеем какими-нибудь специальными знаниями, у нас никакого другого пути и нет. Возьмем пример. Выберем n =12. Итак, мы ищем два положительных целых числа х и у, таких, что х^у и

Какие значения может принимать х2? Вот какие:

1) Gauss, Werke, Vol. 2, S. 3.

2) Части этой главы уже были напечатаны под заглавием «Let us teach guessing» («Научимся догадываться») в книге Études de philosophie des sciences en nommage à Ferdinand Gonseth, éditions du Griffon, 1950, p. 147—154.

Возможно ли, что x2=121? Т. е. является ли разность

квадратом? Нет, 23 не квадрат. Теперь нужно было бы испытать другие квадраты, но в действительности испытывать слишком много из них нет необходимости. Так как у<х, то

так что x2=100 и x2 = 81 —единственные остающиеся возможности. Но ни одно из чисел

не является квадратом, и отсюда ответ: не существует ни одного целочисленного прямоугольного треугольника с гипотенузой 12. Рассмотрим подобным же образом гипотенузу 13. Из трех чисел

квадратом является только одно и, таким образом, существует лишь один целочисленный прямоугольный треугольник с гипотенузой 13:

Действуя подобным образом, мы можем при некоторой настойчивости исследовать все числа до данного не слишком высокого предела, например 20. Мы находим только пять «гипотенуз», меньших чем 20, —числа 5, 10, 13, 15 и 17:

Между прочим, случаи 10 и 15 не очень интересны. Треугольник со сторонами 10, 8 и 6 подобен более простому треугольнику со сторонами 5, 4 и 3, и это же верно для треугольника со сторонами 15, 12 и 9. Остающиеся три прямоугольных треугольника с гипотенузами соответственно 5, 13 и 17 существенно различны; ни один из них не подобен другому.

Мы можем подметить, что все три числа 5, 13 и 17 являются нечетными простыми числами. Однако это не все нечетные простые числа до 20; ни одно из других нечетных простых чисел 3, 7, 11 и 19 не является гипотенузой. Почему? В чем различие между этими двумя множествами? Когда, при каких условиях нечетное простое число является гипотенузой и когда не является?

Это — видоизменение нашего первоначального вопроса. Оно может казаться более многообещающим: во всяком случае, оно является новым. Исследуем его снова с помощью индукции. При небольшой настойчивости мы составим следующую таблицу (черта указывает, что нет прямоугольного треугольника с гипотенузой /?).

Нечетное простое число р

Прямоугольные треугольники с гипотенузой р

Когда простое число является гипотенузой и когда нет? В чем различие между этими двумя случаями? Физик легко мог бы задать себе какие-нибудь очень похожие вопросы. Например, он исследует двойное лучепреломление кристаллов. Некоторые кристаллы действительно обнаруживают двойное лучепреломление, другие нет. Какие кристаллы являются дважды лучепреломляющими, а какие нет? В чем различие между этими двумя случаями?

Физик разглядывает свои кристаллы, а мы разглядываем свои два множества простых чисел:

Хотелось бы отыскать какое-нибудь характеристическое различие между этими двумя множествами. Числа в обоих множествах возрастают неправильными скачками. Посмотрим на длины этих скачков, на последовательные разности:

Многие из этих разностей равны 4 и, как легко заметить, все они делятся на 4. Числа в первом множестве, начинающемся с 5, при делении на 4 дают остаток 1, имеют вид Ап+1 с целым п. Числа из второго множества, начинающегося с 3, имеют вид 4x + 3. Могло бы это быть характеристическим различием, которое мы ищем? Если мы с самого начала не отбросим этой возможности, то придем к следующему предположению: простое кисло вида 4я+1 является гипотенузой в точности одного целочисленного прямоугольного треугольника; простое число вида 4л+ 3 не является гипотенузой ни одного такого треугольника.

2. Суммы квадратов. Задача о целочисленных прямоугольных треугольниках, одним аспектом которой мы только что занимались (в § 1), играла, как мы сказали, важную роль в истории теории чисел. Она приводит в действительности к многим дальнейшим вопросам. Какие вообще числа, квадраты или нет, могут быть разложены в сумму двух квадратов? Что можно сказать о числах, которые не могут быть разложены в сумму двух квадратов? Возможно, они разложимы в сумму трех квадратов; но что можно сказать о числах, неразложимых в сумму трех квадратов?

Мы могли бы продвигаться беспредельно, но, и это в высшей степени замечательно, мы в этом не нуждаемся. Баше де Мезириак (автор первой печатной книги о математических развлечениях) заметил, что любое (т. е. положительное целое) число есть или квадрат, или сумма двух, трех или четырех квадратов. Он не претендовал на доказательство. От нашел намеки, приводящие к этому утверждению, в некоторых задачах Диофанта и убедился, что оно верно для всех чисел до 325.

Короче говоря, утверждение Баше было всего лишь предположением, найденным индуктивно. Мне кажется, что главным его достижением была постановка вопроса: сколько квадратов нужно, чтобы представить все целые числа? Раз этот вопрос ясно поставлен, не представляет особых трудностей найти ответ с помощью индукции. Мы составляем таблицу, начиная с

Этим предположение подтверждается для чисел до 10. Только число 7 требует четырех квадратов; другие представимы с помощью одного, двух или трех. Баше продолжил таблицу для чисел до 325 и нашел много чисел, требующих четырех квадратов, и ни одного требующего больше. Такие индуктивные доводы, по-видимому, убедили его, но крайней мере до некоторой степени, и он опубликовал свое утверждение. Ему повезло. Его предположение оказалось верным, и, таким образом, ему принадлежит открытие «теоремы о четырех квадратах», которую мы можем сформулировать и в такой форме: Уравнение

где л —любое данное положительное целое число, имеет решение, в котором Ху у, z и w являются неотрицательными целыми числами.

Разложение числа в сумму квадратов можно рассматривать и с других точек зрения. Так, мы можем исследовать число решений уравнения

в целых числах х и у. Мы можем допускать только положительные целые числа или все целые числа, положительные, отрицательные или 0. Если мы выберем последнее понимание задачи и возьмем в качестве примера n = 25, то найдем 12 решений уравнения

а именно следующие:

Между прочим, эти решения имеют интересную геометрическую интерпретацию, но нам нет необходимости ее здесь рассматривать. См. пример 2.

3. О сумме четырех нечетных квадратов. Из многих задач, относящихся к суммам квадратов, я выбираю задачу, которая выглядит несколько искусственной, но окажется чрезвычайно поучительной.

Пусть и обозначает положительное нечетное число. Исследовать индуктивно число решений уравнения

в положительных нечетных числах х, у, z и w. Например, если и=1, то мы имеем уравнение

и, очевидно, имеется всего лишь одно решение В самом деле,

мы не рассматриваем как решения, так как предполагаем, что х, у, z и w могут быть только положительными нечетными числами. Если и = 3, то уравнение имеет вид

и следующие два решения:

являются различными.

Для того чтобы подчеркнуть ограничение, наложенное на значения Ху уу z и w, мы будем избегать термина «решение» и вместо него пользоваться более специфическим описанием: представление числа 4и в виде суммы четырех нечетных квадратов». Так как это описание длинно, мы будем его различными способами сокращать, иногда даже до одного слова «представление».

4. Исследование примера. Для того чтобы вникнуть в смысл нашей задачи, рассмотрим пример. Выберем н = 25. Тогда 4н=100, и мы должны найти все представления числа 100 в виде суммы четырех нечетных квадратов. Какие нечетные квадраты пригодны для этой цели? Следующие:

1, 9, 25, 49, 81.

Если 81 является одним из четырех квадратов, сумма которых равна 100, то сумма трех других должна быть

100-81 = 19.

Нечетными квадратами, меньшими чем 19, являются лишь 1 и 9, и, очевидно, для представления 19 в виде суммы 3 нечетных квадратов, если члены расположены в порядке убывания, имеется единственная возможность. Мы получаем

100 = 81+9 + 9+1.

Подобным же образом находим

Действуя систематически, отщепляя сначала наибольший квадрат, мы можем убедиться, что исчерпали все возможности, при условии, что 4 квадрата расположены в порядке убывания (или, точнее, в порядке невозрастания). Но если мы примем в расчет, как нам и надлежит, все расположения членов, то существует больше возможностей. Например,

Эти шесть сумм имеют одни и те же члены, но порядок членов различен; в соответствии с постановкой нашей задачи они должны рассматриваться как 6 различных представлений; одно представление

100 = 49+49+ 1 + 1

с невозрастающими членами является, источником пяти других представлений, а всего шести представлений. Подобным же образом имеем:

И с возрастающие члены

Число расположений

81+ 9+ 9+ 1

12

49 + 49+ 1+ 1

6

49 + 25 + 25+ 1

12

25 + 25 + 25 + 25

1

Подводя итог, мы находим в нашем случае, когда и = 25 и 4м = 100, количество представлений числа 4м =100 в виде суммы 4 нечетных квадратов:

12 + 6 + 12 + 1 =31.

5. Составление таблицы наблюдений. Частный случай и = 25, где 4н=100 и число представлений равно 31, ясно показывает нам смысл задачи. Мы можем теперь систематически изучить простейшие случаи, ц=1, 3, 5, ...до м = 25. Составим таблицу (см. стр. 87, читателю следует самому составить таблицу или по крайней мере проверить несколько строк).

6. Каково правило? Существует ли какой-нибудь закон, который мы могли бы распознать, какая-либо простая связь между нечетным числом и и числом различных представлений числа 4м в виде суммы четырех нечетных квадратов?

Этот вопрос —ядро нашей задачи. Мы должны на него ответить на основании наблюдений, собранных и сведенных в таблицу в предыдущем параграфе. Мы находимся в положении натуралиста, пытающегося извлечь из своих экспериментальных данных какое-нибудь правило, какую-нибудь общую формулу. Экспериментальный материал, имеющийся к этому моменту в нашем распоряжении, состоит из двух параллельных рядов чисел:

1 3 5 7 9 11 13 15 17 19 21 23 25 1 4 6 8 13 12 14 24 18 20 32 24 31

Первый ряд состоит из последовательных нечетных чисел, но какое правило управляет вторым рядом?

Когда мы пытаемся ответить на этот вопрос, наше первое чувство может быть близко к отчаянию. Этот второй ряд кажется совершенно неправильным, нас озадачивает его сложное происхождение, мы едва ли можем надеяться найти какое-нибудь правило. Однако если мы забудем

Таблица I

и

Au

Невозрастающие слагаемые

Расположения

Представления

1

4

1+ 1+ 1+ 1

1

1

3

12

9+ 1+ 1+ 1

4

4

5

20

9+ 9+ 1+ 1

6

6

7

28

25+ 1+1+1

4

8

9+ 9+ 9+ 1

4

9

36

25+ 9+1+1

12

13

9+ 9+ 9+ 9

1

11

44

25+ 9+ 9+ 1

12

12

13

52

49+ 1+1+1

4

14

25 + 25+ 1 + 1

6

25+ 9+ 9+ 9

4

15

60

49+ 9+1+1

12

24

25 + 25+ 9+ 1

12

17

68

49+ 9+ 9+ 1

12

18

25 + 25+ 9+ 9

6

19

76

49 + 25+ 1+ 1

12

20

49+ 9+ 9+ 9

4

25 + 25 + 25+ 1

4

21

84

81+ 1+ 1+ 1

4

32

49 + 25+ 9+ 1

24

25 + 25 + 25+ 9

4

23

92

81+ 9+ 1+ 1

12

24

49 + 25+ 9+ 9

12

25

100

81+ 9+ 9+ 1

12

31

49 + 49+ 1 + 1

6

49 + 25 + 25+ 1

12

25 + 25 + 25 + 25

1

о его сложном происхождении и сосредоточим свое внимание на том, что находится перед нами, то достаточно легко заметить одно обстоятельство. Довольно часто случается, что член второго ряда превосходит соответствующий член первого ряда ровно на одну единицу. Выделяя эти случаи жирным шрифтом в первом ряду, мы можем представить наш экспериментальный материал следующим образом:

1 3 5 7 9 11 13 15 17 19 21 23 25

1 4 6 8 13 12 14 24 18 20 32 24 31.

Наше внимание привлекают числа, напечатанные жирным шрифтом. Нетрудно их узнать: они простые. Действительно, это все простые числа, имеющиеся в первом ряду нашей таблицы. Это замечание, если мы припомним происхождение нашего ряда, может показаться очень удивительным. Мы рассматривали квадраты, мы никоим образом не касались простых чисел. Не странно ли, что в нашей задаче какую-то роль играют простые числа? Трудно избежать впечатления, что наше наблюдение имеет важное значение, что за ним кроется что-то замечательное.

Что же можно сказать о числах из первого ряда, не напечатанных жирным шрифтом? Они являются нечетными числами, но не простыми. Первое, 1, единица, другие — составные:

Какова природа соответствующих чисел во -втором ряду?

Если нечетное число и простое, то соответствующее число равно и+1; если и не простое, то соответствующее число не равно Это мы уже заметили. Мы можем прибавить одно маленькое замечание. Если и= 1, то соответствующее число также 1, и, таким образом, оно меньше чем н+1, но во всех других случаях, когда и не простое, соответствующее число больше чем и+ 1. Иными словами, число, соответствующее и, меньше, равно или больше чем м + 1 в соответствии с тем, является ли и единицей, простым или составным числом. Существует какая-то закономерность.

Сосредоточим свое внимание на составных числах в верхней строке и соответствующих числах в нижней:

Что-то странное. Квадраты в первой строке соответствуют простым числам во второй. Однако у нас слишком мало наблюдений; вероятно, нам не следует придавать этому замечанию слишком большого значения. Все же верно, что, наоборот, под составными числами в первой строке, не являющимися квадратами, мы находим во второй строке числа, не являющиеся простыми:

Снова что-то странное. Каждый множитель во второй строке превосходит соответствующий множитель в первой строке ровно на одну единицу. Однако у нас слишком мало наблюдений; нам лучше не придавать этому замечанию слишком большого Значения. Все же наше замечание обнаруживает какой-то параллелизм с предыдущим замечанием. Мы подметили раньше

и мы подметили теперь

где р и q простые. Существует какая-то закономерность.

Возможно, мы увидим это яснее, если напишем число, соответствующее pq, иначе:

Что же мы можем здесь увидеть? Что это за числа pq, р, q> 1? Как бы то ни было, случаи

остаются необъясненными. Действительно, числа, написанные под 9 и 25, как мы уже заметили, соответственно больше чем 9 + 1 и 25 + 1:

Что это за числа?

Теперь достаточно лишь небольшой искры и нам может удастся соединить наши отрывочные замечания в стройное целое, наши разрозненные указания в эффектную картину полного соответствия:

ДЕЛИТЕЛИ! Вторая строка указывает делители чисел первой строки. Это может оказаться разыскиваемым правилом и открытием, настоящим открытием:

Каждому числу в первой строке соответствует сумма его делителей.

И таким образом мы пришли к предположению, быть может, к одной из тех «наиболее изящных новых истин» Гаусса:

Если и — нечетное число, то число представлений числа Au в виде суммы четырех нечетных квадратов равно сумме делителей и.

7. Природа индуктивного открытия. Просматривая предыдущие параграфы (от 3 до 6), мы можем найти много вопросов, нуждающихся в ответе.

Что мы получили? Не доказательство, даже не тень доказательства, а всего лишь предположение: простое описание фактов в пределах нашего экспериментального материала и некоторую надежду, что это описание можно применить и за пределами нашего экспериментального материала.

Как мы получили наше предположение? В основном тем же способом, каким обычные люди или ученые, работающие в какой-нибудь нематематической области, получают свои. Мы собрали относящиеся к вопросу наблюдения, исследовали и сравнили их, подметили отрывочные закономерности, колебались, спотыкались, и в конце концов нам удалось соединить разрозненные детали в явно многозначительное целое. Совершенно подобным же образом археолог по нескольким разрозненным буквам на стертом камне может восстановить целую надпись или палеонтолог по немногим окаменевшим

костям вымершего животного может восстановить его существенные черты. В нашем случае многозначительное целое появилось в тот самый момент, когда мы осознали подходящее объединяющее понятие (делители).

8. О природе индуктивных доводов. Остается еще несколько вопросов.

Насколько сильны эти доводы? Ваш вопрос является неполным. Вы имеете, конечно, в виду индуктивные доводы для нашего предположения, сформулированного в § 6, которые мы можем вывести из табл. I § 5; это понятно. Однако, что вы понимаете под словом «сильны»? Доводы сильны, если они убедительны; они убедительны, если они кого-нибудь убеждают. Однако вы не сказали, кого они должны были бы убеждать — меня, или вас, или Эйлера, или начинающего, или кого-нибудь еще?

Лично я нахожу доводы довольно убедительными. Я чувствую уверенность, что Эйлер думал бы о них очень благоприятно (я упоминаю Эйлера потому, что он очень близко подходил к открытию нашего предположения; см. пример 6.24). Я думаю, что начинающий, который кое-что знает о делимости чисел, также нашел бы доводы довольно убедительными. Мой коллега, превосходный математик, который, однако, не был знаком с этим уголком теории чисел, нашел доводы «убедительными на сто процентов».

Я не интересуюсь субъективными впечатлениями. Какова точная, объективно оцениваемая степень разумной веры, оправдываемая индуктивными доводами? Вы даете мне одно (А), не даете мне другого (В) и спрашиваете у меня о третьем (С).

(A) Вы даете мне только лишь индуктивные доводы: предположение было подтверждено в первых тринадцати случаях для чисел 4, 12, 20, 100. Это совершенно ясно.

(B) Вы желаете, чтобы я оценил степень разумной веры, оправдываемую этими доводами. Однако такая вера должна зависеть если не от капризов и темперамента, то от знаний человека, воспринимающего доводы. Он может знать доказательство предполагаемой теоремы или противоречащий пример, подрывающий ее. В этих двух случаях степень его веры, уже твердо установленная, не изменится под влиянием индуктивных доводов. Однако если он знает что-нибудь, что очень близко подходит к полному доказательству или к полному опровержению теоремы, то его вера еще способна измениться и на нее окажут воздействие полученные здесь индуктивные доводы, хотя в соответствии с характером знаний, которые он имеет, из этих доводов будут вытекать различные степени веры. Поэтому, если вы хотите определенного ответа, вам следовало бы указать определенный уровень знаний, на основе которого должны были бы оцениваться предложенные индуктивные доводы (А). Вы должны дать мне определенный набор относящихся к рассматриваемому вопросу

известных фактов (возможно, подробный список известных элементарных предложений из теории чисел).

(С) Вы желаете, чтобы я точно оценил степень разумной веры, оправдываемую индуктивными доводами. Быть может, мне следует дать ее вам в процентах «полной веры»? (Мы можем условиться называть «полной верой» степень веры, оправдываемую полным математическим доказательством рассматриваемой теоремы). Не хотите ли вы услышать, что данные доводы оправдывают веру, составляющую 99% или 2,875% или 0,000001% «полной веры»?

Короче говоря, вы желаете, чтобы я решил задачу:

Пусть даны (А) индуктивные доводы и (В) определенный набор известных фактов и предложений; вычислить (С) процент полной веры, разумно вытекающий из (А) и (В).

Решить эту задачу — означало бы сделать гораздо больше, чем в моих силах. Я не знаю никого, кто смог бы это сделать, и никого, кто отважился бы это сделать. Я знаю некоторых философов, которые обещают сделать что-то в этом роде в чрезвычайной общности. Однако встретив конкретную задачу, они уклоняются и увиливают и находят тысячу отговорок, объясняющих почему нельзя решить именно эту задачу.

Возможно, эта задача является одной из тех типичных философских задач, о которых вы можете много говорить вообще, и даже проявлять подлинную заинтересованность, но которые превращаются в ничто, когда вы снижаете их до конкретных условий.

Могли бы вы сравнить настоящий случай индуктивного умозаключения с каким-нибудь другим знакомим случаем и таким образом прийти к разумной оценке силы доводов? Сравним индуктивные доводы в пользу нашего предположения с доводами Баше в пользу его предположения.

Вот предположение Баше: для л=1, 2, 3, ... уравнение

имеет по крайней мере одно решение в неотрицательных целых числах х, у, z и w. Он убедился, что это предположение верно для /1=1, 2, 3, 325. (См. § 2, в частности, короткую таблицу.)

Вот наше предположение: для данного нечетного и число решений уравнения

в положительных нечетных числах x, уу z и w равно сумме делителей числа и. Мы убедились, что это предположение верно для и=1, 3, 5, 7, 25 (13 случаев). (См. §§ 3—6.)

Я сравню эти два предположения и индуктивные доводы, даваемые их соответственными подтверждениями, в трех отношениях.

Число подтверждений. Предположение Баше было подтверждено в 325 случаях, наше предположение — только в 13 случаях. Преимущество в этом отношении явно на стороне Баше.

Точность предсказания. Предположение Баше предсказывает, что число решений ^ 1; наше — предсказывает, что число решений в точности равно такой-то и такой-то величине. Очевидно, разумно допустить, как я полагаю, что подтверждение более точного предсказания имеет больше веса, чем подтверждение менее точного предсказания. В этом отношении преимущество явно на нашей стороне.

Соперничающие предположения. Предположение Баше относится к максимальному числу квадратов, скажем М, необходимому для представления произвольного положительного целого числа в виде суммы квадратов. Действительно, предположение Баше утверждает, что M = 4. Я не думаю, что Баше a priori имел какое-нибудь основание предпочесть Ж = 4, скажем, М = 5 или любому другому значению, например M = 6 или M = 7; a priori не исключено даже M = оо. (Естественно, М = оо означало бы, что существуют все большие и большие целые числа, требующие все большего и большего числа квадратов. На первый взгляд Ж = оо могло бы казаться наиболее вероятным предположением.) Короче говоря, у предположения Баше есть много очевидных соперников. А у нашего нет ни одного. Когда мы рассматривали неправильную последовательность чисел представлений (§ 6), у нас было впечатление, что мы можем оказаться не в состоянии найти никакого правила. Теперь мы все-таки нашли замечательно ясное правило. Нам трудно надеяться найти какое-нибудь другое правило.

Может оказаться трудным выбрать невесту, если для выбора имеется много привлекательных юных леди: если же поблизости есть всего лишь одна подходящая девушка, то решение может прийти намного быстрее. Мне кажется, что наше отношение к предположениям отчасти сходно. При прочих равных условиях предположение, имеющее многих очевидных соперников, принять труднее, чем предположение, не имеющее соперников. Если вы думаете так же, как и я, то вы должны найти, что в этом отношении преимущество на стороне нашего предположения, а не на стороне предположения Баше.

Пожалуйста, заметьте, что доводы в пользу предположения Баше сильнее в одном отношении, а доводы в пользу нашего предположения сильнее в других отношениях, и не задавайте вопросов, на которые нельзя ответить.

ПРИМЕРЫ И ПРИМЕЧАНИЯ К ГЛАВЕ IV

1. Обозначения. Мы предполагаем, что n и k — положительные целые числа и рассматриваем диофантово уравнение

Мы говорим, что два решения xlt х2, ..., хь и х\у х'ъ x'k равны в том и только в том случае, если хх—х\, х2 = х£> xk — x'k. Если мы допускаем

для X\t х2, ..., Xk все целые числа, положительные, отрицательные или нуль, то число решений мы обозначаем символом Rk (n). Если мы допускаем только положительные нечетные числа, то число решений обозначаем символом S^(fl). Эти обозначения играют важную роль в большей части следующих задач.

Предположение Баше (§ 2) выражается в этих обозначениях неравенством

Ri(n)>0 для л=1, 2, 3, ...

Предположение, открытое нами в § 6, утверждает, что 54(4(2n—1)) равно сумме делителей числа 2n— 1 для я= 1, 2, 3, — Найдите R2 (25) и S3(ll).

2. Пусть X и iy — прямоугольные координаты на плоскости. Точки, для которых и X и у суть целые числа, называются «точками решетки» на плоскости. Точки решетки в пространстве определяются аналогично.

Найдите геометрическую интерпретацию R2 (n) и R3 (n) в терминах точек решетки.

3. Выразите предположение, с которым мы встретились в § 1, пользуясь символом Р2 (n).

4. Когда нечетное число является суммой двух квадратов? Попытайтесь ответить на этот вопрос с помощью индукции, исследуя таблицу

Продолжите, если необходимо, эту таблицу и сравните ее с таблицей § I.

5. Могли бы вы путем математической дедукции подтвердить какую-нибудь часть вашего ответа к примеру 4, полученного с помощью индукции? После такого подтверждения не было ли бы разумно изменить вашу веру в предположение?

6. Проверьте предположение Баше (§ 2) для чисел до 30 включительно. Какие числа действительно требуют четырех квадратов?

7. Пусть а2, b2, с2 и d2 обозначают четыре различных нечетных квадрата. Чтобы лучше понять табл. I в § 5, рассмотрите суммы

Сколько различных представлений (в смысле § 3) вы можете получить из каждой суммы с помощью перестановки членов?

8. Число представлений числа 4м в виде суммы четырех нечетных квадратов нечетно в том и только в том случае, если и есть квадрат. (Следуя обозначениям § 3, мы предполагаем, что и нечетно.) Докажите это утверждение и покажите, что оно находится в согласии с предположением § 6. Какое влияние оказывает это замечание на вашу веру в это предположение?

9. Пусть теперь а, b, с и d обозначают различные положительные целые числа (четные и нечетные). Рассмотрите пять сумм, упомянутых в примере 7, а также следующие:

Найдите в каждом из этих одиннадцати случаев взнос в RA (ri). Все возможные представления нужно выводить из каждой суммы с помощью следующих очевидных операций: прибавлять О2 столько раз, сколько необходимо, чтобы довести число членов до 4, изменять порядок и заменять несколько (или ни одного, или все) чисел а, bу с, d соответственно числами —ау —b, — с, — d. (Проверьте примеры в табл. II.)

Таблица II

п

Невозрастающие слагаемые

Представления

Я4 (n)/8

Продолжение таблицы II

п

Невозрпстающие слагаемые

Представления

Ri (л)/8

Таблица III

10. Индуктивно исследуйте число решений уравнения n = х2+у2 + rг + w2 в целых числах х, у, г и w, положительных, отрицательных или Ö. Начните с построения таблицы, аналогичной табл. I.

11 (продолжение). Попытайтесь воспользоваться методом или результатом § 6.

12 (продолжение). Руководствуясь аналогией с § 6 или вашим наблюдением табл. II, выделите подходящие классы целых чисел и исследуйте каждый класс сам по себе.

13 (продолжение). Сконцентрируйте свое внимание на наиболее неподдающемся вашим усилиям классе.

14. (продолжение). Попытайтесь суммировать все отрывочные закономерности и выразите закон в одном предложении.

15. (продолжение). Проверьте найденное правило в первых трех случаях, не содержащихся в табл. II.

16. Найдите R8 (5) и 58 (40).

17. Проверьте по крайней мере две строки в табл. III стр. 95, еще не приведенные в табл. I и II.

18. Пользуясь табл. III, индуктивно исследуйте R8 (n) и 58 (8я).

19 (продолжение). Попытайтесь воспользоваться методом или результатом § 6 и примеров 10—15.

20. (продолжение). Руководствуясь аналогией или наблюдением, выделите подходящие классы целых чисел и исследуйте каждый класс сам по себе.

21 (продолжение). Попытайтесь обнаружить ключ в наиболее доступном случае.

22 (продолжение). Попытайтесь найти какое-нибудь объединяющее понятие, которое могло бы суммировать отрывочные закономерности.

23 (продолжение). Попытайтесь выразить закон в одном предложении.

24. Какие целые числа могут и какие не могут быть выражены в виде 3* + 5*/, где X и {/ — неотрицательные целые числа.

25. Попытайтесь догадаться, по какому закону составлена следующая таблица:

а

ь

Последнее целое число, не выражающееся в виде ах + bу

2

3

1

2

5

3

2

7

5

2

9

7

3

4

5

3

5

7

3

7

11

3

8

13

4

5

11

5

6

19

Подразумевается, что х и у — неотрицательные целые числа. Проверьте несколько строк и, если необходимо, продолжите таблицу. (Проследите изменения, происходящие в последнем столбце, когда изменяется лишь одно из двух чисел а и 6.)

26. Опасности индукции. Индуктивно исследуйте следующие утверждения:

(1) (n— 1)!+1 делится на я, когда n — простое число, но не делится на я, когда n — составное число.

(2) 2Л_1—1 делится на п. когда л—нечетное простое число, но не делится на л, когда « — составное число.

V. РАЗНЫЕ ПРИМЕРЫ ИНДУКЦИИ

Когда вы убедитесь, что теорема верна, вы начинаете се доказывать.— Традиционный профессор математики1)2)

1. Разложения. Сталкиваясь с разного рода задачами, мы нуждаемся в определенном типе индуктивных рассуждений. В различных областях математики встречаются некоторые задачи, требующие индуктивных рассуждений типичного характера. Настоящая глава несколькими примерами иллюстрирует этот тезис. Мы начинаем с относительно простого примера.

Разложить по степеням х функцию 1/(1 — x1, x2).

Эта задача может быть решена многими способами. Нижеследующее решение несколько громоздко, но оно основано на правильном принципе и может естественно прийти в голову умному начинающему, который знает немного, но все же по крайней мере знает сумму геометрической прогрессии:

В нашей задаче есть возможность воспользоваться этой формулой:

1) Речь идет о профессоре математики —традиционном персонаже анекдотов о математиках; см. «Как решать задачу», стр. 98. — Прим. перев.

2) Приведенному изречению этого хорошо известного педагога иногда предшествует следующее увещание: «Если вы должны доказать теорему, не торопитесь. Прежде всего полностью поймите, что теорема говорит, попытайтесь ясно увидеть, что она означает. Затем проконтролируйте теорему, она может оказаться неверной. Рассмотрите ее следствия, проверьте столько частных примеров, сколько нужно, чтобы убедить вас, что она верна. Когда ...»

Результат поразителен. Любой отличный от нуля коэффициент имеет или значение 1, или значение —1. Последовательность коэффициентов, по-видимому, обнаруживает некоторую закономерность, которая станет более очевидной, если мы вычислим еще несколько членов:

Периодичность! Последовательность коэффициентов оказывается периодической с периодом 6:

Мы, естественно, ожидаем, что наблюдаемая периодичность продолжится и за пределами наших наблюдений. Но это — индуктивное заключение, или всего лишь догадка, к которой нам следовало бы отнестись с должным недоверием. Эта догадка, однако, основана на фактах и поэтому заслуживает серьезного исследования. Исследовать ее, помимо всего прочего, значит выразить ее по-другому. Существует интересный способ выразить иначе наше предположение:

Теперь мы легко можем заметить в правой части равенства две геометрические прогрессии с одним и тем же знаменателем —Xs, суммы которых мы можем найти. И, таким образом, предположение сводится к равенству

которое, конечно, верно. Мы доказали наше предположение.

Наш пример, несмотря на свою простоту, во многих отношениях типичен. Если нам нужно разложить данную функцию, мы часто можем без большого труда получить первые несколько коэффициентов. Рассматривая эти коэффициенты, мы должны попытаться, как мы здесь и сделали, угадать закон, управляющий разложением. Угадав закон, мы должны попытаться, как мы здесь и сделали, его доказать. Может оказаться очень выгодным, как это здесь и оказалось, провести доказательство в обратном направлении, исходя из подходящей ясной формулировки предположения.

Между прочим, наш пример является весьма благодарным (что также типично). Он приводит к любопытному соотношению между биномиальными коэффициентами.

Не лишне будет добавить, что задача разложения данной функции в ряд возникает в различных областях математики. См. следующий параграф, а также примеры и примечания к гл. VI.

2. Приближения1). Пусть Е обозначает длину дуги эллипса с полуосями а и b. Для Е не существует простого выражения через а и by но было предложено несколько приближенных выражений, среди которых следующие два являются, пожалуй, наиболее очевидными:

Р — приближенное, Р — другое приближенное, Е — точное выражение для одной и той же величины — длины дуги эллипса. Когда а совпадает с h, эллипс становится окружностью и как Р, так и Рг совпадают с Е.

Насколько хорошо Р и Р приближают Е, когда а отлично от b? Какое из них ближе к истине, Р или Р'? Вопросы этого рода часто возникают во всех областях прикладной математики, и существует общепринятый способ подхода к ним, который мы в общих чертах опишем следующим образом. Разложите (Р — Е)/E1 относительную погрешность приближения, по степеням подходящей малой величины и основывайте ваше суждение на начальном (первом отличном от нуля) члене разложения.

Посмотрим, что это означает и как этот прием осуществляется в применении к нашему случаю. Сначала нам нужно выбрать ^подходящую малую величину». Испытаем е, эксцентриситет эллипса, определяемый формулой

а мы считаем большой, a b малой полуосью. Когда а превращается в by г эллипс в окружность, е обращается в нуль. Когда эллипс не очень отличается от окружности, е мало. Разложим поэтому относительную погрешность по степеням е. Мы получим (опуская здесь детали)

Мы вычислили только начальный член, который в обоих случаях имеет порядок 4, содержит е4. В обоих разложениях мы не выписали члены высшего порядка, содержащие е5, е6, ... Когда е очень мало (бесконечно мало), т. е. когда эллипс почти круглый, невыписанные члены по сравнению с начальными членами незначительны. Поэтому для почти круглого эллипса Р ближе к истинному значению Е, чем Р\ (Действительно, отношение погрешностей стремится к 1:3, когда е стремится к нулю.) И Р и Рг приближают Е снизу:

1) Ср. Putnam, 1949.

Все это имеет место для очень малого е, для почти круглых эллипсов. Мы еще не знаем, какая часть этих результатов остается справедливой, когда е не так мало. Фактически в данный момент мы знаем только предельные соотношения, справедливые при е→0. Мы еще ничего определенного не знаем о погрешности наших приближений, когда е = 0,5 или е = 0,1. Конечно, то, что нам нужно на практике, это именно информация о таких конкретных случаях.

Практики при таких обстоятельствах проверяют свои формулы численно. Мы можем последовать за ними, но какой случай нам нужно было бы проверить сначала? Рекомендуется не позабыть крайние случаи. Эксцентриситет е меняется между крайними значениями 0 и 1. Когда е = 0, b = а и эллипс превращается в окружность. Однако теперь мы знаем этот случай довольно хорошо и поэтому обратимся лучше к другому крайнему случаю. Когда е=1, й = 0, эллипс превращается в прямолинейный отрезок длины 2а, а длина его дуги равна 4а. Мы имеем

Е=\ау Р = ла, Р' = 0У когда е=1,

Пожалуй, стоит отметить, что в обоих крайних случаях, как для 8 = 1, так и для очень малого е, £>P>P'. Справедливы ли эти неравенства для любого е?

Для второго неравенства ответ не труден. Действительно, для а >й имеем

так как это эквивалентно неравенству

или

Сосредоточим свое внимание на остающемся вопросе. Всегда ли справедливо неравенство £>Р? Естественно предположить, что то, что мы нашли верным в крайних случаях (е мало и е=1), остается верным и в промежуточных случаях (для всех значений е между 0 и 1). Наше предположение не подкрепляется большим числом наблюдений, это верно, но оно подкрепляется аналогией. На подобный же вопрос (относительно P>Pf), который был задан одновременно и опирался на подобные же основания, ответ был утвердительным.

Проверим какой-нибудь случай численно. Мы немного больше знаем о случае, когда е близко к 0, чем о случае, когда оно близко к 1. Выберем для е простое значение, более близкое к 1, чем к 0: а = 5, b=3у е = 4/5. Для этого е (пользуясь соответствующими таблицами) находим

Неравенство Е>Р подтверждается. Это подтверждение нашего предположения идет с новой стороны, из другого источника, и потому имеет некоторый вес. Отметим также, что

Относительная погрешность приблизительно равна 1,5%. Она значительно больше, чем начальный член ее разложения, но имеет тот же знак. Поскольку е = 4/5 = 0,8 не слишком мало, наше замечание годится для всей картины и ведет к увеличению нашей веры в предположение.

Приближенные формулы играют в прикладной математике важную роль. Пытаясь оценить такую формулу, мы часто на практике применяем процедуру, которой следовали в этом параграфе. Мы вычисляем начальный член разложения относительной погрешности и дополняем полученную таким путем информацию численными проверками, рассмотрениями по аналогии и т. д., короче, индуктивными, недоказательными рассуждениями.

3, Пределы. Для того чтобы увидеть индуктивное рассуждение в действии еще и в другой области, рассмотрим следующую задачу1).

Пусть av а2» an —произвольная последовательность положительных чисел. Показать, что

Эта задача требует некоторых предварительных знаний, особенно знакомства с понятием «lim sup», или «верхнего предела последовательности»2). Однако, если даже вы полностью знакомы с этим понятием, вы можете испытать некоторые трудности в нахождении доказательства. Я приношу свои поздравления любому студенту, который сможет в несколько часов без посторонней помощи решить эту задачу.

Если вы сами хоть немного побились над этой задачей, то вы сможете с большим участием переживать борьбу, описанную в следующих параграфах.

4. Попытка опровергнуть. Начинаем с обычных вопросов. В чем состоит посылка? Только в том, что art>0, ни в чем другом.

1) См. Putnam, 1948.

2) См., например, Харди Г. Х., Курс чистой математики, М., 1949, § 82, (Число / называется верхним пределом последовательности xn, если для любых чисел р и q таких, что p<cl<.q. найдется бесконечное множество номеров п. для которых xn > р, и лишь конечное число номеров л, для которых хп> > q. — Прим. перев.)

В чем состоит заключение? В этом неравенстве с е в правой части и сложным пределом в левой.

Известна ли вам какая-нибудь родственная теорема? Нет, пожалуй. Это очень не похоже на все, что я знаю.

Вероятно ли, что теорема верна? Или более вероятно, что она не верна? Конечно, не верна. В самом деле, я не могу поверить, что из такой широкой посылки, всего лишь из того, что an > 0, может быть выведено такое точное следствие.

Что вам требуется сделать? Доказать теорему. Или опровергнуть ее. Я очень стою за опровержение.

Можете ли вы проверить какой-нибудь частный случай теоремы? Да, это то, что я собираюсь сделать.

[Для того, чтобы упростить формулы, положим

и будем писать bn-^b вместо

Пробую an=\ для n=\, 2, 3, ... Тогда

В этом случае заключение теоремы подтверждается.

Однако я мог бы положить а1 = 0, an=\ для n =2, 3, 4, ... Тогда

Теорема опровергнута, Нет, это не так. Посылка разрешает ах = 0,00001, но запрещает ах = 0. Вот жалость!

Попробую что-нибудь другое. Пусть an = п. Тогда

Снова подтвердилось.

Пусть теперь an = n2. Тогда

Снова подтвердилось. И снова е2. Нельзя ли в правой части заключения вместо е поставить е2? Это усилило бы теорему.

Введу параметр. Возьму ... Да, возьму а± = с, где с я оставляю в своем распоряжении, но an = n для n=2, 3, 4, ... Тогда

е1+с всегда >е, так как c = ûi>0. Однако е1+с может быть сколь угодно близким к е, потом, что с может быть произвольно мало. Я не могу опровергнуть, я не могу доказать.

Еще только одно испытание. Возьму an = пс. Тогда [мы опускаем некоторые выкладки]

Снова предел может сколь угодно близко подходить к е, но всегда остается больше е. Мне никак не удается опустить этот ... предел ниже е. Пришло время изменить точку зрения.

5. Попытка доказать. В самом деле, основания для изменения точки зрения очень сильны. В свете накопленных индуктивных доводов перспектива опровергнуть теорему кажется столь тусклой, что перспектива ее доказательства выглядит относительно яркой.

Поэтому ничего не остается, кроме как приступить к новому исследованию теоремы, ее формулировки, ее посылки, ее заключения, связанных с нею понятий и т. д.

Можете ли вы ослабить посылку? Нет, не могу. Если я допускаю an = 0, то заключение перестает быть справедливым, теорема становится неверной (а1 = 0, а2 — а3 = а^ = .. .= 1).

Можете ли вы усилить заключение? Я, безусловно, не могу его усилить, подставив вместо е какое-нибудь большее число, так как в этом случае заключение перестает быть справедливым, теорема становится неверной (примеры в предыдущем § 4).

Принимали ли вы в расчет все существенные понятия, связанные с задачей? Нет, не принимал. Быть может, отсюда и затруднения.

Что вы не приняли в расчет? Определение lim sup. Определение числа е.

Что такое lim sup bn? Это верхний предел последовательности bn при n→со.

Что такое е? Я могу определить е различными способами. Приведенные выше примеры наводят на мысль, что обычное определение е может оказаться наилучшим:

Могли бы вы иначе сформулировать теорему?...

Могли бы вы сформулировать теорему в какой-нибудь более доступной форме ? ..,

Могли бы вы иначе сформулировать заключение? В чем состоит заключение? Заключение содержит е. Что такое е? (Я уже задавал этот вопрос раньше.)

О, да — вот заключение:

или, что то же самое,

Это выглядит значительно лучше!

Может ли заключение быть неверным, когда выполнена посылка? Да, это и есть наш вопрос. Подумаю об этом. Рассмотрю отрицание утверждения, в точности противоположное утверждение. Запишу его:

(?)

Я ставлю рядом с ним знак вопроса, потом, что именно этот пункт подвергается сомнению. Назову его «формулой (?)». Что формула (?) означает? Конечно, она означает, что существует такое п. что

Откуда следует, что

Далее следует ... Попробую что-нибудь. Да, я могу записать это очень стройно! Из (?) далее следует, что

или

Выпишу это подробнее. Отсюда следует, что

и, таким образом,

где С —постоянная, не зависящая от п> если только n^N. Это совсем не важно, но на самом деле

Важно, однако, что n может быть произвольно велико и что гармонический ряд расходится. Поэтому отсюда следует, что

Но это решительно противоречит предположению, что а„>0 для n=1, 2, 3, ... Тем не менее это противоречие безукоризненно следует из формулы (?). Поэтому, действительно, источником противоречия является формула (?); формула (?) несовместима с посылкой an > 0; противоположное утверждение к (?) должно быть верно — теорема доказана!

6. Роль индуктивной фазы. Поверхностно просматривая предыдущее доказательство, мы могли бы подумать, что первая, индуктивная фаза решения (§ 4) вообще не применяется во второй, доказательной фазе (§ 5). Однако это не так. Индуктивная фаза была полезна в нескольких отношениях.

Во-первых, исследуя конкретные частные случаи теоремы, мы до конца ее поняли и осознали ее полное значение. Мы убедились, что ее посылка существенна, ее заключение точно. Это знание было полезно во второй фазе: мы знали, что должны воспользоваться всей посылкой и принять в расчет точное значение постоянной.

Во-вторых, убедившись в том, что теорема верна в нескольких частных случаях, мы приобрели сильные индуктивные доводы в ее пользу. Индуктивная фаза преодолела наше первоначальное сомнение и дала нам сильную уверенность в теореме. Без такой уверенности мы едва ли нашли бы мужество предпринять доказательство, которое вовсе не выглядело привычным делом. «Когда вы убедитесь, что теорема верна, вы начинаете ее доказывать» — традиционный профессор математики совершенно прав.

В-третьих, примеры, в которых известная предельная формула для е выскакивала всё снова и снова, дали нам разумное основание для введения этой предельной формулы и в формулировку теоремы. А это введение оказалось решающим шагом на пути к решению.

В целом кажется естественным и разумным, что индуктивная фаза предшествует доказательной фазе. Сначала догадайтесь, потом докажите.

ПРИМЕРЫ И ПРИМЕЧАНИЯ К ГЛАВЕ V

1. Перемножая ряды

вы найдете первые члены разложения

(a) Вычислите еще несколько членов и попытайтесь догадаться, каков общий член.

(b) Покажите, что у удовлетворяет дифференциальному уравнению

и воспользуйтесь этим уравнением, чтобы доказать вашу догадку.

2. Перемножая ряды

вы найдете первые члены разложения

(a) Вычислите еще несколько членов и попытайтесь догадаться, каков общий член.

(b) Ваша догадка, если она правильна, наводит на мысль, что у удовлетворяет простому дифференциальному уравнению. Установив это уравнение, докажите вашу догадку.

3. Функциональное уравнение

удовлетворяется степенным рядом

Проверьте эти коэффициенты, определите, если необходимо, еще несколько и попытайтесь догадаться, каков общий член.

4. Функциональное уравнение

удовлетворяется степенным рядом

Утверждается, что an есть число структурно различных химических соединении (алифатических алкоголей), имеющих одну и ту же химическую Формулу CrtH2nxiOН. В случае л —4 ответ верен. Существует а4 = 4 алкоголей и4Н,ОН; они представлены на рис. 5.1, каждое соединение изображено в виде «дерева», каждая С —в виде маленького кружка или «узла» и радикал ОН — в виде стрелки; H опускается Проверьте другие значения n.

5.

— 1, —1, 0, когда, соответственно, n = 0, 1, 2, 3, 4, 5 (mod 6).

6. Эллипс описывает вытянутый или сплющенный сфероид в зависимости от того, вращается ли он вокруг большой или малой оси.

Для площади поверхности вытянутого сфероида

соответственно—точное и приближенное выражения (a, b и е как в § 2). Найдите

(a) начальный член относительной погрешности,

(b) относительную погрешность, когда 6 = 0.

Что можно сказать о знаке относительной погрешности?

7. Для площади поверхности сплющенного сфероида

соответственно —точное и приближенное выражения. Найдите

(a) начальный член относительной погрешности,

(b) относительную погрешность, когда b = 0.

Что можно сказать о знаке относительной погрешности?

8. Сравнивая примеры 6 и 7, какую приближенную формулу предложили бы вы для площади поверхности трехосного эллипсоида с полуосями a, b и с?

Что можно сказать о знаке относительной погрешности?

9. [§ 2]. Исходя из параметрического представления эллипса, x = a sin/, y=zbcost, покажите, что

и выведите отсюда начальные члены, приведенные без доказательства в § 2.

10 (продолжение). Пользуясь разложением по степеням е, докажите, что Е > Р для 0 < е =£С 1.

Рис. 5.1. Соединения C4Н,ОН.

1) Так, например, первому «дереву» соответствует структурная формула (бутиловый спирт). — Прим. перев.

11 [§ 2]. Определите число а так, чтобы выражение

давало наилучшее возможное приближение Е для малого е. (Т. е. порядок начального члена разложения погрешности (Р" — Е)1Е должен быть настолько высоким, насколько это возможно.)

12 (продолжение). Исследуйте приближение посредством Р", следуя методу § 2. (Индуктивно!)

13. Пусть дано положительное целое число р и последовательность положительных чисел av аъ а3, ant ... Покажите, что

14 (продолжение). Укажите последовательность a1, a2, а3, ... , для которой достигается равенство.

15. Объясните наблюдаемые закономерности. Открытие в физике часто достигается в два шага. Сначала в данных наблюдений подмечается некоторая закономерность. Затем эта закономерность объясняется как следствие какого-либо общего закона. Эти два шага могут быть отделены большим промежутком времени, и их могут делать разные люди. Великий пример—пример Кеплера и Ньютона: закономерности в движении планет, наблюдавшиеся Кеплером, были объяснены законом тяготения, открытым Ньютоном. Нечто подобное может случиться в математическом исследовании, и вот изящный пример, требующий небольших предварительных знаний.

Обычная таблица четырехзначных десятичных логарифмов содержит 900 мантисс, а именно мантиссы целых чисел от 100 до 999. До наблюдения мы, возможно, склонны думать, что десять цифр 0, 1, ... , 9 встречаются в этих таблицах приблизительно одинаково часто, но это не так: в качестве первой цифры мантиссы они, несомненно, появляются не одинаково часто. Сосчитав мантиссы, имеющие одни и те же первые цифры, получим табл. I (проверьте ее!).

Таблица I. Мантиссы с одной и той же первой цифрой в четырехзначных логарифмах

Рассматривая второй столбец табл, I, мы можем заметить, что в нем любые два последовательных числа имеют приблизительно одинаковое отношение. Это побуждает нас вычислить эти отношения с несколькими десятичными знаками; они записаны в последнем столбце таблицы.

Почему эти отношения приблизительно равны? Попытайтесь за наблюдаемой приближенной закономерностью разглядеть какую-нибудь точную закономерность. Числа во втором столбце табл. I приблизительно являются членами геометрической прогрессии. Можете ли вы открыть точную геометрическую прогрессию, с которой просто связаны члены приближенной прогрессии? [Знаменатель точной прогрессии, возможно, должен быть какого-то рода средним отношений, записанных в последнем столбце табл, I.]

16. Классифицируйте наблюдаемые факты. Значительная часть работы натуралиста посвящена описанию и классификации объектов, которые он наблюдает. Такая работа была преобладающей в течение долгого времени после Линнея, когда главная деятельность натуралистов состояла в описании новых видов и родов растений и животных и в переклассификации известных видов и родов. Натуралисты описывают и классифицируют не только растения и животных, но и другие объекты, особенно минералы; классификация кристаллов основана на их симметрии. Хорошая классификация важна; она сводит разнообразие объектов наблюдения к относительно небольшому числу ясно характеризуемых и хорошо упорядоченных типов. Математик не часто имеет возможность позволить себе удовольствие описания и классификации, но это может случиться.

Если вы знакомы с несколькими простыми понятиями плоской геометрии (ось симметрии, центр симметрии), то вы можете позабавиться узорами. Рис. 5.2 показывает четырнадцать узорных полос, каждая из которых

Рис. 5.2. Симметрия фризов.

порождается простой фигурой, периодически повторяемой вдоль (горизонтальной) прямой. Назовем такую полосу «фризом». Подберите для каждого фриза на левой стороне (помеченного числом) фриз на правой стороне (помеченный буквой) так, чтобы два подобранных фриза имели один и тот же тип симметрии. Кроме того, исследуйте узорные полосы, которые вы можете найти на всех видах объектов или в старых архитектурных работах, и попытайтесь подобрать для каждой фриз па рис. 5.2. Наконец, дайте полный список различных типов симметрии, которые могут иметь фризы, н исчерпывающее описание каждого типа симметрии. [Рассматривайте фриз как бесконечно длинный в обоих направлениях, а порождающую фигуру как периодически повторяющуюся бесконечное число раз. Заметьте, что термин «тип симметрии» не был формально определен. Прийти к подходящей интерпретации этого термина—важная часть вашей задачи.]

17. Найдите на рис. 5.3 два узора, имеющие один и тот же тип симметрии. Каждый узор следует себе представлять как покрывающий всю плоскость своими повторяющимися кусками.

Рис. 5.3. Симметрия обоев.

18. В чем различие? Двадцать шесть заглавных букв латинского алфавита следующим образом подразделены на пять групп:

Чем они отличаются? Каково могло бы быть простое основание для предлагаемой классификации? [Посмотрите на пять уравнений:

Чем они отличаются?]

VI. ОДНО БОЛЕЕ ОБЩЕЕ УТВЕРЖДЕНИЕ

Он [Эйлер] предпочитал обучение своих учеников тому небольшому удовлетворению, которое он получил бы, изумляя их Он думал, что недостаточно сделал бы для науки, если бы не прибавил к открытиям, которыми он обогатил науку, чистосердечного изложения идей, приведших его к этим открытиям. — Кондорсэ

1. Эйлер. Из всех математиков, с работами которых я сколько-нибудь знаком, Эйлер, по-видимому, для рассматриваемого нами вопроса является наиболее важным. Мастер индуктивного исследования в математике, он сделал важные открытия (о бесконечных рядах, в теории чисел и в других областях математики) с помощью индукции, т. е. с помощью наблюдения, дерзкой догадки и проницательных подтверждений. Однако Эйлер в этом отношении не является единственным; другие математики, большие и малые, в своей работе широко пользуются индукцией.

Все же в одном отношении Эйлер кажется мне почти единственным: он старается изложить относящиеся к вопросу индуктивные доводы заботливо, в деталях, в хорошем порядке. Он излагает их убедительно, но честно, как это подобает настоящему ученому. Его изложение является «чистосердечным изложением идей, приведших его к этим открытиям», и имеет особую прелесть. Вполне естественно, что, как и любой другой автор, он пытается убедить своих читателей, но, как действительно хороший автор, он пытается убедить их только тем, в чем по-настоящему убежден сам.

Следующий параграф дает пример того, как писал Эйлер. Выбранный мемуар требует лишь небольших предварительных знаний и целиком посвящен изложению индуктивного рассуждения.

2. Мемуар Эйлера приведен здесь в переводе in extenso1), если исключить небольшое число несущественных изменений, которые должны сделать его более доступным современному читателю2).

1) В полном объеме. —Прим. перге.

2) Оригинал на французском языке; см. Euler, Opera Omnia, ser. 1, vol. 2, p. 241—253. Изменения состоят в перемене обозначения (примечание на стр. 112), в другом устройстве таблицы (объясненном в примечании на стр. 113), в незначительных изменениях, относящихся к нескольким формулам, и в том, что в последнем п. 13 статьи опущено повторение предшествующих рассуждений. Читатель может свериться с легкодоступным оригиналом.

ОТКРЫТИЕ НАИБОЛЕЕ НЕОБЫЧАЙНОГО ЗАКОНА ЧИСЕЛ, ОТНОСЯЩЕГОСЯ К СУММАМ ИХ ДЕЛИТЕЛЕЙ

1. До сих пор математики тщетно пытались обнаружить в последовательности простых чисел какой-либо порядок, и мы имеем все основания верить, что здесь существует какая-то тайна, в которую человеческий ум никогда не проникнет. Чтобы убедиться, следует только взглянуть на таблицу простых чисел, которую некоторые взяли на себя труд вычислить дальше чем до ста тысяч, и осознать, что здесь нет никакого порядка и никакого правила. Это тем более удивительно, что арифметика дает нам определенные правила, с помощью которых мы можем продолжать последовательность простых чисел сколь угодно далеко, не замечая, однако, ни малейшего следа порядка. Я сам, конечно, далек от этой цели, но мне удалось открыть чрезвычайно странный закон, управляющий последовательностью сумм делителей целых чисел, которая на первый взгляд кажется неправильной ровно в такой же степени, как и последовательность простых чисел, и которая в некотором смысле даже включает в себя эту последнюю. Этот закон, который я вскоре объясню, по моему мнению, тем более замечателен, что он имеет такую природу, что мы можем быть уверены в его справедливости, не давая ему безукоризненного доказательства. Тем не менее я представлю в его пользу такие доводы, которые можно рассматривать как почти равносильные строгому доказательству.

2. Простое число не имеет делителей, за исключением единицы и самого себя, и это отличает простые числа от других чисел. Там 7 есть простое число, потом, что оно делится только на 1 и на себя. Любое другое число, имеющее, кроме единицы и самого себя, другие делители, называется составным, как например число 15, которое, кроме 1 и 15, имеет делители 3 и 5. Следовательно, вообще, если число р простое, то оно будет делиться только на 1 и р; но если бы, р было составным, то оно имело бы, кроме 1 и р, другие делители. Поэтому в первом случае сумма его делителей будет равна 1+/?, но во втором она превышает 1+/?. Поскольку я собираюсь рассматривать суммы делителей различных чисел, для обозначения суммы делителей числа n я буду пользоваться1) символом о (ri). Так, о (12) обозначает сумму всех делителей числа 12, каковыми являются 1, 2, 3, 4, б и 12, следовательно, а (12) =28. Таким же образом можно видеть, что а(60)= 168 и а(100)=217. Однако, так как единица делится только на себя, а(1)= 1. Далее, 0 (нуль) делится на все числа. Поэтому и(0) должно было бы, собственно, быть бесконечно. (Однако я буду приписывать ему позднее конечные значения, различные в различных случаях, и это окажется полезным.)

1) Эйлер первым ввел символ для суммы делителей. Он пользовался символом \п, а не современным а (n), принятым в тексте.

3. Определив, как выше, значение символа а (я), мы ясно видим, что если р простое число, то о(р) = 1 +р. Вместе с тем а(1 ) = 1 (а не 1 + l)î отсюда мы видим, что из последовательности простых чисел 1 должна быть исключена; 1 есть начальное целое число, ни простое, ни составное. Если, однако, n составное, то о (ri) больше, чем 1 + n.

В этом случае мы легко можем найти g (ri) но множителям п. Если a, by с, dy ... — различные простые числа, то легко видим, что

и так далее. Нам нужны специальные правила для степеней простых чисел, как

и вообще

Пользуясь этим, мы можем найти сумму делителей любого числа, составленного каким бы то ни было способом. Это мы видим из формул

и вообще

Например, чтобы найти а (360), полагаем, так как 360 разлагается на множители 23-32-5:

4. Чтобы показать последовательность сумм делителей, я приг вожу следующую таблицу1), содержащую суммы делителей всех целых чисел от 1 до 99.

1) Число, стоящее в пересечении строки с отметкой 60 и столбца с отметкой 7, т. е. 68, есть о (67). Если р простое, то о (р) напечатано жирным шрифтом. Таблица устроена несколько более сжато, чем в оригинале.

Посмотрев немного на последовательность этих чисел, мы едва ли не придем в отчаяние. Нет надежды обнаружить хоть малейший порядок. Неправильность простых чисел так глубоко вплетена в нее, что мы должны считать невозможным распутать некий закон, управляющий этой последовательностью, если мы не знаем закона, управляющего последовательностью самих простых чисел. Могло бы даже показаться, что последовательность, находящаяся перед нами, еще более таинственна, чем последовательность простых чисел.

5. Тем не менее я заметил, что эта последовательность подчиняется вполне определенному закону и может даже рассматриваться как рекуррентная последовательность. Это математическое выражение означает, что каждый член может быть по неизменному правилу вычислен по предыдущим членам. Действительно, если о (ri) обозначает любой член этой последовательности, а о (n — 1), о (n — 2), а (n — 3), а (n — 4), а (n — 5),... — предшествующие члены, то я утверждаю, что значение о (ri) всегда можно получить по нескольким предыдущим, как предписывается следующей формулой:

К этой формуле мы должны сделать следующие замечания:

I. Знаки + и — в правой части формулы попарно чередуются.

II. Закон чисел 1, 2, 5, 7, 12, 15, которые мы должны вычитать из рассматриваемого числа я, станет ясен, если мы возьмем их разности:

В самом деле, мы имеем здесь поочередно все целые числа 1, 2, 3, 4,

5, 6, ... и нечетные числа 3, 5, 7, 9, 11,..., и поэтому мы можем продолжать последовательность этих чисел сколь угодно далеко.

III. Хотя эта последовательность бесконечна, мы должны в каждом случае брать только те члены, для которых числа, стоящие под знаком а, еще положительны, и опускать а для отрицательных значений.

IV. Если в нашей формуле встретится символ а(0), то, поскольку его значение само по себе является неопределенным, мы должны подставить вместо а(0) рассматриваемое число n.

6. После этих замечаний нетрудно применить формулу к любому данному частному случаю, и таким образом всякий может убедиться в ее справедливости на стольких примерах, сколько он пожелает разобрать. И так как я должен признать, что не в состоянии дать ей строгое доказательство, я оправдаю ее достаточно большим числом примеров.

Я думаю, этих примеров достаточно, чтобы заставить любого отказаться от представления, что мое правило находится в согласии с истиной лишь по простой случайности.

7. Однако, так как в рассмотренных примерах участвуют только первые шесть из чисел 1, 2, 5, 7, 12, 15, 22, которые мы должны вычитать, кто-нибудь мог бы еще сомневаться, будет ли закон для этих чисел точно таким, как я указал. Таким образом, этот закон мог бы еще показаться недостаточно установленным, и поэтому я приведу несколько примеров с большими числами.

I. Дано число 101; найти сумму его делителей. Имеем

и отсюда мы могли бы заключить, если бы это не было известно раньше, что 101 есть простое число.

II. Дано число 301; найти сумму его делителей. Имеем

На этом примере видно, как мы можем, пользуясь разностями, продолжать формулу, насколько это необходимо в каждом случае. Производя вычисления, находим

Отсюда мы видим, что 301 не является простым числом. Действительно, 301 =7-43, и мы получаем

как и показало наше правило.

8. Примеры, которые я только что разобрал, безусловно рассеют любые сомнения, которые мы могли бы иметь в отношении справедливости моей формулы. Это прекрасное свойство чисел тем более удивительно, что мы не чувствуем никакой разумной связи между структурой моей формулы и природой делителей, с суммой которых мы имеем здесь дело. Последовательность чисел 1, 2, 5, 7, 12,

15,..., казалось бы, не имеет к рассматриваемому вопросу никакого отношения. Более того, поскольку закон этих чисел «прерывист» и они фактически являются смесью двух последовательностей с правильным законом: 1, 5, 12, 22, 35, 51,... и 2, 7, 15, 26, 40, 57, мы не могли ожидать, что такая неправильность может встретиться в Анализе. Отсутствие доказательства должно вызвать еще большее удивление, так как кажется совершенно невозможным, чтобы такое свойство удалось открыть, не руководствуясь каким-либо надежным методом, который мог бы заменить безукоризненное доказательство. Я признаюсь, что не чисто случайно наткнулся на это открытие, но что другое предложение проложило путь к этому прекрасному свойству—другое предложение той же природы, которое должно быть принято как верное, хотя я не в состоянии его доказать. И хотя мы здесь рассматриваем природу целых чисел, к которой Исчисление Бесконечно Малых кажется неприложимым, тем не менее я пришел к своему заключение с помощью дифференцирований и других уловок. Я желал бы, чтобы кто-нибудь другой нашел более короткий и более естественный путь, и, быть может, рассмотрение того пути, которому я следовал, могло бы оказать здесь некоторую помощь.

9. Рассматривая разбиения чисел, я много лет тому назад исследовал выражение

где произведение предполагается бесконечным. Чтобы увидеть, какого рода ряд получится в результате, я фактически перемножил большое число множителей и нашел

Последовательность показателей степени х совпадает с последовательностью чисел, входящей в приведенную выше формулу; знаки + и — попарно чередуются. Достаточно предпринять это перемножение и продолжить его сколь угодно далеко, чтобы убедиться в том, что этот ряд верен. Однако у меня нет для этого никаких других доводов, за исключением длинной индукции, которую я провел так далеко, что никоим образом не могу сомневаться в законе, управляющем образованием этих членов и их степеней. Я долго тщетно разыскивал строгое доказательство равенства между этим рядом и написанным выше бесконечным произведением (1 — х) (1 — х2) X Х(1— ^3)..., и я предложил этот же вопрос некоторым из моих друзей, способности которых в этом отношении мне известны, но все согласились со мной, что это преобразование произведения в ряд верно, хотя никто не сумел раскопать какой-нибудь ключ для доказательства. Таким образом, это познанная, но все же не доказанная истина, что если мы положим

то э1 а же величина s может быть выражена и следующим образом

Ибо каждый из нас может в этой истине убедиться, производя перемножение сколь угодно большого числа множителей, и кажется невозможным, чтобы закон, который, как было обнаружено, выполняется, например, для 20 членов, нельзя было бы наблюдать и для следующих членов.

10. Поскольку мы таким образом обнаружили, что эти два бесконечных выражения равны, хотя и оказалось невозможным это доказать, все заключения, которые могут быть из этого выведены, будут той же природы, т. е. будут верны, но не доказаны. Или если бы одно из этих заключений можно было доказать, то, наоборот, можно было бы получить ключ к доказательству этого равенства; и именно с таким намерением я различными способами манипулировал этими двумя выражениями и, таким путем, среди других открытий пришел к тому, которое я объяснил выше; его справедливость должна быть поэтому столь же несомненной, как и справедливость равенства между этими двумя бесконечными выражениями. Я поступил следующим образом. Пусть дано, что два выражения

равны. Я избавился от множителей в первом, взяв логарифмы:

Чтобы избавиться от логарифмов, я дифференцирую и получаю равенство

или

Из второго выражения для s в виде бесконечного ряда получаем другое значение той же самой величины:

11. Положим

Мы имеем выше два выражения для величины t. В первом выражении я разлагаю каждый член в геометрическую прогрессию и получаю

Мы легко здесь находим, что каждая степень х встречается столько раз, сколько ее показатель имеет делителей, и что каждый делитель появляется в качестве коэффициента при той же самой степени х. Следовательно, если мы соберем члены с одинаковыми степенями, то коэффициенты при каждой степени х будут суммой делителей показателя степени. И, следовательно, пользуясь введенным выше обозначением а (n) для суммы делителей числа п. я получаю

Закон ряда очевиден. И хотя может показаться, что в определении коэффициентов участвовала индукция, мы легко можем убедиться, что этот закон является неизбежным следствием.

12. В силу определения t последняя формула п. 10 может быть записана следующим образом:

Подставляя вместо t значение, полученное в конце п. 11, находим

Приводя подобные члены, находим коэффициент при любой данной степени x. Этот коэффициент состоит из нескольких членов. Сначала появляется сумма делителей показателя степени x, а затем суммы делителей некоторых меньших чисел, полученных из этого показателя степени вычитанием последовательно 1, 2, 5, 7, 12, 15, 22, 26, ... Наконец, если показатель степени принадлежит к этой последовательности, то появляется он сам. Нет необходимости еще раз

объяснять знаки, приписываемые только что перечисленным членам. Следовательно, вообще коэффициентом при xn будет

Это продолжается до того момента, пока числа под знаком а остаются неотрицательными. Однако, если появляется член а(0), мы должны подставить вместо него л.

13. Так как сумма бесконечного ряда, рассмотренного в предыдущем п. 12, равна 0, то каково бы ни было значение х9 коэффициент при каждой отдельной степени х должен обязательно быть равен 0. Отсюда мы получаем закон, который я объяснил выше в п. 5; я имею в виду закон, управляющий суммами делителей и дающий нам возможность рекуррентно их вычислять для всех чисел. В предыдущем выводе мы можем уловить некоторое основание для знаков, некоторое основание для последовательности чисел

1, 2, 5, 7, 12, 15, 22, 26, 35, 40, 51, 57, 70, 77,

и особенно основание для того, почему вместо а(0) мы должны подставлять само число п. что могло показаться наиболее странным свойством моего правила. Это рассуждение, хотя и все еще очень далекое от полного доказательства, безусловно не оставит никаких сомнений относительно необычайного закона, который я здесь объяснил.

3. Переход к более общей точке зрения. Приведенный текст Эйлера необычайно поучителен. Мы можем из него почерпнуть много важных сведений о математике, или о психологии изобретения, или об индуктивных рассуждениях. Примеры и примечания в конце этой главы дают возможность исследовать некоторые из математических идей Эйлера, но теперь мы хотим сосредоточить свое внимание на его индуктивном рассуждении.

Теорема, исследованная Эйлером, замечательна в нескольких отношениях и даже сегодня имеет большой математический интерес. Однако нас здесь интересует не столько математическое содержание этой теоремы, сколько доводы, заставившие Эйлера поверить в теорему, когда она все еще не была доказана. Чтобы лучше понять природу этих доводов, я не буду обращать внимания на математическое содержание мемуара Эйлера и дам только схематический очерк, делая ударение на некотором общем аспекте его индуктивного рассуждения.

Поскольку мы будем пренебрегать математическим содержанием различных теорем, которые мы должны рассмотреть, нам будет выгодно обозначить их буквами 7\ Г*, Cl9 C2>...,С*, С*,... Читатель может совершенно игнорировать значение этих букв. Но, если бы он пожелал отыскать их в тексте Эйлера, вот ключ:

Т есть теорема

Закон чисел 1, 2, 5, 7, 12, 15, ... объяснен в § 2, п. 5, II.

Cn есть утверждение, что коэффициенты при xn в обеих частях предыдущего равенства одинаковы. Например, C6 утверждает, что, разлагая произведение в левой части равенства, мы найдем, что коэффициент при X6 равен 0. Заметьте, что Cn есть следствие теоремы Т.

С% есть равенство

подробно объясненное в § 2, п. 5. Например, С£ утверждает, что

Т* есть «наиболее необычайный закон», утверждающий, что все Cf, С*, Сз, ... верны. Заметьте, что С% есть следствие (частный случай) теоремы 7*.

4. Схематический очерк мемуара Эйлера1). Теорема Т имеет такую природу, что мы можем быть уверены в ее справедливости, не давая ей безукоризненного доказательства. Тем не менее я представлю в ее пользу такие доводы, которые можно рассматривать как почти равносильные строгому доказательству.

Теорема Т включает в себя бесконечное число частных случаев Сь C2, C3,... Наоборот, бесконечное множество этих частных случаев Сь C2, C3, ... равносильно теореме Т. С помощью простого вычисления мы можем узнать, верно ли Сх или нет. Другое простое вычисление определяет, верно ли C2 или нет, и подобным owe образом для C3 и т. д. Я проделал эти вычисления и нашел, что все Съ C2, C3, ..., C40 верны. Достаточно предпринять эти вычисления и продолжить их сколь угодно далеко, чтобы убедиться в том, что эта последовательность, продолженная неограниченно, верна. Однако у меня нет для этого никаких других доводов, за исключением длинной индукции, которую я провел так далеко, что никоим образом не могу сомневаться в законе, для которого Ci, C2, ... являются частными случаями. Я долго тщетно разыскивал строгое доказательство теоремы Т и предложил этот же вопрос некоторым из моих друзей, способности которых в этом отношении мне известны, но все согласились со мной, что теорема Т верна, хотя никто не сумел раскопать какой-нибудь ключ для доказательства. Таким образом, это познанная, но все же не доказанная истина, ибо каждый из нас может в этой истине убедиться с помощью фактического вычисления сколь угодно большого числа

1) Этот очерк впервые был опубликован в моей статье «Heuristic Reasoning and the Theory of Probability», Amer. Math. Monthly, 48 (1941), 450—465. Курсив в очерке указывает фразы, не принадлежащие Эйлеру.

случаев Сг, C2> C3, и кажется невозможным, чтобы закон, который, как было обнаружено, выполняется, например, для 20 членов, нельзя было наблюдать и для следующих членов.

Поскольку мы таким образом обнаружили, что теорема Т верна, хотя и оказалось невозможным ее доказать, все заключения, которые могут быть из нее выведены, будут той же природы, т. е. будут верны, но не доказаны. Или если бы одно из этих заключений можно было доказать, то, наоборот, можно было бы получить ключ к доказательству теоремы Т; и именно с таким намерением я различными способами манипулировал теоремой Т и таким путем среди других открытий нашел теорему Т*, справедливость которой должна быть столь же несомненной, как и справедливость теоремы Т.

Теоремы Т и Т* равносильны; они обе верны или не верны; они вместе стоят или рушатся. Подобно Т, теорема Т* включает в себя бесконечное число частных случаев С*, С*, С*, и эта последовательность частных случаев равносильна теореме Г*. Здесь снова простое вычисление показывает, верно ли С* или нет. Подобным же образом можно определить, верно ли С£ ила нет и т. д. Нетрудно применить теорему 7* к любому данному частному случаю и таким образом всякий может убедиться в ее справедливости на стольких примерах, сколько он пожелает разобрать. И так как я должен допустить, что не в состоянии дать ей строгого доказательства, то я оправдаю ее достаточно большим числом примеров, С*, С*, Cfo- Я думаю, этих примеров достаточно, чтобы заставить любого отказаться от представления, что мое правило находится в согласии с истиной лишь по простой случайности.

Если кто-нибудь еще сомневается в том, что закон точно таков, как я указал, я приведу несколько примеров с большими числами. Путем проверки я нахожу, что С*01 и С*01 верны, и, таким образом, я нахожу, что теорема Т* справедлива даже для этих случаев, далеко отстоящих от тех, которые я проверил раньше. Эти примеры, которые я только что разобрал, безусловно рассеют любые сомнения, которые мы могли бы иметь в отношении справедливости теорем Т и Г*.

ПРИМЕРЫ И ПРИМЕЧАНИЯ К ГЛАВЕ VI

Открывая свой «наиболее необычайный закон чисел», Эйлер «пришел к своему заключению с помощью дифференцирований и других уловок», хотя «Исчисление Бесконечно Малых кажется неприложимым к природе целых чисел». Чтобы понять метод Эйлера, применим его к подобным же примерам. Начнем с того, что дадим название его главной «уловке», или математическому аппарату.

1. Производящие функции. Сформулируем результат п. 11 мемуара Эйлера в современных обозначениях:

В правой части равенства находится ряд по степеням х. Коэффициент при xn в этом степенном ряде есть о (л), сумма делителей числа п. Обе части равенства представляют одну и ту же функцию от х. Разложение этой функции по степеням х «производит» последовательность а(1), а (2), ... , а (я), ..., и потому мы называем эту функцию производящей функцией последовательности о (n). Вообще, если

то мы говорим, что f (х) есть производящая функция для an, или функция, производящая последовательность а0, alt а2, ... , аЛ, ... .

Название «проводящая функция» принадлежит Лапласу. Однако, не давая ему названия, Эйлер пользовался аппаратом производящих функций задолго до Лапласа в нескольких сочинениях, с одним из которых мы только что познакомились в § 2. Он применил этот математический аппарат к нескольким задачам комбинаторного анализа и теории чисел.

Производящая функция является устройством, отчасти напоминающим мешок. Вместо того чтобы нести отдельно много маленьких предметов, что могло бы оказаться затруднительным, мы кладем их в мешок, и тогда нам нужно нести лишь один предмет, мешок. Совершенно таким же образом, вместо того чтобы иметь дело с каждым членом последовательности а0, аг, а2, an, ... в отдельности, мы ставим их в степенной ряд У]апх* и тогда нам нужно иметь дело лишь с одним математическим объектом, степенным рядом.

2. Найдите производящую функцию для п. Или, что то же самое, найдите сумму ряда

3. Дано, что /(*) —производящая функция последовательности а0, а^, а2, ...> ап> ... ⋅ Найдите производящую функцию последовательности

4. Дано, что /(^ — производящая функция последовательности а0, alt а2> , ал, ... Найдите производящую функцию последовательности

5. Дано, что / (х) — производящая функция последовательности an. Найдите производящую функцию последовательности

6. Дано, что f (х) и g (х) — производящие функции соответственно для an и bn. Найдите производящую функцию для

7. Одна комбинаторная задача плоской геометрии. Выпуклый многоугольник с n сторонами разбивается я —3 диагоналями на n — 2 треугольника, см. рис. 6.1. Обозначим символом Dn число различных разбиений.

Найдите Dn для п~3, 4, 5, 6.

8 (продолжение). Нелегко на основании числовых значений, рассмотренных в примере 7, угадать общее явное выражение для DIV Однако последовательность D3, D4, D5, ... является «рекуррентной последовательностью» в следующем очень общем смысле: каждый ее член может быть вычислен по предыдущим членам но неизменному правилу, «рекуррентной формуле» (см. мемуар Эйлера, п. 5).

Положите по определению D2 = l и покажите, что для n ^ 3

[Проверьте первые случаи. Сошлитесь на рис. 6.2.].

9 (продолжение). Вывод явного выражения для Dn из рекуррентной формулы примера 8 не очевиден. Однако рассмотрите производящую функцию

Покажите, что g(x) удовлетворяет квадратному уравнению, и выведите отсюда, что для я = 3, 4, 5, 6, ...

10. Суммы квадратов. Вспомните определение символа Rk (n) (пример 4.1), продолжите его на случай n = 0, полагая R^ (0) = 1 (разумное продолжение),

введите производящую функцию

и покажите, что

[Что такое R3(n)? Число решений уравнения

в целых числах «, v и до, положительных, отрицательных или равных 0. Какую роль может сыграть ряд в правой части равенства, которое требуется доказать?

Как вы представили бы правую часть равенства, которое вы собираетесь доказать? Быть может, так:

11. Обобщите результат примера 10.

Рис. 6.1. Три типа разбиения шестиугольника.

Рис. 6.2. Начало разбиения многоугольника с n сторонами.

12. Вспомните определение символа Sk (ri) (пример 4.1) и выразите производящую функцию

13. Пользуясь примером 11, докажите, что R2 (ri) делится на 4, R4 (ri) — на 8 и Rs(n) — на 16 для п^1. (Этот результат был уже использован в гл. IV, табл. II и III.)

14. Пользуясь примером 12, докажите, что

S2(ri) = 0, если n не является числом вида 8m+ 2, 54(л) = 0, если n не является числом вида 8m + 4, Ss(n) = Q, если n не является числом вида 8m.

15. Пользуясь примером 11, докажите, что

16. Докажите, что

17. Предложите простой метод для составления табл. III гл. IV по табл. I и II той же главы.

18. Пусть Ok (n) обозначает сумму k-x степеней делителей числа п. Например,

(1) Покажите, что из предположений, найденных в § 4.6 и в примере 4.23, следует, что

где и обозначает нечетное число.

(2) Численно проверьте частные случаи соотношения, найденного в (1).

(3) Какое влияние такое подтверждение оказывает на вашу веру в предположения, из которых было выведено подтвердившееся соотношение?

19. Другая рекуррентная формула. Рассмотрим производящие функции

Положим

где и — нечетное число. Тогда в силу примеров 14 и 12

Из последнего соотношения, беря логарифмы и дифференцируя, выводим, что

Сравнивая коэффициенты при ж0, ж13. ж21, ... в обеих частях предыдущего равенства, после некоторых элементарных вычислений находим следующие соотношения:

Самое первое уравнение этой системы бессодержательно и написано здесь только для того, чтобы подчеркнуть общий закон. Однако мы знаем, что st = 1. Зная Sj, из следующего уравнения мы получаем s3. Зная s3, из следующего уравнения получаем s5. И так далее, из системы уравнений мы можем сколь угодно далеко вычислить члены последовательности slt s3, s5, один за другим, рекуррентно.

Эта система имеет замечательную структуру. Имеется 1 уравнение, содержащее 1 из величин S|, s3, s5, 2 уравнения, содержащих 2 из них, 3 уравнения, содержащих 3 из них, и т. д. Коэффициенты в каждом столбце, когда мы переходим от одной строки к следующей, возрастают на 1, а индексы на 2. Первым индексом в каждом столбце является 1, а коэффициентом — 4, умноженное на первый коэффициент этой строки.

Мы можем всю систему сосредоточить в одном уравнении (рекуррентной формуле); напишите ее.

20. Другой Наиболее Необычайный Закон Чисел, Относящийся к Суммам их Делителей. Если остается в силе предположение из § 4.6, то

и, таким образом, пример 19 дает рекуррентную формулу, связывающую члены последовательности о(1), а(3), о (5), а (7), которая во многих отношениях поразительно похожа на формулу Эйлера.

Подробно выпишите и произведите численную проверку первых случаев для указанной рекуррентной формулы.

21. Для нас между рекуррентной формулой Эйлера для о (n) (§2) и вышеупомянутой рекуррентной формулой для о (2n — 1) (пример 20) существует лишь эвристическое сходство. Для нас эта последняя является предположением. Мы вывели это предположение, как Эйлер вывел свое, «с помощью дифференцирований и других уловок» из других предположений.

Покажите, что рекуррентная формула для о(2л—1), указанная в примере 20, равносильна равенству

к которому мы пришли в § 4.6, т. е. если одно из этих двух утверждений верно, то непременно верно и другое.

22. Обобщите пример 19.

23. Придумайте метод для вычисления R8(n) независимо от #4(«).

24. Как Эйлер упустил открытие. Метод, иллюстрированный примерами 19 и 23 и в общем виде высказанный в примере 22, принадлежит Эйлеру1). Придумывая этот метод, Эйлер имел целью задачу о четырех квадратах и некоторые связанные с ней задачи. В самом деле, он применил свой метод к задаче о четырех квадратах и индуктивно исследовал число представлений, но ему не удалось открыть замечательный закон, управляющий /?4 (я), который в конце концов не так уж трудно индуктивно обнаружить (примеры 4.10—4.15). Как это случилось?

Исследуя уравнение

мы можем выбрать различные точки зрения, в частности следующие:

(1) Допустить в качестве х, у, г и w только неотрицательные целые числа.

(2) Допустить в качестве х, у, г и w все целые числа, положительные, отрицательные и нуль.

Вторая точка зрения, быть может, менее очевидна, но приводит к R4 (п) и к замечательной связи между R4 (n) и делителями числа п. Первая точка зрения более очевидна, но число решений, по-видимому, не имеет никакого простого замечательного свойства. Эйлер выбрал точку зрения (1), а не точку зрения (2); он применил свой метод, объясненный в примере 22, к выражению

а не к выражению

и, таким образом, прошел мимо большого открытия. Поучительно сравнить два направления исследования, которые кажутся такими похожими вначале, но одно из которых удивительно плодотворно, а другое почти совершенно бесплодно.

Свойства /?4 (л). S4 (n), Rs (n) и S8 (n), исследованные в гл. IV (примеры 4.10—4.15, §§ 4.3—4.6, примеры 4.18—4.23), были открыты Якоби не индуктивно, но как случайные следствия его исследований об эллиптических функциях. С тех пор было найдено несколько доказательств этих теорем, но ни одно известное доказательство не является вполне элементарным и прямым2).

25. Обобщение теоремы Эйлера о о (n). Для данного k положите

и покажите, что для л=1, 2, 3, ...

Какой частный случай дает теорему Эйлера из § 2?

1) Opera Omnia, ser. 1, vol 4, p. 125—135.

2) См. также для дальнейших ссылок книгу Hardy G. H., Wright E. М., An Introduction to the Theory of Numbers, Oxford, 1938, ch XX.

VII. МАТЕМАТИЧЕСКАЯ ИНДУКЦИЯ

Метод Якова Бернулли имеет значение и для естествознания. Он учит нас, что свойство А. найденное при помощи неполной индукции в членах Ct. C2, C3, ... понятия В, можно только в том случае приписать самому этому понятию, если констатировано, что это свойство связано с признаками понятия В и от изменений его членов не зависит. Как во многих других случаях, математика и здесь является образцом для естествознания. — Эрнст Мах1)

1. Индуктивная фаза. Опять мы начинаем с примера. Совсем нетрудно найти сумму первых n целых чисел. Формулу

которую можно открыть и доказать многими способами, мы будем считать известной2). Труднее найти формулу для суммы n первых квадратов

Нетрудно вычислить эту сумму для малых значений п. но уловить правило нелегко. Вполне естественно, однако, попытаться обнаружить какого-то рода параллелизм между этими двумя суммами и рассмотреть их совместно:

1) Мах Э., Познание и заблуждение, М., 1909, стр. 316. [Смысл этой довольно туманной фразы (под «членом понятия» здесь, очевидно, имеется в виду элемент его объема) автор пытается объяснить в тексте главы. Нам, однако, представляется, что, собственно, к математической индукции она имеет малое отношение; ведь с помощью метода математической индукции доказываются не свойства понятия числа, а свойства чисел. Так, если В есть понятие натурального числа, а Съ C2 ... , Cn ... — натуральные числа 1,2,..., л, .... то в доказательствах с помощью математической индукции доказывается не А (В) (где А (В) означает, что В обладает свойством A), а истинность А (n) для всякого n — Прим. ред.]

2) См. «Как решать задачу», стр. 95.

Как связаны две последние строки? Нам может прийти в голову идея исследовать их отношение:

Здесь правило очевидно, и, если отношения из второй строки записать следующим образом:

его почти невозможно не заметить. Едва ли мы сможем удержаться и не сформулировать предположение, что

Пользуясь значением знаменателя в левой части, которое мы считаем известным, можем высказать наше предположение в форме

Верно ли это? То есть всегда ли это верно? Формула, конечно, верна в частных случаях n=1, 2, 3, 4, 5, 6, из которых она возникла. Верна ли она и в следующем случае n = 7? Предположение приводит нас к предсказанию, что

и, действительно, обе части оказываются равными 140.

Мы могли бы, конечно, перейти к следующему случаю n = 8 и проверить его, но соблазн не так уж велик. Так или иначе, мы склонны верить, что формула подтвердится и в следующем случае, и, таким образом, это подтверждение увеличило бы нашу уверенность, но мало, так мало, что едва ли стоит тратить время на вычисления. Как мы могли бы испытать наше предположение с большим эффектом?

Если предположение верно при любом п. то оно должно было бы не зависеть от изменения случаев, оно должно сохраняться при переходе от одного случая к другому. Предположительно,

Однако, если эта формула верна при любом п. то она должна быть справедлива и для следующего п: мы должны иметь

Вот возможность серьезно проверить предположение: вычитая почленно из нижней строки верхнюю, получаем

Верно ли это следствие из нашего предположения? Небольшое преобразование правой части дает

Рассматриваемое следствие неоспоримо верно, предположение прошло суровое испытание.

2. Фаза доказательства. Подтверждение любого следствия увеличивает нашу веру в предположение, но подтверждение только что рассмотренного следствия может сделать больше: оно может предположение доказать. Нужно лишь немного изменить нашу точку зрения и переставить наши замечания.

Предположительно верно, что

Неоспоримо верно, что

Следовательно, верно, что

(мы сложили два предыдущих неравенства). Это означает: Если наше предположение верно для некоторого целого числа п. то оно непременно остается верно для следующего целого числа n+1.

Однако мы знаем, что предположение верно для n=1, 2, 3, 4, 5, 6, 7. Будучи верным для 7, оно должно быть верным и для следующего числа 8; будучи верным для 8, оно должно быть верно и для 9; так как оно верно для 9, оно верно и для 10, а значит, и для 11 и т. д. Предположение верно для всех целых чисел; нам удалось доказать его в полной общности.

3. Исследование переходов. Последнее рассуждение предыдущего параграфа может быть немного упрощено. О предположении достаточно знать две вещи:

Оно верно для л=1.

Если оно верно для п. то оно также верно и для n + 1.

Тогда предположение верно для всех целых чисел: верно для 1, следовательно, и для 2; верно для 2, следовательно, и для 3 и т. д.

Мы здесь имеем фундаментально важный прием доказательства. Мы могли бы назвать его «переходом от n к n+1», но обычно его называют «математической индукцией». Этот обычный термин является очень неподходящим названием для приема доказательства, так как индукция (в смысле, в котором этот термин чаще всего употребляется) дает только правдоподобное, а не доказательное умозаключение.

Имеет ли математическая индукция какое-нибудь отношение к индукции? Да, имеет, и мы рассматриваем ее здесь по этой причине, а не только из-за ее названия.

В приведенном нами примере доказательное рассуждение § 2 естественно завершает индуктивное рассуждение § 1, и это типично. Доказательство § 2 выступает как «математическое дополнение к индукции», и если слова «математическая индукция» мы возьмем в этом смысле в качестве сокращения, то этот термин в конечном счете может оказаться вполне подходящим. (Возьмем их поэтому в этом смысле, не расходясь с установившейся математической терминологией.) Математическая индукция часто возникает как заключительный шаг или последняя фаза индуктивного исследования, и в этой последней фазе часто используются наводящие соображения, возникшие в предыдущих фазах.

На другой и еще лучший повод для рассмотрения в настоящем кон тексте математической индукции намекает приведенная в начале этой главы выдержка из книги Эрнста Маха1). Исследуя предположение, мы рассматриваем различные случаи, к которым это предположение должно быть применимо. Мы хотим увидеть, является ли соотношение, утверждаемое предположением, устойчивым, т. е. независимым от изменения случаев, не нарушаемым таким изменением. Наше внимание, таким образом, естественно, обращается к переходу от одного такого случая к другому. «Что посредством центростремительной силы планеты могут удерживаться на некоторых орбитах,

1) Мах был уверен, что метод математической индукции изобрел Яков Бернулли, но, по-видимому, наибольший вклад в его изобретение принадлежит Паскалю. Ср. Freudenthal H., Archives internationales d'histoire des sciences, no. 22 (1953), p. 17—37. Ср. также Jacobi Bernoulli Basileensis Opera, vol. 1, Genèva, 1744, p. 282—283. [В истории открытия метода математической индукции, на мой взгляд, недостаточное место уделяется Декарту. Суть его знаменитого правила энумерации ведь и состояла в том, что для изучения необозримого множества случаев их необходимо расположить «как бы по ступеням» (упорядочить по типу натурального ряда чисел), изучить свойства объекта, находящегося на первой ступени, и способ перехода от одной ступени к следующей. Так именно Декарт и считал возможным изучить общие свойства алгебраических кривых. — Прим. ред.]

мы можем легко понять, если рассмотрим движение брошенных тел», сказал Ньютон, и затем он вообразил камень, который бросают со все большей и большей начальной скоростью до тех пор, пока его траектория не обойдет вокруг Земли, как траектория Луны; см. пример 2.18(4). Итак, Ньютон ясно себе представляет непрерывный переход от движения брошенного тела к движению планеты. Он рассматривает переход между двумя случаями, к которым закон всемирного тяготения, доказательство которого он предпринял, должен быть одинаково применим. Любой начинающий, пользующийся математической индукцией для доказательства какой-нибудь элементарной теоремы, поступает в этом отношении подобно Ньютону: он рассматривает переход от л к л+1, переход между двумя случаями, к которым доказываемая теорема должна быть одинаково применима1).

4. Техника математической индукции. Для того чтобы быть хорошим математиком, или хорошим игроком в карты, или хорошим специалистом в любой области, вы должны уметь хорошо догадываться. Для того чтобы уметь хорошо догадываться, вы должны, я бы полагал, прежде всего иметь природные способности. Однако иметь природные способности недостаточно. Вы должны исследовать ваши догадки, сравнивать их с фактами, видоизменять их, если необходимо, и, таким образом, приобрести широкий (и глубокий) опыт в догадках, которые не оправдались, и в догадках, которые сбылись. С таким опытом в своем подсознании вы, возможно, сумеете

1) Роль перехода от ai к n+1 в доказательствах с помощью математической индукции вряд ли действительно выясняется простою ссылкою на необходимость изучать инварианты изменения.

Здесь, скорее, следовало бы отметить, что с помощью математической индукции доказательство общего предложения о свойстве всех натуральных чисел сводится (после того как уже проверено, что единица обладает этим свойством) к доказательству другого, общего же, но обычно более легкого для доказательства предложения о «наследуемости» рассматриваемого свойства в ряду натуральных чисел (переход от n к n+1). Если доказательству подлежит категорическое утверждение, что «всякое число n обладает свойством —запишем это в виде (n)S(n) («для всякого n верно, что n обладает свойством S»), —то таким образом мы сводим доказательство его к: (а) доказательству условного предложения: «для всякого n верно, что если n обладает свойством S, то и n+1 также обладает свойством S» [(я)(5(л)→ -» S(n+1))], и (б) доказательству частного предложения: «единица обладает свойством S» (5(1)]. Заметим, что если каждое из двух высказываний А и В имеет одинаковые шансы оказаться истинным или оказаться ложным, то шансы каждого из них на ложность равны 1/2. Импликация же А → В может быть ложна только в случае, когда А истинно, а В ложно, т. е. ее шансы на ложность равны 1/4. Пользуясь терминологией автора, можно было бы сказать поэтому, что условное предложение: (ri)[S(ri)-$ S(ai+I)] более правдоподобно, чем категорическое: (ri) S (n). Несмотря на большую громоздкость выражения условного предложения, довольно естественно ожидать поэтому, что доказать его легче, чем показать категорическое. Важность общности этого условного предложения (требования, чтобы оно было верно для совершенно произвольного п. хорошо видна на примерах 17 и 18. — Прим. ред.

более основательно судить о том, какие догадки могут оказаться правильными, а какие нет.

Математическая индукция является приемом доказательства, часто полезным для подтверждения математических предположений, к которым мы пришли с помощью некоторого процесса индукции. Поэтому если мы хотим приобрести опыт в индуктивном математическом исследовании, то желательно некоторое знакомство с техникой математической индукции.

Настоящий параграф и нижеследующие примеры и примечания могут оказать небольшую помощь в овладении этой техникой.

(1) Индуктивная фаза. Начнем с примера, очень похожего на пример, разобранный в §§ 1 и 2. Мы хотим в какой-либо более короткой форме выразить следующую сумму, связанную с первыми n квадратами:

Вычислим эту сумму в первых нескольких случаях и составим таблицу результатов:

Возникает очевидная догадка:

На основании нашего опыта, приобретенного при решении предыдущей сходной задачи, мы сразу же испытаем наше предположение с наибольшим возможным эффектом: испытаем переход от n к n+1. Если наше предположение верно всегда, то оно должно быть верно и для n и для n+1:

Вычитая, получаем

Верно ли это следствие из нашего предположения? Преобразуем обе части, стараясь подвести их ближе одну к другой:

Простое алгебраическое преобразование показывает, что обе части последнего равенства действительно тождественны. Рассмотренное следствие неоспоримо верно.

(2) Фаза доказательства. Теперь переставим наши замечания, как в предыдущем примере, § 2.

Предположительно Неоспоримо

Следовательно,

Предположение, если допустить, что оно верно для п. оказалось верным и для n+1. Поскольку оно верно для /1=1, оно верно для любого n.

(3) Короче. Мы могли бы затратить немного меньше времени на индуктивную фазу нашего решения. Сделав предположение, мы могли подозревать, что его удастся доказать с помощью математической индукции. Затем, без какой бы го ни было проверки, мы могли бы попытаться непосредственно применить математическую индукцию следующим образом:

Предположительно

Следовательно,

Итак, нам удалось вывести для я+1 соотношение, предположенное нами для п. Это в точности то, что требовалось сделать, и, таким образом, мы доказали наше предположение.

В этом варианте решения меньше повторений, но, пожалуй, он является и несколько менее естественным, чем изложенный в (1) и (2).

(4) Еще короче. Мы можем увидеть решение почти с первого взгляда, если заметим, что

(Если мы знакомы с разложением рациональной функции на элементарные дроби, то к этой формуле мы приходим совершенно естественно.) Полагая п. 1, 2, 3, ..., n и складывая, получаем

То, что сейчас произошло, происходит не так уж редко. Теорема, доказанная с помощью математической индукции, часто может быть короче доказана каким-либо другим методом. К такому сокращению может даже привести тщательное исследование доказательства с помощью математической индукции.

(5) Другой пример. Рассмотрим два числа, а и b, удовлетворяющих неравенствам

Тогда, очевидно,

Естественное обобщение заставляет нас подозревать, что верно следующее утверждение: Если л ^ 2 и 0 < ах < 1, 0 <а2<. I, . 0<аЛ< 1, то

Докажем его, пользуясь математической индукцией. Мы видели, что это неравенство верно в первом случае, для которого, как утверждается, оно применимо,—для n = 2. Поэтому, допустив, что оно верно для я, где п^2, мы должны вывести его для я-1-1.

Предположительно

и мы знаем, что Следовательно,

Мы вывели для n+1 то, что предположили для п: доказательство закончено.

Отметим, что математической индукцией можно пользоваться и для доказательства предложений, которые применимы не к абсолютно

всем натуральным числам, а ко всем натуральным числам, начиная с некоторого. Например, только что доказанная теорема относится к значениям n ^2.

(6) Что такое п. Рассмотрим теперь одну теорему плоской геометрии.

Если выпуклый многоугольник Р содержится в многоугольнике Q, то периметр Р меньше, чем периметр Q.

То, что площадь внутреннего многоугольника Р меньше, чем площадь внешнего многоугольника Q, очевидно. Но сформулированная теорема совсем не так очевидна; без ограничения, что Р — выпуклый многоугольник, она была бы неверна.

Рис. 7.1 показывает существенную идею доказательства. Мы отрезаем от внешнего многоугольника Q заштрихованный кусок; остается новый многоугольник Q', часть Q, обладающий двумя свойствами.

Во-первых, Q' еще содержит выпуклый многоугольник Р, который, будучи выпуклым, целиком лежит по одну сторону от прямой AB', полученной в результате продолжения стороны AB многоугольника Р.

Во-вторых, периметр Q' короче, чем периметр Q. Действительно, периметр Q' отличается от периметра Q лишь постольку, поскольку первый содержит прямолинейный отрезок, соединяющий точки А' и В', а второй вместо него содержит ломаную линию, содержащую эти точки (на дальней стороне заштрихованного куска). Однако прямая линия есть кратчайшее расстояние между точками A' и В'.

Как мы перешли от Q к Q', так мы можем перейти от Q' к другому многоугольнику Q". Таким образом, мы получаем последовательность многоугольников Q, Q', Q", ... Каждый многоугольник

Рис. 7.1. От n к n+1.

содержится в предыдущем и имеет более короткий периметр, а последним многоугольником в этой последовательности будет Р. Следовательно, периметр Р короче, чем периметр Q.

Нам следует распознать природу предыдущего доказательства; в действительности оно является доказательством с помощью математической индукции. Но что такое п. По отношению к какой величине совершается индукция?

Это серьезный вопрос. Математическая индукция применяется в различных областях и иногда в очень трудных и запутанных вопросах. Пытаясь найти скрытое доказательство, мы можем встретиться с решающим вопросом: что должно играть роль п. По отношению к какой величине нам следует попытаться провести математическую индукцию?

В предыдущем доказательстве в качестве n целесообразно выбрать число тех сторон внутреннего выпуклого многоугольника, которые целиком не принадлежат к периметру внешнего многоугольника. Рис. 7.2 иллюстрирует случай л=1. Я предоставляю читателю выяснить, что целесообразно называть n на рис. 7.1.

ПРИМЕРЫ И ПРИМЕЧАНИЯ К ГЛАВЕ VII

1. Заметьте, что

Догадайтесь, к какому общему закону подводят эти примеры, выразите его в подходящих математических обозначениях и докажите.

2. Докажите выражающие Ln% Sn и в явном виде формулы, догадку о которых мы высказали соответственно в примерах 3.13, 3.14 и 3.20. [Примеры 3.11, 3.12.1

3. Найдите выражение для

и докажите его с помощью математической индукции. [Пример 1.4.]

4. Найдите выражение для

справедливое для п^2, и докажите его с помощью математической индукции.

5. Найдите выражение для

справедливое для /г> 1, и докажите его с помощью математической индукции.

Рис. 7.2. Случай n — 1.

6. Обобщите соотношение

и докажите ваше обобщение с помощью математической индукции.

7. Рассмотрим операцию, состоящую в переходе от последовательности

к последовательности с общим членом

Мы будем называть эту операцию (образование последовательности slf s2. s3,...) «суммированием последовательности alt а2, я3, ...». В этой терминологии мы можем следующим образом выразить уже замеченный (в примере 1.3) факт: Вы можете от последовательности всех натуральных чисел 1, 2, 3, 4, ... перейти к последовательности квадратов 1, 4, 9, 16, ... в два шага: (1) отбросить каждый второй член, (2) суммировать оставшуюся последовательность. В самом деле, взгляните на таблицу

Докажите это утверждение с помощью математической индукции.

8 (продолжение). Вы можете от последовательности всех натуральных чисел 1, 2, 3, 4, ... перейти к последовательности кубов 1, 8, 27, 64, ... в четыре шага: (1) отбросить каждый третий член, (2) суммировать оставшуюся последовательность, (3) отбросить каждый второй член, (4) суммировать оставшуюся последовательность. После того как исследуете таблицу

докажите это с помощью математической индукции.

9 (продолжение). Вы можете от последовательности всех натуральных чисел 1, 2, 3, 4, ... перейти к последовательности четвертых степеней 1, 16, 81, 256, ... в шесть шагов, которые видны из таблицы:

О чем говорят эти факты?

10. Замечая, что

приходим к общему утверждению

Доказывая это с помощью математической индукции, предпочтете ли вы переходить от n к n + 1 или же от к к +

11. В теннисном турнире имеется 2n участников. В первом круге турнира каждый участник играет ровно один раз, так что всего проводится n игр, в каждой из которых занято два игрока. Покажите, что пары для первого круга могут быть составлены точно

1-3-5-7. ..(2n-1)

различными способами.

12. Доказать больше иногда легче. Пусть

и определим последовательность /0 (х), fi(x)t /2 W» ... условием, что

для /г = 0. 1, 2, 3, ... (Такое определение называется рекуррентным: чтобы найти fn+1, мы должны возвратиться к fn.) Замечая, что

докажите с помощью математической индукции, что для л ^ 1 числитель fn (х) есть многочлен, свободный член которого равен 0, а другие коэффициенты—натуральные числа.

13 (продолжение). Найдите с помощью индукции и докажите с помощью математической индукции дальнейшие свойства функции fn (х).

14. Уравновесьте вашу теорему\ Типичное предложение A, доступное доказательству с помощью математической индукции, имеет бесконечное множество случаев Ль A2, A3, ... , АПУ ... Случай A1 часто является легким; как бы то ни было, Лх должен поддаваться определенным средствам. Раз A, установлен, нам нужно, предполагая АПУ доказать Ап+1. Предложение A', более сильное, чем A, иногда доказать легче, чем A1). Действительно, пусть A' состоит из случаев Л[, Л^, Л^, ... Переходя от A к A', мы делаем груз доказательства более тяжелым: вместо Лл+1 мы должны доказать более сильное А^1. Однако мы делаем и опору для доказательства более крепкой: вместо An мы можем пользоваться дающим больше информации А'п, Это иллюстрируется

1) Это «парадокс изобретателя»; см. «Как решать задачу», стр. 138.

решением примера 12. Однако мы сделали бы это решение бесполезно громоздким, включив материал, рассмотренный в примере 13, к которому удобнее подойти, как к следствию, с помощью дополнительных замечаний.

Вообще, когда вы пытаетесь придумать доказательство с помощью математической индукции, вам оно может не удаваться по двум противоположным причинам. Оно может вам не удаваться потому, что вы пытаетесь доказать слишком много: ваше A —слишком тяжелый груз. Оно может вам не удаваться и потому, что вы пытаететь доказать слишком мало: ваше Лп — слишком слабая опора. Вы должны уравновесить утверждение вашей теоремы так, чтобы опора была как раз достаточна для груза. И, таким образом, механизм доказательства приближает вас к более уравновешенному, более приспособленному взгляду на эти факты. Это можно считать типичным для роли доказательств в создании науки.

15. Перспектива. Более сложные задачи в более трудных областях требуют более усложненной техники математической индукции и ведут к различным видоизменениям этого важного метода доказательства. Некоторые из наиболее замечательных примеров дает теория групп. Интересным вариантом является «обратная математическая индукция», или «заключение от n к n—U; интересный элементарный пример см. в книге Харди Г. Г., Литтлвуд Дж. Е. и Полиа Г., Неравенства, М., 1948, стр. 30 и 33.

16. Дано, что Q,= 1 и

для n = 2, 3, ... Найдите общее выражение для Qn и докажите, что оно верно.

17. Равны ли любые n чисел? Вы сказали бы «Нет». Все же мы можем попытаться с помощью математической индукции доказать обратное. Более заманчиво, однако, доказать утверждение: «у любых n девушек глаза одинакового цвета».

Для n—1 утверждение, очевидно, верно (или «бессодержательно»). Остается перейти от n к n+1. Для определенности я перейду от 3 к 4, а общий случай оставлю вам. Позвольте представить вас четырем девушкам: Анне, Бэле, Вере и Галине, или, для краткости, A, £, В и Г. Предполагается (я = 3), что глаза девушек A, Б и В одинакового цвета. Точно так же, по предположению, и глаза девушек Б, В и Г одинакового цвета (я = 3). Следовательно, глаза всех четырех девушек A, Б, В и Г должны быть одинакового цвета; для полной ясности можно взглянуть на диаграмму

Это доказывает утверждение для я+1 = 4, а переход, например, от 4 к 5, очевидно, не более труден.

Объясните парадокс. Можете испытать экспериментальный подход, посмотрев в глаза нескольким девушкам.

18. Если параллельные прямые рассматривать как пересекающиеся (в бесконечности), то утверждение «любые n прямых на плоскости имеют общую точку» верно для n=\ («бессодержательно») и для n = 2 (благодаря нашей интерпретации). Постройте (парадоксальное) доказательство с помощью математической индукции.

VIII. МАКСИМУМЫ И МИНИМУМЫ

Так как здание всего мира совершенно и возведено премудрым Творцом, то в мире не происходит ничего, в чем не был бы виден смысл какого-нибудь максимума или минимума. — Эйлер1)

1. Схемы. Задачи относящиеся к наибольшим и наименьшим значениям, или задачи на максимум и минимум, пожалуй, более привлекательны, чем другие математические задачи сравнимой трудности, и это, быть может, имеет совсем простые причины. У каждого из нас есть свои личные задачи. Мы можем заметить, что эти задачи очень часто являются своего рода задачами на максимум или минимум. Мы хотим получить определенный предмет за наиболее низкую возможную цену, или наибольший возможный эффект при определенном усилии, или максимальную работу, произведенную за данное время, и, конечно, хотим как можно меньше рисковать. Математические задачи на максимум привлекают нас, я думаю, потому, что они идеализируют наши повседневные задачи.

Мы даже склонны воображать, что Природа действует как хотелось бы действовать нам, получая наибольший эффект с наименьшим усилием. Физикам удалось дать идеям этого рода ясные и полезные формы; они описывают некоторые физические явления в терминах «принципов минимума». Первый динамический принцип этого типа («принцип наименьшего действия», обычно именуемый принципом Мопертюи) был, в сущности, развит Эйлером; его слова, приведенные в начале этой главы, ярко описывают определенный взгляд на задачи о максимуме и минимуме, которые в его век могли привлекать многих ученых.

В следующей главе мы рассмотрим несколько задач на максимум и минимум, возникающих в элементарной физике. Настоящая глава подготовит нас к следующей.

Дифференциальное исчисление дает общий метод для решения задач на максимум и минимум. Мы здесь не будем пользоваться

1) См. Эйлер А., Метод нахождения кривых линий, обладающих свойствами максимума либо минимума или Решение изопериметрической задачи, М.-Л., 1934, стр. 447.

[Однако уже Вольтер возражал, что богу необязательно быть бережливым буржуа, он может хотеть и чтобы его считали щедрым аристократом, не жалеющим средств на усовершенствование мира. — Прим. ред.]

этим методом. Будет более поучительно развить вместо него несколько наших собственных «схем».

Решив задачу с настоящим пониманием и интересом, вы приобретаете драгоценное имущество: схему, модель, которой вы можете подражав при решении сходных задач. Вы развиваете эту схему, если, следуя ей, достигаете успеха, если размышляете над причинами вашего успеха, над аналогией решенных задач, над относящимися к делу обстоятельствами, которые делают вашу задачу доступной этого рода решению, и т. д. Развивая такую схему, вы можете в конце концов прийти к настоящему открытию. Во всяком случае, у вас есть возможность приобрести некоторые, находящиеся в хорошем порядке и легко доступные знания.

2. Пример. На плоскости даны две точки и прямая, причем обе точки лежат по одну сторону от прямой. На данной прямой найти точку, из которой отрезок, соединяющий две данные точки, виден под наибольшим возможным углом.

Это-задача, которую мы хотим решить. Начертим фигуру (рис. 8.1) и введем подходящие обозначения. Пусть А и В — две данные точки, / — данная прямая, X — переменная точка прямой /.

Рассмотрим ∠ АХВ, угол с вершиной в переменной точке X, стягиваемый данным отрезком AВ. Требуется найти такое положение точки X на данной прямой /, для которого этот угол достигает своего максимума.

Представьте себе, что /—прямая дорога. Если из некоторой точки дороги / вы хотите выстрелить в цель, простирающуюся от А до В, то вам следовало бы выбрать ту точку, которую мы разыскиваем: она дает нам наилучшую возможность попасть в цель. Если у вас более мирное намерение сделать с дороги снимок фасада, углы которого находятся в А и В, то вы должны были бы снова выбрать ту точку, которую мы разыскиваем; она даст вам наиболее широкое поле зрения.

Рис. 8.1. Отыскание наилучшего вида

Рис. 8.2. Изменение угла может выглядеть приблизительно так.

Решение нашей задачи не совсем непосредственно. Но, даже если мы не знаем, где достигается максимум, мы не сомневаемся в том, что он где-нибудь достигается. Почему это так правдоподобно?

Мы сумеем объяснить это правдоподобие, если ясно представим себе изменение угла, максимум которого мы пытаемся найти. Вообразим, что мы идем по прямой / и смотрим на отрезок AВ. Начнем с точки, в которой прямая / и прямая, проходящая через А и В, пересекаются, и пойдем вправо. Вначале угол, под которым виден отрезок AB, равен нулю; затем угол возрастает; однако в конце концов, когда мы будем находиться очень далеко от AB, он снова должен убывать, так как он обращается в нуль на бесконечном расстоянии1). Между двумя крайними случаями, в которых угол равен нулю, он должен где-нибудь стать максимальным. Но где?

На этот вопрос нелегко ответить, хотя мы могли бы указать большие отрезки прямой /, где максимум, вероятно, не достигается. Выберем любую точку на нашей прямой и обозначим ее через Х. Очень вероятно, что эта точка, выбранная наугад, не находится в положении максимума, которое мы пытаемся найти. Как мы могли бы с полной ясностью решить, находится ли она в положении максимума или нет?

Довольно легко заметить одно обстоятельство2). Если точка не находится в положении максимума, то должна существовать другая точка, по другую сторону от положения максимума, в которой рассматриваемый угол имеет то же самое значение. Существует ли на прямой / какая-нибудь другая точка X', из которой отрезок AB виден под тем же углом, как и из точки X? Вот, наконец, вопрос, на который мы легко можем ответить. В силу известного свойства углов, вписанных в окружность (Евклид, III, 21), и X и X' (если точка X' существует) должны находиться на одной и той же окружности, проходящей через точки А к В.

А теперь может возникнуть идея. Проведем несколько окружностей, проходящих через данные точки А и В. Если такая окружность пересекает прямую / в двух точках, как например X и X' на рис. 8.3, то отрезок AB виден из обеих точек X и X' под одним

Рис. 8.3. Касательная линия уровня.

1) Если мы рассмотрим L АХВ как функцию расстояния, измеряемого вдоль прямой /, то сможем обычным способом нарисовать ее график (изобразить его в прямоугольных координатах). Рис. 8.2 дает качественный набросок графика; ^ АХВ изображается ординатой ХУ'.

2) Очень легко, если мы посмотрим на рис. 8.2.

и тем же углом, но этот угол не является наибольшим возможным углом: окружность, пересекающая / между X и X', дает больший угол. Пересекающие окружности не могут дать наибольшего угла: вершина максимального угла есть точка, в которой окружность, проходящая через А и В, касается прямой / (точка M на рис. 8.3).

3. Схема касательной линии уровня. Снова просмотрим только что найденное решение. Чему мы можем на нем научиться? Что в нем существенно? Какие черты допускают подходящее обобщение?

Шаг, который после некоторого размышления кажется наиболее существенным, не слишком бросается в глаза. Я думаю, что решающим шагом явилось расширение нашей точки зрения, выход из прямой /, рассмотрение значений величины, максимум которой мы разыскиваем (угла, стягиваемого отрезком AB) в точках плоскости, лежащих вне /. Мы рассмотрели изменение этого угла, когда его вершина движется по плоскости, рассмотрели зависимость этого угла от положения его вершины. Короче, мы представили себе этот угол как функцию переменной точки (его вершины) и стали считать эту точку (вершину), изменяющейся на плоскости.

Угол остается постоянным, когда его вершина движется по дуге окружности, соединяющей точки А и В. Назовем такую дугу окружности линией уровня. Это выражение подчеркивает общую точку зрения, к которой мы собираемся прийти. Линии, вдоль которых функция от переменной точки остается постоянной, обычно называются линиями уровня этой функции.

Однако не забудем, что в нашей задаче нужно было определить. Нам требовалось найти максимум угла (этой функции от переменной точки), когда его вершина (переменная точка) не может свободно двигаться по плоскости, а ограничена предписанным путем, прямой /. В какой точке предписанного пути достигается максимум?

Мы уже знаем ответ, но постараемся лучше его понять, посмотрим на него с более общей точки зрения. Рассмотрим аналогичный, довольно общий и очень много говорящий нашей интуиции пример.

Вы знаете, что представляют собою на карте или на местности (мы будем иметь в виду холмистую страну), которую изображает эта карта, «линии уровня», или «контурные линии». Они являются линиями постоянной высоты; линия уровня связывает те точки на карте, которые изображают точки земной поверхности, находящиеся на одинаковой высоте над уровнем моря. Если вы вообразите, что море поднялось на 100 метров, то при новом уровне моря появится новая береговая линия с заливами, вторгшимися в долины. Эта новая береговая линия есть линия уровня высоты 100. Картограф наносит на карту только несколько линий уровня с постоянными интервалами, например с высотой 100, 200, 300,...; однако существует линия уровня для каждой высоты, так что через каждую точку местности проходит некоторая линия уровня. Высота над уровнем

моря есть функция от переменной точки, вот что важно для картографа или для вас, когда вы передвигаетесь по местности; эта функция остается постоянной вдоль каждой линии уровня.

Вот теперь задача, аналогичная нашей только что рассмотренной (в § 2) задаче. Вы идете по дороге, по предписанному пути. В какой точке дороги вы достигнете максимальной высоты над уровнем моря?

Очень легко сказать, где вы ее не достигнете. Точка, которую вы проходите поднимаясь или спускаясь, конечно, не является ни точкой максимальной высоты, ни точкой минимальной высоты. В такой точке ваша дорога пересекает линию уровня: максимум (или минимум). НЕ может достигаться в точке, где предписанный путь пересекает линию уровня.

После этого существенного замечания возвратимся к нашему примеру (§ 2, рис. 8.1, 8.2, 8.3). Рассмотрим весь предписанный путь: часть прямой /, простирающуюся от точки ее пересечения с прямой, проходящей через А и В, на бесконечное расстояние (вправо). В каждой своей точке этот предписанный путь пересекает линию уровня (дугу окружности с концами в А и В), за исключением только одной точки, где он касается линии уровня (такой окружности). Если где-нибудь есть максимум, то он должен быть в этой точке: в точке максимума предписанный путь касается линии уровня.

Это —очень сильный намек на общую идею, скрывающуюся за нашим примером. Исследуем, однако, этот намек. Применим эту идею к простому аналогичному случаю и посмотрим, как она позволяет решить задачу. Вот легкий пример.

На данной прямой найти точку, находящуюся на наименьшем расстоянии от данной точки.

Введем подходящие обозначения:

A —данная точка,

а —данная прямая.

Подразумевается, что данная точка А не лежит на данной прямой а. Требуется найти кратчайшее расстояние от А до а.

Решение знает каждый. Вообразите, что вы плаваете в спокойном море; в этот момент вы находитесь в точке А; линия а отмечает совершенно прямой берег. Внезапно вы пугаетесь, вы хотите как можно быстрее достичь твердой земли. Где ближайшая точка берега? Вы это знаете без размышления. Это знала бы и собака. Собака или корова, брошенные в воду, без промедления начинают плыть по перпендикуляру от A к а.

Однако наша цель состоит не только в том, чтобы найти решение, но и в том, чтобы исследовать общую идею, позволяющую его найти. Величина, минимум которой мы хотим отыскать, есть расстояние от переменной точки до данной точки А. Это расстояние зависит от положения переменной точки. Линии уровня этого расстояния, очевидно, являются концентрическими окружностями с общим центром А. «Предписанный путь» есть данная прямая а. В точке,

где предписанный путь пересекает линию уровня, минимум не достигается. В действительности он достигается в (единственной) точке, в которой предписанный путь касается линии уровня (в точке M на рис. 8.4). Кратчайшее расстояние от точки А до прямой а есть радиус окружности с центром А, касающейся а, что мы и знали сначала. Всё же мы кое-чему научились. Общая идея кажется теперь более ясной, и сделать ее совершенно ясной можно предоставить читателю.

Отчетливо запомнив общие черты предыдущих задач, естественно постараться подыскать аналогичные задачи, к которым мы могли бы применить такую же схему решения. Раньше мы рассматривали переменную точку на плоскости и отыскивали минимум или максимум функции от такой точки на предписанном пути. Мы смогли бы, однако, рассматривать переменную точку в пространстве и отыскивать минимум или максимум функции на предписанной поверхности. На плоскости особую роль играли касательные линии уровня. Аналогия побуждает нас ожидать, что подобную роль в пространстве будут играть касательные поверхности уровня.

4. Примеры. Рассмотрим два примера, которые могут быть решены одним и тем же методом, но в остальном имеют очень мало общего.

(1) Найти наименьшее расстояние между двумя данными скрещивающимися прямыми.

Введем обозначения:

а и b — две данные скрещивающиеся прямые,

X— переменная точка на прямой а,

К—переменная точка на прямой b\ см. рис. 8.5. Требуется определить такое положение прямолинейного отрезка ХУ, при котором он является наиболее коротким.

Расстояние ХУ зависит от положений двух концов X и У отрезка ХУ, причем оба они являются переменными. Имеются две переменные точки, а не всего лишь одна, и в этом характерная трудность задачи. Если бы одна из этих двух точек была задана, фиксирована, постоянна, а изменялась только другая, то задача была

Рис. 8.4. Другая касательная линия уровня.

Рис. 8.5. Две скрещивающиеся прямые.

бы легкой. Фактически она даже не была бы новой; она совпала бы с только что решенной задачей (§ 3).

Фиксируем на время одну из первоначально переменных точек, скажем Y. Тогда отрезок ХУ будет расположен в плоскости, проходящей через фиксированную точку У и данную прямую а, и только один из его концов, X, будет переменным, пробегающим вдоль прямой а. Очевидно, длина отрезка ХУ будет минимальной, когда он станет перпендикулярным к а (в силу § 3, рис. 8.4).

Но мы могли бы поменять роли двух точек X и У. Фиксируем теперь для разнообразия X и сделаем переменной лишь точку Y. Очевидно, отрезок ХУ становится наиболее коротким, когда он перпендикулярен к b.

Положение минимума отрезка ХУ не зависит, однако, от нашей прихоти и от того, какую роль мы приписываем точкам X и У, и потому у нас возникает подозрение, что в этом положении отрезок перпендикулярен и к а и к b. Взглянем все же более внимательно на эту ситуацию.

В действительности предыдущее доказательство прямо показывает, где положение минимума не может находиться (и только косвенно, где оно должно было бы находиться). Я утверждаю, что положение, в котором отрезок ХУ не перпендикулярен к прямой а в точке X, не является положением минимума. В самом деле, я зафиксирую точку У и передвину точку X в другое положение так, чтобы ХУ стал перпендикулярен к а, и при этом я сделаю отрезок ХУ короче (в силу § 3). Это рассуждение, очевидно, в такой же мере, как к X, применимо и к К, и поэтому мы видим: длина отрезка ХУ не может быть минимальной, если этот отрезок не перпендикулярен и к а и к b. Если кратчайшее расстояние существует, то оно должно достигаться для общего перпендикуляра к двум данным прямым.

Мы не должны ничего брать на веру. На самом деле мы можем с первого взгляда видеть, что общий перпендикуляр действительно дает кратчайшее расстояние. Будем считать, что на рис. 8.5 плоскость чертежа параллельна обеим данным прямым а и b (а выше, b ниже). Любую точку или прямую в пространстве мы можем рассматривать как представленную на рис. 8.5 ее ортогональной проекцией. Истинная длина отрезка ХУ равна гипотенузе прямоугольною треугольника, один катет которого есть ортогональная проекция отрезка ХУ, изображенная на рис. 8.5, а второй катет есть кратчайшее расстояние между двумя параллельными плоскостями, одна из которых проходит через а, другая через b, причем обе они параллельны плоскости чертежа, к которой второй катет перпендикулярен. Поэтому чем короче проекция отрезка ХУ, изображенная на рис. 8.5, тем короче сам отрезок ХУ. Проекция отрезка ХУ сводится к точке, ее длина равна нулю, и, таким образом, длина ХУ минимальна в том и только в том случае, если отрезок ХУ перпендикулярен к плоскости чертежа и, значит, к обеим прямым а и b.

Итак, мы прямо подтвердили то, что ранее обнаружили с помощью другого метода.

(2) Найти максимум площади многоугольника, вписанного в данную окружность и имеющего данное число сторон.

Дана окружность. На этой окружности мы должны так выбрать n вершин U, W, Ху Y и Z многоугольника, чтобы площадь стала максимальной. В точности, как и в предыдущей задаче (1), главная трудность, по-видимому, состоит в том, что имеется много переменных (вершины U у ...у Wy Ху Y и Z). Нам следует, пожалуй, испробовать метод, работавший в предыдущей задаче. В чем суть этого метода?

Рассмотрим задачу как почти решенную. Представим себе, что мы уже получили искомое положение всех вершин, за исключением одной, скажем Х. Другие n — 1 точек, £/, ..., W, Y и Z, уже фиксированы, каждая в том положении, в котором она должна находиться, но нужно еще так выбрать X, чтобы площадь стала максимальной. Вся площадь, однако, состоит из двух частей: многоугольника U... WYZ с n — 1 фиксированной вершиной, который от X не зависит, и треугольника WXYt зависящего от Х. Сосредоточим свое внимание на этом треугольнике, площадь которого, когда вся площадь становится максимальной, также должна стать максимальной; см. рис. 8.6. Основание WY треугольника WXY фиксировано. Если вершина X движется по параллели к основанию WY, то площадь остается постоянной; такие параллели к WY являются линиями уровня. Выберем касательную линию уровня: касательную к окружности, параллельную основанию WY. Ее точка касания, очевидно, есть положение вершины X, обращающее площадь треугольника WXY в максимум. Когда X займет это положение, треугольник станет равнобедренным, WX=XY. Если площадь многоугольника максимальна, то две соседние стороны должны быть равны. Но то же самое рассуждение применимо и к любой паре соседних сторон: когда достигается максимум площади, все стороны должны быть равны, и, таким образом, вписанный многоугольник максимальной площади должен быть правильным.

5. Схема частного изменения. Сравнивая два примера, рассмотренные в предыдущем параграфе (§ 4), мы легко обнаруживаем некоторые общие черты и общую схему решения. В обеих задачах мы разыскивали экстремум (минимум или максимум) величины, зависящей от нескольких переменных элементов. В обоих решениях мы на время фиксировали все первоначально переменные элементы,

Рис. 8.6. Треугольник максимальной площади.

за исключением одного, и изучали эффект от изменения этого единственного элемента. Одновременное изменение всех переменных элементов, или полное изменение, не так легко обозреть. Нам удалось решить наши задачи, изучая частное изменение, когда изменяется только один элемент, а другие фиксированы. Вот принцип, лежащий в основе нашего образа действий: функция f нескольких переменных не может достигать максимума по отношению к совокупности всех своих переменных, если она не достигает максимума по отношению к каждой переменной в отдельности.

Это утверждение является весьма общим, хотя в одном отношении и излишне ограничительным: оно слишком тесно примыкает к предыдущим примерам, в которых в каждый данный момент времени мы изменяли лишь один элемент. Однако можно себе представить, что в других примерах может оказаться выгодным изменять одновременно ровно два элемента и фиксировать другие или, допустим, ровно три и т. д. В таких случаях еще естественно было бы говорить о «частном изменении». Общая идея выступает теперь довольно ясно, и после еще одного примера читатель самостоятельно сумеет довести ее до полной ясности.

Отрезок длины I делится на n частей. Найти максимум произведения длин этих n частей.

Пусть x1, x2у xn — длины этих n частей; x1, x2, xn — положительные числа с данной суммой:

Требуется сделать максимальным произведение х1х2...хп.

Исследуем сначала простейший частный случай: дана сумма хх+х2 двух положительных величин; найти максимум их произведения ххх2. Мы можем интерпретировать хг и х2 как соседние стороны прямоугольника и высказать задачу в следующей более привлекательной форме: дан периметр L прямоугольника; найти максимум его площади. В самом деле, сумма двух только что упомянутых сторон задана:

Сразу возникает догадка: площадь становится максимальной, когда прямоугольник превращается в квадрат. Эту догадку легко проверить. Каждая сторона квадрата с периметром L равна

Мы должны убедиться в том, что площадь квадрата больше, чем площадь прямоугольника, или, что то же самое, что их разность

положительна. Так ли это? Немного алгебры, и мы получаем

Эта формула показывает все с одного взгляда. Правая часть положительна, если хг не равно х2 и если прямоугольник не является квадратом.

Короче говоря, площадь прямоугольника с данным периметром становится максимальной, когда прямоугольник есть квадрат; произведение двух положительных величин с данной суммой становится максимальным, когда эти две величины равны.

Попытаемся воспользоваться частным случаем, решение которого только что найдено, как ступенью для решения общей задачи. Рассмотрим задачу как почти решенную. Представим себе, что мы уже получили искомые значения всех частей, за исключением первых двух, хг и х2. Таким образом, мы считаем хг и х2 переменными, а A'з, x4, xn постоянными. Сумма двух переменных частей

постоянна,

Далее, произведение всех частей

не может стать максимальным, если не станет максимальным и произведение хгх2 первых двух частей. Это, однако, требует, чтобы х1 = х2. Но нет причины, почему бы любая другая пара частей должна была бы вести себя иначе. Искомый максимум произведения не может достигаться, если все величины, имеющие данную сумму, не равны. Мы процитируем Колина Маклорена (1698—1746), которому принадлежит предыдущее рассуждение: «Если Линия AB разделена на любое Число Частей АС, CD, DE, ЕВ, то Произведение всех этих Частей, умноженных одна на другую, будет Максимальным, когда эти Части равны между собой».

Читатель может многому научиться, разбирая приведенное доказательство. Вполне ли оно удовлетворительно?

6. Теорема о среднем арифметическом и среднем геометрическом и ее первые следствия. Рассмотрим результат предыдущего параграфа: Пусть

тогда

если не выполняется условие х1 — х2 — х3 — ... = xn = 1/п. Исклю-

чая /, можем сформулировать этот результат в форме:

или

если не все положительные величины хъ хъ ..., xn равны; если же эти величины равны, то неравенство становится равенством. Левая часть написанного выше неравенства называется средним геометрическим, а правая — средним арифметическим величин хъ дг2, ..., xn. Только что сформулированную теорему иногда называют «теоремой о среднем арифметическом и среднем геометрическом», или, короче, «теоремой о средних».

Теорема о средних интересна и важна во многих отношениях. Стоит упомянуть, что она может быть высказана в двух различных формах:

Произведение n положительных величин с данной суммой становится максимальным, когда все эти величины равны.

Сумма n положительных величин с данным произведением становится минимальной, когда все эти величины равны.

В первой формулировке речь идет о максимуме, во второй — о соответствующем минимуме. Вывод предыдущего параграфа относится к первой формулировке. Систематически изменяя этот вывод, мы могли бы прийти ко второй формулировке. Проще, однако, заметить, что неравенство между средними одновременно дает обе формулировки: чтобы получить ту или другую, мы должны рассматривать как данную ту или другую часть неравенства. Мы можем называть эти две (по существу равносильные) формулировки сопряженными формулировками.

Теорема о средних позволяет решать многие геометрические задачи на максимум и минимум. Мы рассмотрим здесь только один пример (несколько других можно найти в конце этой главы).

Дана площадь поверхности ящика; найти максимум его объема.

Я пользуюсь словом «ящик» вместо слов «прямоугольный параллелепипед», потом, что слово «ящик» достаточно выразительно и значительно короче, чем официальный термин.

Решение легко предвидеть, и раз уж мы его предвидим, оно легко сводится к теореме о средних. Пусть

а, b, с —длины трех ребер ящика, выходящих из одной и той же вершины,

S—площадь поверхности,

V — объем.

Очевидно,

Замечая, что сумма трех величин ab, ас и be равна S/2, а их произведение равно V2, мы, естественно, вспоминаем теорему о средних, которая дает

если не выполняются равенства

или, что то же самое, Иначе говоря,

если ящик не является кубом, когда осуществляется равенство. Мы можем выразить результат в двух различных (хотя по существу эквивалентных) формах:

Из всех ящиков с данной площадью поверхности куб имеет наибольший объем.

Из всех ящиков с данным объемом куб имеет наименьшую площадь поверхности.

Как и выше, мы можем две эти формулировки называть сопряженными формулировками. Как и выше, в одной из двух сопряженных формулировок речь идет о максимуме, а в другой — о минимуме.

Приведенное приложение теоремы о средних обладает и своими достоинствами. Мы можем его рассматривать как схему и собирать случаи, к которым теорема о средних может быть подобным же образом применена.

ПРИМЕРЫ И ПРИМЕЧАНИЯ К ГЛАВЕ VIII

Первая часть

1. Наименьшие и наибольшие расстояния в плоской геометрии. Найдите наименьшее расстояние между (1) двумя точками, (2) точкой и прямой, (3) двумя параллельными прямыми.

Найдите наименьшее и наибольшее расстояния между (4) точкой и окружностью, (5) прямой и окружностью, (6) двумя окружностями.

Решение во всех случаях очевидно. Вспомните, по крайней мере в нескольких случаях, элементарное доказательство.

2. Наименьшие и наибольшие расстояния в пространственной геометрии. Найдите наименьшее расстояние между (1) двумя точками, (2) точкой и плоскостью, (3) двумя параллельными плоскостями, (4) точкой и прямой, (5) плоскостью и параллельной ей прямой, (6) двумя скрещивающимися прямыми.

Найдите наименьшее и наибольшее расстояния между (7) точкой и сферой, (8) плоскостью и сферой, (9) прямой и сферой, (10) двумя сферами.

3. Линии уровня на плоскости. Рассмотрите расстояние переменной точки от данной (1) точки, (2) прямой, (3) окружности. Каковы линии уровня?

4. Поверхности уро,вня в пространстве. Рассмотрите расстояние переменной точки от данной (1) точки, (2) плоскости, (3) прямой, (4) сферы. Каковы поверхности уровня?

5. Ответьте на вопросы примера 1, пользуясь линиями уровня.

6. Ответьте на вопросы примера 2, пользуясь поверхностями уровня.

7. Даны две стороны треугольника. Найдите максимум площади, пользуясь линиями уровня.

8. Даны сторона и периметр треугольника. Найдите максимум площади, пользуясь линиями уровня.

9. Дана площадь прямоугольника. Найдите минимум периметра, пользуясь линиями уровня. [Пусть (0, 0), (*, 0), (0, у), (х, у) — четыре вершины прямоугольника в прямоугольной системе координат; воспользуйтесь аналитической геометрией.)

10. Исследуйте следующее утверждение: «Кратчайшее расстояние от данной точки до данной кривой есть длина перпендикуляра, проведенного из данной точки к данной кривой».

11. Принцип пересекающей линии уровня. Рассмотрим функцию / переменной точки на плоскости, максимум и минимум функции / на предписанном пути и линию уровня функции b разделяющую две области плоскости; в одной из этих областей / принимает большие, а в другой —меньшие, чем на самой линии уровня, значения.

Если предписанный путь пересекает эту линию уровня, то в точке пересечения не достигается ни максимум, ни минимум функции /.

12. Контурная карта на рис. 8.7 изображает вершину В л перевал (или седловую точку с горизонтальной касательной плоскостью) 77. Путешествуя по такой стране, достигните ли вы непременно наиболее высокой точки своего пути в точке, где этот путь касается линии уровня?

13. Пусть А и В — две данные точки, а X — переменная точка на плоскости. Стягиваемый отрезком AB угол в точке X (L AXB)f который может принимать любое значение между 0° и 180° (включая границы), является функцией переменной точки X.

(1) Дайте полное описание линий уровня.

(2) Какая из двух различных линий уровня соответствует большему значению угла?

Рис. 8.7. Линии уровня на контурной карте.

Вы можете пользоваться рис. 8.1 и 8.3, но должны ясно понять, что теперь вы можете смотреть на отрезок AB с обеих сторон.

14. Рассмотрите рис. 8.1, 8.2, 8.3, возьмите L АХ В как в примере 13 и найдите его минимум на /. Соответствует ли результат принципу примера II?

15. Дан объем ящика (прямоугольного параллелепипеда). Пользуясь частным изменением, найдите минимум площади его поверхности.

16. Какой из всех треугольников с данным периметром имеет наибольшую площадь? [Пример 8.]

17. Какой из всех тетраэдров, вписанных в данную сферу, имеет наибольший объем? [Знаете ли вы какую-нибудь задачу, родственную этой?]

18. Даны длины а, b и с трех ребер тетраэдра, проведенных из одной и той же вершины. Найдите максимум объема тетраэдра. [Знаете ли вы какую-нибудь аналогичную задачу?]

19. Найдите кратчайшее расстояние между сферой и цилиндром. (Под цилиндром понимается бесконечный цилиндр вращения.)

20. Найдите кратчайшее расстояние между двумя цилиндрами со скрещивающимися осями.

21. Исследуйте утверждение: «Кратчайшее расстояние между двумя данными поверхностями есть длина общего перпендикуляра к обеим поверхностям»

22. Принцип частного изменения. Функция / (X, Y, Z, ...) нескольких переменных X, У\ Z, ... достигает своего максимума при Х = A, Y — B, Z = C, ... Тогда функция /(X, В, С, ...) одной переменной X достигает своего максимума при Х = A, и функция /(X, К, С, ...) двух переменных X и Y достигает своего максимума при Х= A, Y = B и т. д.

Функция нескольких переменных не может достигать максимума по отношению ко всем ее переменным в совокупности, если она не достигает максимума по отношению к любому подмножеству переменных.

23. Существование экстремума. И принцип линии уровня и принцип частного изменения обычно дают только «отрицательную информацию». Они прямо показывают, в каких точках рассматриваемая функция / не может достигать максимума, а мы должны отсюда заключить, где / может достигнуть максимума. То, что f где-нибудь должна достигать максимума, не может быть выведено из одних лишь этих принципов. Однако существование максимума иногда может быть выведено с помощью какого-нибудь видоизменения рассуждения. Кроме того, существование максимума часто может быть выведено из общих теорем о непрерывных функциях нескольких переменных1). Как бы то ни было, всякий раз, когда с интуитивной точки зрения существование максимума кажется очевидным, мы имеем достаточные основания надеяться, что для доказательства существования подойдет какой-нибудь специальный прием или какая-нибудь общая теорема.

24. Видоизменение схемы частного изменения: бесконечный процесс. Найдите максимум произведения xyz, если дано, что х+у+г=1.

Подразумевается, что х, у и г —положительные числа и что / задано. Эта задача является частным случаем задачи из § 5. Следуя методу, которым мы там воспользовались, зафиксируем одно из трех чисел х, у и г, а два других изменим так, чтобы они стали равными; при этом их произведение увеличится. Начнем с любой данной системы (xf yt z); производя указанное изменение, переходим к другой системе (xv уь zt); затем переходим к новой системе (*2, у2, z2), а от нее к (х3, у3, z3) и т. д Мы будем поочередно оставлять неизменным одно из наших трех чисел: сначала х, затем у, затем z, затем снова х, затем у, затем z, затем снова х и т. д. Итак, мы

1) Функция нескольких переменных, непрерывная на ограниченном замкнутом множестве, достигает своей верхней и нижней грани. Это обобщает теорему 2 в книге Харди Г. Х., Курс чистой математики, стр. 192.

полагаем

Каждый шаг не изменяет сумму, но увеличивает произведение:

Допустим, что уФ z и что х1 фгх. (Это не исключительный случай; в исключительном случае мы придем к нашему результату значительно легче.) Естественно ожидать, что, когда n возрастает, три числа xn, yn и zn будут все меньше и меньше отличаться одно от другого. Если мы сумеем доказать, что в конце концов

то немедленно сможем заключить, что

Мы получаем, таким образом, этот результат с большой затратой сил, но не предполагая заранее существования максимума.

Докажите, что

25. Другое видоизменение схемы частного изменения: конечный процесс. Вновь рассмотрим пример 24, но воспользуемся теперь более сложным видоизменением метода § 5.

Пусть /=-3/4; таким образом, А есть среднее арифметическое чисел х, у и г, и мы имеем

Может случиться, что x—y = z. Если же это не так, то одна из разностей в левой части нашего равенства должна быть отрицательной, а другая положительной. Выберем обозначения так, чтобы

Перейдем от системы (*, у, г) к системе (*', у\ г'), полагая

первую величину мы оставили неизменной. Тогда

и

так что

Может случиться, что х'=у*= z''. Если это не так, то перейдем от (х',у', z') к (х", у", z"), полагая

что дает

и снова (как мы знаем из § 5) произведение увеличивается, так что

Мы доказали желаемый результат без предположения о существовании максимума и без рассмотрения пределов.

С помощью подходящего расширения этого метода докажите теорему о средних (§ 6) в общем виде для n величин.

26. Графическое сравнение. Пусть Р — точка, лежащая внутри равностороннего треугольника с высотой /, а ху у и z — расстояния точки Р от трех сторон треугольника; см. рис. 8.8. Тогда

x+y + z = l.

(Почему?) Числа ху у и z являются треугольными координатами точки Р. Любую систему трех положительных чисел х, у и z с суммой / можно интерпретировать как треугольные координаты однозначно определенной точки внутри треугольника. Последовательность

(X, у, z), (*!, уи z,), (х2, у2, гз), ... ,

рассмотренная в примере 24, изображается на рис. 8.9 последовательностью точек. Отрезки, соединяющие соседние точки, поочередно параллельны различным сторонам треугольника: первой, второй, третьей, затем снова первой стороне и т. д.; каждый отрезок оканчивается на высоте треугольника. (Почему?) Процесс примера 25 изображается тремя точками и двумя отрезками. (Как?)

27. Пересмотрите рассуждение § 4 (2) и видоизмените его, взяв в качестве модели сначала пример 24, а затем пример 25.

28. Необходимое условие для того, чтобы функция /(*, у, z) имела в точке (а, b, с) максимальное или минимальное значение, состоит в том, что при х = а, у — b, 2-е частные производные

обращаются в нуль.

Обычное доказательство этой теоремы служит примером для одной из наших схем. Какой?

Рис. 8.8. Треугольные координаты.

Рис. 8.9. Последовательные шаги, приближающие центр.

29. Установите хорошо известное (выражающееся через частные производные) необходимое условие для максимального или минимального значения функции / (*, у) при краевом (или дополнительном) условии, что х и у связаны уравнением g(x, у)=0. Объясните связь со схемой касательной линии уровня.

30. Вновь исследуйте случаи, упомянутые в примере 12 в свете условия примера 29. Есть ли какое-нибудь противоречие?

31. Установите хорошо известное необходимое условие для максимального или минимального значения функции / (х, у, z) при краевом условии g(x, у* z) = 0. Объясните связь со схемой касательной поверхности уровня.

32. Установите хорошо известное необходимое условие для максимального или минимального значения функции / (*, у, z) при двух одновременно выполняющихся краевых условиях g(x, у, z) = 0 и h (х, у, z) = Q. Объясните связь со схемой касательной поверхности уровня.

Вторая часть

Употребляемые ниже терминология и обозначения объяснены в примере 33, который следует прочитать вначале.

33. Многоугольники и многогранники. Площадь и периметр. Объем и поверхность. Для многоугольников мы по большей части будем пользоваться следующими обозначениями:

A —площадь и L — длина периметра. Для многогранников мы примем: V — объем и S — площадь поверхности.

Мы будем рассматривать задачи на максимум и минимум, относящиеся к A и L или к V и S. Такие задачи были известны древним грекам1). Мы рассмотрим, главным образом, задачи, которыми занимались Симон Люилье и Якоб Штейнер2). При решении большинства нижеследующих задач окажутся полезными элементарные алгебраические неравенства, особенно теорема о средних (§ 6).

Эти задачи по большей части относятся только к простейшим многоугольникам (треугольникам и четырехугольникам) и к простейшим многогранникам (призмам и пирамидам). Нам нужно усвоить несколько менее обычных терминов.

Две пирамиды, расположенные по разные стороны от их общего основания, вместе образуют двойную пирамиду. Если основание имеет n сторон, то двойная пирамида имеет 2n граней, n + 2 вершины и Зп ребер. Основание не является гранью двойной пирамиды.

Если все боковые грани призмы перпендикулярны основанию, то мы называем эту призму прямой призмой.

Если основание пирамиды описано около круга и высота пересекается с основанием в центре этого круга, то мы называем эту пирамиду прямой пирамидой.

Если две пирамиды, образующие двойную пирамиду, являются прямыми пирамидами и симметричны относительно их общего основания, то мы называем эту двойную пирамиду прямой двойной пирамидой.

Если призма, пирамида или двойная пирамида не являются «прямыми», та мы называем их «наклонными». Среди пяти правильных многогранников имеется ровно одна призма, ровно одна пирамида и ровно одна двойная

1) Pappus, Collections, 5.

2) Simоn Lhui1ier, Poligonométrie et Abrégé d'Isopérimétrie élémentaire, Genève, 1789. Steiner J., Gesammelte Werke, Vol. 2, p. 177—308.

пирамида: соответственно куб, тетраэдр и октаэдр. Каждый из этих трех многогранников является «прямым» многогранником своего типа.

Мы будем также рассматривать цилиндры, конусы и двойные конусы; если нет оговорки о противном, предполагается, что их основания— круги.

34. Прямая призма с квадратным основанием. Из всех прямых призм с квадратным основанием, имеющих данный объем, наименьшую поверхность имеет куб.

Докажите этот частный случай уже доказанной теоремы (§ 6, пример 15), пользуясь теоремой о средних.

Вы можете соблазниться поступить следующим образом. Пусть 1/, S, х и у соответственно обозначают объем, площадь поверхности, сторону основания и высоту призмы. Тогда

Применяя теорему о средних, получаем

Но правая часть не имеет к V = x2y никакого отношения; такое неравенство бесполезно —теорема о средних кажется неприменимой.

Это было, однако, опрометчивое, неразумное, непрофессиональное применение этой теоремы. Сделайте еще одну попытку. [В чем состоит желаемое заключение?]

35. Прямой цилиндр. Заметьте, что из всех призм, рассмотренных в примере 34, только куб можно описать около шара, и докажите: Из всех прямых цилиндров, имеющих данный объем, наименьшую поверхность имеет цилиндр, описанный около шара. [В чем состоит желаемое заключение?]

36. Произвольная прямая призма. Даны объем прямой призмы и форма (но не размеры) ее основания. Когда площадь поверхности минимальна, какую ее долю составляет площадь основания? [Знаете ли вы какую-нибудь задачу, связанную с этой?]

37. Прямая двойная пирамида с квадратным основанием. Докажите: Из всех прямых двойных пирамид с квадратным основанием, имеющих данный объем, наименьшую поверхность имеет правильный октаэдр.

38. Прямой двойной конус. Заметьте, что вписанный шар касается каждой грани правильного октаэдра в ее центре, который делит высоту грани в отношении 1 :2, и докажите: Из всех прямых двойных конусов, имеющих данный объем, минимум поверхности достигается двойным конусом, образующие которого делятся точками касания со вписанным шаром в отношении 1:2.

39. Произвольная прямая двойная пирамида. Даны объем прямой двойной пирамиды и форма (но не размеры) ее основания. Когда площадь поверхности минимальна, какую ее долю составляет площадь основания?

40. Дана площадь треугольника. Найдите минимум его периметра. [Могли ли бы вы предсказать результат? Если вы хотите попытаться применить теорему о средних, то вам может понадобиться выражение площади через стороны.]

41. Дана площадь четырехугольника. Найдите минимум его периметра. [Могли ли бы вы предсказать результат? Обозначьте буквами а, b, с и d стороны четырехугольника, буквой е сумму двух противоположных углов и выразите площадь A через а, 6, с, d и е. Это обобщение задачи, решение которой дается формулой Герона.]

42. Прямая и наклонная призмы имеют одинаковый объем и одно и то же основание. Тогда прямая призма имеет меньшую поверхность.

Прямая и наклонная пирамиды имеют одинаковый объем и одно и то же основание. Тогда прямая пирамида имеет меньшую поверхность.

Прямая и наклонная двойные пирамиды имеют одинаковый объем и одно и то же основание. Тогда прямая двойная пирамида имеет меньшую поверхность.

Во всех трех утверждениях основания двух сравниваемых тел совпадают и по форме и по величине. (Объемы, конечно, совпадают только по величине.)

Выберите из этих трех утверждений то, которое кажется вам наиболее доступным, и докажите его.

43. Приложение геометрии к алгебре. Докажите: Если uv u2t ... , ип, vlt v2, .... ^ — действительные числа, то

и равенство достигается в том и только в том случае, если

[Рассмотрите в прямоугольной системе координат n + 1 точку PQt Ръ Р2» ... Рп и длину ломаной линии Р0РХР2... Рп.;

44. Докажите неравенство примера 43 независимо от геометрических рассмотрений. [В геометрическом доказательстве этого неравенства ведущим частным случаем является я = 2.]

45. Приложение алгебры к геометрии. Докажите: Из всех треугольников с данным основанием и площадью наименьший периметр имеет равнобедренный треугольник. [Пример 43.]

46. Пусть V, 5, А и L соответственно обозначают объем, площадь поверхности, площадь основания и периметр основания пирамиды Р. Пусть V0, S0, A0 и LQ — соответствующие величины, связанные с другой пирамидой Р0. Приняв, что

V=VQt A=A0t L^L0 и что PQ— прямая пирамида, докажите, что

Равенство достигается в том и только в том случае, если L = LQ и Р также является прямой пирамидой. [Пример 43.]

47. Пусть V, S у А и L соответственно обозначают объем, площадь поверхности, площадь основания и периметр основания двойной пирамиды D. Пусть Vb, S0» ^о и £о — соответствующие величины, связанные с другой двойной пирамидой DQ. Приняв, что

У=У0, Л=A0, L-^U

и что D0 —прямая двойная пирамида, докажите, что

S>-SQ.

Равенство достигается в том и только в том случае, если L = L0 и D также является прямой двойной пирамидой. [Примеры 45, 46.]

48. Докажите: Из всех четырехгранных призм данного объема наименьшую поверхность имеет куб. [Сравните с примером 34; какое утверждение сильнее?]

49. Докажите: Из всех восьмигранных двойных пирамид данного объема наименьшую поверхность имеет правильный октаэдр. [Сравните с примером 37; какое утверждение сильнее?]

50. Докажите: Из всех трехгранных пирамид данного объема наименьшую поверхность имеет правильный тетраэдр.

51. Прямая пирамида с квадратным основанием. Докажите: Из всех прямых пирамид с квадратным основанием, имеющих данный объем, наименьшую поверхность имеет пирамида, у которой основание составляет 1/4 полной поверхности.

52. Прямой конус. Из всех прямых конусов, имеющих данный объем, наименьшую поверхность имеет конус, у которого основание составляет 1/4 полной поверхности.

53. Произвольная прямая пирамида. Даны объем прямой пирамиды и форма (но не размеры) ее основания. Когда площадь поверхности минимальна, какую ее долю составляет площадь основания? [Знаете ли вы какой-нибудь частный случай?]

54. Просматривая вновь наши различные примеры, относящиеся к призмам, пирамидам и двойным пирамидам, подметьте их взаимные связи и расположите их в виде таблицы так, чтобы стала заметна аналогия результатов. Укажите пробелы, которые вы надеетесь заполнить дальнейшими результатами.

55. Ящик без крышки. Дана сумма S5 площадей пяти граней ящика. Найдите максимум объема V. [Знаете ли вы какую-нибудь задачу, родственную этой? Могли бы вы воспользоваться результатом или методом?]

56. Корыто. Дана сумма 54 площадей четырех граней прямой трехгранной призмы; отброшена боковая грань. Найдите максимум объема V.

57. Обломок. Дана сумма 53 площадей трех попарно соседних граней (т. е. двух боковых граней и одного основания) прямой призмы с треугольным основанием. Покажите, что когда объем V достигает своего максимума, эти три грани имеют равную площадь и попарно перпендикулярны. [Обломок чего?)

58. Дана площадь сектора круга. Найдите значение угла в центре, при котором периметр является наименьшим.

59. Даны площадь и угол треугольника. Найдите минимум (1) суммы двух сторон, заключающих данный угол, (2) стороны, противолежащей данному углу, (3) всего периметра.

60. Даны угол и точка в плоскости угла, лежащая внутри угла. Переменная прямая, проходящая через данную точку, отсекает от угла треугольник. Найдите минимум площади этого треугольника.

61. Дана сумма Е длин 12 ребер ящика. Найдите максимум (1) его объема V, (2) его поверхности S.

62. Почтовая задача. Найдите максимум объема ящика, если дано, что его длина и обхват вместе не превышают I сантиметров.

63. Задача Кеплера. Дано расстояние d от середины образующей прямого цилиндра до наиболее далекой точки цилиндра. Найдите максимум объема этого цилиндра.

IX. ФИЗИЧЕСКАЯ МАТЕМАТИКА

Физика не только дает нам [математикам] повод к решению проблем; она еще помогает нам найти к этому средства. Это происходит двояким путем. Во-первых, она дает нам предчувствия решения; во-вторых, подсказывает нам ход рассуждений. — Анри Пуанкаре1)

1. Оптическая интерпретация. Математические задачи часто внушаются природой или, вернее, нашей интерпретацией природы, физическими науками. Решение математической задачи также может внушаться природой; физика обеспечивает нас ключами, которыми, будучи предоставлены самим себе, мы имели бы очень мало шансов себя обеспечить. Наша картина была бы слишком узкой, если бы мы не рассмотрели математические задачи, подсказанные физическим исследованием и решенные с помощью физической интерпретации. Вот первая, очень простая задача этого рода.

(1) Природа подсказывает задачу. Прямая есть кратчайший путь между двумя данными точками. Свет, распространяясь в воздухе от одной точки к другой, выбирает этот кратчайший путь; так по крайней мере показывает, по-видимому, наш повседневный опыт. Но что происходит, когда свет распространяется от одной точки к другой не прямо, а подвергаясь отражению от поставленного на его пути зеркала. Выберет ли свет снова кратчайший путь? Каков кратчайший путь при этих обстоятельствах? Изучение распространения света приводит нас к следующей чисто геометрической .задаче:

Даны две точки и прямая, лежащие в одной плоскости, причем обе точки находятся по одну сторону от прямой. На данной прямой найти такую точку, чтобы сумма ее расстояний от двух данных точек была наименьшей.

Пусть (см. рис. 9.1)

А и В — две данные точки, /—данная прямая, X — переменная точка прямой /.

Рассмотрим сумму АХ+ХВ двух расстояний, или, что то же самое, длину пути, ведущего от А к X и от X к В. Требуется найти такое положение точки X на данной прямой /, для которого длина этого пути достигает своего минимума.

1) Пуанкаре А., Ценность науки, М., 1906, стр. 108.

Мы встречались ранее (§ 8.2, рис. 8.1, 8.2, 8.3) с очень похожей задачей. Действительно, обе задачи имеют в точности одни и те же данные и даже неизвестное в обоих случаях одинаковой природы. Здесь, как и там, мы разыскиваем положение точки на данной прямой, для которого достигается некоторый экстремум. Наши две задачи отличаются только природой этого экстремума. Здесь мы разыскиваем минимум суммы длин двух отрезков, а там мы разыскивали максимум угла, образованного этими двумя отрезками.

Тем не менее эти две задачи так тесно связаны, что естественно испытать тот же метод. При решении задачи из § 8.2 мы пользовались линиями уровня; воспользуемся ими снова.

Рассмотрим точку X, которая не обязана находиться на предписанном пути, но может свободно двигаться по всей плоскости. Как может двигаться точка X, если величина АХ + ХВ (минимум которой мы хотим найти) имеет постоянное значение? По эллипсу с фокусами в А и В. Следовательно, линии уровня —это «конфокальные» эллипсы, т. е. эллипсы с одними и теми же фокусами (данными точками А и В). Искомый минимум достигается в точке касания предписанного пути I с эллипсом, фокусами которого являются данные точки А и В (см. рис. 9.2).

(2) Природа подсказывает решение. Мы, действительно, нашли решение. Однако, если мы не знаем некоторых геометрических свойств эллипса, наше решение не приносит большой пользы. Начнем снова и постараемся найти решение, дающее больше информации.

Ясно представим себе физическую обстановку, из которой возникает наша задача. Точка А есть источник света, точка В — глаз наблюдателя, а / указывает положение отражающей плоской поверхности; мы можем думать о горизонтальной поверхности тихого пруда (которая перпендикулярна плоскости рис. 9.1 и пересекает ее по прямой /). Ломаная АХВ, если точка X выбрана правильно, представляет путь света. Мы довольно хорошо по опыту знаем этот путь. Мы подозреваем, что длина ломаной АХВ, когда она представляет действительный путь отражаемого света, является наименьшей.

Рис. 9.1. Какой путь самый короткий?

Рис. 9.2. Касательная линия уровня.

Ваш глаз находится в точке В и вы смотрите вниз на отражающий пруд, наблюдая в нем изображение точки А. Луч света, который вы воспринимаете, приходит не прямо от объекта А, но кажется приходящим из точки, находящейся под поверхностью пруда. Из какой точки? Из точки A*, — зеркального отражения A,— симметричной с A относительно прямой /.

Введите точку A*, подсказанную вашим физическим опытом, в чертеж! Эта точка A* изменяет облик задачи. Мы видим множество новых связей (рис. 9.3). Давайте приведем их в порядок и побыстрее используем. Очевидно,

АХ=А*Х.

(А*Х есть зеркальное отражение отрезка АХ. Вы можете также опираться на равенство треугольников △ АСХ, △А*СХ\ прямая / есть перпендикуляр, делящий отрезок AA* пополам). Следовательно,

АХ + ХВ = А*Х + ХВ.

Обе части этого равенства становятся минимальными при одном и том же положении точки Х. Но правая часть, очевидно, является минимальной, когда Л*, X и В лежат на одной и той же прямой. Прямая линия — кратчайшая.

Это —решение (см. рис. 9.3). Точка М, положение минимума точки X, получается как пересечение прямой / и прямой, соединяющей Л* и В. Очевидно, AM и MB образуют с / одинаковые углы. Вводя прямую MN, нормаль к / (параллель к Л*Л), видим, что

∠AMN= ∠BMN.

Кратчайший путь характеризуется равенством этих двух углов. Однако в точности то же самое равенство

угол падения = углу отражения

характеризует, как мы знаем по опыту, действительный путь света. Следовательно, в самом деле, отражаемый луч света выбирает кратчайший возможный путь между объектом и глазом. Это открытие принадлежит Герону Александрийскому.

(3) Сравнение двух решений. Часто бывает полезно вновь просмотреть законченное решение. В настоящем случае это вдвойне полезно, так как мы имеем два решения (1) и (2), которые мы можем сравнить между собой. Оба метода решения задачи (рис. 9.2 и 9.3) должны давать один и тот же результат (представьте себе, что две

Рис. 9.3. Решение, дающее больше информации.

фигуры наложены одна на другую). Мы можем получить точку М, решение нашей задачи на минимум, с помощью эллипса, касательного к /, или же с помощью двух лучей, одинаково наклоненных к /. Однако, каким бы ни было относительное положение данных (точек А и В и прямой Г), эти два построения должны находиться в согласии. Согласие этих двух построений влечет за собой геометрическое свойство эллипса:

Две прямые, соединяющие два фокуса эллипса с произвольной точкой периферии эллипса, одинаково наклонены к касательной к эллипсу в точке их пересечения.

Если мы представим себе эллипс как зеркало и примем во внимание закон отражения (который мы только что рассмотрели), то сможем сформулировать это геометрическое свойство иначе, в наглядной оптической интерпретации: Любой луч света, приходящий из фокуса эллиптического зеркала, отражается в другой фокус.

(4) Приложение. Открытие Герона, несмотря на свою простоту, заслуживает места в истории науки. Это —первый пример применения принципа минимума при описании физических явлений. Это —поучительный пример взаимосвязи между математической и физической теорией. После Герона были открыты значительно более общие принципы минимума и взаимосвязи между математической и физической теориями чрезвычайно расширились, но первые и простейшие примеры в некоторых отношениях производят наиболее глубокое впечатление.

Просматривая удачное решение (2), такое эффектное, мы должны спросить: Можно ли им воспользоваться? Можно ли воспользоваться результатом? Можно ли воспользоваться методом? В действительности существует несколько возможностей. Мы могли бы исследовать отражение света в кривом зеркале, или последовательные отражения в серии плоских зеркал, или сочетать этот результат с методами, которые мы изучили раньше и т. д.

Рассмотрим здесь еще только один пример, задачу о «транспортном центре». Три города намереваются построить три дороги к общему транспортному центру, который должен быть выбран так, чтобы полная стоимость постройки дорог была наименьшей. Если мы все это предельным образом упростим, то получим следующую чисто геометрическую задачу: Даны три точки. Найти четвертую точку так, чтобы сумма ее расстояний от этих трех точек была наименьшей.

Пусть А, В и С обозначают 1ри данные точки (города), г X — переменную точку на плоскости, определяемой точками А, В и С. Мы разыскиваем минимум суммы АХ + ВХ + CY.

Эта задача кажется родственной задаче Герона. Нам нужно сблизить эти две задачи, установить между ними как можно более тесную связь. Если на момент мы фиксируем расстояние СХ (скажем, будем считать его = г), то связь окажется действительно очень тесной: здесь,

как и там, нам нужно найти минимум суммы АХ + ВХ расстояний одной переменной точки от двух фиксированных точек. Различие состоит в том, что здесь X обязана двигаться по окружности (радиуса r с центром в С), а там —по прямой. Предыдущая задача относилась к отражению в плоском зеркале, а эта задача относится к отражению в круглом зеркале.

Доверимся свету: у него хватит способностей найти кратчайший путь от A к круглому зеркалу, а от него к В. Но свет распространяется так, что угол падения равен углу отражения. Следовательно, в искомом положении минимума ^ АХВ должен делиться пополам прямой, проходящей через С и X (см. рис. 9.4). В силу принципа частного изменения и симметрии условий ^ АХС и ^ ВХС также должны делиться пополам соответствующими прямыми. Три прямые, соединяющие X с А, В и С, разбивают плоскость на шесть углов, общей вершиной которых является Х. Внимательно рассматривая пары вертикальных углов на рис. 9.5, легко видим, что все шесть углов равны и потому каждый из них равен 60°. Три дороги, расходящиеся из транспортного центра, одинаково наклонены одна к другой; угол между любыми двумя дорогами равен 120°.

(Если мы вспомним, что метод частного изменения, которым мы воспользовались, подчиняется некоторым ограничениям, то можем найти желательным критический пересмотр нашего решения.)

2. Механическая интерпретация. Математические задачи и их решения могут быть подсказаны любым сектором нашего опыта, оптическими, механическими или какими-нибудь другими явлениями. Посмотрим теперь, как простые механические принципы иногда помогают нам найти решение.

(1) Нить, оба конца которой закреплены, продета сквозь тяжелое кольцо. Найти положение равновесия.

Рис. 9.4. Транспортный центр и круглое зеркало.

Рис. 9.5. Транспортный центр.

Подразумевается, что нить является абсолютно гибкой и нерастяжимой, ее вес не учитывается, кольцо скользит по нити без трения, и размеры кольца так малы, что его можно рассматривать как математическую точку.

Пусть А и В обозначают закрепленные концы нити, а X — любое положение кольца. На рис. 9.6 нить образует ломаную линию АХВ.

Предлагаемая задача может быть решена двумя разными методами.

Во-первых, кольцо должно висеть как можно ниже. (Действительно, кольцо тяжелое; оно «хочет» как можно более приблизиться к земле, т. е. к центру Земли.) Обе части нерастяжимой нити АХ и ВХ натянуты, и, таким образом, кольцо, скользя вдоль нити, описывает эллипс с фокусами А и В. Очевидно, положение равновесия

есть наиболее низкая точка M этого эллипса, где касательная горизонтальна.

Во-вторых, силы, действующие на точку M нити, должны находиться в равновесии. На точку M действуют вес кольца и натяжения нити. Натяжения в обеих частях нити, MA и MB, равны и направлены вдоль нити соответственно к А и к В. Их равнодействующая делит ^ АМВ пополам и, будучи противоположна весу кольца, направлена вертикально.

Эти два решения должны, однако, находиться в согласии. Поэтому прямые MA и MB, одинаково наклоненные к вертикальной нормали эллипса, одинаково наклонены и к его горизонтальной касательной: две прямые, соединяющие два фокуса эллипса с произвольной точкой M периферии, одинаково наклонены к касательной в точке М. (Сохраняя длину отрезка AB, но изменяя его угол наклона к горизонтали, мы можем поместить M в какое угодно положение на нижней половине эллипса.)

Мы вывели уже известный результат [§ 1(3)] новым методом, который может допускать дальнейшие приложения.

Рис. 9.6. Два условия равновесия.

Рис. 9.7. Транспортный центр с помощью механического устройства.

(2) Кажется, мы обладаем излишком знаний. Не чересчур много учившись механике, мы, судя по всему, знаем ее достаточно не только для того, чтобы найти решение предложенной механической задачи, но и для того, чтобы найти два решения, основанные на двух разных принципах. Эти два решения, когда мы их сравнили, привели нас к интересному геометрическому факту. Не могли бы мы отвести какую-нибудь часть этого излишка механических знаний в другие каналы?

Если нам немного повезет, то мы сумеем представить себе механизм для решения задачи о транспортном центре, рассмотренной выше [§ 1(4)]. Три блока вращаются вокруг осей (гвоздей), закрепленных на вертикальной стене в точках А, В и С; см. рис. 9.7. Три нити, ХАР, XBQ и XCR на рис. 9.7, проходят через блоки соответственно в А, В и С. В их общем конце X три нити соединены и к каждой из них в другом ее конце соответственно подвешен груз Р, Q и R. Эти грузы Р, Q и R равны. Наша задача состоит в том, чтобы найти положение равновесия.

Конечно, эта задача должна пониматься с обычными упрощениями: нити являются абсолютно гибкими и нерастяжимыми, трение, вес нитей и размеры блоков не учитываются (блоки рассматриваются как точки). Как и в (1), мы можем решить задачу двумя различными методами.

Во-первых, три груза должны совместно висеть как можно ниже, т. е. сумма их расстояний от данного горизонтального уровня (поверхности земли) должна быть минимальной (т. е. потенциальная энергия системы должна быть минимальной; вспомните, что три груза равны). Следовательно, сумма AP + BQ + CR должна быть максимальной. Поэтому, так как длина каждой нити постоянна, сумма АХ + ВХ + СХ должна быть минимальной, и, таким образом, наша задача оказалась тождественной с задачей о транспортном центре из § 1(4), рис. 9.4, 9.5.

Во-вторых, силы, действующие в точке X, должны находиться в равновесии. Три равных груза натягивают каждый свою нить с равной силой, и эти силы передаются блоками без потерь на трение, не уменьшаясь. Три равные силы, действуя на X соответственно по прямым ХА, ХВ и ХС, должны находиться в равновесии. Очевидно, в силу симметрии они должны быть одинаково наклонены одна к другой; угол между любыми двумя из трех нитей, соединяющихся в X, равен 120°. (Треугольник, образованный тремя нашими силами, является равносторонним, его внешние углы равны 120°.)

Это подтверждает решение из § 1(4). (С другой стороны, механическая интерпретация может подчеркнуть необходимость некоторых ограничений, относящихся к конфигурации трех точек А, В и С.)

3. Новая интерпретация. Палка, наполовину погруженная в воду, кажется круто изогнутой. Отсюда мы заключаем, что свет, который как в воде, так и в воздухе распространяется прямолинейно, при

переходе из воды в воздух претерпевает резкое изменение направления. Это — явление преломления, явление, несомненно, более сложное и более трудное для понимания, чем отражение. Закон преломления, после безуспешных усилий Кеплера и других, был в конце концов открыт Снеллиусом (около 1621 г.) и опубликован Декартом. Еще позднее появился Ферма (1601—1665), который возвратился к цепи идей, начало которой положил Герон.

Свет, идущий от объекта А, находящегося под водой, к глазу В, находящемуся над водой, описывает ломаную линию с угловой точкой на поверхности, отделяющей воздух от воды, см. рис. 9.8. Однако кратчайший путь между А и В есть прямая, и, таким образом, свет при своем переходе из одной среды в другую не подчиняется принципу Герона. Это досадно; нам не хочется допустить, что простое правило, которое было справедливо в двух случаях (прямолинейное распространение и отражение), в третьем случае (преломление) не выполняется. Ферма пришло в голову, как достичь цели. Он был хорошо знаком с идеей о том, что свету для перехода от одной точки к другой нужно время, что он распространяется с некоторой (конечной) скоростью; действительно, Галилей предложил метод измерения скорости света. Возможно, свет, распространяющийся с некоторой скоростью в воздухе, в воде распространяется с другой скоростью; такое различие, в скорости могло бы, пожалуй, объяснить явление преломления. Выбирая кратчайший путь, свет, поскольку он распространяется с постоянной скоростью, выбирает и наиболее быстрый путь. Если скорость зависит от среды, через которую он распространяется, то кратчайший путь уже не является непременно наиболее быстрым. Может быть, свет всегда выбирает наиболее быстрый путь, в том числе и при переходе из воды в воздух?

Эта цепь идей приводит к ясной задаче на минимум (см. рис. 9.8): Даны две точки А и В, прямая /, отделяющая А от В, и две скорости и и v. Найти наименьшее время, необходимое для перехода от А к В; предполагается, что переход от А к I происходит со скоростью и, а от I к В со скоростью v.

Очевидно, быстрее всего двигаться по прямой от А до некоторой точки X прямой / и по некоторой другой прямой от X до В. Задача в сущности состоит в определении точки Х. Далее, при равномерном движении время равняется расстоянию, деленному на скорость. Поэтому время, нужное для перехода от А до X и от X до В, равно

Эта сумма путем подходящего выбора точки X на прямой / должна

Рис. 9.8. Преломление.

быть сделана минимальной. Мы должны найти X, если заданы А, В, иу V и /.

Решить эту задачу без помощи дифференциального исчисления не слишком легко. Ферма решил ее, придумав метод, который в конечном счете вел к дифференциальному исчислению. Мы лучше будем следовать указаниям, даваемым примерами предыдущего параграфа. Если нам немного повезет, то мы сумеем представить себе механизм, который решит для нас предложенную задачу на минимум; см. рис. 9.9.

Кольцо X может скользить по закрепленному горизонтальному стержню /, который проходит сквозь кольцо. К кольцу X прикреплены две нити ХАР и XBQ. Каждая из этих нитей проходит через блок (соответственно в А и в В), и в другом ее конце к ней подвешен груз (соответственно в Р и в Q). Главное —выбрать грузы. Эти грузы не могут быть равны: если бы они были равны, то линия АХВ в положении равновесия была бы прямой (по крайней мере это кажется правдоподобным), и, таким образом, она не годилась бы для изображения пути преломленного света. Отложим выбор грузов, но введем подходящие обозначения. Обозначим через р груз в конце Р первой нити и через q — груз в конце Q второй нити. А теперь мы должны найти положение равновесия. (Мы принимаем обычные упрощения: стержень является абсолютно жестким, нити — абсолютно гибкими, но и нерастяжимыми; мы не учитываем трения, веса нитей и их сопротивления изгибу, размеров, блоков и размеров кольца.) Как и в § 2, мы решаем нашу задачу двумя различными методами.

Во-первых, два груза должны совместно висеть как можно ниже (т. е. потенциальная энергия системы должна быть минимальной). Отсюда следует, что сумма

должна быть максимальной. Поэтому, так как длина каждой нити неизменна, сумма

должна быть минимальной.

Это очень близко к задаче Ферма, но не точно то же самое. Однако эти две задачи, оптическая и механическая, будут математически совпадать, если мы выберем

Рис. 9.9. Преломление с помощью механического устройства.

Тогда задача о равновесии (рис. 9.9), в точности как и зздача Ферма о наиболее быстром распространении, требует, чтобы сумма

была минимальной. Это мы нашли, рассматривая равновесие механической системы на рис. 9.9 с первой точки зрения.

Во-вторых, силы, действующие на точку X, должны находиться в равновесии. Натяжения от грузов передаются без потерь на трение в блоках, не уменьшаясь. К кольцу приложены две силы, соответственно величины 1/и и 1/m>, причем каждая сила действует в направлении соответствующей нити. Эти силы не могут перемещать кольцо в вертикальном направлении, потом, что стержень /, проходящий сквозь кольцо, абсолютно жесткий (вертикальная реакция стержня может иметь любую величину). Однако горизонтальные составляющие этих двух натяжений, имеющие противоположные направления, должны взаимно уничтожаться, должны быть равны по величине. Для того чтобы выразить это соотношение, введем углы а и ß между проходящей через точку X вертикалью и двумя нитями; см. рис. 9.10. Равенство горизонтальных составляющих выражается так:

Это— условие минимума.

Возвратимся теперь к оптической интерпретации. Угол а между приходящим лучом и нормалью к поверхности называется углом падения, а угол ß между уходящим лучом и нормалью —углом преломления. Отношение u/v скоростей зависит от двух сред, воды и воздуха, но не от геометрических обстоятельств, как например расположения точек А и В. Следовательно, условие минимума требует, чтобы синусы углов падения и преломления имели постоянное отношение, зависящее только от двух сред (называемое в настоящее время коэффициентом преломления). «Принцип наименьшего времени» Ферма приводит к закону преломления Снеллиуса, подтвержденному бесчисленными наблюдениями.

Мы восстановили, насколько сумели, рождение важного открытия. Метод решения (которым мы воспользовались вместо решения Ферма) также достоин быть отмеченным. Наша задача имела сначала

Рис. 9.10. Закон преломления.

физическую (оптическую) интерпретацию. Однако, чтобы ее решить, мы придумали другую физическую (механическую) интерпретацию. Наше решение было решением с помощью новой интерпретации. Такие решения могут выявлять новые аналогии между различными физическими явлениями и имеют своеобразное художественное достоинство.

4. Открытие брахистохроны Иоганном Бернулли. Тяжелая материальная точка начинает двигаться из положения покоя в точке А и скользит без трения по наклонной плоскости до более низкой точки В. Эта материальная точка, начинающая двигаться из положения покоя, может также спускаться от А к В по дуге окружности, как груз маятника. Какое движение занимает меньше времени: движение по прямой или по дуге окружности? Галилей думал, что более быстрым является спуск по дуге окружности. Иоганн Бернулли вообразил в вертикальной плоскости, проходящей через А и В, произвольную кривую, соединяющую эти две точки. Существует бесконечно много таких кривых, и он стал разыскивать кривую, которая делает время спуска минимальным; эта кривая называется «кривой наиболее быстрого спуска», или «брахистохроной». Мы хотим понять замечательное по богатству фантазии решение этой задачи, принадлежащее Иоганну Бернулли.

Поместим произвольную кривую, спускающуюся от А к В, в систему координат; см. рис. 9.11. Выберем точку А в качестве начала координат; ось X направим горизонтально, а ось у вертикально вниз. Рассмотрим момент, когда материальная точка, скользящая по кривой, проходит некоторую точку (х, у) с некоторой скоростью v. Имеем соотношение

которое было хорошо знакомо Бернулли; мы выводим его сегодня из закона сохранения энергии. Иными словами, каким бы ни был путь спуска, достигнутая скорость v зависит только от у, глубины спуска:

(1)

Что это означает? Попытаемся интуитивно понять значение этого основного факта.

Проведем горизонтальные прямые (см. рис. 9.11), делящие плоскость, в которой спускается материальная точка, на узкие горизон-

Рис. 9.11. Путь материальной точки.

тальные слои. Спускающаяся материальная точка пересекает эти слои один за другим. Скорость не зависит от пути, который она проходит, но зависит только от слоя, который она в данный момент пересекает; ее скорость меняется от слоя к слою. Где мы встречали такую ситуацию? Когда к нам падает свет солнца, он пересекает несколько слоев воздуха, каждый из которых имеет различную плотность; поэтому скорость света меняется от слоя к слою. Предложенная механическая задача допускает новую, оптическую интерпретацию.

Мы видим теперь рис. 9.11 в новом контексте. Мы рассматриваем эту фигуру как изображающую оптически неоднородную среду. Эта среда расслоена, состоит из слоев различной плотности; скорость света в горизонтальном слое на глубине у равна (2gy)l/2. Свет, пересекающий эту среду от А до В (от одной из данных точек до другой), мог бы распространяться по различным кривым. Однако свет выбирает наиболее быстрый путь; в действительности он распространяется по кривой, делающей время распространения минимальным. Поэтому действительный путь света, пересекающего описанную неоднородную, расслоенную среду от А до В, есть брахистохрона! Однако действительный путь света подчиняется закону преломления Снеллиуса: решение внезапно оказывается в пределах досягаемости. Новая интерпретация Иоганна Бернулли, возникшая при большом участии фантазии, делает доступной задачу, которая представлялась совершенно новой и недоступной.

Остается еще кое-какая работа, но она требует несравненно меньше оригинальности. Чтобы сделать закон Снеллиуса применимым в его знакомой форме (рассмотренной нами в предыдущем § 3), снова слегка изменим нашу интерпретацию рис. 9.11: скорость v должна меняться вместе су не непрерывно, бесконечно малыми шагами, но разрывно, малыми шагами. Представим себе несколько горизонтальных слоев из прозрачного материала (несколько пластинок из стекла), причем каждый слой немного оптически отличается от соседних с ним слоев. Пусть v, v', v", v", ...— скорости света в последовательных слоях, и пусть свет, пересекающий их один за другим, составляет соответственно углы а, а', а", а'",... с вертикалью; см. рис. 9.12. По закону Снеллиуса (см. § 3)

Теперь мы можем от среды, состоящей из узких пластинок, возвратиться к нашей расслоенной среде, в которой v непрерывно меняется с глубиной. (Пусть пластинки становятся бесконечно узкими.)

Рис. 9.12. Путь света.

Мы видим, что вдоль пути света

(2)

Пусть ß —угол, образованный касательной к кривой с горизонталью. Тогда

и значит

(3)

Сопоставим равенства (1), (2) и (3) (выведенные соответственно из механики, оптики и дифференциального исчисления), введем подходящее обозначение для постоянной, входящей в (2), и в результате получим

где с — положительная постоянная. Мы получили для брахистохроны дифференциальное уравнение первого порядка. Отыскание кривых, удовлетворяющих такому уравнению, было задачей, известной Бернулли. Нам нет необходимости входить здесь в детали (см., тем не менее, пример 31): брахистохрона, определенная этим дифференциальным уравнением, оказалась циклоидой. (Циклоида описывается точкой окружности, катящейся по прямой линии; в нашем случае эта прямая — ось дг, и окружность катится по оси х снизу.)

Отметим, однако, что интуитивно, не прибегая к формулам, мы можем видеть, что закон Снеллиуса приводит к дифференциальному уравнению. Действительно, этот закон определяет направление последовательных элементов пути, изображенных на рис. 9.12, и в точности то же самое делает дифференциальное уравнение.

Решение Иоганна Бернулли задачи о брахистохроне, которое мы здесь разобрали, имеет своеобразную художественную прелесть. Рассматривая рис. 9.11 или рис. 9.12, мы можем наглядно видеть ключевую идею решения. Если мы можем видеть эту идею ясно, без усилий, сознавая, что она за собой влечет, то мы можем заметить, что перед нами настоящее произведение искусства.

Ключевой идеей решения Иоганна Бернулли является, конечно, новая интерпретация. Геометрический чертеж (рис. 9.11 или 9.12) последовательно понимается в двух различных интерпретациях, он рассматривается в двух различных «контекстах»: сначала в механическом контексте, затем в оптическом контексте. Не всякое ли открытие состоит в неожиданном соприкосновении и последующей интерпретации двух различных контекстов?

5. Открытие Архимедом интегрального исчисления. Так уж случилось, что одно из величайших математических открытий всех времен

имело своим источником физическую интуицию. Я имею в виду открытие Архимедом той ветви науки, которую сегодня мы называем интегральным исчислением. Архимед нашел площадь параболического сегмента, объем шара и еще около дюжины подобных результатов с помощью единообразного метода, в котором важную роль играет идея равновесия. Как он сам сказал, он «исследовал несколько математических задач средствами механики»1).

Если мы хотим понять работу Архимеда, то нам нужно кое-что знать о состоянии знаний, от которых он отправлялся. Во времена Архимеда геометрия греков достигла вершины своего развития; Эвдокс и Эвклид были его предшественниками, Аполлоний — его современником. Мы должны упомянуть несколько характерных обстоятельств, которые, возможно, оказали влияние на открытие Архимеда.

Как сообщает сам Архимед, Демокрит нашел объем конуса; он установил, что этот объем равен одной трети объема цилиндра с тем же основанием и с той же высотой. Мы ничего не знаем о методе Демокрита, но, по-видимому, имеются некоторые основания подозревать, что он рассматривал то, что мы сегодня назвали бы переменным поперечным сечением конуса, параллельным его основанию2).

Эвдокс был первым, кто доказал утверждение Демокрита. Доказывая этот и подобные результаты, он изобрел свой «метод исчерпывания» и установил стандарт строгости для греческой математики.

Мы должны ясно осознать, что греки в определенном смысле знали «координатную геометрию». Для изучения геометрических мест точек на плоскости они обычно рассматривали расстояние движущейся точки от двух фиксированных осей отсчета. Если сумма квадратов этих расстояний постоянна и оси отсчета взаимно перпендикулярны, то геометрическое место точек есть окружность — это предложение принадлежит к координатной геометрии, но еще не к аналитической геометрии. Аналитическая геометрия начинается в тот момент, когда мы выражаем упомянутое соотношение в алгебраических символах в виде

х2Агу2 = а2.

Механика греков никогда не достигала такого высокого уровня, как их геометрия, и начала развиваться значительно позднее. Если мы правильно оценим неясные рассмотрения Аристотеля и других, то сможем сказать, что механика как наука началась с Архимеда. Он, как знает каждый, открыл закон плавающих тел. Он открыл

1) Ср. The Method of Archimedes, edited by Thomas L. Heath (Метод Архимеда, изданный Томасом А. Хитом), Cambridge, 1912, р. 13. (См. также Архимед, Сочинения, М, 1962, стр. 298—327, Послание к Эратосфену. Особенно см. стр. 302—304. Ниже эта книга цитируется как Метод. —Прим. перев.)

2) См. Метод, стр. 299.

также принцип рычага и главные свойства центра тяжести, которые нам вскоре понадобятся.

Теперь мы подготовлены к обсуждению наиболее эффектного примера из работы Архимеда; мы хотим его методом найти объем шара. Архимед рассматривает шар как тело, образованное вращающейся окружностью, а окружность он рассматривает как геометрическое место точек, характеризуемое соотношением между расстояниями переменной точки от двух фиксированных взаимно перпендикулярных осей отсчета. Записанное в современных обозначениях, это соотношение имеет вид

— уравнение окружности радиуса а, касающейся оси у в начале координат. См. рис. 9.13, который лишь слегка отличается от оригинального чертежа Архимеда; эта окружность, вращаясь вокруг оси Ху образует шар. Я думаю, что применение современных обозначений не нарушает идеи Архимеда. Наоборот, мне кажется, что эти обозначения заставляют думать. Они подсказывают мотивы, которые могут привести нас сегодня к идее Архимеда и которые, быть может, не слишком отличаются от мотивов, которые привели самого Архимеда к его открытию.

В уравнении окружности имеется член у2. Заметим, что тсу2 есть площадь переменного поперечного сечения шара. Однако Демокрит нашел объем конуса, исследуя изменение его поперечного сечения. Это приводит нас к мысли переписать уравнение окружности в виде

Теперь мы можем ях2 интерпретировать как переменное поперечное сечение конуса, образованного вращением прямой у = х вокруг оси х; см. рис. 9.13. Это наталкивает на мысль отыскать аналогичную интерпретацию для остающегося члена л2ах. Если мы не видим такой интерпретации, то можем попытаться переписать уравнение еще и в других формах, и, таким образом, может случиться, что нам придет в голову записать его в виде

(А)

Многое сосредоточено в этом уравнении (А). Разглядывая уравнение (А), отмечая различные входящие в него длины и площади

Рис. 9.13. Рождение интегрального исчисления.

и подходящим образом располагая их на чертеже, мы можем оказаться свидетелями рождения великой идеи; она родится из тесного соединения формулы (А) с рис. 9.13.

Мы замечаем площади трех круглых дисков, лу2, пх2 и я (2а)2. Эти три круга являются пересечениями одной и той же плоскости с тремя телами вращения. Плоскость перпендикулярна к оси х и находится на расстоянии х от начала О. Эти три тела вращения — шар, конус и цилиндр. Они описываются тремя линиями, имеющими соответственно уравнения (А), у = х и у = 2а, когда правая часть рис. 9.13 вращается вокруг оси х. Конус и цилиндр имеют одно и то же основание и одну и ту же высоту. Радиус их общего основания и их общая высота имеют одинаковую длину 2а. Вершина конуса находится в начале О.

Архимед различным образом подходит к дискам, площади которых находятся в разных частях уравнения (А). Он оставляет диск радиуса 2а, поперечное сечение цилиндра, в его первоначальном положении, на расстоянии х от начала. Однако он перемещает диски радиусов у и ху соответственно поперечные сечения шара и конуса, из их первоначального положения и переносит их в точку И оси х с абсциссой — 2а. Подвесим эти диски радиусов у и х так, чтобы их центр находился вертикально под точкой И, с помощью нити нулевого веса, см. рис. 9.13. (Эта нить —добавление нулевого веса к оригинальному чертежу Архимеда.)

Рассмотрим ось х как рычагу жесткий брус нулевого веса, а начало О —как его точку опоры, или точку подвеса. В уравнение (А) входят моменты. (Момент есть произведение силы на плечо рычага.) Уравнение (А) выражает тот факт, что момент двух дисков в левой части равен моменту одного диска в правой части, и, значит, в силу механического закона, открытого Архимедом, рычаг находится в равновесии.

Когда X меняется от 0 до 2а, мы получаем все поперечные сечения цилиндра; эти поперечные сечения заполняют цилиндр. Каждому поперечному сечению цилиндра соответствуют два поперечных сечения тел, подвешенных в точке Н, и эти поперечные сечения заполняют соответственно шар и конус. Как и их соответствующие поперечные сечения, шар и конус, подвешенные в Н, находятся в равновесии с цилиндром. Следовательно, по механическому закону Архимеда, их моменты должны быть равны. Обозначим буквой V объем шара, вспомним выражение для объема конуса (принадлежащее Демокриту), а также для объема цилиндра и очевидное положение его центра тяжести. Переходя от моментов поперечных сечений к моментам соответствующих тел, приходим от уравнения (А) к уравнению

(В)

которое легко дает1)

Вновь просматривая предыдущее, мы видим, что решающим шагом является переход от (А) к (В), от заполняющих поперечных сечений к полным телам. Однако этот шаг только эвристически допущен, а не логически оправдан. Он правдоподобен, даже очень правдоподобен, но не доказателен. Это догадка, а не доказательство. И Архимед, представляющий великие традиции греческой математической строгости, очень хорошо знает это: «Хотя это всем вышеприведенным рассуждением и не доказано, но все же оно производит впечатление, что окончательный вывод верен»2). Эта догадка является, однако, догадкой с будущим. Идея выходит далеко за пределы требований рассматриваемой задачи и имеет неизмеримо больший размах. Переход от (А) к (В), от поперечного сечения ко всему телу есть на более современном языке переход от бесконечно малой части к целой величине, от дифференциала к интегралу. Этот переход — великое начало, и Архимед, который был достаточно великим человеком, чтобы видеть себя в исторической перспективе, очень хорошо знал это: «Он [этот метод] может принести математике немалую пользу; я предполагаю, что некоторые современные нам или будущие математики смогут при помощи указанного метода найти и другие теоремы, которые нам еще не приходили в голову»3).

ПРИМЕРЫ И ПРИМЕЧАНИЯ К ГЛАВЕ IX

1. На плоскости даны точка Р и две пересекающиеся прямые / и m, причем ни одна из этих прямых не проходит через Р. Пусть Y — переменная точка прямой /, a Z — переменная точка прямой т. Определите Y vi Z так, чтобы периметр △ PYZ был наименьшим.

Дайте два решения: одно с помощью физических рассмотрений, а другое с помощью геометрии.

2. На плоскости даны три окружности, каждая из которых является внешней по отношению к любой другой. Найдите треугольник с минимальным периметром, имеющий по одной вершине на каждой окружности.

Дайте две различные физические интерпретации.

3. Треугольник с минимальным периметром, вписанный в данный треугольник. Дан △ ABС. Найдите три точки X, Y и Z соответственно на сторонах ВС, СА, AB треугольника так, чтобы периметр △ XYZ был минимальным.

Дайте две различные физические интерпретации.

1) Я несколько раз излагал этот вывод формулы объема шара в моих классах и однажды заслужил комплимент, которым я горжусь. После моего обычного: «Есть ли какие-нибудь вопросы?» в конце вывода один юноша спросил: «Кто заплатил Архимеду за его открытие?» Должен признаться, я не был достаточно находчив, чтобы ответить: «В те дни такие исследования поддерживала только Урания, муза пауки».

2) Метод, стр. 302.

3) Метод, стр. 299.

4. Обобщите пример 3.

5. Критически пересмотрите решение примера 1. Ко всем ли случаям оно применимо?

6. Критически пересмотрите решение примера 3. Ко всем ли случаям оно применимо?

7. Дайте строгое решение примера 3 для остроугольного треугольника. [Частное изменение, пример 1, пример 5.]

8. Критически пересмотрите решения § 1 (4) и § 2 (2) задачи о транспортном центре. Ко всем ли случаям они применимы?

9. Транспортный центр четырех точек в пространстве. Дан тетраэдр с вершинами в точках A, В, С и D. Предположим, что существует такая точка X внутри тетраэдра, для которой сумма ее расстояний от четырех вершин

является минимальной. Покажите, что углы Z АХВ и ∠CXD равны и делятся пополам одной и той же прямой; укажите другие пары подобным же образом связанных углов. [Знаете ли вы задачу, родственную этой? Аналогичную задачу? Могли ли бы вы воспользоваться ее результатом или методом ее решения?]

10. Транспортный центр четырех точек на плоскости. Рассмотрите крайний случай примера 9, когда точки A, В, С и D лежат в одной плоскости, являются вершинами выпуклого четырехугольника ABCD. Остается ли утверждение примера 9 справедливым в этом крайнем случае?

11. Транспортная сеть для четырех точек. Пусть A, В, С и D —четыре фиксированных точки, а X и Y — переменные точки на плоскости. Если минимум суммы пяти расстояний АХ + ВХ + XY + YC+ YD достигается так, что все шесть точек A, В, С, D, X и Y различны, то три прямые ХЛ, ХВ и XY одинаково наклонены одна к другой, и это же верно для трех прямых YC, YD и YX.

12. Разверните и выпрямите. Существует еще другая полезная интерпретация рис. 9.3. Начертите /, А*Х и ХВ на листе прозрачной бумаги, затем согните

лист по прямой /: вы получите рис. 9.1 (с Л* вместо А). Представьте себе, что рис. 9.1 первоначально начерчен этим искусственным способом на согнутом прозрачном листе. Чтобы найти положение точки X, обращающее АХ + ХВ в минимум, разверните лист, начертите прямую от А (или, вернее, Л* на рис. 9.3) к ß, и затем снова согните лист.

13. Бильярд. На прямоугольном бильярдном столе в точке Р находится шар. Требуется ударить шар в таком направлении, чтобы после четырех последовательных отражений от четырех сторон прямоугольника шар возвратился в свое первоначальное положение Р. [Рис. 9.14.]

14. Геофизическое исследование. В точке Е горизонтальной поверхности земли происходит взрыв. Звук этого взрыва распространяется внутрь земли и отражается наклонной плоскостью пласта ORt составляющею угол а с поверхностью земли. Звук, приходящий из £, может достичь контрольного поста L в другой точке земной поверхности n различными путями. (Один из этих n путей построен на рис. 9.15 методом примера 12.) Предполагая, что n (отмеченное соответствующим прибором) дано, укажите пределы, межд, которыми заключен угол а.

Рис. 9.14. Отраженный бильярдный стол.

15. В пространстве даны прямая / и две точки А и B1 не лежащие на /. На прямой / найдите точку X, для которой сумма ее расстояний от двух данных точек АХ + ХВ является наименьшей.

[Знаете ли вы какую-нибудь задачу, родственную этой? Более частную задачу? Могли ли бы вы воспользоваться ее результатом или методом ее решения?]

16. Решите пример 15, пользуясь касательной поверхностью уровня.

17. Решите пример 15 сгибанием бумаги.

18. Решите пример 15 с помощью механической интерпретации. Находится ли решение в согласии с примерами 16 и 17?

19. В пространстве даны три скрещивающиеся прямые а, b и с. Покажите, что треугольник наименьшего периметра, имеющий по одной вершине на каждой из данных прямых, обладает следующим свойством: прямая, соединяющая его вершину на прямой а с центром вписанного в него круга, перпендикулярна к а.

20. Рассмотрите частный случай примера 19, когда три скрещивающиеся прямые являются тремя ребрами куба. Где находятся вершины искомого треугольника? Где находится центр вписанного в него круга? Чему равен его периметр, если объем куба равен 8а3?

21. В пространстве даны три скрещивающиеся прямые a, b и с. Пусть X перемещается по a, Y по bу Z по с и Т свободно перемещается в пространстве. Найдите минимум суммы XT + YT + ZT.

22. Рассмотрите частный случай примера 21, подобно тому как в примере 20 рассмотрен частный случай примера 19.

23. Кратчайшие линии на многогранной поверхности. Передняя и задняя стены прямоугольной комнаты являются квадратами; комната имеет 10 м в длину, 4 м в ширину и 4 м в высоту. На передней стене, на высоте 3,5 м от пола и на одинаковом расстоянии от боковых стен находится паук. На противоположной стене на высоте 0,5 м от пола и также на одинаковом расстоянии от боковых стен паук замечает муху. Покажите, что паук, чтобы достичь муху, должен проползти по стенам, или потолку, или полу, меньше чем 14 м. [Пример 17.]

24. Кратчайшие (геодезические) линии на кривой поверхности. Кривую поверхность мы рассматриваем как предел многогранника. Когда многогранник приближается к кривой поверхности, число его граней стремится к оо, наибольшая диагональ любой грани стремится к 0 и грани стремятся стать касательными к поверхности.

На многогранной поверхности кратчайшей линией между двумя точками является ломаная. Она может быть плоской ломаной, все точки которой лежат в одной плоскости, или она может быть пространственной ломаной, точки которой не содержатся в одной плоскости. [Оба случая можно проиллюстрировать решением примера 23, первый случай — (1), второй случай — (2) и (3).]

Кратчайшая линия на кривой поверхности называется «геодезической» потому, что кратчайшие линии играют важную роль в геодезии, учении о земной поверхности. Геодезическая линия может быть плоской кривой, целиком содержащейся

Рис. 9.15. Подземные отражения.

в одной плоскости, или она может быть «пространственной кривой» («скрученной» кривой), точки которой не содержатся в одной плоскости. Как бы то ни было, геодезическая линия должна иметь какую-то внутреннюю геометрическую связь с поверхностью, на которой она является кратчайшей линией. Какова эта связь?

(1) Рассмотрим ломаную ABC...L. Даже если ABC...L — пространственная ломаная, два соседних ее отрезка, например HI и /У, лежат в одной плоскости. Если ABC...L — кратчайшая линия на многогранной поверхности между своими концами А и L, то каждая из промежуточных вершин В% С, D,Я, /, J.....К

лежит на ребре многогранника. Плоскость, содержащая отрезки HI и/У, содержит и биссектрису L Я/У, и эта биссектриса перпендикулярна ребру многогранника, проходящему через /; см. пример 16 или пример 18.

Рассмотрим кривую. Далее если эта кривая скрученная, ее бесконечно малая (очень короткая) дуга может рассматриваться как плоская (почти плоская) дуга. Плоскость бесконечно малой дуги есть соприкасающаяся плоскость в ее середине. Эта соприкасающаяся плоскость аналогична плоскости, в которой лежат два соседних отрезка пространственной ломаной. Если кривая является геодезической линией, т. е. кратчайшей линией на поверхности, то аналогия подсказывает, что соприкасающаяся плоскость геодезической линии в произвольной точке проходит через нормаль к поверхности в этой точке.

(2) Геодезическая линия физически может быть интерпретирована как резиновая лента, натянутая на гладкую поверхность (т. е. поверхность, по которой всякое тело скользит без трения). Исследуем равновесие маленького участка этой резиновой ленты. Силы, действующие на этот участок — два натяжения равной величины, действующие по касательным в двух концах нашей маленькой дуги, и реакция поверхности, которая ввиду отсутствия трения в каждой точке направлена по нормали к поверхности. Равнодействующая сил реакции поверхности и два натяжения в концах дуги находятся в равновесии. Следовательно, эти три силы параллельны одной и той же плоскости. Однако две «близкие касательные» определяют соприкасающуюся плоскость, которая, таким образом, содержит нормаль к поверхности.

(3) Каждая дуга геодезической линии является геодезической линией. Действительно, если кривая имеет участок, который не является кратчайшим между своими концами и, следовательно, может быть заменен более короткой дугой между этими концами, то вся кривая не может быть кратчайшей линией. Поэтому естественно ожидать, что геодезическая линия обладает каким-либо отличительным свойством в каждой своей точке. Свойство, которое показывают два очень различных эвристических рассмотрения (1) и (2), является свойством этого рода.

(4) Подыщите примеры, чтобы проверить эвристически полученный результат. Каковы кратчайшие линии на сфере? Обладают ли они указанным свойством? Обладают ли этим свойством другие линии на сферической поверхности?

25. Материальная точка движется без трения по гладкой жесткой поверхности. Никакие внешние силы (такие, как сила тяжести) на эту точку не действуют (исключая, конечно, реакцию поверхности). Приведите причины, по которым следует ожидать, что точка описывает геодезическую линию.

26. Построение посредством сгибания бумаги. Найдите многоугольник, вписанный в круг, если задан порядок и величина его сторон.

Пусть alf a3, ... , an обозначают заданные длины. За стороной длины ах следует сторона длины а^, за ней — сторона длины а3 и т. д.; за стороной длины an следует сторона длины а1# Подразумевается, что любая из длин alt a2, ... ... , an меньше, чем сумма остальных n — 1 длин.

Существует прекрасное решение посредством сгибания бумаги. Проведите alt аъ ... , an на картоне как последовательные хорды достаточно большого круга так, чтобы две соседние хорды имели общий конец. Проведите радиусы из этих концов в центр круга. Вырежьте многоугольник, ограниченный n хордами и двумя крайними радиусами. Согните картон вдоль n—1 других радиусов и склейте два радиуса, вдоль которых картон был разрезан. Вы получили таким образом открытую многогранную поверхность; она состоит из n жестких равнобедренных

треугольников, ограничена n свободными ребрами длин соответственно alt а2, ... ..., an и имеет n двугранных углов, которые еще могут изменяться. (Мы предполагаем,что n > 3.)

Что вы можете делать с этой многогранной поверхностью, чтобы решить предложенную задачу?

27. Бросается кость. Масса внутри тяжелого жесткого выпуклого многогранника может быть распределена неравномерно. Фактически мы можем представить себе подходящее неоднородное распределение массы, центр тяжести которой совпадает с произвольно указанной внутренней точкой многогранника. Если бросить многогранник на горизонтальный пол, то он остановится на одной из своих граней. Это дает механический довод для следующего геометрического предложения.

Если дан выпуклый многогранник Р и некоторая точка С внутри Р, то мы можем найти грань F многогранника Р, обладающую следующим свойством: основание перпендикуляра, опущенного из С на плоскость грани F, есть внутренняя точка F.

Найдите геометрическое доказательство этого предложения. (Заметьте, что грань F может, но не обязана, однозначно определяться сформулированным свойством.)

28. Всемирный потоп. На контурной карте существует три типа замечательных точек: вершины, перевалы (или седловые точки с горизонтальной касательной плоскостью) и «котловины» (на рис. 8.7 В — вершина, Я — перевал). «Котловина» — наиболее глубокая точка в дне долины, из которой вода не находит никакого стока. Котловина есть «перевернутая» вершина: рассмотрите на контурной карте любую линию уровня высоты h над уровнем моря как если бы она имела над уровнем моря высоту — h. Тогда карта «перевернута»; она становится картой ландшафта под морем, вершины становятся котловинами, котловины становятся вершинами, но перевалы остаются перевалами. Существует замечательная связь между этими тремя типами точек.

Допустим, что на острове имеется В вершин, К котловин и Я перевалов. Тогда

в+ к = П+ 1.

Чтобы интуитивно вывести эту теорему, вообразим, что неперестающий дождь заставил озеро, окружающее остров, подниматься до тех пор, пока, наконец, весь остров не был затоплен. Мы можем считать, что все В вершин имеют одинаковую высоту и что все К котловин находятся на уровне озера или ниже его. В самом деле, мы можем вообразить, что вершины поднялись, а котловины понизились, но их число не изменилось. Когда дождь начинает идти, в котловинах собирается вода; вначале мы имеем, считая окружающее остров озеро,

К + 1 озер и 1 остров.

Непосредственно перед тем как остров скроется под водой, из-под воды выступают только вершины, и, таким образом, в конце мы имеем

1 озеро и В островов.

Как происходил переход?

Вообразим, что в какой-то момент на одной и той же высоте находится несколько озер. Если нет никаких находящихся на этой высоте перевалов, то вода может еще немного подняться, не меняя числа озер или числа островов. Когда, однако, поднимающаяся вода как раз достигнет перевала, малейший последующий подъем ее уровня или объединит два прежде отделенных озера, или изолирует участок земли. Поэтому каждый перевал или на одну единицу уменьшает число озер, или на одну единицу увеличивает число островов. Рассматривая полное изменение, получаем

(К + 1—1) + (В — 1) = Я;

в этом и состоит наша теорема.

(a) Допустите теперь, что на всем земном шаре имеется В вершин, К котловин и П перевалов (некоторые из них под водой), и покажите, что

В+ К = П+ 2.

(b) Последнее соотношение напоминает нам теорему Эйлера (см. §§3.1—3.7 и примеры 3.1—3.9). Могли бы вы воспользоваться теоремой Эйлера для построения геометрического доказательства результата, только что полученного с помощью интуитивных соображений? [Рис. 9.16 и 9.17 показывают важные куски более полной карты, на которой указано не только несколько линий уровня, но и несколько «линий наиболее крутого спуска», перпендикулярных к линиям уровня. Эти два типа линий разбивают поверхность земли на треугольники и четырехугольники. Ср. пример 3.2.]

(с) Имеются ли какие-нибудь замечания по поводу метода?

29. Не слишком глубоко1). Чтобы найти глубину колодца d, вы бросаете в колодец камень и измеряете время t от момента бросания камня до момента, когда вы услышите, что камень ударился о воду.

(a) Даны ускорение силы тяжести g и скорость звука с. Выразите d через g, с и t (пренебрегая сопротивлением воздуха).

(b) Если колодец не слишком глубок, то скорость камня даже в момент падения будет составлять малую долю скорости звука, и, таким образом, мы можем ожидать, что значительно большая часть измеренного времени t уйдет на падение камня. Поэтому следует ожидать, что

где поправка относительно мала, когда t мало.

Чтобы проверить эту догадку, разложите выражение, полученное в качестве ответа в (а), по степеням t и сохраните первые два не равных нулю члена.

(с) Что в этом примере вы рассматривали бы как типичное?

30. Полезный крайний случай. Эллипс, вращающийся вокруг своей большой оси, описывает так называемый вытянутый сфероид, или яйцевидный эллипсоид вращения. Фокусы вращающегося эллипса не вращаются: они находятся на оси вращения и также называются фокусами вытянутого сфероида. Мы могли бы изготовить эллиптическое зеркало, покрыв внутреннюю, вогнутую сторону этой поверхности полированным металлом; все лучи, приходящие из одного фокуса, отражаются таким эллиптическим зеркалом в другой фокус; ср. § 1 (3). Эллип-

Рис. 9.16. Окрестность вершины.

Рис. 9.17. Окрестность перевала.

1) В оригинале «Not so deep as a well». — Прим. nepeв.

тические зеркала на практике применяются очень редко, но существует предельный случай, очень важный в астрономии. Что происходит, если один из фокусов эллипсоида фиксирован, а другой стремится к бесконечности?

31. Решите дифференциальное уравнение брахистохроны, найденное в § 4.

32. Вариационное исчисление занимается задачами на максимум и минимум величин, зависящих от формы и размера переменной кривой. Такова задача о брахистохроне, решенная в § 4 с помощью оптической интерпретации. Задача о геодезических, или кратчайших линиях на кривой поверхности, рассмотренная в примере 24, также принадлежит к вариационному исчислению; к нему же принадлежит и «изопериметрическая задача», о которой будет идти речь в следующей главе. Физические рассмотрения, которые, как мы видели, могут решать различные задачи на максимум и минимум, могут решать и некоторые задачи вариационного исчисления. Наметим пример.

Найти кривую данной длины и с данными концами, имеющую центр тяжести наименьшей высоты. Предполагается, что плотность постоянна вдоль кривой, которую мы рассматриваем как однородную веревку или цепь. Когда центр тяжести цепи достигает своего наиболее низкого положения, цепь находится в равновесии. Теперь мы можем исследовать равновесие цепи, рассматривая действующие на нее силы, ее вес и ее натяжение. Это исследование приводит к дифференциальному уравнению, которое определяет искомую кривую, цепную линию. Мы не входим в детали. Мы хотим только отметить, что намеченное решение имеет ту же основную идею, что и механические решения, рассмотренные в § 2.

33. От равновесия поперечных сечений к равновесию тел. Архимед не сформулировал в явной форме общий принцип своего метода, но он применил его к нескольким примерам, вычисляя объемы, площади и центры тяжести, и разнообразие этих примеров делает этот принцип совершенно ясным. Применим вариант метода Архимеда, изложенный в § 5, к некоторым из его примеров.

Докажите Предложение 7 «Метода»:

Объем шарового сегмента относится к объему конуса с тем же основанием и высотой как сумма радиуса шара и высоты дополнительного сегмента к высоте дополнительного сегмента.

34. Докажите Предложение 6 «Метода»:

Центр тяжести полушария лежит на его оси и делит эту ось так, что часть, примыкающая к вершине полушария, относится к остальной части как 5 : 3.

35. Докажите Предложение 9 «Метода»:

Центр тяжести шарового сегмента лежит на его оси и делит эту ось так, что часть, примыкающая к вершине, относится к остальной части как сумма оси сегмента и четырехкратной оси дополнительного сегмента к сумме оси сегмента и удвоенной оси дополнительного сегмента.

36. Докажите Предложение 4 «Метода»:

Объем сегмента параболоида вращения, отсеченного плоскостью, перпендикулярной оси, относится к объему конуса, имеющего то же основание и ту же высоту, что и сегмент, как 3 : 2.

37. Докажите Предложение 5 «Метода»:

Центр тяжести сегмента параболоида вращения, отсеченного плоскостью, перпендикулярной оси, лежит на оси и делит ее так, что часть, примыкающая к вершине, вдвое больше остальной части.

38. Ретроспективный взгляд на Метод Архимеда. Что было в уме Архимеда, когда он открыл свой метод, мы никогда не узнаем и можем только смутно об этом догадываться. Однако мы можем составить ясный и довольно короткий перечень таких математических правил (хорошо известных сегодня, но не сформулированных во времена Архимеда), которые нужны нам для решения современными методами задач, решенных Архимедом его методом. Нам нужны:

(1) Два общих правила интегрального исчисления:

(2) Значения четырех интегралов:

(3) Геометрическая интерпретация двух интегралов:

Здесь Q (х) означает длину в плоской геометрии и площадь в пространственной геометрии; оно обозначает в обоих случаях переменное поперечное сечение фигуры или тела, определяемое плоскостью, перпендикулярной к оси х. Первый интеграл выражает площадь или объем, второй интеграл — момент однородной площади или объема в соответствии с тем, рассматриваем ли мы задачу плоской или пространственной геометрии.

Архимед не формулировал эти правила, хотя мы не можем не думать, что он в той или иной форме ими владел. Он воздержался даже от того, чтобы сформулировать в общих выражениях процесс, лежащий в основании перехода от переменного поперечного сечения к площади или объему, от подынтегральной функции к интегралу, как мы сказали бы сегодня. Он описывал этот процесс в частных случаях, он применял его к замечательному разнообразию случаев, он, несомненно, глубоко его знал, но он рассматривал его только как эвристический метод и считал это вполне достаточной причиной для того, чтобы воздержаться от формулирования его в общем виде.

Приведите простые геометрические факты, которые могут интуитивно дать значения четырех интегралов, указанных в (2)1).

1) Для других замечаний об открытии Архимеда см.: van der Wаеrden В. L., Elemente der Mathematik, v. 8, 1953, p. 121—129; v.9, 1954, p. 1—9.

Х. ИЗОПЕРИМЕТРИЧЕСКАЯ ЗАДАЧА

Круг— первая, наиболее простая и наиболее совершенная фигура. — Прокл1)

Locerchio е perfetlssima figura. —Данте2)

1. Индуктивные доводы Декарта. В неоконченной работе Декарта Regulae ad Direciionem Ingenii (или Правила для руководства ума, которая, кстати сказать, должна рассматриваться как одна из классических работ по логике открытия) мы находим следующее любопытное место3): «Чтобы показать посредством энумерации, что периметр круга меньше, чем периметр любой другой фигуры той же площади, нет необходимости исследовать все возможные фигуры, но достаточно доказать это на нескольких из них, чтобы путем индукции вывести то же самое для всех других фигур».

Чтобы понять смысл этой выдержки, выполним действительно то, что предлагает Декарт. Сравним круг с несколькими другими фигурами: треугольниками, прямоугольниками и круговыми секторами. Возьмем два треугольника: равносторонний и равнобедренный прямоугольный (с углами соответственно 60°, 60°, 60° и 90°, 45°, 45°). Форма прямоугольника характеризуется отношением его ширины к его высоте; мы выберем отношения 1:1 (квадрат), 2:1,3:1 и 3:2. Форма сектора круга определяется углом в центре; мы выберем углы 180°, 90° и 60° (полукруг, квадрант и секстант). Допустим, что все эти фигуры имеют одинаковую площадь, скажем 1 см2. Затем вычислим длину периметра каждой фигуры в сантиметрах. Полученные числа собраны в следующую таблицу (см. стр. 186); порядок фигур выбран так, чтобы периметры возрастали, когда мы читаем их сверху вниз.

Из десяти перечисленных фигур, имеющих одинаковую площадь, круг, указанный первым, имеет наименьший периметр. Можем ли мы отсюда посредством индукции вывести, как, по-видимому, предлагает Декарт, что круг имеет наименьший периметр не только среди десяти перечисленных фигур, но и среди всех возможных

1) Комментарии к определениям XV и XVI первой книги Начал Евклида.

2) Convivio (Пир) II, XIII, 26.

3) Рене Декарт, Избранные произведения, М., 1950, стр. 104. Место несущественно изменено; рассматриваемое свойство круга дано здесь в иной форме.

фигур? Никоим образом. Но нельзя отрицать, что наш сравнительно короткий список очень сильно толкает к этой обшей теореме. В сущности, настолько сильно, что если бы мы и добавили к нему еще одну или две фигуры, он не мог бы толкать к ней намного сильнее.

Таблица I

Периметры фигур равной площади

Я склонен верить, что Декарт, когда он писал приведенное место, думал об этом последнем, более тонком обстоятельстве. Он намеревался, я думаю, сказать, что удлинение этого списка не оказало бы на нашу веру большого влияния.

2. Скрытые доводы. «Из всех плоских фигур равной площади наименьший периметр имеет круг». Назовем это утверждение, подкрепленное табл. I, изопериметрической теоремой1). Таблица I, построенная в соответствии с предложением Декарта, является довольно убедительным индуктивным доводом в пользу изопериметрической теоремы. Но почему этот довод кажется убедительным?

Представим себе до некоторой степени сходную ситуацию. Выберем десять деревьев из десяти различных знакомых видов. Измерим удельный вес древесины каждого дерева и выберем дерево, древесина которого имеет наименьший удельный вес. Разумно ли было бы только на основании этих наблюдений верить, что вид дерева, имеющий наиболее легкую древесину среди десяти исследованных видов, имеет наиболее легкую древесину и среди всех существующих видов деревьев? Верить этому было бы не только не разумно, но глупо.

В чем же отличие от случая круга? Мы расположены в пользу круга. Круг — наиболее совершенная фигура; мы охотно верим, что вместе с другими своими совершенствами круг для данной площади имеет наименьший периметр. Индуктивный довод, высказанный Декартом, кажется таким убедительным потому, что он подтверждает предположение, правдоподобное с самого начала.

1) Объяснение этого названия и эквивалентные формы будут даны позднее (§ 8).

«Круг — наиболее совершенная фигура» — это традиционная фраза. Мы находим ее в сочинениях Данте (1265—1321), Прокла (410—485) и еще более ранних авторов. Смысл сентенции не ясен, но за ней может скрываться нечто большее, чем простая традиция.

3. Физические доводы. «Из всех тел равного объема наименьшую поверхность имеет шар». Назовем это утверждение «изопериметрической теоремой в пространстве».

Изопериметрической теореме в пространстве, как и на плоскости, мы склонны верить без какого-либо математического доказательства. В пользу шара мы расположены, пожалуй, даже больше, чем в пользу круга. В самом деле, кажется, что сама природа расположена в пользу шара. Дождевые капли, мыльные пузыри, Солнце, Луна, наша Земля, планеты шарообразны или почти шарообразны. Немножко зная физику поверхностного натяжения, мы можем научиться изопериметрической теореме у мыльного пузыря.

Однако, даже если мы не знаем серьезной физики, к изопериметрической теореме нас могут привести совсем примитивные рассмотрения. Мы можем научиться ей у кота. Я думаю вы видели, что делает кот, когда в холодную ночь он приготовляется ко сну: он поджимает лапы, свертывается и таким образом делает свое тело насколько возможно шарообразным. Он делает так, очевидно* чтобы сохранить тепло, сделать минимальным выделение тепла через поверхность своего тела. Кот, не имеющий ни малейшего намерения уменьшить свой объем, пытается уменьшить свою поверхность. Он решает задачу о теле с данным объемом и наименьшей поверхностью, делая себя возможно более шарообразным. Судя по всему, он имеет некоторое знакомство с изопериметрической теоремой.

Физика, на которой основано это рассмотрение, крайне груба1). Однако это рассмотрение убедительно и даже ценно как своего рода предварительное подкрепление для изопериметрической теоремы. Неуловимые доводы в пользу шара или круга, на которые выше был сделан намек (§ 2), начинают сгущаться. Не являются ли они доводами физической аналогии?

4. Индуктивные доводы лорда Рэлея. Немногим более чем через двести лет после смерти Декарта физик лорд Рэлей исследовал тоны мембран. Пергамент, натянутый на барабан, есть «мембрана» (или, вернее, разумное приближение к математической идее мембраны), если только он сделан очень тщательно и так натянут, что является повсюду однородным. Барабаны обычно имеют круглую форму, но

1) Лучше осведомленный кот должен был бы делать минимальной не поверхность своего тела, а его теплопроводность или, что сводится к тому же, его электростатическую емкость. Однако в силу одной теоремы Пуанкаре эта другая задача на минимум имеет то же решение, шар. См. Polya G., Amer. Math. Monthly, 54 (1947), 201—206,

в конце концов мы могли бы делать барабаны эллиптической, или многоугольной, или любой другой формы. Барабан любой формы может издавать различные тоны, из которых наиболее низкий тон, называемый основным тоном, обычно является наиболее сильным. Лорд Рэлей сравнивал основные тоны мембран различной формы, но равной площади и подчиненных одним и тем же физическим условиям. Он составил табл. II, очень похожую на нашу табл. I в § 1. В этой табл. II перечисляются те же формы, что и в табл. I, но в несколько ином порядке, и для каждой формы приводится высота (частота) основного тона1).

Таблица II

Основные частоты мембран равной площади

Круг.................... 4,261

Квадрат.................. 4,443

Квадрант................. 4,551

Секстант.................. 4,616

Прямоугольник 3:2........... 4,624

Равносторонний треугольник...... 4,774

Полукруг................. 4,803

Прямоугольник 2:1........... 4,967

Равнобедренный прямоугольный треугольник ................ 4,967

Прямоугольник 3:1........... 5,736

Из десяти перечисленных мембран, имеющих одну и ту же площадь, первая, круглая мембрана, имеет наиболее низкий основной тон. Можем ли мы отсюда по индукции заключить, что круг имеет наиболее низкий тон из всех форм?

Конечно, не можем; индукция никогда не дает возможности сделать окончательное заключение. Но она толкает к такому заключению очень сильно, даже сильнее, чем в предыдущем случае. Мы знаем (и лорд Рэлей и его современники также знали), что из всех фигур с данной площадью круг имеет наименьший периметр и что эта теорема может быть математически доказана. Помня об этом геометрическом минимальном свойстве круга, мы склонны верить, что круг имеет и физическое минимальное свойство, к которому толкает табл. 11. На наше суждение оказывает влияние аналогия, а аналогия имеет большое влияние.

Сравнение табл. I и II чрезвычайно поучительно. Оно наводит на различные другие размышления, которые мы не пытаемся теперь обсуждать2).

5. Выведение следствий. Мы должны обозреть различные основания в пользу изопериметрической теоремы, которые конечно, недо-

1) См. Рэлей, Теория звука, М., 1955, т. 1, стр. 365.

2) См. §§ 12.4 и 12.5, — Прим. перев.

статочны, чтобы ее доказать, но достаточны, чтобы сделать ее разумным предположением. Физик, исследующий предположение в своей науке, выводит из него следствия. Эти следствия могут находиться в согласии с фактами или же им противоречить, и физик придумывает эксперименты, чтобы выяснить, что же имеет место в действительности. Математик, исследующий предположение в своей науке, может пойти аналогичным путем. Он выводит из своего предположения следствия. Эти следствия могут быть верными или неверными, и математик пытается выяснить, что же имеет место в действительности.

Пойдем по этому пути при исследовании изопериметрической теоремы, которую мы выскажем теперь в следующей форме: Из всех плоских фигур равного периметра наибольшую площадь имеет круг. Это утверждение отличается от утверждения, приведенного выше (§ 2), и не только словесно. Однако мы можем показать, что эти два утверждения равносильны. Мы отложим это доказательство (см. § 8) и поспешим перейти к рассмотрению следствий.

(1) Дидона, дочь тирского царя, бежавшая от отца, после многих приключений прибыла на берег Африки, где она позднее стала основательницей Карфагена и его первой легендарной царицей. Дидона начала с того, что купила у туземцев участок земли на берегу моря «не больше, чем можно окружить воловьей шкурой». Она разрезала воловью шкуру на тонкие узкие полосы, из которых связала очень длинную веревку. А затем Дидона столкнулась с геометрической задачей: участок земли какой формы следовало бы окружить ее веревкой данной длины, чтобы получить наибольшую площадь?

Во внутренней части континента ответ давал бы, конечно, круг, но на берегу моря задача изменяется. Решим ее в предположении, что берег представляет собой прямую линию. На рис. 10.1 дуга XYZ имеет данную длину. Требуется сделать максимальной площадь между этой дугой и прямолинейным отрезком XZ (который лежит на данной бесконечной прямой, но по желанию может быть удлинен или укорочен).

Чтобы решить эту задачу, рассмотрим данную бесконечную прямую (берег моря) как зеркало; см. рис. 10.2. Линия XYZ и ее

Рис. 10.1. Задача Дидоны.

Рис. 10.2. Решение с помощью зеркального отражения.

зеркальное отражение XY'Z совместно образуют замкнутую кривую XYZY' данной длины, окружающую площадь, которая в точности вдвое больше площади, максимум которой нам нужно найти. Эта площадь максимальна, когда замкнутая кривая — окружность, для которой данная бесконечная прямая (берег моря) является осью симметрии. Следовательно, решение задачи Дидоны — полукруг с центром на берегу моря.

(2) Якоб Штейнер вывел из изопериметрической теоремы множество интересных следствий. Разберем одно из его рассуждений, являющееся особенно поразительным. Впишем в данный круг многоугольник (рис. 10.3). Сегменты круга (заштрихованные на рис. 10.3), отсекаемые сторонами вписанного многоугольника, будем рассматривать как жесткие (вырезанные из картона). Представим себе, что эти жесткие сегменты круга в вершинах вписанного многоугольника соединены гибкими суставами. Продеформируем эту суставчатую систему, изменяя углы в суставах. После деформации (см. рис. 10.4) мы получим новую кривую, которая не является окружностью, но состоит из следующих одна за другой дуг окружности и имеет ту же длину, что и данная окружность. Поэтому в силу изопериметрической теоремы площадь, ограниченная новой кривой, должна быть меньше, чем площадь данного круга. Однако сегменты круга жесткие (из картона), их площади не изменились и, таким образом, площадь уменьшилась за счет деформированного многоугольника. Площадь вписанного в круг многоугольника больше, чем площадь любого другого многоугольника с такими же сторонами (стороны одинаковы по длине и по порядку следования).

Это следствие изящно, но пока не доказано, поскольку мы пока не доказали саму изопериметрическую теорему.

(3) Соединим задачу Дидоны с методом Штейнера. Впишем в данный полукруг ломаную линию; см. рис. 10.5. Сегменты, отсекаемые

Рис. 10.3. Вписанный многоугольник.

Рис. 10.4. Гибкие суставы и картонные сегменты.

от полукруга звеньями ломаной линии (заштрихованные на рис. 10.5), будем рассматривать как жесткие (из картона). Поместим в вершины ломаной гибкие суставы, изменим углы и переместим концы ломаной по содержащей диаметр прямой, которую мы рассматриваем как заданную. Так мы получим новую кривую (рис. 10.6), состоящую из дуг окружности той же общей длины, что и полуокружность, но в силу теоремы, которую мы разобрали в (1), заключающую вместе с данной бесконечной прямой площадь меньшую, чем площадь полукруга. Но сегменты круга жесткие (из картона), и поэтому площадь уменьшилась за счет деформированного многоугольника. Отсюда теорема: Даны по длине и порядку следования стороны многоугольника, за исключением одной стороны. Площадь становится наибольшей, когда многоугольник вписан в полукруг, диаметром которого является первоначально не заданная сторона.

6. Подтверждение следствий. Физик, выведя из своего предположения различные следствия, разыскивает такое следствие, которое можно удобно проверить с помощью экспериментов. Если эксперименты явно противоречат выведенному из него следствию, то подрывается само предположение. Если эксперименты подтверждают следствия, то вес предположения возрастает, оно становится более правдоподобным. Математика может идти подобным же путем. Он разыскивает доступные следствия своего предположения, которые он мог бы доказать или опровергнуть. Опровергнутое следствие опровергает само предположение. Доказанное следствие делает предположение более правдоподобным и может подсказать путь, на котором удалось бы доказать само предположение.

Как обстоит дело с нашим случаем? Мы вывели из изопериметрической теоремы несколько следствий; какое из них является наиболее доступным?

(1) Некоторые из следствий, выведенных в предыдущем параграфе из изопериметрической теоремы, в действительности относятся к элементарным задачам на максимум. Имеется ли какое-нибудь следствие, которое мы могли бы подтвердить? Просмотрим различные случаи, указанные рис. 10.3—10.6. Какой из них самый простой? Сложность многоугольника возрастает с увеличением числа его сторон. Следовательно, простейшим из всех многоугольников является треугольник;

Рис. 10.5. Дидона и Штейнер.

Рис. 10.6. Сегменты из картона.

конечно, нам больше всего нравится треугольник, потом, что мы о нем больше всего знаем. Но задача рис. 10.3 и 10.4 для треугольников теряет смысл, или, мы можем сказать, в случае треугольника она бессодержательна: треугольник с заданными сторонами является определенным, жестким. Для треугольника нет никакого перехода, подобного переходу от рис. 10.3 к рис. 10.4. Однако переход от рис. 10.5 к рис. 10.6 для треугольников вполне возможен. Это, пожалуй, самое простое следствие, выведенное нами до сих пор из изопериметрической теоремы; исследуем его.

Простейший частный случай результата, выведенного в § 5(3), решает следующую задачу: Даны две стороны треугольника; найти максимум его площади; см. рис. 10.7. Ответ получен в § 5(3): площадь наибольшая, когда треугольник вписан в полукруг, диаметром которого служит первоначально не заданная сторона. Это, однако, означает, что площадь наибольшая, когда две данные стороны заключают прямой угол, что очевидно (пример 8.7).

Нам удалось подтвердить первое следствие изопериметрической теоремы. Такая удача, естественно, поднимает наше настроение. Что кроется за только что подтвержденным фактом? Не могли бы мы подтвердить какое-нибудь другое следствие?

(2) Обобщая задачу, рассмотренную в (1), приходим к следующей задаче: Даны величины всех последовательных сторон многоугольника, за исключением одной. Найти максимум площади.

Введем подходящие обозначения и начертим рис. 10.8. Длины сторон АВ, ВС, KL заданы; длина стороны LA не задана. Мы можем представлять себе ломаную линию ABC ... F ...KL как своего рода «сверхпалец»: «кости» AB, ВС, KL имеют постоянную длину, углы в суставах В, С, F, К переменны. Требуется сделать площадь ABC ... KL А максимальной.

Как и в некоторых задачах, рассмотренных нами ранее (§§ 8.4 и 8.5), характерная трудность, по-видимому, состоит в том, что переменных много (углы в В, С, ..., F, ... и К). Однако только что, в (1), мы рассмотрели крайний частный случай задачи, когда имеется всего лишь один переменный угол (один лишь сустав; рис. 10.7). Естественно надеяться, что мы сможем воспользоваться этим частным случаем как точкой опоры для решения общей задачи.

Рис. 10.7. Палец с одним суставом.

Рис. 10.8. Сверхпалец.

Действительно, рассмотрим задачу как почти решенную. Представим себе, что мы уже получили искомые значения всех углов, за исключением одного. На рис. 10.9 мы считаем угол в F переменным, но все другие углы, в В, С, K — фиксированными; суставы В, С, ...» К жесткие, и только F гибкий. Соединим А и L с F. Длины AF и LF постоянны. Весь многоугольник ABC ... F ... KL А разлагается теперь на три части, две из которых жесткие (из картона) и только третья может изменяйся. Многоугольники ABC ... FA и LK ... FL жесткие. Треугольник AFL имеет две данных стороны, F А и FL, и переменный угол в F. Площадь этого треугольника и с ней площадь всего многоугольника ABC ... F ... KL А становится максимальной, когда Z.AFL является прямым углом, как мы только что сказали в (1), рассматривая на рис. 10.7.

Это рассуждение, очевидно, в такой же степени применимо и к другим суставам, т. е. к углам в S, С, ... и К (рис. 10.8), и, таким образом, мы видим: площадь многоугольника ABC ... KL А не может быть максимальной у если первоначально не заданная сторона AL не стягивает в каждой из вершин, не принадлежащих к ней, в В, С, ... . ..,F,.. .,К, прямой угол. Если наибольшая площадь существует, то она должна достигаться в только что описанной ситуации. То, что наибольшая площадь существует, мы можем считав не требующим доказательства и, немножко вспоминая элементарную геометрию, следующим образом можем описать эту ситуацию в других выражениях: максимум площади достигается в том и только в том случае, если многоугольник вписан в полукруг, диаметром которого является первоначально не заданная сторона.

Мы получили в точности тот же результат, что и в § 5(3), но здесь мы не пользовались изопериметрической теоремой, а там пользовались.

(3) Сначала, в (1), мы подтвердили очень специальное следствие изопериметрической теоремы, затем, в (2), значительно более широкое следствие. Мы развили теперь, пожалуй, достаточную скорость, чтобы взяться за другое широкое следствие, выведенное выше, в § 5(2).

Сравним два многоугольника ABC ... KL и А'В'С ...K'L'\ см. рис. 10.10. Соответствующие стороны равны, АВ = А'В', ВС = В'С\ KL = K'L'у LA = LrAfy но некоторые углы различны; ABC ...KL вписан в круг, а А'В'С ... К'V нет.

Соединим вершину J многоугольника ABC ... KL с центром описанной окружности и проведем диаметр JМ. Если случайно точка M совпадет с вершиной многоугольника ABC ... KL, наша задача

Рис. 10.9. Только один сустав гибкий.

значительно упростится [мы могли бы в этом случае немедленно воспользоваться результатом, полученным в (2)]. Если нет, то M лежит иа окружности между двумя соседними вершинами вписанного многоугольника, скажем, А и В. Проведем MA, МБ, рассмотрим △АМВ (заштрихованный на рис. 10.10) и построим △А'М'В' на основании А'В' (также заштрихованный), равный △ АМВ. Наконец, проведем f М'.

Многоугольник АМВС ...Kl делится прямой JM на две части (см. рис. 10.10); многоугольник А'М'В'С ...K'L' соответствующим образом делится прямой f М'. Применим к обеим частям теорему, доказанную в (2). Площадь многоугольника МВС-... J, вписанного

в полукруг, не меньше, чем площадь многоугольника М' В'С____Г;

действительно, все соответствующие стороны, за исключением MJ и M'f, равны, и лишь сторона MJ, образующая диаметр полукруга, может отличаться от M'f. По той же причине площадь многоугольника MALK ... J не меньше, чем площадь M'A'L'K'____У. Складывая, получаем, что

площадь АМВС ... KL > площади А'М'В'С ... K'L'.

Однако

△ ЛМ£ = △ А'М'В'.

Вычитая, получаем, что

площадь ABC ... Kl > площади А'В'С ... K'L'.

Площадь многоугольника, вписанного в круг, больше, чем площадь любого другого многоугольника с такими же сторонами.

Мы получили здесь в точности тот же результат, что и в § 5 (2), но здесь мы не пользовались изопериметрической теоремой, а там пользовались.

(Первое неравенство между площадями сложенных многоугольников содержит знак >, хотя добросовестный читатель мог ожидать знак Рассмотрим этот несколько более тонкий пункт. Я утверждаю,

Рис. 10.10. Один многоугольник вписан, другой нет.

чю многоугольник А'М'В'С ... К'L' не может быть вписан вкруг; в противном случае А'В'С ... КL' также можно было бы вписать в круг, что неверно. Я утверждаю, что оба многоугольника М' В'С ... У и M'A'L'K' нельзя вписать в полукруг с диаметром M'J';

в противном случае весь многоугольник А'М'В'С ... К'L' можно было бы вписать в круг, что неверно. Поэтому слова «не меньше», дважды употребленные при выводе рассматриваемого неравенства, по крайней мере один раз можно заменить словом «больше»)1).

7. Очень близко. Следствия, которые нам удалось подтвердить, делают изопериметрическую теорему чрезвычайно правдоподобной. Больше того, у нас, возможно, появилось чувство, что эти следствия «многое содержат», что мы «очень близки» к окончательному решению, к полному доказательству.

(1) Найти многоугольник с данным числом сторон и данным периметром, имеющий наибольшую площадь.

Если такой многоугольник существует, то он должен быть вписанным в круг. Это мы можем непосредственно заключить из нашего последнего замечания, § 6 (3).

С другой стороны, рассмотрим задачу как почти решенную. Допустим, что мы уже знаем правильные положения всех вершин, за исключением одной., скажем Х. Другие n — 1 вершин, скажем U, ...,W, У и Z, уже фиксированы. Весь многоугольник U... WXYZ состоит из двух частей: многоугольника U ... WYZ с n—1 уже фиксированными вершинами, который не зависит от X, и △ WXY, зависящего от Х. У этого треугольника, △ WXY, мы знаем основание WY и сумму двух других сторон WX+XY; в самом деле, остающиеся n — 2 стороны многоугольника предполагаются известными, а мы в действительности знаем сумму всех n сторон. Площадь △ WXY должна быть наибольшей. Однако почти очевидно, что площадь △ WXY с известным основанием и периметром достигает своего максимума, когда треугольник является равнобедренным (пример 8.8). Таким образом, WX=XY, две смежные стороны искомого многоугольника равны. Поэтому (в силу симметрии условий и схемы частного изменения) любые две смежные стороны равны. Все стороны равны: искомый многоугольник является равносторонним.

Искомый многоугольник, вписанный в круг, а также равносторонний, необходимо является правильным: Из всех многоугольников с данным числом сторон и данным периметром наибольшую площадь имеет правильный многоугольник.

(2) Два правильных многоугольника, один с п. а другой с n + 1 сторонами, имеют один и тот же периметр. Какой имеет большую площадь?

1) Теоремы и доказательства этого параграфа принадлежат Люильеру, см. примечание на стр. 157.

Правильный многоугольник с /1+1 сторонами, как мы только что [в (1)] видели, имеет площадь большую, чем неправильный многоугольник с rt+l стороной и тем же периметром. Но правильный многоугольник с n сторонами, каждая из которых равна, скажем, а, можно рассматривать как неправильный многоугольник с л+1 сторонами, имеющий n — 1 сторон длины а, две стороны длины а/2 и один угол, равный 180°. (Середину одной стороны многоугольника, понимаемого обычным образом, считайте вершиной, и тогда вы придете к этому менее привычному пониманию.) Итак, правильный многоугольник с л+1 сторонами имеет большую площадь, чем правильный многоугольник с n сторонами и тем же периметром,

(3) Круг и правильный многоугольник имеют один и тот же периметр. Что имеет большую площадь?

Продумаем, что означает полученный в (2) результат. Возьмем л=3, 4, ... и сформулируем результат в каждом частном случае. Переходя от равностороннего треугольника к квадрату с тем же периметром, мы находим, что площадь возросла. Переходя от квадрата к правильному пятиугольнику с тем же периметром, вновь находим, что площадь возросла. И так далее, переходя от одного правильного многоугольника к следующему, от пятиугольника к шестиугольнику, от шестиугольника к семиугольнику, от n .к л+1, мы видим, что площадь с каждым шагом возрастает, когда периметр остается неизменным. В конечном счете в пределе мы получаем круг. Его периметр все еще тот же, но его площадь, очевидно, превосходит площадь любого правильного многоугольника, пределом бесконечной последовательности которых он является. Площадь круга больше, чем площадь любого правильного многоугольника с тем же периметром.

(4) Круг и произвольный многоугольник имеют один и тот же периметр. Что имеет большую площадь?

Круг. Это немедленно следует из (1) и (3).

(5) Круг и произвольная фигура имеют один и тот же периметр. Что имеет большую площадь?

Круг. Это следует из (4), так как любая фигура является пределом многоугольников. Мы доказали изопериметрическую теорему!

8. Три формы изопериметрической теоремы. В предыдущих параграфах (§§ 6 и 7) мы доказали изопериметрическую теорему в следующей формулировке:

I. Из всех плоских фигур равного периметра наибольшую площадь имеет круг.

Однако в § 2 мы рассматривали другую формулировку:

II. Из всех плоских фигур равной площади наименьший периметр имеет круг.

Эти две формулировки различны и различны не только словесно. Они нуждаются в некотором дальнейшем объяснении.

(1) Две фигуры называются «изопериметрическими», если их периметры равны. «Из всех изопериметрических плоских фигур наибольшую площадь имеет круг» — вот традиционная редакция формулировки I, которая объясняет название «изопериметрическая теорема».

(2) Мы можем называть эти две формулировки теоремы (I и II) «сопряженными формулировками» (см. § 8.6). Мы докажем, что эти два сопряженных утверждения равносильны одно другому, показав, что оба они равносильны одному и тому же третьему.

(3) Пусть A обозначает площадь, a L —длину периметра данной фигуры. Допустим, что данная фигура и круг радиуса r являются изопериметрическими: L = 2nr. Тогда первая форма изопериметрической теоремы (формулировка I) утверждает, что

Подставляя вместо г его выражение через L, r = L/2n, легко преобразуем неравенство:

Назовем это неравенство изопериметрическим неравенством, а частное в левой части — изопериметрическим частным. Это частное зависит только от формы фигуры и не зависит от ее размеров. Действительно, если, не изменяя формы, мы увеличим линейные размеры фигуры в отношении 1 :2, то периметр станет равен 2L, а площадь 4 A, но частное A/L2 останется неизменным, и это же верно для 4tt/4/L2 и для увеличения в любом отношении. Некоторые авторы называют изопериметрическим частным A/L2; мы ввели множитель 4я, чтобы сделать наше изопериметрическое частное в случае круга равным 1. В этой терминологии мы можем сказать:

III. Из всех плоских фигур наибольшее изопериметрическое частное имеет круг1).

Это третья форма изопериметрической теоремы.

(4) Мы пришли к третьей форме теоремы, отправляясь от фигур с равным периметром. Теперь начнем с утверждения III и перейдем к фигурам с равной площадью. Допустим, что фигура с площадью А и периметром L имеет ту же площадь, что и круг радиуса r, т. е. A —яг2. Подставляя вместо A это выражение, легко преобразовать изопериметрическое неравенство в 2яг. Это означает, что периметр этой фигуры больше, чем периметр круга с равной площадью. Мы пришли ко второй сопряженной форме теоремы, к утверждению II.

(5) Мы могли бы, конечно, провести это рассуждение в обратном направлении и, переходя через III, из II вывести I. И, таким образом, мы можем убедиться, что все три формы равносильны.

1) Записывая вместо «изопериметрическое частное» сокращенно И. Ч., мы могли бы сказать, что круг имеет наибольшее И. Ч.

9. Приложения и вопросы. Если Дидона заключила с туземцами сделку в окрестности мыса, то ее задача была, пожалуй, больше похожа не на рассмотренную в § 5(1), а на следующую:

Дан угол (бесконечная часть плоскости между двумя лучами, проведенными из одной и той же начальной точки). Найти наибольшую площадь, отсекаемую от него линией данной длины.

На рис. 10,11 вершина данного угла обозначена буквой M (мыс). Предполагается, что произвольная линия, соединяющая точки X и Y, имеет данную длину /, Требуется сделать максимальной треугольную площадь между этой кривой и берегом моря. Мы можем передвигать концы X и Y кривой и видоизменять ее форму, но не можем изменять ее длину /.

Задача не слишком легка, но является одной из тех задач, которые частный выбор данных делает более доступными. Если угол в M прямой, то мы можем взять зеркальное отражение фигуры сначала относительно одной стороны угла, а затем относительно другой. Мы получим таким образом новую фигуру, рис. 10.12, и новую задачу. Линия XY, учетверенная отражениями, дает новую замкнутую линию данной длины 4/. Площадь, максимум которой нужно найти, учетверенная отображениями, дает новую площадь, целиком окруженную новой данной кривой, и нужно найти максимум этой новой площади. В силу изопериметрической теоремы решением новой задачи служит круг. Этот круг имеет две данные оси симметрии, XX' и YY\ и, таким образом, его центр находится в точке пересечения этих двух осей, в точке М. Следовательно, решением первоначальной задачи (задачи Дидоны) является квадрант: четверть круга с центром в вершине данного угла.

Мы, естественно, вспоминаем здесь решение задачи из § 5(1), основанное на рис. 10.2, и замечаем, что оно совершенно аналогично настоящему решению. Легко видеть, что существует бесконечное множество дальнейших частных случаев, в которых годится этого рода решение. Если данный угол в M равен 360°/2л= 180°/л, то

Рис. 10.11. Задача Дидоны, усложненная мысом.

Рис. 10.12. Иногда ее решают отражения.

мы можем с помощью повторных отражений преобразовать кривую ХУ данной длины / в новую замкнутую кривую длины 2л/, а предложенную задачу в новую задачу, решением которой в силу изопериметрической теоремы будет круг. Случаи, разобранные в § 5(1) и в настоящем параграфе, как раз являются в этой бесконечной последовательности первыми двумя случаями, соответствующими л=1 и 2.

Таким образом, если угол с вершиной в M имеет специальный вид (180% при целом л), то решением нашей задачи (рис. 10.11) будет дуга окружности с центром в М. Естественно ожидать, что эта форма решения не зависит от величины угла (по крайней мере пока он не превышает 180°). Таким образом, мы делаем предположение, что решением задачи рис. 10.11 независимо от того, имеет ли угол с вершиной в M специальный вид 180°/n или нет, является дуга окружности с центром в М. Это предположение есть индуктивное предположение, подкрепленное в бесконечном множестве случаев, /1=1, 2, 3, доказательством. Верно ли это предположение?

Рассмотренное приложение изопериметрической теоремы и связанный с ним вопрос могут побудить нас ожидать много подобных же приложений и вопросов. Наш вывод теоремы поднимает дальнейшие вопросы; ее аналоги в пространственной геометрии и математической физике подсказывают новые вопросы. Изопериметрическая теорема, глубоко коренящаяся в нашем опыте и интуиции, которую так легко предположить, но не так легко доказать, служит неисчерпаемым источником вдохновения.

ПРИМЕРЫ И ПРИМЕЧАНИЯ К ГЛАВЕ X

Первая часть

1. Взгляд назад. В предыдущих параграфах (§§ 6—8) мы доказали изопериметрическую теорему — доказали ли? Проверим рассуждение шаг за шагом.

По-видимому, нет возражений против простого результата § 6(1). Однако при решении задачи в § 6(2) мы без доказательства допустили существование максимума; и это же мы сделали в § 7(1). Не лишают ли силы наш результат эти недоказанные допущения?

2. Могли бы вы вывести какую-либо часть этого результата иначе? Непосредственно убедитесь в том, что верен простейший нетривиальный частный случай результата, найденного в §5(2), т. е. независимо от §6(3) докажите, что площадь четырехугольника, вписанного в круг, больше, чем площадь любого другого четырехугольника с такими же сторонами. [Пример 8.41.]

3. Заново с большими подробностями проведите рассуждение из § 7(2): постройте многоугольник с n + 1 сторонами, имеющий тот же периметр, что и правильный многоугольник с n сторонами, но большую площадь.

4. Докажите независимо от § 7(3), что круг имеет большую площадь, чем правильный многоугольник с тем же периметром.

5. Докажите более общее утверждение, что круг имеет большую площадь, чем многоугольник с тем же периметром, в который можно вписать окружность.

6. Заново, с большими подробностями проведите рассуждение из § 7(5). Доказывает ли оно утверждение I § 8? Есть ли какое-нибудь возражение?

7. Можете ли вы воспользоваться этим методом для решения какой-нибудь другой задачи? Воспользуйтесь методом § 8, чтобы доказать, что равносильны следующие два утверждения:

«Из всех ящиков с данной площадью поверхности наибольший объем имеет куб».

«Из всех ящиков с данным объемом наименьшую площадь поверхности имеет куб».

8, Более сильная форма изопериметрической теоремы. Сравните утверждения I, II и III § 8 со следующими.

I'. Площадь круга больше, чем площадь любой другой плоской фигуры с тем же периметром,

II', Периметр круга меньше, чем периметр любой другой плоской фигуры с той же площадью.

III'. Если А — площадь плоской фигуры, a L — ее периметр, то

и равенство достигается в том и только в том случае, если эта фигура —круг. Покажите, что Г, 1Г и ПГ между собой равносильны. Доказали ли мы Г?

9. Дана фигура С с периметром L и площадью A; С не является кругом. Постройте фигуру С с тем же периметром L, но с площадью А', большей чем А.

Эта задача важна (почему?), но не слишком легка. Если вы не можете решить ее в полной общности, то решите ее в существенных частных случаях; поставьте уместные вопросы, которые могут подвести вас ближе к ее общему решению; попытайтесь заново ее сформулировать; попытайтесь подойти к ней с той или иной стороны.

10. Даны четырехугольник С с входящим углом, его периметр L и площадь А. Постройте треугольник С с тем же периметром L, но с площадью А', большей чем А.

11. Обобщите пример 10.

12. Информация «С не есть круг» является «чисто отрицательной». Могли бы вы охарактеризовать С более «положительно» каким-нибудь способом, который дал бы вам точку опоры для того, чтобы взяться за решение примера 9?

[Любые три точки произвольной кривой лежат на одной окружности или на одной прямой. Что можно сказать о четырех точках?]

13. Дана фигура С с периметром L и площадью А; на кривой, ограничивающей фигуру С, существуют четыре точки Р, Q, R и S, не лежащие ни на одной окружности, ни на одной прямой. Постройте фигуру С с тем же периметром L, но с площадью А', большей чем А. [Пример 2.]

14. Сравните следующие два вопроса.

Рассмотрим фигуры с данным периметром. Если С — такая фигура, но не круг, то мы можем построить другую фигуру С с большей площадью. (Действительно, это сделано в примерах 10—13. Условие, что С не круг, существенно; наше построение не увеличивает площади круга.) Можем ли мы отсюда заключить, что круг имеет наибольшую площадь?

Рассмотрим положительные целые числа. Если n — такое число, но не 1, то мы можем построить другое целое число л', большее чем п. (Действительно, положим п' = n2. Условие n > I существенно; наше построение не годится для n=1, так как I2 = 1.) Можем ли мы отсюда заключить, что 1 —наибольшее целое число?

Укажите отличие, если оно существует.

15. Докажите утверждение Г примера 8.

Вторая часть

16. Палка и веревка. Даны палка и веревка; каждый конец веревки (которая, конечно, должна быть длиннее палки) привязан к соответствующему концу палки. Окружите этим устройством наибольшую возможную площадь.

Положите палку. Ее концы А и В полностью определяют ее положение. Однако веревка может принимать бесконечно много форм, образуя произволь-

ную кривую данной длины, начинающуюся в A и кончающуюся в В; см. рис. 10.13. Одной из возможных форм веревки является дуга окружности, заключающая вместе с палкой круговой сегмент. Дополните круг, добавив другой сегмент (заштрихованный на рис. 10.14, I), и этот же сегмент прибавьте к фигуре, образованной палкой и произвольным положением веревки (рис. 10.14, II). Круг I рис. 10.14 имеет большую площадь, чем любая другая фигура с тем же периметром, а II на рис. 10.14 и есть такая фигура. Вычитая один и тот же (заштрихованный) сегмент из I и II, находим результат: площадь, окруженная палкой и веревкой, будет наибольшей, когда веревка образует дугу окружности.

Этот результат остается справедливым, если мы прибавим к переменной площади на рис. 10.13 по ее постоянной прямой граничной линии любую постоянную площадь. Это замечание оказывается полезным.

Выскажите сопряженный результат, т. е. сформулируйте факт, который имеет такое же отношение к теореме II § 8, какое только что найденный факт имеет к теореме I § 8.

17. Дан угол (бесконечная часть плоскости между двумя лучами, проведенными из одной и той же начальной точки) и две точки, по одной на каждой стороне угла. Найдите наибольшую площадь, отсекаемую от угла линией данной длины, соединяющей две данные точки. (На рис. 10.11 точки X и К заданы.)

18. Дан угол, меньший чем 180°, и точка на одной из его сторон. Найдите наибольшую площадь, отсекаемую от угла линией данной длины, начинающейся в данной точке. (На рис. 10.11 точка X задана, но точка Y является переменной.)

19. Дан угол, меньший чем 180°. Найдите наибольшую площадь, отсекаемую от угла линией данной длины. (На рис. 10.11 точки X и Y являются переменными. Предположение было высказано в § 9.)

20. Дан угол, меньший чем 180°. Найдите наибольшую площадь, отсекаемую от угла прямолинейным отрезком данной длины.

21. Две палки и две веревки. Имеем две палки: AB и CD. Первая веревка привязана к последней точке В первой палки одним концом и к первой точке С второй палки другим концом. Вторая веревка подобным же образом связывает D и А. Окружите этим устройством наибольшую возможную площадь.

22. Обобщите.

23. Перейдите к частному случаю и таким путем получите элементарную теорему, игравшую в этой главе важную роль.

Рис. 10.13. Палка и веревка.

Рис. 10.14. Принцип дуги окружности.

24. Дана окружность в пространстве. Найдите поверхность с данной площадью, ограниченную данной окружностью и заключающую вместе с кругом, ограниченным данной окружностью, наибольший объем. [Знаете ли вы какую-нибудь аналогичную задачу?]

25. Задача Дидоны в пространственной геометрии. Дан трехгранный угол (одна из восьми бесконечных частей, на которые пространство разбивается тремя плоскостями, пересекающимися в одной точке). Найдите наибольший объем, отсекаемый от трехгранного угла поверхностью данной площади.

Эта задача слишком трудна. От вас требуется только выбрать более доступный частный случай.

26. Найдите задачу, аналогичную примеру 25, результат которой вы можете предвидеть. [Обобщите, перейдите к частному случаю, перейдите к пределу, ... ]

27. Биссекторы плоской области. Рассмотрим плоскую область, ограниченную некоторой кривой. Дуга, соединяющая две точки граничной кривой, называется биссектором области, если она делит область на две части равной площади.

Покажите, что любые два биссектора одной и той же области имеют по крайней мере одну общую точку.

28. Сравните два биссектора квадрата. Один — прямолинейный отрезок, параллельный одной из сторон и проходящий через центр квадрата. Другой — четверть окружности с центром в вершине квадрата. Какой из них короче?

29. Найдите кратчайший прямолинейный биссектор равностороннего треугольника.

30. Найдите кратчайший биссектор равностороннего треугольника.

31. Покажите, что кратчайшими биссекторами круга являются его диаметры.

32. Найдите кратчайший биссектор эллипса.

33. Попытайтесь сформулировать общие теоремы, охватывающие примеры 28—32.

34. Биссекторы замкнутой поверхности1). Замкнутая кривая без самопересечений, лежащая на замкнутой поверхности, называется биссектором этой поверхности, если она делит поверхность на две части (открытые поверхности) равной площади.

Покажите, что любые два биссектора одной и той же поверхности имеют по крайней мере одну общую точку.

35. Кратчайший биссектор поверхности многогранника состоит из кусков, каждый из которых есть или прямолинейный отрезок, или дуга окружности.

36. Кратчайший биссектор поверхности правильного многогранника является правильным многоугольником. Найдите его форму и расположение и число решений для каждого из пяти правильных многогранников. (Можете экспериментировать с моделью многогранника и резиновой лентой.)

37. Покажите, что кратчайшими биссекторами сферы являются большие круги.

38. Попытайтесь найти обобщение примера 37, охватывающее и существенную часть примера 36. [Примеры 9.23, 9.24.]

39. Дан шар 5 радиуса а. Назовем диафрагмой S ту часть сферической поверхности, пересекающей S, которая находится внутри S. Докажите:

(1) Все диафрагмы, проходящие через центр шара 5, имеют одинаковую площадь.

(2) Никакая диафрагма, делящая объем шара 5 пополам, не имеет площади, меньшей чем па2.

Последнее утверждение и рассмотренные аналогичные случаи подсказывают предположение. Сформулируйте его. [Примеры 31, 37.]

1) Мы рассматриваем здесь только замкнутые поверхности «топологического типа» сферы и исключаем, например, (баранкообразный) тор.

40. Фигура многих совершенств. Рассмотрим плоскую область, ограниченную некоторой кривой. Мы хотим обозреть некоторые из большого числа теорем, аналогичных изопериметрической теореме; Из всех областей с данной площадью наименьший периметр имеет круг.

Мы уже встречались с одной теоремой этого рода. В § 4 мы рассмотрели некоторые индуктивные доводы в пользу утверждения: Из всех мембран с данной площадью наиболее низкий основной тон издает круглая мембрана.

Рассмотрим теперь область как однородную пластинку постоянной толщины. Рассмотрим момент инерции этой пластинки относительно перпендикулярной к ней оси, проходящей через ее центр тяжести. Этот момент инерции, который мы назовем «полярным моментом инерции», зависит при прочих равных условиях от размера и формы пластинки. Из всех пластинок с данной площадью наименьший полярный момент имеет круглая пластинка.

Эта пластинка, если она является проводником электричества, может также вместить электрический заряд, пропорциональный ее электростатической емкости. Емкость также зависит от размера и формы пластинки. Из всех пластинок с данной площадью наименьшую емкость имеет круглая пластинка.

Пусть теперь область является поперечным сечением однородного упругого бруса. Если мы попытаемся закрутить такой брус вокруг его оси, то сможем заметить, что он сопротивляется скручиванию. Это сопротивление, или «жесткость на кручение», бруса зависит при прочих равных условиях от размера и формы поперечного сечения. Из всех поперечных сечений с данной площадью наибольшую «жесткость на кручение» имеет круглое поперечное сечение1).

Почему круг является решением такого большого числа таких различных задач на максимум и минимум? В чем «причина»? Не является ли «истинной причиной» «совершенная симметрия» круга? Такие туманные вопросы могут быть стимулирующими и плодотворными, если только вы не просто с удовольствием занимаетесь туманными разговорами и размышлениями, но серьезно пытаетесь спуститься к чему-нибудь более точному или более конкретному.

41. Аналогичный случай. Не видите ли вы аналогии между изопериметрической теоремой и теоремой о средних? (См. § 8.6)

Длина замкнутой кривой одинаково зависит от каждой точки, или от каждого элемента этой кривой. И площадь области, ограниченной кривой, также одинаково зависит от каждой точки, или элемента этой кривой. Мы разыскиваем максимум площади, когда длина задана. Поскольку обе рассматриваемые величины имеют такую природу, что никакая точка кривой не играет в их определении предпочтительной роли, мы не должны удивляться, что решением является единственная такая кривая, которая содержит каждую из своих точек одинаковым образом и любые два элемента которой наложимы один на другой: окружность.

Сумма х1 + х2 + ... + xn есть симметрическая функция переменных хА, х2> ⋅..» *л> т. е- она одинаково зависит от каждой переменной. И произведение *л одинаково зависит от каждой переменной. Мы разыскиваем максимум произведения, когда сумма задана. Поскольку обе рассматриваемые величины являются симметричными относительно n переменных, мы не должны удивляться, что решение требует, чтобы xv = х2 = ... = xn.

Существуют, кроме площади и длины, и другие величины, зависящие от размеров и формы замкнутой кривой, которые «одинаково зависят от каждого элемента кривой»; несколько таких величин мы перечислили в примере 40. Мы разыскиваем максимум величины этого рода, когда другая величина этого же рода задана. Является ли решение, если оно существует, обязательно окружностью?

1) Доказательства указанных и аналогичных теорем см. в книге Г. Полиа и Г. Сеге, Изопериметрические неравенства в математической физике, М., 1962.

Для правдоподобного ответа обратимся к простейшему аналогичному случаю. Рассмотрим две симметрические функции f(xly хп) и g(xly х2> .... хп) от п

переменных и будем разыскивать экстремум функции f(xly xlt хп), когда задано, что^чХ, х2у хп) = \. Существуют случаи, когда нет максимума, другие случаи, когда нет минимума, и третьи случаи, когда нет ни максимума, ни минимума. Условие Ху = х2 = ... = xn играет важную роль1), но, когда достигается максимум или минимум, оно не обязано удовлетворяться. Имеет место, однако, простои факт. Если

ху = а1У х2 = аъ х3 = а3, xn = an

есть решение, то в силу симметрии функций / и g также и

*i = a2, х2 = а{у х3 = а3, ... , xn = an

является решением. Следовательно, если ах Ф <*г> то существуют по крайней мере два различных решения. Если существует единственное решение (т. е. экстремум достигается и достигается ровно для одной системы значений х1у хп), то это решение требует, чтобы x1 = хг = ... = xn. «Comparaison n'est pas raison»2) говорят французы. Конечно, такое сравнение, как только что сделанное, не может дать непреложного доказательства, а дает только эвристическое указание. Но мы иногда очень рады получить и такое указание.

Возьмите в качестве иллюстрации

и найдите экстремум / при условии g= \У рассмотрев (1) все действительные значения х1у х2у хк и (2) только неотрицательные действительные значения этих переменных.

42. Правильные многогранники. Найдите многогранник с данным числом n граней и сданной площадью поверхности, имеющий наибольший объем.

Эта очень трудная задача подсказывается аналогичной задачей § 7(1), которая подсказывает и предположение: если существует правильный многогранник с n гранями, то он дает наибольший объем. Однако, каким бы правдоподобным ни казалось это предположение, в двух случаях из пяти оно оказывается ошибочным. В действительности это предположение

верно для n = 4, 6, 12, неверно для n = 8, 20.

В чем различие? Попытайтесь подметить какое-нибудь простое геометрическое свойство, отличающее эти два вида правильных многогранников.

43. Индуктивные доводы. Пусть V обозначает объем тела, a S — площадь его поверхности. Сказанное в § 8(3) по аналогии наводит на мысль рассматривать по определению

как изопериметрическое частное в пространственной геометрии. По аналогии мы можем предположить, что наибольшее изопериметрическое частное имеет шар. Таблица III индуктивно подкрепляет это предположение.

1) Харди Г. Г., Литтлвуд Дж. Е. и Полиа Г., Неравенства, М., 1948, стр. 133—135 и цитированные там теоремы.

2) Сравнение не доказательство (франц.). — Прим. перев.

Проверьте некоторые из тел, приведенных в табл. III, и добавьте новый материал. В частности, попытайтесь найти тело с изопериметрическим частным, большим чем частное правильного икосаэдра.

Таблица III

Изопериметрическое частное 36лК2/53

Шар..................... 1,0000

Икосаэдр.................. 0,8288

Наилучший двойной конус........ 0,7698

Додекаэдр ................. 0,7547

Наилучшая призма ............ 0,6667

Октаэдр................... 0,6045

Куб..................... 0,5236

Наилучший конус............. 0,5000

Тетраэдр.................. 0,3023

По поводу терминов «наилучшие» двойной конус, призма и конус см. соответственно примеры 8.38, 8.35 и 8.52.

XI. ДРУГИЕ ВИДЫ ПРАВДОПОДОБНЫХ ДОВОДОВ

Индукция основывается на том, что простейшие отношения суть самые обыкновенные. — Лаплас1)

1. Предположения и предположения. Все наши предыдущие рассмотрения были посвящены выяснению роли предположений в математическом исследовании. Наши примеры дали нам возможность познакомиться с двумя видами правдоподобных аргументов, говорящих за или против высказанного предположения: мы рассмотрели индуктивные аргументы, основанные на подтверждении следствий, и аргументы, основанные на аналогии. Существуют ли другие виды полезных правдоподобных аргументов за или против предположения? Примеры настоящей главы имеют целью выяснить этот вопрос.

Нам следует также ясно понять, что существуют предположения различных видов: большие и малые, оригинальные и обычные предположения. Существуют предположения, сыгравшие яркую роль в истории науки, но и решение наиболее скромной математической задачи может нуждаться в каком-нибудь соответственно скромном предположении или догадке. Мы начнем с примеров из классной комнаты, а затем перейдем к другим примерам, имеющим историческое значение.

2. Суждение по родственному случаю. Работая над задачей, мы часто пытаемся догадаться. Конечно, нам хо.елось бы отгадать полное решение. Если, однако, это нам не удается, мы бываем вполне удовлетворены, когда можем отгадать ту или иную деталь решения. По крайней мере нам хотелось бы знать, является ли наша задача «разумной». Мы спрашиваем себя: Разумна ли наша задача? Можно ли удовлетворить условию? Достаточно ли условие для определения неизвестного? Или недостаточно? Или чрезмерно? Или противоречиво?2)

Такие вопросы возникают естественно и являются особенно полезными на ранней стадии нашей работы, когда они нуждаются не в окончательном ответе, а только в предварительном ответе, догадке,

1) Лаплас, Опыт философии теории вероятностей, М., 1908, стр. 187.

2) «Как решать задачу», стр. 202.

и бывают случаи, когда мы можем отгадать ответ вполне разумно и с очень небольшими усилиями.

В качестве иллюстрации рассмотрим элементарную задачу пространственной геометрии. Ось цилиндра проходит через центр шара. Поверхность цилиндра пересекает поверхность шара и делит шар на две части: «продырявленный шар» и «пробку». Первая часть расположена вне цилиндра, вторая — внутри. См. фигуру на рис. 11.1, которую нужно было бы вращать вокруг вертикальной прямой AВ. Даны радиус шара r и высота цилиндрического отверстия h. Найти объем продырявленного шара.

Знакомясь с предложенной задачей, вполне естественно приходим к обычным вопросам: Достаточны ли данные для определения неизвестного? Или они недостаточны? Или чрезмерны? Данные г и h кажутся как раз достаточными. Действительно, г определяет размер шара, a h — размер цилиндрического отверстия. Зная г и h, мы можем определить продырявленный шар по форме и размеру, и, с другой стороны, для его определения нам нужны г и h.

Однако, вычисляя искомый объем, мы находим, что он равен я/г3/6; см. пример 5. Этот результат кажется крайне парадоксальным. Мы убедились в том, что для определения формы и размеров продырявленного шара нам нужны и г и /г, а теперь оказалось, что для определения его объема г нам не нужно; это звучит совершенно неправдоподобно.

Тем не менее здесь нет противоречия. Если h остается постоянным, а г возрастает, то продырявленный шар заметно изменяется по форме: он становится шире (что ведет к увеличению объема), но его внешняя поверхность становится более плоской (что ведет к уменьшению объема). Мы только не предвидели (и это a priori кажется довольно невероятным), что эти две тенденции в точности уравновешиваются, и объем остается неизменным.

Чтобы понять и этот частный случай и лежащую в его основании общую идею, мы должны отделить одну от другой разные задачи. Нам следует ясно различать две родственные, но не одинаковые задачи. Если даны г и /г, то от нас может требоваться определить

(a) объем и

(b) форму и размер

продырявленного шара. Нашей первоначальной задачей было (а). Мы интуитивно видели, что задание г и h и необходимо и достаточно для решения (b). Отсюда следует, что этих данных достаточно и для

Рис. 11.1. Продырявленный шар.

решения (а), но не следует, что они необходимы для решения (а); и на самом деле они не необходимы.

Отвечая на вопрос: «Необходимы ли эти данные?», мы судила по родственному случаю, вместо (а) подставили (b), мы игнорировали различие между первоначальной задачей (а) и видоизмененной задачей (b). С эвристической точки зрения такое игнорирование может быть оправдано. Нам нужен был только предположительный, но быстрый ответ. Кроме того, такое различие обычно игнорируется: данные, которые необходимы для определения формы и размеров, обычно необходимы и для определения объема. Мы пришли к парадоксу, забыв, что наше заключение было только эвристическим, или как-то неясно веря, что необычное никогда не может случиться. А в нашем примере как раз и случилось необычное.

Суждение о предложенной задаче по видоизмененной задаче — оправданный, разумный эвристический прием. Мы не должны, однако, забывать, что заключение, к которому мы с помощью такого приема приходим, является только предположительным, не окончательным; только правдоподобным, но отнюдь не безусловно верным.

3. Суждение по общему случаю. Следующая задача может быть подходящим образом изложена в классе алгебры для начинающих.

Завещание одного отца трем сыновьям содержит следующие распоряжения.

«Часть моего старшего сына будет равна среднему частей двух других сыновей и трем тысячам долларов. Часть моего второго сына должна быть в точности равна среднему частей двух других. Часть моего младшего сына будет равна среднему двух других без трех тысяч долларов». Каковы эти части?

Достаточно ли условие для определения неизвестных? Имеются достаточные основания сказать да. Действительно, имеются три неизвестных — соответственно части старшего, среднего и младшего сыновей, скажем х, у и z. Каждое из трех приведенных из завещания предложений может быть переведено в уравнение. Далее, вообще говоря, система трех уравнений с тремя неизвестными определяет эти неизвестные. Таким образом, мы совершенно разумно приходим к мысли, что условие предлагаемой задачи достаточно для определения неизвестных.

Выписав, однако, эти уравнения, получаем следующую систему:

Складывая эти три уравнения, получаем

Поэтому любое уравнение этой системы является следствием двух других уравнений. Наша система содержит только два независимых уравнения и, следовательно, на самом деле недостаточна для определения неизвестных.

Задача существенно изменяется, если завещание содержит также и следующее распоряжение: «Я делю все мое состояние, состоящее из 15 000 долларов, между моими тремя сыновьями». Это распоряжение прибавляет к написанной выше системе уравнение

*-f_y-fz=15 000.

Мы имеем теперь более широкую систему из четырех уравнений. Но, вообще говоря, система аз четырех уравнений с тремя неизвестными противоречива. На самом же деле, однако, наша система не противоречива, а как раз достаточна для определения неизвестных, и она дает

x = 7000, ^ = 5000, г = 3000.

Из кажущихся противоречий этого не слишком глубокого примера не так уж трудно выпутаться, но тщательное объяснение может оказаться полезным.

Не верно, что «система n уравнений с n неизвестными определяет неизвестные». В самом деле, мы только что видели противоречащий пример при n=3. То, о чем здесь идет речь, является, однако, не математической теоремой, а эвристическим утверждением, в действительности следующим утверждением: «Система n уравнений с n неизвестными, вообще говоря, определяет неизвестные». Слова «вообще говоря» можно понимать по-разному. Здесь речь идет о несколько туманном и грубом «практическом» истолковании: утверждение имеет место «вообще говоря», если оно имеет место «в огромном большинстве таких случаев, которые, вероятно, должны естественно встретиться».

Собираясь решить геометрическую или физическую задачу с помощью алгебры, мы интуитивно пытаемся выразить рассматриваемое условие уравнениями. Каждый пункт этого условия мы пытаемся выразить каким-либо уравнением и стараемся исчерпать таким путем все условие. Если нам удается набрать столько уравнений, сколько У нас неизвестных, то мы надеемся, что сумеем определить эти неизвестные. Такая надежда разумна. Маши уравнения «встретились естественно»; мы можем ожидать, что находимся «в общем случае». Однако пример этого параграфа как раз не встретился естественно;

он был специально придуман, чтобы .выявить, что в эвристическом утверждении нет абсолютной несомненности. Таким образом, этот пример вовсе не лишает силы лежащий в основании эвристический принцип.

В повседневной жизни мы полагаемся на нечто подобное. С полным основанием мы не слишком боимся того, что очень необычно. Письма теряются, и поезда терпят крушение, и тем не менее я все еще посылаю письма и без колебания сажусь в поезд. В конце концов потери писем и крушения поездов чрезвычайно необычны; такой несчастный случай происходит только с очень небольшим процентом писем или поездов. Так почему же он должен произойти именно теперь? Подобным же образом, вполне естественно полученные n уравнений с n неизвестными могут оказаться недостаточными для определения неизвестных. Однако, вообще говоря, это не происходит; так почему же это должно произойти именно теперь?

Мы не можем жить и не можем решать задачи, не обладая хотя бы капелькой оптимизма.

4. Более простое предположение предпочтительнее. «Simplex sigillum verb, или «Простота — печать истины», говорили схоластики. Сегодня, когда человечество стало старше и обогатилось значительным научным опытом прошедших веков, нам следовало бы выразиться более осторожно: мы знаем, что истина может быть чрезвычайно сложной. Возможно, схоластики не имели в виду, что простота является необходимой принадлежностью истины; возможно, они намеревались высказать эвристический принцип: «То, что просто, имеет хорошие шансы оказаться истинным». Может быть даже лучше сказать еще меньше и ограничиться плоским советом: «Сначала попробуйте самое простое».

Этот, основанный на здравом смысле совет включает (правда, несколько туманно) эвристические приемы, рассмотренные ранее. То, что объем изменяется, когда изменяется форма,— это не только обычный случай, но и самый простой случай. То, что система n уравнений с n неизвестными определяет неизвестные,— это не только общий случай, но и самый простой случай. Разумно сначала попробовать самый простой случай. Даже если в конечном счете нам придется обратиться к более детальному исследованию более сложных возможностей, предшествующее исследование самого простого случая может послужить полезной подготовкой.

Сначала попробовать самое простое —это часть подхода, который выгоден при встрече с задачами, малыми или большими. Попытаемся представить себе (с значительным упрощением и, несомненно, с некоторым искажением) положение Галилея, когда он исследовал закон падения тел. Если эру современной науки мы хотим исчислять с какой-нибудь определенной даты, то дату этого исследования Галилея можно было бы рассматривать как наиболее подходящую.

Нам нужно ясно понять положение Галилея. Он имел нескольких предшественников, нескольких друзей, разделявших его взгляды, но ему решительно противодействовала господствовавшая философская школа, последователи Аристотеля. Эти последователи Аристотеля спрашивали: «Почему тела падают?» —и удовлетворялись каким-то поверхностным, почти чисто словесным объяснением. Галилей спрашивал: «Как тела падают?» —и пытался найти ответ из эксперимента, и притом точный ответ, который можно выразить в числах и математических понятиях. Эта замена «Почему» на «Как», поиски ответа с помощью эксперимента и поиски математического закона, сжато выражающего экспериментальные факты, в современной науке являются общим местом, но во времена Галилея они были революционным нововведением.

Камень, падающий с более высокого места, ударяется о землю сильнее. Баба, падающая из более высокой точки, вбивает сваю глубже в землю. Чем дальше падающее тело от своей начальной точки, тем быстрее оно движется —все это ясно из непосредственного наблюдения. Что самое простое? Кажется, достаточно просто допустить, что скорость тела, начинающего падать из положения покоя, пропорциональна пройденному расстоянию. «Этот принцип выглядит очень естественным, — говорит Галилей,— и он соответствует нашему опыту с машинами, приводимыми в действие с помощью удара». Тем не менее в конечном счете Галилей отверг пропорциональность скорости расстоянию как «не только ошибочную, но и невозможную»1).

Возражения Галилея против допущения, которое вначале казалось ему таким естественным, могут быть более ясно и отчетливо сформулированы в обозначениях анализа бесконечно малых. Это, конечно, анахронизм; анализ бесконечно малых был открыт после смерти Галилея и, по крайней мере частично, под влиянием его открытий. Тем не менее воспользуемся этим анализом. Пусть t обозначает время, протекшее с момента начала падения, а х — пройденное расстояние. Тогда скорость равна dx/dt (одним из достижений Галилея было то, что он сформулировал отчетливое понятие скорости). Пусть g — подходящая положительная постоянная. Тогда это «самое простое допущение», пропорциональность, скорости пройденному расстоянию, выражается дифференциальным уравнением

(1)

Мы должны добавить начальное условие

х = 0, когда ( = 0. (2)

1) См. Галилео Галилей, Избранные труды, М., 1964, т. 2, стр. 238—246.

Из уравнений (1) и (2) следует, что

(3)

это условие выражает тот факт, что падающее тело начинает двигаться из положения покоя.

Интегрируя дифференциальное уравнение (1), мы получаем, однако, что

где с — некоторая постоянная. Это дает Отсюда мы получаем, однако, что

что противоречит (1) и (2): движение, удовлетворяющее дифференциальному уравнению (1), не может начинаться из положения покоя. И, таким образом, предположение, которое казалось таким «естественным», именно «самым простым», на самом деле является внутренне противоречивым: «не только ошибочным, но и невозможным», как выразился Галилей.

Но что «следующее самое простое?» Можно допустить, что скорость падающего тела, начинающего двигаться из положения покоя, пропорциональна протекшему времени. Это —хорошо известный закон, к которому в конечном счете пришел Галилей. В современных обозначениях он выражается уравнением

и движение, удовлетворяющее этому уравнению, может, конечно, начинаться из положения покоя.

5. Фон1). Мы не можем не восхищаться свойственным Галилею мужеством ума, его свободой от философских предрассудков и ми-

1) В этом и в следующем параграфе, а также иногда и в других местах книги мы переводим словом фон английское слово background. Автор имеет в виду совокупность неосознанных мыслей и представлений человека, его опыт и знания, быть может, и в неокончательно оформленном виде, влияние окружающей его среды и мировоззрения, так сказать, весь его «умственный багаж». — Прим. перев.

стицизма. Однако мы должны восхищаться и достижениями Кеплера, а Кеплер, современник Галилея, находился под глубоким влиянием мистицизма и предрассудков своего времени.

Нам трудно ясно понять позицию Кеплера. Современный читатель поражается такому названию, как «Введение в космографические исследования, содержащее КОСМИЧЕСКУЮ ТАЙНУ о замечательной пропорции небесных орбит и подлинные и должные причины числа, величины и периодических движений небес, доказанные с помощью пяти правильных тел». Содержание еще более поразительно: астрономия переплетается с теологией, геометрия перемешана с астрологией. Однако, каким бы экстравагантным ни казалось кое-что из этого содержания, эта первая работа Кеплера отмечает начало его великих астрономических открытий и, кроме того, живо и привлекательно обрисовывает его личность. Его жажда знаний восхитительна, хотя она почти равняется его жажде таинственного.

Как совершенно правильно говорит название его работы, Кеплер намеревается открыть причину или основание числа планет, их расстояний от Солнца, периодов их вращения. В самом деле, он спрашивает: почему существует ровно шесть планет? Почему их орбиты расположены именно так? Эти вопросы звучат странно для нас, но не звучали так для некоторых из его современников1). Однажды он подумал, что нашел секрет, и записал в своей записной книжке: «Земная орбита, или сфера, является мерой всего. Опишите вокруг нее додекаэдр: сфера, окружающая его, есть Марс. Опишите вокруг Марса тетраэдр: сфера, окружающая его, есть Юпитер. Опишите вокруг Юпитера куб: сфера, окружающая его, есть Сатурн. Теперь впишите в Землю икосаэдр: сфера, содержащаяся в нем, есть Венера. Впишите в Венеру октаэдр: сфера, содержащаяся в нем, есть Меркурий. Теперь вы имеете основание для числа планет».

Таким образом, Кеплер представляет себе 11 концентрических поверхностей: 6 сфер, перемежающихся с 5 правильными многогранниками. Первая и самая внешняя поверхность — сфера, и каждая поверхность вписана в предыдущую. Каждая сфера связана с планетой: радиус сферы равен расстоянию (среднему расстоянию) планеты от Солнца. Каждый правильный многогранник вписан в предыдущую, окружающую сферу, и описан вокруг следующей, окруженной сферы.

И Кеплер добавляет: «Мне никогда не удастся найти слов, чтобы выразить свое восхищение этим открытием».

Кеплер (в этом отношении современный ученый) тщательно сравнивает свое предположение с фактами. Он составляет таблицу, представленную здесь в слегка модернизированной форме в качестве табл. I (см. стр. 214).

1) Кеплер отвергает объяснение Ретикуса: существует шесть планет, так как 6 является первым «совершенным числом».

Таблица I

Теория Кеплера в сравнении с наблюдениями

(I)

Наблюдение Коперника (2)

Теория Кеплера (3)

Правильные многогранники (4)

Сатурн........

Юпитер .......

Марс.........

Земля ........

Венера ........

Меркурий ......

0,635

0,333

0,757

0,794

0,723

0,577

0,333

0,795

0,795

0,577

Куб

Тетраэдр

Додекаэдр

Икосаэдр

Октаэдр

Столбец (1) перечисляет планеты в порядке убывания расстояний от Солнца; он содержит шесть строк, на одну больше, чем следующие столбцы. Столбец (2) содержит отношения расстояний двух соседних планет от Солнца, согласно Копернику; каждое отношение помещено между теми строками, где указаны названия соответствующих планет; расстояние внешней планеты — знаменатель. Столбец (4) перечисляет пять правильных многогранников в порядке, выбранном Кеплером. Столбец (3) указывает отношение радиусов вписанной и описанной сфер для соответствующего правильного многогранника. Числа в одной и той же строке должны находиться в согласии. На самом же деле согласие хорошее в двух случаях и очень плохое в трех остальных.

Теперь Кеплер (что менее славным образом напоминает нам современного ученого) начинает менять точку зрения и модифицировать свое первоначальное предположение. (Основная модификация состоит в том, что он сравнивает расстояние Меркурия от Солнца не с радиусом сферы, вписанной в октаэдр, а с радиусом окружности, вписанной в квадрат, по которому некоторая плоскость симметрии пересекает октаэдр.) Однако он не приходит к какому-нибудь потрясающему согласию между предположением и наблюдением. Все же он остается верен своей идее. Шар — «наиболее совершенное тело», и следующие за ним пять правильных многогранников, известных Платону, являются «благороднейшими телами». У Кеплера мелькает мысль, что бесчисленные мириады неподвижных звезд могут иметь какое-то отношение к неразличимому множеству неправильных тел. И ему кажется «естественным», что Солнце и планеты, самые превосходные творения, как-то связаны с самыми превосходными эвклидовыми телами. Это могло бы оказаться секретом мироздания, «Космической тайной».

С современной точки зрения предположение Кеплера может казаться нелепым. Мы знаем много связей между наблюдаемыми фактами и математическими понятиями, но это связи совсем другого характера.

Нам не известна ни одна полезная связь, которая имела бы какую-нибудь ощутимую аналогию с предположением Кеплера. Наиболее странным мы находим то, что Кеплер мог верить в существование чего-то глубоко скрытого за числом планет и задавать такой вопрос: Почему существует ровно шесть планет?

Может возникнуть искушение отнестись к предположению Кеплера как к странному заблуждению. Однако нам следовало бы учитывать возможность, что некоторые теории, которые мы с почтением обсуждаем сегодня, могут рассматриваться как странное заблуждение, если и не будут совершенно забыты, в недалеком будущем. Я думаю, что предположение Кеплера чрезвычайно поучительно. Оно с особой ясностью показывает обстоятельство, которое стоит иметь в виду: доверие, с которым мы относимся к предположению, неизбежно зависит от всего нашего фона, от всей научной атмосферы нашего времени.

6. Неисчерпаем. Предыдущий пример выдвигает на передний план важную особенность правдоподобных рассуждений. Попытаемся описать ее с известной степенью общности.

Мы имеем некоторое предположение, скажем А Это значит, что A —ясно сформулированное, но не доказанное предложение. Мы подозреваем, что А верно, но в действительности не знаем, верно А или нет. Все же у нас есть некоторая уверенность в своем предположении А. Такая уверенность может иметь, но не обязательно имеет, отчетливое основание. Предположение А совершенно внезапно возникает после продолжительной и явно безуспешной работы над какой-либо задачей. Это предположение А может казаться единственным выходом из запутанной ситуации; оно может казаться почти несомненным, хотя мы и не могли бы сказать почему.

Однако, когда пройдет известное время, нам могут прийти в голову какие-нибудь более отчетливые доводы, которые, хотя и не доказывают А, определенно говорят в его пользу: доводы по аналогии, по индукции, по родственным случаям, по общему опыту или по свойственной самому А простоте. Такие доводы, не давая строгого доказательства, могут сделать А очень правдоподобным.

Но то, что мы поверили в это предположение без каких-либо отчетливо сформулированных аргументов, должно было бы послужить нам предостережением.

И мы последовательно осознаем эти аргументы. Был первый ясный пункт, который нам удалось отделить от темного фона. Однако за этим пунктом в фоне есть еще что-то, так как впоследствии нам удалось выделить другой ясный аргумент. И таким же образом за каждым выясненным пунктом может быть еще что-то. Возможно, этот фон неисчерпаем. Возможно, наша уверенность в предположении никогда не основывается только на выясненных основаниях; такая уверенность может как-то нуждаться во всем нашем фоне как базисе,

Все же правдоподобные основания важны, и особенно важны выясненные правдоподобные основания. Имея дело с доступной наблюдению действительностью, мы никогда не можем прийти к доказанной истине, мы всегда должны полагаться на какое-то правдоподобное основание. Имея дело с чисто математическими вопросами, мы можем прийти к строгому доказательству. Однако прийти к нему может оказаться очень трудно, и рассмотрение предположительных, правдоподобных оснований может дать нам временную поддержку и может в конечном счете привести нас к открытию окончательного доказательства.

Эвристические доводы важны, хотя они ничего не доказывают. Выяснить наши эвристические доводы также важно, хотя за каждым так выясненным доводом может оказаться еще что-нибудь — возможно какое-нибудь все еще темное, еще более важное основание1).

Это подсказывает другое замечание: если в каждом конкретном случае мы можем выяснить только некоторые из наших правдоподобных оснований и ни в каком конкретном случае всех их не исчерпываем, то как могли бы мы надеяться исчерпывающим образом абстрактно описать все виды правдоподобных оснований?

7. Обычные эвристические допущения. Два из наших примеров (§§ 2 и 3) поднимают другой вопрос. Напомним кратко одну из ситуаций и коснемся сходной ситуации.

Работая над какой-нибудь задачей, вы получили из явно различных источников столько же уравнений, сколько у вас неизвестных. Вам следует знать, что n уравнений не всегда достаточно для определения n неизвестных: уравнения могут оказаться взаимно зависимыми или противоречивыми. Тем не менее, такой случай является исключительным, и, таким образом, разумно, пожалуй, надеяться, что ваши уравнения будут определять ваши неизвестные. Поэтому вы идете вперед, преобразуете свои уравнения и смотрите, что из них вытекает. Если имеется противоречие или неопределенность, то это как-то обнаружится. С другой стороны, если вы придете к точному результату, то можете почувствовать большую склонность потратить время и усилия на строгое доказательство.

Решая другую задачу, вы приходите к почленному интегрированию бесконечного ряда. Вам следует знать, что такая операция не всегда позволительна и может привести к неверному результату. Тем не менее такой случай является исключительным, и, таким образом, разумно, пожалуй, надеяться, что ваш ряд будет вести себя как следует. Поэтому может оказаться целесообразным идти вперед, посмотреть, что вытекает из вашей формулы, не полностью доказанной, и отложить заботы о полном доказательстве.

1) «Как решать задачу», стр. 200—201.

Мы коснулись здесь двух обычных эвристических допущений: одного относительно системы уравнений, другого относительно бесконечного ряда. Такие допущения имеются в каждой области математики, и одним из главных достоинств специалиста в этой области является знание распространенных допущений и знание того, как ими можно воспользоваться и насколько им можно доверять.

Конечно, не следует чрезмерно доверять ни любой догадке, ни обычным эвристическим допущениям, ни вашим собственным предположениям. Без доказательства верить что ваша догадка справедлива, было бы глупо. Однако предпринять какую-то работу в надежде, что ваша догадка может оказаться справедливой, пожалуй, разумно. Осторожный оптимизм — разумная позиция.

ПРИМЕРЫ И ПРИМЕЧАНИЯ К ГЛАВЕ XI

1. Даны основание треугольника а, высота А, опущенная на а, и угол а, противоположный а. Следует: (а) построить треугольник, (b) вычислить его площадь. Все ли данные необходимы?

2. Даны высота трапеции A, средняя линия m, параллельная двум основаниям трапеции и находящаяся от каждой из них на одинаковом расстоянии, и углы а и ß между одним из оснований и двумя остальными (наклонными) сторонами. Следует: (а) построить трапецию, (b) вычислить ее площадь. Всели данные необходимы?

3. Пояс есть часть поверхности шара, содержащаяся между двумя параллельными плоскостями. Высота пояса есть расстояние между этими двумя плоскостями. Даны радиус шара r, высота пояса h и расстояние d от центра шара до той ограничивающей плоскости, которая ближе к центру. Найдите поверхность пояса. Есть какие-нибудь замечания?

4. Первая сфера имеет радиус а. Вторая сфера, радиуса b, пересекает первую сферу и проходит через ее центр. Вычислите площадь той части второй сферы, которая лежит внутри первой. Есть какие-нибудь замечания? Проверьте крайние случаи.

5. Пересмотрите пример § 2 и докажите решение.

6. Шаровой сегмент есть часть шара, содержащаяся между двумя параллельными плоскостями. Его поверхность состоит из трех частей: сферического пояса и двух кругов, называемых основанием и крышкой сегмента. Мы пользуемся следующими обозначениями:

а — радиус основания, b — радиус крышки, h — высота (расстояние между основанием и крышкой), M — площадь среднего поперечного сечения (параллельного основанию и крышке и находящегося от них на одинаковом расстоянии), V — объем сегмента. Даны a, b и h; найдите Мп — V.

Есть какие-нибудь замечания? Проверьте несколько крайних случаев.

7. Ось конуса проходит через центр шара. Поверхность конуса пересекает поверхность шара по двум окружностям и делит шар на две части: «конически продырявленный шар» и «пробку» (см. фигуру на рис. 11.2, которую следует вращать вокруг прямой АВ)\ пробка находится внутри конуса. Пусть г обозначает радиус шара, с — длину хорды, образующей при вращении коническое отверстие, и h (высота продырявленного шара) — проекцию с на ось конуса. Даны r, с и А. Найдите объем конически продырявленного шара. Есть какие-нибудь замечания?

8. Ось параболоида вращения проходит через центр шара, и их поверхности пересекаются по двум окружностям. Вычислите объем кольцеобразного тела, заключенного между этими двумя поверхностями (внутри шара и вне параболоида), если даны: радиус шара r, проекция h кольцеобразного тела на ось параболоида и расстояние d центра шара от вершины параболоида. (Вращайте рис. 11.3 вокруг ОХ.) Есть какие-нибудь замечания?

9. Даны нижнее основание трапеции а, верхнее основание b и высота А; а>b. Трапеция, вращаясь вокруг своего нижнего основания, описывает тело вращения (цилиндр, прикрытый двумя конусами), для которого найдите (а) объем и (b) площадь поверхности. Достаточно ли данных для определения неизвестных?

10. Десять чисел, выбранных в определенном порядке, ыь иъ w3, ... , ы10, связаны так, что, начиная с третьего, каждое из них является суммой двух предыдущих:

Дано и7; найдите сумму всех десяти чисел П. Вычислите

Есть какие-нибудь замечания? Проверьте случаи а = 0, а оо, а → —∞.

12. Обобщите пример 11. [Сначала попробуйте самое простое.]

13. Напишите одно уравнение с одним неизвестным, не определяющее неизвестного.

14. Если природа неизвестных ограничена подходящим добавочным условием, то одно уравнение может определять несколько неизвестных. Например, если ху у и z — действительные числа, то они полностью определяются уравнением

Найдите все системы положительных целых чисел ху у, удовлетворяющие уравнению х2 + у2 = 128.

15. Найдите все системы положительных целых чисел ху yt z, w, удовлетворяющие уравнению х2 + у2 + z2 + w2 = 64.

16. Общий случай. Рассмотрите систему трех линейных уравнений с тремя неизвестными:

Рис. 11.2. Конически продырявленный шар.

Рис. 11.3. Параболически продырявленный шар.

Предполагаем, что 12 данных чисел alt blt <\, dlt a^, ... , d3 — действительные числа. Система называется определенной, если существует только одно решение (только одно множество х, у, z трех чисел, ей удовлетворяющих), неопределенной, если существует бесконечное множество решений, и несовместной, если решений нет. С разных точек зрения случай, когда система является определенной, выступает как общий, обычный, нормальный, правильный случай, а другие случаи — как исключительные, необычные, ненормальные, неправильные.

(a) Геометрически мы можем интерпретировать множество трех чисел х, yt z как точку в прямоугольной системе координат, а каждое уравнение как множество точек, ему удовлетворяющих, как плоскость. (На самом деле для такой интерпретации мы должны допустить, что в левой части каждого уравнения имеется по крайней мере один не равный нулю коэффициент, но будем так и считать.) Система трех уравнений является определенной, если три плоскости имеют только одну общую точку. Когда они имеют две общие точки, они имеют и общую прямую, и, таким образом, система является неопределенной. Когда три плоскости параллельны одной и той же прямой, но не имеют точек, общих всем трем, система несовместна. Если три плоскости находятся в «общем положении», если они «выбраны наугад», то они имеют только одну общую точку, и система является определенной.

(b) Алгебраически система трех уравнений является определенной в том и только в том случае, если определитель из 9 коэффициентов левой части не равен нулю. Следовательно, система является определенной, если на коэффициенты не наложено специальное условие или ограничение в форме уравнения.

(c) Множество из девяти (действительных) коэффициентов (аи fy, а3, blf с3) мы можем интерпретировать как точку в девятимерном пространстве. Точки, соответствующие системам, не являющимся определенными (неопределенным или несовместным), удовлетворяют уравнению (определитель = 0), и, значит, они образуют многообразие низшей размерности (восьмимерную «гиперповерхность») .

(d) Бесконечно невероятно, чтобы система трех линейных уравнений с тремя неизвестными, заданная наугад, оказалась неопределенной. Ср. пример 14.23.

17. Рассмотрите для каждого из пяти правильных многогранников вписанную и описанную сферы и вычислите отношения их радиусов.

18. Столбец (3) табл. I остался бы неизменным, если бы мы переменили местами куб и октаэдр или додекаэдр и икосаэдр. Эта неопределенность должна была представлять для теории Кеплера существенное затруднение. Однако Кеплер проявлял необычайную изобретательность в изыскании причин, по которым одно из этих пяти благородных тел должно обладать более высоким благородством, чем другое, и главенствовать над ним, как барон главенствует над баронетом.

Найдите некоторое простое геометрическое свойство, отличающее три многогранника, которые Кеплер поместил вокруг земной орбиты, от двух, которые он поместил в этой орбите.

19. Никакая идея не является действительно плохой. «Многие догадки оказались ошибочными, но тем не менее полезными, приводя к лучшей догадке». «Никакая идея не является действительно плохой, если мы не принимаем все без критики. Что действительно плохо, это не иметь никакой идеи вообще»1). Я почти ежедневно пользуюсь этими сентенциями, чтобы утешить того или иного студента, предлагающего какую-нибудь честную, но наивную идею. Эти сентенции подходят и к тривиальным повседневным ситуациям и к научному исследованию. Наиболее эффектно они подходят к случаю Кеплера.

Самому Кеплеру с его своеобразным переходным от средневековой к современной точке зрения состоянием ума его идея сочетания шести планет с пятью правильными многогранниками казалась ослепительной. Однако я не могу себе представить, чтобы такую идею мог возыметь современник Кеплера, Галилей.

1) «Как решать задачу», стр. 99—103.

Современному нам уму эта идея должна с самого начала казаться довольно плохой, потом, что она имеет так мало отношения ко всем остальным нашим знаниям о природе. Предположение Кеплера, даже если бы оно и находилось в лучшем согласии с наблюдениями, было бы подкреплено слабо, потом, что оно не подкреплялось бы аналогией с чем-либо известным из других источников.

Тем не менее догадка Кеплера, оказавшаяся ошибочной, самым несомненным образом была полезной для перехода к лучшей догадке. Она привела Кеплера к более тщательному исследованию средних расстояний планет, их орбит, их времен обращения, для которых он надеялся найти какое-нибудь подобное же «объяснение», и, таким образом, она в конце концов привела к знаменитым законам движения планет Кеплера, к Ньютону и ко всем нашим современным научным воззрениям.

20. Несколько обычных эвристических допущений. Эта тема заслуживала бы более полного разбора, однако мы ограничимся очень коротким перечнем и отрывочными замечаниями. Мы должны быть осторожны, когда интерпретируем слова «вообще говоря» в «практическом», неизбежно несколько туманном смысле.

«Если в системе уравнений столько же уравнений, сколько и неизвестных, то «вообще говоря» неизвестные определяются».

Если в задаче столько же условий, сколько имеющихся в распоряжении параметров, то разумно начать с ориентировочного допущения, что задача имеет решение. Например, квадратичная форма от n переменных имеет n (n + 1)/2 коэффициентов, а ортогональное преобразование n переменных зависит от n(п — 1)/2 параметров. Поэтому с самого начала довольно правдоподобно, что подходящим ортогональным преобразованием любая квадратичная форма от n переменных может быть приведена к выражению У\у Чг> ... , Уп — новые переменные, введенные преобразованием, а Аь Л^, ... ... , Хп — подходящие параметры. В самом деле, это выражение зависит от n параметров, и

Это замечание, возникающее после доказательства этого предложения в частных случаях п. 2 и п. 3, и объяснение геометрического смысла этих случаев могут вызвать довольно сильную уверенность в том, что верен и общий случай.

«Две предельные операции вообще говоря коммутативны».

Если одна из этих предельных операций — суммирование бесконечного ряда, а другая — интегрирование, то мы имеем случай, упомянутый в § 7).

«Что верно до предела, то вообще говоря верно и в пределе»2).

Если дано, что an > 0 и lim an = а, то мы не можем заключить, что а > 0; верно лишь, что а > 0. Рассмотрим кривую как предел вписанных ломаных и поверхность — как предел вписанных многогранников. Вычисление длины кривой как предела длины вписанной ломаной дает правильный результат, однако вычисление площади поверхности как предела площади поверхности вписанного многогранника может дать неправильный результат3). Высказанный эвристический принцип, хотя он и легко может ввести нас в заблуждение, является наиболее благодарной почвой для появления новых идей. См., например, пример 9.24.

«Неизвестную функцию сначала рассматривайте как монотонную».

1) См. Харди Г. Х., Курс чистой математики, М., 1949, стр. 503—505.

2) Ср. Whеwеll W., The Philosophy of the Inductive Sciences, new ed., v. 1, p. 146.

3) См. Schwarz H.A., Gesammelte Mathematische Abhandlungen, V. 2, S. 309—311. (См. также Фихтенгольц Г. М., Основы математического анализа, т. 2, п. 364. — Прим. перев.)

Мы следовали чему-то похожему на этот совет в § 2, когда допустили, что с изменением формы тела изменяется и его объем, и мы были введены в заблуждение. Тем не менее высказанный принцип часто бывает полезен. Возможно, нам потребуется доказать неравенство вида

где а < b. Мы можем начать, пробуя доказать большее, а именно:

f(x)<g (X).

Это сводится к тому, чтобы сначала допустить, что функция, имеющая производную g (х)—/ (*), монотонна. (Задача состоит в сравнении значений этой функции для X = а и X = b.) Высказанный принцип содержится в более общем эвристическом принципе: «сначала попробуйте самое простое».

«Вообще говоря, функция может быть разложена в степенной ряд, первый член которого дает приемлемое приближение, и чем больше членов мы возьмем, тем лучшим будет приближение».

Без должным образом понимаемого ограничения «вообще говоря» это утверждение было бы вопиющим образом неверно. Тем не менее физики, инженеры и другие ученые, применяющие в своей науке математический анализ, по-видимому, особенно его любят. Оно включает в себя другой принцип, даже более широкий, чем тот, который мы сформулировали ранее: «Неизвестную функцию сначала рассматривайте как линейную». Действительно, если мы имеем разложение

то мы можем приближенно взять

(Следует заметить, что Галилей, на знавший анализа бесконечно малых, уже отдавал сильное предпочтение линейной функции; см. § 4.) Настоящий принцип лежит в основе той значимости, которую часто приписывают начальному члену относительной погрешности; см. § 5 (2). Этот принцип часто бывал полезен, наталкивая на какую-нибудь идею, близкую к истине, однако он легко может натолкнуть и на что-нибудь очень далекое от истины.

В самом деле, физик (или инженер, или биолог) может прийти к убеждению, что физическая величина у зависит от другой физической величины х так, что имеет место дифференциальное уравнение

Теперь интегрирование, требующееся для решения этого уравнения, может оказаться слишком трудным или вид функции / (у) может быть неизвестен. В обоих случаях физик разлагает функцию / (у) по степеням у, и он может рассматривать как последовательные приближения возникающие при этом дифференциальные уравнения:

Однако этим трем уравнениям удовлетворяют кривые весьма различной природы и приближение может оказаться только вводящим в заблуждение. К счастью, физики больше полагаются на тщательное рассуждение, чем на

аккуратную математику, и, таким образом, они с помощью подобных приемов получали хорошие результаты даже в тех случаях, когда математическая ошибка была менее очевидна и потому более опасна, чем в нашем примере.

21. Вознагражденный оптимизм. Даны величины а, bу с, d, et /, g и h. Исследуем, допускает ли система четырех уравнений с четырьмя неизвестными х, у, и и v:

(S)

решение, отличное от тривиального решения x = y=u=v=0. Система (S) имеет, как мы знаем, нетривиальное решение в том и только в том случае, если ее определитель равен нулю, но мы хотим избежать непосредственного вычисления этого определителя четвертого порядка. Своеобразная симметрия системы (S) может натолкнуть на мысль положить

и = X, v = у.

Тогда первое уравнение системы (S) совпадает с четвертым, а второе с третьим, так что система четырех уравнений сведется к системе только двух различных уравнений:

Эта система допускает нетривиальное решение в том и только в том случае, если ее определитель равен нулю.

Однако мы можем также преобразовать систему (S), полагая

Опять мы получаем только два различных уравнения:

Обращение в нуль определителя первой или второй системы двух уравнений влечет за собой обращение в нуль определителя системы (S). Поэтому (если мы достаточно оптимистичны) мы можем подозревать, что этот последний определитель четвертого порядка является произведением двух указанных определителей второго порядка.

(a) Докажите это и обобщите результат на определители я-го порядка.

(b) В каком отношении были мы оптимистичны?

22. Возьмите систему координат как в § 9.4. Ось х горизонтальна, а ось у направлена вниз. Соедините начало координат с точкой (а, b)

(1) прямой,

(2) дугой окружности с центром на оси х.

Материальная точка, начинающая двигаться из положения покоя в начале координат, достигает точки (а, b) за время 71 или Т2 в зависимости от того, скользит ли она (без трения) вниз по прямой (1) или по дуге (2). Галилей (как рассказано в § 9.4) считал, что 71 >-Г2. После некоторой обработки это неравенство оказывается равносильным следующему:

где мы полагаем

Мы могли бы попытаться доказать это неравенство, разложив обе части равенства по степеням /г. Что было бы самой простой (или «наиболее оптимистической») возможностью?

23. Числовые выкладки и инженер. Неспециалист склонен думать, что числовые выкладки ученого непогрешимы, но скучны. На самом деле числовые выкладки ученого могут быть захватывающе рискованны, но ненадежны. Древние астрономы пытались, а современные инженеры пытаются получить числовые результаты, касающиеся недостаточно известных явлений с помощью недостаточно известных математических средств. Едва ли удивительно, что такие попытки могут не удаваться; куда более удивительно, что часто они удавались. Вот типичный пример. (Технические детали, пропущенные здесь, будут опубликованы где-нибудь в другом месте.)

Инженер хочет вычислить некоторую физическую величину Q, связанную с квадратом со стороной 1. (В действительности Q — жесткость на кручение бруса с квадратным поперечным сечением, но читателю нет необходимости это знать, фактически он не обязан даже знать, что такое жесткость на кручение.) Точное решение упирается в математические трудности и поэтому наш инженер, как инженеры часто делают, обращается к приближениям. Следуя определенному методу аппроксимации, он делит данный квадрат на равные «элементы», т. е. на п. меньших квадратов, каждый площади 1/гс2. (Аппроксимируя двойной интеграл, мы также подобным же образом разбиваем данную площадь на элементы.) Можно разумно ожидать, что, когда n стремится к бесконечности, приближенное значение стремится к истинному значению. На самом же деле, однако, когда n возрастает, трудность вычислений также возрастает, и так быстро, что вскоре становится непреодолимой. Инженер рассматривает только случаи n = 2, 3, 4, 5 и получает для Q соответствующие приближенные значения:

Не забудем, что эти числа соответствуют значениям

площадей маленьких квадратов, использованных при вычислениях.

Инженер изображает эти результаты графически. Он решает наносить приближенные значения, полученные для Q, как ординаты, но колеблется относительно выбора абсциссы. Сначала он пробует в качестве абсциссы я, затем Мп

и наконец Мп2 (что является численным значением площади маленького квадрата, использованного при аппроксимации); см. соответственно, рис. 11.4, 11.5 и 11.6. Последний выбор является самым лучшим: четыре точки на рис. 11.6 приблизительно лежат на одной прямой. Замечая это, инженер продолжает эту прямую до тех пор, пока она не пересечет вертикальную ось, и рассматривает ординату точки пересечения как «хорошее» приближение для Q.

(a) Почему? На какой идее это основано?

(b) Проверьте рис. 11.6 численно: соедините каждую точку со следующей прямолинейным отрезком и вычислите три угла наклона.

(c) Выберите две наиболее надежные точки на рис. 11.6, воспользуйтесь прямой, проходящей через них в конструкции инженера, вычислите получающееся в результате приближения для Q и сравните его с истинным значением Q, равным 0,1406.

Рна 11.4. Испытание: абсцисса n.

Рис. 11.5. Другое испытание: абсцисса \/п.

Рис. 11.6. Абсцисса 1/л2: удача!

ЗАКЛЮЧИТЕЛЬНОЕ ЗАМЕЧАНИЕ К ПЕРВОМУ ТОМУ

Читатель, внимательно прочитавший предыдущие главы и решивший некоторые из предыдущих задач, имел хороший случай познакомиться с некоторыми сторонами правдоподобных рассуждений. Сформировать общую идею природы правдоподобных рассуждений является целью остающихся пяти глав этого труда, собранных в томе II. Эта цель, я верю, представляет значительный теоретический интерес, но она может иметь и некоторое практическое значение: мы можем лучше выполнить конкретную задачу, если лучше понимаем лежащую в ее основе абстрактную идею.

Главным предметом тома II является формулировка некоторых схем правдоподобных рассуждений. Однако эти схемы будут извлечены из конкретных примеров и изложены в тесной связи с ними. Поэтому том II прибавит к примерам, рассмотренным в томе I, еще несколько математических примеров и будет трактовать их в том же духе.

СХЕМЫ ПРАВДОПОДОБНЫХ УМОЗАКЛЮЧЕНИЙ

Том II

ПРЕДИСЛОВИЕ КО II ТОМУ

Индуктивные рассуждения — одно из многих полей сражения для столкновения философских мнений, и при этом сегодня еще сравнительно полное жизни. Читатель, внимательно прочитавший I том этого труда, имел хорошую возможность заметить две вещи. Во-первых, индуктивные рассуждения и рассуждения, основанные на аналогии, играют в математическом открытии главную роль. Во-вторых, и индуктивные рассуждения и рассуждения, основанные на аналогии, являются частными случаями правдоподобных рассуждений. Мне кажется, с философской точки зрения лучше рассматривать общую идею правдоподобных рассуждений вместо ее изолированных частных случаев. Настоящий том II пытается сформулировать некоторые схемы правдоподобных рассуждений, исследовать их связи с теорией вероятностей и выяснить, в каком смысле они могут рассматриваться как «правила» правдоподобных рассуждений. Будет также кратко обсуждена и их связь с изобретением в математике.

Текст настоящего тома II не часто в явной форме ссылается на том I, и читатель может понять главные связи, не пользуясь этими ссылками. Среди задач, приложенных к различным главам, имеется несколько таких, которые читатель не сумеет решить, не справляясь в томе I, но в целом том II в первом приближении можно читать, не прочитав тома I. Однако, конечно, более естественно прочитать том II после тома I, примеры которого обеспечивают предстоящее нам исследование экспериментальными данными и богатым фоном1).

Такие данные и фон особенно желательны ввиду метода, которому я буду следовать. Я хочу исследовать правдоподобные рассуждения, поступая как натуралист: я собираю наблюдения, высказываю заключения и подчеркиваю пункты, в которых мои наблюдения кажутся подкрепляющими мои заключения. Однако я уважаю мнение

1) См. примечание на стр. 212. — Прим. перев.

читателя и не хочу силой или обманом побуждать его принять мои заключения.

Конечно, представленные взгляды нисколько не претендуют на окончательность. На самом деле имеется несколько мест, где я ясно чувствую необходимость улучшений, меньших или больших. Однако я верю, что главное направление правильно и что обсуждения и особенно примеры этого труда могут объяснить «двойственную природу» и «дополнительные стороны» правдоподобных и особенно индуктивных рассуждений, которые иногда кажутся «объективными», а иногда «субъективными».

Дьердь Пойа

Стэнфордский университет, май 1953 г.

XII. НЕСКОЛЬКО БРОСАЮЩИХСЯ В ГЛАЗА СХЕМ1)

я не хочу на этой стадии исследовать логическое оправдание этой формы аргументации; пока я рассматриваю ее как практику, которую мы можем наблюдать в поведении людей и животных. — Бертран Рассел2)

1. Подтверждение следствия. В первом томе этого труда, посвященном Индукции и аналогии в математике, мы нашли некоторую возможность познакомиться с практикой правдоподобных рассуждений. В настоящем втором томе мы собираемся описать эту практику в общем виде. Примеры первой части уже указали некоторые формы схем правдоподобных рассуждений. В настоящей главе мы собираемся сформулировать несколько таких схем в явном виде3).

Начнем со схемы правдоподобного умозаключения, которая имеет такое общее употребление, что мы могли бы извлечь ее почти из любого примера. Однако мы возьмем пример, который еще не рассматривали раньше.

Эйлеру4) принадлежит следующее предположение:

Любое целое число вида 8/z+3 является суммой квадрата и удвоенного простого числа. Эйлер не смог доказать это предположение, и трудность доказательства сегодня кажется, пожалуй, еще большей, чем во времена Эйлера. Однако он удостоверился, что это утверждение верно для всех целых чисел вида 8/z+3 до 200; для /1=1, 2, 10 см. табл. I на стр. 230.

Такая эмпирическая работа может быть легко проведена дальше; для чисел до 1000 не найдено никаких исключений5). Доказывает ли это гипотезу Эйлера? Никоим образом; отнюдь не было бы доказательством даже подтверждение для чисел до 1 000 000. Тем

1) Английское слово «pattern» (образец, образчик, форма, шаблон) мы переводим словом «схема», поскольку речь идет об обобщении накопленных наблюдений, имеющем вид общей рекомендации —правила, которому для легкости запоминания придается вид некоторой схемы.--Прим. ред.

2) Russell В., Philosophy, W. W. Norton and Co., 1927, p. 80.

3) Части этой главы были использованы в моей речи «On plausible reasoning», опубликованной в Ргос. Intern. Congr. Math. 1950. v. 1, p. 739—747.

4) Opera Omnia, ser. 1, vol. 4, p. 120—124. В этом контексте Эйлер рассматривает 1 как простое число; это необходимо для счета в случае 3=1 + 2Х 1.

5) Сообщение профессора Лемера (D. Н. Lehmer).

Таблица I

не менее каждое подтверждение делает предположение несколько более правдоподобным, и мы можем видеть в этом общую схему1).

Пусть А обозначает некоторое ясно сформулированное предположение, к этому моменту ни доказанное, ни опровергнутое. (Например, А может быть предположением Эйлера, что для /1=1, 2, 3, ..,

где x —целое, а /7 —простое число.) Пусть В обозначает некоторое следствие A; В также предполагается ясно сформулированным и к данному моменту ни доказанным, ни опровергнутым. (Например, В может быть первым частым случаем предположения Эйлера, не записанным в табл. I, утверждающим, что 9\=х2 + 2р.) к настоящему моменту мы не знаем, истинны ли А или В. Мы знаем, однако, что

из А следует В.

Теперь мы предпринимаем проверку В. Чтобы выяснить, будет ли утверждение относительно числа 91 истинно или нет, достаточно нескольких проб. Если бы оказалось, что В ложно, мы могли бы заключить, что и А ложно. Это совершенно ясно. Мы имеем здесь классическую элементарную схему рассуждения, «modus tollens», так называемого гипотетического силлогизма:

Горизонтальная линия, отделяющая две посылки от заключения, заменяет, как обычно, слово «следовательно». Мы имеем здесь доказательное умозаключение хорошо известного типа.

1) См. примечание к названию главы (стр. 229). — Прим. ред.

Что случится, если В окажется верным? (На самом деле 91 = 9 + 2×41 = 81+2×5.) Нет никакого доказательного заключения: подтверждение следствия В предположения А не доказывает А. Однако такое подтверждение делает А более правдоподобным. (Предположение Эйлера, подтвердившееся еще в одном случае, становится несколько более правдоподобным.) Мы имеем схему правдоподобного умозаключения:

Горизонтальная линия снова заменяет слово «следовательно». Мы будем называть эту схему фундаментальной индуктивной схемой или, несколько короче, «индуктивной схемой».

Эта индуктивная схема не говорит ничего удивительного. Напротив, она выражает убеждение, в котором, по-видимому, не сомневается ни один разумный человек: Подтверждение следствия делает предположение более правдоподобным. При небольшой внимательности мы можем в повседневной жизни, в суде, в науке и т. д. наблюдать бесчисленное множество рассуждений, соответствующих нашей схеме.

2. Последовательное подтверждение нескольких следствий. В этом параграфе словами «разбор теоремы» я пользуюсь в специальном значении «обсуждение, или обзор нескольких частных случаев и нескольких наиболее непосредственных следствий теоремы». Я думаю, что разбор изложенных теорем полезен и в повышенных и в элементарных классах. Рассмотрим совсем простой пример. Допустим, что вы преподаете в классе стереометрию и должны вывести формулу для площади боковой поверхности усеченного конуса. Конечно, это прямой круговой конус, и вам даны радиус нижнего основания R, радиус верхнего основания r и высота h. Вы проделываете обычный вывод и приходите к результату:

А. Площадь боковой поверхности усеченного конуса равна

Для последующих ссылок обозначим эту теорему буквой А.

Теперь начинается разбор теоремы А. Вы задаете классу вопрос: Можете ли вы проверить результат? Если ответа нет, то вы ставите более прозрачные наводящие вопросы: Можете ли вы проверить его, применяя к какому-нибудь уже вам известному частному случаю? В конечном счете, при большем или меньшем сотрудничестве с частью класса, вы спускаетесь к различным частным

случаям. Если R = r, вы получаете первый, заслуживающий внимания частный случай:

Bv Площадь боковой поверхности цилиндра равна 2nrh.

Конечно, h обозначает высоту цилиндра, а г —радиус основания. Это следствие теоремы А для последующих ссылок мы обозначаем буквой Вг. Следствие B1 уже изучалось в вашем классе, и, таким образом, оно служит подтверждением для А.

Полагая г = 0, вы получаете другой частный случай теоремы А:

Вг. Площадь боковой поверхности конуса равна nRY^R2+h2.

Здесь h обозначает высоту конуса, a R — радиус его основания. И это следствие B2 теоремы А было известно ранее и служит дальнейшим подтверждением А.

Существует менее очевидный, но интересный частный случай, соответствующий h = 0:

B3. Площадь кольца между двумя концентрическими окружностями с радиусами Rur равна я/?2 —яг2.

Это следствие B3 теоремы А известно из планиметрии и дает новое подтверждение А.

Три отмеченных частных случая —все они известны по предыдущему изучению —подкрепляют А с трех разных сторон; три тела (цилиндр, конус и кольцо, соответственно отвечающие случаям r = R, г = 0 и h = 0) выглядят совершенно по-разному. Вы можете упомянуть и совсем уж частный случай г = /г = 0

В4. Площадь круга радиуса R равна nR2.

Я иногда замечал, что мальчик в последнем ряду, который до конца моего строгого вывода формулы казался крепко спящим, открывал глаза и обнаруживал некоторый интерес к ходу разбора. Вывод формулы, стандартный и легкий, казался ему непонятным и трудным. Вывод его не убедил. Его больше убеждает разбор: формула, подтверждающаяся в таком большом числе и таких различных случаев, думает он, имеет хорошие шансы оказаться правильной, И думая так, он поступает в соответствии со схемой правдоподобного рассуждения, тесно связанной с фундаментальной индуктивной схемой, но более усложненной, чем эта схема:

Эта схема уточняет фундаментальную индуктивную схему. Конечно, подтверждение любого следствия усиливает нашу веру в предположение. Однако подтверждение одних следствий усиливает нашу веру

больше, а подтверждение других усиливает ее меньше. Только что приведенная схема обращает наше внимание на обстоятельство, имеющее большое влияние на силу индуктивных доводов: разнообразие проверенных следствий. Подтверждение нового следствия имеет большее значение, если новое следствие больше отличается от ранее подтвержденных следствий.

Теперь посмотрим на оборотную сторону медали. Возьмем пример предыдущего § 1. Следующие друг за другом в табл. I случаи, в которых подтверждается предположение Эйлера, выглядят очень похожими один на другой, —если мы не подметили никакого скрытого ключа, а кажется очень трудным подметить такой ключ. Поэтому раньше или позже мы устанем от этой однообразной последовательности подтверждений. Проверив какое-то число случаев, мы начинаем колебаться. Стоит ли терять время и браться за следующий случай? Следующий случай, если бы результат его был отрицателен, мог бы опровергнуть предположение, но следующий случай во всех известных нам отношениях так похож на уже проверенные случаи, что мы едва ли можем ожидать отрицательный результат. Следующий случай, если бы результат его был положителен, увеличил бы нашу уверенность в справедливости гипотезы Эйлера, но это увеличение уверенности было бы настолько мало, что оно едва ли стоит усилий, требующихся для испытания этого следующего случая.

Это рассмотрение подсказывает следующую схему, несущественно отличающуюся от только что высказанной схемы и, скорее, являющуюся ее дополнительной формой:

Подтверждение нового следствия имеет большее или меньшее значение в зависимости от того, больше или меньше это новое следствие отличается от ранее подтвержденных следствий.

3. Подтверждение невероятного следствия. В одной малоизвестной короткой заметке1) Эйлер рассматривает для положительных значений параметра n ряд

(1)

1) Opera Omnia, ser. 1, vol. 16, sect. 1, p. 241—265.

сходящийся для всех значений х. Он прослеживает сумму ряда и ее нули для n = 1, 2, 3, 4,

Эйлер наблюдает различие: в первых трех случаях все нули действительные, в последнем случае ни один из нулей не является действительным. Эйлер отмечает более тонкое различие между первыми двумя случаями и третьим случаем: для n = 1 и n = 2 расстояние между двумя соседними нулями равно я (если только в случае n = 2 мы не учитываем расстояние между нулями, ближайшими к началу координат), но для л = 3 расстояние между соседними нулями равно 2я (с аналогичной оговоркой). Это приводит его к поразительному наблюдению: в случае л = 3 все нули являются двойными нулями. «Однако мы знаем из анализа, — говорит Эйлер, — что два корня уравнения при переходе от действительных к мнимым корням всегда совпадают. Таким образом, мы можем понять, почему все нули внезапно становятся мнимыми, когда мы берем для n значение, превосходящее 3». На основании этих наблюдений он высказывает неожиданное предположение: функция, определенная рядом (1), при 0 < n ^ 3 имеет только действительные нули и бесконечное их множество, но при n > 3 не имеет ни одного действительного нуля. В этом утверждении n он рассматривает как непрерывно меняющийся параметр.

Во времена Эйлера вопросы о действительности корней трансцендентных уравнений были совершенно новыми, и мы должны признаться, что даже сегодня мы не владеем никаким систематическим методом для решения таких вопросов. (Например, мы не можем доказать или опровергнуть известную гипотезу Римана.) Поэтому предположение Эйлера кажется чрезвычайно смелым. Я думаю, что мужество и ясность, с которыми он высказал свое предположение, вызывают восхищение.

Однако вызывающее восхищение достижение Эйлера в известной степени можно понять. Другие специалисты совершают подобные же подвиги, занимаясь другими вопросами, и каждый из нас нечто подобное совершает в повседневной жизни. Фактически Эйлер догадался о целом по нескольким разрозненным деталям. В точности таким же образом археолог с разумной уверенностью может восстановить всю надпись по нескольким разрозненным буквам на стертом камне. Палеонтолог может надежно описать все животное, исследовав несколько его окаменевших костей. Когда человек, которого вы очень хорошо знаете, начинает говорить определенным образом, вы после нескольких слов можете предсказать всю историю, которую он собирается вам поведать. Совершенно подобным же образом

Эйлер отгадал всю историю, математическую ситуацию по нескольким ясно осознанным фактам.

Замечательно еще то, что он отгадал ее по такому малому числу фактов, рассматривая только четыре случая /1=1, 2, 3, 4. Нам не следует, однако, забывать, что косвенные улики могут быть очень сильными. Подсудимый обвиняется в том, что он взорвал яхту отца своей приятельницы, и обвинение предъявляет расписку, подписанную подсудимым, удостоверяющую покупку такого-то количества динамита. Такая улика чрезвычайно усиливает доводы обвинения. Почему? Потому, что покупка динамита обыкновенным гражданином сама по себе является очень необычным происшествием, но такую покупку вполне можно понять, если покупатель собирается что-либо или кого-либо взорвать. Пожалуйста, заметьте, что этот судебный случай очень похож на случай л = 3 ряда Эйлера. То, что все корни написанного наугад уравнения оказываются двойными корнями, само по себе является необычным происшествием. Однако вполне можно понять, что при переходе от двух действительных корней к двум мнимым корням появляется двойной корень. Случай л = 3 является наиболее сильной частью косвенных улик, предъявленных Эйлером, и мы можем уловить в этом общую схему правдоподобного умозаключения:

И эта схема кажется уточнением или усложнением фундаментальной индуктивной схемы (1). Прибавим без специальной иллюстрации дополнительную схему, объясняющую ту же идею с противоположной стороны:

Подтверждение следствия имеет большее или меньшее значение в зависимости от того, более или менее само по себе вероятно это следствие. Подтверждение наиболее неожиданного следствия является наиболее убедительным.

Между прочим, Эйлер оказался прав: спустя 150 лет его предположение было полностью доказано1).

1) См. статью автора: Sopra una equazione transcendente trattata da Eulero, Bolletino dell' Unione Matematica ltaliana, 5 (1926), 64—68.

4. Умозаключение по аналогии. На этом этапе может оказаться поучительным вернуться к примерам из первого тома об Индукции и Аналогии. В предыдущих параграфах этой главы мы сформулировали несколько схем правдоподобных умозаключений: как выглядят упомянутые примеры в свете этих схем?

Рассмотрим вновь два родственных примера (соответственно из §§ 10.1 и 10.4 тома I). Один из этих примеров связан с изопериметрической теоремой и Декартом, другой с физическим аналогом изопериметрической теоремы и лордом Рэлеем. Воспроизведем две таблицы из гл. X (названные там табл. I и табл. 11, а здесь соответственно табл. II и табл. III), поместив их рядом. Табл. II (как она занумерована в этой главе) перечисляет периметры десяти фигур, каждая из которых имеет одну и ту же площадь 1, а табл. III перечисляет основные частоты тех же десяти фигур (рассматриваемых как колеблющиеся мембраны).

Таблица II

Периметры фигур равной площади

Круг ........... 3,55

Квадрат.......... 4,00

Квадрант......... 4,03

Прямоугольник 3:2. . . 4,08

Полукруг......... 4,10

Секстант ......... 4,21

Прямоугольник 2:1 . . 4,24

Равносторонний треугольник ........... 4,56

Прямоугольник 3:1 . . 4,64

Равнобедренный прямоугольный треугольник 4,84

Таблица III

Основные частоты мембран равной площади

Круг........... 4,261

Квадрат......... 4,443

Квадрант........ 4,551

Секстант......... 4,616

Прямоугольник 3:2.. 4,624

Равносторонний треугольник ....... 4,774

Полукруг........ 4,803

Прямоугольник 2:1 . . 4,967

Равнобедренный прямоугольный треугольник 4,967

Прямоугольник 3:1 . . 5,736

Периметры в одной таблице, главные частоты в другой расположены в порядке возрастания. Обе таблицы начинаются с круга, имеющего среди перечисленных десяти фигур наименьший периметр, а также наиболее низкую основную частоту, и это наталкивает на две теоремы:

Из всех плоских фигур с данной площадью наименьший периметр имеет круг.

Из всех мембран с данной площадью наиболее низкую основную частоту имеет круг.

Первое утверждение есть изопериметрическая теорема, второе — знаменитая гипотеза лорда Рэлея. Наши таблицы дают серьезные индуктивные доводы в пользу обоих утверждений, но, конечно, не доказывают их.

С тех пор как мы рассматривали эти таблицы в §§ 10.1 и 10.4, положение изменилось. За это время мы познакомились с доказательством изопериметрической теоремы (§§ 10.6—10.8, примеры 10.1—10.15). Геометрическое минимальное свойство круга, индуктивно подкрепленное табл. II, было доказано. Естественно ожидать, что аналогичное физическое минимальное свойство круга, индуктивно подкрепленное табл. III, также окажется верным. Ожидая это, мы следуем важной схеме правдоподобного умозаключения:

Предположение становится более правдоподобным, когда оказывается истинным аналогичное предположение.

Применение этой схемы к рассмотренной ситуации кажется разумным. Однако в этой ситуации существуют и другие многообещающие указания.

5. Углубление аналогии. Таблицы II и III, помещенные рядом, по-видимому, наводят на дальнейшие размышления. Десять рассматриваемых фигур не стоят в обеих таблицах точно в одной и той же последовательности. В этой последовательности есть что-то своеобразное. Расположение фигур в табл. II кажется не слишком отличным от расположения в табл. III, но не это главное. Таблицы содержат различные виды фигур: прямоугольники, треугольники, секторы. В каком же порядке расположены фигуры одного и того же вида? Как выглядела бы более короткая таблица, в которой были бы выписаны только фигуры одного вида? Таблицы содержат несколько правильных фигур: равносторонний треугольник, квадрат и, не забудем, круг. В каком порядке расположены правильные фигуры? Не могли бы мы как-нибудь сравнить фигуры различных видов, например треугольники и секторы? Не могли ли бы мы расширить индуктивную базу, добавив к нашим таблицам новые фигуры? (В этом мы сильно ограничены. Не трудно вычислять площади и периметры, но трудно иметь дело с основными частотами, и их явное выражение известно лишь в очень немногих случаях.) В конечном счете мы получаем табл. IV (см. стр. 238).

Таблица IV выявляет между нашими двумя величинами, зависящими от формы переменной плоской фигуры— периметром и основной частотой,— замечательный параллелизм. (Не следует забывать, что площадь переменной фигуры постоянна, равна 1.) Если мы знаем периметр, то мы никоим образом не в состоянии вычислить основную частоту, и наоборот. Однако, судя по табл. IV, мы должны были бы подумать, что во многих простых случаях эти величины меняются в одном и том же направлении.

Таблица IV

Периметры и основные частоты фигур равной площади

Фигура

Периметр

Осн. частота

Прямоугольники:

4,00

4,443

1 : 1 (квадрат)...........

3:2 .................

4,08

4,624

2:1 .................

4,24

4,967

3:1 .................

4,64

5,736

Треугольники:

60° 60° 60°..............

4,56

4,774

45° 45° 90°..............

4,84

4,967

30° 60° 90°..............

5,08

5,157

Секторы:

180° (полукруг)...........

4,10

4,803

90° (квадрант)...........

4,03

4,551

60° (секстант) ...........

4,21

4,616

45°.................

4,44

4,755

36°.................

4,68

4,916

30° .................

4,93

5,084

Правильные фигуры:

3,55

круг ............

4,261

квадрат ...............

4,00

4,443

равносторонний треугольник . . .

4,56

4,774

Треугольники в сравнении с секторами:

тр. 60° 60° 60° ...........

4,56

4,774

сектор 60° ..............

4,21

4,616

тр. 45° 45° 90°...........

4,84

4,967

сектор 45°..............

4,44

4,755

тр. 30° 60° 90° ...........

5,08

5,157

сектор 30° ..............

4,93

5,084

Рассмотрим два столбца числовых данных в этой таблице и перейдем от какой-нибудь строки к следующей: если возрастание имеется в одном из столбцов, то соответствующее возрастание имеется и в другом, и если в одном из столбцов имеется убывание, то соответствующее убывание имеется и в другом.

Сосредоточим свое внимание на прямоугольниках. Если отношение длины к ширине возрастает от 1 до оо, так что форма изменяется от квадрата до бесконечно растянутого прямоугольника, то и периметр и основная частота, по-видимому, монотонно возрастают. Квадрат, который как правильная фигура среди всех четырехугольников является «ближайшим» к кругу, имеет наименьший периметр, а также наименьшую основную частоту. Из трех входящих в таблицу треугольников равносторонний треугольник, который как правильная фигура среди всех треугольников является «ближайшим» к кругу, имеет наименьший периметр, а также наименьшую основную частоту. Поведение секторов сложнее. Когда угол сектора меняется от 180°

до 0°, периметр сначала убывает, достигает минимума, а затем возрастает; и таким же образом изменяется и основная частота. Посмотрим теперь на правильные фигуры. Равносторонний треугольник имеет 3 оси симметрии, квадрат имеет 4 таких оси, а круг —бесконечное множество. Насколько мы можем судить по табл. IV, и периметр и основная частота, по-видимому, убывают, когда возрастает число осей симметрии. В последнем отделе табл. IV каждый треугольник мы сопоставляем с сектором, угол которого равен наименьшему углу треугольника. Во всех трех случаях сектор оказывается «более круглым», имеет наименьший периметр и более низкую основную частоту.

То, что мы определенно знаем относительно этих закономерностей, не выходит за пределы табл. IV. Таблица IV внушает и делает правдоподобным, что эти закономерности сохраняются и за пределами собранного экспериментального материала, но она этого никоим образом не доказывает. Итак, табл. IV приводит нас к нескольким новым предположениям, которые, хотя и похожи на предположение Рэлея, имеют, конечно, значительно более ограниченную сферу действия.

Какое влияние оказывает табл. IV на нашу веру в предположение Рэлея? Можем ли мы в табл. IV найти для него какое-нибудь разумное основание, которого мы не замечали раньше, рассматривая табл. II и III?

Конечно, можем. Прежде всего табл. IV содержит еще несколько частных случаев, в которых подтверждается предположение Рэлея (треугольник 30°, 60°, 90°, секторы с углами 45°, 36° и 30°). Однако здесь есть нечто большее. Аналогия между изопериметрической теоремой и предположением Рэлея стала значительно более глубокой; факты, перечисленные в табл. IV, прибавляют к этой аналогии несколько новых сторон. И вот, кажется разумным рассматривать заключение по аналогии как ставшее более сильным, если стала сильнее сама аналогия, на которой основано это заключение. Таким образом, табл. IV значительно усилила позицию Рэлея.

6. Затушеванное умозаключение по аналогии. Однако есть еще кое-что. Как мы заметили, табл. IV подсказывает несколько предположений, аналогичных предположению Рэлея (но имеющих более ограниченную сферу действия). Таблица IV подсказывает эти предположения и вдобавок придает им некоторое правдоподобие. Это же обстоятельство, естественно, несколько увеличивает правдоподобие первоначального предположения Рэлея. Если вы думаете таким же образом, то вы думаете согласно следующей схеме:

Предположение становится несколько более правдоподобным, когда становится более правдоподобным аналогичное предположение. Это — ослабленная или затушеванная форма схемы, сформулированной в § 4.

ПРИМЕРЫ И ПРИМЕЧАНИЯ К ГЛАВЕ XII

1. Таблица I, приводящая некоторые индуктивные доводы в пользу упомянутого в § 1 предположения Эйлера, очень похожа на таблицу в § 1.3, или на табл. I, II и III в гл. IV, или на таблицу Эйлера, приведенную в подкрепление его «Наиболее Необычайного Закона Чисел, Относящегося к Суммам их Делителей», см. § 6.2. Эти таблицы имеют также сходство с двумя таблицами, приведенными в гл. III, одна в § 3.1 (многогранники), другая в § 3.12 (разбиения пространства). С какой из этих двух таблиц больше сходства?

2. Эйлер, проверив свой «Наиболее Необычайный Закон» (см. § 6.2) для п. 1, 2, 3, 4, ... , 20, переходит к подтверждению его для n = 101 и n = 301. Он имеет достаточное основание предпочесть исследование 101 и 301 исследованию 21 и 22 (которое он ясно высказывает в начале п. 7 своей статьи). Не учитывая или только смутно припоминая содержание Закона Эйлера, не думали ли бы вы, что подтверждение двух его случаев (101 и 301) имеет с точки зрения испытания большую ценность, чем имело бы подтверждение двух следующих случаев (21 и 22)?

3. Пусть а, b и с обозначают стороны треугольника, 2р = а+ b + с — его периметр, А — площадь.

Проверьте формулу Герона

столькими способами, сколькими сумеете.

4. Рассмотрим четырехугольник, вписанный в круг. Пусть а, b, с и d обозначают стороны, 2p=a+b+c+d — периметр, А — площадь.

Утверждается, что

Проверьте это утверждение столькими способами, сколькими сумеете. Есть ли у вас какие-нибудь замечания?

5. Пусть V обозначает объем тетраэдра, а

— длины его шести ребер; ребра а, b и с оканчиваются в одной и той же вершине тетраэдра, е ребро, противоположное ребру а, / — ребру b и g — ребру с. (Два ребра тетраэдра называются противоположными, если они не имеют общей вершины.) Ребра еу f и g являются тремя сторонами грани тетраэдра, противоположной вершине, в которой оканчиваются a, b и с. Утверждается, что

Проверьте это утверждение столькими способами, сколькими сумеете. [Симметрично ли предлагаемое для V выражение относительно шести ребер?] 6. Положим

для n = 1, 2, 3, ... и определим р, q и г с помощью тождества относительно х:

так что

(В обычной терминологии р, q и г — «элементарные симметрические функции от а, b и с, a $п — «сумма одинаковых степеней».) Очевидно, р — Утверждается, что для произвольных значений a, b и с

если только знаменатель не равен нулю. Проверьте эти формулы в частном случае а = 1, b — 2, с = 3 и еще в трех случаях, указанных в таблице:

Случай

а

b

с

(1)

1

2

3

(2)

1

2

—3

(3)

1

2

0

(4)

1

2

-2

Придумайте дальнейшие проверки. В частности, попытайтесь обобщить случаи (2), (3) и (4).

7. Пусть .4, Вц B2, B3 и В4 имеют значение, приданное им в § 2. Дает ли подтверждение ß4, произведенное после подтверждения Въ B2 и B3, добавочные индуктивные доводы в пользу А?

8. Вспомним «Наиболее Необычайный Закон» Эйлера и значение сокращений 7\ Ci, C2, C3, ... , Cf, С J, , ... , объясненное в § 6.3. Эйлер индуктивно подкрепил теорему 7\ когда он все еще не был в состоянии ее доказать, подтвердив ее следствия C1э C2, C3, ... , C2q. (Он, возможно, шел даже дальше.) Затем он открыл, что и Cf, Cf, С^, ... являются следствиями теоремы 7\ и подтвердил Cf, Cf, ... , С?о, Cf01, С£01. Благодаря этим новым подтверждениям уверенность Эйлера, по-видимому, значительно усилилась; но можно ли оправдать это усиление? [Здесь нужно обратить более серьезное, чем в примере 2, внимание на детали.]

9. Возвратимся к предположению Эйлера, рассмотренному в § 1; для краткости назовем его «предположением .9». Запишем кратко значение этого сокращения:

Идея, которая привела Эйлера к его предположению Э, заслуживает упоминания. Эйлер посвятил много труда тем знаменитым предположениям теории чисел, которые Ферма высказал без доказательства. Одно из них (мы называем его «предположением Ф») говорит, что любое целое число является суммой трех треугольных чисел. Запишем кратко значение этого сокращения:

Эйлер подметил, что если бы его предположение Э было верно, то из него легко вытекало бы предположение Ферма Ф. Иными словами, Эйлер убедился, что из Э следует Ф. (Детали см. в следующем примере 10.) Будучи полон решимости доказать предположение Ферма Ф, Эйлер, естественно, желал, чтобы его предположение Э оказалось верным. Было ли это только желанием? Я так не думаю; рассмотренные связи дают какое-то слабое, но не неразумное основание для

веры в предположение Эйлера Э в соответствии со следующей схемой:

Вот еще одна схема правдоподобного умозаключения. Читателю следовало бы сравнить ее с фундаментальной индуктивной схемой.

10. Доказывая, что из Э следует Ф (в обозначениях предыдущего примера 9), Эйлер пользовался более глубоким результатом, который он доказал предварительно: простое число вида 4я + 1 является суммой двух квадратов. (Оно было индуктивно рассмотрено в примере 4.4.) Принимая его на веру, докажите, что в самом деле из Э следует Ф.

11. После того как у Эйлера возникло его предположение, изложенное в § 3, он испытал его, вычисляя первые нули своего ряда для нескольких значений я. (Под «первым нулем» мы понимаем «нуль», абсолютная величина которого наименьшая. Если X есть первый нуль рассматриваемого ряда, то и —х есть нуль; и X и —X являются «первыми нулями». Поэтому х будет действительным в том и только в том случае, когда х2 положительно.) Конечно, Эйлер должен был вычислять эти нули приближенно. Метод (метод Даниила Бернулли), которым он часто пользовался для подобной цели, дал такие последовательности приближенных значений для первого нуля х в случаях n = 1/2, 1/3, 1/4:

Во всех трех случаях приближенные значения кажутся стремящимися к положительному пределу монотонно и довольно быстро. Эйлер принял это за признак того, что первые нули действительны, и увидел в этом подтверждение своего предположения.

Постараемся выяснить общую схему эвристического умозаключения Эйлера. Пусть А обозначает его предположение, объясненное в § 3, относительно действительности нулей его ряда. Пусть В обозначает тот факт, что для n — 1/2 первый нуль действителен. Очевидно, из А следует В. Так вот, Эйлер не доказал В, он только сделал В более правдоподобным. Таким образом, мы имеем здесь следующую схему правдоподобного умозаключения:

Вторая посылка слабее, чем вторая посылка фундаментальной индуктивной схемы. Слово «несколько» поставлено, чтобы подчеркнуть, что и заключение слабее, чем в фундаментальной индуктивной схеме.

12. Современный математик может вывести из числовых данных предыдущего примера 11 эвристическое заключение более строгое, чем вывел сам Эйлер. Можно показать, что если ряд Эйлера имеет только действительные корни, то последовательные приближенные значения, полученные по методу Даниила Бернулли, непременно образуют возрастающую последовательность1). Пусть А обозначает то же предположение, что и в предыдущем примере 11, но В пусть теперь означает другое утверждение, а именно следующее: «Для n = 1/2 первые четыре приближения, полученные по методу Даниила Бернулли, образуют возрастающую последовательность, и это же имеет место для n — 1/3 и л = 1/4».

1) См. статью автора: Remarks on power series, Acta Scientiarum Mathematicarum, 12B (1950), 199—203.

Тогда известно, что имеют место обе посылки фундаментальной индуктивной схемы:

Из А следует В В истинно

и получающееся в результате эвристическое заключение сильнее. К предыдущему можно прибавить два замечания:

(1) Эйлер не формулировал только что указанного свойства метода Даниила Бернулли и, конечно, не доказал его. Однако очень вероятно, что, обладая громадным опытом работы по этому методу, он имел какого-то рода индуктивное знание. Так, Эйлер, хотя он и не вывел заключения современного математика, обладал им в менее ясной форме. И, по-видимому, он имел в своем богатом математическом фоне1) и другие указания, которые он не мог бы полностью сформулировать и которые мы не могли бы объяснить и сегодня.

(2) Числовые данные, указанные в примере 11, привели автора к подозрению об общей теореме, доказанной в статье, цитированной на предыдущей странице. Это — маленький, но конкретный пример пользы индуктивного метода в математическом исследовании.

13. В гл. IV мы индуктивно исследовали сумму четырех нечетных квадратов; см. §§ 4.3. — 4.6, табл. I. Позднее мы брались за аналогичные задачи, касающиеся четырех произвольных квадратов и восьми квадратов; см. примеры 4.10—4.23 и табл. II и III. Первое исследование, несомненно, помогло нам распознать закон в последующих случаях. Должна ли также усилиться наша вера в результат последнего исследования из-за результата первого?

14. Индуктивное умозаключение по бесплодным усилиям. Построить с помощью циркуля и линейки сторону квадрата, равную площади круга данного радиуса. Это — строгая формулировка известной задачи о квадратуре круга, придуманной греками. Она не была забыта в средние века, хотя мы не можем верить, что многие понимали тогда ее строгую формулировку; Данте ссылается на нее в теологической кульминации Божественной Комедии, в конце заключительной песни. Этой задаче было около двух тысяч лет, когда Французская академия приняла решение, что рукописи, имеющие целью найти квадратуру круга, не будут проверяться. Не проявила ли Академия узость взглядов? Я так не думаю; после бесплодных усилий тысяч людей на протяжении тысячелетий были некоторые основания подозревать, что задача неразрешима.

Вас тянет бросить задачу, не поддающуюся вашим неоднократным усилиям. Если вы упорны или глубоко заинтересованы задачей, то вы прекратите работу только после многих и больших усилий. Если вы не любите больших усилий или не серьезно заинтересованы, то вы прекратите работу после нескольких поверхностных попыток. Но в любом случае имеется своего рода индуктивное умозаключение. Вот рассматриваемое предположение:

Л. Справиться с этой задачей невозможно. Вы наблюдаете;

В. Даже Я не могу справиться с этой задачей. Это, само по себе, в самом деле очень невероятно. Однако, несомненно,

из А следует В,

и, таким образом, ваше наблюдение относительно В по фундаментальной индуктивной схеме делает А более правдоподобным.

Невозможность квадратуры круга, строго сформулированная, была доказана в 1882 г. Линдеманом, после основной работы Эрмита. Существуют другие сходные задачи, ведущие начало от греков (трисекция угла и удвоение куба), неразрешимость которых после накопленной очевидности бесплодных усилий была в конце концов доказана. После бесплодных усилий построить «perpetuum mobile» физики сформулировали «принцип невозможности вечного движения», и этот принцип оказался замечательно плодотворным.

1) См. примечание на стр. 212. — Прим. перев.

XIII. ДАЛЬНЕЙШИЕ СХЕМЫ И ПЕРВЫЕ СВЯЗИ МЕЖДУ СХЕМАМИ

После того как мы усвоим несколько простых положений . . . , полезно обозреть их путем последовательного и непрерывного движения мысли, обдумать их взаимоотношения и отчетливо представить одновременно наибольшее их количество; благодаря этому наше знание сделается более достоверным и наш ум приобретет больший кругозор. — Декарт1)

1. Исследование следствия. Рассмотрим ситуацию, часто встречающуюся в математических изысканиях. Мы хотим решить, истинно ли ясно сформулированное математическое положение A или нет. У нас есть, возможно, какая-то интуитивная уверенность в истинности A, но этого недостаточно: мы хотим доказать А или опровергнуть. Мы работаем над этой задачей, но без решающего успеха. После того как прошло некоторое время, мы замечаем следствие В предложения А. Это В является ясно сформулированным математическим предположением, о котором мы знаем, что оно вытекает из А.

Из А следует В.

Однако мы не знаем, истинно В или нет. При этом нам кажется, что В доступней, чем А; по той или иной причине у нас есть впечатление, что с й мы будем иметь больший успех, чем с А. Поэтому мы переключаемся на исследование В. Мы стараемся ответить на вопрос: истинно В или ложно? В конце концов нам удается на него ответить. Какое влияние этот ответ оказывает на нашу уверенность в Л?

Это зависит от ответа. Если мы находим, что В, это следствие A, ложно, то мы можем с достоверностью заключить, что и A должно быть ложно. Однако, если мы найдем, что В истинно, то никакого доказательного умозаключения нет: хотя следствие В предположения A оказалось истинным, само A может быть ложным. Тем не менее имеется эвристическое умозаключение: так как следствие В оказалось истинным, само A заслуживает большей веры. В соответствии с природой нашего результата относительно В мы следуем

1) Одиннадцатое из его правил для руководства ума. См. Рене Декарт, Избранные произведения, М., 1950, стр. 117.

доказательной или эвристической схеме:

Мы уже встречали эти схемы в § 12.1, где эвристическую схему мы назвали фундаментальной индуктивной схемой. С подобными же, но другими схемами мы познакомимся в следующих параграфах.

2. Исследование возможного основания. Рассмотрим другую ситуацию, часто встречающуюся в математических изысканиях. Мы хотим решить, истинно ли ясно сформулированное предложение A или нет, мы хотим доказать А или опровергнуть. После некоторой, не имеющей решающего значения работы мы сталкиваемся с другим предложением B1 из которого следовало бы А. Мы не знаем, истинно В или нет, но убедились, что

А следует из В.

Итак, если бы мы смогли доказать В, то было бы доказано и нужное нам A; В есть возможное основание для А. Мы могли устать от A или В может нам показаться более многообещающим, чем A; так или иначе мы переключаемся на исследование В. Наша цель теперь—доказать или опровергнуть В. В конце концов нам это удается. Какое влияние наш результат относительно В оказывает на нашу уверенность в Л?

Это зависит от характера нашего результата. Если мы находим, что В истинно, то мы можем заключить, что A, которое следует из B, также истинно. Однако, если мы найдем, что В ложно, то никакого доказательного умозаключения нет: A могло бы еще оказаться истинным. Но мы были вынуждены отказаться от возможного основания для A, у нас теперь для доказательства A одним шансом меньше, наша надежда доказать A с помощью В рухнула: если вообще есть какое-нибудь изменение в нашей уверенности в A в результате опровержения В, то оно может быть только изменением к худшему. Короче, в соответствии с природой нашего результата относительно В мы следуем доказательной или эвристической схеме:

Следует заметить, что первая посылка в обеих схемах одинакова. Вторые посылки диаметрально противоположны, и заключения также противоположны, хотя и не столь уж далеки друг от друга.

Доказательное умозаключение следует классической схеме «modus ponens» так называемого гипотетического силлогизма. Эвристическая схема похожа на фундаментальную индуктивную схему, но отличается от нее, см. § 1 или § 12.1. Мы можем высказать это эвристическое умозаключение словами: Когда возможное основание для предположения рушится, наша уверенность в этом предположении может только уменьшиться.

3. Исследование противоречащего предположения. Рассмотрим ситуацию, не слишком обычную в математических изысканиях, но часто встречающуюся в естественных науках. Исследуем два противоречащих, несовместных предположения A и В. Когда мы говорим, что А противоречит В, или

А несовместно с В,

мы имеем в виду, что из истинности одного из двух предположений А и В необходимо следует ложность другого. Таким образом, А может быть истинно или нет, В также может быть истинно или нет; мы не знаем, что имеет место в действительности, но знаем лишь, что А и В не могут быть оба истинны. Однако оба они могли бы быть ложны. Натуралист, чтобы объяснить какое-то явление, высказал предположение A, другой натуралист, чтобы иначе объяснить то же самое явление, высказал предположение В. Объяснения несовместны; оба натуралиста не могут быть правы, но оба могут ошибаться.

Если доказано, что одно из этих предположений, скажем В, правильно, то и судьба другого окончательно решена: А должно быть ошибочно. Если, однако, В опровергнуто, то судьба А еще окончательно не установлена, и А могло бы оказаться ошибочным. Тем не менее бесспорно при опровержении соперничающего предположения, несовместного с А, А может только выиграть. (Натуралист, придумавший A, конечно, думал бы так же.) Таким образом, мы снова имеем две схемы:

Когда рушится несовместное соперничающее предположение, наша уверенность в данном предположении может только возрасти.

4. Логические термины. В трех предыдущих параграфах мы встретили три пары схем. Каждая пара состоит из доказательной схемы и эвристической схемы; три доказательных схемы между собой связаны, и три соответствующие эвристические схемы кажутся соот-

ветствующим образом связанными. Связи между доказательными схемами—это ясные связи формальной логики. В следующем параграфе мы попытаемся выяснить связи между эвристическими схемами. Настоящий параграф подготовляет нас к следующему посредством обсуждения некоторых простых терминов формальной логики1).

(1) Термин высказывание может быть взят в более общем смысле, но в нашем изложении чаще всего будет достаточно и даже выгодно думать о некотором ясно сформулированном математическом предложении, о котором в данный момент мы не знаем, истинно оно или нет. (Хорошим примером для более подготовленного читателя является знаменитая «гипотеза Римана»: ^-функция Римана2) имеет только действительные нули. Несмотря на усилия многих превосходных математиков, мы не знаем, истинно это высказывание или ложно.) Для обозначения высказываний мы будем пользоваться прописными буквами А, В, С, ...

(2) Отрицание высказывания А есть высказывание, которое истинно в том и только в том случае, если А ложно. Отрицание А мы будем обозначать символом не-А

(3) Два утверждения «А ложно» и «не-А истинно» означают в точности одно и то же. В любом контексте мы можем подставить одно вместо другого, не изменяя значения, т.е. истинности или ложности, всего текста. Два утверждения, которые можно таким образом подставлять одно вместо другого, называются эквивалентными. Итак, утверждение «А ложно» эквивалентно утверждению «не-А истинно». Удобно записывать это в сокращенном виде:

«А ложно» экв. «Не-А истинно».

Правильно также сказать, что

«А истинно» экв. «Не-А ложно»3), «Не-А истинно» экв. «А ложно», «Не-А ложно» экв. «А истинно»3).

(4) Мы говорим, что два высказывания А и В несовместны одно с другим, если они оба не могут быть истинны. Высказывание A может быть истинно или ложно, В может быть истинно или ложно;

1) Мы излагаем здесь формальную логику на «старомодный» манер (пользуясь обычным языком и избегая логических символов, насколько это осуществимо), но с несколькими современными идеями. Некоторые из простейших логических символов будут несущественно использованы позднее, особенно в § 7.

2) См. Риман Б., Сочинения. М.— А., 1948, стр. 218—219. — Прим. перев.

3) Трудности, связанные с применением закона исключенного третьего к бесконечным множествам, заставляют иногда отказываться от признания правильности этой эквивалентности. Из утверждения, что «А истинно», и без закона исключенного третьего можно заключить, что «не-А ложно», обратное же не всегда возможно. — Прим. ред.

если мы вместе рассмотрим и A и В, то могут возникнуть четыре различных случая:

А истинно, В истинно; А истинно, В ложно; А ложно, В истинно; А ложно, В ложно.

Если мы говорим, что А несовместно с В, то мы подразумеваем, что первый из этих четырех случаев (в северо-западном углу) исключен. Несовместность всегда взаимна. Следовательно,

«А несовместно с В» экв. «В несовместно с А»,

(5) Мы говорим, что A имплицирует В (или В имплицируется A, или В следует из A, или В является следствием A и т. д.), если A и не-5 несовместны. Таким образом, понятие импликации1) характеризуется следующей эквивалентностью:

«Из A следует В» экв. «А несовместно с не-В».

Знать, что из A следует B1 важно. Пусть в данный момент мы не знаем, истинно A или нет, и в том же состоянии неведения находимся и по отношению к В. Если, однако, в какой-то момент окажется, что A истинно, то, располагая знанием, что из A следует B1 мы немедленно будем знать, что не-5 должно быть ложно и, таким образом, В должно быть истинно2).

1) Если несовместность А с В понимать только в том смысле, что по крайней мере одно из двух высказываний А и В ложно, то слово «следует» («имплицирует») в этом абзаце в точности соответствует употребляемой обычно в математической логике импликации (которую нужно отличать от —более близких к аристотелеву пониманию «логического следствия» —разновидностей «строгой» или «сильной» импликации). Как явствует, однако, из остального контекста, авторское «следует» («имплицирует») не совпадает с обычной импликацией (которую мы здесь будем обозначать знаком zd). Ведь если В истинно, то A zd В («А имплицирует В») истинно, каково бы ни было A, так что делать какие-нибудь заключения насчет А в случае одновременной истинности В и A ZD В заведомо нельзя. Между тем автор полагает, что в этом случае можно заключить, что А более правдоподобно (фундаментальная индуктивная схема). (Аналогичные замечания относятся к случаю, когда В ложно, а В zd А истинно, а также к авторскому пониманию несовместности, см., например, табл. 1, стр 253.) Аксиоматическое определение употребляемых автором понятий «следует», «более правдоподобно» и др. нетрудно получить, очевидно, обозревая рассматриваемые им схемы, но его интересы концентрируются на обосновании этих схем с помощью интерпретации их для правдоподобностей, о чем см. особенно гл. XV. Здесь заметим еще только, что в отличие от обычной импликации: A zd B1 истинность или ложность которой определяется только истинностью или ложностью каждого из высказываний А и B1 в фундаментальной индуктивной схеме автора на самом деле предполагается, что А и В каким-то образом связаны между собой, например В без А «мало правдоподобно» и т. п. (см §§ 10, 13). В настоящее время существует большая литература по логике модальностей, строгой импликации и других связей, аналогичных рассматриваемым Пойа. — Прим. ред.

2) Опять в предположении верности закона исключенного третьего или, точнее, эквивалентности двойного отрицания А утверждению А. —Прим. ред.

Мы знаем, что

«А несовместно с не-В» экв. «Не-В несовместно с А».

Мы знаем также, что

«Не-В несовместно с А» экв. «Из не-В следует не-А»1).

Из цепи трех последних эквивалентностей заключаем:

«Из A следует В» экв. «Из не-В следует не-А»2).

Эта последняя эквивалентность очень важна сама по себе и будет существенна в последующем рассмотрении.

(6) То немногое из формальной логики, что было изложено в этом параграфе, уже дает нам возможность выяснить связь между доказательными схемами, встретившимися нам в трех предыдущих параграфах.

Начнем с доказательной схемы, сформулированной в § 1 («modus tollens»):

Понятно, что эта схема всегда применима. Применим ее, подставив не-А вместо A и не-В вместо В. Получаем

Мы видели, однако, раньше, что

«Из не-А следует не-В» экв. «Из В следует А»3),

«Не-В ложно» экв. «В истинно»3), «Не-А ложно» экв. «А истинно»3).

Подставим вместо посылок и заключения последней рассмотренной схемы три соответствующих указанных здесь эквивалентных

1) Напомним, что и в случае отказа от закона исключенного третьего верно, что из А следует двойное отрицание А. — Прим. ред.

2) При отказе от закона исключенного третьего эта эквивалентность в общем случае не будет иметь места: из левой ее части правая всегда будет следовать, из правой же всегда можно будет заключить, что «из двойного отрицания А следует двойное отрицание В». Если А и В — отрицательные высказывания, то рассматриваемая эквивалентность верна для них и в конструктивной логике (без закона исключенного третьего). — Прим. ред.

3) В классической формальной логике. — Прим. ред.

утверждения. Тогда получаем:

т. е. доказательную схему § 2, «modus ponens».

Мы предоставляем читателю подобным же образом вывести доказательную схему § 3 из схемы § 1.

5. Логические связи между схемами правдоподобных умозаключений. Рассмотрение в предыдущем параграфе было только подготовительным. Мы изложили эти классические вопросы доказательной логики не ради них самих, а чтобы приготовиться к изучению правдоподобных умозаключений. Мы рассмотрели вывод «modus ponens» из «modus tollens» не в какой-нибудь тщетной надежде сказать что-то новое и неожиданное относительно столь классических вещей, а для приготовления к таким вопросам, как например: можем ли мы с помощью чистой формальной логики вывести эвристическую схему § 2 из эвристической схемы § 1?

Нет, очевидно, не можем. В самом деле, эти схемы содержат такие утверждения, как «А становится более правдоподобным» или «А становится менее правдоподобным». Хотя каждый понимает, что это значит, последовательный формальный логик отказывается понимать такое утверждение, и он даже прав. В чистой формальной логике для таких утверждений нет места; она не имеет средств, чтобы с ними справиться.

Мы могли бы, однако, подходящим способом расширить область формальной логики. Главный пункт, по-видимому, — прибавление к классическому содержанию формальной логики следующей эквивалентности: «не-А становится более правдоподобным» экв. «А становится менее правдоподобным». Сокращенно

«Не-А более правдоподобно» экв. «А менее правдоподобно».

Допуская это, мы получаем полезный инструмент. Теперь мы можем приспособить прием § 4 (6) к нашей нынешней цели и поступить следующим образом. Мы начинаем с фундаментальной индуктивной схемы, приведенной в § 1. Применяем ее к не-А и не-В вместо применения ее к A и В, т. е. подставляем в нее не-А вместо A и не-В вместо В. Затем мы применяем три эквивалентности, две из которых являются чисто логическими (и изложены, кстати сказать в предыдущем § 4), а третья — существенно новая эквивалентность, введенная в настоящем параграфе. С помощью этих трех шагов мы в конце концов приходим к эвристической схеме из § 2.

Можно предоставить читателю выписать этот вывод в деталях и таким же образом вывести эвристическую схему § 3 из фундаментальной индуктивной схемы § 1.

6. Затушеванное умозаключение. Мне кажется, что индуктивные рассуждения легче изучать в области математики, чем в области физики. Причина этого достаточно проста. Задавая математический вопрос, мы можем надеяться получить вполне недвусмысленный ответ, совершенно четкое Да или Нет. Направляя вопрос Природе, вы не можете надеяться получить ответ без некоторой полосы неопределенности. Вы предсказываете, что лунное затмение начнется (тень коснется диска луны) в такое-то и такое-то время. В действительности вы наблюдаете начало затмения 4 минутами позже, чем предсказано. Согласно стандартам греческой астрономии, ваше предсказание было бы поразительно точным, согласно современным стандартам оно скандально неточно. Данное расхождение между предсказанием и наблюдением можно истолковать и как подтверждение и как опровержение. То или другое истолкование зависит от правдоподобного рассуждения некоторого рода, трудности которого в «физической ситуации» начинаются шагом раньше, чем в «математической ситуации». Мы попытаемся свести это различие к его простейшему выражению.

Допустим, что мы исследуем математическое предположение, рассматривая его следствия. Пусть А обозначает предположение, а В — одно из его следствий, так что из А следует В. Мы приходим к окончательному решению относительно В: опровергаем В или доказываем и соответственно сталкиваемся с той или иной из следующих двух ситуаций;

Мы будем их называть «математическими ситуациями». Мы их неоднократно рассматривали и знаем, что из каждой из них можно вывести разумное заключение.

Допустим теперь, что мы исследуем физическое предположение А и что мы экспериментально проверяем одно из его следствий В. Относительно В мы не можем прийти к окончательному решению; наши эксперименты могут, однако, показать, что в В или в его противоположность очень трудно поверить. Соответственно мы сталкиваемся с той или иной из следующих двух ситуаций:

Назовем их «физическими ситуациями». Какое заключение разумно в этих ситуациях? (Пустое место под горизонтальной чертой, заменяющей слово «следовательно», символизирует открытый вопрос.)

В каждой из четырех рассмотренных ситуаций мы имели по две данных, или посылки. Первая посылка во всех четырех ситуациях одинакова; все различие между ними зависит от второй посылки. Вто-

рая посылка в «математических» ситуациях находится на уровне чистой формальной логики, но в «физических» ситуациях на значительно более смутном уровне. Это отличие мне кажется существенным; дополнительные трудности физических ситуаций могут им объясняться. Попытаемся обозреть эти четыре ситуации «путем последовательного и непрерывного движения мысли», как предпочитает говорить Декарт (см. эпиграф в начале этой главы). Представим себе, что наша уверенность в В постепенно изменяется, «непрерывно» уменьшаясь или увеличиваясь. Мы представляем, что В становится менее правдоподобным, затем еще менее правдоподобным, затем в него вряд ли можно поверить, и, наконец, оно становится ложным. С другой стороны, мы представляем, что В становится более правдоподобным, затем еще более правдоподобным, практически несомненным и, наконец, истинным. Если сила нашего заключения непрерывно изменяется в том же самом направлении, что и сила нашей уверенности в В, то мало сомнений в том, каким должно быть наше заключение, с тех пор как ясны крайние случаи (В ложно, В истинно). Таким образом, мы приходим к следующим схемам:

Слово «несколько» во второй схеме вставлено для того, чтобы напомнить нам, что заключение, конечно, является более слабым, чем в фундаментальной индуктивной схеме. Наша уверенность в предположении зависит от нашей уверенности в одном из его следствий и изменяется в том же направлении. Мы будем называть эти схемы «затушеванными»: первая —затушеванная доказательная схема, вторая— затушеванный вариант фундаментальной индуктивной схемы. Термин «затушеванная» должен указывать ослабление второй посылки: «менее правдоподобно» вместо «ложно», «более правдоподобно» вместо «истинно». Мы уже пользовались этим термином в этом смысле в § 12.6.

Мы получили только что введенные затушеванные схемы из их крайних случаев, «modus tollens» и фундаментальной индуктивной схемы, рассмотренных в § 1, ослабляя вторую посылку. Таким же образом мы можем получить другие затушеванные схемы из схем, сформулированных в §§ 2 и 3. Мы приведем здесь лишь одну (все они выписаны в следующем параграфе). Эвристическая схема § 3 дает следующую затушеванную схему:

7. Таблица. Чтобы сжато записать схемы, рассмотренные в этой главе, удобно воспользоваться некоторыми сокращениями. Мы пишем

вместо из А следует В А*-В вместо А следует из В А I В вместо А несовместно с В

Введенные символы используются некоторыми авторами, пишущими по символической логике1). В этих обозначениях две формулы

А -+В, В*-А,

так же как и формулы

А\В, В\А,

в точности эквивалентны. Мы будем также сокращать «правдоподобно» на «пр.» и «несколько» на «н.». См. табл. I.

Таблица I

1. Исследование следствия

2. Исследование возможного основания

3. Исследование противоречащего предположения

8. Комбинация простых схем. В математических изысканиях легко может возникнуть следующая ситуация. Мы исследуем теорему А. Эта теорема А ясно сформулирована, но мы не знаем и желаем узнать, истинна она или ложна. Когда пройдет некоторое время, мы наталкиваемся на возможное основание; мы видим, что А может быть выведено из другой теоремы #,

А следует из Н,

и поэтому мы пытаемся доказать Н. Доказать H нам не удается, но

1) Гильберт Д. и Аккерман В., Основы теоретической логики М„ 1947.

2) См. примечание 1) на стр. 248, — Прим. ред.

мы замечаем, что одно из его следствий, В, истинно. Вот ситуация:

А следует из И В следует из И В истинно

Вытекает ли из этих посылок какое-нибудь разумное заключение относительно А?

Я думаю, вытекает, и мы можем даже его получить, комбинируя две из схем, рассмотренных в предыдущем параграфе. Действительно, фундаментальная индуктивная схема дает:

Из H следует В В истинно Н более правдоподобно

Чтобы получить это заключение, мы воспользовались только двумя из трех посылок. Скомбинируем неиспользованную третью посылку с только что полученным заключением: одна из наших затушеванных схем (находящаяся на пересечении второй строки со вторым столбцом табл. I в § 7) дает:

А следует из И H более правдоподобно

А более правдоподобно

Результат (как это и должно было быть) сам по себе довольно очевиден: увеличение уверенности в возможном основании И предложения А, возникающее в результате подтверждения следствия В этого основания Н, в какой-то мере отражается и на самом А.

9. Об умозаключении по аналогии. Ситуацию, рассмотренную в предыдущем параграфе, можно истолковать как связь между схемами, рассмотренными в этой главе, и одной из наиболее бросающихся в глаза форм правдоподобного умозаключения: умозаключением по аналогии.

Я не думаю, что идею аналогии можно объяснить во вполне определенных терминах формальной логики; во всяком случае, я на это не претендую. Как мы говорили ранее, в § 2.4, аналогия имеет дело со сходством и намерениями думающего. Если вы подмечаете между двумя объектами (или, предпочтительно, между двумя системами объектов) некоторое сходство и намереваетесь выразить это сходство в определенных понятиях, то вы мыслите по аналогии.

Например, вы улавливаете некоторое сходство между двумя теоремами А и В; вы замечаете некоторые общие пункты. Быть может, вы думаете, что когда-нибудь будет возможно представить себе более

широкую теорему Я, которая будет выявлять все существенные общие пункты и из которой и A и В будут естественно следовать. Если вы думаете таким образом, то вы начинаете мыслить по аналогии1).

Как бы то ни было, рассмотрим аналогию между двумя теоремами А и В как намерение открыть общее основание, из которого следовали бы и А и В:

А следует из Н, В следует из Н

Не будем забывать, что у нас нет Н; мы только надеемся, что такое Н существует.

Теперь нам удалось доказать одну из двух аналогичных теорем, скажем В. Как повлияет это событие на нашу уверенность в другой теореме а? У этой ситуации есть что-то общее с ситуацией, рассмотренной в предыдущем § 8. Там мы пришли к разумному заключению, выраженному составной схемой

A следует из Н В следует из Н В истинно

A более правдоподобно

Существует, конечно, важное отличие, состоящее в том, что теперь у нас нет Я, мы только надеемся на Я С этой оговоркой, однако, мы можем рассматривать две посылки

A следует из Н, В следует из Н

как эквивалентные одной:

A аналогично В.

Подставляя эту одну посылку вместо первых двух посылок в написанную выше составную схему, приходим к фундаментальной схеме правдоподобного умозаключения, впервые указаной в § 12.4:

A аналогично В В истинно

A более правдоподобно

10. Уточненное умозаключение. Возвратимся опять к фундаментальной индуктивной схеме. Это — первая, введенная нами схема и наиболее бросающаяся в глаза форма правдоподобного рассуждения. Эта схема относится к подтверждению следствия из предположения

1) Так, изопериметрическая теорема и гипотеза Рэлея, которые мы сравнили в § 12.4, могут подсказав идею их совместного обобщения.

и получающемуся в результате изменению в нашем мнении. Она кое-что говорит о направлении этого изменения; такое подтверждение может только увеличить нашу уверенность в предположении. Она ничего не говорит о величине этого изменения; увеличение уверенности может быть большим или малым. В действительности оно может быть чудовищно большим и ничтожно малым.

Цель настоящего параграфа —выяснить обстоятельства, от которых зависит такое важное различие. Мы начинаем с напоминания об одном из примеров (§ 12.3).

Посудимый обвиняется во взрыве яхты отца своей приятельницы, и обвинение предъявляет расписку, подписанную подсудимым, подтверждающую покупку такого-то количества динамита.

Эта улика против подсудимого кажется очень сильной. Почему? Выделим главные черты этого случая. Существенную роль играют два утверждения:

А: Подсудимый взорвал эту яхту. В: Подсудимый приобрел взрывчатое вещество.

В начале процесса суд должен рассматривать А как предположение. Обвинение стремится сделать А более правдоподобным для присяжных, защита старается сделать его менее правдоподобным.

В начале процесса и В тоже должно рассматриваться как предположение. Позднее, после представления в суд упомянутой расписки (подлинность подписи не оспаривалась защитой), В должно рассматриваться как доказанный факт.

Некоторые связи между A и △ однако, должны были быть ясны с самого начала.

А без В невозможно. Если подсудимый взорвал яхту, то у него было взрывчатое вещество. Он как-то приобрел это взрывчатое вещество: путем покупки, кражи, получения подарка, получения наследства или как-нибудь иначе, т. е.

Из А следует В.

В без А не невозможно, но с самого начала должно казаться крайне невероятным. Покупка динамита, во всяком случае, очень необычна для обыкновенного гражданина. Покупка динамита без намерения что-нибудь или кого-нибудь взорвать была бы бессмыслицей. Легко заподозрить, что подсудимый имел весьма сильные эмоциональные и финансовые основания для взрыва этой яхты. Трудно подозревать какую-либо цель покупки динамита, исключая взрыв яхты. Таким образом, как мы сказали, В без А кажется крайне невероятным.

Особо выпишем эту важную характеристику ситуации: правдоподобность В до события, рассматриваемая при допущении, нто А не истинно. Мы сократим это точное, но длинное описание так: «правдоподобность В без А». Итак, мы можем сказать:

В без А едва ли правдоподобно.

Теперь мы можем видеть существенные посылки и всю схему правдоподобного умозаключения, которая производит на нас впечатление своей убедительностью:

Из A следует В В без А едва ли правдоподобно В истинно

А гораздо более правдоподобно

Чтобы лучше понять, представим себе, что эта важная характеристика ситуации, правдоподобность В без А, постепенно изменяется, непрерывно переходя от одного крайнего случая к другому.

Из А следует В. Если, наоборот, и из ^ следует А, так что А и В взаимно имплицируют друг друга, то правдоподобность В без А достигает своего минимума, исчезает. В этом случае, если В истинно, то и A достигает своего минимума.

Из A следует В, т. е. когда A истинно, В несомненно. Если правдоподобность В без A приближается к своему максимуму, то, когда A ложно, В почти несомненно. Следовательно, В в любом случае почти несомненно. Когда происходит событие, которое заранее кажется почти несомненным, мы не получаем много новой информации и, таким образом, не можем вывести неожиданных следствий. (Например, покупка буханки хлеба едва ли когда-нибудь может дать такую сильную улику, как покупка динамита.)

Допустим, как в § 6, что сила заключения непрерывно изменяется в одном и том же направлении, когда увеличивается или когда уменьшается этот имеющий большое влияние фактор: правдоподобность В без А. Тогда они должны изменяться в противоположных направлениях, и мы приходим к важному уточнению силы заключения в фундаментальной индуктивной схеме:

Из A следует В В истинно

A более правдоподобно

Уточнение это состоит в том, что когда правдоподобность В без А уменьшается, сила заключения увеличивается. Выпишем рядом два крайных случая:

Первые две посылки заключены в скобки, чтобы выразить, что вторая рассматривается как уточнение первой. То, что из A следует В, является первой посылкой в фундаментальной индуктивной схеме. Здесь мы уточняем эту посылку; мы добавляем уточнение, имеющее большое значение для определения силы заключения. Для сравнения вспомним, что в § 6 мы уточнили фундаментальную индуктивную схему в другом направлении, ослабив ее вторую посылку.

11. О последовательных подтверждениях. Мы уже подтвердили n следствий Въ B2t .... Bn некоторого предположения А. Теперь мы переходим к новому следствию Bn+lt проверяем его и находим, что и Вп+1 истинно. Какое влияние оказывает этот добавочный довод на нашу уверенность в Л? Конечно,

Из A следует Вп+1 Вп+1 истинно

A более правдоподобно

Но насколько сильно это заключение? Это зависит, как мы видели в предыдущем параграфе, от правдоподобности Вп+1 без А.

Так вот, мы могли иметь хорошие основания верить в Вп+1 до того, как оно было подтверждено, даже при допущении, что A не истинно. Мы ранее видели, что B1, В2 Bn истинны. Если Вп+1 очень похоже на Въ Въ Bn, то мы можем по аналогии предвидеть, что и Bn+i будет истинно. Если Вп+1 очень отличается от Въ Въ Вт то оно не подкрепляется такой аналогией, и у нас может быть очень мало оснований верить в Вп+1 без А. Следовательно, когда аналогия вновь подтвержденного следствия с ранее подтвержденными следствиями уменьшается, сила добавочной уверенности, возникающей в результате добавочного подтверждения, увеличивается.

Это, в сущности, выражает то же, что и дополнительные схемы, сформулированные в § 12.2, но, пожалуй, немножко лучше. В самом деле, явное упоминание об аналогии мы можем рассматривать как преимущество.

12. О соперничающих предположениях. Если существуют два различных предположения, A и В, предназначенные для объяснения одного и того же явления, то мы рассматриваем их как противодействующие одно другому, даже если не доказано, что они логи-

чески несовместны. Эти предположения А и В могут быть совместны или несовместны, но одно из них стремится сделать другое излишним. Это — достаточное противодействие, и мы рассматриваем А и В как соперничающие предположения.

Бывают случаи, когда с соперничающими предположениями мы обращаемся почти так, как будто они несовместны. Например, мы имеем два соперничающих предположения А и В, но, несмотря на некоторое усилие, не можем придумать третьего предположения, объясняющего то же явление; тогда каждое из двух предположений А и В является «единственным очевидным соперником» другого. Краткая схематическая иллюстрация может пояснить смысл этого термина.

Пусть, скажем, А — корпускулярная теория света, восходящая к Ньютону, —волновая теория света, берущая начало от Гюйгенса. Представим также себе, что мы обсуждаем эти вопросы во времена после Ньютона и Гюйгенса, но до Юнга и Френеля, когда и в самом деле имело место очень неокончательное обсуждение этих теорий. Никто не показал или не претендовал на то, чтобы показать, что эти две теории логически несовместны, и еще менее, что они являются едиственными возможными логическими альтернативами; но не существовало никаких других теорий света, которые были бы достаточно известны, хотя физики имели широкую возможность изобретать такие теории: каждая теория была единственным очевидным соперником другой. Таким образом, любой аргумент, который казался говорящим против одной из двух соперничающих теорий, легко интерпретировался как говорящий в пользу другой.

Вообще, отношение между двумя соперничающими предположениями похоже на отношение между соперниками в любом другом виде соревнования. Если вы соревнуетесь на приз, то ослабление позиции любого из ваших соперников означает некоторое усиление вашей позиции. Вы немного выигрываете при легкой задержке одного из ваших многочисленных неясных соперников. Вы выигрываете много, если такая задержка случилась с опасным соперником. Вы выигрываете еще больше, если ваш наиболее опасный соперник выбывает из состязания. Если же вы имеете единственного очевидного соперника, то любое ослабление или усиление его позиции ощутимо сказывается на вашей позиции. И нечто подобное происходит между состязающимися предположениями. Существует схема правдоподобного рассуждения, которую мы попытаемся сделать несколько более ясной в табл. II.

Строение табл. II почти само собой понятно. Эта таблица содержит четыре схемы, расположенные в двух строках и двух столбцах. Первая строка содержит две уже рассмотренные схемы, см. § 3, конец § 6 и последнюю строку табл. I. Переходя от первой строки ко второй, мы ослабляем первую посылку; действительно, вместо ясной связи формальной логики между А и В мы подставляем

Таблица II

А несовместно с В В ложно

А более правдоподобно

А несовместно с В В менее правдоподобно

А несколько более правдоподобно

А соперник В В ложно

А немного более правдоподобно

А соперник В В менее правдоподобно

А чуть-чуть более правдоподобно

какую-то расплывчатую связь, имеющую, однако, практический смысл. Это ослабление первой посылки делает заключение соответственно слабее, что и пытается передать словесное выражение. Переходя от первого столбца ко второму, мы ослабляем вторую посылку, что делает соответственно слабее заключение. У схемы, находящейся в юго-восточном углу, нет ни одной посылки, которая имела бы смысл в доказательной логике, и ее заключение является самым слабым.

Важно подчеркнуть, что употребляемые словесные выражения слегка вводят в заблуждение. В действительности характеристики, прибавляемые к слову «правдоподобно» («несколько», «немного», «чуть-чуть»), должны были бы передавать не какую-то абсолютную, а только относительную степень правдоподобности. Они указывают только изменение силы, когда мы переходим от одной строки к другой, от одного столбца к другому. Даже наиболее слабая из этих четырех схем может давать весомое заключение, если убеждение, что предположение А не имеет другого опасного соперника, кроме В, достаточно сильно. Фактически эта схема будет играть некоторую роль в следующей главе.

13. О судебном доказательстве. Рассуждения, с помощью которых суд приходит к решению, можно сравнить с индуктивными рассуждениям, с помощью которых натуралист подкрепляет свои обобщения. Такие сравнения уже предлагались и обсуждались авторитетами по судебной процедуре1). Начнем обсуждение этого интересного вопроса с рассмотрения примера.

(1) Управляющий популярного ресторана, открытого допоздна, возвратился в свой загородный дом, как обычно, значительно позже полуночи. Когда он оставил автомобиль, чтобы открыть дверь своего гаража, он был остановлен и ограблен двумя субъектами в масках. Полиция, обследовавшая место происшествия, в палисаднике дома

1) Ср. Wigmore J. H., The principles of judicial proof, Boston, 1913, p. 9-12, 15-17.

жертвы нашла темно-серую тряпку. Эта тряпка могла быть использована одним из грабителей в качестве маски. Полиция допросила в близлежащем городе нескольких лиц. Один из допрошенных имел пальто с большой дырой в подкладке, но в остальном находившееся в хорошем состоянии. Тряпка, найденная в палисаднике, была из того же материала, что и подкладка, и в точности соответствовала дыре. Обладатель этого пальто был арестован и обвинен в участии в ограблении.

(2) Многие из нас, вероятно, почувствуют, что такое обвинение достаточно оправдывается обстоятельствами дела. Но почему? На какой идее это основано? Это обвинение является не изложением фактов, а выражением подозрения, выражением предположения:

А. Обладатель пальто участвовал в ограблении.

Такое официальное обвинение, однако, не должно быть беспричинным предположением, а должно подкрепляться относящимися к делу фактами. Предположение A подкрепляется фактом:

В. Тряпка, найденная в палисаднике дома жертвы ограбления, была из того же материала, что и подкладка пальто обвиняемого, и точно соответствовала дыре в подкладке.

Однако почему мы рассматриваем В как оправдание для Л? Нам не следует забывать, что A —только предположение: оно может быть истинно или ложно. Если мы хотим поступать справедливо, мы должны рассматривать обе возможности.

Если A истинно, то В можно понять без труда. Мы легко можем себе представить, что человек, срочно нуждавшийся в маске и не имевший возможности достать более подходящий материал, отрезал кусок от подкладки своего пальто. Спеша удрать после преступного акта, такой человек мог потерять свою маску. Или в испуге он даже мог в тот же момент отбросить свою маску, вместо того чтобы положить ее в карман и бросить в безопасном месте. Короче, В вместе с A выглядит очень правдоподобно.

Если, однако, A не истинно, то В кажется необъяснимым. Если этот человек не был участником ограбления или чего-либо подобного, то зачем он должен был бы портить свое хорошее пальто, вырезая большой кусок из подкладки? И почему этот кусок подкладки из всех возможных мест должен был оказаться именно на месте грабежа, совершенного бандитами в масках? Он мог там оказаться, конечно, и по-простому совпадению, но такому совпадению трудно поверить. Короче, В без A едва ли правдоподобно.

Итак, мы видим, что умозаключение, которое привело к обвинению обладателя пальто, имеет следующую схему:

Но эта схема правдоподобного рассуждения очевидным образом связана с другой схемой правдоподобного рассуждения, которую мы разобрали раньше (в § 10):

Различие между этими двумя схемами проявляется уже в самом начале. Посылка

В вместе с А весьма правдоподобно сходна с посылкой

Из А следует В

которая на самом деле может быть высказана и словами: «В вместе с А несомненно», но слабее, чем эта посылка. Итак первая схема (только что открытая) выступает как «ослабленная форма» второй схемы (введенной в § 10) и, таким образом, в конечном счете как уточнение фундаментальной индуктивной схемы (сформулированной в § 12.1).

Случай, который привел нас к формулировке новой схемы, был довольно прост. Рассмотрим более сложный случай1).

(3) К моменту убийства Клэренс Б. Хиллер со своей женой и четырьмя детьми жил в двухэтажном доме в Чикаго. Спальни семьи находились на втором этаже. На верхней площадке лестницы, ведущей на второй этаж, на ночь оставалась гореть газовая лампа. Вскоре после двух часов ночи с воскресенья на понедельник миссис Хиллер проснулась и заметила, что эта лампа погасла. Она разбудила мужа, и он в ночной рубашке вышел на верхнюю площадку лестницы, где наткнулся на незнакомца. Они начали драться и во время драки скатились к основанию лестницы, где в Хиллера было сделано два выстрела; он умер через несколько секунд. Стрельба произошла приблизительно в 2 часа 25 мин. ночи.

За несколько минут до убийства одна из дочерей Хиллера в дверях своей спальни видела человека, державшего спичку так, что его лица нельзя было разглядеть. Она не испугалась потому, что отец обычно вставал ночью и проверял, все ли в порядке у детей. Никто другой из членов семьи постороннего не видел.

Приблизительно в трех четвертях мили от дома Хиллера имеется трамвайная остановка. Перед рассветом в день, когда произошло

1) Относительно следующего случая читателю следует справиться в решениях Верховного суда штата Иллинойс, почти полностью перепечатанных у Уигмора; см. цитированную в примечании на стр. 260 книгу.

убийство, четыре полисмена, , которых незадолго перед тем поблизости окончилось дежурство, сидели на скамье у этой остановки, ожидая трамвая. Примерно в 2 часа 38 мин. ночи они увидели человека, идущего в таком направлении, что скамья не могла быть ему хорошо видна. Когда человек приблизился, полисмены заговорили с ним, но он продолжал идти, держа правую руку в кармане. Полисмены остановили его и обыскали. В кармане был заряженный револьвер, человек вспотел, в разных местах его одежды выступала свежая кровь, на его левом предплечье была легкая рана, слегка кровоточащая. Полисмены (в то время не знавшие об убийстве) привели человека в полицейский участок, где он был допрошен. Этот человек —мы будем называть его подсудимым — позднее был обвинен в убийстве мистера Хиллера.

Суд должен был провести судебное следствие и после следствия отвергнуть или поддержать обвинение, т. е. следующее предположение, выдвинутое обвинительным актом:

Л. Подсудимый стрелял в мистера Хиллера и убил его.

Сделаем обзор основных доводов, выдвигаемых в поддержку предположения А.

B1. В двух гнездах барабана револьвера, найденного у подсудимого, когда он был арестован, имелся сгоревший порох и ощущался запах свежего дыма. По мнению полисменов, из револьвера дважды стреляли в пределах часа до ареста. Пять патронов, которыми был заряжен револьвер, имели в точности ту же фабричную марку, что и три нестреляных патрона, найденных в коридоре дома Хиллера поблизости от мертвого тела.

B2. Незнакомец проник в дом Хиллера через заднее окно кухни, с которого он сначала снял ставни. Человек, пролезающий через это окно, мог опереться на перила веранды. На этих перилах, которые были недавно покрашены, имелся отпечаток четырех пальцев левой руки. Два служащих бюро идентификации города Чикаго показали, что, по их мнению, отпечатки на перилах были тождественны отпечаткам пальцев подсудимого.

B3. Два эксперта, не принадлежащие к чикагской полиции, выразили по поводу отпечатков пальцев то же мнение. (Один был инспектором полиции в Оттаве, Канада; другой— бывший эксперт Федерального правительства в Вашингтоне.)

B4. Приблизительно в 2 часа 00 мин. ночи, как раз перед убийством мистера Хиллера, в дом, отделенный от дома Хиллера незанятым участком, проник неизвестный. Две женщины видели в дверях своей спальни человека с зажженной спичкой над головой. Обе женщины показали, что этот неизвестный был того же роста и телосложения, что и подсудимый. Одна из женщин вспомнила также, что неизвестный был в светлой рубашке и с узорчатыми подтяжками. Осмотрев рубашку и подтяжки подсудимого, представленные в суд, свидетельница показала, что, по ее мнению,

подсудимый был тем человеком, которого она видела той ночью в дзерях.

Вь. Подсудимый, когда он был арестован, назвал фальшивую фамилию и дал фальшивый адрес и отрицал, что он когда-либо находился под арестом. На самом деле он был ранее осужден по обвинению в краже со взломом, освобожден под честное слово, возвращен в каторжную тюрьму за нарушение честного слова и вторично освобожден под честное слово приблизительно за шесть недель до ночи убийства. Примерно через две недели после второго освобождения он под фальшивой фамилией купил револьвер, отдал его в залог, получил обратно, заложил снова и вторично получил его обратно за два часа до убийства.

Вв, Подсудимый был не в состоянии удовлетворительно объяснить ни кровь на своей одежде, ни рану на своем левом предплечье, ни свое местоприбывание в ночь убийства. Относительно своего местопребывания он рассказал две различные истории: одну после ареста, а другую в суде. Люди, которых, как он сначала утверждал, он посетил в ту ночь, отрицали это. Тогда подсудимый сказал суду, что он посетил салун, но не нашлось ни одного свидетеля, который подтвердил бы это.

(4) Все эти факты, события и обстоятельства, сообщенные под заголовками Вь B2, B6, легко можно понять, если обвинение A справедливо. Все они подкрепляют A, но вес такого подкрепления не один и тот же во всех случаях. Некоторые из этих фактов были бы объяснимы, даже если бы A не было справедливо. Некоторые другие, однако, если бы А не было справедливо, казались бы сверхъестественными совпадениями.

То, что патроны, найденные в револьвере подсудимого, имеют гу же фабричную марку, что и патроны, найденные поблизости от тела жертвы, само по себе доказывает немногое, если патроны этой марки— обычные патроны, продаваемые всеми оружейными мастерами. Однако то, что из этого револьвера выстрелили ровно столько раз, сколько выстрелов было сделано в жертву, и в пределах того же часа, доказывает многое; трудно объяснить такое совпадение. Совпадение отпечатков пальцев на перилах с отпечатками пальцев подсудимого в наше время и само по себе рассматривалось бы как почти решающее доказательство, но еще не рассматривалось так в то время, когда происходил суд, в 1911 г. То, что обвиняемый xал относительно своей фамилии, адреса и преступного прошлого, когда он был арестован, доказывает немногое: такую ложь можно понять, если обвинение A справедливо, но можно понять и если оно несправедливо: человек во всяком случае предпочел бы, чтобы полиция оставила его в покое. Однако значительный вес имеет то, что подсудимый был не в состоянии удовлетворительно объяснить свое местопребывание в эту роковую ночь. Он должен был знать, что этот вопрос важен, и его защитник, несомненно, знал о важ-

ности любого алиби. Если обвинение А было ложно и подсудимый провел ночь, не причинив никому вреда, или совершил какое-нибудь меньшее преступление, то почему он не сказал этого сразу же или по крайней мере до того, как стало слишком поздно?

Все упомянутые подробности легко можно понять, если обвинение А справедливо. Но совпадение такого большого числа подробностей кажется необъяснимым, если обвинение А несправедливо; крайне трудно поверить, что столько совпадений произошло только по простой случайности. Как бы то ни было, защите не удалось представить состоятельного толкования предъявленных улик.

Для присяжных были, конечно, и другие улики, помимо тех, о которых мы здесь рассказали, и были улики, которые нельзя точно передать никаким описанием: поведение подсудимого и свидетелей. Присяжные признали подсудимого виновным в убийстве, и Верховный суд штата подтвердил приговор. Приведем последнюю фразу из мнения Главного судьи: «Ни одно из этих обстоятельств, рассматриваемое отдельно, не было бы решающим для установления его (подсудимого) вины, но когда все факты и обстоятельства, входящие в число улик, рассматриваются вместе, можно найти оправдание присяжным, которые были уверены, что вердикт о виновности должен последовать как логическое следствие»1).

(5) Утверждения Вь Въ ..., B6, перечисленные в (3), довольно хорошо соответствуют схеме, введенной в (2). Они даже лучше соответствуют схеме, отличающейся от нее только в одном пункте:

Каждое из утверждений Въ Въ Вв может быть с полным смыслом подставлено в эту схему вместо В, причем, конечно, А должно интерпретироваться как обвинение. Утверждения В1, B2, Bs являются составными утверждениями; они имеют части (некоторые из них мы подчеркнули в (4)), каждая из этих частей сама по себе может рассматриваться как существенная улика: каждая такая часть также с полным смыслом может быть подставлена вместо В в приведенную выше схему. Если мы вспомним наш разбор в (4), то, конечно, сможем ясно понять, что чем менее правдоподобно В без А тем сильнее заключение.

Если мы ясно представим себе, как свидетели один за другим подтверждали перед присяжными на протяжении процесса множество улик, то мы сможем яснее увидеть, что правдоподобные

1) Ср. книгу Уигмора, цитированную на стр. 260.

рассуждения в таких процессах и в научном исследовании, в котором последовательно проверяется несколько следствий из предположения, играют аналогичную роль (ср. особенно § 12.2).

(6) Предыдущее рассмотрение ясно подсказывает составную схему правдоподобного рассуждения, имеющую к схеме, сформулированной в (5), в точности такое же отношение, какое составная схема, введенная в § 12.2, имеет к фундаментальной индуктивной схеме § 12.1. Я не вхожу здесь в этот предмет; читатель, более сведущий в доктрине судебного доказательства, мог бы разработать его с более выразительными примерами и интерпретациями, но я прибавлю еще одну иллюстрацию этой схемы.

Когда Колумб и его товарищи плыли на запад через неведомый океан, они всякий раз, когда видели птиц, приветствовали их громкими возгласами. Они рассматривали птиц как благоприятный признак, указывающий на близость земли. Хотя в этом они неоднократно бывали разочарованы, лежащее в основании рассуждение мне кажется совершенно правильным. Если сформулировать это рассуждение со всеми подробностями, то оно будет звучать следующим образом:

Это рассуждение в точности соответствует схеме, сформулированной в (5): присутствие птиц рассматривается как косвенная улика в пользу близости земли. Спутники Колумба видели нескольких птиц в четверг, 11 октября 1492 года, а на следующий день был открыт первый остров Нового Света.

Читатель может заметить, что проиллюстрированная схема лежит в основании многих из наших каждодневных рассуждений.

ПРИМЕРЫ И ПРИМЕЧАНИЯ К ГЛАВЕ XIII

Первая часть

1. Следуя методу § (4) 6, выведите доказательную схему, упомянутую в § 3, из доказательной схемы, упомянутой в § 1.

2. Восполните детали доказательства, намеченного в § 5: выведите эвристическую схему § 2 из эвристической схемы § 1.

3. Выведите эвристическую схему § 3 из эвристической схемы § 1.

4. В кроссворде нам нужно найти слово из 8 букв, и вот к нему ключ: «неприятная форма верности»1).

1) The Manchester Guardian Weekly, November 29,1951. (Пример, естественно, пришлось заменить; соответственно были немного изменены и наводящие вопросы. В оригинале имеется в виду слово «Tiredness» — усталость. — Прим. перев.)

Условие, которому должно удовлетворять неизвестное слово, конечно, высказано двусмысленно. После нескольких неудачных попыток мы можем подметить, что «верность» состоит из восьми букв, как раз из стольких, из скольких состоит и неизвестное слово, и это может привести нас к следующему предположению:

Л. Неизвестное слово означает «неприятное» и является анаграммой слова ВЕРНОСТЬ.

(Анаграмма данного слова — это слово, составленное из тех же букв, но расположенных в другом порядке.) Это предположение A может казаться весьма вероятным. (Действительно, слова «форма верности» могут наводить на мысль, что на кроссвордном жаргоне речь идет об анаграмме слова «верность».) Стараясь отгадать другие неизвестные слова кроссворда, мы находим вполне правдоподобные решения для двух из них, пересекающих упомянутое восьмибуквенное слово, для которого мы получаем две возможные буквы, расположенные как указано на следующей диаграмме:

Мы можем рассматривать это как довод в пользу нашего предположения А.

(a) Почему? Укажите соответствующую схему.

(b) Попытайтесь найти требуемое восьмибуквенное слово. [Отыскивая это слово, вы имеете естественную возможность оценить вес этого довода в пользу А. Вот несколько наводящих вопросов: Где наиболее вероятно должен стоять b? Куда можно было бы поставить гласные Е и О? См. также Как решать задачу, стр. 79—81.]

5. Возвратимся еще раз к судебному случаю, уже рассмотренному в § 12.3 и (более полно) в § 10. Рассмотрим снова обвинение (Factum Probandum, факт, который должен быть доказан обвинителем):

Л. Подсудимый взорвал яхту.

Однако изменим утверждение В и в качестве В рассмотрим здесь утверждение:

.8. Подсудимый купил динамит в такой-то лавке, в такой-то день.

Изменение состоит в том, что В обозначает теперь не общее утверждение, а конкретный факт. (Суд предпочитает или должен был бы предпочитать иметь дело с фактами как можно более точными.) Примем В за доказанное. (Итак, В есть Factum Probans — факт, подкрепленный доказательством.)

Изменение утверждений, которое мы произвели, не может изменить силу аргументации. Но какова теперь схема?

6. Подсудимые — подрядчик и государственный чиновник. Один обвиняется в том, что дал, а другой в том, что взял взятку.

Обвинение носит конкретный характер: обвинительный акт утверждает, что плата наличными за новый автомобиль чиновника была произведена из кармана подрядчика. Одним из свидетелей обвинения был торговец автомобилями; он показал, что к 29 ноября получил 875 долларов как плату за автомобиль чиновника. Другим свидетелем был управляющий местным банком; он показал, что 27 ноября (того же года) с обычно бездействующего общего счета подрядчика и его жены было выдано 875 долларов; расписка была подписана женой. Эти факты не оспаривались защитой.

Что вы рассматривали бы как сильный пункт этих улик? Назовите подходящую схему.

7. Черные, Белые и Зеленые жили на одной и той же улице в Пригородске. Черные и Белые были соседями, а Зеленые жили как раз напротив. Однажды вечером мистер Черный и миссис Белая вели через изгородь продолжительный разговор. Было довольно темно, однако миссис Зеленая не преминула понаблюдать за этим разговором и сделать поспешное заключение — вы знаете, какое заключение: излюбленное предположение миссис Зеленой.

К несчастью, едва ли удастся остановить поток сплетен, начало которому положила миссис Зеленая. Если, тем не менее, взяв на себя страшный риск,

вы пожелаете образовать в своем лице совет для защиты невинных людей, оклеветанных миссис Зеленой, я могу сообщить вам факт: Белые, которые уже давно хотели переехать поближе к конторе мистера Белого, подписали договор об аренде дома, принадлежащего дяде мистера Черного, и это произошло через несколько дней после упомянутой беседы. Воспользуйтесь этим фактом. В чем состоит ваша защита и какова схема?

8. Обвинение пытается доказать:

А. Подсудимый знал и был способен узнать жертву во время совершения преступления.

Обвинение подкрепляет это неоспоримым фактом:

С. И подсудимый и жертва за три года до совершения преступления в течение нескольких месяцев работали в одной и той же фирме.

Итак, А есть Factum Probandum, а С выдвигается в качестве Factum Probans. Какова схема? [Обозначения придуманы так, чтобы вам помочь. Играет ли какую-нибудь роль величина фирмы?!

9. Об индуктивном исследовании в математике и в физических науках. В § 6 было указано различие между «математической ситуацией» и «физической ситуацией», которое кажется важным с точки зрения правдоподобных рассуждений. По-видимому, существуют и другие различия этого рода, и одно из них будет рассмотрено здесь.

Кулон открыл, что сила взаимодействия между электрическими зарядами изменяется обратно пропорционально квадрату расстояния. Он подкрепил этот закон обратного квадрата прямыми экспериментами с крутильными весами. Эксперименты Кулона были деликатными, и расхождение между его теоретическими и экспериментальными числами было значительным. Мы не можем удержаться от подозрения, что без мощной аналогии закона Ньютона (закона обратного квадрата в гравитационном притяжении) ни сам Кулон, ни его современники не рассматривали бы его эксперименты с крутильными весами как окончательные.

Кавендиш открыл закон обратного квадрата в электрическом притяжении и отталкивании независимо от Кулона. (Исследования Кавендиша не были опубликованы при его жизни, и приоритет Кулона неоспорим.) Однако Кавендиш, чтобы подкрепить этот закон, придумал более тонкий эксперимент. Нам нет необходимости входить в детали его метода1), только одна особенность которого здесь существенна: Кавендиш учитывает возможность того, что сила пропорциональна не г"2 (г — расстояние между электрическими зарядами), а общее, г'а, где а — некоторая положительная постоянная. Его эксперимент показал, что число а — 2 по абсолютной величине не может превосходить некоторой дроби.

Экспериментальное исследование Кулона довольно похоже на индуктивное исследование в математике: он сопоставляет частные следствия из предполагаемого физического закона с наблюдениями, как математик сопоставлял бы с наблюдениями частные следствия из предполагаемого теоретико-числового закона. И здесь и там важную роль в в