Р. Курант Г. Роббинс

ЧТО ТАКОЕ МАТЕМАТИКА?

Р. Курант Г. Роббинс

ЧТО ТАКОЕ МАТЕМАТИКА?

Элементарный очерк идей и методов

Перевод с английского под ред. А. Н. Колмогорова

Издание 3-е, исправленное и дополненное

МЦНМО 2001

УДК 51(07)

К93 ББК 22.1

Федеральная Программа Книгоиздания России

Р. Курант, Г. Роббинс

К93 Что такое математика? — 3-е изд., испр. и доп. — М.: МЦНМО, 2001. —568 с.

ISBN 5-900916-45-6

Книга написана крупным математиком Рихардом Курантом в соавторстве с Гербертом Роббинсом. Она призвана сократить разрыв между математикой, которая преподается в школе, и наиболее живыми и важными для естествознания и техники разделами современной математической науки. Начиная с элементарных понятий, читатель движется к важным областям современной науки. Книга написана доступным языком и является классикой популярного жанра в математике.

Книга предназначена для школьников, студентов, преподавателей, а также для всех интересующихся развитием математики и ее структурой.

ББК 22.1

ISBN 5-900916-45-6

©МЦНМО, 2001

Оглавление

Предисловие к изданию на русском языке................... 10

К русскому читателю............................... 14

Предисловие.................................... 16

Как пользоваться книгой............................. 19

Что такое математика?.......................... 20

Глава I. Натуральные числа 25

Введение..................................... 25

§ 1. Операции над целыми числами...................... 26

1. Законы арифметики. 2. Представление целых чисел с помощью письменных знаков (нумерация). 3. Арифметические действия в недесятичных системах счисления. § 2. Бесконечность системы натуральных чисел. Математическая индукция 34 1. Принцип математической индукции. 2. Арифметическая прогрессия. 3. Геометрическая прогрессия. 4. Сумма п первых квадратов. *5. Одно важное неравенство. *6. Биномиальная теорема. 7. Дальнейшие замечания по поводу метода математической индукции.

Дополнение к главе I. Теория чисел 45

Введение..................................... 45

§ 1. Простые числа............................... 45

1. Основные факты. 2. Распределение простых чисел, а. Формулы, дающие простые числа, б. Простые числа в арифметических прогрессиях, в. Теорема о распределении простых чисел, г. Две еще не решенные задачи о простых числах.

§ 2. Сравнения.................................. 57

1. Общие понятия. 2. Теорема Ферма. 3. Квадратические вычеты.

§ 3. Пифагоровы числа и большая теорема Ферма ............. 65

§ 4. Алгоритм Евклида............................. 67

1. Общая теория. 2. Применение к основной теореме арифметики. 3. Функция Эйлера ср(л). Еще раз о теореме Ферма. 4. Непрерывные дроби. Диофантовы уравнения.

Глава II. Математическая числовая система 77

Введение..................................... 77

§ 1. Рациональные числа............................ 77

1. Рациональные числа как средство измерения. 2. Возникновение надобности в рациональных числах внутри самой математики. Принцип обобщения. 3. Геометрическое представление рациональных чисел.

§ 2. Несоизмеримые отрезки. Иррациональные числа, пределы...... 83

1. Введение. 2. Десятичные дроби: конечные и бесконечные. 3. Пределы. Бесконечные геометрические прогрессии. 4. Рациональные числа

и периодические десятичные дроби. 5. Общее определение иррациональных чисел посредством стягивающихся отрезков. *6. Иные методы определения иррациональных чисел. Дедекиндовы сечения.

§ 3. Замечания из области аналитической геометрии ............ 99

1. Основной принцип. 2. Уравнения прямых и кривых линий.

§ 4. Математический анализ бесконечного.................. 104

1. Основные понятия. 2. Счетность множества рациональных чисел и несчетность континуума. 3. «Кардинальные числа» Кантора. 4. Косвенный метод доказательства. 5. Парадоксы бесконечного. 6. Основания математики.

§ 5. Комплексные числа ............................ 116

1. Возникновение комплексных чисел. 2. Геометрическое представление комплексных чисел. 3. Формула Муавра и корни из единицы. *4. Основная теорема алгебры.

§ 6. Алгебраические и трансцендентные числа................ 130

1. Определение и вопросы существования. **2. Теорема Лиувилля и конструирование трансцендентных чисел.

Дополнение к главе II. Алгебра множеств 134

1. Общая теория. 2. Применение к математической логике. 3. Одно из применений к теории вероятностей.

Глава III. Геометрические построения. Алгебра числовых полей 143

Введение..................................... 143

Часть 1. Доказательства невозможности и алгебра 146

§ 1. Основные геометрические построения.................. 146

1. Построение полей и извлечение квадратных корней. 2. Правильные многоугольники. 3. Проблема Аполлония.

§ 2. Числа, допускающие построение, и числовые поля........... 153

1. Общая теория. 2. Все числа, допускающие построение — алгебраические.

§ 3. Неразрешимость трех классических проблем.............. 161

1. Удвоение куба. 2. Одна теорема о кубических уравнениях. 3. Трисекция угла. 4. Правильный семиугольник. 5. Замечания по поводу квадратуры круга.

Часть 2. Различные методы выполнения построений 167

§ 4. Геометрические преобразования. Инверсия............... 167

1. Общие замечания. 2. Свойства инверсии. 3. Геометрическое построение обратных точек. 4. Как разделить отрезок пополам и как найти центр данной окружности с помощью одного циркуля.

§ 5. Построения с помощью других инструментов. Построения Маскерони с помощью одного циркуля........................ 173

*1. Классическая конструкция, служащая для удвоения куба. 2. Построения с помощью одного циркуля. 3. Черчение с помощью различных механических приспособлений. Механические кривые. Циклоиды.

*4. Шарнирные механизмы. Инверсоры Поселье и Гарта.

§ 6. Еще об инверсии и ее применениях ................... 185

1. Инвариантность углов. Семейства окружностей. 2. Применение к проблеме Аполлония. 3. Повторные отражения.

Глава IV. Проективная геометрия. Аксиоматика. Неевклидовы геометрии 191

§ 1. Введение .................................. 191

1. Классификация геометрических свойств. Инвариантность при преобразованиях. 2. Проективные преобразования.

§ 2. Основные понятия............................. 194

1. Группа проективных преобразований. 2. Теорема Дезарга.

§ 3. Двойное отношение ............................ 198

1. Определение и доказательство инвариантности. 2. Применение к полному четырехстороннику.

§ 4. Параллельность и бесконечность..................... 206

1. «Идеальные» бесконечно удаленные точки. 2. Идеальные элементы и проектирование. 3. Двойное отношение с бесконечно удаленными элементами.

§ 5. Применения................................. 212

1. Предварительные замечания. 2. Двумерное доказательство теоремы Дезарга. 3. Теорема Паскаля . 4. Теорема Брианшона. 5. Замечание по поводу двойственности.

§ 6. Аналитическое представление....................... 217

1. Вводные замечания. *2. Однородные координаты. Алгебраические основы двойственности.

§ 7. Задачи на построение с помощью одной линейки............ 223

§ 8. Конические сечения и квадрики...................... 224

1. Элементарная метрическая геометрия конических сечений. 2. Проективные свойства конических сечений. 3. Конические сечения как «линейчатые кривые». 4. Теоремы Паскаля и Брианшона для общего случая произвольных конических сечений. 5. Гиперболоид.

§ 9. Аксиоматика и нееклидова геометрия.................. 240

1. Аксиоматический метод. 2. Гиперболическая неевклидова геометрия. 3. Геометрия и реальность. 4. Модель Пуанкаре. 5. Эллиптическая, или риманова, геометрия.

Приложение. Геометрия в пространствах более чем трех измерений 253

1. Введение. 2. Аналитический подход. *3. Геометрический, или комбинаторный, подход.

Глава V. Топология 261

Введение..................................... 261

§ 1. Формула Эйлера для многогранников.................. 262

§ 2. Топологические свойства фигур...................... 267

1. Топологические свойства. 2. Свойства связности.

§ 3. Другие примеры топологических теорем................. 270

1. Теорема Жордана о замкнутой кривой. 2. Проблема четырех красок. *3. Понятие размерности. 4. Теорема о неподвижной точке. 5. Узлы.

§ 4. Топологическая классификация поверхностей.............. 282

1. Род поверхности. *2. Эйлерова характеристика поверхности. 3. Односторонние поверхности.

Приложение. 290

*1. Проблема пяти красок. 2. Теорема Жордана для случая многоугольников. *3. Основная теорема алгебры.

Глава VI. Функции и пределы 299

Введение..................................... 299

§ 1. Независимое переменное и функция................... 300

1. Определения и примеры. 2. Радианная мера углов. 3. График функции. Обратные функции. 4. Сложные функции. 5. Непрерывность. *6. Функции нескольких переменных. *7. Функции и преобразования.

§ 2. Пределы................................... 317

1. Предел последовательности ап. 2. Монотонные последовательности. 3. Число Эйлера е. 4. Число к. *5. Непрерывные дроби.

§ 3. Пределы при непрерывном приближении................ 330

1. Введение. Общие определения. 2. Замечания по поводу понятия предела. 3. Предел ^ИИ, 4. Пределы при х —> оо.

§ 4. Точное определение непрерывности.................... 337

§ 5. Две основные теоремы о непрерывных функциях............ 339

1. Теорема Больцано. *2. Доказательство теоремы Больцано. 3. Теорема Вейерштрасса об экстремальных значениях. *4. Теорема о последовательностях. Компактные множества.

§ 6. Некоторые применения теоремы Больцано ............... 344

1. Геометрические применения. *2. Применение к одной механической проблеме.

Дополнение к главе VI. Дальнейшие примеры на пределы и непрерывность 349

§ 1. Примеры пределов............................. 349

1. Общие замечания. 2. Предел qn. 3. Предел ^/р. 4. Разрывные функции как предел непрерывных. *5. Пределы при итерации.

§ 2. Пример, относящийся к непрерывности................. 355

Глава VII. Максимумы и минимумы 357

Введение..................................... 357

§ 1. Задачи из области элементарной геометрии............... 358

1. Треугольник наибольшей площади при двух заданных сторонах.

2. Теорема Герона. Экстремальное свойство световых лучей. 3. Применения к задачам о треугольниках. 4. Свойства касательных к

эллипсу и гиперболе. Соответствующие экстремальные свойства. *5. Экстремальные расстояния точки от данной кривой.

§ 2. Общий принцип, которому подчинены экстремальные задачи..... 366

1. Принцип. 2. Примеры.

§ 3. Стационарные точки и дифференциальное исчисление......... 369

1. Экстремальные и стационарные точки. 2. Максимумы и минимумы функций нескольких переменных. Седловые точки. 3. Точки минимакса и топология. 4. Расстояние точки от поверхности.

§ 4. Треугольник Шварца............................ 375

1. Доказательство, предложенное Шварцем. 2. Другое доказательство. 3. Тупоугольные треугольники. 4. Треугольники, образованные световыми лучами. *5. Замечания, касающиеся задач на отражение и эргодическое движение.

§ 5. Проблема Штейнера............................ 382

1. Проблема и ее решение. 2. Анализ возникающих возможностей. 3. Дополнительная проблема. 4. Замечания и упражнения. 5. Обобщение: проблема уличной сети.

§ 6. Экстремумы и неравенства........................ 389

1. Среднее арифметическое и среднее геометрическое двух положительных величин. 2. Обобщение на случай п переменных. 3. Метод наименьших квадратов.

§ 7. Существование экстремума. Принцип Дирихле............. 394

1. Общие замечания. 2. Примеры. 3. Экстремальные проблемы элементарного содержания. 4. Трудности, возникающие в более сложных случаях.

§ 8. Изопериметрическая проблема...................... 401

*§ 9. Экстремальные проблемы с граничными условиями. Связь между проблемой Штейнера и изопериметрической проблемой.......... 404

§ 10. Вариационное исчисление........................ 407

1. Введение. 2. Вариационное исчисление. Принцип Ферма в оптике.

3. Решение задачи о брахистохроне, принадлежащее Якобу Бернулли.

4. Геодезические линии на сфере. Минимаксы.

§ 11. Экспериментальные решения задач на минимум. Опыты с мыльными

пленками.................................. 413

1. Введение. 2. Опыты с мыльными пленками. 3. Новые опыты, относящиеся к проблеме Плато. 4. Экспериментальные решения других математических проблем.

Глава VIII. Математический анализ 425

Введение..................................... 425

§ 1. Интеграл .................................. 426

1. Площадь как предел. 2. Интеграл. 3. Общие замечания о понятии интеграла. Общее определение. 4. Примеры интегрирования. Интегрирование функции хг. 5. Правила «интегрального исчисления».

§ 2. Производная................................ 442

1. Производная как наклон. 2. Производная как предел. 3. Примеры.

4. Производные от тригонометрических функций. *5. Дифференцируемость и непрерывность. 6. Производная и скорость. Вторая производная и ускорение. 7. Геометрический смысл второй производной. 8. Максимумы и минимумы.

§ 3. Техника дифференцирования....................... 455

§ 4. Обозначения Лейбница и «бесконечно малые»............. 461

§ 5. Основная теорема анализа ........................ 463

1. Основная теорема. 2. Первые применения. Интегрирование функций *г, cos*, sin*. Функция arctgх. 3. Формула Лейбница для к.

§ 6. Показательная (экспоненциальная) функция и логарифм....... 471

1. Определение и свойства логарифма. Эйлерово число е. 2. Показательная (экспоненциальная) функция. 3. Формулы дифференцирования функций е*, ах, Xs. 4. Явные выражения числа е и функций е* и In* в виде пределов. 5. Бесконечный ряд для логарифма. Вычисление логарифмов.

§ 7. Дифференциальные уравнения...................... 482

1. Определения. 2. Дифференциальное уравнение экспоненциальной функции. Радиоактивный распад. Закон роста. Сложные проценты. 3. Другие примеры. Простые колебания. 4. Закон движения Ньютона.

Дополнение к главе VIII. 491

§ 1. Вопросы принципиального порядка ................... 491

1. Дифференцируемость. 2. Интеграл. 3. Другие приложения понятия интеграла. Работа. Длина кривой.

§ 2. Порядки возрастания ........................... 498

1. Показательная функция и степени переменного х. 2. Порядок возрастания функции 1п(я!).

§ 3. Бесконечные ряды и бесконечные произведения............ 501

1. Бесконечные ряды функций. 2. Формула Эйлера cos* + /sin* = ёх. 3. Гармонический ряд и дзета-функция. Формула Эйлера, выражающая sin* в виде бесконечного произведения. *§ 4. Доказательство теоремы о простых числах на основе статистического метода.................................... 511

Приложение. Дополнительные замечания. Задачи и упражнения 517

Арифметика и алгебра............................. 517

Аналитическая геометрия............................ 519

Геометрические построения........................... 525

Проективная и неевклидова геометрия.................... 525

Топология .................................... 527

Функции, пределы, непрерывность....................... 530

Максимумы и минимумы............................ 531

Дифференциальное и интегральное исчисления............... 533

Техника интегрирования ............................ 535

Добавление 1. Вклейка «От издательства» в первое издание книги на русском языке 541

Добавление 2. О создании книги «Что такое математика?» 544

Рекомендуемая литература............................ 551

Предметный указатель............................... 557

Предисловие к третьему изданию на русском языке

Книга, которую держит в руках читатель,— одно из самых замечательных введений в математику в ряду тех, что обращены к широкой читательской аудитории. Ее замысел выражен в предисловии: «Нет ничего невозможного в том, чтобы, начиная от первооснов и следуя по прямому пути, добраться до таких возвышенных точек, с которых можно ясно обозреть самую сущность и движущие силы современной математики.»

Первый из авторов книги — Рихард Курант (1888—1972) —один из ведущих математиков XX века, ученик Д. Гильберта, иностранный член Академии Наук СССР. Книги Куранта неоднократно издавались на русском языке. На них выросло не одно поколение математиков. Его книги «Уравнения математической физики», «Теория функций», «Уравнения в частных производных», и «Принцип Дирихле» до сих пор остаются основополагающими при изучении математики.

Данную книгу Курант задумал написать в драматический период истории, осенью 1939 г., когда разразилась вторая мировая война. Пятью годами раньше он оказался в Соединенных Штатах Америки, изгнанный фашистами со своей родины — Германии, где он работал в математическом интституте Геттингенского университета. Нельзя не отметить огромную заслугу Куранта как организатора в том, что этот институт стал мировым математическим центром. Собственно говоря, Курант, воплотив давнюю мечту Феликса Клейна, основал этот институт. В США Курант создал еще один выдающийся институт (ныне известный как «курантовский институт»), который играл и играет важную роль в развитии прикладной математики во всем мире.

Для осуществления своего замысла — написать книгу, читая которую можно было бы «войти в соприкосновение с самим содержанием живой математической науки»,— Курант привлек молодого двадцатичетырехлетнего тополога Герберта Роббинса. Курант, используя свой талант организатора, сумел добыть в те трудные годы немалые материальные средства для издания такого объемного труда. Он долго колебался, выбирая название для своей книги, и окончательно утвердился в нем, лишь поговорив с великим немецким писателем, также лишенным родины, Томасом Манном.

Книга Куранта и Роббинса была переведена на русский язык и подготовлена к печати в 1947 г. Это было очень трудное время для нашей страны. Только что закончилась Великая Отечественная война, потребовавшая немыслимого напряжения. Но, несмотря на это, целесообразность издания труда Куранта и Роббинса была совершенно несомненной для проницательных ученых, думавших о будущем страны.

Однако для того, чтобы книга вышла в свет, потребовалось преодолеть существенные препятствия: у нас началась борьба с космополитизмом, когда русская культура противопоставлялась мировой, а значение последней принижалось. Для выхода книги потребовалось предисловие «От издательства». Оно было вклеено в каждый экземпляр отпечатанного тиража (15000 экземпляров), между десятой и одиннадцатой страницами, без номеров страниц и без указания о нем в оглавлении.

Требовались особые аргументы для того, чтобы уже напечатанный тираж не был уничтожен. Предисловие было написано Андреем Николаевичем Колмогоровым — одним из величайших математиков уходящего века, хотя и не было подписано им.

Это предисловие — примечательный исторический документ, в котором отражены драматические перипетии того времени. Оно напечатано в добавлении к этому изданию, но мне хочется привести здесь некоторые фрагменты из него о значении книги Куранта и Роббинса. Они актуальны и в наше время, когда живо обсуждаются проблемы математического образования.

Первые три абзаца предисловия обращены к тем основным группам молодежи, для которых, по мнению Колмогорова, книга может быть наиболее полезна. Прежде всего, это школьники, ибо «существует большой разрыв между математикой, которая преподается в средней школе, и наиболее живыми и важными для естествознания и техники разделами современной математической науки». Затем, это студенты инженерных, химических, биологических и сельскохозяйственных вузов, в которых «оставляют совершенно в стороне ряд более общих и новых идей математики... Между тем, эти идеи становятся все более существенными для всей совокупности точных и технических наук». Наконец, это «молодежь, избравшая своей специальностью математику или те разделы естественных наук (механика, астрономия, физика), изучение которых связано с прохождением вполне современного курса математики... [и которая] часто нуждается в том, чтобы еще на стадии перехода из средней школы в высшую в более легкой и наглядной форме познакомиться с различными разделами математики, вплоть до самых важных и современных».

Труд Куранта и Роббинса удовлетворяет потребности этих групп молодежи. Но не только. Эта книга интересна всякому человеку, которому небезразлична судьба научного знания. Вне всякого сомнения, она входит в

золотой фонд литературы по математике. Книга была переведена на многие языки и сразу же после ее издания стала математическим бестселлером.

Эта книга была написана шестьдесят лет назад. С тех пор во всем мире и в математической науке произошли весьма значительные изменения. Структура книги Куранта и Роббинса во многом соответствует структуре математики, сложившейся в начале века. Представление об этой структуре дает список основных секций на Втором математическом конгрессе (Париж, 1900 г.): арифметики и алгебры, геометрии, анализа, механики и математической физики. Ныне, в дополнение к этим четырем секциям, на современных конгрессах работают секции математической логики и оснований математики, топологии, алгебраической геометрии, комплексного анализа, теории групп Ли и теории представлений, теории функций и функционального анализа, дифференциальных уравнений с частными производными, обыкновенных дифференциальных уравнений, численных методов, дискретной математики и комбинаторики, теории информации и приложений математики к нефизическим наукам.

Масштаб произошедших изменений не даёт возможности в коротких редакторских примечаниях отразить содержательно достижения в математике за последние две трети века. Поэтому мы ограничились лишь самыми необходимыми комментариями к тексту книги, но при этом значительно пересмотрели и расширили список литературы, включив в него наиболее интересные книги, ориентированные на школьников, вышедшие за последние тридцать лет,

В добавлении помещен также фрагмент книги К. Рид «Курант в Гёттингене и Нью-Йорке», посвященный истории создания книги Куранта и Роббинса.

В. М. Тихомиров

Предисловие ко второму изданию на русском языке

Книга Р. Куранта и Г. Роббинса уже издавалась в СССР в 1947 г. Она пользуется большим успехом у любителей математики самых различных возрастов и уровней подготовки, но давно уже стала библиографической редкостью. В серии «Математическое просвещение» она займет свое почетное место.

Перевод, выполненный для первого издания под редакций покойного проф. В. Л. Гончарова, был выправлен и пополнен по последним английскому (1948) и немецкому (1962) изданиям. Восстановлен также предметный указатель. Список «рекомендованной литературы» следует оригиналу

лишь в части книг, переведенных на русский язык; редакторы русского издания дополнили его рядом книг, имеющихся на русском языке.

Примечания редакторов русского издания немногочисленны (они помечены цифрами, в то время как примечания авторов обозначены звездочками1.) Редакторы, не желая нарушать цельный и впечатляющий стиль книги, не стремились исправлять и дополнять довольно случайный выбор их указаний на историю вопроса и принадлженость отдельных результатов определенным лицам.

Мы рады поблагодарить проф. Р. Куранта за любезное внимание, оказанное им новому изданию книги на русском языке. В своем коротком обращении к русскому читателю он еще раз подчеркивает руководящую идею своей педагогической деятельности: пропаганду органического единства математики и ее неразрывной связи с естествознанием и техникой. При этом имеется в виду не нравоучения об обязанности математиков быть полезными, а наглядная демонстрация того, что живые источники математического творчества неотделимы от интереса к познанию природы и задачам управления природными явлениями.

В новом издании использованы замечания проф. К. Л. Зигеля и проф. Отто Нейгебауэра, которым мы вместе с авторами выражаем искреннюю признательность.

Москва, А. Н. Колмогоров

12 ноября 1966 г.

1 В настоящем издании не сохранилось. — Прим. ред. наст. изд.

К русскому читателю

Выход в свет второго русского издания нашей книги — весьма приятное для меня событие. Я всегда с глубоким восхищением относился к замечательному вкладу в нашу науку, сделанному многими выдающимися математиками Советского Союза. Пожалуй, в большей степени, чем в некоторых странах Запада, русская математическая традиция сохранила идеал единства науки и способствовала упрочению роли математики в научных и технических приложениях. На меня также производит сильнейшее впечатление активное участие, которое принимают крупные математики Советской России в деле подъема математического образования. Я рад, что свое место в русской научно-педагогической литературе по математике заняла и наша книга.

Настоящее издание отличается от предыдущих английских и немецких изданий небольшими исправлениями и уточнениями, которыми мы обязаны, в частности, профессору К. Л. Зигелю, Отто Нейгенбауэру и другим своим коллегам.

Р. Курант

Нью-Йоркский университет, 9 мая 1966 г.

ПОСВЯЩАЕТСЯ

Эрнсту, Гертруде, Гансу и Леоноре Курант

Предисловие к первому изданию

На протяжении двух с лишним тысячелетий обладание некоторыми, не слишком поверхностными, знаниями в области математики являлось необходимой составной частью интеллектуального багажа каждого образованного человека. В наши дни установленному традицией воспитательному значению математики угрожает серьезная опасность. К сожалению, профессиональные представители математической науки в данном случае не свободны от ответственности. Обучение математике нередко приобретало характер стереотипных упражнений в решении задач шаблонного содержания, что, может быть, и вело к развитию кое-каких формальных навыков, но не призывало к глубокому проникновению в изучаемый предмет и не способствовало развитию подлинной свободы мысли. Научные исследования обнаруживали тенденцию в сторону чрезмерной абстракции и специализации. Приложениям и взаимоотношениям с иными областями не уделялось достаточно внимания. И все же эти малоблагоприятные предпосылки ни в какой мере не могут послужить оправданием для политики сдачи позиций. Напротив, те, кто умеют понимать значение умственной культуры, не могут не выступить — и уже выступают — на ее защиту. Преподаватели, учащиеся — все, хотя бы и не связанные со школой, образованные люди — требуют не идти по линии наименьшего сопротивления, не складывать оружия, а приступить к конструктивной реформе преподавания. Целью является подлинное понимание существа математики как органического целого и как основы научного мышления и действования.

Несколько блестящих книг биографического и исторического содержания и кое-какие публицистические выступления разбудили в широких кругах, казалось бы, безразличных к математике, на самом деле никогда не угасавший к ней интерес. Но знание не может быть достигнуто с помощью одних лишь косвенных средств. Понимание математики не приобретается только безболезненно развлекательными способами — так же как, например, вы не сможете приобрести музыкальной культуры путем чтения журнальных статей (как бы ярко они ни были написаны), если не научитесь слушать внимательно и сосредоточенно. Нельзя обойтись без действенного соприкосновения с самим содержанием живой математической науки.

С другой стороны, следовало бы избегать всего слишком технического или искусственного, делая изложение математики в одинаковой степени свободным от духа школьной рутины и от мертвящего догматизма, отказывающегося от мотивировок и указания целей, — того самого догматизма, который представляет собой столь неприятное препятствие для честного усилия. Нет ничего невозможного в том, чтобы, начиная от первооснов и следуя по прямому пути, добраться до таких возвышенных точек, с которых можно ясно обозреть самую сущность и движущие силы современной математики.

Настоящая книга делает такую именно попытку. Поскольку она не предполагает иных сведений, кроме тех, которые сообщаются в хорошем школьном курсе, ее можно было бы назвать популярной. Но она — не уступка опасной тенденции устранить всякое напряжение мысли и упражнение. Она предполагает известный уровень умственной зрелости и готовность усваивать предлагаемое рассуждение. Книга написана для начинающих и для научных работников, для учащихся и для учителей, для философов и для инженеров; она может быть использована как учебное пособие в учебных заведениях и в библиотеках. Может быть, намерение обратиться к такому широкому кругу читателей является чересчур смелым и самонадеянным. Нужно признать, что под давлением иной работы мы вынуждены были при публикации этой книги искать компромиссы: подготовка велась многие годы, но так и не была по-настоящему закончена. Мы будем рады критике и готовы выслушать пожелания.

Если ответственность за план и философское содержание этой публикации ложится на нижеподписавшегося, то воздаяние ее достоинствам (если таковые имеются) мне подобает разделить с Гербертом Роббинсом. С самого момента присоединения к задуманной работе он отдался ей с увлечением, как своей собственной, и его сотрудничество сыграло решающую роль в окончательном придании книге ее настоящей формы.

Я должен выразить свою глубокую благодарность за помощь многочисленным друзьям. Беседы с Нильсом Бором, Куртом Фридрихом и Отто Нейгебауэром оказали влияние на мои позиции в вопросах философского и исторического характера. Большое количество конструктивных критических замечаний с точки зрения педагога высказала Эдна Крамер. Давид Гильбарг записал лекции, положенные затем в основу книги. Эрнест Курант, Норман Девидс, Чарльз де Прима, Альфред Горн, Герберт Минтцер, Вольфганг Вазов и другие помогли в поистине бесконечной работе по перепечатке рукописи и внесли в нее множество улучшений. Доналд Флендерс внес много ценных предложений и тщательно выверил рукопись к печати. Джон Кнудсен, Герта фон Гумпенберг, Ирвинг Риттер и Отто Нейгебауэр изготовили чертежи. Часть упражнений для приложения в конце книги исходит от Г. Уитни. Курсы лекций и статьи, положенные

в основу книги, были осуществлены благодаря щедрой поддержке Отдела народного образования Рокфеллеровского фонда. Я должен также поблагодарить издательство Waverly Press, особенно г-на Гровера К. Орта, за чрезвычайно квалифицированную работу и издательство Oxford University Press, особенно г-на Филипа Бодрена и г-на У. Омана, за инициативу и поддержку.

Нью-Рошель, Нью-Йорк, Р. Курант

22 августа 1941 г.

Предисловие ко второму, третьему и четвертому изданиям

В последний год, под воздействием совершающихся событий, возник усиленный спрос на математическую информацию и соответствующий инструктивный материал. Сейчас больше чем когда-либо существует опасность выхолащивания и разочарований, если только учащиеся (и учителя) не сумеют увидеть и схватить то, что лежит за формулами и преобразованиями, — истинное существо и содержание математики. Именно для тех, кто видит глубже, была написана эта книга, и отклики на первое издание поддерживают в авторах надежду, что она принесет пользу.

Благодарим читателей, чей критические замечания позволили внести в новые издания многочисленные поправки и улучшения. За большую помощь в подготовке четвертого издания сердечно благодарим г-жу Наташу Артин.

Нью-Рошель, Нью-Йорк, Р. Курант

18 марта 1943 г. 10 октября 1945 г. 28 октября 1947 г.

Как пользоваться книгой

Порядок изложения в книге — систематический, но это не значит никоим образом, что читатель обязан читать ее подряд—страницу за страницей, главу за главой. Главы в значительной степени независимы одна от другой. Часто начало раздела покажется легкодоступным, но потом дорога постепенно пойдет вверх, становясь круче в конце главы и в дополнениях к ней. Поэтому читатель, нуждающийся скорее в общей информации, чем в приобретении специальных знаний, поступит правильно, если удовлетворится таким отбором материала, который может быть осуществлен по принципу избегания более детализированных рассмотрений.

Учащийся с ограниченной математической подготовкой пусть выбирает по своему вкусу. Звездочками и мелким шрифтом отмечено то, что может быть опущено при первом чтении без серьезного ущерба для понимания последующего. Больше того, беды не будет, если при изучении книги читатель ограничится теми разделами или главами, которые представляют для него наибольший интерес. Большинство упражнений не носит чисто формального характера; более трудные отмечены звездочкой. Не надо слишком огорчаться, если вы не сумеете выполнить некоторые из них.

Преподаватели школ найдут в главах, посвященных геометрическим построениям и максимумам и минимумам, материал, подходящий для кружковых занятий или для отдельных групп учащихся.

Мы надеемся, что книга сможет послужить и учащимся разных классов колледжей и лицам тех или иных профессий, действительно интересующимся проблемами точного знания. Она может быть положена в основу «свободных» курсов в колледжах по основным понятиям математики. Главы III, IV и V подходят для курса геометрии, тогда как главы VI и VIII, вместе взятые, образуют законченное изложение основ анализа с опорой скорее на понимание, чем на достижение технического совершенства. Они могут быть использованы в качестве вводного текста преподавателем, который пожелал бы дополнить учебный курс в соответствии с теми или иными специфическими потребностями, и в особенности — обогатить его более разнообразными примерами. Многочисленные упражнения разбросаны по всей книге; дополнительное собрание упражнений в конце могло бы, как мы полагаем, облегчить ее использование в школьной обстановке.

Мы надеемся, что и специалист обнаружит кое-что интересное в деталях и в иных элементарных рассуждениях, содержащих в себе зерно более широких идей.

Что такое математика?

Математика содержит в себе черты волевой деятельности, умозрительного рассуждения и стремления к эстетическому совершенству. Ее основные и взаимно противоположные элементы — логика и интуиция, анализ и конструкция, общность и конкретность. Как бы ни были различны точки зрения, питаемые теми или иными традициями, только совместное действие этих полярных начал и борьба за их синтез обеспечивают жизненность, полезность и высокую ценность математической науки.

Без сомнения, движение вперед в области математики обусловлено возникновением потребностей, в большей или меньшей мере носящих практический характер. Но раз возникшее, оно неизбежно приобретает внутренний размах и выходит за границы непосредственной полезности. Совершающееся таким образом превращение прикладной науки в теоретическую наблюдается в истории древности, но не в меньшей степени также и в наши дни: достаточно принять во внимание тот вклад, который сделан в современную математику инженерами и физиками.

Самые ранние из дошедших до нас образцов математической мысли появились на Востоке: около двух тысячелетий до нашей эры вавилоняне собрали обширный материал, который мы склонны были бы в настоящее время отнести к элементарной алгебре. Но как наука в современном смысле слова математика возникает позднее на греческой почве, в пятом и четвертом столетиях до нашей эры. Все усиливающееся соприкосновение между Востоком и Грецией, начавшееся во времена Персидской империи и достигшее апогея в период, непосредственно следующий за экспедициями Александра Македонского, обеспечило грекам возможность перенять достижения вавилонян в области математики и астрономии. Математика не замедлила стать объектом философских дискуссий, обычных в греческих городах-государствах. Таким образом, греческие мыслители осознали значительные трудности, связанные с основными математическими концепциями — непрерывностью, движением, бесконечностью — и с проблемой измерения произвольных величин данными заранее единицами. Но обнаружилась и решимость преодолеть препятствия: возникшая в результате великолепного усилия мысли евдоксова теория геометрического континуума представляет собой такое достижение, которое можно поставить в один ряд только с современной теорией иррациональных чисел. От Евдокса идет аксиоматико-дедуктивное напрвление в математике, проявившееся вполне отчетливо в «Началах» Евклида.

Хотя теоретико-постулативная тенденция незыблемо остается одной из самых ярких особенностей греческой математики и, как таковая, оказала беспримерное влияние на дальнейшее развитие науки, тем не менее необходимо со всей энергией указать, что практические потребности и связь

с физической реальностью участвовали никак не в меньшей мере в создании античной математики и что изложению, свободному от евклидовой строгости, очень часто отдавалось предпочтение.

Не исключено, что именно слишком раннее открытие трудностей, связанных с «несоизмеримыми» величинами, помешало грекам развить искусство численных операций, сделавшее в предшествовавшие эпохи значительные успехи на Востоке. Вместо этого они стали искать пути в дебрях чистой аксиоматической геометрии. Так началось одно из странных блужданий в истории науки, и, может быть, были при этом упущены блестящие возможности. Почти на два тысячелетия авторитет греческой геометрической традиции задержал неизбежную эволюцию идеи числа и буквенного исчисления, положенных впоследстии в основу точных наук.

После периода медленного накопления сил — с возникновением в XVII столетии аналитической геометрии и дифференциального и интегрального исчислений — открылась бурная революционная фаза в развитии математики и физики. В XVII и XVIII вв. греческий идеал аксиоматической кристаллизации и систематической дедукции потускнел и утерял свое влияние, хотя античная геометрия продолжала высоко расцениваться. Логически безупречное мышление, отправляющееся от отчетливых определений и «очевидных», взаимно не противоречащих аксиом, перестало импонировать новым пионерам математического знания. Предавшись подлинной оргии интуитивных догадок, перемешивая неоспоримые заключения с бессмысленными полумистическими утверждениями, слепо доверяясь сверхчеловеческой силе формальных процедур, они открыли новый математический мир, полный несметных богатств. Но мало-помалу экстатическое состояние мысли, упоенной головокружительными успехами, уступило место духу сдержанности и критицизма. В XIX столетии осознание необходимости консолидировать науку, особенно в связи с нуждами высшего образования, после Французской революции получившего широкое распространение, повело к ревизии основ новой математики; в частности, внимание было направлено к дифференциальному и интегральному исчислениям и к уяснению подразумеваемого анализом понятия предела. Таким образом, XIX век не только стал эпохой новых успехов, но и был ознаменован плодотворным возвратом к классическому идеалу точности и строгости доказательств. В этом отношении греческий образец был даже превзойден. Еще один раз маятник качнулся в сторону логической безупречности и отвлеченности. В настоящее время мы еще, по-видимому, не вышли из этого периода, хотя позволительно надеяться, что установившийся прискорбный разрыв между чистой математикой и ее жизненными приложениями, неизбежный, по-видимому, во времена критических ревизий, сменится эрой более тесного единения. Приобретенный запас внутренних сил и, помимо всего прочего, чрезвычайное упрощение, достигаемое на основе ясного

понимания, позволяют сегодня манипулировать математической теорией таким образом, чтобы приложения не упускались из виду. Установить еще раз органическую связь между чистым и прикладным знанием, здоровое равновесие между абстрактной общностью и полнокровной конкретностью — вот как нам представляется задача математики в непосредственно обозримом будущем.

Здесь не место входить в подробный философский или психологический анализ математики. Хочется отметить все же некоторые моменты. Чрезмерное подчеркивание аксиоматико-дедуктивного характера математики представляется мне весьма опасным. Конечно, начало конструктивного творчества, интуитивное начало, являющееся источником наших идей и доводов в их пользу, с трудом укладываются в простые философские формулировки; и тем не менее именно это начало есть подлинная суть любого математического открытия, даже если оно относится к самым абстрактным областям. Если целью и является четкая дедуктивная форма, то движущая сила математики — это интуиция и конструкции. В допущении, что математика есть не более чем система следствий, извлекаемых из определений и постулатов, которые должны быть только совместимы между собой, а в остальном являются продуктом свободной фантазии математиков, таится серьезная угроза для самого существования науки. Если бы это было действительно так, математика была бы занятием, недостойным мыслящего человека. Она была бы просто игрой с определениями, правилами и силлогизмами, не имеющей ни причины, ни цели. Представление, согласно которому человеческий интеллект может творить лишенные какого бы то ни было смысла системы постулатов, есть обман, точнее, полуправда.

Получать результаты, имеющие научную ценность, свободный разум может, только подчиняясь суровой ответственности перед природой, только следуя некоей внутренней необходимости.

Хотя созерцательное направление логического анализа и не представляет всей математики, оно способствовало более глубокому пониманию математических фактов и их взаимозависимости и более ясному овладению существом математических понятий. Именно из этого направления выросла современная точка зрения на математику как на образец универсально приложимого научного метода.

Каких бы философских позиций мы ни придерживались, все задачи научного исследования сводятся к нашему отношению к воспринимаемым объектам и инструментам исследования. Конечно, восприятие само по себе еще не есть ни знание, ни понимание; нужно еще согласовать их между собой и истолковать в терминах некоторых лежащих за ними сущностей, «вещей в себе», не являющихся предметами непосредственно физического изучения, а принадлежащими к метафизической сфере. Но для научного метода существенным является отказ от метафизических умозрений и, в

конечном счете, представление всех наблюдаемых фактов в форме понятий и конструкций. Отказ от претензии понимания природы «вещей в себе», от постижения «окончательной истины», от разгадки внутренней сущности мира, быть может, будет психологически тягостен для наивных энтузиастов, но на самом-то деле этот отказ оказался в высшей степени плодотворным для развития современной научной мысли.

Некоторым из величайших открытий физики мы обязаны смелому следованию принципу устранения метафизики. Когда Эйнштейн попытался свести понятие «одновременных событий, происходящих в разных местах» к наблюдаемым явлениям, когда он понял, что вера в то, что это понятие само по себе непременно должно иметь какой-то точный смысл, есть попросту метафизический предрассудок, в этом открытии уже было заключено ядро его теории относительности. Когда Нильс Бор и его ученики вдумались в тот факт, что любое физическое наблюдение связано с взаимодействием между прибором и наблюдаемым объектом, то им стало ясно, что точное одновременное определение положения и скорости частицы в том смысле, в каком это понимается в физике, невозможно. Далеко идущие следствия этого открытия, составившие современную систему квантовой механики, хорошо известны ныне каждому физику. В XIX столетии господствовала идея, согласно которой механические силы и передвижения частиц в пространстве суть вещи в себе, а электричество, свет и магнетизм можно свести к механическим явлениям (или «объяснить» в механических терминах), подобно тому как это было сделано с теорией теплоты. Была выдвинута концепция гипотетической среды — так называемого «эфира»,— способной к не вполне понятным механическим передвижениям, представляющимся нам в качестве света или электричества. Постепенно выяснилось, что этот эфир принципиально ненаблюдаем, т. е. что это понятие принадлежит скорее метафизике, нежели физике. Вначале с сожалением, а затем с облегчением идея механического объяснения световых и электрических явлений — а вместе с ней и понятие эфира — была окончательно отброшена.

Подобная же ситуация, и даже еще более отчетливая, создалась и в математике. В течение столетий математики рассматривали интересующие их объекты — числа, прямые и т. д. — как некие субстанции, вещи в себе. Поскольку, однако, эти «сущности» упорно не поддавались попыткам точного описания их природы, математики девятнадцатого столетия стали понемногу укрепляться в мысли, что вопрос о значении этих понятий как субстанциальных объектов в рамках математики (да и где бы то ни было) просто не имеет смысла. Математические утверждения, в которые входят эти термины, относятся вовсе не к физической реальности; они лишь устанавливают взаимосвязи между математически «неопределимыми объектами» и правила оперирования с ними. Вопрос о том, чем «на самом

деле» являются точки, прямые и числа, не может и не должна обсуждать математическая наука. Действительно существенными и имеющими непосредственное касательство к «проверяемым» фактам являются структура и взаимосвязи между этими объектами: что две точки определяют прямую, что из чисел по определенным правилам получаются другие числа, и т. п. Ясное осознание необходимости отказа от представления об основных математических понятиях как о реально существующих предметах явилось одним из самых важных и плодотворных завоеваний современного аксиоматического развития математики.

К счастью, творческая мысль забывает о догматических философских верованиях, как только привязанность к ним становится на пути конструктивных открытий. И для специалистов, и для любителей не философия, а именно активные занятия самой математикой смогут дать ответ на вопрос: Что такое математика?

ГЛАВА I

Натуральные числа

Введение

Число — это основное понятие современной математики. Но что такое число? Если мы говорим, что^ + -| = 1,|--^- = |- или что (-1) • (-1) = 1, то какой смысл вкладывается в эти утверждения? В школе мы изучаем технику действий с дробями и с отрицательными числами, но, чтобы приобрести подлинное понимание того, как устроена система чисел, недостаточно ограничиваться элементарными сведениями и нужно пойти несколько дальше. Греки в древнее время в основу созданной ими математики положили геометрические концепции точки и прямой; руководящим принципом современной математики стало сведение в конечном счете всех утверждений к утверждениям, касающимся натуральных чисел 1, 2, 3, ... «Бог создал натуральные числа, все прочее — дело рук человека». Этими словами Леопольд Кронекер (1823—1891) определил тот прочный фундамент, на котором может быть построено здание математики.

Числа служат для того, чтобы считать объекты, входящие в состав тех или иных объединений или собраний. Числа решительно никак не связаны с индивидуальной характеристикой считаемых объектов. Так, число «шесть» есть результат абстрагирования, производимого при рассмотрении всевозможных совокупностей, состоящих из шести предметов: оно нисколько не зависит ни от специфических свойств этих объектов, ни от употребляемых символов (обозначений). Но абстрактный характер идеи числа становится ясным только на очень высокой ступени интеллектуального развития. В глазах детей числа всегда остаются соединенными с самими осязаемыми объектами — допустим, пальцами или камешками; в языках народов числа также трактуются конкретно: для обозначения предметов различных типов употребляются различные сочетания числительных.

Мы воспользуемся тем, что математик (как таковой) не обязан заниматься философской проблемой перехода от совокупностей конкретных предметов к абстрактному понятию числа. Мы примем поэтому натуральные числа как данные вместе с двумя основными операциями, над ними совершаемыми: сложением и умножением.

§ 1. Операции над целыми числами

1. Законы арифметики. Математическую теорию натуральных (иначе, целых положительных) чисел называют арифметикой. Эта теория основана на том факте, что сложение и умножение целых чисел подчинены некоторым законам. Чтобы сформулировать эти законы во всей их общности, нельзя воспользоваться символами вроде 1, 2, 3, относящимися к определенным, конкретным числам. Утверждение

1+2=2+1

есть только частный случай общего закона, содержание которого заключается в том, что сумма двух чисел не зависит от порядка, в котором мы рассматриваем эти числа. Если мы хотим выразить ту мысль, что некоторое соотношение между целыми числами имеет место (оправдывается, осуществляется), каковы бы ни были рассматриваемые числа, то будем обозначать их символически, т. е. условно, буквами а, Ь, с, ... Раз такого рода соглашение принято, сформулировать пять основных законов арифметики — очевидно, близко знакомых читателю — не представит труда:

Два первых закона — коммутативный (переместительный) закон сложения и коммутативный закон умножения — говорят, что при сложении и при умножении можно менять порядок чисел, над которыми совершается действие. Третий — ассоциативный (сочетательный) закон сложения — гласит, что при сложении трех чисел получается один и тот же результат независимо от того, прибавим ли мы к первому числу сумму второго и третьего, или прибавим третье к сумме первого и второго. Четвертый закон есть ассоциативный закон умножения. Последний — дистрибутивный (распределительный) закон — устанавливает то обстоятельство, что при умножении суммы на некоторое целое число можно умножить на это число каждое слагаемое и полученные произведения сложить.

Эти арифметические законы совсем просты и, пожалуй, могут показаться очевидными. Но следует все же заметить, что к иного рода объектам — не к целым числам — они могут оказаться и неприменимыми. Например, если а и b обозначают не числа, а химические вещества и если «сложение» понимается в смысле обычной речи, то легко понять, что коммутативный закон сложения не всегда оправдывается. В самом деле, если, скажем, к воде будем прибавлять серную кислоту, то получится разбавленный раствор, тогда как прибавление воды к чистой серной кислоте может закончиться неблагополучно для экспериментатора. С помощью таких же иллюстраций можно показать, что в химической «арифметике» иногда нарушаются и ассоциативный, и дистрибутивный законы сложения.

Итак, можно вообразить и такие типы арифметических систем, в которых один или несколько законов 1)—5) теряют силу. Такие системы действительно изучались современной математикой. Основа, на которой покоятся законы 1)—5), дается конкретной моделью для абстрактного понятия целого числа. Вместо того чтобы пользоваться обыкновенными знаками 1, 2, 3 и т. д., станем обозначать число предметов в данной совокупности (например, яблок на данном дереве) системой точек в четырехугольном «ящичке» — таким образом, чтобы каждому предмету соответствовало по одной точке. Оперируя этими ящичками, мы сможем исследовать законы арифметики целых чисел. Чтобы сложить два целых числа а и Ь, мы сдвигаем вместе соответствующие ящички и затем уничтожаем перегородку.

Чтобы умножить а на ft, мы выстроим точки в двух ящичках в ряд и затем устроим новый ящичек, в котором точки будут расположены так, что образуют а горизонтальных и b вертикальных рядов. И тогда ясно видно, что правила 1)—5) выражают интуитивно очевидные свойства введенных операций с ящичками.

На основе определения сложения двух целых чисел можно теперь дать определение неравенства. Каждое из двух эквивалентных утверждений, именно а < b («а меньше, чем Ь») и b> а («Ь больше, чем а»), обозначает, что ящичек b может быть получен из ящичка а посредством прибавления надлежащим образом выбранного третьего ящичка с таким образом, что b = а + с. Если это так, то мы напишем

чем и определяется операция вычитания.

Рис. 1. Сложение

Рис. 2. Умножение

Рис. 3. Дистрибутивный закон

Рис. 4. Вычитание

Сложение и вычитание называют обратными операциями, так как если, например, к числу а прибавить число d, а затем из того, что получится, отнять d, то получится снова исходное число а:

(а + d) - d = а.

Нужно заметить, что число Ь — а было определено только при условии b > а. Значение символа b - а как отрицательного целого числа при условии b < а будет рассмотрено далее (стр. 79 и след.). Часто бывает удобно пользоваться обозначением b ^ а («Ь больше или равно а») или а ^ b («а меньше или равно й», «а не превосходит fc»), понимая под этим не что иное, как отрицание того, что а > Ь. Таким образом, можно написать 2 ^ 2, и можно также написать 3^2.

Мы можем еще несколько расширить область положительных целых чисел, которые мы изображаем ящичками с точками. Введем целое число нуль, изображаемое совершенно пустым ящичком; условимся обозначать такой пустой ящичек обычным символом 0. Тогда, согласно нашему определению сложения и умножения, каково бы ни было целое число а, получаются соотношения

а + 0 = а, а -0 = 0.

Действительно, а + 0 обозначает прибавление пустого ящичка к ящичку а, a а • 0 обозначает ящичек, в котором вовсе нет вертикальных рядов, т. е. пустой ящичек. Тогда уже вполне естественно расширить определение вычитания, полагая

а-а = 0

при любом а. Таковы характерные арифметические свойства нуля.

Геометрические модели вроде ящичков с точками (сюда относится древний абак) широко применялись при арифметических вычислениях вплоть до конца средневековья и только мало-помалу уступили место гораздо более совершенным символическим методам, основанным на десятичной системе.

2. Представление целых чисел с помощью письменных знаков (нумерация). Необходимо очень тщательно делать различие между целым числом и тем символом (например, 5, V и т. п.), которым пользуются для его письменного воспроизведения. В нашей десятичной системе нуль и девять целых натуральных чисел обозначаются цифрами 0, 1, 2, 3, ..., 9. Числа большей величины, как, скажем, «триста семьдесят два», представляются в виде

и в десятичной системе записываются символом 372. Существенно в данном случае то, что смысл каждой из цифр 3, 7, 2 зависит от ее положения — от того, стоит ли она на месте единиц, десятков или сотен. Используя «поместное значение» цифр (позиционный принцип), мы имеем возможность изобразить любое натуральное число с помощью всего лишь десяти цифр в их различных комбинациях. Общее правило такого изображения дается схемой, которая иллюстрируется примером

где а, Ь, с, d представляют собой целые числа в пределах от нуля до девяти. Число z в этом случае сокращенно обозначается символом

Заметим, между прочим, что коэффициенты d, с, b, а являются не чем иным, как остатками при последовательном делении числа г на 10. Так, например,

С помощью написанного выше выражения для числа z можно изображать только те числа, которые меньше десяти тысяч, так как числа большие, чем десять тысяч, требуют пяти или большего числа цифр. Если z есть число, заключенное между десятью тысячами и ста тысячами, то его можно представить в виде

и записать символически как abcde. Подобное же утверждение справедливо относительно чисел, заключенных между ста тысячами и одним миллионом, и т.д. Чрезвычайно важно располагать способом, позволяющим высказать результат, к которому мы приходим, во всей его общности посредством одной-единственной формулы. Мы можем добиться этой цели, если обозначим различные коэффициенты е, rf, с, ... одной и той же буквой а с различными значками (индексами) а0, а2, ..., а то обстоятельство, что степени числа 10 могут быть сколь угодно большими, выразим тем, что высшую степень числа 10 обозначим не 103 или 10\ как в предыдущих примерах, а станем писать 10", понимая под п совершенно произвольное натуральное число. В таком случае любое целое число z в десятичной системе может быть представлено в виде

(1)

и записано посредством символа

Как и в рассмотренном выше частном примере, мы обнаруживаем, что а0, а\, а,2, ..., ап являются остатками при последовательном делении z на 10.

В десятичной системе число «десять» играет особую роль как «основание» системы. Тот, кому приходится встречаться лишь с практическими вычислениями, может не отдавать себе отчета в том, что такое выделение числа десять не является существенным и что роль основания способно было бы играть любое целое число, большее единицы. Например, была бы вполне возможна семеричная система с основанием семь. В такой системе целое число представлялось бы в виде

(2)

где коэффициенты b обозначают числа в пределах от нуля до шести, и оно записывалось бы посредством символа

Так, число «сто девять» в семеричной системе обозначалось бы символом 214, потому что

В качестве упражнения читатель может вывести общее правило для перехода от основания 10 к любому основанию В: нужно выполнять последовательные деления на ß, начиная с данного числа z\ остатки и будут «цифрами» при записи числа в системе с основанием В. Например,

109 (в десятичной системе) = 214 (в семеричной системе).

Естественно, возникает вопрос: не был ли бы особенно желательным выбор какого-либо специального числа в качестве основания системы счисления? Мы увидим дальше, что слишком маленькое основание должно было бы вызвать кое-какие неудобства; с другой стороны, слишком большое основание потребовало бы заучивания многих цифр и знания расширенной таблицы умножения. Высказывались соображения в пользу системы с основанием 12 («двенадцатиричной»): указывалось, что 12 делится без остатка на два, на три, на четыре и на шесть, и потому вычисления, связанные с делениями и дробями, при основании 12 были бы несколько проще. Чтобы написать произвольное число в двенадцатиричной системе, понадобились бы две лишние цифры — для обозначения чисел «десять» и «одиннадцать». Пусть а обозначало бы десять, a ß — одиннадцать. Тогда в двенадцатиричной системе «двенадцать» пришлось бы написать в виде 10,

«двадцать два» — в виде 1а, «двадцать три» — в виде lß, а «сто тридцать один» — в виде aß.

Изобретение позиционной нумерации, основанной на поместном значении цифр, приписывается шумерийцам и вавилонянам; развита была такая нумерация индусами и имела неоценимые последствия в истории человеческой цивилизации. Более древние системы нумерации были построены исключительно на аддитивном принципе.1 Так, в римской нумерации CXVII обозначает «сто + десять + пять -h один + один + один». Египетская, еврейская и греческая системы были на том же уровне. Неудобством чисто аддитивной системы является то обстоятельство, что с увеличением изображаемых чисел требуется неограниченное число новых символов. Но главнейшим недостатком древних систем (вроде римской) было то, что сама процедура счета была очень трудна: даже самые простые задачи могли решать только специалисты-профессионалы. Совсем иначе обстоит дело с распространенной в наше время индусской «позиционной» системой. В средневековой Европе она появилась через итальянских купцов, в свою очередь заимствовавших ее у мусульман. Позиционная система обладает тем чрезвычайно выгодным свойством, что все числа, и малые и большие, могут быть записаны с помощью небольшого числа различных символов; в десятичной системе таковыми являются «арабские цифры» О, 1, 2, ..., 9. Не меньшее значение имеет и легкость счета в этой системе. Правила действий с числами, записываемыми по позиционному принципу, могут быть резюмированы в виде таблиц сложения и умножения и могут быть раз навсегда выучены на память. Старинному методу счета, которым раньше владели лишь немногие избранные, теперь обучают разве лишь в начальных школах. В истории культуры найдется немного примеров того, чтобы научный прогресс оказал на практическую жизнь столь глубокое, столь облегчающее влияние.

3. Арифметические действия в недесятичных системах счисления.

Исключительная роль десятка восходит к истокам цивилизации и без всякого сомнения связана со счетом по пальцам на двух руках. Но наименования числительных в разных языках указывают и на наличие (в былые времена) иных систем счисления, именно с основаниями двадцать и двенадцать. В английском и немецком языках слова, обозначающие 11 и 12, построены не по десятичному принципу, сочетающему десятки с единицами: они лингвистически независимы от слов, обозначающих число 10. Во французском языке слова, обозначающие 20 и 80, позволяют предполагать первоначальное существование системы с основанием 20, используемой

1 На самом деле элементы «позиционности» есть и в римской нумерации, во всяком случае, порядок расположения «разрядов» играет роль; так, VI = V + I, но IV = V — I, LX = L -I- X, но XL = L - X и т. п. — Прим. ред.

для тех или иных надобностей. В датском языке слово halvfirsinds-tyve, обозначающее 70, буквально переводится «полпути от трижды двадцать до четырежды двадцать». Вавилонские астрономы пользовались системой, являвшейся отчасти шестидесятеричной (с основанием 60), и именно в этом обстоятельстве следует искать объяснение того факта, что час и угловой градус подразделены на 60 минут.

В недесятичных системах счисления правила арифметики, конечно, те же самые, но таблицы сложения и умножения однозначных чисел отличны от наших десятичных. Будучи приучены к десятичной системе и связаны наименованиями числительных в нашем языке, мы, если попытаемся считать по иным системам, сначала испытаем известное неудобство. Попробуем поупражняться в умножении по семеричной системе. Прежде чем приступить к этому, рекомендуется выписать две таблички, которыми придется пользоваться.

Сложение Умножение

Станем теперь умножать 265 на 24, причем эти числа предполагаются написанными в семеричной системе. (Если написать числа по десятичной системе, то речь идет об умножении 145 на 18.) Начнем с умножения 5 на 4, что, как показывает таблица умножения, дает 26.

Мы пишем 6 на месте единицы, затем переносим двойку в следующий разряд. Далее, находим, что 4 • 6 = 33 и что 33 + 2 = 35. Пишем в произведении 5 и продолжаем таким же образом, пока умножение не закончится. При сложении чисел 1456 и 5630 на месте единиц получаем 6 + 0 = 6, затем на месте семерок 5 + 3 = 11. Пишем 1 и 1 переносим на место «сорокадевяток», где получается 1 + 6 + 4= 14. Окончательный результат:

Для проверки проделаем то же действие в десятичной системе. Чтобы переписать число 10416 по десятичной системе, придется найти степени 7 вплоть до четвертой: 72 = 49, 73 = 343, 74 = 2401. Отсюда следует, что 10416 = 2401 + 4 • 49 -I- 7 + 6, причем правая часть равенства записана уже по десятичной системе. Складывая числа, мы находим, что число 10416, записанное по семеричной системе, равно числу 2610, записанному по десятичной. Умножим теперь 145 на 18 в десятичной системе: получается как раз 2610.

Упражнения. 1) Составьте таблицы сложения и умножения в двенадцатеричной системе и проделайте несколько примеров вроде приведенного выше.

2) Напишите «тридцать» и «сто тридцать три» в системах с основаниями 7, 11, 12.

3) Что обозначают символы 11111 и 21212 в этих системах?

4) Составьте таблицы сложения и умножения для систем с основаниями 5, 11,13.

С теоретической точки зрения система, построенная по позиционному принципу с основанием 2, выделяется в том смысле, что это основание — наименьшее возможное. В этой двоичной (диадической, бинарной) системе имеются лишь две цифры: 0 и 1; всякое иное число записывается как комбинация этих символов. Таблицы сложения и умножения сводятся к двум правилам: 1 + 1 = 10 и 1-1 = 1. Но непрактичность такой системы достаточно очевидна1: чтобы изобразить уже небольшие числа, нужны длинные выражения. Так, число «семьдесят девять», которое представляется в виде 1 • 26 + 0 • 25 + 0 • 24 + 1 • 23 + 1 • 22 + 1 • 2 + 1, записывается в двоичной системе как 1001111.

Чтобы проиллюстрировать, насколько просто производится умножение в двоичной системе, перемножим числа семь и пять, которые записываются соответственно в виде 111 и 101. Принимая во внимание, что в этой системе 1 + 1 = 10, мы пишем:

и в итоге, как и следовало ожидать, получается тридцать пять.

1 Со времени написания книги (1941 г.; последнее английское издание, которым мы располагали, вышло в 1948 г.) столь «непрактичная» для обычного счета двоичная система получила широкие и общеизвестные применения в машинной математике (идея которых — «кодирование» любого текста с помощью алфавита из двух знаков — предугадывается в приводимой ниже фразе Лапласа о Лейбнице). — Прим. ред.

Готфрид Вильгельм Лейбниц (1646-1716), один из величайших умов своего времени, расценивал двоичную систему чрезвычайно высоко. Вот что говорит по этому поводу Лаплас: «В своей бинарной арифметике Лейбниц видел прообраз творения. Ему представлялось, что единица представляет божественное начало, а нуль — небытие, и что Высшее Существо создает все сущее из небытия точно таким же образом, как единица и нуль в его системе выражают все числа».

Упражнение. Исследуйте в общем виде вопрос о представлении чисел в системе с основанием а. Чтобы называть числа в этой системе, нужны наименования для однозначных чисел 0, 1, ..., а — 1 и для различных степеней а: а, а2, а3, ... Сколько именно числительных потребуется, чтобы назвать все числа до одной тысячи в системах с основанием а = 2, 3, 4, 5, ..., 15? Каково должно быть основание а, чтобы число этих имен числительных было наименьшим? (Примеры: если а = 10, то нужно десять числительных для однозначных чисел. Затем еще три числительных, обозначающих 10, 100 и 1000, всего— 13. При а = 20 нужно двадцать числительных для однозначных чисел и еще числительные для 20 и 400; всего — 22. При а = 100 понадобится 101 числительное.)

§ 2. Бесконечность системы натуральных чисел. Математическая индукция

I. Принцип математической индукции. Последовательность натуральных чисел 1, 2, 3, 4, ... не имеет конца: действительно, как только достигается некоторое число я, вслед за ним сейчас же можно написать ближайшее к нему натуральное число п + 1. Желая как-нибудь назвать эти свойства последовательности натуральных чисел, мы говорим, что этих чисел существует бесконечное множество. Последовательность натуральных чисел представляет простейший и самый естественный пример бесконечного (в математическом смысле), играющего господствующую роль в современной математике. Не раз в этой книге нам придется иметь дело с совокупностями, содержащими бесконечное множество объектов; такова, например, совокупность всех точек на прямой линии или совокупность всех треугольников на плоскости. Но бесконечная последовательность натуральных чисел безусловно представляет простейший пример бесконечной совокупности.

Последовательный, шаг за шагом, переход от п к п + 1, порождающий бесконечную последовательность натуральных чисел, вместе с тем лежит в основе одного из важнейших и типичных для математики рассуждений, именно принципа математической индукции. «Эмпирическая индукция», применяемая в естественных науках, исходит из частного ряда наблюдений некоторого явления и приходит к констатации общего закона, которому подчиняется явление в его различных формах. Степень уверенности, с ко-

торой закон таким образом устанавливается, зависит от числа отдельных наблюдений и выводимых из них заключений. Часто подобного рода индуктивные рассуждения бывают вполне убедительными; утверждение, что солнце взойдет завтра с востока, столь несомненно, насколько это вообще возможно; и все же характер констатации в данном случае совсем иной, чем в случае теоремы, доказываемой на основе строгого логического, т. е. математического, рассуждения.

Что касается математической индукции, то она применяется иным, отличным способом с целью установления истинности математической теоремы в бесконечной последовательности случаев (первого, второго, третьего и так далее — без всякого исключения). Обозначим через А некоторое утверждение, относящееся к произвольному натуральному числу п. Пусть А будет хотя бы такое утверждение: «Сумма углов в выпуклом многоугольнике с п + 2 сторонами равна 180° • п». Или еще: обозначим через А' утверждение: «проводя п прямых на плоскости, нельзя разбить ее больше чем на 2" частей». Чтобы доказать подобного рода теорему для произвольного значения я, недостаточно доказать ее отдельно для первых 10, или 100, или даже 1000 значений п. Это как раз соответствовало бы принципу эмпирической индукции. Вместо того нам приходится воспользоваться строго математическим и отнюдь не эмпирическим рассуждением; мы уясним себе его характер на частных примерах доказательства предложений, которые мы обозначили через А и А'. Остановимся на предложении А. Если п = 1, то речь идет о треугольнике, и мы знаем из элементарной геометрии, что сумма углов такового равна 180° • 1. В случае четырехугольника, (п = 2) мы проводим диагональ, разделяющую четырехугольник на два треугольника, и тогда сейчас же становится ясно, что сумма углов четырехугольника равна сумме углов в двух треугольниках, именно равна 180° + 180° = 180° • 2. Обращаясь к случаю пятиугольника (дг = 3), мы разбиваем его таким же образом на четырехугольник и треугольник. Так как первый из названных многоугольников по доказанному имеет сумму углов 180° • 2, а второй — 180° • 1, то всего в случае пятиугольника мы получаем сумму углов 180° • 3. И теперь нам уже становится ясно, что рассуждение может быть продолжено совершенно таким же образом неограниченно. Мы докажем теорему для случая п = 4, затем для случая п = 5, и т. д. Как и раньше, каждое следующее заключение неизбежно вытекает из предыдущего, и теорема А оказывается установленной при произвольном значении п.

Так же обстоит дело и с предложением А'. При п = 1 оно, очевидно, справедливо, так как всякая прямая делит плоскость на 2 части. Проведем вторую прямую. Каждая из двух прежних частей разобьется в свою очередь на две части — при условии, что вторая прямая непараллельна первой. Но, как бы то ни было, в случае п = 2 всего окажется не более 4 = 22

частей. Добавим еще третью прямую. Каждая из уже имеющихся частей или будет разбита на две части, или останется нетронутой. Таким образом, число вновь полученных частей не превысит 22 • 2 = 23. Считая это установленным, мы точно так же перейдем к следующему случаю и т. д. — без конца.

Сущность предыдущего рассуждения заключается в том, что, желая установить справедливость некоторой общей теоремы А при любых значениях п, мы доказываем эту теорему последовательно для бесконечного ряда специальных случаев Аи А2, ... Возможность этого рассуждения покоится на двух предпосылках: а) имеется общий метод доказательства того, что если справедливо утверждение Ап то следующее по порядку утверждение Аг+\ также справедливо; б) известно, что первое утверждение А\ справедливо. В том, что эти два условия достаточны для того, чтобы справедливость всех утверждений А\, A2i А3, ... была установлена, заключается некоторый логический принцип, имеющий в математике столь же фундаментальное значение, как и классические правила аристотелевой логики.

Сформулируем этот принцип следующим образом. Предположим, что требуется установить справедливость бесконечной последовательности математических предложений

Аи А2, Л3,

которые все, совместно взятые, образуют некоторое общее предложение Л. Допустим, что а) проведено математическое рассуждение, показывающее, что если верно Аг, то верно и Лг+1, каково бы ни было натуральное число г, и б) установлено, что А\ верно. Тогда все предложения нашей последовательности верны и, следовательно, предложение А доказано.

Мы примем принцип индукции без колебаний (так же как мы принимаем все правила обыкновенной логики) и будем его рассматривать как основной принцип, на котором строится математическое доказательство. В самом деле, мы можем установить справедливость каждого утверждения Ап, исходя из допущения б) о том, что А\ справедливо, и, многократно пользуясь допущением а), последовательно установим справедливость утверждений А2, Л3, А4, и т.д., пока не достигнем утверждения Ап. Принцип математической индукции вытекает, таким образом, из того факта, что за каждым натуральным числом г следует (непосредственно) другое натуральное число г+ 1 и что, отправляясь от натурального числа 1, можно после конечного числа таких переходов достигнуть любого натурального числа п.

Часто принцип математической индукции применяют без явного о том упоминания или же просто он скрывается за формулой «и так далее».

Такая скрытая форма применения принципа индукции в особенности свойственна преподаванию элементарной математики. Но при доказательстве иных, более тонких и более глубоких теорем этим принципом неизбежно приходится пользоваться явно. Мы приведем далее некоторое число относящихся сюда простых и все же не совсем тривиальных примеров.

2. Арифметическая прогрессия. Каково бы ни было значение п, сумма 1 + 2 + 3 +... + п первых п натуральных чисел равна п^ + Ц

Чтобы доказать эту теорему по принципу математической индукции, мы должны для произвольного значения п установить справедливость соотношения Ап\ т Ä Л п(п+\)

(1)

а) Если г — некоторое натуральное число и если известно, что утверждение Аг справедливо, т. е. если известно, что

то, прибавляя к обеим частям последнего равенства по г + 1, мы получаем:

а это как раз и есть утверждение Аг+\.

б) Утверждение Ль очевидно, справедливо, так как 1 = Итак, по принципу математической индукции утверждение Ап справедливо при любом п, что и требовалось доказать.

Обыкновенно эту теорему доказывают иным способом. Пишут сумму 1+2 + 3 + ... + /ib двух видах:

Складывая, мы видим, что числа, стоящие на одной вертикали, вместе составляют п + 1, и так как вертикалей всего имеется я, то отсюда следует, что

и остается еще разделить на 2.

Из формулы (1) сразу же вытекает общая формула для суммы (п + 1) первых членов любой арифметической прогрессии:

(2)

В самом деле,

В случае, когда а = 0, d = 1, последнее соотношение превращается в соотношение (1).

3. Геометрическая прогрессия. Таким же образом можно рассуждать и по поводу геометрической прогрессии (в общем виде). Мы покажем, что, каково бы ни было я,

(3)

(Мы предполагаем, что q^ 1: иначе правая часть (3) лишена смысла.)

Наше утверждение, несомненно, справедливо при п = 1, так как в этом случае

И если мы допустим, что

то, как следствие, отсюда немедленно вытекает:

Но это как раз и есть утверждение (3) при п = г + 1. Доказательство закончено.

В элементарных учебниках дается другое доказательство. Положим

Умножая обе части на q, получим

Вычитая затем последнее равенство из предпоследнего, получаем далее

4. Сумма п первых квадратов. Следующее интересное применение принципа математической индукции относится к сумме п первых квадратов. Путем проб мы устанавливаем (по крайней мере для нескольких небольших значений ri), что

(4)

после чего естественно высказать в виде догадки утверждение, что эта замечательная формула справедлива при всех целых положительных значениях п. Чтобы доказать это, воспользуемся опять методом математической индукции. Заметим прежде всего, что если утверждение Л„, которое заключается как раз в соотношении (4), справедливо при п = г, так что, то, прибавляя к обеим частям по (r+ I)2, мы получаем

а это и есть утверждение Лг+Ь так как оно получается из соотношения (4) посредством подстановки г + 1 вместо п. Чтобы закончить доказательство, достаточно обратить внимание на то, что утверждение A i, которое сводится к равенству

справедливо. Итак, соотношение (4) верно при всех значениях п.

Подобного же рода формулы можно написать для сумм третьих и четвертых степеней, вообще для сумм вида 1* + 2* + 3* + ... + я*, где k — произвольное целое положительное число. В качестве упражнения читатель может доказать с помощью математической индукции формулу

(5)

Необходимо заметить в заключение, что, хотя принципа математической индукции совершенно достаточно для того, чтобы доказать формулу (5) — раз она уже написана, однако доказательство не дает решительно никаких указаний, как прийти к самой этой формуле: почему именно нужно догадываться, что сумма п первых кубов равна выражению

а не какому-нибудь иному в таком же роде, например,

или

и т.д. Выбор велик! Тот факт, что доказательство теоремы заключается в применении таких-то простых логических правил, не оказывает ни малейшего влияния на творческое начало в математике, роль которого — делать выбор из бесконечного множества возникающих возможностей. Вопрос о том, как возникает гипотеза (5), принадлежит к той области, в которой нет никаких общих правил; здесь делают свое дело эксперимент, аналогия, конструктивная индукция. Раз только правильная гипотеза сформулирована, принципа математической индукции часто бывает достаточно, чтобы теорема была доказана. Но так как само такое доказательство никак не указывает пути к открытию, то его лучше было бы называть проверкой.

*5. Одно важное неравенство. В следующей главе нам понадобится неравенство

(6)

имеющее место при всяком р, удовлетворяющем условию р > — 1, и при любом целом положительном значении п. (Ради общности мы предвосхищаем здесь применение отрицательных и нецелых чисел, предполагая, что р может быть любым числом, большим чем -1. Доказательство неравенства одно и то же, независимо от того, каково число р.) Мы воспользуемся и на этот раз математической индукцией.

а) Если верно, что (1 + р)г ^ 1 + гр, то, умножая обе части неравенства на положительное число 1 + р, мы получаем:

Отбрасывая вовсе положительный член гр2, мы только усилим это неравенство; итак,

Полученный результат показывает, что неравенство (6) имеет место и при п = г + 1.

б) Совершенно очевидно, что (1 + р)1 ^ 1 + р. Таким образом, доказательство закончено.

Ограничение, заключающееся в условии р > — 1, существенно. Если р < — 1, то 1 + р отрицательно, и рассуждение а) отпадает, так как при умножении обеих частей неравенства на отрицательное число знак неравенства должен измениться. (Например, умножая обе части неравенства 3 > 2 на —1, мы получили бы —3 > —2, а это неверно.)

*6. Биномиальная теорема. Часто бывает нужно написать в раскрытом виде выражение для дг-й степени бинома (а + Ь)п. Непосредственное

вычисление показывает, что

и так далее. Но какой общий закон скрывается за словами «и так далее»? Проанализируем процесс вычисления (а + ft)2. Так как (а + ft)2 = (а + b)(a + ft), то мы получили выражение для (а + ft)2, умножая каждый член выражения a + ft на а, затем на b и складывая то, что получилось. Ту же процедуру пришлось применить при вычислении (а + ft)3 = (а + Ь)(а + Ь)2. Так же точно вычисляются (а + ft)4, (а + Ь)ъ и так далее до бесконечности. Выражение для (а + ft)" мы получим, умножая выражение (а Л- ft)"-1 сначала на а, потом на ft, затем складывая то, что получится. Это приводит к следующей диаграмме:

позволяющей сразу разобраться в общем законе составления коэффициентов в разложении (а + ft)". Мы строим треугольную схему из натуральных чисел, начиная с коэффициентов 1, 1 двучлена а + ft таким образом, что каждое число в треугольнике является суммой двух чисел, стоящих над ним в предыдущей строке (слева и справа). Такая схема известна под названием треугольника Паскаля.

Коэффициенты в разложении (а + ft)" по убывающим степеням а и возрастающим степеням b стоят в п-й строке этой схемы.

Так, например,

С помощью очень сжатых обозначений, использующих нижние и верхние значки (индексы), запишем числа, стоящие в /2-й строке треугольника Паскаля, следующим образом:

Тогда общей формуле для разложения (a + Ь)п можно придать вид

(7)

Согласно закону, лежащему в основе построения треугольника Паскаля, мы имеем соотношение . .

(8)

В качестве упражнения читатель, имеющий уже некоторый опыт в применении математической индукции, может воспользоваться этим принципом (и очевидными равенствами С]0 = С] = 1) для доказательства общей формулы , lw_ оч .

(9)

(При любом целом положительном значении п символ п\ (читается «я-факториал») обозначает произведение п первых натуральных чисел: п\ = 1 • 2 • 4 •... • п. Удобно положить по определению 0! = 1, чтобы формула (9) оправдывалась также и при /, равном 0 или п.)

Выводу этой раскрытой формулы для коэффициентов биномиального разложения иногда дается наименование биномиальной теоремы (см. также стр. 504).

Упражнения. Докажите с помощью метода математической индукции следующие равенства:

Найдите сумму следующих геометрических прогрессий:

10) То же самое докажите непосредственно методом математической индукции.

7. Дальнейшие замечания по поводу метода математической индукции.

Принцип математической индукции может быть слегка обобщен следующим образом: если имеется последовательность утверждений Л5, As+i, As+2, где s — некоторое положительное число, и если

а) при всяком значении s справедливость Аг+\ следует из справедливости Ar, и

б) известно, что As справедливо,

то все утверждения As, As+\, As+2, • • • справедливы. Иначе говоря, Ап «справедливо при любом п ^ 5». То же самое рассуждение, которое привело нас к обыкновенному принципу математической индукции, пригодно и в данном случае, только последовательность 1, 2, 3, ... заменяется на этот раз подобной ей последовательностью s, 5 4- 1, s + 2, s + 3, ...

Пользуясь принципом индукции в этой форме, мы можем усилить неравенство (6) на стр. 40, исключая возможность знака равенства. Именно: каково бы ни было р ф 0 и > -1 и каково бы ни было целое число п ^ 2, имеет место неравенство (1> 1+„р. (10)

Доказательство предоставляется читателю.

С принципом математической индукции тесно связан «принцип наименьшего целого числа», утверждающий, что во всяком непустом множестве С натуральных чисел имеется наименьшее число. Множество С может быть конечным, как, например, множество 1, 2, 3, 4, 5, или бесконечным, как, например множество всех четных чисел 2, 4, 6, 8, 10, ... Множество называется пустым, если оно не содержит ни одного элемента; примером пустого множества может служить множество всех кругов, одновременно являющихся прямыми линиями, или множество натуральных чисел я, удовлетворяющих соотношению п > п. По понятным причинам мы оговариваем в формулировке «принципа наименьшего целого числа», что пустые множества исключаются. Всякое непустое множество С целых чисел непременно содержит хоть одно число, например я, и тогда наименьшее из чисел 1, 2, 3, я, принадлежащее множеству С, есть наименьшее целое число множества.

Чтобы уяснить значение этого принципа, следует указать на то, что он, вообще говоря, неверен для множеств, состоящих из нецелых чисел; например, множество положительных дробных чисел 1, 4, А, 4, ... не содержит наименьшего числа.

С чисто логической точки зрения небезынтересно отметить то обстоятельство, что с помощью принципа наименьшего целого числа принцип математической индукции доказывается как теорема. В самом деле, пусть имеется последовательность таких утверждений А\, A<i, Лз, ..., что

а) при любом г справедливость Лг+| вытекает из справедливости Аг,

б) известно, что А\ справедливо.

Пользуясь формулами (4) и (5), докажите равенства:

Мы докажем, что предположение о том, что хоть одно из утверждений А несправедливо, придется отбросить. Действительно, если бы хоть одно из утверждений А было неверным, то множество всех натуральных чисел п, для которых Ап неверно, не было бы пустым. Тогда согласно принципу наименьшего целого числа оно содержало бы наименьшее число р, которое вследствие б) должно было бы быть больше чем 1. Но тогда Ар было бы неверно, а Ар-\ верно. Это противоречит условию а).

Подчеркнем еще раз, что принцип математической индукции резко отличается от эмпирической индукции, свойственной естественным наукам. Подтверждение общего закона на конечном числе случаев (как бы это число ни было велико) никоим образом не представляет собой доказательства в математическом смысле, даже если неизвестно ни одного исключения. При таких обстоятельствах рассматриваемое утверждение, или «закон», есть не что иное, как вполне разумная гипотеза, которую могут видоизменить результаты будущих экспериментов. В математике «закон» может считаться доказанным только тогда, когда он выведен как неизбежное логическое следствие из предпосылок, признаваемых справедливыми. Существует немало примеров математических утверждений, которые были проверены и оправдывались во всех до настоящего времени рассмотренных частных случаях, но для которых еще не было найдено общего доказательства (см. пример на стр. 55). Можно подозревать, что теорема справедлива во всей общности, если она подтверждается на большом числе примеров, и тогда есть основание пытаться доказать ее с помощью математической индукции. Если попытка удается, то тем самым справедливость теоремы устанавливается; в противном случае вопрос о том, верна или неверна теорема, остается открытым, и она может быть доказана или опровергнута когда-нибудь в будущем уже иными методами.

Применяя принцип математической индукции, необходимо всегда тщательно следить за тем, чтобы условия а) и б) были действительно выполнены. Иначе можно иной раз прийти и к абсурду. Мы предлагаем читателю разобраться в следующем софизме. Мы «докажем» сейчас, что любые два целых положительных числа равны между собой; например, 5 = 10. Начнем с определения. Если а и Ь — два неравных между собой целых положительных числа, то через тах(а, Ь) будем обозначать а или Ь, смотря по тому, какое из чисел больше: а или Ь; если же а = Ь, то положим тах(а, Ь) = а = Ь. Так, тах(3, 5) — тах(5, 3) = 5, тогда как тах(4, 4) = 4. Далее, через Ап обозначим следующее утверждение: «Если а и b — два таких целых положительных числа, что тах(а, Ь) =п, то а = Ь».

а) Предположим, что Аг верно. Пусть а и b — два таких целых положительных числа, что тах(а, Ь) = г + 1. Рассмотрим числа

0L = a-1, ß = b-U

тогда max(a, ß) = г. В таком случае а = ß, так как АГ верно. Но отсюда следует, что а = Ь\ значит, верно и Аг+\.

б) ЛI, очевидно, верно, так как если тах(а, Ь) = 1, то а и Ь (по предположению — целые положительные числа) должны быть каждое в отдельности равны 1.

Итак, по принципу математической индукции Ап верно при любом п.

Пусть теперь а и Ь — два произвольных целых положительных числа; положим max(a, b) = г. Было показано, что Ап верно при любом п\ значит, в частности, верно Ar. Следовательно, а = Ь.

ДОПОЛНЕНИЕ К ГЛАВЕ I

Теория чисел

Введение

Мистические и суеверные представления, связывавшиеся первоначально с целыми числами, мало-помалу изгладились, но среди математиков интерес к числам не ослабевал никогда. Евклид (около 300 г. до нашей эры), громкая слава которого объясняется той частью его «Начал», которая посвящена основам геометрии (изучаемым в школе), по-видимому, сделал оригинальные открытия в области теории чисел, тогда как его геометрия в значительной степени представляет собой компиляцию ранее полученных результатов. Диофант Александрийский (около 275 г. нашей эры), один из первых алгебраистов, оставил также след в теории чисел. Пьер Ферма (1601 — 1665), живший в Тулузе, по специальности юрист, вместе с тем замечательнейший математик своей эпохи, положил начало современным теоретико-числовым изысканиям. Эйлер (1707—1783), наиболее изумительный из математиков в смысле богатства продукции, в своих исследованиях весьма часто углублялся в область теории чисел. Сюда же следует прибавить ряд иных имен, знаменитых в анналах математики: Лежандр, Дирихле, Риман. Гаусс (1777—1855), виднейший из математиков более близкой к нам эпохи, в равной степени отдававший себя различным отраслям математики, следующими словами определил свое отношение к теории чисел: «Математика — царица наук, теория чисел — царица математики».

§ 1. Простые числа

1. Основные факты. Многие утверждения в области теории чисел, как и математики вообще, относятся не к отдельным объектам, скажем, к числу 5 или числу 32, а к целому классу объектов, имеющих какое-то общее свойство; примерами могут служить класс всех четных чисел

или класс чисел, делящихся на 3,

3, 6, 9, 12,

или класс квадратов целых чисел

1, 4, 9, 16, ...

и так далее.

В теории чисел особенно важную роль играет класс всех простых чисел. Очень многие числа могут быть разложены на меньшие множители: 10 = 2-5, 111 = 3 • 37, 144 = 3 • 3 • 2 • 2 ■ 2 • 2, и т. п. Числа, которые таким образом не разлагаются, носят название простых. Точнее, простым называется такое целое число р, большее единицы, которое не имеет иных множителей, кроме единицы и самого себя. (Число а есть множитель, или делитель, числа b или делит число Ь, если существует такое целое число с, что b = ас.) Числа 2, 3, 5, 7, 11, 13, 17, — простые, тогда как, например, число 12 не является простым, так как 12 = 3-4. Значение класса простых чисел заключается в том, что каждое число может быть представлено как произведение простых: если данное число не простое, то его можно последовательно разлагать на множители до тех пор, пока все множители не окажутся простыми; так, например, 360 = 3 • 120 = 3-30-4 = 3- 3.10.2.2 = 3- 3- 5- 2- 2- 2 = 23-32-5. Число, отличное от 0 и 1 и не являющееся простым, называется составным.

Один из первых вопросов, возникающих по поводу класса простых чисел, заключается в том, существует ли только конечное число различных простых чисел или же класс простых чисел содержит бесконечное число членов подобно классу всех целых чисел, частью которого он является. Ответ таков: простых чисел существует бесконечное множество.

Данное Евклидом доказательство существования бесконечного множества простых чисел представляет собой типичный образец математического рассуждения. В основе его лежит «косвенный метод» (доказательство от противного, приведение к абсурду). Сделаем попытку допустить, что рассматриваемое предложение неверно. Это означало бы, что существует лишь конечное число простых чисел, хотя, может быть, и очень много — скажем, около миллиарда; тогда допустим, что это число, представленное в «общей» или «неопределенной» форме, будет п. Пользуясь знаками, мы можем обозначить все простые числа через Р\,р2, ...,рп- Всякое иное число тем самым составное и должно делиться по меньшей мере на одно из простых чисел р\, р2, ...,рп- А теперь мы придем к противоречию, а именно, построим число А, которое будет отлично от каждого из чисел pi, /?2> • • • 1 Рпу так как будет больше их всех и тем не менее не будет делиться ни на одно из них. Вот это число:

Как видно, оно равно единице плюс произведение тех чисел, которые образуют совокупность всех простых чисел. Число А больше, чем любое из чисел /?, и потому должно быть составным. Но при делении на рх, на р2 и т. д. Л дает всякий раз остаток 1, таким образом, А не делится ни на одно из чисел р. Сделанное нами допущение, что существует лишь конечное число простых чисел, приводит, таким образом, к противоречию, так что приходится заключить, что это допущение ошибочно, а следовательно, истинным может быть только противоположное ему. Итак, теорема доказана.

Хотя это доказательство и «косвенного» характера, все же небольшое его видоизменение приводит, по крайней мере теоретически, к методу построения бесконечной последовательности простых чисел. Предположим, что, исходя из некоторого простого числа, скажем р\ = 2, мы уже нашли п простых чисел р\% /?2, рп\ заметим, далее, что число р\р2...рп + 1 или простое, или содержит множителем простое число, отличное от тех, которые уже найдены. Так как такой множитель всегда может быть найден (хотя бы непосредственными пробами), то в обоих названных случаях мы в итоге получаем новое простое число рп+\\ продолжая таким же образом дальше, убеждаемся, что последовательность простых чисел, которые мы действительно можем построить, не имеет конца.

Упражнение. Выполните намеченное построение, начиная с простых чисел р\ = 2, р2 = 3; найдите еще пять простых чисел.

Если какое-нибудь число представлено в виде произведения простых множителей, то эти множители можно, конечно, располагать в каком угодно порядке. Занимаясь разложением чисел на простые множители, мы очень скоро приходим к заключению, что с точностью до порядка сомножителей разложение любого числа N на простые множители обладает свойством единственности: каждое натуральное число N, большее единицы, может быть разложено на простые множители только одним способом. Это утверждение кажется на первый взгляд таким очевидным, что неспециалист склонен обыкновенно отвергать необходимость его доказательства. Все же рассматриваемое предложение отнюдь не тривиально; с другой стороны, его доказательство, хотя и совсем элементарного содержания, требует более или менее тонких рассуждений. Классическое доказательство этой «основной теоремы арифметики», данное Евклидом, базируется на методе («алгоритме») нахождения общего наибольшего делителя двух чисел. Этот метод будет нами рассмотрен на стр. 67. Здесь же мы приведем доказательство менее почтенной давности, которое несколько короче, чем доказательство Евклида, и вместе с тем выглядит несколько более «софистическим». Оно также является типичным образцом «косвенного» рассуждения. Мы допустим, что существует такое число, которое может быть разложено на простые множители двумя существенно различными способами, и это допущение приведет нас

к противоречию. Возникновение противоречия будет свидетельствовать о том, что гипотеза о существовании числа, допускающего два существенно различных разложения на простые множители, несостоятельна; и отсюда мы заключим, что разложение чисел на простые множители обладает свойством единственности.

* Если существует хоть одно число, допускающее два существенно различных разложения на простые множители, то существует непременно и наименьшее число, обладающее таким свойством (см. стр. 43),

(1)

где через р и q обозначены простые числа. Меняя, если потребуется, порядок этих множителей, мы можем допустить, что

Заметим, что р\ отлично от qx \ иначе, деля равенство (1) на общий простой множитель, мы получили бы два существенно различных разложения на простые множители числа, которое было бы меньше, чем га, и это противоречило бы предложению о том, что га — наименьшее число, обладающее таким свойством. Следовательно, одно из двух: или рх < qx, или Ц\ < рх. Пусть р\ <Q\. (Если бы оказалось qx <р\, то в дальнейшем рассуждении достаточно было бы поменять местами буквы р и q.) Рассмотрим целое число

(2)

Подставляя вместо га два его выражения, взятые из равенства (1), мы можем представить число га' в любом из двух видов:

(3) (4)

Из равенства (4) следует, что га' — положительное число, так как р\ <qù из равенства (2) следует, с другой стороны, что га' меньше чем га. Но раз так, то разложение га' на множители должно быть единственным (с точностью до порядка сомножителей). Из равенства (3) далее видно, что р\ входит множителем в га'; значит, из равенства (4) можно в таком случае заключить, что р{ входит множителем или в q{ - ри или в q2q?> ...qs. (Это вытекает из единственности разложения га' на простые множители; см. рассуждение в следующем абзаце.) Но последнее невозможно, так как все q больше чем р\. Поэтому р\ должно входить множителем в Ц\ — рь т. е. qi — р\ должно делиться на р\. Другими словами, существует такое целое число Л, что

Но это значит, что q\ делится на р\, чего, однако, быть не может, так как, по предположению, q\ — число простое. Противоречие, к которому мы пришли, показывает несостоятельность первоначально сделанного допущения, чем и заканчивается доказательство основной теоремы арифметики.

Вот одно важное следствие основной теоремы. Если простое число р входит множителем в произведение ab, то оно непременно входит множителем или в а, или в Ь. В самом деле, если бы р не входило множителем ни в а, ни в Ь, то, перемножая разложения на простые множители чисел а и Ь, мы получили бы разложение на простые множители числа ab, не содержащее множителя р. С другой стороны, так как предполагается, что р входит множителем в произведение ab, то это значит, что существует такое целое число /, что

ab = pt.

Поэтому, перемножая р и разложение на простые множители числа /, мы получим разложение на простые множители числа ab, содержащее множитель р. Таким образом, приходится признать, что существует два различных разложения числа ab на простые множители, а это противоречит основной теореме.

Примеры. Если установлено, что 2652 делится на 13 и что 2652 = 6 • 442, то отсюда можно сделать заключение, что 442 делится на 13. С другой стороны, 240 делится на 6 и притом 240 = 15 • 16, но ни 15, ни 16 не делятся на 6. Этот пример показывает, что условие основной теоремы относительно того, что число р — простое, является существенным.

Упражнение. Чтобы найти все делители числа а, достаточно разложить а в произведение

где все множители р — простые и различные, причем каждый из них возводится в некоторую степень. Все делители числа а имеют вид

где показатели ß — произвольные целые числа, подчиненные условиям

Докажите это утверждение. В качестве следствия установите, что число всех делителей а (включая 1 и само а) равно произведению

Так, например,

имеет 5 • 3 делителей. Вот они:

2. Распределение простых чисел. Можно составить список всех простых чисел, не превышающих какого-то данного числа N, следующим

образом. Напишем подряд все натуральные числа от 2 до Л/, затем вычеркнем все числа, являющиеся кратными 2 (не считая самого числа 2), все числа, являющиеся кратными 3 (не считая 3), и т.д., пока не будут вычеркнуты все составные числа. Эта процедура, известная под названием «решета Эратосфена», позволит выловить все простые числа в пределах от 2 до N. Усовершенствования этого метода мало-помалу привели к тому, что в настоящее время составлены вполне надежные таблицы простых чисел примерно до 10000000. Они предоставляют в наше распоряжение обширнейший эмпирический материал, позволяющий судить о распределении и свойствах простых чисел. Основываясь на этих таблицах, мы можем высказать ряд в высшей степени правдоподобных гипотез — совершенно так, как будто бы теория чисел была экспериментальной наукой. Часто доказательство этих гипотез оказывается необычайно затруднительным.

а. Формулы, дающие простые числа

Были сделаны попытки найти элементарные арифметические формулы, которые давали бы только простые числа, хотя бы без требования, чтобы они давали все простые числа. Ферма высказал предположение (не выставляя его в качестве положительного утверждения), что все числа вида

являются простыми. В самом деле, при п = 1, 2, 3, 4 мы получаем

— всё простые числа. Но в 1732 г. Эйлер разложил на множители число + 1 =641 -670041 7; таким образом, число F(5) — уже не простое. Позднее среди этих «чисел Ферма» удалось обнаружить другие составные числа, причем ввиду непреодолимых трудностей, с которыми были связаны непосредственные пробы, в каждом случае были выработаны более глубокие теоретико-числовые методы. В настоящее время остается неизвестным даже то, дает ли формула Ферма бесконечное множество простых чисел.

Вот другое простое и замечательное выражение, дающее много простых чисел:

При п = 1, 2, 3, ..., 40 f(ri) есть простое число; но уже при /2 = 41 простого числа не получается:

Выражение

дает простые числа до я = 79 включительно; при п = 80 получается составное число.

В итоге можно сказать, что поиски элементарных формул, дающих только простые числа, оказались тщетными. Еще менее обнадеживающей следует считать задачу нахождения такой формулы, которая давала бы только простые числа и притом все простые числа.

б. Простые числа в арифметических прогрессиях

Если доказательство того, что в последовательности всех натуральных чисел п = 1, 2, 3, 4, ... содержится бесконечное множество простых чисел, носит вполне элементарный характер, то следующий шаг в сторону таких последовательностей, как, например, 1, 4, 7, 10, 13, ... или 3, 7, 11, 15, 19, или, вообще говоря, в сторону произвольной арифметической прогрессии а, а + d, a + 2d, ..., а + nd, ... (где а и d не имеют общих множителей), оказался связанным с гораздо большими трудностями. Все наблюдения только подтверждали тот факт, что в каждой такой прогрессии содержится бесконечное число простых чисел, как и в простейшей из них 1, 2, 3, ... Но понадобились величайшие усилия для того, чтобы доказать эту общую теорему. Успех был достигнут Леженом Дирихле (1805—1859), одним из ведущих математиков прошлого столетия, который применил при доказательстве самые усовершенствованные средства математического анализа из известных в то время. Его замечательные работы в этой области даже для настоящего времени остаются непревзойденными; прошло около ста лет, но доказательства Дирихле все еще не упрощены настолько, чтобы они могли быть поняты теми, кто не овладел полностью техникой математического анализа и теорией функций.

Мы не будем здесь пытаться привести доказательство общей теоремы Дирихле, а ограничимся рассмотрением более легкой задачи: обобщим евклидово доказательство о существовании бесконечного множества простых чисел таким образом, чтобы оно охватило некоторые специальные прогрессии, например An + 3 или 6п + 5. Рассмотрим первую из этих прогрессий. Заметим прежде всего, что всякое простое число, большее 2, — непременно нечетное (иначе оно делилось бы на 2) и, следовательно, имеет вид 4п + 1 или 4а2 Ч- 3 (при целом ri). Далее, произведение двух чисел вида 4п + 1 также есть число того же вида, так как

Допустим теперь, что существует лишь конечное число простых чисел вида 4п + 3; обозначим их ри р2, ..., рп и рассмотрим число

Одно из двух: либо число N — простое, либо оно разлагается в произведение простых чисел, среди которых, однако, не может быть ни одного из чисел ри р2, ..., Рп, так как эти числа делят N с остатком -1.

Заметим далее, что все множители, входящие в /V, не могут быть вида An + 1, так как само N не этого вида, а мы видели, что произведение чисел вида An + 1 является числом того же вида. Итак, хоть один из множителей, входящих в N, должен быть вида An + 3, а это невозможно, так как ни одно из чисел р не входит множителем в Л/, а числами р все простые числа вида An + 3 по предположению исчерпываются. Таким образом, допуская, что существует лишь конечное число простых чисел вида An + 3, мы приходим к противоречию, и значит, таких чисел бесконечно много.

Упражнение. Докажите соответствующую теорему для прогрессии 6я + 5.

в. Теорема о распределении простых чисел

В исследованиях, связанных с законом распределения простых чисел, решительный шаг был сделан тогда, когда математики отказались от тщетных попыток найти элементарную математическую формулу, которая давала бы все простые числа или же точное число простых чисел, содержащихся среди п первых натуральных чисел, и сосредоточили вместо того внимание на распределении в среднем простых чисел среди всех натуральных.

При всяком целом п обозначим через Ап число простых чисел среди чисел 1, 2, 3, ..., п. Если мы выделим среди первых чисел натурального ряда

те, которые являются простыми, то не составит труда подсчитать ряд значений Ап:

Возьмем теперь какую-нибудь неограниченно возрастающую последовательность значений я, например

тогда соответствующие значения Ап

также будут возрастать безгранично (хотя и более медленно). Действительно, множество простых чисел, как мы уже знаем, бесконечно, и потому значения Ап рано или поздно станут больше любого назначенного числа.

«Плотность» распределения простых чисел среди п первых чисел натурального ряда дается отношением не представляет особого труда с помощью таблиц простых чисел подсчитать значения ^ при достаточно больших значениях п:

Последняя, скажем, из выписанных строчек в приведенной табличке дает вероятность того, что число, случайно выхваченное из 109 первых чисел натурального ряда, окажется простым: всего имеется 109 возможных выборов, из них Л109 соответствуют простым числам.

Распределение отдельных простых чисел отличается чрезвычайно неправильным характером. Но эта неправильность «в малом» исчезает, если мы направим внимание к распределению «в среднем», находящему свое выражение в изменениях отношения — при неограниченно растущем п.

Простой закон, которому подчиняется поведение этого отношения, следует отнести к числу самых замечательных открытий, сделанных во всей математике. Для того чтобы сформулировать теорему о распределении простых чисел, к которой мы теперь подходим, необходимо предварительно разъяснить, что такое «натуральный логарифм» числа п. Для этой цели возьмем в плоскости две взаимно перпендикулярные оси и рассмотрим геометрическое место таких точек на плоскости, для которых произведение расстояний X и у от двух осей равно единице. В терминах координат х и у это геометрическое место есть равносторонняя гипербола, уравнение которой имеет вид ху = 1. Мы определим In п как площадь (рис. 5) фигуры, ограниченной гиперболой и двумя вертикальными прямыми х = 1 и х = п. (Более детально логарифм и его свойства будут рассмотрены в главе VIII.) Чисто случайно, в связи с изучением таблицы простых чисел, Гаусс заметил, что отношение — приблизительно равно ;— и что точность этого

Рис. 5. Площадь заштрихованной области под гиперболой определяет Inn

приближения, по-видимому, улучшается при возрастании п. Насколько удовлетворительно приближение, можно судить по отношению — :

значения которого при п— 1000, 1000000, 1000000000 показаны в следующей табличке:

Основываясь на такого рода эмпирической очевидности, Гаусс высказал в качестве предположения, что отношение — «асимптотически равно»

Смысл этого утверждения заключается в следующем: если возьмем последовательность значений я, становящихся все больше и больше, например,

(как мы делали и раньше), то отношение

вычисляемое для этих последовательно рассматриваемых значений я, будет становиться все более и более близким к числу 1, а именно, разность между указанным отношением и единицей будет делаться столь малой, сколь будет назначено, лишь бы только мы рассматривали достаточно большие значения я. Такого рода соотношение символически выражается знаком ~: — ~ :— означает, что — : :— при возрастании я стремится к 1. Что знак ~ не может быть заменен знаком обыкновенного равенства (=), ясно хотя бы из того факта, что Ап — непременно целое число, тогда как -— не является таковым.

То обстоятельство, что распределение простых чисел хорошо описывается с помощью логарифмической функции, нельзя не признать поистине поразительным, так как здесь вступают в тесное соприкосновение два математических понятия, казалось бы не имеющие друг к другу никакого отношения.

Хотя схватить содержание высказанного Гауссом предположения не представляет особой трудности, однако его строгое математическое доказательство во времена Гаусса было за пределами возможностей математической науки. Для того чтобы доказать теорему о распределении

простых чисел, говорящую лишь о самых элементарных математических понятиях, неизбежно нужно прибегнуть к самым мощным методам современной математики. Пришлось ждать почти сто лет, пока анализ получил достаточное развитие для того, чтобы Адамар (1896) в Париже и Валле-Пуссен (1896) в Лувэне смогли дать исчерпывающее доказательство теоремы о распределении простых чисел. Упрощения и важные дополнения были затем внесены Мангольдтом и Э. Ландау. Задолго до Адамара значительное продвижение в этой области было сделано Риманом (1826—1866) в его знаменитой работе, намечающей основные стратегические линии предстоящей атаки. Совсем недавно американский математик Норберт Винер сумел видоизменить доказательство таким образом, чтобы избежать применения комплексных чисел в узловых моментах проводимых рассуждений. Но все же доказательство теоремы о распределении простых чисел остается слишком сложным для того, чтобы его можно было предложить начинающему. Мы вернемся к этому вопросу на стр. 511 и следующих.

г. Две еще не решенные задачи о простых числах

Если проблема распределения простых чисел («в среднем») была разрешена удовлетворительно, то справедливость ряда других гипотез, эмпирически совершенно несомненная, все еще не доказана.

Сюда относится прежде всего знаменитая гипотеза Гольдбаха. Гольдбах (1690—1764) сам по себе не оставил никакого следа в истории математики: он прославился только проблемой, которую предложил Эйлеру в письме, относящемся к 1742 г. Он обратил внимание на тот факт, что ему всегда удавалось представить любое четное число (кроме 2, которое само есть простое число) в виде суммы двух простых. Например, 4 = 2 + 2, 6 = 3 + 3, 8 = 5 + 3, 10 = 5 + 5, 12 = 5 + 7, 14 = 7 + 7, 16=13 + 3, 18 = 11 + 7, 20 = 13 + 7, ..., 48 = 29 + 19, ..., 100 = 97 + 3 и т. д.

Гольдбах спрашивал у Эйлера, может ли тот доказать, что такого рода представление возможно для всякого четного числа, или же, напротив, сможет указать пример, опровергающий такое предположение. Эйлер так и не дал ответа; не дал его никто и в дальнейшем. Эмпирическая очевидность гипотезы Гольдбаха, как легко проверить, вполне убедительна. Источник же возникающих затруднений — в том, что понятие простого числа определяется в терминах умножения, тогда как сама проблема касается сложения. Вообще, находить связи между мультипликативными и аддитивными свойствами чисел очень трудно.

До недавнего времени доказательство гипотезы Гольдбаха казалось задачей совершенно неприступной. Сегодня дело обстоит уже не так. Очень значительный успех, оказавшийся неожиданным и поразительным для всех специалистов по данному вопросу, был достигнут в 1931 г. неизвестным в то

время молодым русским математиком Шнирельманом (1905-1938), который доказал, что всякое целое положительное число может быть представлено в виде суммы не более чем 800 ООО простых. Хотя этот результат и производит несколько комическое впечатление (по сравнению с первоначально поставленной целью доказать гипотезу Гольдбаха), тем не менее он стал первым шагом в должном направлении. Доказательство Шнирельмана — прямое и носит конструктивный характер, хотя и не обеспечивает практического метода для представления произвольного целого числа в виде суммы простых. Еще позднее русский же математик Виноградов, пользуясь методами Харди, Литтлвуда и их поистине великого сотрудника по работе индуса Рамануджана, сумел понизить число слагаемых в формулировке Шнирельмана с 800000 до 4. Это уже гораздо ближе к решению проблемы Гольдбаха. Но между результатами Шнирельмана и Виноградова имеется очень резкое различие более резкое, чем различие между числами 800000 и 4. Теорема Виноградова была доказана им лишь для всех «достаточно больших» чисел; точнее говоря, Виноградов установил существование такого числа Л/, что всякое целое число п > N может быть представлено в виде суммы четырех простых чисел. Метод Виноградова не позволяет никак судить о величине N; в противоположность методу Шнирельмана, он — существенно «косвенный» и неконструктивный. По существу, Виноградов доказал следующее: допуская, что существует бесконечное множество чисел, не представимых в виде суммы четырех (или менее того) простых чисел, можно получить противоречие. Здесь перед нами прекрасный пример, показывающий глубокое различие между двумя типами доказательств — прямым и косвенным (см. общее обсуждение этого вопроса на стр. 46)1.

1 Основной результат И. М. Виноградова (1937) устанавливает существование такого натурального N, что всякое нечетное п > N представимо в виде суммы трех простых чисел:

п=Р1 +Р2+Р3, (*)

из чего, разумеется, вытекает уже представимость любого натурального п > N + 2 в виде суммы четырех простых чисел. Результат Виноградова о нечетных числах окончателен — число слагаемых (три) в его формулировке уменьшить нельзя. Что же касается четных чисел, то из представимости их в виде (*) вытекала бы сразу и представимость любого четного п в виде суммы двух простых слагаемых (т. к. в этом случае одно из слагаемых равно 2). Однако при всей правдоподобности гипотезы о представимости в таком виде любого четного п > 3, проблема ее доказательства чрезвычайно трудна и превышает, по-видимому, еще возможности математиков. Неэффективный характер теоремы Виноградова устранен в 1939 г. К. Г. Бороздиным, показавшим, что в виде (*) представимо любое нечетное п > С = ее ; в 1956 г. ему же удалось снизить эту оценку до С = ее . Конечно, уменьшение константы С до разумных пределов позволило бы решить гипотезу о представимости в виде (*) нечетных п, 6 < п < С, — и тем самым любого нечетного п > 6 — посредством прямой вычислительной проверки. — Прим. А. Н. Колмогорова.

Следующая проблема, еще более любопытная, чем проблема Гольдбаха, нисколько не приблизилась к своему разрешению. Было подмечено, что простые числа нередко встречаются парами в виде р и р + 2. Таковы 3 и 5, 11 и 13, 29 и 31 и т. д. Предположение о существовании бесконечного множества таких «близнецов» кажется весьма правдоподобным, но до сих пор не удалось даже приблизиться к его доказательству.

§ 2. Сравнения

1. Общие понятия. Всякий раз, когда приходится говорить о делимости целых чисел на некоторое определенное целое число d, все рассуждения становятся яснее и проще, если пользоваться отношением сравнения, введенным Гауссом, и соответствующими обозначениями.

Чтобы ввести понятие сравнения, рассмотрим остатки, получающиеся при делении различных чисел, например, на 5. Мы получаем:

Заметим, что остатком при делении на 5 может быть только одно из чисел 0, 1,2, 3, 4. Говорят, что два числа а и b сравнимы по модулю 5, если при делении на 5 они дают один и тот же остаток. Так, все числа 2, 7, 12, 17, 22, -3, -8, -13, -18, ... сравнимы по модулю 5, так как при делении на 5 все они дают остаток 2. Вообще, говорят, что два числа а и b сравнимы по модулю d (где d — некоторое целое число), если при делении на d они дают один и тот же остаток; другими словами, если существует такое целое число п (положительное, отрицательное или нуль), что а - b = nd. Например, 27 и 15 сравнимы по модулю 4, так как 27 = 6-4 + 3, 15 = 3-4 + 3.

Для отношения сравнения введено специальное обозначение — если а и b сравнимы по модулю d, то пишут: а = b (mod d). [Если же а не сравнимо с b по модулю dy то пишут а ф b (mod d).] Если ясно, какой модуль имеется в виду, то приписку «mod d» опускают.

Сравнения часто встречаются в повседневной жизни. Например, часовая стрелка указывает время по модулю 12; автомобильный счетчик отмечает пройденные расстояния по модулю 100000 (миль или километров).

Прежде чем перейти к более детальному рассмотрению сравнений и их свойств, пусть читатель проверит, что следующие утверждения в точности эквивалентны:

Введенные Гауссом обозначения для сравнений подчеркивают то обстоятельство, что сравнения обладают многими свойствами обычных равенств. Напомним эти свойства:

Кроме того, если а = а' и b = Ь\ то

Эти же свойства сохраняются, если соотношение равенства а = b заменяется соотношением сравнения а = b (mod d). Именно:

(Проверьте! — это нетрудно.)

Точно так же, если а = а' (mod d) и b = b' (mod d), то

Таким образом, сравнения по одному и тому же модулю можно складывать, вычитать и умножать. В самом деле, из

вытекает

что и приводит к нужным заключениям.

Сравнения допускают великолепное геометрическое представление. Если хотят дать геометрическое представление целым числам, то обыкновенно выбирают прямолинейный отрезок единичной длины и затем откладывают кратные отрезки в обе стороны. Таким образом, для каждого

целого числа получается соответствующая ему точка на прямой — числовой оси (рис. 6). Но если приходится иметь дело с числами по данному модулю d, два сравнимых числа — поскольку речь идет о делимости на d — рассматриваются как нечто неразличимое, так как дают одни и те же остатки. Чтобы изобразить все это геометрически, возьмем окружность, разделенную на d равных частей. Всякое целое число при делении на d дает в качестве остатка одно из чисел 0, 1, 2, ..., d - 1 ; эти числа мы и расставим по окружности на равных расстояниях. Каждое число сравнимо с одним из этих чисел по модулю d и, следовательно, представляется соответствующей точкой; два числа сравнимы, если изображаются одной и той же точкой. Рис. 7 сделан для случая d = 6. Циферблат часов может также служить моделью.

В качестве примера применения мультипликативного свойства сравнений 6') определим остатки, получающиеся при делении на одно и то же число последовательных степеней числа 10. Так как 10 = —1 + 11, то

Умножая многократно это сравнение само на себя, получаем дальше

Отсюда можно заключить, что всякое целое число, запись по десятичной системе которого имеет вид

дает тот же остаток при делении на 11, что и сумма его цифр, взятая с чередующимися знаками:

В самом деле, мы имеем

Рис. 6. Геометрическое представление целых чисел

Рис. 7. Геометрическое представление целых чисел по модулю 6

Так как все выражения 102 — 1, 103 + 1, ... сравнимы с нулем по модулю 11, то z — t также сравнимо с нулем, и потому z при делении на 11 дает тот же остаток, что и /. В частности, число делится на 11, т. е. дает остаток О при делении, в том и только том случае, если знакочередующаяся сумма его цифр делится на 11. Например, число z = 3162819 делится на 11, так как 3-1+6-2-1-8-1-1-9 = 22 делится на 11. Найти таким же образом правило делимости на 3 или на 9 еще проще, так как 10=1 (mod 3 и 9), и потому 10" = 1 (mod 3 и 9) при любом п. Отсюда следует, что число z делится на 3 и на 9 в том и только том случае, если сумма его цифр

делится соответственно на 3 и на 9.

Если в качестве модуля возьмем 7, то получим

Далее остатки повторяются. Таким образом, z делится на 7 в том и только том случае, если выражение

делится на 7.

Упражнение. Найдите подобный же признак делимости на 13.

Складывая и умножая сравнения по определенному модулю, скажем d = 5, можно всегда обеспечить то, чтобы входящие числа не становились слишком большими, заменяя всякий раз встречающееся число одним из чисел

0, 1, 2, 3, 4,

а именно тем, с которым оно сравнимо. Так, вычисляя суммы и произведения различных чисел по модулю 5, нужно только пользоваться следующими таблицами сложения и умножения:

Из второй таблицы видно, что произведение ab сравнимо с нулем по модулю 5 только в том случае, если а или b = 0 (mod 5). Это наводит на мысль о существовании следующего общего закона:

7) ab = 0 (mod d) только в том случае, если а = 0 или b = 0 (mod d), что является распространением хорошо известного свойства обыкновенного умножения:

ab = О только в том случае, если а = О или b = 0.

Но закон 7) действителен только при том условии, что модуль d есть простое число. Действительно, сравнение

означает, что ab делится на d, а мы уже видели, что произведение ab делится на простое d в том и только том случае, если один из множителей а или b делится на d, т. е. если

С другой стороны, закон теряет силу при d составном: можно тогда написать d = г • s, где оба множителя г и 5 меньше чем d, так что

и, однако,

Например, 2^0 (mod 6) и 3 ф 0 (mod 6), но 2 • 3 = 6 = 0 (mod 6).

Упражнения. 1) Покажите, что для сравнений по простому модулю имеет место следующее правило сокращения', если ab = ас и а ф 0, то b = с.

2) С каким числом в пределах от 0 до 6 включительно сравнимо число 11 • 18 х ж 2322- 13- 19 по модулю 7?

3) С каким числом в пределах от 0 до 12 включительно сравнимо число 3 • 7 х ж 11 • 17 - 19 - 23 - 29 - 113 по модулю 13?

4) С каким числом в пределах от 0 до 4 включительно сравнима сумма 1 + 2 + 22 + ... 4- 219 по модулю 5?

2. Теорема Ферма. В XVII столетии Ферма, основатель современной теории чисел, открыл чрезвычайно важную теорему. Если р — простое число, не делящее целого числа а, то

Другими словами, (р - 1)-я степень а при делении на р дает остаток 1.

Некоторые из ранее произведенных нами вычислений подтверждают эту теорему: так, мы видим, что 106 = 1 (mod 7), 102 = 1 (mod 3) и 10ю = 1 (mod 11). Таким же образом легко проверить, что 212 = 1 (mod 13) и 510 = 1 (mod 11). Для этой цели нет необходимости на самом деле вычислять

столь высокие степени данных чисел; достаточно использовать мультипликативное свойство сравнений:

Обращаясь к доказательству теоремы Ферма, рассмотрим числа, кратные а:

Никакие два из этих чисел не могут быть между собой сравнимы по модулю р. В противном случае р должно было бы делить разность тг — ms = (г — s)a, где г, s была бы пара целых чисел, подчиненных ограничению 1 ^ г < 5 ^ (р — 1). Но из закона 7) следует, что этого не может случиться: так как s — г меньше чем р, то р не делит s — г; с другой стороны, по предположению, р не делит и а. Таким же образом мы убеждаемся, что ни одно из чисел m не сравнимо с нулем. Отсюда следует, что числа ть га2, ..., mp_i соответственно сравнимы с числами 1, 2, ..., р — 1, взятыми в некоторой их перестановке. Дальше заключаем:

или же, полагая ради краткости К = 1 • 2 • 3... (р — 1),

Число К не делится на /?, так как ни один из входящих в него множителей не делится на р\ значит, согласно закону 7) (ар~х — 1) должно делиться на р, т. е.

Это и есть теорема Ферма.

Проверим эту теорему еще раз. Возьмем р = 23 и а = 5; тогда получаем по модулю 23

Если возьмем а = 4 вместо 5, то будем иметь, опять-таки по модулю 23,

В примере, где было взято а = 4, р = 23 (как и во многих иных), можно заметить, что не только (р — 1)-я степень, но и более низкая степень а уже оказывается сравнимой с единицей. Наименьшая такая степень — в нашем примере степень 11 — непременно есть делитель числа р — 1 (см. ниже, упражнение 3).

Упражнения. 1) С помощью подобных же вычислений проверьте, что

2) Проверьте теорему Ферма, взяв р — 5, 7, 11, 17 и 23 и придавая числу а различные значения.

3) Докажите общую теорему: наименьшее число е, для которого ае = 1 (mod р), должно быть делителем р — 1. [Указание: произведите деление р — 1 на е, получая

где 0 ^ г < е, и дальше воспользуйтесь тем обстоятельством, что ар~1 = ас = 1 (mod /?).]

3. Квадратические вычеты. Обращаясь снова к примерам, иллюстрирующим теорему Ферма, мы можем подметить, что не только всегда справедливо сравнение ар~х = 1 (mod р), но (предположим, что р есть простое число, отличное от 2, значит, — нечетное, р = 2р' + 1) при некоторых значениях а справедливо также сравнение ар = а 2 =1 (mod р). Это обстоятельство вызывает ряд заслуживающих внимания соображений. Теорему Ферма можно записать в следующем виде:

Так как произведение делится на р только в том случае, если один из множителей делится на р, то, значит, одно из чисел ар' — 1 или ар' + 1 должно делиться на /?; поэтому, каково бы ни было простое число р > 2 и каково бы ни было число а, не делящееся на р, непременно должно иметь место одно из двух сравнений

Начиная с самого возникновения современной теории чисел, математики были заинтересованы выяснением вопроса: для каких чисел а оправдывается первое сравнение, а для каких — второе? Предположим, что а сравнимо по модулю р с квадратом некоторого числа ле,

Тогда а 2 =хр~\ и согласно теореме Ферма правая, а следовательно, и левая части сравнения должны быть сравнимы с 1 по модулю р. Такое число а (не являющееся кратным р), которое по модулю р сравнимо с квадратом некоторого числа, называется квадратическим вычетом р\ напротив, число 6, не кратное р, которое не сравнимо ни с каким квадратом по модулю р, называется квадратическим невычетом р. Мы только что видели, что всякий квадратический вычет а числа р удовлетворяет сравнению а 2 = 1 (mod р). Довольно легко установить, что всякий невычет b

числа р удовлетворяет сравнению b 2 = — 1 (mod р). Кроме того, мы покажем (несколько дальше), что среди чисел 1, 2, 3, ..., р — 1 имеется в точности £—2— квадратических вычетов и невычетов.

Хотя с помощью прямых подсчетов можно было собрать немало эмпирических данных, но открыть сразу общие законы, регулирующие распределение квадратических вычетов, было нелегко. Первое глубоко лежащее свойство этих вычетов было подмечено Лежандром (1752—1833); позднее Гаусс назвал его законом взаимности. Этот закон касается взаимоотношения между двумя различными простыми числами р и q. Он заключается в следующем:

1) Предположим, что произведение - - • - - четное. Тогда q есть вычет р в том и только том случае, если р есть вычет q.

2) Предположим, напротив, что указанное произведение — нечетное. Тогда ситуация резко меняется: q есть вычет если р есть невычет q, и наоборот.

Первое строгое доказательство закона взаимности, долгое время остававшегося гипотезой, данное Гауссом еще в молодости, явилось одним из крупных его достижений. Доказательство Гаусса никоим образом нельзя назвать простым, и в наше время провести доказательство закона взаимности стоит известного труда, хотя количество различных опубликованных доказательств очень велико. Истинный смысл закона взаимности вскрылся лишь в недавнее время — в связи с новейшим развитием алгебраической теории чисел.

В качестве примера, иллюстрирующего распределение квадратических вычетов, возьмем р = 7. Так как по модулю 7

и так как дальнейшие квадраты повторяют эту последовательность, то квадратическими вычетами числа 7 являются числа, сравнимые с 1, 2 и 4, а невычетами — числа, сравнимые с 3, 5 и 6. В общем случае квадратические вычеты р составляются из чисел, сравнимых с числами I2, 22, ..., (р — I)2. Но эти последние попарно сравнимы, так как

Действительно, (р — х)2 = р2 — 2рх + х2 = х2 (mod р). Значит, половина чисел 1, 2, ..., р — 1 представляет собою квадратические вычеты числа р, а другая половина — невычеты.

Чтобы дать иллюстрацию также и закону взаимности, положим р = 5, q=\\. Так как 11 = I2 (mod 5), то 11 есть квадратический вычет по модулю 5, и так как, кроме того, произведение • —-— четное, то согласно закону взаимности 5 должно быть также квадратическим вычетом

по модулю 11; и в самом деле, мы видим, что 5 = 42 (mod 11). С другой стороны, положим p = 7,q = 11. Тогда произведение —— • —-— нечетно, и в этом случае 11 есть вычет по модулю 7 (так как 11 = 22 (mod 7)), а 7 — невычет по модулю 11.

Упражнения. 1) б2 = 36= 13 (mod 23). Является ли 23 квадратическим вычетом по модулю 13?

2) Мы видели, что х2 = (р — х)2 (mod р). Покажите, что иного вида сравнений между числами I2, 22, З2, ..., (р - I)2 быть не может.

§ 3. Пифагоровы числа и большая теорема Ферма

Интересный вопрос из области теории чисел связан с теоремой Пифагора. Теорема эта, как известно, алгебраически выражается равенством

(1)

где а и b— длины катетов, а с — длина гипотенузы. Проблема разыскания всех прямоугольных треугольников, стороны которых выражаются целыми числами, таким образом, эквивалентна проблеме нахождения всех решений (а, Ьу с) в целых числах уравнения (1). Каждая тройка целых чисел (а, 6, с), удовлетворяющих этому уравнению, носит название пифагоровой тройки.

Все пифагоровы тройки могут быть найдены довольно просто. Пусть целые числа a, b и с образуют пифагорову тройку, т. е. связаны соотношением а2 + Ь2 = с2. Положим ради краткости - — х, - = у. Тогда х и у — рациональные числа, связанные равенством х2 + у2 = I. Из последнего следует: у2 = (1 - х)(1 + х) или -г^— = -— Общее значение двух отношений в полученной пропорции есть число которое может быть представлено как отношение двух целых чисел —. Можно, далее, написать:

Из полученной системы уравнений немедленно следует, что

Подставляя - и - вместо х и у и — вместо /, будем иметь

Отсюда вытекает

(2)

где г — некоторый рациональный множитель пропорциональности. Итак, если числа (а, Ь, с) образуют пифагорову тройку, то они соответственно пропорциональны числам вида и2 — и2, 2uv, и2 + v2. Обратно, легко проверить, что всякие три числа (a, Ь, с), определенные равенствами вида (2), образуют пифагорову тройку, так как из равенств (2) следует

Этот результат можно несколько упростить. Из некоторой пифагоровой тройки (а, Ь, с) легко выводится бесконечное множество других пифагоровых троек (sa, sb, sc), каково бы ни было целое положительное 5. Так, из (3, 4, 5) получаются (6, 8, 10), (9, 12, 15) и т.д. Такие тройки не являются существенно различными, так как соответствуют подобным треугольникам. Мы условимся говорить о примитивной пифагоровой тройке, если числа а, fr и с не имеют общего множителя. Можно показать, что формулы

где и, v — произвольные целые положительные числа (v > и), не имеющие общих множителей и не являющиеся одновременно нечетными, дают нам все примитивные пифагоровы тройки.

* Упражнение. Докажите последнее утверждение.

Вот примеры примитивных пифагоровых троек:

В связи с рассмотрением пифагоровых чисел более или менее естественно возникает вопрос о возможности следующего обобщения задачи: можно ли найти такие целые положительные числа а, Ь, с, которые удовлетворяли бы уравнению a3 + b3 = с3, или уравнению a4 -h b4 = с4, или, вообще говоря, уравнению

(3)

где показатель п — целое число, большее 2? Ответ был дан Ферма, который пришел к нему умозрительным путем. Ферма изучал одно сочинение Диофанта, известного математика древности, занимавшегося теорией чисел, и имел обыкновение делать примечания на полях книги. Хотя он не затруднял себя тем, чтобы приводить тут же доказательства многих высказанных им теорем, но все они постепенно в дальнейшем были доказаны — за одним весьма значительным исключением. По поводу пифагоровых чисел Ферма сделал пометку, что уравнение (3) неразрешимо в целых числах, если п > 2, но что найденное им остроумное доказательство этой теоремы слишком длинно, чтобы его можно было поместить на полях книги, с которой он работал.

Это утверждение Ферма в его общей форме никогда и никем впоследствии не было ни доказано, ни опровергнуто, несмотря на усилия целого ряда крупнейших математиков.1 Правда, теорема была доказана для очень многих значений п, в частности, для всех п < 619, но не для всех возможных значений п\ вместе с тем не было указано и примера, опровергающего теорему. Хотя сама по себе теорема и не имеет очень большого значения в математическом смысле, но попытки доказать ее положили начало многим важнейшим исследованиям в области теории чисел. Проблема вызвала большой интерес и в более широких кругах — отчасти благодаря премии размером в 100000 марок, предназначенной для лица, которое впервые даст решение, причем присуждение премии было поручено Геттингенской Академии. Пока послевоенная инфляция в Германии не свела на нет денежную ценность этой премии, ежегодно представлялось громадное число «решений», содержащих ошибки. Даже специалисты-математики не раз были введены в заблуждение и представляли или публиковали доказательства, которые затем отпадали после обнаружения в них иной раз каких-нибудь поверхностных недосмотров. Со времени падения курса марки ажиотаж вокруг проблемы Ферма несколько приутих; и все же пресса не перестает время от времени осведомлять нас о том, что решение найдено каким-нибудь новоявленным «гением».

§ 4. Алгоритм Евклида

1. Общая теория. Читатель прекрасно знаком с обыкновенной процедурой «длинного» деления одного целого числа а на другое число b и знает, что эту процедуру можно продолжать до тех пор, пока остаток не станет меньше, чем делитель. Так, если а = 648 и b = 7, то мы получаем

1 Теорема Ферма была доказана в 1995 г. Подробную историю доказательства этой теоремы можно найти в книге: Сингх С. Великая теорема Ферма. — М.: МЦНМО, 2000. — Прим. ред. наст. изд.

частное q = 92 и остаток г = 4.

По этому поводу можно сформулировать следующую общую теорему: если а и b — целые числа, причем b отлично от нуля, то можно всегда найти такое целое число q, что

a = b-q + r, (1)

где г есть целое число, удовлетворяющее неравенству 0 ^ г < Ь.

Докажем эту теорему независимо от процедуры длинного деления. Достаточно заметить, что число а или само есть кратное числа Ь, или же лежит между двумя последовательными кратными Ь,

bq <a<b(q + 1) = bq + b.

В первом случае равенство (1) оправдывается, причем г = 0. Во втором случае из первого неравенства вытекает, что

а - bq = г > о,

а из второго — что

а — bq = г < Ь,

так что число г в этом случае удовлетворяет условию 0 < г < Ь.

Из указанного обстоятельства можно вывести большое число различных важных следствий. Первое из них — это метод для нахождения общего наибольшего делителя двух целых чисел.

Пусть а и b — два каких-то целых числа, не равных одновременно нулю; рассмотрим совокупность всех чисел, на которые делятся и а и Ь. Эта совокупность, несомненно, конечная, так как если, например, а ^ 0, то никакое число, большее чем а, не может быть делителем а. Отсюда следует, что число общих делителей а и b конечно; пусть через d обозначен наибольший из них. Число d называется общим наибольшим делителем а и Ь, и мы условимся обозначать его d = (а, Ь). Так, если а = 8, b = 12, то непосредственная проверка показывает, что (8, 12) = 4; если а = 5, b = 9, то мы точно так же получаем (5, 9) = 1. Если а и b — достаточно большие числа, например а = 1804, b = 328, то попытки найти общий наибольший делитель с помощью непосредственных проб довольно утомительны. Короткий и вполне надежный метод вытекает из алгоритма Евклида. (Алгоритмом называют всякий систематизированный прием вычисления.) Он основан на том обстоятельстве, что из соотношения вида

a = b-q + r (2)

необходимо следует, что

(а, Ь) = (Ь, г). (3)

В самом деле, всякое число и, которое одновременно делит и а и Ь,

a = su, b = tu,

делит также и г, так как г = а - bq = su - qtu = (s - qt)u\ и обратно, всякое число v, которое одновременно делит b и г,

b = s'v, r=t'v,

делит также и а, так как а = bq + г = s'vq + t'v = (s'g + /')*>• Значит, каждый общий делитель а и b есть вместе с тем общий делитель b и г, и обратно. Но раз совокупность всех общих делителей а и b совпадает с совокупностью всех общих делителей b и г, то ясно, что общий наибольший делитель а и b должен совпадать с общим наибольшим делителем b и г. А это и выражено равенством (3). Мы сейчас убедимся в полезности установленного обстоятельства.

Для этого вернемся к примеру нахождения общего наибольшего делителя чисел 1804 и 328. Обыкновенное «длинное» деление

приводит нас к заключению, что

Отсюда в силу (3) следует, что

Заметим, что задача вычисления общего наибольшего делителя (1804, 328) заменена теперь аналогичной задачей, но для меньших чисел. Можно продолжать эту процедуру. Так как

то мы получаем дальше 328 = 2 • 164 + 0, так что (328, 164) = (164, 0) = 164. Значит, (1804, 328) = (328, 164) = (164, 0) = 164, и общий наибольший делитель найден.

Эта самая процедура нахождения общего наибольшего делителя двух чисел в геометрической форме описана в «Началах» Евклида. Мы дадим ее общее описание в арифметической форме, исходя из произвольных целых чисел а и Ь, которые оба одновременно не равны нулю.

Так как сразу ясно, что (а, 0) = а, то можно допустить, что b ф 0. Последовательные деления приводят нас к цепи равенств

(4)

Деление продолжается, пока какой-нибудь из остатков гь г2, г3, ... не обратится в нуль. Рассматривая неравенства, выписанные справа, мы видим, что последовательно получаемые остатки образуют убывающую последовательность положительных чисел:

b > г, > г2 > г3 > г4 > ... > 0. (5)

Отсюда ясно, что после конечного числа делений (нужно сделать не более b операций, но часто гораздо меньше, так как разности между соседними г обыкновенно превышают единицу) должен получиться остаток 0:

Как только это получилось, мы можем утверждать, что

другими словами, общий наибольший делитель (а, Ь) равен последнему остатку в последовательности (5). Это следует из многократного применения равенства (3) к соотношениям (4); в самом деле, из этих соотношений следует:

Упражнение. Выполните алгоритм Евклида с цепью нахождения общего наибольшего делителя чисел: а) 187, 77; б) 105, 385; в) 245, 193.

Из равенств (4) можно вывести одно чрезвычайно важное свойство общего наибольшего делителя (а, Ь): если d = (а, Ь), то можно найти такие целые положительные или отрицательные числа k и /, что

(6)

Чтобы убедиться в этом, рассмотрим последовательные остатки (5). Первое из равенств (4) нам дает

так что Г\ может быть записано в форме k\a + l\b (в данном случае k\ = 1, /, = -g,). Из следующего равенства получается

Очевидно, такое же рассуждение можно по очереди применить ко всем остаткам г3, г4, ..., пока мы не придем к представлению

которое и желали получить.

В качестве примера рассмотрим алгоритм Евклида в применении к нахождению (61, 24): общий наибольший делитель есть 1, и интересующее нас представление числа 1 получается из равенств

Первое из этих равенств дает

второе — третье —

и, наконец, четвертое —

2. Применение к основной теореме арифметики. Тот факт, что d = (а, Ь) всегда может быть записано в форме d = ka + lb, позволит нам привести доказательство основной теоремы арифметики, отличное от того, которое было изложено на стр. 48. Сначала в качестве леммы мы докажем следствие, приведенное на стр. 49, а затем уже из него выведем теорему. Таким образом, ход мыслей будет теперь противоположен прежнему.

Лемма. Если произведение ab делится на простое число р, то или а, или b делится на р.

Предположим, что а не делится на р\ тогда (а, р) = 1, так как р имеет лишь два делителя: р и 1. В таком случае можно найти такие целые числа k и /, что

1 = ka + 1р.

Умножая обе части равенства на Ьу получим:

Так как ab делится на р, то можно написать

ab — рг,

так что

b = kpr + Ipb = p(kr + lb),

и отсюда ясно, что b делится на р. Таким образом, мы установили, что если ab делится на р, но а не делится, то b непременно делится на р\ значит, во всяком случае, или а, или b делится на р, раз ab делится на р.

Обобщение на случай произведения трех или большего числа множителей не представляет труда. Например, если abc делится на р, то достаточно дважды применить лемму, чтобы получить заключение, что по меньшей мере один из трех множителей ab и с делится на р. В самом деле, если р не делит ни а, ни Ь, ни с, то не делит ab и, следовательно, не делит (ab)c = abc.

Упражнение. Обобщение этого рассуждения на случай произведения из произвольного числа п множителей требует явного или неявного применения принципа математической индукции. Воспроизведите все детали соответствующих рассуждений.

Из полученного результата немедленно получается основная теорема арифметики. Предположим, что имеются два разложения целого числа N на простые множители:

N = pxp2...pr = qxq<1...qs.

Так как р\ делит левую часть равенства, то должно делить и правую и, значит (см. предыдущее упражнение), должно делить один из множителей qk. Но qk — простое число; значит, р\ должно равняться qk. Сократив равенство на общий множитель р\ = qk, обратимся к множителю р2 и установим таким же образом, что он равен некоторому qt. Сократив на р2 = qt, переходим, далее, к множителю /?3, и т. д. В конце концов сократятся все множители р, и слева останется 1. Так как q — целые положительные числа, то и справа не может остаться ничего, кроме 1. Итак, числа р и числа q будут попарно равны, независимо от порядка; значит, оба разложения тождественны.

3. Функция Эйлера ср(я). Еще раз о теореме Ферма. Говорят, что два целых числа а и b взаимно простые, если их общий наибольший делитель равен 1 :

(а,Ь) = 1.

Например, числа 24 и 35 взаимно простые, но числа 12 и 18 не взаимно простые.

Если а и b взаимно простые, то можно подобрать такие целые числа k и I, что

ka + lb=\.

Это следует из свойства (а, Ь), отмеченного на стр. 70.

Упражнение. Докажите теорему: если произведение ab делится на г, причем гиа взаимно простые, то b делится на г. (Указание: если гиа взаимно простые, то можно найти такие целые числа k и /, что

kr+la= 1.

Затем умножьте обе части равенства на Ь). Эта теорема обобщает лемму со стр. 71, так как простое число р в том и только в том случае является взаимно простым с а, если а не делится на р.

Пусть п — произвольное целое положительное число; обозначим через ср(лг) количество таких целых чисел в пределах от 1 до п, которые являются взаимно простыми с числом п. Выражение ф(лг), впервые введенное Эйлером, представляет собой очень важную теоретико-числовую функцию. Легко подсчитать значения ср(я) для нескольких первых значений п:

Заметим, что ср(р) = р — 1, если р — простое число; в самом деле, у числа р нет делителей, кроме 1 и р, и потому все числа 1, 2, р — 1 являются взаимно простыми с р. Если п составное и его разложение на простые множители имеет вид

где числа р обозначают различные простые множители, каждый из которых возводится в некоторую степень, то тогда

Например, из разложения 12 = 22 • 3 следует

что легко проверить и непосредственно. Доказательство приведенной теоремы совершенно элементарно, но мы его не приводим.

Упражнение. Пользуясь функцией Эйлера ср(я), обобщите теорему Ферма, приведенную на стр. 61. Обобщенная теорема формулируется следующим образом: если п — целое число и а взаимно просто с п, то

4. Непрерывные дроби. Диофантовы уравнения. Алгоритм Евклида, служащий для нахождения общего наибольшего делителя двух целых чисел, сразу же приводит к очень важному методу представления отношения двух целых чисел в виде некоторой сложной дроби особого вида.

Например, в применении к числам 840 и 611 алгоритм Евклида дает ряд равенств

которые, между прочим, показывают, что (840, 611) = 1. Но из этих равенств, с другой стороны, получаются следующие:

Комбинируя последние равенства, мы приходим к следующему разложению числа

Выражение вида

(7)

где все числа а целые положительные, называется непрерывной дробью. Алгоритм Евклида дает метод для представления всякого рационального числа в виде такой непрерывной дроби.

Упражнение. Разложите в непрерывные дроби рациональные числа

* Непрерывные дроби играют важную роль в той области высшей арифметики, которую иногда называют диофантовым анализом. Диофантово уравнение — это алгебраическое уравнение с одним или с несколькими неизвестными, все коэффициенты которого — целые числа, причем ставится задача отыскания лишь целых его корней. Такое уравнение может или вовсе не иметь решений, или иметь их конечное число, или, наконец, иметь бесконечное множество решений. Простейшее диофантово уравнение — линейное, с двумя неизвестными:

ах + by = с, (8)

где а, Ь, с — данные целые числа, и требуется найти целые решения х, у. Полное решение уравнения этого типа может быть найдено посредством алгоритма Евклида.

Прежде всего этот алгоритм позволит нам определить d = (а, Ь); затем, как мы знаем, при надлежащем выборе целых чисел к и / выполняется равенство

(9)

Итак, уравнение (8) имеет частное решение х = к, у = I в том случае, если с = d. Вообще, если с есть кратное d,

с = d - q,

то из равенства (9) мы выводим

так что в этом случае уравнение (8) имеет частное решение х = х* = kq, у = у* = lq. Обратно, если уравнение (8) имеет при данном с хоть одно решение х, у, то с должно быть кратным d = (а, Ь): действительно, d делит и а и Ь, следовательно, должно делить с. Мы доказали, таким образом, что уравнение (8) имеет (хоть одно) решение в том и только том случае, если с кратно (а, Ь).

Посмотрим теперь, как, зная одно решение х — х*,у = у* уравнения (8), определить все прочие решения. Пусть х — х', у = у' есть какое-либо иное решение; тогда X = х' — X*, у — у1 — у* есть решение «однородного» уравнения

ax + by = 0. (10)

Действительно, из равенств

посредством вычитания получаем

Обращаясь теперь к уравнению (10), мы видим, что общее его решение имеет вид X = У = ~Ja^b) где Г — произвольное целое число. (Предоставляем доказательство читателю в качестве упражнения. Указание: разделите на (а, Ь) и воспользуйтесь упражнением на стр. 73.) Затем окончательно будем иметь общее решение уравнения (8):

Подведем итоги. Линейное диофантово уравнение ах + by = с, где a, b и с — целые числа, имеет целые решения в том и только том случае, если с кратно (а, Ь). В этом случае частное решение х = х*, у = у* может быть найдено посредством алгоритма Евклида, а самое общее имеет вид

где г — произвольное целое число.

Примеры. Уравнение Зх + 6у = 22 не имеет целых решений, так как (3, 6) = 3 не делит 22.

Уравнение 7х + My = 13 имеет частное решение х = -39, у = 26, которое находится с помощью следующих вычислений:

Отсюда следует:

Остальные решения даются формулами

где г — произвольное целое число.

Упражнение. Решите диофантовы уравнения:

ГЛАВА II

Математическая числовая система

Введение

В дальнейшем мы должны в очень значительной степени расширить понятие числа, связываемое первоначально с натуральным рядом, для того чтобы сконструировать мощный инструмент, способный удовлетворять потребностям и практики, и теории. Исторически — в процессе долгой и неуверенно протекавшей эволюции — нуль, целые отрицательные числа и рациональные дроби приобрели постепенно те же права, что и числа натурального ряда, и в наши дни правилами действий со всеми этими числами прекрасно овладевает средний ребенок школьного возраста. Но для того чтобы обеспечить полную свободу в алгебраических операциях, нужно идти и дальше и охватить расширенным понятием также иррациональные и комплексные числа. Хотя эти обобщения понятия числа употреблялись уже столетия тому назад и на них базируется вся современная математика, но на прочный логический фундамент они были поставлены лишь в недавнее время. В настоящей главе мы дадим очерк основных этапов этого развития.

§ 1. Рациональные числа

1. Рациональные числа как средство измерения. Натуральные числа возникают как абстракция в процессе счета объектов, образующих конечные совокупности. Но в повседневной жизни нам приходится не только считать объекты, индивидуально отделенные один от другого, но и измерять величины, например такие, как длина, площадь, вес, время. Если мы хотим обеспечить свободу операций с результатами измерения таких величин, могущих неограниченно делиться на части, нам необходимо, не ограничиваясь натуральным рядом, расширить пределы арифметики и создать новый мир чисел. Первый шаг заключается в том, чтобы проблему измерения свести к проблеме счета. Мы выбираем сначала совершенно произвольно единицу измерения — фут, ярд, дюйм, фунт, грамм — смотря по случаю, и этой единице приписываем меру 1. Затем мы считаем число таких единиц, входящих в измеряемую величину. Может случиться, что данный кусок свинца весит ровно 54 фунта. Но в общем

случае, как мы замечаем, процесс счета «не сходится»: данная величина не измеряется абсолютно точно выбранной единицей, не оказывается ей кратной. Самое большее, что мы можем сказать в этом случае, — это то, что она заключена между двумя последовательными кратными этой единицы, допустим, между 53 и 54 фунтами. Если так действительно происходит, то мы делаем следующий шаг и вводим новые подъединицы, получающиеся от подразделения первоначальной единицы на некоторое число п равных частей. На обыкновенном языке эти новые подъединицы могут иметь те или иные названия; например, фут подразделяется на 12 дюймов, метр — на 100 сантиметров, фунт — на 16 унций, час — на 60 минут, минута — на 60 секунд, и т. д. Однако в общей математической символике подъединица, получаемая при подразделении первоначальной единицы на п частей, обозначается символом и если рассматриваемая величина содержит ровно m таких подъединиц, то ее мера тогда есть ^.

Этот символ называется дробью или отношением (иногда пишут т\п). Последний, и самый существенный, шаг был совершен уже осознанно, после многих столетии накопления отдельных усилии: символ — был освобожден от его конкретной связи с процессом измерения и самими измеряемыми величинами и стал рассматриваться как отвлеченное число, самостоятельная сущность, уравненная в своих правах с натуральным числом. Если тип — натуральные числа, то символ — называется рациональным числом.

Употребление термина «число» (первоначально под «числами» понимали только натуральные числа) применительно к новым символам оправдывается тем обстоятельством, что сложение и умножение этих символов подчиняются тем же законам, что и соответствующие операции над натуральными числами. Чтобы в этом убедиться, нужно сначала определить, в чем заключаются сложение и умножение рациональных чисел, а также определить, какие рациональные числа признаются равными между собой. Эти определения, как всем известно, таковы:

(1)

где а, Ь, с, d — произвольные натуральные числа. Например,

Эти самые определения мы вынуждены принять, если имеем в виду использовать рациональные числа для измерения длин, площадей и т. п. Но с

более строгой логической точки зрения эти правила сложения и умножения и это толкование равенства по отношению ко вновь вводимым символам устанавливаются независимо по определению, не будучи обусловлены какой-либо иной необходимостью, кроме взаимной совместимости (непротиворечивости) и пригодности к практическим приложениям. Исходя из определений (1), можно показать, что основные законы арифметики натуральных чисел продолжают сохраняться и в области всех рациональных чисел:

(коммутативный закон сложения), (ассоциативный закон сложения), (коммутативный закон умножения), (ассоциативный закон умножения), (дистрибутивный закон).

(2)

Так, например, доказательство коммутативного закона сложения в случае дробей ясно из следующих равенств:

здесь первое и последнее равенства оправдываются определением сложения (1), а среднее есть следствие коммутативных законов сложения и умножения в области натуральных чисел. Читатель сможет, если пожелает, проверить таким же образом четыре остальных закона.

2. Возникновение надобности в рациональных числах внутри самой математики. Принцип обобщения. Независимо от «практического» основания для введения рациональных чисел существует основание более глубокое и носящее в известном смысле еще более принудительный характер. Эту сторону дела мы рассмотрим здесь совершенно независимо от приведенных выше рассуждений. В обычной арифметике натуральных чисел мы всегда можем выполнять основные прямые операции — сложение и умножение. Но обратные операции — вычитание и деление — не всегда выполнимы. Разность b - а двух натуральных чисел а и b есть по определению такое натуральное число с, что а + с = ft, т. е. это есть решение уравнения a + х = Ь. Но в области натуральных чисел символ b - а имеет смысл лишь при ограничении b > а, так как только при этом условии уравнение а + х = b имеет решением натуральное число. На пути к снятию этого ограничения серьезный шаг был сделан уже тогда, когда был введен символ 0 для обозначения а - а. Но еще более значительным успехом было введение символов -1, -2, -3, ... и вместе с тем определения

для случая b < а: после этого можно было утверждать, что и вычитание обладает свойством неограниченной выполнимости в области всех целых — положительных и отрицательных— чисел. Вводя новые символы — 1, —2, —3, ... и тем самым расширяя числовую область, мы обязаны, конечно, определить операции со вновь вводимыми числами таким образом, чтобы первоначальные правила арифметических операций не были нарушены. Так, например, правило

(3)

которое лежит в основе умножения отрицательных чисел, есть следствие нашего желания сохранить дистрибутивный закон а(Ь + с) =ab + ас. Действительно, если бы мы, скажем, декларировали, что (—1) • (—1) = — 1, то, полагая а = — 1, b = 1, с = — 1, получили бы (—1) • (1 — 1) = — 1 — 1 = -2, тогда как на самом деле (—1) • (1 — 1) = (— 1) - 0 = 0.

Понадобилось немало времени, чтобы среди математиков было хорошо осознано, что «правило знаков» (3) и вместе с ним все прочие определения, относящиеся как к отрицательным числам, так и к дробям, никак не могут быть «доказаны». Они создаются, или декларируются, нами самими с целью обеспечить свободу операций и притом без нарушения основных арифметических законов. Что может — и должно — быть доказываемо, так это только то, что если эти определения приняты, то тем самым сохранены основные законы арифметики: коммутативный, ассоциативный и дистрибутивный. Даже великий Эйлер пользовался совершенно неубедительной аргументацией, желая показать, что (—1) • (—1) «должно» равняться +1. Он говорил: «Рассматриваемое произведение может быть только или +1, или —1; но —1 быть не может, так как —1 = (+1) • (—1).»

Совершенно подобно тому, как введение отрицательных целых чисел и нуля расчищает путь для неограниченной выполнимости вычитания, введение дробных чисел устраняет арифметические препятствия, мешающие выполнять деление. Отношение, или частное, х = — двух целых чисел определяется как решение уравнения

(4)

и существует как целое число только в том случае, если а есть делитель Ь. Но если это не так (например, при а = 2, b = 3), то мы просто вводим новый символ —, называемый дробью и подчиненный условию, выражающемуся равенством а • ^ = Ь, так что ^ есть решение (4) «по определению».

Изобретение дробей как новых числовых символов обеспечивает неограниченную выполнимость деления, за исключением деления на нуль, которое исключается раз навсегда.

Выражения вроде —, —, — и т. п. останутся для нас символами, лишенными смысла. Если бы мы допустили деление на 0, то из верного равенства 0-1=0-2 вывели бы неверное следствие 1 = 2. Иногда бывает целесообразно обозначать такие выражения символом «бесконечность», однако с условием, чтобы не делалось даже попытки оперировать этим символом так, как будто бы он подчинялся обычным законам арифметики.

Теперь нам ясны принципы, согласно которым сконструирована система всех рациональных чисел — целых и дробных, положительных и отрицательных. В этой расширенной области не только полностью оправдываются формальные законы — ассоциативный, коммутативный и дистрибутивный, — но и уравнения а + х = b и ах = b всегда имеют решения х = Ь- аих=^с единственной оговоркой, что в случае второго уравнения а не должно равняться нулю. Иными словами, в области рациональных чисел так называемые рациональные операции — сложение, вычитание, умножение и деление — выполнимы неограниченно и не выводят за пределы области. Такие замкнутые числовые области называются полями. Мы повстречаемся с дальнейшими примерами полей ниже, в этой же главе, а также в главе III.

Расширение области посредством введения новых символов, совершаемое таким образом, что законы, которые имели место в первоначальной области, сохраняются и в расширенной, является типичным примером характерного для математики принципа обобщения. Переход путем обобщения от натуральных чисел к рациональным удовлетворяет одновременно и теоретической потребности в снятии ограничений, которые наложены на вычитание и деление, и вместе с тем — практической потребности в числах, пригодных для фиксации результатов измерений. Именно тот факт, что рациональные числа идут навстречу сразу теоретической и практической потребностям, придает им особую важность. Как мы видели, расширение понятия числа совершилось путем введения новых абстрактных символов вроде 0, —2 или —. В наше время мы оперируем этими символами бегло и уверенно, не вдумываясь в их природу, и трудно даже себе представить, что еще в XVII столетии они пользовались доверием гораздо в меньшей степени, чем натуральные числа, что ими если и пользовались, то с известным сомнением и трепетом. Свойственное человеческому сознанию стремление цепляться за «конкретное» — воплощаемое в ряде натуральных чисел — обусловливает ту медленность, с которой протекала неизбежная эволюция. Логически безупречная арифметическая система может быть сконструирована не иначе, как в отвлечении от действительности.

3. Геометрическое представление рациональных чисел. Выразительное геометрическое представление системы рациональных чисел может быть получено следующим образом.

На некоторой прямой линии, «числовой оси», отметим отрезок от 0 до 1 (рис. 8). Тем самым устанавливается длина единичного отрезка, которая, вообще говоря, может быть выбрана произвольно. Положительные и отрицательные целые числа тогда изображаются совокупностью равноотстоящих точек на числовой оси, именно, положительные числа отмечаются вправо, а отрицательные — влево от точки 0. Чтобы изобразить числа со знаменателем п, разделим каждый из полученных отрезков единичной длины на п равных частей; точки деления будут изображать дроби со знаменателем п. Если сделать так для значений п, соответствующих всем натуральным числам, то каждое рациональное число будет изображено некоторой точкой числовой оси. Эти точки мы условимся называть «рациональными»; вообще, термины «рациональное число» и «рациональная точка» будем употреблять как синонимы.

В главе I, § 1 было определено соотношение неравенства А < В для натуральных чисел. На числовой оси это соотношение отражено следующим образом: если натуральное число А меньше, чем натуральное число В, то точка А лежит левее точки В. Так как указанное геометрическое соотношение устанавливается для любой пары рациональных точек, то естественно пытаться обобщить арифметическое отношение неравенства таким образом, чтобы сохранить этот геометрический порядок для рассматриваемых точек. Это удается, если принять следующее определение: говорят, что рациональное число А меньше, чем рациональное число В (А < В), или что число В больше, чем число А (В > А), если разность В - А положительна. Отсюда следует (при А < В), что точки (числа) между А и В — это те, которые одновременно > А и < В. Каждая такая пара точек А и В, вместе со всеми точками между ними, называется сегментом (или отрезком) и обозначается [А, В] (а множество одних только промежуточных точек — интервалом (или промежутком), обозначаемым (А, В)).

Расстояние произвольной точки А от начала 0, рассматриваемое как положительное число, называется абсолютной величиной А и обозначается символом

Понятие «абсолютная величина» определяется следующим образом: если А ^ 0, то \АI = А; если А < 0, то \А \ = —А. Ясно, что если числа А и В

Рис. 8. Числовая ось

имеют один и тот же знак, то справедливо равенство \А + ß| = |Л| + |ß|; если же А и В имеют разные знаки, то \А + В\ < \А \ + |ß|. Соединяя эти два результата вместе, мы приходим к общему неравенству

которое справедливо независимо от знаков А и В.

Факт фундаментальной важности выражается следующим предложением: рациональные точки расположены на числовой прямой всюду плотно. Смысл этого утверждения тот, что внутри всякого интервала, как бы он ни был мал, содержатся рациональные точки. Чтобы убедиться в справедливости высказанного утверждения, достаточно взять число п настолько большое, что интервал ^0, ^ будет меньше, чем данный интервал (Л, ß); тогда по меньшей мере одна из точек вида — окажется внутри данного интервала. Итак, не существует такого интервала на числовой оси (даже самого маленького, какой только можно вообразить), внутри которого не было бы рациональных точек. Отсюда вытекает дальнейшее следствие: во всяком интервале содержится бесконечное множество рациональных точек. Действительно, если бы в некотором интервале содержалось лишь конечное число рациональных точек, то внутри интервала, образованного двумя соседними такими точками, рациональных точек уже не было бы, а это противоречит тому, что только что было доказано.

§ 2. Несоизмеримые отрезки.

Иррациональные числа, пределы

1. Введение. Если мы станем сравнивать по величине два прямолинейных отрезка а и Ь, то не исключена возможность, что а содержится в b в точности целое число раз г. В таком случае длина отрезка b очень просто выражается через длину отрезка а: длина b в г раз больше, чем длина а. Может случиться и так, что целого числа г, которое обладало бы указанным свойством, не существует; но при этом возможно, что, разделив отрезок а на некоторое число, скажем я, равных частей ^каждая длины ^

и взяв целое число m таких частей, мы в точности получим отрезок Ь:

(1)

Если осуществляется соотношение вида (1), то говорят, что два отрезка а и b соизмеримы, так как они обладают некоторой «общей мерой»: таковой является отрезок длины —, который содержится в отрезке а ровно п раз, а в отрезке b ровно m раз. Некоторый отрезок b соизмерим или несоизмерим с отрезком а в зависимости от того, можно или нельзя подобрать два

таких натуральных числа m и п (п т^О), что имеет место равенство (1). Обращаясь к рис. 9, предположим, что в качестве отрезка а избран единичный отрезок [0, 1 ], и рассмотрим всевозможные отрезки, у которых один из концов совпадает с 0. Тогда из этих отрезков те и только те будут соизмеримы с единичным отрезком, у которых второй конец совпадает с некоторой рациональной точкой —.

Для практической цели измерения рациональных чисел всегда совершенно достаточно. Даже с точки зрения теоретической, поскольку рациональные точки расположены всюду плотно, могло бы показаться, что все точки на числовой оси — рациональные. Если бы дело обстояло именно так, то всякий отрезок был бы соизмерим с единичным. Но дело обстоит не так просто, и в установлении этого обстоятельства заключается одно из самых поразительных открытий в математике: оно было сделано уже в древнейшие времена (в школе Пифагора). Существуют несоизмеримые отрезки, или иначе (если мы допустим, что каждому отрезку соответствует некоторое число, выражающее его длину), существуют иррациональные числа. Осознание этого факта было научным событием величайшей значимости, почти откровением. Весьма возможно, что именно оно положило начало тому, что мы теперь считаем строгим математическим методом и рассматриваем как вклад в науку, сделанный древними греческими математиками. Без сомнения, это замечательное открытие глубоко повлияло на всю математику и даже философию от древних времен и до наших дней.

Евдоксова теория несоизмеримых величин, изложенная в геометрической форме в «Началах» Евклида, представляет собой тончайшее достижение греческой математики (ее изложение обыкновенно пропускается в разжиженных пересказах Евклида, предназначенных для школьного обучения). Эта теория получила подобающую ей высокую оценку лишь в конце XIX столетия — после того как усилиями Дедекинда, Кантора и Вейерштрасса была создана строгая теория иррациональных чисел. Мы изложим в дальнейшем эту теорию в ее современном арифметическом аспекте.

Прежде всего установим: диагональ квадрата несоизмерима с его стороной. Предположим, что сторона квадрата избрана в качестве единицы длины, длину же диагонали обозначим через х. Тогда, согласно теореме Пифагора, мы получаем:

Рис. 9. Рациональные точки

(Такое число х обозначают символом у/2.) Если бы х было соизмеримо с единицей, то можно было бы найти два таких целых числа р и qy что х = —, и тогда мы пришли бы к равенству

(2)

Можно допустить, что дробь — несократима, иначе мы с самого начала сократили бы ее на общий наибольший делитель чисел р и q. С правой стороны имеется 2 в качестве множителя, и потому р2 есть четное число, и, значит, само р — также четное, так как квадрат нечетного числа есть нечетное число. В таком случае можно положить р = 2г. Тогда равенство (2) принимает вид:

Так как с левой стороны теперь имеется 2 в качестве множителя, значит, q2, а следовательно, и q — четное. Итак, и р и q — четные числа, т. е. делятся на 2, а это противоречит допущению, что дробь ^ несократима. Итак, равенство (2) невозможно, и х не может быть рациональным числом.

Иначе этот результат можно сформулировать, утверждая, что \f2 есть число иррациональное.

Только что приведенное рассуждение показывает, что иной раз самое простейшее геометрическое построение приводит к отрезку, несоизмеримому с единицей. Если такой отрезок будет отложен с помощью циркуля на числовой оси от точки 0, то построенная таким образом точка (конец отрезка) не совпадает ни с какой рациональной точкой. Итак, система рациональных точек (хотя и всюду плотная) не покрывает всей числовой оси. Наивному сознанию, несомненно, может показаться странным и парадоксальным, что всюду плотное множество рациональных точек не покрывает всей прямой. Никакая наша «интуиция» не поможет нам «увидеть» иррациональные точки или отличить их от рациональных. Нет ничего удивительного в том, что открытие несоизмеримого потрясло греческих математиков и мыслителей и что его существование и в наши дни продолжает производить впечатление на людей, склонных к углубленным размышлениям.

Не представило бы труда сконструировать столько отрезков, несоизмеримых с единицей, сколько бы мы пожелали. Концы всех таких отрезков — при условии, что их начала совпадают с точкой 0,— образуют совокупность иррациональных точек. Заметим теперь, что нашим руководящим принципом уже при введении рациональных дробей было желание обеспечить

Рис. 10. Построение числа

возможность измерения длин отрезков посредством чисел, и тот же принцип продолжает руководить нами и тогда, когда речь идет о несоизмеримых отрезках. Если мы требуем, чтобы существовало взаимное соответствие между числами, с одной стороны, и точками на прямой линии — с другой, то неизбежно приходится ввести в рассмотрение иррациональные числа.

Подводя итоги до сих пор сказанному, мы констатируем, что иррациональное число обозначает длину отрезка, несоизмеримого с единицей. В следующих разделах мы должны будем уточнить это несколько смутное и всецело геометрическое определение и в результате придем к определению, более удовлетворительному с точки зрения логической строгости. Рассматривая этот вопрос, мы будем вначале исходить из десятичных дробей.

Упражнения. 1) Докажите, что числа #2, л/3, л/5, #3 иррациональные. (Указание: воспользуйтесь леммой на стр. 71.)

2) Докажите, что числа у/2 + у/Ъ и у/2 + у/2 иррациональные. (Указание: если бы, например, первое из этих чисел было рациональным числом г, то, написав у/3 = г — у/2 и возведя в квадрат, мы заключили бы, что у/2 есть рациональное число.)

3) Докажите, что число у/2 + y/3 + у/Ъ иррациональное. Попробуйте придумать еще подобные и более общие примеры.

2. Десятичные дроби: конечные и бесконечные. Чтобы покрыть числовую ось везде плотным множеством точек, нет необходимости использовать всю совокупность рациональных чисел: достаточно, например, ограничиться только теми числами, которые возникают при подразделении единичного отрезка на 10, потом на 100, 1000 и т.д. равных частей. Получающиеся при этом точки деления соответствуют «десятичным дробям». Так, числу 0,12 = — + j^q соответствует точка, расположенная в первом единичном интервале, во втором «подынтервале» длины 10"1, и именно она есть начальная точка третьего «подподынтервала» длины 10~2

Если такого рода десятичная дробь содержит п знаков после запятой, то она имеет вид

где z — целое число, а коэффициенты а — цифры 0, 1, 2, ..., 9, обозначающие число десятых, сотых и т. д. Сокращенно число / записывается в десятичной системе следующим образом: z,a\a2a3.. .ап. Мы убеждаемся непосредственно, что такого рода десятичные дроби могут представлены виде обыкновенных дробей —, где q = 10"; так, например,

Если окажется, что р и q имеют общий множитель, то дробь можно сократить, и тогда знаменатель будет некоторым делителем числа 10". С другой стороны, несократимая дробь, у которой знаменатель не есть делитель некоторой степени 10, не может быть представлена в виде десятичной дроби указанного типа. Например, ^ = Jq= ^ = jj^q = 0,004; но ^ не может быть написана как десятичная дробь с конечным числом п десятичных знаков, как бы ни было велико п: в самом деле, из равенства вида

следовало бы

а последнее равенство невозможно, так как 3 не входит множителем ни в какую степень числа 10.

Возьмем теперь на числовой оси какую-нибудь точку Р, которая не соответствует никакой конечной десятичной дроби; можно, например, взять рациональную точку ^- или иррациональную точку \/2. Тогда в процессе последовательного подразделения единичного интервала на 10 равных частей точка Р никогда не окажется в числе точек деления: она будет находиться внутри десятичных интервалов, длина которых будет неограниченно уменьшаться; концы этих интервалов соответствуют конечным десятичным дробям и приближают точку Р с какой угодно степенью точности. Рассмотрим несколько подробнее этот процесс приближения.

Предположим, что точка Р лежит в первом единичном интервале. Сделаем подразделение этого интервала на 10 равных частей, каждая длины Ю-1, и предположим, что точка Р попадает, скажем, в третий из этих интервалов. На этой стадии мы можем утверждать, что Р заключена между десятичными дробями 0,2 и 0,3. Подразделяем снова интервал от 0,2 до 0,3 на 10 равных частей, каждая длины Ю-2, и обнаружим, что Р попадает, допустим, в четвертый из этих интервалов. Подразделяя его, как раньше, видим, что точка Р попадает в первый интервал длины 10~3. Теперь можно сказать, что точка Р заключена между 0,230 и 0,231. Этот процесс может быть продолжен до бесконечности и приводит к бесконечной последовательности цифр ai, а2, а3, ..., а„, ..., обладающей таким свойством: каково бы ни было п, точка Р заключена в интервале /„, у которого начальная точка есть 0,а\а2а3.. . a„_ia„, а конечная— 0,а|Я2Яз • • .ап-\{ап + 1), причем длина /„ равна 10"". Если станем полагать по порядку п = 1,2, 3, 4, то увидим, что каждый из интервалов /|, /2, /з, ... содержится в предыдущем, причем их длины Ю-1, 10~2, 10~3, ... неограниченно уменьшаются. Мы скажем, более кратко, что точка Р заключена в стягивающуюся последовательность десятичных интервалов. Например,

если точка Р есть —, то все цифры ai, a2, a3, ... равны 3, и Р заключена в любом интервале 1п от 0,333... 33 до 0,333... 34, т. е. ^ больше чем 0,333... 33 и меньше чем 0,333... 34, сколько бы ни взять цифр после запятой. Мы скажем в этих обстоятельствах, что я-значная десятичная дробь 0,333...33 «стремится к ^-», когда число цифр п неограниченно возрастает. И мы условимся писать

причем точки обозначают, что десятичная дробь может быть продлена «до бесконечности».

Иррациональная точка \/2, которая была рассмотрена в пункте 1, также приводит к бесконечной десятичной дроби. Но закон, которому подчиняются последовательные цифры десятичного разложения, на этот раз далеко не очевиден. Мы затрудняемся указать формулу, которая давала бы цифру, стоящую на п-м месте, хотя можно вычислить столько цифр, сколько мы пожелали бы себе заранее назначить:

В качестве общего определения мы скажем, что точка Р, которая не может быть представлена в виде десятичной дроби с конечным числом десятичных знаков, представляется в виде бесконечной десятичной дроби 2,aia2a3..., если, каково бы ни было я, точка Р лежит в интервале длины 10~л с начальной точкой z,a\a2az.. .ап.

Таким образом, мы устанавливаем соответствие между всеми точками числовой оси и всеми (конечными или бесконечными) десятичными дробями. Теперь мы попытаемся ввести предварительное определение: «число» есть конечная или бесконечная десятичная дробь. Те бесконечные десятичные дроби, которые не представляют рационального числа, называются иррациональными числами. До середины XIX столетия соображения, подобные приведенным выше, казались достаточными для объяснения того, как устроена система рациональных и иррациональных чисел — числовой континуум. Необычайные успехи математики, достигнутые начиная с XVII столетия, в частности, развитие аналитической геометрии и дифференциального и интегрального исчислений, твердо базировались

именно на таком представлении о системе чисел. Однако в период критического пересмотра принципов и консолидации результатов стало ощущаться все более и более явственно, что понятие иррационального числа должно быть подвергнуто более точному и глубокому анализу. Но, прежде чем перейти к очерку современной теории числового континуума, нам придется рассмотреть и разобрать — на более или менее интуитивной основе — одно из математических понятий капитальной значимости — понятие предела.

Упражнение. Вычислите приближенно \/2 w \/Ъ с ошибкой, не превышающей ю-2.

3. Пределы. Бесконечные геометрические прогрессии. Как мы видели в предыдущем пункте, иногда случается, что некоторое рациональное число s приближается последовательностью других рациональных чисел sn, причем индекс п принимает последовательно все значения 1, 2, 3, ... Так, например, можно взять: s = ^, тогда S\ = 0,3, s2 = 0,33, s3 = 0,333 и т. д. Вот еще пример. Разобьем единичный интервал на две равные части, вторую половину — снова на две равные части, вторую из полученных двух частей — снова на две равные части и т. д., пока наименьший из полученных таким образом интервалов не станет равным 2~п, где п — сколь угодно большое наперед заданное число, например, п = 100, п = 100000 и т.д. Затем, складывая вместе все интервалы, кроме самого последнего, мы получаем общую длину

(3)

Легко понять, что sn отличается от 1 на ^J и что эта разность становится сколь угодно малой, или «стремится к нулю», при неограниченном возрастании п. Говорить, что эта разность равна нулю, когда п равно «бесконечности», не имеет никакого смысла. Бесконечное в математике связывается с некоторым процессом, не имеющим конца, и никогда не связывается с актуальной величиной. Желая описать поведение sn, мы говорим, что сумма sn стремится к пределу 1, когда п стремится к бесконечности, и пишем

(4)

причем то, что возникает справа, есть бесконечный ряд. Последнее «равенство» не следует понимать в том смысле, что имеется в виду сложить вместе бесконечное число слагаемых: это только сокращенная запись того факта, что 1 есть предел конечных сумм sn, получающийся, когда п стремится к бесконечности (и ни в коем случае не равно бесконечности). Итак, равенство (4), заканчивающееся неопределенным символом

«+...», как бы стенографирует некоторую точную мысль, выражаемую, по неизбежности, длинным рядом слов:

«1 равна пределу (при п, стремящемся к бесконечности) выражения

(5)

Еще более кратко и более выразительно пишут следующим образом:

(6)

Говоря о пределах, рассмотрим еще пример. Пусть перед нами имеется бесконечная последовательность различных степеней числа q:

Если -1 < q < 1, например, то qn стремится к нулю при неограниченном возрастании п. При этом если q — отрицательное число, то знаки qn чередуются: за + следует -, и обратно; таким образом, qn стремится к нулю «с двух сторон». Так, если

но если

Мы утверждаем, что предел qn, когда п стремится к бесконечности, равен нулю, или, символически,

(7)

(Между прочим, если q > 1 или q < — 1, то qn уже не стремится к нулю, а неограниченно возрастает по абсолютной величине.)

Приведем строгое доказательство утверждения (7). Мы видели на стр. 40, что при любом целом положительном значении п и при условии р > — 1 имеет место неравенство ( 1 + р)п ^ 1 -h пр. Пусть q — какое-то положительное число, меньшее единицы, например, q — yjj. Тогда можно положить

Отсюда следует

или же (см. определение (4) на стр. 80)

Значит, qn заключено между постоянным числом 0 и числом — • —, которое стремится к нулю при неограниченном возрастании п (так как р — постоянное). После этого ясно, что qn —> 0. Если q — отрицательное число, то мы

положим q = — --, и тогда qn будет заключено между числами — и — • —; рассуждение заканчивается так же, как раньше. Рассмотрим теперь геометрическую прогрессию

(8)

(Частный случай q = ^ был рассмотрен выше.) Как уже было показано (см. стр. 38), сумма sn может быть представлена в более простой и сжатой форме. Умножая sn на q, мы получаем

(8а)

и, вычитая (8а) из (8), убеждаемся, что все члены, кроме 1 и qn+\ взаимно уничтожаются. В результате будем иметь

или же, деля на 1 — q.

С понятием предела мы встретимся, если заставим п неограниченно возрастать. Мы видели только что, что qn+l = q • qn стремится к нулю, если -1 < q < 1, и отсюда можем заключить:

(9)

Тот же результат можно записать, пользуясь бесконечным рядом

(10)

Например,

в полном соответствии с равенством (4); подобным же образом

или, иначе, 0,9999...= 1. Совершенно так же конечная дробь 0,2374 и бесконечная дробь 0,23739999... представляют одно и то же число.

В главе VI мы вернемся к общему обсуждению понятия предела, рассматривая вопрос с современной, логически более строгой точки зрения.

Упражнения. 1) Докажите, что

2) Каков предел последовательности ai, а2, аз. где ап = ——г? (Указаri 1 л + I ние: напишите данное выражение - — j в виде 1 — и обратите внимание на то, что вычитаемое стремится к нулю.)

3) Каков предел

при п —> оо? (Указание: напишите это выражение в виде

4) Предполагая q по абсолютной величине меньшим чем 1, докажите, что

(Указание: воспользуйтесь результатом

упражнения 3 на стр. 42.)

5) Каков предел бесконечного ряда

6) Вычислите пределы выражений

(Указание: воспользуйтесь результатами, полученными на стр. 37—39.)

4. Рациональные числа и периодические десятичные дроби. Такие рациональные числа которые не могут быть представлены в виде конечных десятичных дробей, разлагаются в бесконечные десятичные дроби посредством обыкновенного приема «длинного» деления. На каждой ступени этого процесса возникает остаток, не равный нулю, иначе дробь оказалась бы конечной. Различные возникающие остатки могут быть только целыми числами от 1 до q — 1, так что имеется всего q - 1 возможностей для значений этих остатков. Это значит, что после q делений некоторый остаток k появится во второй раз. Но тогда все следующие остатки также будут повторяться в том же порядке, в каком они уже появлялись после первого возникновения остатка k. Таким образом, десятичное разложение всякого рационального числа обладает свойством периодичности; после некоторого числа десятичных знаков одна и та же группа десятичных знаков начинает повторяться бесконечное число раз. Например,

и т. д. (Заметим по поводу

тех рациональных чисел, которые представляются в виде конечной десятичной дроби, что у этой конечной дроби можно вообразить после последнего ее десятичного знака бесконечно повторяющуюся цифру 0, и, таким образом, рассматриваемые рациональные числа не исключаются из данной

выше общей формулировки.) Из приведенных примеров видно, что у некоторых из десятичных разложений, соответствующих рациональным числам, периодическому «хвосту» предшествует непериодическая «голова».

Обратно, можно показать, что все периодические дроби представляют собой рациональные числа. Рассмотрим, например, бесконечную периодическую дробь

Можно написать:

Выражение в скобках есть бесконечная геометрическая прогрессия:

Значит,

В общем случае доказательство строится таким же образом, но затруднено необходимостью вводить несколько громоздкие обозначения. Рассмотрим периодическую дробь общего вида

Обозначим через В = 01Ь[Ь2Ь^ ...Ьп периодическую часть нашего разложения. Тогда можно написать

Выражение в скобках — бесконечная геометрическая прогрессия, для которой q= 10~п. Сумма этой прогрессии, согласно формуле (10) предыдущего пункта, равна -—р^Г, и потому

Упражнения. 1) Разложите в десятичные дроби следующие рациональные числа: —, у^, у^, у^, уу, уу, и определите периоды разложении.

*2) Число 142857 обладает тем свойством, что при умножении его на 2, 3, 4, 5 или 6 в нем совершаются только перестановки цифр. Объясните это свойство, исходя из разложения числа у в десятичную дробь.

3) Разложите числа, приведенные в упражнении 1, в бесконечные дроби с основаниями 5, 7 и 12.

4) Разложите число |- в двоичную дробь.

5) Напишите разложение 0,11212121... Установите, какое число оно представляет при основаниях 3 или 5.

5. Общее определение иррациональных чисел посредством стягивающихся отрезков. На стр. 88 мы ввели предварительное определение: «число» есть конечная или бесконечная десятичная дробь. Мы условились вместе с тем десятичные дроби, не представляющие рационального числа, называть иррациональными числами. На основе результатов, полученных в предыдущем пункте, мы можем теперь предложить следующую формулировку: «числовой континуум, или система действительных чисел («действительные» числа противопоставляются здесь «мнимым», или «комплексным», см. § 5), есть совокупность всевозможных бесконечных десятичных дробей». (Приписывая нули, можно, как уже было отмечено, конечную десятичную дробь написать в виде бесконечной, или есть другой способ: последнюю цифру дроби а заменить на а - 1 и к ней приписать бесчисленное множество девяток. Так, мы видели, например, что 0,999... = 1, — см. п. 3.)

Рациональные числа суть периодические дроби; иррациональные числа суть непериодические дроби. Но и такое определение не представляется вполне удовлетворительным: действительно, мы видели в главе I, что самой природой вещей десятичная система ничем особым не выделяется из других возможных; таким же образом можно было бы оперировать, например, двоичной системой. По этой причине является чрезвычайно желательным дать более общее определение числового континуума, независимое от специального выбора основания 10 или любого иного. Вероятно, простейший метод для введения такого обобщения заключается в следующем.

Рассмотрим на числовой оси некоторую последовательность Л, /2, /з, ...,/„,... отрезков с рациональными концами; предположим, что каждый следующий отрезок содержится в предыдущем и что длина п-го отрезка 1п стремится к нулю при неограниченном возрастании п. Такую последовательность «вложенных» друг в друга отрезков мы будем называть последовательностью стягивающихся отрезков. В случае десятичных отрезков длина 1п равна 10~\ но с таким же успехом она могла бы равняться, скажем, 2~\ или можно ограничиться хотя бы тем требованием, чтобы она была меньше —. Дадим теперь следующую формулировку, которую будем рассматривать как основной геометрический постулат: какова бы ни была последовательность стягивающихся отрезков, существует одна и только одна точка числовой оси, которая одновременно содержится во всех отрезках. (Совершенно ясно, что существует не более одной такой точки, так как длины отрезков стремятся к нулю, а две различные точки не могли бы содержаться в отрезке, длина которого была бы меньше, чем расстояние между точками.) Эта точка, по определению, и называется действительным числом; если она не является рациональ-

ной, то называется иррациональным числом. С помощью такого определения мы устанавливаем полное соответствие между точками и числами. Здесь не прибавлено ничего существенно нового: всего лишь определению числа как бесконечной десятичной дроби придана более общая форма.

Все же читателя в этом месте могут охватить известные сомнения, которые следует признать вполне обоснованными. Что же на самом деле представляет собой та «точка» на числовой оси, которая, как мы допускаем, содержится одновременно во всех стягивающихся отрезках последовательности в случае, если она не соответствует рациональному числу? Наш ответ таков: существование на числовой оси (рассматриваемой как геометрический образ) точки, содержащейся во всех стягивающихся отрезках с рациональными концами, есть основной геометрический постулат. Нет надобности делать редукцию, приводя его к иным математическим предложениям. Мы принимаем его, как принимаем в математике другие аксиомы или постулаты, основываясь на его интуитивной правдоподобности и на его полезности, обнаруживающейся при построении логически последовательной системы математических предложений. Чисто формально мы могли бы исходить из числовой прямой, которую мыслили бы как совокупность одних только рациональных точек, и затем определили бы иррациональную точку как символ, обозначающий некоторую последовательность стягивающихся отрезков. Иррациональная

Рис. 11. Стягивающиеся отрезки. Пределы последовательностей

точка полностью определяется последовательностью стягивающихся рациональных отрезков, длины которых стремятся к нулю. Значит, наш основной постулат на самом деле способен служить определением. Принять такое определение, после того как мы были приведены к последовательности стягивающихся отрезков интуитивным ощущением, утверждающим «существование» иррациональной точки, — значит отбросить «костыли интуиции», на которые опиралось наше рассуждение, и осознать, что все математические свойства иррациональных точек могут быть понимаемы и представляемы как свойства последовательностей стягивающихся отрезков.

С чисто математической точки зрения в данном случае важно то обстоятельство, что, приняв определение иррационального числа как последовательности стягивающихся отрезков, мы приобретаем возможность дать определения сложения, умножения и т.д., а также отношений неравенства, являющихся непосредственным обобщением соответствующих определений в поле рациональных чисел, и притом с сохранением всех основных законов, действующих в поле рациональных чисел. Так, например, чтобы определить сумму двух иррациональных чисел а и ß исходя из двух последовательностей стягивающихся отрезков, определяющих числа аир, построим новую последовательность стягивающихся отрезков, складывая соответственно начальные и конечные точки отрезков, входящих в состав данных последовательностей. То же можно сделать с произведением aß, разностью a - ß и частным a/ß. И можно показать на основе этих определений, что арифметические законы, рассмотренные в § 1 этой главы, при переходе к иррациональным числам не нарушаются. Подробности, сюда относящиеся, мы опускаем.

Проверка всех этих законов проста и производится непосредственно без особых затруднений, но могла бы показаться несколько скучноватой начинающему читателю, который, естественно, интересуется скорее тем, что можно сделать с помощью математики, чем анализом ее логических основ. Нередко случается, что новейшие учебники математики отталкивают читателя именно тем, что с первых же страниц дают педантическое обоснование системы действительных чисел. Читатель, спокойно игнорирующий эти страницы, пусть успокоит свою совесть сознанием того факта, что вплоть до конца XIX столетия все великие математики делали свои открытия на основе «наивной» концепции числового континуума, доставляемой непосредственно интуицией.

Наконец, с физической точки зрения, определение иррационального числа посредством последовательности стягивающихся отрезков естественно уподобляется определению числового значения некоторой доступной наблюдению величины — путем ряда измерений, производимых последовательно со все возрастающей точностью. Всякая операция, со-

вершаемая, скажем, с целью определения длины некоторого отрезка, практически осмыслена лишь в пределах некоторой возможной погрешности, величину которой определяет точность инструмента. Так как рациональные числа расположены на прямой всюду плотно, то никакая физическая операция, как бы точна она ни была, не позволит различить, является ли данная длина рациональной или же иррациональной. Таким образом, могло бы показаться, что в иррациональных числах нет никакой необходимости для адекватного описания физических явлений. Но, как мы увидим в главе VI, при математическом описании физических явлений истинное преимущество, приобретаемое посредством привлечения иррациональных чисел, заключается в чрезвычайном упрощении этого описания — именно благодаря свободному использованию понятия предела, основой которого является числовой континуум.

*6. Иные методы определения иррациональных чисел. Дедекиндовы сечения. Несколько иной путь для определения иррациональных чисел был избран Рихардом Дедекиндом (1831-1916), одним из самых выдающихся основоположников логического и философского анализа основ математики. Его статьи — «Stetigkeit und irrationale Zahlen»1 (1872) и «Was sind und was sollen die Zahlen?»2 (1887) —оказали глубокое влияние на исследование основных принципов математики. Дедекинд предпочитал общие абстрактные концепции конкретным построениям вроде последовательностей стягивающихся отрезков. Его процедура базируется на идее «сечения»; мы сейчас опишем, что это такое.

Предположим, что каким-то способом удалось разбить совокупность всех рациональных чисел на два класса А и В таким образом, что всякое число b класса В больше, чем всякое число а класса А. Всякое разбиение такого рода называется сечением в области рациональных чисел. Если произведено сечение, то должна осуществиться одна из следующих трех логически мыслимых возможностей.

1) Существует наибольший элемент а* в классе А. Такое положение вещей имеет место, например, в том случае, если к классу А отнесены все рациональные числа ^ 1, к классу В — все рациональные числа > 1.

2) Существует наименьший элемент Ь* в классе В. Это происходит, например, в том случае, если к классу А отнесены все рациональные числа < 1, к классу В — все рациональные числа ^ 1.

3) Нет ни наибольшего элемента в классе Л, ни наименьшего в классе В. Сечение этого рода получится, например, в том случае, если к классу А отнесены все рациональные числа, квадрат которых меньше чем 2, а к классу В — все рациональные числа, квадрат которых больше

1 «Непрерывность и иррациональные числа». — Прим. ред.

2 «Что такое числа и чем они должны быть?» — Прим. ред.

чем 2. Классами А и В исчерпываются все рациональные числа, так как было показано, что такого рационального числа, квадрат которого равен 2, не существует.

Такой случай, когда в классе А есть наибольший элемент а* и вместе с тем в классе В — наименьший элемент Ь*, логически немыслим, так как

а* + Ь* .

тогда рациональное число —-—, заключенное как раз между а и о , было бы больше, чем наибольший элемент в Л, и меньше, чем наименьший элемент в ß, и, значит, не могло бы принадлежать ни к Л, ни к В.

В третьем случае, когда нет ни наибольшего рационального числа в классе Л, ни наименьшего в классе ß, тогда, по Дедекинду, сечение определяет, или, лучше, представляет собой, некоторое иррациональное число. Не составит труда проверить, что определение Дедекинда согласуется с определением, в основе которого находятся вложенные отрезки: из всякой последовательности вложенных отрезков /ь /2, /з, .. • мы получаем сечение, если отнесем к классу А все те рациональные числа, которые меньше, чем левый конец хотя бы одного интервала /„, к классу В — все прочие рациональные числа.

В философском отношении определение иррациональных чисел по Дедекинду находится на более высоком уровне абстракции, так как оно не ограничивает ни в чем того математического закона, который определяет классы А и В. Другой, более конкретный метод для определения континуума действительных чисел принадлежит Георгу Кантору (1845—1918). На первый взгляд резко отличный как от метода вложенных отрезков, так и от метода сечений, он, однако, эквивалентен любому из них в том смысле, что числовой континуум, получающийся на основе всех трех методов, обладает одними и теми же свойствами. Идея Кантора базируется на тех обстоятельствах, что 1) действительные числа можно трактовать как бесконечные десятичные дроби, 2) бесконечные десятичные дроби можно рассматривать как пределы конечных десятичных дробей. Чтобы не связывать себя зависимостью от десятичных дробей, мы, следуя Кантору, принимаем, что всякая «сходящаяся» последовательность рациональных чисел а\, а2, аз. ••• определяет действительное число. При этом «сходимость» понимается в том смысле, что разность (ат - ап) между двумя членами последовательности стремится к нулю, если тип одновременно и независимо друг от друга неограниченно возрастают. (Как раз последовательные десятичные приближения обладают этим свойством: любые два из них после я-го отличаются меньше чем на 10_л.) Так как одно и то же действительное число по методу Кантора может быть определяемо самыми разнообразными последовательностями рациональных чисел, то приходится добавить, что две последовательности ai, аг, аз, ... и Ь\,02,Ьз,... определяют одно и то же действительное число, если разность ап — Ьп стремится к нулю при неограниченном возрастании п. Идя по пути, намеченному Кантором, нетрудно определить сложение и т. д.

§ 3. Замечания из области аналитической геометрии1

1. Основной принцип. Уже начиная с XVII в. числовой континуум, принимаемый как нечто само собой разумеющееся или же подвергаемый более или менее поверхностному критическому анализу, стал основой математики, в частности, аналитической геометрии и дифференциального и интегрального исчислений.

Введение числового континуума дает возможность сопоставить каждому отрезку прямой в качестве его «длины» некоторое определенное действительное число. Но можно пойти и дальше. Не только длина, но и всякий вообще геометрический объект, всякая геометрическая операция могут найти свое место в царстве чисел. Решительные шаги в направлении арифметизации геометрии был сделаны не позднее 1629 г. Ферма (1601 — 1665) и в 1637 г. Декартом (1596-1650). Основная идея аналитической геометрии заключается в использовании «координат»— чисел, связанных (координированных) с данным геометрическим объектом и полностью этот объект характеризующих. Большинству читателей известны так называемые прямоугольные, или декартовы, координаты, служащие для того, чтобы фиксировать положение произвольной точки на плоскости. Мы исходим из двух неподвижных взаимно перпендикулярных прямых на плоскости, «оси х» и «оси у», и к ним относим каждую точку. Эти оси рассматриваются как ориентированные числовые прямые, причем измерение совершается с помощью одного и того же единичного отрезка. Каждой точке Р (рис. 12) сопоставлены две координаты х и у. Они получаются следующим образом. Рассмотрим ориентированный отрезок (вектор), идущий из «начала» О в точку Р, и затем спроектируем ортогонально этот вектор на обе оси, получая ориентированный отрезок ОР' на оси х и такой же отрезок OQ' на оси у. Два числа х и у, измеряющие соответственно ориентированную длину отрезков OF и OQ\ называются координатами точки Р. Обратно, если х и у — два произвольных наперед заданных числа, то соответствующая точка Р определяется однозначно. Если числа х и у оба положительные, то Р попадает в первый квадрант координатной системы (рис. 13); если оба отрицательные, то в

Рис. 12. Прямоугольные координаты точки

1 Читателю, не вполне освоившемуся с предметом этого параграфа, рекомендуется обратиться к упражнениям, которые помещены в приложении в конце книги, стр. 519 и дальше.

третий; если х положительно, а у отрицательно, то в четвертый, и, наконец, если X отрицательно, а у положительно, то во второй.

Расстояние между точкой Р{ с координатами х]у ух и точкой Р2 с координатами х2у у2 дается формулой

(1)

Это немедленно следует из пифагоровой теоремы (рис. 14).

2. Уравнения прямых и кривых линий. Если С есть неподвижная точка с координатами х = а, у = Ь, то геометрическое место всех точек Р, находящихся от точки С на данном расстоянии г, есть окружность с центром С и радиусом г. Из формулы для расстояния между двумя точками (1) следует, что точки этой окружности имеют координаты x, г/, удовлетворяющие уравнению

(х-а)2 + (у-Ь)2 = ^. (2)

Это уравнение называется уравнением окружности, так как оно выражает полное (необходимое и достаточное) условие того, что точка Р с координатами х} у лежит на окружности с центром С и радиусом г. Если скобки раскрыть, уравнение принимает вид

(3)

где k = г2 — а2 — Ь2. Обратно, если задано уравнение вида (3), причем а, b и k — произвольные постоянные и сумма k + а2 + Ь2 положительна, то с

Рис. 13. Четыре квадранта

Рис. 14. Расстояние между двумя точками

Рис. 15. Окружность

помощью алгебраической процедуры «дополнения до квадрата» мы можем написать то же уравнение в форме

где г2 = k + a2 + b2. И тогда ясно, что уравнение (3) определяет окружность радиуса г, центр которой — в точке С с координатами а, Ь.

Уравнение прямой линий еще проще по своей форме. Так, например, уравнение оси х имеет вид у = О, так как координата у равна нулю для всех точек этой оси и ни для каких иных точек. Точно так же ось у имеет уравнение х = 0. Прямые, проходящие через начало и делящие пополам углы между осями, имеют уравнения х = у и х = —у. Легко показать, что всякая прямая линия имеет уравнение вида

ах + Ьу = с, (4)

где а, Ь, с — постоянные, характеризующие эту прямую. Как и в других случаях, смысл уравнения (4) тот, что пары действительных чисел х и у, удовлетворяющих этому уравнению, являются координатами некоторой точки на прямой, и обратно.

Может быть, читатель учил в школе, что уравнение вида

(5)

представляет эллипс (рис. 16). Эта кривая пересекает ось х в точках А(р, 0) и А'(-р, 0) и ось у в точках ß(0, q) и ß'(0, -q). (Обозначение P(x, у) или, еще короче, (*, у), вводится ради краткости и должно

Рис. 16. Эллипс с фокусами

быть расшифровано так: «точка Р с координатами х и у».) Если р > q, то отрезок АА' длины 2р называется большой осью эллипса, а отрезок ВВ' длины 2q — его малой осью. Эллипс есть геометрическое место точек Р, сумма расстояний которых от точек F(y/p2 — q2, 0) и F'(—\Jp2 — q2, 0) равна 2р. Читатель сможет проверить это в качестве упражнения, применяя формулу (1). Точки F w F называются фокусами эллипса, а отношение е = — называется его эксцентриситетом.

Уравнение вида

(6)

представляет гиперболу. Эта кривая состоит из двух ветвей, пересекающих ось X соответственно в точках А(р, 0) и А'(—р, 0) (рис. 17). Отрезок АА' длины 2р называется «действительной» осью гиперболы. Гипербола, удаляясь в бесконечность, приближается к двум прямым qx± ру = 0, но так с ними и не пересекается; эти прямые называются асимптотами гиперболы. Гипербола есть геометрическое место точек Р, разность расстояний которых до двух точек F(y/p2 + q2, 0) и F\—\Jp2 + q2, 0) по абсолютной величине равна 2р. Эти точки в случае гиперболы тоже называются фокусами; под эксцентриситетом гиперболы понимают отношение е =

Рис. 17. Гипербола с фокусами

Уравнение

(7)

также определяет гиперболу, но такую, для которой асимптотами являются две оси (рис. 18). Уравнение этой «равносторонней» гиперболы геометрически означает, что площадь прямоугольника OP'PQ' (см. рис. 12), связанного с точкой Р, для всякой точки Р кривой равна 1. Равносторонняя гипербола несколько более общего вида

(7а)

где с — постоянная, представляет собой частный случай гиперболы в том же смысле, в каком окружность представляет собой частный случай эллипса. Отличительная характеристика равносторонней гиперболы заключается в том, что ее две асимптоты (в нашем случае — две оси) взаимно перпендикулярны.

Во всем этом для нас самым интересным является руководящая идея: геометрические объекты могут полностью описываться в арифметической или алгебраической форме. То же справедливо и относительно геометрических операций. Например, если нам требуется найти точки пересечения

Рис. 18. Равносторонняя гипербола. Площадь прямоугольника, определенного точкой Р(х, у), равна 1

двух прямых, то мы рассматриваем два их уравнения

(8)

и для нахождения общей точки этих двух прямых достаточно решить систему (8); решение дает нам координаты искомой точки. Таким же образом точки пересечения двух произвольных кривых (скажем, окружности х2 + у2 — 2ах — 2Ьу = k и прямой ах + by = с) находятся посредством совместного решения их уравнений.

§ 4. Математический анализ бесконечного

1. Основные понятия. Последовательность натуральных чисел

1, 2, 3, ...

представляет собой первый и самый важный пример бесконечного множества. Не нужно видеть ничего таинственного в том, что она — бесконечная, что у нее «нет конца»: как бы велико ни было натуральное число я, можно построить другое, следующее за ним число, еще большее — п+ 1. Но при переходе от прилагательного «бесконечный», означающего просто-напросто «не имеющий конца», к существительному «бесконечность» никоим образом не следует привносить допущения, что «бесконечность», обыкновенно изображаемая особым символом оо, может быть рассматриваема как обыкновенное число. Нельзя включить символ оо в числовую систему действительных чисел, не нарушая при этом основных законов арифметики. И тем не менее идея бесконечности пронизывает всю математику, так как математические объекты изучаются обыкновенно не как индивидуумы — каждый в отдельности, а как члены классов или совокупностей, содержащих бесчисленное множество элементов одного и того же типа; таковы совокупности натуральных чисел, действительных чисел или же треугольников на плоскости. Именно по этой причине возникает необходимость в точном математическом анализе бесконечного. Современная теория множеств, созданная Георгом Кантором и его школой в конце XIX столетия, приступив к разрешению этой задачи, достигла значительных успехов. Канторова теория множеств глубоко проникла во многие области математики и оказала на них огромное влияние; она стала играть особо выдающуюся роль в исследованиях, связанных с логическим и философским обоснованием математики. Исходным в канторовой теории является общее понятие совокупности или множества. При этом имеется в виду собрание объектов (элементов), которое определяется некоторым правилом, позволяющим с полной определенностью судить о том, входит ли данный объект в число элементов собрания или не входит. Примерами

могут служить множество всех натуральных чисел, множество всех периодических десятичных дробей, множество всех действительных чисел или множество всех прямых в трехмерном пространстве.

Для того чтобы сравнивать множества с точки зрения «количества» содержащихся в них элементов, нужно ввести основное в этой теории понятие «эквивалентности» множеств. Если элементы двух множеств А и В могут быть приведены в попарное соответствие такого рода, что каждому элементу множества А сопоставлен один и только один элемент множества В, а каждому элементу множества В сопоставлен один и только один элемент множества А, то установленное таким образом соответствие называется взаимно однозначным, а о самих множествах А и ß тогда говорят, что они между собой эквивалентны. Понятие эквивалентности в случае конечных множеств совпадает с обыкновенным понятием числового равенства, так как два конечных множества в том и только том случае могут быть приведены во взаимно однозначное соответствие, если содержат одно и то же число элементов. На этом и основывается, нужно заметить, идея счета: когда мы «считаем» элементы множества, то процесс счета как раз и заключается в установлении взаимно однозначного соответствия между элементами множества и числами 1, 2, п.

Чтобы установить эквивалентность двух конечных множеств, иногда нет необходимости «считать» элементы. Так, например, не считая, можно утверждать, что конечное множество кругов единичного радиуса эквивалентно множеству их центров.

Перенося понятие эквивалентности на бесконечные множества, Кантор имел в виду создать «арифметику» бесконечного. Множество действительных чисел и множество точек на прямой линии эквивалентны, так как после того, как выбраны начало и единичный отрезок, данная прямая становится «числовой прямой», и каждой ее точке Р в качестве координаты взаимно однозначно сопоставляется некоторое совершенно определенное действительное число х:

Р^х.

Четные числа образуют правильное подмножество множества всех натуральных чисел, а все целые числа образуют правильное подмножество множества всех рациональных чисел. (Говоря о «правильном» подмножестве некоторого множества S, мы имеем в виду множество S', состоящее из элементов множества S, но не из всех его элементов.) Совершенно ясно, что если данное множество конечно, т. е. содержит какое-то число п элементов и не более того, то оно не может быть эквивалентно никакому своему правильному подмножеству, так как всякое правильное его подмножество содержало бы самое большее п — 1 элемент. Но если данное множество содержит бесконечное число элементов, то, как

это ни парадоксально, оно может быть эквивалентно некоторому своему правильному подмножеству. Например, схема

устанавливает взаимно однозначное соответствие между множеством натуральных чисел и множеством всех четных целых положительных чисел, и эти два множества оказываются эквивалентными, хотя второе есть правильное подмножество первого. Такое противоречие с ходячей истиной «целое больше своей части» показывает, какие сюрпризы нас ждут в области «арифметики бесконечного».

2. Счетность множества рациональных чисел и несчетность континуума. Одно из первых открытий Кантора в области анализа бесконечного заключалось в том, что множество рациональных чисел (содержащее в качестве правильного подмножества бесконечное множество натуральных чисел и потому само бесконечное) эквивалентно множеству натуральных чисел. На первый взгляд кажется странным, что всюду плотное множество рациональных чисел не более богато элементами, чем множество натуральных чисел, элементы которого «рассеяны» редко и стоят на значительном расстоянии один от другого. И в самом деле, с сохранением порядка возрастания нельзя расположить положительные рациональные числа так, как это можно сделать с натуральными: самое маленькое число а будет первым, следующее за ним по величине b вторым, и т.д.; дело в том, что рациональные числа расположены везде плотно, и потому ни для одного из них нельзя указать «следующего по величине». Но Кантор заметил, что если отказаться от требования «располагать по величине», то тогда оказывается возможным расставить все рациональные числа в ряд Г|, г2, г3, г4, ..., подобный ряду натуральных чисел. Такое расположение предметов некоторого множества в виде последовательности часто называют пересчетом («нумерацией») этого множества. Множества, для которых пересчет может быть выполнен, называются счетными или исчислимыми. Указывая один из способов пересчета множества рациональных чисел и устанавливая, таким образом, его счетность, Кантор тем самым показал, что это множество эквивалентно множеству натуральных чисел, так как схема

создает взаимно однозначное соответствие между двумя множествами. Мы опишем сейчас один из возможных способов пересчета множества рациональных чисел.

Каждое рациональное число записывается в виде —, где а и b — целые числа; все эти числа могут быть расположены в виде таблицы, где число % стоит в а-м столбце и в Ь-й строчке. Например, — станет в третьем столбце и в четвертой строчке таблицы. Предположим, что все свободные места, или «клеточки», в таблице заполнены соответствующими числами, а затем проведем по таблице непрерывную ломаную линию, которая пройдет через все клеточки. Начиная с 1, мы сделаем сначала один шаг вправо и получим 2 в качестве второго члена последовательности; затем по диагонали налево и вниз — получим третий член —; следующий шаг прямо вниз даст нам четвертый член -г-; потом движемся по диагонали вправо и вверх через — к 3; вправо — к 4; по диагонали влево и вниз через

и т.д., как показано на рис. 19. В результате движение по ломаной лини* приводит к последовательности рациональных чисел

Если мы выбросим теперь все дроби, у которых числитель и знаменатель имеют отличные от 1 общие делители, то останется последовательность, в которой каждое рациональное число встретится в точности один раз:

Так устанавливается, что множество всех рациональных чисел является счетным. Принимая во внимание, что рациональные числа взаимно однозначно связаны с рациональными точками числовой прямой, можно также сказать, что множество рациональных точек на числовой прямой счетно.

Рис. 19. Пересчет рациональных чисел

Упражнения. 1) Покажите, что множество всех целых, положительных и отрицательных, чисел счетно. Покажите, что множество всех рациональных, положительных и отрицательных, чисел счетно.

2) Покажите, что если S и Т — счетные множества, то множество 5 + Т (см. стр. 137) — также счетно. То же покажите для суммы трех, четырех и, вообще, п множеств; покажите, наконец, что множество, составленное посредством сложения счетного множества счетных множеств, также счетно.

Раз оказалось, что множество рациональных чисел счетно, то могло бы возникнуть подозрение, что и всякое бесконечное множество также счетно, и на этом, естественно, закончился бы весь анализ бесконечного. Но это совсем не так. Тому же Кантору принадлежит открытие исключительной важности: множество всех действительных (рациональных и иррациональных) чисел несчетно. Другими словами, совокупность всех действительных чисел совершенно иного (так сказать более высокого) «типа бесконечности», чем совокупность одних только целых или одних только рациональных чисел. Принадлежащее Кантору остроумное «косвенное» доказательство этого факта стало моделью для многих иных доказательств в математике. Идея рассуждения такова. Мы исходим из допущения, что все действительные числа удалось перенумеровать, располагая их в виде последовательности, и после этого демонстрируем число, которое никак не может быть числом этой последовательности. Отсюда возникает противоречие: ведь было предположено, что все действительные числа вошли в состав последовательности, и это предположение должно быть признано ложным, если хотя бы одно число оказывается за пределами последовательности. Таким образом обнаруживается несостоятельность утверждения, что все действительные числа поддаются «пересчету», и ничего другого не остается, как только признать вместе с Кантором, что множество действительных чисел несчетно.

Однако проведем это рассуждение фактически. Допустим, что все действительные числа, представленные в виде бесконечных десятичных дробей, расположены в порядке последовательности, или списка:

где буквы Ni обозначают целую часть, а буквы а, 6, с, ... представляют собой десятичные знаки, стоящие вправо от запятой. Мы допускаем, что эта последовательность дробей охватывает все действительные числа. Существенной частью доказательства является построение с помощью «диагональной процедуры» такого нового числа, относительно которого можно показать, что оно не входит в наш список.

Построим такое число. Для этого возьмем первую цифру после запятой а, какую угодно, но отличную от ah a также от 0 и 9 (последнее — чтобы избежать затруднений, возникающих из равенств вроде следующего: 0,999- •• = 1,000...); затем вторую цифру b возьмем отличной от b2> а также от 0 и 9; третью цифру с — отличной от с3 и т. д. (Для большей определенности можно условиться в следующем: мы берем а = 1, если только а\ j=> 1, а в случае а{ = 1 возьмем а = 2; и аналогично для всех прочих цифр Ь, с, d, е, ...) Теперь рассмотрим число

z = 0,abcde...

Это новое число z наверняка не входит в наш список; действительно, оно не равно первому числу, стоящему в списке, так как от него отличается первой цифрой после запятой, оно не равно второму числу, так как от него отличается второй цифрой после запятой, и вообще отлично от п-го числа по списку, так как от него отличается п-и цифрой после запятой. Итак, в нашем списке, составленном будто бы из всех действительных чисел, нет числа z. Значит, множество всех действительных чисел несчетно.

Читателю может прийти в голову мысль, что несчетность континуума обусловливается неограниченной протяженностью прямой линии и что конечный отрезок прямой будет содержать лишь счетное множество точек. Чтобы убедиться в ложности такого предположения, достаточно установить, что весь числовой континуум в целом эквивалентен некоторому конечному интервалу, скажем, единичному интервалу от 0 до 1. Получить необходимое для этой цели взаимно однозначное соответствие можно, например, сгибая интервал в точках ^ и |- и затем проектируя так, как показано на рис. 20. Отсюда видно, что даже конечный интервал (и, конечно, отрезок) содержит несчетное множество точек.

Упражнение. Покажите, что любой отрезок [Л, В] числовой прямой эквивалентен любому другому отрезку [С, D] (рис. 21).

Стоит привести еще другое доказательство несчетности континуума, носящее, пожалуй, более интуитивный характер. Достаточно (принимая

Рис. 20. Взаимно однозначное соответствие между точками согнутого интервала и точками прямой линии

во внимание последнее доказанное предложение) сосредоточить внимание на точках единичного отрезка от 0 до 1. Доказательство, впрочем, как и раньше, будет «косвенное». Предположим, что множество всех точек названного отрезка может быть расположено в виде последовательности

а,, а2, а3, ... (1)

Покроем точку а\ интервалом, длина которого пусть будет равна у^, точку а2 — интервалом длины jig и т-Д- Если бы все точки единичного отрезка входили в последовательность (1), то весь единичный отрезок оказался бы покрытым бесконечным множеством таких отрезков (может быть, частью перекрывающихся), длины которых суть -j^2, ... (Беды нет, если некоторые из наложенных отрезков выйдут за пределы основного единичного отрезка.) Сумма всех длин наложенных отрезков равна

Итак, допущение, что последовательность (1) содержит все действительные точки единичного отрезка, приводит к заключению, что весь этот отрезок, длина которого равна 1, можно покрыть множеством промежутков с общей длиной с интуитивной точки зрения это нелепость. Это рассуждение мы позволим себе рассматривать как доказательство, хотя строго логически тут был бы нужен более глубокий анализ.

Приведенное только что рассуждение, между прочим, позволяет установить одну теорему, имеющую большое значение в современной «теории меры». Заменяя упомянутые выше промежутки меньшими промежутками — длины у^-, где е — произвольно малое положительное число, мы убедимся, что всякое счетное множество точек на прямой может быть покрыто множеством отрезков с общей длиной ^. Так как е произвольно мало, то и -| может быть сделано столь малым, сколь нам угодно. Пользуясь фразеологией «теории меры», мы скажем, что счетное множество точек имеет меру нуль.

Упражнение. Докажите аналогичную теорему для счетного множества точек на плоскости, заменяя отрезки площадями квадратов.

3. «Кардинальные числа» Кантора. Резюмируем полученные результаты. Число элементов конечного множества А не может равняться числу

Рис. 21. Взаимно однозначное соответствие между точками двух отрезков различной длины

элементов другого конечного множества ß, если А содержит больше элементов, чем В. Но если мы заменим понятие «множеств, имеющих одно и то же конечное число элементов» более общим понятием «эквивалентных множеств», то — в случае бесконечных множеств — предыдущее утверждение уже не будет справедливо: множество всех целых чисел содержит «больше» элементов, чем множество всех четных чисел, а множество всех рациональных чисел — «больше» элементов, чем множество всех целых чисел; и, однако, как мы видели, все эти множества эквивалентны. Можно было бы заподозрить, что все бесконечные множества между собой эквивалентны, но Кантор опроверг это предположение: существует множество — континуум действительных чисел, — которое не эквивалентно никакому счетному множеству.

Итак, существует по меньшей мере два различных «типа бесконечности»: счетная бесконечность натуральных чисел и несчетная бесконечность континуума. Если два множества А и ß, конечные или бесконечные, эквивалентны, мы скажем, что им соответствует одно и то же кардинальное число (или мощность). В случае конечных множеств кардинальное число сводится к обыкновенному натуральному числу, но понятие кардинального числа носит более общий характер. Далее, если случится, что множество А эквивалентно некоторому подмножеству (части) множества ß, но само В неэквивалентно ни множеству Л, ни какой бы то ни было его части, то говорят, следуя Кантору, что множеству В соответствует большее кардинальное число, чем множеству А. Это употребление термина «число» также согласуется с обычным употреблением в случае конечных множеств. Множество целых чисел есть подмножество множества всех действительных чисел, тогда как множество действительных чисел не эквивалентно ни множеству целых чисел, ни какому бы то ни было его подмножеству (оно ни счетное, ни конечное). Значит, по данному определению, континууму действительных чисел соответствует большее кардинальное число, чем множеству натуральных чисел.

* Кантор показал фактически, как можно построить бесконечную последовательность бесконечных множеств, которым соответствуют все большие и большие кардинальные числа. Так как можно исходить из множества натуральных чисел, то достаточно показать, что, каково бы ни было данное множество Л, можно построить другое множество В, у которого кардинальное число будет больше, чем у А. Вследствие большой общности этой теоремы доказательство ее по неизбежности несколько абстрактно. Множество В мы определяем как множество, элементами которого являются все возможные подмножества множества А. Говоря о «подмножествах» Л, мы в данном случае имеем в виду не только «правильные подмножества» Л, но не исключаем и самого множества Л, а также «пустого» множества 0, не содержащего никаких элементов. (Так, если Л состоит из трех целых чисел 1, 2, 3, то В содержит 8 различных элементов {1, 2, 3}, {1, 2}, {1, 3}, {2, 3},

{1}, {2}, {3} и 0.) Каждый элемент множества В сам есть множество, состоящее из каких-то элементов множества Л. Допустим теперь, что В эквивалентно А или некоторому подмножеству Л, т. е. что существует некоторое правило, приводящее во взаимно однозначное соответствие элементы А или некоторого подмножества А со всеми элементами В, т. е. всеми подмножествами А:

а <-> Sa, (2)

где через Sa обозначено то подмножество Л, которому соответствует элемент а множества А. Мы придем к противоречию, если укажем некоторый элемент В, т. е. некоторое подмножество Т множества Л, которому не может соответствовать никакой элемент а. Чтобы построить подмножество 7\ заметим прежде всего, что для всякого элемента х из Л существуют две возможности: либо множество SXl сопоставляемое зависимостью (2) элементу x, содержит элемент x, либо не содержит. Мы определим Т как подмножество Л, состоящее из всех таких элементов х, что Sx не содержит х. Определенное таким образом множество Т отличается от всякого Sa по крайней мере элементом а, так как если Sa содержит а, то Т не содержит а, a если Sa не содержит а, то Т содержит а. Итак, Т не включено в соответствие (2). Это и показывает, что невозможно установить взаимно однозначное соответствие между элементами Л (или некоторого подмножества Л) и элементами В. Но соотношение

а <-> {а}

устанавливает взаимно однозначное соответствие между всеми элементами Л и подмножеством Ву состоящим из одноэлементных подмножеств Л. Значит, по данному выше определению, множеству В соответствует большее кардинальное число, чем множеству Л.

* Упражнение. Если множество Л содержит п элементов, то определенное выше множество В содержит 2п элементов. Если Л есть множество натуральных чисел, то В эквивалентно континууму действительных чисел, заключенных между 0 и 1. (Указание: сопоставьте каждому подмножеству Л символ, состоящий из последовательности — конечной в первом примере, бесконечной во втором —

а\а2аъ

где ап = 1 или 0, смотря по тому, принадлежит или не принадлежит п-й элемент А рассматриваемому подмножеству.)

Могло бы показаться легкой задачей построить множество точек, обладающее большим кардинальным числом, чем множество точек единичного отрезка. Казалось бы, что квадрат со стороной 1, как «двумерная» фигура, должен содержать «больше» точек, чем «одномерный» отрезок. Но, как это ни странно, дело обстоит иначе: кардинальное число точек квадрата в точности равно кардинальному числу точек отрезка. Для доказательства достаточно установить взаимно однозначное соответствие между точками квадрата и точками отрезка. Постараемся это сделать.

Если (x, у) есть какая-нибудь точка единичного квадрата, то ее координаты х и у могут быть представлены в виде десятичных разложений

причем пусть будет условлено (ради избежания всяких сомнений), что, например, число j будет записываться в виде 0,25000..., а не в виде 0,24999... Названной точке квадрата (л:, у) мы сопоставим точку единичного отрезка z = 0,ai/?ia2^2û3^3û4^4 — Очевидно, различным точкам квадрата (х, у) и (*', у') сопоставляются различные же точки отрезка z и z'; это и значит, что кардинальное число множества точек квадрата не превышает кардинального числа множества точек отрезка.

(Собственно говоря, в данном случае построено взаимно однозначное соответствие между множеством всех точек квадрата и некоторым подмножеством точек отрезка: никакая точка квадрата не будет соответствовать, например, точке отрезка 0,2140909090..., так как мы условились писать 0,25000..., а не 0,24999... Но можно слегка видоизменить построение таким образом, чтобы действительно осуществлялось взаимно однозначное соответствие между множеством всех точек квадрата и множеством всех точек отрезка.)

Аналогичнее рассуждение показывает, что кардинальнее число точек куба не превышает кардинального числа точек отрезка.

Все эти результаты, казалось бы, стоят в противоречии с интуитивным представлением о «размерности». Но нужно обратить внимание на то, что вводимые нами соответствия не являются «непрерывными»; когда мы перемещаемся по отрезку от 0 к 1 непрерывно, соответствующие точки в квадрате не образуют непрерывной кривой, а будут появляться в порядке совершенно «хаотическом». Размерность множества точек зависит не только от кардинального числа точек, но и от того, как они расположены в пространстве. Мы вернемся к этому вопросу в главе V.

4. Косвенный метод доказательства. Теория кардинальных чисел представляет собой лишь один из аспектов общей теории множеств, созданной Кантором несмотря на суровую критику со стороны наиболее выдающихся математиков того времени. Многие из критиков, например Пуанкаре и Кронекер, возражали против неопределенности общего понятия «множества» и против неконструктивного характера рассуждений, применявшихся при определении некоторых множеств.

Возражения против неконструктивных рассуждений относятся к тем доказательствам, которые можно было бы назвать «существенно косвенными». Сами по себе «косвенные» доказательства есть самый обыкновенный элемент математического мышления: желая установить истинность предложения Л, мы вначале допускаем, что справедливо иное предложение Л', противоположное Л; затем некоторая цепь рассуждений приводит нас к утверждению, противоречащему Л', и тем самым обнаруживается несостоятельность предложения А'. Тогда на базе основного логического принципа «исключенного третьего» из ложности А' следует истинность А.

В разных местах этой книги читатель найдет ряд таких примеров, для которых косвенное доказательство легко может быть превращено в прямое, но «косвенная» форма создает преимущества краткости и

освобождает от рассмотрения подробностей, имеющих второстепенный интерес с точки зрения поставленной ближайшей цели. Но попадаются и такие теоремы, для которых до настоящего времени не удалось дать иных доказательств, кроме косвенных. О некоторых из этих теорем можно даже сказать, что, по-видимому, по самой их природе прямые, конструктивные их доказательства принципиально невозможны. Сюда относится, например, теорема, приведенная на стр. 108. Не раз бывали случаи в истории математики, когда все усилия математиков были направлены в сторону построения («конструкции») решения тех или иных проблем, разрешимость которых предполагалось установить, а затем кто-нибудь приходил, если так можно выразиться, со стороны и ликвидировал все трудности с помощью «косвенного» неконструктивного рассуждения.

Когда речь идет о доказательстве существования объекта определенного типа, то имеется существенное различие между тем, чтобы построить осязаемый пример объекта, и тем, чтобы доказать, что из несуществования объекта можно вывести противоречивые заключения. В первом случае получается осязаемый объект, во втором — ничего, кроме противоречия. Не так давно некоторые математики (весьма заслуженные) провозгласили более или менее полное устранение из математики всех неконструктивных доказательств. Даже если бы выполнение этой программы признать желательным, необходимо указать, что это повлекло бы за собой в настоящую эпоху чрезвычайные усложнения, и можно было бы даже опасаться, что в процессе совершающихся потрясений подверглись бы разрушению существенные части организма математики. Поэтому нечего удивляться, что школа «интуиционистов», принявшая упомянутую программу, встретила упорное сопротивление, и что даже наиболее ортодоксальные интуиционисты не всегда в состоянии жить согласно своим убеждениям.1

5. Парадоксы бесконечного. Хотя бескомпромиссная позиция, занятая интуиционистами, с точки зрения большинства математиков является слишком экстремистской, волей-неволей приходится согласиться, что для внешне прекрасной теории бесконечных множеств возникла серьезная угроза, когда в пределах самой этой теории обнаружились совершенно явные логические парадоксы. Очень скоро было замечено, что неограниченная свобода в пользовании понятием «множество» неизбежно ведет к противоречиям. Мы приведем здесь один из парадоксов, обнаруженный Бертраном Расселом. Вот в чем он заключается.

1 Об интуиционизме и выросшем из него конструктивном направлении в математике и логике, на исчерпывающую характеристику которых никак не претендуют эти строки, см., например, [11] и [15] в списке литературы в конце книги (номера по которому всюду указываются в квадратных скобках). — Прим. ред.

Как правило, множества не содержат себя в качестве элемента. Например, множество А всех целых чисел содержит в качестве элементов только целые числа; так как само А не есть целое число, а есть множество целых чисел, то А себя в качестве элемента не содержит. Условимся называть такие множества «ординарными». Но могут существовать и такие множества, которые содержат себя в качестве элемента. Рассмотрим, например, множество S, определенное следующим образом: «S содержит в качестве элементов все множества, которые можно определить посредством предложения, содержащего меньше двадцати слов». Так как само множество S определяется предложением, содержащим меньше двадцати слов, то выходит, что оно является элементом множества 5. Такие множества назовем «экстраординарными». Как бы то ни было, большинство множеств — ординарные; попробуем не иметь дела с дурно ведущими себя экстраординарными множествами и будем рассматривать только множество всех ординарных множеств. Обозначим его буквой С. Каждый элемент С есть множество, притом ординарное множество. Но вот возникает вопрос: а само множество С — ординарное или экстраординарное? Несомненно, оно должно быть или тем, или другим.1 Если С — ординарное множество, то оно содержит себя в качестве элемента, так как С определено как множество всех ординарных множеств. Раз дело обстоит так, значит, С — экстраординарное множество, так как экстраординарными, согласно определению, названы множества, содержащие себя в качестве элемента. Получается противоречие. Значит, С должно быть экстраординарным множеством. Но тогда множество С содержит в качестве элемента себя, т. е. оно есть экстраординарное множество, а это противоречит определению С как множества всех ординарных множеств. Итак, мы видим, что уже одно только допущение существования множества С внутренне противоречиво.

6. Основания математики. Парадоксы вроде вышеприведенного побудили Рассела и других подвергнуть систематическому изучению основания математики и логики. Конечная цель этих исследований заключается в создании для математических рассуждений такой логической базы, относительно которой можно было бы доказать, что она свободна от возможных противоречий, и которая вместе с тем была бы достаточно обширной, чтобы из нее можно было путем дедукции вывести все, что в математике признается существенным, или хотя бы многое из того. Поскольку такой самонадеянной цели достигнуть не удавалось (а может быть, ее и нельзя

1 Получаемое далее противоречие может быть выведено и без использования так называемого закона исключенного третьего, подразумеваемого в этой фразе. См., например, Френкель А. и Бар-Хиллел И. Основания теории множеств. — М.: Мир, 1966, гл. I, § 2. — Прим. ред.

достигнуть), математическая логика как особый предмет привлекала внимание все возрастающего числа исследователей. Многие относящиеся сюда проблемы необходимо признать крайне трудными, хотя формулировки их вполне просты. В качестве примера назовем гипотезу континуума, утверждающую, что не существует множества, для которого кардинальное число больше, чем кардинальное число множества натуральных чисел, но меньше, чем кардинальное число множества действительных чисел. Из этой гипотезы можно вывести много интересных следствий, но сама гипотеза до наших дней не была ни доказана, ни опровергнута. Впрочем, не так давно1 Курт Гедель доказал, что если система обычных постулатов, лежащих в основе теории множеств, не содержит противоречий, то в таком случае расширенная система постулатов, получающаяся при добавлении континуум-гипотезы, также не содержит противоречий. Вопросы, рассматриваемые в математической логике, в конечном счете упираются в один основной вопрос: что понимать под существованием в математике? К счастью, существование самой математики не зависит от того, найден ли удовлетворительный ответ на этот вопрос. Школа «формалистов», во главе которой стоял великий математик Гильберт, утверждает, что в математике «существование» означает «свободу от противоречия». Если принять эту точку зрения, то очередной и необходимой задачей является как раз построение системы постулатов, из которых всю математику можно было бы вывести путем логической дедукции, и доказательство того, что эти постулаты не могут привести ни к какому противоречию. Недавние результаты Геделя и других как будто бы показывают, что такая программа, по крайней мере в той форме, в какой она была намечена самим Гильбертом, не может быть осуществлена. Весьма многозначительно то обстоятельство, что гильбертова теория формализированного построения математики существенно опирается на интуитивные процедуры. Тем или иным путем, в открытой или в скрытой форме, даже прикрытая самым безупречным формалистическим, логическим, аксиоматическим одеянием, конструктивная интуиция всегда остается самым жизненным элементом в математике.2

§ 5. Комплексные числа

1. Возникновение комплексных чисел. По ряду причин возникла потребность в расширении понятия числа даже за пределы континуума действительных чисел — посредством введения так называемых комплексных чисел. Необходимо ясно представлять себе, что все подобного рода

1 1940 г. А в 1963г. американским математиком П. Коэном доказана независимость континуум-гипотезы от принятой Геделем системы аксиом теории множеств. — Прим. ред.

2 Подробнее об этих вопросах см. [11 ] и [38]. — Прим. ред.

расширения и нововведения приходят отнюдь не в результате чьих-то индивидуальных усилий. Скорее их можно рассматривать как итог некоторой постепенной и исполненной колебаний эволюции, в которой не следует преувеличивать роль отдельных личностей. Одной из причин, которые обусловили появление и употребление отрицательных и дробных чисел, было стремление к большей свободе в формальных вычислениях. Только к концу средневековья математики стали терять ощущение беспокойства и неуверенности, с которым они оперировали этими понятиями, тогда как ничего подобного не наблюдалось в отношении таких интуитивно ясных и конкретно воспринимаемых понятий, как понятие натурального числа.

Простейшая процедура, требующая применения комплексных чисел, есть решение квадратных уравнений. Напомним, как обстояло дело с линейным уравнением ах = Ь, когда нужно было определить удовлетворяющее ему значение неизвестной величины х. Решение имеет вид х = ^, и введение дробных чисел как раз обусловливается требованием, чтобы всякое линейное уравнение с целыми коэффициентами (при а ф 0) было разрешимо. Уравнения вроде

х2 = 2 (1)

не имеют решения в области рациональных чисел, но имеют таковое в расширенном поле всех действительных чисел. Но даже поле действительных чисел недостаточно обширно, чтобы в нем можно было построить полную и законченную теорию квадратных уравнений. Например, следующее очень простое уравнение

х2 = -1 (2)

не имеет действительных решений, так как квадрат действительного числа никак не может быть отрицательным. Нам приходится или удовольствоваться тем положением, что такие простые уравнения неразрешимы, или следовать по уже знакомому пути — расширять числовую область и вводить новые числа, с помощью которых удастся решить уравнение. Именно это самое и делается, когда вводят новый символ i и принимают, в качестве определения, что /2 = — 1. Разумеется, этот объект — «мнимая единица» — не имеет ничего общего с числом как орудием счета. Это — отвлеченный символ, подчиненный основному закону î2 = — 1, и ценность его зависит исключительно от того, будет ли достигнуто в результате его введения действительно полезное расширение числовой системы.

Так как мы хотим складывать и умножать с помощью символа i так же, как с обыкновенными числами, то естественно пользоваться символами вроде 2/, 3/, -/, 2 + 5/, вообще, a + Ы, где а и b — действительные числа. Раз эти символы должны подчиняться коммутативному, ассоциативному и дистрибутивному законам, то должны быть возможны, например, такие

вычисления:

Руководствуясь этими соображениями, мы начинаем систематическое изложение теории комплексных чисел со следующего определения: символ вида а + W, где а и b — два действительных числа, носит название комплексного числа с действительной частью а и мнимой частью Ь. Операции сложения и умножения совершаются над этими числами так, как будто бы i было обыкновенное действительное число, однако с условием заменять i2 на —1. Точнее говоря, сложение и умножение определяются по формулам

(3)

В частности, мы получаем

(4)

Основываясь на этих определениях, легко проверить, что для комплексных чисел справедливы коммутативный, ассоциативный и дистрибутивный законы. Далее, не только сложение и умножение, но также и вычитание и деление, будучи применены к двум комплексным числам, приводят снова к комплексным числам того же вида a + ЫЛ так что комплексные числа образуют поле (см. стр. 81):

(5)

(Второе равенство теряет смысл, если с + di = О + О/, так как тогда с2 + d2 = 0. Значит, и на этот раз нужно исключить деление на нуль, т. е. на 0 4- 0/.) Например,

Поле комплексных чисел включает поле действительных чисел в качестве «подполя», так как комплексное число а + 0/ отождествляется с действительным числом а. Заметим, с другой стороны, что комплексное число вида 0 + Ы = Ы называется «чисто мнимым».

Упражнения. 1) Представьте

в форме а + Ы.

2) Представьте в форме а + Ы.

3) Представьте в форме a + Ы следующие выражения:

4) Вычислите %/5 + 12/. (Указание: напишите у/Ь + 12/ = х + yi% возведите в квадрат и приравняйте действительные части и мнимые части.)

Вводя символ /, мы расширили поле действительных чисел и получили поле символов a + Ы, в котором квадратное уравнение

имеет два решения: х = i и х = — /. В самом деле, согласно определению, / • / = (-/)(-/) = /2 = -1. Нужно сказать, что мы приобрели гораздо больше: можно легко проверить, что теперь каждое квадратное уравнение

(6)

становится разрешимым. В самом деле, выполняя над равенством (6) ряд преобразований, мы получаем:

(7)

Заметим теперь, что если Ь2 - 4ас ^ 0, то у/Ь2 - 4ас есть обыкновенное действительное число и корни уравнения (6) действительные; если же Ь2 - 4ас < 0, то тогда 4ас - Ь2 > 0, и следовательно, у/Ь2 - 4ас = V-(4ac - b2) = у/4ас - b2 • /, так что уравнение (6) имеет в качестве корней мнимые числа. Так, например, уравнение

имеет действительные корни

тогда как

уравнение

имеет мнимые корни

2. Геометрическое представление комплексных чисел. Уже в XVI столетии в математических работах появляются квадратные корни из отрицательных чисел в формулах, дающих решения квадратных уравнений. Но в те времена математики затруднились бы объяснить точный смысл этих выражений, к которым относились почти с суеверным трепетом. Сам термин «мнимый» до сих пор напоминает нам о том, что эти выражения рассматривались как нечто искусственное, лишенное реального значения. И только в начале XIX в., когда уже выяснилась роль комплексных чисел в различных областях математики, было дано очень простое геометрическое истолкование комплексных чисел и операций с ними, и этим был положен конец сомнениям в возможности их законного употребления. Конечно, с современной точки зрения, формальные операции с комплексными числами полностью оправдываются на основе формальных определений, так что геометрическое представление логически не является необходимым. Но такое представление, предложенное почти одновременно Весселем (1745-1818), Арганом (1768-1822) и Гауссом, позволило рассматривать комплексные числа и действия с ними как нечто вполне естественное с интуитивной точки зрения и, кроме того, имеющее чрезвычайно большое значение в приложениях комплексных чисел как в самой математике, так и в математической физике.

Геометрическая интерпретация комплексных чисел заключается в том, что комплексному числу z = х + yi сопоставляется точка на плоскости с координатами je, у. Именно, действительная часть числа мыслится как х-координата, а мнимая — как (/-координата. Таким образом устанавливается взаимно однозначное соответствие между комплексными числами и точками «числовой плоскости», подобно тому как нами было установлено раньше (см. § 2) соответствие между действительными числами и точками «числовой оси». Точкам на оси х в числовой плоскости соответствуют действительные числа z — х + О/, тогда как точкам на оси у — чисто мнимые числа z = 0 + yi. Если

есть какое-то комплексное число, то мы называем число

сопряженным с числом z. В числовой плоскости точка z получается из точки z посредством зеркального отражения относительно оси х. Если

Рис. 22. Геометрическое представление комплексных чисел. Точка z имеет прямоугольные координаты je, у

мы условимся расстояние точки z от начала обозначать через р, то на основании теоремы Пифагора

Действительное число р

называется модулем z и обозначается

Если z лежит на действительной оси, то модуль совпадает с абсолютной величиной z. Комплексные числа с модулем 1 изображаются точками, лежащими на «единичной окружности» с центром в начале и радиусом 1.

Если \z\ = 0, то z = 0. Это следует из определения \z\ как расстояния точки z от начала. Далее, модуль произведения двух комплексных чисел равен произведению модулей:

Это вытекает как следствие из более общей теоремы, которая будет доказана на стр. 123.

Упражнения. 1) Докажите последнюю теорему, исходя непосредственно из определения умножения двух комплексных чисел Z\ — Х\ 4- y\i и z2 = х2 + у21.

2) Пользуясь тем обстоятельством, что произведение двух действительных чисел равно нулю в том и только том случае, если один из множителей равен нулю, докажите соответствующую теорему для комплексных чисел. (Указание: основывайтесь при доказательстве на двух последних теоремах.)

Согласно определению сложения двух комплексных чисел Z\ = X\ + yxi и z2 = х2 + y2i, мы имеем

Zi + z2 = (xi + x2) + (yi + y2)L

Таким образом, точка Z\ + z2 изображается в числовой плоскости четвертой вершиной параллелограмма, у которого тремя первыми вершинами являются точки 0, 2|, z2. Это простой способ построения суммы двух комплексных чисел ведет ко многим важным следствиям. Из него мы заключаем, что модуль суммы двух комплексных чисел не превышает суммы модулей (ср. стр. 83):

Рис. 23. Сложение комплексных чисел по правилу параллелограмма

Достаточно сослаться на то, что длина стороны треугольника не превышает суммы длин двух других сторон.

Упражнение. В каких случаях имеет место равенство

Угол между положительным направлением оси х и отрезком Oz называется аргументом z и обозначается буквой ср (см. рис. 22). Числа zwz имеют один и тот же модуль

но их аргументы противоположны по знаку:

Конечно, аргумент z определяется не однозначно, так как к нему можно прибавлять или из него вычитать любой угол, кратный 360°, не изменяя направления отрезка Oz. Итак, углы

графически дают один и тот же аргумент. Так как, согласно определению синуса и косинуса,

x = pcos(p, j/ = psincp,

то любое комплексное число z выражается через его модуль и аргумент следующим образом:

(8)

Например,

Читатель может проверить эти утверждения посредством подстановки числовых значений тригонометрических функций.

Тригонометрическим представлением (8) очень полезно воспользоваться, чтобы уяснить себе геометрический смысл умножения двух комплексных чисел. Если

то

Но, в силу основных теорем сложения синуса и косинуса,

Итак,

(9)

В правой части последнего равенства мы видим написанное в тригонометрической форме комплексное число с модулем рр' и аргументом ф + ср'. Значит, мы можем отсюда заключить, что при умножении двух комплексных чисел их модули перемножаются, а аргументы складываются (рис. 24). Таким образом, мы видим, что умножение комплексных чисел как-то связано с вращением.

Установим точнее, в чем тут дело. Назовем направленный отрезок, идущий из начала в точку z, вектором точки z; тогда модуль р = \z\ есть его длина. Пусть z' — какая-нибудь точка единичной окружности, так что р' = 1. В таком случае умножение z на z' просто поворачивает вектор 2 на угол ср'. Если же р' ф 1, то, помимо вращения, длина вектора должна быть умножена на р;. Рекомендуем читателю самостоятельно проиллюстрировать эти факты, умножая различные комплексные числа на Z\ = i (вращение на 90°); z2 = —i (тоже вращение на 90°, но в обратном направлении); гз = 1 + i и г4 = 1 — L

Формула (9) в особенности представляет интерес, если z = z'\ в этом случае имеем:

Умножая снова на г, будем иметь

и, вообще, для любого пу повторяя операцию, получим

Рис. 24. Умножение комплексных чисел: аргументы складываются, модули перемножаются

В частности, если точка z находится на единичной окружности, так что р= 1, мы приходим к формуле, открытой французским математиком А. де Муавром (1667-1754):

(11)

Эта формула — одно из самых замечательных и полезных соотношений в элементарной математике. Поясним это примером. Возьмем п = 3 и разложим левую часть по формуле бинома

Тогда получим:

Одно такое комплексное равенство равносильно двум равенствам, связывающим действительные числа. В самом деле, если два комплексных числа равны, то в отдельности равны их действительные части и их мнимые части. Итак, можно написать

Пользуясь затем соотношением

получим окончательно:

Подобного рода формулы, выражающие sin/zcp и cos ггср соответственно через sin ф и coscp, легко получить при каком угодно целом значении п.

Упражнения. 1) Напишите аналогичные формулы для sin4cp и cos4cp.

2) Предполагая, что точка z находится на единичном круге: z = coscp + / sin ср, покажите, что — = coscp — / sinср.

3) Без вычислений установите, что модуль числа Равен единице.

4) Докажите: если z\ и z2 —два комплексных числа, то аргумент z\ — z2 равен углу между положительным направлением действительной оси и вектором, идущим от Z2 К 2|.

5) Дан треугольник с вершинами z\, z2, 23; установите геометрический смысл аргумента числа j—~.

6) Докажите, что отношение двух комплексных чисел с одинаковым аргументом есть действительное число.

7) Докажите, что если аргументы чисел 23 - 2| и 24 - 2| равны между собой, то четыре точки Z\, z2y 23, Z\ лежат на окружности или на прямой линии, и обратно.

8) Докажите: четыре точки z|, 22, 23, 24 лежат на окружности или на прямой линии, если число действительное.

3. Формула Муавра и корни из единицы. Под корнем п-й степени из числа а мы понимаем всякое такое число 6, что Ьп = а. В частности, число 1 имеет два квадратных корня: 1 и -1, так как I2 = (— I)2 = 1. Число 1 имеет один действительный кубический корень, именно 1, тогда как оно же имеет четыре корня четвертой степени: два действительных, 1 и —1, и два мнимых: i и —/. Эти факты наводят на мысль, что в комплексной области должно существовать еще два кубических корня из 1 (а всего кубических корней тогда будет три). С помощью формулы Муавра мы покажем, что эта догадка справедлива.

Мы убедимся, что в поле комплексных чисел существует ровно п корней степени п из 1. Эти корни изображаются вершинами правильного п-угольника, вписанного в единичный круг и имеющего точку 1 в качестве одной из вершин.

Сказанное почти ясно из рис. 25 (соответствующего случаю п = 12). Первая вершина многоугольника есть 1. Следующая есть

Рис. 25. Двенадцать корней двенадцатой степени из единицы

(12)

так как аргумент должен равняться п-й части угла в 360°. Еще следующая вершина есть а • а = а2, так как мы получим ее, вращая вектор а на угол ——. Дальше получаем вершину or и т.д.; после п шагов возвращаемся снова к вершине 1, т. е. получаем

что следует также из формулы (11), так как

Итак, ос1 = а есть корень уравнения хп = 1. То же справедливо относительно следующей вершины

Мы убедимся в этом, если напишем

или же воспользуемся формулой Муавра

Точно так же мы заключаем, что все п чисел

являются корнями степени п из 1. Если будем степени увеличивать дальше или рассмотрим отрицательные степени, то новых корней не получим. В самом деле,

точно так же

и т.д., так что ранее полученные корни повторяются. Читателю предоставляем в качестве упражнения показать, что иных корней, кроме перечисленных, рассматриваемое уравнение не имеет.

Если п четное, то одна из вершин п-угольника попадает в точку — 1, в соответствии с общеизвестным алгебраическим фактом: —1 есть корень четной степени из 1.

Уравнение, которому удовлетворяют корни л-й степени из 1,

(13)

есть уравнение п-и степени, но легко понизить его степень на единицу. Воспользуемся алгебраической формулой

(14)

Так как произведение двух чисел равно 0 в том и только том случае, если один из множителей равен нулю, то выражение (14) обращается в нуль или при х= 1, или при условии, что удовлетворяется уравнение

(15)

Этому уравнению удовлетворяют корни а, а2, ..., а"-1; оно называется циклотомическим, или уравнением деления окружности. Так, например, мнимые кубические корни из 1

являются корнями уравнения

как читатель сможет убедиться, выполняя подстановки. Таким же образом корни пятой степени из 1 (кроме самого числа 1) удовлетворяют уравнению

(16)

Чтобы построить правильный пятиугольник, нам приходится решить уравнение четвертой степени. Простое алгебраическое ухищрение — замена w = x + j — приводит к уравнению второй степени. Мы делим уравнение (16) на x2 и переставляем члены:

и, принимая во внимание, что

получаем

По формуле (7) пункта 1 корни этого квадратного уравнения имеют вид

Итак, мнимые корни пятой степени из 1 являются корнями следующих двух квадратных уравнений:

Читатель сможет их решить по той же формуле (7).

Упражнения. 1) Найдите корни 6-й степени из 1.

2) Вычислите (1 + /)п.

3) Вычислите все различные значения выражений

4) Вычислите

*4. Основная теорема алгебры. Не только уравнения вида ах2 + Ьх + с = 0 или хп - 1 = 0 разрешимы в поле комплексных чисел, но можно утверждать гораздо больше: всякое алгебраическое уравнение степени п с действительными или комплексными коэффициентами

(17)

разрешимо в поле комплексных чисел. Для случая уравнений 3-й и 4-й степеней эта теорема была установлена в XVI в. Тартальей, Кардано и другими: оказалось, что такие уравнения решаются посредством формул,

подобных формуле квадратного уравнения, но значительно более сложных. В течение почти двух столетий длилось настойчивое изучение общего уравнения 5-й и более высоких степеней, но все усилия разрешить их теми же методами оказались напрасными. Когда молодому Гауссу в его докторской диссертации (1799) удалось впервые доказать, что решения существуют, то это уже было крупнейшим успехом; правда, вопрос о возможности обобщить на случай степеней ^ 5 классические формулы, позволяющие находить корни с помощью рациональных операций и извлечения корней, оставался в то время открытым (см. стр. 144).

Теорема Гаусса утверждает, что, каково бы ни было алгебраическое уравнение вида (17), где п — целое положительное число, а коэффициенты а — действительные или даже комплексные числа, существует по крайней мере одно такое комплексное число а = с + di, что

/(а) = 0.

Число а называется корнем уравнения (17). Доказательство этой теоремы будет приведено в этой книге на стр. 295—297. Предположим пока, что теорема доказана, и выведем из нее другую теорему, известную под названием основной теоремы алгебры (было бы, впрочем, правильнее назвать ее основной теоремой комплексной числовой системы): всякий алгебраический полином степени п

(18)

может быть представлен в виде произведения ровно п множителей:

(19)

где ось а2, ..., а„ — комплексные числа, корни уравнения f(x) = 0. Так, например, полином

разлагается на множители следующим образом:

Что числа а являются корнями уравнения f(x) = 0, это очевидно из самого разложения (19), так как при х = аг один из множителей f(x), а следовательно, и сам полином f(x), обращается в нуль.

В иных случаях не все множители х — ось х — осг, ... полинома f(x) степени п оказываются различными; так, в примере

мы имеем только один корень, х= 1, «считаемый дважды», или «кратности 2». Во всяком случае, полином степени п не может разлагаться в произведение более чем п различных множителей вида х — а, и соответствующее уравнение не может иметь более п корней.

При доказательстве основной теоремы алгебры мы воспользуемся — не в первый раз — алгебраическим тождеством

(20)

которое при а = 1 служило нам для определения суммы геометрической прогрессии. Предполагая теорему Гаусса доказанной, допустим, что а = oi\ есть корень уравнения (17), так что

Вычитая это выражение из f(x) и перегруппировывая члены, мы получим тождество

(21)

Пользуясь теперь формулой (20), мы можем выделить множитель х - oi\ из каждого члена и затем вынести его за скобку, причем степень многочлена, остающегося в скобках, станет уже на единицу меньше. Перегруппировывая снова члены, мы получим тождество

где g(x) — многочлен степени п — 1:

(Вычисление коэффициентов, обозначенных через Ь, нас здесь не интересует.) Применим дальше то же рассуждение к многочлену g(x). По теореме Гаусса, существует корень а2 уравнения g(x) = 0, так что

где h(x) — новый многочлен степени уже п - 2. Повторяя эти рассуждения п — 1 раз (подразумевается, конечно, применение принципа математической индукции), мы, в конце концов, приходим к разложению

(22)

Из тождества (22) следует не только то, что комплексные числа аь а2, ... ..., ал суть корни уравнения (17), но и то, что иных корней уравнение (17) не имеет. Действительно, если бы число у было корнем уравнения (17), то из (22) следовало бы

Но мы видели (стр. 121), что произведение комплексных чисел равно нулю в том и только том случае, если один из множителей равен нулю. Итак, один из множителей у — аг равен 0, т.е. у = аг, что и требовалось установить.

§ 6. Алгебраические и трансцендентные числа

1. Определение и вопросы существования. Алгебраическим числом называется всякое число х, действительное или мнимое, удовлетворяющее некоторому алгебраическому уравнению вида

(1)

где числа а, целые. Так, например, число \/2 алгебраическое, так как оно удовлетворяет уравнению

Таким же образом алгебраическим числом является всякий корень любого уравнения с целыми коэффициентами третьей, четвертой, пятой, какой угодно степени, и независимо от того, выражается или не выражается он в радикалах. Понятие алгебраического числа есть естественное обобщение понятия рационального числа, которое соответствует частному случаю п=1.

Не всякое действительное число является алгебраическим. Это вытекает из следующей, высказанной Кантором, теоремы: множество всех алгебраических чисел счетно. Так как множество всех действительных чисел несчетное, то обязательно должны существовать действительные числа, не являющиеся алгебраическими.

Укажем один из методов пересчета множества алгебраических чисел. Каждому уравнению вида (1) сопоставим целое положительное число

которое назовем ради краткости «высотой» уравнения. Для каждого фиксированного значения п существует лишь конечное число уравнений вида (1) с высотой h. Каждое из таких уравнений имеет самое большее п корней. Поэтому может существовать лишь конечное число алгебраических чисел, порождаемых уравнениями с высотой Л; следовательно, все алгебраические числа можно расположить в виде последовательности, перечисляя сначала те из них, которые порождаются уравнениями высоты 1, затем — высоты 2 и т. д.

Это доказательство счетности множества алгебраических чисел устанавливает существование действительных чисел, которые не являются алгебраическими. Такие числа называют трансцендентными (от латинского transcendere — переходить, превосходить); такое наименование им дал Эйлер, потому что они «превосходят мощность алгебраических методов».

Канторово доказательство существования трансцендентных чисел не принадлежит к числу конструктивных. Теоретически рассуждая, можно было бы построить трансцендентное число с помощью диагональной процедуры, производимой над воображаемым списком десятичных разложе-

нии всех алгебраических чисел; но такая процедура лишена всякого практического значения и не привела бы к числу, разложение которого в десятичную (или какую-нибудь иную) дробь можно было бы на самом деле написать. Наиболее интересные проблемы, связанные с трансцендентными числами, заключаются в доказательстве того, что определенные, конкретные числа (сюда относятся числа тг и е, о которых см. стр. 325—328) являются трансцендентными.

**2. Теорема Лиувилля и конструирование трансцендентных чисел. Доказательство существования трансцендентных чисел еще до Кантора было дано Ж. Лиувиллем (1809—1862). Оно дает возможность на самом деле конструировать примеры таких чисел. Доказательство Лиувилля более трудно, чем доказательство Кантора, и это неудивительно, так как сконструировать пример, вообще говоря, сложнее, чем доказать существование. Приводя ниже доказательство Лиувилля, мы имеем в виду только подготовленного читателя, хотя для понимания доказательства совершенно достаточно знания элементарной математики.

Как обнаружил Лиувилль, иррациональные алгебраические числа обладают тем свойством, что они не могут быть приближены рациональными числами с очень большой степенью точности, если только не взять знаменатели приближающих дробей чрезвычайно большими.

Предположим, что число z удовлетворяет алгебраическому уравнению с целыми коэффициентами

(2)

но не удовлетворяет такому же уравнению более низкой степени. Тогда говорят, что само х есть алгебраическое число степени п. Так, например, число z = y/2 есть алгебраическое число степени 2, так как удовлетворяет уравнению х2 -2 = 0 степени 2, но не удовлетворяет уравнению первой степени; число z = у/2 — степени 3, так как удовлетворяет уравнению je3 — 2 = 0, но не удовлетворяет (как мы покажем в главе III) уравнению более низкой степени. Алгебраическое число степени п > 1 не может быть рациональным, так как рациональное число z = £ удовлетворяет уравнению qx — р = 0 степени 1. Каждое иррациональное число z может быть с какой угодно степенью точности приближено с помощью рационального числа; это означает, что всегда можно указать последовательность рациональных чисел

с неограниченно растущими знаменателями, обладающую тем свойством, что

Теорема Лиувилля утверждает: каково бы ни было алгебраическое число z степени п > 1, оно не может быть приближено посредством рационального числа ^ с точностью лучшей чем другими словами, при достаточно больших знаменателях непременно выполняется неравенство

(3)

Мы собираемся привести доказательство этой теоремы, но раньше покажем, как с ее помощью можно строить трансцендентные числа. Рассмотрим число

где а, обозначают произвольные цифры от 1 до 9 (проще всего было бы положить все а, равными 1), а символ я!, как обычно (см. стр. 42), обозначает 1 • 2 •... • п. Характерным свойством десятичного разложения такого числа является то, что быстро возрастающие по своей длине группы нулей чередуются в нем с отдельными цифрами, отличными от нуля. Обозначим через zm конечную десятичную дробь, получающуюся, когда в разложении возьмем все члены до ат • 10~ш! включительно. Тогда получим неравенство

(4)

Предположим, что z было бы алгебраическим числом степени п. Тогда, полагая в неравенстве Лиувилля (3) ^ = zm = у^-, мы должны иметь

при достаточно больших значениях га. Сопоставление последнего неравенства с неравенством (4) дает

откуда следует (п + \)т\ > (т + 1)! — 1 при достаточно больших га. Но это неверно для значений m, больших чем п (пусть читатель потрудится дать детализированное доказательство этого утверждения). Мы пришли к противоречию. Итак, число z — трансцендентное.

Остается доказать теорему Лиувилля. Предположим, что z — алгебраическое число степени п > 1, удовлетворяющее уравнению (1), так что

(5)

Пусть zm = — — последовательность рациональных чисел, причем zm —» z.

Тогда

Деля обе части на zm - z и пользуясь алгебраической формулой

мы получаем:

(6)

Так как zm стремится к г, то при достаточно больших m рациональное число zm будет отличаться от z меньше чем на единицу. Поэтому при достаточно больших m можно сделать следующую грубую оценку:

(7)

причем стоящее справа число M — постоянное, так как z не меняется в процессе доказательства. Выберем теперь га настолько большим, чтобы у дроби zm = — знаменатель qm был больше, чем М; тогда

(8)

Ради краткости условимся дальше писать р вместо рт и q вместо qm. В таком случае

(9)

Рациональное число zm = ^ не может быть корнем уравнения f(x) = 0, так как тогда можно было бы из многочлена f(x) выделить множитель (х - zm), и, значит, z удовлетворяло бы уравнению степени низшей чем п. Итак, f(zm) ф 0. Но числитель в правой части равенства (9) есть целое число и, следовательно, по абсолютной величине он по меньшей мере равен единице. Таким образом, из сопоставления соотношений (8) и (9) вытекает неравенство

(10)

как раз и составляющее содержание указываемой теоремы.

На протяжении нескольких последних десятилетий исследования, касающиеся возможности приближения алгебраических чисел рациональными, продвинулись гораздо дальше. Например, норвежский математик А. Туэ (1863—1922) установил, что в неравенстве Лиувилля (3) показатель п + 1 может быть заменен меньшим показателем т^ + 1. К. Л. Зигель показал,

что можно взять и еще меньший (еще меньший при больших п) показатель 2у/п.

Трансцендентные числа всегда были темой, приковывающей к себе внимание математиков. Но до сравнительно недавнего времени среди чисел, которые интересны сами по себе, было известно очень немного таких, трансцендентный характер которых был бы установлен. (Из трансцендентности числа гс, о которой пойдет речь в главе III, следует невозможность квадратуры круга с помощью линейки и циркуля.) В своем выступлении на Парижском международном математическом конгрессе 1900 г. Давид Гильберт предложил тридцать математических проблем, допускающих простую формулировку, некоторые — даже совсем элементарную и популярную, из которых ни одна не только не была решена, но даже и не казалась способной быть разрешенной средствами математики той эпохи. Эти «проблемы Гильберта» оказали сильное возбуждающее влияние на протяжении всего последующего периода развития математики. Почти все они мало-помалу были разрешены, и во многих случаях их решение было связано с ясно выраженными успехами в смысле выработки более общих и более глубоких методов. Одна из проблем, казавшаяся довольно безнадежной, заключалась в доказательстве того, что число

является трансцендентным (или хотя бы иррациональным). На протяжении трех десятилетий не было даже намека на такой подход к вопросу с чьей-нибудь стороны, который открывал бы надежду на успех. Наконец, Зигель и, независимо от него, молодой русский математик А. Гельфонд открыли новые методы для доказательства трансцендентности многих чисел, имеющих значение в математике. В частности, была установлена трансцендентность не только гильбертова числа 2^, но и целого довольно обширного класса чисел вида аь, где а — алгебраическое число, отличное от 0 и 1, ab — иррациональное алгебраическое число.

ДОПОЛНЕНИЕ К ГЛАВЕ II

Алгебра множеств

1. Общая теория. Понятие класса, или совокупности, или множества объектов — одно из самых фундаментальных в математике. Множество определяется некоторым свойством («атрибутом») 21, которым должен или обладать, или не обладать каждый рассматриваемый объект; те объекты, которые обладают свойством 21, образуют множество А. Так, если мы рассматриваем целые числа и свойство 21 заключается в том,

чтобы «быть простым», то соответствующее множество Л состоит из всех простых чисел 2, 3, 5, 7, ...

Математическая теория множеств исходит из того, что из множеств с помощью определенных операций можно образовывать новые множества (подобно тому как из чисел посредством операций сложения и умножения получаются новые числа). Изучение операций над множествами составляет предмет «алгебры множеств», которая имеет много общего с обыкновенной числовой алгеброй, хотя кое в чем и отличается от нее. Тот факт, что алгебраические методы могут быть применены к изучению нечисловых объектов, каковыми являются множества, иллюстрирует большую общность идей современной математики. В последнее время выяснилось, что алгебра множеств бросает новый свет на многие области математики, например, теорию меры и теорию вероятностей; она полезна также при систематизации математических понятий и выяснении их логических связей.

В дальнейшем / будет обозначать некоторое постоянное множество объектов, природа которых безразлична, и которое мы можем называть универсальным множеством (или универсумом рассуждения), a А, В, С, ... будут какие-то подмножества /. Если / есть совокупность всех натуральных чисел, то Л, скажем, может обозначать множество всех четных чисел, В — множество всех нечетных чисел, С — множество всех простых чисел, и т. п. Если / обозначает совокупность всех точек на плоскости, то А может быть множеством точек внутри какого-то круга, В — множеством точек внутри другого круга и т. п. В число «подмножеств» нам удобно включить само /, а также «пустое» множество 0, не содержащее никаких элементов. Цель, которую преследует такое искусственное расширение, заключается в сохранении того положения, что каждому свойству 21 соответствует некоторое множество элементов из /, обладающих этим свойством. В случае, если 21 есть универсально выполняемое свойство, примером которого может служить (если речь идет о числах) свойство удовлетворять тривиальному равенству х = х, то соответствующее подмножество / будет само /, так как каждый элемент обладает таким свойством; с другой стороны, если 21 есть какое-то внутренне противоречивое свойство (вроде хфх), то соответствующее подмножество не содержит вовсе элементов, оно — «пустое» и обозначается символом 0.

Говорят, что множество А есть подмножество множества ß, короче, «Л входит в ß», или «ß содержит Л», если во множестве Л нет такого элемента, который не был бы также во множестве В. Этому соотношению соответствует запись

А с В, или Вэ А.

Например, множество Л всех целых чисел, делящихся на 10, есть подмножество множества В всех целых чисел, делящихся на 5, так как каждое число, делящееся на 10, делится также на 5. Соотношение Л с В

не исключает соотношения В с А. Если имеет место и то и другое, то мы пишем

А = В.

Это означает, что каждый элемент А есть вместе с тем элемент ß, и обратно, так что множества А и В содержат как раз одни и те же элементы.

Соотношение А с В между множествами во многих отношениях напоминает соотношение а ^ b между числами. В частности, отметим следующие свойства этого соотношения:

По этой причине соотношение А с В иногда называют «отношением порядка». Главное отличие рассматриваемого соотношения от соотношения а ^ b между числами заключается в том, что между всякими двумя заданными (действительными) числами а и b непременно осуществляется по меньшей мере одно из соотношений а ^ b или b ^ а, тогда как для соотношения А с В между множествами аналогичное утверждение неверно. Например, если А есть множество, состоящее из чисел 1, 2, 3,

А = {1,2, 3},

a В — множество, состоящее из чисел 2, 3, 4,

ß = {2, 3, 4},

то не имеет места ни соотношение А с ß, ни соотношение В с А. По этой причине говорят, что подмножества Л, ß, С, ... множества / являются «частично упорядоченными», тогда как действительные числа a, ft, с, ... образуют «вполне упорядоченную» совокупность.

Заметим, между прочим, что из определения соотношения А с В следует, что, каково бы ни было подмножество А множества /,

Свойство 4) может показаться несколько парадоксальным, но, если вдуматься, оно логически строго соответствует точному смыслу определения знака С. В самом деле, соотношение 0 с А нарушалось бы только в том случае, если бы пустое множество 0 содержало элемент, который не содержался бы в Л; но так как пустое множество не содержит вовсе элементов, то этого быть не может, каково бы ни было А.

Мы определим теперь две операции над множествами, формально обладающие многими алгебраическими свойствами сложения и умножения чисел, хотя по своему внутреннему содержанию совершенно отличные от

этих арифметических действий. Пусть А и В — какие-то два множества. Под объединением, или «логической суммой», А и ß понимается множество, состоящее из тех элементов, которые содержатся или в А, или в ß (включая и те элементы, которые содержатся и в А и в ß). Это множество обозначается А + В.1 Под «пересечением», или «логическим произведением», А и В понимается множество, состоящее из тех элементов, которые содержатся и в А и в ß. Это множество обозначается Aß.2

Проиллюстрируем приведенные определения примером. Возьмем опять в качестве А и В множества

Тогда

Среди важных алгебраических свойств операций А + В и AB перечислим следующие. Читатель сможет проверить их справедливость, исходя из определения самих операций:

Проверка всех этих законов — дело самой элементарной логики. Например, правило 10) констатирует, что множество элементов, содержащихся или в А, или в А, есть как раз множество А; правило 12) констатирует,

Рис. 26. Объединение и пересечение множеств

1 Или AU В. — Прим. ред.

2 Или А п В. — Прим. ред.

что множество тех элементов, которые содержатся в Л и вместе с тем содержатся или в ß, или в С, совпадает со множеством элементов, которые или содержатся одновременно в Л и в ß, или содержатся одновременно в А и в С. Логические рассуждения, используемые при доказательствах подобного рода правил, удобно иллюстрируются, если мы условимся изображать множества Л, ß, С, ... в виде некоторых фигур на плоскости и будем очень внимательны в том отношении, чтобы не упустить ни одной из возникающих логических возможностей, когда речь идет о наличии общих элементов двух множеств или, напротив, наличии в одном множестве элементов, которые не содержатся в другом.

Читатель, несомненно, обратил внимание на то обстоятельство, что законы 6), 7), 8), 9) и 12) внешне тождественны с хорошо знакомыми коммутативным, ассоциативным и дистрибутивным законами обыкновенной алгебры. Отсюда следует, что все правила обыкновенной алгебры, вытекающие из этих законов, действительны также в алгебре множеств. Напротив, законы 10), 11) и 13) не имеют своих аналогов в обыкновенной алгебре, и они придают алгебре множеств более простую структуру. Например, формула бинома в алгебре множеств сводится к простейшему равенству

которое следует из закона 11). Законы 14), 15) и 17) говорят о том, что свойства множеств 0 и / по отношению к операциям объединения и пересечения множеств весьма похожи на свойства чисел 0 и 1 по отношению к операциям числовых действий сложения и умножения. Но закон 16) не имеет аналога в числовой алгебре.

Остается дать определение еще одной операции в алгебре множеств. Пусть А — какое-нибудь подмножество универсального множества /. Тогда под дополнением А в / понимается множество всех элементов /, которые не содержатся в А. Для этого множества мы введем обозначение А'. Так, если / есть множество всех натуральных чисел, а Л — множество всех простых чисел, то А' есть множество, состоящее из всех составных чисел и числа 1. Операция перехода от Л к Л', для которой нет аналога в обыкновенной алгебре, обладает следующими свойствами:

Проверку этих свойств мы опять предоставляем читателю.

Законы 1)—26) лежат в основе алгебры множеств. Они обладают замечательным свойством «двойственности» в следующем смысле:

Если в одном из законов 1)—26) заменить друг на друга соответственно символы

(в каждом их вхождении), то в результате снова получается один из этих же законов. Например, закон 6) переходит в закон 7), 12) — в 13), 17) — в 16) и т. д. Отсюда следует, что каждой теореме, которая может быть выведена из законов 1)—26), соответствует другая, «двойственная» ей теорема, получающаяся из первой посредством указанных перестановок символов. В самом деле, так как доказательство первой теоремы состоит из последовательного применения (на различных стадиях проводимого рассуждения) некоторых из законов 1—26), то применение на соответствующих стадиях «двойственных» законов составит доказательство «двойственной» теоремы. (По поводу подобной же «двойственности» в геометрии см. главу IV.)

2. Применение к математической логике. Проверка законов алгебры множеств основывалась на анализе логического смысла соотношения А с В и операций А + В, AB и А'. Мы можем теперь обратить этот процесс и рассматривать законы 1)—26) как базу для «алгебры логики». Скажем точнее: та часть логики, которая касается множеств, или, что по существу то же, свойств рассматриваемых объектов, может быть сведена к формальной алгебраической системе, основанной на законах 1)—26). Логическая «условная вселенная» определяет множество /; каждое свойство 21 определяет множество А, состоящее из тех объектов в I, которые обладают этим свойством. Правила перевода обычной логической терминологии на язык множеств ясны из следующих примеров:

В терминах алгебры множеств силлогизм «Barbara», обозначающий, что «если всякое А есть В и всякое В есть С, то всякое А есть С», принимает простой вид:

3) Если А с В и В с С, то А с С. Аналогично «закон противоречия», утверждающий, что «объект не может одновременно обладать и не обладать некоторым свойством», записывается в виде:

20) АА' = 0,

а «закон исключенного третьего», говорящий, что «объект должен или обладать, или не обладать некоторым свойством», записывается: 19) А+А' = 1.

Таким образом, та часть логики, которая выразима в терминах символов с, +, • и ', может трактоваться как формальная алгебраическая система, подчиненная законам 1)—26). На основе слияния логического анализа математики и математического анализа логики создалась новая дисциплина— математическая логика, которая в настоящее время находится в процессе бурного развития.

С аксиоматической точки зрения заслуживает внимания тот замечательный факт, что утверждения 1)—26), вместе со всеми прочими теоремами алгебры множеств, могут быть логически выведены из следующих трех равенств:

Отсюда следует, что алгебра множеств может быть построена как чисто дедуктивная теория, вроде евклидовой геометрии, на базе этих трех положений, принимаемых в качестве аксиом. Если эти аксиомы приняты, то операция AB и отношение А с В определяются в терминах А + В и А'\

Совершенно иного рода пример математической системы, в которой выполняются все формальные законы алгебры множеств, дается системой восьми чисел 1, 2, 3, 5, 6, 10, 15, 30: здесь a + b обозначает, по определению, общее наименьшее кратное а и b, ab — общий наибольший делитель а и b, а с b — утверждение «Ь делится на а» и а' — число —. Существование таких примеров повлекло за собой изучение общих алгебраических систем, удовлетворяющих законам 27). Такие системы называются «булевыми алгебрами»— в честь Джорджа Буля (1815—1864), английского математика и логика, книга которого «An investigation of the laws of thought» (Исследование законов мышления) появилась в 1854 г.

3. Одно из применений к теории вероятностей. Алгебра множеств имеет ближайшее отношение к теории вероятностей и позволяет взглянуть на нее в новом свете. Рассмотрим простейший пример: представим себе эксперимент с конечным числом возможных исходов, которые все мыслятся как «равновозможные». Эксперимент может, например, заключаться в том, что мы вытягиваем наугад карту из хорошо перетасованной полной колоды. Если множество всех исходов эксперимента обозначим через /, а А обозначает какое-нибудь подмножество /, то вероятность того, что исход эксперимента окажется принадлежащим к подмножеству Л, определяется как отношение

Если условимся число элементов в каком-нибудь множестве А обозначать через п(А), то последнему равенству можно придать вид

(1)

В нашем примере, допуская, что А есть подмножество треф, мы получим п(А) = 13,

Идеи алгебры множеств обнаруживаются при вычислении вероятностей тогда, когда приходится, зная вероятности одних множеств, вычислять вероятности других. Например, зная вероятности р(А), р(В) и р(АВ), можно вычислить вероятность р(А + В):

(2)

Доказать это не составит труда. Мы имеем

так как элементы, содержащиеся одновременно в А и в В, т. е. элементы AB, считаются дважды при вычислении суммы п(А) + п(В), и, значит, нужно вычесть п(АВ) из этой суммы, чтобы подсчет п(А + В) был произведен правильно. Деля затем обе части равенства на мы получаем соотношение (2).

Более интересная формула получается, если речь идет о трех множествах А, В, С из /. Пользуясь соотношением (2), мы имеем

Закон (12) из предыдущего пункта дает нам (А + В)С = АС + ВС. Отсюда следует:

Подставляя в полученное раньше соотношение значение р[(А + В)С] и значение р(А + В), взятое из (2), мы приходим к нужной нам формуле:

(3)

В качестве примера рассмотрим следующий эксперимент. Три цифры 1, 2, 3 пишутся в каком попало порядке. Какова вероятность того, что по крайней мере одна из цифр окажется на надлежащем (в смысле нумерации) месте? Пусть А есть множество перестановок, в которых цифра 1 стоит на первом месте, В —

множество перестановок, в которых цифра 2 стоит на втором месте, С — множество перестановок, в которых цифра 3 стоит на третьем месте. Нам нужно вычислить р(А + В + С). Ясно, что

действительно, если какая-нибудь цифра стоит на надлежащем месте, то имеются две возможности переставить остальные две цифры из общего числа 3-2-1=6 возможных перестановок трех цифр. Далее,

так как в каждом из этих случаев возникает только одна возможность. И тогда формула (3) дает нам

Упражнение. Выведите соответствующую формулу для р(А + В + С + D) и примените ее к эксперименту, в котором будут участвовать 4 цифры. Соответствующая вероятность равна -3- = 0,6250.

Общая формула для объединения п множеств имеет вид

(4)

где символы

обозначают суммирование по всем возможным комбинациям, содержащим одну, две, три,..., (п — 1) букв из числа А |, Л2, ..., Ап. Эта формула может быть установлена посредством математической индукции — точно так же, как формула (3) была выведена из формулы (2).

Из формулы (4) можно заключить, что если п цифр 1, 2, 3, п написаны в каком угодно порядке, то вероятность того, что по крайней мере одна из цифр окажется на надлежащем месте, равна

(5)

причем перед последним членом стоит знак + или -, смотря по тому, является ли п четным или нечетным. В частности, при п = 5 эта вероятность равна

В главе VIII мы увидим, что, когда п стремится к бесконечности, выражение стремится к пределу -, значение которого, с пятью знаками после запятой, равно 0,36788. Так как из формулы (5) видно, что рп = 1 — 5Л, то отсюда следует, что при п —► оо

ГЛАВА III

Геометрические построения. Алгебра числовых полей

Введение

Задачи на построение всегда были одним из самых любимых предметов геометрических занятий. С помощью только циркуля и линейки, как читатель знает из школьного курса, можно выполнить очень много разнообразных построений: разделить пополам отрезок или угол, провести через точку перпендикуляр к данной прямой, вписать в данный круг правильный шестиугольник и т. д. Во всех этих построениях линейка служит только для того, чтобы проводить прямую линию, но не для того, чтобы измерять или откладывать расстояния. Традиционное ограничение — пользоваться только циркулем и линейкой — восходит к глубокой древности, хотя на практике сами греки без колебания прибегали и к другим инструментам.

Одной из самых знаменитых, классических задач на построение является задача Аполлония (около 220 года до нашей эры): даны три круга, требуется провести четвертый, касательный к трем данным. В частности, не исключено, что один или большее число из данных кругов «вырождаются» в точку или прямую («круг» с «нулевым» или с «бесконечным» радиусом). Например, может идти речь о проведении круга, касательного к двум данным прямым и проходящего через данную точку. Если такого рода специальные случаи не связаны с затруднениями, то в общей постановке задача принадлежит к числу весьма трудных.

Из всех задач на построение задача построения (с помощью циркуля и линейки) правильного я-угольника представляет, может быть, наибольший интерес. Для ряда значений п, например, п = 3, 4, 5, 6, решение было известно уже в древности и излагается в школьной геометрии. Но в случае правильного семиугольника (п = 7) построение, как было доказано, невозможно. Вот еще три классические проблемы, решение которых разыскивалось долго и безрезультатно: разделить на три равные части данный произвольный угол, удвоить данный куб (т. е. построить сторону куба, объем которого вдвое больше, чем объем куба, сторона которого задана) и выполнить «квадратуру» круга (т. е. построить квадрат, имеющий такую

же площадь, как и данный круг). И в этих проблемах предполагается, что, кроме циркуля и линейки, другие инструменты не применяются.

Проблемы подобного рода, не поддающиеся решению, привели к одному из самых замечательных и оригинальных направлений математической мысли. После нескольких столетий безуспешных поисков математики утвердились в подозрении, что найти решение невозможно. На очередь встал соблазнительный по своей трудности новый вопрос: как можно доказать, что та или иная проблема не может быть разрешена?

В области алгебры тот же вопрос возник в связи с проблемой решения уравнений 5-й и более высоких степеней. В течение XVI столетия было установлено, что алгебраические уравнения степени 3 и 4 решаются посредством той же процедуры, что и квадратные. Эта процедура может быть, вообще говоря, охарактеризована следующим образом: решения, или «корни», уравнения представляются в виде выражений, составленных из коэффициентов уравнения и содержащих операции, из которых каждая есть или рациональная — сложение, вычитание, умножение, деление, — или же извлечение корня — квадратного, кубического или четвертой степени. Говорят короче, что алгебраическое уравнение не выше четвертой степени «решается в радикалах» (radix по-латыни означает «корень»). Казалось как нельзя более естественным пытаться обобщить эту процедуру на уравнения 5-й и более высоких степеней, пользуясь, конечно, и радикалами соответствующих степеней. Но ни одна из попыток не увенчалась успехом. В XVIII столетии были случаи, когда даже выдающиеся математики впадали в заблуждение, предполагая, что решение ими найдено. Но только в начале XIX столетия у итальянца Руффини (1765— 1822) и у гениального норвежского математика Н. Г. Абеля (1802—1829) возникла поистине революционная для того времени идея — доказать невозможность решения в радикалах общего алгебраического уравнения степени п. Нужно понимать совершенно отчетливо, что речь не идет о существовании решения алгебраического уравнения степени п: существование решений было строго доказано Гауссом в его докторской диссертации в 1799 г. Таким образом, уже не было никаких сомнений в том, что каждое алгебраическое уравнение действительно имеет корни, в особенности после того, как были указаны приближенные методы для их вычисления с какой угодно степенью точности. «Численное» решение алгебраических уравнений, имеющее громадное значение в приложениях, прекрасно разработано. Проблема Абеля и Руффини была поставлена совсем иначе: может ли быть найдено решение с помощью одних только рациональных операций и операций извлечения корней? Именно стремление добиться полной ясности в этом вопросе послужило толчком для великолепного развития современной алгебры и теории групп, начатого работами Руффини, Абеля и Э. Галуа (1811 — 1832).

Доказательство невозможности некоторых геометрических построений оказывается примером, иллюстрирующим направление в алгебре, о котором только что было сказано. Именно оперируя алгебраическими понятиями, мы сможем установить в этой главе невозможность и трисекции угла, и построения правильного семиугольника, и удвоения куба с помощью одних только циркуля и линейки. (Проблема квадратуры круга значительно сложнее; см. по этому поводу стр. 167.) Подходя ближе к интересующему нас вопросу, мы сосредоточимся не на его отрицательной стороне — невозможности выполнения тех или иных построений, а придадим ему положительный характер: как могут быть полностью охарактеризованы задачи на построение, допускающие решение? После того как ответ на этот вопрос будет найден, не составит труда установить, что рассматриваемые нами проблемы не входят в эту категорию.

В возрасте 17 лет Гаусс исследовал возможность построения правильных «р-угольников», где р — простое число. В то время были известны построения только для случаев р = 3 и р = 5. Гаусс установил, что построения возможны в том и только том случае, если р есть простое «число Ферма»:

р = 22" + 1.

Первые числа Ферма суть 3, 5, 17, 257, 65537 (см. стр. 50). Это открытие произвело на Гаусса такое впечатление, что он сразу отказался от филологической карьеры и решил посвятить свою жизнь математике и ее приложениям. Он и позднее смотрел на это первое из своих открытий с особенной гордостью. После смерти Гаусса в Гёттингене была воздвигнута его бронзовая статуя, с пьедесталом в форме правильного 17-угольника. Трудно придумать более достойную почесть.

Когда речь идет о геометрических построениях, никак не следует упускать из виду, что проблема заключается не в практическом вычерчивании фигур с известной степенью аккуратности, а в том, может ли построение быть выполнено теоретически, предполагая, что наши инструменты дают абсолютную точность. Гаусс доказал именно принципиальную возможность рассмотренных им построений. Его теория не касается того, как выполнить построение на самом деле, какие следует использовать приемы, чтобы упростить процедуру или даже уменьшить число необходимых конструктивных операций. Все это — вопросы не столь высокого теоретического значения. С практической точки зрения, такие построения не дают столь удовлетворительного результата, какой может быть достигнут посредством хорошего транспортира. Вероятно, именно непониманием теоретического характера вопроса о геометрических построениях, с одной стороны, а с другой — упорным нежеланием считаться с прекрасно установленными научными фактами нужно объяснять то обстоятельство, что еще продолжают существовать нескончаемые вереницы «трисекторов» и

«квадратурщиков». Тем из них, которые способны понимать элементарную математику, можно порекомендовать заняться изучением этой главы.

В заключение отметим, что в известном отношении наша постановка вопроса о геометрических построениях представляется искусственной. Циркуль и линейка, конечно, простейшие из геометрических инструментов, но требование ограничиваться именно этими инструментами при построениях не вытекает из существа самой геометрии. Как уже давным-давно установили греческие математики, некоторые проблемы — скажем, удвоение куба — могут быть решены, например, с привлечением угольника (с прямым углом); можно изобрести всякие другие инструменты, помимо циркуля, которые позволили бы чертить эллипсы, гиперболы и более сложные кривые: тем самым область фигур, допускающих построение, была бы значительно расширена. Однако мы будем придерживаться прочно установившегося понимания выполнимости геометрических построений, подразумевая, что разрешено пользоваться только циркулем и линейкой.

ЧАСТЬ 1

Доказательства невозможности и алгебра

§ 1. Основные геометрические построения

1. Построение полей и извлечение квадратных корней. В порядке развития общих идей мы начнем с рассмотрения небольшого числа классических построений. Более углубленное изучение возможности геометрических построений неизбежно связано с переводом геометрической задачи на язык алгебры. Всякая проблема геометрического построения может быть схематизирована следующим образом: дано некоторое число отрезков, скажем, а, 6, с,...; требуется построить один или несколько отрезков je, г/, ... Даже если на первый взгляд проблема имеет совсем иной вид, ее всегда можно переформулировать таким образом, чтобы она включилась в указанную схему. Искомые отрезки фигурируют или в виде сторон треугольника, который требуется построить, или в виде радиусов кругов, или как прямоугольные координаты каких-то искомых точек (см., например, стр. 151). Предположим для простоты, что требуется построить какой-то отрезок х. В таком случае геометрическое построение приводит к решению алгебраической задачи: установить соотношение (в форме уравнения) между искомой величиной х и данными величинами а, Ьу с, ...; затем, решая это уравнение, найти формулу для величины х и, наконец, выяснить, можно ли свести вычисление х к таким алгебраическим процедурам, которые соответствуют построениям, выполнимым с помощью

циркуля и линейки. Таким образом, в основе всей рассматриваемой теории лежит принцип аналитической геометрии — количественная характеристика геометрических объектов, основанная на введении континуума действительных чисел.

Заметим прежде всего, что простейшие алгебраические операции соответствуют элементарным геометрическим построениям. Если даны два отрезка, длины которых равны а и b (измерение производится посредством «единичного» отрезка), то очень легко построить а + b, а - Ь, га (где г — рациональное число), j и ab.

Чтобы построить а + b (рис. 27), мы проводим прямую линию и на ней откладываем циркулем отрезки ОА = а и AB = b. Тогда OB = а + b. Точно так же в случае а - b мы откладываем OA = а и AB = b, но на этот раз откладываем b в сторону, противоположную той, в которую отложили а. Тогда OB = а — b. Чтобы построить За, мы просто строим а + а + а\ аналогично поступаем, если нужно построить рау где р — целое число. Отрезок ^ строится следующим приемом (рис. 28): на произвольной прямой откладываем OA = а и затем проводим другую прямую через точку О. На этой прямой откладываем произвольный отрезок ОС = с и строим OD = Зс. Соединяем А и D прямой линией и проводим через точку С прямую, параллельную AD\ пусть эта прямая пересекает OA в точке В. Треугольное пут * OB OB ОС \ ~D а ~ ники ОВС и OAD подобны; значит, — = — = — = - и ОВ =-. Таким же образом можно вообще построить —, где q — целое. Совершая эту операцию над отрезком рау мы построим га, где г = — — какое угодно рациональное число.

Чтобы построить ^ (рис. 29), откладываем OB = b и OA = а на сторонах произвольного угла с вершиной О и на стороне OB откладываем

Рис. 27. Построение а + b и а — b Рис. 28. Построение ^

отрезок OD = 1. Через D проводим прямую, параллельную AB; пусть она пересекает OA в точке С. Тогда будем иметь: ОС = Построение показано на рис. 30; здесь AD — прямая, проходящая через А и параллельная ВС.

Из этих соображений вытекает, что «рациональные» алгебраические операции — сложение, вычитание, умножение и деление, — производимые над заданными величинами, могут быть выполнены посредством геометрических построений. Исходя из данных отрезков, измеряемых действительными числами а, 6, с, ..., мы можем, последовательно выполняя эти простые построения, построить любую величину, которая через а, ft, с, ... выражается рационально, т. е. с помощью лишь перечисленных выше четырех основных действий. Совокупность всех величин, которые таким образом могут быть получены из а, ft, с, образует то, что называется числовым полем — множество чисел, обладающее тем свойством, что любая рациональная операция, совершенная над двумя (или более) элементами этого множества, приводит снова к элементу этого же множества. Мы напоминаем, что совокупность всех рациональных чисел, совокупность всех действительных чисел, совокупность всех комплексных чисел образуют такие поля. В рассматриваемом нами теперь случае говорят, что поле порождается данными числами a, ft, с, ...

Существенно новой операцией, выводящей нас за пределы полученного поля, является извлечение квадратного корня. Если задан отрезок а, то отрезок у/а может быть построен с помощью только циркуля и линейки. На произвольной прямой мы откладываем OA = а и AB = 1 (рис. 31). Проводим, далее, окружность с диаметром OB и из точки А восставляем перпендикуляр к OB; пусть он пересекает окружность в точке С. Угол С в треугольнике ОВС прямой (согласно теореме, известной из элемен-

Рис. 29. Построение

Рис. 30. Построение ab

Рис. 31. Построение

тарной геометрии: угол, вписанный в полуокружность, прямой). Значит, /.ОСА = /.ABC, прямоугольные треугольники ОАС и CAB подобны, и, полагая АС = х, мы получаем

2. Правильные многоугольники. Рассмотрим теперь несколько более сложные конструктивные задачи. Начнем с построения правильного десятиугольника. Предположим, что правильный десятиугольник вписан в круг радиуса 1 (рис. 32); обозначим его сторону через х. Так как центральный угол, под которым эта сторона х видна из центра круга, содержит 36°, то остальные два угла большого треугольника содержат каждый по 72°, и значит, пунктирная линия, делящая пополам угол А, разбивает треугольник ОАВ на два равнобедренных треугольника с равными боковыми сторонами длины х. Радиус круга, таким образом, составляется из отрезков x и 1-х. Так как треугольник ОАВ подобен меньшему из двух треугольников, на которые он разбивается, то мы получаем — = -—-. Эта пропорция приводит к квадратному уравнению х2 + х - 1 = 0, решение которого имеет вид л/5- 1 , x = —£—• (Другое решение нас не интересует, так как оно соответствует отрицательному значению х.) Из полученной формулы ясно, что отрезок х может быть построен геометрически. Имея же отрезок х, мы сможем построить правильный десятиугольник, откладывая по окружности десять раз хорду x. Отсюда уже легко получить и правильный пятиугольник, соединяя вершины десятиугольника через одну.

Вместо того чтобы строить \/5 тем методом, который указан на рис. 31, мы можем построить гипотенузу прямоугольного треугольника со сторонами 1 и 2. Затем нужно отнять единичный отрезок и то, что получится, разделить пополам.

Отношение ^ в рассмотренной задаче было названо «золотым», так как, по мнению греческих математиков, прямоугольник, стороны которого находятся в этом отношении, эстетически особенно приятен для глаза. Значение отношения приблизительно равно 1,62.

Из всех правильных многоугольников легче всего построить шестиугольник. Так как длина стороны такого шестиугольника, вписанного в

Рис. 32. Правильный десятиугольник

круг, равна радиусу круга, то сам шестиугольник строится без затруднений, если мы отложим шесть раз по окружности отрезок, равный радиусу.

Имея правильный я-угольник, можно сейчас же получить и правильный 2я-угольник, деля пополам дуги между соседними вершинами /г-угольника. Начиная с диаметра круга (правильного вписанного «двуугольника»), мы построим последовательно 4, 8, 16, 2"-угольники. Таким же образом, начиная с шестиугольника, мы получим 12, 24, 48, .. .-угольники, а начиная с десятиугольника, — 20, 40, .. .-угольники.

Если sn обозначает длину стороны правильного «-угольника, вписанного в единичный круг (т. е. круг с радиусом 1), то сторона правильного вписанного 2я-угольника будет иметь длину

Доказывается это следующим образом (рис. 34): пусть sn = DE = 2DC, s2n = DB и AB = 2. Площадь прямоугольного треугольника ABD равна ^ BD • AD, или, с другой стороны, AB • CD. Так как AD = V'AB2 — DB2, то, подставляя AB = 2, BD = s2n, CD = ^sn и сравнивая между собой два выражения для площади, мы получаем

Остается решить квадратное уравнение относительно х = s\n и при выборе корня принять во внимание, что х должно быть меньше 2.

Из этой формулы, так как длина s4 (сторона квадрата) равна у/2, следует, что

Рис. 33. Правильный шестиугольник

Рис. 34. Удвоение числа сторон правильного многоугольника

В качестве общей формулы мы получаем (при п > 2)

причем в правой части должно быть всего п — 1 радикалов. Периметр 2"-угольника, вписанного в круг радиуса 1, равен 2ns2n. Когда п стремится к бесконечности, этот периметр в пределе переходит в длину окружности, по определению равную 2к:

Деля на два и подставляя m вместо п— 1, мы получаем следующую формулу для гс:

Упражнение. Пользуясь тем, что 2т —* оо, докажите, как следствие, что

Резюмируем полученные здесь результаты таким образом: стороны вписанных в единичный круг правильных 2п-угольников, 5 • 2п-угольников и 3 • 2п-угольников вычисляются посредством рациональных операций — сложения, вычитания, умножения, деления — и операции извлечения квадратного корня; следовательно, они могут быть построены с помощью только циркуля и линейки.

3. Проблема Аполлония. Другая конструктивная проблема, решающаяся весьма просто, если подойти к ней с алгебраической точки зрения,— это знаменитая и уже упомянутая выше проблема Аполлония о проведении окружности, касательной к трем данным окружностям. В настоящем контексте нам не представляется необходимым искать ее особенно элегантное решение. Нам существенно лишь установить принципиально важное положение: проблема Аполлония решается с помощью циркуля и линейки. Мы вкратце приведем соответствующее доказательство; вопрос же о наиболее элегантном построении будет разобран ниже (см. стр. 187).

Пусть центры трех данных окружностей имеют соответственно координаты (jti, ух), (х2, у2) и (х3, уз), а радиусы равны г,, г2 и г3. Обозначим координаты центра искомой окружности через (х, у), а радиус через г. Легко написать условие касания двух окружностей, если учесть, что расстояние между центрами должно равняться сумме или разности радиусов, смотря по тому, имеет ли место внешнее или внутреннее касание. Записывая в

Рис. 35. Окружности Аполлония

алгебраической форме три условия задачи, мы получаем три уравнения

(1)

(2) (3)

которые после преобразований принимают вид

(1а)

И т. п.

В каждом из уравнений нужно брать знак плюс или минус, в зависимости от того, каково касание — внешнее или внутреннее (рис. 35). Все уравнения (1), (2), (3) — второй степени относительно неизвестных jt, у, г, но они обладают тем свойством, что члены второй степени входят в одинаковой комбинации, как видно из развернутой формы (1а). Таким образом, вычитая (2) из (1), мы получаем уравнение, линейное относительно x, у, г:

(4)

и т.д. Точно так же, вычитая (3) из (1), будем иметь другое линейное уравнение

(5)

Решая уравнения (4) и (5) относительно неизвестных х и у, которые, таким образом, выразятся линейно через г, и затем подставляя в (1), придем к

уравнению, квадратному относительно г, каковое может быть решено с помощью рациональных операций и извлечения корня (см. стр. 149). Это уравнение, вообще говоря, будет иметь два решения, из которых лишь одно будет положительным. Определив г, найдем дальше значения де и у, подставляя г в ранее полученные формулы. Окружность с центром (x, у) и радиусом г должна быть касательной к трем данным окружностям. Во всей процедуре решения участвуют только рациональные операции и извлечение квадратного корня. Отсюда следует, что построение ху у и г может быть выполнено с помощью только циркуля и линейки.

В общем случае будет иметься 8 решений проблемы Аполлония в соответствии с возможными 2-2-2 = 8 комбинациями в выборе знаков + и - в уравнениях (1), (2) и (3); выбор же знаков надлежит делать в зависимости от того, какого рода касание — внешнее или внутреннее — желательно иметь по отношению к каждой из данных окружностей. Вполне возможно, что наша алгебраическая процедура не приведет к действительным значениям л:, у и г. Таков будет, например, случай, когда все три данные окружности — концентрические; тогда, очевидно, наша геометрическая задача не будет иметь ни одного решения. Следует также предвидеть возможность и случаев «вырождения»; например, если все три окружности «вырождаются» в точки, лежащие на одной прямой, тогда аполлониева окружность тоже «вырождается» в эту самую прямую. Мы не видим необходимости рассматривать вопрос во всех подробностях: это сделает сам читатель, если обладает некоторыми алгебраическими навыками.

§ 2. Числа, допускающие построение, и числовые поля

1. Общая теория. В предыдущем изложении мы постарались охарактеризовать общий, так сказать, алгебраический фон геометрических построений. Каждое геометрическое построение представляет ряд последовательных этапов из числа следующих: 1) проведение прямой линии через две точки, 2) нахождение точки пересечения двух прямых, 3) проведение окружности с данным центром и радиусом, 4) нахождение точки пересечения окружности с другой окружностью или прямой линией. Элемент (точка, прямая, окружность) считается известным в том случае, если он задается условием задачи или если он построен на предыдущей стадии задачи. Проводя теоретический анализ задачи, мы относим всю рассматриваемую конструкцию к некоторой координатной системе x, у (см. стр. 99). Тогда заданные элементы изображаются в виде точек или отрезков в плоскости Х, у. Если задан только один отрезок, его можно принять в качестве единичного, в результате чего фиксируется точка х= 1, у = 0. Иногда в процессе построения возникают произвольные элементы: проводятся

произвольные прямые, строятся произвольные точки или круги. (Пример произвольного элемента мы имеем при нахождении середины отрезка: мы проводим два круга с центрами в концах отрезка и с одинаковыми, но произвольными радиусами, затем соединяем точки их пересечения.) В подобных случаях всегда можно считать произвольный элемент рациональным: произвольную точку можно выбрать так, чтобы у нее были рациональные координаты, произвольную прямую ах + by + с = О так, чтобы у нее были рациональные коэффициенты a, è, с, произвольный круг — так, чтобы рациональными были координаты центра и радиус. Мы условимся, что если в построении участвуют произвольные элементы, мы будем выбирать их рациональными: раз эти элементы в самом деле произвольны, такой выбор не повлияет на результат построения.

Ради простоты допустим в ближайшем рассуждении, что в условии задачи задается только один элемент — отрезок длины 1. Тогда в соответствии с результатами § 1 мы можем построить с помощью циркуля и линейки все числа, получающиеся из единицы посредством рациональных операций, т. е. рациональные числа —, где г и s — целые числа. Система рациональных чисел «замкнута» по отношению к рациональным операциям: сумма, разность, произведение, частное (исключая, как всегда, деление на 0) двух рациональных чисел снова являются рациональными числами. Всякое множество чисел, обладающее таким свойством замкнутости по отношению к четырем рациональным операциям, мы назвали числовым полем (стр. 81).

Упражнение. Покажите, что каждое числовое поле во всяком случае содержит все рациональные числа. (Указание: если а есть какое-нибудь не равное нулю число из поля /\ то — = 1 также принадлежит к Z7, а из 1 можно получить все рациональные числа посредством рациональных операций.)

Отправляясь от единицы, можно построить все рациональное числовое поле и, следовательно, все рациональные точки (т. е. точки, у которых обе координаты рациональны) в плоскости х, у. Дальше, с помощью циркуля можно построить новые, иррациональные числа вроде числа л/2, которое, как мы знаем из главы II, § 2, находится уже за пределами рационального поля. Но построив л/2, можно еще дальше с помощью «рациональных» построений (§ 1) получить все числа вида

(1)

где а и b рациональные и, следовательно, сами допускают построение. Можно также построить и числа вида

где a, ft, с, d — рациональные. Однако эти числа всегда можно написать в форме (1). В самом деле,

где р и q рациональные. (Знаменатель с2 — 2d2 отличен от нуля, так как из с2 - 2d2 = О следовало бы у/2 = ~, что противоречит факту иррациональности у/2.) Точно так же

где г и 5 рациональные. Итак, все, что мы можем построить исходя из у/2, это числа вида (1), где а и ft— произвольные рациональные числа.

Упражнение. Напишите в форме (1) числа

где положено

Как показывает предшествующее рассуждение, числа (1) снова образуют поле. Это поле обширнее, чем поле рациональных чисел, и включает его как часть («подполе»). Но, конечно, новое поле менее обширно, чем поле всех действительных чисел. Обозначим через F0 поле рациональных чисел, а через F\ —поле чисел вида (1). Мы установили возможность построения каждого числа из «расширенного» поля F\. Можно и дальше расширять область чисел, допускающих построение, например, таким образом: выберем число из поля F\% скажем k = 1 + у/2, и, извлекая из него корень, получим новое допускающее построение число

Это число, в свою очередь, порождает (§ 1) поле, состоящее из всех чисел вида гт

(2)

где р и q теперь уже числа из поля F\% т. е. вида а + Ьу/2, где a, b из F0i т. е. рациональные.

Упражнение. Представьте числа

в форме (2).

Все эти числа были построены в предположении, что первоначально был задан только один отрезок. Если задано два отрезка, то один из них можно принять за

единичный. Предположим, что второй отрезок выражается через первый в виде числа а. Тогда можно построить поле G, состоящее из всех чисел вида

где flOi .. •» о-т и bo, ..., bn — рациональные, атия — произвольные целые положительные числа.

Упражнение. Считая заданными отрезки 1 и а, выполните построения для

Будем исходить теперь из более общего предположения, что мы умеем строить все числа некоторого числового поля F. Убедимся, что применение одной линейки не выведет нас за пределы поля F. Уравнение прямой, проходящей через две точки с координатами ах, Ь\ и а2у Ь2 из поля /% имеет вид (b\ - b2)x + (а2 - а\)у + (а\Ь2 - а2Ь\) = 0 (см. стр. 522 и далее); коэффициенты в этом уравнении рационально зависят от чисел из поля F и, следовательно, сами принадлежат полю F. Далее, если у нас имеются две прямые olx + ßy + у = 0 и ol'x + ß'y + у' — О с коэффициентами из /% то координаты точки пересечения, получающиеся при решении системы этих уравнений, суть

Так как и они тоже являются числами из /\ то ясно, что применение одной только линейки не выведет нас за пределы F.

Упражнение. Прямые х + \/2у — 1=0, 2х — у + у/2 = 0 имеют коэффициенты, принадлежащие полю (1). Вычислите коэффициенты точки их пересечения и проверьте, что они также вида (1); соедините точки (1, у/2) и (л/2, 1 — \/2) прямой линией ах + by -h с = 0 и проверьте, что коэффициенты а, Ьу с имеют вид (1). То же сделйте по отношению к полю (2) для прямых

и для точек

Но с помощью циркуля можно выбраться за пределы поля F. Для этой цели выберем в поле F такое число что число Vk уже не будет принадлежать F. Число \fk можно построить с помощью циркуля, так же как и все числа вида

(3)

где a, b — произвольные числа из F. Сумма и разность двух таких чисел

их произведение

и их отношение

— снова числа вида р + qy/ky где р и q принадлежат F. (Знаменатель не обращается в нуль, так как с и d одновременно не обращаются в нуль: иначе мы получили бы y/k = что противоречит допущению, что y/k не принадлежит F.) Итак, множество чисел вида a + by/k образует некоторое поле F'. Поле F' включает поле F как «подполе» (достаточно положить Ь = 0). Будем называть F' «расширенным» полем.

В качестве примера рассмотрим поле F чисел вида a + by/2, где a, b рациональные: возьмем k = у/2. Тогда числа расширенного поля F' имеют вид р + qy/2, где р и q принадлежат F, р = а + by/2, q = a' + b'y/2, а числа a, Ьу а'у Ь' — рациональные. Всякое число из F может быть записано в этой форме, например,

Упражнение. Пусть F есть поле

числа a, b рациональные. Представьте

в таком же виде.

Мы убедились, что, отправляясь от некоторого поля F чисел, допускающих построение, и выбрав произвольное число k из этого поля, мы можем с помощью циркуля и линейки построить число y/k, а значит, и все числа вида a -h by/k, где a, b принадлежат F.

Покажем теперь, обратно, что, пользуясь только циркулем, мы можем получить числа только указанного вида. В самом деле, в результате однократного применения циркуля можно сделать только одно из двух: или найти точку пересечения окружности и прямой, или найти точку пересечения двух окружностей (то и другое равносильно построению координат точки пересечения). Окружность с центром (£, г)) и радиусом г имеет уравнение (х - I)2 + (у - г))2 = г2; поэтому, если г), г принадлежат Fy то уравнение окружности, записанное в виде

будет иметь коэффициенты а, ß, у, принадлежащие также F. Прямая линия

соединяющая две точки с координатами F, имеет также коэффициенты из F (см. стр. 156). Исключая у из этих двух уравнений, мы получаем для координаты х точки пересечения окружности и прямой квадратное уравнение вида

с коэффициентами А, В, С из F (именно,

Решение дается формулой

которая имеет вид р + qy/k, где р, q, k принадлежат F. Такая же формула получается и для координаты у точки пересечения.

С другой стороны, если речь идет о двух окружностях

то, вычитая одно уравнение из другого, мы получим линейное уравнение

которое можно решить совместно с одним из уравнений двух окружностей.

В обоих случаях построение дает нам обе координаты одной или двух новых точек, и эти новые величины имеют вид р -h qy/k, причем р, q, k принадлежат F. В частности, y/k может сам оказаться принадлежащим F, например, если k = 4. Но, вообще говоря, этого не будет.

Упражнение. Рассмотрим окружность с центром в начале координат и радиусом 2у/2 и прямую, соединяющую точки о), (4>/2, у/2). Определите поле F\ порождаемое точками пересечения окружности и прямой. Сделайте то же по отношению к точкам пересечения данной окружности с окружностью, у которой радиус равен а центр есть (0, 2у/2).

Подведем еще раз итоги. Отправляясь от некоторых заданных величин (отрезков или чисел), с помощью одной только линейки мы можем построить все величины из поля F, порождаемого данными величинами с помощью рациональных операций, но не выйдем за пределы этого поля. Воспользовавшись циркулем, мы расширяем поле величин, допускающих построение, и получаем новое расширенное поле F, состоящее из чисел вида а + by/k, где a, b, k принадлежат F. Поле F есть подполе поля F': всякое число из F принадлежит также Р, так как в формуле а + by/k

можно положить b = 0. (Предполагается, что \[k есть новое число, не принадлежащее F\ иначе F совпало бы с F.) Мы убедились, что в результате каждого геометрического построения (т. е. проведения прямой через две известные точки; проведения окружности, имеющей известный центр и известный радиус; нахождения пересечения двух известных прямых или окружностей) или получаются величины, принадлежащие первоначальному полю, или же, при построении квадратного корня, открывается новое, расширенное поле величин, допускающих построение.

Мы теперь в состоянии точно охарактеризовать совокупность всех величин, допускающих построение с помощью только циркуля и линейки. Будем исходить из некоторого поля F0, определяемого величинами, входящими в условие задачи; например, это будет поле рациональных чисел, если задан только один отрезок, выбираемый в качестве единичного. Далее, «присоединяя» к полю величину у/Щ, (где k0 принадлежит F0, но у/Щ ему не принадлежит), строим новое поле F\ чисел, допускающих построение вида а0 + Ьоу/Щ, где a0î b0 принадлежат F0. Еще дальше, посредством «присоединения» \fk[ (где k\ принадлежит F\, но \fk\ не принадлежит), получается новое поле F2 чисел вида ах + b\\fk[, где ах и Ь\ принадлежат F|. Повторяя эту процедуру, приходим вообще к полю Fn после «присоединения» п квадратных корней. С помощью только циркуля и линейки допускают построение те и только те числа, которые после конечного числа «присоединений» описанного выше типа включаются в расширенное поле Fn. Число п необходимых «присоединений» не имеет особенно большого значения; но оно до некоторой степени характеризует, насколько сложна рассматриваемая проблема.

Иллюстрируем описанную процедуру следующим примером. Нужно построить число

Пусть F0 — поле рациональных чисел. Полагая k0 = 2, получаем поле F\, содержащее число 1 + \/2. Возьмем затем k\ = 1 + у/2 и k2 = 3. Число 3 содержится уже в начальном поле F0, значит, и подавно в поле F2, так что положить k2 = 3 вполне допустимо. Потом возьмем

и, наконец, k4 = \J\J\ + V2 + y/3 -h 5. Полученное после этого поле F5 уже содержит интересующее нас число, так как \/б в нем содержится: действительно, у/2 и \/3, а следовательно, и их произведение, содержатся уже в F3, значит, и подавно — в F5.

Упражнение. Отправляясь от рационального поля, проверьте, что сторона правильного 2т-угольника (см. стр. 151) допускает построение (п = m — 1). Проследите за тем, какова последовательность постепенно расширяемых полей.

Сделайте то же самое с числами

2. Все числа, допускающие построение — алгебраические. Если начальное поле Fo есть рациональное поле (порождаемое единственным отрезком), то все числа, допускающие построение, принадлежат к числу алгебраических. (Определение алгебраических чисел было дано на стр. 130.) Именно, числа поля F\ являются корнями квадратных уравнений, числа поля F2 — корнями уравнений четвертой степени, и вообще, числа поля Fk — корнями уравнений степени 2к с рациональными коэффициентами. Докажем это сначала для поля F2, причем начнем с примера. Пусть х = у/2 + \/3 4- у/2. Мы получаем (х — у/2)2 = 3 4- у/2, x2 4- 2 — 2у/2х = 3 4- \/2, или х2 — 1 = у/2(2х 4-1) — квадратное уравнение с коэффициентами из F\. Возведение в квадрат приводит к уравнению четвертой степени с рациональными коэффициентами. В общем случае любое число поля F2 имеет вид

(4)

где р, q, w принадлежат полю Fi и, значит, имеют вид р = а 4- b\fs, q = с + dy/s, w = е + fy/s, где a, by с, dy е, /, s — рациональные числа. Из равенства (4) мы получаем

причем все коэффициенты принадлежат полю Fi, порождаемому величиной Поэтому последнее равенство можно переписать в виде

где коэффициенты г, 5, /, w, v — рациональные. Возводя в квадрат, получим уравнение четвертой степени

(5)

с рациональными коэффициентами, как и требовалось.

Упражнения. 1) Постройте уравнения с рациональными коэффициентами для чисел

2) Постройте таким же образом уравнения восьмой степени для чисел

Чтобы закончить доказательство теоремы в общем случае, когда х принадлежит полю Fk с произвольным индексом /г, достаточно установить, как выше, что х удовлетворяет квадратному уравнению с коэффициентами из поля

Затем, повторяя процедуру доказательства, убеждаемся, что х удовлетворяет уравнению степени 22 = 4 с коэффициентами из поля Fk-ч, и т. д.

Упражнение. Закончите это общее доказательство, применяя метод математической индукции: докажите, что х удовлетворяет уравнению степени 21 с коэффициентами из поля Fk-i, 0 < / ^ k. При / = k получается окончательный результат.

§ 3. Неразрешимость трех классических проблем

1. Удвоение куба. Теперь мы уже достаточно подготовлены к исследованию известных еще с древности проблем трисекции угла, удвоения куба и построения правильного семиугольника. Рассмотрим прежде всего проблему удвоения куба.

Если данный куб имеет ребро, равное единице, его объем будет равен кубической единице; требуется найти ребро х куба, объем которого вдвое больше. Итак, искомое ребро удовлетворяет простому кубическому уравнению

jt3-2 = 0. (1)

Наше доказательство невозможности построения числа х с помощью только циркуля и линейки будет носить «косвенный» характер. Допустим, что такое построение возможно. Тогда, согласно полученным выше результатам, число x должно принадлежать некоторому полю Fkj полученному так, как было объяснено раньше, — из рационального поля посредством последовательного «присоединения» квадратных корней. Мы сейчас убедимся в том, что такое допущение приведет к противоречию.

Мы уже знаем, что число х не может принадлежать рациональному полю F0, так как \/2 есть число иррациональное (см. упражнение 1 на стр. 86). Значит, придется допустить, что оно принадлежит одному из расширенных полей Fkl где k — целое положительное число. Мы имеем право допустить, что k есть наименьшее из таких целых чисел, т. е. что х принадлежит Fky но не принадлежат Fk_\. Это значит, что х имеет вид

где pyqww принадлежат какому-то полю Fk-\, но y/w ему не принадлежит. Основываясь, далее, на довольно простом алгебраическом рассуждении (подобные рассуждения приходится применять нередко), мы убедимся, что если р + qy/w есть решение уравнения (1), то у = р — qy/w есть также его решение. Так как х принадлежит полю Fkl то х3 и х3 — 2 тоже принадлежат Fk и, значит,

(2)

где а и b принадлежат Fk-\. Нетрудно подсчитать, что а = р3 -f 3pq2w — 2, b = Sp2q + q3w. Если положим

то сразу видно, что

(2')

Так как мы предположили, что х есть корень уравнения (1), то

(3)

Но из последнего равенства следует (это основной момент рассуждения!), что оба числа а и b равны нулю. Действительно, если бы b было отлично

от нуля, то из (3) получилось бы равенство y/w = -™, это противоречит допущению, что y/w не принадлежит полю Fk_\. Итак, b = О, и тогда из (3) следует, что а = 0. Но раз мы установили, что а = b = 0, то уже из равенства (2') немедленно вытекает, что у = р — qy/w есть решение уравнения (1), так как у3 - 2 = 0. Далее у Ф х, т. е. х - у ^ 0, так как число X — у = 2qy/w могло бы обращаться в нуль только при q = 0, а в этом случае х = р принадлежало бы полю чего мы не предполагали.

Мы установили, что если х = р + есть корень кубического уравнения (1), то у = р — qy/w есть другой, не равный ему, корень того же уравнения. Но это немедленно приводят к противоречию: у = р - qy/w есть, очевидно, действительное число, так как числа р, q, y/w действительные, уравнение же (1) имеет только один действительный корень, а два — мнимых (см. стр. 125).

Наше первоначальное допущение привело к противоречию, значит, оно ошибочно; поэтому корень уравнения (1) не может принадлежать никакому полю Fk. Итак, удвоение куба с помощью только циркуля и линейки невозможно.

2. Одна теорема о кубических уравнениях. Заключительная часть только что приведенного алгебраического рассуждения была приспособлена к специальному уравнению, которым мы занимались. Но если мы хотим исследовать две другие проблемы древности, то желательно основываться на некоторой теореме общего характера. С алгебраической точки зрения все три проблемы связаны с решением кубического уравнения. Отлично известно, что если xb x2, x3 — три корня кубического уравнения

(4)

то они связаны между собой соотношением

(5)

Рассмотрим кубическое уравнение (4), в котором коэффициенты а, Ь, с пусть будут рациональными числами. Может, конечно, случиться, что один из корней уравнения есть рациональное число: например, уравнение хъ --1=0 имеет один корень 1 — рациональный, тогда как два других, удовлетворяющих квадратному уравнению х2 + х + 1 = 0, — мнимые. Но мы сейчас докажем такую общую теорему: если кубическое уравнение с рациональными коэффициентами не имеет рациональных корней, то ни один из его корней не может быть построен с помощью циркуля и линейки, исходя из рационального поля F0.

Доказательство будем вести, как раньше, косвенным методом. Допустим, что число X, являющееся корнем уравнения (4), допускает построение. Тогда X должно принадлежать некоторому полю Fk, последнему в цепи постепенно расширяемых полей F0, F\, Fk.

Мы, как раньше, имеем право допустить, что никакой корень уравнения (4) не принадлежит полю Fk-\. (Что k не есть нуль, следует как раз из условия теоремы: х не может быть рациональным числом.) Итак, х может быть записано в виде

причем р, q, w принадлежат полю Fk-\, но \fw не принадлежит Fk_\. Такое же самое рассуждение, какое было проведено в предыдущем пункте, приводит к заключению, что число

также принадлежащее Fk, является корнем уравнения (4). Мы видим, как раньше, что q^O; значит, х Ф у.

Из равенства (5) мы теперь заключаем, что третий корень уравнения (4) дается формулой и = -а - х - у. Но так как х + у = 2р, то, значит,

Радикал y/w здесь исчез, так что оказывается, что и принадлежит полю Fk-\. Это противоречит сделанному допущению, согласно которому k есть наименьшее целое число такое, что некоторое поле Fk содержит корень уравнения (4). Придется отвергнуть сделанное допущение, раз оно

1 Многочлен 23 + az2 + bz + с можно представить в виде произведения трех множителей (z - x\)(z — x2)(z — *з), где х\, х2, *з — корни уравнения (4) (см. стр. 128). Отсюда следует тождество

и так как коэффициенты при одинаковых степенях должны быть равны между собой, то

— Прим. ред.

привело к противоречию, и признать, что ни один из корней уравнения (4) не принадлежит никакому полю Fk. Теорема доказана. На основании этой теоремы можно утверждать, что некоторое число не может быть построено с помощью только циркуля и линейки, как только установлено, что это число является корнем кубического уравнения с рациональными коэффициентами, не имеющего рациональных корней.

Теперь мы можем перейти к рассмотрению двух других проблем древности; заметим, что каждая из них облекается в алгебраическую форму не столь непосредственно, как уже рассмотренная.

3. Трисекция угла. Покажем, что трисекция угла с помощью только циркуля и линейки в общем случае невозможна. Конечно, существуют углы, например углы в 90° или в 180°, для которых трисекция выполняется. Но мы должны показать, что не существует процедуры построения, пригодной для всякого угла. Так как общий метод должен был бы относиться ко всем углам, то наша цель будет достигнута, если мы укажем хотя бы один какой-нибудь угол, для которого трисекция невозможна. Итак, несуществование общего метода трисекции будет установлено, если мы убедимся, что, например, угол в 60° не может быть разделен на три равные части с помощью только циркуля и линейки.

Алгебраический эквивалент рассматриваемой проблемы можно получить разными способами; самый простой способ — считать, что угол 0 задан своим косинусом: cos0 = g. Тогда проблема сводится к вычислению величины x = cos-^. Интересующие нас косинусы связаны между собой простой тригонометрической формулой (см. стр. 124)

Другими словами, проблема трисекции угла 9 (такого, что cos0 = g) равносильна построению корня кубического уравнения

(6)

Так как по предыдущему мы имеем право положить

то уравнение (6) принимает вид

(7)

В силу теоремы, доказанной в предыдущем пункте, для нашей цели достаточно показать, что это уравнение не имеет рациональных корней. Положим v = 2z\ уравнение примет еще более простой вид

(8)

Если бы существовало рациональное число v = -, удовлетворяющее этому уравнению, где г и 5 — целые числа без общего множителя (> 1), то мы

должны были бы иметь равенство г3 - 3s2r = s3. Отсюда следовало бы, что число s3 - г(г2 - 3s2) делится на г, и тогда получилось бы, что г и 5 имеют общий множитель, если только г не равно ±1. Совершенно так же мы заключили бы, что число г3 = s2(s + Зг) делится на s2, а это значило бы, что г и s имеют общий множитель, если только 5 не равно ±1. Но так как дробь j по предположению несократима, то, значит, остается

заключить, что числа г и s равны ±1, т. е. v = ±1. Но подставляя v = +1 и v = — 1 в уравнение (8), мы видим, что в обоих случаях уравнение не удовлетворяется. Итак, уравнение (8), а следовательно, и уравнение (7) не имеют рациональных корней; тем самым невозможность трисекции угла доказана.

Эта теорема доказана в предположении, что линейка рассматривается как инструмент, служащий для проведения прямой через две данные точки, и никак иначе. В самом деле, когда мы давали общую характеристику чисел, которые допускают построение, имелось в виду только такое употребление линейки. Если допустить иные приемы пользования линейкой, то совокупность выполнимых построений чрезвычайно расширяется. Хорошим примером является следующий метод трисекции угла, указываемый в сочинениях Архимеда.

Пусть дан угол х (рис. 36). Продолжим горизонтальную сторону угла влево и затем проведем полукруг с центром О и произвольным радиусом г. Отметим на самой линейке такие точки А и В, что AB = г. Затем приведем линейку в такое положение, чтобы точка А линейки была на продолженной стороне угла, точка В на проведенном полукруге и вместе с тем линейка прошла бы через точку пересечения второй стороны угла с полукругом. В этом положении линейки проведем по ней прямую линию, образующую с продолженной стороной данного угла угол, который обозначим через у.

Упражнение. Докажите, что у = ^.

4. Правильный семиугольник. Перейдем теперь к проблеме построения стороны X правильного семиугольника, вписанного в единичный круг. Проще всего справиться с этой проблемой, если прибегнуть к ком-

Рис. 36. Прием трисекции угла, указанный Архимедом

плексным числам (см. главу ii, § 5). Мы знаем, что вершины правильного семиугольника служат корнями уравнения

(9)

причем координаты х, у каждой вершины являются действительной и мнимой частями комплексного числа z = х + iy. Один из корней есть z = 1, а остальные удовлетворяют уравнению

(10)

(см. стр. 126). Деля на z3, получаем новое уравнение

(11)

Простые алгебраические преобразования приводят его к виду

(12)

Положив теперь

мы приходим окончательно к уравнению третьей степени

(13)

Мы знаем, что г, корень седьмой степени из единицы, дается формулой

(14)

где ф = —— есть угол, под которым из центра круга видна сторона семиугольника; кроме того, из упражнения 2 на стр. 124 следует, что — =

Если мы сумеем построить у, то сумеем построить и coscp, и обратно. Итак, раз будет установлено, что величина у не может быть построена, то тем самым будет установлено, что не могут быть построены ни величина coscp, ни величина z; следовательно, невозможно будет построение семиугольника.

Таким образом, в силу теоремы пункта 2, остается показать, что уравнение (13) не имеет рациональных корней. Это тоже доказывается косвенным методом. Допустим, что уравнение (13) имеет рациональный корень j,

где г и s — целые числа без общих множителей. В таком случае должно удовлетворяться равенство

(15)

отсюда ясно, что г3 делится на s, as3 — на г. Так как г и s — взаимно простые числа, то отсюда следует, что каждое из них равно ±1. Значит, и у,

если только это число рациональное, должно равняться или +1 или — 1. Но подстановка в уравнение (13) показывает, что ни +1, ни -1 не являются корнями уравнения. Итак, нельзя построить величины у, а следовательно, и стороны семиугольника.

5. Замечания по поводу квадратуры круга. Сравнительно элементарные методы позволили нам довести до конца исследование проблем удвоения куба, трисекции угла и построения правильного семиугольника. Но проблема квадратуры круга гораздо сложнее и требует техники математического анализа. Так как круг радиуса г имеет площадь гсг2, то проблема построения квадрата, площадь которого равна площади круга с радиусом 1, равносильна построению числа y/îï, равного стороне искомого квадрата. Число \/к допускает построение в том и только том случае, если допускает построение число гс. Исходя из данной нами общей характеристики чисел, допускающих построение, мы установили бы неразрешимость проблемы квадратуры круга, если бы показали, что тс не содержится ни в каком поле Fk, возникающем из поля рациональных чисел посредством последовательных присоединений квадратных корней. Так как все числа, принадлежащие таким полям, являются алгебраическими, т. е. удовлетворяющими алгебраическим уравнениям с целыми коэффициентами, то неразрешимость квадратуры круга была бы доказана, если бы было установлено, что число гс не алгебраическое, а трансцендентное (см. стр. 130).

Технический аппарат, необходимый для доказательства трансцендентности числа гс, был создан Шарлем Эрмитом (1822—1905), который доказал вместе с тем трансцендентность числа е. Несколько усовершенствовав метод Эрмита, Ф. Линдеман (в 1882 г.) сумел доказать трансцендентность числа гс и тем самым окончательно исчерпал вопрос, остававшийся без ответа на протяжении тысячелетий. Доказательство Линдемана — вне пределов, намеченных для этой книги, хотя оно и по плечу учащемуся, несколько знакомому с математическим анализом.

ЧАСТЬ 2

Различные методы выполнения построений

§ 4. Геометрические преобразования. Инверсия

1. Общие замечания. В настоящей, второй части этой главы мы систематически рассмотрим некоторые общие принципы, которые могут быть приложены к конструктивным проблемам. Многие из этих проблем обозреваются гораздо легче, если смотреть на них с общей точки зрения

«геометрических преобразований». Вместо того чтобы изучать отдельное построение, мы займемся сразу целым классом проблем, связанных между собой теми или иными процедурами преобразований. Способность бросать яркий свет на существо вещей, присущая идее класса геометрических преобразований, никоим образом не ограничена конструктивными проблемами, но имеет ближайшее отношение ко всей геометрии в целом. В главах IV и V мы будем иметь случай оценить роль геометрических преобразований в этом более широком аспекте. Пока же мы подвергнем изучению один из частных типов преобразований — инверсию плоскости относительно окружности, представляющую собой обобщение обыкновенного зеркального отражения относительно прямой линии.

Говоря о преобразовании (отображении) плоскости самой в себя, мы имеем в виду некоторое правило, сопоставляющее каждой точке Р плоскости некоторую другую точку Р' той же плоскости. Точка Р' называется образом точки Р, точка Р — прообразом точки Р'. Простейший пример такого преобразования — зеркальное отражение (осевая симметрия) плоскости относительно данной прямой линии L: точка Р по одну сторону L имеет своим образом точку Р', расположенную по другую сторону L таким образом, что L является перпендикуляром к отрезку РР', восставленным из его середины. Преобразование может оставлять некоторые точки плоскости неподвижными; в нашем примере таковы точки самой прямой L.

Дальнейшими примерами преобразований являются вращения плоскости относительно неподвижной точки О, затем параллельные переносы, перемещающие каждую точку в данном направлении на одно и то же расстояние (это преобразование не имеет неподвижных точек), и, наконец, в качестве несколько более общего примера следует назвать движения плоскости, которые можно представлять себе составленными из вращений и параллельных переносов.

Но в данный момент нас интересует иной, частный класс преобразований,— именно, инверсии относительно окружностей. (Иногда их называют круговыми отражениями, вследствие наличия приблизительного сходства

Рис. 37. Отражение точки относительно прямой

Рис. 38. Инверсия точки относительно окружности

с отражением в сферическом зеркале.) Пусть в неподвижной плоскости задана некоторая окружность С с центром О (называемым центром, или полюсом, инверсии) и радиусом г. Образ точки Р определяется как точка Р\ лежащая на прямой ОР по ту же сторону от О, что и Р, и такая, что

OP'OP' = r2. (1)

Из этого определения следует, что если Р' есть образ Я, то и Р есть (в данном преобразовании) образ Р'. Это дает право называть точки Р и F взаимно обратными относительно окружности С. Инверсия превращает внутреннюю область окружности во внешнюю, и обратно: в самом деле, из неравенства ОР < г следует неравенство ОР' > г и, напротив, из неравенства ОР > г — неравенство ОР' < г. Неподвижными точками плоскости являются точки самой окружности С.

Правило (1) не определяет никакого образа для центра О. Но ясно, что когда движущаяся точка Р приближается к О, ее образ Р' уходит неограниченно далеко. По этой причине иногда говорят, что при инверсии образом центра является бесконечно удаленная точка. Полезность этой терминологии вытекает из того обстоятельства, что она дает нам право утверждать, что инверсия устанавливает взаимно однозначное соответствие между всеми точками плоскости без исключения и их образами: каждая точка плоскости имеет один и только один образ и сама является образом одной и только одной точки. Отметим, что это последнее свойство принадлежит также и раньше приведенным примерам геометрических преобразований.

2. Свойства инверсии. Самое важное свойство инверсии заключается в том, что она преобразует прямые линии и окружности в прямые линии и окружности. Точнее, мы сейчас обнаружим, что в результате инверсии

а) прямая, проходящая через О, становится прямой, проходящей через О,

б) прямая, не проходящая через О, становится окружностью, проходящей через О,

в) окружность, проходящая через О, становится прямой, не проходящей через О,

г) окружность, не проходящая через О, становится окружностью, не проходящей через О.

Утверждение а) не требует доказательства, так как из самого определения инверсии ясно, что каждая точка на рассматриваемой прямой имеет в качестве образа другую точку на той же прямой, так что хотя отдельные точки на прямой перемещаются, но прямая в целом остается неизменной.

Докажем утверждение б). Из О опустим перпендикуляр на данную прямую L (рис. 39). Пусть А — основание этого перпендикуляра, А' — точка, обратная точке А. Возьмем произвольную точку Р на L и обозначим

через Р' точку, ей обратную. Так как OA • OA' = OP • OP' = г2, то отсюда следует, что

Поэтому треугольники ОР'А' и ОАР подобны и, значит, угол ОР'А' прямой. В таком случае из теорем элементарной геометрии вытекает, что Р' лежит на окружности К с диаметром OA'; эта окружность и является, следовательно, образом прямой L. Итак, утверждение б) доказано. Утверждение в) следует из того, что если образ L есть /(, то образ К есть L.

Остается доказать утверждение г). Пусть К — окружность, не проходящая через О, с центром M и радиусом k (рис. 40). Чтобы получить ее образ, проведем через О прямую, пересекающую К в точках А и В, и затем посмотрим, как изменяются образы А' и В\ когда направление прямой

изменяется и она пересекает К самыми разнообразными способами. Обозначим расстояния OA, OB, OA', OB', ОМ через а, Ь, а', Ь', т, и пусть / есть длина касательной к К, проведенной из точки О. По определению инверсии, мы имеем аа' = bb' = г2, а по элементарному геометрическому свойству окружности ab = f. Если разделим первые равенства на второе, то получим

Рис. 39. Инверсия прямой относительно окружности

Рис. 40. Инверсия окружности

где с1 зависит только от г и t и, значит, не зависит от положения точек А и В. Теперь проведем через А' прямую, параллельную ВМ\ пусть Q есть точка ее пересечения с ОМ. Положим OQ = q, A'Q = р. Тогда

или же

Это означает, что при всевозможных положениях А и В точка Q на прямой ОМ всегда будет одна и та же и что расстояние A'Q также не будет меняться. Точно так же B'Q = р, так как — = —. Итак, образами точек А и В на К будут точки, расстояния которых от Q равны постоянной величине р, т. е. образ К есть окружность. Утверждение г) доказано.

3. Геометрическое построение обратных точек. Следующая теорема будет полезна в пункте 4 этого параграфа: точка Р', обратная данной точке Р относительно окружности С, может быть построена геометрически с помощью одного только циркуля. Рассмотрим сначала тот случай, когда точка Р находится вне окружности С. Радиусом ОР опишем круговую дугу с центром Р, пересекающую С в точках R и S. Затем из этих точек как центров опишем круговые дуги радиусом г, равным радиусу круга С; эти дуги пересекутся в О и еще в точке Р' на прямой ОР. В равнобедренных треугольниках ORP и ORP'

ZORP=ZPOR = ZOP'R,

так что треугольники подобны, и потому

Значит, Р' есть искомая точка Р.

Если данная точка Р лежит внутри С, то построение и доказательство остаются в силе, лишь бы окружность радиуса ОР с центром Р пересекала окружность С в двух точках. Если же пересечений не получается, то можно редуцировать построение к предыдущему случаю посредством следующего простого приема.

Рис. 41. Инверсия точки, внешней относительно окружности

Прежде всего заметим, что на прямой, соединяющей две данные точки Л и О, можно с помощью одного циркуля построить такую точку С, что АО = ОС. Для этого достаточно провести окружность с центром О и радиусом г = АО. Затем, начиная от точки Л, отметить последовательно на этой окружности такие точки Я, Q, С, что АР = PQ = QC = г. Тогда С есть как раз искомая точка: это ясно из того, что треугольники АОР, OPQ, OQC — равносторонние, так что угол между OA и ОС содержит 180° и ОС = OQ = АО. Повторяя указанную процедуру, мы имеем возможность отложить отрезок АО по прямой сколько угодно раз. Кстати, так как длина отрезка АО равна гу/З (как читатель проверит без всякого труда), то нам удалось построить \/3, исходя из единичного отрезка, не пользуясь линейкой.

Теперь мы можем построить точку, обратную точке Р относительно окружности С, как бы точка Р ни была расположена внутри С. Прежде всего на прямой ОР найдем такую точку /?, что OR есть кратное ОР, и вместе с тем R лежит уже вне С:

OR = nOP.

Для этого достаточно последовательно откладывать расстояние ОР посредством циркуля, пока мы не выберемся из круга С. Затем с помощью уже известного построения найдем точку /?', обратную точке R. Тогда будем иметь

f = 0R'OR = OR' • (п • ОР) = (п • OR') • OP.

Останется построить точку Р' по условию ОР' = п • OR\ и задача будет закончена.

4. Как разделить отрезок пополам и как найти центр данной окружности с помощью одного циркуля. После того как мы научились находить точку, обратную данной, можно с помощью одного циркуля выполнить дальнейшие интересные построения. Например, сейчас мы найдем середину отрезка, концы которого А и В заданы, с помощью

Рис. 42. Удвоение отрезка

Рис. 43. Инверсия точки, внутренней относительно окружности

одного циркуля — не проводя самого отрезка. Вот решение этой задачи. Опишем окружность радиусом AB с центром ß и на нем, отправляясь от А, как раньше, отмерим последовательно три дуги радиусом AB. Последняя точка С будет лежать на прямой AB, причем мы будем иметь: AB = ВС. Затем опишем окружность радиуса AB с центром А и построим точку С, обратную точке С относительно этой окружности. Тогда получим:

АС - АС = AB2,

АС'2АВ = АВ2,

2АС' = АВ.

Значит, С есть искомая середина отрезка.

Другое построение с помощью одного циркуля, также использующее обратные точки, заключается в нахождении центра данной окружности, когда начерчена только сама окружность, а центр неизвестен. Берем произвольную точку Р на окружности и около нее как центра описываем круг произвольного радиуса, пересекающийся с данным кругом в точках R и 5. Из этих последних точек как центров описываем дуги радиусом RP = SP, пересекающиеся, кроме точки Р, еще в точке Q. Сравнивая то, что получилось, с рис. 41, мы видим, что неизвестный центр Q' есть точка, обратная точке Q относительно окружности с центром Р, и Q' может быть, как мы видели, построена с помощью одного циркуля.

§ 5. Построения с помощью других инструментов. Построения Маскерони с помощью одного циркуля

*1. Классическая конструкция, служащая для удвоения куба. Мы рассматривали до сих пор только проблемы геометрических построений без использования иных инструментов, кроме циркуля и линейки. Если допускаются и другие инструменты, то, разумеется, разнообразие возможных построений сильно увеличивается. Следующий пример может

Рис. 44. Нахождение середины отрезка

Рис. 45. Нахождение центра круга

Рис. 46. Инструмент, служащий для удвоения куба

служить образцом того, как греки решали проблему удвоения куба. Рассмотрим (рис. 46) жесткий прямой угол MZN и подвижной прямоугольный крест VW, PQ. Двум дополнительным стержням RS и TU предоставлена возможность скользить, оставаясь перпендикулярными к сторонам прямого угла. На кресте пусть выбраны фиксированные точки Е и G, причем расстояния GB = а и BE = / заданы. Располагая крест таким образом, чтобы точки £ и G соответственно лежали на NZ и MZ, и перемещая стержни TU и RS, можно весь аппарат привести в такое положение, чтобы лучевые перекладины креста BW, BQ, BV проходили через вершины Л, D, Е прямоугольника ADEZ. Указанное на чертеже расположение всегда возможно при условии f > а. Мы видим сразу, что а : х = х : у = у : /, откуда, в частности, если положено / = 2а, получается х3 = 2а3. Значит, х есть ребро куба, объем которого вдвое больше, чем объем куба с ребром а. Таким образом, поставленная задача решена.

2. Построения с помощью одного циркуля. Если вполне естественно, что с допущением большего разнообразия инструментов оказывается возможным решать более обширное множество задач на построение, то можно было бы предвидеть, что, напротив, при ограничениях, налагаемых

на инструменты, класс разрешимых задач будет суживаться. Тем более замечательным нужно считать открытие, сделанное итальянцем Маскерони (1750—1800): все геометрические построения, выполнимые с помощью циркуля и линейки, могут быть выполнены с помощью одного только циркуля. Следует, конечно, оговорить, что провести на самом деле прямую линию через две данные точки без линейки невозможно, так что это основное построение не покрывается теорией Маскерони. Вместо того приходится считать, что прямая задана, если заданы две ее точки. Но с помощью одного лишь циркуля удается найти точку пересечения двух прямых, заданных таким образом, или точку пересечения прямой с окружностью.

Вероятно, простейшим примером построения Маскерони является удвоение данного отрезка AB. Решение было уже дано на стр. 172. Далее, на стр. 173 мы научились делить данный отрезок пополам. Посмотрим теперь, как разделить пополам дугу окружности AB с центром О. Вот описание этого построения (рис. 47). Радиусом АО проводим две дуги с центрами А и В. От точки О откладываем на этих дугах две такие дуги ОР и OQ, что OP=OQ = AB. Затем находим точку R пересечения дуги с центром Р и радиусом PB и дуги с центром Q и радиусом QA. Наконец, взяв в качестве радиуса отрезок OR, опишем дугу с центром Р или Q до пересечения с дугой AB — точка пересечения и является искомой средней точкой дуги AB. Доказательство предоставляем читателю в качестве упражнения.

Было бы невозможно доказать основное утверждение Маскерони, указывая для каждого построения, выполнимого с помощью циркуля и линейки, как его можно выполнить с помощью одного циркуля: ведь возможных построений бесчисленное множество. Но мы достигнем той же цели, если установим, что каждое из следующих основных построений выполнимо с помощью одного циркуля:

1. Провести окружность, если заданы центр и радиус.

2. Найти точки пересечения двух окружностей.

3. Найти точки пересечения прямой и окружности.

4. Найти точку пересечения двух прямых.

Любое геометрическое построение (в обычном смысле, с допущением циркуля и линейки) составляется из выполнения конечной последовательности этих элементарных построений. Что первые два из них выполнимы с

Рис. 47. Нахождение середины дуги без линейки

помощью одного циркуля, ясно непосредственно. Более трудные построения 3 и 4 выполняются с использованием свойств инверсии, рассмотренных в предыдущем пункте.

Обратимся к построению 3: найдем точки пересечения данной окружности С с прямой, проходящей через данные точки А и В. Проведем дуги с центрами А и В и радиусами, соответственно равными АО и ВО; кроме точки О, они пересекутся в точке Р. Затем построим точку Q, обратную точке Р относительно окружности С (см. построение, описанное на стр. 173). Наконец, проведем окружность с центром Q и радиусом QO (она непременно пересечется с С): ее точки пересечения А' и А'' с окружностью С и будут искомыми. Для доказательства достаточно установить, что каждая из точек X и Л7 находится на одинаковых расстояниях от О и Р (что касается точек А и ß, то аналогичное их свойство сразу вытекает из построения). Действительно, достаточно сослаться на то обстоятельство, что точка, обратная точке Ç, отстоит от точек X и X' на расстояние, равное радиусу окружности С (см. стр. 171). Стоит отметить, что окружность, проходящая через точки Ху X' и О, является обратной прямой AB в инверсии относительно круга С, так как эта окружность и прямая AB пересекаются с С в одних и тех же точках. (При инверсии точки основной окружности остаются неподвижными.)

Указанное построение невыполнимо только в том случае, если прямая AB проходит через центр С. Но тогда точки пересечения могут быть найдены посредством построения, описанного на стр. 175, как середины дуг С, получающихся, когда мы проводим произвольную окружность с центром 5, пересекающуюся с С в точках В\ и ß2.

Рис. 48. Пересечение окружности и прямой, не проходящей через центр

Рис. 49. Пересечение окружности и прямой, проходящей через центр

Метод проведения окружности, обратной прямой, соединяющей две данные точки, немедленно дает и построение, решающее задачу 4. Пусть прямые даны точками А, В и А', В' (рис. 50). Проведем произвольную окружность С и с помощью указанного выше метода построим окружности, обратные прямым AB и А'В'. Эти окружности пересекаются в точке О и еще в одной точке Y. Точка X, обратная точке У, и есть искомая точка пересечения: как ее построить — уже было разъяснено выше. Что X есть искомая точка, это ясно из того факта, что Y есть единственная точка, обратная точке, одновременно принадлежащей обеим прямым AB и А'В'; следовательно, точка X, обратная Y, должна лежать одновременно и на AB, и на А'В'.

Этими двумя построениями заканчивается доказательство эквивалентности между построениями Маскерони, при которых разрешается пользоваться только циркулем, и обыкновенными геометрическими построениями с циркулем и линейкой.

Мы не заботились об изяществе решения отдельных проблем, нами здесь рассмотренных, так как нашей целью было выяснить внутренний смысл построений Маскерони. Но в качестве примера мы еще укажем пятиугольника; точнее говоря, речь идет о нахождении каких-то пяти точек на окружности, которые могут служить вершинами правильного вписанного пятиугольника.

Пусть А — произвольная точка окружности К. Так как сторона правильного вписанного шестиугольника равна радиусу круга, то не представит труда отложить на К такие точки В, С, Д что ^ AB = ^ ВС = ^ CD = 60° (рис. 51). Проведем дуги с центрами AwD радиусом, равным АС; пусть они пересекаются в точке X. Тогда, если О есть центр /(, дуга с центром А и радиусом ОХ пересечет К в точке F, являющейся серединой дуги ВС (см. стр. 175). Затем радиусом, равным радиусу /(, опишем дуги с центром F, пересекающиеся с К в точках G и Я. Пусть Y

Рис. 50. Пересечение двух прямых

Рис. 51. Построение правильного пятиугольника

есть точка, расстояния которой от точек G и H равны ОХ и которая отделена от X центром О. В таком случае отрезок AY как раз и есть сторона искомого пятиугольника. Доказательство предоставляется читателю в качестве упражнения. Интересно отметить, что при построении используются только три различных радиуса.

В 1928 г. датский математик Ельмслев нашел в книжной лавке в Копенгагене экземпляр книги под названием Euclides Danicus, опубликованной в 1672 г. никому не известным автором Г. Мором. По титульному листу можно было сделать заключение, что это — просто один из вариантов евклидовых «Начал», снабженный, может быть, редакторским комментарием. Но при внимательном рассмотрении оказалось, что в ней содержится полное решение проблемы Маскерони, найденное задолго до Маскерони.

Упражнения. В дальнейшем дается описание построений Мора. Проверьте их правильность. Почему можно утверждать, что они решают проблему Маскерони?

1) К отрезку AB длины р восставите перпендикуляр ВС. (Указание: продолжите AB до точки D таким образом, что AB = BD. Проведите произвольным радиусом дуги с центрами А и D и таким образом определите С.)

2) В плоскости даны как угодно расположенные отрезки длины р и q, причем р > q. Постройте с помощью 1) отрезок длины х = у/р2 — q2.

3) По заданному отрезку а постройте отрезок ау/2. (Указание: обратите внимание, что (ау/2)2 = (ау/З)2 - а2.)

4) По данным отрезкам р и q постройте отрезок х = у/р2 + q2. (Указание: примите во внимание, что х2 = 2р2 - (р2 — q2).) Придумайте сами аналогичные построения.

5) Пользуясь предыдущими результатами, постройте отрезки р + q и р - q, предполагая, что отрезки длины р и q заданы как-то на плоскости.

6) Проверьте и постарайтесь обосновать следующее построение середины M данного отрезка AB длины а. На продолжении отрезка AB найдем такие точки С и Д что CA = AB = BD. Построим равносторонний треугольник ECD согласно условию ЕС = ED = 2а и определим M как пересечение окружностей с диаметрами ЕС и ED.

7) Найдите прямоугольную проекцию точки А на отрезок ВС.

8) Найдите х по условию х : а = р : q, где а, р и q — данные отрезки.

9) Найдите х = ab, где а и b — данные отрезки.

Вдохновляясь результатами Маскерони, Якоб Штейнер (1796— 1863) предпринял попытку исследования построений, выполнимых с помощью одной только линейки. Конечно, одна только линейка не выводит за пределы данного числового поля, и потому она недостаточна для выполнения всех геометрических построений в классическом их понимании. Но тем более замечательны результаты, полученные Штейнером при введенном им ограничении — пользоваться циркулем только один раз. Он доказал, что все построения на плоскости, выполнимые с помощью циркуля и линейки, выполнимы также с помощью одной линейки при

условии, что задан единственный неподвижный круг вместе с центром. Эти построения подразумевают применение проективных методов и будут описаны позднее (см. стр. 223).

* Без круга, и притом с центром, обойтись нельзя. Например, если дан круг, но не указан его центр, то найти центр с помощью одной линейки невозможно. Мы сейчас докажем это, ссылаясь, однако, на факт, который будет установлен позднее (см. стр. 247): существует такое преобразование плоскости самой в себя, что а) заданная окружность остается неподвижной, б) всякая прямая линия переходит в прямую, в) центр неподвижной окружности не остается неподвижным, а смещается. Само существование такого преобразования свидетельствует о невозможности построить центр данной окружности, пользуясь одной линейкой. В самом деле, какова бы ни была процедура построения, она сводится к ряду отдельных этапов, заключающихся в проведении прямых линий и нахождении их пересечений друг с другом или с данной окружностью. Представим себе теперь, что вся фигура в целом — окружность и все прямые, проведенные по линейке при выполнении построения центра — подвергнута преобразованию, существование которого мы здесь допустили. Тогда ясно, что фигура, полученная после преобразования, также удовлетворяла бы всем требованиям построения; но указываемое этой фигурой построение приводило бы к точке, отличной от центра данной окружности. Значит, построение, о котором идет речь, невозможно.

3. Черчение с помощью различных механических приспособлений. Механические кривые. Циклоиды. Изобретение различных механизмов, предназначенных для того, чтобы чертить различные кривые, помимо окружности и прямой линии, чрезвычайно расширяет область фигур, допускающих построение. Например, если имеется инструмент, позволяющий чертить гиперболы ху = и другой инструмент, вычерчивающий параболы у = ах2 + bx + с, то любая проблема, приводящая к кубическому уравнению

(1)

может быть решена конструктивно, с помощью только этих инструментов. В самом деле, решение уравнения (1) равносильно решению системы

(2)

точнее, корни уравнения (1) являются ^-координатами точек пересечения гиперболы и параболы, представляемых уравнениями (2). Таким образом, решения уравнения (1) допускают построение, если разрешается пользоваться инструментами, с помощью которых можно начертить кривые (2).

Уже математикам древности были известны многие интересные кривые, которые могут быть определены и начерчены с помощью простых механических приспособлений. Среди таких «механических» кривых особенно видное место занимают циклоиды. Птолемей (около 200 года до нашей эры), обнаруживая необычайную проницательность, сумел использовать эти кривые для описания планетных движений.

Циклоида самого простого вида представляет собой траекторию движения точки Р, фиксированной на окружности диска, катящегося без скольжения по прямой линии. На рис. 53 изображены четыре положения точки Р в различные моменты времени. По форме циклоида напоминает ряд арок, опирающихся на горизонтальную прямую.

Разновидности этой кривой получаются, если возьмем точку Р или внутри диска (как на спице колеса), или на продолжении радиуса за пределы диска.

Рис. 52. Графическое решение кубического уравнения

Рис. 53. Циклоида

Рис. 54. Циклоиды общего вида

Эти две кривые показаны на рис. 54.

Дальнейшие разновидности циклоиды возникают, когда наш диск катится не по прямой, а по дуге окружности. Если при этом катящийся диск с радиусом г остается все время касающимся изнутри той большой окружности С радиуса /?, по которой он катится, то траектория точки, фиксированной на окружности диска, называется гипоциклоидой.

Когда диск прокатывается по всей окружности С ровно один раз, то точка Р возвращается в исходное положение только в том случае, если радиус С является кратным радиуса с. На рис. 55 изображена замкнутая гипоциклоида, соответствующая предположению R = 3r. В более общем случае, если R = г, то гипоциклоида замкнется после того, как диск прокатится по окружности С ровно п раз, и будет состоять из m арок. Заслуживает особого упоминания случай R = 2г. Любая точка Р на окружности диска будет описывать в этом случае один из диаметров большой окружности С (рис. 56). Предоставляем читателю доказать это в качестве задачи.

Рис. 55. Трехрогая гипоциклоида

Рис. 56. Прямолинейное движение при качении круга по кругу двойного радиуса

Еще один тип циклоид получается, когда диск с катится по окружности С, касаясь ее все время извне. Получающиеся при этом кривые носят название эпициклоид.

*4. Шарнирные механизмы. Инверсоры Поселье и Гарта. Оставим на время в стороне вопрос о циклоидах (они появятся еще раз в этой книге — довольно неожиданно) и обратимся к иным методам механического воспроизведения кривых линий. Мы займемся сейчас шарнирными механизмами.

Механизм этого типа представляет собой систему сочлененных между собой твердых стержней, обладающих такой степенью свободы, чтобы каждая его точка была способна описывать определенную кривую. Циркуль также является простейшим шарнирным механизмом, по существу состоящим из одного стержня с закрепленным концом.

Шарнирные механизмы издавна находят себе применение как составные части машин. Одним из самых знаменитых (в историческом отношении) примеров является так называемый «параллелограмм Уатта». Это приспособление было изобретено Джемсом Уаттом при решении следующей проблемы: как связать поршень с точкой махового колеса таким образом, чтобы вращение колеса сообщало поршню прямолинейное движение? Решение, данное Уаттом, было лишь приближенным, и, несмотря на усилия многих первоклассных математиков, проблема конструирования механизма, сообщающего точке в точности прямолинейное движение, долгое время оставалась нерешенной. Было даже сделано предположение, что такой механизм неосуществим: это было как раз тогда, когда всякого рода «доказательства невозможности» привлекли к себе всеобщее внимание. Тем большее изумление было вызвано в кругах математиков, когда французский морской офицер Поселье (в 1864 г.) все же изобрел несложный механизм, действительно разрешающий проблему в положи-

Рис. 57. Преобразование прямолинейного движения во вращательное

тельном смысле. В связи с введением в употребление хорошо действующих смазочных веществ техническая проблема потеряла свое значение для паровых машин.

Назначение механизма Поселье заключается в том, чтобы превращать круговое движение в прямолинейное. В основе этого механизма лежит теория инверсии, изложенная в § 4. Как видно из рис. 58, механизм состоит из семи жестких стержней, два из них — длины четыре — длины 5 и один — произвольной длины. Точки О и R закреплены и расположены таким образом, что OR = PR. Весь аппарат может быть приведен в движение, будучи подчинен указанным условиям. Мы сейчас убедимся, что, когда точка Р описывает дугу окружности с центром R и радиусом RP, точка Q описывает прямолинейный отрезок. Обозначая основание перпендикуляра, опущенного из точки S на прямую OPQ, через Г, мы замечаем, что

(3)

Величина /2 - s2 постоянная; положим t2 - s2 = г2. Так как ОР • OQ = г2, то точки Р и Q взаимно обратные относительно окружности с центром О и радиусом г. В то время как Р описывает дугу окружности, проходящей через О, Q описывает кривую, обратную этой дуге. Но кривая, обратная окружности, проходящей через О, есть, как мы видели, не что иное, как прямая линия. Итак, траектория точки Q есть прямая, и инверсор Поселье чертит эту прямую без линейки.

Рис. 58. Инверсор Поселье, преобразующий вращательное движение в прямолинейное

Другой механизм, решающий ту же проблему, есть инверсор Гарта. Он состоит всего лишь из пяти стержней, сочленение которых показано на рис. 59. Здесь AB = CD, ВС = AD. Через О, Р и Q обозначены точки, соответственно зафиксированные на стержнях AB, AD и Cß, притом таким образом, что — = — = —. Точки О и S закреплены на плоскости неподвижно, с соблюдением условия OS = PS. Больше связей нет, и механизм способен двигаться. Очевидно, прямая АС всегда параллельна прямой BD. В таком случае точки О, Р и Q лежат на одной прямой, и прямая ОР параллельна прямой АС. Проведем перпендикуляры АЕ и CF к прямой BD. Мы имеем

Далее,

Следовательно,

Последняя полученная величина не изменяется при движении механизма. Поэтому точки Р и Q являются взаимно обратными относительно некоторого круга с центром О. При движении механизма точка Р описывает окружность с центром 5, проходящую через О; значит, обратная точка Q описывает прямую линию.

Можно построить — по крайней мере теоретически — другие шарнирные механизмы, которые будут чертить эллипсы, гиперболы и даже любую наперед заданную алгебраическую кривую f(x, у) = 0, какова бы ни была ее степень.

Рис. 59. Инверсор Гарта

§ 6. Еще об инверсии и ее применениях

1. Инвариантность углов. Семейства окружностей. Хотя круговая инверсия есть преобразование, довольно резко меняющее внешний вид геометрических фигур, все же весьма замечательным является то обстоятельство, что вновь получаемые фигуры сохраняют некоторые свойства первоначальных фигур. Эти свойства, не теряющиеся при преобразовании, называются инвариантными. Мы уже знаем, что при инверсии окружность или прямая переходит в окружность или прямую. Прибавим теперь еще одно важное свойство инверсии: угол между двумя прямыми или кривыми при инверсии не изменяется. Говоря подробнее, это означает, что инверсия преобразовывает две пересекающиеся кривые в две другие кривые, которые пересекаются под тем же углом. Под углом между кривыми подразумевается угол между их касательными.

Доказательство получается при рассмотрении рис. 60, где имеется в виду частный случай пересечения в точке Р произвольной кривой С с прямолинейным отрезком OL, проведенным из центра инверсии О. Кривая С, обратная кривой С, пересекается с OL в точке Р', обратной Р, так как Р', так же как и Р, лежит на OL. Покажем, что угол х0 между OL и касательной к С в точке Р по величине равен углу у0 между OL и касательной к С в точке Р'. Для этого возьмем точку А на кривой С вблизи Р и проведем секущую АР.

Рис. 60. Инвариантность углов при инверсии

Точка, обратная Л, есть А'; так как она находится на прямой OA и на кривой С, то является их точкой пересечения. Проведем также секущую А'Р'. По определению инверсии, г2 = ОР • OP' = OA • OA'\ или же

т. е. треугольники ОАР и ОА'Р' подобны. Значит, угол х равен углу ОА'Р', который мы обозначим через у. Последний шаг в нашем рассуждении заключается в том, чтобы заставить точку А приближаться по кривой С к точке Р. При этом секущая АР переходит в касательную к кривой С в точке Р, и угол х стремится к х0. В то же время А' будет приближаться кР'и прямая А'Р' перейдет в касательную к кривой С в точке Р\ а угол у будет стремиться к у0. Так как при всяком положении точки А мы имеем равенство х = у, то оно сохранится и в пределе х0 = у0.

Наше доказательство еще не закончено, так как мы рассмотрели пока только случай пересечения кривой С с прямой, проходящей через центр О. Но рассмотреть общий случай пересечения двух произвольных кривых С и С* теперь уже совсем легко. Пусть эти кривые пересекаются в точке Р и образуют между собой угол z. Тогда прямая ОРР' делит этот угол на два угла, из которых каждый в отдельности не изменяется при инверсии.

Следовало бы оговорить, что, хотя инверсия не изменяет величины угла, она, однако, изменяет направление его отсчета: если вообразим, что при постоянном увеличении угла хо одна сторона его неподвижна, а другая вращается против часовой стрелки, то подвижная сторона соответствующего «обратного» угла вращается по часовой стрелке.

Частным следствием инвариантности углов при инверсии является то, что две ортогональные (т. е. пересекающиеся под прямым углом) окружности или прямые после инверсии сохраняют это свойство, и если две окружности взаимно касаются («пересекаются под углом, равным нулю»), то касаются и обратные им окружности.

Рассмотрим семейство окружностей, проходящих через центр инверсии О и еще через одну и ту же неподвижную точку плоскости А. Мы знаем (§ 4, пункт 2), что это семейство преобразуется в семейство прямых, проходящих через точку Л', являющуюся образом А. В то же время семейство окружностей, ортогональных первоначальному семейству, превращается в семейство окружностей, ортогональных упомянутому семейству прямых. (На рис. 61 ортогональные семейства изображены пунктиром.) Внешне семейство прямых, проходящих через одну и ту же точку, мало напоминает семейство окружностей, но эти семейства связаны теснейшим образом — с точки зрения теории инверсии они, так сказать, вполне эквивалентны.

Вот другой пример того, к каким результатам приводит инверсия. Пусть дано семейство окружностей, проходящих через центр инверсии и имеющих

в этой точке общую касательную. После инверсии получается семейство параллельных прямых. Действительно, так как окружности проходят через О, то они превращаются в прямые, и так как окружности не имеют точек пересечения кроме О, то получаемые прямые параллельны.

2. Применение к проблеме Аполлония. Прекрасной иллюстрацией того, насколько полезна теория инверсии, является следующее простое геометрическое решение проблемы Аполлония. При инверсии относительно какого бы то ни было центра проблема Аполлония для трех данных окружностей трансформируется в соответствующую проблему для трех других окружностей: пусть читатель внимательно продумает, почему это так.

Отсюда легко понять, что если проблема решена для некоторой тройки окружностей, то тем самым ее можно считать решенной и для всякой тройки окружностей, которая из первой тройки может быть получена путем

Рис. 61. Преобразование двух систем ортогональных окружностей с помощью инверсии

Рис. 62. Преобразование касающихся окружностей в параллельные прямые

инверсии. Мы сумеем использовать это обстоятельство, выбирая из всевозможных «эквивалентных» троек такую, для которой проблема решается особенно просто.

Предположим для определенности, что три данные окружности с центрами Л, В, С взаимно не пересекаются и лежат каждая вне двух других, и допустим, что речь идет о нахождении окружности U с центром О и радиусом р, касающейся трех данных окружностей внешним образом. Заметим, что если мы увеличим радиус всех трех данных окружностей на одну и ту же величину d, то окружность с центром О и радиусом р — d, очевидно, был бы решением видоизмененной таким образом проблемы. Пользуясь этим обстоятельством, увеличим радиусы данных окружностей на такую величину, чтобы две из трех окружностей оказались взаимно касающимися в некоторой точке, которую обозначим К (рис. 63). Затем произведем инверсию всей фигуры относительно какой-нибудь окружности с центром /С. Окружности с центрами В и С станут параллельными прямыми b и с, а третья окружность превратится в некоторую окружность a (рис. 64). Мы уже знаем, что а, Ь, с могут быть построены с помощью циркуля и линейки. Что касается искомой окружности (/, то она преобразуется в окружность н,

Рис. 63. Подготовка построения, решающего проблему Аполлония

Рис. 64. Решение проблемы Аполлония

касающуюся прямых b, с и окружности а. Ее радиус г, очевидно, должен равняться половине расстояния между прямыми b и с\ центр же ее О' должен совпадать с одной из точек пересечения средней линии между b и с с окружностью, концентрической окружности а, но имеющей радиус на г больший. Остается применить обратную инверсию к окружности и, и тогда получим искомую аполлониеву окружность U.

3. Повторные отражения. Каждому из нас приходилось наблюдать странные явления отражения, возникающие, если имеется более одного зеркала. Если четыре стены прямоугольной комнаты представляют собой идеальные зеркала, ни в малой степени не поглощающие света, то находящаяся в этой комнате освещенная точка создает бесконечное множество отражений, по одному на каждую из прямоугольных комнат, возникающих из первой посредством отражений (рис. 65). При менее правильной форме соединения зеркал, например при трех зеркалах, создается более сложная система отражений.

Получающуюся конфигурацию легко описать только в том случае, если отраженные треугольники, не перекрывая друг друга, полностью покрывают плоскость. Таким свойством обладают только прямоугольный равнобедренный треугольник, равносторонний треугольник и прямоугольный треугольник, представляющий собою половину равностороннего (рис. 66).

Еще более курьезные обстоятельства возникают, если мы станем рассматривать повторные инверсии относительно пары окружностей.

Рис. 65. Повторное отражение относительно прямолинейных стен

Рис. 66. Правильные системы треугольных зеркал

Поместившись между двумя концентрическими сферическими зеркалами, мы увидали бы бесчисленное множество концентрических отражений.

Одна последовательность отражений уходила бы в бесконечность, другая — сосредоточивалась бы около центра. Случай двух окружностей, расположенных одна вне другой, несколько сложнее: окружности и их отражения последовательно отражаются одна в другой, уменьшаясь после каждого отражения и теснясь к двум предельным точкам, по одной в каждой из данных окружностей. (Эти точки обладают свойством взаимной обратности относительно каждой из данных окружностей.) Все это показано на рис. 67. Что получится в случае трех кругов, об этом читатель может составить впечатление, взглянув на узор, изображенный на рис. 68.

Рис. 67. Повторное отражение относительно двух сферических дуг

Рис. 68. Отражение относительно трех сферических зеркал

ГЛАВА IV

Проективная геометрия. Аксиоматика. Неевклидовы геометрии

§ 1. Введение

1. Классификация геометрических свойств. Инвариантность при преобразованиях. В геометрии рассматриваются свойства фигур на плоскости и в пространстве. Эти свойства столь многочисленны и столь разнообразны, что необходим какой-то принцип классификации для того, чтобы внести порядок в обширное собрание накопленных знаний. Можно было бы, например, положить в основу классификации метод, применяемый при выводе получаемых утверждений. С этой точки зрения обыкновенно различаются «синтетические» и «аналитические» процедуры. Синтетические доказательства существенно связаны с классическим аксиоматическим методом, идущим от Евклида: рассуждение строится на чисто геометрической основе, независимо от средств алгебры и концепции числового континуума, и все теоремы выводятся формально логическим путем, исходя из некоторого числа начальных положений, называемых аксиомами или постулатами. Другой метод подразумевает введение числовой координатной системы и использует технический аппарат алгебры. Этот метод произвел глубокие изменения в самой математической науке, слив в одно органическое целое геометрию, анализ и алгебру.

В этой главе, однако, нас будет интересовать не столько классификация методов, сколько классификации содержания, т. е. сами по себе утверждения теорем, а не способы их доказательства. В элементарной геометрии плоскости резко различаются две группы теорем; в одних идет речь о равенстве фигур, об измерении отрезков и углов, в других — о подобии фигур, для которого существенно измерение углов, но не отрезков. Указанное различие не столь уж существенно, так как длины отрезков и величины углов довольно тесно связаны между собой и разделять их — несколько искусственно. (Изучение этой связи составляет главным образом предмет тригонометрии.) Отметим иную сторону дела. В элементарной геометрии мы имеем дело с величинами: отрезками, углами, площадями. Две фигуры там считаются эквивалентными, если они конгруэнтны, т. е. могут

быть переведены одна в другую посредством движения — преобразования, меняющего только положение фигуры, но не числовые значения величин, с ней связанных. Возникает вопрос: является ли значение величин — и вместе с тем конгруэнтность или подобие фигур — чем-то существенно неизменным в геометрии? Или же имеются иные, более глубоко лежащие свойства геометрических фигур, которые сохраняются также и при преобразованиях более общего типа, чем движения? Мы увидим, что такие свойства существуют.

Представим себе, что на прямоугольной доске, изготовленной из мягкого эластичного материала, нарисован круг с парой взаимно перпендикулярных диаметров (рис. 69). Если мы положим эту доску в тиски и сожмем до половины ее первоначальной ширины, то окружность превратится в эллипс и углы между диаметрами уже не будут прямыми. Окружность обладает тем свойством, что все ее точки находятся на одном и том же расстоянии от центра, но эллипс таким свойством не обладает. Могло бы показаться, что сжатие уничтожает все геометрические свойства первоначальной конфигурации. Но и это предположение далеко от истины: например, утверждение, что центр делит диаметры пополам, одинаково справедливо и для окружности, и для эллипса; в данном случае мы встречаемся с таким свойством фигуры, которое сохраняется при весьма резком изменении в размерах ее отдельных элементов. Сделанные замечания наводят на мысль о возможности классифицировать теоремы, относящиеся к той или иной геометрической фигуре, в зависимости от того, сохраняют ли они силу или теряют ее при равномерном сжатии (или растяжении). Можно поставить и более общий вопрос, исходя из некоторого данного класса преобразований фигуры (такого рода классы, например, порождаются совокупностью всех движений, или сжатий, или, скажем, круговых инверсий и т. д.); можно поинтересоваться тем, какие свойства фигуры остаются неизменными, когда фигура подвергается различным преобразованиям данного класса.

Рис. 69. Сжатие окружности

Система теорем, утверждающих такие свойства, составляет геометрию рассматриваемого класса преобразований. Идея классификации различных отраслей геометрии в соответствии с классами преобразований принадлежит Феликсу Клейну (1849—1925); она была высказана им в 1872 г. в его знаменитом выступлении, получившем широкую известность под названием «Эрлангенской программы». С тех пор эта идея оказала решающее влияние на направление многих геометрических исследований.

В главе V нам представится случай установить весьма удивительное обстоятельство, заключающееся в том, что некоторые свойства геометрических фигур заложены настолько глубоко, что не исчезают даже после совершенно произвольных деформаций: так, фигуры, нарисованные на куске резины, не потеряют кое-каких характеристических черт при самых разнообразных и самых резких деформациях. Но в настоящей главе мы займемся теми свойствами, которые сохраняются, «инвариантны» при некотором специальном классе преобразований, более широком, чем весьма ограниченный класс движений, но более узком, чем самый общий класс произвольных деформаций. Мы говорим о классе «проективных преобразований».

2. Проективные преобразования. Изучение относящихся сюда геометрических свойств было выдвинуто перед математиками в давнее время проблемами перспективы, которые изучались художниками, в том числе Леонардо да Винчи и Альбрехтом Дюрером. Изображение, создаваемое художником, следует рассматривать как проекцию оригинала на плоскость картины, причем центр проекции помещается в глазу художника. При проектировании — в зависимости от относительных положений различных изображаемых объектов — длины отрезков и углы неизбежно подвергаются искажениям. И тем не менее на картине обычно не представляет труда распознать геометрическую структуру оригинала. Как объяснить это обстоятельство? Нельзя объяснить иначе, как указав на наличие геометрических свойств, «инвариантных относительно проектирования»,— свойств, сохраняющихся на картине и делающих возможным узнавание нарисованного оригинала. Отыскание и анализ этих свойств составляют предмет проективной геометрии.

Совершенно ясно, что в этой отрасли геометрии не содержится положительных утверждений, относящихся к длинам отдельных отрезков или к величинам отдельных углов; не идет речь и о равенстве фигур. Некоторые изолированные факты, касающиеся проективных свойств, были известны уже в XVII в., а иногда, как в случае «теоремы Менелая», даже в древности. Но систематические исследования в области проективной геометрии развернулись впервые лишь к концу XVIII столетия, когда знаменитая École Polytechnique в Париже открыла новую страницу в истории

математики, в частности геометрии. Эта школа, созданная Французской революцией, подготовила большое число офицеров, оказавших на военной службе выдающиеся услуги своей республике. В числе ее питомцев был Жан-Виктор Понселе (1788—1867), написавший свой «Трактат о проективных свойствах фигур» в 1813 г., будучи в плену в России.

В XIX в. под влиянием Штейнера, Штаудта, Шаля и других проективная геометрия стала одним из излюбленных предметов математических исследований. Своей популярностью она обязана отчасти присущей ей особенной эстетической привлекательности, отчасти же способности проливать свет на геометрическую науку в целом, а также глубокой внутренней связи с неевклидовой геометрией и с алгеброй.

§ 2. Основные понятия

1. Группа проективных преобразований. Прежде всего определим класс, или «группу»1, проективных преобразований. Пусть в пространстве заданы две плоскости гс и гс', параллельные или непараллельные между собой. Мы выполняем центральную проекцию тс на гс' с данным центром О, не лежащим ни на тс, ни на гс', сопоставляя каждой точке Р плоскости л такую точку Р' плоскости тс', что Р и Р' лежат на одной и той же прямой, проходящей через О. Аналогично мы выполняем подобным же образом параллельную проекцию, предполагая, что проектирующие прямые параллельны между собой. Точно так же определяется проекция прямой или кривой линии / в плоскости тс на некоторую линию /' в плоскости гс', причем и в этом случае проекция может быть центральной или параллельной.

Всякое отображение одной фигуры на другую, получающееся посредством проектирования (центрального или параллельного) или же посредством конечной последовательности таких проектирований, называется проективным преобразованием2. Проективная геометрия плоскости или прямой составляется из системы геометрических теорем, сохраняющихся при произвольных проективных преобразованиях соответствующих фигур. Проективной геометрии противопоставляется метрическая геометрия,

1 Термин «группа» в применении к классу преобразований подразумевает, что последовательное выполнение двух преобразований из рассматриваемого класса есть также преобразование этого класса и что преобразование, «обратное» по отношению к преобразованию из рассматриваемого класса, также принадлежит этому классу. Групповые свойства математических операций играли и продолжают играть очень большую роль во многих областях, однако по отношению к геометрии значение понятия «группы» в свое время, возможно, было несколько преувеличено.

2 Если две фигуры связаны только одним проектированием, то говорят обычно, что они перспективны. Таким образом, если сказано, что фигура F в результате проективного преобразования переходит в фигуру то это значит, что или фигуры F и F' перспективны, или же можно указать последовательность таких фигур F, F\, F2, Fn, F', что любые две рядом стоящие в ней фигуры перспективны.

Рис. 70. Центральная проекция

Рис. 71. Параллельная проекция

которая понимается как система теорем, устанавливающих связи между величинами в рассматриваемых фигурах, инвариантные только относительно класса движений.

Некоторые проективные свойства можно формулировать непосредственно. Точка, разумеется, проектируется в точку. Далее, прямая линия проектируется в прямую: в самом деле, если прямая / в плоскости гс проектируется на плоскость гс', то линия пересечения /' плоскости гс с плоскостью, проходящей через О и /, — обязательно прямая1. Если точка А и прямая / инцидентны2, то точка А' и прямая /', возникающие из них при проективном преобразовании, также инцидентны. Другими словами, инцидентность точки и прямой есть свойство, инвариантное относительно группы проективных преобразований. Из этого обстоятельства вытекает ряд простых, но весьма важных следствий. Если три точки (или более трех точек) коллинеарны, т. е. инцидентны с одной и той же прямой, то их отображения также коллинеарны. Аналогично, если в плоскости гс три прямые (или более трех прямых) конкуррентны, т. е. инцидентны с одной и той же точкой, то их отображения — также конкуррентные прямые. В то время как эти простые свойства — инцидентность, коллинеарность, конкуррентность — являются проективными свойствами (т. е. свойствами, инвариантными относительно проективных преобразований), величины отрезков и углов, а также и отношения этих величин, вообще говоря, изменяются при проектировании. Равнобедренные или равносторонние треугольники могут, например, спроектироваться на треугольники с тремя различными сторонами. Отсюда следует, что хотя понятие «треугольник» принадлежит проективной геометрии, понятие «равносторонний треугольник» ей не принадлежит, а принадлежит только метрической геометрии.

2. Теорема Дезарга. Одним из самых ранних открытий в области проективной геометрии является замечательная теорема Дезарга (1593—1662): если на плоскости два треугольника ABC и А'В'С расположены таким образом, что прямые, соединяющие соответственные вершины, конкуррентны, то три точки, в которых пересекаются, будучи продолжены, три соответственные стороны, коллинеарны. Эта теорема здесь иллюстрируется чертежом (рис. 72), но пусть читатель проверит ее справедливость, экспериментируя на самостоятельно построенных чертежах. Доказательство теоремы не является

1 За исключением того случая, когда прямая ОР (или плоскость, проходящая через Owl) оказывается параллельной плоскости к. Такие исключения будут устранены в § 4.

2 Точка и прямая называются инцидентными, если прямая проходит через точку или точка лежит на прямой. Этот «нейтральный» термин подчеркивает взаимность рассматриваемого отношения.

тривиальным, несмотря на всю простоту чертежа, состоящего только из прямых линий. Теорема явственно принадлежит проективной геометрии, так как при проектировании рассматриваемый чертеж не теряет свойств, упомянутых в теореме. В дальнейшем мы еще вернемся к этой теореме (стр. 213). В настоящий же момент мы хотели бы привлечь внимание читателя к тому любопытному обстоятельству, что теорема Дезарга справедлива также и в том предположении, что рассматриваемые треугольники расположены в двух различных (непараллельных) плоскостях и что подобного рода «трехмерная», или «пространственная» теорема Дезарга доказывается без малейших затруднений. По предположению, прямые АА\ ВВ' и СС пересекаются в одной и той же точке О (рис. 73). В таком случае прямые AB и А'В' лежат в одной плоскости и, значит, пересекаются в некоторой точке /?; пусть, таким же образом, АС и А'С пересекаются в точке Qy а ВС и В'С — в точке Р. Так как точки Р, Q и R находятся на продолжениях сторон треугольников ABC и А'В'С', то все они лежат в плоскости каждого из этих треугольников и потому — на прямой пересечения этих двух плоскостей. Значит Р, Q и R коллинеарны, что и требовалось доказать.

Это простое доказательство наводит на мысль, что можно попытаться доказать «двумерную» теорему Дезарга, так сказать, с помощью перехода к пределу, постепенно сплющивая всю пространственную конструкцию таким образом, чтобы две плоскости в пределе совпали в одну, и в этой последней, вместе с другими, оказалась и точка О. Выполнить, однако, указанный предельный переход не так просто, так как прямая пересечения PQR при совмещении плоскостей не определяется однозначно.

Рис. 72. Конфигурация Дезарга на плоскости

Рис. 73. Конфигурация Дезарга в пространстве

Тем не менее конфигурация, изображенная на рис. 72, может быть истолкована как перспективное изображение пространственной конфигурации рис. 73, и это обстоятельство можно использовать при доказательстве «плоской» теоремы.

Есть существенное различие между теоремой Дезарга на плоскости и в пространстве. Наше доказательство, относящееся к случаю трех измерений, опиралось только на геометрические соображения, относящиеся к инцидентности точек, прямых и плоскостей. Можно показать, что доказательство двумерной теоремы — при дополнительном требовании не выходить из данной плоскости — неизбежно должно опираться на некоторые свойства подобных фигур, принадлежащих уже не проективной, а метрической геометрии.

Теорема, обратная теореме Дезарга, утверждает, что если три точки, в которых пересекаются соответственные стороны, коллинеарны, то прямые, соединяющие соответственные вершины, конкуррентны. Доказательство этой теоремы — в случае, когда треугольники лежат в непараллельных плоскостях, — предоставляется читателю в качестве упражнения.

§ 3. Двойное отношение

1. Определение и доказательство инвариантности. Если длина отрезка прямой представляет собой своего рода ключ к метрической геометрии, то существует и в проективной геометрии одно основное понятие, с помощью которого могут быть выражены все отличительные проективные свойства фигур.

Предположим, что три точки Л, В и С расположены на одной прямой. Проектирование, вообще говоря, изменяет не только расстояния AB и ВС, AB

но и их отношение В самом деле, любые три точки Л, ß, С на прямой / могут быть переведены в любые три точки Л', ß', С на прямой /' посредством двух последовательно производимых проектирований. Чтобы в этом убедиться, станем вращать прямую /' около точки С, пока она не примет положения /", параллельного / (рис. 74). Затем, проектируя / на /" параллельно прямой СС, получим три точки Л", В" и С" (= С). Прямые А'А" и ß'ß" пересекутся в точке О, которую мы изберем в качестве центра второй проекции. Последовательно выполненные указанные две проекции дают требуемый результат1.

Из доказанного вытекает, что никакая величина, определяемая только тремя точками на прямой, не может быть инвариантной при проектировании. Но — в этом заключается решающее открытие в проективной геометрии— если на прямой дано четыре точки Л, ß, С, Д которые при проектировании переходят в точки Л7, ß', С, D' другой прямой, то некоторая величина, называемая двойным отношением этих четырех точек, при проектировании не изменяет числового значения. В этом заключено математическое свойство системы четырех точек на прямой, которое носит инвариантный характер и которое можно обнаружить во всякой проекции рассматриваемой прямой. Двойное отношение не есть ни расстояние, ни отношение расстояний, а отношение двух таких отношений: если мы составим отношения

Рис. 74. Проектирование трех точек

1 Подумайте, что делать, если прямые А'А" и В'В" параллельны.

то их отношение

по определению есть двойное отношение четырех точек Л, В, С, D, взятых в указанном выше порядке.

Убедимся теперь, что двойное отношение четырех точек инвариантно при проектировании, т. е. что если Л, В, С, D и Л', В\ С, D' — две четверки точек на двух прямых и между ними установлено проективное соответствие, то тогда справедливо равенство

Доказательство вполне элементарно. Вспомним, что площадь треугольника равна половине произведения основания на высоту и, с другой стороны, равна половине произведения двух сторон на синус заключенного между ними угла. Тогда получим (рис. 75):

Отсюда следует:

Таким образом, двойное отношение точек Л, В, С, D зависит только от углов, образованных в точке О отрезками ОЛ, 05, ОС, OD. Так как эти углы — одни и те же, каковы бы ни были четыре точки Л', В', С, D', в которые при проектировании переходят Л, В, С, Д то ясно, что двойное отношение не изменяется при проектировании.

Что двойное отношение не изменяется при параллельном проектировании, следует из элементарных свойств подобных треугольников. Доказательство предоставляется читателю в качестве упражнения (рис. 76).

Рис. 75. Инвариантность двойного отношения при центральном проектировании

До сих пор, говоря о двойном отношении четырех точек А, В, С, D, расположенных на прямой /, мы предполагали, что это отношение составлено из положительных отрезков. Целесообразно видоизменить это определение следующим образом. Примем одно из двух направлений прямой / за положительное и условимся, что все отрезки, отсчитываемые в этом направлении, будут считаться положительными, а отрезки, отсчитываемые в противоположном направлении, — отрицательными. Теперь определим двойное отношение точек Л, ß, С, D (взятых в указанном порядке) согласно формуле

причем знаки чисел СЛ, Cß, DA, DB берутся в соответствии с указанным выше условием. Так как при изменении направления на прямой /, принятого за положительное, меняются только знаки всех четырех отрезков, то значение (ABCD) не зависит от выбора направления. Легко понять, что (ABCD) имеет отрицательный или положительный знак, смотря по тому, разделена ли пара точек Л, В парой точек С, D или не разделена. Так как свойство «разделяться» инвариантно относительно проектирования, то понимаемое в новом смысле (как величина, способная иметь тот или иной знак) двойное отношение (ABCD) также инвариантно. Выберем начальную точку О на прямой / и сопоставим каждой точке на прямой / в качестве координаты X ее расстояние от О, взятое с надлежащим знаком; тогда, обозначая координаты А, В, С, D соответственно через Х\, получим формулу

Если (ABCD) = -1, так что — = -—, то точки С и D делят отрезок AB внутренне и внешне в одном и том же отношении. В этом случае принято говорить, что С и D делят отрезок AB гармонически, и каждая из точек С и D считается гармонически сопряженной с другой точкой относительно пары точек Л, ß. Если (ABCD) = 1, то точки С и D (или Л и ß) совпадают.

Рис. 76. Инвариантность двойного отношения при параллельном проектировании

Рис. 77. Знак двойного отношения

Необходимо не упустить из виду, что при определении двойного отношения (ABCD) существенную роль играет порядок, в котором берутся точки Л, ß, С, D. Например, если (ABCD) = X, то двойное отношение (BACD) равно —, тогда как (DACB) = 1 - X, в чем читатель убедится без труда. Четыре точки Л, ß, С, D могут быть переставлены между собой 4 • 3 • 2 • 1 = 24 различными способами, и каждой перестановке соответствует некоторое значение двойного отношения. Некоторым перестановкам соответствует то же числовое значение двойного отношения, что и начальной перестановке Л, 5, С, D; например, (ABCD) = (BADC). Читателю предоставляется в качестве упражнения доказать, что при 24 возможных перестановках четырех точек получается всего лишь шесть различных значений двойного отношения, а именно

Эти шесть величин, вообще говоря, различны, но при некоторых значениях X могут и совпадать по две, например при значении X = — 1 в случае гармонического деления.

Мы можем также определить двойные отношения четырех компланарных (т.е. лежащих в одной плоскости) и конкуррентных прямых 1, 2, 3, 4, как двойное отношение четырех точек пересечения этих прямых с некоторой прямой, лежащей в той же плоскости. Положение этой пятой прямой несущественно вследствие инвариантности двойного отношения при проектировании. Эквивалентным этому определению является следующее:

где нужно взять знак плюс, если пара прямых 1, 2 не разделяется парой 3, 4, и знак минус, если разделяется. (В этой формуле (1, 3), например, обозначает угол между прямыми 1 и 3.) Наконец, можно определить двойное отношение четырех коаксиальных плоскостей (четырех плоскостей, пересекающихся по одной прямой, или «оси»). Если некоторая прямая пересекает плоскости в четырех точках, то двойное отношение этих точек

Рис. 78. Координатное выражение для двойного отношения

всегда будет иметь одно и то же значение, независимо от выбора прямой (доказательство предлагается в качестве упражнения). Таким образом, полученное значение можно назвать двойным отношением рассматриваемых четырех плоскостей. Иначе, можно назвать двойным отношением четырех коаксиальных плоскостей двойное отношение четырех прямых, по которым они пересекаются произвольной пятой плоскостью (рис. 79).

Понятие двойного отношения четырех плоскостей побуждает поставить вопрос о том, нельзя ли дать определение проективного преобразования трехмерного пространства самого на себя. Определение с помощью центральной проекции, очевидно, не обобщается непосредственно от случая двух измерений на случай трех измерений. Но можно доказать, что каждое непрерывное преобразование плоскости самой на себя, взаимно однозначно переводящее точки в точки и прямые в прямые, есть проективное. Это обстоятельство наводит на мысль ввести следующее определение для случая трех измерений: проективным преобразованием пространства называется непрерывное взаимно однозначное преобразование, переводящее прямые линии в прямые линии. Можно показать, что такие преобразования оставляют значения двойных отношений неизменными.

Добавим к предыдущему еще кое-какие замечания. Пусть на прямой даны три различные точки Л, В, С с координатами Х\% х2, х3. Требуется найти четвертую точку D таким образом, чтобы удовлетворялось равенство (ABCD) = X, где X задано. (Частный случай, когда X = -1 и задача

Рис. 79. Двойное отношение четырех плоскостей

заключается в построении четвертой гармонической точки, будет подробно рассмотрен в следующем пункте.) Вообще говоря, задача имеет одно и только одно решение; действительно, если х — координата искомой точки Д то уравнение

имеет ровно одно решение. Считая x,, х2 и хг заданными и полагая ради краткости

мы придадим решению вид

Например, если точки Л, В, С находятся на равных расстояниях друг от друга и имеют соответственно координаты Х\ = О, х2 = d, х3 = 2d, то

тогда

Если прямая / спроектирована из двух различных центров О' и О" на две различные прямые /' и /", то получается соответствие Р «—♦ Р' между точками прямых / и /' и соответствие Р <—» Р" между точками прямых / и I". Этим устанавливается соответствие Р' <—> Р" между точками прямых /' и /", и притом такое, что каждые четыре точки А', В\ С7, D' на /' имеют то же самое двойное отношение, что и соответствующие точки А", В",

Рис. 80. Проективное соответствие между точками двух прямых

С", D" на /". Всякое взаимно однозначное соответствие между точками двух прямых, обладающее этим свойством, называется проективным соответствием, независимо от того, каким способом это соответствие установлено.

Упражнения. 1) Докажите, что если даны две прямые вместе с проективным соответствием, установленным между ними, то можно подвергнуть одну из прямых такому параллельному перенесению, что заданное соответствие будет получаться посредством простой проекции. (Указание: совместите какую-нибудь пару взаимно соответствующих точек на данных прямых.)

2) Пользуясь предыдущим результатом, покажите, что если между точками двух прямых / и /' установлено соответствие посредством конечного числа последовательных проектирований на различные промежуточные прямые при произвольных центрах проекций, то тот же результат может быть получен посредством всего лишь двух проектирований.

2. Применение к полному четырехстороннику. В качестве интересного применения инвариантности двойного отношения мы докажем одну простую, но важную теорему проективной геометрии. Речь идет о полном четырехстороннике — фигуре, образованной произвольными четырьмя прямыми, из которых никакие три не являются конкуррентными, и шестью точками их пересечения. На рис. 81 названные четыре прямые суть АЕ, BE, В/, AF. Прямые AB, EG и IF являются диагоналями четырехсторонника. Рассмотрим одну из диагоналей, например AB, и отметим на ней точки С и D, где она пересекается с двумя другими диагоналями. Тогда теорема утверждает существование равенства (ABCD) = -1; словами это

Рис. 81. Полный четырехсторонник

выражается так: точки пересечения одной диагонали с двумя другими делят отрезок между вершинами четырехсторонника гармонически. Для доказательства достаточно обратить внимание на то, что

X = (ABCD) = (IFHD) (проектируем из Е),

(IFHD) = (BACD) (проектируем из G).

Как нам известно,

таким образом,

Но так как С, D разделяют Л, В, то двойное отношение х отрицательно и потому оно должно быть равно именно —1, что мы и хотели доказать.

Полученное замечательное свойство полного четырехсторонника дает нам возможность с помощью одной лишь линейки построить точку, гармонически сопряженную с точкой С относительно пары Л, В (если Л, ß, С коллинеарны). Нужно только, выбрав произвольную точку Е вне данной прямой, провести прямые ЕА, ЕВ, ЕС; затем, взяв произвольно точку G на ЕС, провести прямые AD и BD, пересекающие ЕВ и ЕА, скажем, в точках F и /; провести, наконец, прямую IF, которая и пересечет исходную прямую в искомой точке D.

Задача. На плоскости задан отрезок AB и область R, как показано на рис. 82. Желательно продолжить прямую AB вправо от R. Как это можно сделать с помощью одной линейки и при условии, чтобы в процессе построения не покрывать линейкой никакой части области /?? (Указание: выберите на отрезке AB две произвольные точки С и С, затем постройте сопряженные с ними гармонические D и D' относительно пары точек А, В\ при построении воспользуйтесь четыре раза теоремой о полном четырехстороннике.)

§ 4. Параллельность и бесконечность

1. «Идеальные» бесконечно удаленные точки. Внимательное рассмотрение изложенного в предыдущем параграфе обнаруживает, что во многих случаях приведенная аргументация теряет силу — именно, тогда, когда прямые, точка пересечения которых нужна для построения, оказываются параллельными. Например, построение четвертой гармонической

Рис. 82. Проведение прямой через препятствие

точки D становится невыполнимым, если прямая IF параллельна AB. Геометрические рассуждения на каждом шагу затруднены тем обстоятельством, что параллельные прямые не имеют общей точки, и потому всякий раз, когда речь идет о пересечении прямых, приходится отдельно рассматривать и особо оговаривать случай параллелизма. С другой стороны, если производится проектирование, мы вынуждены различать и трактовать независимо рядом с центральной также и параллельную проекцию. Если бы из такого положения не было выхода, то проективная геометрия, будучи вынуждена вникать в детальное исследование каждого встречающегося исключения и особого случая, неизбежно была бы чрезвычайно усложнена. Все это побуждает искать выхода в ином направлении, именно, на пути такого обобщения основных понятий, которое устраняло бы возможные исключения.

Тут нам поможет геометрическая интерпретация; мы видим, что если прямая, пересекающая другую прямую, медленно вращается, приближаясь к положению параллельности, то точка пересечения двух прямых неограниченно удаляется. Это дает повод к наивному утверждению: две прямые пересекаются «в бесконечно удаленной точке». Подобного рода формулировке существенно придать точный смысл с таким расчетом, чтобы с «бесконечно удаленными», или, как иногда говорят, с «идеальными» точками можно было проводить точные и надежные рассуждения, как с обыкновенными точками на плоскости или в пространстве. Иными словами, мы желали бы, чтобы все правила поведения точек, прямых, плоскостей оставались в силе и для «идеальных» геометрических элементов.

В математическом смысле существование «бесконечно удаленных точек» обеспечено, если отчетливо и без взаимных противоречий установлены математические свойства этих вновь вводимых элементов, т. е. их взаимоотношения с «обыкновенными» точками и между собой. Обыкновенно система геометрических аксиом (например, в евклидовой геометрии) вытекает путем абстракции из наблюдений над физическими объектами: таковы следы прикосновения карандаша к бумаге или мела к доске, натянутые нити, световые лучи, твердые стержни и т. п. Свойства, приписываемые аксиомами математическим точкам и прямым, представляют собой в высшей степени упрощенные и идеализированные описания поведения соответствующих им физических «двойников». Через любые два карандашных пятнышка можно провести не одну, а много карандашных «прямых». Если пятнышки становятся все меньше по диаметру, то все такие «прямые» станут трудно отличимыми одна от другой. Вот что мы, собственно говоря, имеем в виду, высказывая в качестве геометрической аксиомы, что «через любые две точки можно провести одну и только одну прямую»: мы при этом говорим об «абстрактных», чисто умозрительных, геометрических точках и прямых. Геометрические точки и прямые обладают гораздо более простыми

свойствами, чем какие бы то ни было физические объекты. Упрощение является существенным условием, позволяющим строить геометрию как дедуктивную дисциплину.

Как уже было отмечено, обыкновенная геометрия точек и прямых весьма осложнена тем обстоятельством, что две параллельные прямые не имеют точки пересечения. Это побуждает нас сделать дальнейшее упрощение в структуре геометрии, расширяя понятие геометрической точки таким образом, чтобы устранить указанное исключение — совершенно так же, как мы расширяли понятие числа с целью устранения ограничений при вычитании и делении. В геометрии, как и в арифметике, мы озабочены неукоснительно сохранением в расширенной области тех законов, какие регулировали отношения в первоначальной области.

Итак, мы уславливаемся в том, что к обыкновенным точкам всякой прямой добавляем еще одну, «идеальную», точку и будем считать эту точку принадлежащей одновременно всем прямым, параллельным данной, и никаким другим. Следствием такого условия является то, что всякая пара прямых на плоскости теперь уже пересекается в единственной точке: если прямые не параллельны, то в «обыкновенной» точке; если параллельны, то в им обеим принадлежащей «идеальной» точке. По причинам интуитивного порядка эта идеальная точка на прямой называется бесконечно удаленной точкой на этой прямой.

Интуитивное представление о точке, удаляющейся в бесконечность по прямой линии, могло бы навести на мысль, что следует добавить две идеальные точки на каждой прямой — по одной для каждого направления. Если мы добавляем только одну, то лишь потому, что мы заинтересованы в сохранении закона: через каждые две точки проходит одна и только одна прямая. Если бы прямая содержала две бесконечно удаленные точки вместе со всеми, ей параллельными, то вышло бы, что через две такие «точки» проходит бесконечное множество прямых.

Мы уславливаемся также в том, что к обыкновенным прямым на плоскости добавляем еще одну «идеальную», так называемую «бесконечно удаленную» прямую, содержащую все бесконечно удаленные точки плоскости и никаких других. Мы вынуждены принять именно такое условие, если хотим сохранить первоначальный закон — «через всякие две точки проходит одна прямая» и вновь утвержденный закон — «всякие две прямые пересекаются в одной точке». В самом деле, возьмем две какие-нибудь идеальные точки. Единственная прямая, которая должна проходить через эти точки, не может быть обыкновенной прямой, так как по принятому условию каждая обыкновенная прямая содержит только одну идеальную точку. С другой стороны, эта прямая не может содержать обыкновенных точек, так как через обыкновенную точку и одну из идеальных точек непременно прошла бы обыкновенная прямая. Наконец,

рассматриваемая прямая непременно содержит все идеальные точки, так как мы хотим, чтобы она имела одну общую точку со всякой обыкновенной прямой. Итак, прямая, о которой идет речь, неизбежно должна обладать как раз всеми теми свойствами, которыми мы наделили идеальную прямую в нашей плоскости.

Согласно принятым условиям, каждая бесконечно удаленная точка определяется или представляется семейством параллельных прямых, точно так же как иррациональное число определяется последовательностью «вложенных» рациональных отрезков. Такого рода условный способ описывать параллельность с помощью терминов, первоначально предназначенных для интуитивно отличных объектов, единственной своей целью имеет сделать излишним перечисление исключительных случаев; эти последние теперь автоматически покрываются теми же терминами (и оборотами речи), которые первоначально употреблялись для «обыкновенных» случаев.

Резюмируем: наши условия, касающиеся бесконечно удаленных элементов, были выбраны таким образом, чтобы законы, регулирующие отношение инцидентности между обыкновенными точками и прямыми, сохранялись и в расширенной области, чтобы операция нахождения точки пересечения двух прямых, ранее возможная только в случае непараллельности, могла быть выполнена без ограничений. Соображения, которые привели нас к формальному упрощению в отношениях инцидентности, способны показаться несколько абстрактными. Но читатель убедится на следующих страницах, что они будут вполне оправданы результатами.

2. Идеальные элементы и проектирование. Введение бесконечно удаленных точек и бесконечно удаленной прямой на плоскости позволит нам гораздо более удовлетворительным образом рассмотреть проектирование одной плоскости на другую. Пусть плоскость гс проектируется на плоскость гс' из центра О (рис. 83). Эта проекция устанавливает соответствие между точками и прямыми гс и точками и прямыми гс'. Каждой точке Л на гс соответствует единственная точка А' на гс' со следующими исключениями: если выходящий из О проектирующий луч параллелен плоскости гс', то он пересекает гс в точке Л, которой не соответствует никакая обыкновенная точка плоскости гс'. Такие исключительные точки плоскости гс расположены на прямой /, которой не соответствует никакая обыкновенная прямая плоскости гс'. Но оговаривать эти исключения становится излишним, если мы условимся точке А сопоставлять бесконечно удаленную точку на плоскости гс', взятую в направлении прямой ОЛ, а прямой / — сопоставлять бесконечно удаленную прямую в плоскости гс'. Аналогично, некоторую бесконечно удаленную точку в плоскости гс мы сопоставляем каждой точке В' на такой прямой т' в плоскости гс', через которую

проходят все лучи, выходящие из О и параллельные плоскости тт. Самой прямой т' соответствует бесконечно удаленная прямая плоскости гс. Таким образом, посредством введения в плоскости бесконечно удаленных точек и прямой достигается то, что проекция одной плоскости на другую устанавливает такое соответствие между точками и прямыми двух плоскостей, которое взаимно однозначно без всяких исключений. (Так устраняются исключения, упомянутые в сноске на стр. 199.) Далее, легко понять, что из принятых соглашений вытекает следствие: точка лежит на прямой, если проекция точки лежит на проекции прямой. Отсюда видно, что все теоремы, относящиеся к коллинеарным точкам, конкуррентным прямым и т. д. и говорящие только о точках, прямых и отношениях инцидентности, инвариантны относительно проектирования в расширенном смысле. Это дает возможность оперировать с бесконечно удаленными точками плоскости тс, заменяя их соответствующими получающимися при проектировании обыкновенными точками плоскости гс'.

* Можно воспользоваться интерпретацией бесконечно удаленных точек плоскости гс с помощью проектирования из внешней точки О на обыкновенные точки другой плоскости гс', чтобы получить конкретную евклидову «модель» расширенной плоскости. Для этого не будем обращать внимания на плоскость гс', а сосредоточимся на плоскости гс и прямых, проходящих через О. Каждой обыкновенной точке гс соответствует прямая, проходящая через О, непараллельная гс; каждой бесконечно удаленной точке гс —

Рис. 83. Возникновение бесконечно удаленных элементов при проектировании

прямая, проходящая через О, параллельная гс. Итак, совокупности всех точек тс, обыкновенных и идеальных, соответствует совокупность прямых, проходящих через О, и это соответствие взаимно однозначно без всяких исключений. Точки на некоторой прямой в плоскости гс переходят в прямые на плоскости, проходящей через О. Точка и прямая в плоскости гс инцидентны в том и только в том случае, если инцидентны соответствующие прямая и плоскость, проходящие через О. Другими словами, геометрия инцидентности точек и прямых в расширенной плоскости совершенно равносильна геометрии инцидентности обыкновенных прямых и плоскостей, проходящих через фиксированную точку пространства.

Положение вещей в трехмерном пространстве вполне аналогично, хотя отпадает возможность пользоваться наглядным аппаратом проектирования. Здесь тоже мы вводим особую бесконечно удаленную точку, связанную с каждым семейством параллельных прямых. В каждой плоскости имеется бесконечно удаленная прямая. Затем вводится новый элемент — бесконечно удаленная плоскость, состоящая из всех бесконечно удаленных точек пространства и содержащая все бесконечно удаленные прямые. С бесконечно удаленной плоскостью каждая обыкновенная плоскость пересекается по своей собственной бесконечно удаленной прямой.

3. Двойное отношение с бесконечно удаленными элементами.

Еще одно замечание следует сделать по поводу двойных отношений с бесконечно удаленными элементами. Будем обозначать символом оо бесконечно удаленную точку на прямой /. Посмотрим, как определяется символ (АВСоо), если Л, В, С — три обыкновенные точки на /. Пусть Р — некоторая точка на /; тогда (ЛоСоо) рассматривается как предел (АВСР), когда Р удаляется в бесконечность по /. Но

и, когда Р неограниченно удаляется, — стремится к 1. Отсюда вытекает определение:

Рис. 84. Двойное отношение с участием бесконечно удаленной точки

В частности, если (АВСоо) = 1, то С есть середина отрезка AB: средняя точка отрезка и бесконечно удаленная точка, взятая в направлении отрезка, делят отрезок гармонически.

Упражнение. Что представляет собой двойное отношение четырех прямых 1\, /2, /з, Ц, если они параллельны? Что получится, в частности, с этим двойным отношением, если в качестве Ц будет взята бесконечно удаленная прямая?

§ 5. Применения

1. Предварительные замечания. После введения бесконечно удаленных элементов уже нет необходимости явно оговаривать все исключительные случаи параллельности, возникающие при построениях и доказательствах теорем. Достаточно помнить, что если точка является бесконечно удаленной, то все проходящие через нее прямые параллельны. Отпадает и необходимость делать различие между центральной и параллельной проекциями, так как параллельная проекция есть не что иное, как проекция из бесконечно удаленной точки. На рис. 72 точка О или прямая PQR могут оказаться бесконечно удаленными (рис. 85 изображает первый из упомянутых случаев); мы предоставляем читателю в качестве упражнения сформулировать в «финитных» (т. е. не содержащих упоминания о бесконечности) терминах соответствующие утверждения дезарговой теоремы.

Не только формулировка, но и доказательство теоремы, принадлежащей проективной геометрии, нередко упрощаются в результате введения бесконечно удаленных элементов. Общий принцип заключается в следующем. Условимся под «проективным классом» некоторой геометрической

Рис. 85. Дезаргова конфигурация с центром в бесконечности

фигуры F понимать класс всех фигур, в которые F может быть переведена проективными преобразованиями. Проективные свойства F ничем не отличаются от проективных свойств любой фигуры ее проективного класса, так как по самому определению проективные свойства сохраняются при проектировании. Таким образом, любая проективная теорема (т. е. теорема, говорящая только о проективных свойствах), которая верна для фигуры F, будет также верна для любого «представителя» проективного класса этой фигуры, и обратно. Поэтому, чтобы доказать такую теорему для F, достаточно доказать ее для некоторого «представителя» проективного класса F. Мы можем воспользоваться указанным обстоятельством и выбрать такого «представителя», для которого доказательство проще, чем для самой фигуры F. Например, произвольные две точки Л, В плоскости к могут быть спроектированы в бесконечность из данного центра О, если проектировать на плоскость, параллельную плоскости, проходящей через точки О, Л, ß; прямые, проходящие через Л или через ß, при этом превратятся в семейства параллельных прямых. Именно такое предварительное преобразование мы выполним при доказательстве проективных теорем, которыми займемся в этом параграфе.

В дальнейшем нам придется воспользоваться следующим обстоятельством, относящимся к параллельным прямым. Пусть две прямые, проходящие через точку О, пересекаются прямыми /| и /2 в точках Л, ß, С, D, как показано на рис. 86. Если прямые /] и /2 параллельны, то ^ = —; и обратно, если выполнено последнее соотношение, то прямые U и /2 параллельны. Доказательство, вытекающее из элементарных свойств подобных треугольников, предоставляется читателю.

2. Двумерное доказательство теоремы Дезарга. Докажем теперь, не прибегая к пространственному проектированию, что если два треугольника ABC и А'В'С расположены на плоскости так, как изображено на рис. 72, т. е. если прямые, соединяющие соответствующие вершины, встречаются в одной и той же точке, то точки пересечения

Рис. 86. Подобие треугольников, образованных параллельными прямыми

соответствующих сторон Р, Q, R лежат на одной прямой. Для этого прежде всего спроектируем чертеж таким образом, чтобы точки Q и R ушли в бесконечность. После такого проектирования прямая А'В' станет параллельна прямой AB, а прямая А'С — прямой АС (рис. 87). Как было отмечено в пункте 1 настоящего параграфа, чтобы доказать теорему Дезарга в общем случае, достаточно доказать ее только для случая рассматриваемой здесь частной конфигурации. Именно, достаточно показать, что точка Р пересечения сторон ВС и В'С также уйдет в бесконечность, т. е. что прямая В'С параллельна прямой ВС: тогда точки Р, Q, R будут коллинеарны (так как все три будут лежать на бесконечно удаленной прямой). Обратим внимание на то, что

Поэтому ^ = а отсюда следует ВС \\ В'С, что и требовалось доказать.

Следует отметить, что приведенное доказательство теоремы Дезарга опирается на математическое понятие длины отрезка. Таким образом, проективная теорема доказана в данном случае метрическими средствами. Другое заслуживающее внимания обстоятельство заключается в следующем. Мы указывали раньше (стр. 205), что понятию проективного преобразования может быть дано «внутреннее» определение («проективное преобразование плоскости — такое, которое оставляет инвариантными все двойные отношения»): отсюда вытекает, что теорема Дезарга способна быть сформулирована и доказана без выхода в пространство, т. е. без использования трехмерных представлений и построений.

Упражнение. Докажите подобным же образом теорему, обратную дезарговой: если треугольники ABC и А1 В'С таковы, что Р, Q, R коллинеарны, то прямые АА', ВВ\ СС конкуррентны.

Рис. 87. Доказательство теоремы Дезарга

3. Теорема Паскаля1. Эта теорема формулируется так: если вершины шестиугольника лежат поочередно на двух пересекающихся прямых, то точки Р, Q, R пересечения противоположных сторон этого шестиугольника коллинеарны (рис. 88). (Контур шестиугольника может быть самопересекающимся. Что такое «противоположные» стороны, можно легко понять из схемы на рис. 89.)

Выполняя предварительное проектирование, можно допустить, что Р и Q ушли в бесконечность. Остается показать, что R также уйдет в бесконечность. Ситуация иллюстрируется рис. 90, где 23 II 56 и 12 || 45. Нужно показать, что 16 || 34. Мы имеем

Поэтому

так что 16 II 34, что и требовалось доказать.

Рис. 88. Конфигурация Паскаля

Рис. 89. Нумерация вершин шестиугольника

Рис. 90. Доказательство теоремы Паскаля

1 На стр. 236 будет рассмотрена более общая теорема этого же типа. Настоящий частный случай связывается также с именем Паппа Александрийского (III столетие до нашей эры).

4. Теорема Брианшона. Эта теорема формулируется так: если стороны шестиугольника проходят поочередно через две данные точки Р и Q, то три диагонали, соединяющие противоположные вершины шестиугольника, конкуррентны (рис. 91).

Посредством предварительного проектирования можно отправить в бесконечность точку Р и точку, в которой пересекаются две какие-нибудь диагонали, например 14 и 36. Полученная ситуация изображена на рис. 92.

Так как 14 II 36, то % = —. Но вместе с тем — = % и — = —. Значит, — = и поэтому 36 II 25, так что все три диагонали параллельны и, следовательно, конкуррентны. Этого достаточно, чтобы считать теорему доказанной и в общем случае.

5. Замечание по поводу двойственности. Читатель, вероятно, уже заметил замечательное сходство теорем Паскаля (1623— 1662) и Брианшона (1785—1864). Это сходство особенно бросается в глаза, если обе формулировки поставить рядом:

Теорема Паскаля

Если вершины шестиугольника лежат поочередно на двух прямых, то точки пересечения противоположных сторон коллинеарны.

Теорема Брианшона

Если стороны шестиугольника проходят поочередно через две точки, то прямые, соединяющие противоположные вершины, конкуррентны.

Не только теоремы Паскаля и Брианшона, но все вообще теоремы проективной геометрии группируются попарно таким образом, что две теоремы одной и той же пары сходны между собой и, так сказать, идентичны по

Рис. 91. Конфигурация Брианшона

своей структуре. Это явление носит название двойственности. В геометрии плоскости точка и прямая представляют собой взаимно двойственные элементы. Провести прямую через точку и отметить точку на прямой — операции взаимно двойственные. Две фигуры взаимно двойственны, если одна может быть получена из другой посредством замены каждого элемента и каждой операции двойственным элементом и двойственной операцией. Две теоремы взаимно двойственны, если одна превращается в другую при замене каждого элемента и каждой операции двойственным элементом и двойственной операцией. Например, теоремы Паскаля и Брианшона взаимно двойственны, тогда как теоремой, двойственной теореме Дезарга, является теорема, ей обратная. Явление двойственности резко отличает проективную геометрию от элементарной (метрической), в которой никакой двойственности не наблюдается. (Например, было бы бессмысленно искать какое-нибудь «двойственное» утверждение по отношению к тому факту, что данный угол содержит 37° или что данный отрезок равен 2 линейным единицам.) Принцип двойственности, согласно которому каждой верной теореме проективной геометрии сопоставляется двойственная ей, также верная теорема, во многих учебниках подчеркивается тем, что формулировки взаимно двойственных теорем, вместе со взаимно двойственными их доказательствами, приводятся рядом, как мы это сделали выше. Внутренняя причина явления двойственности будет изучена в следующем параграфе (см. также стр. 234).

Рис. 92. Доказательство теоремы Брианшона

§ 6. Аналитическое представление

1. Вводные замечания. В раннем периоде развития проективной геометрии существовала настойчиво проводимая тенденция выполнять все построения на синтетической или, как говорилось, «чисто геометрической» основе, вовсе избегая применения чисел и алгебраических методов. Выполнение этой программы встретило на своем пути большие затруднения, так как всегда оставались какие-то пункты, в которых алгебраические

формулировки казались неизбежными. Полный успех в построении чисто синтетической проективной геометрии был достигнут только к концу XIX в. и только ценой значительных осложнений. В этом отношении методы аналитической геометрии оказались гораздо более плодотворными. Для современной математики характерна иная тенденция — положить в основу построения понятие числа, и в геометрии эта тенденция, идущая от Ферма и Декарта, возымела решительный триумф. Аналитическая геометрия перестала быть подсобным аппаратом, играющим служебную роль в геометрических рассуждениях, и стала самостоятельной областью, в которой интуитивная геометрическая интерпретация операций и результатов уже не является последней и окончательной целью, а принимает на себя функцию руководящего принципа, помогающего угадывать и понимать аналитические факты. Такое изменение значения геометрии есть последствие постепенного развития геометрии в историческом плане — развития, широко раздвинувшего рамки классических концепций; оно же обусловило вместе с тем почти органическое слияние геометрии и анализа.

В аналитической геометрии под «координатами» геометрического объекта понимается какая угодно совокупность чисел, позволяющая определить этот объект однозначно. Так, точка определяется своими прямоугольными координатами x, у или своими полярными координатами р, 6; с другой стороны, например, треугольник определяется координатами трех вершин, что в целом составляет шесть координат. Мы знаем, что прямая линия в плоскости х, у представляет собой геометрическое место всех точек Р(х, у) (об обозначениях см. стр. 99), координаты которых удовлетворяют некоторому линейному уравнению

ax + by + c = 0. (1)

Поэтому можно три числа а, Ьу с назвать «координатами» этой прямой. Например, а = О, 6 = 1, с = О определяют прямую у = 0, т. е. ось х\ а = 1, Ь = — 1, с — О определяют прямую х — у, которая делит пополам угол между положительной осью х и положительной осью у. Таким же образом следующие уравнения определяют «конические сечения»: х2 + у2 = г2 — окружность радиуса г с центром в начале координат, (х — a)2 + {у — Ь)2 = г2 — окружность радиуса г с центром (а, 6), ^ + ^ = ' — эллипс и т. д.

Более или менее наивный подход к аналитической геометрии заключается в том, чтобы, отправляясь от чисто «геометрических» представлений— точка, прямая и т.д., — переводить их затем на язык чисел. Современная точка зрения противоположна. Мы отправляемся от множества всевозможных пар чисел х, у и называем каждую такую пару точкой, так как можем, если пожелаем, наглядно интерпретировать такую пару чисел с помощью общедоступного понятия геометрической точки. Точно

так же прямая линия является геометрическим представлением или интерпретацией линейного уравнения, связывающего х и у. Указанный перенос акцента от интуитивного понимания геометрии к аналитическому открывает возможность, в частности, простой и вполне строгой трактовки бесконечно удаленных точек в проективной геометрии; он же необходим для более глубокого проникновения в эту область. Для тех читателей, которые обладают достаточной предварительной математической подготовкой, мы дадим теперь некоторый очерк применения аналитических методов в проективной геометрии.

*2. Однородные координаты. Алгебраические основы двойственности. В обыкновенной аналитической геометрии прямоугольными координатами точки на плоскости являются снабженные знаками расстояния точки от двух взаимно перпендикулярных осей. Но в такой системе координат не находится места для бесконечно удаленных точек расширенной проективной плоскости. Поэтому, если мы хотим пользоваться аналитическими методами в проективной геометрии, то необходимо найти такую координатную систему, которая смогла бы включить идеальные точки наравне с обыкновенными. Легче всего дать описание такой координатной системы, если представить себе данную плоскость X, Y (которую будем обозначать через гс) расположенной в трехмерном пространстве с прямоугольными координатами x, у, z (эти буквы обозначают снабженные знаками расстояния точки от трех координатных плоскостей, образованных осями Х, у и z). Представим себе, что плоскость гс параллельна координатной плоскости Х, у и находится на расстоянии 1 от нее, так что трехмерные координаты точки Р в плоскости гс будут (Х, У, 1). Принимая начало О координатной системы за центр проектирования, заметим, что всякой точке Р взаимно однозначно соответствует некоторая прямая ОР, проходящая через начало координат (см. стр. 105). В частности, бесконечно удаленным точкам плоскости гс соответствуют прямые, проходящие через О и параллельные гс.

Посмотрим теперь, что же представляет собой система однородных координат для точек плоскости гс. Чтобы найти однородные координаты обыкновенной точки Р в этой плоскости, возьмем прямую ОР и на ней выберем произвольную точку Ç, отличную от О (рис. 93). Обыкновенные трехмерные координаты х, у, z точки Q считаются однородными координатами точки Р в плоскости гс. В частности, координаты (Л', У, 1) самой точки Р являются ее однородными координатами. Но вместе с тем ее же однородными координатами явятся любые числа (tX, /К, /), где / ф 0, так как координаты всех точек прямой ОР (кроме О) имеют как раз такой вид. (Мы исключаем точку (0, 0, 0), потому что она лежит на всех прямых, проходящих через О, и не может служить для их различения.)

Система однородных координат, конечно, представляет известное неудобство в том отношении, что нужны три числа вместо двух для определения точки, и, самое главное, координаты точки определяются не однозначно, а с точностью до постоянного множителя. Но она имеет то безусловное преимущество, что она охватывает и идеальные, бесконечно удаленные точки плоскости гс. Действительно, такой идеальной точке Р соответствует некоторая прямая, проходящая через О и параллельная гс; всякая точка Q на такой прямой имеет координаты вида (х, у, 0); таким образом, однородные координаты идеальных точек плоскости к имеют вид (x, г/, 0). Нетрудно написать в однородных координатах уравнение прямой линии на плоскости к. Для этого достаточно заметить, что прямые, соединяющие О с точками этой прямой, лежат в плоскости, проходящей через О. В аналитической геометрии доказывается, что уравнение такой плоскости имеет вид

ax + by + cz = 0. (1')

Это же есть и уравнение данной прямой в однородных координатах.

Теперь, когда геометрическая модель, изображающая точки плоскости к в виде прямых, проходящих через О, отслужила свою службу, можно ее отбросить и дать следующее чисто аналитическое определение расширенной плоскости:

Рис. 93. Однородные координаты

Точка есть не что иное, как тройка действительных чисел (x, у, z), из которых не все равны нулю. Две такие тройки (х\, у\, Z\) и (х2, у2, z2) определяют одну и ту же точку, если существует такое число t ф 0, что

x2 = tx, y2 = ty{, z2 = tz{.

Другими словами, можно, не меняя самой точки, умножать ее координаты на произвольный множитель, отличный от нуля. (Потому эти координаты и называются однородными.) Точка (x, у, z) обыкновенная, если z отлично от нуля, и идеальная, если z равно нулю.

Прямая линия в плоскости гс состоит из всех точек (x, у, z), удовлетворяющих линейному уравнению вида

ax + by + cz = 0, (Г)

где а, Ь, с — постоянные числа, не все равные нулю. В частности, бесконечно удаленные точки плоскости гс удовлетворяют уравнению

z = 0; (2)

согласно определению, это — также уравнение прямой, именно — бесконечно удаленной прямой плоскости гс. Так как прямая определяется уравнением вида (\'),то тройка чисел (а, Ь, с) может быть рассматриваема как однородные координаты прямой (Г). Далее следует, что при произвольном / ф 0 тройка чисел (ta, tb, te) представляет собой координаты той же прямой, так как уравнение

(ta)x + (tb)y + (tc)z = 0 (3)

удовлетворяется в точности теми же координатными тройками (х, у, z), что и уравнение (Г).

В этих определениях обнаруживается полная симметрия между точкой и прямой: и та и другая определяются тройкой чисел — однородными координатами (и, v, w). Условие того, что точка (x, у, z) лежит на прямой (а, Ь, с), выражается равенством

ах + by + cz = 0,

и это же есть вместе с тем условие того, что точка с координатами (а, Ь, с) лежит на прямой с координатами (x, у, z). Например, арифметическое тождество

2 - 3 +1 • 4 + (-5) -2 = 0

означает, что точка (3, 4, 2) лежит на прямой (2, 1, -5), и в равной мере, что точка (2, 1, —5) лежит на прямой (3, 4, 2). Эта симметрия и представляет собой основу двойственности между точкой и прямой в проективной геометрии, так как всякое соотношение между точками и прямыми становится некоторым соотношением между прямыми и точками, если координаты точек считать координатами прямых, а координаты прямых —

координатами точек. Толкуя по-новому те же алгебраические операции и результаты, мы получаем теоремы, соответствующие первоначальным в смысле двойственности. Необходимо заметить, с другой стороны, что в обыкновенной плоскости Л', У ни о какой двойственности не может быть речи, так как уравнение прямой в обыкновенных координатах

aX + bY + с = 0

несимметрично относительно X, Y и а, Ь, с. Только включение в рассмотрение бесконечно удаленных элементов (точек и прямой) обеспечивает применимость принципа двойственности.

Чтобы перейти от однородных координат jt, у, z обыкновенной точки Р в плоскости л к обыкновенным прямоугольным координатам, мы просто полагаем X = ^, Y = ^. Тогда X, Y обозначают расстояния точки Р от двух перпендикулярных осей в плоскости 71, параллельной х- и //-осям, как показано на рис. 93. Мы знаем, что уравнение

aX + bY + c = 0

представляет прямую в плоскости п. Полагая X = —, Y = и умножая на г, мы найдем, что уравнение той же прямой в однородных координатах будет

ах + by + cz = о,

как это уже было указано на стр. 220. Так, уравнение прямой 2х — Зу + z = 0 в обыкновенных прямоугольных координатах X, Y примет вид 2Х — 3Y + 1 = 0. Разумеется, последнему уравнению бесконечно удаленная точка рассматриваемой прямой с однородными координатами (3, 2, 0) уже не отвечает.

Остается сказать еще одно. Нам удалось получить чисто аналитическое определение точки и прямой; но что можно сказать о важном понятии проективного преобразования? Можно установить, что проективное преобразование, понимаемое в том смысле, как это было разъяснено на стр. 203, задается аналитически системой линейных уравнений

(4)

связывающих однородные координаты Jt', у\ г' точек в плоскости к' с однородными координатами х, у, z точек в плоскости к. С аналогичной точки зрения можно определить проективное преобразование как такое, которое задается системой уравнений вида (4). Теоремы проективной геометрии тогда становятся теоремами, говорящими о поведении числовых троек (х, у, z) при таких преобразованиях. Например, доказательство инвариантности двойного отношения при проективных преобразованиях превращается в легкое упражнение из области алгебры линейных преобразований. Не будем вникать в детали этой аналитической процедуры и вернемся вместо того назад — к проективной геометрии в ее более наглядном аспекте.

§ 7. Задачи на построение с помощью одной линейки

В следующих построениях предполагается, что единственным инструментом служит линейка.

Задачи 1-18 заимствованы из одной работы Я. Штейнера, в которой он доказывает, что при геометрических построениях можно обойтись без циркуля, если задан фиксированный круг с центром (см. главу III, стр. 179). Читателю рекомендуется проделать эти задачи в указанном порядке.

Четверка прямых а, Ь, с, d, проходящих через точку Р, называется гармонической, если двойное отношение (abed) равно —1. В этом случае говорят, что с, d гармонически сопряжены с a, b и обратно.

1) Докажите, что если в гармонической четверке а, Ь, с, d прямая а делит пополам угол между с и d, то прямая b перпендикулярна к прямой а.

2) Постройте четвертую гармоническую к трем данным прямым, проходящим через одну точку. (Указание: воспользуйтесь теоремой о полном четырехстороннике.)

3) Постройте четвертую гармоническую к трем данным точкам на одной прямой.

4) Даны прямой угол и произвольный угол с общей вершиной и одной общей стороной. Удвойте данный произвольный угол.

5) Дан угол и его биссектриса Ь. Постройте перпендикуляр к b в вершине данного угла.

6) Докажите, что если проходящие через точку Р прямые 1\, k, ..., 1п пересекают прямую а в точках А\, Лг, ..., Ап и прямую b в точках В\, В2, Вп, то все точки пересечения пар прямых Л/В* и Д^В, (i ф k\ k = 1, 2, ..п) лежат на одной прямой.

7) Докажите, что если в треугольнике ABC прямая, параллельная стороне ВС, пересекает AB в точке В' и АС в точке С, то прямая, соединяющая точку Л с точкой D пересечения прямых В'С и С В, делит пополам ВС.

7а) Сформулируйте и докажите теорему, обратную 7.

8) На прямой / даны три такие точки Р, Q, R, что Q есть середина отрезка PR. Постройте прямую, параллельную / и проходящую через данную точку 5.

9) Даны две параллельные прямые 1\ и k; разделите пополам данный отрезок AB на прямой /|.

10) Через данную точку Р провести прямую, параллельную двум данным параллельным между собой прямым 1\ и /2. (Указание: используйте 7.)

11) Штейнер предлагает следующее решение задачи об удвоении данного отрезка AB при условии, что задана прямая /, параллельная AB: через точку С, не лежащую ни на прямой /, ни на прямой AB, провести прямые CA и СВ; пусть А\ и В\ —соответственно точки их пересечения с прямой /. Затем (см. 10) провести через С прямую, параллельную /; пусть D — точка ее пересечения с ВА\. Если Е — точка пересечения AB и DB\, то АЕ = 2 • AB.

Докажите последнее утверждение.

12) Разделите отрезок AB на п равных частей, если задана прямая /, параллельная AB. (Указание: пользуясь 11, отложите сначала п раз данный отрезок на прямой /.)

13) Дан параллелограмм ABCD. Через данную точку Р проведите прямую, параллельную данной прямой /. (Указание: примените 10 к центру параллелограмма и воспользуйтесь 8.)

14) Дан параллелограмм; увеличьте данный отрезок в п раз. (Указание: примените 13 и 11.)

15) Дан параллелограмм; разделите данный отрезок на п равных частей.

16) Дан неподвижный круг с центром. Проведите через данную точку прямую, параллельную данной прямой. (Указание: примените 13.)

17) Дан неподвижный круг с центром. Увеличьте и уменьшите данный отрезок в п раз. (Указание: примените 13.)

18) Дан неподвижный круг с центром. Проведите через данную точку перпендикуляр к данной прямой. (Указание: воспользуйтесь прямоугольником, вписанным в данный круг, с двумя сторонами, параллельными данной прямой, и сведите к предшествующим задачам.)

19) Пересмотрев задачи 1 — 18, перечислите, какие основные задачи на построение можно выполнить с помощью двусторонней линейки (с двумя параллельными сторонами).

20) Две данные прямые /| и h пересекаются в точке Р, находящейся за пределами чертежа. Постройте прямую, соединяющую данную точку Q с точкой Р. (Указание: дополните заданные элементы таким образом, чтобы получилась конфигурация плоскостной теоремы Дезарга, причем Р и Q стали бы точками пересечения взаимно соответствующих сторон двух треугольников.)

21) Проведите прямую через две точки, между которыми расстояние больше, чем длина линейки. (Указание: примените 20.)

22) Прямые /| и /2 пересекаются в точке Р\ прямые ш\ и т2 — в точке Q; обе точки Р и Q — за пределами чертежа. Постройте ту часть прямой PC, которая находится в пределах чертежа. (Указание: чтобы получить точку прямой PQ, постройте конфигурацию Дезарга таким образом, чтобы две стороны одного треугольника лежали соответственно на 1\ и mi, две стороны другого — соответственно на k и гаг).

23) Решите 20 с помощью теоремы Паскаля (стр. 215). (Указание: достройте конфигурацию Паскаля, рассматривая 1\ и /2 как пару противоположных сторон шестиугольника, a Q — как точку пересечения другой пары противоположных сторон.)

*24) Каждая из двух прямых, целиком лежащих за пределами чертежа, задана двумя парами прямых линий, пересекающихся за пределами чертежа в точках соответствующей прямой. Определите точку их пересечения с помощью двух прямых, пересекающихся за пределами чертежа.

§ 8. Конические сечения и квадрики

1. Элементарная метрическая геометрия конических сечений. До сих пор мы занимались только точками, прямыми, плоскостями и фигурами, составленными из конечного числа этих элементов. Если бы проективная геометрия ограничивалась рассмотрением таких «линейных» фигур,

она была бы сравнительно малоинтересна. Но фактом первостепенного значения является то обстоятельство, что проективная геометрия этим не ограничивается, а включает также обширную область конических сечений и их многомерных обобщений. Аполлониева метрическая трактовка конических сечений — эллипсов, гипербол и парабол — была одним из выдающихся успехов античной математики. Едва ли можно переоценить значение конических сечений как для чистой, так и для прикладной математики (например, орбиты планет и орбиты электронов в атоме водорода являются коническими сечениями). Не приходится удивляться тому, что классическая, возникшая в Древней Греции, теория конических сечений и в наши дни составляет необходимую часть математического образования. Но греческая геометрия никоим образом не сказала последнего слова. Через две тысячи лет были открыты замечательные проективные свойства конических сечений. Несмотря на простоту и изящество этих свойств, академическая инерция до настоящего времени служит препятствием их проникновению в школьное преподавание.

Начнем с того, что напомним метрические определения конических течений. Таких определений несколько, и их эквивалентность доказывается в элементарной геометрии. Наиболее распространенные определения связаны с фокусами кривых. Эллипс определяется как геометрическое место таких точек Р на плоскости, что сумма их расстояний г{ и г2 от двух данных точек F\ и F2, называемых фокусами, имеет постоянное значение. (Если фокусы совпадают, кривая превращается в окружность.) Гипербола определяется как геометрическое место таких точек Р на плоскости, что абсолютная величина разности г{ - г2 равно одной и той же постоянной величине. Парабола определяется как геометрическое место точек Р, расстояние которых г от данной точки F равно расстоянию от данной прямой /.

В аналитической геометрии эти кривые представляются уравнениями второй степени относительно прямоугольных координат x, у. Нетрудно доказать, обратно, что всякая кривая, представляемая уравнением второго порядка

есть или одно из трех названных выше конических сечений, или прямая линия, или пара прямых, или сводится к одной точке, или носит чисто мнимый характер. Как показывается во всяком курсе аналитической геометрии, для доказательства достаточно сделать надлежащим образом подобранную замену координатной системы.

Указанные выше определения конических сечений — существенно метрические, так как пользуются понятием расстояния. Но вот другое определение, устанавливающее место конических сечений в проективной геометрии: конические сечения суть не что иное, как проекции окружности на плоскость. Если мы станем проектировать окружность С

из некоторой точки О, то проектирующие прямые образуют бесконечный двойной конус, и пересечение этого конуса с плоскостью гс будет проекцией окружности С. Кривая пересечения будет эллипсом или гиперболой, смотря по тому, пересечет ли плоскость только одну «полость» конуса или обе. Возможен и промежуточный случай параболы, если плоскость гс параллельна одной из проектирующих прямых, проведенных через О (рис. 94).

Проектирующий конус не обязан быть «прямым круговым» с вершиной О, расположенной вертикально над центром окружности С: он может быть и «наклонным». Но во всех случаях (как мы примем здесь, не приводя доказательства) в пересечении конуса с плоскостью получается кривая, уравнение которой — второй степени; и обратно, всякая кривая второго порядка может быть получена из окружности посредством проектирования. По этой именно причине кривые второго порядка иначе называются коническими сечениями.

Мы уже отметили, что если плоскость пересекает только одну «полость» прямого кругового конуса, то пересечение Е представляет собой эллипс. Нетрудно установить, что кривая Е удовлетворяет обыкновенному фокальному определению эллипса, которое было сформулировано выше. Приведем очень простое и изящное доказательство, данное в 1822 г. бельгийским математиком Данделеном. Представим себе две сферы S\ и S2 (рис. 95), которые касаются плоскости сечения к соответственно в точках F\ и F2 и, кроме того, касаются конуса вдоль параллельных окружностей К\ и К2. Взяв произвольную точку Р кривой £, проведем отрезки PF\ и РЕ2. Затем рассмотрим отрезок РО, соединяющий точку Р с вершиной конуса О; этот отрезок целиком лежит на поверхности конуса; обозначим через Q\ и Q2 точки его пересечения с окружностями К\ и К2.

Рис. 94. Конические сечения

Так как PF\ и PQ\ —две касательные, проведенные из точки Р к одной и той же сфере 5|, то

Точно так же

Складывая эти равенства, мы получаем:

Но PQi + PQ2 = Q1Q2 есть расстояние между параллельными окружностями К\ и К2 на поверхности конуса: оно не зависит от выбора точки Р на кривой Е. Отсюда следует, что, какова бы ни была точка Р на £, имеет место равенство

PF{ + PF2 = const,

а это и есть фокальное определение эллипса. Итак, Е есть эллипс, a F\ и F2 — его фокусы.

Упражнение. Если плоскость пересекает обе «полости» конуса, то кривая пересечения — гипербола. Докажите это утверждение, помещая по одной сфере в каждой из «полостей» конуса.

2. Проективные свойства конических сечений. Основываясь на положениях, установленных в предыдущем пункте, примем теперь временно следующее определение: коническое сечение есть проекция окружности на плоскость. Это определение в большей степени отвечает духу проективной геометрии, чем общепринятые фокальные определения, так как эти последние всецело опираются на метрическое понятие расстояния. Новое определение тоже не вполне свободно от этого недостатка, поскольку «окружность» — также метрическое понятие. Но через мгновение мы придем к чисто проективному определению конических сечений.

Рис. 95. Сферы Данделена

Раз мы приняли, что коническое сечение есть не что иное, как проекция окружности (другими словами, под термином «коническое сечение» мы понимаем любую кривую, принадлежащую проективному классу окружности; см. стр. 212), то отсюда сейчас же следует, что всякое свойство окружности, инвариантное относительно проективных преобразований, должно также принадлежать любому коническому сечению. Вспомним теперь следующее хорошо известное — метрическое — свойство окружности: «вписанные в окружность углы, опирающиеся на одну и ту же дугу, равны между собой». На рис. 96 угол АОВ, опирающийся на дугу AB, не зависит от положения точки О на окружности. Свяжем, дальше, указанное обстоятельство с проективным понятием двойного отношения, вводя на окружности уже не две точки Л, В, а четыре: А, В, С, D. Четыре прямые a, Ь, с, d, соединяющие эти точки с точкой О на окружности, имеют двойное отношение (а, Ь, с, d), зависящее только от углов, опирающихся на дуги CA, СВ, DA, DB. Соединяя Л, В, С, D с какой-нибудь другой точкой О' на окружности, получим прямые а', Ь', с', d'. Из отмеченного ранее свойства окружности вытекает, что две четверки прямых «конгруэнтны»1. Поэтому у них будет одно и то же двойное отношение: (a'b'c'd') = (abed). Спроектируем окружность на некоторое коническое сечение К: тогда на К получится четверка точек, которые мы снова обозначим через Л, В, С, D, две точки О и О7 и две четверки прямых а, Ь, с, d и a', b', с', d'. Эти две четверки прямых уже не будут конгруэнтны, так как углы при проектировании, вообще говоря, не сохраняются. Но так как двойное отношение при проектировании не изменяется, то равенство (abcd) = (a'b'c'd') по-прежнему имеет место. Мы пришли, таким образом, к следующей основной теореме: если четыре точки конического сечения К, например Л, В, С, D, соединены с пятой точкой О того же сечения прямыми а, Ь, с, d, то двойное отношение (abed) не зависит от положения О на кривой К (рис. 97).

Рис. 96. Двойное отношение на окружности

1 Четверка прямых а, Ь, с, d считается конгруэнтной другой четверке а', Ь\ с', а", если углы между каждой парой прямых в первой четверке равны как по величине, так и по направлению отсчета углам между соответствующими прямыми второй четверки.

Это — замечательный результат. Как нам уже известно, если четыре точки А, В, С, D взяты на прямой, то двойное отношение, составленное из соединяющих эти точки с пятой точкой О прямых, не зависит от выбора этой пятой точки. Это — исходное положение, лежащее в основе проективной геометрии. Теперь мы узнали, что аналогичное утверждение справедливо и относительно четырех точек, взятых на некотором коническом сечении /(, однако с существенным ограничением: пятая точка О уже не может свободно двигаться по всей плоскости, а может только перемещаться по коническому сечению К.

Не представляет особого труда доказать и обратную теорему в следующей форме: если на кривой К имеются две точки О и О', обладающие тем свойством, что какова бы ни была четверка точек А, В, С, D на кривой К, двойные отношения, составленные из прямых, соединяющих эти точки с О, и из прямых, соединяющих эти точки с О', равны между собой, то кривая К есть коническое сечение (а уж тогда, по прямой теореме, двойное отношение, составленное из прямых, соединяющих четыре данные точки с произвольной точкой О" на К, будет иметь одно и то же постоянное значение). Но доказательства мы здесь приводить не будем.

Изложенные проективные свойства конических сечений наводят на мысль об общем методе точечного построения этих кривых. Условимся под пучком прямых понимать совокупность всех прямых плоскости, проходящих через данную точку О. Рассмотрим пучки прямых, проходящих через две точки О и О', расположенные на коническом сечении К. Между прямыми пучка О и прямыми пучка О' можно установить взаимно однозначное соответствие, сопоставляя прямой а из первого пучка прямую а' из второго всякий раз, как а и а' встречаются в некоторой точке А кривой К. Тогда любая четверка прямых а, Ь, с, d из пучка О будет иметь то же двойное отношение, что и соответствующая четверка а', Ь', с', d' из пучка О'. Всякое взаимно однозначное соответствие между двумя пучками прямых, обладающее этим последним свойством, называется проективным соответствием. (Это определение двойственно по отношению к определению проективного соответствия между точками на двух прямых, см. стр. 204-205.) Пользуясь этим определением, можно теперь утверждать: коническое сечение К есть геометрическое место

Рис. 97. Двойное отношение на эллипсе

точек пересечения взаимно соответствующих прямых из двух пучков, находящихся в проективном соответствии. Полученная теорема подводит фундамент под следующее чисто проективное определение конических сечений: коническим сечением называется геометрическое место точек пересечения взаимно соответствующих прямых из двух пучков, находящихся в проективном соответствии1. Как ни соблазнительно проникнуть в глубь теории конических сечений, строящейся на таком определении, однако мы вынуждены ограничиться немногими замечаниями по этому поводу.

Пары пучков, находящихся в проективном соответствии, можно получить следующим образом. Спроектируем все точки Р прямой линии / из двух разных центров О и О" и установим между проектирующими пучками взаимно однозначное соответствие, сопоставляя друг другу те прямые, которые пересекаются на прямой /. Этого достаточно, чтобы полученные пучки находились в проективном соответствии. Затем возьмем пучок О" и перенесем его «как нечто твердое» в произвольное положение О'. Что новый пучок О' будет находиться в проективном соответствии с пучком О, это совершенно очевидно. Но замечательно то, что любое проективное

соответствие между двумя пучками можно получить именно таким образом. (Это обстоятельство двойственно по отношению к упражнению 1 на стр. 205.) Если пучки О и О' конгруэнтны, получается окружность. Если углы между соответствующими лучами в двух пучках равны, но отсчитываются в противоположных направлениях, то получается равносторонняя гипербола (рис. 99).

Следует еще заметить, что указанное определение конического сечения может, в частности, дать и прямую линию, как это показано на рис. 98.

Рис. 98. К построению проективных пучков прямых

1 Это геометрическое место, при известных обстоятельствах, может вырождаться в прямую линию; см. рис. 98.

В этом случае прямая 00" соответствует сама себе, и все ее точки должны быть рассматриваемы как принадлежащие искомому геометрическому месту. Таким образом, коническое сечение вырождается в пару прямых: это обстоятельство вполне согласуется с тем фактом, что существуют сечения конуса, состоящие из двух прямых (если секущая плоскость проходит через вершину конуса).

Упражнения. 1) Вычертите эллипсы, гиперболы и параболы с помощью проективных пучков. (Читателю настойчиво рекомендуется экспериментировать с подобного рода построениями. Это в высшей степени способствует пониманию сути дела.)

2) Дано пять точек О, О', Л, В, С некоторого конического сечения К. Найдите точки пересечения D произвольной прямой d пучка О с кривой К. (Указание: через О проведите прямые ОЛ, OB, ОС и назовите их а, 6, с. Через О' проведите прямые ОМ, О'В, О'С и назовите их а', Ь\ с'. Проведите через О прямую d и постройте такую прямую d'пучка О', что (abcd) = (a'b'c'd1). Тогда точка пересечения d и d'принадлежит кривой К)

3. Конические сечения как «линейчатые кривые». Понятие касательной к коническому сечению принадлежит проективной геометрии, так как касательная к коническому сечению есть прямая, имеющая с самой кривой только одну общую точку, а это — свойство, сохраняющееся при проектировании. Проективные свойства касательных к коническим сечениям основываются на следующей теореме:

Рис. 99. Образование окружности и равносторонней гиперболы с помощью проективных пучков

Двойное отношение точек пересечения четырех фиксированных касательных к коническому сечению с произвольной пятой касательной не зависит от выбора этой пятой касательной.

Доказательство этой теоремы весьма просто. Так как любое коническое сечение есть проекция окружности и так как в теореме идет речь только о таких свойствах, которые инвариантны относительно проектирования, то, чтобы доказать теорему в общем случае, достаточно доказать ее для частного случая окружности.

Для этого же частного случая теорема доказывается средствами элементарной геометрии. Пусть Я, Q, /?, S — четыре точки на окружности К\ а, Ь, с, d — касательные в этих точках; Т — еще какая-нибудь точка на окружности, о — касательная в ней; пусть, далее, Л, В, С, D — точки пересечения касательной о с касательными а, Ь, с, d. Если M — центр окружности, то, очевидно, Z.TMA = ^/.ТМР, и последнее выражение

представляет угол, вписанный в /С, опирающийся на дугу ТР. Таким же образом ZTMB представляет угол, вписанный в К и опирающийся на дугу TQ. Следовательно,

где — ^ PQ обозначает угол, вписанный в К и опирающийся на дугу PQ.

Отсюда видно, что А, В, С, D проектируются из M четырьмя прямыми, углы между которыми имеют величины, зависящие только от положения

Рис. 100. Окружность как совокупность касательных

Рис. 101. Свойство касательной к окружности

точек Р, Q, /?, S. Но тогда двойное отношение (ABCD) зависит только от четырех касательных a, by с, d, но не от касательной о. Как раз это и нужно было установить.

В предыдущем пункте мы имели случай убедиться, что коническое сечение может быть построено «по точкам», если станем отмечать точки пересечения взаимно соответствующих прямых двух пучков, между которыми установлено проективное соответствие. Только что доказанная теорема дает нам возможность сформулировать двойственную теорему. Возьмем две касательные а и а' к коническому сечению К. Третья касательная t пусть пересекает а и а' соответственно в точках А и А'. Если / будет перемещаться вдоль кривой, то установится соответствие между точками а и точками а'. Это соответствие будет проективным, так как по доказанной теореме произвольная четверка точек на а будет непременно иметь то же двойное отношение, что и соответствующая четверка точек на а'. Отсюда следует, что коническое сечение К, рассматриваемое как «совокупность своих касательных», «состоит» из прямых, соединяющих взаимно соответствующие точки двух точечных рядов1 на а и на а', находящихся в проективном соответствии. Указанное обстоятельство позволяет ввести новое определение конических сечений, рассматриваемых на этот раз как «линейчатые кривые». Сравним это определение с

Рис. 102. Проективные ряды точек на двух касательных к эллипсу

1 Совокупность точек на прямой называется точечным рядом. Это понятие двойственно по отношению к пучку прямых.

прежним проективным определением конического сечения, данным в предыдущем пункте:

I

Коническое сечение, рассматриваемое как совокупность точек, состоит из точек пересечения взаимно соответствующих прямых в двух проективных пучках.

II

Коническое сечение, рассматриваемое как «совокупность прямых», состоит из прямых, соединяющих взаимно соответствующие точки в двух проективных рядах.

Если мы станем считать касательную к коническому сечению в некоторой его точке двойственным элементом по отношению к самой точке и условимся, кроме того, «линейчатую кривую» (образованную совокупностью касательных) на основе двойственности сопоставлять «точечной кривой» (образованной совокупностью точек), то предыдущие формулировки будут безупречны с точки зрения принципа двойственности. При «переводе» одной формулировки в другую с заменой всех понятий соответствующими двойственными понятиями, «коническое сечение» остается неизменным; но в одном случае оно мыслится как «точечная кривая», определяемая своими точками, в другом — как «линейчатая кривая», определяемая своими касательными.

Из предыдущего вытекает важное следствие: принцип двойственности, первоначально установленный в проективной геометрии плоскости только для точек и прямых, оказывается, может быть распространен и на конические сечения. Если в формулировке любой теоремы, касающейся точек, прямых и конических сечений, заменить каждый элемент ему двойственным (не упуская из виду, что точке конического сечения должна быть сопоставляема касательная к этому коническому сечению), то в результате также получится справедливая теорема. Пример действия этого принципа мы встретим в пункте 4 настоящего параграфа.

Построение конических сечений, понимаемых как «линейчатые кривые», показано на рис. 103—104. В частности, если в двух проективных точечных рядах бесконечно удаленные точки соответствуют взаимно одна другой (так будет непременно, если точечные ряды конгруэнтны или подобны1), то коническое сечение будет параболой; справедливо и обратное утверждение.

Упражнение. Докажите обратную теорему: на двух неподвижных касательных к параболе движущаяся касательная к параболе определяет два подобных точечных ряда.

1 Что такое «конгруэнтные» и «подобные» точечные ряды, достаточно понятно без объяснений.

Рис. 103. Парабола, определенная конгруэнтными точечными рядами

Рис. 104. Парабола, определенная подобными точечными рядами

4. Теоремы Паскаля и Брианшона для общего случая произвольных конических сечений. Одной из лучших иллюстраций принципа двойственности применительно к коническим сечениям является взаимоотношение между общими теоремами Паскаля и Брианшона. Первая из них была открыта в 1640 г., вторая — в 1806 г. И, однако, каждая из них есть непосредственное следствие другой, так как всякая теорема, формулировка которой упоминает только конические сечения, прямые и точки, непременно остается справедливой при изменении формулировки по принципу двойственности.

Теоремы, доказанные в § 5 под теми же наименованиями, представляют собой «случаи вырождения» следующих более общих теорем.

Теорема Паскаля. Противоположные стороны шестиугольника, вписанного в коническое сечение, пересекаются в трех коллинеарных точках.

Теорема Брианшона. Три диагонали, соединяющее противоположные вершины шестиугольника, описанного около конического сечения, конкуррентны.

Обе теоремы имеют очевидное проективное содержание. Их двойственность бросается в глаза, если сформулировать их следующим образом:

Теорема Паскаля. Дано шесть точек 1, 2, 3, 4, 5, 6 на коническом сечении. Соединим последовательные точки прямыми (1,2), (2, 3), (3, 4), (4, 5), (5, 6), (6, 1). Отметим точки пересечения прямых (1,2) и (4, 5), (2, 3) и (5, 6), (3, 4) и (6, 1). Эти три точки лежат на одной прямой.

Рис. 105. Общая конфигурация Паскаля. Показаны два случая: один для шестиугольника 1, 2, 3, 4, 5, 6, другой для шестиугольника 1, 3, 5, 2, 6, 4

Теорема Брианшона. Дано шесть касательных 1, 2, 3, 4, 5, 6 к коническому сечению. Последовательные касательные пересекаются в точках (1, 2), (2, 3), (3, 4), (4, 5), (5, 6), (6, 1). Проведем прямые, соединяющие точки (1,2) и (4, 5), (2, 3) и (5, 6), (3, 4) и (6, 1). Эти три прямые проходят через одну точку.

Доказательства проводятся с помощью специализации такого же рода, как и в рассмотренных раньше случаях вырождения. Докажем теорему Паскаля. Пусть Л, В, С, Д £, F — вершины шестиугольника, вписанного в коническое сечение К. Посредством проектирования можно сделать параллельными прямые AB и ED, FA и CD (и тогда получится конфигурация, изображенная на рис. 107; ради удобства шестиугольник на чертеже взят самопересекающимся, хотя в этом нет никакой необходимости.) Нам нужно теперь доказать только одно: что прямая СВ параллельна прямой FE] другими словами, что противоположные стороны пересекаются на бесконечно удаленной прямой. Для доказательства рассмотрим четверку точек F, Л, В, Д которая, как мы знаем, при проектировании из любой точки К сохраняет одно и то же двойное отношение, скажем, k. Станем проектировать из точки С на прямую AF; получим четверку точек F, Л, Y, оо, причем

(см. стр. 211).

Рис. 106. Общая конфигурация Брианшона. Показаны только два случая

Рис. 107. Доказательство теоремы Паскаля

Рис. 108. Построение прямых, пересекающих три данные прямые общего положения

Станем теперь проектировать из точки Е на прямую ВА\ получим четверку точек X, А, В, оо, причем

Итак,

что как раз и означает, что YB || FX. Доказательство теоремы Паскаля закончено.

Теорема Брианшона, как было указано, следует из теоремы Паскаля по принципу двойственности. Но ее можно доказать и непосредственно — путем рассуждения, двойственного относительно только что приведенного. Провести это рассуждение во всех деталях будет прекрасным упражнением для читателя.

5. Гиперболоид. В трехмерном пространстве мы встречаемся с так называемыми квадриками (поверхностями второго порядка), которые в данном случае играют ту же роль, что «конические сечения» (кривые второго порядка) на плоскости.

Простейшими из них являются сфера и эллипсоид. Квадрики более разнообразны, чем конические сечения, и изучение их связано с большими трудностями. Мы рассмотрим бегло и без доказательств одну из самых интересных поверхностей этого типа: так называемый связный (или однополостный) гиперболоид.

Эта поверхность может быть получена следующим образом. Возьмем в пространстве три прямые /ь /2, /3, находящиеся в общем положении. Последнее означает, что никакие две из них не параллельны и все три не являются параллельными одной и той же плоскости. Может показаться удивительным, что существует бесконечное множество прямых в пространстве, из которых каждая пересекается со всеми тремя данными прямыми. Убедимся в этом. Пусть тс — произвольная плоскость, содержащая прямую 1\\ эта плоскость пересекает прямые /2 и /3 в двух точках, и прямая га, проведенная через эти две точки, очевидно, пересекается со всеми прямыми /|, 12 и /3. Когда плоскость гс вращается около прямой /|, прямая га будет изменять свое положение, однако все время продолжая пересекаться с тремя данными прямыми. При движении га возникает поверхность, неограниченно уходящая в бесконечность, которая и называется однополостным гиперболоидом. Она содержит бесконечное множество прямых типа га. Любые три такие прямые, скажем tri\, га2 и га3, также будут находиться в общем положении, и те прямые в пространстве, которые будут пересекаться с тремя прямыми Ш\, т2 и га3 одновременно, также будут лежать на рассматриваемой поверхности. Отсюда следует основное свойство гиперболоида: он составляется из двух различных семейств прямых линий; каждые три линии одного и того же семейства находятся в общем положении и каждая прямая одного семейства пересекается со всеми прямыми другого.

Важное проективное свойство гиперболоида заключается в том, что двойное отношение тех четырех точек, в которых данная четверка прямых одного семейства пересекается с некоторой прямой второго семейства, не зависит от выбора этой последней. Это утверждение вытекает из метода

Рис. 109. Гиперболоид

построения гиперболоида с помощью вращающейся плоскости, и читатель может убедиться в его справедливости и качестве упражнения.

Отметим еще одно замечательное свойство гиперболоида: хотя он содержит два семейства прямых линий, но существование этих прямых не препятствует изгибанию поверхности — не делает ее жесткой. Если устроить модель гиперболоида из стержней, способных свободно вращаться около точек взаимных пересечений, то поверхность в целом может быть непрерывно деформируема, пробегая бесконечное множество различных состояний.

§ 9. Аксиоматика и нееклидова геометрия

1. Аксиоматический метод. Аксиоматический метод в математике берет свое начало по меньшей мере от Евклида. Было бы совершенно ошибочно полагать, что античная математика развивалась или излагалась исключительно в строго постулативной форме, свойственной «Началам». Но впечатление, произведенное этим сочинением на последующие поколения, было столь велико, что в нем стали искать образцов для всякого строгого доказательства в математике. Иной раз даже философы (например, Спиноза в его «Ethica, more geometrico demonstrata») пытались излагать свои рассуждения в форме теорем, выводимых из определений и аксиом. В современной математике, после периода отхода от евклидовой традиции, продолжавшегося на протяжении XVII и XVIII вв., снова обнаружилось все усиливающееся проникновение аксиоматического метода в различные области. Одним из самых недавних продуктов подобного рода устремления мысли явилось возникновение новой дисциплины — математической логики.

В общих чертах аксиоматическая точка зрения может быть охарактеризована следующим образом. Доказать теорему в некоторой дедуктивной системе — значит установить, что эта теорема есть необходимое логическое следствие из тех или иных ранее доказанных предложений; последние в свою очередь должны быть доказаны и т. д. Процесс математического обоснования сводился бы, таким образом, к невыполнимой задаче «бесконечного спуска», если только в каком-нибудь месте нельзя было бы остановиться. Но в таком случае должно существовать некоторое число утверждений — постулатов, или аксиом, которые принимаются в качестве истинных и доказательство которых не требуется. Из них можно пытаться вывести все другие теоремы путем чисто логической аргументации. Если все факты некоторой научной области приведены в подобного рода логический порядок, а именно такой, что любой из них «выводится» из нескольких отобранных предложений (предпочтительно, чтобы таковые были немногочисленны, просты и легко усваивались), то

тогда есть основание сказать, что область представима в «аксиоматической форме» или «допускает аксиоматизацию». Выбор предложений-аксиом в широкой степени произволен. Однако мало пользы, если наши постулаты недостаточно просты или если их слишком много. Далее, система постулатов должна быть совместимой (непротиворечивой) в том смысле, что никакие две теоремы, которые из них могут быть выведены, не должны содержать взаимных противоречий, и полной в том смысле, что всякая теорема, имеющая место в рассматриваемой области, из них может быть выведена. Желательно также, чтобы система постулатов была независимой, т. е. чтобы ни один из них не был логическим следствием остальных. Вопрос о непротиворечивости и полноте системы аксиом был предметом больших дискуссий. Различные философские взгляды на источники человеческого знания обусловили различные, подчас несовместимые точки зрения на основания математики. Если математические понятия рассматриваются как субстанциальные объекты в сфере «чистой интуиции», независимые от определений и отдельных актов мыслительной деятельности человека, тогда, конечно, в математических результатах не может быть никаких противоречий, поскольку они представляют собой объективно истинные предложения, описывающие реальный мир. Если исходить из такой «кантианской» точки зрения, то никакой проблемы непротиворечивости вообще нет. Но, к сожалению, действительное содержание математики не удается уложить в столь простые философские рамки. Представители современного математического интуиционизма не полагаются на чистую интуицию в ее полном кантовском понимании. Они признают счетную бесконечность в качестве законного детища интуиции, но допускают использование лишь конструктивных свойств. Такие же фундаментальные понятия, как числовой континуум, следует, с их точки зрения, исключить из употребления, пожертвовав при этом важными разделами существующей математики (а то, что после этого остается, оказывается чрезвычайно сложным, причем без особой надежды на упрощение).

Совершенно другую позицию заняли «формалисты». Они не приписывают математическим понятиям никакой интуитивной реальности и не утверждают, что аксиомы выражают какие-то объективные истины, относящиеся к объектам чистой интуиции; они (формалисты) заботятся лишь о формальной логической правильности процесса рассуждений, базирующихся на постулатах. Позиция эта обладает безусловными преимуществами по сравнению с интуиционистской, так как она предоставляет математике полную свободу действий, нужную как для теории, так и для приложений. Но она вместе с тем вынуждает формалистов доказывать, что принятые ими аксиомы, выступающие теперь в качестве продукта свободного творчества человеческого интеллекта, не могут привести к

противоречию. На протяжении последних двадцати лет1 предпринимались многочисленные и напряженные попытки поиска такого рода доказательств непротиворечивости, особенно по отношению к аксиомам арифметики и алгебры и к понятию числового континуума. Результаты, полученные в этом направлении, имеют исключительную важность, но задача в целом еще далеко не выполнена2. Более того, полученные в последние годы результаты свидетельствуют о том, что такого рода попытки и не могут привести к полному успеху — выяснилось, что для некоторых строго определенных и замкнутых систем понятий вообще нельзя доказать, что они непротиворечивы и в то же время полны. Особенно замечательно то обстоятельство, что все такого рода рассуждения, касающиеся проблем обоснования, проводятся полностью конструктивными и интуитивно убедительными методами.

Спор между интуиционистами и формалистами, особенно обострившийся в связи с парадоксами теории множеств (см. стр. 114—115), породил массу страстных выступлений убежденных сторонников обеих школ. Математический мир потрясали возгласы о «кризисе основ». Но эти сигналы тревоги не воспринимались — да и не следовало их воспринимать — слишком уж всерьез. При всем уважении к достижениям, завоеванным в борьбе за полную ясность основ, вывод, что эти расхождения во взглядах или же парадоксы, вызванные спокойным и привычным использованием понятий неограниченной общности, таят в себе серьезную угрозу для самого существования математики, представляется совершенно необоснованным.

Совершенно независимо от каких бы то ни было философских рассмотрений и интереса к проблемам оснований аксиоматический подход к предмету математики — самый естественный способ разобраться во всех хитросплетениях взаимосвязей между различными фактами и выяснить закономерности логического строения объединяющих их теорий. Не раз случалось, что такое сосредоточение внимания на формальной структуре, а не на интуитивном смысле понятий, облегчало отыскание обобщений и применений, которые легко было бы упустить при более интуитивном подходе к делу. Но выдающиеся открытия и подлинное понимание лишь в исключительных случаях оказывались результатом применения чисто аксиоматических методов. Подлинный источник развития математики — это творческая мысль, поддерживаемая интуицией. И если даже считать аксиоматизацию тем идеалом, к которому стремится математика, было бы непростительной ошибкой уверовать в то, что аксиоматика сама по себе является сутью математики. Творческая, конструктивная интуиция матема-

1 Написано в 1941 г. О дальнейших работах в этой области, а также по поводу всей обширной проблематики оснований математики и характеристики различных направлений, см. [11], [15], [38]. — Прим. ред.

2 См. предыдущее примечание. — Прим. ред.

тика привносит в математику недедуктивные и иррациональные моменты, уподобляющие ее музыке или живописи.

Со времен Евклида геометрия неизменно была прототипом аксиоматизированной дисциплины. На протяжении столетий система евклидовых постулатов была предметом напряженного изучения. Но только сравнительно недавно стало совершенно ясно, что эти постулаты должны быть изменены и дополнены, для того чтобы из них могла быть выведена дедуктивно совокупность предложений элементарной геометрии. Например, в конце прошлого столетия Паш обнаружил, что при рассмотрении порядка расположения точек на прямой, т. е. соотношений, характеризуемых словом «между», требуется особый постулат. Паш выдвинул в качестве постулата следующее предложение: если прямая пересекает сторону треугольника в точке, не являющейся вершиной, то она пересекается и еще с одной стороной треугольника. (Невнимательное отношение к этой детали приводит к ряду явных парадоксов: абсурдные следствия — например, общеизвестное «доказательство» того, что все треугольники равнобедренные — как будто бы строго «выводятся» из евклидовых аксиом. Этот «вывод» основывается на неточном выполнении чертежа, причем некоторые прямые пересекаются вне треугольника или круга, тогда как на самом деле должны пересечься внутри.)

В своей знаменитой книге «Grundlagen der Geometrie» (первое издание ее появилось в 1899 г.) Гильберт дал вполне удовлетворительно построенную систему аксиом геометрии и вместе с тем произвел исчерпывающий анализ их взаимной независимости, их непротиворечивости и полноты.

Во всякую систему аксиом неизбежно входят некоторые неопределимые понятия, например, «точка» или «прямая» в геометрии. Их «значение» (или связь с объектами реального мира) для математики несущественно. Эти понятия должны быть принимаемы чисто абстрактно, и их математические свойства в пределах дедуктивной системы всецело вытекают из тех соотношений между ними, которые утверждаются в аксиомах. Так, в проективной геометрии естественно начать с основных понятий «точка» и «прямая» и отношения «инцидентности» и сформулировать две двойственные аксиомы: «каждые две различные точки инцидентны с одной и только одной прямой» и «каждые две различные прямые инцидентны с одной и только одной точкой». В аксиоматической системе проективной геометрии двойственность в формулировке аксиом обусловливает двойственность в самом построении. Всякой теореме, содержащей в своей формулировке и в доказательстве только двойственные элементы, непременно соответствует двойственная теорема. В самом деле, доказательство исходной теоремы заключается в последовательном применении некоторых аксиом, и применение в том же порядке двойственных аксиом составит доказательство двойственной теоремы.

Совокупность аксиом геометрии составляет неявное определение всех «неопределяемых» геометрических понятий: «точка», «прямая», «инцидентность» и т. д. Для применений геометрии важно, чтобы основные понятия и аксиомы геометрии находились в хорошем соответствии с доступными физической проверке утверждениями, касающимися «реальных», осязаемых предметов. Физическая реальность, стоящая за понятием «точки», есть какой-то очень маленький объект, вроде небольшого пятнышка, получаемого на бумаге при прикосновении карандаша, и таким же образом «прямая» представляет собой абстракцию туго натянутой нити или светового луча. Свойства этих физических точек и прямых, как можно установить путем проверки, более или менее соответствуют формальным аксиомам геометрии. Легко себе представить, что более точно поставленные эксперименты могут вызвать необходимость в изменении аксиом, если мы хотим, чтобы они давали адекватное описание физических явлений. Напротив, если бы существовало заметное отклонение формальных аксиом от физических свойств предметов, то геометрия, построенная на этих аксиомах, представляла бы ограниченный интерес. Таким образом, даже с точки зрения формалиста, есть нечто, что оказывает большее влияние на направления математической мысли, нежели человеческий разум.

2. Гиперболическая неевклидова геометрия. В системе Евклида имеется одна аксиома, относительно которой — на основе сопоставления с эмпирическими данными, с привлечением туго натянутых нитей или световых лучей, — никак нельзя сказать, является ли она «истинной». Это знаменитый постулат о параллельных, утверждающий, что через данную точку, расположенную вне данной прямой, можно провести одну и только одну прямую, параллельную данной. Своеобразной особенностью этой аксиомы является то, что содержащееся в ней утверждение касается свойств прямой на всем ее протяжении, причем прямая предполагается неограниченно продолженной в обе стороны: сказать, что две прямые параллельны, — значит утверждать, что у них нельзя обнаружить общей точки, как бы далеко их ни продолжать. Вполне очевидно, что в пределах некоторой ограниченной части плоскости, как бы эта часть ни была обширна, напротив, можно провести через данную точку множество прямых, не пересекающихся с данной прямой. Так как максимально возможная длина линейки, нити, даже светового луча, изучаемого с помощью телескопа, непременно конечна, и так как внутри круга конечного радиуса существует много прямых, проходящих через данную точку и в пределах круга не встречающихся с данной прямой, то отсюда следует, что постулат Евклида никогда не может быть проверен экспериментально. Все прочие аксиомы Евклида имеют конечный характер, т. е. касаются конечных отрезков прямых или конечных частей рассматриваемых плоских фигур. Тот

факт, что аксиома параллельности не допускает эмпирической проверки, выдвигает на первый план вопрос о том, является ли она независимой от прочих аксиом. Если бы она была неизбежным логическим следствием других аксиом, то тогда нужно было бы просто вычеркнуть ее из списка аксиом и доказывать как теорему с помощью иных евклидовых аксиом. Много столетий математики пытались найти такое доказательство; этому способствовало широко распространенное среди всех, кто занимался геометрией, смутное сознание того, что аксиома параллельности по своему характеру существенно отличается от остальных, что ей недостает той убеждающей наглядности, которой, казалось бы, должно было обладать всякое геометрическое предложение, возводимое в ранг аксиомы.

Одна из первых попыток в указанном направлении была сделана в IV столетии н. э. комментатором Евклида Проклом, который, чтобы избежать необходимости вводить специальный постулат о параллельных прямых, ввел определение, согласно которому прямая, параллельная данной прямой, есть геометрическое место точек, расположенных от нее на одном и том же заданном расстоянии. При этом Прокл упустил из виду, что таким образом трудность не устраняется, а только перемещается, так как при его ходе мыслей остается недоказанным, что названное геометрическое место действительно есть прямая линия. Так как последнего Прокл доказать не мог, то именно это предложение ему пришлось бы принять в качестве аксиомы параллельности, и ничто не было бы выиграно, так как мы можем легко установить, что обе упомянутые аксиомы эквивалентны между собой. Саккери (1667—1733), а затем Ламберт (1728-1777) делали попытки доказать аксиому параллельности косвенным путем, допуская противоположное утверждение и выводя из него абсурдные следствия. Но выведенные ими следствия оказались далеко не абсурдными: это были теоремы неевклидовой геометрии, получившей позднее дальнейшее развитие. Если бы названные лица рассматривали свои результаты не как нелепости, а как утверждения, свободные от внутренних противоречий, то не кому иному, как им, принадлежала бы заслуга открытия неевклидовой геометрии.

Но в те времена любую геометрическую систему, не находящуюся в абсолютном согласии с евклидовой, непременно стали бы рассматривать как очевидную нелепость. Кант, наиболее влиятельный философ той эпохи, выразил свое отношение к вопросу, утверждая, что аксиомы Евклида — не что иное, как неизбежные формы человеческого мышления, чем, по его мнению, и объясняется их объективная значимость по отношению к «реальному» пространству. Эта вера в аксиомы Евклида, как в незыблемые истины, существующие в сфере чистой интуиции, была одним из главных догматов кантовой философии. Однако с течением времени ни привычные навыки мышления, ни влияние философских авторитетов

не смогли подавить растущего убеждения, что неизменные неудачи в поисках доказательства аксиомы параллельности имели своей причиной не столько недостаток изобретательности со стороны геометров, сколько тот основной факт, что этот постулат на самом деле независим от других. (Подобным же образом неудачи в решении при помощи радикалов общего уравнения пятой степени мало-помалу привели к подозрению, позднее оправдавшемуся, что такое решение невозможно.) Венгерский математик Бойяи (1802—1860) и русский математик Лобачевский (1793-1856) положили конец сомнениям, построив во всех деталях геометрическую систему, в которой аксиома параллельности была отвергнута. Когда молодой гениальный энтузиаст Бойяи послал свою работу «королю математики» Гауссу, от которого с нетерпением ждал поддержки, то получил в ответ уведомление, что самим Гауссом открытие было сделано раньше, но он воздержался в свое время от публикации результатов, опасаясь слишком шумных обсуждений.

Посмотрим, что же означает независимость аксиомы параллельности. Эту независимость следует понимать в том смысле, что возможно свободное от внутренних противоречий построение «геометрических» предложений о точках, прямых и т.д., исходя из системы аксиом, в которой аксиома параллельности заменена противоположной. Такое построение называется неевклидовой геометрией. Нужно было интеллектуальное бесстрашие Гаусса, Бойяи и Лобачевского, чтобы осознать, что геометрия, основанная не на евклидовой системе аксиом, может быть абсолютно непротиворечивой.

Чтобы убедиться в непротиворечивости новой геометрии, нет надобности развивать во всех подробностях многочисленные теоремы неевклидовой геометрии, как это делали Бойяи и Лобачевский. Мы умеем теперь строить простые «модели» такой геометрии, удовлетворяющие всем аксиомам Евклида, кроме аксиомы параллельности. Простейшая модель была указана Феликсом Клейном, работы которого в этой области стимулировались идеями английского геометра Кэли (1821 — 1895). В такой модели через данную точку, лежащую вне данной прямой, можно провести бесчисленное множество «прямых», «параллельных» данной прямой. Подобного рода геометрия называется геометрией Бойяи—Лобачевского, или «гиперболической» геометрией. (Основание для последнего наименования будет приведено на стр. 252.)

При построении модели Клейна сначала рассматриваются объекты обыкновенной евклидовой геометрии; и затем некоторые из объектов и отношений между ними переименовываются таким образом, что для их описания оказывается пригодной уже неевклидова геометрия. Эта последняя, тем самым, не в меньшей мере непротиворечива, чем первоначальная евклидова геометрия, так как излагается (если посмотреть

с другой точки зрения и описывать другими словами) как совокупность фактов обыкновенной евклидовой геометрии. С этой моделью можно легко освоиться, привлекая кое-какие понятия из проективной геометрии.

При проективном преобразовании одной плоскости на другую или на саму себя (можно после отображения совместить обе плоскости) окружность, вообще говоря, переходит в некоторое коническое сечение. Но можно легко показать (доказательства мы не приводим), что существует бесчисленное множество таких проективных преобразований плоскости на саму себя, при которых данный круг, вместе со всеми заключенными внутри точками, переходит сам в себя. При таких преобразованиях внутренние точки, как и точки контура, меняют, вообще говоря, свои места, но внутренние точки остаются внутренними, а точки контура остаются на контуре. (Центр круга, как легко убедиться, можно перевести в любую наперед заданную внутреннюю точку.) Рассмотрим совокупность всех таких преобразований. Конечно, они не будут оставлять очертания фигур неизменными и потому не являются движениями в обычном смысле. Но мы теперь сделаем решающий шаг и назовем их «неевклидовыми движениями» в той геометрии, которую строим. Посредством этих «движений» можно дальше определить и «равенство»: две фигуры называются равными, если существует «неевклидово движение», переводящее одну фигуру в другую.

Перейдем теперь к описанию упомянутой выше клейновой модели гиперболической геометрии. «Плоскость» состоит только из внутренних точек круга, внешние точки просто отбрасываются. Каждая внутренняя точка называется неевклидовой «точкой», каждая хорда круга называется неевклидовой «прямой»; «движения» и «равенства» уже определены выше; проведение «прямой» через две «точки» и нахождение «точки» пересечения двух «прямых» совершаются, как в евклидовой геометрии. Легко убедиться, что новая конструкция удовлетворяет всем постулатам евклидовой геометрии, с единственным исключением — постулатом о параллельных прямых. Что этот постулат здесь не выполняется, ясно видно из того, что через «точку», не лежащую на «прямой», можно провести бесчисленное множество «прямых», не имеющих общей «точки» с данной прямой. Данная «прямая» есть евклидова хорда, тогда как в качестве второй «прямой» может быть взята любая из хорд, проходящих через данную «точку» и не пересекающих первой «прямой» внутри круга. Описанная простая модель совершенно достаточна для того, чтобы покончить с основным вопросом, породившим неевклидову геометрию: она показывает, что аксиома параллельности не

Рис. 110. Модель неевклидовой плоскости Клейна

выводится из остальных аксиом евклидовой геометрии. Действительно, если бы она выводилась из них, то тогда была бы верной теоремой и по отношению к модели Клейна, а мы видим, что это не так.

Строго говоря, предыдущая аргументация построена на допущении, что модель Клейна непротиворечива, т. е. что нельзя доказать вместе с некоторым утверждением также и противоположного утверждения. Но, во всяком случае, геометрия модели Клейна непротиворечива в такой же степени, как и обыкновенная евклидова геометрия, так как теоремы о «точках» и «прямых» и т. д. модели Клейна представляют собой только своеобразно сформулированные теоремы евклидовой геометрии. Удовлетворительного доказательства непротиворечивости аксиом евклидовой геометрии дано не было, если не считать сведения к аналитической геометрии и в конечном счете к числовому континууму; а непротиворечивость концепции континуума — также вопрос открытый1.

* Мы привлечем внимание читателя еще к одной детали (впрочем, стоящей за пределами непосредственно поставленных нами задач) — именно, к определению неевклидова «расстояния» в модели Клейна. Это «расстояние» должно быть инвариантно относительно неевклидовых «движений», так как обыкновенное движение не изменяет обыкновенного расстояния. Мы знаем, что двойное отношение есть инвариант проективного преобразования. Естественно возникает мысль о том, чтобы при определении «расстояния» между двумя различными точками Р и Q внутри нашего круга воспользоваться двойным отношением (OSQP), где О и 5 — точки, в которых продолженный в обе стороны отрезок PQ встречается с окружностью. Это двойное отношение, в самом деле, есть положительное число; но взять это отношение непосредственно в качестве «расстояния» PQ не представляется удобным. Действительно, в предположении, что три точки Р, Q, R лежат на одной прямой, мы должны были бы иметь равенство PQ + QR = PR, но, вообще говоря,

(OSQP) + (OSRQ) ф (OSPR). Напротив, справедливо несколько иное равенство

(1)

в самом деле,

Рис. 111. Неевклидово расстояние

1 Подробнее об исследованиях в этой области см. упомянутую на стр. 115 книгу А. Френкеля и И. Бар-Хиллела, содержащую также обширную библиографию. — Прим. ред.

Свойство (1) позволяет определить «расстояние» PQ как логарифм двойного отношения (а не как само двойное отношение), с таким расчетом, чтобы обеспечить аддитивность расстояния: PQ = неевклидово «расстояние» PQ = log(OSQP). Это «расстояние» есть положительное число, так как (OSQP) > 1 при РфС.

Из основного свойства логарифма (см. стр. 472) следует, в силу (1), что PQ + QR = PR. По какому основанию брать логарифмы — несущественно, так как при изменении основания меняется лишь единица измерения. Между прочим, если одна из точек, скажем Q, приближается к окружности, то неевклидово расстояние PQ неограниченно возрастает. Это означает, что «прямая» нашей неевклидовой модели имеет бесконечную неевклидову «длину», хотя в евклидовом смысле представляет собой конечный отрезок.

3. Геометрия и реальность. Модель Клейна показывает, что гиперболическая геометрия как формально-дедуктивное построение непротиворечива в такой же степени, как и классическая евклидова геометрия. Возникает вопрос: которой же из двух геометрий следует отдать предпочтение, когда речь идет об описании геометрических отношений, существующих в физическом мире? Как мы уже отметили, эксперимент никоим образом не может решить, проходит ли через данную точку только одна прямая, параллельная данной прямой, или бесчисленное множество. Однако в евклидовой геометрии сумма углов треугольника равна 180°, тогда как в гиперболической геометрии, как можно показать, она меньше 180°. Гаусс предпринял опытное исследование вопроса о том, как обстоит дело с суммой углов треугольника с физической точки зрения: он очень тщательно измерил углы в треугольнике, образованном тремя достаточно удаленными друг от друга горными пиками, и в пределах возможных ошибок измерений сумма углов оказалась равной 180°. Если бы результат был заметно меньше 180°, то отсюда следовало бы, что гиперболическая геометрия лучше подходит для описания внешнего мира. Но эксперимент не решил ничего, так как для небольших треугольников со сторонами длиной всего в несколько миль отклонение от 180°, которое предвидит гиперболическая геометрия, могло быть столь ничтожным, что гауссовы инструменты его не обнаружили. Таким образом, не дав решающих результатов, эксперимент все же показал, что евклидова и гиперболическая геометрии, различающиеся только в очень обширных частях пространства, для сравнительно малых фигур оказываются практически одинаково пригодными для употребления. Поэтому если рассматриваются только локальные свойства пространства, то выбор между двумя геометриями остается делать лишь по принципу простоты. Но так как работать с евклидовой геометрией гораздо легче, чем с гиперболической, то мы и пользуемся именно ею, покуда

рассматриваются небольшие (порядка нескольких миллионов миль!) расстояния. Однако нет оснований ожидать, что она наверное оказалась бы подходящей при описании физического мира в целом, во всех его обширных пространствах. Положение вещей в геометрии совершенно такое же, какое существует и в физике, где системы Ньютона и Эйнштейна дают неразличимые результаты при малых расстояниях и скоростях, но обнаруживают расхождение, когда рассматриваются большие величины.

Научно-революционное значение открытия неевклидовой геометрии заключается в том, что оно разрушило представление об аксиомах Евклида как о непоколебимой математической схеме, к которой приходится приспособлять наши экспериментальные знания о физической реальности.

4. Модель Пуанкаре. Математик волен видеть «геометрию» во всякой непротиворечивой системе аксиом, говорящих о «точках», «прямых» и т.д.; но его исследования только в том случае будут полезны для физика, если система аксиом находится в соответствии с поведением физических объектов в реальном мире. Мы хотели бы теперь, с этой точки зрения, разобраться в смысле утверждения: «Свет распространяется по прямой линии». Если в этом утверждении содержится физическое определение «прямой линии», то систему геометрических аксиом следует выбирать таким образом, чтобы получилось соответствие с поведением световых лучей. Вообразим, следуя Пуанкаре, что мир состоит из внутренности круга С и что во всякой точке скорость света пропорциональна расстоянию точки от окружности. Можно тогда доказать, что свет будет распространяться по круговым дугам, образующим прямые углы с окружностью С. В таком мире геометрические свойства «прямых линий» (определенных как световые лучи) будут отличаться от свойств евклидовых прямых. В частности, не будет евклидовой аксиомы параллельности, так как через данную точку пройдет бесчисленное множество «прямых линий», не пересекающихся с данной «прямой линией». Можно обнаружить, что «точки» и «прямые линии» в описываемом мире будут обладать в точности теми же свойствами, какими обладают «точки» и «прямые» в модели Клейна. Другими словами, мы получили новую модель гиперболической геометрии. Но евклидову геометрию также можно применять в этом

Рис. 112. Модель неевклидовой плоскости Пуанкаре

мире: тогда выйдет, что световые лучи, которые уже не будут евклидовыми «прямыми линиями», распространяются по кругам, перпендикулярным к окружности С. Таким образом, одна и та же физическая ситуация может быть описана различными геометрическими системами, если предположить, что физические объекты (в нашем случае — световые лучи) связаны с различными понятиями в этих системах:

Световой луч —► «прямая линия» — гиперболическая геометрия Световой луч —► «окружность» — евклидова геометрия

Так как в евклидовой геометрии понятие прямой линии сопоставляется с поведением светового луча в однородной среде, то говоря, что геометрия в описании мира внутри С гиперболическая, мы утверждали бы только то, что физические свойства световых лучей в этом мире те же самые, что и свойства «прямых» гиперболической геометрии.

5. Эллиптическая, или риманова, геометрия. В евклидовой геометрии, как и в гиперболической геометрии Бойяи—Лобачевского, молчаливо допускается, что всякая прямая бесконечна (бесконечность прямой существенно связана с отношением «быть между» и аксиомами порядка). Но, после того как гиперболическая геометрия открыла путь к свободному построению геометрий, естественно возник вопрос о том, нельзя ли осуществить построение таких неевклидовых геометрий, в которых прямые линии конечны и замкнуты. Разумеется, в таких геометриях теряют силу не только постулат о параллельных, но и аксиомы порядка. Современные исследования выяснили значение этих геометрий для новейших физических теорий. Впервые такие геометрии были подвергнуты рассмотрению в речи, произнесенной в 1851 г. Риманом при вступлении его в должность приват-доцента Геттингенского университета. Геометрии с замкнутыми конечными прямыми могут быть построены без каких бы то ни было противоречий. Вообразим двумерный мир, состоящий из поверхности S сферы, причем под «прямыми» условимся понимать большие круги сферы. Это был бы самый естественный способ описывать «мир» мореплавателя: дуги больших кругов являются кратчайшими кривыми, связывающими две точки на сфере, а это как раз и есть характеристическое свойство прямых на плоскости. В рассматриваемом двумерном мире всякие две «прямые» пересекаются, так что из внешней точки нельзя провести ни одной «прямой», не пересекающейся с данной

Рис. 113. «Прямые линии» в геометрии Римана

(т. е. ей параллельной). Геометрия «прямых» в этом мире называется эллиптической геометрией. Расстояние между двумя точками в такой геометрии измеряется просто как длина кратчайшей дуги большого круга, проходящего через данные точки. Углы измеряются так же, как и в евклидовой геометрии. Самым характерным свойством эллиптической геометрии мы считаем несуществование параллельных.

Следуя Риману, мы можем обобщить эту геометрию следующим образом. Рассмотрим «мир», состоящий из некоторой кривой поверхности в пространстве (не обязательно сферы) и определим «прямую линию», проходящую через две точки, как кратчайшую кривую («геодезическую»), соединяющую эти точки. Точки поверхности можно разбить на два класса: 1°. Точки, в окрестности которых поверхность подобна сфере в том отношении, что она вся лежит по одну сторону от касательной плоскости в этой точке. 2°. Точки, в окрестности которых поверхность седлообразна— лежит по обе стороны касательной плоскости. Точки первого класса называются эллиптическими точками поверхности — по той причине, что при небольшом параллельном перемещении касательной плоскости она пересечет поверхность по кривой, имеющей вид эллипса; точки же второго класса носят название гиперболических, так как при аналогичном перемещении касательной плоскости получается пересечение с поверхностью, напоминающее гиперболу. Геометрия геодезических «прямых» в окрестности точки поверхности является эллиптической или гиперболической, смотря по тому, будет ли сама точка эллиптической или гиперболической. В этой модели неевклидовой геометрии углы измеряются, как в обыкновенной евклидовой геометрии.

Рис. 114. Эллиптическая точка

Изложенная идея была развита Риманом дальше: он рассмотрел геометрии пространства, аналогичные только что разобранным геометриям поверхности. По Риману, «кривизна» пространства, меняясь от точки к точке, определяет характер геометрии в окрестности точки. «Прямые линии» у Римана — геодезические кривые. В эйнштейновой общей теории относительности геометрия пространства есть риманова геометрия; свет распространяется по геодезическим линиям, а кривизна пространства в каждой точке определяется в зависимости от свойств материи в окрестности точки.

Возникнув из чисто аксиоматических изысканий, неевклидова геометрия в наши дни стала чрезвычайно полезным аппаратом, допускающим различные применения при изучении физической реальности. В теории относительности, в оптике, в общей теории колебаний неевклидово описание явлений оказывается в ряде случаев гораздо более адекватным физической реальности, чем евклидово.

ПРИЛОЖЕНИЕ

Геометрия в пространствах более чем трех измерений

1. Введение. То «реальное» пространство, которое служит средой нашего физического опыта, имеет три измерения, плоскость имеет два измерения, прямая — одно. Наша, в обычном смысле понимаемая, пространственная интуиция решительно ограничена тремя измерениями — и дальше не простирается. Тем не менее во многих случаях вполне уместно говорить

Рис. 115. Гиперболическая точка

о «пространствах», имеющих четыре или более измерений. В каком же смысле допустимо говорить об n-мерном пространстве, где п > 3, и для чего могут быть полезны такие пространства? Ответ можно дать, став или на аналитическую, или на геометрическую точку зрения. Терминологию /î-мерного пространства дозволительно рассматривать только как образный язык, служащий для выражения математических идей, находящихся за пределами обычной геометрической интуиции.

2. Аналитический подход. Мы уже обращали внимание читателя на изменение роли аналитической геометрии, происшедшее на протяжении ее развития. Точки, прямые, кривые линии и т. д. первоначально рассматривались как чисто геометрические объекты, и задачей аналитической геометрии было всего-навсего, сопоставляя им координаты или уравнения, интерпретировать и развивать дальше геометрическую теорию алгебраическими или аналитическими методами. Но с течением времени постепенно начала утверждаться противоположная точка зрения. Число x, или пара чисел je, у, или тройка чисел x, у, z стали рассматриваться как исходные, основные объекты, и эти аналитические объекты далее конкретизировались, или, еще лучше сказать, «визуализировались» в виде точек на прямой, на плоскости, в пространстве. И тогда геометрический язык стал служить для того, чтобы констатировать наличие тех или иных соотношений между числами. При этом мы лишаем геометрические объекты их самостоятельного и независимого значения и говорим, что пара чисел ху у есть точка на плоскости, совокупность всех пар х, у, удовлетворяющих линейному уравнению Цх, у) = ах + by + с = 0 (где а, Ь, с — данные постоянные числа), есть прямая линия и т.д. Такие же определения устанавливаются и для трехмерного пространства.

Даже в том случае, когда мы занимаемся собственно алгебраической проблемой, язык геометрии нередко представляется вполне удобным для краткого и совершенно точного описания фактов, и геометрическая интуиция начинает работать, подсказывая правильные алгебраические процедуры. Например, решая систему трех линейных уравнений с тремя неизвестными х, ц, z мы истолковываем стоящую перед нами задачу геометрически и говорим, что в трехмерном пространстве /?3 требуется найти точку пересечения трех плоскостей, заданных уравнениями L = О, U = О, L" = 0. Другой пример: рассматривая все такие числовые пары x, у, что х > 0, мы скажем, что имеем дело с полуплоскостью, расположенной вправо от оси у. В более общем случае совокупность числовых пар х, у, для которых выполняется

неравенство

интерпретируется как полуплоскость, лежащая по одну сторону прямой L = 0, а совокупность таких числовых троек x, у, z, что

— как «полупространство», определяемое плоскостью L = 0.

После этих разъяснений нам совсем легко перейти к «четырехмерному» или даже к «n-мерному» пространству. Рассмотрим четверку чисел x, у, z, /. Скажем, что такая четверка представляет собой точку, или, еще проще, есть точка в четырехмерном пространстве /?4. Вообще, по определению, точка /î-мерного пространства Rn есть не что иное, как система из п действительных чисел Х\, х2, ..., хпу записанных в определенном порядке. Не так важно, что мы не «видим» этой точки. Геометрический язык не перестает быть вполне понятным в случае, если идет речь об алгебраических свойствах п переменных. Дело в том, что многие алгебраические свойства линейных уравнений и т. п. совершенно не зависят от числа входящих переменных, или, как принято говорить, от размерности пространства этих переменных. Мы назовем, таким образом, «гиперплоскостью» совокупность всех таких точек xb *2» ..., хп в n-мерном пространстве Rn, которые удовлетворяют линейному уравнению

Точно так же основная алгебраическая задача решения системы п линейных уравнений с п неизвестными

истолковывается на геометрическом языке как нахождение точки пересечения п гиперплоскостей L\ = 0, L2 = 0, ..., Ln = 0.

Преимущество такого геометрического способа описания математических факты заключается в том, что он подчеркивает некоторые обстоятельства алгебраического характера, которые не зависят от числа измерений п и вместе с тем в случае п^З могут быть наглядно интерпретированы. Во многих приложениях употребление геометрической терминологии имеет также преимущество краткости, и вместе с тем облегчает аналитические рассуждения, а иногда руководит ими и направляет их в должную сторону. Теория относительности снова может быть приведена здесь в качестве примера области, в которой существенный успех был достигнут по той причине, что три пространственные

координаты х, у, z и временная координата t «события» были объединены в одно «пространственно-временное» четырехмерное многообразие х, у, z, t. Подчиняя, таким образом, «пространство-время» этой аналитической схеме и наделяя его, кроме того, свойствами неевклидовой геометрии, удалось описать многие весьма сложные ситуации с замечательной простотой. Столь же полезными оказались n-мерные пространства в механике, в статистической физике, не говоря уже о самой математике.

Приведем еще кое-какие чисто математические примеры. Совокупность всех кругов на плоскости образует трехмерное многообразие, так как круг с центром X, у и радиусом / может быть изображен точкой с координатами X, у, t. Так как радиус круга есть положительное число, то совокупность рассматриваемых точек заполняет полупространство. Таким же образом совокупность всех сфер в обыкновенном трехмерном пространстве образует четырехмерное многообразие, так как каждая сфера с центром х, у, z и радиусом / может быть представлена точкой с координатами х, у, z, /. Куб в трехмерном пространстве с центром в начале координат, ребрами длины 2 и гранями, параллельными координатным плоскостям, состоит из совокупности всех точек Х\у х2, х3, для которых \Х]\ ^ 1, |x2| ^ 1, |*3| ^ 1. Так же точно «куб» в n-мерном пространстве Rn с центром в начале координат, «ребрами» длины 2 и «гранями», параллельными координатным плоскостям, определяется как совокупность точек Х\, х2, ..., хп, для которых одновременно справедливы неравенства |xj| ^ 1, |x2| ^ 1, ..., \хп\ ^ 1. «Поверхность» такого куба состоит из всех точек, для которых хотя бы в одном из этих соотношений имеет место знак равенства. Поверхностные элементы размерности п — 2 состоят из точек, для которых знак равенства стоит по меньшей мере два раза; и т. д.

Упражнение. Дайте описание поверхности такого куба в трехмерном, четырехмерном, n-мерном пространствах.

*3. Геометрический, или комбинаторный, подход. Хотя аналитический подход к n-мерной геометрии чрезвычайно прост и удобен для многих приложений, все же следует упомянуть и о другом методе, носящем чисто геометрический характер. Он основан на редукции от n-мерных данных к (п — 1)-мерным и тем открывает возможность определять многомерные геометрии посредством математической индукции.

Начнем с того, что рассмотрим контур треугольника ABC в двух измерениях. Разрезая его в точке С и затем поворачивая стороны АС и ВС соответственно около А и ß, мы выпрямим контур в прямолинейный отрезок (рис. 116), на котором точка С будет фигурировать дважды. Полученная одномерная фигура дает исчерпывающее представление контура двумерного треугольника. Сгибая фигуру в точках А и В и добившись совпадения двух точек С, мы имеем возможность восстановить треугольник.

Но важно то, что сгибать вовсе и не нужно. Достаточно условиться, что мы «идентифицируем» (т. е. не будем различать) обе точки С, несмотря на то что эти две точки и не совпадают в обычном смысле. Можно сделать еще следующий шаг: разрезая фигуру также и в точках А и В, мы получим три отрезка CA, AB, ВС, которые при желании можно опять сложить таким образом, чтобы был восстановлен «настоящий» треугольник ABC, причем пары идентифицируемых точек совпадут между собой. Идея идентифицировать различные точки в данной совокупности отрезков, чтобы из них построить многоугольный контур (в нашем случае — треугольник), практически иногда оказывается очень полезной. Если нужно отправить в дальнее путешествие какое-нибудь соединение из металлических балок, например, мостовую ферму, то удобнее всего упаковать сложенные вместе, предварительно разъединенные балки, обозначив одними и теми же знаками те концы различных балок, которые должны быть соединены вместе. Такое собрание балок с размеченными концами совершенно эквивалентно пространственной конструкции. Предыдущее замечание приводит к мысли о том, как можно «разнять» двумерный многогранник в трехмерном пространстве, заменяя его фигурами низших измерений. Возьмем, например, поверхность куба (рис. 117). Ее сейчас же можно свести к системе из шести квадратов, стороны которых надлежащим образом идентифицированы; следующий шаг будет состоять в том, чтобы заменить эту систему квадратов системой из 12 прямолинейных отрезков с надлежащим образом идентифицированными концами.

Вообще, любой многогранник в трехмерном пространстве /?3 приводится таким образом или к системе плоских многоугольников, или к системе прямолинейных отрезков.

Рис. 116. Определение треугольника по сторонам с сопоставленными друг другу концами

Упражнение. Выполните указанную редукцию для всех правильных многогранников (см. стр. 263).

Теперь уже ясно, что мы можем обратить ход наших рассуждений, определяя многоугольник на плоскости с помощью системы прямолинейных отрезков и многогранник в пространстве /?3 — с помощью системы многоугольников в /?2 или же, при условии дальнейшей редукции, с помощью опять-таки прямолинейных отрезков. Но тогда совершенно естественно определить «многогранник» в четырехмерном пространстве RA с помощью системы многогранников в /?3 при надлежащей идентификации двумерных граней; «многогранник» в R5 — с помощью «многогранников» в /?4 и т. д. В конечном счете всякий «многогранник» в Rn сводится к системе отрезков.

Останавливаться на этом вопросе подробнее мы лишены возможности. Добавим лишь несколько замечаний, не приводя доказательств. «Куб» в R4 ограничен 8 трехмерными кубами, из которых каждый имеет со своими «соседями» по идентифицированной двумерной грани. У такого куба 16 вершин, в каждой вершине сходятся по четыре ребра; всего ребер имеется 32. В /?4 существует шесть правильных многогранников. Кроме «куба», имеется один многогранник, ограниченный 5 правильными тетраэдрами,

Рис. 117. Определение куба по сопоставленным друг другу вершинам и ребрам

один, ограниченный 16 тетраэдрами, один, ограниченный 24 октаэдрами, один, ограниченный 120 додекаэдрами, и еще один, ограниченный 600 тетраэдрами. Доказано, что в /?„, при п > 4, существует только 3 правильных многогранника: один с п + 1 вершинами, ограниченный п + 1 многогранниками из /?л_1, имеющими по п (п — 2)-мерных граней; один с 2" вершинами, ограниченный 2п многогранниками из имеющими по 2п — 2 (п — 2)-мерных граней; и еще один с 2п вершинами, ограниченный 2п многогранниками из /?„-ь имеющими по п (п — 2)-мерных граней.

Упражнение. Сравните определение «куба» из /?4, данное в пункте 2, с определением, данным в настоящем пункте, и установите, что прежнее «аналитическое» определение куба равносильно настоящему «комбинаторному».

Со структурной, или «комбинаторной», точки зрения простейшими геометрическими фигурами размерности 0, 1, 2, 3 являются соответственно точка, отрезок, треугольник, тетраэдр. Ради единообразия символики обозначим фигуры этого типа соответственно Т0) Т\, Т2, Т3. (Индексы указывают на размерность.) Структура каждой из этих фигур характеризуется тем, что каждая фигура типа Тп имеет п + 1 вершин и каждое подмножество из i + 1 вершин фигуры типа Тп (/ = 0, 1, п) определяет некоторую фигуру типа Tt. Например, трехмерный тетраэдр Т$ имеет 4 вершины, 6 ребер и 4 грани.

Ясно, как будет дальше. Мы определим четырехмерный «тетраэдр» Г4 как множество, состоящее из 5 вершин, причем каждое подмножество из 4 вершин порождает фигуру типа Т3, каждое подмножество из 3 вершин — фигуру типа Т2 и т.д. Фигура типа Т4 схематически показана на рис. 118: мы видим, что у нее 5 вершин, 10 ребер, 10 треугольных граней и 5 тетраэдров.

Обобщение на п измерений не представляет труда. Из теории соединений известно, что существует ровно Q = . таких различных подмножеств по i объектов, которые могут быть составлены из множества г

Рис. 118. Простейшие элементы в 1, 2, 3, 4 измерениях

объектов. Поэтому n-мерный «тетраэдр» содержит

Упражнение. Нарисуйте схематически фигуру типа 7s и определите число фигур типа 7}, в ней содержащихся (/ = 0, 1, ..., 5).

ГЛАВА V

Топология

Введение

В середине XIX столетия возникло совершенно новое течение в геометрии, которому было суждено вслед за тем стать одной из главных движущих сил современной математики. Предметом новой отрасли, называемой топологией (или analysis situs), является изучение свойств геометрических фигур, сохраняющихся даже тогда, когда эти фигуры подвергаются таким преобразованиям, которые уничтожают все их и метрические, и проективные свойства.

Одним из великих геометров этой эпохи был А. Ф. Мёбиус (1790— 1868), человек, не слишком преуспевший из-за своей чрезмерной скромности в научной карьере: он занимал должность астронома в одной из второразрядных немецких обсерваторий. В возрасте шестидесяти восьми лет он представил Парижской Академии мемуар об «односторонних» поверхностях, содержащий кое-какие из наиболее изумительных фактов в новой отрасли геометрии. Подобно многим другим важным научным работам, его рукопись несколько лет валялась на полках Академии, пока обстоятельства не сложились так, что ее опубликовал сам автор. Независимо от Мёбиуса гёттингенский астроном И. Листинг (1808—1882) сделал подобные же открытия и, под влиянием Гаусса, в 1847 г. издал небольшую книгу «Vorstudien zur Topologie». Когда Бернгард Риман (1826-1866) прибыл в Геттинген, чтобы стать там студентом, математическая атмосфера этого университетского города уже была насыщена острым любопытством по отношению к новым и странным геометрическим идеям. Скоро он осознал, что именно в них нужно искать разгадку самых глубоких свойств аналитических функций комплексного переменного. Позднейшее развитие топологии, вероятно, едва ли обязано чему-либо в такой степени, как великолепному зданию римановой теории функций, в которой топологические концепции имеют самое фундаментальное значение.

На первых порах своеобразие методов, которыми приходилось действовать в новой области, воспрепятствовало тому, чтобы полученные здесь результаты были изложены в традиционной дедуктивной форме, типичной для элементарной геометрии.

Происходило нечто совсем иное: так, Пуанкаре, делая смелые шаги вперед, был вынужден широко и откровенно опираться на геометрическую интуицию. Даже в наши дни изучающий топологию явственно ощущает, что при слишком большой заботе о формальной безупречности существенно геометрическое содержание упускается из виду и тонет в массе деталей. Впрочем, как бы то ни было, нужно рассматривать как особое достижение то обстоятельство, что самые недавние работы по топологии включили эту отрасль геометрии в круг вполне строго построенных математических дисциплин, для которых интуиция была и остается источником, но не конечным критерием истины. По мере развития процесса «формализации» топологии, идущего от Л. Э. Я. Брауэра, удельный вес топологии по отношению к математике в целом непрерывно возрастал. Существенные успехи в указанном направлении принадлежат американским математикам, в частности, О. Веблену, Дж. У. Александеру и С. Лефшетцу.

Хотя топологию можно с полной определенностью назвать продуктом последнего столетия, необходимо все же отметить, что еще и раньше было сделано несколько открытий, которые, как вытекает из современной систематики математических знаний, имеют ближайшее отношение к топологии. Из них самым крупным, несомненно, является установление формулы, связывающей числа вершин, ребер и граней простого многогранника: она была подмечена уже Декартом в 1640 г., позднее переоткрыта и использована Эйлером в 1752 г.; характерные черты топологического утверждения в этой формуле стали очевидными гораздо позднее — после того как Пуанкаре в «формуле Эйлера» и ее обобщениях усмотрел одну из центральных теорем топологии. Итак, по причинам как исторического, так и внутреннего порядка мы начнем наше знакомство с топологией именно с формулы Эйлера. Так как при первых шагах в неизведанной области идеал безупречной строгости вовсе не обязателен и даже мало желателен, то мы будем иногда без колебаний апеллировть непосредственно к интуиции читателя.

§ 1. Формула Эйлера для многогранников

Хотя в античной геометрии изучение многогранников занимало одно из центральных мест, только Декарту и Эйлеру было суждено открыть следующее предложение: пусть V — число вершин простого многогранника, Е— число ребер, F— число граней: тогда

V-E + F = 2. (1)

Под многогранником здесь подразумевается тело, поверхность которого состоит из конечного числа граней, имеющих форму многоугольников. В случае правильных многогранников все многоугольники конгруэнтны и все плоские углы при вершинах равны между собой. Многогранник называется простым, если в нем нет «дыр», так что посредством непрерывной

Рис. 119. Правильные многогранники

деформации его поверхность может быть переведена в поверхность сферы. На рис. 120 изображен простой многогранник, который не является правильным; на рис. 121 изображен многогранник, не являющийся простым.

Предлагаем читателю проверить справедливость формулы Эйлера для всех многогранников, представленных на рис. 119 и 120; но пусть он убедится также, что для многогранника на рис. 121 эта формула неверна.

Переходя к доказательству формулы Эйлера, вообразим, что наш многогранник — внутри пустой и что поверхность его сделана из тонкой резины. Тогда, вырезав предварительно одну из граней пустого внутри многогранника, можно оставшуюся поверхность деформировать таким образом, что она расстелется по плоскости. Конечно, при этом и грани многогранника и углы между ребрами испытают резкие изменения. Но «сетка», составленная из вершин и ребер на плоскости, будет содержать то же число вершин и ребер, что и первоначальный многогранник, тогда как число граней станет на одну меньше, так как одна грань была вырезана. Мы убедимся теперь, что для полученной нами сетки на плоскости будет справедливо равенство V — Е + F= 1; тогда, добавляя вырезанную грань, для первоначального многогранника получим равенство V — Е + F = 2.

Прежде всего «триангулируем» плоскую сетку следующим образом. Если в сетке имеются многоугольники с числом углов большим трех, то, выбрав один из них, проведем в нем какую-нибудь диагональ.

Рис. 120. Простой многогранник: V — £ + F = 9- 18+ 11 =2

Рис. 121. Непростой многогранник: V - Е + F= 16-32+16 = 0

В результате каждое из чисел Е и F увеличится на единицу, но значение выражения V — Е + F от этого не изменится. Будем и дальше проводить диагонали, соединяя пары точек (рис. 122), пока сетка не окажется состоящей из одних только треугольников (в чем и заключается наша ближайшая цель). В триангулированной сетке величина V - £ + F имеет то же значение, какое имела и до триангуляции, так как проведение каждой новой диагонали этого значения не меняет. Некоторые из треугольников, далее, имеют ребра (проще сказать — стороны), принадлежащие к «границе» триангулированной сетки. Некоторые из этих треугольников (например, ABC) имеют лишь одно ребро на границе, другие — по два. Возьмем один из такого рода «граничных» треугольников и удалим из него все то, что не принадлежит какому-нибудь другому треугольнику. Так, в треугольнике ABC удалим ребро АС и саму грань, оставляя вершины Л, ß, С и ребра AB и ВС, но в треугольнике DEF удалим грань, два ребра DF и FE и вершину F. При «уничтожении» треугольника ABC числа Е и F уменьшаются на 1, а V не изменяется, так что V - £ + F также не изменяется. При уничтожении треугольника типа DEF число V уменьшится на 1, Е на 2 и F на 1, так что опять-таки V - Е + F не изменится. Последовательное осуществление таких удалений граничных треугольников (причем всякий раз меняется и сама граница) приводит, наконец, к одному-единственному треугольнику, имеющему, очевидно, три ребра, три вершины и одну грань. Для образуемой им совсем простой сетки V — £ + F = 3 — 3+1 = 1. Но мы видели, что при удалении из сетки каждого треугольника V — Е + F не изменялось. Значит, V — Е + F

Рис. 122. Доказательсиво теоремы Эйлера

должно было равняться единице и для первоначальной плоской сетки, а также и для того многогранника с вырезанной гранью, из которого была получена плоская сетка. Отсюда следует, что для исходного многогранника (до вырезания грани) должно было иметь место равенство V — Е + F = 2. Этим и заканчивается доказательство теоремы Эйлера.

С помощью теоремы Эйлера легко показать, что существует не более пяти типов правильных многогранников. Предположим, что правильный многогранник имеет F граней, из которых каждая есть правильный я-угольник, и что у каждой вершины сходится г ребер. Считая ребра один раз по граням, другой — по вершинам, получим, во-первых,

nF = 2E (2)

(так как каждое ребро принадлежит двум граням и, следовательно, считается дважды в произведении я/7), и, во-вторых,

rV = 2Е (3)

(так как каждое ребро упирается в две вершины). Тогда равенство Эйлера (1) нам дает

или

(4)

Заметим прежде всего, обращаясь к рассмотрению последнего соотношения, что п ^ 3 и г ^ 3, так как многоугольник имеет не меньше трех сторон и в каждой вершине сходится не менее трех граней. С другой стороны, оба числа пи г не могут быть более 3, так как в противном случае левая часть равенства (4) не превышала бы ^ и равенство было бы невозможно ни при каком положительном значении Е.

Итак, нам остается выяснить, какие значения может принять г, если п = 3, и какие значения может принять /г, если г = 3. Подсчитав все возникающие возможности, мы получим число типов правильных многогранников. При п = 3 равенство (4) принимает вид

г может здесь равняться 3, 4 или 5 (6 или большее значение исключается, так как £ положительно). При этих значениях пи г оказывается, что Е соответственно равно 6, 12 или 30. Так получаются многогранники: тетраэдр, октаэдр и икосаэдр. Таким же образом при г = 3 равенство (4) принимает вид

из которого следует, что п = 3, 4 или 5 и, соответственно £=6, 12 или 30. Получаются многогранники: тетраэдр, куб и додекаэдр.

Подставляя полученные значения я, г и Е в соотношения (2) и (3), мы установим число вершин V и число граней F соответствующих многогранников.

§ 2. Топологические свойства фигур

1. Топологические свойства. Мы установили, что формула Эйлера справедлива для случая любого простого многогранника. Но эта формула не теряет смысла и значимости также и применительно к иным, гораздо более общим случаям: вместо многогранников элементарной геометрии с плоскими гранями и прямыми ребрами можно взять простые «многогранники», у которых «гранями» будут кривые поверхности, а «ребрами» — кривые линии, или можно нарисовать «грани» и «ребра» на поверхности, например, шара. Больше того, вообразим, что поверхность многогранника или сферы сделана из тонкого слоя резины; тогда формула Эйлера сохранится, как бы ни была деформирована рассматриваемая поверхность — путем изгибаний, сжатий, растяжений и т.д.,— лишь бы резиновый слой не был порван. Действительно, формула Эйлера относится только к числу вершин, ребер и граней; длины же, площади, двойные отношения, кривизна и т. п., как и иные понятия элементарной или проективной геометрии, в данном случае никакой роли не играют.

Мы уже указывали, что элементарная геометрия имеет дело с величинами (расстояния, углы, площади), которые не меняют своих значений при движениях рассматриваемых фигур, тогда как проективная геометрия занимается такими понятиями (точка, прямая, отношение инцидентности, двойное отношение), которые сохраняются при более широкой группе проективных преобразований. Однако и движения, и проективные преобразования— только очень частные случаи гораздо более общих топологических преобразований; топологическое преобразование одной геометрической фигуры Л в другую А' определяется как произвольное соответствие р <—> р' между точками р фигуры А и точками р' фигуры Л', обладающее следующими свойствами:

1. Взаимной однозначностью. (Это значит, что каждой точке р фигуры А сопоставлена одна и только одна точка р' фигуры Л', и обратно.)

2. Взаимной непрерывностью. (Это значит, что если мы возьмем две точки р, q фигуры А и станем двигать р так, чтобы расстояние между р и q неограниченно уменьшалось, то расстояние между соответствующими точками р' и q' фигуры А' также будет неограниченно уменьшаться, и обратно.)

Всякое свойство геометрической фигуры Л, которое сохраняется также и для той фигуры Л', в которую А переходит при топологическом преобразовании, называется топологическим свойством фигуры Л; топология же — это та отрасль геометрии, которая рассматривает исключительно топологические свойства фигур. Представьте себе, что некоторая фигура должна быть скопирована от руки совершенно малоопытным, но очень

добросовестным чертежником, который невольно искривляет прямые линии, искажает углы, расстояния и площади; тогда на сделанной им копии, хотя метрические и проективные свойства фигуры, может быть, и не сохранятся, но топологические свойства все же останутся в неприкосновенности.

Наиболее наглядными примерами топологических преобразований могут служить деформации. Вообразите, что фигура вроде сферы или треугольника сделана из тонкого слоя резины (или нарисована на таковом), и затем растягивайте и крутите резину самыми разнообразными способами, лишь бы не рвать ее и не приводить двух различных точек в состояние физического совпадения. (Приведение двух различных точек в состояние физического совпадения нарушило бы условие 1. Разрыв резинового слоя противоречил бы условию 2: действительно, рассматривая две точки, лежащие по разные стороны линии разрыва, мы видим, что расстояние между ними может быть неограниченно малым, тогда как после разрыва этого уже не будет.)

Фигура в окончательном ее положении — после указанных операций — будет находиться в топологическом соответствии с фигурой в ее первоначальном положении. Треугольник можно деформировать в другой треугольник, или в окружность, или в эллипс, и потому названные фигуры обладают совершенно одинаковыми топологическими свойствами. Но никак нельзя деформировать круг в отрезок прямой или поверхность сферы в боковую поверхность цилиндра.

Но общее понятие топологического преобразования шире, чем понятие деформации. Например, если фигура разрезана до деформации и склеена по тем же линиям после деформации, то в итоге, несомненно, получается некоторое топологическое преобразование первоначальной фигуры, хотя это преобразование может и не быть деформацией. Так, две кривые, изобра-

Рис. 123. Поверхности, топологически эквивалентные

Рис. 124. Поверхности, топологически неэквивалентные

женные на рис. 134 (стр. 281), топологически эквивалентны друг другу и эквивалентны каждая окружности, так как их можно разрезать, распутать и снова склеить. Но предварительно не разрезав, невозможно одну кривую деформировать в другую.

Топологические свойства фигур (вроде того свойства, которое дается теоремой Эйлера, или других, которые будут рассмотрены ниже) представляют величайший интерес во многих математических исследованиях. В известном смысле это — самые глубокие, самые основные геометрические свойства, так как они сохраняются при самых «резких» преобразованиях.

2. Свойства связности. В качестве следующего примера фигур, топологически неэквивалентных, рассмотрим две плоские области на рис. 125. Первая состоит из всех внутренних точек круга; вторая — из всех точек, расположенных между двумя концентрическими кругами. Любая замкнутая кривая, лежащая в области а, может быть непрерывно деформирована, или «сжата», в одну точку, не выходя из этой области. Область, обладающая таким свойством, называется односвязной. Что касается области б, то она не односвязна. Так, окружность, концентрическая с двумя граничными окружностями и лежащая между ними, не может быть сжата в точку, не выходя из области, так как во время деформации кривая должна будет пройти через общий центр кругов, а он не принадлежит рассматриваемой области. Область, которая не является односвязной, называется многосвязной. Если двусвязную область разрезать вдоль одного из радиусов, как это сделано на рис. 126, то полученная область становится односвязной.

Вообще, можно построить области с двумя, тремя или большим количеством «дыр». Область с двумя «дырами» изображена на рис. 127; чтобы превратить ее в односвязную, нужно сделать два разреза. Если нужно сделать п — 1 взаимно не пересекающихся разрезов от границы к границе, чтобы превратить данную многосвязную область в односвязную,

Рис. 125. Односвязная и двусвязная области

Рис. 126. После разреза двусвязная область становится односвязной

то говорят, что область имеет порядок связности п. Порядок связности плоской области представляет собой важный топологический инвариант этой области.

§ 3. Другие примеры топологических теорем

1. Теорема Жордана о замкнутой кривой. На плоскости нарисована простая замкнутая кривая (нигде сама себя не пересекающая). Посмотрим, какое свойство этой фигуры сохраняется неизменным даже в том случае, если плоскость будет подвергаться каким угодно деформациям, как будто бы она была сделана из тонкого слоя резины. Длина кривой или площадь ограниченной ею части плоскости при деформациях не сохраняется. Но у рассматриваемой конфигурации есть и топологическое свойство, столь простое, что может показаться тривиальным. Простая замкнутая кривая С на плоскости делит плоскость ровно на две области, внутреннюю и внешнюю. Точнее говоря, мы утверждаем следующее: точки плоскости разбиваются на два класса — А (внешние точки) и В (внутренние точки) — таким образом, что любая пара точек, принадлежащих одному и тому же классу, может быть связана кривой, не имеющей общих точек с С, тогда как всякая кривая, соединяющая две какие-нибудь точки разных классов, непременно пересекается с С. Это утверждение вполне очевидно, например, для случая окружности или эллипса, но уже чуть менее очевидно для такой сложной кривой, как причудливой формы многоугольник, изображенный на рис. 128.

Впервые эта теорема была сформулирована Камиллом Жорданом (1838—1922) в его широко известном «Cours d'analyse», из которого целое поколение математиков почерпнуло современную концепцию математической строгости. Как это ни странно, доказательство, данное самим Жорданом, не было ни кратким, ни простым по своей идее, но в особенности удивительно то, что, как оказалось, оно и не было вполне исчерпывающим, и понадобились значительные усилия, чтобы восполнить его пробелы. Первые строгие доказательства теоремы Жордана были очень

Рис. 127. Редукция трехсвязной области

сложными и трудно воспринимались даже людьми с хорошей математической подготовкой. Сравнительно простые доказательства были придуманы лишь недавно. Одно из затруднений заключается в большой общности понятия «простой замкнутой» кривой, значительно более широкого, чем понятие многоугольника или «гладкой» кривой: по определению, «простая замкнутая кривая» есть любая кривая, топологически эквивалентная окружности. С другой стороны, необходимо таким терминам, как «внутри» или «вне» (столь ясным интуитивно), дать логические определения, прежде чем строгое доказательство станет возможным. Проанализировать в их полной общности возникающие в связи с этим отношения и концепции есть теоретическая задача первостепенного значения, разрешению которой в большой степени служит современная топология. Но, с другой стороны, следует иметь в виду и то обстоятельство, что, занимаясь изучением конкретных явлений в области геометрии, в громадном большинстве случаев малоуместно вводить понятия, неограниченная общность которых создает излишние затруднения. Так, возвращаясь к теореме Жордана, существенно то, что для случая «хорошо ведущих себя» кривых — например, для многоугольников или для кривых с непрерывно меняющейся касательной (которые только и встречаются в наиболее важных задачах) — доказательство этой теоремы может быть проведено совсем просто. Для случая многоугольников мы укажем доказательство в дополнении к этой главе.

2. Проблема четырех красок. Пример только что рассмотренной теоремы Жордана способен, пожалуй, навести на мысль, что топология занимается придумыванием строгих доказательств для таких истин, в которых не станет сомневаться ни один здравомыслящий человек. Но это совсем не так: существует много вопросов топологического характера, в числе которых иные формулируются чрезвычайно просто и на которые интуиция не дает удовлетворительных ответов. Примером может служить знаменитая «проблема четырех красок».

Раскрашивая географическую карту, обыкновенно стараются распределить цвета между странами таким образом, чтобы две страны, имеющие общую границу, были окрашены по-разному. Было обнаружено на опыте,

Рис. 128. Какие точки находятся внутри этого многоугольника?

что любая карта, сколько бы ни было изображено на ней стран и как бы они ни были расположены, может быть раскрашена с соблюдением указанного правила не более чем четырьмя красками. Легко убедиться, что меньшее число достаточным для всех случаев не является. На рис. 129 изображен остров посреди моря, который никак нельзя раскрасить менее чем четырьмя красками, так как на нем имеется четыре страны, из которых каждая соприкасается с остальными тремя.

Тот факт, что до настоящего времени не было найдено такой карты, для раскрашивания которой потребовалось бы более четырех красок, приводит к мысли о справедливости такой теоремы: при любом данном разбиении плоскости на области, не покрывающие друг друга ни полностью, ни частично, всегда возможно пометить их цифрами 1, 2, 3, 4 таким образом, чтобы «прилежащие» области были обозначены разными цифрами. Под «прилежащими» областями понимаются такие, которые имеют целый отрезок границы общим: две области, имеющие лишь одну общую точку (или даже конечное число общих точек) — как, например, штаты Колорадо и Аризона,— не будут называться «прилежащими», так как никакого смешения или неудобства не возникает, если их раскрасить одинаково.

Есть основания полагать, что впервые проблема четырех красок была поставлена Мёбиусом в 1840 г.; позднее ее формулировали де Морган в 1850 г. и Кэли в 1878 г. «Доказательство» ее было опубликовано в 1879 г. Кемпе, но Хивуд в 1890 г. нашел ошибку в рассуждении Кемпе. Пересматривая доказательство Кемпе, Хивуд обнаружил, что пяти красок всегда достаточно. (Доказательство теоремы о пяти красках дано в приложении к этой главе.) Несмотря на усилия многих выдающихся математиков, положение вплоть до нашего времени остается в сущности неизменным. Было доказано, что пяти красок достаточно для всех карт, и имеется предположение, что достаточно также четырех. Но, как и в случае знаменитой теоремы Ферма (см. стр. 66), ни доказательства этого предположения, ни противоречащего ему примера приведено не было, и указанное предположение остается одной из нерешенных «больших» математических проблем1. Заметим, между прочим, что проблема четырех красок была решена в

Рис. 129. Раскрашивание карты

1 Проблема четырех красок была решена в 1976 г. Ее решение свелось к проверке 1482 карт и перебору различных комбинаций раскрасок каждой из них. Перебор был осуществлен с помощью компьютера; многие математики полагают, что рассуждение, опирающееся на компьютерный перебор, нельзя считать убедительным. — Прим. ред. наст. изд.

положительном смысле для частных случаев, когда число областей не превышает тридцати восьми. Отсюда ясно, что если в общем случае теорема неверна, то опровергающий пример должен быть не особенно простым.

В рассматриваемой проблеме четырех красок предполагается, что карта нарисована или на плоскости, или на сфере. Эти два случая эквивалентны. В самом деле, каждая карта, заданная на сфере, может быть перенесена па плоскость, если проделаем дырочку внутри одной из областей А и затем расплющим оставшуюся часть сферы по плоскости, как мы это делали при доказательстве теоремы Эйлера. Полученная карта на плоскости покажет нам «остров», состоящий из всех нетронутых областей, и «море», состоящее из одной области А. С другой стороны, проделывая всю эту процедуру в обратном направлении, можно любую карту на плоскости превратить в карту на сфере. Итак, вместо карт на плоскости можно ограничиться рассмотрением карт на сфере. Больше того, так как деформации областей и их границ существенно не влияют на нашу проблему, то можно предположить, что граница каждой области есть простой замкнутый многоугольник, состоящий из дуг больших кругов. Но даже таким образом «регуляризированная» проблема не решена; трудности в данном случае (не в пример теореме Жордана) зависят не от общности понятия области и кривой.

В связи с проблемой четырех красок стоит отметить то замечательное обстоятельство, что для некоторых поверхностей более сложного типа, чем плоскость или сфера, соответствующие теоремы действительно были доказаны, так что, как это ни парадоксально, анализ более сложных (в геометрическом отношении) поверхностей в данном случае проводится легче, чем более простых. Например, было установлено для случая поверхности тора, имеющей вид «бублика» (см. рис. 123), что всякая нарисованная на ней «карта» может быть раскрашена семью красками и что, с другой стороны, на ней мыслимы такие «карты», составленные из семи областей, что каждая область соприкасается с остальными шестью.

*3. Понятие размерности. Понятие о «числе измерений», или о «размерности», не представляет особых затруднений, пока речь идет о таких простых геометрических образах, как точки, линии, треугольники или многогранники. Отдельная точка или любое конечное множество точек имеет размерность нуль, отрезок — размерность 1, поверхность треугольника или сферы — размерность 2. Множество всех точек куба имеет размерность 3. Однако при желании обобщить понятие размерности на точечные множества более общих типов возникает необходимость в точном определении. Какую размерность следует, например, приписать множеству состоящему из всех точек прямой, у которых координаты — рациональные числа? Множество рациональных точек на прямой всюду плотно, и потому, казалось бы, ему, как и самому отрезку прямой, надлежало бы приписать размерность 1. С другой стороны, между всякими двумя рациональными точками

существуют иррациональные «дыры», как между всякими двумя точками конечного множества, и это говорит в пользу размерности 0.

Еще запутаннее обстоит дело с размерностью любопытного множества, впервые рассмотренного Кантором, построенного следующим образом. Из единичного отрезка 0 ^ х ^ 1 удалим среднюю треть (интервал), т. е. все точки x, удовлетворяющие неравенству ^ < х < ^. Оставшееся точечное множество обозначим через С|. Множество С\ состоит из двух отрезков; удалим теперь из каждого отрезка его среднюю треть, и то множество, которое останется, обозначим через С2. Повторим опять эту процедуру, удаляя среднюю треть у всех четырех отрезков; получим Сз. Дальше таким же образом получим С4, с5, Сб, ... Обозначим через С множество точек, которое останется, когда все средние трети будут удалены; другими словами, С есть множество точек, принадлежащих одновременно всем множествам С|, C2l с3, ... В первой операции был удален интервал длины |; во второй операции — два интервала, каждый длины - и т. д.; сумма длин всех удаленных интервалов равна

Бесконечный ряд в больших скобках есть геометрическая прогрессия, сумма которой равна —Цг = 3; итак, сумма длин удаленных промежутков составляет 1.

И все-таки далеко не все точки отрезка удалены: множество С не пустое. Например, все точки, являющиеся концами удаленных интервалов —

— ему принадлежат. Можно легко убедиться, что множество С состоит в точности из всех тех чисел х, разложения которых в бесконечную дробь по основанию 3 могут быть написаны в форме

где всякое ап есть 0 или 2 тогда как в аналогичном разложении для всякой удаленной точки среди чисел ап, хоть раз встретится 1.

Какова же размерность множества С? Диагональный процесс, с помощью которого была доказана несчетность множества всех действительных чисел, может быть видоизменен таким образом, чтобы тот же результат получился и для множества С. Отсюда было бы естественно заключить, что множеству С надлежит приписать размерность 1. С другой стороны, С не содержит никакого, даже самого малого, промежутка, как и любое конечное множество; это сближает С с множествами размерности 0. Таким же образом, восставив в плоскости х, у из каждой рациональной точки или из каждой точки канторова множества перпендикуляр длины 1 к оси X (направляя его в сторону положительных значений у), мы получим множества, относительно которых может возникнуть сомнение — приписать ли ему размерность 2 или 1.

Впервые Пуанкаре (в 1912 г.) обратил внимание на необходимость более глубокого анализа и более точного определения размерности. Пуанкаре заметил, что прямая или кривая имеет размерность 1, так как любые две точки на ней можно разделить, удаляя одну-единственную точку (множество размерности 0); плоскость же имеет размерность 2 по той причине, что для разделения двух точек на плоскости нужно удалить целую замкнутую кривую (множество размерности 1). Это приводит к мысли о том, что понятие размерности имеет «индуктивную» природу: некоторому «пространству» следует приписать размерность п, если две точки в нем разделяются при удалении подмножества точек размерности п - 1 (но удаления подмножества меньшей размерности уже не было бы достаточно). В сущности, такого рода индуктивное определение неявно содержится уже в евклидовых «Началах», где одномерный образ толкуется как нечто, граница чего состоит из точек; двумерный образ — как нечто, граница чего состоит из линий; наконец, трехмерный образ — как нечто, граница чего состоит из поверхностей.

За последние годы была развита обширная теория — теория размерности. Определение размерности начинается с того, что разъясняется смысл термина «точечное множество размерности 0». Любое конечное точечное множество обладает тем свойством, что каждая его точка может быть заключена в сколь угодно малую область пространства, причем на границе области нет точек множества. Это свойство принимается теперь за определение размерности 0. Условимся ради удобства говорить, что пустое множество имеет размерность —1. В таком случае множество S имеет размерность 0, если оно не имеет размерности —1 (т. е. если S содержит хоть одну точку) и если каждая точка S может быть заключена в произвольно малую область, граница которой пересекает 5 по множеству размерности —1 (т. е. совсем не содержит ни одной точки S). Так, например, множество рациональных точек на прямой имеет размерность 0, так как каждая рациональная точка может быть рассматриваема как центр произвольно малого промежутка с иррациональными концами. Канторово множество С также размерности 0, так как, подобно множеству рациональных точек, оно получается посредством удаления везде плотного множества точек прямой.

Итак, мы уже определили понятия «размерность —1» и «размерность 0». Теперь легко понять, что такое «размерность 1»: говорят, что множество S имеет

Рис. 130. Канторово множество

«размерность 1», если оно не есть ни размерности —1, ни размерности 0, и если каждая точка 5 может быть заключена в произвольно малую область, граница которой пересекается с S по множеству размерности 0. Отрезок прямой обладает этим свойством, так как границей каждого промежутка является пара точек, т. е. множество размерности 0 по предыдущему определению. Дальше, продолжая таким же образом, мы можем последовательно определить, что такое размерность 2, размерность 3 и т. д., причем каждое следующее определение основывается на предыдущем.

Таким образом, говорят, что множество S имеет размерность п, если оно не имеет меньшей размерности и если каждая точка S может быть заключена в произвольно малую область, граница которой пересекается с S по множеству размерности п — 1. Например, плоскость имеет размерность 2, так как любая точка плоскости может быть заключена в кружок произвольно малого радиуса, граница которой имеет размерность 1.1 В обыкновенном пространстве никакое множество точек не может иметь размерность большую чем 3, так как любая точка пространства есть центр произвольно малой сферы, граница которой имеет размерность 2. Но в современной математике термин «пространство» употребляется в более общем смысле; он обозначает любую систему объектов, для которой введено понятие «расстояния» или «окрестности», и такого рода абстрактные «пространства» могут иметь размерность большую чем 3. Простым примером является декартово n-мерное пространство, «точки» которого суть системы из п действительных чисел, взятых в определенном порядке:

а «расстояние» между Р и Q определяется по формуле

Можно показать, что это пространство имеет размерность п. Пространство, которое не имеет размерности п, как бы велико ни было п, называется пространством бесконечной размерности. Известно много примеров таких пространств.

В теории размерности устанавливается одно чрезвычайно интересное свойство двумерных, трехмерных и вообще n-мерных фигур. Начнем с двумерного случая. Если какая-то простая двумерная фигура подразделена на достаточно маленькие «ячейки» (причем предполагается, что каждая ячейка содержит свою границу), то непременно найдутся такие точки, которые принадлежат сразу по меньшей мере трем ячейкам, какова бы ни была форма выбранных ячеек. Вместе с тем существуют такие разбиения фигуры на ячейки, что никакая точка фигуры не принадлежит сразу больше чем трем ячейкам. Так, если рассматриваемая

1 Сказанное не означает, что доказательство того, что плоскость имеет размерность 2 в смысле нашего определения, уже закончено: остается доказать, что граница круга (окружность) имеет размерность 1, и что сама плоскость не имеет размерности 0 или 1. Эти утверждения можно доказать, как и аналогичные утверждения для высших размерностей. Все предыдущие рассуждения показывают, что приведенное выше общее определение размерности не стоит в противоречии с обычным его пониманием.

двумерная фигура есть квадрат (рис. 131), то непременно имеются точки вроде той, которая сразу принадлежит трем ячейкам 1, 2 и 3, но для указанного на рисунке разбиения не существует точки, которая сразу принадлежала бы большему числу ячеек. Точно так же в трехмерном случае можно доказать, что если некоторая объемная фигура (тело) разбита на достаточно маленькие ячейки, то наверняка существуют точки, принадлежащие по меньшей мере четырем ячейкам, и вместе с тем можно выбрать такие подразделения, что никакая точка не будет принадлежать сразу больше чем четырем ячейкам.

Все эти соображения приводят нас к следующей теореме, высказанной А. Лебегом и Брауэром: если n-мерная фигура разбита на достаточно маленькие ячейки, то непременно существуют точки этой фигуры, принадлежащие сразу по меньшей мере п + 1 ячейкам; вместе с тем возможно указать и такие разбиения, что ни одна точка фигуры не будет принадлежать сразу более чем п 4- 1 ячейкам. Эта теорема характеризует размерность рассматриваемой фигуры: все фигуры, для которых теорема верна, являются n-мерными, все прочие имеют иную размерность. По этой причине указанная теорема может быть взята за определение размерности (так и делают некоторые авторы).

Размерность фигуры относится к числу топологических ее свойств: никакие две фигуры различных размерностей не могут быть топологически эквивалентными. В этом заключается замечательная теорема об «инвариантности размерности»: чтобы оценить ее должным образом, стоит напомнить другую теорему (доказанную на стр. 112), согласно которой множество точек квадрата имеет ту же мощность, что и множество точек отрезка. Соответствие между точками, установленное при доказательстве этой теоремы, не топологическое, так как требование непрерывности нарушается.

4. Теорема о неподвижной точке. В приложениях топологии к другим отраслям математики играют важную роль теоремы о «неподвижной точке». Типическим примером является излагаемая ниже теорема Брауэра. Она гораздо менее «очевидна» в интуитивном смысле, чем другие топологические теоремы.

Рассмотрим круглый диск на плоскости. Под таковым мы понимаем внутренность некоторого круга вместе с его границей (окружностью). Предположим, что весь этот диск подвергается некоторому топологическому преобразованию (даже не обязательно взаимно однозначному), при котором всякая точка диска остается точкой диска, хотя и меняет свое положение. Например, представляя себе этот диск сделанным из тонкой резины, можно его сжимать, растягивать, вращать, изгибать — одним словом, деформировать как угодно, лишь бы его точки не вышли за пределы

Рис. 131. Теорема о покрытии

первоначального положения диска. Иначе еще можно представить себе, что жидкость, налитая в стакан, приведена в движение таким образом, что частицы, находившиеся на поверхности, остаются на ней и во время движения; тогда в каждый определенный момент времени положение частиц на поверхности определяет некоторое топологическое преобразование или трансформацию первоначального их распределения. Теорема Брауэра утверждает: каждое непрерывное преобразование такого рода оставляет неподвижной по крайней мере одну точку; другими словами, существует по меньшей мере одна точка, положение которой после преобразования совпадает с положением ее до преобразования. (В примере с жидкостью неподвижные точки зависят от избранного момента времени; в частности, если движение сводится к простому круговому вращению, то неподвижной точкой в любой момент является центр.) Излагаемое далее доказательство существования неподвижной точки — очень характерный пример рассуждений, применяемых в топологии.

Рассмотрим наш диск до и после преобразования и допустим, что, вопреки утверждению теоремы, ни одна точка не остается неподвижной, так что любая точка диска после преобразования превращается в некоторую другую точку диска. Каждой точке Р диска в его первоначальном положении сопоставим стрелку или «вектор преобразования» РР\ причем Р' есть та точка, в которую переходит Р после преобразования. Такая стрелка будет выходить из каждой точки диска, так как всякая точка куда-то перемещается. Рассмотрим теперь все точки граничной окружности вместе с соответствующими векторами преобразования. Все эти векторы направлены внутрь круга, так как по предположению ни одна точка не выходит за его пределы. Начнем с какой-нибудь точки Р, лежащей на граничной окружности, и пойдем по этой окружности в направлении, противоположном движению часовой стрелки. При этом направление вектора преобразования будет изменяться, так как различным точкам границы соответствуют различно направленные векторы. Все эти векторы можно также представить себе (подвергнув их параллельному переносу) выходящими из некоторой одной и той же точки плоскости (рис. 133). Легко понять, что, когда мы обойдем один раз весь круг, вектор после ряда поворотов вернется в первоначальное положение. Число полных пово-

Рис. 132. Векторы преобразования

ротов, сделанных при этом нашим вектором, мы назовем индексом рассматриваемой граничной окружности; точнее говоря, мы определим индекс как алгебраическую сумму различных изменений в угле векторов, условливаясь, что всякому частному повороту по часовой стрелке приписывается знак минус, против часовой стрелки — знак плюс. Индекс есть итоговый результат, который a priori равен одному из чисел 0, ±1, ±2, ±3, соответствующих итоговым поворотам на 0°, ±360°, ±720°, ... Мы утверждаем теперь, что индекс граничной окружности равен единице, т. е. что итоговый поворот вектора преобразования составляет один полный поворот в положительном направлении. Прежде всего напомним еще раз, что вектор преобразования, имеющий начало в точке граничного круга, направлен непременно внутрь круга, а не по касательной. Если допустить, что итоговый поворот вектора преобразования отличается от итогового поворота касательного вектора (а этот последний поворот в точности равен 360°, так как касательный вектор, очевидно, делает один полный поворот), то разность между итоговыми поворотами касательного вектора и вектора преобразования будет равна кратному 360°, но никак не нулю. Отсюда следует, что вектор преобразования при обходе круга должен будет по крайней мере раз сделать полный поворот вокруг касательного вектора, а так как оба вектора изменяются непрерывно, то в некоторой точке окружности направления двух векторов совпадут. Но это, как мы видели, невозможно.

Рис. 133. К доказательству теоремы Брауэра

Рассмотрим теперь окружность, концентрическую границе диска, но с меньшим радиусом, а также соответствующие векторы преобразования. Для этой новой окружности индекс также непременно равен единице. В самом деле, при переходе от граничной окружности к новой окружности индекс должен меняться непрерывно, так как направления самих векторов преобразования меняются непрерывно. Но индекс может принимать только целые значения и потому остается равным единице: действительно, переход от единицы к какому-нибудь другому целому числу обязательно был бы связан со скачком, т. е. нарушением непрерывности. (Очень характерное математическое рассуждение: величина меняется непрерывно, но может принимать только целые значения, значит, она постоянна.) Итак, мы можем найти окружность, концентрическую граничной, притом сколь угодно малую, для которой индекс будет равен единице. Но это невозможно, так как, в силу непрерывности преобразования, векторы преобразования в достаточно малом круге должны весьма мало отличаться от вектора в центре круга. И потому итоговый поворот такого вектора при обходе круга может быть сделан, скажем, меньше 10°, если только радиус круга будет достаточно мал. Но отсюда следует, что индекс такого круга (обязательно целое число) не может быть отличен от нуля. Полученное противоречие показывает, что сделанное нами допущение об отсутствии неподвижных точек преобразования должно быть отвергнуто. Таким образом, теорема доказана.

Теорема о неподвижных точках имеет место не только для кругового диска, но, конечно, и для треугольника, квадрата и всякой другой фигуры, в которую диск может быть переведен топологическим преобразованием. В самом деле, если бы некоторая фигура Л, получающаяся из кругового диска посредством такого рода преобразования, могла быть преобразована сама в себя без неподвижных точек, то тем самым было бы определено и топологическое преобразование кругового диска самого в себя без неподвижных точек, а это, как мы видели, невозможно. Теорема обобщается также на случай трехмерных фигур — сфер или кубов, но доказательство не столь просто.

* Хотя теорема Брауэра о неподвижных точках в случае круга не является вполне очевидной в интуитивном смысле, однако легко убедиться, что она является непосредственным следствием такой достаточно очевидной теоремы: невозможно непрерывно отобразить круговой диск в одну только его граничную окружность таким образом, чтобы каждая точка этой окружности оставалась неподвижной. Убедимся, что существование непрерывного отображения диска в себя без неподвижных точек противоречит этой последней теореме. Предположим, что указанного рода непрерывное отображение Р—>Р' существует. Тогда для всякой точки Р нашего диска проведем вектор с началом в точке Р', проводя его через Р и заканчивая в точке Я*, где он встретится с граничной окружностью.

Тогда преобразование Р —> Р* будет непрерывным отображением всего диска в граничную окружность, оставляющим неподвижными все точки этой окружности, возможность чего была отвергнута. Подобное рассуждение можно применить и при доказательстве теоремы Брауэра в трехмерном случае сферы или куба.

Легко убедиться, с другой стороны, что для некоторых фигур непрерывные преобразования в себя без неподвижных точек возможны.

Например, кольцеобразная область между двумя концентрическими окружностями может быть подвергнута вращению около центра на угол, не являющийся кратным 360°, и это как раз будет непрерывным преобразованием области в себя без неподвижных точек. Такое же преобразование можно произвести над поверхностью сферы, сопоставляя всякой ее точке диаметрально противоположную. Но, применяя тот же метод, что и в случае диска, не представит труда доказать, что непрерывное преобразование сферической поверхности, не переводящее ни одной точки в диаметрально противоположную (например, всякая малая деформация), непременно имеет неподвижные точки.

Теоремы о неподвижных точках вроде перечисленных выше доставляют могущественный метод для доказательства многих «теорем существования» в разных областях математики, причем геометрический характер этих теорем часто далеко не очевиден. Замечательным примером может служить теорема Пуанкаре, высказанная им незадолго до смерти, в 1912 г., без доказательства. Из этой теоремы непосредственно вытекает существование бесчисленного множества периодических орбит в ограниченной проблеме трех тел. Пуанкаре не сумел обосновать своей догадки, доказательство этого замечательного факта получил через год американский математик Г. Д. Биркгоф. С тех пор топологические методы неоднократно и с большим успехом применялись к изучению качественного поведения динамических систем.

5. Узлы. В качестве последнего примера отметим, что трудные математические проблемы топологического характера возникают в связи с изучением узлов. Узел образуется, когда из отрезка веревки делают петли, затем сквозь них пропускают концы веревки и, наконец, два конца соединяют вместе. Изготовленная из веревки замкнутая кривая представляет собой геометрическую фигуру, существенные свойства которой не

Рис. 134. Топологически эквивалентные узлы, не переводящиеся друг в друга

изменяются, как бы в дальнейшем ни перетягивать или ни перекручивать веревку. Но как возможно было бы дать внутреннюю характеристику, которая позволила бы различить тем или иным способом «заузленные» кривые между собой и отличать их от «незаузленных» вроде круга? Ответ далеко не прост, и еще менее прост исчерпывающий математический анализ узлов разных типов. Затруднения встречаются даже при самых первых шагах в этом направлении. Взгляните на два узла, напоминающие трилистники, изображенные на рис. 134. Они совершенно симметричны друг другу, являются взаимно «зеркальными отображениями», они топологически эквивалентны и вместе с тем неконгруэнтны друг другу. Возникает проблема: можно ли деформировать непрерывным движением один узел в другой? Ответ отрицателен; но доказательство потребовало бы значительно большего владения топологической техникой и больших знаний из области теории групп, чем предполагают рамки этой книги.

§ 4. Топологическая классификация поверхностей

1. Род поверхности. Многие простые, но весьма существенные обстоятельства выясняются при изучении двумерных поверхностей. Сравним, например, поверхность сферы с поверхностью тора. Взглянув на рис. 135, сразу можно обнаружить различие: на сфере, как и на плоскости, замкнутая кривая вроде С разделяет поверхность на две части; но на торе существуют и такие замкнутые кривые, например С, которые не разделяют поверхности на две части. Если мы говорим, что кривая С разделяет сферу на две части, то это означает, другими словами, что при разрезании поверхности сферы по кривой С эта поверхность распадается на два не связанных между собой куска, или еще, иначе, что можно найти две такие точки сферы, что всякая кривая на сфере, их соединяющая, непременно пересечется с кривой С. Напротив, если разрезать тор по кривой С, то после разреза поверхность не распадется: любые две ее точки можно соединить кривой, не имеющей общих точек с С. Указанное различие свидетельствует о том, что сфера и тор в топологическом смысле не принадлежат одному и тому же классу поверхностей: тор нельзя топологически преобразовать в сферу.

Рис. 135. Разрезы на сфере и на торе

Рассмотрим теперь поверхность с двумя «дырами», изображенную на рис. 136. На этой поверхности оказывается возможным провести сразу две замкнутые кривые, А и ß, которые не разделяют поверхности на части. Тор, напротив, при проведении двух таких кривых непременно разделится на части. С другой стороны, любые три замкнутые кривые разделяют нашу поверхность с двумя дырами.

Все это подсказывает мысль ввести понятие рода поверхности, понимая под родом поверхности наибольшее возможное число взаимно не пересекающихся простых замкнутых кривых, которые можно провести на поверхности, не разделяя ее на части. Род сферы равен 0, род тора равен 1, род поверхности, изображенной на рис. 136, равен 2. Такая же поверхность с р «дырами» имеет род р. Род есть топологический инвариант поверхности: он не изменяется при деформировании поверхности. Обратно, можно доказать (но мы не приводим здесь этого доказательства), что если две замкнутые поверхности имеют один и тот же род, то одну можно деформировать в другую; таким образом род р = О, 1, 2, ... замкнутой поверхности полностью характеризует топологический класс, к которому она принадлежит. (Здесь предполагается, что мы рассматриваем только обыкновенные «двусторонние» поверхности. В пункте 3 этого параграфа мы рассмотрим также и «односторонние» поверхности.) Например, только что рассмотренная поверхность с двумя дырами и сфера с двумя «рукоятками», изображенная на рис. 137, являются обе замкнутыми поверхностями рода 2, и мы видим, что каждую из этих поверхностей удается деформировать в другую. Так как поверхность с р дырами или ее эквивалент — сфера с р рукоятками — поверхности рода /?, то любую из этих поверхностей можно взять в качестве «топологического представителя» всех замкнутых поверхностей рода р.

*2. Эйлерова характеристика поверхности. Предположим, что замкнутая поверхность S рода р разбита на некоторое число областей:

Рис. 136. Поверхность рода 2

Рис. 137. Поверхности рода 2

такое подразделение получается, если мы отметим на S ряд «вершин» и соединим их затем между собой дугами кривых. Мы покажем, что в таком случае

V-E + F = 2-2p, (1)

где V — число вершин, Е — число дуг и F — число областей. Число 2 — 2р называется эйлеровой характеристикой поверхности. Как мы уже видели, для случая сферы V — Е + F = 2, что согласуется с формулой (1), так как сфера имеет род /?, равный нулю.

Желая доказать общую формулу (1), вообразим, что 5 есть сфера с р рукоятками. Как мы отметили, любая поверхность рода р может быть непрерывной деформацией приведена к этому виду, и во время деформации ни V — Е + Z7, ни 2 — 2р не изменяются. Непрерывную деформацию мы выберем таким образом, чтобы замкнутые кривые Ah Л2, В\/В2, ..., по которым рукоятки соединяются со сферой, пришлись как раз на дуги данного подразделения. (Рис. 138 иллюстрирует описываемую дальше процедуру в случае р = 2.)

Прорежем теперь поверхность S по кривым Л2, В2, ... и выпрямим рукоятки. У каждой рукоятки появится свободный край, ограниченный новой кривой Л*, В*, причем на появившемся крае будет столько же вершин и столько же дуг, сколько их было соответственно на Л2, В2, ...

Число V — Е + F при прорезывании не изменится, так как новых областей не возникнет, а число вновь возникших вершин уравновешивается числом вновь возникших дуг. Затем деформируем поверхность дальше, сплющивая торчащие рукоятки (включая их в поверхность сферы). В итоге получается сфера с 2р отверстиями. Так как V — Е + F, как нам известно, равно 2 для всякого разбиения полной сферы, то для нашей сферы с 2р отверстиями мы получаем V — Е + F = 2 — 2ру и это равенство, очевидно, справедливо также и для первоначальной сферы с р рукоятками. Наше утверждение доказано.

Рис. 121 иллюстрирует применение формулы (1) к поверхности 5, составленной из плоских многоугольников. Эту поверхность можно топологически деформировать в поверхность тора, так что ее род р равен 1, и

Рис. 138. К эйлеровой характеристике поверхностей

потому 2 - 2р = 2- 2 = 0. Как и требуется по формуле (1), мы получаем

V-E + F= 16-32+16 = 0.

Упражнение. Произведите какое-нибудь разбиение на поверхности с двумя дырами, изображенной на рис. 137, и проверьте, что V — Е + F= -2.

3. Односторонние поверхности. У каждой из обыкновенных поверхностей имеется по две стороны. Это относится и к замкнутым поверхностям вроде сферы или тора, и к поверхностям, имеющим границы, каковы, например, диск или тор, из которого удален кусок поверхности. Чтобы легко различать две стороны одной и той же поверхности, их можно было бы раскрасить разными красками. Если поверхность замкнутая, две краски нигде не встретятся. Если поверхность имеет граничные кривые, то разные краски встречаются по этим кривым. Предположим, что по таким поверхностям ползал бы клоп и что-нибудь мешало бы ему пересекать граничные кривые; тогда он оставался бы всегда на одной стороне поверхности.

Рис. 139. Лист Мёбиуса: а, б, в — перекручивание и склеивание ленты; г — ориентация «сторон»

Мёбиусу принадлежит честь ошеломляющего открытия: существуют поверхности, у которых имеется только одна сторона. Простейшая из таких поверхностей есть так называемая лента (или лист) Мёбиуса. Чтобы ее построить, нужно взять лист бумаги, имеющий форму очень вытянутого прямоугольника, и склеить его концы после полуповорота, как показано на рис. 139 (а, б, в). Клоп, который будет ползти по этой поверхности, держась все время середины «ленты», вернувшись в исходную точку, окажется в перевернутом положении (рис. 139, г). Если кто-нибудь вздумает раскрасить «только одну» сторону поверхности мебиусовой ленты, пусть лучше сразу погрузит ее всю в ведро с краской.

Другое замечательное свойство поверхности Мёбиуса заключается в том, что у нее только один край: вся граница состоит из одной замкнутой кривой. Обыкновенная двусторонняя поверхность, получающаяся при склеивании концов ленты без всякого поворота, явственно имеет две различные граничные кривые. Если эту последнюю поверхность разрезать по центральной линии, она распадется на две поверхности того же типа. Но если разрезать таким же образом по центральной линии ленту Мёбиуса (см. рис. 139), то мы увидим, что распадения на две части не будет. Тому, кто не упражнялся с лентой Мёбиуса, трудно предсказать это обстоятельство, столь противоречащее нашим интуитивным представлениям о том, что «должно» случиться. Но если поверхность, полученную после описанного выше разрезания ленты Мёбиуса, снова разрезать по ее центральной линии, то у нас в руках окажутся две не связанные, но переплетенные между собой ленты!

Очень интересно разрезать такие ленты по линиям, параллельным границе и отстоящим от нее на ^, ^ и т.д. ширины ленты. Поверхность Мёбиуса, без сомнения, заслуживает упоминания и в школьном курсе.

Граница поверхности Мёбиуса представляет собой простую «незаузленную» замкнутую кривую, и ее можно деформировать в окружность. Но придется допустить, что в процессе деформации поверхность будет сама себя пересекать. Получающаяся при этом самопересекающаяся односторонняя поверхность известна под названием «кросс-кэп» (рис. 140)1. Линию пересечения здесь следует считать дважды, один раз относя к одному из пересекающихся листов поверхности, другой раз — к другому. Кросс-кэп, как и всякую одностороннюю поверхность, нельзя непрерывно деформировать в двустороннюю (топологическое свойство).

Рис. 140. Кросс-кэп

1 Cross-cap — «перекрещивающаяся шляпа» (англ.).

Любопытно, что ленту Мёбиуса можно, оказывается, так деформировать, что ее граница будет плоской ломаной (а именно, треугольником), причем лента останется несамопересекающейся. Такая модель, найденная д-ром Б. Туккерманом, показана на рис. 141,а; границей ленты служит треугольник ABC, ограничивающий половину диагонального квадратного сечения октаэдра (симметричного относительно этого сечения). Сама лента состоит при этом из шести граней октаэдра и четырех прямоугольных треугольников — четвертей вертикальных диагональных плоскостей октаэдра1.

Другой любопытный пример односторонней поверхности — так называемая «бутылка Клейна». Это — замкнутая поверхность, но она, в противоположность известным нам замкнутым поверхностям, не делит пространство на «внутреннюю» и «внешнюю» части. Топологически она эквивалентна паре кросс-кэпов со склеенными между собой граничными кривыми.

Можно доказать, что всякая замкнутая односторонняя поверхность рода р=1,2,... топологически эквивалентна сфере, из которой вынуты р дисков и заменены кросс-кэпами. Отсюда легко выводится, что эйлерова

Рис. 141. Лента Мёбиуса с прямолинейным краем (а) и ее развертка (б)

1 Из поверхности октаэдра вырезаются грани АВР и BCQ. К оставшимся шести граням приклеиваются четыре треугольника ОАР, OBPt OCQ и OBQ. На рис. 141, б приведена развертка описанной поверхности. По линии, соединяющей точку О с точкой, помеченной двумя буквами Л и С, надо сделать разрез, а потом склеить соответствующие отрезки края развертки. Жирными отрезками обозначен край ленты (периметр треугольника ABC). — Прим. ред.

характеристика V - Е + F такой поверхности связана с родом р соотношением

V-E + F = 2-p.

Доказательство этого предложения такое же, как и для двусторонних поверхностей. Прежде всего убедимся, что Эйлерова характеристика кросс-кэпа или ленты Мёбиуса равна 0. Для этого заметим, что, перерезая поперек ленту Мёбиуса, предварительно подразделенную на области, мы получим прямоугольник, у которого будут две лишние вершины и одна лишняя дуга, число же областей останется то же самое, что и для ленты Мёбиуса. Мы видели на стр. 265, что для прямоугольника V - Е + F = 1. Следовательно, для ленты Мёбиуса V — Е + F = 0. Предлагаем читателю в качестве упражнения восстановить это доказательство во всех подробностях.

Изучение топологической структуры поверхностей, подобных тем, которые только что были описаны, проводится более удобно, если воспользоваться плоскими многоугольниками с попарно идентифицированными сторонами (см. гл. IV, Приложение, пункт 3). Так, на схемах рис. 143 стрелки показывают, какие из параллельных сторон и в каком направлении должны быть идентифицированы: если возможно, то физически, если невозможно, то хотя бы мысленно, абстрактно.

Метод идентификации можно применить и для определения трехмерных замкнутых многообразий, аналогичных двумерным замкнутым поверхностям. Например, отождествляя соответствующие точки взаимно противоположных граней куба (рис. 144), мы получаем замкнутое трехмерное многообразие, называемое трехмерным тором. Такое многообразие топологически эквивалентно пространственной области, заключенной между двумя концентрическими поверхностями тора (одна внутри другой), с идентификацией соответствующих точек (рис. 145). Действительно, это последнее многообразие получается из куба, если привести в «физическое» совпадение две пары «мысленно отождествленных» взаимно противоположных граней.

Рис. 142. Бутылка Клейна

Рис. 143. Замкнутые поверхности, определенные посредством идентификации сторон квадрата

Рис. 144. Определение трехмерного тора посредством идентификации граней куба

Рис. 145. Другое представление трехмерного тора (разрезы показывают идентификацию)

ПРИЛОЖЕНИЕ

*1. Проблема пяти красок. Доказательство того, что всякая карта на сфере может быть правильно раскрашена с помощью не более чем пяти различных красок, основывается на формуле Эйлера. (В соответствии с тем, что было сказано на стр. 271, карта считается раскрашенной правильно, если никакие две области, соприкасающиеся по целой дуге, не окрашены одинаково.) Мы ограничимся рассмотрением таких карт, на которых все области являются простыми замкнутыми многоугольниками, ограниченными круговыми дугами. Не уменьшая общности, можно допустить, что в каждой вершине сходится ровно по три дуги; карту, удовлетворяющую такому условию, будем называть регулярной. Заменим каждую вершину, в которой встречается более трех дуг, маленьким кружком и присоединим внутренность этого кружка к одной из прилегающих областей: тогда получится новая карта, в которой «кратные» вершины заменены обыкновенными. Новая карта будет содержать столько же областей, сколько и старая, и она будет регулярной. Если ее удастся правильно раскрасить, то, сжимая потом кружок и сводя его в точку, мы получим требуемую раскраску первоначальной карты. Таким образом, достаточно убедиться, что каждую регулярную карту на сфере можно правильно раскрасить пятью красками.

Прежде всего докажем, что всякая регулярная карта содержит по крайней мере один многоугольник с числом сторон меньшим шести. Обозначим через Fn число я-угольных областей нашей регулярной карты; тогда, обозначая через F число всех областей, получим равенство

F = F2 + F3 + F4 + ... (1)

У каждой дуги два конца; в каждой вершине сходится три дуги. Поэтому если Е обозначает число дуг, а V — число вершин на нашей карте, то

2£ = ЗК (2)

Далее, так как область, ограниченная п дугами, имеет п вершин и каждая вершина принадлежит трем областям, то

2£ = 3l/ = 2F2 + 3F3 + 4F4 + ... (3)

По формуле Эйлера мы имеем

V-E + F = 2, или 61/-6£ + 6F= 12.

Из соотношения (2) следует, что 6К = 4£, так что 6F — 2Е = 12. Тогда соотношения (1) и (3) нам дают

или

Так как хотя бы один из членов суммы слева должен быть положительным, то отсюда ясно, что четыре числа F2, F3, F4 и F5 не могут одновременно равняться нулю. Но это и есть то, что нам нужно было доказать.

Перейдем теперь к теореме о пяти красках. Пусть M — какая угодно регулярная карта на сфере, п — число всех ее областей. Мы знаем, что имеется хоть одна область с числом сторон меньшим шести.

Случай 1. M содержит область Л с 2, 3 или 4 сторонами (рис. 146). В этом случае удалим дугу, отделяющую Л от одной из прилежащих областей. (Здесь необходимо следующее примечание. Если у области А четыре стороны, то может случиться, что одна из прилежащих областей, если ее обойти вокруг, окажется также прилежащей к А с противоположной стороны. В этом случае, на основании теоремы Жордана, две области, прилегающие к Л с двух остальных сторон, будут различными, и мы сможем удалить одну из этих двух сторон.) Вновь полученная карта М' будет также регулярной, но содержащей уже только п - 1 областей. Если карту М' можно правильно раскрасить пятью красками, то можно раскрасить и карту М. В самом деле, к области А прилегает самое большее четыре области карты M, и потому для А всегда найдется пятая краска.

Случай 2. M содержит область А с пятью сторонами. Рассматривая пять областей, прилегающих к Л, обозначим их через 5, С, Д Е и F. Можно всегда среди этих пяти областей найти две, которые не прилегают друг к другу: действительно, если, например, В и D прилегают одна к другой, то отсюда вытекает, что С не прилегает ни к £, ни к F, так как в противном случае всякий путь, идущий из С в £ или F, должен был бы пройти по крайней мере через одну из областей Л, В или D (рис. 147). (Ясно, что это утверждение существенно зависит от теоремы Жордана, справедливой для плоскости и для сферы. Для тора, напротив, все это

Рис. 146—147. К доказательству теоремы о пяти красках

рассуждение отпадает.) Итак, можно допустить, что, например, С и F не прилегают друг к другу. Удалим те две стороны Л, которые отделяют Л от С и Z7, и тогда получим новую карту M' с п - 2 областями, также регулярную. Если новую карту М' можно правильно раскрасить пятью красками, то можно раскрасить и первоначальную карту М. В самом деле, после восстановления удаленных сторон область Л будет прилегать к пяти областям, окрашенным не более чем четырьмя красками (так как С и F окрашены одинаково), и потому для Л всегда найдется пятая краска.

Таким образом, во всех случаях всякий регулярной карте M с п областями можно сопоставить такую, также регулярную, карту M' с п — 1 или п - 2 областями, что если М' можно раскрасить пятью красками, то M — также. Это рассуждение можно повторить для карты M' и т. д. В результате мы лолучим последовательность карт, в которой первым членом явится М:

м, м\ лг,

обладающую тем свойством, что каждая карта этой последовательности может быть раскрашена пятью красками, если может быть раскрашена следующая за ней. Но так как число областей в картах этой последовательности неизменно убывает, то рано или поздно в ней найдется карта с пятью областями (или меньшим числом). Такую карту всегда можно раскрасить не более чем пятью красками. Возвращаясь по последовательности карт, шаг за шагом, обратно, заключим отсюда, что и сама карта M может быть раскрашена пятью красками. Этим доказательство и заканчивается.

Остается заметить, что это доказательство имеет «конструктивный» характер: оно дает практически осуществимый, хотя, может быть, и утомительный, метод нахождения требуемой раскраски данной карты Af, составленной из п областей, посредством конечного числа шагов.

2. Теорема Жордана для случая многоугольников. Теорема Жордана утверждает, что всякая простая замкнутая кривая С разделяет точки плоскости, не принадлежащие С, на такие две области (не имеющие общих точек), по отношению к которым сама кривая С является общей границей. Мы докажем здесь эту теорему для частного случая, когда С есть замкнутый многоугольник Р.

Мы покажем, что точки плоскости (кроме точек, находящихся на самом многоугольном контуре Р) разбиваются на два класса Л и ß, обладающие следующими свойствами: 1) две точки одного и того же класса могут быть соединены ломаной линией, не имеющей общих точек с Р; 2) если две точки принадлежат разным классам, то любая ломаная линия, их соединяющая, имеет общие точки с Р. Один из названных классов образует «внутренность» многоугольника, другой состоит из точек, находящихся «вне» многоугольника.

Приступая к доказательству, выберем какое-то фиксированное направление в нашей плоскости, не параллельное ни одной из сторон Р. Так как Р имеет конечное число сторон, то это всегда возможно. Затем определим классы А и В следующим образом.

Точка р принадлежит классу А, если луч, проведенный через нее в фиксированном направлении, пересекает Р в четном числе точек (0, 2, 4, 6 и т.д.). Точка р принадлежит классу В, если луч, проведенный из р в фиксированном направлении, пересекает Р в нечетном числе точек (1,3, 5 и т.д.).

К этому нужно добавить, что если рассматриваемый луч проходит через какую-нибудь вершину, то эта вершина идет в счет как точка пересечения луча с Р или не идет, смотря по тому, расположены ли прилежащие стороны многоугольника Р по разные стороны луча или по одну и ту же его сторону.

Условимся говорить, что две точки р и q имеют одну и ту же «четность», если они принадлежат одному и тому же из двух классов А и В.

Заметим прежде всего, что все точки любого отрезка прямой, не пересекающегося с Р, имеют одну и ту же четность. Действительно, четность точки р, движущейся по такому отрезку, может измениться не иначе, как при пересечении соответствующего луча с одной из вершин Р; но, принимая во внимание наше соглашение о счете точек пересечения, легко убедиться, что в каждом из двух возможных случаев четность все же не меняется. Из сказанного следует, что если некоторая точка р\ области А соединена ломаной линией с некоторой точкой р2 области В, то эта линия непременно пересекает Р. Иначе четность всех точек ломаной линии, в частности, точек р\ и р2, была бы одинаковой. Дальше, покажем, что две точки одного и того же из двух классов А и В могут быть соединены ломаной линией, не пересекающейся с Р. Обозначим две данные точки через р и q. Если прямолинейный отрезок pq, соединяющий р и q, не пересекается с Р, то доказывать больше нечего. В противном случае пусть р' — первая, г q' — последняя точка пересечения отрезка pq с многоугольником Р (рис. 149). Построим ломаную линию, начинающуюся от точки р прямолинейным отрезком, расположенным по направлению pq, но заканчивающуюся непосредственно перед точкой р'\ отсюда ломаная пойдет вдоль Р (безразлично,

Рис. 148. Счет пересечений

Рис. 149. К доказательству теоремы Жордана

в каком из двух возможных направлений) и будет так идти, пока не придет снова на прямую pq — около точки q'. Весь вопрос в том, произойдет ли пересечение с прямой pq на отрезке p'q' или на отрезке q'q: мы сейчас убедимся, что справедливо именно последнее, и тогда будем иметь возможность закончить ломаную, соединяя последнюю из полученных точек с точкой q прямолинейным отрезком, снова лежащим на отрезке pq. Если две точки г и s расположены очень близко одна от другой, но по разные стороны одной из сторон многоугольника Я, то они имеют различную четность, так как выходящие из них (в фиксированном направлении) лучи будут таковы, что на одном из них будет на одну точку больше точек пересечения с Я, чем на другом. Отсюда ясно, что четность меняется, когда, двигаясь по pq, мы проходим через точку q'. Значит, ломаный «путь», намеченный на чертеже пунктиром, вернется на pq между q' и q, так как р и q (следовательно, все точки на рассматриваемом «пути») имеют одну и ту же четность.

Таким образом, теорема Жордана для случая многоугольника доказана. «Внешними» по отношению к многоугольнику Я будут те точки, которые принадлежат классу А: действительно, двигаясь по какому-нибудь лучу в фиксированном направлении достаточно далеко, мы, несомненно, придем к точке, за которой пересечений с Р уже не будет, и все такие точки будут принадлежать классу Л, так что их четность будет 0. Тогда уже придется заключить, что точками «внутренними» будут точки класса В. Каким бы запутанным ни был замкнутый многоугольник Я, всегда очень легко узнать, расположена ли данная точка р внутри или вне его: достаточно из р провести луч и посчитать число его точек пересечения с Р. Если это число нечетное, значит, р «сидит» внутри и не сможет выбраться наружу, не пересекая Р. Но если это число четное, то точка р — вне многоугольника Р (попробуйте проверить это на рис. 128).

Вот идея другого доказательства жордановой теоремы для случая многоугольников. Определим порядок точки ро относительно замкнутой кривой С (не проходящей через ро) как число полных поворотов1, совершаемых стрелкой (вектором), проведенным от р к ро, когда точка р делает один обход по кривой С.

1 Это число нужно, конечно, брать в алгебраическом смысле, т. е. с учетом направления вращения.

Затем пусть А есть совокупность точек ро (не на Р) четного порядка относительно Л а В есть совокупность точек ро (не на Р) нечетного порядка относительно Р. В таком случае А и В, определенные указанным способом, представляют собой соответственно области «внешнюю» и «внутреннюю» относительно Р. Читатель может в качестве упражнения воспроизвести все детали доказательства.

*3. Основная теорема алгебры. Основная теорема алгебры утверждает, что если функция f(z) имеет вид

f(z) = zn + dn-xz"-* + art_2^-2 +... + axz+a0, (1)

где n ^ 1 и a„_i, а„_2, ..., ai, a0 — какие угодно комплексные числа, то существует такое комплексное число а, что /(а) = 0. Другими словами, в поле комплексных чисел всякое алгебраическое уравнение имеет корень. (Основываясь на этой теореме, мы на стр. 128 сделали дальнейшее заключение: полином f(z) может быть разложен на п линейных множителей

/(г) = (z- а,)(г - а2)... (г - а„),

где он, а2, ..., ая — нули f(z).) Замечательно, что эту теорему можно доказать, исходя из соображений топологического характера, как и теорему Брауэра о неподвижной точке.

Пусть читатель вспомнит, что комплексное число есть символ вида X + yi, где X и у — действительные числа, а символ i обладает свойством /2 = -1. Комплексное число х + yi изображается точкой (х, у) в плоскости прямоугольных координат. Если мы введем в этой же плоскости полярные координаты, принимая начало координат за полюс, а положительное направление оси х за полярную ось, то можно будет написать

z = X + yi = r(cos 9 + i sin 6),

где r = \/x2 + y2. Из формулы Муавра следует, что zn = /-"(cosazO + is'mnQ) (см. стр. 124). Отсюда ясно, что если комплексное число z описывает круг радиуса г с центром в начале координат, то г" опишет ровно п раз круг с радиусом г". Напомним еще, что модуль z (обозначаемый через |z|) представляет собой расстояние z от 0 и что если z' = х' -f iy\ то \z — z'\ есть расстояние между z и z'. После этих напоминаний можно перейти к доказательству теоремы.

Допустим, что полином (I) не имеет корней, так что при любом комплексном z

При этом допущении, если z описывает некоторую замкнутую кривую в плоскости Ху у у то f(z) опишет некоторую замкнутую кривую Г, не проходящую через начало координат (рис. 150). Можно определить порядок точки О для функции /(г) относительно замкнутой кривой С как число полных поворотов, совершаемых вектором, идущим от О к точке f(z)

на кривой Г, когда z делает полный обход по кривой С. Возьмем в качестве кривой С окружность с центром О и радиусом / и обозначим через ф(/) порядок точки О для функции f(z) относительно окружности с центром О и радиусом /. Очевидно, ср(0) = 0, так как круг радиуса О сводится к одной точке и кривая Г также сводится к одной точке /(0) ф 0. Если мы докажем, что при достаточно больших значениях / функция ср(/) равна /2, то в этом уже будет заключаться противоречие, так как, с одной стороны, порядок ср(/) должен быть непрерывной функцией / (поскольку /(г) есть непрерывная функция z), а с другой стороны, функция ф(/) может принимать только целые значения и потому никак не может перейти от значения 0 к значению п непрерывно.

Нам остается доказать, что при достаточно больших значениях /

9(0 = я-

Для этого заметим, что если радиус круга / удовлетворяет неравенствам

Рис. 150. Доказательство основной теоремы алгебры

Так как выражение слева есть не что иное, как расстояние между точками zn и /(z), а выражение в самой правой части неравенства — расстояние точки zn от начала координат, то мы видим отсюда, что отрезок, соединяющий точки zn и /(г), не пройдет через начало координат, если только z будет находиться на круге радиуса / с центром в начале. В таком случае имеется возможность деформировать кривую, описываемую точкой /(/), в кривую, описываемую точкой zn, без прохода через начало, смещая непрерывным движением каждую точку f(z) к соответствующей точке zn по прямоугольному отрезку. При этом порядок начала может принимать только целые значения и вместе с тем во время деформации может меняться не иначе, как непрерывно; значит, для обеих функций f(z) и zn он одинаков, и так как для zn он равен я, то имеет то же самое значение и для f(z). Доказательство закончено.

ГЛАВА VI

Функции и пределы

Введение

Важнейшие разделы современной математики сосредоточиваются вокруг понятий функции и предела. В этой главе мы займемся систематическим анализом этих понятий.

Такие выражения, как, например,

х2 + 2х- 3,

не имеют определенного числового значения, пока не указано значение х. Говорят, что значение этого выражения есть функция значения х, и пишут

гЧ 2*-3 = /(*).

Например, если х = 2, то 22 + 2 • 2 - 3 = 5, так что /(2) = 5. Таким же образом непосредственной подстановкой можно найти значение функции f(x) при любом целом, дробном, иррациональном и даже комплексном значении х.

Количество простых чисел, меньших чем я, есть функция п(п) целого числа п. Когда задано значение числа я, то значение функции тс(лг) определено, несмотря на то что неизвестно никакого алгебраического выражения для его подсчета. Площадь треугольника ес