Ф. КЛЕЙН

ЭЛЕМЕНТАРНАЯ МАТЕМАТИКА С ТОЧКИ ЗРЕНИЯ ВЫСШЕЙ

АРИФМЕТИКА

АЛГЕБРА

АНАЛИЗ

I

Ф. КЛЕЙН

ЭЛЕМЕНТАРНАЯ МАТЕМАТИКА С ТОЧКИ ЗРЕНИЯ ВЫСШЕЙ

Лекции, читанные в Гёттингенском университете

ТОМ ПЕРВЫЙ

АРИФМЕТИКА, АЛГЕБРА, АНАЛИЗ

Перевод с немецкого Д. А. КРЫЖАНОВСКОГО

Под редакцией В. Г. БОЛТЯНСКОГО

ИЗДАНИЕ ЧЕТВЕРТОЕ

МОСКВА «НАУКА»

ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ

1987

ББК 2210 К48 УДК 51 (023)

FELIX KLEIN

ELEMENTARMATHEMATIK VOM HÖHEREN STANDPUNKTE AUS ERSTER BAND

ARITHMETIK. ALGEBRA. ANALYSIS

Dritte Auflage

BERLIN

VERLAG VON JULIUS SPRINGER 1924

Клейн Ф. Элементарная математика с точки зрения высшей: В 2-х томах. T. I. Арифметика. Алгебра. Анализ: Пер. с нем./Под ред. В. Г. Болтянского. — 4-е изд. — М.: Наука. Гл. ред. физ.-мат. лит., 1987. — 432 с.

Книга выдающегося немецкого математика Феликса Клейна занимает особое место в популярной литературе по математике. Она в доходчивой и увлекательной форме рассказывает о тонких математических понятиях, о методике преподавания математики в школе (средней и высшей), об интересных фактах из истории науки, о собственных взглядах автора на математику и ее роль в прикладных вопросах.

Первый том посвящен вопросам арифметики, алгебры, анализа. Автор рассматривает понятие числа (целого, рационального, иррационального), особо останавливаясь на тех «мостиках», которыми можно соединить вузовское и школьное преподавание математики. Написанная в форме лекций для учителей, книга и за давностью лет не потеряла своей значимости» свежести, привлекательности.

3-е изд. выходило в 1935 г.

Для студентов-математиков, преподавателей, научных работников и просто любителей математики.

© Перевод на русский язык. Дополнения. Издательство «Наука». Главная редакция физико-математической литературы, 1987

ОГЛАВЛЕНИЕ

Предисловие редактора ............... 5

Введение..................... 15

АРИФМЕТИКА

I. Действия над натуральными числами......... 20

1. Введение чисел в школе............ 20

2. Основные законы арифметических действий..... 23

3. Логические основы теории целых чисел ...... 26

4. Практика счета с целыми числами......... 35

II. Первое расширение понятия числа......... 37

1. Отрицательные числа.............. 37

2. Дроби................... 45

3. Иррациональные числа............. 49

III. Особые свойства целых чисел........... 57

1. Роль теории чисел в школьном и университетском преподавании .................. 57

2. Простые числа и разложение на множители..... 61

3. Обращение простых дробей в десятичные...... 62

4. Непрерывные дроби.............. 64

5. Пифагоровы числа. Великая теорема Ферма ..... 69

6. Задача о делении окружности на равные части ... 75

7. Доказательство невозможности построения правильного семиугольника циркулем и линейкой ........ 78

IV. Комплексные числа................ 85

1. Обыкновенные комплексные числа......... 85

2. Высшие комплексные числа, в особенности кватернионы 88

3. Умножение кватернионов и преобразование поворотного растяжения в пространстве........... 99

4. Комплексные числа в преподавании........ 112

V. Современное развитие и строение математики вообще . .114

1. Два различных ряда эволюции, по которым параллельно развивался математический анализ....... 114

2. Краткий обзор истории математики........ 118

АЛГЕБРА

Введение..................... 127

I. Уравнения с действительными неизвестными...... 127

1. Уравнения, содержащие один параметр...... 127

2. Уравнения с двумя параметрами......... 129

3. Уравнения с тремя параметрами......... 137

II. Уравнения в области комплексных чисел......147

A. Основная теорема алгебры............148

B. Уравнение с одним комплексным параметром . . . .151

1. Двучленное уравнение гя = w.........159

2. Уравнение диэдра...............166

3. Уравнения тетраэдра, октаэдра и икосаэдра.....173

4. Продолжение; вывод уравнений.........178

5. О решении нормальных уравнений........186

6. Униформизация нормальных уравнении посредством трансцендентных функций............190

7. Разрешимость в радикалах...........197

8. Сведение общих уравнений к нормальным .... 202

АНАЛИЗ

I. Логарифм и показательная функция........206

1. Систематика алгебраического анализа.......206

2. Историческое развитие учения о логарифме.....209

3. Некоторые замечания о школьном преподавании . . . 222

4. Точка зрения современной теории функций ..... 224

II. О тригонометрических функциях..........233

1. Теория тригонометрических функций в связи с учением о логарифме.................233

2. Тригонометрические таблицы..........243

3. Применения тригонометрических функций.....249

III. Исчисление бесконечно малых в собственном смысле слова 295

1. Общие замечания относительно исчисления бесконечно малых ...................295

2. Теорема Тейлора...............315

3. Замечания исторического и педагогического характера 331

ПРИЛОЖЕНИЯ

I. Трансцендентность чисел е и л...........334

1. Исторические замечания............334

2. Доказательство трансцендентности числа е.....336

3. Доказательство трансцендентности числа л.....343

4. Трансцендентные и алгебраические числа......352

II. Учение о множествах..............355

1. Мощность множества.............355

2. Порядок элементов множества..........372

3. Заключительные замечания о значении учения о множествах и о преподавании в школе........378

Примечания....................382

Именной указатель.................426

Предметный указатель , , . ,............429

ПРЕДИСЛОВИЕ РЕДАКТОРА

Феликс Клейн (1849—1925) принадлежит к числу математиков-классиков, обогативших науку новыми идеями и в значительной степени определивших ее современное лицо. В области геометрии XIX век ознаменовался, прежде всего, значительным расширением наших взглядов на пространство и предмет геометрии. Если раньше господствовало представление о том, что научные факты, теоремы, законы в точности описывают свойства единственного мыслимого, волею творца созданного пространства*), то XIX век не только поколебал, но и полностью опрокинул эти идеалистические взгляды. И начало этому было положено работами нашего выдающегося соотечественника Н. И. Лобачевского.

Лобачевский, открывший новую геометрию, отличную от евклидовой, неизбежно пришел к вопросу о том, какова же геометрия реального пространства, подошел к пониманию того, что евклидова геометрия может лишь приближенно описывать свойства реального пространства, которое в действительности является значительно более сложным. И его эксперименты по вычислению суммы углов огромного космического треугольника — яркое свидетельство этого. Работы Лобачевского открыли перед математиками целый новый мир, позволили искать новые и новые геометрии, и это вскоре ознаменовалось появлением римановой геометрии, введением нормированных, топологических и многих других пространств.

Вместе с тем был один пробел в математическом наследии Лобачевского, существенность которого он сам отлично понимал. Речь идет о доказательстве непротиворечивости его «воображаемой геометрии». Вместо построения необходимой для этого модели Лобачевскому удалось построить другую модель: оказалось, что на предельной сфере пространства Лобаческого реализуется планиметрия Евклида. Какая горькая ирония судьбы! Для того чтобы «узаконить» свою геометрию, Лобачевскому нужна была «обратная» модель, реализующая все соотношения его геометрии

*) Этих взглядов придерживался и великий Ньютон. Приведем несколько цитат из книги: Клайн М. Математика — утрата определенности. — М.: Мир, 1984. — С. 72—73: «Как и все математики и естествоиспытатели того времени, Ньютон верил в то, что бог сотворил мир в соответствии с математическими принципами... изящнейшее соединение Солнца, планет и комет не могло произойти иначе, как по намерению и власти могущественнейшего и премудрого существа... господь бог — искусный математик и физик... Задача науки состоит в том, чтобы раскрыть блистательные замыслы творца».

и построенная из евклидова «материала». Но этого ему не суждено было сделать. Это выпало на долю нескольких геометров, работавших во второй половине XIX столетия, и Феликс Клейн — один из них. Один из тех, кто построением изящной модели завершил более чем двухтысячелетнюю «борьбу» математиков с пятым постулатом Евклида (постулатом о параллельных) и подтвердил правомерность идей Лобачевского о возможности существования разных геометрий.

Если бы математические заслуги Клейна этим только и ограничивались, одно это полностью оправдывало бы интерес к его научному наследию. Однако Клейн сделал гораздо больше. В 1876 году, при вступлении на должность профессора по кафедре геометрии университета в городе Эрлангене, Клейн прочитал блестящую лекцию, в которой наметил далеко идущую научную программу переосмысления различных геометрий с единой групповой точки зрения. Мысль Клейна можно пояснить следующим образом.

Равенство (точнее, конгруэнтность) геометрических фигур— например на плоскости — является отношением эквивалентности, т. е. оно рефлексивно, симметрично и транзитивно. Иначе говоря, для любых фигур F, о, H справедливы следующие утверждения (в которых символом с* обозначается конгруэнтность геометрических фигур):

F ^ F (рефлексивность); если F caGy то G с* F (симметричность)* если F 22 G и G H, то F ex H (транзитивность).

Справедливость этих утверждений вытекает из определения конгруэнтности и свойств движений. Напомним, что фигура F называется конгруэнтной фигуре G, если существует движение g, переводящее г в G, т.е. g(F) = G (заметьте, здесь равенство, т.е. совпадение, а не конгруэнтность!). Чтобы доказать рефлексивность, нужно найти такое движение, которое переводит фигуру F в себя. Таким движением является тождественное отображение е, т. е. рефлексивность отношения конгруэнтности вытекает из включения е œ D, где £> — группа всех движений плоскости.

Несложно доказывается и симметричность. Пусть F си G, т. е. существует такое движение g. что g(F) « G. Тогда обратное преобразование g*1 (которое также является движением) переводит фигуру G обратно в F, т.е. g~*(G) = F. Это и означает, что G ~ F, т. е. отношение конгруэнтности симметрично.

Наконец, пусть F си G и G си Я, т. е. существуют такие движения /, g, что f(F) = ö и g(G) = H. Тогда композиция g°f (т.е. результат последовательного выполнения движений f и g)9 которая в свою очередь является движением, сразу переводит F в Я, т.е. g °t(F) = H. Это означает, что F ~ И, те. отношение конгруэнтности транзитивно.

Итак, рефлексивность, симметричность и транзитивность отношения конгруэнтности вытекают из того, что множество D всех движений является группой преобразований плоскости, т.е. это множество не пусто и обладает следующими двумя свойствами: если [еД то /~* œ D, и, кроме того, если f œ D и ^sD, то g 0 / €= D.

Но группа всех движений — не единственная известная нам группа преобразований. Аффинные преобразования (плоскости

или пространства) также составляют группу. Образуют группу все проективные преобразования (проективной плоскости или проективного пространства), все преобразования подобия, все параллельные переносы, все движения плоскости Лобачевского и т. д. По мысли Клейна каждая группа преобразований (некоторого множества) задает «свою» геометрию. Именно, пусть Г — некоторая группа преобразований множества М\ тогда две фигуры F и G (т. е. два подмножества множества М) называются Г-конгруэнтными, если существует такое преобразование g œ Г, которое переводит F в О И подобно тому как евклидова геометрия изучает те свойства фигур, которые одинаковы у конгруэнтных фигур, т.е. те свойства фигур, которые сохраняются (остаются инвариантными) при движениях, так и геометрия группы преобразований Г изучает те свойства фигур (т е подмножеств множества М), которые одинаковы у Г-конгруэнтных фигур, т.е. те свойства фигур, которые остаются инвариантными при всех преобразованиях, принадлежащих группе Г.

Эта идея Клейна позволила ему объединить, охватить единым подходом многие различные геометрии: евклидову, аффинную, проективную, гиперболическую геометрию Лобачевского, эллиптическую геометрию Римана и ряд других.

Прошли десятилетия. Групповой подход Клейна к осмыслению геометрии приобрел новые звучания и новые области приложения. Теперь значение идей эрлангенской программы Клейна не ограничивается рамками геометрии. Групповая точка зрения на геометрические свойства фигур широко используется в физике. Знаменитый русский кристаллограф и геометр Е. С. Федоров, используя идеи Клейна, открыл кристаллографические группы, носящие теперь его имя. Они стали в наши дни научной основой кристаллографии. Групповой подход находит важные применения в ядерной физике, квантовой теории, физике элементарных частиц; принципы симметрии и четности — яркое проявление групповой точки зрения. Еще один впечатляющий пример — специальная теория относительности. Ее основой является группа преобразований Лоренца, которая задает своеобразную геометрию четырехмерного пространства — времени и служит подлинной основой современного физического понимания взаимоотношения времени и пространства (локально, в небольшой области).

Разумеется, помимо физики и других естественных наук, принципы эрлангенской программы применяются и в самой математике. Развитие этих идей воплощено сейчас в понятии однородных пространств (нередко называемых пространствами Клейна), которые находят различные приложения в ряде разделов математики.

А в проблемах, связанных с преподаванием геометрии, идеи эрлангенской программы вплоть до сегодняшнего дня имеют огромное значение и находятся на переднем крае «методического фронта». С влиянием этих идей школьный преподаватель математики встречается буквально во всех разделах курса геометрии, и за прошедшие сто лет со дня провозглашения Клейном эрлангенской программы влияние этих идей не только не ослабло, но, скорее, возросло.

Сейчас хорошо известно, что традиционно «школьные» геометрические задачи на доказательство могут решаться не только идущим из седой древности (от Евклида или даже ранее) мето-

дом цепочек равных треугольников, связанным с применением трех признаков равенства их, но также применением геометрических преобразований и в первую очередь движений. Именно такие решения, связанные с движениями и использующие, в частности, соображения симметрии, наиболее важны для развития «геометрического видения». Применение движений сближает математику с идеями физики, химии, биологии, техники, соответствует прогрессивным чертам математического осмысления мира.

Влияние группового подхода Клейна можно проследить во всех темах школьной геометрии. Каждая фигура F определяет некоторую группу движений; эта группа содержит все те движения, которые переводят фигуру F в себя, и называется группой самосовмещений (или группой симметрий) фигуры F. Знание группы самосовмещений фигуры F во многом определяет геометрические свойства этой фигуры. Все свойства параллелограмма вытекают из того, что его группа самосовмещений содержит (кроме тождественного преобразования) центральную симметрию. Группа самосовмещений ромба (или прямоугольника) богаче: она содержит еще две осевые симметрии, и это полностью определяет те дополнительные свойства, которые имеет эта фигура по сравнению с параллелограммом общего вида. Свойства равнобедренного треугольника — проявление его симметричности. Все свойства правильных многоугольников вытекают из рассмотрения их групп симметрий. Свойства правильных многогранников (или других многогранников, обладающих той или иной симметричностью), свойства сферы, цилиндра, конуса удобнее всего выводит с помощью рассмотрения групп самосовмещений этих фигур. И для каждой конкретной геометрической фигуры богатство ее свойств определяется прежде всего ее группой самосовмещений. Все это — своеобразное преломление клейновских идей в школьном преподавании.

Мы остановились на двух ярких геометрических достижениях Клейна. Но его многостороннее научное наследие содержит и много других идей и результатов. Клейн вместе с великим французским математиком Пуанкаре заложил основы теории автоморфных функций; он внес существенный вклад в развитие теории римановых поверхностей многозначных аналитических функций; так называемые клейновы группы являются классическим объектом рассмотрения в теории функций комплексной переменной; всем хорошо известна бутылка Клейна, явившаяся одним из первых примеров односторонних поверхностей, и т. д.

Несомненно, личность такого математика, как Клейн, привлекает внимание, и его взгляды на развитие математики, ее теоретическую и прикладную значимость, взаимосвязь различных разделов математики, его методические взгляды и понимание ценности науки — все это пробуждает интерес многих читателей. Подобно тому как вызывает взволнованное внимание визит в мастерскую известного художника, посещение творческого вечера композитора или чтение мемуаров выдающегося писателя, так каждая возможность заглянуть в творческую мастерскую крупного математика вызывает живой интерес. К сожалению, математики скупо делятся секретами творчества со своими будущими почитателями, и в этом плане книги Пуанкаре, Пойа, Адамара представляют собой приятные исключения. И книга Клейна, в ка-

кой-то степени воссоздающая творческий стиль его мышления, взгляды и замыслы, несомненно, очень привлекательна.

Автор «Элементарной математики с точки зрения высшей» — не только крупный ученый-теоретик, но также и большой популяризатор науки. Перу Клейна принадлежат такие замечательные произведения, как «Высшая геометрия», «Лекции об икосаэдре», «Четыре знаменитые задачи древности» и многие другие, в которых с удивительным мастерством, в интересной и доступной форме он рассказывает о тонких и глубоких математических фактах, теориях, методах. И в этой книге, предлагаемой вниманию читателя, Клейн выступает как мастер-популяризатор. Читатель найдет здесь красивый этюд о пифагоровых числах и великой теореме Ферма, изящное изложение теории деления окружности, рассказ о кватернионах, прозрачно изложенную гауссову идею доказательства основной теоремы алгебры, доказательство трансцендентности чисел е и я, много крайне интересных подробностей из истории математики и ряд других вопросов.

И все же, несмотря на многоплановость предлагаемой вниманию читателей книги и наличие в ней различных математических идей, подходов, популяризаторских находок, не изложение взглядов Клейна на развитие математики и не его стремление внести вклад в научно-популярную литературу составляет основной замысел книги. Написание этой книги связано еще с одной стороной жизни и деятельности Феликса Клейна, направленной на осуществление прогрессивных тенденций в деле школьного математического образования. Остановимся несколько подробнее на истории этого вопроса.

Старая германская гимназия (школа филологического типа) давала своим воспитанникам очень скудные сведения по математике и естествознанию. В противовес гимназическим программам под руководством В. Гумбольдта (имя которого ныне носит Берлинский университет) были разработаны новые программы, в которых много места отводилось математике и предметам естественнонаучного цикла. Через некоторое время были учреждены «реальные гимназии» с несколько расширенными программами по математике. Однако все правовые преимущества, в том числе доступ в высшие школы, были сохранены только за классическими гимназиями.

Признать образование, основанное на естествознании и математике, равноправным с классическим — таково было первое требование группы новаторов, возглавляемой Клейном.

Реформа математического образования, за проведение которой боролись Клейн и его единомышленники, была направлена на то, чтобы обновить застывший курс математики реальных училищ, сделать его более современным, включающим новые идеи и достижения науки. Взгляды Клейна на преподавание математики в средней школе были весьма прогрессивны. И хотя многие из его требований сейчас воплощены в школьном преподавании, педагогические идеи Клейна остаются актуальными и сегодня. Эти идеи можно изложить следующим образом.

Математика XIX столетия принесла с собой ряд замечательных идей, которые наложили глубокий отпечаток на все отрасли знания и техники. Совершенно недопустимо поэтому, чтобы общеобразовательная школа была чужда тому, что составляет подлинное содержание современной математики. Основную, руководя-

щую роль в курсе математики средней школы должно играть понятие функции. Оно должно быть усвоено учащимися очень рано и должно проникать все преподавание алгебры и геометрии. Развить в юноше способность к функциональному мышлению составляет основную задачу реформы.

Далее, изучение функций, их возрастания и убывания необходимо и естественно приводит к понятию производной. Это вызывает следующее требование реформаторов: в программу средней школы должны быть введены начала математического анализа. Основные понятия дифференциального и интегрального исчислений играют важную роль во всех отраслях и приложениях математики, и обойтись без них невозможно. В механике при определении понятий скорости и ускорения, а также в ряде разделов физики, которые изучаются в средней школе, мы фактически оперируем производными. Клейн высказывает убеждение, что искусственные приемы, к которым прибегают в каждом частном случае, чтобы избежать понятия о производной и об интеграле, только сбивают учащихся, создают путаницу и отнимают много времени.

Наконец, по мнению Клейна, на первых ступенях преподавания надо отказаться от строго логических тенденций; нужно возможно больше наглядных представлений, возможно большее число примеров из повседневной жизни. Но при этом Клейн считает необходимым, чтобы в течение последних лет обучения логическая сторона дела достаточно выяснялась.

Итак, отказ от господства филологической школы в пользу изучения естествознания и математики, углубление связи между теоретической и прикладной математикой, введение в преподавание математики функционального мышления и начал математического анализа, а также наглядное обучение и прежде всего широкое применение графических методов — вот те принципы, которые Клейн и его последователи считали необходимым положить в основу реформы преподавания математики в школе. Не правда ли, эти принципы не только прогрессивны, но удивительно актуальны и современны?! Достаточно сказать, что в советской школе эти принципы осуществлены более или менее полно лишь за последние два-три десятилетия.

Но вернемся к истории создания книги. В связи с борьбой за проведение в жизнь своих взглядов Клейн прочел ряд курсов для преподавателей и будущих учителей средних учебных заведений. Один из этих курсов (прочитанный в Гёттингенском университете в 1907/08 учебном году) и составляет основу книги. В своих лекциях Клейн имел в виду дать учителю или студенту старшего курса содержание и обоснование вопросов, составляющих элементарную математику. Он стремился подойти к этим вопросам, как он сам писал в предисловии к литографированным лекциям, вышедшим в 1903 году, «с точки зрения современной науки в возможно простой и живой форме». Лекции Клейна представляют собой редкий вклад в учебную математическую литературу. Некоторые вопросы ни в каком другом сочинении в подобной обработке нельзя найти: многое заимствовано непосредственно из научных мемуаров, из обширных исторических сочинений, малодоступных или даже вовсе недоступных тому читателю, для которого предназначены лекции Клейна. Мало того, книга интересна не только учителю, а местами, пожалуй, и вовсе не

учителю. Она интересна выпускнику университета, пединститута, технического вуза, аспиранту — она дает ему обзор руководящих идей, проникающий многие отделы современной математики.

Понятие об «элементарной математике» является очень растяжимым. Клейн признает элементарным все то, что доступно юноше школьного возраста. Но с этой точки зрения многие части сочинения Клейна вовсе не могут быть признаны элементарными. Учение о кватернионах, уравнения и группы многогранников и их связь с римановыми поверхностями, учение о малых колебаниях, о рядах Фурье, об интерполяции никак не могут быть признаны элементарными. В некоторых своих частях книга требует значительной научной подготовки — что, конечно, вовсе не уменьшает ее достоинства для тех, кому эти вопросы доступны. Вместе с тем книга имеет характер сборника этюдов по вопросам элементарной математики и их осмыслению с точки зрения математики современной. Как писал Клейн в предисловии к упомянутым выше литографированным лекциям, «...я не имел в виду дать систематическое изложение, как это делают, например, Вебер и Вельштейн*); я хотел придать этим лекциям характер эскизов в той самой форме, в какую они выливались, когда я их читал».

Школьный преподаватель математики хорошо разбирается в вопросах методики преподавания своего предмета, но, как правило, судиг об этих вопросах на уровне школьной программы и наличия межпредметных связей с другими, но именно школьными, предметами. Помочь ему подняться над этим уровнем, взглянуть на школьную математику с высоты научных и прикладных интересов — искреннее желание автора. При общении со школьниками преподаватель часто сталкивается с тем, что учащийся недоумевает, для чего автору учебника понадобился тог или иной сложный аппарат, те или иные громоздкие рассуждения и как можно было до этого додуматься. Вот эти именно вопросы Клейн и старается осветить, он старается раскрыть идею в свете ее исторического развития, пояснить проблему в сопоставлении попыток ее решения. Клейн всюду стремится соединить геометрическую наглядность с точностью аналитических формул, пояснить в историческом плане особенности различных способов изложения, которые в школьном преподавании нередко уживаются рядом. И высшую награду своему труду автор видел в том, «...чтобы книга побуждала учителя средней школы к самостоятельному размышлению о новом, более целесообразном изложении того учебного материала, который он преподает. Исключительно с такой точки зрения надо смотреть на мою книгу, а не считать ее готовым учебным планом; разработку последнего я всецело представляю тем, кто работает в школе».

Остановимся кратко на содержании первого тома. Первая его часть представляет собой обзор современной теоретической арифметики. Кроме раздела 3 главы IV («Умножение кватернионов и преобразование поворотного растяжения в пространстве»), здесь все очень доступно и может в такой же мере служить введением в теоретическую арифметику, как и дополнением к ней.

*) Книга имеется в русском переводе, хотя и является библиографической редкостью: Вебер Г., Вельштейн И. Энциклопедия элементарной математики/Под ред. В. Ф. Кагана. — Одесса: Матезис, 1912.

Читатель должен только помнить, что доказательства нигде не доводятся до конца, автор лишь выясняет их ведущие идеи.

Перейдем, далее, ко второй части первого тома, к «Алгебре». Из обилия тем, которые предоставляет алгебра для беседы с будущими учителями, Клейн выбрал вопросы, связанные с решением уравнений. Здесь, прежде всего, изложены интересные графические приемы нахождения действительных корней уравнений с параметрами. Материал этот близок к школьному преподаванию, представляет интерес для учителя и может быть использован в кружковой работе со школьниками. В полной мере к освещению проблем элементарной математики с точки зрения математики современной относится обсуждение вопросов, связанных с комплексными числами, основной теоремой алгебры, двучленными уравнениями, неразрешимостью задачи трисекции угла в общем виде. Вместе с тем заключительные разделы «Алгебры» излагают вопросы, составлявшие главным образом предметы собственных работ Клейна. Эти идеи находят замечательное осуществление в вопросах о том, как слить различные отделы математики в одно целое и как геометрические представления помогают уяснить аналитические теории. Но хотя в ряде мест Клейн возвращается к школьным проблемам и дает крупицы ярких и интересных мыслей о преподавании (например, в связи с решением кубических уравнений), в целом эти идеи стоят далеко от школы, и изучение их вряд ли может принести существенную пользу будущему преподавателю. Однако для студентов и математиков, которые интересуются алгеброй, эти главы представляют глубочайший интерес. Впрочем, сама идея этих исследований Клейна очень близка к вопросам элементарной математики. В общих чертах она сводится к следующему С давних времен были указаны методы вычисления корней двучленных уравнений вида хп = а. Пожалуй, именно в связи с этим извлечение корня было отнесено к числу операций, которые должны считаться хорошо известными и изученными. Классическая постановка задачи об алгебраическом решении уравнений в том именно и заключалась, чтобы свести решение всякого уравнения к решению «основных», т. е. двучленных уравнений. Как известно, это удалось для уравнений второй, третьей и четвертой степеней. Относительно же уравнений более высоких степеней было обнаружено, что их решение, вообще говоря, не может быть сведено к извлечению корней, т. е. решению двучленных уравнений. Подобно тому как были изучены двучленные уравнения, можно искать новые типы «основных» уравнений, изучить, определяемую этими уравнениями функциональную зависимость и попытаться свести дальнейшие группы уравнений к этим новым основным типам. К такому направлению относится известное исследование Клейна об икосаэдре, общие результаты которого и приведены в главе II «Алгебры». Руководящей нитью здесь служило изображение функциональной зависимости, определяемой «основным» уравнением, на римановой поверхности. Эта зависимость в случае двучленных уравнений приводит к уравнению диэдра. Дальнейшее развитие идеи, которое читатель найдет в тексте, приводит к уравнениям многогранников. Клейн указывает категорию уравнений, которые приводятся к этим типам. И хотя эти исследования, глубокие по идее и талантливые по исполнению, носят все же специальный характер, но замысел их (изложенный в виде резюме на последних двух страницах «Ал-

гебры») очень интересен и дает повод к раздумьям и более глубокому осмыслению математики.

Третья часть первого тома, посвященная анализу, написана (за небольшими исключениями) в высшей степени доступно. Так же как первую часть и начало второй части, ее можно рекомендовать всем изучающим математику. Более того, именно эта часть дает преподавателю богатый иллюстративный, методический и исторический материал как в отношении функционального мышления, так и по вопросу о началах анализа в школе (не только средней). Как и книга в целом, эта часть написана неравномерно. Наряду с очень интересными идеями, связанными с изучением элементарных трансцендентных функций, с основными идеями математического анализа и их историей, здесь есть и более специальные вопросы (сферическая тригонометрия, ряды Фурье и другие «нешкольные» темы). Много идей как бы брошено вскользь и не развито подробно. Поэтому в этой книге, предназначенной по замыслу Клейна для учителя, мы в предлагаемом издании добавили, с целью разъяснения, ряд сносок (иногда учитывающих сегодняшний уровень науки). Некоторые методологические положения Клейна покажутся советскому читателю, грамотному в идеологическом отношении, несколько наивными. Однако это не снижает большого интереса и значения труда Клейна. Книга математически и методически значительна, в высшей степени привлекательна, полезна. Она написана большим ученым, выдающимся популяризатором, педагогом, мастером слова.

Обратимся теперь к содержанию второго тома, посвященного геометрии. Эта книга необычно интересна и оригинальна — и не только потому, что в ней автор эрлангенской программы и группового подхода к построению и осмыслению геометрии излагает свои мысли и взгляды на этот предмет. Изложение второго тома особенно интересно еще и тем, что Клейн здесь с самого начала становится на путь аналитического осмысления идей и понятий геометрии. Теория инвариантов — тот геометрический компас, который хочет дать Клейн в руки читателя. И именно с помощью этого компаса он осуществляет ориентировку в том объеме геометрических сведений, который необходим учителю для глубокого понимания предмета: измерение геометрических величин, векторы, преобразование координат, движения и другие геометрические преобразования (в частности, проективные), эрлангенская программа, основания геометрии.

Клейну принадлежит принципиальная оценка того вклада в геометрию, который содержится в работе замечательного геометра Грассмана, появившейся в середине прошлого столетия, но далеко не сразу замеченной математиками. Именно от Грассмана идет идея многомерного пространства и идея векторного осмысления геометрии, завершившаяся (уже после выхода книги Клейна) появлением вейлевской аксиоматизации геометрии. И первую часть своих геометрических лекций, озаглавленную «Простейшие геометрические образы», Клейн изящно излагает, выводя все первоначальные геометрические идеи из грассманова принципа определителей, который Клейн считает «целесообразным путеводителем среди множества основных геометрических образов» и источником «большого круга идей, который охватывает всю геометрическую систематику». Клейн как бы подчеркивает этим, что в значительной степени из идей Грассмана он исходил в предложенной

им систематике геометрии, т. е. в эрлангенской программе.

Вторая часть геометрического тома посвящена геометрическим преобразованиям. Клейн с удивительным мастерством ученого и популяризатора охватывает евклидову, аффинную, проективную геометрии и касается таких вопросов, казалось бы, далеких от основной темы, как меркаторская карта мира, теория зубчатых колес и т. п.

Третья часть геометрического тома посвящена систематике геометрии, т. е. эрлангенской программе. Изложение Клейна, как и во всей книге в целом, подчеркнуто аналитическое. Это не значит, что Клейн настаивает на исключительно аналитическом изложении геометрии в школе. Клейн подчеркивает, что речь идет о создании у учителя целостного понимания геометрии, тогда как школьное преподавание должно быть генетическим, наглядным и — до определенного места — синтетическим. Заканчивается третья часть интересным обзором, посвященным основаниям геометрии. Здесь читатель найдет оригинальный критический разбор «Начал» Евклида, построение системы аксиом геометрии с помощью движений, идеи неевклидовой геометрии.

Последняя часть книги связана с вопросами преподавания геометрии. Хотя Клейн освещает состояние преподавания геометрии в разных странах в начале нашего столетия, но на этом фоне он излагает свои мысли о преподавании, имеющие большой интерес и сохраняющие значение сегодня.

В заключение отметим, что, сохранив в целом содержание книги Клейна, мы все же произвели некоторые купюры в тексте сочинения. Исключены дополнения «Развитие реформы преподавания математики в Германии», «Дополнительные сведения о математической и дидактической литературе», а также дополнения ко второму тому (все они написаны не самим Клейном, а его сотрудником Ф. Зейфартом).

Далее, в разделе «Арифметика» выпущен текст «Описание счетной машины Brunsviga», в котором автор описывает арифмометр с вращающейся ручкой и перемещающейся кареткой. В условиях широкого внедрения информатики и быстрой компьютеризации рассказ о «современной вычислительной технике» в виде арифмометра малоинтересен.

В предлагаемом издании книги значительно сокращены ссылки на статьи и учебники (на немецком языке), выпущенные в конце прошлого и начале нынешнего столетий. В некоторых случаях добавлены ссылки на современную математическую и методическую литературу на русском языке.

В остальном текст книги Клейна сохранен без изменений (если не считать некоторого редактирования перевода, который в предыдущем издании книги местами оставлял желать лучшего). Отметим, что правильным переводом заглавия книги было бы «Элементарная математика с высшей точки зрения»; однако мы сохранили прежнее заглавие, поскольку именно под этим названием книга Клейна приобрела столь заслуженный интерес и признание.

В. Г. Болтянский

ВВЕДЕНИЕ

В последние годы в среде университетских преподавателей математики и естествознания стал обнаруживаться интерес к вопросу о целесообразной, соответствующей всем потребностям, подготовке кандидатов на учительские должности. Это явление замечается сравнительно недавно. До того в течение долгого периода в университетах культивировалась исключительно высокая наука без внимания к тому, что, собственно, нужно школе; об установлении связи между университетским преподаванием и школьной математикой никто не заботился. Но к каким последствиям привела такая практика? Вступая в высшую школу, молодой студент оказывается лицом к лицу с такими задачами, которые совершенно не напоминают ему того, чем он до сих пор занимался; естественно, что все это он быстро и основательно забывает. Когда же он заканчивает университетское образование и становится преподавателем, он вынужден в качестве учителя преподавать традиционную математику; не будучи в состоянии самостоятельно связать эту задачу с тем, что он слышал в высшей школе, он быстро усваивает старую традицию; университетское же образование остается у него только в виде приятного воспоминания, не оказывающего никакого влияния на его преподавание.

В настоящее время возникло стремление уничтожить этот двойной разрыв, который, несомненно, был одинаково вреден как для средней, так и для высшей школы. Именно, мы стараемся, с одной стороны, провести через весь материал школьного обучения те идеи, которые отвечают современному развитию науки и общей культуры (к этому мы еще неоднократно будем возвращаться); с другой стороны, мы стараемся в университетском преподавании принять во внимание

нужды учителей. В этом именно деле очень полезным средством представляются мне научные обзоры, к одному из которых мы нынче приступаем. Я имею, следовательно, перед собой не начинающих; напротив, я считаю, что всем вам общий материал важнейших математических дисциплин хорошо знаком. Мне придется неоднократно говорить о задачах алгебры, теории чисел, теории функций, не входя в детали. Вы должны быть со всеми этими вещами до некоторой степени знакомы. Моя задача будет постоянно заключаться в том, чтобы выдвигать взаимную связь между вопросами отдельных дисциплин (которая часто скрадывается в специальных курсах), чтобы указывать их отношение к вопросам школьной математики. Я полагаю, что этим путем мне удастся облегчить вам достижение цели, которую вы должны иметь в виду при изучении математики в высшей школе: позже, в вашем собственном преподавании, сохранить живую связь с той наукой, которая вам здесь преподносится в изобилии.

Позвольте прежде всего упомянуть о том интересе, который вызывает в последнее время в широких кругах вопрос о подготовке учителей. В частности, эти вопросы очень занимали последний съезд естествоиспытателей в Дрездене, состоявшийся в сентябре 1907 г., на котором мы, согласно представлению педагогической комиссии, приняли «предложения относительно научной подготовки преподавателей математики и естествознания».

В качестве введения в настоящий курс я хочу обратить ваше внимание на то, что три года назад я читал лекции, преследовавшие такую же цель, как и настоящий курс. Мой тогдашний ассистент Р. Шиммак обработал эти лекции, и первая часть их недавно появилась в печати. В них идет речь о различного рода школах, включая и высшие, об общем ходе преподавания и о взаимной связи между этими школами. Здесь, как бы в виде продолжения того же изложения, я буду останавливаться на том, что относится собственно к математике и что имеет то или иное отношение к преподаванию. Часто касаясь преподавательской практики, я основываюсь при этом не на одних только расплывчатых соображениях о том, как это дело могло бы обстоять, или же на собственных

старых школьных воспоминаниях; напротив, я нахожусь в постоянном общении с Шиммаком, который в настоящее время преподает здесь в одной гимназии и постоянно осведомляет меня о настоящем положении преподавания, несомненно ушедшем далеко вперед по сравнению с прошлым. В настоящем семестре я намерен изложить «три великие А»: арифметику, алгебру и анализ; продолжение же этого курса в следующем семестре будет посвящено геометрии. Замечу кстати, что в высших учебных заведениях эти три отдела нередко именуются общим названием арифметики; да и вообще мы не раз встретимся с отклонением терминологии, принятой в школе, от той, которая царит в высшем учебном заведении. Только живое общение, как вы видите на этом незначительном простом примере, может привести к взаимному пониманию.

Обращу ваше внимание на обширное сочинение, которое, в общем, преследует те же цели, какие имею и я в виду; это — «Энциклопедия элементарной математики» Вебера и Вельштейна. Укажу сейчас же на некоторое различие между этим сочинением и планом настоящего курса. У Вебера и Вельштейна элементарная математика систематически и логически развивается на зрелом математическом языке, доступном студенту, далеко подвинувшемуся в своих занятиях. О том, в каком собственно виде этот материал должен фигурировать в школе, здесь вовсе нет речи. Между тем изложение в школе, выражаясь образно, должно быть психологическим, а не систематическим. Учитель должен быть, так сказать, дипломатом; он должен учитывать душевные движения юноши, должен уметь возбудить его интерес, а это будет ему удаваться только в том случае, если он будет излагать вещи в наглядной, доступной форме. Лишь в старших классах возможно также и более абстрактное изложение.

Приведем пример. Ребенок никогда не поймет излагаемый материал, если мы будем вводить числа аксиоматически, как объекты, не имеющие никакого реального содержания, над которыми мы оперируем по формальным правилам, установленным принятыми нами соглашениями. Напротив, он соединяет с числами реальное представление; они являются для него

не чем иным, как количествами орехов, яблок и тому подобных хороших вещей; только в такой форме эти вещи можно передавать в начальном обучении, только в этой форме их и будут в действительности передавать детям. Но и вообще, во всем ходе обучения математике, даже в высшей школе, необходимо всегда указывать на связь между этой наукой и теми интересами, которые занимают учащегося в повседневной жизни*). Это именно имеют в виду новые тенденции, стремящиеся поднять прикладную математику в университете. Впрочем, в школе этим требованием никогда не пренебрегали в такой мере, как в университете. Эти психологические моменты я и намерен подчеркнуть в своих лекциях.

Другое различие между книгой Вебера и Вельштейна и моей точкой зрения заключается в разграничении материала школьной математики. В этом отношении Вебер и Вельштейн настроены «консервативно», я же «прогрессивно». Мы, которых называют теперь реформаторами, стремимся положить в основу преподавания понятие функции, ибо это есть то понятие, которое в течение последних 200 лет заняло центральное место всюду, где только мы встречаем математическую мысль. Это понятие мы желаем выработать при преподавании столь рано, как это только возможно, постоянно применяя графический метод изображения каждого закона в системе координат (х, у), которая теперь употребляется при всяком практическом применении математики. Чтобы сделать возможным это нововведение, мы готовы отказаться от многих частей материала, входящего в состав действующих программ; эти вопросы, несомненно, интересны сами по себе, но по общему своему значению и по связи со всей современной культурой они представляются менее существенными. Развитие пространственных представлений должно при этом играть пер-

*) С методологической точки зрения особенно важно подчеркивать эту связь для формирования диалектико-материалистического мировоззрения школьников и студентов. Существенно также акцентировать внимание на том, что понятия математики возникли в результате практической деятельности людей как отражение действительных отношений между реальными объектами и как необходимый язык и аппарат для развития техники и естествознания.

венствующую роль. Обучение в школе должно проникнуть вверх, в область начал исчисления бесконечно малых в такой мере, чтобы молодой человек выходил уже из средней школы во всеоружии того математического материала, без которого будущий естествоиспытатель или страховой деятель совершенно не в состоянии обойтись. В противоположность этим сравнительно современным идеям, Вебер и Вельштейн по существу держатся старого разграничения материала. В настоящих лекциях я имею, конечно, целью пропагандировать те идеи, которых я придерживаюсь*).

*) В следующем абзаце, который мы не приводим, автор высказывает замечания по поводу книги М. Симона, выпущенной в 1908 г. в Мюнхене.

АРИФМЕТИКА

I. ДЕЙСТВИЯ НАД НАТУРАЛЬНЫМИ ЧИСЛАМИ

Естественно, что мы начнем прежде всего с основного вопроса всей арифметики, т. е. с действий над целыми положительными числами. Здесь, как и во всем своем изложении, я намерен прежде всего поставить вопрос о том, как этот предмет трактуется в школе, а затем уже займусь исследованием того, что он, собственно, в себе содержит с более глубокой точки зрения.

1. Введение чисел в школе

Я ограничусь здесь краткими указаниями, так как вы, несомненно, еще помните, как вы сами учились этим вещам в школе. Я, конечно, отнюдь не имею в виду действительно ввести вас в практику школьного обучения, как это делается на семинарских занятиях в средних учебных заведениях. Я только приведу материал, который поможет нам ориентироваться в наших критических рассуждениях.

Ознакомить детей с учением о целых числах, приспособляясь к их пониманию, научить их действиям над ними так, чтобы они этим предметом вполне овладели, в высшей степени трудно и требует многолетних усилий, начиная с первого года обучения вплоть до третьего класса гимназии. Тот способ изложения, который в настоящее время господствует почти во всех наших школах, можно лучше всего характеризовать словами «наглядно» и «генетически». Это значит, что весь материал развивается постепенно на почве хорошо известных, наглядных представлений. В этом заключается коренное отличие от логического и систематического метода обучения, который практикуется в высшей школе. Весь материал расчленяется приблизительно следующим образом (в точности,

конечно, этого указать невозможно). Весь первый год обучения посвящается счету в пределах первых двух десятков, а примерно первое полугодие — даже счету в пределах одного десятка. Числа вводятся как числовые образы, составленные из точек, или как количества всевозможных доступных детям предметов. Сложение и умножение объясняются детям и усваиваются ими на наглядных представлениях. На второй ступени разрабатывается числовая область от единицы до ста; в этот период обучения, а зачастую еще и раньше вводятся арабские цифры, выясняется значение места, занимаемого цифрой в числе, и вообще вводится десятичная система. Хочу здесь попутно указать, что установившееся название «арабские цифры», как и многое в обычной терминологии, исторически неправильно. Эта система счисления в действительности ведет начало от индусов, а не от арабов1).

Следующая важная задача, относящаяся к этой ступени обучения, есть разучивание таблицы умножения. Сколько составит 5X3 или 3X8, нужно всегда помнить наизусть, а поэтому и заставляют детей выучить табличку наизусть, пояснив им ее предварительно на наглядных примерах. Для этого служит главным образом «счетная машина», обычно называемая счетами. Она состоит из десяти параллельно укрепленных проволок, по которым свободно передвигаются по десяти шариков на каждой. Передвигая надлежащим образом шарики, мы можем прочесть на счетах результат умножения, написанный уже в десятичной форме.

Третий год обучения посвящается действиям над многозначными числами по известным простым правилам, справедливость которых детям обыкновенно ясна, или, по крайней мере, должна была бы быть ясна. Правда, этой ясности еще обыкновенно недостаточно для того, чтобы ученик вполне усвоил правило, и учитель нередко прибегает к очень действенному средству: «если ты этого не будешь знать, то тебе придется плохо!».

Я хочу здесь подчеркнуть еще одну сторону всего этого обучения, ибо этой стороной дела обыкновенно пренебрегают в высшей школе; именно, с самого начала уделяется особенное внимание приложениям счета к потребностям практической жизни. Числа с

самого начала вводятся на конкретных примерах практической жизни; ученик очень скоро начинает считать монетами, мерами, весами, и вопросом «Сколько стоит?», столь важным в повседневной жизни, начинается обыкновенно немалая часть наших школьных задач. Отсюда преподаватель постепенно восходит к таким задачам (к так называемым «скрытым» задачам), в которых ход вычисления предполагает уже некоторое самостоятельное рассуждение; это приводит к задачам на пропорциональное деление, смешение. К словам «наглядно» и «генетически», которыми мы старались охарактеризовать школьное обучение, в качестве третьей характеристики мы могли бы присоединить «практические приложения».

Если бы мы, наконец, еще хотели охарактеризовать в немногих словах и цель обучения арифметике, то мы должны были бы сказать следующее: она заключается в том, чтобы приучить детей уверенно владеть арифметическими действиями, пользуясь при этом различными параллельно развивающимися психологическими соображениями, к которым приходится апеллировать, не настаивая глубоко на логичной концепции, связывающей этот материал.

Упомяну здесь кстати о некоторой вражде, играющей для школы нередко фатальную роль, — именно, о вражде между преподавателями, получившими образование в учительских семинариях, и преподавателями, вышедшими из высших учебных заведений2). Начиная с третьего класса, на место преподавателя, получившего образование в семинарии, вступает лицо с высшим образованием. Вследствие этого в ходе обучения часто происходит разрыв, достойный всякого сожаления. Бедные дети часто бывают вынуждены внезапно оперировать совершенно другими выражениями, нежели те, к которым они до того привыкли и над которыми теперь даже издеваются. Небольшим примером является, скажем, различие в знаках умножения: крест, который предпочитает учитель начальных классов, и точка, которой охотнее пользуются математики. Это враждебное отношение можно сгладить только в том случае, если преподаватели, приходящие из высшей школы, отнесутся с большим вниманием к своим коллегам из семинарии и будут стараться сойтись с ними. Это вам легко удастся вы-

полнить, если вы всегда будете помнить, с каким уважением вы должны относиться к народному учителю. Подумайте только, какую нужно выработать в себе методическую выдержку, чтобы постоянно обучать арифметике сотни тысяч неразумных мальчишек, не приносящих в школу никакой предварительной подготовки. Попытайтесь это сделать, и вы убедитесь, что вся ваша академическая подготовка принесет вам здесь мало пользы.

Однако после этого краткого отступления возвратимся к школьному преподаванию. В третьем и, в особенности, в четвертом3) классе обучение счету постепенно принимает уже благородное облачение математики, что характеризуется прежде всего переходом к буквенному исчислению. Буквами a, Ь, с или х, у, z обозначают какие-нибудь числа, хотя первоначально все же целые положительные; над этими числовыми значениями, изображаемыми буквами, производят действия, исходя из конкретного, наглядного содержания, которое присваивается числам. Это представляет уже существенный шаг вперед в переходе от конкретного к абстрактному; математика, собственно, и начинается с действий над буквами. Конечно, этот переход не должен совершаться в школе внезапно; напротив, нужно приучить юношу к абстракции постепенно.

Но уже здесь в деле обучения становится совершенно необходимым, чтобы сам преподаватель был хорошо знаком с логическими законами и основами счета и теории целых чисел, хотя бы ему, естественно, и не приходилось непосредственно сообщать их ученикам. Займемся поэтому теперь несколько подробнее основными законами счета.

2. Основные законы арифметических действий

В ходе исторического развития, конечно, долго складывали и умножали, не отдавая себе отчета в тех законах, которым подчиняются эти операции. Лишь в 20-х и 30-х годах предыдущего столетия главным образом французские и английские математики выяснили основные свойства этих операций. Кто хочет ознакомиться с историей этого вопроса подробнее, тому я могу рекомендовать здесь, как буду это делать

неоднократно ниже, большую «Энциклопедию математических наук»4).

Возвращаясь к нашей теме, я имею в виду теперь действительно перечислить те пять основных законов, к которым приводится сложение:

1) а + 6 всегда представляет собою число, иначе говоря, действие сложения всегда без всяких исключений выполнимо (в противоположность вычитанию, которое в области положительных чисел выполнимо не всегда);

2) сумма а + Ь всегда определена однозначно;

3) имеет место сочетательный, или ассоциативный закон: (а + b) + с = а + (Ь + с), так что скобки можно и вовсе опустить;

4) имеет место переместительный, или коммутативный закон: а + Ь = Ь + а;

5) имеет место закон монотонности: если Ь> с, то а + b > а + с.

Эти свойства понятны без дальнейших пояснений, если мы имеем перед глазами наглядное представление о числе как о количестве. Но они должны быть выражены строго формально, чтобы на них можно было опираться при дальнейшем строго логическом развитии теории.

Что касается умножения, то здесь действует, прежде всего, пять законов, аналогичных только что перечисленным:

1) а-Ь всегда есть число;

2) произведение а-Ь однозначно;

3) закон сочетательности:

а • (Ь • с) = (а • b) • с =а • b • с;

4) закон переместительности: а-Ь = Ь-а;

5) закон монотонности: если b > с, то а -Ь > а -с.

Наконец, связь сложения с умножением устанавливается шестым законом:

6) закон распределительности, или дистрибутивности:

а - (Ь + с) = а- Ь + а> с.

Легко уяснить, что все вычисления опираются исключительно на эти 11 законов. Я ограничусь простым примером, скажем, умножением числа 7 на 12;

согласно закону распределительности

7 . 12 = 7 • (10 + 2) = 70+ 14;

далее, если мы разобьем 14 на 10 + 4 (чтобы вывести «перенесение десятков»), то, опираясь на закон сочетательный, имеем

70 + ( 10 + 4) = (70 + 10) + 4 = 80 + 4 = 84.

В этом коротком рассуждении вы, конечно, узнаете отдельные шаги, которые мы производим при вычислениях в десятичной системе5). Предоставляю вам самим разобрать примеры посложнее. Мы здесь выскажем только сводный результат: наши цифровые вычисления заключаются в повторном применении перечисленных выше одиннадцати основных положений, а также в применении заученных наизусть6) результатов действий над однозначными числами (таблица сложения и таблица умножения).

Однако, где же находят себе применение законы монотонности? В обыкновенных, формальных вычислениях мы на них действительно не опираемся, но они оказываются необходимыми в задачах несколько иного рода. Напомню вам здесь о способе, который в десятичном счете называют оценкой величины произведения и частного. Это прием величайшей практической важности, который, к сожалению, в школе и среди студентов известен далеко еще не достаточно, хотя при случае о нем говорят уже во втором классе; я здесь ограничусь только примером. Допустим, нам нужно умножить 567 на 134, причем в этих числах цифры единиц установлены, — скажем, посредством физических измерений — лишь весьма неточно. В таком случае было бы совершенно бесполезно вычислять произведение с полною точностью, так как такое вычисление все равно не гарантирует нам точного значения интересующего нас числа. Но что нам действительно важно — это знать порядок величины произведения, т. е. определить, в пределах какого числа десятков или сотен число заключается. Но эту оценку закон монотонности действительно дает вам непосредственно, ибо из него вытекает, что искомое число содержится между 560-130 и 570-140. Дальнейшее развитие этих соображений я опять-таки предоставляю вам самим. Во всяком случае, вы видите,

что при «оценочных вычислениях» приходится постоянно пользоваться законами монотонности.

Что касается действительного применения всех этих вещей в школьном преподавании, то о систематическом изложении всех этих основных законов сложения и умножения не может быть и речи. Учитель может остановиться только на законах сочетательном, переместительном и распределительном, и то только при переходе к буквенным вычислениям, эвристически выводя их из простых и ясных численных примеров.

3. Логические основы теории целых чисел

Если в деле школьного преподавания мы, естественно, не можем дойти до постановки тонких и трудных вопросов, то в современном математическом исследовании серьезные вопросы здесь, собственно, и возникают: как обосновать эти законы, как обосновать понятие числа? Здесь я намерен ориентировать вас в этом вопросе, оставаясь верным цели настоящего сочинения — осветить материал школьного преподавания с высшей точки зрения, и я делаю это тем охотнее, что эти современные идеи и помимо того проникают к вам со всех сторон в течение ваших академических занятий, между тем как психологическая сторона этого дела обычно не оговаривается в той мере, в какой это необходимо.

Что касается, прежде всего, самого понятия числа, то корни его в высшей степени трудно вскрыть. Легче всего дышится, быть может, тогда, когда решаешься вовсе оставить в стороне эти трудные вещи. За более подробными указаниями относительно этих вопросов, очень усердно обсуждаемых философами, вы вновь должны обратиться к соответствующей статье «Энциклопедии математических наук»7); здесь же я ограничусь немногими замечаниями. Очень распространена точка зрения, что понятие числа тесно связано с понятием последовательности во времени. Из представителей этого воззрения назову из философов Канта, из математиков Гамильтона. Другие, напротив, полагают, что понятие числа стоит ближе к пространственным представлениям, они сводят понятие числа к одновременному созерцанию различных пред-

метов, находящихся в пространстве друг подле друга. Наконец, третье направление усматривает в представлении о числе выражение особой способности нашего духа, независимо стоящей рядом с нашими гредставлениями о пространстве и времени, а может быть, и выше их. Я полагаю, что эта точка зрения хорошо выражается цитатой из «Фауста»*), которую Г. Минковский приводит относительно чисел в сообщении о новом его сочинении «Диофантовы приближения».

Если в этой задаче мы имеем дело более с вопросами теории познания и психологии, то в проблеме об обосновании наших одиннадцати законов мы стоим существенно перед вопросом логики.

Мы здесь будем различать четыре точки зрения.

1. Первая точка зрения, представителем которой я могу назвать Канта, смотрит на правила действий как на непосредственный результат созерцания (Anschauung), причем это слово в наиболее широком его значении нужно понимать как «внутреннее созерцание» или интуицию. Впрочем, этот взгляд отнюдь не сводится к тому, что вся математика опирается на экспериментально контролируемые факты грубого внешнего опыта. Приведем простой пример. Закон переместительный доказывается ссылкой на приведенную здесь фигуру (рис. 1), в которой соединены две строки по три точки в каждой, причем мы видим, что совокупность их распадается также на три столбца но две точки в каждой: 2-3 = 3-2. Если на это, однако, возражают, что при сколько-нибудь значительных числах это непосредственное созерцание уже не приводит к сознанию справедливости высказанной истины, то приходится прибегнуть к закону совершенной индукции: если некоторое предложение справедливо для небольших чисел и если сверх того оно остается справедливым для числа п + 1 всякий раз, как оно справедливо для числа п, то оно справедливо вообще для всякого числа. Это предложение, имеющее, по моему мнению, интуитивное происхождение, действительно всегда помогает нам выйти за те

Рис 1

*) «Там царят в уединении богини, не ведающие ни пространства, ни времени».

пределы, в которые нас необходимо ставит конкретное созерцание. На этой приблизительно точке зрения стоит также и Пуанкаре в своих известных философских сочинениях.

Если мы хотим уяснить себе значение этого вопроса об обосновании одиннадцати основных законов счета, то мы должны принять в соображение, что совместно с арифметикой на них в конечном счете покоится и вся математика. Мы не впадем поэтому в преувеличение, если скажем, что, согласно выясненной сейчас точке зрения, достоверность всего здания математики в конечном счете опирается на созерцание (интуицию) в самом обычном смысле этого слова.

2. Во вторую очередь мы приведем некоторую модификацию первой точки зрения. Она заключается в том, что пытаются расчленить эти основные законы на значительно более мелкие ступени, так что на непосредственном созерцании приходится основывать лишь немногие простейшие случаи, из которых можно вывести остальные уже чисто логически, не прибегая вновь к созерцанию. В то время как обычно чисто логические операции применяются лишь после установления названных одиннадцати законов, здесь сказывается возможным воспользоваться ими раньше, именно после введения упомянутых более простых предложений. Граница, отделяющая созерцание от логики, отодвигается, и притом в пользу последней. Эту точку зрения впервые провел Герман Грассман в своем «Учебнике арифметики», выпущенном в 1861 г. В качестве примера я укажу, что закон переместительности с помощью совершенной индукции может быть выведен из закона сочетательности.

После книги Грассмана следует указать сочинение итальянского ученого Пеано «Начала арифметики, изложенные новым методом», Турин, 1889. Она написана на собственном символическом языке автора, который имеет целью выделить каждый шаг логического доказательства. Пеано имеет в виду таким образом достигнуть гарантий, что он действительно опирается исключительно на те положения, которые он предварительно принял, и не пользуется никаким другим интуитивным материалом. Он хочет избежать опасности, которую необходимо вносит обыкновенный язык своими бесконтрольными ассо-

ниациями идей и воспоминаниями о наглядных образах. Должен сказать вам к тому же, что Пеано является главой целой школы, очень обширной в Италии, которая таким же образом расчленяет предпосылки каждой отдельной математической дисциплины и старается посредством идеографии (писания понятиями) исследовать ее логические концепции8).

3. Мы переходим теперь к современному развитию этих идей, которое, впрочем, оказало уже свое влияние и на Пеано. Я имею в виду ту трактовку учения о числе, которая кладет в основу понятие совокупности, или множества. Вы составите себе представление о широком объеме этого понятия, если я скажу вам, что совокупность всех целых чисел, с одной стороны, и совокупность всех точек отрезка, с другой стороны, представляют собой частные примеры множеств. Общую идею о множестве впервые сделал предметом систематического математического исследования Георг Кантор (G. Kantor), профессор в Галле; созданное им учение о совокупностях, или множествах, в настоящее время весьма заинтересовало молодое поколение математиков. Позже я еще попытаюсь дать вам возможность заглянуть в эту теорию; здесь же я ограничусь следующей краткой характеристикой этой новой системы арифметики: эта система старается свести свойства целых чисел и относящихся к ним операций к общим свойствам множеств и связанных с ними абстрактных соотношений; этим имеется в виду достигнуть возможно более глубокого и общего обоснования теории целых чисел. В качестве пионера этого направления я должен указать еще Р. Дедекинда (R. Dedekind), который в своей небольшой, но весьма содержательной книжке «Что такое числа и каково их значение?»9) впервые дал такое обоснование учения о целых числах. К этой точке зрения по существу примыкает и Г. Вебер в первой главе первого тома «Энциклопедии элементарной математики». Однако оказывается, что развитие теории становится при этом настолько отвлеченным и мало доступным, что в приложении к третьему тому того же сочинения автор был вынужден дать более элементарное изложение того же предмета, оперирующее исключительно с конечными множествами.

4. Наконец, в заключение, я хочу привести чисто формальную теорию числа, которая восходит еще к Лейбницу и которая в последнее время особенно выдвинута Гильбертом. К арифметике относится в этом смысле его доклад на III Международном математическом конгрессе в Гейдельберге «Об основах логики и арифметики»10). Исходная точка здесь заключается в следующем. Если мы уже располагаем одиннадцатью законами счета, то мы можем вести счет в буквах а, 6, с, выражающих любые числа, совершенно не считаясь с тем значением, которое таковые имеют как числа. Или яснее: пусть а, Ь, с, ... будут вещи без всякого значения, вернее, вещи, о значении которых нам ничего не известно. Положим также, что нам все же известно, что над ними можно производить операции согласно перечисленным одиннадцати основным положениям, хотя бы эти операции не имели какого-либо известного нам содержания; тогда мы можем оперировать с этими объектами совершенно так же, как и с обыкновенными числами, но при этом возникает только вопрос, не могут ли эти операции когда-либо привести к противоречию. Если обыкновенно говорят, что опыт обнаруживает существование чисел, для которых перечисленные правила имеют место, и что в этих правилах, следовательно, нет противоречия, то теперь, когда мы отказываемся от реального значения этих символов, такого рода ссылка на наглядное представление уже недопустима. Вместе с тем возникает совершенно новая задача — доказать чисто логически, что при любых операциях над нашими символами, согласно перечисленным одиннадцати основным законам, мы никогда не придем к противоречию, т. е. упомянутые одиннадцать законов логически совместны. Если мы вначале, при изложении первой точки зрения, сказали, что достоверность математики покоится на существовании наглядных объектов, для которых имеют место ее законы, то представитель настоящей формальной точки зрения усматривает достоверность математики в том, что основные ее законы с чисто формальной точки зрения, независимо от их наглядного содержания, представляют логически цельную систему, не содержащую противоречия.

Для выяснения и оценки этой новой точки зрения я должен сделать еще несколько замечаний.

a) Гильберт формулировал эти идеи по отношению к арифметике и начал их разрабатывать, но он отнюдь не дал полного развития их. После упомянутого доклада он еще раз возвратился к этому предмету в одной лекции, но больше этими вопросами не занимался. Мы можем, следовательно, сказать, что здесь мы имеем перед собой только программу.

b) Попытка совершенно изгнать созерцание и удержать только логическое исследование представляется мне в полной мере неосуществимой. Некоторый остаток, некоторый минимум интуиции всегда должен сохраниться, и эти остаточные интуитивные представления мы необходимо должны соединять с символами, с которыми оперируем, даже уже потому, что мы должны эти символы постоянно вновь узнавать, хотя бы этот остаток и сводился только к внешнему виду наших символов.

c) Но примем даже, что поставленная задача действительно безупречно разрешена, что обнаружено чисто логически отсутствие противоречия в наших одиннадцати основных положениях. Но тогда все еще остается место возражению, которому я придаю наибольшее значение. Нужно себе уяснить, что эти соображения, собственно, обоснования арифметики еще отнюдь не дают и что в этом порядке идей его и нельзя провести. Именно, совершенно невозможно чисто логическим путем показать, что законы, в которых мы обнаружили отсутствие логического противоречия, действительно имеют силу по отношению к числам, столь хорошо нам известным эмпирически, что неопределенные объекты, о которых здесь идет речь, могут быть отождествлены с реальными числами, а выкладки, которые мы над ними производим, — с реальными эмпирическими процессами. Что здесь действительно достигается — это только расчленение обширной задачи обоснования арифметики, мало доступной по своей сложности, на две части; первая часть представляет собой чисто логическую проблему установления независимых друг от друга основных положений, или аксиом, и доказательства их независимости и отсутствия противоречия. Вторая часть задачи относится, скорее, к теории познания и в

известной мере выражает применение названных логических исследований к реальным соотношениям; никаких попыток приступить к разработке этой второй задачи, строго говоря, еще не было, хотя для действительного обоснования арифметики и она необходимо должна быть исчерпана. Эта вторая часть вопроса представляет крайне глубокую задачу, трудность которой коренится в общих проблемах теории познания. Быть может, я выражу наиболее ясно постановку этого вопроса, если выскажу несколько парадоксальное утверждение, что всякий, кто признает чистой математикой только чисто логическое исследование, необходимо вынужден будет отнести вторую часть проблемы обоснования арифметики, а вместе с этим, стало быть, и саму арифметику, к прикладной математике.

Я считаю необходимым отчетливо все это здесь указать, так как в этом именно пункте наиболее часто возникают недоразумения вследствие того, что многие просто не замечают существования этой второй задачи. Гильберт сам отнюдь не стоит на этой точке зрения, и мы не можем высказать ни одобрений, ни возражений его теории, которые исходят из такого именно допущения. Томе, профессор в Вене, остроумно назвал людей, стоящих на почве этих чисто абстрактно-логических исследований о вещах, ничего не обозначающих, и о предложениях, ничего не выражающих, которые, таким образом, не только забывают эту вторую проблему, но и всю остальную математику, — мыслителями без мысли11); конечно, это ироническое замечание не может относиться к лицам, занимающимся этого рода исследованиями попутно, рядом с многочисленными другими вопросами.

В связи с этими рассуждениями об основах арифметики, обзор которых я вам изложил, я хочу представить вашему вниманию еще некоторые соображения общего характера. Многократно высказывалось мнение, что обучение математике можно и даже необходимо вести строго дедуктивно, полагая в основу целый ряд аксиом и развивая из него все остальное строго логически. Этот прием, который так охотно поддерживают историческим авторитетом Евклида, однако, отнюдь не соответствует историческому ходу развития математики. Напротив, в действительности

математика развивалась подобно дереву, которое не разрастается путем тончайших разветвлений, идущих от корней, а разбрасывает свои ветви и листья вширь и вверх, распространяя их зачастую вниз, к корням. Совершенно так же и математика, оставляя образное выражение, начала свое развитие с определенного пункта, соответствующего, скажем, здравому человеческому смыслу, и по мере того как мы восходили к новым и новым научным достижениям, мы одновременно опускались также и вниз к исследованию оснований науки. Так, например, мы стоим теперь относительно оснований на совершенно другой точке зрения, чем та, которой придерживались исследователи несколько десятков лет тому назад; точно так же то, что мы выдаем за последние принципы, через короткое время сделается пережитком, так как последние истины будут все глубже и детальнее расчленяться и приводиться к более общим положениям. В основных исследованиях в области математики не может быть окончательного завершения, а вместе с тем и окончательно установленного первого начала, которое могло бы служить абсолютной исходной точкой для преподавания.

Я хотел бы сделать еще одно замечание, касающееся отношения между логической и интуитивной математикой, между чистой и прикладной математикой. Я имел уже случай упомянуть, что в школе приложение с самого начала сопровождает обучение арифметике, что ученик не только должен понимать правила, но должен также учиться делать из них то или иное употребление. Так оно нормально должно было оставаться и всюду, где идут занятия математикой. Чисто логические концепции должны составить, так сказать, жесткий скелет организма математики, сообщающий ей устойчивость и достоверность. Но сама жизнь математики, важнейшие ее линия развития и продуктивность относятся преимущественно к ее приложениям, т. е. к взаимным отношениям ее абстрактных объектов со всеми другими областями. Изгнать приложение из математики — это то же, что искать живое существо с одной только костной основой без мускулов, нервов и сосудов.

В деле научного исследования будет, конечно, всегда оставаться разделение между чистой и

прикладной наукой, но, если только мы хотим сохранить разумное положение вещей, мы должны заботиться о непрерывной связи между этими сторонами дела; здесь же я хотел бы особенно подчеркнуть то, что в школе такого рода разделение, такого рода специализация отдельного учителя совершенно невозможны. Вообразите себе, например, — я несколько утрирую, чтобы ярче это выразить, — в какой-либо школе учителя, который трактует числа как символы, лишенные значения; другого, который умеет из этих ничего не означающих символов получить наглядные числа; наконец, третьего, четвертого, пятого, которые владеют приложениями этих символов в геометрии, механике, физике. Представьте себе, что в распоряжение всех этих различных учителей будут предоставлены ученики. Вы понимаете, что таким образом дело обучения не может быть организовано; этим путем предмет не может быть усвоен учениками, а различные учителя не смогут понимать друг друга. Потребности школьного преподавания, таким образом, предполагают известную разносторонность каждого учителя, уменье довольно широко ориентироваться в области чистой и прикладной математики в самом широком смысле этого слова; этим путем учитель должен всегда создавать коррекцию слишком мелкому расщеплению науки.

Я возвращусь здесь еще раз к упомянутым уже выше дрезденским предложениям, чтобы дать практическое направление всем последним замечаниям. В этих предложениях мы настаиваем на том, чтобы прикладная математика, которая с 1898 г. введена в испытание на звание учителя как особая специальность, была признана необходимой составной частью каждого нормального математического образования, чтобы, таким образом, удостоверение в праве преподавания чистой и прикладной математики выдавалось всегда совместно. Наконец, упомянем также, какие цели обучения математике в выпускном классе предусматривает педагогическая комиссия в так называемой меранской программе:

1) научный обзор систематического построения математики;

2) уменье грамотно справляться с численным и графическим решением отдельных задач;

3) некоторое знакомство со значением математической мысли в естествознании и современной культуре12).

Ко всем этим резолюциям я присоединяюсь с глубочайшим убеждением в их правильности.

4. Практика счета с целыми числами

После отвлеченных рассуждений, которыми я преимущественно занимался до сих пор, я обращусь к конкретным вещам, именно — исключительно к операциям, производимым над числами. Из литературы, дающей возможность ориентироваться в этом вопросе, я прежде всего отмечу опять-таки статью Р. Мемке по этому предмету в энциклопедии. Я лучше всего дам вам обзор относящихся сюда вопросов, если сначала изложу план этой статьи. Она распадается на две части, именно: А. Учение о точных вычислениях; В. Учение о приближенных вычислениях. К отделу А принадлежат все методы, облегчающие точные действия над большими числами, как, например, удобное расположение тех или иных схем в вычислении, таблицы произведений и квадратов, в особенности же счетные машины13). В отделе В, напротив, вы найдете разработку всех тех приемов, которые имеют в виду определить только порядок величины результата, т. е. установить первые значащие его цифры. Сюда относятся таблицы логарифмов и аналогичные средства вычисления, как, например, счетная линейка14).

Остановимся еще на минутку на общем значении того факта, что действительно существуют счетные машины, которые освобождают математика от чисто механических вычислений и которые выполняют их гораздо быстрее и более безошибочно, так как машина свободна от случайных ошибок, с которыми всегда может быть сопряжено беглое вычисление. Само существование такого рода машины может служить для нас подтверждением того, что для производства вычислений существенным является не значение целых чисел, а формальные правила, по которым они совершаются, ибо машина может следовать только этим правилам — так она устроена, — но наглядного представления о значении чисел она иметь не может.

Вряд ли можно считать случайным то, что такой человек, как Лейбниц, который был в такой же мере абстрактным мыслителем первого ранга, как и человеком выдающихся практических дарований, является одновременно как отцом чисто формальной математики, так и изобретателем первой счетной машины. Его машина еще по настоящее время представляет одно из наиболее ценных достояний музея Кестнера в Ганновере. Хотя это исторически и не удостоверено, но я склонен допустить, что Лейбниц имел в виду изобретением счетной машины не только достигнуть практических целей, но и ярко осветить строго формальный характер математических вычислений.

Само собою разумеется, однако, что Лейбниц отнюдь не был склонен изобретением счетной машины умалить значение математической мысли, а между тем такого рода выводы иногда приходится слышать. «Если, — говорят, — научная деятельность может осуществляться также машиной, то на эту науку, конечно, немного можно поставить, и роль ее неизбежно должна быть совершенно второстепенной». Однако на такого рода аргументацию достаточно возразить, что математик, когда он сам оперирует с числами и формулами, отнюдь не представляет собой только жалкой копии непогрешимой машины, что он ни в коем случае не является «мыслителем без мысли» по выражению Томе. Напротив, он сам себе ставит задачи, имеющие определенную и полезную цель, и разрешает их всякий раз новыми, своеобразными приемами. Он изобрел счетную машину только для того, чтобы освободить себя от некоторых операций, постоянно повторяющихся в однообразной последовательности, и что нужно менее всего забывать, математик ее изобрел и математик постоянно ставит ей на разрешение задачи15).

Позвольте мне закончить пожеланием, чтобы со счетной машиной ввиду большого значения, которое она приобретает, познакомились более широкие круги; в настоящее время ее, к сожалению, знают еще весьма немногие. Прежде всего же с нею должен, конечто, познакомиться учитель; я не могу не высказать пожелания, чтобы каждый ученик в старшем классе средней школы имел возможность хоть раз посмотреть эту машину16).

II. ПЕРВОЕ РАСШИРЕНИЕ ПОНЯТИЯ ЧИСЛА

Мы намерены теперь оставить целые числа и в настоящей главе перейти к расширению понятия числа. В школе этот процесс разделяют обыкновенно на следующие ступени:

1. Введение дробей и действия над ними.

2. Изложение теории отрицательных чисел в связи с началом буквенного исчисления.

3. Более или менее подробное развитие понятия иррационального числа на примерах из различных областей; вместе с этим постепенно формируется представление о совокупности всех действительных чисел.

Совершенно безразлично, начинать ли с пункта первого или со второго. Мы предпочитаем последнее17).

1. Отрицательные числа

Начнем с одного замечания, относящегося к терминологии. В школе положительные и отрицательные числа обыкновенно называют «относительными» числами в противоположность «абсолютным» (положительным); между тем в университете эта манера выражения не принята. В школе те же относительные числа называют также «алгебраическими» числами18)— термин, который в университете мы употребляем в совершенно ином смысле.

Что касается происхождения и введения отрицательных чисел, то относительно фактического материала я могу быть краток: этими вещами вы владеете свободно и, во всяком случае, по моим сведениям вы легко в них ориентируетесь10).

Ближайшим поводом для введения отрицательных чисел является, как известно, требование сделать вычитание операцией, выполнимой во всех случаях. Если а<&, то в области натуральных чисел разность а — b не имеет смысла. Существует, однако, число с — b — а\ мы полагаем

а — Ъ = — с,

и называем —с отрицательным числом. С этим связывают обыкновенно с самого начала интерпретацию целых чисел при помощи шкалы равноотстоящих

точек на прямой, простирающейся безгранично в обе стороны, или «числовой оси» (рис. 2). Этот образ можно считать в настоящее время достоянием всех образованных людей, и нужно полагать, что своим распространением он обязан главным образом известной всем термометрической шкале. Наглядный и хорошо известный образ отрицательных чисел представляет расчет прибылей и убытков.

Но мы здесь, прежде всего, точно выразим, в чем заключается, собственно, принципиальный и чрезвычайно трудный шаг, который связан с введением отрицательных чисел в школе.

Если ученик привык постоянно связывать с числами и затем с буквами, с которыми он оперирует, конкретные количества и при сложении их, а также при других действиях всегда имел перед глазами соответствующие операции, которые можно реально над этими количествами производить, то теперь дело совершенно меняется. Ему приходится иметь дело с чем-то новым, с «отрицательными числами», которые уже не имеют ничего общего с наглядным образом о количестве предметов; ему приходится производить над ними действия как над количествами, а между тем именно эти действия совсем уже не имеют для него прежнего ясного, наглядного значения20). Здесь приходится в первый раз делать переход от реальной математики к формальной, для полного уяснения которой нужно значительное развитие способности к абстракции.

Присмотримся, однако, подробнее, что происходит с арифметическими действиями после введения отрицательных чисел. Прежде всего, ясно, что сложение и вычитание по существу сливаются воедино. Прибавление положительного числа есть вычитание противоположного отрицательного числа. М. Симон делает по этому поводу остроумное замечание, что именно вследствие введения отрицательных чисел, благодаря которому вычитание становится действием, не имеющим исключения, оно перестает существовать

Рис. 2

как самостоятельная операция. Для этого обобщенного сложения, охватывающего также и вычитание, в области положительных и отрицательных чисел неизменно остаются в силе те же основные пять формальных законов: 1) постоянная выполнимость, 2) однозначность, 3) сочетательность, 4) переместительность и 5) монотонность. Относительно свойства 5) нужно заметить, что а < Ь теперь означает, выражаясь кратко, что при геометрическом изображении число а лежит влево от Ь, так что, например, —2 <—1, —3 < +2 и т. д.

При умножении важнейшим моментом является так называемое правило знаков, согласно которому а-(—с) = (—с)-а = — (а-с) и (—с) • (—с') = + сс'\ в особенности последнее (минус на минус дает плюс) часто представляет собой камень преткновения. К внутренней сущности этого правила нам придется еще вскоре возвратиться. Мы выразим его предварительно одним предложением, относящимся к произведению какого угодно количества положительных и отрицательных чисел: модуль произведения равен произведению модулей сомножителей, а по знаку произведение будет положительным или отрицательным в зависимости от того, входит ли в его состав четное или нечетное число отрицательных сомножителей. При таком определении умножения в области положительных и отрицательных чисел оно опять обладает следующими свойствами: 1) постоянная выполнимость, 2) однозначность, 3) сочетательность, 4) переместительность и 5) распределительность относительно сложения. Только в законе монотонности здесь оказывается отклонение. Его место теперь занимает следующий закон: если а> Ъ, то ас> be, ас = Ьс или ас <.Ьс в зависимости от того, будет ли с > 0, с = О или с < 0.

Спросим себя теперь, не заключают ли эти законы по чисто формальному своему содержанию логического противоречия. Мы должны в первую очередь сказать, что доказательство отсутствия противоречия, основанное на чисто логических соображениях, по настоящее время здесь удалось провести еще менее, чем для целых положительных чисел. Но вопрос удалось свести к тому, что названные законы заведомо не имеют противоречия, если они не содержат такового

в применении к целым положительным числам. До тех пор, следовательно, пока этот вопрос не будет доведен до конца*), т. е. пока не будет дано логическое доказательство отсутствия противоречия в области тех же операций над целыми положительными числами, мы можем основывать уверенность в отсутствии противоречия в названных законах лишь на том, что существуют наглядные объекты и наглядные операции над ними, которые удовлетворяют этим законам. В качестве таких наглядных объектов мы указали уже выше ряд равноудаленных одна от другой точек на числовой оси; нам остается только прибавить, что означают в применении к этим образам арифметические действия. Сложение х' = х + а при постоянном а относит каждой точке х некоторую точку х' таким образом, что неограниченная прямая просто передвигается по себе на отрезок а и притом вправо или влево в зависимости от того, имеет ли а положительное или отрицательное значение. Далее, умножение xf — ax представляет собой отображение подобия прямой в себя (гомотетию) и притом при а > 0 — растяжение, при а<0 — растяжение, сопровождаемое симметрией относительно нулевой точки.

Я хочу теперь остановиться на том, как, собственно, все эти вещи исторически возникли. Не нужно думать, что отрицательные числа представляют собой открытие какого-либо одного умного человека, который вместе с тем, быть может, даже обнаружил на основании геометрического их толкования отсутствие в них противоречия. Напротив, в процессе медленной эволюции употребление отрицательных чисел как бы само собой напрашивалось, и лишь позже, когда ими уже давно оперировали, именно в XIX в. возник вопрос об отсутствии противоречия.

Переходя к истории отрицательных чисел, позвольте мне обратить ваше внимание на то, что древние греки, несомненно, не владели отрицательными числами, так что здесь мы имеем пункт, в котором грекам не приходится отводить первого места, как это некоторые всегда склонны делать. Напротив, честь открытия отрицательных чисел должна быть приписана индусам, которые ввели также нуль и нашу си-

*) См. примечание 9.

стему цифр. В Европе отрицательные числа постепенно вошли в употребление в эпоху Возрождения в тот именно период, когда стали оперировать над буквами. Не могу не упомянуть при этом, что более или менее совершенное буквенное исчисление впервые ввел Виет21) в 1591 г. На этой почве, естественно, пришли к правилам раскрытия скобок при действиях с положительными числами, которые, конечно, содержатся в перечисленных нами выше основных формулах, если мы только присоединим соответствующие законы вычитания. Однако я хочу остановиться несколько подробнее по крайней мере на двух примерах, чтобы, прежде всего, показать, что для них можно дать крайне простые и наглядные доказательства,— правда, такие доказательства, которые, собственно говоря, исчерпываются фигурой и словечком «смотри», как мы это часто встречаем у древних индийцев22).

1) Пусть а>Ь и с > а. В таком случае а — Ь есть положительное число, меньшее, нежели с. Поэтому разность с — — (а — b) будет положительным числом (рис. 3). Если мы нанесем эти числа на числовую ось и заметим, что отрезок между точками Ь и а имеет длину а — Ь, то достаточно взглянуть на рисунок, чтобы убедиться в следующем: если мы отнимем от отрезка с (т. е. отрезка между точками 0 и с) отрезок а — 6, то получим то же самое, что получили бы, если бы отняли сначала весь отрезок а, а затем прибавили отрезок &, т. е.

с— (а~b) = с — а + b. (1)

2) Пусть а> Ь и с> d\ тогда разности а —- b и с — d представляют собой целые положительные числа. Рассмотрим произведение (а —- b) • (с — d). С этой целью мы построим прямоугольник со сторонами а — Ь и с — d (рис. 4); он составит часть прямоугольника, имеющего стороны а и с. Чтобы из последнего получить первый, мы отнимем сначала верхний, горизонтально заштрихованный прямоугольник a-d, а потом расположенный справа и заштрихованный вертикально прямоугольник b -с. Однако небольшой

Рис. 3

прямоугольник b-d, заштрихованный накрест, мы отняли лишний раз; мы должны его поэтому снова прибавить. Этим путем мы приходим к известной формуле

(а — b) (с — d) = ас — ad — be -f bd. (2)

В дальнейшем развитии этих идей сказывается общая особенность человеческой натуры, заключающаяся в том, что мы невольно постоянно стремимся распространять правила, выведенные для частных случаев, на другие более общие случаи. Ганкель в своем сочинении «Теория комплексных числовых систем»23) называет это принципом перманентности формальных законов и придает ему значение руководящего основного положения. Этот общий принцип в применении к интересующему нас случаю означал бы, что мы желаем освободить формулы (1) и (2) от условий (наложенных на числа а, 6, с, d), при которых они выведены, и сделать их применимыми также к другим случаям. Например, если мы применим формулу (2) к случаю а = с = 0 (для какового случая мы эту формулу отнюдь не доказали), то мы получим (—b) • (—d)=+bd, т. е. получим правило знаков при умножении отрицательных чисел. Таким же образом мы можем без труда прийти и к другим случаям правила знаков, благодаря чему, пожалуй, склонны будем даже признать их за совершенно необходимые допущения. В действительности же они будут необходимы лишь постольку, поскольку мы хотим сохранить для этих новых объектов прежние правила действий. Математики прежних времен, конечно, не с легким сердцем решались на образование этих новых понятий, и тяжелое чувство, с которым они на это шли, сказывалось в тех названиях, которые они часто давали отрицательным числам: «придуманные числа», «ложные числа» и т. д. Однако, несмот-

Рис. 4

ря на все эти сомнения, в XVI и XVII вв. отрицательные числа постепенно приобретают всеобщее признание; этому, без сомнения, в значительной степени способствовало развитие аналитической геометрии. Конечно, сомнения еще оставались и должны были оставаться до тех пор, пока все еще старались интерпретировать отрицательное число как количество предметов и не уяснили себе возможности априорного установления формальных законов; в связи с этим возникали постоянные попытки доказать правило знаков. Простое разъяснение, которое принес только XIX в., заключается в том, что о логической необходимости этого положения, о его доказуемости не может быть речи. Напротив, речь может идти только о том, чтобы признать его логическую допустимость; в остальном же оно является произвольным и регулируется лишь соображениями целесообразности и приведенным выше принципом перманентности.

В связи с этим нельзя не высказать мысли, которая и помимо того часто напрашивается, что вещи нередко представляются разумнее, нежели люди. Вы видите, что один из важнейших шагов в математике,— именно, введение отрицательных чисел и действий над ними — был сделан не вследствие сознательного логического суждения одного человека, а стал органически необходимым благодаря интенсивным занятиям этими вещами: может даже показаться, что человек научился этим правилам от букв. Сознательное убеждение, что мы при этом поступаем правильно, не впадая в коллизию со строгой логикой, явилось лишь гораздо позже. Вообще, чистая логика при образовании таких новых понятий может иметь лишь регулирующее значение, руководящей же роли она играть не может, ибо единственное требование, которое она ставит, заключается в том, чтобы не было внутреннего противоречия, а этому, конечно, могут удовлетворить и многие другие абстрактные системы.

Если вас интересует литература по теории отрицательных чисел, то я могу вам указать еще на книгу Тропфке «История элементарной математики»24).

Обращаясь к критическому обзору того, как отрицательные числа излагаются в школе, нужно прежде всего сказать, что преподаватели часто здесь делают

ту же ошибку, в которую впадали математики прежних времен; именно, они пытаются доказать правило знаков как нечто логически необходимое. Особенно часто выдают за доказательство приведенный выше эвристический вывод правила (—b) • (—d)= + bd из формулы для (а — b) • (с — d), фактически совершенно забывая, что эта формула при ее первоначальном выводе (см. с. 41—42) неразрывно связана с неравенствами а > by c>d. Таким образом, получается лишь видимость (симуляция) доказательства; психологический момент, который в силу принципа перманентности приводит к этому правилу, смешивается с логическим доказательством. Ученик, которому это в таком виде в первый раз преподносится, естественно, не может этого понять, но поверить этому он в конце концов вынужден; если же при повторении на высшей ступени обучения, как это часто бывает, ученик не получает более точных разъяснений, то у многих может установиться убеждение, что эта теория содержит нечто мистическое, непонятное.

По поводу этих приемов я должен категорически заявить, что никогда не следует пытаться симулировать невозможные доказательства25). Следовало бы, напротив, на простых примерах, сообразно фактическому положению дела, убедить ученика, а если возможно, то заставить его самого прийти к тому, что именно эти положения, основанные на принципе перманентности, способны дать единообразный и удобный алгоритм, тогда как при выборе других правил всегда придется различать отдельные случаи. Конечно, при этом не нужно проявлять лишней поспешности, нужно дать ученику время освоиться с тем внутренним переворотом, который в нем совершается в результате этого акта познания. И в то время как ученику легко понять, что другие положения нецелесообразны, необходимо настойчиво подводить его к пониманию того, что чудесная сторона дела в том именно и заключается, что действительно существует общее и целесообразное положение; он должен ясно понять, что существования такой системы отнюдь нельзя было с уверенностью ожидать заранее.

Этим я заканчиваю теорию отрицательных чисел и перехожу к учению о дробях.

2. Дроби

Обращаясь теперь к такому же изложению учения о дробях, мы начнем с того, как трактуется этот вопрос в школе. Здесь дробь ~ с самого начала имеет совершенно конкретное значение. Только по сравнению с наглядными образами, которыми интерпретируются целые числа, здесь субстрат меняется,— именно, от количества предметов мы переходим к измерению, от предметов, подлежащих счету, мы переходим к предметам, подлежащим измерению. Примерами величин, допускающих измерения, могут служить масса и длина. На этих примерах каждому ученику и поясняется значение дробей, ибо каждому человеку очень легко понять, что такое 4- метра или ~ килограмма. Из конкретных же соображений легко устанавливается значение соотношений =, >, < для дробей, а также устанавливаются правила сложения и вычитания дробей. Умножение обычно вводится путем незначительной модификации первоначального определения этого действия. Умножить число на дробь ~ значит умножить его на целое число а (согласно старому определению) и затем разделить на Ь. Или, иначе, произведение составляется из множимого совершенно так же, как множитель -j составляется из единицы. Вслед за этим деление на дробь определяется как операция, обратная умножению: разделить а на у значит найти такое число, которое, будучи умножено на даст число а. Эти определения в теории дробей мы комбинируем далее с введением отрицательных чисел и таким образом получаем окончательно совокупность всех рациональных чисел. Мы не имеем возможности входить в детали всего этого построения, проведение которого в школе, естественно, требует много времени; мы лучше сравним это изложение с современной разработкой этого вопроса в математике26).

У Вебера и Вельштейна выступает на первый план формальная сторона дела, сводящаяся к выбору из

различных возможных интерпретаций той, которая позволяет удобно описать общие свойства дробей.

Здесь дробь -j просто является символом (числовой27) парой), над которым нужно совершать действия согласно определенным правилам.

Эти правила (которые, как мы упомянули выше, естественно, вытекают из реального значения дробей) имеют здесь характер совершенно произвольных соглашений. Так, например, то, что представляет для ученика наглядное понимание равенства двух дробей, приобретает здесь форму определения равенства: две дроби и называются равными28), если ad=bc. Аналогичным образом определяется понятие «больше» или «меньше»; сумма двух дробей у и -j просто определяется как дробь ad^° » и т. д. Затем уже доказывается, что определенные таким образом действия в получающейся при этом более обширной числовой области строго подчиняются прежним формальным законам, т. е. одиннадцати основным законам, которые мы уже неоднократно приводили.

Не столь формально, как в системе Вебера — Вельштейна (изложенной здесь, конечно, только в самых общих чертах), трактует этот вопрос Буркгардт.

На дробь у он смотрит как на последовательность двух операций в области целых чисел, — именно, умножение на число а и деление на число Ь\ объектом, над которым эти операции должны быть выполнены, является совершенно произвольное целое число. Если мы последовательно произведем две такие пары операций -J и ~, то это рассматривается как умножение дробей. Легко видеть, что осуществляемая таким образом операция представляет собой не что иное, как умножение на ас и деление на bd. Таким образом, правило умножения дробей

вытекает здесь из того смысла, который придается понятию дроби, а не представляется произвольным

соглашением. Совершенно аналогично можно, конечно, определить деление дробей; однако сложение и вычитание не поддаются интерпретации в этом порядке идей. Формула

остается, таким образом, и у Буркгардта соглашением, в пользу которого он приводит только наводящие указания.

Сравним теперь школьную постановку вопроса с указанным современным изложением, в котором как в одной, так и в другой интерпретации мы остаемся всецело на почве целых чисел. Известными предполагаются только совокупность целых чисел и действия над ними; новые же числа являются объектами, которые определяются как числовые пары или как операции над целыми числами. Школьное же изложение существенно опирается на новое наглядное представление об измерении величин, приводящее к непосредственному интуитивному представлению о дробях. Мы уясним себе это различие лучше всего, если представим себе существо, владеющее только идеей о целом числе и вовсе не знающее измерений. Для такого существа школьное изложение казалось бы совершенно непонятным, между тем как постановка вопроса у Вебера и Вельштейна была бы ему вполне доступна.

Какая же из двух точек зрения лучше и что дает каждая из них? Ответ на этот вопрос созвучен тому ответу, который мы привели выше, когда мы разбирали аналогичный вопрос относительно целых чисел. Новая точка зрения, несомненно, чище, но в то же время и беднее. Она, собственно говоря, дает только половину того, что в целом виде содержит в себе школьное изложение: абстрактное, арифметическое, логически точное введение дробей и действий над ними.

И когда эта новая точка зрения, основывающаяся лишь на понятии целого числа, полностью проведена, остается еще другой, независимый и не менее важный вопрос: можно ли применить построенную таким образом теоретическую доктрину к наглядным, поддающимся измерению величинам, с которыми нам

приходится иметь дело? И здесь, конечно, можно было бы смотреть на этот вопрос как на относящийся к «прикладной математике» и допускающий строго самостоятельную обработку. Представляется, однако, сомнительным, можно ли такое разделение считать целесообразным с педагогической точки зрения. У Вебера и Вельштейна это разделение задачи на две части находит себе, впрочем, своеобразное выражение: вводя абстрактно действия с дробями, авторы затем посвящают отдельную главу под заглавием «отношения» вопросу о том, как рациональные дроби могут быть применены к внешнему миру. При этом изложение носит у них более абстрактный, чем наглядный, характер.

Я закончу настоящее рассуждение о дробях общим замечанием, относящимся к совокупности всех целых чисел; при этом для наглядности я буду пользоваться изображением чисел на прямой линии. Мы представим себе, что на прямой (рис. 5) отмечены все точки с рациональными координатами, которые мы будем короче называть просто «рациональными точками». Говорят, что совокупность всех этих рациональных точек образует на числовой оси «всюду плотное множество». Этим хотят сказать, что в каждом интервале, как бы мал он ни был, имеется все же бесчисленное множество рациональных точек. Точнее, не вводя чуждых понятий, можно иначе выразить то же самое следующим образом: между любыми двумя рациональными точками имеется еще по крайней мере одна рациональная точка. Следствием этого является то, что из совокупности всех рациональных чисел всегда можно выделить часть, не содержащую ни наибольшего, ни наименьшего элемента. Примером может служить совокупность всех рациональных дробей, содержащихся между нулем и единицей, если сами эти два числа не включать. В самом деле, какова бы ни была правильная дробь, всегда существует еще меньшая дробь, содержащаяся между нею

Рис. 5

и нулем, и большая, содержащаяся между нею и единицей. Эти понятия в систематическом развитии относятся уже к канторовой теории множеств*). Ниже нам действительно придется воспользоваться рациональными числами с указанными их свойствами как важным примером множества.

3. Иррациональные числа

Переходим теперь к дальнейшему развитию понятия числа,— именно, к иррациональным числам. Здесь мы не будем останавливаться на том, как этот вопрос излагается в школе, так как относительно иррациональных чисел в школе ограничиваются обыкновенно несколькими примерами. Мы лучше перейдем к историческому развитию вопроса.

Исторически возникновение понятия иррационального числа имеет своим источником геометрическую интуицию и потребности геометрии. Представим себе числовую ось с нанесенным на ней всюду плотным множеством рациональных точек. На этой оси имеются тогда еще и другие числа; по-видимому, это впервые показал Пифагор и сделал он это, примерно, следующим образом. Если мы имеем прямоугольный треугольник, в котором два катета равны единице длины, то его гипотенуза имеет длину д/2 (рис. 6). Это число заведомо не является рациональным. В самом деле, если мы положим <yj2 — ^, где а и & — взаимно простые числа, то мы легко придем к противоречию с известными законами делимости целых чисел. Таким образом, мы геометрически построили такой отрезок, отложив который на числовой оси от нулевой точки, мы придем к точке нерационально^ т. е. к такой точке, которая в прежнем множестве рациональных точек не содержится. Вообще в большинстве случаев29) гипотенуза ^/пг2 + п2 прямоугольного треугольника, в котором катеты выражаются целыми числами m и п, будет выражена иррациональным числом. Школа Пифагора очень усердно занималась разысканием таких пар чисел тип, ко-

Рис. 6

*) См. приложение II (с. 355).

торым соответствует рациональная гипотенуза; это так называемые пифагоровы числа, простейшим примером которых являются 3, 4, 5; мы к ним еще возвратимся ниже. Во всяком случае было известно, что при этом построении, вообще говоря, получаются иррациональные отрезки; это открытие стоило жертвы в сто быков, по поводу которой так часто приходится слышать дурные остроты.

Последующие греческие математики изучали более сложные иррациональности; так, например, у Евклида мы находим иррациональности вида VV^+ V* и т. п. Вообще же можно сказать, что все иррациональные числа, о которых имели представление греческие математики, сводятся к таким иррациональностям, которые можно получить повторным извлечением квадратного корня и которые в силу этого можно строить циркулем и линейкой. Общей же идеей об иррациональном числе греки еще не владели.

Я должен, однако, несколько точнее сформулировать это замечание, чтобы избежать недоразумений. Мы имели в виду сказать только то, что греки не владели таким приемом, при помощи которого можно было бы дать общее арифметическое определение иррационального числа, как мы это сделаем ниже. При всем том понятием общего действительного числа, которое может и не быть рациональным, греки владели,— правда, с иной точки зрения, чем у нас; все это носит у них другой характер, так как они не пользовались буквами для общего обозначения числа. Именно, они рассматривали, как это излагает систематически Евклид, отношение двух произвольных отрезков и оперировали с этими отношениями точно так же, как мы теперь оперируем с произвольными действительными числами. У Евклида встречаются даже такие определения, которые совсем напоминают современную теорию иррациональных чисел. Иррациональные числа уже названием своим существенно отличаются от рациональных чисел; последнее называется «apiO^ioa», между тем как отношение отрезков, т. е. любое действительное число, называется «Хо^оо».

К этому присоединим еще замечание относительно самого слова «иррациональный». Оно ведет свое на-

чало, вероятно, от неправильного перевода греческого слова «аАюуоа» на латинский язык. Это греческое слово, по-видимому, означало «невыговариваемое число». Этим желали сказать, что эти новые числа, т. е. отношения отрезков, не могут быть выражены отношением двух целых чисел; лишь непониманием переводчика объясняется то, что эти числа оказались «нелогичными», как это, по-видимому, выражается словом «иррациональные числа». Общее понятие иррационального числа появилось, по-видимому, только в конце XVI столетия после введения десятичных дробей, употребление которых получило право гражданства в связи с возникновением логарифмических таблиц. Когда мы обращаем рациональную дробь в десятичную, мы можем, кроме конечных дробей, получать еще бесконечные десятичные дроби, которые, однако, всегда должны быть периодическими*). Простейшим примером будет

мы имеем здесь десятичную дробь, период которой, состоящий из одной цифры 3, начинается непосредственно после запятой. Но тогда нет препятствий к тому, чтобы представить себе непериодическую десятичную дробь, цифры которой следуют друг за другом по какому-либо другому определенному закону30); каждый, конечно, признает такую дробь определенным и в то же время нерациональным числом. Но в этом, собственно, уже содержится понятие иррационального числа, к которому, таким образом, нас непосредственно приводит десятичная дробь. Исторически дело и здесь происходило совершенно так, как мы это выяснили выше относительно отрицательных чисел: вычисления с необходимостью приводили к введению новых чисел, и с ними оперировали, не размышляя много об их сущности и об их обосновании, тем более, что они часто оказывались чрезвычайно полезными.

Лишь в 60-х годах XIX в. была признана потребность в точной арифметической обработке учения об иррациональных числах, что и было выполнено Вей-

*) Об этом подробнее см, ниже, с, 62 и след.

ерштрассом в его лекциях, относящихся к указанному периоду. Общую теорию иррациональных чисел дал в 1879 г. Г. Кантор в Галле, основатель учения о множествах, и независимо от него Р. Дедекинд в Брауншвейге Точку зрения Дедекинда я намерен пояснить здесь в немногих словах. Допустим, что мы владеем совокупностью всех рациональных чисел, и игнорируем все пространственные представления, навязывающие нам интуитивно непрерывность числового ряда. Чтобы, исходя отсюда, прийти к чисто арифметическому определению иррационального числа, Дедекинд*) строит понятие сечения в области рациональных чисел. Именно, если г есть рациональное число, то оно делит всю совокупность рациональных чисел на два класса А и В таким образом, что каждое число класса А меньше, нежели любое число класса В, причем каждое рациональное число принадлежит тому или иному классу. Класс А содержит все числа, которые меньше числа г, а В — все числа, которые больше, нежели г, само же число г можно отнести как к одному, так и к другому классу. Кроме этих «собственных» сечений, бывают еще сечения «несобственные»: под этим мы разумеем такие разбиения множества всех рациональных чисел на два класса, которые обладают перечисленными выше свойствами, но не производятся рациональными числами; иными словами, это — сечения, в которых класс А не имеет наибольшего, а класс В не имеет наименьшего числа. Пример такого рода несобственного сечения дает нам, скажем, л/2= 1,414... или вообще всякая непериодическая бесконечная дробь. Относительно каждого рационального числа лы можем тотчас решить, больше ли оно или меньше, чем эта бесконечная десятичная дробь31), и сообразно этому отнести каждое рациональное число либо к классу Л, либо к классу В. В таком случае ясно, что каждое число класса А меньше каждого числа класса В, с другой стороны, в классе А не может быть наибольшего, а в классе В не может быть наименьшего числа, ибо между каждым рациональным

*) Дедекинд Р. Непрерывность и иррациональные числа / Пер. с нем. приват-доцента С. Шатуновского. — Изд. 2-е. — Одесса: Матезис, 1909. Были и позднейшие издания.

числом и нашей бесконечной дробью всегда найдется еще бесчисленное множество других рациональных чисел.

Ввиду этих соображений Дедекинд устанавливает следующее определение, которое с точки зрения строго логической должно, конечно, рассматриваться как чисто условное соглашение. Каждое сечение в области рациональных чисел мы будем называть рациональным или иррациональным числом в зависимости от того, будет ли это сечение собственным или несобственным.

К этому непосредственно примыкает определение равенства: два числа называются равными, если они призводят одно и то же32) сечение в области рациональных чисел. Исходя из этого определения, можно, например, доказать, что -|- равняется бесконечной десятичной дроби 0,333... Тот, кто станет на нашу точку зрения, действительно должен требовать доказательства, основанного на данном определении, хотя человеку, наивно подходящему к этому делу, это может показаться совершенно ненужным. Получить же это доказательство нетрудно, если мы сообразим, что каждое рациональное число, которое меньше у, при обращении в десятичную дробь рано или поздно даст меньший десятичный знак, чем в нашей бесконечной дроби; всякое же рациональное число, которое больше ~-, рано или поздно даст больший десятичный знак.

В лекциях Вейерштрасса соответствующее определение гласит: два числа называются равными, если они отличаются друг от друга меньше, чем на любое данное положительное рациональное число. Связь между этим определением и предыдущим легко усмотреть. Особенно наглядным представляется последнее определение, если мы сообразим, почему дробь 0,999... равна 1: эти числа отличаются, очевидно, меньше, чем 0,1, чем 0,01, и т. д.; следовательно, на основании определения они равны.

Теперь спрашивается: благодаря чему мы имеем возможность добавить к множеству всех рациональных чисел еще и иррациональные числа и произво-

дить действия над теми и другими числами, совершенно их не различая? Причина кроется в том, что сохраняет силу закон монотонности элементарных операций. Принцип этот заключается в следующем: если два иррациональных числа нужно сложить, перемножить и т. п., то мы их заключаем во все более и более тесные пределы и над этими пределами соответственно производим те же действия, которые нам нужно произвести над самими иррациональными числами-, вследствие закона монотонности и результат последовательно замыкается во все более и более тесные границы33).

Мне нет надобности излагать здесь эти вещи, так как вы можете подробно ознакомиться с ними по многим учебникам, в которых вы найдете большие подробности относительно определения иррационального числа, которое я здесь изложил только в общих чертах34).

Здесь я предпочел бы остановиться еще на том, чего вы в книгах обыкновенно не найдете: именно, на том, как можно перейти от изложенной здесь арифметической теории иррациональных чисел к их применению в других областях. В особенности я имею в виду здесь аналитическую геометрию, которую иногда по наивной интуиции принимают за источник иррациональных чисел и которая психологически действительно является этим источником.

Если мы возьмем числовую ось, на которой, как выше, нанесены начало и все рациональные точки, то основное положение, на котором покоится это применение, гласит: каждому рациональному или иррациональному числу отвечает точка, имеющая это число своей координатой; каждой точке на прямой отвечает в качестве координаты рациональное или иррациональное число35).

Такого рода исходное положение, которое стоит во главе дисциплины, из которого все дальнейшее вытекает чисто логически, тогда как само оно не может быть логически доказано, мы называем аксиомой. Отдельные математики в зависимости от сложившихся у них взглядов смотрят на аксиому как на интуитивно ясную истину или как на более или менее произвольное соглашение. Настоящая аксиома о взаимно однозначном соответствии между всеми действитель-

ными числами, с одной стороны, и точками прямой, с другой стороны, обыкновенно называется аксиомой Кантора, который первый точно ее сформулировал (в 1872 г.).

Здесь будет уместно сказать несколько слов о природе наших пространственных представлений.

Это выражение, строго говоря, можно понимать двояко: с одной стороны, можно иметь в виду непосредственное чувственное, эмпирическое представление о пространстве, которое мы контролируем при помощи измерения; с другой стороны, — отвлеченное, внутреннее представление о пространстве, можно было бы сказать, присущую нам идею о пространстве, которая возвышается над неточностью чувственных восприятий. Такого рода различие вообще имеет место при каждом интуитивном представлении, как я уже имел случай указать по поводу развития понятия числа; лучше всего оно поясняется, быть может, следующим примером. Что означает небольшое число 2, 5 или 7, нам непосредственно ясно, но о больших числах, например о числе 2503, мы уже не имеем такого непосредственного, наглядного представления. Здесь, напротив, находит себе применение внутреннее представление о расположенном числовом ряде, которое мы себе составляем, исходя из начальных чисел, при помощи совершенной индукции. Что касается представления о пространстве, то дело обстоит так: если мы рассматриваем расстояние между двумя точками, то мы можем оценить и измерить его лишь с ограниченным приближением, так как наш глаз неспособен различать отрезки, имеющие длину ниже некоторой границы; это есть так называемый порог ощущения — понятие, играющее чрезвычайно важную роль во всей психологии. Но по существу дело не изменяется и в том случае, если мы усиливаем наш глаз самыми тонкими инструментами, так как и они имеют известные границы точности. Таким же образом и при всяких других физических наблюдениях и измерениях мы наталкиваемся на такого рода пороги ощущения, которые устанавливают предел возможной точности. Указания, попадающие за эти пределы, никакого значения уже не имеют и свидетельствуют с невежестве или даже о недобросовестности.

В противоположность этому свойству эмпирического представления о пространстве, необходимо ограниченного известным приближением, абстрактное или идеальное представление о пространстве обладает неограниченной точностью и в силу канторовой аксиомы обнаруживает полный параллелизм с арифметическим пониманием числа36).

В соответствии с этим целесообразно и саму математику разделить на две части: на математику точную и математику приближенную. Выясним это различие на примере уравнения /(л:) = 0. В приближенной математике, как и в случае наших действительных эмпирических представлений, речь идет не о том, чтобы f(x) точно обратилось в нуль, а только о том, чтобы значение функции \f(x)\ оказалось ниже достижимого порога точности; таким образом, равенство f(x) = 0 должно служить только сокращенным выражением неравенства

с которым фактически и приходится иметь дело37). Выполнение же строгого требования равенства /(*) = 0 составляет уже задачу точной математики. Так как в приложениях играет роль только приближенная математика, то можно, выражаясь грубо, сказать, что мы имеем потребность, собственно, в этой последней дисциплине, между тем как точная математика существует только для удовольствия тех, которые ею занимаются, а в остальном составляет лишь опору для математики приближенной.

Возвращаясь опять к нашей теме, я должен сказать, что логическое определение иррационального числа, несомненно, относится к точной математике. В самом деле, утверждение, что две точки отстоят друг от друга на расстояние, выражающееся иррациональным числом миллиметров, фактически не имеет никакого смысла, так как десятичные знаки дальше шестого не имеют реального значения38). В практике мы можем, таким образом, свободно заменять иррациональные числа рациональными. На первый взгляд это находится в противоречии с законом рациональных указателей в кристаллографии или, например, с тем, что в астрономии приходится различать случаи, существенно разные, когда времена

оборотов двух планет имеют рациональное или иррациональное отношение. В действительности же здесь опять проявляется только многозначность нашего языка, так как здесь понятие «рациональное» и «иррациональное» нужно понимать в совершенно другом смысле, — именно, в смысле, свойственном приближенной математике. Когда здесь говорят, что величины имеют рациональное отношение, то под этим разумеют, что их отношение выражается парой небольших чисел, — например у. Такое же отношение, как » Здесь, несомненно, отнесли бы уже к иррациональным. Насколько, собственно, велики могут быть числитель и знаменатель, это меняется от случая к случаю в зависимости от условий вопроса.

В двух словах я хотел бы еще указать, в заключение, как я себе представляю желательное изложение этих вещей в школе. Точное изложение теории иррациональных чисел здесь вряд ли уместно, так как она не может быть интересна для большинства учеников. Юноша, несомненно, всегда удовлетворится указанием ограниченного приближения; точность же 0,001 мм уже вызовет удивление, а потребности в полной точности у него, несомненно, не будет. Вследствие этого будет вполне достаточно, если в школе пояснить понятие иррационального числа только на примерах, как это большею частью и делают. Конечно, немногие юноши, обладающие ясно выраженным математическим дарованием, этим не удовлетворятся и захотят вникнуть глубже в сущность вопроса. Достойной задачей учителя будет удовлетворить эту потребность, не нарушая интересов большинства учеников39).

III. ОСОБЫЕ СВОЙСТВА ЦЕЛЫХ ЧИСЕЛ

1. Роль теории чисел в школьном и университетском преподавании

Мы начнем теперь новую главу, которую посвятим собственно учению о целых числах, теории чисел, или арифметике в более узком смысле этого слова.

Я прежде всего дам сводку отдельных вопросов, в которых эта дисциплина соприкасается со школьным преподаванием.

1. Первой задачей теории чисел является вопрос о делимости: делится ли одно число на другое?

2. Можно указать простые правила, которые дают возможность легко распознать, делится ли произвольное число на небольшие числа: 2, 3, 4, 5, 9, 11 и т. д.

3. Имеется бесчисленное множество простых чисел, т. е. таких, которые не имеют собственных делителей, иными словами, которые делятся только на себя и на единицу: 2, 3, 5, 7, 11, 13, 17, ...

4. Мы владеем всеми соотношениями, касающимися делимости любых чисел, если мы знаем их разложение на простые множители.

5. Теория чисел играет роль в вопросе об обращении рациональных дробей в десятичные: она поясняет, почему десятичная дробь должна стать периодической и как велик период.

Эти вопросы появляются уже в младших классах; позже вопросы теории чисел появляются лишь изредка. Отметим следующие факты.

6. Если и не во всех школах, то во всяком случае во многих излагаются непрерывные дроби.

7. Иногда излагаются диофантовы уравнения, т. е. уравнения с многими неизвестными, при решении которых мы ограничиваемся целыми значениями неизвестных. В виде примера я приведу пифагоровы числа, о которых мы уже имели случай говорить. Как известно, здесь речь идет о целых решениях уравнения

а2 + Ь2 = с2.

8. В тесной связи с теорией чисел находится вопрос о делении окружности на равные части, хотя этот вопрос вряд ли когда-либо разбирается в школе. Если нам нужно разделить окружность на п равных частей, — разумеется, пользуясь всегда только циркулем и линейкой, — то это легко удается при п = = 2, 3, 4, 5, 6. Но при п = 7 это уже не удается, и учитель обыкновенно почтительно останавливается на этом пункте, не высказывая даже категорически того, что это выполнить вовсе невозможно. Причина этого обстоятельства коренится в глубоких сообра-

жениях теории чисел. Чтобы избежать недоразумений, с которыми, к сожалению, в этом вопросе приходится довольно часто встречаться, я еще раз подчеркну, что здесь мы вновь имеем дело с вопросом точной математики, не имеющим для практических применений никакого значения. Для практических целей вряд ли кто-либо станет пользоваться точным построением даже в тех случаях, когда это возможно. Напротив, будет гораздо целесообразнее, оставаясь на почве приближенной математики, простыми и умело подобранными испытаниями разделить окружность на любое число равных частей; при этом можно легко достигнуть всякой практически доступной точности. Так, несомненно, поступает каждый механик, которому нужно строить инструменты с окружностями, разделенными на некоторое число частей.

9. Еще в одном месте в школе приходится столкнуться с высшей теорией чисел, — именно, в вопросе о квадратуре круга и связанном с ней вычислении числа я. При изложении этого вопроса тем или иным путем вычисляют первые десятичные знаки числа я, а затем, несомненно, упоминают о современном доказательстве трансцендентности числа я, решающем в отрицательном смысле древнюю задачу о квадратуре круга при помощи циркуля и линейки. В конце своего курса я возвращусь к этому доказательству, здесь же я ограничусь точной формулировкой этого утверждения; дело сводится к тому, что число я не может удовлетворять никакому алгебраическому уравнению с целыми коэффициентами вида

То обстоятельство, что коэффициенты должны быть целыми числами, играет здесь особую роль: именно оно и относит этот вопрос к теории чисел.

Само собой разумеется, что и здесь мы имеем дело с вопросом точной математики, ибо для нее только и имеет значение числовой характер я. Для математика, ограничивающегося приближением, достаточно определить первые десятичные знаки, которые дают ему возможность произвести квадратуру круга с любой доступной нам точностью.

Этим исчерпывается роль теории чисел в школе. Спросим еще, какое место она занимает в универси-

тетском преподавании и в научном исследовании. Я склонен разделить математиков, занимающихся самостоятельными исследованиями, по их отношению к теории чисел на две категории: одних я назову энтузиастами, других индифферентными. Для первых не существует никакой науки, которая была бы так прекрасна и так важна, как теория чисел, никакой науки, которая давала бы столь ясные и точные доказательства и теоремы такой безукоризненной строгости. «Если математика есть царица наук, то теория чисел есть царица математики», — говорит Гаусс. Индифферентные же стоят далеко от теории чисел, очень мало заботятся о ее развитии и стараются вовсе ее избегать. Большинство изучающих математику по своим симпатиям относится к последней категории.

Причина этого замечательного разделения, по моему мнению, коренится в следующем: с одной стороны, теория чисел, несомненно, имеет основное значение для всякого глубокого математического исследования. Необычайно часто мы наталкиваемся, исходя из совершенно различных областей, на сравнительно простые арифметические факты. Но с другой стороны, чистая теория чисел является крайне абстрактной дисциплиной; способностью же воспринимать с удовольствием весьма абстрактные вещи обладают немногие. Уже это обстоятельство само по себе могло бы содействовать безучастности, которую проявляют многие к теории чисел. Но это еще усиливается тем, что в современных сочинениях по теории чисел предмет излагается обыкновенно чрезвычайно абстрактно. Я полагаю, что теория чисел сделалась бы гораздо более доступной и встретила бы гораздо больше интереса к себе, если бы ее излагали гораздо но и на подходящих фигурах. Ее предложения, конечно, не зависят от этих вспомогательных средств, но применение этих средств могло бы во многом содействовать пониманию. Эту цель имеет в виду Минковский в своей книге «О диофантовых приближениях», вышедшей в 1907 г. в Лейпциге.

Что касается учебников по теории чисел, то вы можете, собственно, вполне ограничиться тем материалом, который находите в учебниках алгебры40).

2. Простые числа и разложение на множители

Разъяснения, специально относящиеся к теории чисел, я хотел бы связать с упомянутыми выше вопросами и постараюсь изложить их возможно более наглядно. Само собой разумеется, что я по-прежнему имею в виду тот материал, который, по моему мнению, должен знать учитель, и отнюдь не думаю, чтобы весь этот материал можно было непосредственно в той же форме сообщить ученику. Я должен указать на опыт, вынесенный мною из учительских экзаменов. Мне пришлось убедиться, что в большинстве случаев кандидаты на учительское звание ограничиваются лишь ходячими выражениями, не имея сколько-нибудь серьезных сведений в этой области. Что я есть трансцендентное число, это говорит, конечно, каждый, но что это, собственно, означает, знают уже немногие. Раз я получил даже и такой ответ, что я не есть ни рациональное, ни иррациональное число. Точно так же довольно часто приходится встречать экзаменующихся, которые знают, правда, что имеется бесчисленное множество простых чисел, но не имеют ни малейшего представления о доказательстве этого предложения.

С этого последнего доказательства я и начну; при этом те простые вещи, которые содержатся в пп. 1 и 2 предыдущего перечисления, я буду считать известными41). Упомяну еще, что исторически доказательство этого предложения принадлежит Евклиду, «Начала» (по гречески Sxoixeta) которого содержат не только систему геометрии, но также алгебраические и арифметические факты, часто облеченные в геометрические формы.

Евклидов прием доказательства указанного предложения заключается в следующем. Положим, что ряд простых чисел ограничен и исчерпывается числами 2,3,5, р; в таком случае число N=(2-3-5- ... ... "р)+ 1, очевидно, не делится ни на 2, ни на 3, ..., ни на р, так как при делении на каждое из этих чисел мы получаем в остатке единицу. Поэтому должно иметь место одно из двух: либо это есть простое число, либо существуют простые числа, отличные от 2,3, ...,р. Но то и другое противоречит нашему предположению, и теорема, таким образом, доказана.

Что касается п. 4 раздела 1 — разложения чисел на простые множители42), — то я хочу показать вам одну из старейших таблиц разложения, принадлежащую Чермаку и изданную в 1811 г. под названием «арифметическое решето». Это название происходит от переданного нам еще из древности термина «решето Эратосфена». Основанием для этого термина послужило представление, что мы из всего натурального ряда чисел последовательно просеиваем те, которые делятся на 2, 3, 5, ..., так что в конце концов остаются только простые числа.

3. Обращение простых дробей в десятичные

Обращаюсь теперь к п. 5 раздела 1, — именно, к обращению рациональных дробей в десятичные. Подробную теорию вы найдете в книге Вебера и Вельштейна; я же хочу выяснить здесь только принципы этой теории на простейшем типичном примере. Рассмотрим дробь —, где р — простое число, отличное от 2 и 5; мы покажем, что дробь у представляется в виде бесконечной периодической десятичной дроби, причем число цифр периода — обозначим его через Ô — есть наименьшее натуральное число, при котором 10ô дает при делении на р в остатке 1, или, выражаясь языком теории чисел, Ô есть наименьший показатель, при котором имеет место сравнение

Доказательство прежде всего предполагает известным, что такое сравнение всегда возможно; это устанавливается так называемой малой теоремой Ферма, заключающейся в том, что при всяком простом р, не делящем числа 10,

На доказательстве этого основного предложения, служащего постоянным орудием исследования всякого математика, я здесь не буду останавливаться. Далее, из теории чисел мы должны заимствовать еще предложение, утверждающее, что наименьший показатель Ô, о котором шла выше речь, либо равен числу р— 1,

либо есть делитель этого числа. Это мы можем применить к нашему числу р и получим, таким образом, что

есть целое число N, так что

Если мы поэтому представим себе дроби

обращенными в десятичные, то у них все десятичные знаки после запятой будут соответственно совпадать, так как разность между этими дробями есть целое число. Так как, с другой стороны, дробь — получается из дроби переносом запятой вправо на ô десятичных знаков, то отсюда следует, что от такого переноса запятой десятичные знаки дроби j- не изменяются, иными словами, что десятичные знаки дроби -i- представляют собой последовательное повторение периода, состоящего из ô цифр. Теперь покажем, что не может быть меньшего периода, состоящего из ô' < ô цифр. Для этого нам достаточно обнаружить, что число цифр Ô' каждого периода удовлетворяет сравнению 10ô'== 1, ибо нам известно, что ô есть наименьшее решение этого сравнения. Это доказательство представляет собой простое обращение прежнего рассуждения. В самом деле, из условия

следует, что дроби — и — имеют одни и те же десятичные знаки; следовательно, разность этих дробей

есть целое число N9 а потому 100'-— 1 делится на р\ таким образом, действительно 100' э = l(modp); этим вполне исчерпывается доказательство.

Я приведу некоторые возможно более простые и поучительные примеры, из которых вы увидите, что ô в различных случаях действительно может принимать значения, как меньшие р—1, так и равные р—1.

Заметим прежде всего, что для дроби — = 0,333 ...

число десятичных знаков в периоде, т. е. о, равно 1, и это соответствует тому, что уже 10l=l(mod3).

Далее для дроби ур = 0,090909... имеем «5 = 2 и соответственно

Наивысшее значение 6 = р—1 мы встречаем при разложении дроби

здесь ô = 6. И действительно, нетрудно видеть, что по модулю 7

и, наконец,

4. Непрерывные дроби

Я хочу также несколько остановиться на вопросе, содержащемся в п. 6 раздела 1, именно, на непрерывных дробях. При этом я не буду здесь, однако, приводить обыкновенное чисто арифметическое изложение, которое вы найдете во многих других сочинениях, например, у Вебера и Вельштейна43). Нaпротив, я воспользуюсь случаем, чтобы вам показать, какую ясную и понятную форму приобретают вопросы теории чисел при наглядном геометрическом их изложении. К тому же, прибегая к этим геометрическим приемам в области теории чисел, мы возвращаемся к тем путям, по которым шли Гаусс и Дирихле. Лишь новейшие математики начиная примерно с 1860 г., изгнали эти методы из теории чисел44). Само собой разумеется, что здесь я имею возможность кратко привести только ход рассуждений и важнейшие теоремы без доказательств; я естественно предполагаю также, что начала элементарной теории непрерывных дробей вам известны.

Вы знаете, как представляется данное положительное число со в виде непрерывной дроби: мы вы-

деляем наибольшее целое число п0. содержащееся в о, и полагаем

далее с дробью — мы поступаем так же, как с числом со:

и этот процесс проводим дальше:

Если со есть рациональное число, то этот процесс обрывается после конечного числа ступеней; если же со есть иррациональное число, то процесс продолжается бесконечно45). В любом случае мы будем писать кратко «разложение числа сэ в непрерывную дробь»:

В виде примера приведу разложение в непрерывную дробь числа я:

Если мы оборвем непрерывную дробь на первом, втором, третьем, ... частном, то мы получим

рациональные, так называемые «подходящие дроби»:

Эти дроби представляют собой чрезвычайно хорошие приближения к числу со; выражаясь точнее, каждая из них дает самое лучшее приближение, какого только возможно достигнуть, не увеличивая знаменателя приближенной дроби.

Благодаря этому свойству подходящих дробей теория непрерывных дробей приобретает практически важное значение во всех тех случаях, где нужно выразить иррациональные числа или даже рациональные дроби с большими знаменателями (например, десятичные дроби со многими знаками) в виде дробей с возможно меньшими знаменателями. Насколько хорошее приближение мы получаем, можно видеть из следующей таблички, содержащей запись первых подходящих дробей числа я в виде десятичных дробей:

Кстати, вы замечаете на этих примерах, что подходящие дроби попеременно то больше я, то меньше этого числа; это есть, как известно, общее свойство подходящих дробей: представляя число о) в виде непрерывной дроби, мы заключаем его при помощи подходящих дробей в пределы, постоянно суживающиеся сверху и снизу46). Оживим теперь все эти вещи при помощи геометрического образа. С этой целью представим себе в положительном квадранте плоскости Оху (предполагая, что мы ограничиваемся положительными числами) все точки, которые имеют координатами целые числа: они образуют «целочисленную решетку точек». Будем рассматривать эту решетку — я мог бы даже сказать «это звездное небо» — из начала координат О (рис. 7): луч, идущий от начала

к точке X = а, у = Ь, имеет уравнение

и обратно, на каждом луче — = Х, где X есть рациональное число-г. лежит бесчисленное множество целочисленных точек (та,тb); здесь m — произвольное целое число. Таким образом, из точки О во всех возможных рациональных направлениях и только в этих направлениях мы видим точки нашей решетки; поле зрения всюду плотно заполнено «звездами», но не свободно от пробелов; оно не заполнено ими непрерывно и как бы напоминает «млечный путь». На иррациональном луче

где со — иррациональное число, не лежит, следовательно, ни одна целочисленная точка — факт, замечательный уже и сам по себе. Но, очевидно, такого рода прямая, выражаясь термином, напоминающим дедекиндово определение иррациональных чисел, производит сечение в области всех целочисленных точек; именно, она разбивает их на две группы точек, расположенных справа и слева от прямой. Если мы спросим себя теперь, где же у нашего луча отделяются друг от друга эти группы, то мы придем к чрезвычайно интересному свойству разложения числа со в непрерывную дробь. Именно, если мы отметим точки х = pr, у = qr, соответствующие каждой подходящей дроби —в разложении числа со (рг и qr — взаимно простые числа), то лучи, идущие к этим точкам, должны все ближе и ближе подходить к лучу = © и притом попеременно то с одной, то с другой стороны; это приближение должно происходить

Рис. 7

с такой же быстротой, с какой дробь приближается к иррациональному числу ш. Развитие этой идеи приводит к следующей теореме, которую нетрудно доказать, пользуясь известными в теории чисел свойствами чисел р, и qr.

Представим себе, что во все целочисленные точки воткнуты штифтики или булавки, как на китайском биллиарде. Каждую из двух групп булавок, расположенных справа и слева от луча ~ = со, обведем нитью; если теперь мы натянем каждую нить так, чтобы она охватывала соответствующую группу булавок и прилегала вплотную к ближайшим, то она примет форму выпуклой ломаной линии; вершинами этой ломаной и будут служить точки, координатами Pr, qr которых служат соответственные числители и знаменатели подходящих дробей; при этом слева будут лежать точки, отвечающие четным подходящим дробям, а справа — нечетным.

Этим путем мы приходим к новому и, нужно сказать, чрезвычайно наглядному геометрическому определению разложения числа в непрерывную дробь. Приведенный выше рис. 7 относится к случаю

т. е. к иррациональному числу, выражающему отношение стороны правильного десятиугольника к радиусу описанной вокруг него окружности. Здесь первыми вершинами двух ломаных линий будут

слева: j справа:

Для числа я значения рг, qr возрастают гораздо быстрее, так что нанести соответствующую фигуру на чертеж было бы довольно трудно.

5. Пифагоровы числа. Великая теорема Ферма

Я перехожу теперь к п. 7 раздела 1, к учению о так называемых пифагоровых числах; здесь мы опять воспользуемся наглядными представлениями, но з несколько иной форме. Задача о пифагоровых числах заключается, как известно, в том, чтобы найти целые числа, удовлетворяющие уравнению

а2 + Ь2 = с2. (1)

Положив

(2)

мы рассмотрим вместо уравнения (1) уравнение

(3)

к которому оно приводится при помощи преобразования (2); нам нужно, следовательно, разыскать все рациональные дроби, удовлетворяющие этому уравнению. Имея это в виду, мы рассмотрим совокупность всех рациональных точек на плоскости (т. е. всех точек, которые имеют рациональные координаты g, т)); точки эти образуют в плоскости всюду плотное множество*).

Уравнение (3) выражает окружность на плоскости, описанную из начала координат радиусом, равным единице; наша задача сводится к тому, чтобы определить, как проходит наша окружность в этом плотном множестве рациональных точек, какие из них она содержит. Некоторые из рациональных точек, принадлежащих окружности, мы хорошо знаем наперед: сюда относятся, например, точки ее пересечения с четырьмя осями. Но мы остановимся предпочтительно на точке S(g=—1, Т1 = 0) (рис. 8). Представим себе все лучи, проходящие через точку S; они выражаются уравнением

îl = MÊ+l). (4)

Каждый из этих лучей мы будем называть рациональным или иррациональным в зависимости от того,

Рис. 8

*) См. с, 48.

имеет ли параметр А, рациональное или иррациональное значение.

Теперь нетрудно доказать следующее предложение: каждая рациональная точка окружности проектируется из точки S рациональным лучом ы, обратно, каждый рациональный луч (4) пересекает окружность в рациональной точке.

Первая половина непосредственно ясна47). Вторую мы докажем прямым вычислением. Именно, подставляя выражение (4) для ц в уравнение (3), мы получим для абсциссы точки пересечения уравнение

£2 + Л2(£+1)2=1,

или

(1 + Я*)!2 + 2А* + Л8-1—0.

Но один корень (g =—1), соответствующий точке S, нам известен; для другого корня мы простым вычислением получаем выражение

(5а)

а тогда уравнение (4) дает для ординаты выражение

(5b)

при рациональном Я мы, таким образом, действительно получаем рациональную точку пересечения.

Доказанное предложение можно выразить так: все рациональные точки нашей окружности выражаются формулами (5), где К обозначает любое рациональное число. Этим наша задача собственно решена; нам остается только сделать переход к целым числам.

Для этого мы полагаем

где п и т суть целые числа; тогда выражения (5) принимают вид

Это будет общий вид всех рациональных решений48) уравнения (3). Совокупность всех целых решений первоначального уравнения (1), т. е. всех пифагоро-

вых чисел, содержится, стало быть, в формулах а = т2 — п2, Ь = 2тп, с = т2 + п2\

мы получаем отсюда все решения, не имеющие общих делителей, если числа тип пробегают все пары чисел, взаимно простых между собой49).

Мы пришли, таким образом, к чрезвычайно наглядному решению этого вопроса, которое обыкновенно получается при помощи весьма абстрактных соображений.

Здесь я хочу кстати остановиться на так называемой «великой теореме Ферма». Я поступлю совершенно в духе древних геометров, если перенесу вопрос о пифагоровых числах — в обыкновенной его постановке на плоскости — в пространство более сложной структуры, и именно следующим образом50): возможно ли, чтобы сумма кубов двух51) целых чисел представляла собой полный куб? Или возможно ли, чтобы сумма четвертых степеней представляла собой полную четвертую степень? Вообще, может ли уравнение

xn + yn = zn

при целом52) п быть разрешено в целых числах? Ферма дал отрицательный ответ на этот вопрос, который заключается в следующей теореме, носящей имя ее автора: уравнение

xn + yn = Zn

не имеет целых решений ни при каком п, большем 2.

Позвольте мне начать с некоторых исторических сведений. Ферма жил с 1608 до 1665 г. и был в Тулузе советником парламента, — стало быть, юристом. Но он много занимался математическими вопросами и притом настолько плодотворно, что его следует отнести к числу величайших математиков. Ферма может быть вполне заслуженно отнесен к числу основателей аналитической геометрии, исчисления бесконечно малых и теории вероятностей, но особенно важное значение имеют его труды в области теории чисел. Однако все результаты, полученные им в этой области, оставлены им в виде пометок на полях экземпляра Диофанта, знаменитого эллинского математика, написавшего книгу по теории чисел около 300 г. н. э.,

т. е. приблизительно через 600 лет после Евклида. Эти заметки Ферма были опубликованы его сыном лишь через 5 лет после его смерти; он сам при жизни их не печатал. Среди этих заметок имеется также и «великая теорема», о которой теперь идет речь, с припиской: «я нашел воистину удивительное доказательство, но за недостатком места не могу его здесь привести». Однако по настоящее время не удалось найти доказательства этого предложения.

Чтобы несколько ближе ориентироваться в содержании этой теоремы Ферма, мы, как и в случае я=2, попытаемся сначала найти рациональные решения уравнения

т. е. постараемся представить себе положение заданной этим уравнением кривой относительно рациональных точек плоскости. Рис. 9 и 10 приблизительно изображают кривые53), соответствующие значениям м=3 и п = 4. Они, во всяком случае, содержат точки |=0, т]=1 и g = 1, т] = 0 и при и = 4 соответственно точки 5 = 0, т) = ±1 и g = ± 1, т) = 0. Утверждение Ферма сводится, таким образом, к тому, что эти кривые в противоположность рассмотренной выше окружности извиваются во всюду плотном множестве рациональных точек, не проходя ни через одну его точку, кроме упомянутых выше.

Интерес этого предложения заключается прежде всего в том, что полного его доказательства до сих пор никому не удалось найти, несмотря на все употребленные к этому усилия. Что касается попыток

Рис. 9 Рис 10.

доказательства этого предложения, то здесь на первом месте приходится назвать Куммера, существенно подвинувшего вопрос вперед54). Куммер привел этот вопрос в связь с теорией алгебраических чисел, в частности с числами, к которым приводит задача о делении окружности на равные части. Пользуясь корнем n-й степени из единицы

можно разложить разность г11 — уп на линейные множители; уравнение Ферма принимает тогда вид

иными словами, /г-я степень числа должна разлагаться на множители, которые указанным выше способом составляются из чисел у, z и из числа е. Для такого рода чисел Куммер построил теории, совершенно аналогичные тем, которые издавна известны для целых чисел: он построил понятие о делимости этих чисел, о разложении числа на простые множители и т. д. Сообразно этому мы говорим теперь о целых алгебраических числах и, в частности, о целых числах, к которым приводит задача о делении окружности на равные части. С точки зрения Куммера, предложение Ферма является теоремой о разложении на множители в области чисел е55). Исходя из этих соображений, он и пытается доказать теорему. Это ему действительно удалось для большого количества значений показателя п; в частности, например, предложение им доказано для всех показателей, которые меньше 100. Но между большими числами оказываются исключения, освободиться от которых не удалось ни ему, ни крупнейшим математикам, следовавшим его пути. Я вынужден здесь естественно ограничиться этими указаниями; подробности о состоянии этой задачи вы найдете в «Математической энциклопедии», в конце реферата Гильберта «О теории алгебраических чисел». Гильберт сам принадлежит к числу тех математиков, которые продолжали и развили исследования Куммера56).

Вряд ли можно сомневаться, что «удивительное» доказательство Ферма не попадало в эту область идей. Трудно думать, чтобы он владел операциями

над алгебраическими числами в ту пору, когда относительно мнимых чисел математики еще не были достаточно ориентированы, когда была еще в зачаточном состоянии сама теория чисел, которая именно благодаря глубоким исследованиям Ферма получила импульс к дальнейшему развитию. С другой стороны, очень мало вероятно, чтобы такой математик, как Ферма, в своем доказательстве допустил ошибку, хотя такого рода случаи и бывали у величайших математиков. Нужно думать поэтому, что он нашел доказательство благодаря какой-либо особенно удачной, простой идее57). Но так как мы не имеем никаких указаний, которые позволили бы уловить эту идею, то полное доказательство теоремы Ферма можно, по-видимому, ожидать получить только путем систематического развития работ Куммера.

Эти вопросы в настоящее время особенно привлекают внимание потому, что Гёттингенское ученое общество располагает премией в 100 000 марок за решение задачи Ферма. Это есть завещание скончавшегося около года тому назад математика Вольфскеля из Дармштадта, который, вероятно, всю жизнь занимался этим вопросом и оставил часть своего громадного состояния счастливцу, которому удастся либо доказать это предложение во всей его общности, либо опровергнуть его одним противоречащим примером58). Однако разыскать такой пример, конечно, нелегко, так как для показателей, не превышающих ста, теорема уже доказана, и здесь приходится, таким образом, оперировать с чрезвычайно большими числами. Что должен думать о трудности получить эту премию математик, знакомый с усилиями Куммера и его последователей, это ясно из изложенного мною выше, но широкая публика другого мнения об этом. В конце лета этого года известие о премии было распространено газетами (которые, впрочем, не были к тому уполномочены); с этого времени у нас накопился уже целый склад доказательств. Люди всех профессий — инженеры, народные учителя, священники, банкиры, дамы и т. д. — являются авторами этих работ. Общее во всех этих работах лишь то, что их авторы не имеют ни малейшего представления о серьезном математическом значении проблемы; они не делают даже ни малейшей попытки осведомиться в литера-

туре по этому вопросу, всегда стараются справиться с задачей посредством какой-либо необычайной идеи и, конечно, неизменно попадают впросак. О тех несообразностях, которые появляются в этого рода произведениях, можно прочесть в критических отзывах о подобных доказательствах, которые помещены в большом количестве в журнале «Archiv für Mathematik und Physik», тома XIV, XV, XVI, XVII и XVIII (1901—1911 гг.). Не могу отказать себе в том, чтобы привести особенно разительный пример из этого вороха нелепостей. Человек, не понимающий смысла знака >, вместо

xn + yn = zn (п>2)

читает

xn + yn*=zn (п + 2)

и, конечно, уже при п = 1 находит решение уравнения:

х + у = г-3.

Это открытие он шлет Гёттингенскому ученому обществу и считает математиков такими глупцами, которые способны за это дать такую премию. Но и серьезная математическая мысль получила благодаря всему этому новый толчок к тому, чтобы заняться теоремой Ферма; действительно, здесь можно уже отметить некоторые успехи, хотя само решение проблемы все еще остается очень далеким.

6. Задача о делении окружности на равные части

Теперь обратимся к восьмому из перечисленных в разделе 1 пунктов, — именно, к задаче о делении окружности на равные части. Я буду при этом считать, что действия над комплексными числами вида х + yi и изображение их на так называемой «комплексной плоскости» всем вам уже известны59). Итак, задача заключается в том, чтобы разделить окружность на п равных частей или построить правильный п-угольник. Мы возьмем окружность радиуса 1 с центром в нулевой точке комплексной плоскости и примем точку x + yi = 1 за первую из п точек деления; тогда комплексные числа, соответствующие остальным

вершинам, имеют вид (рис. 11)

Они удовлетворяют поэтому уравнению

2"=1,

и задача о делении окружности на равные части сводится к решению этого простейшего алгебраического уравнения. Так как это уравнение имеет рациональный корень z=l, то двучлен zn— 1 делится на z— 1, и потому мы для остальных корней получаем уравнение

zn~x + zn~2 + z"-3 + ... +

+ z2 + z+l=0.

Это есть уравнение (п—1)-й степени, в котором все коэффициенты равняются единице.

Уже в глубокой древности вызывал большой интерес вопрос о том, какие правильные многоугольники можно построить циркулем и линейкой. В древности же было уже известно, что при п = 2\ 3, 5 (где h — произвольное целое число), а также для составных значений n = 2h-3, м = 2/1-5, п = 2Л-3-5 эта задача решается; на этом месте вопрос остановился вплоть до конца XVIII столетия, когда им занялся молодой Гаусс. Он нашел, что для всех простых п, имеющих вид

(6)

возможно деление окружности на равные части циркулем и линейкой; при других же простых значениях п оно невозможно60). И действительно, первые значения \i — 0, 1, 2, 3, 4 дают в этой формуле простые числа 3, 5, 17, 257, 65 537. Из них первые два случая были уже хорошо известны раньше, а остальные являются новыми. Особенно знаменит правильный семнадцатиугольник, возможность построения которого посредством циркуля и линейки была в этом со-

Рис. 11

чинении в первый раз обнаружена. Впрочем, общий вопрос о том, при каких значениях показателя \х предыдущая формула дает именно простые числа, остается и по сей день нерешенным61). Я и здесь не буду останавливаться на деталях, а предпочту изложить в общих чертах ход и значение этого открытия; подробности же относительно правильного семнадцатиугольника вы найдете в книге Вебера и Вельштейна.

По этому поводу я считаю необходимым особенно обратить ваше внимание на «Дневник» Гаусса, опубликованный в томе 57 журнала «Mathematische Annalen» (1903) и в томе X, I полного собрания сочинений Гаусса (1917). Это небольшая, невзрачная тетрадка, которую Гаусс начал вести с 1796 г., незадолго перед тем, как ему исполнилось 19 лет. Как раз первая запись относится к вопросу о возможности построения правильного семнадцатиугольника. Сделав так рано это важное открытие, Гаусс принял окончательное решение посвятить себя математике. Всякому математику будет очень интересно просмотреть этот дневник, так как здесь можно проследить и за дальнейшими выдающимися работами Гаусса, относящимися к теории чисел, к теории эллиптических функций и т. д.

В первый раз это первое крупное открытие Гаусса было опубликовано 1 июня 1796 г. Это было сделано по почину учителя и покровителя Гаусса, Циммермана из Брауншвейга, который поместил также и от себя короткую заметку об этой статье. Доказательство Гаусс дал в своем основном сочинении по теории чисел: «Disquisitiones arithmeticae», опубликованном в 1801 г.

Здесь мы находим также и вторую, отрицательную часть предложения, которой в упомянутой заметке не было, — именно, что для других простых чисел, которые не могут быть приведены к виду (6), деление окружности на равные части не может быть произведено циркулем и линейкой. Я хочу рассмотреть здесь один частный случай этого важного доказательства невозможности, тем более, что широкая математическая публика имеет очень мало представления о доказательствах невозможности вообще. Современной математике удалось при помощи такого рода доказательств невозможности исчерпать целый ряд знаменитых проблем, над которыми с древних времен

тщетно трудились многие выдающиеся математики. Достаточно указать на задачи о построении правильного семиугольника, о трисекции угла и о квадратуре круга. При всем том имеется много людей, которые и по сей день занимаются этими задачами, не только не имея никакого представления о высшей математике, но и не зная даже постановки вопроса о доказательстве невозможности; сообразно своим познаниям, ограничивающимся большей частью элементарной геометрией, они обыкновенно пытаются преодолеть затруднения вспомогательными прямыми и окружностями и в конце концов нагромождают их в таком количестве, что никто не в состоянии разобраться в получающейся путанице и непосредственно указать автору на его ошибку. Вы напрасно будете ссылаться на существующее доказательство невозможности, так как на этих людей в лучшем случае можно повлиять только прямым указанием допущенной ими ошибки. Каждый сколько-нибудь известный математик каждый год получает целую уйму такого рода посланий, и вы будете получать такие доказательства в большом количестве, когда будете стоять у дела. Очень хорошо, чтобы вы впредь были готовы к этим переживаниям и знали, как себя в этом отношении держать. Я полагаю поэтому, что вам будет полезно ознакомиться с одним из таких доказательств невозможности в простейшей форме.

7. Доказательство невозможности построения правильного семиугольника циркулем и линейкой

Вот я и хочу изложить вам теперь подробное доказательство того, что правильный семиугольник не может быть построен циркулем и линейкой. Известно, что каждое построение, производимое циркулем и линейкой, при переходе к вычислению эквивалентно целому ряду последовательных извлечений квадратного корня62) и что, обратно, каждое такое выражение, содержащее квадратные корни, может быть построено геометрически пересечением прямых и окружностей. Это вы и сами себе легко уясните. Поэтому наше утверждение мы можем аналитически формулировать так: уравнение шестой степени

характерное для правильного семиугольника, не может быть решено при помощи конечного числа операций извлечения квадратного корня. Но это так называемое возвратное уравнение, которое одновременно с каждым корнем z имеет еще корень —. Это и будет тотчас видно, если мы напишем уравнение в таком виде:

(1)

Степень такого уравнения может быть сразу понижена вдвое, если положить z + z~x = х и принять х за новое неизвестное. Простое вычисление дает для х кубическое уравнение

х* + х2-2х-1=0, (2)

и мы видим непосредственно, что уравнения (1) и (2) одновременно либо решаются в квадратных радикалах, либо не решаются. Впрочем, величину x можно привести в непосредственную геометрическую связь с построением правильного семиугольника. Из рис. 12, изображающего в комплексной плоскости окружность радиуса, равного единице, легко усмотреть следующее: если мы обозначим через ф = -у- центральный угол правильного семиугольника и примем во внимание, что z = cos ф +1 sin ф и zrl = cos ф — i sin ф — две вершины, смежные с вершиной 2=1, то окажется, что * = 2cos9; поэтому по данному значению х легко построить семиугольник.

Нам остается обнаружить, что кубическое уравнение (2) не решается в квадратных радикалах. Это доказательство распадается на арифметическую и алгебраическую части; мы начнем с первой части, которая, естественно, примыкает к тем вопросам теории чисел, которыми мы здесь занимаемся. Мы обнаружим сначала, что кубическое уравнение (2) неприводимо, т. е. что его левая часть не может быть разбита на два множителя с рациональными коэффициентами. Заметим прежде всего, что если многочлен третьей

Рис. 12

степени разлагается на множители, то один из множителей имеет первую степень, и потому разложение должно иметь вид

je3 + x2 - 2х - 1 = (х2 + ß x + y) (х + а) ; (3)

нам нужно поэтому доказать, что такое разложение не может иметь места.

Если бы такое разложение имело место, то уравнение (2) необходимо имело бы рациональный корень —а. Положим — а= где р и q— целые взаимно простые числа. Если бы это число удовлетворяло уравнению (2), то имело бы место равенство

р3 + Р2?-2рс72-с73 = 0.

Но в таком случае число р3 делилось бы на q, а так как р и q — числа взаимно простые, то и само число р делилось бы на q. Но совершенно так же можно показать, что q3, а следовательно и q, делится на р. Итак, р и q должны были бы быть целыми взаимно простыми числами, которые, однако, делятся друг на друга. Ясно, что это возможно только в том случае, когда р=±<7 = ±1. Иными словами, уравнение (2) должно было бы при этих условиях иметь корень, равный ±1. Но непосредственное вычисление обнаруживает, что это места не имеет. Сделанное допущение, таким образом, неправильно, т. е. разложение (3) не имеет места.

Вторая часть доказательства должна теперь заключаться в том, чтобы обнаружить, что неприводимое кубическое уравнение с рациональными коэффициентами не может быть решено при помощи квадратных радикалов. Эта часть доказательства имеет существенно алгебраический характер; однако для цельности изложения мы приведем его здесь. Мы дадим нашему предложению несколько иное и именно положительное выражение. Если уравнение третьей степени с рациональными коэффициентами

f(x)**x3 + Ax2 + Bx + C*~0 (4)

решается в квадратных радикалах, то оно необходимо имеет рациональный корень, а потому будет приводимым; в самом деле, существование рационального

корня а равносильно тому, что функция f(x) имеет рациональный множитель х — а.

Этому доказательству необходимо предпослать классификацию всех выражений, составленных из квадратных радикалов, — вернее сказать, всех выражений, составленных из конечного числа квадратных корней и рациональных чисел при помощи рациональных операций, например

где а, 6, ..., /— рациональные числа. Мы здесь, естественно, имеем в виду только такие радикалы, в которых нельзя произвести точного извлечения корня. Эта классификация составляет важнейший пункт всего рассуждения.

Каждое выражение такого рода представляет собой рациональную функцию некоторого числа квадратных радикалов, в нашем примере трех. Мы обратимся прежде всего к одному из этих радикалов, который может иметь, впрочем, сколь угодно сложное строение. Под порядком такого радикала мы будем понимать число входящих в его состав и стоящих один внутри другого радикалов. Таким образом, в предыдущем выражении знаменателем служит радикал 3-го порядка, в числителе же первый радикал имеет порядок 2, второй — порядок 1.

В произвольном «квадратно-радикальном выражении» (т. е. выражении, составленном из квадратных радикалов) мы по этому правилу устанавливаем числа, выражающие порядки отдельных «простых квадратно-радикальных выражений», из которых уже составляется рационально все наше выражение и которые не сводятся к радикалам низшего порядка; наибольшее из этих чисел р, принимается за порядок всего выражения. В нашем примере р, = 3. Однако в состав нашего выражения может входить несколько «простых квадратно-радикальных выражений» порядка fx; число их — так называемое «число членов» квадратно-радикального выражения — мы обозначим через п и примем за второе характерное число нашего выражения. При этом предполагается, что ни одно из этих п простых квадратно-радикальных

выражений ji-го порядка не выражается через остальные с помощью выражений низшего порядка63). Так, например, в выражении первого порядка

число ^радикальных членов есть 2, а не 3, потому что V6 = л/2 • л/3- В приведенном выше выражении а (3-го порядка) число членов равно 1.

Таким образом, каждому квадратно-радикальному выражению мы отнесли два числа \i и п, которые мы в виде символа (ц, п) будем называть характеристикой или рангом выражения. Из двух квадратно-радикальных выражений различного порядка мы припишем низший ранг тому, которое имеет низший порядок; из двух же выражений одинакового порядка мы припишем низший ранг тому, которое имеет меньше членов. Таким образом, выражениями самого низшего ранга являются те, которым соответствует порядок 0, т. е. рациональные числа.

Предположим теперь, что корень х\ кубического уравнения (4) может быть выражен через квадратные радикалы, именно, может быть представлен выражением ранга _(|л, п). Выделяя один из п членов Iii-го порядка V#> мы можем написать этот корень в виде

где каждое из выражений а, ß, -у, ô содежит уже не более п—1 членов ji-ro порядка, a R — выражение (\х—1)-го порядка. С другой стороны, выражение y — во всяком случае, отлично от нуля, иначе радикал д/# был бы равен y/ô, т. е. выражался бы рационально через остальные п—1 членов ц-го порядка, фигурирующих в выражении х\% а потому был бы лишним радикалом, от него можно было бы освободиться. Мы можем поэтому умножить числитель и знаменатель дроби х\ на у — Ьл/R и тогда получим

где Р и Q — рациональные функции от а, ß, у, ô и /?, a поэтому содержат не более п— 1 членов ц-го порядка или же содержат только члены более низкого порядка; эти выражения имеют поэтому ранг не выше (ц,, л — 1). Если мы подставим это выражение в уравнение (4), то получим

Выполнив все возведения в степень, мы приведем это соотношение к виду

где M, N — полиномы, зависящие от Р, Q, /?, т. е. рациональные функции от а, ß, у, ô, R. Если бы N было отлично от нуля, то мы получили бы У/? = — т. е. этот радикал выражался бы рационально через а, ß, у, 6 и /?, т. е. максимум через п—1 членов р,-го порядка и через члены (\i—1)-го порядка, но это, как мы уже указали выше, места иметь не может. Отсюда следует, что необходимо N = 0, а потому и M = 0. Отсюда мы заключаем, далее, что и

есть корень нашего кубического уравнения; в самом деле, совершенно ясно, что

Но теперь доказательство быстро и очень любопытно заканчивается. Если Хг — третий корень уравнения, то, как известно,

х\ "Ь х2 Н~ *з= — х3 = — А — (х{ + х2) = — А — 2Р.

Это выражение имеет тот же ранг, что и Р, т. е. низший, чем х\. Если Xz уже есть рациональное число, то наша теорема доказана. В противном случае мы можем сделать этот корень точкой отправления того же рода рассуждений; тогда окажется, что более высокий ранг двух первых корней мог представлять собой

только иллюзию, так как один из них, во всяком случае, должен иметь еще более низкий ранг, нежели Хг. Продолжая это рассуждение, мы переходим от одного корня к другому и всякий раз убеждаемся, что корень должен быть ступенью ниже. Вследствие этого мы в конце концов необходимо должны прийти к корню порядка \х = О, т. е. мы приходим к заключению, что наше уравнение третьей степени действительно имеет рациональный корень. Тогда мы уже не имеем возможности вести то же рассуждение дальше; два других корня в этом случае либо также должны быть_ рациональными, либо должны иметь вид PdtQ^Ry где Р, Q и R — рациональные числа. Но этим доказано, что функция f(x) разлагается на множители, из которых один первой, а другой — второй степени; это функция приводимая. Итак, никакое неприводимое уравнение третьей степени, — в частности, наше уравнение правильного семиугольника — не решается в квадратных радикалах. Этим доказано вместе с тем, что правильный семиугольник не может быть построен циркулем и линейкой.

Вы видите, как просто и наглядно проводится это доказательство, и как мало познаний оно, собственно, предполагает. Некоторые части доказательства, особенно рассуждения относительно классификации квадратно-радикальных выражений, требуют довольно серьезной математической абстракции. Я не берусь поэтому судить, можно ли это доказательство считать доказательством достаточно простым, чтобы убедить профанов, о которых шла речь выше, в тщетности их попыток найти элементарное решение задачи. Все же мне кажется, следует всякий раз делать попытку медленно и подробно разъяснить им доказательство.

В заключение я хочу еще привести некоторую литературу, относящуюся частью к вопросу о правильных многоугольниках, частью же к вопросу о выполнимости геометрических построений вообще. В первую очередь приходится указать опять на «Энциклопедию элементарной математики» Вебера и Вельштейна, т. I (гл. XVIII и XX), затем могу указать недавно выпущенный в Болонье Энрикесом сборник под общим заглавием «Вопросы элементарной геометрии»64), который ориентирует вас в этих вопросах.

Этим я заканчиваю обзор вопросов, относящихся к теории чисел, оставляя последний из них — доказательство трансцендентности чисел — к концу лекций.

Мне остается рассмотреть последнюю ступень в деле расширения понятия числа.

IV. КОМПЛЕКСНЫЕ ЧИСЛА

1. Обыкновенные комплексные числа

Позвольте мне предпослать несколько исторических указаний о развитии этих чисел. Впервые мнимые числа появляются в 1545 г. у Кардано (Cardano), но и то случайно, при решении кубического уравнения. Относительно их дальнейшего развития можно повторить замечание, сделанное нами по поводу отрицательных чисел: помимо и даже против воли того или другого математика мнимые числа снова и снова появляются при вычислениях, и лишь постепенно, по мере того как обнаруживается польза от их употребления, они получают все более и более широкое распространение.

Конечно, математики делали это не с легким сердцем; мнимые числа долго сохраняли несколько мистическую окраску, какую они и теперь еще имеют в глазах ученика, который впервые слышит об этом удивительном i= л]— 1- Для подтверждения я хочу привести вам одну крайне характерную фразу Лейбница, относящуюся к 1702 г.; вот она: «Мнимые числа — это прекрасное и чудесное убежище божественного духа, почти что сочетание бытия с небытием». В XVIII в. логическая сторона вопроса еще нисколько не выясняется, но благодаря Эйлеру устанавливается фундаментальное значение мнимых чисел в теории функций: в 1748 г. Эйлер нашел удивительное соотношение

вскрывающее внутреннюю связь тех видов функциональной зависимости, которые встречаются в элементарном анализе. Лишь XIX в. принес с собой логически ясное понимание сущности комплексных чисел. Здесь прежде всего надо указать на геометрическую интерпретацию, к которой почти одновременно пришли

многие исследователи на рубеже двух столетий. Достаточно будет указать на того, кто, несомненно, наиболее глубоко проник в сущность вопроса и дольше всех оказывал влияние на ученый мир, на нашего соотечественника Гаусса; уже в 1797 г., как видно из упомянутого выше его дневника, он вполне владел этой интерпретацией, но он опубликовал ее лишь гораздо позже. Вторым завоеванием XIX в. является создание чисто формального обоснования комплексных чисел, которое сводит это учение к теории действительных чисел; им мы обязаны английским математикам 30-х годов.

Остановимся подробнее на этих двух способах обоснования теории комплексных чисел; эти способы господствуют до настоящего времени. Станем сперва на чисто формальную точку зрения, согласно которой правильность образования новых понятий обусловливается не значением самих объектов, а отсутствием внутреннего противоречия в правилах действий. С этой точки зрения введение комплексных чисел представляется в следующем виде, свободном от всяких следов чего-либо таинственного:

1. Комплексное число x + iy есть соединение двух действительных чисел х, у в одну числовую пару, относительно которой принимаются следующие положения:

2. Два комплексных числа х + iy, х' + it/ считаются равными в том и только в том случае, когда х = х\ У = У'-

3. Сложение и вычитание определяются так:

Легко видеть, что при этих условиях остаются в силе все правила сложения, кроме закона монотонности, который не может быть сохранен в старой формулировке, так как комплексные числа по самой своей природе не допускают того расположения в ряд по их величине, которое свойственно натуральным и вообще действительным числам. Ради краткости я не вхожу в рассмотрение той измененной формы, которую приходится поэтому дать закону монотонности.

4. Что касается умножения, то мы устанавливаем, что вычисления производятся так же, как с обыкно-

венными буквами, но только при этом мы всегда принимаем i2 = —1, так что, например,

(X + 1у) (*' + If) = - УУ') + i (ху' + х'у).

В результате имеют место все законы умножения, кроме закона монотонности.

5. Деление определяется как действие, обратное умножению; в частности,

в чем легко убедиться перемножением.

Это действие выполнимо всегда, кроме случая X = у = 0, т. е. сохраняется невозможность деления на нуль65).

Из всего этого следует, что вычисления с комплексными числами не могут привести к противоречиям, так как мы свели эти вычисления целиком к действительным числам и к известным действиям над ними, а эти последние мы здесь будем считать свободными от противоречий66).

После этих чисто формальных рассуждений, естественно, возникает вопрос: возможно ли такое геометрическое или какое-нибудь другое наглядное истолкование комплексных чисел и операций над ними, которое давало бы в то же время наглядное обоснование отсутствия в них внутренних противоречий.

Всем вам известно — к тому же мне уже приходилось упоминать об этом, — каким образом совокупность точек плоскости в системе координат х, у рассматривают как изображение совокупности комплексных чисел X + iy- Сумма двух чисел z + а получается тогда посредством известного построения параллелограмма по соответствующим этим числам точкам67) и по началу координат О (рис. 13), между тем как произведение z-a получается при помощи точки-единицы 1 (х = 1, у = 0) посредством построения треугольника, подобного треугольнику aOl. Другими

Рис. 13

словами, сложение z' = z + а изображается параллельным переносом плоскости, а умножение z' = = z-a — подобным преобразованием, т. е. поворотным растяжением при неподвижном начале О68), Этих указаний вполне достаточно, чтобы напомнить вам постановку вопроса.

Я хочу воспользоваться здесь случаем, чтобы указать вам на то место у Гаусса, где это обоснование комплексных чисел посредством геометрической интерпретации их высказано вполне отчетливо, благодаря чему оно впервые получило всеобщее признание. В одной работе 1831 г. Гаусс занимается теорией целых комплексных чисел а + ib, где а и Ъ — целые действительные числа, и распространяет на них теоремы обыкновенной теории чисел относительно простых множителей, квадратичных и биквадратичных вычетов и т. д. О подобных обобщениях теории чисел мы уже упоминали по поводу великой теоремы Ферма.

В собственном сообщении об этой работе Гаусс говорит о том, что он называет «истинной метафизикой мнимых чисел». Здесь он основывает оправдание действий с комплексными числами исключительно на том обстоятельстве, что этим числам и действиям над ними можно дать указанное выше наглядное геометрическое толкование; таким образом, Гаусс нисколько не становится на формальную точку зрения. Вообще же эти довольно длинные, весьма красиво написанные рассуждения Гаусса в высшей степени интересны и заслуживают того, чтобы вы их прочитали. Упомяну еще только о том, что в этой статье Гаусс предлагает вместо слова «мнимый» (imaginär) более ясное слово «комплексный», которое действительно вошло в употребление.

2. Высшие комплексные числа, в особенности кватернионы

У всякого основательно занимавшегося комплексными числами возникает вопрос: нельзя ли построить другие высшие комплексные числа с большим числом новых единиц, а не с одной только /, и целесообразно определить действия над ними? К положительным результатам в этой области впервые пришли около 1840 г. независимо друг от друга Г. Грассман в

Штеттине*) и Гамильтон в Дублине. С изобретением Гамильтона, так называемым исчислением кватернионов, я хочу познакомить вас несколько ближе. Но сперва я скажу несколько слов об общей постановке проблемы.

Обыкновенные комплексные числа x + iy можно рассматривать как линейные комбинации вида

X • 1 + у • /,

построенные из двух различных единиц 1 и i с помощью параметров ху у. Аналогично этому станем рассматривать сколько угодно — скажем п — различных между собой единиц ей ^2, .. •, еп и назовем системой высших комплексных чисел, построенной из этих единиц, совокупность комбинаций вида

составленных с помощью п произвольных действительных чисел Хи *2, ..., хп.

Само собою разумеется, что два таких комплексных числа, например х и у = у\в\ + у2е2 + ... + Упеп, мы будем считать равными тогда и только тогда, когда коэффициенты при отдельных единицах, так называемые составляющие комплексного числа, попарно равны между собой:

Х\ — Уи *2 = У2> •••> Хп = Уп>

Столь же естественно и определение сложения и вычитания, которое попросту сводит эти операции к сложению и вычитанию составляющих:

Труднее и интереснее обстоит дело с умножением.

Здесь мы, конечно, начинаем с того, что поступаем по общим правилам буквенного исчисления, умножая каждый /-й член выражения х на каждый k-n член выражения у (i, k — 1, 2,..., п) :

Но чтобы этот результат умножения также представлял собой некоторое число нашей системы, необ-

*) Ныне г. Щецин в Польской Народной Республике.

ходимо обладать правилом, которое изображало бы произведения егвк в виде комплексного числа системы, т. е. в виде линейной комбинации единиц; необходимо иметь, следовательно, п2 равенств такого вида:

Тогда, действительно, произведение

представит собой некоторое число нашей системы. В установлении этого правила умножения, т. е. схемы коэффициентов ciki, заключается характеристика каждой конкретной системы комплексных чисел.

Если определить деление как действие, обратное умножению, то оказывается, что деление не всегда выполнимо даже и в том случае, когда делитель не обращается в нуль. В самом деле, определение у из уравнения x-y = z получается посредством решения п линейных уравнений

(/, k = 1, 2, 3, ..., п в каждом суммировании) с неизвестными у\, У2, ..., Уп, но эти уравнения в том случае, когда их определитель обращается в нуль, либо вовсе не имеют решений, либо имеют их бесчисленное множество; в этом случае все г% могут равняться нулю, хотя и не все yk = 0, т. е. произведение двух чисел может обращаться в нуль, хотя ни один сомножитель не равен нулю (такие числа называются делителями нуля). Только с помощью специального искусного подбора коэффициентов Сш можно достичь здесь сохранения свойства обыкновенных чисел, заключающегося в отсутствии делителей нуля; правда, более подробное изучение вопроса показывает, что при п > 2 сохранение того свойства всегда покупается ценою отказа от одного из других правил действий69); поэтому стараются распорядиться так, чтобы этим невыполняющимся свойством оказалось такое, которое наименее важно для соотношений, составляющих цель исследования.

Все эти общие рассуждения мы теперь проследим на кватернионах, которые ввиду их применений в физике и механике представляют, несомненно, самую важную систему высших комплексных чисел. Как видно из их названия, это — четырехчленные числа (п = 4). В частном случае они вырождаются в трехчленные векторы; последние стали теперь общеизвестными, и о них, вероятно, при случае упоминают и в школе.

За первую из четырех единиц, из которых составляются кватернионы, как и в случае обыкновенных комплексных чисел, принимают обыкновенную единицу 1. Три другие единицы обыкновенно обозначают по Гамильтону через i, /, k, так что общий вид кватерниона получается такой:

q = d + te + jb + kcf

где a, b, ct d — действительные параметры (составляющие или коэффициенты кватерниона). Первую составляющую d, на которую умножается 1 и которая аналогична действительной части обыкновенного комплексного числа, называют скалярной составной частью кватерниона, совокупность же трех остальных членов ai + bj + ck называют его векторной частью.

Относительно сложения вряд ли можно что-либо прибавить к предыдущим общим соображениям; поэтому я дам вам сразу же естественное геометрическое истолкование его, основанное на известной вам интерпретации векторов. А именно, представим себе отрезок, соответствующий векторной части кватерниона q и имеющий проекции а, Ь, с на оси координат; этому вектору припишем вес, равный скалярной части d. После этого сложение векторов q и q' = d' + te' + \b' + kc' сводится к следующему: мы строим равнодействующую обоих отрезков по известному правилу параллелограмма для сложения векторов (рис. 14) и приписываем ей в качестве веса сумму весов обоих слагаемых; этим путем мы действительно получаем вектор, представляющий собой кватернион:

Рис. 14

Со специальными свойствами кватернионов мы встречаемся впервые, когда переходим к умножению; именно, они заключаются, как мы видели это в общей теории, в том, как устанавливаются значения произведений единиц. Я покажу вам прежде всего, каким кватернионам Гамильтон приравнивает 16 произведений основных единиц. Первое условие состоит в том, чтобы с первой единицей 1, как это показывает само ее обозначение, производить вычисления, как с действительным числом 1; следовательно,

р=1, f. 1 = 1 ./ = /, /. 1 = 1 ./ = /,

fe. 1 = 1 .k = k.

Но существенно новыми являются условия относительно квадратов трех других единиц:

и относительно их произведений; полагаем

/•* = + '• k • i = + /, I • / = + k,

между тем как при обратном порядке сомножителей полагаем

k • / = — /, i • k = — /, / • i = — ft.

При этом сразу бросается в глаза, что переместительный закон умножения, вообще говоря, не имеет места; с этим неудобством приходится примириться, чтобы спасти однозначность деления и ту теорему, по которой произведение двух чисел только в том случае может обратиться в нуль, когда один из сомножителей становится равным нулю. Мы сейчас увидим, что этот и все другие законы сложения и умножения, за единственным указанным исключением, действительно остаются в силе и что, следовательно, сделанные выше простые условия являются в высшей степени целесообразными.

Начнем с того, что составим произведение двух кватернионов в общем виде:

q' = p-q = (d + ia + jb + kc) • {w + ix + jy + kz),

принимая во внимание данную последовательность сомножителей. Перемножая почленно, заменяя произведения единиц их значениями из нашей таблицы

умножения и соединяя затем члены с одинаковыми единицами в один, находим

Таким образом, составляющие кватерниона-произведения представляют собой определенные простые билинейные70) комбинации составляющих обоих сомножителей. При перемене порядка сомножителей шесть подчеркнутых членов меняют свои знаки, так что q-p, вообще говоря, существенно отлично от p-q и притом не только по знаку, как это имеет место для произведений отдельных единиц.

В то время как переместительность, как мы видим, не имеет места, законы распределительности и сочетательности остаются в силе. Действительно, если вычислить, с одной стороны, произведение p(q + q\)> а с другой, выражение pq + pqu формально перемножая члены, и не заменять произведений единиц их значениями, то должны получиться тождественные выражения; но это тождество не нарушится, если затем к тому и другому выражению применить таблицу умножения единиц. Далее, нетрудно видеть, что и закон сочетательности должен остаться всегда в силе, если только он действителен для умножения единиц. А этот последний факт можно установить непосредственно, на основании таблицы умножения, как я покажу на таком примере:

(ij)k = i(jk).

В самом деле,

(*7) k = k • k = — l,

и

/ (/Ä) = £./ = _ 1.

Перейдем к делению. Достаточно показать, что всякому кватерниону p = d + i-a + j-b-\-k-c отвечает вполне определенный другой кватернион q, удовлетворяющий условию

p-q=l;

представляется целесообразным обозначить это q через71) 1/р. Деление в общем случае легко сводится к этому частному случаю. Чтобы определить это q, полагаем предыдущее выражение для p-q равным 1, т. е. 1 = 1+ 0-f+ 0-/ + 0-Ä; приравнивая составляющие, получаем следующие четыре уравнения для четырех неизвестных составляющих х9 у, z, w кватерниона q:

Разрешимость подобной системы уравнений зависит, как известно, от ее определителя; в данном же случае мы имеем так называемый кососимметрический определитель, т. е. такой, в котором элементы, лежащие симметрично по отношению к главной диагонали (идущей от верхнего элемента слева к нижнему элементу справа), отличаются друг от друга только знаками, между тем как все элементы главной диагонали равны между собой. Теория определителей дает очень простую формулу для вычисления такого рода определителя, а именно, в данном случае оказывается

в справедливости этого равенства можно легко убедиться и непосредственным вычислением. В том обстоятельстве, что этот определитель оказывается равным как раз некоторой степени суммы квадратов четырех составляющих, и заключается собственно тонкий и глубокий смысл условий Гамильтона; именно, из этого обстоятельства вытекает, что определитель всегда отличен от нуля, кроме того случая, когда одновременно а = b = с = d = 0\ поэтому, за исключением одного только этого случая (р = 0), уравнения однозначно разрешаются, и обратный кватернион q оказывается, таким образом, однозначно определенным.

Если положить

(эту величину, играющую большую роль в теории кватернионов, называют модулем кватерниона72)), то легко убедиться непосредственной подстановкой, что это однозначное решение выражается так:

так что окончательный результат получается такой:

Вводя аналогично теории обыкновенных комплексных чисел кватернион

p — d — ia — jb — kc

под названием сопряженного с р, можно последнюю формулу написать еще и в таком виде:

или

эти формулы являются непосредственными обобщениями известных свойств обыкновенных комплексных чисел. А так как и, обратно, р является сопряженным с р числом, то также

так что в этом частном случае имеет место переместительность сомножителей.

Теперь мы в состоянии сразу получить решение задачи деления в общем виде.

Если положим

pq = q'

и обе части этого равенства умножим слева на

то получим

или

так как

Уравнение же qp = q', отличающееся от первого только тем, что неизвестный сомножитель q занимает первое место, имеет, вообще говоря, другое решение:

Возникает вопрос, нельзя ли найти такую геометрическую интерпретацию, при которой эти действия и их законы являются чем-то естественным.

Чтобы прийти к такой интерпретации, начнем с частного случая, когда оба сомножителя сводятся к простым векторам, т. е. когда скалярные части d = w = 0. Тогда наша общая формула для произведения (с. 93) принимает такой вид:

q' = p.q = (ia + jb + kc) • (ix + jy + kz) =

= — (ax + by + cz) + i (bz — cy) +

+ j (cx — az) + k (ay — bx);

мы видим, что произведение двух кватернионов, сводящихся к одним только векторам, состоит из двух частей — скалярной и векторной. Эти составные части нетрудно привести в связь с общепринятыми теперь видами произведений векторов. Эти понятия, гораздо более распространенные в Германии, чем кватернионы, ведут начало от Грассмана, хотя само слово «вектор» английского происхождения. Те два вида произведений векторов, с которыми обыкновенно оперируют, носят теперь большей частью названия внутреннего или скалярного произведения ах+ by + cz9 которое, таким образом, только знаком отличается от скалярной части написанного выше произведения кватернионов, и внешнего или векторного произведения i {bz — су) + у (сх — az) + k{ay — — bx), которое равно векторной части произведения кватернионов. Построим оба вектора (а,Ь,с) и (х, у, z) в виде направленных отрезков, исходящих из начала координат О (рис. 15); их концы будут находиться в точках (а, Ь, с) и (х, у, z); длины их равны

Если через <р обозначить угол между обоими отрезками, то, согласно

Рис. 15

известным теоремам аналитической геометрии,— в подробности я не вхожу — внутреннее произведение равно

ах + by + cz = / • V • cos <р.

Внешнее произведение само представляет собой вектор, который, как нетрудно видеть, направлен перпендикулярно плоскости векторов /, /'; его длина оказывается равной M'«sinq).

Существенным является вопрос о направлении вектора-произведения еще в том смысле, в какую сторону плоскости, определяемой векторами I и /', надо его откладывать. Это направление меняется в зависимости от принятой системы координат. А именно, существуют, как вам известно, две различные, не могущие быть совмещенными системы прямоугольных координат; при соответственно одинаковом направлении двух пар осей у них (например, осей у и z) третьи оси — оси X—имеют прямо противоположные направления. Такие две зеркально симметричные системы находятся одна к другой в таком же отношении, как правая рука к левой; действительно, их можно различать, пользуясь следующим простым мнемоническим правилом: оси xt у, z одной системы расположены, как расставленные пальцы — большой, указательный и средний — правой руки, оси лс, у, z другой системы — как те же пальцы левой руки (рис. 16). В литературе постоянно встречается то одна, то другая система; в различных странах, в различных дисциплинах и, наконец, у различных авторов господствуют различные системы.

В простейшем случае, когда р = /, q = /, т. е. когда р и q равны единичным векторам, направленным вдоль осей X и у, их внешнее произведение в силу

Рис. 16

условия i'j = k оказывается равным единичному вектору, лежащему на оси z (рис. 17). Но i и /' можно, непрерывно изменяя, превратить в любые векторы р и <773); при этом k перейдет непрерывным образом в векторную составную часть произведения p*q, ни разу не обращаясь в течение этого процесса в нуль; поэтому первый и второй сомножители и само векторное произведение всегда должны быть расположены друг относительно друга так, как оси х, у, z системы координат, т. е. должны представлять «правую» или «левую» тройку в зависимости от того, какая система принята для координатных осей. Мне хочется прибавить несколько слов по поводу прискорбного вопроса о системе обозначений в векторном анализе. Дело в том, что для каждого действия с векторами употребляется большое количество различных знаков, и, к сожалению, до сих пор еще не удалось создать одну-единственную общеобязательную систему обозначений. Четыре года назад на съезде естествоиспытателей в Касселе (1903) с этой целью была даже избрана особая комиссия, но члены ее не могли вполне столковаться, а так как каждый из них все же имел доброе желание сделать шаг от своей первоначальной точки зрения навстречу другим взглядам, то единственным результатом явилось возникновение трех новых обозначений! После этого и других аналогичных случаев я пришел к тому заключению, что действительное объединение всех заинтересованных в таких вещах кругов на почве одних и тех же словесных и письменных обозначений возможно только в тех случаях, когда к этому побуждают в высшей степени важные материальные интересы. Только под таким давлением могло произойти в 1881 г. в электротехнике всеобщее признание единообразной системы мер вольт—ампер — ом и последующее закрепление ее государственным законодательством, так как промышленность настойчиво требовала подобного единства мер как основы всех операций. За векторным исчислением еще не стоят такие могущественные материальные стимулы, и поэтому приходится пока что — плохо ли, хорошо ли — мириться с тем, что каждый отдельный математик остается при привыч-

Рис. 17

ном для него способе обозначений, который он считает наиболее удобным или даже — если он несколько склонен к догматизму — единственно правильным.

3. Умножение кватернионов и преобразование поворотного растяжения в пространстве

Теперь перейдем к геометрической интерпретации умножения кватернионов в общем виде, предпослав ей следующее замечание.

Если в произведении q' = pq заменить р и q их сопряженными значениями р, q, т. е. если изменить знаки при а, &, с, х, у, z на обратные, то в формуле произведения скалярная часть останется без изменения, а в векторной части только неподчеркнутые*) множители при /, /, k изменят свои знаки на обратные. Если же одновременно изменить и порядок множителей р, q, то и подчеркнутые множители изменят знаки, так что q -р представляет собой как раз сопряженное значение q': если q' = p-q, то q' = q-p.

Перемножая оба равенства, находим

(f .q' = p-q.q.p.

При этом порядок множителей играет существенную роль, но мы вправе применить сочетательный закон и написать

qf .q' = p.(q.q).pu

Но, как мы видели выше, q-q = х2 + у2 + г2 + до2, так что окончательно получаем

Здесь второй множитель в правой части есть скаляр, а при умножении скаляра M на кватернион имеет силу переместительный закон, так как

Поэтому в данном случае

а так как р-р есть квадрат модуля кватерниона р, то

*) См. с. 93.

другими словами: модуль произведения двух кватернионов равен произведению модулей обоих сомножителей. Конечно, эту формулу можно получить и непосредственным вычислением, если подставить вместо w\ я', у\ z' их выражения из формулы умножения на с. 93.

Теперь будем интерпретировать кватернион q как направленный отрезок в пространстве четырех измерений, идущий от начала координат к точке х, у, г, wf вполне аналогично интерпретации вектора в трехмерном пространстве. В настоящее время не приходится, конечно, извиняться, когда призываешь на помощь четырехмерное пространство, как то было необходимо в то время, когда я был студентом. Все вы знаете, что здесь не скрывается никакой метафизической идеи, а многомерное пространство попросту есть удобное аналогичное нашему действительному представлению о пространстве средство математического способа выражения74).

Если сохранять постоянным множитель р, т. е. величины d, а, Ъ, с, то уравнение в кватернионах q' — = p-q описывает некоторое линейное преобразование точек X, у, г, w четырехмерного пространства в точки х\ у\ z\ w\ относя каждому четырехмерному вектору некоторый другой вектор; в явном виде уравнения преобразования получаются путем сравнения коэффициентов в формуле произведения на с. 93. Но из только что полученного соотношения для модулей видно, что при этом расстояние <\Jх2 + у2 + z2 + w2 всякой точки от начала умножается на один и тот же постоянный множитель Т = д/а2 + Ь2 + с2 + d2; кроме того, как мы видели, определитель линейного преобразования всегда имеет положительное значение. С другой стороны, из аналитической геометрии в трехмерном пространстве известно, что линейное преобразование X, у у Zy которое преобразует сумму х2 + + У2 + z2 в себя (так называемое «ортогональное» преобразование) и которое, кроме того, имеет положительный определитель,- изображает поворот пространства вокруг начала координат и что всякий поворот может быть так представлен. Если же линейное преобразование умножает х2 + у2 + z2 на некоторый множитель Т2 и определитель по-прежнему имеет по-

ложительное значение, то получается поворот в соединении с растяжением всего пространства до Г-кратных размеров при неподвижном начале координат. Такого рода преобразование мы будем называть поворотным растяжением. Сказанное справедливо не только для трехмерного пространства, но и для четырехмерного. Мы будем говорить, что наше линейное преобразование в точно таком же смысле выражает поворот и растяжение четырехмерного пространства.

Однако нетрудно видеть, что это еще не самый общий случай возможных преобразований поворотного растяжения. Действительно, наше преобразование содержит только четыре произвольных параметра а, &, с, dy тогда как мы сейчас увидим, что самое общее преобразование поворотного растяжения четырехмерного пространства /?4 содержит семь таких параметров. А именно, чтобы общее линейное преобразование изображало поворотное растяжение, необходимо должно иметь место следующее тождество:

это дает нам при сравнении коэффициентов 10 условий, так как левая часть после замены х'у ..., w' их выражениями через х, ..., w переходит в квадратичную форму четырех переменных и поэтому содержит 4 • 5 —^- ==10 членов. Но так как Т остается произвольным, то всего имеем 10— 1 = 9 условий для 16 коэффициентов линейного преобразования, так что действительно остается еще 16 — 9 = 7 произвольных параметров.

Но оказывается возможным — и это наиболее удивительно— получить с помощью перемножения кватернионов наиболее общий вид преобразования поворотного растяжения. А именно, если я = ô + ia + + /ß + ky — некоторый постоянный кватернион, то можно показать подобно тому, как это было сделано выше, что и q' = q-n (что отличается от предыдущей формулы только изменением порядка сомножителей) представляет преобразование поворотного растяжения четырехмерного пространства 7?4, а вследствие этого и последовательное выполнение обоих преобразований:

дает такое же преобразование. Но это преобразование содержит как раз семь произвольных параметров, так как оно остается неизменным, если а, &, с, d умножить на одно и то же действительное число и в то же время разделить а, ß, у> Ô на это же число; поэтому представляется вероятным, что это— общий вид преобразований поворотного растяжения в пространстве четырех измерений; эта красивая теорема действительно была доказана Кэли. Я ограничусь здесь этими историческими указаниями, чтобы не затеряться в деталях этой интерпретации. Указанная формула находится в работе Кэли 1854 г.

Другое большое преимущество формулы Кэли заключается в том, что она дает весьма наглядное представление о результате последовательного выполнения двух поворотных растяжений. Действительно, если еще одно такое преобразование дано уравнением

q» = w" + /я" + \у» + kz" = p'-q'- я',

где р', л'—некоторые заданные кватернионы, то, подставляя указанное выше значение q', получаем

q" = р' • (р • q • я) • я';

на основании сочетательного закона умножения находим

q" = (p'.p).q.(n-n') = r-q-о,

где

г = р • р, <У = я • я .

Получается снова выражение поворотного растяжения, переводящего q в q'\ как раз в прежнем виде, а именно, левым и правым множителями при q служат произведения обоих левых и соответственно правых множителей в выражениях последовательно производимых поворотных растяжений (причем порядок играет существенную роль).

Но вы, может быть, недовольны этой четырехмерной интерпретацией и хотите что-либо более наглядное, основанное на обычном трехмерном представлении о пространстве. В таком случае посредством простой специализации я постараюсь получить из предыдущих формул формулы для аналогичных операций в трехмерном пространстве; в этих именно формулах и заключается громадное значение умножения ква-

тернионов для обыкновенной физики и механики; я говорю нарочно — для обыкновенной, чтобы не предрешать дальнейшего развития этих дисциплин, благодаря которому могут получить непосредственное приложение и предыдущие интерпретации. И это время, может быть, ближе, чем вы думаете; новейшие исследования в теории электронов в том виде, в каком они находят себе выражение в так называемом принципе относительности, представляют собой, в сущности, не что иное, как последовательное применение поворотных растяжений пространства четырех измерений; в этом именно порядке идей эти исследования и были недавно изложены проф. Минковским.

Во всяком случае понятие о вращении с растяжением в четырехмерном пространстве /?4 находится в самой тесной связи с основаниями «принципа относительности» в электродинамике, который вот уже несколько лет самым живым образом занимает физиков. А именно — как я вкратце покажу — те «преобразования Лоренца», на изучении которых основаны исследования, относящиеся к «принципу относительности», представляют не что иное, как поворот некоторого пространства /?4, и могут быть даже представлены самым удобным образом с помощью формул исчисления кватернионов.

Как известно, под преобразованием Лоренца понимают такую линейную однородную подстановку (с действительными коэффициентами) трех координат в пространстве х, у, z и времени t:

(1)

которая преобразует квадратичную форму х2 + у2 + + 22 — с2/2 (где с есть скорость света) в себя, так что

(2)

и у которой последний коэффициент

(3)

При этом ради краткости не принято во внимание могущее иметь место смещение начальной точки х =

Оказывается, что в исчислении кватернионов легко можно указать такую подстановку, которая удовлетворяет условию (2), если только на первое время оставить без внимания требование действительности коэффициентов и неравенство (3). Для этого нужно рассматривать такие кватернионы, компонентами которых являются не действительные, а обыкновенные комплексные числа, образованные с помощью обыкновенной мнимой единицы У—1 (которую следует, конечно, отличать от специальных единиц исчисления кватернионов /, /', k). Заметим прежде всего, что кватернионы

(1а)

имеют своими модулями квадратные корни из квадратичных форм (2). Поэтому можно точно так же, как выше (с. 101 — 102), доказать, что формула

(1b)

описывает линейную подстановку, удовлетворяющую условию (2), если р и п — произвольные кватернионы с комплексными коэффициентами, a M — квадратный корень из произведения их модулей.

Чтобы получить действительные коэффициенты и удовлетворить условию (3), надо в качестве р и я взять специально подобранные сопряженные кватернионы, получаемые следующим образом.

Пусть Л, Л', D, D' — восемь действительных величин, связанных равенством

АА' + ВВ' + СС + DD' = 0 (IIа)

и неравенством

(IIb)

Тогда мы положим

(IIc)

Формулы (I) совместно с условиями (II) дают запись всех преобразований Лоренца.

Сам Минковский, впрочем, пользуется в своих работах вместо исчисления кватернионов символикой матриц Кэли, которая позволяет наряду с преобразованиями Лоренца получить инварианты группы Лоренца.

Но вернемся к трем измерениям. При поворотном растяжении точка х, у, z переходит в такую точку у\ г', что

х'3 + / + z'2 = M2 (л-2 + У2 + z2),

где M обозначает линейное растяжение длин. Ввиду того, что наиболее общее линейное преобразование неременных х, у, z в х', у', z' содержит 3-3 = 9 коэффициентов, а левая часть после подстановки этих выражений переходит в квадратичную форму от х, у, z 3.4 а с —2~= 6 членами, наше тождество при произвольном M представляет 6— 1 = 5 условий, и все линейные подстановки, удовлетворяющие ему, содержат еще 9—5 = 4 произвольных параметра (ср. аналогичные рассуждения на с. 101). Если некоторая из этих подстановок имеет положительный определитель, то она изображает, как уже было упомянуто, поворот пространства около начала, соединенный с растяжением; если же определитель имеет отрицательное значение, то подстановка соответствует такому же поворотному растяжению, сопровождаемому центральной симметрией пространства, определяемой равенствами х' = —х, у' = —у, z' = —z. С другой стороны, можно показать, что этот определитель может принимать только значения ±Л13.

Чтобы описать эти факты с помощью кватернионов, мы прежде всего будем считать, что у переменных кватернионов q, q' отсутствует скалярная часть, т. е. они сводятся лишь к векторной части: q' = ix' + jy' + -f kz\ q = ix + jy + kz; это — векторы, соединяющие начало координат с точкой и ее образом, полученным после преобразования. И вот я утверждаю, что наиболее общее преобразование трехмерного пространства, представляющее собой поворотное растяжение, получится, если взять в предыдущих формулах для р

и zi сопряоюенные значения, т. е. если положить

q' = p-q-p, (1)

или, выписывая подробно,

Чтобы это доказать, надо прежде всего убедиться в том, что скалярная часть произведения, стоящего справа, обращается в нуль и что, следовательно, q' действительно есть вектор. Для этого75) перемножим сперва p-q по правилам умножения кватернионов:

после вторичного перемножения кватернионов действительно получается для скалярной части q' значение 0, а для его трех векторных составляющих получаются выражения

Остается показать, что эти формулы действительно выражают требуемое преобразование. Это сразу получается, если в равенстве (1) перейти к модулям (см. с. 100):

или

где Т—модуль кватерниона р. Далее, мы сразу видим, что наша формула действительно содержит четыре произвольных параметра, которые, согласно предыдущим вычислениям, входят в состав наиболее общего преобразования этого вида. Чтобы решить

также и вопрос о знаке определителя, достаточно взять один какой-нибудь пример; действительно, так как Т всегда имеет положительное значение и никогда не обращается в нуль, то при изменении значений а, Ь, с, d определитель как непрерывная функция никогда не может принять значения —Г6, если он хоть раз принимает значение + Г6, а между тем только эти два значения, как выше было замечено, и будут рассматриваться. Если же, например, положить а = b = с = 0, то определитель подстановки (2) равняется

следовательно, он имеет всегда положительное значение, и поэтому наше преобразование, выражаемое соотношением (1), в самом деле изображает всегда поворотное растяжение. После этого столь же просто изобразится поворотное растяжение, соединенное еще с отражением; для этого надо лишь написать q' = = p-q-p, ибо это и есть соединение предыдущего преобразования с центральной симметрией

*' = — *, у' = — у, z' = — z76).

Теперь посмотрим, как расположена ось того поворота, который определяется равенствами (2), и каков угол поворота. Пусть g, ц, £ — направляющие косинусы оси поворота, так что

(3)

а угол поворота обозначим через со. Оказывается, что имеют место следующие соотношения:

(4)

из них легко определить при известных а, Ь, с, d четыре величины I, г\, £, со и притом так, что выполняется соотношение (3); в самом деле, из соотношения

получаемого из (4) возведением в квадрат и сложением, вытекает соотношение (3), так как Т — модуль кватерниона р. Поэтому для определения £, т), £ достаточны получающиеся из системы (4) уравнения

(4')

которые говорят, что точка (а, 6, с) лежит на оси рассматриваемого поворота77).

Переходя к доказательству этих утверждений, начнем с проверки последнего свойства; для этого положим в уравнениях (2) х = а, у = 6, z = с; тогда получим

из этих равенств видно, что точка (л/, у\ z') лежит на прямой, проходящей через начало координат и через точку (а, Ь, с), a это именно и характеризует точку (а, Ь, с) как точку оси вращения. Остается только доказать, что число со, определяемое из соотношений (4), действительно представляет собой угол вращения. Но это требует сложных рассуждений, вместо которых я укажу на то, что наши формулы преобразования (2) при Т = 1 в силу соотношения (4) переходят как раз в те формулы, которые Эйлер установил для поворота системы координат вокруг оси g, т], £ на угол (о.

Я хочу еще показать вам сжатое и удобное выражение, которое дает исчисление кватернионов для поворота вокруг оси g, tj, £ на угол со, соединенного с растяжением в Т2 раз; это выражение получается, если подставить формулы (4) в уравнения (1):

(5)

Здесь все эйлеровы формулы поворота совмещены в одну, которая легко запоминается: в ней вектор ix + jy + kz слева и справа умножается на сопря-

женные кватернионы с модулем 1 (так называемые версоры, или «вращатели») и к этому произведению присоединяется в качестве скалярного множителя величина растяжения.

Теперь я намерен показать вам, что в случае двух измерений эти формулы дают как раз известное выражение поворота и растяжения плоскости ху посредством умножения двух комплексных чисел. Для этого стоит только принять за ось вращения в уравнениях (5) ось z (I = ц = 0, £ = 1); тогда при z = — z' ™ 0 получаем

произведя умножение на основании правил умножения единиц, находим78)

Если обе части полученного равенства умножить справа на (—i), то получим

а это и есть известная формула умножения двух обыкновенных комплексных чисел с его геометрическим истолкованием как поворота на угол <о и растяжения в Т2 раз с той только разницей, что вместо мнимой единицы д/~ Ь обычно обозначаемой через/, здесь стоит k.

Возвращаясь снова к трехмерному пространству, постараемся так видоизменить формулу (1), чтобы она изображала собой один только поворот без растяжения. Для этого заменим х\ у', z' через х'-Т2,

y'-T2, z'-T2 и, следовательно, q' через q'-T2\ вспоминая же, что Р~1=="~" = "^» находим следующую формулу:

ix' + jy' + kz' = p(ix + jy+kz)p~K (6)

Мы не нарушим общности, если будем принимать в этой формуле р за кватернион с модулем 1: р =

eCosf.+ sIn-J-(« + /i| + *Ö. где |2 + т)2 + £2=1; поэтому формула (6) может быть получена из уравнений (5), если принять Т равным единице. В этом виде формула впервые была дана Кэли в 1845 г.

Последовательное проведение двух поворотов в трехмерном пространстве столь же просто, как и в случае четырехмерного пространства (с. 102). Если дан второй поворот

где

(!'» л'> £' — оси» ю'— угол), то снова находим в качестве записи получающегося поворота

так что оси т]", £" и угол со" поворота получаются из равенства

Таким образом, мы снова получаем для композиции двух поворотов простое и сжатое выражение формул, довольно сложных в их обычном виде. Но, с другой стороны, — ввиду того, что всякий кватернион, не считая некоторого действительного множителя (его модуля), можно в то же время рассматривать как версор некоторого поворота — мы имеем в композиции поворотов простой геометрический эквивалент умножения кватернионов; некоммутативность произведения кватернионов соответствует при этом тому известному обстоятельству, что вообще нельзя менять порядка двух поворотов вокруг одной точки без изменения окончательного результата.

В заключение я приведу несколько общих соображений о значении и распространении кватернионов. При этом следует, конечно, отличать собственно умножение кватернионов от общего исчисления кватернионов. Первое представляет собой нечто в высшей степени полезное, как достаточно видно из предыдущего. Напротив, общее исчисление, как его понимал Гамильтон, рассматривает сложения, умножения, деления кватернионов в любом порядке, — другими словами, оно составляет алгебру кватернионов; соединяя инфинитезимальные процессы, можно дойти даже до теории функций в области кватернионов. Конечно, ввиду того, что переместительный закон здесь не имеет места, все обстоит здесь совершенно иначе, чем в теории обыкновенных комплексных переменных. Но есть полное основание утверждать, что эти общие, широко задуманные идеи Гамильтона не оправдали себя, т. е. они не вошли в соприкосновение и в живой обмен идей с другими областями математики и ее приложений и потому не вызвали общего интереса79).

Но в математике приходится наблюдать то же, что и в человеческой жизни: наряду со спокойными, объективными взглядами большинства выступают страстные индивидуальные убеждения. Так и кватернионы имеют своих приверженцев-энтузиастов и своих страстных противников. Первые, особенно многочисленные в Англии и в Америке, прибегли — вот уже 12 лет — к современному средству: они основали «Всемирный союз для развития учения о кватернионах»: президентом его состоял сэр Роберт Болл, а основано оно в качестве вполне интернационального учреждения японцем Кимурой, получившим высшее образование в Америке. От интенсивного изучения кватернионов их сторонники ожидают совершенно особенного преуспевания математики. В противоположность этому противники кватернионов не хотят о них и слышать и вследствие этого отказываются даже от столь полезного умножения: они исходят из того взгляда, что все вычисления с кватернионами сводятся в конечном счете к вычислению с четырьмя составляющими и что единицы и таблица их произведений представляют излишнюю роскошь. Я думаю, что оба направления одинаково далеко отклонились от правильного среднего пути.

4. Комплексные числа в преподавании

Покидая теорию кватернионов, я хочу закончить эту главу несколькими замечаниями относительно той роли, какую эти понятия играют в школьном преподавании. Конечно, никому не приходит в голову обучать в школе кватернионам, но зато постоянно заходит речь об обыкновенных комплексных числах х + iy. Быть может, не будет лишено интереса, если я вместо данных рассуждений о том, как это обыкновенно излагают и как следовало бы излагать*), покажу вам на примере трех книг из различных эпох, как развивалось исторически преподавание этих вещей.

Я предлагаю вашему вниманию прежде всего книгу Кестнера, который во вторую половину XVIII в. занимал в Гёттингене руководящее положение. В то время его обучали в университете тем вещам из элементарной математики, которые впоследствии, около 30-х годов XIX в., перешли в школу; поэтому и Кестнер читал тогда популярные математические лекции, которые посещались в большом числе и нематематиками. Его учебник, лежащий в основе этих лекций, носит название «Начальные основания математики». Изложение мнимых величин начинается там приблизительно следующими словами: «Тот, кто требует извлечь корень с четным показателем из «отрицаемой» величины («verneint — так тогда говорили вместо «отрицательной», «negativ»), требует невозможного, ибо нет ни одной отрицаемой величины, которая была бы такою степенью». Все это совершенно справедливо, но затем читаем: «Такие корни называются невозможными или мнимыми». Вслед за этим замечанием автор оперирует с ними совершенно спокойно, как с обыкновенными числами, не заботясь особенно об оправдании такого обращения с ними, хотя он только что отрицал их существование, — как будто бы благодаря присвоению определенного имени неразумное внезапно стало годным к употреблению. Вы узнаете здесь отражение точки зрения Лейбница, согласно которой мнимые числа представляют собой в сущности нечто совершенно нелепое, но, тем не менее, они непонятным образом ведут к правильным результатам.

*) Эта точка зрения изложена в примечании 59.

Вообще Кестнер писал весьма забавно; он даже получил известность в литературе своими эпиграммами. Так, во введении к упомянутой книге он распространяется относительно происхождения слова «алгебра», которое принадлежит, конечно, арабам, как показывает начало «al»80).

Под алгебраистом надо, по мнению Кестнера, понимать человека, который «делает целыми» дроби,— другими словами, занимается рациональными функциями, приводит их к общему знаменателю и т. д. Первоначально это якобы относилось также к деятельности врача-хирурга, который лечит при переломе костей. Кестнер приводит при этом в виде примера Дон-Кихота, который отправляется к алгебраисту с тем, чтобы последний расправил ему поломанные ребра. Остается открытым вопрос о том, держался ли здесь Сервантес принятого словоупотребления или же здесь надо видеть сатиру.

Вторая книга вышла в свет на много лет позже (в 1828 г.) и принадлежит берлинскому профессору Ому: «Опыт вполне последовательной системы математики»; эта книга имеет то же назначение, что и книга Кестнера, и одно время была очень распространена. Но Ом стоит гораздо ближе к современной точке зрения, так как он ясно высказывает принцип расширения числовой области. «Подобно отрицательным числам, — говорит он, — должно и символ aJ—\ присоединить к вещественным числам как новую вещь». Геометрическое толкование, конечно, не было ему еще известно: это было накануне появления упомянутой выше работы Гаусса (1831).

Наконец, я хочу познакомить вас с одним из многочисленных современных учебников, которым очень часто пользуются: это «Сборник задач» Бардея (Лейпциг, 1907). Здесь на первый план выступает принцип расширения понятия числа, а впоследствии дается и геометрическое истолкование. В этом действительно заключается теперь общепринятая точка зрения школьного преподавания, хотя в отдельных местах развитие и задержалось на предыдущей ступени. На мой взгляд, такое изложение вопроса является наиболее подходящим для школы: не утомляя ученика систематическим изложением и не вдаваясь, конечно, в абстрактные логические рассужде-

ния, следует истолковывать комплексные числа как расширение уже известного понятия числа, избегая при этом, разумеется, всякой мистической окраски, но прежде всего нужно приучить ученика к наглядному геометрическому истолкованию их в комплексной плоскости!

Мы пришли к концу первой главной части наших лекций, посвященной арифметике. Прежде чем перейти к таким же пояснениям, относящимся к алгебре и анализу, я хотел бы сделать довольно продолжительное отступление исторического характера, которое бросает новый свет на общую постановку современного преподавания, а также на то, что мы решили бы в нем улучшить.

V. СОВРЕМЕННОЕ РАЗВИТИЕ И СТРОЕНИЕ МАТЕМАТИКИ ВООБЩЕ

1. Два различных ряда эволюций, по которым параллельно развивался математический анализ

Позвольте мне начать с замечания, что в истории развития математики до самого последнего времени очень ясно выступают две различные линии развития, которые то сменяют друг друга, то выступают одновременно и независимо, то, наконец, взаимно переплетаются. Различие, которое я имею в виду, вы поймете лучше всего на конкретном примере, а именно, если я покажу вам, как в действительности пришлось бы построить самые элементарные главы анализа в духе той и другой линии эволюции.

Если следовать одной из них — мы будем называть ее линией эволюции Л, — то получается следующая система, которая преимущественно господствует теперь в школах и в элементарных руководствах:

1. Главное место занимает формальное учение об уравнениях, следовательно, действия с целыми рациональными функциями и изучение тех случаев, в которых алгебраические уравнения разрешимы в радикалах.

2. При систематическом развитии понятия степени и ее обращения возникают логарифмы, которые оказываются весьма полезными при оперировании с числами.

3. Между тем как до сих пор геометрия оставалась совершенно изолированной от арифметики и анализа, у нее теперь производят заем, который дает определения трансцендентных функций другого рода,— именно, тригонометрических функций; дальнейшая теория этих функций строится затем в виде отдельной дисциплины.

4. За этим следует алгебраический анализ, который учит разлагать простейшие функции в бесконечные ряды; здесь рассматриваются бином Ньютона в общем виде, логарифм и его обращение — показательная функция — и тригонометрические функции. Сюда же относится общая теория бесконечных рядов и действий с ними. При этом обнаруживаются поразительные соотношения между названными элементарными трансцендентными функциями, в особенности знаменитая формула Эйлера

Эти соотношения представляются тем более уди вительными, что они устанавливают связь между функциями, определения которых были взяты из совершенно различных областей.

5. За пределами школьной математики к этому построению примыкает в качестве естественного продолжения разработанная Вейерштрассом теория функций комплексной переменной.

Теперь я представляю в общих чертах схему второй линии эволюции, которую назовем линией В\ здесь в общем господствует дух аналитической геометрии, а именно, идея слияния представлений числа и пространства. Соответственно этому:

1. Начинают с графического изображения простейших функций — многочленов и рациональных функций одной переменной. Точки пересечения получаемых при этом кривых с осью абсцисс определяют корни многочленов. Сюда же, естественно, примыкает учение о приближенном решении численных уравнений.

2. Геометрический образ кривой является естественным и наглядным источником для понятий производной и интеграла; к первому приводит подъем или спуск кривой, ко второму — площадь, заключенная между кривой и осью абсцисс.

3. В тех случаях, когда процесс интегрирования (или нахождение квадратур в узком смысле слова) не может быть выполнен в явном виде с помощью рациональных функций, он дает повод к возникновению новых функций, которые таким образом вводятся вполне естественно и единообразно. Так, квадратура гиперболы дает определение логарифма:

между тем как квадратура круга легко сводится к интегралу

другими словами, к обращениям тригонометрических функций. Как вам известно, этот же самый ход мыслей приводит далее к новым высшим классам функций, в частности к эллиптическим функциям.

4. Разложение всех полученных таким путем функций в бесконечные степенные ряды производится опять-таки по единообразному принципу — на основании теоремы Тейлора.

5. Высшим применением этого приема является разработанная Коши и Риманом аналитическая теория функций комплексной переменной, основанная на дифференциальных уравнениях Коши — Римана или на теореме об интеграле Коши.

Если мы пожелаем четко выразить в немногих словах результат этого обзора, то можно сказать, что в основе линии А лежит тенденция к дроблению, т. е. такое понимание науки, которое всю ее область разбивает на ряд частей, вполне отграниченных одна от другой, и в каждой из них стремится обойтись минимумом вспомогательных средств, по возможности избегая заимствований у соседних областей; идеалом здесь является изящно выкристаллизованное, логически замкнутое в себе построение каждой отдельной области. В противоположность этому приверженец направления В придает главное значение как раз органической связи между отдельными областями и многочисленным случаям их взаимного содействия;

соответственно этому он предпочитает те методы, которые дают ему одновременное понимание многих областей с одной и той же точки зрения; его идеал состоит в том, чтобы обнять все математические науки как одно целое.

Не может быть сомнения относительно того, какое из двух направлений более жизненно, какое из них способно в большей степени заинтересовать ученика, если только он не имеет специального предрасположения к абстрактным математическим рассуждениям. Возьмем для примера, чтобы лучше себе это уяснить, функции ех и sin jc, относительно которых нам придется именно по этому же поводу еще много говорить. В системе Л, —к сожалению, почти исключительно к ней в данном случае примыкает школа — они представляются совершенно разнородными: функция ех и соответственно логарифм появляются в качестве удобного вспомогательного средства при оперировании с числами, a sinjc возникает в геометрии треугольника. Как же после этого понять то, что эти функции находятся в столь простой зависимости между собой, и особенно то, что в самых разнообразных областях, не имеющих ничего общего ни с техникой вычислений, ни с геометрией, они постоянно h неожиданно появляются как естественное выражение царящих там законов? Названия «функция сложных процентов» или «закон органического роста», которые давали функции ех, и, с другой стороны, то, что sin* играет центральную роль всюду, где идет речь о колебаниях, показывают, как далеко заходит возможность их применения. В системе же В все это представляется вполне понятным и соответствующим значению функций, отмеченному с самого начала. Ведь здесь функции ех и sin л: возникают из одного источника, из квадратуры простых кривых, а это приводит, как мы увидим ниже, к дифференциальным уравнениям простейшего типа , которые составляют естественную основу всех упомянутых приложений.

Но для полного понимания развития математики необходимо еще вспомнить о третьей линии эволюции С, которая очень часто играет важную роль то

отдельно, то вместе с линиями эволюции А и В. Речь идет о том, что обозначают словом «алгоритм», возникшим из искаженного имени одного известного арабского математика81). Алгоритмом является, в сущности, всякое строго установленное формальное исчисление — в частности буквенное исчисление. Мы неоднократно отмечали, какую огромную роль в развитии науки играл алгоритмический процесс, являясь как бы самостоятельной движущей силой, присущей самим формулам и оказывающей свое действие независимо от намерения и предвидения того или другого математика и часто даже вопреки его желанию. Так и в начале развития исчисления бесконечно малых алгоритм, как мы еще при случае увидим, часто побуждал к созданию новых понятий и действий даже прежде, чем математики могли отдать себе отчет в их допустимости. Даже на высших ступенях развития эти алгоритмические моменты могут приносить пользу и действительно приносили ее, так что их можно назвать подпочвой развития математики. Поэтому оставлять в стороне эти моменты как играющие в развитии математики исключительно формальную роль — а это теперь в моде — значит не считаться с историческим ходом развития науки.

2. Краткий обзор истории математики

Я хотел бы проследить теперь подробнее контраст между этими различными направлениями в работе математиков на протяжении всей истории математики; при этом я, разумеется, буду иметь возможность упомянуть лишь самые важные моменты развития. Тем не менее различие между направлениями А и В, проходящее через всю область математики, обнаружится здесь еще яснее, чем в приведенном выше сопоставлении, при котором мы ограничивались областью анализа.

Если начнем с древних греков, то мы найдем резкое разграничение чистой и прикладной математики, которое восходит к Платону и Аристотелю. К чистой математике относится прежде всего известное евклидово построение геометрии, к прикладной принадлежат, в частности, числовые операции, так называемая

логистика (Я,оуо£ — всеобщее число). При этом к последней относились довольно презрительно — предрассудок, который во многих случаях сохранился до сих пор, но во всяком случае, большей частью только у людей, которые сами не умеют вычислять. Этому положению логистики могло содействовать отчасти то, что она развивалась в тесной связи с тригонометрией и с потребностями практического землемерия, которое с древних времен казалось людям недостаточно благородным занятием. Конечно, она снова была несколько реабилитирована тем, что без нее не могла обойтись другая наука, которая хотя и родственна геодезии, но в противоположность ей всегда считалась одной из самых благородных, — астрономия. Эта греческая манера научной работы с ее строгим размежеванием отдельных областей, каждая из которых излагалась затем в виде как бы застывшего логического построения, принадлежит, конечно, линии эволюции Л. Тем не менее грекам не были чужды и рассуждения в духе В; они, по-видимому, служили им для эвристических целей и для первого сообщения их открытий; однако для окончательного изложения форма А казалась им незаменимой. Это видно из недавно открытого манускрипта Архимеда, в котором он сообщает вычисления объемов тел во вполне современной живой форме.

Наряду с греками в истории математики в древности особое значение имеют индийцы как творцы современной системы счисления и позднее арабы, передавшие ее нам; у последних встречаются также начатки буквенного исчисления. Ясно, что эти успехи принадлежат алгоритмической линии эволюции С.

Переходя к новому времени, мы можем прежде всего отметить (около 1500 г.) начало возрождения математического творчества, которое принесло с собой целый ряд замечательных открытий. Для примера я назову формальное решение кубического уравнения (формула Кардано), которое находится в труде «Ars magna» Кардано, появившемся в Нюренберге в 1545 г.; это в высшей степени ценное произведение содержит вообще зародыши современной алгебры, выходящие за пределы схемы античной математики.

Конечно, это не составляет собственной заслуги Кардано, так как он, по-видимому, не сам открыл свою знаменитую формулу, но заимствовал ее, как и многое другое, у иностранных авторов.

Начиная с 1550 г., на первый план выступают тригонометрические вычисления; появляются первые большие тригонометрические таблицы, вызванные потребностями астрономии, относительно которой я ограничусь одним только именем Коперника. Приблизительно с 1600 г. непосредственно к этому примыкает развитие логарифмов; первые логарифмические таблицы, составленные шотландцем Непером в 1614 г., содержат только логарифмы тригонометрических функций. Таким образом, мы видим, что в эти 100 лет развитие математики в точности следовало схеме А.

Теперь мы приходим к новейшему времени — к дальнейшему течению XVII в. Здесь на первый план выступает исключительно направление В. В 1637 г. появляется аналитическая геометрия Декарта, которая устанавливает связь между числом и пространством, играющую основную роль во всем последующем развитии математики. В связи с этим тотчас выступают две великие проблемы XVII в.: проблема касательных и проблема квадратуры, т. е. проблемы дифференцирования и интегрирования. Для развития дифференциального и интегрального исчисления в собственном смысле недостает еще только одного: еще не знают, что обе проблемы находятся в очень тесной связи, что одна представляет собой обращение другой; в уяснении этого заключалось, по-видимому, ядро того громадного прогресса, который осуществился в конце столетия.

Но еще раньше, в том же столетии, возникает учение о бесконечных рядах, в частности о степенных рядах, и притом не как самостоятельная дисциплина в смысле современного алгебраического анализа, но в теснейшей связи с квадратурными проблемами. Меркатор (латинская переделка немецкого имени «Кремер»: Krämer — торговец), в особенности известный как творец меркаторской проекции, первый проложил здесь путь; ему принадлежит смелая идея — для разложения In ( 1 + л:) в ряд представить в виде ряда

дробь -7-7-— и проинтегрировать почленно:

Это в точности соответствует ходу его мыслей, хотя он, конечно, пользуется не нашими простыми знаками ^, dx ит. д., но более тяжелым языком. После 1660 г. этим приемом стал пользоваться Ньютон, который построил ряд для выражения бинома с любым показателем. Конечно, им руководили при этом только заключения по аналогии с известными ему простейшими случаями; он не владел строгим доказательством и не знал границ приложимости этого разложения — в этом снова обнаруживается алгоритмическая линия С. Применяя этот прием к выражению 1 ==(1 — х2)"1/29 он получает по способу Меркатора ряд для [ ,dx = aresin х. С помощью очень искусного обращения этого ряда, а также ряда для функции In л: он далее получает ряды для sin* и ех. В заключение этой цепи открытий следует назвать, наконец, Тейлора, нашедшего в 1714 г. свой общий принцип для разложения функций в степенные ряды.

Возникновением исчисления бесконечно малых в собственном смысле в конце XVII в. мы обязаны, как известно, Лейбницу и Ньютону. У Ньютона основной идеей является представление о течении; обе переменные je, у рассматриваются как функции ф(0» ^(0 времени /; течет время — «текут» непрерывно и эти функции. Соответственно этому переменная называется у Ньютона флюентой (fluens), а то, что мы называем производной, он обозначает как «флюксию» i, у. Мы видим, как тут все сплошь основано на наглядном представлении.

То же относится и к изложению Лейбница, первая работа которого появилась в 1684 г. Он сам

называет своим главнейшим открытием принцип непрерывности во всяком процессе природы, т. е. положение «Natura non facit saltum»*). На этом представлении процессов природы он основывает свои математические построения — опять-таки черта, типичная для линии В. С другой стороны, у Лейбница большую роль играет влияние алгоритма (линия С); от него ведут начало такие ценные с точки зрения алгоритма обозначения, как dx и ^ / (х) dx.

В целом результат этого обзора заключается в том, что великие открытия XVII в. по существу целиком принадлежат эволюционной линии В.

В XVIII в. этот период открытий продолжается сперва в том же направлении; в качестве наиболее блестящих имен следует назвать Эйлера и Лагранжа. В эту эпоху развивается, говоря кратко, учение о дифференциальных уравнениях в самом общем смысле, включая вариационное исчисление, а также здание аналитической геометрии и аналитической механики; всюду здесь мы видим живое движение вперед. Это напоминает эпоху в истории географии после открытия Америки, когда новые страны исследовали и объезжали вдоль и поперек. Но совершенно подобно тому, как там еще долго не было и речи о точных измерениях, так что в первое время имели место совершенно ложные представления даже об общем положении новой части света (ведь думал же вначале Колумб, что открыл восточный берег Азии),— так и здесь, во вновь завоеванных странах новой математической части света, анализа бесконечно малых, в первое время представления были довольно далеки от надежной логической постановки. Даже в отношении старых, хорошо известных областей математики впадали подчас в заблуждения, считая исчисление бесконечно малых чем-то мистическим, не допускающим точного логического анализа. До чего шатко было основание, на котором первоначально стояли творцы нового анализа, стало вполне ясным лишь тогда, когда понадобилось изложить новые отрасли математики в доступном виде в руководствах; тогда сразу обнаружилось, что направление В, до сих

*) Природа не делает скачков (лат.).

пор единственно господствовавшее, здесь уже бессильно, и Эйлер первый оставил его. Хотя у него самого исчисление бесконечно малых и не вызывало никаких сомнений, но для начинающих оно, по мнению Эйлера, представляло слишком много трудностей и сомнений. Исходя из этих дидактических соображений, он счел нужным предпослать ему в виде отдельного курса под названием «Введение в анализ бесконечно малых» (Introductio in analysin infinitorum», 1748) ту дисциплину, которую мы теперь называем алгебраическим анализом. К этому курсу Эйлер относит, в частности, учение о бесконечных рядах и других бесконечных процессах, которое служит ему потом фундаментом при построении исчисления бесконечно малых.

Гораздо более радикальный путь прокладывает почти 50 лет спустя (в 1797 г.) Лагранж в своей «Теории аналитических функций».

Свои сомнения относительно современного ему обоснования исчисления бесконечно малых он находит возможным устранить лишь тем, что он отказывается от него как от общей дисциплины, понимая под ним просто собрание формальных правил, относящихся к известным специальным функциям; а именно, он рассматривает исключительно такие функции, которые даны в виде степенных рядов:

f (х) = а0 + ахх + а2х2 + аъхг +

и такие именно функции он и называет аналитическими, т. е. такими, которые встречаются в анализе и с которыми последний действительно может что-либо предпринять. Производная такой функции f(x) определяется вполне формально с помощью второго такого же степенного ряда, как мы это еще увидим впоследствии, а взаимная связь между такими рядами и составляет предмет дифференциального и интегрального исчислений. Такое ограничение чисто формальными построениями, конечно, устраняло для того времени целый ряд затруднений.

Вы видите, что эта деятельность Эйлера и Лагранжа целиком принадлежит направлению А, поскольку они заменяют наглядно-генетическое развитие строго замкнутым в себе кругом мыслей. Оба эти сочинения имели огромное влияние на школьное преподавание;

если в настоящее время в средней школе изучают бесконечные ряды или решают уравнения разложением по степеням по так называемому способу неопределенных коэффициентов, но отказываются включить в ее программу дифференциальное и интегральное исчисления в собственном смысле слова, то это значит, что наша школа вполне еще находится под влиянием Эйлера и Лагранжа.

Наиболее существенным для начала XIX в., к которому мы теперь переходим, является строгое обоснование высшего анализа посредством признаков сходимости, о которых раньше не заботились. В XVIII в. в этом отношении царит еще райское состояние, в котором не различают добра и зла, сходящегося и расходящегося ряда; даже в «Introductio» Эйлера мирно уживаются рядом сходящиеся и расходящиеся ряды. Но в начале нового столетия Гаусс и Абель публикуют первые точные исследования о сходимости, а в 20-х годах Коши развивает в своих лекциях и сочинениях первое точное обоснование исчисления бесконечно малых в современном духе. Он не только дает точное определение производной и интеграла как пределов конечных отношений и сумм, как это уже делали иногда и до него, но впервые строит на нем последовательную систему преподавания анализа, выдвигая на первый план теорему о среднем значении. Впоследствии мы еще остановимся на этом подробнее. Эти теории принадлежат, конечно, направлению Л, так как они систематично, логически разрабатывают известную область изолированно от других областей. Между тем эти теории не оказали никакого влияния на нашу школу, хотя они были вполне способны разрушить старые предрассудки против дифференциального и интегрального исчислений.

Из дальнейшего развития математики в XIX в. я отмечу лишь очень немногое. Прежде всего я назову некоторые успехи, принадлежащие направлению В: возникают новая геометрия, математическая физика и теория функций комплексной переменной по Коши и Риману. Вождями при возникновении этих трех обширных областей были сперва французы. Здесь уместно будет сказать несколько слов о стиле математического изложения. У Евклида вы все найдете расчлененным по схеме «предположение, утвержде-

ние, доказательство», к которой он еще присоединяет «определение» (ограничение области, внутри которой действительны рассуждения); в широких кругах вы можете встретить мнение, что вся математика всегда движется по такой схеме в четыре такта. А между тем, как раз в тот период, о котором мы сейчас говорим, у французов стала вырабатываться новая, художественная форма математического изложения, которую можно называть искусно расчлененной дедукцией. Сочинения Монжа или, чтобы назвать более новую книгу, «Курс анализа» Пикара читаются как хорошо написанный увлекательный роман. Это стиль, свойственный манере ß, тогда как евклидово изложение вполне родственно манере А.

Из немцев, сделавших великое завоевание в названных областях, я назову еще Якоби и Римана и присоединю сюда же из новейшего времени Клебша и норвежца Ли. Все они существенно принадлежат направлению 5, но только по временам у них замечается алгоритмическая тенденция.

С Вейерштрассом снова сильнее выступает на первый план метод мышления Л. Особенно это относится к периоду с 1860 г., когда он стал читать свои лекции в Берлине. Теорию функций Вейерштрасса я уже приводил под буквой А. В равной степени принадлежат типу А новейшие исследования об аксиомах геометрии; здесь мы имеем исследования совсем в духе Евклида, которые и по изложению приближаются к указанному типу.

Этим мы закончим наш краткий исторический обзор; в качестве итога мы можем указать, что за целые столетия истории математики оба наши главнейшие направления развития появлялись равномерно и каждое из них (а часто как раз их смена) приводило к великим успехам науки. Таким образом, математика только тогда сможет равномерно развиваться по всем направлениям, когда ни один из методов исследования не будет оставлен в пренебрежении. Пусть каждый математик работает в том направлении, к которому лежит его сердце.

Но школьное преподавание, к сожалению, находится с давних пор (я это уже отмечал) под односторонним влиянием направления А. Всякое движение в пользу реформы математического образования

должно поэтому ратовать за более сильное выделение направления В. При этом я считаю необходимым прежде всего провести в преподавании генетический метод, более настойчиво подчеркивать наглядные пространственные представления и, в особенности, выдвинуть на первый план понятие функции, сливая при этом представление о пространстве и числе. Этой же цели должны служить и настоящие лекции, тем более, что в тех книгах по элементарной математике, к которым мы обращаемся за советом (книги Вебера и Вельштейна, Тропфке, Симона), почти исключительно представлено направление Л; на этот контраст я уже указывал во введении к этому курсу.

На этом мы заканчиваем историческое отступление и обратимся к следующему большому разделу курса.

АЛГЕБРА

ВВЕДЕНИЕ

Обращаясь к нашей теме, я должен предупредить вас, что по самому характеру этих лекций я, конечно, не могу дать здесь систематического изложения алгебры; я могу лишь дать отдельные выдержки, так что будет наиболее целесообразным, если я выделю такие вещи, которые несправедливо опускаются другими авторами и которые в то же время способны представить в особенном освещении школьное обучение. Все мое изложение будет группироваться вокруг одного пункта, а именно, вокруг применения графических и вообще геометрических наглядных методов к решению уравнений. Это —весьма обширная и богатая различными результатами тема, из которой я могу выхватить только ряд наиболее важных и интересных вещей; мы будем при этом вступать в органическую связь с различнейшими областями, занимаясь, таким образом, математикой в смысле нашей эволюционной линии В.

I. УРАВНЕНИЯ С ДЕЙСТВИТЕЛЬНЫМИ НЕИЗВЕСТНЫМИ

Мы ограничимся сначала уравнениями с действительными коэффициентами82) и действительными значениями неизвестных. Комплексными величинами мы займемся позже. Начнем с очень простого частного случая, который поддается геометрической обработке.

1. Уравнения, содержащие один параметр

Это уравнения такого типа: /(*, Я) = 0.

Мы получим наиболее простое геометрическое истолкование их, если заменим К второй переменной у

и станем рассматривать

fix. У) = 0

как уравнение кривой в плоскости ху (рис. 18). Точки пересечения этой кривой с параллелью у = Х к оси абсцисс дают действительные корни уравнения f(x,%)=0. Если приближенно начертить эту кривую,— что при не слишком сложных функциях / нетрудно,— то, перемещая параллель, легко можно видеть, как при изменении К изменяется число действительных корней. Особенно пригоден этот прием, когда / есть линейная функция от Я, т. е. для исследования уравнений вида

действительно, в этом случае уравнение у = .) : дает рациональную кривую, и ее поэтому легко построить.

В этих случаях указанный метод может быть с пользой применен и для вычисления корней.

Рассмотрим в качестве примера квадратное уравнение

X2 + ах — Я = 0.

Кривая у = X2 + ах представляет собой параболу (рис. 19), так что сразу видно, для каких значений % число действительных корней уравнения равно 2, 1, 0

Рис. 18

Рис. 19 Рис. 20

соответственно горизонталям, пересекающим параболу в 2, 1, 0 точках. Выполнение таких простых и наглядных построений кажется мне весьма полезным и для старших классов школы. В качестве второго примера возьмем кубическое уравнение хг + ах2 + Ьх— — к = 0, которое дает кубическую параболу у = = X3 + я*2 + Ьх. В зависимости от значения коэффициентов а, b эта парабола имеет различный вид. На рис. 20 принято, что уравнение х2 + ах + b = 0 имеет действительные*) корни; тогда видно, как параллели разделяются на такие, которые пересекают кубическую параболу в одной точке, и на такие, которые пересекают ее в трех точках, тогда как в двух предельных положениях имеем по одному двойному корню.

2. Уравнения с двумя параметрами

Здесь графическая постановка проблемы требует больше искусства, но зато и результаты оказываются более значительными и более интересными. Ограничимся тем случаем, когда оба параметра К, \х входят линейно; неизвестное обозначим через t\ тогда уравнение, действительные корни которого требуется определить, будет иметь вид

ф(0 + *-х(0 + 1*-+(о«ов (1)

где ф, X. ^ — некоторые многочлены от t.

Если через х, у обозначены обыкновенные прямоугольные координаты точки на плоскости, то всякая прямая в этой плоскости**) изобразится уравнением

y + ux + v = 0, (2)

и мы можем назвать и, v координатами этой прямой: (—и) есть тангенс угла, образуемого прямой с осью Ху (—v) выражает отрезок, отсекаемый прямой на оси у (рис. 21). Если считать точку и прямую (и соответственно координаты точки и прямой) равноправными понятиями, то мы придем к точке зрения, которая окажется особенно важной

Рис. 21

*) И притом различные между собой и отличные от нуля.

**) Не параллельная оси ординат.

в дальнейшем. Мы можем сказать, что уравнение

у + их + V = О

означает соединенное положение*) прямой (u,v) и точки (х,у), т. е. что точка лежит на прямой, а прямая проходит через точку.

Чтобы истолковать геометрически наше уравнение (1), приведем его к виду (2), чего можно достигнуть двумя существенно различными способами.

А. Полагаем

(3а) (3b)

Уравнения (3а) изображают при переменной / вполне определенную рациональную кривую в плоскости ху, так называемую «определяющую кривую» уравнения (1); всякая ее точка соответствует определенному значению t, так что на ней можно нанести шкалу значений переменной t. На основании соотношений (3а) можно непосредственно вычислить сколько угодно точек кривой и построить таким образом достаточно точно определяющую кривую со шкалой на ней. Для каждой определенной пары параметров X, \х уравнения (3b) изображают некоторую прямую в плоскости; тогда, согласно сказанному, уравнение (1) выражает, что точка t определяющей кривой лежит на этой прямой. Рассматривая все действительные пересечения определяющей кривой с этой прямой и отсчитывая значения параметра t в них по шкале, имеющейся на кривой, можно получить все действительные корни уравнения (1).

Для лучшего уяснения послужит нам квадратное уравнение

t2 + X( + \i = 0;

определяющая кривая представляет собой в этом случае параболу

у = t2, x = t,

или

У = х2

*) Инцидентность.

изображенную на рис. 22 с намеченной шкалой83), по которой сразу можно найти действительные корни нашего уравнения как пересечения параболы с прямой у + Хх + (л = 0, Так, рис. 22 показывает, что корни уравнения84) /2 — ^ — 1 = 0 лежат между 3/2 и 2 и между —1/2 и —1. Существенное отличие от предыдущего метода заключается в том, что здесь мы рассматриваем все прямые плоскости, тогда как раньше мы брали только горизонтали. Зато теперь мы можем, пользуясь одной и той же раз начерченной параболой, приближенно решить все возможные квадратные уравнения. Последний метод оказывается пригодным для практических целей, если только не требуется значительной точности.

Аналогично можно трактовать все кубические уравнения, которые, как известно, посредством линейного преобразования приводятся к так называемой «приведенной форме»

t3 + M + \i = 0;

определяющей кривой здесь служит кубическая парабола (рис. 23)

У = Р, x = t,

или

У = х3.

И этот метод представляется мне вполне уместным в школе; ученики находят, несомненно, громадное удовольствие в самостоятельном вычерчивании подобных кривых.

Рис. 22 Рис. 23

В. Второй метод истолкования уравнения (1) получается из первого, если применить принцип двойственности, т. е. если поменять местами координаты точки и координаты прямой. Для этого перепишем уравнение (2) в обратном порядке:

V + хи + У = О h приведем уравнение (1) к этому виду, полагая

(4а) (4b)

Уравнения (4а) при переменной t представляют семейство прямых, огибающих некоторую определенную кривую, «определяющую кривую» уравнения (1) в этом новом его истолковании; это — рациональная кривая определенного класса, так как она выражается в координатах прямой посредством рациональных функций одного параметра. Каждая касательная и вместе с нею ее точка касания получаются при определенном значении /, так что мы снова получаем некоторую шкалу на определяющей кривой. Нанося на чертеж достаточно много касательных на основании уравнений (4а), можно получить кривую и шкалу с любой степенью точности. При определенных значениях %, [к уравнение (1) говорит, что касательная t к определяющей кривой (4а) проходит через точку (А,, ц,), выражаемую уравнениями (4b); таким образом можно получить все действительные корни уравнения (1), если определить те значения параметра /, которые принадлежат всем касательным к определяющей кривой, проходящим через точку х=Х у=ц.

Для лучшего уяснения рассмотрим снова те же примеры. Для квадратного уравнения

/2 + М + ц = 0

определяющей кривой является огибающая прямых

V = /2, и = /;

это — парабола с вершиной в начале координат (рис. 24). Чертеж дает сразу действительные корни, соответствующие данной паре значений Я, ja в виде

параметров (/) касательных к параболе из точки (К ix).

Для кубического уравнения

определяющая кривая v = t*t u = t есть кривая третьего класса, имеющая точку заострения в начале координат (рис. 25).

Этот метод можно представить еще в несколько ином виде. Если рассматривать только так называемое трехчленное уравнение

г + ия + \i = о,

то система касательных определяющей кривой будет представлена уравнением, содержащим один параметр /:

f(t) = tm + xtn + y = 0.

Чтобы получить уравнение определяющей кривой в точечных координатах, надо, как известно, исключить параметр t из этого уравнения и из уравнения, получаемого из него дифференцированием по t:

f'(t) = mtm-l + nxtn-l=0;

действительно, определяющая кривая есть огибающая семейства прямых, содержащая точки пересечения каждых двух «бесконечно близких» прямых (/ и t + dt). Вместо того чтобы исключать выразим из

Рис. 24 Рис. 25

обоих уравнений х, у через t:

это — параметрическое уравнение определяющей кривой в координатах точки.

Для определяющих кривых квадратного и кубического уравнений в рассмотренных выше примерах получаем по этому способу

x = -2t, у = ?\ x = -3t\ y = 2t3;

эти уравнения в самом деле выражают кривые на рис. 24 и 25.

Замечу, что этот прием проводится на практике профессором Рунге в его лекциях и упражнениях и оказывается целесообразным для решения уравнений. И в школе можно рекомендовать использовать при случае тот или другой из этих чертежей.

Классификация уравнений по числу действительных корней. Если сравнить между собой оба рассмотренных нами способа, то окажется, что по отношению к одной определенной, но весьма важной цели второй способ имеет существенное преимущество,— а именно, в тех случаях, когда хотят получить наглядное представление о совокупности всех тех уравнений определенного типа, которые имеют данное число действительных корней.

Такие совокупности уравнений изображаются при первом способе системами прямых, а при втором — областями точек; последние формы совокупностей в силу некоторой особенности наших геометрических представлений или же в силу привычки нам существенно легче наглядно себе представить, чем первые.

Теперь я хочу показать на примере квадратного уравнения, чего можно достигнуть в этом направлении; в этом случае через точки, лежащие внутри параболы (рис. 26), не проходит ни одной касательной к ней, а через каждую точку, взятую вне параболы, проходит по две действительных касательных; таким образом, эти области изображают совокупности всех уравнений, имеющих 0 или 2 (действительных) корня. Через каждую точку на самой параболе проходит только по одной касательной, которая принимается

за двойную; таким образом, как здесь, так и вообще сама определяющая кривая является геометрическим местом точек, для которых два корня уравнения совпадают; вследствие этого ее можно назвать дискриминантной кривой.

В случае кубического уравнения через каждую точку внутри клина определяющей кривой проходит но три касательных к ней (рис. 27); действительно, для точек, расположенных на срединной линии, это следует из симметричности фигуры; с другой же стороны, число касательных не может изменяться, если переходить к другим точкам, не пересекая при этом кривой. Когда точка (х, у) попадает на кривую, два корня из трех совпадают; когда же эта точка переходит в область, лежащую вне кривой, эти два корня становятся мнимыми, и остается только один действительный корень. Наконец, в острие кривой имеем только одну тройную касательную, так что соответствующее уравнение (£3 = 0) имеет только один тройной корень. Чертеж позволяет охватить эту группировку одним взглядом.

Фигуры получаются еще интереснее и дают существенно больше, если ввести — как это часто приходится делать в алгебре — еще некоторые ограничения для корней: например, если задаться целью найти все действительные корни, лежащие в данном промежутке t\ ^ t ^ t2. Общий ответ на этот вопрос дает, как известно, теорема Штурма. Нетрудно так дополнить наши фигуры, чтобы они давали удовлетворительное наглядное решение и этого общего вопроса. Построим для этого попросту касательные к определяющей

Рис. 26 Рис. 27

кривой, соответствующие значениям параметра tu h, и рассмотрим получающееся разделение плоскости на области. Если применить этот прием прежде всего опять к квадратному уравнению, то вопрос сводится к определению числа касательных, которые проходят через данную точку и касаются параболы в точках ее дуги между t\ и i2 (рис. 28). Через каждую точку треугольника, образуемого этой дугой параболы и обеими «основными» касательными, проведенными через концы tu h рассматриваемой дуги, проходят по две касательные; при переходе через каждую из основных касательных теряется одна из касательных, ибо она касается параболы вне взятой дуги; через точки серповидных областей, ограниченных параболой и одной из основных касательных, не проходит ни одной прямой, касающейся параболы в точках дуги (Л,/2); через внутренние точки параболы вовсе не проходят действительные касательные. Таким образом, обе дуги t ^ tx и / ^ t2 для получающегося при этом разделения плоскости не имеют существенного значения; остаются только сплошные линии рис. 28, благодаря которым мы получаем возможность, пользуясь проставленными числами, ясно обозреть совокупность тех квадратных уравнений, которые имеют по 2, 1, 0 действительных корней между t] и г2.

Точно так же поступаем и с кубическим уравнением. Пусть t\ > О, Î2 < 0. Снова проводим основные касательные с этими значениями параметра (рис. 29); надо рассмотреть только то разделение на области, которое производят эти касательные и заключенная между ними дуга определяющей кривой. В четырех-

Рис. 28 Рис. 2.

угольной области у острия действительно через каждую точку проходит по три касательных, касающихся кривой в точках дуги между t\ и *2. Если принять во внимание, что при переходе через каждую из основных касательных теряется одна, а при переходе через кривую — две касательные этого рода, что непосредственно видно из чертежа, то получается указанное распределение областей, соответствующих уравнениям с 3, 2, 1, 0 действительными корнями между t\ и /2- Чтобы составить себе представление об огромной пользе графического метода, попробуйте только описать абстрактно это подразделение кубических уравнений, не апеллируя ни к каким пространственным образам; это потребует у вас несравненно больше времени. Доказательство, которое здесь постигается при одном взгляде на чертеж, тоже окажется тогда далеко не простым.

Что касается отношения этого геометрического метода к известным алгебраическим критериям Штурма, Декарта, Будана — Фурье, то я замечу только, что геометрический метод охватывает все эти критерии. Более подробный разбор этих интересных соотношений вы найдете в моей работе «Приложение геометрии к подсчету корней алгебраических уравнений»*).

3. Уравнения с тремя параметрами

Обратимся теперь к рассмотрению четырехчлен ного уравнения следующего вида:

(1)

применим метод, совершенно аналогичный прежнему, с той только разницей, что теперь мы используем не плоскость, а трехмерное пространство. Вместе с тем напишем теперь наряду с заданным уравнением то условие геометрии в пространстве, которое выражает, что точка (х, у, z) и плоскость с плоскостными координатами (и, V, w) находятся в «соединенном положении» (инцидентны, т. е. плоскость содержит точку):

(2)

или

(3)

*) См. том II математических сочинений Клейна, с. 198—208.

Это уравнение, написанное в той или другой последовательности его членов, мы будем отождествлять с исходным уравнением (1) и придем тогда, как и раньше, к двум интерпретациям, находящимся между собой в отношении, определяемом принципом двойственности.

Полагаем сперва

z = tp, x = tm, y = tn\ (2а)

этими уравнениями определяется некоторая кривая в пространстве, «определяющая кривая» четырехчленного уравнения со шкалой значений параметра /. Далее, полагаем

и = Х, v = \i, w = v\ (2b)

тогда уравнение (1) показывает, что действительные корни данного уравнения тождественны со значениями параметра для точек пересечения определяющей кривой (2а) с плоскостью (2b)86).

Пользуясь принципом двойственности, полагаем далее

w = tp, u = tm, v = tn; (3а)

эти уравнения определяют однократно бесконечное множество87) плоскостей, которые можно рассматривать как соприкасающиеся плоскости некоторой определенной кривой в пространстве, также отнесенной таким образом к параметру t; ввиду такого определения этой кривой в плоскостных координатах ее можно представить как определяющую кривую определенного класса. Рассматривая теперь наряду с нею точку

х = Х, y = \i, z = v, (3b)

находим, что действительные корни (1) тождественны со значениями параметра t для тех соприкасающихся плоскостей кривой (3а), которые проходят через точку (3b).

Остается на конкретных примерах глубже вникнуть в смысл обеих интерпретаций; для той и для другой мы имеем в нашей коллекции модели, которые я теперь вам покажу.

Первой интерпретацией воспользовался проф. Мемке в Штутгарте при построении прибора для чис-

ленного решения уравнений. В этом приборе (рис. 30), сделанном из латуни, вы видите три вертикальных столбика со шкалами; в прибор помещают вырезанную в виде шаблона определяющую кривую четырехчленного уравнения третьей, четвертой или пятой степени, но, в отличие от нашего изложения, принята не обыкновенная прямоугольная система координат, а такая, что координаты плоскости, т. е. коэффициенты и, v, w уравнения плоскости, представленного в виде (2), изображаются теми отрезками, которые соответствующая плоскость отсекает на шкалах трех вертикальных столбиков и которые можно отсчитать по ним. Чтобы иметь возможность фиксировать определенную плоскость в пространстве: и = 'к, v = |1, w=v, к переднему ку-столбику приделан визир, который можно установить на любом делении шкалы v; деления же К и р, на шкалах столбов и и v соединяют натянутой нитью. Лучи зрения, идущие от визира к точкам этой нити, образуют нашу плоскость; ее пересечения с определяющей кривой можно наблюдать непосредственно как кажущиеся (проектирующиеся) пересечения нити с шаблоном, если смотреть через отверстие в визире; соответствующие значения параметра, которые являются искомыми корнями уравнения, отсчитываем на нанесенной на шаблон шкале значений t для определяющей кривой. Степень практической пригодности описанного прибора зависит, конечно, существенным образом от тщательности его механического изготовления.

Дискриминантная кривая приведенного уравнения четвертой степени. Для иллюстрации второго метода у нас имеется модель, построенная Гартенштейном в качестве работы для государственного экзамена. Она построена для так называемого приведенного

Рис. 30

уравнения четвертой степени

(4)

в этом виде, как известно, можно представить всякое уравнение четвертой степени. Но сначала я изложу второй метод в несколько измененном виде, как я это уже проделал выше для уравнения с двумя параметрами (с. 133).

Рассмотрим однократно бесконечную систему плоскостей, плоскостные координаты которых выражены уравнениями (3а), тогда как их уравнения в точечных координатах в данном случае напишутся так:

f(t) = t< + xt2 + yt + z = 0.

Огибающей этих плоскостей является совокупность прямых, по которым каждая из плоскостей f(t) — 0 пересекается с близкой к ней плоскостью f(t + dt) = 0\ иначе говоря, это есть развертывающаяся поверхность, уравнение которой получается исключением t из уравнений f(t) = 0 и /'(0 = 0. Чтобы получить определяющую кривую, надо рассмотреть кривую соприкасания семейства плоскостей, т. е. геометрическое место точек, в которых пересекаются три бесконечно близкие плоскости; это есть, как известно, ребро возврата развертывающейся поверхности, координаты которого в функции t получаются из трех уравнений /(0 = 0, /'(0 = 0, Г(0 = 0. В данном случае эти три уравнения напишутся так:

t* + xt2 + yt + z = 0, 4/3 + X • 2/ + у = 0, 12/2 + *.2 = 0;

из них находим

X = -б/2, */ = 8/3, z=-3t\ (5)

Это — уравнение в точечных координатах определяющей кривой уравнения (4); в плоскостных координатах эта же кривая выражается уравнением (см. (3а))

w = t\ u = t2, v = t. (6)

Оба уравнения четвертой степени относительно t; следовательно, определяющая кривая принадлежит как к четвертому классу, так и к четвертому порядку.

Чтобы ближе познакомиться с этой кривой, рассмотрим несколько простых поверхностей, которые содержат ее. Прежде всего выражения (5) тождественно (относительно t) удовлетворяют уравнению

т. е. наша кривая лежит на изображаемом этим уравнением параболическом цилиндре второго порядка, образующие которого параллельны оси у. Но, с другой стороны, имеет место также соотношение

так что и этот обыкновенный кубический цилиндр с образующими, параллельными оси г, проходит через нашу кривую; она представляет собой пересечение обоих цилиндров. На основании этого можно легко составить себе приблизительное представление о ходе определяющей кривой: она представляет собой кривую двоякой кривизны, расположенную симметрично по отношению к плоскости xz и имеющую острие в начале координат (рис. 31).

Далее, через нашу определяющую кривую проходит еще и следующая поверхность второго порядка:

так как и это соотношение удовлетворяется выражениями (5) тождественно относительно t. Из уравнений этой поверхности и кубического цилиндра составим еще следующую линейную комбинацию, которая представляет новую поверхность третьего порядка, проходящую через определяющую кривую:

Рассмотрим теперь развертывающуюся поверхность, для которой определяющая кривая представ-

Рис. 31

ляет ребро возврата и которую мы можем определить поэтому как совокупность всех касательных к определяющей кривой.

Если некоторая кривая в пространстве задана уравнениями вида

то касательная к ней в точке t выразится уравнениями

где р — параметр; действительно, направляющие косинусы касательной, как известно, пропорциональны производным координат кривой по t. Если рассматривать и t как переменную, то последние уравнения с двумя параметрами tup изображают развертывающуюся поверхность, состоящую из касательных; все это — хорошо известные соображения из геометрии в пространстве. Для нашей кривой (5) это изображение развертывающейся поверхности имеет следующий вид, если ее координаты, в отличие от координат кривой, обозначить через X, К, Z:

(7)

Это и есть та поверхность, которая воспроизведена на упомянутой модели Гартенштейна, — а именно, ее прямые изображены здесь натянутыми нитями. Это изображение поверхности в параметрах дает само по себе наилучший способ для исследования и действительного построения ее; мы следуем, собственно говоря, только старой привычке, когда все же спрашиваем, каково уравнение поверхности. Это уравнение получится, если исключить t и р из системы (7). Я покажу вам самый простой прием для достижения этой цели, хотя я и не могу здесь входить в подробное объяснение того, что приводит к такому приему. Из формул (7) составляют такие комбинации:

которые на самой кривой (р = 0) обращаются в нуль, а будучи приравнены нулю, изображают две из рас-

смотренных уже выше специальных поверхностей, проходящих через кривую. Из этих двух уравнений легко можно исключить произведение р«/, что дает уравнение развертывающейся поверхности

следовательно, это поверхность шестого порядка*).

Относительно значения этой формулы я сделаю для тех, кто ближе знаком с предметом, следующие замечания: выражения, стоящие в скобках, представляют собой не что иное, как инварианты уравнения четвертой степени в приведенном виде:

l4 + xt2 + yt + z = 0; (8)

они играют большую роль в теории эллиптических функций, где их обыкновенно обозначают через g2 и g3. Левая часть уравнения нашей поверхности k = g\ — 27g\ является, как известно, дискриминантом уравнения четвертой степени, которое имеет двойной корень, когда дискриминант обращается в нуль. Таким образом, наша развертывающаяся поверхность представляет собой не что иное, как дискриминантную поверхность уравнения четвертой степени, т. е. совокупность всех точек, в которых последнее имеет двойной корень.

После этих теоретических разъяснений построение нитяной модели нашей поверхности не представляет никаких принципиальных затруднений: нужно только на основании параметрического изображения определить те точки, в которых касательные, подлежащие построению, пересекают известные неподвижные плоскости, и затем натянуть нити между этими плоскостями, реализованными посредством деревянной или картонной коробки. Но чтобы такая модель действительно была красива и пригодна, чтобы она давала ясное представление об интересующем нас расположении поверхности и ее ребра возврата, необходимы продолжительные опыты и очень большое искусство. Рис. 32 изображает поверхность с ее прямыми; АОВ есть ребро возврата (ср. рис. 31).

*) В действительности это поверхность пятого порядка, так как члены шестой степени выпадают. — Примеч. пер.

Вы замечаете на этой модели двойную кривую (СО), вдоль которой встречаются обе полы поверхности; это следующая парабола в плоскости у:

Но только одна половина (СО) этой параболы, а именно та, для которой X < О, представляет собой пересечение действительных частей поверхности, тогда как другая (отмеченная на чертеже пунктиром) расположена в пространстве изолированно. Это явление не покажется удивительным тому, кто привык теорию алгебраических поверхностей сопровождать геометрическими представлениями; там нередко случается, что действительные ветви двойных линий то являются пересечением действительных частей поверхности, то оказываются изолированными в пространстве, и

тогда их можно рассматривать как действительные пересечения мнимых частей поверхности. Соответствующее явление на плоскости заключается в том, что наряду с обыкновенными двойными точками алгебраических кривых, представляющими собой пересечения действительных ветвей кривой, встречаются двойные точки, лежащие изолированно и представляющие собой пересечения мнимых частей кривой; это явление известно всякому88).

Рассмотрим подробнее, что может дать нам полученная таким образом поверхность с ее ребром возврата, т. е. определяющей кривой. Представим себе, что на определяющей кривой нанесена ее шкала, или, еще лучше, отнесем каждой построенной касательной соответствующее ей значение параметра t, которое принадлежит и ее точке касания. Если задано урав-

Рис. 32

нение четвертой степени (8) с коэффициентами х, у9 г, то стоит лишь через соответствующую точку пространства (х, у, z) провести соприкасающиеся плоскости к определяющей кривой или — что то же самое— касательные плоскости к дискриминантной поверхности, и мы получим действительные корни в виде параметров точек касания с кривой или самих касательных в этих точках. Так как соприкасающаяся плоскость, касаясь кривой, пересекает ее, то при рассматривании из точки (х, у, z) каждая точка касания соприкасающейся плоскости проектируется в виде кажущейся точки перегиба кривой, и наоборот. Таким образом, действительные корни уравнения четвертой степени являются параметрами кажущихся точек перегиба определяющей кривой, когда мы смотрим на нее из точки (х, у, z).

Правда для тех, кто не имеет достаточного навыка, довольно трудно уверенно распознать на модели соприкасающиеся плоскости или кажущиеся точки перегиба. Но с непосредственной очевидностью модель разъясняет следующий, наиболее важный пункт: разделение всех уравнений четвертой степени по числу их действительных корней. Посмотрим, какие случаи представляются возможными на основании теоретического исследования уравнения. Если а, ß, y» ô — четыре корня действительного уравнения четвертой степени (4), то ввиду отсутствия члена, содержащего tz, необходимо a + ßH-v + o = 0. Что же касается корней, то возможны, очевидно, следующие три главных случая:

I. Четыре действительных*) корня.

II. Два действительных*), два мнимых сопряженных корня.

III. Ни одного действительного корня, две*) пары мнимых сопряженных корней.

Если даны два уравнения типа I с корнями а, ß, y, 6 и а', ß', y', ô', то всегда можно а, ß, -у, ô обратить в а', ß', у\ о', переходя непрерывно через различные системы из четырех действительных чисел, сумма которых остается все время равной нулю; при этом первое уравнение обратится во второе, переходя непре-

*) Различных.

рывным образом через уравнения того же типа, т. е. все уравнения I типа образуют сплошной континуум*); то же справедливо и для двух других типов.

На нашей модели это обстоятельство должно выразиться тем, что пространство распадается на три сплошные части такого рода, что точки одной и той же части соответствуют уравнениям одного и того же типа. Рассмотрим теперь переходные случаи между этими тремя типами: I тип переходит во II тип через уравнения, которые имеют два различных действительных корня и один двойной, но отличный от двух других, действительный корень. Это мы обозначим символически через 2 + (2); точно так же между II и III типами имеем переходный случай одного действительного двойного корня и двух мнимых корней; это будем обозначать через (2). Обоим переходным типам должны отвечать в нашем пространственном образе части самой дискриминантной поверхности, так как она вообще изображает все уравнения с кратными корнями; при этом, рассуждая аналогично предыдущему, найдем, что каждому типу должна отвечать сплошная часть поверхности89). Обе эти группы уравнений: 2 + (2) и (2) в свою очередь переходят одна в другую через уравнения с двумя действительными90) двойными корнями, символически (2) + (2); таким образом, точки, соответствующие уравнениям типа (2) + (2), должны принадлежать обоим полам дискриминантной поверхности; следовательно, они лежат на неизолированной ветви ее двойной линии. Таким образом, дискриминантная поверхность распадается на две части, разделяемые одной ветвью двойной линии; из них одна 2+ (2) отделяет I область пространства от II области, а другая (2) разделяет II и III области. Чтобы усмотреть, как расположена определяющая кривая, заметим, что она представляет собой ребро возврата, и потому в ее течках совпадают по три касательные плоскости, образуя соприкасающуюся плоскость; поэтому мы имеем здесь случай одного тройного и одного простого действительного корня: 1+(3); этот случай

*) Имеется в виду, что множество всех этих различных уравнений является связным и открытым в пространстве параметров.

может получиться только из случая 2+ (2), а именно, таким образом, что один из простых корней становится равным двойному корню; следовательно, ребро возврата должно целиком лежать на первой части 2+ (2) поверхности. Только в острие ребра возврата (х = у = z = 0) мы имеем четырехкратный корень, который может получиться и от совпадения обоих двойных корней (2)+ (2). Действительно, острие О ребра возврата лежит одновременно и на двойной линии. Что же касается изолированной ветви двойной линии, то она целиком проходит в области III и характеризуется тем, что для ее точек четыре мнимых корня по два совпадают между собой, образуя два двойных сопряженных мнимых корня.

Все перечисленные возможные случаи в точности реализованы на нашей модели. На чертеже (рис. 32) часть пространства, заключенная внутри поверхности справа от двойной линии, образует область I, а слева от той же линии лежит область III; пространство же, лежащее вне поверхности, образует область II91). Поэтому, имея в руках следующую схему, вы легко сможете вполне ориентироваться относительно числа действительных корней:

II. УРАВНЕНИЯ В ОБЛАСТИ КОМПЛЕКСНЫХ ЧИСЕЛ

Мы теперь откажемся от того, чтобы ограничиваться только действительными величинами, и будем оперировать с комплексными числами.

Здесь мы снова поставим себе целью выделить такие вещи, которые допускают геометрическую иллюстрацию в большей степени, чем это обыкновенно делают. Я начну с наиболее важной теоремы алгебры.

А. ОСНОВНАЯ ТЕОРЕМА АЛГЕБРЫ

Основная теорема алгебры, как известно, заключается в том, что всякое алгебраическое уравнение П-й степени имеет, вообще говоря, п корней, или, точнее, всякий полином f(x) П-й степени может быть разложен на п линейных множителей.

В сущности, все доказательства этой теоремы пользуются геометрической интерпретацией комплексных величин на плоскости ху. Я познакомлю вас с ходом мыслей в первом доказательстве Гаусса (1799), которое можно представить в наглядной форме; изложение его у самого Гаусса имеет, конечно, совершенно другой вид.

Если дан многочлен

f(z) = zn + (l{Zn-x+ _ +ап9

то можно написать

/(х + iy) = и(х, y) + i-v(х, у),

где и, V — некоторые действительные многочлены от обеих действительных переменных х, у. Основная мысль гауссова доказательства заключается в следующем: если исследовать кривые и(х,у) = 0 и v(x, у) = 0, лежащие в плоскости ху, и показать, что они должны иметь общую точку, то для этой точки (х,у) будет }(x + iy) = Q; этим и будет доказано существование по крайней мере одного корня уравнения /=0. Оказывается, что для этой цели достаточно исследовать ход обеих кривых в бесконечности, т. е. в сколь угодно большом удалении от начала координат.

Если абсолютная величина г переменной z становится весьма большой, то можно в функции f(z) пренебречь низшими степенями z по сравнению с г"; это означает, что функция /(г) асимптотически приближается к

где с помощью формулы Муавра введены полярные координаты г, ф на плоскости ху. Из этого результата можно заключить, что и и v асимптотически приближаются к функциям rncosnq> и r"sinmp; поэтому ход кривых и = 0, v = О в бесконечности в первом приближении изобразится так:

Но кривая sin мер = О состоит из п прямых, которые проходят через начало и образуют с осью х углы О, л/л, 2я/п, (п—1)я/л, а кривая cos мер = О состоит из п биссектрис углов между первыми прямыми (см. рис. 33, соответствующий случаю /г=3). В конечной части плоскости кривые и = О, v = О могут, конечно, существенно отклоняться от этих прямых, но чем дальше от начала, тем больше должны первые приближаться к последним; поэтому ход настоящих кривых можно схематически изобразить тем, что за пределами некоторой достаточно большой окружности (с центром в начале) мы сохраним наши прямые, а внутри нее соединим их между собой произвольным образом (рис. 34). Но каков бы ни был ход кривых внутри круга, уходящие в бесконечность ветви и, v должны непременно переходить одна в другую92), отсюда наглядно видно, что эти кривые внутри круга должны хоть раз пересечься. Действительно, этот результат можно — и в этом заключается содержание гауссова доказательства — точно вывести из непрерывности кривых. Но по существу ход идей изложен выше.

Когда получен таким образом один корень, тогда можно*) отщепить от функции f(z) один линейный сомножитель и повторить доказательство для оставшегося многочлена (п— 1)-й степени. Продолжая поступать таким образом, мы в конце концов действи-

Рис. 33 Рис. 31

*) Применяя теорему Безу.

тельно получим разложение на п линейных сомножителей, чем доказывается существование п корней.

Идея доказательства станет вам яснее, если вы проделаете несколько примеров со всеми построениями. Одним из простейших примеров является следующий:

/(2) = 2з_1=0.

Здесь, очевидно,

и = г3 cos Зф — 1, v = г3 sin Зф,

так что кривая v = О состоит просто из трех прямых, тогда как кривая и = 0 имеет три гиперболовидных ветви. На чертеже (рис. 35) вы, в самом деле, видите три точки пересечения обеих кривых; эти точки дают три корня нашего уравнения. Я весьма рекомендую разобрать более сложные примеры.

Этими краткими указаниями по поводу основной теоремы я могу здесь ограничиться, так как я не читаю сейчас курса алгебры. Замечу еще только, что значение введения комплексных чисел в алгебру в том и заключается, что они дают возможность установить основную теорему алгебры в общей форме, не допускающей никаких исключений; ограничиваясь же действительными величинами, можно утверждать только то, что уравнение п-й степени имеет либо п корней, либо меньше, либо ни одного93).

Время, которое остается у нас для алгебры, мы употребим на то, чтобы исследовать в наглядной форме полные системы решений комплексных уравнений подобно тому, как мы это уже сделали выше для действительных решений действительных уравнений. Но при этом мы ограничимся только уравнениями с одним комплексным параметром, входящим в уравнение линейно.

Рнс. 35

В. УРАВНЕНИЕ С ОДНИМ КОМПЛЕКСНЫМ ПАРАМЕТРОМ

В тех узких условиях, какими мы ограничили задачу, изучение простого конформного отображения даст нам все, что нам нужно.

Обозначим через z = х + 1у неизвестное, через w — u-\-iv параметр; тогда рассматриваемые уравнения будут иметь такой вид:

<р(г) — w • о|)(г) = 0, (1)

где ф, -ф — многочлены относительно z\ пусть п — показатель высшей степени z в ф или По основной теореме алгебры это уравнение для каждого значения до имеет п (вообще говоря, различных) корней г. Из уравнения (1) следует, что

(2)

т. е. что w есть однозначная рациональная функция от z, а именно, как говорят, рациональная функция степени п. Если бы мы захотели воспользоваться в качестве геометрического эквивалента уравнения (1) тем конформным отображением комплексных плоскостей z и до, которое устанавливается функциональной зависимостью (2), то наглядность нарушалась бы многозначностью z как функции до. Ввиду этого поступим так, как это всегда делается в теории функций: плоскость до мы представляем себе в виде п наложенных друг на друга экземпляров (листов), которые мы подходящим образом соединяем между собой в так называемых «точках ветвления» в одну п-листную риманову поверхность; этот прием знаком всем вам из элементов учения об алгебраических функциях94). Тогда наша функция (2) осуществляет взаимно однозначное и, вообще говоря, конформное соответствие между точками римановой поверхности над плоскостью до, с одной стороны, и точками обычной плоскости z, с другой стороны.

Прежде чем перейти к подробному изучению этого соответствия будет целесообразно принять некоторые меры к тому, чтобы устранить ту исключительную, но не лежащую в существе вещей роль, которую играют бесконечно большие значения до и г, и тем сделать возможной такую формулировку теорем, чтобы они не допускали исключений. Ввиду того, что эти усло-

бия, к сожалению, указывают далеко не всегда, когда это было бы необходимо сделать, мы остановимся на них несколько подробнее. А именно, мы считаем недостаточным говорить только символически о бесконечно удаленной точке комплексной плоскости, а следует уяснить себе, что именно нужно считать аналогичным определенному свойству конечной точки в том случае, когда точка становится бесконечно удаленной. Но мы будем иметь все, что нам нужно, если раз навсегда заменим гауссову плоскость комплексных чисел римановой сферой. С этой целью представим себе сферу диаметра 1, касающуюся плоскости

Гаусса в начале координат, и станем проектировать ее на плоскость из ее северного полюса N, диаметрально противоположного точке касания, или южному полюсу S (так называемая стереографическая проекция, рис. 36). При этом всякой точке Q на плоскости однозначно соответствует точка Р на сфере — вторая точка пересечения луча NQ со сферой, и, обратно, всякой точке Р сферы, кроме точки N, однозначно сопоставляется некоторая точка Q на плоскости с определенными координатами х, у; поэтому можно рассматривать точку Р как представителя числа x + iy. Когда же точка Р приближается по какому-либо пути к северному полюсу N, точка Q уходит в бесконечность, и наоборот. Поэтому представляется естественным рассматривать точку N, которой не сопоставлено никакое конечное комплексное число, как единственного представителя всех бесконечно больших чисел х + iy т. е. как конкретный образ бесконечно удаленной точки числовой плоскости. Этим достигается в геометрической интерпретации полная равноправность как всех конечных, так и бесконечно удаленной точки.

Теперь, чтобы вернуться к геометрическому истолкованию нашего алгебраического соотношения (1), заменим также плоскость w сферой w. Тогда наша

Рис. 36

функция представит отображение сферы z на сферу w\ это отображение конформно так же, как и соответствие обеих плоскостей, по той причине, что по известной теореме стереографическая проекция конформно отображает плоскость на сферу и обратно. При этом одной точке на сфере w отвечают, вообще говоря, п различных точек на сфере z. Чтобы получить взаимно однозначное соответствие, представим себе п экземпляров сферы w, наложенных один на другой, и скрепим их в точках ветвления в одну п-листную риманову поверхность над сферой w. Составить себе такое представление не труднее, чем уяснить понятие о римановой поверхности на плоскости. Этим достигается в конце концов геометрическое истолкование алгебраического уравнения (1) как взаимно однозначного, вообще говоря, конформного соответствия между точками римановой поверхности над сферой w, с одной стороны, и сферы z, с другой стороны; в эту интерпретацию включены, очевидно, и бесконечные значения z и w, которые соответствуют или друг другу или конечным значениям этих переменных.

Чтобы получить возможность вполне использовать эти новые геометрические средства, необходимо и в алгебре сделать соответствующий шаг, направленный к тому, чтобы устранить в формулах исключительный характер бесконечно большого; этот шаг заключается во введении однородных переменных, а именно, мы полагаем z = — и рассматриваем z\ и z2 как две независимые комплексные переменные, но такого рода, что z\/z2 и c-z\/c-z2 при любом с изображают одну и ту же точку95). Пусть zu ^2 принимают нее возможные пары конечных значений, но только не обращаются одновременно в нуль; тогда, согласно сделанному условию, для каждого конечного значения z мы получим одну определенную точку, но кроме того, существует еще одна точка (z\ произвольно, 22 = 0), соответствующая бесконечному значению г. Таким образом, получаем арифметический эквивалент бесконечно удаленной точки. Точно так же, радо.

зумеется, полагаем w = ~^ и пишем следующее «однородное» уравнение между «однородными» перемен-

ными Zu z2 и wu W2> соответствующее уравнению (2):

(3)

Здесь ф(21,г2), i|)(2i,22) означают целые рациональные функции от 2i и 22, так как ф(2) и ty(z) содержат z = —, самое большее, в п-и степени; кроме того, это однородные многочлены (формы) измерения я, ибо каждый член z1, входящий в ф(2) или г|з(2), при умножении числителя и знаменателя дроби

на z\ обращается в

т. е. в член дг-ro измерения.

Теперь нам предстоит, последовательно применяя оба введенных вспомогательных средства — изображение на комплексной сфере и однородные координаты,— изучить во всех подробностях ту функциональную зависимость между z и w, которую устанавливает уравнение (1). Эта задача будет решена, если мы сумеем составить себе полное представление о конформном соответствии между сферой z и римановой поверхностью над сферой w.

Но здесь прежде всего возникает вопрос о характере и положении точек ветвления на поверхности Римана. Я напомню, что р,-кратной точкой ветвления называется такая точка, в которой сходится лист96). Так как w является однозначной функцией переменной 2, то положение точек ветвления будет нам известно, если мы будем знать соответствующие им точки на сфере г; я обыкновенно называю их просто замечательными точками сферы 2. Им тоже соответствует известная кратность, равная кратности соответствующих им точек ветвления. Я приведу без подробного доказательства теоремы, решающие эту задачу. При этом я предполагаю, что эти, собственно говоря, довольно простые факты из области теории функций в общем вам знакомы, хотя, быть может, и не в той однородной трактовке, которой я здесь отдаю предпочтение. Абстрактные вещи, о которых я

сейчас буду говорить, получат позже в ряде примеров конкретную наглядную форму.

Начнем с небольшого вычисления, которое даст

dw

нам аналог производной -^j в однородных координатах. Продифференцируем уравнения (3):

(3')

Но

где

С другой стороны, по теореме Эйлера об однородных функциях степени п имеем

<Pl • *i + Ф2 • Z2 = Лф, *1 •г1 + ф2в^2 = Лф.

Поэтому числитель в правой части равенства (3') можно преобразовать следующим образом:

что по теореме умножения определителей равняется

Поэтому соотношение (3х) принимает такой вид:

Это — основная формула в однородной теории нашего уравнения; определяющим выражением для всего последующего является функциональный определитель ф1г|)2— ф2г|)1 форм ф и -ф. Кроме этого множителя, справа входит дифференциал от z =—, а слева дифференциал от ш = -^-, а так как для конечных значений переменных z и w замечательные

точки получаются, как известно*), из уравнения *gj"= 0, то становится ясной следующая теорема, строгого доказательства которой я не могу здесь излагать: каждый \х-кратный корень функционального определителя является замечательной точкой \к-й кратности; другими словами, ей соответствует [i-кратная точка ветвления римановой поверхности над сферой w. Главное преимущество этого правила по сравнению с прежними заключается в том, что оно в общей формулировке охватывает конечные и бесконечные значения z и w. Оно же дает точное указание относительно числа замечательных точек. Действительно, четыре производные, входящие в функциональный определитель, представляют собой формы (п— 1)-го измерения, поэтому сам определитель есть форма (2м — 2)-го измерения. А такой многочлен всегда имеет как раз 2п — 2 корня, если принимать во внимание кратности последних. Если поэтому ai, 0&2, av — замечательные точки сферы z (т. е. если ф1ф2 — 'Ф1ф2 = 0 для Zi:22 = ai, a»), а Hi* JLI2» \iv — их кратности, то сумма последних

^1 + ^2+ ... + \iv = 2n — 2.

В силу конформного отображения этим точкам отвечают v точек ветвления ab а2, av римановой поверхности над сферой w; они расположены на поверхности изолированно, и в них в круговом порядке сходятся соответственно m + 1, 112+1. ...» H* + 1 листов. Но следует заметить, что несколько различных точек ветвления могут лежать над одной и той же точкой сферы w, так как из соотношения w = для 2 = аь av может получиться несколько раз одно и то же значение до. Над такой точкой окажется тогда несколько различных (друг от друга изолированных) групп листов, причем листы каждой группы в этой точке склеены между собой. Такие точки на сфере w мы будем (в отличие от точек ветвления римановой поверхности, соответствующих замечательным точкам сферы г) называть местами ветвления и будем обозначать их через Л, В, С, ... ; число та-

*) См. примечание 96.

ких различных мест ветвления может, таким образом, быть меньше и.

Теперь мы построим поверхность Римана, о которой по имеющимся пока у нас данным мы можем иметь лишь весьма расплывчатые представления, причем сделаем это таким образом, чтобы она получила более наглядный вид. С этой целью проведем на сфере w через места ветвления /4,/i, С, ... замкнутую линию © без кратных точек возможно более простого вида; заштрихуем одну из ограниченных ею частей сферы в отличие от другой (рис. 37). Во всех примерах, разбираемых нами ниже, все точки Л, ß, С, ... действительны; в этом случае естественно взять за линию (£ меридиан97) действительных чисел, так что наша сфера распадается на две полусферы.

Возвращаясь к общему случаю, заметим, что каждый лист римановой поверхности склеивается с другим листом вдоль линии разреза, или, как мы будем говорить, линии ветвления, соединяющей две точки ветвления. Как известно, риманова поверхность, по существу, остается неизменной, когда мы такую линию как-либо по ней перемещаем, если при этом концы ее остаются неподвижными, другими словами, если те же листы скреплять между собой вдоль иных линий, соединяющих те же точки. В этой неизменяемости заключается большая общность, но в то же время и существенная трудность идеи поверхностей Римана. Чтобы придать нашей поверхности определенный вид, легко допускающий конкретное представление, сдвинем все линии ветвления таким образом, чтобы все они лежали над построенной выше линией 6, проходящей через все места ветвления; при этом над одними частями линии <£ может, конечно, лежать по нескольку линий ветвления, а над другими частями линии 6 может их вовсе не быть.

Теперь разрежем все листы вдоль линий, лежащих над <£. Ввиду того, что мы уже раньше поместили все линии ветвления над линией © и теперь произ-

Рис. 37

водим вдоль всех них разрезы, наша риманова поверхность распадается на две группы по п «полулистов», совершенно свободных от ветвлений и расположенных над каждой из двух частей сферы, ограниченных линией 6. Соответственно тому, как мы условились выше различать обе части сферы, мы будем говорить о п заштрихованных и о п незаштрихованных полулистах. Теперь мы можем так описать строение римановой поверхности: каждый заштрихованный полулист на ней окружен исключительно незаштрихованными полулистами, с которыми он встречается вдоль линий, расположенных над частями AB, ВС, ... линии S; аналогично этому, каждый незаштрихованный полулист окружен вдоль таких отрезков кривой одними лишь заштрихованными полулистами. Но более чем два полулиста встречается только в точках ветвления, а именно, в \х-кратной точке ветвления сходятся попеременно р, + 1 заштрихованных и [x + 1 незаштрихованных полулистов.

Ввиду того, что посредством нашей функции w (z) сфера z взаимно однозначно отображена на риманову поверхность над сферой w, можно сразу перенести на сферу z найденные соотношения склеивания. Именно, в силу непрерывности 2п полулистам поверхности соответствуют 2п односвязных областей на сфере г, которые мы назовем соответственно заштрихованными и незаштрихованными полуобластями; они отделяются одна от другой кривыми на сфере г, в которые п-значная функция*) z(w) отображает каждую из частей AB,ВС, ... линии 6. Каждая заштрихованная полуобласть соприкасается вдоль таких кривых исключительно с незаштрихованными полуобластями, и наоборот; только в [i-кратной замечательной точке сходятся больше чем две полуобласти, а именно, [X -f- 1 заштрихованных и столько же незаштрихованных.

Это разбиение сферы z на области послужит нам для того, чтобы проследить во всех деталях ход функции z(w) для некоторых простых и характерных примеров. Начнем с самого простого примера.

*) То есть функция z = g(w), обратная функции (2); этой функции и соответствует рассматриваемая риманова поверхность.

1. Двучленное уравнение zn = w

Как известно, формальное решение этого уравнения получают, вводя знак корня или радикала: z = ^w* но от этого мы не много выигрываем в смысле знания функциональной зависимости, связывающей г и w. Поэтому станем поступать согласно нашему общему приему: вводим однородные переменные

и составляем функциональный определитель числителя и знаменателя правой части:

Для этого определителя z\ = 0 и 22 = 0 — или, в неоднородной форме, 2 = 0 и 2 = сю — представляют собой корни (п—1)-й кратности; следовательно, известны все замечательные точки с общей суммой кратностей 2п— 2. Но (согласно нашей общей теореме) над соответствующими в силу зависимости w = zn местами ветвления w = 0 и w = оо находятся две точки ветвления поверхности Римана над сферой w, и притом кратность той и другой равна п— 1, так что в каждой из них сходятся циклически все п листов. Обозначим через 6 действительную прямую на сфере w и разрежем все листы римановой поверхности вдоль линий, расположенных над этой прямой, сдвинув предварительно линии ветвления соответствующим образом. Из 2п полусфер, на которые распадается при этом поверхность, представим себе заштрихованными те, которые соответствуют значениям w с положительной мнимой частью. На действительной прямой различаем полупрямую (луч) положительных действительных чисел (сплошная линия на рис. 38), и луч отрицательных чисел (пунктир).

Рис. 38

Теперь исследуем изображения этой прямой S на сфере 2, производящие характеристическое деление последней на полуобласти. Вдоль положительного луча имеем w = г, где г пробегает значения от О до оо. Поэтому на основании известной формулы из теории комплексных чисел находим

Эти значения z заполняют для различных k те полупрямые (меридианы) сферы 2, которые составляют с лучом положительных чисел углы

Таким образом, эти линии соответствуют той дуге, которая изображена сплошной линией. Аналогично, на отрицательной полупрямой сферы w надо положить w = — г — r*ein, где снова 0 ^ г ^ оо; это дает

где k = 09 1, п—1. Эти значения заполняют п меридианов сферы z с «географическими долготами»

которые, таким образом, делят пополам углы между предыдущими меридианами. Таким образом, сфера z распадается на 2п равных двусторонников с вершинами в северном и южном полюсе — подобно тому, как надрезают апельсин. Это разбиение в точности соответствует общей теории; в частности, только в замечательных точках — в обоих полюсах — пересекаются более чем две полуобласти, а именно 2п, что соответствует кратности п—1. Что же касается распределения заштрихованных и незаштрихованных полуобластей, то необходимо определить относительно одной какой-нибудь полуобласти, следует ли ее заштриховать или нет; тогда остальные полуобласти придется заштриховать через одну. Если смотреть на заштрихованную половину сферы w, то мы увидим,

что сплошная часть ее периферии лежит влево от нас, а пунктирная вправо98). А так как мы имеем дело с конформным отображением без переворачивании углов (или «прямым» конформным отображением), то и каждая заштрихованная полуобласть на сфере г должна быть так расположена, что сплошная часть ограничивающей ее линии лежит слева, а пунктирная часть справа99). Это дает нам полное знание распределения полуобластей на сфере г. Следует обратить внимание на характерное различие в распределении областей на обеих половинах сферы z в зависимости от того, четно п или нечетно, как это видно на рис. 39 и 40 для случаев п = 3 и п = 4.

Рис. 39 Рис. 40

Хочу обратить ваше внимание и на то, насколько действительно необходимо перейти к комплексной сфере для полного понимания положения вещей; в случае комплексной плоскости мы получили бы разбиение на углы с общей вершиной в начале координат*), и представлялось бы далеко не таким наглядным то, что 2 = сю как замечательная точка и w =оо как место ветвления имеют то же значение, что и точки 2 = 0иш = 0.

Теперь мы имеем основу для полного выяснения функциональной связи между z и w\ остается только изучить конформное отображение каждого из 2п сферических двусторонников на ту или другую полусферу w. Но я не стану здесь входить в рассмотрение этого вопроса; всякому, кому приходилось иметь дело

*) См. рис. 129 (с. 405).

с конформным отображением, этот случай знаком как один из простейших и в высшей степени наглядных примеров. К способам численного определения z нам еще придется вернуться ниже.

Теперь же займемся важным вопросом о взаимоотношении между отдельными однородными полуобластями на сфере z. Точнее говоря: w = zn принимает одно и то же значение в соответственных точках всех п заштрихованных областей; не выражаются ли отвечающие этим точкам значения z простым образом друг через друга? Действительно, мы сразу видим, что для z' = z-ey где е— какой-нибудь из корней п-й степени из единицы, всегда z,n = zn, т. е. w = zn принимает одно и то же значение во всех п точках

(2)

Поэтому эти п точек распределены как раз между всеми п заштрихованными областями и пробегают по каждой из них, когда z движется по одной какой-нибудь; то же имеет место и для незаштрихованных областей. Но каждая подстановка вида (2) геометрически означает поворот сферы z около вертикальной оси (О, оо) на угол у • — , так как в комплексной плоскости, как известно, умножение на е п изображает поворот около начала на угол ——. Таким образом, соответственные точки наших сферических областей, как и сами области, переходят друг в друга при п таких поворотах около вертикальной оси.

Поэтому, если бы мы заранее могли определить хоть одну заштрихованную область сферы, то это замечание дало бы нам и остальные области. При этом применяется только то свойство подстановок (2), что они преобразуют уравнение (1) само в себя (т. е. превращают уравнение zn = w в z' =w) и что число их совпадает со степенью уравнения. В дальнейших примерах мы всегда будем иметь возможность заранее указать такие линейные подстановки и постоянно будем пользоваться тем существенным упрощением, которое благодаря этому вносится в решение вопроса о разбиении на области.

Теперь мы воспользуемся нашим примером для выяснения одного важного понятия весьма общего характера, а именно, понятия неприводимости в приложении к уравнениям, которые рационально содержат один параметр w. О неприводимости уравнений с рациональными числовыми коэффициентами мы j же говорили по поводу построения правильного семиугольника. Уравнение f(zy w) = 0 (например, наше уравнение zn— ш = 0), в котором f(zfw)—многочлен, целый относительно г, и коэффициенты которого являются рациональными функциями от w, называется приводимым по отношению к параметру до, если / разлагается в произведении двух многочленов того же рода:

f (z, w) = f{ (г, w) • f2 (z, w);

в противном случае уравнение называется неприводимым относительно w. Все обобщение по сравнению с прежним понятием сводится к тому, что под «областью рациональности», в которой мы оперируем и к которой должны принадлежать все коэффициенты рассматриваемых многочленов, вместо совокупности всех рациональных чисел теперь мы понимаем совокупность всех рациональных функций одного параметра w; мы переходим, таким образом, от точки зрения чистой теории чисел к точке зрения теории функций.

Изображая наглядно всякое уравнение f{z, w)=0 посредством его римановой поверхности, можно установить простой критерий приводимости в этом новом смысле. В самом деле, если уравнение приводимо, то всякая пара значений (г, до), удовлетворяющая ему, должна обращать в нуль либо fi{z, w) либо /2(2, до). Но решения уравнений /1 = 0, f2 = О изображаются их римановыми поверхностями, которые не имеют между сообой ничего общего и, в частности, нигде не скреплены. Следовательно, риманова поверхность, принадлежащая приводимому уравнению /(г, до) = 0, должна распадаться по крайней мере на две раздельные части.

Поэтому мы можем теперь сразу же утверждать, что уравнение zn — до = 0 неприводимо в понимании теории функций. В самом деле, в каждой точке разветвления ее римановой поверхности, которая нам в

точности известна, циклически связаны между собой все п листов, и, кроме того, вся поверхность отображается на связную сферу z\ поэтому распадения на части нет.

Невозможность деления угла на три равные части. В виде приложения мы можем теперь заняться решением одной уже раньше затронутой популярной математической проблемы, — а именно, задачи о делении любого угла ф на п равных частей, в частности для л = 3,— задачи о трисекции угла. Задача состоит в том, чтобы найти точное построение с помощью циркуля и линейки, которое давало бы деление любого угла ф на три равные части. Для целого ряда специальных значений угла ф*) легко можно найти такие построения. Я хочу познакомить вас с ходом мыслей в доказательстве невозможности трисекции угла в указанном смысле; при этом я прошу вас вспомнить доказательство невозможности построения правильного семиугольника с помощью циркуля и линейки. Как и в том доказательстве, мы сведем задачу к неприводимому кубическому уравнению и затем покажем, что его невозможно решить посредством одних только извлечений квадратного корня. Но только теперь в уравнение будет входить параметр — угол ф, — тогда как раньше коэффициенты были целыми числами; в соответствии с этим теперь вместо числовой должна оказаться функциональная неприводимость.

Чтобы получить уравнение, дающее запись нашей проблемы, представим себе, что на положительной полуоси действительных чисел построен угол ф (рис. 41); тогда его вторая сторона пересечет окружность радиуса 1 в точке

Наша задача сводится к тому, чтобы найти такое независимое от величины угла ф построение, состоящее из конечного числа операций с циркулем и линейкой, которое всякий раз давало бы точку пересе-

Рис 41

*) Например, лля ф = 90°.

чения этой окружности со стороной угла т. е. точку

Это значение z удовлетворяет уравнению

(3)

и аналитический эквивалент нашей геометрической задачи состоит в том, чтобы решить это уравнение посредством конечного числа извлечений квадратных корней из рациональных функций от costp и sin<p, ибо это суть координаты точки до, из которых мы должны исходить при нашем построении.

Прежде всего надо убедиться в том, что уравнение (3) неприводимо с точки зрения теории функций. Правда, это уравнение не вполне подходит под тот тип уравнений, который мы имели в виду в предыдущих общих рассуждениях: вместо рационально входящего комплексного параметра до здесь рационально входят две функции — косинус и синус — действительного параметра ф. Мы назовем здесь многочлен г3 — — (cos ф + i sin ф) приводимым при условии, что он распадается на многочлены относительно z, коэффициенты которых тоже являются рациональными функциями от cos ф и sin ф. Можно дать критерий понимаемой в этом смысле приводимости, вполне подобный прежнему. А именно, если ф в равенстве (3) пробегает все действительные значения, то до = е1^ = cos ф + +/sinq> пробегает в то же время окружность радиуса 1 в плоскости до, которой в силу стереографической проекции соответствует экватор на сфере до. Линия, лежащая над этой окружностью на римановой поверхности уравнения г3 = до и одновременно пробегающая все три листа, при помощи (3) взаимно однозначно отображается на окружность радиуса 1 сферы z и поэтому может быть до некоторой степени названа его «одномерным римановым изображением». Ясно, что подобным образом можно для всякого уравнения вида f(z, cosy, зтф) = 0 построить такое риманово изображение; для этого нужно взять столько экземпляров окружностей с радиусом 1 и с длиной дуги ф, сколько корней имеет уравнение, и скрепить их соответственно связности корней. Далее заключаем

совершенно подобно прежнему, что уравнение (3) только тогда могло бы быть приводимым, если бы его одномерное риманово изображение распадалось на отдельные части, но в данном случае это не имеет места, и потому неприводимость нашего уравнения (3) доказана.

Прежнее доказательство того, что всякое кубическое уравнение с рациональными численными коэффициентами, разрешимое посредством ряда извлечений квадратного корня, является приводимым, может быть дословно перенесено на настоящий случай неприводимого в функциональном смысле уравнения (3)*); стоит только вместо слов «рациональные числа» говорить каждый раз «рациональные функции от cos ф и sin ф». После этого является вполне доказанным наше утверждение о том, что невозможно выполнить посредством конечного числа операций (с циркулем и линейкой) деление на три части произвольного угла ф; таким образом, все старания людей, занимающихся трисекцией угла, обречены на вечную бесплодность!

Теперь перейдем к рассмотрению несколько более сложного примера.

2. Уравнение диэдра

Так называют следующее уравнение:

(1)

основание же для такого названия будет выяснено ниже. Умножая на гп, находим, что степень этого уравнения равна 2п. Вводя однородные переменные, получаем

здесь действительно числитель и знаменатель представляют собой формы степени 2п. Их функциональный определитель равен

*) См. первую часть этой книги (Арифметика),

Прежде всего, он имеет корни z\ = 0 и г2 = 0 кратности п—1 каждый; остальные 2п корней получаются из уравнения

или

Если ввести наряду с корнем л-й степени из единицы

которым мы пользовались уже выше, еще и следующий корень л-й степени из — 1:

то остальные 2п корней таковы:

и

так как соответствующие значения z = -—-имеют каждое модуль 1 и поэтому расположены на экваторе z (соответствующем окружности радиуса 1 на плоскости г) на одинаковых угловых расстояниях -2. одно от другого. Итак, мы находим следующие замечательные точки на сфере z: южный полюс z = 0 и северный полюс z = oo каждый кратности п—1; 2п точек на экваторе z = ev, z = e'-ev каждая кратности 1.

Сумма всех кратностей равна 2-(/г — 1) + 2л1-1 == = 4п — 2, как того требует общая теорема (с. 156) при степени 2п. В силу (1) замечательным точкам z = 0, z = оо на сфере до отвечает точка до = оо, всем точкам z = ev — точка w = +1 и, наконец, всем точкам z = e'-ev— точка до= —1. Поэтому на сфере до имеются только три места ветвления: оо, +1, — 1. При этом

над до = оо расположены 2 точки ветвления кратности п — 1,

над до = +1 расположены п точек ветвления кратности 1,

над w = — 1 расположены п точек ветвления кратности 1.

Таким образом, из 2п листов поверхности Римана в точке w = со циклически сходятся обе группы по п листов, а в каждой из точек ш = + 1 и w = — l сходятся п раз по два листа. Детали расположения этих листов представятся нагляднее, если мы изучим соответствующее разбиение сферы z на полуобласти.

Для этого полезно знать, как замечено выше, те линейные подстановки, которые преобразуют уравнение (1) в себя. Прежде всего, оно остается неизменным, подобно двучленному уравнению, при п подстановках

(2а)

где е =e2in/n, так как при них z'n — zn. Точно так же оно переходит в себя при следующих п подстановках:

(2b)

так как они только меняют местами zn и—» . В итоге мы имеем 2п линейных преобразований уравнения (1) в себя, т. е. как раз число, равное степени уравнения. Поэтому, зная при некотором значении w один корень 20 уравнения, можно сразу получить все корней: ev20 и — (v = 0, 1, я-1), если только известен корень я-й степени из единицы.

Теперь перейдем к исследованию того разбиения сферы 2, которое соответствует разрезанию римановой поверхности над сферой w вдоль действительной прямой; при этом мы будем различать на этой прямой, как и в предыдущем примере, отрезки, определяемые тремя местами ветвления, а именно: от +1 до оо (сплошная линия), от со до —1 (пунктир), от —-1 до + 1 (штриховая линия) (рис. 42). Каждому из этих трех отрезков отвечают на сфере z по 2п различных дуг, которые все получаются из одной из них с помощью 2п линейных подстановок (2); поэтому достаточно определить каждый раз положение одной из них. С другой стороны, все эти дуги должны соединять замечательные точки 2 = 0, со, ev, e'«ev, которые мы прежде всего отмечаем на сфере 2. Аналогично

предыдущему случаю, изображение этих отрезков несколько различается в зависимости от того, является ли п четным или нечетным числом. Для нас достаточно будет наглядно представить себе один какой-нибудь определенный случай, например п = 6. Рис. 42 изображает в прямоугольной проекции переднюю сторону сферы z\ на ней видны из точек еЛ, лежащих на экваторе на расстоянии 60° друг от друга, начиная слева, точки е3 = — 1, е4, е5, е6= 1, а из точек e'-ev, расположенных посередине между первыми, видны точки е'-е3, е'-е4 =—/, е'-е5.

Я утверждаю, что луч (+1,оо) действительной прямой на сфере z соответствует части +1<ш< +°° на сфере w. Действительно, если положить z = г и придавать г действительные значения от 1 до оо, то

ш = у (г'1 + -^?г) = у(г,1 + ~^) будет принимать также возрастающие*) действительные значения от 1 до оо. Из этой дуги получаются п других связных дуг на сфере z с помощью п линейных подстановок (2а), которые, как мы знаем из первого примера, изображают повороты сферы около вертикальной оси (0, оо) на углы —, —, ——-—-—; таким образом, мы получаем п полумеридианов, соединяющих северный полюс оо с точками ev экватора. Еще одну связную дугу мы получим, применяя, например, подстановку z' = •—. которая переводит отрезок положительного

Рис 42

*) Поскольку

луча от +1 До сю в нижний отрезок меридиана, соединяющий точки +1 и 0. Если подвергнуть и эту кривую всем поворотам (2а)—соединение этих поворотов с преобразованием ;г'=*~-дает все подстановки (2b),— то получим еще п полумеридианов, соединяющих южный полюс с точками экватора ev, так что мы действительно получаем 2/г искомых связных дуг, соответствующих полумеридиану сферы w. При п = 6 эти дуги составляют три больших окружности, которые получаются из одной (действительной) поворотами на углы 0, 60, 120°.

Теперь мы можем убедиться в том, что совокупность значений г = е'-г, где г снова пробегает действительные значения от +1 до со, соответствует части действительного меридиана w> изображенной пунктиром; в самом деле, уравнение (1) при этих значениях дает

следовательно, w постоянно убывает от — 1 до — оо. Но г = г'-г представляет полумеридиан от оо до точки е' на экваторе; применяя к нему снова подстановки (2а) и (2b), находим аналогично предыдущему, что части действительного меридиана w, отмеченной пунктиром, соответствуют все полумеридианы, соединяющие полюсы с точками экватора е'-е, так что эти меридианы делят пополам углы между меридианами, которые мы использовали выше.

Остается найти 2п криволинейных отрезков, соответствующих дуге -{-I <С w <С -\-\> отмеченной штриховой линией; я докажу, что это как раз отрезки, определяемые на экваторе сферы z точками ev и 6'-ev. В самом деле, экватор изображает точки с модулем 1 и поэтому может быть представлен посредством функции z = е1ф, где ф принимает действительные значения от 0 до 2я. Поэтому соответствующее w равно

оно, действительно, остается всегда действительным и по модулю меньшим единицы, а именно, принимает по

разу все значения между +1 и —1, когда ф пробегает дугу длиною -2., т. е. w пробегает один из тех отрезков, о которых идет речь.

Определенные таким образом дуги делят сферу z на 2-2п треугольных (при п> 1) полуобластей; каждая из них ограничена тремя дугами, по одной каждого рода, и соответствует одному из полулистов поверхности Римана. В замечательных точках сходятся вместе по нескольку областей, а именно, как это и должно быть по таблице кратностей (с. 167, 168), в северном и южном полюсах по 2-я, а в каждой из точек 8v и e'*ev по 2-2. Чтобы определить, какие из этих областей следует заштриховать, обратим внимание на то, что граница заштрихованной полусферы (соответствующей значениям до с положительной мнимой частью), пробегаемая в положительном направлении, состоит из сплошной, штриховой и пунктирной дуг; ввиду конформности отображения следует заштриховать все те полуобласти, у которых три части периферии следуют одна за другой в таком же порядке, все же остальные оставить без штриховки.

Таким образом, мы получили полное геометрическое изображение зависимости между z и до, выражаемой нашим уравнением; это изображение можно проследить еще дальше, подробнее разбирая конформное отображение отдельной треугольной области на полусферу до, но мы не станем здесь этим заниматься. Я хочу только описать эти результаты в применении к случаю п = 6, на котором мы останавливались выше. В этом случае сфера распадается на 12 заштрихованных и 12 незаштрихованных треугольников, из которых на нашем рисунке видно по 6 тех и других. В каждом полюсе сходятся по 6 треугольников того и другого рода, а в 12 равноотстоящих точках экватора по 2. Каждая область конформно отображается на такой же полулист поверхности Римана; последние соответственно группировке полуобластей соединяются по 6 полулистов каждого рода над местом ветвления оо и по 2 каждого рода над местами ветвления ±1.

Особенно удобное и — ввиду аналогии с последующим—особенно ценное изображение деления сферы получается так: соединяют отрезком каждые две соседние точки деления экватора, отстоящие одна от

другой на — (например, все ev), и затем каждую из них с обоими полюсами (рис. 43). Таким образом получают вписанную в сферу двойную пирамиду с п (на нашем рисунке 6) боковыми гранями у каждой из простых пирамид. Если спроектировать сферу с ее областями из центра на эту пирамиду, то каждая треугольная грань разделится своей высотой на две половины, одна из которых заштрихована. Если принять эту двойную пирамиду за изображение деления сферы и, следовательно, как наглядное представление о нашей функции, то она окажет нам те же услуги, какие представят правильные многогранники в нижеследующих примерах. Мы достигаем полной аналогии с последними, если представим себе, что наша двойная пирамида сплюснута в плоскость оснований, и станем рассматривать получающийся при этом дважды покрытый правильный п-угольник (шестиугольник), обе стороны которого*) разделены прямыми, соединяющими центр его с вершинами и с серединами сторон, на 2п треугольников каждая (рис. 44). Я всегда был склонен причислять эту фигуру, называя ее диэдром, к пяти правильным многогранникам, которые известны со времен Платона100). Действительно, она удовлетворяет всем условиям, которыми обыкновенно определяют правильный многогранник: все ее ребра равны между собой (стороны правильного «-угольника), и углы ее также равны между собой (углы я-угольника); единственное различие заключается в том, что она не представляет собой тела в буквальном смысле, так как заключает в себе объем, равный нулю. Таким образом, теорема Платона о том, что суще-

Рис. 43 Рис. 44

*) Верхняя и нижняя.

ствует только пять правильных многогранников, справедлива лишь в том случае, если включить в определение требование — всегда, конечно, молчаливо подразумеваемое,— что многогранник является телом в собственном смысле слова.

Исходя из диэдра, можно, очевидно, получить наше деление сферы, проектируя на сферу не только его вершины, но также середины его сторон и боковые грани; поэтому его тоже можно рассматривать как представителя изображаемой нашим уравнением функциональной зависимости между w и z, так что это уравнение можно, как уже было указано, назвать уравнением диэдра.

Теперь мы переходим к упомянутым уже примерам, которые имеют непосредственное отношение к правильным телам Платона.

3. Уравнения тетраэдра, октаэдра и икосаэдра

Мы увидим, что два последних уравнения мы могли бы с таким же правом назвать уравнениями куба и додекаэдра, так что действительно перебраны все пять правильных тел. Здесь мы пойдем по обратному пути по сравнению с предыдущим примером: сначала мы выведем, исходя из правильного тела, деление сферы на области и затем составим соответствующее алгебраическое уравнение, которое находит в этой фигуре свое геометрическое наглядное изображение. Но мне придется при этом часто ограничиваться намеками, и поэтому я с самого начала указываю вам на мою книгу «Лекции об икосаэдре и о решении уравнений пятой степени»*), в которой вы найдете систематическое изложение всей этой обширной теории со всеми ее приложениями.

Я буду разбирать все три случая параллельно и начну с деления сферы на области для тетраэдра.

1. Тетраэдр. Разделим каждый из 4 равносторонних треугольников тетраэдра тремя высотами на 6 треугольничков, которые по три получаются друг из друга поворотами, в то время как соседние треугольнички зеркально симметричны между собой (рис. 45).

*) Klein F. Vorlesungen über das Ikosaeder und die Auflösung der Gleichungen vom fünften Grade. — Leipzig, 1884.

В результате получается разбиение всей поверхности тетраэдра на 24 треугольничка; одну из этих групп треугольничков отметим штриховкой (рис. 46). Что же касается вершин этих треугольников, то можно различать три рода их, так что каждый треугольник имеет по одной вершине каждого рода:

а) 4 вершины первоначального тетраэдра, в которых сходятся по 3 заштрихованных и по 3 незаштрихованных треугольника;

b) 4 центра граней, которые в свою очередь образуют правильный тетраэдр (гомотетичный первоначальному с коэффициентом — у) ; в них сходятся по 3 треугольника каждого рода;

c) 6 середин ребер, образующие правильный октаэдр; в них сходятся по 2 треугольника каждого рода.

Если спроектировать это деление на треугольники из центра на описанную сферу, то последняя разделится на 2-12 треугольников, ограниченных дугами больших кругов; они попеременно получаются друг из друга поворотами и зеркальными симметриями. Около каждой вершины рода а, Ь, с расположены соответственно по 6, 6, 4 равных углов, и так как сумма углов на поверхности шара вокруг точки всегда равна 2я, то каждый из наших сферических треугольников имеет в вершинах а и Ъ углы ~, а в вершине с — угол-^ .

Характерное свойство этого разбиения сферы заключается в том, что оно, как и сам тетраэдр, при некоторых поворотах около центра переходит в себя. Вы легко можете представить себе это во всех деталях на модели тетраэдра, но здесь я ограничусь тем,

Рис. 45 Рис. 46

что перечислю все возможные повороты, причем к ним всегда будет причисляться «движение», оставляющее фигуру в покое, в качестве «тождественного поворота». Выберем какую-нибудь определенную вершину первоначального тетраэдра; поворотом мы можем совместить ее с любой другой вершиной тетраэдра (или с нею же самой), что дает четыре возможных случая. Оставляя же ее неподвижной в одном из этих положений, можно тремя различными поворотами совместить тетраэдр с самим собой, а именно, поворачивая его на углы 0, 120 или 240° вокруг прямой, проходящей через эту неподвижную вершину и через центр. Это дает в общем 4»3= 12 поворотов, которые переводят тетраэдр или соответствующее деление описанной сферы на треугольники в себя. Посредством таких поворотов можно любой заштрихованный (или незаштрихованный) треугольник перевести в любой другой заштрихованный (соответственно незаштрихованный) треугольник; любой поворот вполне определен, если дан и этот второй треугольник. Эти 12 поворотов образуют, очевидно, то, что называют группой G12, т. е. если произвести два таких поворота один после другого, то результат будет также одним из этих 12 поворотов101).

Если рассматривать нашу сферу как сферу 2, то каждый из этих 12 поворотов может быть представлен посредством линейного преобразования переменной 2; получаемые таким образом 12 линейных преобразований не изменяют уравнения, принадлежащего тетраэдру. Для сравнения я замечу, что, как вы сами можете убедиться, 2п линейных подстановок уравнения диэдра можно интерпретировать как совокупность поворотов диэдра в себя.

2. Приложим аналогичные рассуждения к октаэдру, но теперь мы можем выражаться более сжато. Разделим, как и раньше, каждую из 8 боковых треугольных граней на 6 треугольничков; получается разбиение всей поверхности октаэдра на 24 заштрихованных треугольничка, получающихся друг из друга поворотами, и на 24 незаштрихованных (зеркально симметричных по отношению к первым) треугольничка (рис. 47). И на этот раз можно различать вершины трех родов:

a) 6 вершин октаэдра, в которых сходятся по 4 треугольника каждого рода;

b) 8 центров граней, образующих вершины куба; в них сходятся по 3 треугольника каждого рода;

c) 12 середин ребер, в которых встречаются по 2 треугольника каждого рода.

Переходя с помощью центральной проекции к описанной сфере, получаем ее разбиение на 2-24 треугольников, половина из которых заштрихована (они получаются друг из друга поворотами, а незаштрихованные зеркально симметричны им). Каждый из треугольников имеет в вершине а угол -J . в вершине о — угол -j и в вершине с — угол у. Принимая во внимание то, что вершины b образуют куб, легко можно убедиться в том, что точно такое же подразделение получается, если исходить от куба и проектировать его вершины и середины граней и ребер на сферу; таким образом, действительно, не приходится рассматривать куб отдельно.

Совершенно так же, как и в первом случае, можно убедиться в том, что как октаэдр, так и это разбиение сферы на области переходят в себя при 24 поворотах, образующих группу G2\\ каждый отдельный поворот характеризуется тем, что он переводит один заданный треугольник в определенный другой треугольник.

3. Теперь мы подошли к икосаэдру (двадцатиграннику). И здесь в основу кладем деление каждой из 20 треугольных граней на 6 составляющих треугольничков и в общем получаем 60 заштрихованных и 60 незаштрихованных таких треугольничков (рис. 48). Три типа вершин в этом случае будут:

Рис. 47

Рис. 48

a) 12 вершин икосаэдра, в которых сходится по 5 треугольников каждого рода;

b) 20 центров граней; они образуют вершины правильного додекаэдра (двенадцатигранника с пятиугольными гранями); в них сходятся по 3 треугольника каждого рода;

c) 30 середин ребер; в них сходятся по 2 треугольника того и другого рода.

Поэтому при перенесении на сферу каждый треугольник получает при вершинах а, Ьу с углы 4-,

. Из свойства углов Ь можно опять заключить, что такая же фигура получилась бы из правильного додекаэдра. Наконец, можно видеть, что икосаэдр и соответствующее подразделение сферы переходят в себя посредством группы Geo из 60 поворотов сферы около центра. Эти повороты, как и повороты октаэдра, вы можете уяснить себе на модели.

Я еще раз хочу сопоставить те углы сферических треугольников, которые получались в трех рассмотренных случаях, присоединяя сюда же и диэдр:

Диэдр:

Тетраэдр:

Октаэдр:

Икосаэдр:

Натуралист, вероятно, немедленно заключил бы из этого, что возможны и дальнейшие аналогичные подразделения сферы с углами "c-t-jt-jiy.^.y;...

Но математик не должен, разумеется, применять таких заключений по аналогии, и его осторожность оказывается в данном случае оправданной, так как действительно ряд возможных разбиений сферы описанного рода обрывается на перечисленных выше. Конечно, этот факт стоит в связи с тем, что нет других правильных многогранных тел, кроме 5 Платоновых тел. Еще одно основание этого можно усмотреть в некотором свойстве целых чисел, которое не может быть

сведено к более простым соображениям. А именно, можно показать, что углы каждого из наших треугольников должны быть такими целыми частями я, скажем, ~. ~» у» чтобы было удовлетворено неравенство

оказывается, что этому неравенству удовлетворяют только перечисленные выше решения. Смысл этого неравенства легко понять, так как оно говорит, что сумма углов сферического треугольника всегда больше я.

Я хотел бы здесь еще упомянуть о том, что, как многим из вас, конечно, известно, разумное обобщение этой теории выходит за эти как будто слишком узкие рамки: теория автоморфных функций102) рассматривает деление сферы*) на бесчисленное множество треугольников с суммой углов, меньшей я или соответственно равной я.

4. Продолжение; вывод уравнений

Теперь мы переходим ко второй части нашей задачи, а именно, к установлению тех уравнений вида

или

(1)

которые принадлежат каждому из наших разбиений сферы, т. е. тех уравнений, в силу которых обе полусферы w отображаются на 2-12, или соответственно на 2-24, или, наконец, на 2-60 треугольничков сферы г. Таким образом, каждому значению w должно в общем соответствовать по 12, 24, 60 значений z — каждое в треугольнике соответствующего рода, — так что искомые уравнения должны иметь степень 12, 24, 60, которую мы будем обозначать вообще через N. Но каждый треугольничек опирается на три замечательные точки, так что во всяком случае на сфере w должны быть три места ветвления, которые мы поместим, как это было принято, в точках w = 0, 1, 00;

*) Или ее части.

в качестве линии разреза К, проходящей через эти три точки, три отрезка которой должны соответствовать линиям, ограничивающим треугольники на сфере г, мы снова возьмем действительную прямую (рис. 49), Далее, мы примем, что в каждом из трех случаев точке w = О соответствуют центры граней (углы b в прежнем обозначении), точке w = 1 соответствуют середины ребер (углы с) и точке w = со соответствуют вершины многогранника (углы а) (рис. 50).

Указанные на чертеже обозначения сторон треугольников (сплошная линия, пунктир, штриховая линия) соответствуют трем отрезкам действительной прямой на сфере w (рис. 49), и при этом заштрихованные треугольники соответствуют полусфере, на которой изображаются значения w с положительной мнимой частью, а незаштрихованные — другой полусфере. При этом уравнение (1) в соответствии с этими соглашениями должно взаимно однозначно отображать сферу z на N-листную риманову поверхность, покрывающую сферу w и имеющую ветвления в точках 0, 1, со.

Можно было бы легко вывести a priori существование этого уравнения из общих теорем теории функций, но я не хочу здесь предполагать необходимых для этого знаний и предпочитаю более эмпирическое построение отдельных уравнений, которое, быть может, даст нам и более живое и наглядное представление об отдельных моментах.

Представим себе уравнение (1) написанным в однородных переменных:

Рис. 49 Рис 50

где Флг, Ws обозначают однородные многочлены измерения Л' от zu 22 (N= 12, 24 или 60). При таком способе записи уравнения исключительную роль играют точки ^1=0 и шг = 0 на сфере w, но так как наряду с ними для нас всегда представляет равный интерес и третье место ветвления w = 1 (w{ — w2 = 0 в однородных переменных), то представляется целесообразным иметь в виду и следующую форму уравнения:

где Хлг = Флг — Vn тоже представляет собой форму iV-го измерения. Оба вида я предпочитаю соединить в одну непрерывную пропорцию:

(2)

это представляет собой однородную форму уравнения (1) ив ней одинаково приняты во внимание все три точки ветвления.

Теперь наша задача заключается в том, чтобы составить формы Ф#, Хлг, Ч^; для этой цели мы сразу же поставим их в связь с нашим делением сферы z. Из уравнения (2) мы находим, что при w\ = 0 оказывается Флг(2Ь г2) = 0, т- е- значению до = 0 соответствуют (на сфере z) N корней формы Ф#. С другой же стороны, согласно нашим условиям месту ветвления w = 0 должны соответствовать центры граней многогранников (вершины Ъ в нашей классификации), число их в каждом случае равно -g-, но в каждой из этих точек встречаются по три заштрихованных и по три незаштрихованных треугольника, однократно отображенных на отдельные полусферы, так что каждую из них следует считать тройным корнем нашего уравнения. Таким образом, эти точки, если принять во внимание их кратность, дают все точки, соответствующие w = 0, и, следовательно, все корни функции ФлГ, иначе говоря, функция Флг имеет исключительно тройные корни и представляет собой поэтому третью степень некоторой формы ф(2Ь22) степени -у :

Таким же образом находим, что значению w = 1, т. е. W\ — W2 = 0, соответствуют корни уравнения Хн = О, и что они тождественны с -у серединами ребер многогранника, считая по два раза каждую (вершины с в нашей классификации); поэтому Хы должно быть полным квадратом формы степени

Наконец, значению w = оо соответствуют корни функции Ч'лг, и поэтому они должны быть тождественны с вершинами первоначального многогранника (вершины а); в них сходятся в соответственных случаях по 3, 4 или 5 треугольников, так что получаем

где v = 3, 4 или 5. Таким образом, наше уравнение непременно должно иметь вид

w{ : (wi — w2):w2 = (ç (zi, z2f :%(ги z2)2 : Ф (zlf z2)v; (3)

при этом измерения и показатели форм ф, %. г[\ а также значения степени уравнения N указаны в следующей табличке:

тетраэдр:

октаэдр:

икосаэдр:

Теперь я хочу еще показать, что и разобранное раньше уравнение диэдра можно включить в эту схему (3). Мы должны только вспомнить, что там мы помещали места ветвления на сфере w в точках —I, + 1, оо, а не в точках 0, +1, со, как теперь, так что мы достигнем действительной аналогии с уравнениями (3) лишь в том случае, если потребуем представить уравнение диэдра в таком виде:

(wi + wo) : (wi — w2) : w2 = Ф : X : x¥.

Из формы уравнения диэдра

которой мы пользовались в свое время (с. 161), с помощью простого преобразования получаем

Таким образом, мы действительно можем присоединить к предыдущей табличке следующую строчку: диэдр: ф2, к*, -ф2; N = 2n.

Замечательные точки непосредственно определяются по этой форме уравнения, а их кратности совпадают с установленными раньше (с. 167, 168).

Теперь нашей задачей является действительно построить формы ф, х» Ф в тРех новых случаях. При этом я остановлюсь подробнее только на октаэдре, для которого обстоятельства складываются наиболее просто. Но и здесь, желая оставаться в рамках краткого обзора, я многое буду только намечать и сообщать в виде результатов; всякий же, кто пожелает познакомиться с этим ближе, может найти подробное изложение в моей книге об икосаэдре.

Ради простоты представим себе, что октаэдр так вписан в сферу 2, что 6 его вершин совпадают с точками 2 = 0, оо, +1. 4-/, —1, —i (рис. 51). При таком положении октаэдра те 24 линейных подстановки 2, которые изображают его повороты, т. е. перемещают названные 6 точек, можно представить в очень простом виде; начнем с четырех поворотов, при которых вершины 0 и оо остаются неподвижными:

(4а)

Далее можно, например, посредством подстановки г —~ [т. е. поворота около горизонтальной оси (4-1, —1) на 180°] переместить точку 0 в оо; приме-

Рис. 51

няя затем еще (4а), получим 4 новых подстановки

(4b)

Точно так же переместим с помощью подстановок

поочередно каждую из 4 точек z = 1, +*> —1» —i в со; применяя каждый раз 4 поворота (4а). получим еще 4-4= 16 подстановок*) октаэдра

(4с)

Теперь мы нашли все 24 искомые подстановки; непосредственными вычислениями можно убедиться в том. что они действительно переводят 6 вершин октаэдра в себя и что они образуют группу, — другими словами, что последовательное выполнение любых двух из этих подстановок снова дает некоторую подстановку (4).

Теперь я хочу прежде всего образовать форму \|)6г которая имеет простыми корнями 6 вершин октаэдра: точка 2 = 0 дает множитель z\, точка 2 = со дает множитель 22; 4 точки ±1 и ±i представляют собой простые корни формы z\ — z\, так что окончательно получаем

(5а)

Труднее составить формы ф8 и %\2, для которых центры граней и соответственно середины ребер служат простыми корнями; я приведу их здесь без вывода:

(5b)

Конечно, во все эти три формы входит еще неопределенный постоянный множитель. Поэтому, если под ф8, г|)б, Xi2 понимать формы в том виде, как они вы-

*) То есть самосовмещений октаэдра — движений сферы г% при которых изображенный на ней октаэдр вместе с указанием заштрихованных и незаштрихованных областей переходит в себя.

ражены равенствами (5), то в уравнение октаэдра (3) следует еще ввести неопределенные постоянные с-и с2 и написать его в таком виде:

Кроме того, надо так определить постоянные С\, c2t чтобы эта пропорция действительно представляла только одно уравнение между z и ш, а это имеет место в том и только в том случае, когда

тождественно по zu z2. Последнее соотношение действительно можно осуществить при помощи соответствующего выбора постоянных Си с2, а именно, имеет место — в чем можно убедиться простым преобразованием — тождество

так что уравнение октаэдра (3) принимает следующий вид:

(6)

Это уравнение действительно отображает точки w = = 0, 1, оо соответственно в центры граней, середины ребер и вершины октаэдра с надлежащей кратностью, так как формы ср, х» Ф составлены соответствующим образом. Кроме того, 24 подстановки октаэдра (4) переводят это уравнение в себя, так как они преобразуют корни каждой формы ср, х» Ф в себя и, следовательно, вводят в сами формы только лишь по множителю, а вычисление показывает, что при образовании частных эти множители выпадают.

Остается еще показать, что это уравнение конформно отображает каждый заштрихованный или незаштрихованный треугольник сферы z на соответствующую полусферу w. Нам уже известно, что трем вершинам каждого треугольника соответствуют точки 0, 1, оо действительной прямой на сфере w и что внутри каждого треугольника w принимает не более чем по разу одно и то же значение, ибо уравнение при этом до имеет только 24 корня, которые должны распределиться по 24 треугольникам. Если бы нам удалось еще показать, что до остается действитель-

ным вдоль трех сторон треугольника, то отсюда нетрудно было бы заключить, что каждая сторона взаимно однозначно отображается на дугу большой окружности, изображающей действительную прямую на сфере до, и что внутренность треугольника отображается конформно и взаимно однозначно на полусферу. Вы легко сумеете сами довести до конца эту цепь выводов, в которой главное значение имеет то, что отображение производится непрерывной и аналитической функцией до (г). Я же хочу подробнее остановиться только на одном моменте доказательства, а именно на доказательстве того, что на сторонах треугольника до принимает действительные значения.

Оказывается более удобным доказывать это утверждение в такой форме, что до имеет действительные значения на всех больших окружностях, которые образуют разбиение октаэдра. Это прежде всего те 3 взаимно перпендикулярные окружности, которые проходят через каждые 4 и 6 вершин октаэдра и соответствуют ребрам октаэдра (они изображены на рис. 51 сплошными линиями), и, далее, 6 окружностей, соответствующих высотам граней октаэдра; они делят пополам углы между ранее указанными тремя большими окружностями (штриховые линии на рис. 51). С помощью подстановок октаэдра можно любую «сплошную» большую окружность превратить в любую другую и точно так же каждую «штриховую» окружность превратить в любую другую. Поэтому достаточно показать, что до сохраняет действительное значение вдоль одной какой-нибудь «сплошной» и одной «штриховой» окружности, ибо на других оно должно принимать те же самые значения.

Но среди «сплошных» окружностей имеется действительная прямая на сфере г, и на ней, конечно, до имеет действительное значение, получаемое из уравнения (6):

(7)

так как ф и -ф представляют собой действительные многочлены от z\ и z2.

Из «штриховых» окружностей, проходящих через точки 0 и оо, мы выбираем ту, которая составляет

с действительной прямой угол 45° и вдоль которой, следовательно, z принимает значения 2 = e/rt/4*r, где г проходит действительные значения от —оо до -f-oo; вдоль нее во всяком случае z4 = ein-r* = —г4 имеет действительное значение, а так как в силу уравнений (5) в функцию фв и в четвертую степень функции «ф в входят только четвертые степени переменных z\ и г2, то w ввиду формулы (7) опять-таки имеет действительное значение.

Теперь мы подошли к концу нашего доказательства: уравнение (6), в самом деле, отображает конформным образом каждый треугольник (из того подразделения сферы z на треугольники, которое соответствует октаэдру) на соответствующую полусферу римановой сферы или покрывающей ее римановой поверхности. Таким образом, зависимость между z и w, устанавливаемая этим уравнением, определяет взаимно однозначное конформное отображение сферы 2 на риманову поверхность.

С тетраэдром и икосаэдром поступают совершенно таким же образом; я дам здесь лишь результаты, которые и в этих случаях получаются при возможно более простом выборе разбиения сферы г на треугольники. Для тетраэдра получается такое уравнение:

а для икосаэдра — уравнение

другими словами, эти уравнения отображают полусферы сферы w на заштрихованные и незаштрихованные треугольники того разбиения сферы 2, которое соответствует тетраэдру и икосаэдру.

5. О решении нормальных уравнений

Теперь мы займемся общими свойствами тех уравнений, которые мы до сих пор рассматривали как примеры общей теории, развитой выше, и которым

мы дадим название нормальных уравнений. Конечно, я и здесь могу представить вам положение вещей лишь в самых простых случаях, отсылая интересующихся подробностями к моей книге об икосаэдре.

Начну с того замечания, что крайне простая природа всех наших нормальных уравнений происходит от того, что они допускают столько же линейных подстановок, сколько единиц в показателе их степени, так что все корни представляют собой линейные функции одного из них; замечу также, что в разбиениях сферы мы имеем наглядный геометрический образ всех рассматриваемых здесь соотношений. Я хочу показать на примере одного вопроса, относящегося к уравнению икосаэдра, те существенные упрощения, которые возникают благодаря указанным обстоятельствам в вопросах, которые вообще оказываются крайне сложными, когда имеешь дело с уравнениями столь высокой степени.

Пусть дано значение w0, например, на отрезке (1, со) действительной прямой сферы w; требуется определить 60 корней z уравнения икосаэдра при w = Wo (рис. 52). Наша теория показывает, что каждый из них должен лежать на одной из 60 соответствующих (на рис. 50 сплошных) сторон треугольников разбиения сферы z. Таким образом, выполнено то, что в теории уравнений называют отделением корней, являющимся большей частью крайне утомительной работой, которая должна предшествовать численному нахождению корней: так называется задача определения таких отдельных промежутков, в которых заведомо заключается только по одному корню. В нашем случае можно сразу определить, сколько среди этих 60 корней действительных. При вышеприведенной форме уравнения икосаэдра предполагается, что он вложен в сферу z таким образом, что действительная прямая проходит через 4 угла каждого рода а, 6, с. Из этого вытекает (ср. рис. 50 и 48), что как раз 4 сплошных стороны треугольников расположены вдоль действительной прямой, так что имеется ровно 4 действительных корня. То же самое имеет место, если wQ лежит в одном из двух

Рис. 52

других отрезков действительной прямой до, так что вообще при всяком действительном до уравнение икосаэдра имеет 4 действительных и 56 комплексных корней.

Теперь я хочу сказать несколько слов о численном определении корней наших нормальных уравнений. Прежде всего, здесь снова является для нас благоприятным то, что вычислять приходится каждый раз только один корень уравнения, так как остальные корни получаются посредством линейных подстановок. Впрочем, я должен заметить, что численное определение корня составляет, собственно говоря, задачу анализа, а не алгебры, так как оно с необходимостью требует применения бесконечных процессов, чтобы представить с любым приближением значения корней (как правило, иррациональные).

Более подробно я остановлюсь только на самом простом примере — на двучленном уравнении до = zn, причем я снова прихожу в непосредственное соприкосновение со школьной математикой, так как и в ней разбирается эта задача — вычисление <y/wt — по крайней мере для первых значений п и для положительных действительных значений до = г. Метод вычисления квадратных и кубических корней, известный всем вам со школьной скамьи, состоит в сущности в следующем: исследуют, какое место занимает подкоренное число до = г в ряду квадратов или кубов целых чисел 1, 2, 3, 4, затем, основываясь на десятичной системе счисления, повторяют то же испытание с десятыми долями найденного промежутка, затем с сотыми долями и т. д., получая при этом, разумеется, любую степень точности.

Здесь мы применим более рациональный метод, который годится не только при любых целых п, но и при любых комплексных значениях до. Так как нам достаточно найти лишь одно какое-нибудь решение рассматриваемого уравнения, то станем искать то значение z = yw> которое лежит внутри угла —, построенного при действительной оси (рис. 53). Строго придерживаясь обобщения упомянутого выше элементарного метода, начнем с того, что разделим (лучами, проходящими через вершину) этот угол на

v равных частей (на чертеже v = 5) и пересечем эти лучи окружностями, описанными около начала радиусами г= 1,2,3, ... Таким образом, внутри угла мы получим при выбранном v все точки

Соответствующие им значения в плоскости до мы можем указать сразу:

Они образуют там вершины сети, покрывающей всю плоскость до и состоящей из окружностей, имеющих радиусы 1", 2Л, Зп, ..., и лучей, составляющих с действительнои осью углы 0, —, —, -—^— (рис. 54). Данное значение до должно находиться в какой-нибудь из этих клеток; пусть до0 — вершина, ближайшая к значению до. Одно из значений г0 = л/и>0 известно: это — одна из вершин исходной сети в плоскости z. Теперь для искомого значения корня имеем

Правую часть развернем по формуле бинома Ньютона, которую спокойно можно считав известной, ибо мы и без того ведь, в сущности, находимся в области

Рис. 53 Рис. 54

анализа:

Вопрос о сходимости этого ряда мы можем решить сразу, рассматривая его как разложение аналитической функции <\]w в ряд Тейлора и применяя теорему о том, что ряд Тейлора сходится внутри окружности, описанной около wq и проходящей через ближайшую особую точку. Так как для д/ w особыми точками являются только 0 и со, то написанный выше ряд будет сходиться, когда w будет лежать внутри окружности, описанной около wq и проходящей через начало, чего мы всегда можем достигнуть, исходя в случае надобности из аналогичной сети в плоскости г, но с более мелкими клетками. А чтобы наш ряд сходился хорошо, т. е. годился для численного определения, необходимо, сверх того, чтобы дробь Ww™° была достаточно мала, чего также всегда можно достигнуть дальнейшим измельчением сети. Этот прием оказывается пригодным для фактического выполнения численного нахождения корней.

Замечательно, что численное решение дальнейших нормальных уравнений правильных тел оказывается в сущности нисколько не труднее; конечно, здесь я должен ограничиться указанием на это как на факт. Если применить только что изложенный метод к нашим нормальным уравнениям и исходить из отображения двух соседних треугольников на сферу w, то вместо биномиального ряда появляются другие ряды, которые, однако, в анализе не менее известны и пользоваться которыми достаточно легко; это — гипергеометрические ряды. Я дал в 1877 г. численное выражение рядов, о которых идет речь*).

6. Униформизация нормальных уравнений посредством трансцендентных функций

Теперь я перейду к рассмотрению другого метода решения наших нормальных уравнений, который ха-

*) Klein F. Weitere Untersuchungen über die Theorie des Ikosaeders//Math. Ann. — 1877. — Bd. 12. — S, 515,

рактеризуется систематическим привлечением трансцендентных функций. Вместо того чтобы в каждом отдельном случае обращаться к разложению в ряд в окрестности известного решения, при применении этого метода стараются представить раз навсегда все удовлетворяющие уравнению пары значений w, z как однозначные аналитические функции одной вспомогательной переменной или, как говорят, униформизировать уравнение. Если при этом удается применить такие функции, для которых легко можно составить таблицы значений или уже существуют числовые таблицы, то можно найти численное решение уравнения без новой вычислительной работы. Я тем охотнее говорю об этом применении трансцендентных функций, что в некоторых случаях оно имеет место и в школьном преподавании, причем там оно часто имеет неясный, почти мистический характер; причина заключается в том, что в школе держатся старых, несовершенных воззрений даже там, где современная теория функций комплексной переменной давно уже все выяснила.

Я подробно разовью эти замечания общего характера прежде всего на примере двучленного уравнения. Вам известно, что уже в школе постоянно вычисляют с помощью логарифмов положительное решение уравнения zn = г при положительном действительном г, а именно, пишут уравнение в виде z = e^nr)/nt понимая под In г положительное главное значение логарифмической функции; сначала по таблице логарифмов находят это значение, затем вычисляют In г и, наконец по таблицам значений показательной функции (или по «обратно читаемым» таблицам логарифмов) находят г; впрочем, обыкновенно пользуются вместо е основанием 10103). Этот прием можно перенести и на комплексные значения: чтобы удовлетворить уравнению

полагают х = In w, понимая под этим общее значение комплексного логарифма, так что оказывается

При этом ввиду многозначности функции х = In w (позднее мы еще будем подробно говорить об этой

функции) для одного и того же w получается как раз п значений z. Это х называют униформизирующей переменной. Но наши таблицы содержат только действительные логарифмы положительных чисел, так что применить указанный прием непосредственно к численному решению уравнения невозможно. Но можно, пользуясь некоторыми простыми свойствами логарифмов, свести вычисление к употреблению всем доступных тригонометрических таблиц. В самом деле, положим

первый множитель как положительное действительное число имеет действительный логарифм, а второй множитель, модуль которого равен 1, имеет, как известно, чисто мнимый логарифм /-ср, причем ф получается из уравнений

Таким образом, находим

так что искомый корень уравнения равен

Ввиду того, что в величину ф входит слагаемым произвольное целочисленное кратное число 2я, наша формула дает все п значений корня. С помощью обыкновенных логарифмических и тригонометрических таблиц можно определить сначала ф по его синусу и косинусу, а затем по последней формуле и z. Мы получили здесь это тригонометрическое решение вполне естественным образом, исходя из логарифмов комплексных чисел; если же стоять на той точке зрения, что таких логарифмов не существует, и все же стараться получить это тригонометрическое решение — в школе следуют такому именно пути, — то оно должно казаться чем-то совершенно странным и непонятным.

Тригонометрическое решение кубического уравнения. Но в одном месте, близком школьному преподаванию, оказывается необходимым извлекать корни из комплексных чисел, а именно при так называемом решении уравнения третьей степени по способу Кардано; я хочу сделать здесь по этому поводу несколько замечаний.

Если кубическое уравнение дано в приведенном виде

x* + px-q = 0, (1)

то, как известно, формула Кардано гласит, что три его корня х\, х2у Xz содержатся в следующем выражении:

(2)

Так как каждый кубический корень имеет три значения, то само по себе это выражение имеет 9, вообще говоря, различных значений; среди них x\t x2f *з определяются тем условием, что произведение обоих входящих в них кубических корней должно быть равно —- . Заменяя коэффициенты уравнения р, q их обычными выражениями104) в виде симметрических функций от х\, х2у xz и имея в виду, что коэффициент при X2 равен х\ _+ х2 + х% = О, находим

т. е. выражение, стоящее под знаком квадратного корня, равно — если не считать постоянного отрицательного множителя — дискриминанту уравнения. Отсюда следует, что подкоренное выражение отрицательно, если уравнение имеет три различных действительных корня; положительным же подкоренное выражение будет в случае, если один корень действительный, а два других комплексно сопряженные. Таким образом, как раз в случае, кажущемся наиболее простым, когда кубическое уравнение имеет только действительные корни, формула Кардано требует извлечения квадратного корня из отрицательного числа, а затем кубического корня из комплексного числа.

Это прохождение через комплексную величину должно было, конечно, представляться старым алгеб-

ранетам (в эпоху, когда они были еще так далеки от теории комплексных чисел, — за 250 лет до того, как Гаусс показал их интерпретацию на числовой плоскости) чем-то совершенно невозможным. Тогда говорили о неприводимом случае (casus irreducibilis) кубического уравнения и думали, что в этом случае формула Кардано не дает разумного, пригодного решения. Впоследствии, однако, нашли, что как раз в этом случае кубическое уравнение находится в тесной связи с трисекцией угла, и таким образом получили «тригонометрическое решение», целиком выполняемое в области действительных чисел в качестве заменителя отказывающейся служить формулы Кардано, но при этом полагали, что открыли нечто совершенно новое, не стоящее ни в каком отношении к старой формуле. И на этой-то точке зрения до сих пор еще стоит, к сожалению, элементарное преподавание.

В противоположность этому я хотел бы подчеркнуть, что это тригонометрическое решение является не чем иным, как применением изложенного выше общего метода вычисления корней из комплексных чисел. Оно получается самым естественным образом, если сделать формулу Кардано — в случае комплексного выражения под знаком кубического корня — удобной для вычисления.

Это получается следующим образом. Мы предполагаем, следовательно,

так что непременно должно быть р <С 0. Переписывая затем первый кубический корень выражения (2) в таком виде105) :

замечаем, что его модуль (т. е. положительный кубический корень из модуля y\J — комплексного числа, стоящего под знаком кубического корня) равен — у. Но так как произведение первого кубического корня на второй должно как раз равняться —|, то

этот второй корень должен иметь комплексное значение, сопряженное с первым корнем. Следовательно, сумма обоих кубических радикалов — решение кубического уравнения — должна равняться их удвоенной действительной части:

Теперь можно применить общий прием, описанный на с. 192. Запишем подкоренное выражение кубического корня, выделив его модуль множителем:

и определяем ф из уравнении

Так как положительный корень третьей степени из д/—-ff равен д/—у» то Для кубического корня находим следующее значение:

принимая же во внимание, что в выражение ф входит слагаемым целочисленное кратное числа 2л, находим

Это и есть обычный вид тригонометрического решения.

Позвольте сделать по этому поводу еще одно замечание относительно выражения «casus irreducibilis». Здесь слово «irreducibilis» (неприводимый) употреблено в совершенно другом смысле сравнительно с его нынешним употреблением и с тем пониманием, в котором я часто уже пользовался им в настоящих лекциях; здесь оно означает, что решение кубического

уравнения не может быть сведено к извлечению кубических корней из действительных чисел, — а это не имеет ничего общего с современным значением этого слова. Вы видите, как в этой области неудачное обозначение и всеобщая боязнь комплексных чисел создали возможность для множества недоразумений. Я бы хотел, чтобы мои слова могли способствовать устранению этих недоразумений по крайней мере в вашей среде.

Попытаемся теперь вкратце ориентироваться в том, как достигается униформизация посредством трансцендентных функций в случае других нормальных уравнений. Начнем с уравнения диэдра

Здесь достаточно попросту положить

и уравнение, как это видно сразу на основании формулы Муавра, будет удовлетворяться при

Так как все значения ф + 2йя и 2kn— ф дают для w одно и то же значение, то эта формула в самом деле при каждом w дает 2п корней z, которые можно написать в таком виде:

В случае уравнений октаэдра, тетраэдра и икосаэдра этих «элементарных» трансцендентных функций оказывается уже недостаточно, но зато можно получить совершенно аналогичное решение с помощью эллиптических модулярных функций. Хотя этого и нельзя отнести к элементарной математике, но я все же хочу указать, по крайней мере, формулы, относящиеся к икосаэдру*). Эти формулы находятся в самой тесной связи с решением общего уравнения пятой степени посредством эллиптических функций, о котором всегда упоминается в учебниках; о нем я тоже

*) Klein F. — Gesammelte mathematische Abhandlungen.— Bd. III. — 1923.— S. 13.

хочу сказать несколько пояснительных слов. Уравнение икосаэдра имело такой вид (с. 179—181) :

Отождествим до с абсолютным инвариантом / из теории эллиптических функций и станем рассматривать последний как функцию отношения периодов

(в обозначениях Якоби ^-)» т. е. положим

где g2 и А означают известные трансцендентные формы (—4)-й и (—12)-й степени относительно on и (о2, играющие большую роль. Если введем еще обычно употребляемое сокращенное обозначение Якоби

то корни г уравнения икосаэдра представятся в виде такого частного двух 9-функций:

Принимая во внимание бесконечную многозначность функции со (до), определяемой из первого уравнения, можно показать, что эта формула действительно дает 60 корней уравнения икосаэдра при каждом до.

7. Разрешимость в радикалах

Одного вопроса в теории нормальных уравнений я еще не затрагивал. Представляют ли наши нормальные уравнения вообще что-либо алгебраически существенно новое и нельзя ли их свести одно к другому и, в частности, к двучленным уравнениям? Другими словами: можно ли решение z этих уравнений выразить посредством конечного числа последовательных извлечений корня?

Что касается, прежде всего, уравнений диэдра, тетраэдра и октаэдра, то с помощью алгебраической

теории легко убедиться в том, что их возможно свести к двучленным уравнениям. Покажем это на примере уравнения диэдра

Если положить

то уравнение принимает вид

отсюда непосредственно следует, что

а поэтому

что и представляет искомое решение в радикалах.

Между тем для уравнения икосаэдра подобное решение в радикалах невозможно, так что это уравнение определяет некоторую существенно новую алгебраическую функцию. Я покажу вам одно особенно наглядное доказательство этого утверждения, которое я недавно опубликовал*); оно основано на известном в теории функций построении функции икосаэдра z(w). Я пользуюсь при этом следующей леммой Абеля, доказательство которой вы можете найти в любом учебнике алгебры: если алгебраическое уравнение разрешимо с помощью ряда радикалов, то каждый входящий в это выражение радикал может быть представлен в виде рациональной функции всех корней первоначального уравнения.

Применим все это к уравнению икосаэдра. Итак, если допустить, что его корень z выражается с помощью ряда извлечений корня из коэффициентов уравнения, т. е. из рациональных функций от до (а мы покажем, что это допущение ведет к противоречию), то каждый входящий в выражения корней радикал

*) Klein F. Beweis für die Nichtauflösbarkeit der Ikosaedergleichung durch Wurzelzeichen//Math. Ann. — 1905. — Bd. 61.— S. 369—371. См. также: Klein F. Gesammelte mathematische Abhandlungen. — Bd. II.— 1923. —S. 385.

выражает некоторую рациональную функцию 60 корней уравнения

R(Z\9 z2, ..., 2ео).

Но так как все корни уравнения икосаэдра получаются из какого-нибудь одного из них z с помощью линейных подстановок, то можно вместо последнего выражения написать просто рациональную функцию R(z) одного только z. Представим себе это R(z) как функцию до, которая получится, если вместо z подставить 60-значную функцию икосаэдра г (до). Ввиду того, что каждый обход в плоскости до, который возвращает z к его начальному значению, необходимым образом приводит и функцию R(z) к ее первоначальному значению, то R может иметь ветвления только в точках до = 0, 1, оо, в которых разветвляется и г(до); вместе с тем число листов поверхности Римана для /?, которые циклически сходятся в каждом таком месте, должно быть делителем соответствующего числа для 2(до), которые, как мы знаем, равны соответственно 3, 2 и 5. Всякая рациональная функция R(z) одного из корней уравнения икосаэдра и, следовательно, всякий радикал, входящий в предполагаемое решение, может в качестве функции w иметь ветвления (если только она их вообще имеет) лишь в точках до = 0, до = 1, до = оо, а именно, в данном случае в точке 0 должно сходиться по 3 листа ее римановой поверхности, в точке 1 по 2 листа и в точке оо по 5 листов, так как числа 2, 3, 5 не имеют других делителей, кроме 1.

Теперь мы постараемся показать, что мы необходимо должны прийти к противоречию с этим результатом: с этой целью рассмотрим самый внутренний радикал, какой входит в допущенное нами выражение для г (до). Он должен представлять собой корень из рациональной функции Р(до), и мы можем считать его показатель простым числом р, так как всякий другой радикал можно составить из ряда корней с простыми показателями. Кроме того, P(w) не может быть р-й степенью рациональной функции s (до) от до, ибо иначе наш радикал был бы вообще излишен, и мы могли бы отнести наши рассуждения к ближайшему действительно необходимому знаку корня.

Посмотрим, какие ветвления может иметь этот радикал л/Р(т)\ для этого наиболее удобно написать подкоренное выражение в однородном виде:

где g, h — формы одной и той же степени в однородных переменных wu W2(<w~'^). Согласно основной теореме алгебры функции g и h можно разложить на линейные множители:

где ввиду равенства степеней числителя и знаменателя

a+ß + Y+ ...=<x,+ ß, + Y,+ ...

Ясно, что все показатели а, ß, ..., а', ß', ... не могут делиться на р, ибо иначе Р представляло бы собой полную р-ю степень; с другой стороны, составленное из всех показателей выражение a + ß + ... —а'— — ß/— ... равно нулю, а потому делится на р; вследствие этого не может быть, чтобы только одно из этих чисел не делилось на р, т. е. таких чисел (не делящихся на р) должно быть по крайней мере два. Поэтому корни соответствующих линейных множителей должны заведомо быть такими местами ветвления, в которых циклически сходится по р листов. Но это находится в противоречии с установленным выше положением, которое должно, конечно, иметь место и для л/Р{хю). В самом деле, мы там перебрали все возможные ветвления и среди них мы не нашли двух с равным числом сходящихся листов. Таким образом, наше допущение оказывается ложным, и уравнение икосаэдра не разрешимо в радикалах.

Это доказательство существенным образом основано на том, что характерные для икосаэдра числа 3, 2, 5 не имеют попарно общих делителей. Когда же, наоборот, общий делитель имеется, как, например, в случае чисел 3, 2, 4 для октаэдра, то возможны

такие рациональные функции R(z(w)), которые в двух местах имеют одинаковые ветвления, например, функция, у которой сходится по два листа в точках 1 и оо; такие функции в самом деле можно представить в виде корней из рациональной функции P(w). Таким именно образом обнаруживается разрешимость в радикалах уравнений октаэдра и тетраэдра (с числами 3, 2, 3), а также диэдра (2, 2, ri).

Я хотел бы указать здесь, как сильно отстала от успехов современной науки та терминология, которая царит в широких математических кругах. Слово «корень» теперь употребляют почти всегда в двояком смысле: во-первых, для обозначения решения всякого алгебраического уравнения и, во-вторых, для обозначения решения именно двучленного уравнения. Это словоупотребление ведет свое начало, конечно, с тех времен, когда занимались исключительно двучленными уравнениями. В настоящее время оно является, если и не прямо-таки вредным, то во всяком случае довольно неудобным. Но в гораздо большей степени дает повод к недоразумениям другое выражение, сохранившееся из истоков алгебры, согласно которому алгебраическое уравнение, которое неразрешимо в радикалах, т. е. которое не сводится к двучленным уравнениям, называют алгебраически неразрешимым. Это находится в самом резком противоречии с современным значением слова «алгебраический». В настоящее время алгебраически разрешимым называют такое уравнение, которое оказывается возможным свести к цепи таких возможно более простых уравнений, для которых зависимость решений от параметров, взаимная связь различных значений корней и т. д. известны с такою же полнотой, как это имело место с давних пор для двучленного уравнения, но это отнюдь не должны быть непременно двучленные уравнения. В этом смысле мы можем отнести уравнение икосаэдра к числу тех, которые вполне разрешаются алгебраически, ибо все наши рассуждения показали, что мы можем построить их теорию, удовлетворяя всем указанным требованиям. То, что оно неразрешимо в радикалах, скорее делает его особенно интересным, так как вследствие этого оно является подходящим нормальным уравнением, к которому можно попытаться свести другие уравнения, тоже

неразрешимые алгебраически в старинном смысле слова, чтобы вполне овладеть и их решением.

Это замечание приводит нас к последнему разделу настоящей главы.

8. Сведение общих уравнений к нормальным

Можно сказать, что самое общее уравнение: третьей степени сводится к уравнению диэдра при п = 3,

четвертой степени сводится к уравнению тетраэдра или октаэдра,

пятой степени сводится к уравнению икосаэдра.

Этот результат представляет собой самый последний триумф правильных тел, которым с самого начала истории математики все время приходилось играть важную роль.

Чтобы сделать для вас понятнее смысл моего общего утверждения, я приведу его несколько подробнее для простейшего случая — для уравнения третьей степени, — впрочем, без полного доказательства формул. Представим себе кубическое уравнение снова в приведенной форме:

x3 + px-q = 0. (1)

Пусть хи *2, Хз — его корни; станем искать такую рациональную функцию z этих корней, которая при 6 перестановках этих трех величин описывает как раз 6 линейных подстановок диэдра для п = 3, т. е. принимает значения

Легко видеть, что функция

(2)

удовлетворяет этим условиям. Принадлежащая диэдру функция z3 + этой величины должна, таким образом, оставаться неизменной при всех перестановках Xk, так как она остается без изменений при 6 линейных подстановках г; следовательно, на основании известной теоремы алгебры ее можно представить в виде рациональной функции коэффициентов

уравнения (1)—а именно, вычисление дает

(3)

Если же, наоборот, известно решение этого уравнения диэдра и г — один из его корней, то можно по выражению (2) с помощью известных соотношений

выразить рационально три значения х\, х2% *з через 2, р, q, а именно, оказывается, что

(4)

Таким образом, если решено уравнение диэдра (3), то эти формулы непосредственно дают решение кубического уравнения (1).

Совершенно аналогично получается сведение наиболее общего уравнения четвертой и пятой степени. Уравнения оказываются, конечно, несколько длиннее, но в сущности не более трудными; новым является то, что параметр w нормального уравнения, который прежде выражался рационально через коэффициенты уравнения (2w = — 27—3-— 2), теперь содержит еще и квадратные корни. Вы можете найти очень подробное изложение этой теории для уравнения пятой степени и соответственно для икосаэдра во второй части моих лекций об икосаэдре и притом в таком виде, что не только приводится вывод формул, но, кроме того, всегда указываются внутренние основания, приводящие к этим уравнениям.

Позвольте мне сказать еще несколько слов о том положении, которое эти построения занимают по отношению к обыкновенно излагаемой теории уравнений третьей, четвертой и пятой степени. Прежде всего, обычные решения уравнений третьей и четвертой сте-

пени можно, конечно, получить из наших формул с помощью соответствующих вычислений, пользуясь решением уравнений диэдра, октаэдра и тетраэдра в радикалах.

Что же касается уравнений пятой степени, то, к сожалению, в учебниках обыкновенно ограничиваются констатированием того отрицательного результата, что такое уравнение невозможно решить с помощью ряда радикалов, присоединяя к этому еще туманное указание на то, что решение становится возможным посредством эллиптических функций — точнее следовало бы сказать «эллиптических модуль-функций». Я отношусь отрицательно к такому изложению, так как оно дает совершенно неправильное противопоставление и служит скорее помехой правильному пониманию положения вещей, чем способствует ему. В действительности, отделяя алгебраическую часть от аналитической, можно резюмировать все, к чему мы пришли, следующим образом.

1. Хотя и невозможно свести уравнение пятой степени, данное в общем виде, к двучленным уравнениям, но зато удается — и в этом именно и заключается собственно задача алгебраического решения — свести его к уравнению икосаэдра как к простейшему нормальному уравнению.

2. Уравнение икосаэдра в свою очередь можно решить посредством эллиптических модуль-функций; это пригодно для численного нахождения корней и является полным аналогом решения двучленных уравнений посредством логарифмов.

Это составляет полное решение проблемы уравнения пятой степени. В самом деле, когда что-либо не удается на обычном пути, не следует сразу отказываться от дальнейших попыток и удовлетворяться констатированием невозможности, но надо стараться подойти к вопросу с такой стороны, чтобы можно было его разрабатывать дальше. Математическая мысль как таковая никогда не имеет конца, и если вам кто-нибудь скажет, что в некотором месте прекращается математическое понимание, то будьте уверены, что там как раз должна найтись наиболее интересная постановка вопроса.

В заключение я хочу указать на то, что эти теории отнюдь не заканчиваются на уравнениях пятой

степени; напротив, можно и для уравнений шестой и высших степеней развить вполне аналогичные теории, прибегая к помощи правильных тел в пространстве многих измерений. Если вы желаете ближе ознакомиться с этими теориями, то обратитесь к моей статье «О решении общего уравнения пятой и шестой степени»*).

Решение уравнений шестой степени соответственно приведенным в тексте принципам сведения уравнений пятой степени к теории икосаэдра было в связи с упомянутой моей работой 1905 г. успешно исследовано Горданом в двух работах**). Упрощенную и продолженную дальше разработку этой прблемы содержит работа А. Кобля***).

*) Klein F. Ueber die Auflösung der allgemeiner Gleichung 5 und 6 Grades//J. reine angew. Math.— 1905. — Bd. 129.— S. 151; Math. Ann. — 1905. - Bd. 861. — S. 50.

**) Gordan P. —Math. Ann. — 1905. — Bd. 61. —S. 50; Math. Ann.— 1910 — Bd. 68. —S. 1.

***) Coble А. В. —Math. Ann. — 1911. — Bd. 70. —S. 337.

АНАЛИЗ

I. ЛОГАРИФМ И ПОКАЗАТЕЛЬНАЯ ФУНКЦИЯ

Теперь, во второй половине семестра, мы займемся тем, что подвергнем отдельные, наиболее важные, с нашей точки зрения, главы анализа такому же обсуждению, какому раньше мы подвергли арифметику и алгебру. Речь пойдет главным образом об элементарных трансцендентных функциях, которые действительно играют большую роль в школьном преподавании: это — показательная функция (соответственно логарифм) и тригонометрические функции.

Прежде всего я хочу напомнить известный всем вам ход изложения этого вопроса в школе и его продолжение, примыкающее к так называемой систематике алгебраического анализа.

1. Систематика алгебраического анализа

Исходят из степени а = Ьс и затем последовательно переходят от целых положительных показателей с к дробным значениям с; тем самым понятие корня включается в обобщенное понятие степени. Не входя в подробности свойств степеней, отмечу только правило умножения:

которое сводит умножение двух степеней к сложению их показателей. Возможность такого сведения, которое, как известно, лежит в основании вычислений с помощью логарифмов, формально обусловливается тем, что основные законы умножения и сложения во многом совпадают; в частности, оба действия коммутативны и ассоциативны106).

Обращение действия возведения в степень приводит к логарифму: с называют логарифмом числа а по

основанию b:

Но уже здесь появляется ряд затруднений существенного характера, мимо которых в большинстве случаев проходят молча, не разъясняя их как следует, и которые мы именно поэтому постараемся вполне себе выяснить. При этом оказывается удобнее ввести вместо а и с, взаимную зависимость которых мы намерены изучать, обычные обозначения переменных х, у, так что наши основные равенства принимают такой вид:

Начнем с того, что основание b всегда предполагается положительным; при отрицательном b переменная х принимала бы для целых значений у то положительные, то отрицательные значения, а при рациональных у она принимала бы много раз даже комплексные значения, и совокупность этих пар значений х, у не могла бы образовать непрерывной кривой. Но и при b > 0 невозможно обойтись без соглашений, которые, на первый взгляд, кажутся произвольными. В самом деле, при рациональном = (где m, п— взаимно простые числа), как известно, значение x = bm!n =л/Ьт определено, но этот корень имеет п значений, и если даже ограничиться действительными числами, то все же при четном п он имеет два значения. Первое соглашение и состоит в том, что мы под X всегда будем разуметь положительное значение корня или так называемое главное («арифметическое») значение. Значение этого условия мы исследуем с помощью общеизвестного изображения логарифмической кривой у = = logo Ху которым я хочу воспользоваться уже здесь ради большей ясности (рис. 55).

Если у пробегает множество рациональных чисел (всюду плотное на действительной прямой), то положительным главным значениям абсциссы х = Ьу

Рис. 55

отвечает на нашей кривой всюду плотное множество точек. Если бы мы стали отмечать при четном знаменателе п (у показателя у) каждый раз и соответствующие отрицательные значения jc, то получилось бы, можно сказать, «вдвое менее плотное», но все же всюду плотное множество точек на зеркальном образе нашей кривой по отношению к оси у, т. е. на кривой y = \ogb(—х). Представляется далеко не ясным, почему в случае, если давать у всевозможные действительные, в том числе и иррациональные значения, следует именно главные значения справа соединять в одну непрерывную плавно идущую кривую, и не следует ли — и почему именно не следует — дополнить таким же образом и значения слева.

Мы увидим, что вполне понять все это мы сможем лишь с помощью более глубоких средств теории функций, какими не может располагать школа. Вследствие этого в школе отказываются от более глубокого понимания положения вещей и большей частью довольствуются тем, — конечно, весьма убедительным для ученика — авторитетным утверждением, что нужно брать Ъ > 0 и положительные, главные значения корней и что все иное неправильно. На этом основано то утверждение, что логарифм есть однозначная функция, определенная только для положительных значений аргумента.

Когда теория логарифма доведена до этого места, ученик получает в руки таблицы логарифмов и должен научиться пользоваться ими для практических вычислений. При этом возможны, конечно, и такие школы — в мои школьные годы это было общим явлением,— в которых не особенно распространяются о том, как именно составлены такие таблицы. Само собой разумеется, что мы должны самым резким образом осудить такой грубый утилитаризм, игнорирующий высшие принципы обучения. Но теперь большей частью уже говорят о вычислении логарифмов и во многих школах вводят с этой целью также учение о натуральных логарифмах и о разложении их в ряды.

Что касается первого вопроса, то, как известно, основанием натуральной системы логарифмов служит число

Это определение е и его употребление в качестве основания системы логарифмов большей частью помещают непосредственно в самом начале, в особенности— в подражание французам — в больших учебниках анализа, причем, конечно, отсутствует собственно наиболее ценный элемент, способствующий пониманию: объяснение того, почему принимают за основание как раз этот замечательный предел и почему получаемые при этом логарифмы называют натуральными. Точно так же и разложение в ряд появляется часто совершенно неожиданно; полагают попросту формально вычисляют коэффициенты а0, аь ... на основании известных свойств логарифма и доказывают, сверх того, еще сходимость ряда при |х|< 1. Но при этом опять-таки оставляют в стороне вопрос о том, как вообще приходят хотя бы к тому, что подозревают возможность разложения в ряд функции и притом еще столь произвольно составленной, какой является логарифм по школьному определению.

2. Историческое развитие учения о логарифме

Если мы хотим найти все те внутренние причины, о которых шла речь, и узнать более глубокие основания того, почему такие, по-видимому, произвольные допущения все же приводят к разумным результатам,—короче говоря, если мы хотим действительно достичь полного понимания теории логарифма, — то будет лучше всего проследить в общих чертах ход исторического развития этой теории. Вы увидите, что он нисколько не соответствовал изложенной выше школьной практике, но что последняя стоит к нему как бы в положении проекции, построенной из очень неблагоприятной точки.

Прежде всего приходится назвать одного немецкого математика XVI в. — шваба Михаэля Штифеля, который выпустил в Нюрнберге свою «Arithmetica intégra»; это было в 1544 г., т. е. в самом начале развития современной алгебры, за один год перед тем, как появилось, тоже в Нюрнберге, уже упомянутое

выше сочинение Кардано. В этой книге Штифеля вы впервые встречаете действия над степенями с любыми рациональными показателями, причем особенно подчеркивается правило умножения. Штифель дает даже, видимо, первую из существовавших таблиц логарифмов, но, конечно, весьма рудиментарную: она содержит всего лишь целые числа от —3 до 6 в качестве показателей и рядом с ними соответствующие степени числа 2, т. е. -g-, ..., 64. По-видимому, Штифель имел представление о значении дальнейшего развития этих идей, так как он замечает, что об этих замечательных числовых соотношениях можно было бы написать целую книгу.

Для того чтобы иметь возможность сделать логарифмы пригодными для практических вычислений, Штифелю недоставало еще одного важного вспомогательного средства, а именно десятичных дробей, так что лишь со времени изобретения последних — после 1600 г. — стало возможным построение настоящих логарифмических таблиц. Первые таблицы принадлежат шотландцу Джону Неперу, жившему с 1550 г. до 1617 г., истинному изобретателю логарифмов, придумавшему само их название; эти таблицы появились в 1614 г. в Эдинбурге под заглавием «Описание чудесного канона логарифмов» («Mirifici logarithmorum canonis descriptio»). О воодушевлении, вызванном этими замечательными таблицами, вы можете судить по тем забавным стихам, которые напечатаны в начале таблиц и в которых различные авторы воспевают отменные качества логарифмов. Впрочем, сам способ Непера для вычисления логарифмов был опубликован лишь после его смерти, в 1620 г.

В сущности, натуральные логарифмы появились еще до Непера по поводу одного весьма важного успеха в картографии: открытие «меркаторской проекции» Герхардом Меркатором (около 1550 г.) можно считать первым графическим открытием логарифмов. Достаточно сослаться на главу III части 2 тома II этих лекций, где выяснена связь меркаторской проекции с логарифмической функцией. Если хотят, не зная этой связи, вывести меркаторскую проекцию при помощи подходящего предельного перехода, то неявно появляется (натуральный) логарифм с совершенно

такой же точки зрения, как у Непера из логарифмов Бюрги.

Что же касается работ Непера и Бюрги, то здесь указаны только их руководящие основные идеи; для полного вычисления своих таблиц они пользовались, конечно, наряду с определением последовательных степеней числа 1 + jqa и соответственно числа 1 —tqt на основании разностных уравнении, также интерполяционными методами. Кроме того, Непер владел уже идеей предельного перехода к натуральным логарифмам в собственном смысле, т. е., выражаясь современным языком, перехода к дифференциальному уравнению

именно, он рассматривает движение, скорость которого растет пропорционально расстоянию от исходной точки; этим представлением он даже пользовался при построении своих таблиц.

Независимо от Непера швейцарец Бюрги (1552— 1632) построил таблицы, которые он опубликовал, впрочем, лишь в 1620 г. в Праге под заглавием «Progresstabuln». Для нас, гёттингенцев, Бюрги представляет особый интерес, как земляк, так как он долгое время жил в Касселе*). Вообще Кассель и в особенности его старая обсерватория играли весьма важную роль в истории развития арифметики, астрономии, оптики перед изобретением исчисления бесконечно малых — подобно тому как впоследствии имел значение Ганновер как местожительство Лейбница. Таким образом, вблизи от нас находится почва, представлявшая историческое значение для нашей науки еще задолго до того, как был основан наш университет.

Непер и Бюрги: уравнение в конечных разностях.

Представляется весьма поучительным присмотреться ближе к ходу идей у Непера и Бюрги. Оба исходят из значений х = ду для целых у и хотят устроить так, чтобы числа X лежали по возможности гуще, чтобы подойти, таким образом, возможно ближе к конечной

*) Ближайший к Гёттингену большой город (в 50 км).

цели — найти для каждого числа его логарифм. Теперь в школе достигают этого с помощью перехода к дробному показателю у, о котором шла речь выше. Но Непер и Бюрги избегают всех тех затруднений, которые встречаются на этом пути, благодаря тому, что с помощью гениальной интуиции подходят к вопросу сразу же с верной стороны, а именно, им приходит в голову простая, но счастливая мысль взять за основание Ъ число, очень близкое к единице, ибо при этом, действительно, последовательные целые степени числа Ь лежат очень близко друг к другу. Бюрги принимает

0 = 1,0001,

между тем как Непер пользуется числом, меньшим единицы:

Ъ = 1 — 0,0000001 = 0,9999999,

подходя, таким образом, еще ближе к единице. Причина этого отклонения Непера от теперешнего обычая заключается в том, что он наперед имел в виду применение к тригонометрическим вычислениям; действительно, там ведь прежде всего имеют дело с логарифмами правильных дробей (синуса и косинуса), которые при Ъ > 1 отрицательны, а при Ь < 1 положительны. Но для обоих исследователей является общим тот главный факт, что они пользуются только целыми степенями этого числа Ь и благодаря этому совершенно избавляются от многозначности, которая стесняла нас выше. Вычислим по системе Бюрги значения степеней для двух соседних показателей у и у+ 1:

Вычитание дает

или, если вместо показателей, имеющих разность 1, рассмотреть вообще показатели с разностью Ау:

(1а)

Получается, таким образом, уравнение в конечных разностях для логарифмов Бюрги, которое сам Бюр-

ги непосредственно применяет при вычислении своих таблиц; определив, какое значение х соответствует некоторому уу Бюрги находит следующее значение, соответствующее у+1, посредством прибавления -j~4". Точно так же оказывается, что логарифм Непера удовлетворяет разностному уравнению

(1b)

Чтобы убедиться в близком родстве обеих систем, нужно только рассматривать вместо у то числа -црг» то числа —другими словами, переставить десятичную запятую в логарифмах; обозначая опять новые числа просто через у, получаем каждый раз числовой ряд, удовлетворяющий одному и тому же разностному уравнению

(2)

в котором у изменяется скачками, в одном случае равными 0,0001, а в другом случае равными —0,0000001.

Если мы позволим себе ради удобства воспользоваться изображением непрерывной показательной кривой, — собственно говоря, к этой кривой мы должны были бы прийти в результате наших рассуждений,— то мы сможем дать в нескольких словах наглядное описание расположения точек (х, у), соответствующих числовому ряду Непера или Бюрги: это — вершины лестницы с постоянной высотой ступени Ау = 0,0001 и соответственно Ау = 0,0000001, вписанной в показательную кривую

и соответственно

(3)

как схематически изображено на рис. 56.

Другое геометрическое истолкование, которое не предполагает знания показательной кривой и тем не

Рис. 56

менее лучше покажет нам естественный путь к ее построению, получается, если заменить разностное уравнение (2) следующим суммированием (как бы «проинтегрировать» его):

(4)

суммирование здесь надо понимать в том смысле, что I изменяется от 1 до х скачками такой величины, что соответствующее Дт] = -|^ постоянно равно 10~4 или соответственно —10~7, что дает Д£ = или соответственно Д6 =--j|r . Этот процесс нетрудно описать геометрически: надо начертить в плоскости \т\ гиперболу t] = у и отметить на оси 6, начиная от точки 6=1, все те точки, которые получаются, если последовательно прибавлять AI = -j|t (для логарифмов Бюрги)107). Над каждым таким отрезком (между двумя соседними точками) построим прямоугольник с высотой у, одной из вершин которого служит точка гиперболы, имеющая абсциссу g; все такие прямоугольники имеют одну и ту же площадь дЁ*у = 1о5' (рис. 57).

В таком случае равенство (4) показывает, что логарифм Бюрги равен как раз сумме всех этих вписанных, в гиперболу прямоугольников, лежащих между 1 и *. То же имеет место и для логарифмов Непера.

XVII столетие: площадь гиперболы. Последнее истолкование приводит нас непосредственно к натуральным логарифмам, если вместо суммы прямоугольников рассматривать площадь, ограниченную самой гиперболой между ординатами 6=1, 6 = * (заштрихованную на чертеже); это выражается, как известно,

Рис. 57

следующей формулой:

Таков же был и действительный исторический путь: а именно, решительный шаг был сделан около 1650 г., когда аналитическая геометрия составляла уже общее достояние математиков и нарождающееся исчисление бесконечно малых приводило к квадратурам известных кривых.

Если мы принимаем это определение натурального логарифма, то мы должны, конечно, прежде всего убедиться в том, что он действительно обладает тем основным свойством, что умножение чисел заменяется сложением логарифмов, или, выражаясь современным языком, мы должны показать, что определяемая площадью гиперболы функция

удовлетворяет простой теореме сложения:

В самом деле, при вариации переменных х\, х2 обе части получают по самому определению интеграла приращения —--\--- и соответственно , которые, таким образом, равны между собой; поэтому f (*i) + f и f(x\X2) могут отличаться только на постоянную С; но последняя оказывается равной нулю, так как при х\ — 1 имеем108) /(1) + f(x2) — f(x2), ибо /(1) = 0.

Чтобы найти «основание» полученных таким образом логарифмов, обратим наше внимание на то, что переход от ряда прямоугольников к площади, ограниченной гиперболой, можно получить, если двигаться по оси абсцисс каждый раз на Ag=~ вместо A£ = -jL. и давать п неограниченно возрастающие значения. Но это означает, что мы заменяем последовательность значений Бюрги х = 1,000110 000i/ последова-

тельностыо х= [I + ~J , где п пробегает ряд натуральных чисел. Согласно общему определению степени это можно выразить так: х есть у-я степень числа ^1 а это делает весьма вероятным, что по выполнении предельного перехода Wm (\ + —V станет основанием; это действительно как раз тот предел, который обыкновенно помещают в самом начале как определение числа е. Любопытно, что основание Бюрги 1,0001 10000 = 2,718146... совпадает с в с точностью до третьего десятичного знака109).

Посмотрим теперь, как развивалась исторически теория логарифма после Непера и Бюрги. Здесь прежде всего я должен указать следующее:

1. Упомянутый уже выше Меркатор одним из первых стал пользоваться определением натурального логарифма посредством площади гиперболы; в своей книге «Logarithmotechnica», а также в некоторых статьях, помещенных в «Philosophical Transaction» Лондонской академии за 1667 и 1668 гг., он показывает, исходя, собственно говоря, из тех же соображений, которые я только что изложил на современном языке, что / (х) = ^ отличается от обыкновенного логарифма по основанию 10 — этим основанием уже тогда пользовались при вычислениях — лишь постоянным множителем, так называемым модулем перехода. Кроме того, он же ввел название натуральный логарифм или также гиперболический логарифм. Но самой крупной заслугой Меркатора является то, что он нашел степенной ряд для логарифма, который он получает — по существу, — выполняя в его подынтегральном выражении деление и интегрируя затем почленно*). Я уже отметил это выше как шаг, проложивший в математике новый путь.

2. Там же я сообщал, что Ньютон воспользовался этими идеями Меркатора и обогатил их двумя новыми весьма ценными открытиями: обобщенной теоремой бинома и методом обращения рядов. Эти от-

*) См. с. 120-121.

крытия находятся уже в одной юношеской работе Ньютона: «De analysi per aequationes numéro terminorum infinitas», которая была напечатана много позднее*), но уже с 1669 г. была распространена в рукописи. В этой работе Ньютон выводит впервые из ряда Меркатора для у = \пх посредством его обращения ряд для показательной функции:

Таким образом, число, натуральный логарифм которого равен единице, получается отсюда в таком виде:

и с помощью функционального уравнения для логарифма110) нетрудно вполне строго прийти к выводу, что для каждого рационального у, в смысле обыкновенного определения степени, х равен одному из значений еу, а именно положительному, как мы еще увидим ниже. Таким образом, функция у = In* действительно представляет то, что, согласно обычному определению, следовало бы назвать «логарифм х по основанию е», причем е здесь определено посредством ряда, а не как

3. Более удобный способ получения показательного ряда имел возможность дать Брук Тейлор, установив в своем «Методе приращений»**) общий принцип разложения в ряд, названный его именем; об этом ряде нам еще придется много говорить в последующем. Ему надо было только из соотношения, содержащегося в определении логарифма с помощью интеграла:

вывести для обратной функции равенство

после этого он имел возможность сразу написать ряд для показательной функции как частный случай его общего ряда (т. е. так называемого ряда Тейлора).

*) В 1711 г.

**) Methodus Incrementorum. — Londini, 1715.

Эйлер и Лагранж: алгебраический анализ. Мы уже видели выше, что за этой продуктивной эпохой последовала эпоха критики, которую можно назвать чуть ли не периодом морального угнетения; в течение этого периода математики стремились главным образом к тому, чтобы надежно обосновать вновь приобретенные результаты и отделить то, что могло оказаться неверным. Мы должны теперь ближе присмотреться к тому, как относились к показательной функции и к логарифму главные представители этого направления— Эйлер и Лагранж.

Начнем с «Введения в анализ бесконечно малых» Эйлера*). Позвольте мне прежде всего отметить необычайный, поразительный анализ Эйлера, проявляемый им во всех его рассуждениях, хотя я должен заметить, что у Эйлера нет и следа той строгости, какая теперь обыкновенно требуется.

Эйлер начинает свои рассуждения с теоремы о биноме:

для целого показателя /; при нецелом показателе Эйлер вообще не рассматривает бинома во «Введении». Это разложение Эйлер применяет к выражению

где п и у — целые числа; заставляя п при сохранении этого условия возрастать до бесконечности и выполняя справа этот же процесс в каждом члене ряда отдельно, Эйлер получает показательный ряд

где е определено как lim Г1 + ^-У. Могут ли быть строго оправданы в современном значении этого слова отдельные шаги этого приема,— например, действительно ли сумма пределов членов ряда равна пределу суммы ряда, — обо всем этом Эйлер нисколько

*) Introductio in analisin infinitorum. — Lausannae, 1748. [Русский перевод: Эйлер Л. Введение в анализ бесконечно малых.— М.: Физматгиз, 1961.]

не заботится. Идея этого вывода ряда для показательной функции является, как вам известно, образцом для весьма многих курсов анализа, причем, во всяком случае, чем дальше, тем больше разрабатываются отдельные шаги сами по себе и особенное значение придается доказательству их правильности. О том, какое определяющее значение имела книга Эйлера для всего дальнейшего развития этих вещей, вы можете судить уже по одному тому, что от Эйлера ведет начало употребление буквы е для обозначения этого замечательного числа: «Ponamus autem brevitatis gratia pro numéro hoc 2,71828... constanter litteram e...»*).

Быть может, будет уместно здесь же упомянуть, что Эйлер дает непосредственно вслед за этим совершенно аналогичный вывод рядов для синуса и косинуса. При этом он исходит из разложения в ряд sin q>

по степеням sin ~ и заставляет п возрастать до со.

Если построить это разложение на основании «формулы Муавра»

то нетрудно понять, что применяемый Эйлером процесс представляет собой предельный переход для бинома. В этом же месте**) Эйлер впервые употребляет букву я для обозначения того числа, для которого она с тех пор всегда употребляется.

Обратимся теперь к замечательному сочинению Лагранжа — к «Теории аналитических функций»***). И в этом случае приходится прежде всего отметить, что вопросами о сходимости Лагранж, если и занимается, то совершенно случайно и мимоходом. Мы уже знаем, что Лагранж рассматривает лишь такие функции, которые даны в виде степенных рядов, и определяет их производные вполне формально посред-

*) «Примем ради краткости для этого числа 2,71828... постоянное обозначение — букву £», см. с. 105 в русском издании.

**) С. 109 русского издания.

***) Lagrange J.-L. Théorie des fonctions analytiques.— Paris, 1797,

ством почленного дифференцирования степенных рядов, т. е. призводная получается из исходного ряда с помощью совершенно определенных правил. Поэтому ряд Тейлора

представляет для него только лишь результат формальной перегруппировки членов ряда для f(x + h)t расположенного первоначально по степеням x + h. Если он желает применить этот ряд к какой-нибудь определенной функции, то, конечно, сначала он должен, строго говоря, показать, что взятая функция принадлежит к числу «аналитических», т. е. что она вообще может быть разложена в степенной ряд.

Лагранж начинает с рассмотрения функции f(x) = xn при рациональном п и определяет f'(x) как коэффициент111) при h в разложении (x + ft)n, представляя себе, что действительно вычислены первые два члена этого разложения; по тому же самому закону он сразу получает и /"(*), /'"(*)» а биномиальное разложение (x + h)n получается как частный случай ряда Тейлора для f(x + h). При этом я особенно подчеркиваю, что Лагранж не разбирает отдельно случая иррациональных показателей я, но считает очевидным, что этот случай исчерпан, если приняты во внимание все рациональные значения п\ это представляется интересным отметить ввиду того, что в настоящее время придают очень большое значение точной разработке подобных переходов.

Эти результаты Лагранж применяет к изучению функции f(x) = (l+b)x; а именно, преобразуя биномиальный ряд для (1 + è)*+\ он находит { (х) как коэффициент при Л, затем определяет по тому же закону f"(x), f" (х), ... и, наконец, пишет ряд Тейлора для f(х + h) = (l + b)x+h; полагая затем дс = 0, он получает искомый ряд для показательной функции.

XIX столетие: функции комплексной переменной. Этот исторический обзор, в котором я, разумеется, мог назвать имена только первоклассных математиков, я хотел бы закончить тем, что вкратце отмечу те существенно новые течения, которые возникли в XIX в. Здесь я должен прежде всего указать на следующее:

1. В выработке точных понятий сходимости бесконечных рядов и других бесконечных процессов первое место занимает Гаусс с его статьей 1812 г. о гипергеометрических рядах; затем следует работа Абеля 1824 г. о биномиальном ряде, между тем как Коши в двадцатых годах впервые публикует о своем «Курсе анализа»*) исследования общего характера о сходимости рядов. Результат всех этих работ по отношению к рассматриваемым здесь рядам состоит в том, что все прежние разложения — поскольку они относились к области сходимости — были правильны, причем точные доказательства оказываются, конечно, очень сложными. Относительно подробностей этих доказательств в их современном виде я снова отсылаю интересующихся к «Алгебраическому анализу» Буркгардта или к книге Вебера и Вельштейна.

2. Здесь же я должен упомянуть о точном обосновании анализа бесконечно малых в работах Коши, хотя подробно говорить об этом нам придется позже. Это обоснование сообщило тому изложению теории логарифмов, которое выработалось в XVII в., полную математическую точность.

3. Наконец, я должен упомянуть о той теории, которая одна только могла привести к полному пониманию логарифма и показательной функции, — о теории функций комплексной переменной, кратко называемой теперь «теорией функций». Первым, кто ясно представлял себе основные черты этой теории, был опять-таки Гаусс, хотя он опубликовал об этом очень мало или даже почти ничего. Для нас интересно прежде всего письмо Гаусса к Бесселю от 18 декабря 1811 г., которое было опубликовано, конечно, лишь намного позднее. В этом письме с поразительной ясностью определено значение интеграла Sdz — в комплексной плоскости и объяснено, почему он представляет бесконечнозначную функцию. Впрочем, слава самостоятельного создания и первого опубликования теории комплексных функций и в этом отношении принадлежит Коши.

*) Cauchy A.-L. Cours d'analyse. — T. I. Analyse algébrique.—Paris, 1821.

Результат этих исследований начала XIX в. в приложении к нашему специальному вопросу можно выразить приблизительно так: определение натурального логарифма на основании квадратуры гиперболы обладает такою же строгостью, как и всякое другое определение, и даже более того: оно, как мы видели, превосходит другие определения простотой и наглядностью.

3. Некоторые замечания о школьном преподавании

Несомненно — хотя и удивительно, — что это современное развитие идей, по существу, прошло совершенно бесследно для характера школьного преподавания, на что я уже неоднократно указывал. Там — в школе — и по сей день обходятся с помощью алгебраического анализа, несмотря на все трудности и несовершенства последнего, избегая всякого применения исчисления бесконечно малых, хотя страх XVIII в. перед последними давно уже потерял всякий смысл. Причину указанного явления приходится искать в том, что с самого начала XIX в. преподавание математики в школе и идущее вперед научное исследование потеряло всякое соприкосновение между собой, и это представляется тем более удивительным, что как раз в первые десятилетия этого же столетия вообще впервые начинается специальная подготовка кандидатов в преподаватели математики. Я указывал уже во «Введении» на этот разрыв, который долгое время имел здесь место и препятствовал какой-либо реформе школьной традиции. Средняя школа всегда очень мало заботилась о том, как высшая школа будет строить свое здание на основах, даваемых ей средней школой, и часто довольствовалась такими определениями, которые, быть может, и были достаточны для ее целей, но оказывались несостоятельными перед лицом более серьезных требований. С другой же стороны, и высшая школа часто совершенно не дает себе труда точно примыкать к тому, что дано в средней школе; вместо этого она строит совою собственную систему, лишь изредка сокращая свой труд не всегда даже подходящим указанием: «это вы уже имели в школе».

В противоположность этому интересно заметить, что те преподаватели высшей школы, которым приходится читать лекции для более широких кругов — для естественников и для техников, — сами собой пришли в своей практике к способу введения логарифмов, совершенно подобному тому, который я здесь рекомендую.

Так, Жюль Таннери в своих «Элементах математики» определяет с самого начала логарифм посредством площади гиперболы. Такой способ изложения представляет собой точное и последовательное проведение точки зрения «высшей» математики. Включение в преподавание определения Непера — Бюрги при постоянной иллюстрации на конкретных примерах рекомендует, например, Коппе в своей упомянутой выше программе 1893 г.

Я хочу теперь еще раз в нескольких словах резюмировать, как мне представляется введение логарифма в школе по этому простому и естественному способу. Основным принципом должно быть признание квадратуры уже известных кривых правильным источником для введения новых функций. Это, как я показал, соответствует, с одной стороны, историческому положению вещей, а с другой, методу, применяемому в высших частях математики (сравните, например, эллиптические функции). Следуя этому общему принципу, надо исходить из гиперболы Ч = т и назвать логарифмом X число, измеряющее площадь, которая содержится между кривой и осью абсцисс, а с боков ограничена ординатами 1=1 и 1 = х (рис. 58). Передвигая вторую ординату, можно легко на основании геометрической интуиции составить себе качественное представление об изменении этой площади при изменении X и, следовательно, приблизительно построить кривую у = In X. Чтобы возможно более просто получить функциональное уравнение логарифма, можно,

Рис. 58

например, исходить из равенства

которое получается при преобразовании с£ = %' переменных интегрирования; это равенство говорит, что площадь, заключенная между ординатами 1 и х, равна площади, заключенной между ординатами с и сх, в с раз более удаленными от начала. Этот факт легко сделать весьма наглядным геометрически, если обратить внимание на то, что величина площади должна оставаться неизменной, если передвигать ее под гиперболой и в то же время растягивать в такой же мере, в какой уменьшается высота. Но из этой теоремы вытекает непосредственно теорема сложения:

Мне бы очень хотелось, чтобы возможно скорее попробовали применить этот путь в школьной практике; решение вопроса о том, как должны быть построены детали этого изложения, следует, конечно, предоставить опытному преподавателю. Впрочем, в меранской программе мы еще не решались предложить этот путь в виде нормы.

Наконец, мы должны еще получить ориентировку в вопросе о том, как складывается наша теория, если мы становимся на точку зрения теории функций; это даст нам также полное освещение всех трудностей, затронутых ранее.

4. Точка зрения современной теории функций

В дальнейшем изложении мы заменим у и х комплексными переменными w = u-\-iv и z = x + iy. 1. Логарифм определяется посредством интеграла

(1)

причем путем интегрирования может служить любая кривая в комплексной плоскости £, идущая от точки £; = 1 к точке Ç = z (рис. 59).

2. В зависимости от того, обходит ли путь интегрирования вокруг точки Ç = О один раз, два раза,... или же не обходит вовсе, интеграл принимает бесконечно много различных значений, так что In г представляет собой бесконечнозначную функцию. Определенное значение — так называемое главное значение [In z] — получится, если разрезать плоскость, например, вдоль полупрямой отрицательных действительных чисел и установить, что путь интегрирования не должен пере-

ходить через этот разрез112). Произвольным остается при этом только то, желаем ли мы получать логарифмы отрицательных действительных значений, подходя к линии разреза сверху или снизу; соответственно этому логарифм получает чисто мнимую часть + in или — in. Из главного значения общее значение логарифма получается прибавлением произвольного целочисленного кратного числа 2ш:

(2)

3. Из определения логарифма с помощью интеграла следует, что обратная ему функция z — f(w) удовлетворяет дифференциальному уравнению

на основании которого можно сразу составить разложение функции / в степенной ряд:

Так как этот ряд сходится для всякого конечного значения до, то отсюда можно заключить, что обратная функция однозначна, имеет только одну особую точку w = оо и, таким образом, представляет собой целую трансцендентную функцию.

4. Совершенно так же, как и в случае действительной переменной, из определения при помощи интеграла можно вывести теорему сложения для логарифма, из которой для обратной функции вытекает функциональное уравнение

î iwy) • / (w2) = f{w{ + w2). (3)

Точно так же из соотношения (2) получаем

f(w + 2kin) = f(w) (k = 0, =Ы, ±2, ...);

другими словами, f(w) представляет собой простую периодическую функцию с периодом 2ш.

5. Положим f(l) = e. Тогда из соотношения (3) следует, что для каждого рационального значения w~^n число f(w) Равно одному*) из п значений Цеш, - определенных обычным образом:

Принято — и мы тоже присоединимся к этому обычаю — обозначать через ew = em/n всегда именно это значение f(w), так что ew обозначает вполне определенную однозначную функцию, а именно ту, которая определена в п. 3.

6. Какую же функцию надо понимать в наиболее общем смысле под степенью bw при произвольном основании 6? Определения должны быть даны таким образом, чтобы сохранились формальные правила возведения в степень. Если, таким образом, чтобы свести bw к только что определенной функции ew, мы положим b равным еХп ь, где In b имеет бесконечно много значений:

то с необходимостью получаем

а это дает при различных значениях k бесконечно много функций, среди которых нет равных. Таким образом, мы приходим к тому замечательному резуль-

*) А именно, действительному и положительному.

тату, что значения показательного выражения общего вида bw, получаемые посредством процессов возведения в степень и извлечения корня, принадлежат отнюдь не одной и той же функции, а бесконечно многим различным функциям от w, каждая из которых однозначна.

Значения этих функций находятся, конечно, в различных отношениях между собой. В частности, все они равны между собой, если w есть целое число;

если же w есть рациональная дробь вида

где m, п — взаимно простые числа, то среди них существует только конечное число, а именно, п различных значений; это — значения еп е п для £ = = 0, 1, п— 1; таким образом, как оно и должно было быть, это все п значений корня л/Ьт.

7. Лишь теперь мы можем вполне понять, до какой степени нецелесообразна обычная система школьного изложения, которая хочет, исходя из возведения в степень и извлечения корней, подойти к однозначной показательной функции; этим она попадает в лабиринт, из которого не может найти выхода с помощью одних своих так называемых «элементарных» средств, обязывая себя к тому же не выходить за пределы области действительных чисел113). Вам станет это вполне ясно, если вы теперь на основании приобретенного общего взгляда сообразите, как обстоит дело при отрицательном Ь. Я должен еще указать здесь на то, что теперь мы действительно можем понять целесообразность того определения главных значений, которое раньше казалось нам произвольным (Ь > 0 и Ьт,п > 0; см. с. 207): оно дает исключительно значения одной из наших бесчисленных функций, а именно, значения функции

В противоположность этому отрицательные действительные значения величины Ьм/п при четном п, которые тоже образуют всюду плотное множество, принадлежат совершенно разным из наших бесчисленных функций, и поэтому взятые вместе они не могут составить одну непрерывную аналитическую кривую.

Теперь я хочу добавить еще несколько более глубоких замечаний относительно природы логарифма с точки зрения теории функций. Так как функция ш = In г при каждом обходе около точки 2 = 0 испытывает приращение 2ш, то соответствующая ей риманова поверхность с бесконечным числом листов должна иметь в этом месте точку ветвления бесконечного порядка, а именно, такую точку ветвления, что при каждом обходе около нее происходит переход от одного листа к следующему; заменяя плоскость сферой, нетрудно убедиться в том, что точка z = со представляет собой вторую точку ветвления поверхности (такого же рода), а других точек ветвления нет. Теперь мы можем наглядно представить себе то, что называют униформизующей силой логарифма, о которой мы уже упоминали по поводу решения алгебраических уравнений (с. 191—192). Если имеется рациональная степень zm/n, то в силу тождества

она является однозначной функцией до = In 2, или, как говорят, она униформизуется логарифмом. Чтобы понять это, представим себе на плоскости, кроме римановой поверхности логарифма, еще и риманову поверхность функции zm/n: это м-листная поверхность, точками ветвления которой также являются 2 = 0 и г = оо, причем в каждой из них сходятся циклически все п листов. Если представить себе в плоскости 2 такой замкнутый путь, что на нем логарифм возвращается к своему первоначальному значению, — так что этот путь является замкнутым и на бесконечно многолистной поверхности логарифма114),— то легко видеть, что он должен оставаться замкнутым и в том случае, если перенести его на /глистную поверхность zm/n (рис. 60). Из этих геометрических соображений мы заключаем, что zm/n возвращается к своему начальному значению всякий раз, как возвращается к своему значению функция In 2, и что поэтому zm/n действительно униформизуется логарифмом. Я тем охотнее делаю эти краткие указания,

Рис. 60

что здесь мы имеем простейший случай проблемы униформизации, играющей столь большую роль в современной теории функций.

Теперь постараемся лучше представить себе природу функциональной зависимости w = lr\z при помощи рассмотрения конформного отображения плоскости z (или соответственно римановой поверхности) на плоскость w. Чтобы не слишком удаляться в сторону, мы откажемся от рассмотрения соответствующих сфер, что само по себе являлось бы, конечно, более предпочтительным, а будем вести рассмотрения в плоскости. Разделим, как мы это делали выше, плоскость z осью действительных чисел на заштрихованную (верхнюю) и незаштрихованную полуплоскости; каждая из них должна дать в плоскости w бесконечное множество областей, так как In г имеет бесконечное число значений, и все эти области должны, примыкая друг к другу, заполнить плоскость к», ибо обратная функция z = ew однозначна115). Здесь получается разбиение плоскости w на параллельные полосы шириною я, образуемые прямыми, параллельными оси действительных чисел; эти полосы следует попеременно заштриховать и оставить чистыми (первая полоса сверху от действительной оси w заштрихована); соответственно этому они представляют собой попеременно конформные образы верхней и нижней полуплоскостей, в то время как пограничные параллели соответствуют частям действительной оси z (рис. 61). Что же касается подробностей этого соответствия, то замечу здесь только, что z всегда приближается к нулю, когда w удаляется в бесконечность влево, оставаясь внутри одной и той же полосы; между тем z удаляется в бесконечность, если w уходит в бесконечность вправо; w = оо представляет

Рис. 61

собой существенно особую точку обратной функции ет.

Я бы хотел указать еще на связь этого с теоремой Пикара — одной из самых интересных в новейшей теории функций. Пусть г (до) означает целую трансцендентную функцию, т. е. такую функцию, которая имеет только одну существенно особую точку, а именно в точке до = оо (например ew). Вопрос заключается в том, имеются ли и в каком именно числе такие значения г, которых z(w) не принимает ни при одном конечном (т. е. расположенном на конечном расстоянии) значении до, но к которым z(w) только приближается, если до надлежащим образом удаляется в бесконечность. Теорема Пикара и состоит в том, что для каждой функции может быть самое большее два таких различных значения, которых она не принимает в окрестности существенно особой точки, и что, следовательно, целая трансцендентная функция, кроме значения г = оо, которого она не достигает, не принимает еще самое большее одного значения. Так, ew дает пример функции, которая действительно, кроме оо, не принимает еще одного значения, а именно г = 0, ибо хотя ew в каждой из параллельных полос нашего деления и приближается при указанных предельных переходах к обоим этим значениям О и оо, но ни в одной конечной точке не становится равной им. Пример функции, которая не принимает только одного значения (2 = 00), представляет sin до.

В заключение я хочу с помощью этих геометрических средств выяснить еще один вопрос, которого я уже несколько раз касался, это — предельный переход от степени к показательной функции, который задается формулой

или, полагая n*w=v,

Рассмотрим с этой целью функцию в том виде, в каком она представляется до предельного перехода:

свойства ее нам хорошо известны. Для нее «замечательными точками» служат до = —v и до = оо, в которых основание становится равным нулю и соответственно со. Эта функция отображает конформным образом полуплоскости переменной / на секторы плоскости до, имеющие общую вершину в точке до = —v и угловой раствор я/v (рис. 62); если v не равно целому числу, то последовательность этих секторов может покрывать плоскость до конечное или бесконечное число раз в соответствии с той многозначностью, которою обладает в этом случае /v. Если v становится бесконечно большим, то общая вершина секторов отодвигается влево в бесконечность, и вполне понятно, что секторы, расположенные справа от —v, переходят при этом в параллельные полосы плоскости до, соответствующие предельной функции ew; это дает геометрическое разъяснение указанного определения функции ew посредством предела; с помощью несложного вычисления можно убедиться и в том, что ширина секторов у точки до = О переходит при этом в ширину полос.

Но тут сейчас же появляется сомнение следующего рода: если позволить v возрастать до бесконечности, соответствуют многолистные поверхности; как же рациональные и иррациональные значения, для которых функция fv становится многозначной и которым соответствуют многочисленные поверхности; как же могут последние перейти в простую плоскость, принадлежащую однозначной функции ew? Если, например, v переходит в бесконечность, принимая одни только дробные значения со знаменателем /г, то каждая функция fv(w) имеет риманову поверхность с п листами. Чтобы проследить за этим процессом, обратимся на одну минуту к сфере до; для каждой функции fv(w) она покрыта п листами, которые встречаются в точках ветвления —v и со; предположим, что сечение ветвления проходит вдоль меньшей дуги прямой, соединяющей эти точки (рис. 63). Когда v уходит в бесконечность, точки ветвления

Рис. 62

сближаются и сечение ветвления исчезает: этим уничтожается тот мост, вдоль которого п листов переходили друг в друга, и получаются п отдельных листов и соответственно им п различных однозначных функций; наша функция ew представляет только одну из них. Если же предоставить v пробегать все действительные значения, то получаются вообще поверхности с бесконечным числом листов, связь которых прекращается в предельном положении; на одном из листов каждой такой поверхности значения стремятся в пределе к совпадению со значениями однозначной функции ew, которая расположена на простой сфере, между тем как последовательности значений на других листах, вообще говоря, не стремятся ни к каким предельным значениям. Этим вполне выясняется довольно сложный и замечательный предельный переход от многозначной степени к однозначной показательной функции.

Общую мораль всех этих рассуждений можно, пожалуй, видеть в том, что полное понимание сущности подобных проблем возможно только при переходе в комплексную область. Не является ли это достаточным основанием для того, чтобы и в школе изучать теорию комплексных функций? Макс Симон, например, действительно выставляет подобные требования. Но я не думаю, чтобы возможно было дойти до этого со средними учениками даже в последнем классе, и уже по одному этому я полагаю, что следует отказаться в преподавании от появляющейся здесь методики алгебраического анализа в пользу развитого выше простого и естественного пути116). Конечно, мне представляется тем более желательным, чтобы учитель вполне владел всеми играющими здесь роль сведениями из теории функций, ибо он должен стоять достаточно высоко над тем материалом, который ему приходится излагать, и должен в точности знать все те подводные скалы и мели, среди которых он проводит своих учеников.

После этих рассуждений мы сможем быть гораздо более краткими при изложении учения о тригонометрических функциях.

Рис. 63

II. О ТРИГОНОМЕТРИЧЕСКИХ ФУНКЦИЯХ

Заметим прежде всего, что мы предпочитаем название «гониометрические функции» наименованию «тригонометрические функции» по той причине, что учение о треугольниках представляет собой только частное применение этих функций, играющих в высшей степени важную роль во всех отраслях математики*). Обратные им функции, вполне соответствующие логарифму (между тем как сами гониометрические функции представляют собой аналогию с показательной функцией), мы называем циклометрическими функциями**).

1. Теория тригонометрических функций в связи с учением о логарифме

Рассмотрение этой теории мы поставим в связь с вопросом о том, какой способ изложения ее в школе представляется наиболее естественным. Я полагаю, что и в этом случае будет лучше всего применить наш общий принцип, согласно которому надо исходить из квадратуры плоских кривых. Обычный способ изложения, который начинается с измерения дуг, кажется мне не в такой степени непосредственно наглядным; прежде всего, он не дает возможности одинаково просто и с одной и той же точки зрения охватить как высшие, так и низшие области. Позвольте мне снова воспользоваться аналитической геометрией.

1. За исходный пункт я беру круг радиуса 1:

х2 + у2=1

(рис. 64) и рассматриваю сектор, образуемый радиус-векторами точек Л (1,0) и Р(х,у). Обозначим площадь этого сектора через (ибо тогда дуга ЛР=ф).

*) В оригинале весь этот раздел озаглавлен «О гониометрических функциях», и всюду применяется именно это название. Мы с полным уважением отнеслись к точке зрения Клейна, изложенной в этом абзаце, но в заглавии и всюду далее вернулись к термину «тригонометрические функции», поскольку терминология Клейна не прижилась, а постоянное повторение в тексте этого неприжившегося термина ничего, кроме неудобства, не представляет.

**) В дальнейшем мы будем пользоваться более употребительным у нас термином «обратные тригонометрические функции».

2. Под тригонометрическими функциями «косинус» и «синус» аргумента мы будем понимать координаты X и у концевой точки Р сектора площадью у I X = cos ф, у = sin ф.

Происхождение этого обозначения остается неясным; по всей вероятности, слово «sinus» возникло вследствие какого-нибудь недоразумения при переводе арабского слова на латинский язык.

3. Прочие тригонометрические функции:

а в старой тригонометрии еще seccp и coseccp, определяем как простые сочетания обеих основных функций. Их вводят исключительно ради сокращения формул, которые приходится применять на практике; теоретического значения они для нас не имеют.

4. Если мы станем следить за изменением координат точки Р при возрастании ср, то легко сможем составить себе качественное представление о виде графиков синуса и косинуса в прямоугольной системе координат. Получаем известные волнообразные линии, имеющие период 2я (рис. 65); при этом число л; определяем как площадь полного круга радиуса 1 (а не как длину полуокружности).

Сравним теперь подробно с этими определениями изложенный выше способ определения логарифма и показательной функции.

1. Там мы исходили из равносторонней гиперболы, отнесенной к ее асимптотам:

Рис. 64 Рис. 65

полуось OA этой гиперболы равна у 2 (рис. 66), тогда как здесь радиус круга равнялся 1. Мы рассматривали далее площадь полосы между неподвижной ординатой АА' (£=1) и подвижной РР'\ обозначая эту площадь через Ф, мы полагали Ф = ln g, так что координаты Р оказывались равными

Вы замечаете известную аналогию с предыдущим, которая, впрочем, здесь нарушается в двух отношениях: во-первых, Ф не выражает площадь сектора, как выше, в случае круга; во-вторых, здесь обе координаты выражаются рационально через одну функцию еф, между тем как в случае круга мы должны были ввести две функции coscp и sin ср. Но мы сейчас увидим, что оба отклонения можно легко устранить.

2. Прежде всего заметим, что площадь треугольника OPfP не зависит от положения точки Р на кривой, а именно, она всегда равна •^ОР/ • PfP = 2"ь • Л = у- " частности, она равна площади треугольника OA'А, так что, присоединяя этот треугольник к площади Ф криволинейной трапеции А'АРР' и отнимая равный треугольник ОР'Р, находим, что Ф можно определить как площадь гиперболического сектора ОАР, заключенного между радиус-векторами вершины А и подвижной точки гиперболы, — вполне аналогично случаю круга (рис. 67). Имеется однако различие в направлении отсчета: для наблюдателя, находящегося в О, дуга АР в случае окружности была направлена влево, а для гиперболы вправо. Это

Рис. 66 Рис. 67

различие мы устраним ее зеркальным отражением относительно радиус-вектора ОЛ, —другими словами, поменяем ролями переменные g и ц; тогда координаты точки Р будут

3. Наконец, примем за оси координат вместо асимптот главные оси гиперболы, повернув для этого весь чертеж на 45° (рис. 68). Если обозначить новые координаты через X, У, то уравнения преобразования будут иметь такой вид:

поэтому уравнение гиперболы переходит в

Х2-Г2 = 2,

и сектор Ф принимает такое же положение, какое он раньше занимал в круге. Новые координаты точки Р представляют собой следующие функции аргумента Ф:

4. Остается только уменьшить весь чертеж в отношении 1:V2» чтобы полуось гиперболы стала равна 1 вместо л/2, подобно тому как раньше радиус круга равнялся единице. Теперь площадь сектора, о котором идет речь, станет равна Ф; обозначая новые координаты снова через х, у, находим, что они равны следующим функциям аргумента Ф:

которые удовлетворяют такому соотношению (уравнению гиперболы):

Рис. 68

Этим функциям дано название гиперболического косинуса и синуса; их обозначают через

Результат, к которому мы пришли, сводится к следующему. Если поступать с кругом радиуса 1 и с равносторонней гиперболой, полуось которой равна 1, совершенно одинаково, то в первом случае мы придем к обыкновенным тригонометрическим функциям, а во втором — к гиперболическим функциям, которые вполне соответствуют друг другу.

Как известно, применение функции ch и sh часто бывает полезно. Но тем не менее в данном случае в применении к исследованию гиперболы мы, в сущности, сделали шаг назад: если раньше мы могли рационально представить координаты |, г) с помощью одной только функции еф, то теперь нам необходимы для этого две функции, связанные между собой алгебраическим соотношением (уравнением гиперболы). Это подсказывает, что естественно и в случае круга совершить обратный переход: развить учение о тригонометрических функциях совершенно аналогично тому, как мы раньше определили логарифм, исходя из гиперболы. Сделать это очень легко, если только не бояться перехода к комплексным величинам; тогда удастся ввести только одну основную функцию, посредством которой соэф и эшф выражаются рациональным образом, подобно тому как сЬФ и shO выражаются через еф; она призвана поэтому играть в теории тригонометрических функций центральную роль.

1. Для этого мы прежде всего вводим в уравнение круга х2 + у2 = 1 (где х = cos ф, у = sin ф) новые координаты

после чего уравнение принимает вид

2. Искомой центральной функцией является — подобно тому как было в случае гиперболы — вторая

координата117); обозначая ее через f(q>), находим на основании уравнений преобразования

3. Из последних равенств находим, что

чем достигается полная аналогия с прежними соотношениями между сЬФ, sh<P, еф. Если, таким образом, заранее вскрыть аналогию между тригонометрическими и гиперболическими функциями, то великое открытие Эйлера, выражаемое формулой /(ф) = е'ф, теряет характер поразительной неожиданности.

Не является ли возможным подобное сведение функций соэф и sincp к одной основной функции и в том случае, если оставаться в действительной области? К этому, действительно, можно прийти, если взглянуть на наши фигуры с точки зрения проективной геометрии. А именно, можно в случае гиперболы ту координату tj, которая дала нам основную функцию, определить как параметр в пучке параллелей ц = const, который, рассматриваемый с проективной точки зрения в его отношении к гиперболе, представляет собой не что иное, как пучок лучей118) с вершиной в одной из точек гиперболы (здесь в одной из бесконечно удаленных точек). Рассматривая в случае круга или гиперболы параметр какого-нибудь такого пучка как функцию площади, мы придем к другой основной функции, тоже оставаясь в действительной области.

Рассмотрим в случае круга пучок прямых, проходящих через точку S(— 1, 0):

У = Цх+1),

где А, —параметр (рис. 69); выше мы уже вычислили координаты точки пересечения Р луча, имеющего па-

раметр X, с окружностью, а именно, мы нашли, что

так что

представляет собой нужную нам действительную основную функцию. А так как, с другой стороны, zPSO = y ZPO а и ZPO А =ф, то отсюда непосредственно вытекает, что À = tg-^; этим однозначным выражением функций cos ф и sin ф через tg у очень часто пользуются при тригонометрических вычислениях. Соотношение функции X с прежней основной функцией /(ф) получается из последней формулы в таком виде:

или, наоборот,

Таким образом, введение величины X сводится в конечном счете попросту к некоторой дробно-линейной функции от /(ф), которая имеет действительное значение вдоль окружности круга; хотя благодаря этому формулы становятся действительными, но они не столь просты, как при непосредственном применении функции /(ф).

Стоит ли покупать преимущество оперирования с действительными числами ценой такого недостатка,

Рис. 69

зависит, конечно, от того, насколько то или иное лицо умеет обращаться с комплексными величинами. По этому поводу я замечу только, что физики давно уже перешли к употреблению мнимых величин, в особенности же в оптике, когда приходится иметь дело с уравнениями колебательных движений. С другой стороны, техники — и прежде всего электротехники с их вектор-диаграммами — тоже начинают в последнее время с успехом пользоваться комплексными величинами. Таким образом, можно утверждать, что применение комплексных величин начинает, наконец, завоевывать права гражданства в более широких кругах, хотя, конечно, в настоящее время значительное большинство еще крепко придерживается действительной области.

Имея в виду обрисовать в общих чертах дальнейшее развитие теории тригонометрических функций, мы должны прежде всего упомянуть о теореме сложения.

1. Теорема сложения выражается формулой

и аналогичной формулой для cos(cp + Ф)- Причина того, что эти формулы выглядят сложнее, чем в случае показательной функции, заключается, конечно, в том, что здесь мы имеем дело не с основной элементарной функцией; для этой последней функции /(<р) = = cosq>-Msincp получается совершенно такая же крайне простая формула, как и для ех:

2. От формулы сложения мы приходим к выражениям функций для кратных углов и для частей угла, из числа которых я отмечу только две следующие формулы, игравшие большую роль при вычислении первых тригонометрических таблиц:

Изящное выражение всех соотношений, имеющих здесь место, дает так называемая «формула Муавра»:

Муавр был француз, но жил в Лондоне в кругу Ньютона; свою формулу он опубликовал в 1730 г.

3. Исходя из нашего первоначального определения t/ = sincp, можно, разумеется, легко получить выражение обратной функции*) ф = = arcsin у в виде интеграла.

Сектор у (т. е. АОР) круга

радиуса 1 вместе с горизонтально заштрихованным треугольником ОР'Р ограничен параллелями у = 0 и у к оси абсцисс и кривой х = у\ — у2 и имеет поэтому площадь, равную ^ Vi —y2dy (рис. 70), а так как упомянутый треугольник имеет площадь

то

Отсюда находим посредством простого преобразования119)

Поступая теперь совершенно так же, как в случае логарифма, а именно, разлагая подынтегральное выражение в ряд по теореме бинома и применяя затем по идее Меркатора почленное интегрирование, можно найти разложение arcsin у в степенной ряд, а из него вывести, пользуясь методом обращения рядов, ряд для самого синуса; так именно — я уже говорил об этом выше — поступил сам Ньютон.

Рис. 70

*) Клейн использует для обратных тригонометрических функций обозначения sin-1, cos-1, принятые в зарубежной математической литературе. В этом издании использованы более привычные нам обозначения arcsin, arecos.

4. Я больше склонен воспользоваться здесь более кратким путем, который стал возможен благодаря великому открытию, сделанному Тейлором. Для этого из упомянутого интегрального выражения выводим сначала величину производной для самого синуса:

совершенно аналогично находим

Отсюда120) на основании теоремы Тейлора получаем разложения

Нетрудно видеть, что эти ряды сходятся для всякого конечного, даже комплексного, значения jc, так что sinx и cos X определяются ими как однозначные целые трансцендентные функции во всей комплексной плоскости.

5. Сравнивая эти ряды с рядом для е*, находим для основной функции /(ф):

Такой вывод без оговорки становится возможным только после того, как мы убедились, что cosy и sin у, так же как и е/ф, представляют собой однозначные целые функции.

6. Остается описать ход изменения комплексных функций sin w, cos w. С этой целью я прежде всего замечу, что каждая из обратных функций w = = arcsin z и w = arecos z дает поверхность Римана с бесконечным числом листов и с местами ветвления — 1, +1. со, а именно, над точками z = ±\ лежит по бесконечному числу точек ветвления первого порядка, а над точкой z = со находятся две точки ветвления бесконечно высокого порядка. Чтобы лучше выяснить расположение листов, рассмотрим снова разбиение плоскости w на области, соответствующие верхней (заштрихованной) и нижней (незаштрихованной) полуплоскости z (рис. 71). Для г = cos до

это разбиение получается с помощью действительной оси и параллелей к мнимой оси, проходящих через точки w = 0, ±я, ±2я, ... ; при этом, как видно из чертежа, получаются треугольные области121), которые все простираются до бесконечности; их приходится попеременно заштриховывать и оставлять чистыми. В точках w = О, ±2я, ±4я, ..., соответствующих # = + 1> и в точках w = =Ья, ±3я, ..., соответствующих у = —1, встречается по четыре треугольника, и это соответствует четырем полулистам поверхности Римана, которые сходятся в каждой из точек ветвления, лежащих над точками г = ± 1. Функция cos w приближается к значению z = оо, когда мы удаляемся внутри одного какого-нибудь треугольника вверх или вниз до бесконечности. Это соответствует тому, что на римановой поверхности в точке со сходятся две отдельные системы из бесконечного числа листов каждая. В случае z = sin w дело обстоит совершенно аналогично с той только разницей, что чертеж в плоскости w следует представить себе передвинутым на вправо. На этих чертежах находят подтверждение сделанные нами выше (по поводу теоремы Пикара) указания относительно природы существенно особой точки w = со.

Рис. 71

2. Тригонометрические таблицы

На этом я закончу краткий обзор теории тригонометрических функций и перейду к рассмотрению того, что наиболее важно на практике, а именно, тригонометрических таблиц. Одновременно с этим я буду говорить о таблицах логарифмов, рассмотрение которых я до сих пор откладывал ввиду того, что составление этих последних с самого начала и до наших дней идет рука об руку с составлением тригонометрических таблиц. Вопрос о том, каким образом

таблицы логарифмов получили свой теперешний вид, представляется, конечно, весьма важным и интересным и для школьного преподавателя математики. Разумеется, я не могут здесь подробно изложить всю крайне продолжительную историю развития таблиц; я хочу только отметить некоторые наиболее замечательные моменты, чтобы дать вам приблизительное понятие об этом развитии.

А. Чисто тригонометрические таблицы. Под этим названием мы понимаем таблицы, которые были построены до изобретения логарифмов. Такие таблицы существовали уже в древности, а именно — первой дошедшей до нас является таблица Птолемея.

1. Это так называемая таблица хорд Птолемея, которую последний составил для астрономических целей около 150 г. нашей эры. Она помещена в его сочинении «Megale Syntaxis», в котором Птолемей развивает названную его именем систему мира.

Это сочинение дошло до нас окольным путем через руки арабов под часто употребляемым названием «Almagest», которое, быть может, получилось из соединения арабского артикля «al» с извращенным греческим названием. Эта таблица Птолемея дает для углов с интервалами 30' не сам синус угла a, a соответствующую этому углу хорду (т. е. 2 • sin у) .

Значения хорд даны здесь в виде трехзначных шестидесятеричных дробей, другими словами, в виде W + lkô+imôô' где а> *• целые числа от нуля до 59. Для нас самым трудным является то, что эти числа а, 6, с написаны, разумеется, греческими числовыми знаками, т. е. посредством сочетания греческих букв. Далее мы находим здесь еще значения разностей, которые позволяют производить интерполяцию до минуты.

Что же касается вычисления этой таблицы, то Птолемей, во всяком случае, пользовался произведенной выше формулой для sin у (следовательно, он применял извлечение корня) и интерполяцией.

2. Перенесемся теперь на тысячу лет далее — к тому времени, когда тригонометрические таблицы были вычислены впервые на Западе. Здесь прежде

всего следует назвать Региомонтана (1436—1476), настоящее имя которого было Иоганн Мюллер*). Он вычислил различные тригонометрические таблицы, в которых ясно виден переход от остатков шестидесятеричной системы к чистой десятичной системе. В то время тригонометрических линий не изображали, как теперь, в виде дробей, принимая радиус за 1, но вычисляли их для окружностей очень большого радиуса, так что можно было — с не меньшей точностью — ограничиться выражением их в виде целых чисел. Эти большие числа уже тогда писали в десятичной системе, но в выборе радиуса еще долгое время слышались отзвуки шестидесятеричной системы. Так, в одной таблице Региомонтана радиус считается равным 6000 000, но в другой таблице впервые радиус равен чистому десятичному числу 10 000 000, благодаря чему все вычисление оказалось возможным провести полностью в десятичной системе. Достаточно вставить запятую, чтобы число этой таблицы превратилось в нашу десятичную дробь. Эти таблицы Региомонтана были напечатаны лишь много лет спусти после его смерти в сочинении его учителя Пейрбаха «Трактат о предложениях Птолемея относительно синусов и хорд»**). Обратите внимание на то, что и это сочинение, как и многие другие капитальные математические издания — из них нам уже известны произведения Кардано и Штифеля, а дальше мы познакомимся и с другими, — были отпечатаны в 40-х годах XVI в. в Нюрнберге. Сам Региомонтан провел большую часть жизни в Нюрнберге.

3. Теперь я предложу вашему вниманию книгу, имевшую огромное значение вообще, а именно, сочинение Николая Коперника «De revolutionibus orbium coelestium», в котором развита «коперникова система мира». Коперник жил с 1473 до 1543 г. в Торуне, но упомянутое сочинение появляется снова в Нюрнберге всего лишь через два года после появления таблиц Региомонтана, с которыми Коперник тогда еше не был знаком; поэтому для осуществления своей

*) Псевдоним «Региомонтан» представляет собой перевод на латинский язык названия «Кенигсберг» (ныне г. Калининград), родины И. Мюллера.

**) Peurbach G. Tractatus super propositiones Ptolemaei de sinubus et chordis. — Norimbergae, ap. Jo. Petreium, 1541,

теории он должен был сам вычислить небольшую таблицу синусов.

4. Но эти таблицы ни в коем случае не могли удовлетворить потребности астрономов, и вот мы видим, что один ученик и друг Коперника вскоре приступает к осуществлению гораздо шире задуманного дела. Это—Ретикус; его имя представляет искусно латинизированное указание его родной страны (Vorarlberg)*). Он жил с 1514 по 1596 г. и был профессором в Виттенберге. Во всем этом обзоре вы всегда должны принимать во внимание историческую обстановку; этот период относится к эпохе реформации, во время которой, как известно, Виттенберг, а также свободный имперский город Нюрнберг стали главными центрами интеллектуальной жизни. Но постепенно в ходе религиозных войн центр тяжести политической и духовной жизни передвигается от городов к княжеским дворам, и вот, в то время как ранее все печаталось в Нюрнберге, обширные таблицы Ретикуса появляются на свет в Гейдельберге при денежкой поддержке пфальцского курфюрста (1596). Они появились лишь после смерти Ретикуса. Эти таблицы гораздо полнее предыдущих; в них содержатся значения тригонометрических функций для каждых 10" в десятизначных дробях; правда, в них встречается еще довольно много ошибок.

5. В весьма усовершенствованном виде переиздал эти таблицы Питискус в Силезии (1561—1613), капеллан пфальцского курфюрста. Снова отпечатанные на средства курфюрста (1613), эти таблицы содержат значения тригонометрических функций для интервалов в 10" с 15 десятичными знаками. Они в гораздо большей степени свободны от ошибок и изданы лучше, чем таблицы Ретикуса.

Мы должны иметь в виду, что все эти таблицы вычислены с помощью одной только формулы для половины дуги и интерполяции, так как тогда еще не были известны бесконечные ряды для синуса и косинуса. Только принимая это во внимание, мы сможем в надлежащей мере оценить то невероятное усердие и ту работу, которые вложены в эти почтенные произведения.

*) Ныне земля в составе Австрии,

К этим таблицам уже непосредственно примыкают новые таблицы, соединяющие тригонометрические данные с логарифмическими.

В. Логарифмо-тригонометрические таблицы. Здесь мы наблюдаем как бы иронию истории: всего лишь год спустя после того, как в руках Питискуса таблицы тригонометрических функций достигли известного совершенства, впервые появляются таблицы логарифмов, делающие тригонометрические таблицы, собственно говоря, излишними, так как теперь уже нужны не сами синусы и косинусы, а их логарифмы.

1. Прежде всего приходится назвать уже упомянутые мною первые таблицы логарифмов Непера (1614). При этом Непер до такой степени имел в виду прежде всего облегчение тригонометрических вычислений, что сначала дал даже не логарифмы натуральных чисел, а семизначные логарифмы тригонометрических функций для каждой минуты.

2. Впервые придал таблицам логарифмов их обычную теперь форму англичанин Генри Бригг (1556— 1630), находившийся в личных отношениях с Непером. Он понял, какое громадное преимущество для практических вычислений имеют логарифмы по основанию 10, более родственные нашей десятичной записи чисел, и ввел поэтому это основание вместо неперова. Таким образом, получились «искусственные логарифмы», называемые также «бригговыми». Кроме того, Бригг дает и логарифмы натуральных чисел (а не только логарифмы тригонометрических функций). Эти нововведения находятся в его «Arithmetica logarithmica» (Лондон, 1624). Правда, Бригг не успел закончить все вычисления и дает только логарифмы целых чисел от 1 до 20 000 и от 90000 до 100 000, но зато с 14 знаками. Замечательно, что именно в наиболее старых таблицах содержится наибольшее число десятичных знаков, между тем как в новое время в большинстве случаев довольствуются весьма малым числом знаков; к этому я еще вернусь.

3. Пропуск в таблицах Бригга впервые заполнил голландец Адриан Влакк, живший в Гуде близ Лейдена,— математик, типограф и книгопродавец. Он отпечатал второе издание таблиц Бригга, содержавшее на этот раз логарифмы всех целых чисел от i

до 100 000, но только с 10 десятичными знаками. Это издание является основой всех наших теперешних таблиц.

Что же касается дальнейшего развития таблиц, то я могу дать только самые общие указания относительно того, в чем заключалось дальнейшее развитие их по сравнению с указанными первыми шагами.

а) Прежде всего существенное значение имел прогресс теории, а именно, логарифмические ряды дали новое, крайне практичное, средство для вычисления логарифмов. Об этом вычислители первых таблиц не знали ничего. Непер, как мы видели, вычислял свои логарифмы с помощью разностного уравнения, — другими словами, посредством последовательного прибавления пользуясь при этом в большой степени интерполяцией. У Бригга самую важную роль играло извлечение квадратных корней; он пользуется тем, что, зная lg а и lg о, можно найти lg л/а • b по формуле

Этим же самым приемом пользовался и Влакк.

b) Значительные успехи были достигнуты путем более целесообразного расположения таблиц, которое дало возможность поместить больше материала на меньшем пространстве и в форме, более доступной обозрению.

c) Но, что важнее всего, значительно возросла правильность таблиц благодаря тому, что ошибки, которые еще часто попадались в старинных таблицах, особенно в последних десятичных знаках, были устранены при помощи внимательной проверки.

Из большого числа возникших таким образом таблиц я назову только самые известные.

4. «Полное собрание больших логарифмо-тригонометрических таблиц», изданное австрийским артиллерийским офицером Вега в 1794 г. в Лейпциге. Оригинальное издание стало библиографической редкостью, но в 1896 г. во Флоренции появилась фототипная перепечатка. Эти таблицы содержат десятизначные логарифмы натуральных чисел и тригонометрических функций, расположенные по способу, ставшему с тех

пор типичным; так, вы видите, например, здесь уже маленькие таблички разностей, предназначенные для облегчения интерполирования.

Переходя к XIX в., мы замечаем широкое распространение логарифмов, стоящее в связи, во-первых, с тем, что в 20-х годах логарифмы были введены в школу, а во-вторых, с тем, что логарифмы находят все больше и больше применений в практике физиков и техников. При этом пришлось, конечно, согласиться на значительное сокращение числа знаков, так как и школа и практика нуждались в таблицах, не слишком объемистых; к тому же три или четыре десятичных знака представляют точность, вполне достаточную в большинстве случаев. Правда, в мое школьное время мы пользовались еще семизначными таблицами; в то время в защиту употребления такого числа знаков приводили то соображение, что ученики должны благодаря этому проникнуться «величием чисел». Теперь все настроены утилитарно и всюду пользуются трехзначными, четырехзначными или, самое большее, пятизначными таблицами.

Счетная линейка, как известно, представляет собой не что иное, как трехзначную таблицу логарифмов в самой удобной форме механического счетного аппарата; вам всем, конечно, известен этот инструмент, который теперь всякий инженер всегда имеет при себе для своих расчетов.

Но мы еще не дошли, конечно, в этом направлении до конца и можем довольно ясно представить себе, в чем будет состоять дальнейшее развитие, а именно, в последнее время все больше и больше распространяются счетные машины, которые делают излишними таблицы логарифмов, так как они позволяют производить непосредственное умножение гораздо быстрее и увереннее122).

3. Применения тригонометрических функций

Здесь нас интересуют:

Тригонометрия, которая вообще послужила поводом к изобретению тригонометрических функций.

Механика, в которой учение о малых колебаниях представляет собой особенно обширную область их применения.

Изображение периодических функций посредством тригонометрических рядов, которое, как известно, играет весьма важную роль в самых разнообразных вопросах.

А. Тригонометрия, в особенности сферическая тригонометрия. Тригонометрия является весьма древней наукой; уже в Египте она достигла высокой степени развития под влиянием запросов двух важных наук: геодезии, нуждавшейся в учении о плоских треугольниках, и астрономии, нуждавшейся в учении о сферических треугольниках.

Характер настоящих лекций не позволяет, конечно, дать систематическое изложение всей тригонометрии; это должно составить предмет специального курса; к тому же ведь здесь, в Гёттингене, практической тригонометрии уделяется вполне достаточно внимания на обычных лекциях по геодезии и сферической астрономии. Я же хотел бы поговорить с вами об одной очень интересной главе теоретической тригонометрии, которая, несмотря на свою весьма глубокую древность, все еще не может считаться вполне законченной, так как она до сих пор еще содержит много невыясненных вопросов и проблем сравнительно элементарного характера, обработка которых не кажется мне неблагодарным трудом; я имею в виду сферическую тригонометрию. Этот отдел как раз разработан весьма обстоятельно в книге Вебера и Вельштейна*); там приняты во внимание те идеи, которые развил Штуди в своем фундаментальном сочинении «Сферическая тригонометрия, ортогональные подстановки и эллиптические функции». Я попытаюсь представить вам обзор всех относящихся сюда теорий и в особенности указать на вопросы, остающиеся пока открытыми.

Основные понятия сферической тригонометрии и формулы первой ступени. Элементарное понятие сферического треугольника вряд ли нуждается в подробных разъяснениях: три точки на сфере вполне определяют (если только никакие две из них не лежат на концах одного диаметра) треугольник123); каждый из трех углов и каждая сторона этого треугольника заключаются между 0 и я (рис. 72).

*) Русский перевод в книге: Энциклопедия элементарной математики, т. II, кн. II.

Но при дальнейших исследованиях оказывается целесообразным считать стороны и углы неограниченными переменными величинами, которые могут становиться даже большими я или 2я или кратными 2я; тогда приходится говорить о сторонах, налагающихся на самих себя, и об углах, делающих по нескольку оборотов около вершины. При этом приходится условиться относительно знака этих величин, т. е. относительно того направления, в котором их надо отсчитывать.

Заслуга последовательного проведения принципа знаков как в геометрии, так и, в частности, в сферической тригонометрии принадлежит великому лейпцигскому геометру Мёбиусу124). Благодаря этому принципу был впервые проложен путь для исследований наиболее общего характера о величинах, неограниченно изменяющихся.

Эти условия относительно знака начинаются с того, что устанавливают определенное направление вращения, при котором углы около всякой точки А на сфере считаются положительными; если это направление указано для одной какой-нибудь точки сферы, то это же самое направление переносят по принципу непрерывного изменения на всякую другую точку сферы (рис. 73). Можно, например, как обыкновенно делают, считать за положительное направление вращения то, которое при наблюдении с внешней стороны представляется обратным движению часовой стрелки. Далее, необходимо установить для всякой большой окружности на сфере определенное направление обхода, но здесь невозможно ограничиться установлением определенного направления для одной какой-нибудь окружности и затем непрерывно

Рис. 72 Рис. 73

переходить ко всем другим окружностям, так как каждую окружность можно привести двумя существенно различными способами к совмещению со всякой другой окружностью. Поэтому каждой окружности, с которой нам придется иметь дело, мы будем в отдельности приписывать определенное направление обхода и будем рассматривать одну и ту же окружность как два различных геометрических объекта в зависимости от того, какое направление для нее мы примем за положительное. Установив такие определения, мы можем каждой большой окружности а однозначно отнести определенный полюс Р, а именно тот из ее двух полюсов в обычном смысле слова, из которого ее направление представляется положительным; обратно, каждому полюсу соответствует однозначно определенная «полярная окружность» с определенным направлением обхода. Этим вполне однозначно устанавливается столь важный в тригонометрии «процесс полярного преобразования»125).

Если даны три какие-нибудь точки Л, В, С на сфере (рис. 74), то для однозначного определения сферического треугольника, имеющего вершины в этих точках, недостает еще некоторых данных; прежде всего необходимо присвоить каждой из трех больших окружностей, проходящих через точки Л, В, С, определенное направление, а также нужно указать, сколько раз следует каждую из них обойти в указанном для нее направлении, прежде чем прийти от ß к С от С к А, от А к В. Определенные таким образом длины а, Ъ, с, которые могут иметь любые действительные значения, называются сторонами сферического треугольника; мы, конечно, примем, что они отнесены к сфере с радиусом 1. Далее, углы получают такое определение: угол а при вершине А получается при таком повороте в положительном направлении, при котором положительное направление дуги CA, кончающейся в А, переходит в положительное направление дуги AB, начинающейся в Л; к этому углу

Рис. 74

еще можно добавить в виде слагаемого любое кратное 2л; аналогично определяются и прочие углы. Рассмотрим обыкновенный элементарный треугольник, как указано на рис. 74, и установим направления сторон так, чтобы длины сторон а, &, с были меньше я; тогда углы а, ß, у оказываются согласно нашему новому определению, как это легко видеть, внешними углами треугольника, а не его внутренними углами, как при обычном элементарном определении.

Давно известно, что при такой замене обычно принимаемых углов их дополнениями до я формулы сферической тригонометрии получают более симметричный и более наглядный вид. Более глубокую причину этого можно видеть в следующем: указанный выше процесс полярного преобразования относит каждому треугольнику, определенному согласно правилам Мёбиуса, описанным выше, вполне однозначно другой треугольник, «полярный» по отношению к первому126), и нетрудно видеть, что последний при наших новых определениях имеет углами стороны первоначального треугольника, а сторонами — его углы. Поэтому всякая формула, написанная в этих обозначениях, должна иметь место и в том случае, если мы в ней поменяем местами а, Ь, с с а, ß, у, так что всегда должна иметь место симметрия между сторонами и углами. При обычном элементарном измерении углов и сторон эта симметрия не имеет места, так как соотношения между данным треугольником и его полярным треугольником зависят от того, что считают в каждом отдельном случае за углы и стороны, и от выбора того или другого из двух полюсов окружности, заданной без определенного направления обхода.

Ясно поэтому, что из шести определенных таким образом элементов сферического треугольника только три можно изменять непрерывным образом независимо друг от друга, например, две стороны и заключенный между ними угол. Формулы сферической тригонометрии представляют собой известное число соотношений между этими 6 элементами или, вернее, алгебраических соотношений между их 12 косинусами и синусами; эти соотношения позволяют произвольно изменять только 3 из этих 12 величин, тогда как другие 9 находятся в алгебраической зависимости

от первых трех. При переходе к косинусу и синусу мы перестаем, разумеется, обращать внимание на то, какое именно кратное 2я служит дополнительным слагаемым. Представляя себе тригонометрию как собрание всевозможных алгебраических соотношений такого рода, мы можем определить ее задачу в соответствии с современными взглядами следующим образом: станем рассматривать величины

как координаты точки в пространстве 12 измерений R\2\ совокупность всех тех точек этого пространства, которые соответствуют действительно возможным сферическим треугольникам а, ..., у, составляет трехмерное алгебраическое многообразие Mz этого пространства Rï2, и вот это именно многообразие А13 в R\2 и подлежит изучению. Этим сферическая тригонометрия включается в общую аналитическую геометрию многомерных пространств.

Это многообразие Мг должно обладать различными симметриями. Так, процесс полярного преобразования показывает, что замена величин a, ft, с величинами сс, ß, у и обратно всегда дает новый сферический треугольник; по отношению к нашим новым обозначениям это значит, что из всякой точки в Af3 можно получить другую точку, принадлежащую тоже А13, если заменить хи х2, *3, у\, У2, Уз величинами лг4, *5> *б, У\у Уь, Уб и наоборот. Далее, всякому треугольнику соответствуют семь смежных треугольников соответственно делению всего пространства на 8 октантов плоскостями трех больших окружностей; элементы этих треугольников получаются из элементов первоначального треугольника посредством изменения и прибавления я12'); это дает для каждой точки множества Л43 семь новых точек, координаты которых Хи ..., Уб получаются посредством перемены знака у координат исходной точки. Совокупность этих симметрий приводит в конце концов к некоторой группе

перестановок и перемен знака у координат точек R\2, которая преобразует многообразие Af3 в себя*).

Наиболее важным является вопрос о тех алгебраических уравнениях, которым удовлетворяют координаты точек многообразия Л43 и которые образуют совокупность тригонометрических формул. Так как всегда cos2a + sin2a= 1, то это дает нам прежде всего шесть квадратичных соотношений

которые, выражаясь геометрически, изображают шесть цилиндрических поверхностей второго порядка, содержащих многообразие М3.

Другие шесть формул дает теорема косинусов сферической тригонометрии, которая в наших обозначениях выражается так:

cos а = cos b • cos с — sin b • sin с • cos a,

что при полярном преобразовании дает

cos a = cos ß cos у — sin ß sin у cos a.

Эти формулы вместе с теми четырьмя, которые получаются при циклических перестановках символов а, d, си а, ß,v» определяют шесть поверхностей третьего порядка, содержащих многообразие М3:

(2) (3)

Наконец, можно еще использовать теорему синусов, которая получается, если приравнять нулю миноры следующей матрицы:

*) Если некоторая такая симметрия (т. е. перестановка некоторых координат и перемен знаков) преобразует точку £ многообразия Ms в точку г) того же многообразия, а другая переводит точку ч в точку £, го последовательное выполнение этих двух симметрий переводит точку £ в точку £; это значит, что композиция двух таких симметрий представляет собой также одну из них; преобразование, обратное симметрии, тоже представляет собой одну из симметрий. Это означает, что все рассматриваемые симметрии образуют группу.

Иначе говоря, эта теорема выражается равенствами

(4)

Это дает три поверхности второго порядка, из которых, однако, только две линейно независимы.

Таким образом, в общем мы получили 15 уравнений для точек нашего многообразия М3 в пространстве У?12.

Для выделения из R\2 трехмерного множества оказывается, вообще говоря, недостаточным иметь 12 — 3 = 9 уравнений. В самом деле, уже в обыкновенной геометрии пространства /?3, как известно, отнюдь не всякая кривая в пространстве может быть представлена как полное пересечение двух алгебраических поверхностей; простейшим примером служит пространственная кривая третьего порядка, для определения которой необходимы по меньшей мере 3 уравнения. Так и в нашем случае легко видеть, что 9 уравнений (1) и (2) еще не определяют Мг\ как известно, из теоремы косинусов можно вывести теорему синусов, не считая одного знака, вопрос о котором решают затем при помощи геометрических соображений. Представляется желательным знать, какие именно уравнения и в каком числе вполне определяют наше многообразие М3. Вообще, я желал бы формулировать здесь четыре определенных вопроса, на которые, по-видимому, в литературе до сих пор еще нет точного ответа; они заслуживают, я думаю, подробного изучения, которое к тому же и не должно представить особенного труда, если только приобретена известная сноровка в обращении с формулами сферической тригонометрии.

Вот эти вопросы:

1. Что надо понимать под «порядком» многообразия М3?

2. Каковы уравнения самой низкой степени, посредством которых можно представить многообразие Л13 в чистом виде?

3. Какова полная система независимых уравнений, содержащих М3, т. е. таких уравнений fi = _ о, ..., fn = 0, из которых всякое другое уравнение, изображающее поверхность, проходящую через Л1з, может быть составлено линейным образом по-

средством целых рациональных множителей*) mi, ... тп в виде гп\{\ + + rnnfn=0? Для этого может понадобиться больше уравнений, чем указывает ответ на вопрос 2.

4. Какие алгебраические тождества [так называемые сизигии (Syzygieen)] имеют место между этими п формами fu ..., fn?

Во всех этих вещах можно ориентироваться с помощью уже произведенных исследований, которые преследуют ту же самую цель, хотя исходят из несколько иной постановки вопроса. Эти исследования содержатся в гёттингенской диссертации, которую написала Чизхольм (позднее Юнг) в 1894 г. Это — первая диссертация в Пруссии, написанная женщиной. Среди различных приемов, применяемых Чизхольм, наиболее замечательный состоит в том, что за независимые координаты она принимает котангенсы половин углов и дуг; действительно, ввиду того, что основной функцией является tg у, а следовательно, и ctg у и что через нее однозначно выражаются cos а и sin а, оказывается возможным записать всякое тригонометрическое равенство в виде алгебраического соотношения между ctg у, ctg-~ .

Поэтому сферические треугольники представляют теперь трехмерное алгебраическое многообразие Л13 в шестимерном пространстве #6, которое имеет координатами Ctg у, Ctg у, Ctg у, Ctg у, Ctg у, Ctg-y .

Чизхольм показала, что это многообразие AJ3 имеет порядок, равный 8, и что оно может быть представлено как полное пересечение трех поверхностей второго порядка в пространстве R6.

Формулы второй ступени, собственные и несобственные треугольники. Формулы сферической тригонометрии, о которых я до сих пор говорил и которые связывают синусы и косинусы сторон и углов, я называю формулами первой ступени; им противопоставляют группу существенно других формул под именем формул второй ступени. Эти формулы представляют собой алгебраические урав-

*) От переменных х\, •. •, Ув-

нения, которым подчинены тригонометрические функции половин углов и сторон; поэтому при изучении последних представляется наиболее удобным рассматривать 12 величин

как координаты нового двенадцатимерного пространства /?12, в котором сферические треугольники снова образуют трехмерное алгебраическое многообразие Мз. На первом месте здесь стоят прежде всего те изящные формулы, которые были опубликованы в начале прошлого столетия почти одновременно и независимо друг от друга Деламбром (1807), Мольвейде (1808) и, наконец, Гауссом (1809). Это 12 формул, получаемых посредством круговой перестановки из формул

Нечто существенное и новое по сравнению с формулами первой ступени представляет здесь двойной знак, который надо понимать следующим образом: для одного и того же треугольника имеют место одновременно все верхние или все нижние знаки во всех 32 формулах; при этом оказывается, что существуют треугольники как того, так и другого рода. Таким образом, множество ЛГз сферических треугольников в определенном выше пространстве R\2 определяется двумя совершенно различными системами, состоящими из 12 кубических уравнений каждая, и распадается поэтому_на два отдельных алгебраических многообразия: М3, для которого имеет место один знак, и Mz> для которого надо брать другой знак. Благодаря этому замечательному обстоятельству упомянутые формулы приобретают особенно важное значение в теории сферических треугольников; они

представляют собой нечто гораздо большее, чем простое преобразование прежних уравнений, годное — самое большее — для облегчения тригонометрических вычислений, как полагали Деламбр и Мольвейде. Гаусс первый взглянул на дело глубже; действительно, он указывает на возможность перемены знака, если придать идее сферического треугольника ее наибольшую общность. Поэтому мне кажется вполне справедливым называть эти формулы формулами Гаусса, хотя и не ему принадлежит приоритет их опубликования.

Но впервые понял все значение этого обстоятельства Штуди и разъяснил его в 1894 г. Его главный результат удобно выразить, если исходить из пространства шести измерений Re, для которого координатами служат сами значения а, Ъ, с, а, ß, у, рассматриваемые как неограниченно изменяющиеся переменные; мы будем называть их трансцендентными определяющими элементами треугольника в отличие от алгебраических определяющих элементов cos а, ... или cos—-, так как первые представляют собой трансцендентные, а вторые — алгебраические функции обыкновенных пространственных координат вершин треугольника. В этом пространстве Re совокупность всех сферических треугольников составляет трансцендентное многообразие М3('>, образом которого в пространстве Rn служит определенное выше алгебраическое многообразие My Но так как последнее распадается на два многообразия, а отображающие функции cos у, ... представляют собой однозначные и непрерывные функции трансцендентных координат, то и трансцендентное многообразие Mz{t) должно распадаться на две отдельные части (составляющие). Сама теорема Штуди заключается в следующем: трансцендентное многообразие Л13(0 всех величин а, Ь, с, а, ß, у, какие только могут быть элементами сферического треугольника самого общего вида, распадается, соответственно двойному знаку в формулах Гаусса, на две отдельные связные части. Наиболее важным является здесь невозможность дальнейшего распадения; это значит, что дальнейший анализ тригонометрических формул не может

привести к подобным и столь же глубоким разделениям множества всех сферических треугольников. Треугольники первой группы, соответствующей верхнему знаку в формулах Гаусса, называют собственными треугольниками, а треугольники второй группы— несобственными, так что теорему Штуди можно выразить так: совокупность всех сферических треугольников распадается на континуум собственных и на континуум несобственных треугольников. Относящиеся сюда подробности и доказательство теоремы Штуди вы найдете у Вебера и Вельштейна (т. II, § 47). Я же сообщаю здесь только результаты в возможно кратком обзоре.

Теперь я остановлюсь подробнее на различении обоих родов треугольников: если имеется какой-нибудь сферический треугольник, т. е. «допустимая система значений» величин а, 6, с, а, ß, у, косинусы и синусы которых удовлетворяют формулам первой ступени и которые поэтому представляют некоторую точку в многообразии Af3(/>, то каким образом можем мы решить вопрос о том, является ли этот треугольник собственным или несобственным? С этой целью образуем прежде всего наименьшие положительные вычеты До, Ьо> Со» <х<ь ßo, Yo данных чисел по модулю 2л:

Косинусы и синусы этих вычетов равны тем же тригонометрическим функциям для а, а, так что они в свою очередь образуют сферический треугольник, который мы назовем приведенным или мёбиусовым треугольником, соответствующим первому треугольнику, так как сам Мёбиус не рассматривал треугольников с элементами, превосходящими 2л. Решим прежде всего с помощью небольшой таблицы вопрос о том, в каких случаях треугольник Мёбиуса является собственным и когда он принадлежит к числу несобственных. Такую табличку вы можете найти у Вебера и Вельштейна, но только в не столь наглядной форме; там также помещены рисунки различных типов собственных и несобственных треугольников. Мы находим по четыре типа треугольников каждого рода.

I. Собственные треугольники Мёбиуса:

1) 0 сторон >я, но < 2я; 0 углов > я,

но < 2я;

2) 1 сторона > я, но < 2я; 2 прилежащих угла > я,

но < 2я;

3) 2 стороны > я, но < 2я; 1 заключенный угол > я,

но <2я;

4) 3 стороны > я, но < 2я; 3 угла > я,

но < 2д.

II. Несобственные треугольники Мёбиуса:

1) 0 сторон >я, но < 2я; 3 угла > я,

но < 2л;

2) I сторона >я, но <2я; 1 противолежащий угол >я,

но <2л;

3) 2 стороны >я, но <2я; 2 противолежащих угла >я,

но <2я;

4) 3 стороны > я, но < 2я; 0 углов > я,

но < 2л.

Других случаев, кроме здесь перечисленных, не существует, так что с помощью этой таблички вполне решается вопрос о том, к которому из двух видоd принадлежит данный треугольник Мёбиуса.

Согласно сказанному выше переход к треугольнику общего вида а, а, ... от соответствующего треугольника Мёбиуса производится посредством следующего рода формул:

причем имеет место теорема: треугольник общего вида оказывается одноименным с приведенным треугольником (т. е. одновременно с ним собственным или несобственным), если сумма шести целых чисел п\ + П2 + Лз + vi + V2 + v3 есть четное число, и разноименным, если это число нечетное. Таким образом, характер каждого треугольника оказывается вполне определенным.

Площадь сферического треугольника, дополнительные соотношения сферической тригонометрии. Я закончу этот раздел несколькими замечаниями о площади сферических треугольников. Об этом совершенно не упоминают ни Штуди в своих исследованиях, ни Вебер и Вельштейн, но это играет большую роль в моих прежних исследованиях по теории функций о треугольниках, составленных из дуг окружностей. В то время как до сих пор треугольник представлял собою в наших глазах не что иное, как соединение трех углов и трех сторон, удовлетворяющих теоремам косинусов и синусов, теперь речь пойдет об определенной части поверхности, ограниченной этими сторонами и представляющей собой как бы мембрану (пленку), натянутую между тремя сторонами и соответствующими углами.

Конечно, здесь не имеет смысла рассматривать «внешние» углы а, ß, у треугольника, как мы делали раньше ради симметрии; теперь речь будет идти о тех углах, которые сама мембрана образует у вершин; для краткости мы будем называть их «внутренними» углами треугольника. Я привык обозначать их через Лл, ря, vn (рис. 75). Эти углы можно рассматривать как неограниченно изменяющиеся исключительно положительные величины, так как мы не хотим исключать и того случая, когда вершины мембраны служат точками свивания (наслаивания) поверхности. Аналогично этому, обозначим абсолютные длины сторон через /я, тя, пя; это тоже неограниченно изменяющиеся положительные величины. Но теперь уже углы и стороны не могут, как раньше, покрывать сами себя неограниченное число раз независимо друг от друга, — иными словами, получать в виде слагаемых произвольные кратные 2я; тот факт, что должна существовать одна сплошная мембрана с этими углами и сторонами, находит свое выражение в известных соотношениях между этими множителями при 2я; в работе «О нулевых точках гипергеометриче-

Рис 75

ского ряда» я назвал эти соотношения*) дополнительными соотношениями сферической тригонометрии. Они имеют следующий вид, если через Е{х) обозначить целую часть числа х, т. е. наибольшее целое число, не превосходящее х:

и так как, например, ^(у) обозначает число cлагаемых, равных 2я каждое, содержащихся в стороне /я, то эти соотношения как раз выражают искомые кратные 2я, содержащиеся в сторонах /я, тя, шг, если известны углы tat, |1я, vя с содержащимися в них кратными 2я. В частности, нетрудно видеть, что при положительных Я, р,, v положительным может быть, самое большее, одно из трех чисел К — р,— v, — k + — v, —Я — fx + v, так что только один из трех аргументов в правых частях равенств может быть больше единицы, а так как при х < 1 всегда £*) = 0, то только одно из трех упомянутых кратных**) 2я может быть отлично от нуля. Итак, у треугольной мембраны только одна сторона может превосходить 2я, а именно, сторона наибольшего угла.

Что же касается доказательства этих дополнительных соотношений, то я хочу только в нескольких словах охарактеризовать ход мыслей в этом доказательстве. Исходят из элементарного треугольника, на который, конечно, всегда можно натянуть мембрану, и из нее получают последовательно мембраны самого общего вида, присоединяя по нескольку раз надлежащим образом мембраны, имеющие форму круга, с точками ветвления в вершинах. Рис. 76 показывает в виде примера — в стереографической проекции — треугольник ABC, полученный из элементарного треугольника присоединением полусферы, ограниченной

*) Klein F. Über die Nullstellen der hypergeometrischen Reihe//Math. Ann. — 1888. — Bd 37.

**) Выражаемых левыми частями написанных выше равенств.

большим кругом AB, вследствие чего как сторона AB, так и угол С по одному разу покрывают сами себя. Легко видеть, что при этом процессе дополнительные соотношения остаются в силе; оказывается, что это имеет место и для треугольных мембран самого общего вида, какие только можно построить посредством подобных процессов.

Теперь мы должны уточнить, какое место занимают эти треугольники с дополнительными соотношениями в описанной выше общей теории. Очевидно, они представляют собой только частные случаи, причем — ввиду того, что вообще числа, показывающие, сколько раз стороны и углы покрывают сами себя, вполне произвольны, — такие частные случаи, которые характеризуются возможностью обтянуть треугольник мембраной. Конечно, на первый взгляд это вызывает недоумение: в самом деле, как мы видели г.ыше, все собственные треугольники, даже и те, которые вовсе не удовлетворяют дополнительным соотношениям, образуют один континуум, так что каждый из них может быть получен посредством непрерывного изменения из элементарного треугольника; поэтому казалось бы, что мембрана, натянутая на элементарный треугольник, не может при этом процессе исчезнуть. Объяснение этого затруднения мы получим, если применим принцип Мёбиуса определения знака и к площадям: площадь надо считать положительной или отрицательной в зависимости от того, обходят ли ее в положительном (против движения часовой стрелки) или в отрицательном направлении. Если кривая, пересекая себя, ограничивает несколько частей поверхности, то вся ограничиваемая ею площадь равна алгебраической сумме площадей отдельных частей. На рис. 77 надо брать разность, а на рис. 78 сумму площадей обеих частей. Конечно, эти определения представляют собой лишь геометрическое выражение того, что само собой вытекает из аналитического определения площади.

Применяя эти результаты, в частности, к сферическим треугольникам, найдем, что, действительно,

Рис. 76

каждому собственному треугольнику можно отнести определенную площадь на сфере, но только при этом при однократном обходе периферии треугольника одни части этой площади приходится обходить в положительном, другие же — в отрицательном направлении, и поэтому при подсчете им следует приписывать различные знаки. Те треугольники, для которых имеет место дополнительное соотношение, отличаются только тем, что они состоят из одной только мембраны, обегаемой в положительном направлении; этим свойством и объясняется их большое значение для целей теории функций, ради которых я их и приводил раньше.

Теперь я хотел бы пояснить эти вещи на одном примере. Рассмотрим треугольник ABC, изображенный на рис. 79 в стереографической проекции, причем А есть более удаленная от дуги ВС точка пеоесечения больших окружностей В А и CA; вторая точка пересечения обозначена буквой А'. Внутренние углы треугольника ця, vn измеряют поворот стороны AB до совпадения128) с ВС и стороны ВС до совпадения с CA; оба они положительны. Наоборот, угол Лл, на который надо повернуть сторону САУ чтобы привести ее в совпадение со стороной AB, надо, согласно правилу Мёбиуса, считать отрицательным; положим л = — Треугольник А'ВС представляет собой, очевидно, элементарный треугольник с углами %'п, ця, vji, которые все положительны. При обходе треугольника ABC в указанном направлении приходится треугольник А'ВС обходить в положительном, а сферический двусторонник АА' в отрицательном

Рис. 77 Рис. 78

Рис. 79

направлении, так что за площадь треугольника ABC надо принять согласно условиям Мёбиуса разность этих двух частей сферы. Это разделение треугольной мембраны на положительную и отрицательную части можно сообразно направлению обхода периферии представить себе наглядно, принимая, что мембрана перекручена в точке А', так что нижний двусторонник оказывается обращенным своей изнаночной, отрицательной стороной вверх. Нетрудно составить и более сложные примеры в том же роде.

В заключение я хочу показать на этом же примере, что при этом обобщенном определении площади остается в силе элементарная формула площадей сферической тригонометрии. Как известно, площадь сферического треугольника с углами Ал, рл, vn на сфере радиуса 1 равна так называемому «сферическому избытку» ( к + Ц + V — 1 ) Я, поскольку v > 0. Убедимся теперь, что эта формула справедлива и для нашего треугольника ABC. Действительно, площадь элементарного треугольника А'ВС равна (AZ + ji + v—1)я; из нее надо вычесть площадь сферического двусторонника АА' с угловым раствором А/я, равную 2Х'л (ибо площадь двусторонника пропорциональна его углу, и при угле в 2я она равна площади поверхности всей сферы, т. е. 4я). Получается следующая величина площади треугольника ABC:

Аналогично этому, если попробовать натянуть мембрану из нескольких кусков на собственный треугольник с произвольными углами и сторонами и затем определить на основании правила знаков площадь как алгебраическую сумму отдельных частей, то представляется вероятным, что формула (К + р, -f + v—1)я окажется справедливой, причем, разумеется, Яя, ... надо рассматривать как подлинные углы мембраны, а не как ее внешние углы.

Относящиеся сюда исследования еще, правда, не выполнены, но, видимо, не представляют очень больших трудностей, и я считал бы весьма желательным, чтобы этим вопросом занялись. Особенно важно было бы выяснить роль несобственных треугольников.

На этом я оставлю область тригонометрии и обращаюсь ко второму важному приложению теории тригонометрических функций, также относящемуся к области школьного преподавания.

В. Учение о малых колебаниях, в частности, о колебаниях маятника. Прежде всего я напомню вам вкратце тот вывод закона колебаний маятника, который мы обыкновенно излагаем в университете, пользуясь исчислением бесконечно малых. Предположим, что маятник висит на нити, длина которой равна /; обозначим через ср угол, который маятник составляет с положением равновесия (рис. 80). Так как на маятник действует сила тяжести129) g, направленная вертикально вниз, то, согласно основным уравнениям механики, движение маятника определяется следующим уравнением130):

(1)

В случае небольших ср можно с достаточной точностью заменить sincp на ср, что дает для так называемых малых колебаний маятника такое уравнение:

(2)

Общий интеграл этого уравнения выражается, как известно, посредством тригонометрических функций, которые, таким образом, играют здесь важную роль благодаря их дифференциальным свойствам (наличие тригонометрической величины sincp в уравнении (1) не играет здесь роли131)); именно, общий интеграл имеет вид

где а и в обозначают произвольные постоянные, или, иначе,

(3)

где постоянная С называется амплитудой, а to—начальной фазой колебания; отсюда получаем для

Рис. 80

времени полного колебания величину

Школьное изложение (скрытый анализ бесконечно малых). Но совершенно иначе— по сравнению с этими простыми и ясными рассуждениями, которые, конечно, становятся еще нагляднее при более обстоятельном изучении вопроса,— складывается так называемое «элементарное» изложение закона колебаний маятника, принятое в школе. При этом изложении хотят совершенно избежать всякого последовательного применения исчисления бесконечно малых, между тем как именно здесь физика в силу внутренней природы ее проблем повелительно требует применения методов бесконечно малых; в результате оказывается, что прибегают к помощи специального приема, изобретенного ad hoc*) и содержащего идеи анализа бесконечно малых, но только не называют их собственным именем. Разумеется, при этом получается крайне сложное построение, если только от него требуется действительная точность; поэтому на деле этот прием излагают большей частью с такими пропусками, что, на самом деле, вряд ли можно говорить о доказательстве закона колебаний маятника. Таким образом, получается такое курьезное явление: учитель на одном уроке — математики — наиболее требовательно относится к логической строгости доказательств, которой, по его мнению, унаследованному от традиций XVIII века, не удовлетворяет исчисление бесконечно малых, а на следующем уроке— физики — прибегает к крайне сомнительным заключениям и к самому смелому применению бесконечно малых. Вообще, подробное исследование математических методов, по традиции сохраняющихся в преподавании физики, снова и снова обнаруживает, что всякое рассуждение здесь затрудняет; удовлетворительное изложение становится часто совершенно невозможным благодаря искусственному исключению исчисления бесконечно малых из элементарного преподавания.

*) Для данного случая (лат.)

Разрешите мне, со своей стороны, для лучшего уяснения изложить в нескольких словах ход мыслей в элементарном выводе закона колебаний маятника, который применяется в учебниках и в школе. В этом доказательстве исходят из конического маятника; так называют пространственный маятник, который с равномерной скоростью v описывает окружность вокруг вертикальной оси, так что нить маятника описывает при этом поверхность прямого кругового конуса (рис. 81). Такое движение в механике называют правильной прецессией. Возможность такого движения в школе считают, конечно, установленной опытом и задаются лишь вопросом о том, какие соотношения имеют место между скоростью v и постоянным отклонением маятника от вертикали ср = а (т. е. углом между образующей конуса, описываемого нитью, и вертикалью). Начинают с того, что находят для радиуса круга, описываемого маятником, величину г = = / -sin а, где вместо sin а можно взять а, если предположить, что угол а достаточно мал. Затем говорят о центробежной силе132) и выводят формулу, согласно которой наша точка, описывающая окружность со скоростью v, развивает центробежную силу, равную

Чтобы движение не нарушилось, ее должна уравновешивать равная по величине сила, направленная к центру окружности, — так называемая центростремительная сила. Но последней является горизонтальная составляющая133) силы тяжести, равная по величине g-tga, что при достаточно малом a можно положить равным g-а. Таким образом, получаем искомое соотношение в следующем виде:

Рис. 81

или

Отсюда находим, что время одного колебания маятника T, т. е. то время, в течение которого маятник описывает полную окружность 2лг = 2л/ос, равно

другими словами, конический маятник совершает в случае достаточно малых отклонений а правильную прецессию с определенным периодом, величина которого не зависит от ос.

Если мы хотим подвергнуть критике уже эту часть вывода, то, прежде всего, замену sin а и tga на а мы можем признать допустимой; такую замену мы сами совершали в нашем точном выводе (с. 267); действительно, благодаря ей получается переход от «конечных» колебаний к «бесконечно малым» колебаниям134). В противоположность этому, формула центробежной силы может быть получена «элементарным путем» только ценой различных неточностей, которые находят свое истинное обоснование лишь в дифференциальном исчислении. А именно, уже определение центробежной силы нуждается, в сущности, даже в понятии второй производной, так что при элементарном выводе приходится исказить и последнее. Вследствие этого возникают — ввиду невозможности ясно выразить то, о чем идет речь, — огромные затруднения для понимания, которые при применении дифференциального исчисления совершенно не имели бы места. Мне не приходится входить здесь в детали.

Но на этом еще далеко не кончается вывод закона колебаний маятника. Мы показали только возможность равномерного движения по кругу, которое на языке аналитической механики изображается следующими уравнениями, если возьмем оси х и у в плоскости этого круга (т. е. при наших упрощениях в плоскости, касательной к сфере) (рис. 82):

(4)

Но мы желаем получить плоские колебания маятника, другими словами, тяжелая точка маятника должна двигаться по нашей плоскости ху вдоль одной прямой— оси X, а чтобы при отклонении Ф = у получилось верное уравнение (3), его уравнение движения должно иметь такой вид:

(5)

Итак, нам надо от уравнений (4) прийти к уравнениям (5), причем мы не должны пользоваться дифференциальными уравнениями динамики. Этого достигают, вводя принцип наложения небольших колебаний, согласно которому, если возможны два движения X, у и х\9 У, то возможно и движение х + х\, у + У\. А именно, мы можем комбинировать левовращательное движение маятника, выражаемое уравнениями (4), с правовращательным движением, определяемым такими уравнениями:

В результате, если взять а = -£-* то движение х + х\, у + у\ в действительности представляет собой то колебательное движение маятника, выражаемое уравнениями (5), которое мы хотели вывести.

При критике этих рассуждений прежде всего возникает, конечно, вопрос о том, каким образом можно обосновать или, по крайней мере, сделать правдоподобным, не пользуясь дифференциальным исчислением, принцип наложения колебаний. Но главным образом при всех таких элементарных приемах изложения всегда возникает вопрос о том, не могут ли такие последовательно допускаемые неточности привести в

Рис. 82

результате к заметной ошибке, хотя бы в отдельности эти неточности и были допустимы. Подробнее останавливаться на этом мне не приходится, так как эти вопросы столь элементарны, что всякий из вас может самостоятельно продумать их до конца, раз ваше внимание на них обращено. Я же хотел бы еще раз отметить, что здесь речь идет о следующем центральном пункте проблемы преподавания: с одной стороны, здесь ясно выступает потребность принимать во внимание исчисление бесконечно малых, а с другой стороны, обнаруживается необходимость введения тригонометрических функций в общем виде, независимо от их специального применения к геометрии треугольника.

Теперь я перейду к последнему из тех применений тригонометрических функций, о которых я имел в виду говорить.

С. Изображение периодических функций посредством рядов из тригонометрических функций (тригонометрические ряды). Как известно, в астрономии и в математической физике во многих случаях приходится рассматривать и вычислять периодические функции, и вот здесь-то упомянутое в заглавии изображение и представляет собой самое главное и постоянно применяемое средство исследования.

Приближения, выраженные конечным числом членов ряда. Представим себе для большего удобства единицу длины выбранной так, что период данной периодической функции у = f(х) равен 2я (рис. 83). Вопрос заключается в том, нельзя ли такую функцию f(x) приближенно изобразить посредством линейной комбинации косинусов и синусов целочисленных кратных 2я вплоть до первой, второй, ..., вообще п-й кратности с подходяще выбранными постоянными коэффициентами; другими словами, нельзя ли заменить f(x) с достаточно малой

Рис. 83

ошибкой выражением такого вида:

(1)

В свободный член вводят здесь множитель 1/2 из соображений, которые выяснятся ниже (а именно, для того, чтобы выражение коэффициентов было одинаковым для всех п).

Прежде всего я должен снова пожаловаться на изложение, принятое в учебниках. А именно, вместо того чтобы поставить на первый план только что указанную элементарную проблему, авторы учебников считают единственным заслуживающим внимания примыкающий сюда теоретический вопрос о том, нельзя ли изобразить f(x) точно посредством бесконечного ряда.

Такая постановка вопроса для практических целей совершенно лишена интереса, ибо на практике можно суммировать только конечное и то не слишком большое число членов; решение указанного теоретического вопроса совершенно не позволяет судить о практической пригодности ряда: из сходимости ряда никоим образом нельзя заключать, что его первые члены выражают сумму ряда хотя бы с самым грубым приближением; точно так же, как и, обратно, несколько первых членов расходящегося ряда могут быть весьма пригодными для практического выражения функции. Я нахожу нужным особенно подчеркнуть это, так как тот, кто знаком только с таким обычным изложением, и хочет затем, выполняя физический практикум (общий курс измерительных опытов по физике), на деле применить конечные тригонометрические ряды, обыкновенно вводит сам себя в заблуждение такими ложными заключениями.

Еще поразительнее покажется это пренебрежение конечными тригонометрическими рядами, если вспомним, что их уже с давних пор подвергали самостоятельному изучению. Основы этого изучения дал астроном Бессель еще в 1815 г. Впрочем, те формулы, о которых здесь идет речь, в сущности совпадают с теми, которые встречаются при обычных

доказательствах сходимости, но только те идеи, которые мы с ними соединяем, приобретают здесь иную окраску и облегчают практическое пользование этими вещами.

Величина погрешности. Теперь я перейду к ближайшему рассмотрению нашей темы и начну с вопроса о наиболее целесообразном определении коэффициентов а, b при данном числе членов п. Для этой цели уже Бессель выработал одну идею, примыкающую к методу наименьших квадратов. Погрешность, которую мы совершаем, заменяя значение функции f(x) в точке х суммой 2/г+ 1 тригонометрических функций — обозначим ее через S{x),— равна f(x)—S(x)\ мерой пригодности изображения функции f(x) на всем отрезке 0 ^ х ^ 2я, составляющем один период, может служить сумма квадратов всех ошибок, т. е. интеграл135)

Наиболее целесообразное приближение значений функции f(x) даст, следовательно, та сумма S(x), для которой этот интеграл / получает наименьшее значение; на основании этого требования Бессель определил значение всех 2п+ I коэффициентов ао, Ль •••» ап, bu Ьь &л. В самом деле, необходимые условия минимума интеграла / как функции наших 2п + 1 величин выражаются такими уравнениями:

(2)

Так как / представляет собой квадратичную, существенно положительную функцию переменных а0, ... ..., &п, то нетрудно видеть, что те значения этих переменных, которые получаются из уравнений (2), в самом деле дают для / минимум.

Если выполнить дифференцирование под знаком интеграла136), то уравнения (2) примут такой вид:

(2)

Но интегралы от произведений функции Sn(x) на косинус или синус можно значительно упростить. Действительно, при V = 0,1, ..., п находим

Согласно известным свойствам интегралов от тригонометрических функций все члены справа равны нулю, кроме члена с индексом v, содержащего косинус, который имеет, как известно, значение я; таким образом137),

Эта формула справедлива и при v = 0 благодаря тому, что мы присоединили множитель у к коэффициенту ас. Таким же образом находим далее, что

Эти простые соотношения показывают, что каждое из уравнений (2') содержит только одно из 2п + 1 неизвестных; поэтому мы можем сразу написать значения этих неизвестных:

(3)

Во всем дальнейшем мы будем считать, что коэффициенты Sn(x) имеют эти именно значения; тогда / действительно получит свое наименьшее значение, которое равно138)

Весьма важно отметить то, что полученные таким образом значения коэффициентов совершенно не зависят от общего числа п членов ряда; даже, более того, коэффициент при cosv* или sin va: сохраняет одно и то же значение независимо от того, применяют ли для приближенного вычисления функции f(x) по тому же самому принципу один только этот член или же в соединении с любыми другими членами. Если бы, например, мы захотели возможно ближе подойти к значениям функции f(x) с помощью одного только члена с косинусом: avcosv;c, так что должно было бы быть

то и в таком случае мы получили бы для gv как раз написанное выше значение. Благодаря этому указанный метод приближения оказывается особенно удобным на практике. Если бы мы пожелали, например, приближенно изобразить функцию, ход изменения которой похож на ход изменения синуса, с помощью одной только функции sin X и затем увидели, что это приближение недостаточно точно, то мы могли бы присоединить еще сколько угодно членов в виде слагаемых— на основании того же принципа наименьшей суммы квадратов ошибок, — не изменяя величины уже найденного первого члена.

Сходимость бесконечных рядов. Теперь мне предстоит показать вам, насколько суммы Sn(x)t определенные указанным образом, приближаются в отдельных случаях к данной функции f(x). Но мне представляется весьма целесообразным предпослать такому исследованию естественнонаучный экспериментальный метод, а именно, построить для нескольких конкретных случаев графическое изображение приближенных кривых Sn(x). Это дает живое представление о сути дела и вызывает даже у людей, не имеющих специальной склонности к математике, интерес и потребность в математическом образовании.

1. Наиболее простые функции, для которых имеют смысл наши интегралы, служащие для определения коэффициентов, мы получим, составляя графики из прямолинейных отрезков. Пусть, например, график функции f(x) идет от 0 до ^ по прямой под углом 45° вверх, затем под таким же углом опускается вниз до точки с абсциссой л:= и, наконец, снова под углом в 45° поднимается вверх до точки х = 2я; далее функция повторяет этот период (0, 2л) (рис. 84). Если будем вычислять соответствующие коэффициенты, то увидим, что все av = 0, так как f (х)— нечетная функция, и вследствие этого остаются только члены с синусами; получается такой ряд:

На рис. 84 представлен ход кривых, изображающих сумму одного и двух первых членов. Они

примыкают все ближе и ближе к данной кривой у=* = /(*), причем число точек пересечения их с этой кривой постоянно возрастает. Особенно замечательно то, как эти приближенные кривые все больше и больше вдвигаются в углы, образуемые графиком функции f(x) в точках с абсциссами у, хотя сами они как аналитические функции не могут образовывать углов.

2. Пусть линия f(x) от 0 до я поднимается вверх под углом в 45° по прямой линии, затем делает внезапный скачок вниз до значения —я и потом снова поднимается вверх под углом в 45° до х = 2п; таким образом, график состоит из ряда параллельных прямолинейных отрезков, проходящих через точки х = О, 2я, 4я, ... оси X (рис. 85). Вставляя в местах разрыва по вертикальному отрезку, соединяющему оба конца наклонных отрезков, мы изобразим нашу разрывную функцию посредством непрерывной линии, напоминающей те штрихи, которые все вы делали в начале обучения письму. Это — опять нечетная функция, так что все члены с косинусами выпадают, и разложение в ряд имеет такой вид:

На рис. 85 изображены суммы первых двух, трех, четырех членов; и в данном случае особенно замечательно то, что они как бы стремятся подражать разрывам функции f(x), проходя, например, через нулевое значение при х = я все более крутым падением.

Рис 84

3. В качестве последнего примера возьмем кривую, которая для 0<*<у равна у, для *^-^у равна нулю и для -у-^х^2я равна — у, а дальше периодически принимает такие же значения. Вставляя, как и раньше, вертикальные отрезки в местах разрыва, мы получим крючкообразную линию. И в данном случае только члены с синусами отличны от нуля, ибо функция нечетная, а именно,

Здесь закон для коэффициентов не столь прост, как в предыдущих случаях, и соответственно этому переход от одной приближенной кривой к другой (на рис. 86 изображены кривые для сумм из 3, 5 и 6 членов) не так ясен, как в прежних примерах.

Перейдем теперь к вопросу о том, как велика вообще та ошибка при определенном значении jc, которую мы совершаем, заменяя f(x) суммой Sn(x)\ до сих пор мы интересовались только интегралом от этой

Рис. 85

ошибки, взятым по всему интервалу. Теперь для отличия от абсциссы Х, которую мы считаем постоянной, будем обозначать переменную интегрирования в выражениях (3) для коэффициентов aVt bv через g. Тогда наша конечная сумма (1) примет такой вид:

или же, соединяя каждые два слагаемых, стоящие одно под другим, в один член:

Ряд, стоящий в скобках, нетрудно суммировать; удобнее всего, пожалуй, сделать это, переходя к комплексной показательной функции.

В результате — в детали я не могу здесь входить — получается следующее выражение, если воспользо-

Рис. 86

ваться тем, что в силу периодичности подынтегральной функции за пределы интегрирования можно принять —я и +я:

Чтобы получить представление о величине этого интеграла, построим сперва кривые

для отрезка х — я^£^л' + я оси g; они, очевидно, похожи на ветви гиперболы. Между этими ветвями совершает колебания кривая

причем тем чаще, чем больше п. При g = х она принимает значение, возрастающее одновременно с п и равное г\ = 2п^ 1 . Если положить для простоты

представит площадь, ограниченную кривой т] и осью g (на рис. 87 заштрихованная часть). Но обладая хотя бы в некоторой степени чувством непрерывности, легко убедиться в том, что при достаточно большом значении п как справа, так и слева площади, соответствующие отдельным колебаниям, которые попеременно положительны и отрицательны, должны друг друга компенсировать, так что остается только площадь очень высокого и узкого среднего куска; последний же, как нетрудно видеть, при возрастании п переходит как раз в значение f{x)=l. Совершенно так же в общем обстоит дело, когда f(x) представляет собой любую не слишком разрывную функцию, но непременно непрерывную при х = %.

Такие же точно соображения, выраженные в более строгой форме, лежат в основании доказательства

сходимости бесконечных тригонометрических рядов, которое Дирихле впервые опубликовал в 1829 г. В настоящее время это доказательство приводится в большинстве учебников, так что мне не приходится здесь на нем останавливаться. Я должен лишь назвать те условия, которым должна удовлетворять функция f(x), чтобы ее можно было представить в виде бесконечного тригонометрического ряда. Предположим снова, что функция f(x) задана на отрезке 0 ^ х ^ 2л и затем продолжается периодически. Дирихле делает следующие допущения, называемые теперь просто условиями Дирихле:

a) функция f{x) непрерывна целыми отрезками, т. е. в интервале (0,2я) функция имеет только конечное число разрывов;

b) функция f(x) монотонна целыми отрезками, т. е. весь интервал (0,2я) можно разбить на конечное число таких более мелких интервалов, что в каждом из них f(x) либо не возрастает, либо не убывает,— другими словами, f(x) обладает лишь конечным числом максимумов и минимумов. Поэтому приходится исключить такие, например, функции, как sin-j. для которой в окрестности точки х = 0 скопляется бесконечное число экстремумов.

При соблюдении этих условий, как показывает Дирихле, бесконечный тригонометрический ряд точно

Рис. 87

представляет значение функции f(x) во всех точках х, в которых последняя непрерывна:

Но далее Дирихле показывает, что и в точках разрыва этот ряд сходится, а именно, сумма его при этих значениях X равна среднему арифметическому тех значений, которые принимает f(x), если приближаться справа и слева к точке разрыва, или, как принято писать,

На рис. 88 отмечены такие точки разрыва и те значения, о которых идет речь.

Упомянутые условия Дирихле, накладываемые на функцию f{x), только достаточны, но ни в коем случае не являются необходимыми для того, чтобы f(x) была представлена тригонометрическим рядом S(x). Но, с другой стороны, недостаточно предполагать только непрерывность функции f(x); можно построить непрерывные функции, у которых бесчисленное множество колебаний столь сильно сгущено, что ряд S(x) расходится.

Явление Гиббса. После этих — скорее теоретических— замечаний я хочу сказать несколько слов о практической стороне тригонометрических рядов.

Построены специальные механические аппараты для вычисления коэффициентов тригонометрических рядов, так называемые гармонические анализаторы. Это название объясняется тем значением, которое, как известно, имеет разложение данной функции у = f(x) в тригонометрический ряд в акустике; оно в точности соответствует разложению любого тона y = f(x) (где X означает время, а у — амплитуду колебаний, соответствующую данному тону) на «чистые тона», т. е. на чистые косинусоидальные и синусоидальные колебания. Майкельсон в Чикаго и Стреттон построили

Рис. 88

аппарат, позволяющий вычислить даже 160 коэффициентов (v = 1, 2, 80). Этот аппарат позволяет, и обратно, суммировать данный тригонометрический ряд из 160 членов, — другими словами, по данным коэффициентам восстановить функцию f(x)\ конечно, эта задача тоже имеет громадное практическое значение.

Аппарат Майкельсона — Стреттона впервые обратил внимание на одно интересное явление, собственно говоря, совершенно элементарного характера; приходится удивляться тому, что до тех пор оно оставалось незамеченным. Впервые заговорил о нем Гиббс в 1899 г., и поэтому его и называют явлением Гиббса. Позвольте мне сказать о нем несколько слов. По теореме Дирихле значение бесконечного тригонометрического ряда при определенном значении х равно

так, во втором из наших примеров— чтобы иметь в виду конкретный случай — сумма ряда в этом смысле слова представляет функцию, изображенную на рис. 89 с изолированными точками для X = я, Зя, .,.

Но раньше мы смотрели на тригонометрическое приближение иначе, чем Дирихле, который оставляет величину х постоянной и заставляет п возрастать до бесконечности. Мы, напротив, оставляли значение п постоянным и рассматривали Sn(x) при переменном х и таким образом строили последовательные приближенные кривые S\(x) S?(x), Sz(x), ... Вопрос заключается в следующем: что станет с этими кривыми, если п будет возрастать до бесконечности? Или, выражаясь арифметически, вокруг каких значений сгущаются139) значения Sn(x), когда п при переменном X стремится к бесконечности? Ясно, что теперь предельная функция не содержит более изолированных точек, как прежде, т. е. у Дирихле; напротив, мы должны получить сплошную линию. На первый взгляд представляется вероятным, что эта кривая будет состоять как раз из непрерывных ветвей кривой у = = f(x) и из вертикальных отрезков, соединяющих

Рис. 89

значения /(х + 0) и f(x — 0) в местах разрыва; в упомянутом примере это была бы линия, напоминающая готическую букву «m» (рис. 85). На самом же деле оказывается, что вертикальный отрезок предельной кривой всегда несколько выходит вверх и вниз за пределы значений f(x -f 0) и f(x — 0) на конечную длину, так что эта кривая имеет замечательный вид, представленный на рис. 90. Эти добавочные хвостики впервые были замечены у кривых, построенных аппаратом Майкельсона, так что они обнаружены именно экспериментальным путем. Вначале их, конечно, приписывали несовершенству аппарата, пока Гиббс не выяснил необходимость их появления. Если через D обозначить величину скачка (\f(x + 0)—f(x — 0)|), то, как показал Гиббс, удлинение должно равняться

Что касается обоснования такого утверждения, то достаточно дать его для одной какой-нибудь разрывной функции, — скажем, для функции, которой мы воспользовались в качестве примера, — так как все другие функции с таким же скачком должны получиться из нее посредством прибавления соответственных непрерывных функций. А для этого случая доказательство не особенно трудно; оно получается из рассмотрения интегральной формулы для Sn(x) (с. 281). С другой стороны, можно вполне отчетливо проследить по наброску приближенных кривых (рис. 85), каким образом возникает острие Гиббса.

Я зашел бы слишком далеко, если бы стал входить здесь в дальнейшие, хотя крайне интересные подробности хода приближенных кривых.

На этом я закончу специальные замечания относительно тригонометрических рядов, чтобы присоединить к ним отступление, посвященное общему понятию функции, которое и по существу дела, и исторически очень тесно сюда примыкает.

Рис. 90

D. Общее понятие функции. Мы должны заняться в нашем курсе этим вопросом, тем более, что ведь наша школьная реформа по самому существу своему стоит под девизом выделения на первый план в школьном обучении этого столь важного понятия.

Сначала мы проследим историю развития этого понятия. Прежде всего заметим, что у более старых авторов, каковы Лейбниц и Бернулли, понятие функции встречается всегда лишь в применении к отдельным примерам, к степеням, к тригонометрическим функциям и т. п. Общие формулировки встречаются впервые только в XVIII в.

1. У Эйлера около 1750 г. мы находим два различных определения слова «функция»:

а) В своем «Introduction» он называет функцией всякое аналитическое выражение, содержащее х, т. е. всякое выражение, составленное из степеней, логарифмов, тригонометрических функций и т. д. Впрочем, он уже делает обычное подразделение функций на алгебраические и на трансцендентные.

b) Наряду с этим мы встречаем у него случаи, когда функция у(х) определяется тем, что в плоскости координат ху начерчена кривая просто от руки «libéra manu ducta» (рис. 91).

Рис. 91

2. Лагранж в своей «Théorie des fonctions analytiques» (около 1800 г.) сильно ограничивает понятие функции, сводя его к так называемым аналитическим функциям, определяемым посредством степенного ряда относительно х. Мы сохранили до сих пор этот термин «аналитическая функция», хотя, конечно, хорошо знаем, что здесь идет речь только об одном специальном классе функций из числа тех, которые действительно появляются в анализе. Степенным рядом

функция определяется только внутри области сходимости, т. е. в некоторой окрестности значения х = 0. Но вскоре был найден способ расширения области, в которой функция определена, за пределы первоначального круга сходимости: если, например, значение

х\ лежит внутри (рис. 92) области сходимости ряда Я и если преобразовать этот ряд в другой степенной ряд, расположенный по степеням х — Х\:

y = 9ty (x — xj,

то может случиться, что область сходимости последнего ряда выйдет за пределы области сходимости первого ряда, так что у окажется определенным в более обширной области; повторяя тот же прием, можно иногда эту область расширить еще дальше. Этот процесс аналитического продолжения хорошо известен всякому, кто хоть немного занимался теорией комплексных функций.

Обратите внимание в особенности на то обстоятельство, что все коэффициенты степенного ряда Я(лс), а следовательно, и сама функция у будут вполне определены, если будут известны значения функции у вдоль какого-нибудь отрезка оси х сколь угодно малой длины, например в окрестности точки х = 0; действительно, тогда будут известны значения всех производных функции у при X = 0 и коэффициенты можно определить с помощью формул

Таким образом, самый маленький отрезок функции, аналитической в смысле определения Лагранжа, вполне ее определяет на всем ее протяжении. Это свойство находится в полном противоречии со свойствами функции в смысле второго определения Эйлера: всякий отрезок такой функции молено продолжить произвольным образом.

3. Имея в виду дальнейшее развитие понятия функции, я должен назвать теперь Фурье —одного из многочисленных выдающихся математиков, живших в Париже в начале XIX в. Его главный труд—«Аналитическая теория теплоты» (Théorie analytique de la chaleur)—появился в 1822 г.; первое сообщение о содержащихся в нем теориях Фурье сделал Парижской Академии уже в 1807 г. Это произведение является источником всех тех методов современной

Рис. 92

математической физики, которые можно охарактеризовать сведением проблем к интегрированию дифференциальных уравнений с частными производными при заданных значениях на границах. Сам Фурье занимается специально вопросом о теплопроводности, который в простейшем случае состоит в следующем: край плоской круглой пластинки поддерживается при определенной температуре, например, одна часть края при температуре таяния льда, другая — при температуре кипения воды (рис. 93); спрашивается, какое установится стационарное распределение температур вследствие распространения теплоты в пластинке? Таким образом, здесь играют роль значения на границах, которые можно по краю пластинки задавать совершенно произвольно, причем в одной части совершенно независимо от другой; поэтому здесь на первый план выступает второе определение функции Эйлера, а не определение Лагранжа.

4. Это же самое эйлерово определение принимает, в сущности, и Дирихле в упомянутых выше работах, но только он его переводит на язык анализа или, как говорят теперь, арифметизует его. И это действительно представляется необходимым, ибо никакая кривая, как бы тонко она ни была вычерчена, никогда не даст точного определения соответствия значений х и у по той причине, что толщина черты не позволяет произвести арифметически точное измерение нужных значений.

Дирихле формулирует арифметическое содержание эйлерова определения следующим образом: «Если в некотором промежутке каждому отдельному значению X отнесено одно определенное значение у, то переменная у называется функцией от х». Владея, таким образом, этим наиболее общим понятием функции, Дирихле все же всякий раз имеет в виду, следуя всеми принятому обычаю, прежде всего непрерывные или не слишком разрывные функции. Если в ту пору и считали вполне возможным сложные сгущения точек разрыва, то едва ли предполагали, что такие случаи могут представить интерес для изучения. Эта точка

Рис. 93

зрения находит свое отражение и в том, что Дирихле всегда говорит о разложении в ряд «вполне произвольных функций», а между тем он очень точно формулирует свои «условия Дирихле», которым эти функции должны удовлетворять.

5. Теперь мы должны принять во внимание, что около 1830 г. начинается более общая разработка теории функций комплексной переменной, которая становится постепенно, приблизительно в течение последующих трех десятилетий, общим достоянием математиков. Это развитие связано, прежде всего, с именами Коши, Римана и Вейерштрасса: первые два исходят, как известно, из дифференциальных уравнений в частных производных, названных их именами (этим уравнениям удовлетворяют действительная и мнимая части и, V комплексной функции f(x + iy) = и + iv)t между тем как Вейерштрасс определяет функцию степенным рядом и совокупностью его аналитических продолжений, примыкая этим в известной степени к Лагранжу.

И вот оказывается, что этот переход в область комплексных величин привел к сопоставлению и объединению обеих рассмотренных выше точек зрения на функцию; я остановлюсь на этом несколько подробнее.

Положим z = x + iy и будем рассматривать степенной ряд

f (z) = и + iv = cQ+ c{z + c2z2 + ...;

предположим, что этот ряд сходится при небольших значениях г, определяя собой, по терминологии Вейерштрасса, элемент аналитической функции. Рассмотрим его значения на небольшой окружности радиуса г с центром в точке г = 0 (рис. 94), лежащей целиком внутри области сходимости; другими словами, подставим вместо z в степенной ряд величину х + iy = /*(coscp -f--f-/sincp):

Рис. 94

Если разложим коэффициенты на их действительные и мнимые части:

то для действительной части функции / найдем такое выражение:

Мы преднамеренно взяли чисто мнимые части коэффициентов d со знаком минус с тем, чтобы в последнем выражении все знаки были положительными. Таким образом, степенной ряд для f(z) дает выражение действительной части и на нашей окружности как функции угла <р посредством тригонометрического ряда такого рода, как мы рассматривали выше, с коэффициентами <х0, rvav, rvßv. Обратно, этот тригонометрический ряд вполне определяет собой все величины ао, ai, ßi, ß2, а следовательно, и степенной ряд, не считая постоянного слагаемого--~.

Если задано какое-либо распределение значений и(<р) по окружности, лишь бы его удалось представить в виде тригонометрического ряда, — если, другими словами, задана функция в смысле Дирихле, удовлетворяющая условиям Дирихле, — то ей можно указанным образом отнести определенный степенной ряд, сходящийся внутри взятой окружности радиуса г, т. е. определенную аналитическую функцию, действительная часть которой принимает на этой окружности заданные значения и(у). Мы видим, что в этом порядке идей понятие функции в смысле Фурье — Дирихле вполне совпадает с определением Лагранжа; только та произвольность, которая имеет место по отношению к ходу изменения тригонометрического ряда и(<р) вдоль окружности, степенным рядом вполне концентрируется в ближайшей окрестности центра окружности.

6. Но современная наука не остановилась, конечно, на образовании этих понятий, ибо наука как таковая никогда не знает отдыха, и только тот или другой исследователь может прийти в изнеможение. А имен-

но, в противоположность той точке зрения, которую я охарактеризовал выше как точку зрения Дирихле, в последние три десятилетия при изучении действительных функций стали интересоваться различными функциями, которые существенно выходят за пределы условий Дирихле. При этом были найдены весьма замечательные типы функций, содержащие «отвратительные скопления» самых неприятных особенностей. Здесь, прежде всего, возникает вопрос о том, чтобы исследовать, в какой мере остаются в силе при наличии таких «уродств» те теоремы, которые имеют место для «приличных» функций.

7. Наконец, сюда же примыкает совершенно новое обобщение понятия функции, идущее еще дальше. До сих пор функцию всегда считали определенной в каждой точке континуума всех действительных или всех комплексных значений х или же, по крайней мере, во всех точках некоторого интервала или области. Но с тех пор, как все более и более стало выступать на первый план созданное Г. Кантором понятие множества, согласно которому континуум всех х представляет лишь пример «множества», — с этих пор стали рассматривать и такие функции, которые определены только для значений х из какого-либо множества, и стали вообще называть у функцией аргумента х> если всякому элементу одного множества объектов (чисел или точек) х соответствует определенный элемент другого множества у.

Я хочу здесь же отметить одно отличие этих новых представлений от прежних: понятия, выясненные в пп. 1—5, возникли и развились, главным образом, ввиду их приложений к изучению природы: достаточно вспомнить заглавие сочинения Фурье! Наоборот, новейшие исследования, упомянутые в пп. 6 и 7, представляют собой продукты чисто математической потребности исследования, которая не имеет вовсе в виду нужд естествознания; действительно, до сих пор эти исследования не нашли еще прямого применения. Конечно, оптимист должен полагать, что еще придет, несомненно, время для таких приложений.

Но поставим снова свой обычный вопрос о том, что из всего этого должна воспринять школа, что должен знать о них учитель и что должны знать ученики.

Прежде всего, если школа несколько, скажем, на три десятилетия, отстает от новейших успехов нашей науки, если обнаруживается, так сказать, известный гистерезис, то это вполне естественно и отнюдь не нуждается в оправдании. Но в действительности имеет место гораздо более продолжительный гистерезис, обнимающий более столетия: ведь школа большей частью игнорирует все развитие науки, имевшее место после Эйлера; таким образом, для работы реформаторов остается еще весьма обширное поле. То, чего мы требуем от реформы, представляется весьма скромным, если сравнить наши требования с современным состоянием науки: мы хотим, чтобы общее понятие функции в смысле того и другого определения Эйлера проникло как фермент во все преподавание математики в средней школе; по его надо вводить не в форме абстрактного определения, а на конкретных примерах, которые в большом числе имеются уже у Эйлера, чтобы сделать это понятие живым достоянием ученика. Что же касается преподавателей математики, то, конечно, желательно, чтобы они, помимо того, были знакомы с элементами теории комплексных функций. Хотя и нельзя требовать того же по отношению к новейшим концепциям учения о множествах, но все же желательно, чтобы среди многочисленных учителей нашлось хотя бы небольшое число самостоятельно работающих людей, которые занялись бы и этими вещами.

Историческое значение тригонометрических рядов Фурье. К сказанному я хотел бы добавить несколько слов о том, какую важную роль сыграло учение о тригонометрических рядах во всей этой эволюции понятий.

Первым пришел к изображению произвольных функций посредством тригонометрических рядов Даниил Бернулли, сын Иоганна Бернулли. Изучая (около 1750 г.) акустическую проблему о колебаниях струны, он заметил, что можно получить самый общий вид колебаний струны посредством наложения синусоидальных колебаний, соответствующих основному тону и чистым обертонам, а из этого вытекает возможность разложить функцию, изображающую форму струны, в тригонометрический ряд.

Хотя в деле ознакомления с этими рядами вскоре были сделаны значительные успехи, однако никто не хотел верить, что с помощью таких рядов можно представить любые функции, заданные графически. Это можно объяснить неясностью представления о такого рода соображениях, какие теперь в учении о множествах стали совершенно тривиальными. По-видимому, принимали a priori, — не умея, конечно, выразить это точно, — что множество всех произвольных непрерывных функций обширнее множества всех возможных систем числовых значений а0, au #2, Ь\% Ь2, ...*), которые соответствуют совокупности всех тригонометрических рядов.

Но точные логические построения современной теории множеств пролили свет на эти вопросы и обнаружили ложность указанного предрассудка. Позвольте мне подробнее остановиться на этом важном вопросе. Легко видеть, что непрерывная функция, определенная произвольным образом в некотором uнтервале, например (0, 2я), будет задана на всем се протяжении, если будут заданы ее значения во всех рациональных точках этого интервала. Действительно, ввиду того что эти значения во всяком промежутке образуют всюду плотное множество, то ко всякому иррациональному значению х можно подойти сколь угодно близко с помощью (рис. 95) рациональных значений, и в силу непрерывности функции значение ее f(x) должно равняться пределу значении в этих бесконечно близких рациональных точках. Далее, как известно, множество всех рациональных чисел «счетное», другими словами, его можно расположить в такой ряд, что в нем за определенным первым элементом следует определенный второй, за ним третий и т. д. А из этого следует, что задать произвольную непрерывную функцию значит задать счетное множе-

Рис. 95

*) Каждая комбинация а0, аи аг, .... Ьи Ь2, ... определяет тригонометрический ряд, если рассматривать эти числа как его коэффициенты.

ство констант — значений функции в расположенных таким образом рациональных точках. Точно таким же образом посредством счетного множества постоянных ßo, au bu я2, 62, ... может быть задан определенный тригонометрический ряд. Таким образом мнение, будто множество всех непрерывных функций по самой своей природе существенно обширнее множества рядов, оказывается лишенным всякого основания. Ниже мы снова займемся этим вопросом более обстоятельно.

Фурье первый отрешился от такого предвзятого мнения, и в этом заключается его громадное значение в истории тригонометрических рядов. Хотя он и не дал приведенного выше объяснения в духе учения о множествах, но он первый имел мужество уверовать в способность тригонометрических рядов изображать произвольные функции; руководствуясь этой верой, он действительно вычислил несколько характерных примеров разрывных функций (подобных тем, которые мы рассмотрели выше) и тем поставил вне сомнений правильность своего убеждения. Общие доказательства сходимости дал впервые, как я уже говорил, Дирихле, ученик Фурье. Выступление Фурье было настоящей революцией; чтобы посредством рядов из аналитических функций можно было изобразить произвольные функции, подчиненные в различных частях рассматриваемого промежутка различным аналитическим законам, представлялось тогдашним математикам чем-то совершенно новым и неожиданным. В благодарность за открытие этой истины тригонометрические ряды назвали именем Фурье, которое, действительно, пользуется широким распространением. Конечно, всякое такое присвоение собственных имен к научной терминологии всегда представляет значительную односторонность, если не прямую несправедливость.

В заключение я должен, хотя бы вкратце, упомянуть о второй заслуге Фурье. Он рассматривал также и предельный случай тригонометрических рядов, который возникает, если период изображаемой функции возрастает до бесконечности, а так как функция с бесконечно большим периодом представляет попросту непериодическую функцию, произвольно заданную вдоль всей оси х, то это дает средство изображать

и непериодические функции. Чтобы выполнить этот переход, сначала находят посредством линейного преобразования аргумента ряда изображение функций с любым периодом I вместо фиксированного периода 2я, а затем заставляют I возрастать до бесконечности. При этом ряд переходит в так называемый интеграл Фурье:

где <p(v), *ф (v ) выражаются определенным образом через интегралы от функции f(x), взятые от —оо до +00. Таким образом, различие заключается в том, что теперь индекс v изменяется непрерывно от О до оо, тогда как раньше он принимал только значения 0, 1, 2, 3, и что вместо коэффициентов av, ôv стоят теперь cp(v)dv и \|)(v)dv.

На этом мы можем расстаться с элементарными трансцендентными функциями, которыми мы до сих пор занимались в разделе, посвященном анализу, и перейти к рассмотрению исчисления бесконечно малых в собственном смысле слова.

III. ИСЧИСЛЕНИЕ БЕСКОНЕЧНО МАЛЫХ В СОБСТВЕННОМ СМЫСЛЕ СЛОВА

Конечно, я предполагаю, что все вы умеете дифференцировать и интегрировать и не раз применяли это умение. Эту главу мы посвятим только вопросам общего характера, как например, вопросам о логическом и психологическом обосновании, вопросам о преподавании и т. д.

1. Общие замечания относительно исчисления бесконечно малых

Я хотел бы предпослать замечание общего характера относительно предмета математики. Вы можете часто услышать от нематематиков, в особенности от философов, что математика занимается исключительно выводами логических следствий из ясно заданных посылок, причем совершенно безразлично, что именно означают эти посылки, истинны ли они или ложны —

лишь бы только они не противоречили друг другу. Совершенно иначе смотрит на дело всякий, кто сам продуктивно занимается математикой. В действительности люди, мнение которых было приведено выше, судят исключительно по той выкристаллизованной форме, в какой принято излагать готовые математические теории, но исследователь работает в математике, как и во всякой другой науке, совершенно иначе: он существенно пользуется своей фантазией и продвигается вперед индуктивно, опираясь на эвристические вспомогательные средства. Можно привести немало примеров того, как великие математики находили самые важные теоремы, не будучи в состоянии строго их доказать. Неужели допустимо не ценить такое великое творчество, неужели надо в угоду приведенному выше определению математики сказать, что все это не математика и что только те позднейшие математики, которые нашли, наконец, вылощенные доказательства теорем, — только они одни двигали математику? Конечно, присвоить ли слову то или иное значение — вещь условная, но при оценке заслуг научных работников приходится сказать, что индуктивная работа того, кто впервые нашел какое-нибудь предложение, имеет, конечно, такую же ценность, как и дедуктивная работа того, кто его впервые доказал, ибо то и другое одинаково необходимо.

Как раз при изобретении и первоначальной разработке исчисления бесконечно малых это индуктивное творчество, не основанное на связных логических выводах, сыграло большую роль; при этом весьма часто самым действительным эвристическим средством являлось чувственное восприятие — я имею в виду непосредственное чувственное восприятие со всеми его неточностями, например, восприятие, при котором кривая представляется действительной чертой определенной толщины, а не тем абстрактным воззрением, которое постулирует как нечто заранее выполненное предельный переход к совершенно тонкой одномерной линии. Я хочу в подтверждение этого изложить в кратких чертах, как исторически возникали идеи исчисления бесконечно малых.

Обращаясь прежде всего к понятию интеграла, приходится заметить, что оно исторически возникло в связи с проблемой измерения площадей и объемов

(квадратура и кубатура). Как известно, абстрактное логическое определение интеграла ^ f(x)dx, т. е. площади140) фигуры, ограниченной кривой # = /(*), осью X и ординатами х = а и х = 6, заключается в том, что это есть предел суммы площадей узких прямоугольников, вписанных в эту фигуру, когда число их беспредельно возрастает, а ширина одновременно неограниченно убывает (рис. 96). Но с точки зрения чувственного восприятия представляется естественным определить рассматриваемую площадь не как точный предел, а просто как сумму очень большого числа довольно узких прямоугольников, ибо и без того дальнейшему уменьшению прямоугольников всегда положит конец неизбежная неточность чертежа.

С такими наивными представлениями мы, действительно, встречаемся у самых выдающихся математиков в период возникновения исчисления бесконечно малых. Прежде всего я назову Кеплера, который занимался вопросом об измерении объемов в своей книге*). Главный интерес для Кеплера представляет измерение объемов бочек и их наиболее целесообразная форма. При этом он становится целиком на только что отмеченную наивную точку зрения: он представляет себе бочку состоящей из большого числа тонких листов, например из бумаги, и считает объем бочки равным сумме объемов этих листов (рис. 97), каждый из которых представляет собой цилиндр. Подобным же образом поступает он и при вычислении объемов простых геометрических тел, например шара. Последний Кеплер рассматривает как образованный

Рис. 96 Рис. 97 Рис. 98

*) Kepler I. Nova stereometria doliorum vinariorum. — Lincii, 1615. [Русский перевод: Кеплер И. Новая стереометрия винных бочек. — М.; Л.: ОНТИ, 1935.1

из очень большого числа (рис. 98) небольших пирамидок с вершиной в центре шара; поэтому весь объем шара равен по известной формуле для пирамид произведению у на сумму всех оснований пирамидок.

Полагая последнюю сумму равной площади поверхности шара, т. е. 4яг2, Кеплер получает для объема правильную формулу . Впрочем, Кеплер подчеркивает практическое, эвристическое значение таких рассуждений, а относительно строгих математических доказательств отсылает к сложным рассуждениям Архимеда (метод исчерпания).

Подобные же рассуждения встречаются в книге иезуита Бонавентуры Кавальери «Геометрия неделимых»*), в которой он устанавливает принцип, носящий теперь его имя: объемы двух тел равны, если равны площади сечений, проведенных в обоих телах на одинаковой высоте. Об этом принципе Кавальери очень много, как известно, говорят у нас в школе, думая с его помощью избегнуть интегрального исчисления, тогда как в действительности этот метод вполне принадлежит интегральному исчислению. Обоснование, которое дает Кавальери, сводится к тому, что он представляет себе оба тела построенными из тонких листков, наложенных друг на друга и, по предположению, попарно конгруэнтных между собой. Другими словами, одно тело может быть получено из другого посредством сдвига отдельных листков (рис. 99); при этом, конечно, объем тела не может измениться, так как он состоит из одних и тех же слагаемых и до, и после этого процесса.

Подобным же образом наивное воззрение приводит к понятию производной функции, т. е. к понятию касательной к кривой. Для этого заменяем — так действительно и поступали — кривую линию ломаной, вершинами которой служит достаточно большое число

Рис. 99

*) Cavalieri В. Geometrla indivisibilibus continuorum.— Bologna, 1653. Подробнее см. на с. 305. [Русский перевод: Кавальери Б. Геометрия. — T. I. Основы учения о неделимых. — М.; Л.: Гостехиздат, 1940.]

точек, густо расположенных на кривой. В силу природы нашего чувственного восприятия на большом расстоянии едва ли возможно отличить кривую от такой вереницы точек и тем более от самой ломаной. Но в таком случае касательную к кривой приходится определить просто как прямую, соединяющую две точки, непосредственно следующие одна за другой (рис. 100), т. е. как продолжение одного из звеньев ломаной. С абстрактно-логической точки зрения такая прямая, конечно, всегда — как бы близко ни лежали соседние точки — остается только секущей по отношению к кривой, а касательная является тем предельным положением, к которому эта секущая неограниченно приближается при уменьшении расстояния между точками. Аналогично этому, под кругом кривизны с этой наивной точки зрения надо понимать круг, проходящий через три последовательные вершины ломаной, между тем как, выражаясь точно, надо сказать, что круг кривизны есть предельное положение такого круга при неограниченном сближении трех точек.

Убедительность такого рода наивных рассуждений представляется, конечно, различным лицам весьма различной. Многие—к ним принадлежу и я сам — чувствуют себя в высшей степени ими удовлетворенными. Другие же, будучи односторонне расположены к чисто логической стороне, находят, что такие соображения ничего не говорят, и не могут согласиться с тем, чтобы на них можно было вообще смотреть как на основание для математических рассуждений.

С другой стороны, такие наивные приемы мышления и в настоящее время очень часто применяются всякий раз, когда хотят — в математической физике, в механике, в дифференциальной геометрии — применить какое-нибудь математическое положение; там эти приемы, как все вы знаете, весьма целесообразны. Конечно, чистые математики часто смеются над таким наивным изложением; во время моего студенчества говорили, что для физика дифференциал — это кусок латуни, с которым он обращается, как со своими аппаратами.

Рис. 100

По этому поводу я хочу отметить достоинства обозначений Лейбница, которые теперь господствуют повсюду. Действительно, наряду с целесообразным указанием на наивное воззрение они соединяют также известный намек на тот абстрактный предельный процесс, который действительно в этих понятиях содержится. Так, символ Лейбница для обозначения производной указывает на то, что последняя возникает из частного, но при этом знак d, в отличие от знака конечной разности Д, показывает, что тут внесено и нечто новое, а именно, предельный переход141).

Точно так же символ ^ydx для обозначения интеграла указывает, что последний возникает из суммы малых величин, но при этом обычный знак суммы 2 заменяется стилизованным S (приходится удивляться тому, что не все знают о таком значении знака и это указывает на то, что здесь к суммированию присоединяется новый процесс.

Логическое обоснование исчисления бесконечно малых (Ньютон и его последователи; Коши). Теперь мы должны, наконец, ближе подойти к вопросу о логическом обосновании дифференциального и интегрального исчисления; мы непосредственно приступим к рассмотрению этого вопроса в его историческом развитии.

1. Основная идея заключается — как теперь излагают во всех высших школах, так что мне приходится только в двух словах вам это напомнить, — в том, что исчисление бесконечно малых представляет собой попросту приложение общего понятия предела; производную определяют как предел частного соответственных конечных приращений переменной и функции:

предполагая, что этот предел существует; это ни в коем случае не есть частное, в котором dy и dx имеют самостоятельное значение. Точно так же интеграл определяют как предел суммы:

где àxi обозначает конечные доли промежутка а ^ ^ X ^ 6, a tfi — любые значения функции в них; все Axi должны одновременно стремиться к нулю; но ни в каком случае не следует приписывать реальное значение символу y-dx, например, как слагаемому какой-то суммы. Это обозначение сохранено лишь из вышеуказанных соображений целесообразности.

2. Такое понимание можно найти уже у Ньютона в очень точной форме. Я приведу одно место в его главном произведении «Principia mathematica philosophiae naturalis», вышедшем в 1687 г.*): «Ultimae rationes illae, quibuscum quantitates evanescunt, revera non sunt rationes quantitatum ultimarum, sed limites, ad quos quantitatum sine limite decrescentium rationes semper approprinquant, et quos propius assequi possunt, quam pro data quavis differentia, nonquam vero transgredi neque prius attingere quam quantitates diminuuntur in infinitum» («Эти последние отношения, с достижением которых количества исчезают, в действительности не суть отношения последних количеств, а представляют собою пределы, к которым стремятся отношения постоянно убывающих количеств и к которым они могут подойти ближе чем на любую наперед заданную разность; перейти их или достичь раньше, чем количества бесконечно уменьшатся, они не могут»). Впрочем, Ньютон совершенно избегает в этом сочинении применения исчисления бесконечно малых, хотя он, несомненно, пользовался им при первоначальном выводе своих результатов. Действительно, основное произведение, в котором он развивает свой метод бесконечно малых, Ньютон написал уже в 1671 г., хотя появилось оно впервые лишь в 1736 г. под названием «Метод флюксий и бесконечных рядов» («Methodus fluxiorum et serierum infinitarum»).

В этом произведении Ньютон развивает, не вдаваясь в разъяснения принципиального характера, новое исчисление на многочисленных примерах. При этом он примыкает к одному представлению из повседневной жизни, которое делает весьма понятным пре-

*) Русский перевод акад. А. Н. Крылова: Ньютон И. Математические начала натуральной философии.— Петроград, 1915— 1916. — С. 64—65, а также в книге: Ньютон И. Математические работы. — М.; Л.: ОНТИ, 1937.

дельный переход, а именно, если рассматривать движение x = f{t) вдоль оси X в момент /, то всякий имеет определенное представление о том, что называется скоростью такого движения; если присмотреться ближе, то увидим, что это, в сущности, и есть предел отношения конечных приращений ~. Эту скорость, с которой переменная х изменяется во времени, Ньютон и принимает за основание своих рассуждений как флюксию X переменной х. Он представляет себе, что все переменные х, у зависят от этой первичной переменной, т. е. времени tt так что производная является частным двух флюксий что мы записали бы теперь подробнее так:

3. К этим идеям Ньютона примыкает целый ряд математиков XVIII в., которые с большей или меньшей строгостью строили исчисление бесконечно малых на понятии предела. Я назову лишь несколько имен: Маклорен, написавший «Трактат о флюксиях»*), который в качестве учебника имел обширный круг влияния; затем Даламбер, участвовавший в большой французской «Методической энциклопедии» (Encyklopedie méthodique); далее, Кестнер, живший в Гёттингене, проводил те же идеи в своих лекциях и книгах**). Наконец, и сам Эйлер принадлежит главным образом к этому же направлению, хотя у него, пожалуй, проглядывают уже и другие тенденции.

4. Но во всех этих построениях анализа оставался еще один существенный пробел, без заполнения которого не могло быть и речи о последовательной системе исчисления бесконечно малых; тогда хотя и знали определение производной как предела, но не хватало еще средства для того, чтобы, обратно, по данному значению производной определить величину приращения функции в конечном промежутке. Таким средством является теорема о среднем значении, и великой заслугой Коши является то, что он вполне

*) Maclaurin С. Treatise of fluxions. — Edinburgh, 1742.

**) Kästner G. Anfangsgrunde der Analysis des Unendligen.—Göttingen, 1760.

оценил центральное значение этой теоремы и соответственно этому поставил ее во главе дифференциального исчисления. Поэтому не будет преувеличением, если мы назовем его основателем точного анализа бесконечно малых в современном смысле142). Основное значение имеет в данном отношении его «Résumé des leçons sur le calcul infinitésimal», составленное на основании его лекций в Париже и изданное сначала в 1823 г., а затем в 1829 г. (только первая часть) под заглавием «Leçons sur le calcul différentiel».

Теорема о среднем значении заключается в следующем: если f(x) — непрерывная функция, обладающая во всех точках рассматриваемого интервала производной /'(*), то между х и х + h всегда найдется такое значение i + ÖAf что

В это выражение входит характерная для теорем о средних значениях величина Э, которая начинающему часто на первых порах представляется такой удивительной. В геометрической форме эта теорема представляется весьма наглядной: она утверждает лишь, что на кривой между точками X и X + h всегда найдется такая точка х + 9Л, в которой касательная к кривой параллельна хорде (рис. 101), соединяющей точки х и х + h.

5. Как же доказать строго арифметически теорему о среднем значении, не прибегая к геометрическим представлениям? Такое доказательство должно, конечно, состоять только в том, что доказываемую теорему сводят к абстрактно установленным раньше в самой точной форме арифметическим определениям переменных, функций, непрерывности и тому подобных понятий. В этом смысле вполне строгое доказательство впервые нашли Вейерштрасс и его последователи, которым мы вообще обязаны современным арифметическим представлением о числовом континууме. Я хотел бы отметить здесь лишь характерные моменты этих рассуждений.

Рис. 101

Прежде всего нетрудно свести рассматриваемую теорему к тому случаю, когда секущая, ограничивающая дугу, горизонтальна, т. е. когда f(x) = f(x + ft) (рис. 102); в этом случае требуется показать, что существует точка, в которой касательная горизонтальна. А для этого служит знаменитая теорема Вейерштрасса, согласно которой всякая непрерывная в некотором промежутке143) функция принимает в нем по крайней мере один раз свое наибольшее и наименьшее значение. Хотя бы одно из этих наибольших и наименьших значений должно лежать внутри интервала (jc, x + ft), если исключить тривиальный случай, когда функция равна постоянной величине. Предположим, что это — максимум и что он находится в точке * + 0ft, тогда справа и слева от этой точки f(x) имеет меньшие144) значения; поэтому отношение конечных приращений справа отрицательно, а слева положительно. Следовательно, производную, которая, по предположению, должна существовать в каждой точке, можно представить в точке x + Qh как предел либо только положительных, либо только отрицательных значений в зависимости от того, будем ли мы рассматривать ее как предел отношений конечных разностей слева или как предел таких же отношений справа от рассматриваемой точки. Поэтому производная может равняться только нулю; таким образом, доказаны существование горизонтальной касательной, а тем самым и теорема о среднем значении.

Введение дифференциала (Лейбниц и его последователи). Параллельно с этим направлением, с которым мы теперь познакомились и в духе которого построена современная научная математика, в течение столетий существовало и распространялось другое существенно отличное понимание исчисления бесконечно малых.

1. Оно исходило из старых метафизических спекулятивных соображений о построении числового континуума из неделимых, т. е. неразложимых далее «бесконечно малых» составных частей. Уже в древности имеются намеки на такого рода представления; у схо-

Рис. 102

ластиков и затем у философов-иезуитов они встретили большое сочувствие. Как на характерный пример я укажу на заглавие уже упомянутой книги Кавальери: «Геометрия сплошных величин, состоящих из неделимых», которое указывает на его истинное основное воззрение. Действительно, точка зрения приближенного нахождения величины играет у Кавальери лишь второстепенную роль; он фактически считает пространство состоящим из неделимых, «последних», т. е. неразложимых далее составных частей. Вообще, для полного уяснения этого рода концепции очень важно и интересно быть знакомым с теми изменениями, которые испытало представление о континууме в течение ряда столетий (и даже тысячелетий).

2. К такого же рода воззрениям примыкает и Лейбниц, который разделяет с Ньютоном славу изобретения исчисления бесконечно малых. Для него первичным элементом исчисления бесконечно малых является не производная как предел, а дифференциал dx переменной х, который имеет реальное существование как составная часть оси абсцисс — величина, которая меньше всякой конечной величины и все же не равна нулю (актуально бесконечно малая величина). Аналогично этому дифференциалы высших порядков d2x, d?x, ... определяются как бесконечно малые величины второго, третьего, ... порядков, каждая из которых бесконечно мала по сравнению с предыдущей; таким образом, мы получаем ряд качественно различных систем величин.

Впрочем, у Лейбница это воззрение отнюдь не является единственным; во многих случаях у него выступает на первый план точка зрения приближенного определения величины, согласно которой дифференциал dx представляет собой конечный, но столь малый отрезок, что вдоль него отклонение кривой от касательной совершенно незаметно, неуловимо. Эти метафизические спекуляции представляют собой, разумеется, лишь идеализацию простых психологических фактов, имеющих здесь место.

Совершенно отдельно стоит у Лейбница третий взгляд, который, пожалуй, наиболее для него характерен; это — формальное, аппаратное выражение. Я уже не раз имел случай отметить, что в лице Лейбница мы должны видеть основателя формальной

математики. Идея, о которой идет речь, заключается в следующем: совершенно безразлично, какое именно значение имеют дифференциалы и даже имеют ли они таковое вообще, лишь бы были соответственным образом определены правила действий с ними; в таком случае, если поступать с дифференциалами согласно правилам, то должно, во всяком случае, получиться нечто разумное, правильное. При этом Лейбниц постоянно указывает на аналогию с комплексными числами, о которых у него были представления, вполне соответствующие этому взгляду. Говоря о правилах действий с дифференциалами, мы имеем в виду прежде всего формулу

f(x + dx)-f(x) = f'(x)dx;

теорема о среднем значении показывает, что эта формула будет верна только в том случае, если написать в ней f'(x + Qdx) вместо /'(а:), но содержащаяся здесь ошибка есть бесконечно малая величина высшего (второго) порядка, а на такие величины — и в этом заключается главное формальное правило — не следует обращать внимания при вычислениях с дифференциалами.

Самые важные работы Лейбница опубликованы в 1684, 1695 и 1712 гг. Первая из этих статей «Nova methodus pro maximis et minimis» представляет собой первое вообще печатное произведение, посвященное дифференциальному исчислению; Лейбниц излагает в ней попросту правила дифференцирования. Позднейшие работы дают также разъяснения принципиального характера, в которых особенно заметно выступает формальная точка зрения.

В особенности характерна в этом отношении небольшая работа, напечатанная в 1712 г., т. е. в последние годы жизни Лейбница; в ней Лейбниц говорит о теоремах и определениях: «Rigorem quidem non sustinent, habent tarnen usum magnum in calculando et ad artem inveniendi universalesque conceptus valent» («они не выдерживают строгой критики, но тем не менее находят большое применение в вычислениях и годятся как эвристическое средство и для уяснения общих понятий»). Это Лейбниц относит как к комплексным числам, так и к бесконечности; например, когда мы говорим о бесконечно малом, то «commodi-

tali expressions seu breviloquio mentalis inservimus, sed non nisi toleranter vera loquimur, quae explicatione rigidantur» («пользуемся ими для удобства выражения и для сокращения речи, но высказываем лишь относительные истины, которые укрепляются объяснением»).

3. Начиная с Лейбница, новое исчисление быстро распространяется по континенту, причем каждая из трех его установок находит своих представителей. Прежде всего я должен назвать первое руководство по дифференциальному исчислению, какое только было вообще опубликовано; это «Analyse des infiniment petits pour l'intelligence des courbes» (Париж, 1692) де Лопиталя, одного из учеников Иоганна Бернулли, который, со своей стороны, поразительно быстро перенял новые идеи от Лейбница и выпустил в свет первое руководство по интегральному исчислению. В этой книге проводится точка зрения приближенного определения; так, например, кривую де Лопиталь рассматривает как ломаную с очень малыми сторонами, касательную — как продолжение такой стороны. Распространению дифференциального исчисления Лейбница в Германии особенно содействовал Христиан Вольф, опубликовавший в Галле в 1710 г. свои лекции. Вольф в самом начале дифференциального исчисления вводит дифференциалы Лейбница, но при этом особенно подчеркивает, что они не имеют никакого реального эквивалента. А относительно всего того, что для нашего восприятия является бесконечно малым, он снова проводит исключительно точку зрения приближенного определения. Так, в виде примера Вольф говорит, что высота горы не испытает изменения, заметного для практического измерения, если снять с нее или прибавить пылинку.

4. Нередко встречается также метафизическое представление, приписывающее дифференциалам реальное существование. Особенно оно распространено среди философов, но и среди представителей математической физики оно находит немало приверженцев. К числу последних принадлежал, между прочим, Пуассон, который в предисловии к своему знаменитому трактату по механике в очень категорической форме высказывается в том смысле, что бесконечно малые величины не только представляют собой

орудие исследования, но даже вполне реально существуют.

5. Вероятно, вследствие философской традиции это представление перешло в популярную учебную литературу и играет в ней большую роль и по сию пору. Для примера я назову учебник Любсена «Введение в исчисление бесконечно малых»*), впервые появившийся в 1855 г. и имевший необычайное влияние на широкие круги публики; в мое время, несомненно, всякий— в ученические годы или позже — брал в руки эту книгу, и многие из нее впервые почерпнули побуждение к дальнейшему изучению математики. Любсен сперва определяет производную при помощи понятия предела, но наряду с этим, начиная со второго издания, помещает то, что он считает истинным исчислением бесконечно малых, — мистические операции над бесконечно малыми величинами. Соответствующие главы помечены звездочкой в знак того, что они не содержат нового материала. Здесь дифференциалы вводятся как последние доли, которые возникают, например, при последовательном делении конечной величины пополам бесконечное, не поддающееся определению число раз; каждая из таких долей, «хотя и отлична от абсолютного нуля, но не поддается установлению; она представляет собой бесконечно малую, дуновение, мгновение».

Причину живучести подобных воззрений наряду с математически точным методом пределов надо искать в весьма распространенной потребности заглянуть, минуя абстрактно-логические рассуждения способа пределов, поглубже в саму природу непрерывных величин; желают составить себе о ней более конкретные представления, чем те, которые возникают, когда мы подчеркиваем только психологические моменты, определяющие понятие предела. В этом отношении характерен один афоризм, который, насколько я знаю, принадлежит философу Гегелю и в прежнее время часто повторялся в книгах и лекциях; он утверждает, что функция у = f(x) изображает бытие вещей, а производная— их становление. Конечно, в этом утверждении есть нечто привлекательное, но только надо

*) Lübsen. Einleitung in die Infinitesimalrechnung.-— 8 Aufl. —Leipzig, 1899

ясно сознавать, что подобные фразы нисколько не содействуют дальнейшему развитию математики, ибо последняя нуждается в более точных понятиях.

В новейшей математике «актуально» бесконечно малые величины снова попали в честь, но теперь в совершенно ином порядке идей; именно, мы встречаем их в геометрических исследованиях Веронезе, а также в «Основаниях геометрии» Гильберта. Идея, которую я имею в виду, в самых кратких словах сводится к следующему145). Рассматривают геометрию, в которой задание х = а (а — обыкновенное действительное число) определяет собой не одну только точку оси Ху а бесконечное множество точек146), абсциссы которых отличаются между собой на конечные кратные бесконечно малых величин различных порядков т|, ç, таким образом, точка будет определена, если дано

х = а + Ьх\ + с£ +

где а, &, с, ... означают обыкновенные действительные числа; т), £, ... суть актуально бесконечно малые возрастающих порядков. У Гильберта вопрос поставлен так: он устанавливает относительно введенных таким образом величин особые положения в качестве аксиом и при их помощи обнаруживает, что с ними можно оперировать без риска впасть во внутреннее противоречие. Самый важный момент представляет при этом надлежащий выбор критериев сравнения числа X и другого числа х\ = ах + Ь\х\ + ciç + ... Прежде всего, конечно, устанавливают, что х больше или меньше х\9 если а больше или меньше au если же а = au то вопрос о сравнении величин решают вторые коэффициенты в том смысле, что х ^ х\9 если b^b\\ если же и b =b и то коэффициенты с дают решение вопроса и т. д. Вы поймете это лучше всего, если не будете пытаться связывать с написанными буквами никаких особенных представлений.

Оказывается, что с такими объектами можно оперировать по этим и еще другим указываемым далее правилам совершенно аналогично тому, как оперируют с конечными числами; при этом отпадает только одна существенно важная теорема, имеющая место в системе обыкновенных действительных чисел, а именно, теорема, гласящая, что для всяких двух по-

ложительных чисел е и а, как бы мало ни было первое из них и как бы велико ни было второе, можно подыскать такое целое число я, чтобы было147) пе>а. В данном случае из приведенных определений непосредственно вытекает, что любое конечное кратное п-г\ величины ц всегда будет меньше всякого конечного положительного числа а; именно это свойство и характеризует ц как бесконечно малую величину. Точно так же всегда л*£<т|, т. е. £ есть бесконечно малая величина высшего порядка, чем т]. Такую систему чисел называют неархимедовой, так как упомянутую теорему о конечных числах называют аксиомой Архимеда; Архимед формулирует ее как недоказуемое,— вернее, как не допускающее дальнейшего доказательства — основное допущение относительно конечных чисел. То, что эта аксиома перестает иметь место, является характерным для появления актуально бесконечно малых величин. Впрочем, присвоение этой аксиоме имени Архимеда, как и большинство других именных обозначений, является исторически неточным: уже за сто лет до Архимеда ее высказал Евклид, который, по-видимому, тоже не сам ее нашел, а заимствовал, как и очень многие другие из своих теорем, у Евдокса Книдского.

Изучение неархимедовых величин*), применяемых, в частности, в качестве координат для построения «неархимедовой геометрии»148), имеет целью более глубокое проникновение в сущность тех положений, которыми устанавливается непрерывность, и принадлежит к обширной группе исследований о логической зависимости различных аксиом обыкновенной геометрии и арифметики; с этой целью обыкновенно строят такую искусственную числовую систему, в которой имеет место только часть всех аксиом, и из этого заключают о логической независимости прочих аксиом от первых.

Естественно возникает вопрос о том, нельзя ли распространить на такие числовые системы анализ бесконечно малых в строгой современной его постановке; другими словами, нельзя ли построить своего

*) Неархимедовыми величинами являются, например, так называемые рогообразные углы, которые хорошо знал уже Евклид. См., например, в томе II настоящего сочинения статью, посвященную критике «Начал Евклида».

рода неархимедов анализ. Первая и самая главная задача заключалась бы в доказательстве на основании принятых аксиом теоремы о среднем значении: f(x + h)—/(*)= h'f {x + Qh). Я не хочу утверждать, что в этом направлении успех невозможен, но, во всяком случае, до сих пор никому из тех (а их немало!), кто занимается актуально бесконечно малыми величинами, не удалось добиться каких-либо положительных результатов в этом направлении149).

Чтобы помочь вам лучше ориентироваться, я замечу еще, что со времен Коши термин «бесконечно малый» стали употреблять в современных учебниках в другом смысле. А именно, теперь никогда не говорят, что величина бесконечно мала, но говорят лишь, что она становится бесконечно малой, и видят в этом лишь удобное сокращенное обозначение того, что рассматриваемая величина неограниченно убывает, стремясь к нулю150).

Реакция против предельных переходов и бесконечно малых; исчисление производных Лагранжа. Теперь я должен упомянуть еще о той реакции, которую вызвало такое обоснование анализа на понятии бесконечно малых величин. В этих представлениях очень скоро почувствовали что-то мистическое, недоказуемое; в результате нередко возникало даже предубеждение, будто дифференциальное исчисление является особой философской системой, которую нельзя обосновать, но в которую можно только верить, или даже прямо-таки, выражаясь грубо, подвохом, плутовством. Наиболее резким критиком в этом смысле является философ Беркли, который в небольшой книжке под заглавием «Аналист» в забавной форме вышучивает неясности, царившие в то время в математике. При этом Беркли исходит из той мысли, что по отношению к принципам и методам математики критика должна предоставить себе такую же свободу, какую математики применяют в свою очередь к тайнам религии, и затем самым ожесточенным образом нападает на все методы нового анализа — как на исчисление флюксий, так и на оперирование с дифференциалами; в результате он приходит к тому выводу, что все построение анализа неясно и совершенно непонятно.

Подобные воззрения сохранились среди философов и до настоящего времени; они все еще знают лишь

операции с дифференциалами и совершенно не усвоили себе способа пределов, разработанного в новейшее ьремя до полной строгости. Для примера позвольте мне процитировать одно только место из книги Баумана «Пространство, время и математика»*), напечатанной в 60-х годах: «Таким образом мы отвергаем то логическое и метафизическое обоснование, которое дал исчислению Лейбниц, но самого исчисления мы не касаемся. Мы считаем его гениальным изобретением, оправдавшим себя на практике, скорее искусством, чем наукой; построить его чисто логически невозможно, из элементов обыкновенной математики оно не получается...»

Этой же реакцией против дифференциалов следует объяснить и не раз уже упомянутую нами попытку Лагранжа, которая представляется нам теперь опять в новом освещении. Лагранж хочет совершенно удалить из теории не только бесконечно малые величины, но и вообще все предельные переходы; он ограничивается рассмотрением таких функций, которые можно определить посредством степенных рядов

а их «производные функции f'(x)» (Лагранж не признает производной как отношения дифференциалов

и не употребляет символа определяет чисто формальным образом, а именно, посредством нового степенного ряда

В соответствии с этим он говорит не о дифференциальном исчислении, а об «исчислении производных». Но, конечно, такое изложение не могло долго удовлетворять математиков. Действительно, с одной стороны, определение функции, принимаемое Лагранжем, слишком узко, как мы это выше подробно выясняли, а с другой стороны, — и это наиболее важно — такие исключительно формальные определения делают невозможным более глубокое понимание сущности понятия производной или интеграла; они совер-

*) Baumann. Raum, Zeit und Mathematik, t. II. — Berlin, 1869. — S. 55.

шенно не принимают во внимание того, что мы называем психологическим моментом; вопрос о том, почему занимаются именно такими своеобразными «производными» рядами, остается без ответа. Наконец, без изучения пределов можно обойтись только в том случае, если оставить совершенно без внимания вопрос о сходимости этих степенных рядов, но лишь только мы захотим заняться этим вопросом, — а это является, конечно, необходимым для действительного применения рядов, — как увидим себя вынужденными прибегнуть к тому же самому понятию предела, ради устранения которого и придумана вся система.

Этим я закончу краткий исторический очерк развития анализа бесконечно малых; я по необходимости ограничился тем, что отметил значение наиболее выдающихся людей, игравших руководящую роль. Конечно, такой очерк следовало бы дополнить более подробным изучением литературы этого периода.

О преподавании исчисления бесконечно малых в школе. Если в заключение мы окинем быстрым взглядом отношение школьного преподавания к исчислению бесконечно малых, то увидим, что на первом отразился весь ход развития последнего. Всюду, где в прежнее время занимались в школе анализом бесконечно малых, мы видим — судя, по крайней мере, по учебникам, а иначе и нельзя судить о деле преподавания — полное отсутствие ясного представления о точном научном построении анализа бесконечно малых при помощи метода пределов; этот метод выступал лишь в более или менее расплывчатом виде; на первом плане стояли операции с бесконечно малыми величинами, а подчас и исчисление производных, как его понимает Лагранж. Разумеется, такое преподавание было лишено не только строгости, но и доступности, и нет ничего удивительного в том, что постепенно стало распространяться весьма резкое отрицательное отношение к преподаванию анализа в школе. В 70-х и 80-х гг. (XIX в.) дошли даже до прямого запрещения преподавать анализ, не исключая и реальных школ.

Но это, конечно, не помешало, как я уже раньше имел случай отметить, применению способа пределов в школе в тех случаях, когда в нем оказывалась необходимость, но только при этом избегали самого на-

звания или даже иной раз, пожалуй, думали, что занимаются чем-то другим. Я приведу только примеры, которые большинству из вас знакомы из вашего школьного времени.

a) Общеизвестное вычисление длины окружности и площади круга по способу приближения к кругу посредством вписанных и описанных правильных многоугольников представляет собой, конечно, точное интегрирование. Как известно, этот способ весьма древнего происхождения, а именно, принадлежит Архимеду; этому своему возрасту, восходящему до античной эпохи, он и обязан тем, что сохранился в школе.

b) Преподавание физики, в особенности ее механического отдела, нуждается безусловно в понятиях скорости и ускорения и в их применении к законам падения тел. Но их вывод представляет собой не что иное, как интегрирование дифференциального уравнения zn — g, приводящее к функции z=^gt2 + at + b, где а и Ь суть постоянные интегрирования. Этот вывод школа вынуждена дать ввиду требований, предъявляемых физикой, и те методы, какие школа применяет, представляют собой, конечно, более или менее точные методы интегрирования, но только в замаскированном виде.

Позвольте мне в связи с этим охарактеризовать отношение к этому вопросу наших реформаторских стремлений, которые в настоящее время встречают в Германии, как и в других странах, в особенности во Франции, все больше и больше сочувствия и, надо надеяться, будут играть руководящую роль в преподавании математики в ближайшие десятилетия. Мы хотим, чтобы понятия, обозначаемые символами y*=f(x), -jjp ^ydx, стали знакомы ученику151) вместе с этими обозначениями, но не в виде новой абстрактной дисциплины, а в органической связи со всем преподаванием; при этом нужно продвигаться вперед постепенно, начиная с самых простых примеров. Так, в 4-м и 5-м классах надо начинать с подробного изучения функции у = ах + Ь при определенных численных значениях коэффициентов а, Ъ и функции у = х2, пользуясь клетчатой бумагой; при этом нужно стараться постепенно пояснить учащимся понятие

подъема или падения кривой и площади. В последнем классе можно будет сделать общий обзор приобретенных таким образом знаний, причем само собой обнаружится, что ученики вполне владеют основами или начатками анализа бесконечно малых. Главная цель при этом должна заключаться в том, чтобы пояснить ученику, что здесь нет ничего мистического, что все это — простые вещи, которые всякий может понять.

Неоспоримая необходимость таких реформ явствует из того, что они имеют в виду выяснение тех математических понятий, которые и теперь господствуют во всех без исключения приложениях математики во всевозможных областях и без которых совершенно теряет почву всякое обучение в высшей школе, начиная с простейших занятий по опытной физике. Я ограничусь здесь этими краткими замечаниями.

Чтобы показать приложение этих общих рассуждений к конкретным вещам, я разберу подробнее один из вопросов исчисления бесконечно малых, а именно теорему Тейлора.

2. Теорема Тейлора

Обращаясь к этому вопросу, я отклонюсь от изложения, обычно принятого в учебниках, в том же направлении, как и выше в главе о тригонометрических рядах; а именно, на первый план я поставлю конечный ряд, важный в практическом отношении, и наглядное выяснение всего материала при помощи чертежей. Благодаря этому все приобретает вполне элементарный характер и становится весьма понятным.

Параболы, соприкасающиеся с данной кривой. Я исхожу из такого вопроса: нельзя ли приближенно изобразить ход любой кривой y = f(x) на некотором ее протяжении при помощи других возможно более простых кривых. Проще всего было бы заменить кривую в окрестности точки х = а касательной к ней в этой точке (рис. 103)

у = А + Вх;

так именно и поступают в физике и других приложениях всякий раз, когда при разложении функций

в ряд сохраняют только первые степени независимой переменной, а остальные отбрасывают. Можно получить подобным же образом еще лучшие приближения, если воспользоваться параболами второго, третьего, ... порядка

у = А + Вх + Сх\ y = A + Bx + Cx2 + Dx\ ...

или, выражаясь аналитически, многочленами высших степеней; применение их особенно целесообразно по той причине, что их удобнее всего вычислять. Мы будем так проводить эти кривые, чтобы они примыкали как можно теснее к данной кривой в точке X = а, т. е. будем брать соприкасающиеся параболы. Так, например, парабола второго порядка будет иметь с кривой y = f(x) не только общую ординату, но и одинаковые первую и вторую производные (т. е. будет «соприкасаться» с нею); у кубической параболы также и третья производная будет совпадать с третьей производной функцией у = )(х). Простое вычисление дает для соприкасающейся параболы п-го порядка такое аналитическое выражение:

а это как раз первые п членов ряда Тейлора.

Исследование вопроса о том, представляют ли эти многочлены годные к употреблению приближенные кривые, и если представляют, то в какой именно форме,— это исследование мы начнем с рассуждений скорее опытного характера, как и в случае тригонометрических рядов (с. 272—285). Я могу показать вам несколько чертежей соприкасающихся парабол первых порядков для некоторых простых кривых, которые изготовил Шиммак. Это, прежде всего, следующие четыре функции вместе с их соприкасающимися параболами в точке 0; все они имеют при лг =—1

Рис. 103

особую точку (рис. 104—107):

Чем выше порядок соприкасающихся парабол, тем больше они приближаются к оригинальной кривой в интервале (—1, но замечательно, что справа от х = + 1 они отклоняются от кривой вверх или вниз тем сильнее, чем выше их порядок.

В особой точке х ——1, в которой функции 1,3,4 становятся бесконечно большими, ординаты последовательных соприкасающихся парабол принимают все большие и большие значения. Во втором же случае, в котором кривая, изображаемая оригинальной функцией, имеет в точке х = — 1 вертикальную касательную и не имеет продолжения влево от этой точки, последовательные параболы, хотя и продолжаются влево от точки х = — 1, но все более и более приближаются в ней к оригинальной кривой, все круче и круче опускаясь вниз. В симметрично расположенной точке х = +1 в первых двух случаях параболы примыкают все ближе и ближе к оригинальным кривым; в третьем случае их ординаты попеременно равны единице и нулю, а ордината оригинальной кривой

Рис. 104 Рис. 105

равна y* в четвертом случае параболы получают попеременно положительные и отрицательные значения, возрастающие до бесконечности.

Кроме того, у меня здесь имеются чертежи соприкасающихся парабол для двух целых трансцендентных функций (рис. 108 и 109):

Вы видите, что протяжение, на котором соприкасающиеся параболы представляют годные приближения к оригинальной кривой, становится тем больше, чем выше их порядок. В случае функции sin* особенно ясно видно, как параболы стараются все больше и больше подражать колебаниям синусоиды.

Рис. 106 Рис. 107

Рис. 108

Замечу, это вычерчивание подобных кривых для наиболее простых случаев представляет, пожалуй, подходящий материал и для школы.

Оценка погрешности. Собрав таким образом опытный материал, мы должны теперь перейти к рассмотрению вопроса с математической точки зрения. Здесь прежде всего возникает крайне важный в практическом отношении вопрос о той точности, с какой вообще соприкасающаяся парабола п-го порядка изображает оригинальную кривую, — так называемая оценка погрешности или остатка; сюда же примыкает, конечно, вопрос о переходе к бесконечно большому п: нельзя ли при помощи бесконечного степенного ряда точно изобразить данную кривую?

Я могу здесь ограничиться тем, что приведу наиболее известную теорему о величине остатка

вывод ее вы найдете во всяком учебнике; кроме того, я вернусь еще позже к этому, исходя из более общей точки зрения. Теорема гласит: между aux существует такое промежуточное значение |, что Rn{x) можно представить в таком виде:

Вопрос о переходе к бесконечному ряду сводится теперь непосредственно к вопросу о том, стремится ли

Рис. 109

этот остаток Rn(x) при беспредельном возрастании п к пределу нуль или нет.

В применении к нашим примерам отсюда выводят— и это вы тоже найдете во всяком учебнике,— что прежде всего в примерах 5 и 6 бесконечный ряд сходится для всех значений х. Что же касается первых четырех примеров, то оказывается, что бесконечный ряд сходится для всех значений х, заключенных между +1 и —1, причем сумма его равна первоначально заданной функции, но вне этого промежутка ряд расходится. При х = — 1 во втором примере ряд сходится, имея суммой величину функции в этой точке, а в примерах 1, 3 и 4 сумма ряда стремится к бесконечности так же, как и значение самой функции, так что и в этом случае можно было бы, собственно, говорить о сходимости, но по традиции этого термина не употребляют в случае рядов с явно бесконечным пределом. Наконец, при х = + \ мы имеем дело со сходимостью в обоих примерах 1 и 2. Все это прекрасно согласуется с результатами изучения наших чертежей. Но можно задать себе, как и в случае тригонометрических рядов, такой вопрос: к каким предельным положениям стремятся соприкасающиеся параболы, когда мы смотрим на них чисто геометрически— как на кривые? Ведь они не могут внезапно оборваться при х = ±1. Для 1п(1+лг) эти предельные кривые изображены приближенно на рис. 110, а именно, оказывается, что четные и нечетные параболы стремятся к двум различным предельным положениям, состоящим из части логарифмической кривой, заключенной между —1 и +1, и из примыкающей к ней в точке jc = +1 нижней и соответственно верхней половины вертикали х = -\-\. Аналогично обстоит дело и в остальных трех случаях.

Теоретическое исследование ряда Тейлора находит свое завершение лишь при переходе к комплексным переменным, ибо только тогда становится понятным внезапное прекращение сходимости степенных рядов в совершенно определенных точках функции. Конечно, в наших четырех примерах можно считать, что это явление в точке х = +1 объясняется в достаточной степени тем, что ряд не может сходиться справа дальше, чем он сходится слева; слева же сходимость должна прекращаться в точке х = —1, ибо это —

особая точка для рассматриваемых функций. Но уже в нижеследующем примере это рассуждение оказывается неприменимым. Ряд Тейлора для ветви функции arctgjc, которая остается правильной при всех действительных значениях х, сходится только в интервале (—1, +1), а соприкасающиеся параболы поочередно стремятся к предельным кривым, изображенным штриховой и пунктирной линиями (рис. 111). Внезапное прекращение сходимости во вполне определенных точках х = +1 совершенно не поддается пониманию, если оставаться в области действительных переменных.

Объяснение заключается в замечательной теореме о круге сходимости, которая представляет собой самое прекрасное открытие, сделанное Коши в теории функций; эта теорема гласит: если отметить в комплексной плоскости X все особые точки аналитической функции f(x), то ряд Тейлора для этой функции, относящийся к точке х = а, сходится внутри той окружности с центром в точке а, которая проходит через ближайшую особую точку; этот ряд не сходится ни для одной точки, лежащей вне этой окружности (рис. 112).

Для функции arctgjc, как известно, значения х = = doi представляют собой особые точки; поэтому кругом сходимости для разложения по степеням « является круг радиуса 1 с центром в точке х = 0.

Рис. 110 Рис. 111

Вследствие этого сходимость должна прекращаться в точках * = ±1, в которых действительная ось выходит за пределы круга сходимости (рис. 113).

Что же касается сходимости ряда на самой окружности радиуса 1, то по этому вопросу я должен ограничиться следующим указанием, примыкающим к подчеркнутой выше связи между степенными и тригонометрическими рядами: упомянутая сходимость зависит от того, можно ли действительную и мнимую части функции на окружности круга сходимости вместе с теми особенностями, какими они там необходимо обладают, разложить в сходящиеся тригонометрические ряды.

Проблемы интерполирования и разностного исчисления. Я хочу еще оживить теорему Тейлора тем, что покажу, в каком отношении она стоит к проблемам интерполирования и разностного исчисления. И в этих дисциплинах занимаются вопросом о том, чтобы приближенно изобразить заданную кривую при помощи параболы; но здесь вопрос ставится иначе; здесь парабола не должна примыкать к данной кривой в одной определенной точке, а напротив, требуется, чтобы она пересекала заданную кривую в нескольких заранее указанных точках; вопрос снова заключается в том, в какой мере такая «интерполяционная парабола» представляет собой пригодное приближение. В простейшем случае разница сводится к тому, что кривую заменяют не ее касательной, а ее секущей (рис. 114); аналогично исследуют квадратичную параболу, проходящую через

Рис. 112 Рис. 113

Рис. 114

три точки данной кривой, кубическую параболу, проходящую через четыре точки, и т. д.

Такая постановка вопроса в теории интерполирования является вполне естественной и применяется необычайно часто, например при употреблении численных логарифмических таблиц. Действительно, в этом случае как раз допускают, что логарифмическая кривая проходит между двумя значениями, данными в таблице, по прямой линии, и поэтому интерполируют линейно по обычному способу, пользуясь «табличками разностей». Если же это не дает достаточно точных результатов, то применяют и квадратичную интерполяцию.

По отношению к этой общей задаче определение соприкасающихся парабол по теореме Тейлора представляет собой частный случай, а именно здесь все точки пересечения кривой с интерполяционными параболами сливаются в одну точку. Конечно, при такой замене кривой соприкасающимися параболами слово «интерполирование», собственно говоря, не подходит; но, с другой стороны, в задачу интерполирования всегда включают также и экстраполирование; так, например, секущую сравнивают с кривой не только между ее точками пересечения, но и вне отрезка с концами в этих точках. Поэтому для обозначения всего способа в целом более целесообразным представляется, пожалуй, общее выражение «приближение».

Теперь я намерен указать наиболее важные интерполяционные формулы. Поставим себе прежде всего целью определить параболу (п—1)-го порядка, которая пересекала бы данную кривую в п произвольно выбранных точках а\, а2, аПу т. е. чтобы ее ординаты в этих точках были равны f(a{),f(a2), ..., f(an) (рис. 115). Эту задачу решает интерполяционная формула Лагранжа

(1)

В этой формуле содержится п членов с множителями f(ai),f(a2), /(ал); в числители этих членов не внесены последовательно множители х—аих—а2, ...

,.., x — ап. Справедливость этой формулы можно сразу проверить: с одной стороны, все слагаемые выражения у< а следовательно, и само у представляют собой многочлены (п—1)-й степени относительно х\ с другой стороны, все дроби, кроме первой, обращаются при х = ах в нуль, а первая обращается при этом в единицу, так что у оказывается равным f(a\); точно так же у = f(a2) при х = а2 и т. д.

Из этой формулы можно получить как частный случай формулу Ньютона, которая исторически, конечно, гораздо старше формулы Лагранжа. Формула Ньютона относится к тому случаю, когда даны равноотстоящие абсциссы а\9а2, ап (рис. 116). В этом случае имеют большое преимущество обозначения, принятые в разностном исчислении, и поэтому мы сначала познакомимся с ними.

Пусть Ах — приращение переменной х, а Д/*) — соответствующее приращение функции /(*), так что

f(x + Ax) = f(x) + Af(x).

Но Af(x) в свою очередь представляет собой некоторую функцию от x, которая при замене переменной x на х + Ах имеет определенную разность — так называемую «вторую разность» Д2/(х):

аналогично полагаем далее

и т. д.

Эти обозначения вполне аналогичны обозначениям дифференциального исчисления с той только разницею, что здесь мы имеем дело с определенными конечными величинами и ни о каких предельных переходах нет речи.

Рис. 115 Рис. 116

Из написанных выше равенств, выражающих определения разностей, непосредственно вытекают такие выражения для значений функции / в последовательных равноотстоящих точках:

(2)

Таким же простым образом выражаются значения функции f н в дальнейших равноотстоящих точках через последовательные разности функции / в первой точке к, причем в качестве множителей входят биномиальные коэффициенты.

Формула Ньютона выражает интерполирующую параболу (п—1)-го порядка для п равноотстоящих точек

т. е. такую параболу, которая при этих абсциссах имеет ординаты, равные соответствующим значениям функции f(x); эта формула имеет вид

(3)

В самом деле, это, во-первых, многочлен (п—1)й степени относительно ху во-вторых, при х = а значение у приводится к /(а); далее, при x = a + àx все члены после второго исчезают и остается у = /(а) + -т-Д/(я), что, согласно равенствам (2), как раз равно {(а + Аа)у и т. д. Вообще, таблица (2) показывает, что этот многочлен во всех п точках принимает нужные значения.

Если мы хотим в действительности применить с успехом одну из этих формул интерполирования, то нам надо еще знать что-нибудь относительно той

точности, с которой они выражают функцию f(x); другими словами, мы должны уметь оценить погрешность. Эту оценку указал Коши в 1840 г., и я охотно приведу здесь ее вывод. Будем исходить из общей формулы Лагранжа, пусть х—какое-нибудь значение, заключенное на отрезке, содержащем а\9а2, ... ..., йп, или вне его (интерполирование или экстраполирование). Через Р(х) обозначим значение интерполирующей параболы (п—1)-го порядка, изображаемой формулой Лагранжа, а через R(x) остаток, так что

/(*)-Р (*) + *(*). (4)

Согласно определению функции Р(х) остаток R(x) заведомо обращается в нуль при х = =01,02, •••» 0«; поэтому мы полагаем

Выделение множителя п\ представляется удобным по той причине, что тогда множитель -ф(х) оказывается равным значению /г-й производной от f(x) для некоторой промежуточной точки I — промежуточной в том смысле, что она заключена внутри промежутка, занимаемого П+1 точками 01,02, аПуХ. То, что отклонение функции f(x) от многочлена (п—1)-й степени зависит от общего хода изменения производной п-го порядка f{n)(x)t становится вполне естественным, если принять во внимание, что функция f(x) становится равной этому многочлену, когда производная /<п)(*) обращается тождественно в нуль.

Что же касается доказательства этой формулы остатка, то его удается провести при помощи такого приема: составляем функцию от новой переменной г:

где аргумент х функции \|)(х) рассматриваем как параметр. Так как по определению

Далее, находим, что и F{x) — 0, так как при z = jc последнее слагаемое переходит в R(x) и вся правая часть в силу равенства (4) обращается в нуль. Таким образом, мы знаем п + 1 корней: z = аи а2, ..., ап, х функции F{z). Теперь применим теорему о среднем значении в обобщенном виде, которая получается посредством повторного применения этой теоремы в ее обычной форме: если некоторая непрерывная функция, имеющая п непрерывных производных, обращается в нуль в п + 1 точках, то ее п-я производная обращается в нуль по крайней мере в одной точке промежутка, содержащего все эти п + 1 корней. Поэтому, если только функция f(z), а вместе с нею ^(г) обладает п непрерывными производными, то существует такая точка g, заключенная между крайними из значений аь а2, ап,х, что

Но

так как п-я производная многочлена (п—1)-й степени Р равна нулю, а в последнем слагаемом только высший член -~ zn ф (х) дает л-ю производную, отличную от нуля. Таким образом, в результате находим

т. е.

а это и требовалось доказать.

Я выпишу подробно, в частности, интерполяционную формулу Ньютона с ее остаточным членом:

(5)

где g— некоторое значение, заключенное в промежутке, содержащем п + 1 точек а, а + Аде, ..., а + + (п—1 )âkx, X, Эта формула действительно незаме-

нима в применениях. Я уже указывал на линейное интерполирование при пользовании таблицами логарифмов; для f(x) = \g(x) и п = 2 формула (5) дает

ибо d*2 = — где M — модуль перехода для системы десятичных логарифмов; это дает выражение для ошибки, которую мы совершаем при линейном интерполировании между двумя логарифмами чисел а и а + Д-*> взятыми из таблицы. Между прочим, из этой формулы видно, что эта ошибка получает различный знак в зависимости от того, лежит ли число х между числами а и а + Д* или вне их.

Я не буду больше останавливаться на приложениях, а перейду к замечательной аналогии между интерполяционной формулой Ньютона и формулой Тейлора. В основе этой аналогии лежит следующее обстоятельство: из формулы Ньютона можно очень легко и притом совершенно строго вывести формулу Тейлора с остаточным членом; этот вывод вполне соответствует переходу от интерполяции к приближенным параболам. В самом деле, если при постоянных х, а и п приращение Лдг стремится к нулю, то каждое из п—1 отношений между конечными разностями, встречающихся в равенстве (5), переходит в соответствующую производную (по предположению, ведь существуют первые п производных функций f(x)):

и т. д.

Отсюда следует, что множитель f(n)(Q в последнем члене правой части тоже стремится к определенному пределу, а вследствие непрерывности функции f(n)(x) этим пределом опять является некоторое среднее значение /(л)(1). Итак, мы получаем совершенно строгое равенство

Таким образом, мы вполне доказали теорему Тейлора и в то же время показали, с каким изяществом ее можно привести в связь с общим учением об интерполяции.

Благодаря этой тесной связи с очень простыми вопросами и благодаря тому, что предельный переход здесь так легок, я считаю этот вывод формулы Тейлора лучшим из всех возможных выводов. Однако не все математики, даже хорошо знакомые с этими вещами, — нужно, впрочем, заметить, что, как это ни странно, их часто не знают даже составители учебников,— придерживаются этого мнения; они обыкновенно принимают очень серьезный вид, приступая к предельному переходу, и предпочитают дать непосредственное доказательство теоремы Тейлора, чем вывод ее при помощи исчисления конечных разностей.

Но я могу здесь же отметить, что исторически источником открытия ряда Тейлора было именно разностное исчисление. Как я уже упоминал, в первый раз этот ряд построил Тейлор в 1715 г.*); он выводит сначала формулу Ньютона, — конечно, без остаточного члена — и потом полагает в ней одновременно Дх=*0 и л = оо; он вполне правильно получает из первых членов этой формулы первые члены нового ряда:

и считает очевидным, что этот ряд можно продолжать до бесконечности, — ни об остаточном члене, ни о сходимости у него нет и речи. Это — неслыханный по своей смелости предельный переход. Первые члены, в которых встречается х—а — Ах> х — а — 2Ах, не представляют трудностей, так как при ПтДх = 0 исчезает также Д*, повторенное конечное число раз. Но при дальнейшем возрастании п появляются в постоянно возрастающем числе члены, содержащие множители X — а — kAx с постоянно возрастающими значениями k, и мы, конечно, не имеем права обращаться с ними так, как с первыми членами, и предполагать, что мы получаем сходящийся ряд.

*) Taylor В. Methodus incrementorum. — Londinii, 1715.

В сущности, Тейлор здесь оперирует с бесконечно малыми величинами (дифференциалами) гораздо, если можно так выразиться, легкомысленнее, чем это когда-либо делали последователи Лейбница: интересно отметить, что ему было тогда 29 лет, и он на глазах Ньютона так уклонился от метода пределов, которым пользовался последний. Как бы там ни было, ему удалось таким образом сделать свое очень важное открытие.

Я хотел бы еще сказать несколько слов по поводу делаемого обыкновенно различия между рядом Тейлора и рядом Маклорена. Как известно, во всех учебниках под названием ряда Маклорена отдельно рассматривают частный случай ряда Тейлора при а = 0:

и легко может прийти в голову, что очень важно строго отличать один ряд от другого. Каждому знакомому с делом ясно, что с математической точки зрения это различие совсем несущественно; менее известно то обстоятельство, что оно исторически также является бессмыслицей. Во-первых, Тейлору принадлежит несомненный приоритет в отношении общей теоремы, к которой он пришел, как указано выше. Но, кроме того, он дальше в своей работе специально останавливается на той форме, которую его ряд принимает при а = 0, и замечает, что в этом случае ряд можно получить также непосредственно при помощи так называемого способа неопределенных коэффициентов. Этим способом воспользовался в 1742 г. Маклорен в своей книге «Трактат о флюксиях», причем он совершенно яс