МАТЕМАТИКА, ЕЕ СОДЕРЖАНИЕ, МЕТОДЫ И ЗНАЧЕНИЕ

том

III

АКАДЕМИЯ НАУК СССР МАТЕМАТИЧЕСКИЙ ИНСТИТУТ им. В. А. СТЕКЛОВА

МАТЕМАТИКА, ЕЕ СОДЕРЖАНИЕ, МЕТОДЫ И ЗНАЧЕНИЕ

ТОМ ТРЕТИЙ

ИЗДАТЕЛЬСТВО АКАДЕМИИ НАУК СССР

МОСКВА 1956

РЕДАКЦИОННАЯ КОЛЛЕГИЯ:

член-корр. АН СССР А. Д. АЛЕКСАНДРОВ,

академик А. Н. КОЛМОГОРОВ,

академик М. А. ЛАВРЕНТЬЕВ

Глава XV

ТЕОРИЯ ФУНКЦИЙ ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО

§ 1. ВВЕДЕНИЕ

К концу XVIII — началу XIX в. дифференциальное и интегральное исчисление было в основном разработано. До этого времени (фактически, весь XVIII век) ученые были заняты построением его отдельных разделов, открывали все новые и новые факты, развивали все новые и новые области приложений дифференциального и интегрального исчисления к различным вопросам механики, астрономии, техники. Теперь появилась возможность обозреть полученные результаты, заняться их систематизацией, вникнуть в смысл основных понятий анализа. И вот выясняется, что с основами анализа дело обстоит не совсем благополучно.

Еще в XVIII в. у крупнейших математиков того времени не было единого мнения насчет того, что такое функция. Это приводило к долгим спорам о том, правильно или неправильно то или иное решение задачи, правилен или неправилен тот или иной конкретный математический результат. Постепенно выяснилось, что и другие основные понятия анализа нуждаются в уточнении. Недостаточно четкое понимание того, что такое непрерывность и каковы свойства непрерывных функций, привело к появлению ряда ошибочных утверждений, например, что непрерывная функция всегда дифференцируема. Математика стала оперировать со столь сложными функциями, что стало уже невозможно ссылаться на очевидность и догадку. Появилась настоятельная необходимость навести порядок в основных понятиях анализа.

Первая серьезная попытка в этом направлении была предпринята Лагранжем, а затем на тот же путь встал Коши. Коши уточнил и ввел во всеобщее употребление сохранившиеся до наших дней определения предела, непрерывности, интеграла. Примерно в то же время чешский математик Больцано провел строгое изучение основных свойств непрерывных функций.

Рассмотрим эти свойства непрерывных функций более подробно. Пусть непрерывная функция f(x) задана на некотором отрезке [а, b], т. е. для всех чисел, удовлетворяющих неравенствам а⩽х⩽b. Ранее считалось очевидным, что если на концах отрезка функция принимает

значения разных знаков, то в некоторой промежуточной точке она обращается в нуль. Теперь этот факт получил строгое обоснование. Точно так же было строго доказано, что непрерывная функция, заданная на отрезке, принимает в некоторых точках свое наибольшее и наименьшее значение.

Исследование этих свойств непрерывных функций заставило глубже вникнуть в природу действительных чисел. В результате появилась теория действительных чисел, были четко сформулированы основные свойства числовой прямой.

Дальнейшее развитие математического анализа привело к необходимости рассматривать все более и более «плохие», в частности разрывные, функции. Разрывные функции появляются, например, как пределы непрерывных функций, причем заранее не известно, будет ли предельная функция непрерывной, или нет, а также при схематизации процессов с резким внезапным изменением. Возникла новая задача — обобщение аппарата анализа на разрывные функции.

Риман исследовал вопрос о том, на какие классы разрывных функций распространяется понятие интеграла. В результате всей этой деятельности по обоснованию анализа появилась новая математическая дисциплина: теория функций действительного переменного.

Если классический математический анализ оперирует в основном с «хорошими» (например, непрерывными, дифференцируемыми) функциями, то теория функций действительного переменного изучает значительно более общие классы функций. Если в математическом анализе дается определение какой-либо операции (например, интегрирования) для непрерывных функций, то для теории функций действительного переменного характерно исследование вопроса о том, для какого класса функций применимо это определение, как следует видоизменить определение, чтобы оно стало более широким. В частности, лишь теория функций действительного переменного смогла дать удовлетворительный ответ на вопрос о том, что такое длина кривой и для каких кривых имеет смысл говорить о длине.

Основанием, на котором строится сама теория функций действительного переменного, является теория множеств.

В соответствии с этим мы начинаем наше изложение с рассмотрения элементов теории множеств, затем переходим к изучению точечных множеств и завершаем главу изложением одного из основных понятий теории функций действительного переменного, а именно интеграла Лебега.

§ 2. МНОЖЕСТВА

Людям постоянно приходится иметь дело с различными совокупностями предметов. Как уже разъяснялось в главе I (том 1), это повлекло за собой возникновение понятия числа, а затем и понятия

множества, которое является одним из основных простейших математических понятий и не поддается точному определению. Нижеследующие замечания имеют своей целью пояснить, что такое множество, но не претендуют на то, чтобы служить его определением.

Множеством называется собрание, совокупность, коллекция вещей, объединенных по какому-либо признаку или по какому-либо правилу. Понятие множества возникает путем абстракции. Рассматривая какую-либо совокупность предметов как множество, отвлекаются от всех связей и соотношений между различными предметами, составляющими множества, но сохраняют за предметами их индивидуальные черты. Таким образом, множество, состоящее из пяти монет, и множество, состоящее из пяти яблок, — это разные множества. С другой стороны, множество из пяти монет, расположенных по кругу, и множество из тех же монет, положенных одна на другую,—это одно и то же множество.

Приведем несколько примеров множеств. Можно говорить о множестве песчинок, составляющих кучу песка, о множестве всех планет нашей солнечной системы, о множестве всех людей, находящихся в данный момент в каком-либо доме, о множестве всех страниц этой книги. В математике тоже постоянно встречаются различные множества, например множество всех корней заданного уравнения, множество всех натуральных чисел, множество всех точек на прямой и т. д.

Математическая дисциплина, изучающая общие свойства множеств, т. е. свойства множеств, не зависящие от природы составляющих их предметов, называется теорией множеств. Эта дисциплина начала бурно развиваться в конце XIX и начале XX в. Основатель научной теории множеств — немецкий математик Г. Кантор.

Работы Кантора по теории множеств выросли из рассмотрения вопросов сходимости тригонометрических рядов. Это весьма обычное явление: очень часто рассмотрение конкретных математических задач ведет к построению весьма абстрактных и общих теорий. Значение таких абстрактных построений определяется тем, что они оказываются связанными не только с той конкретной задачей, из которой они выросли, но имеют приложения и в ряде других вопросов. В частности, именно так обстоит дело и с теорией множеств. Идеи и понятия теории множеств проникли буквально во все разделы математики и существенно изменили ее лицо. Поэтому нельзя получить правильного представления о современной математике, не познакомившись с элементами теории множеств. Особенно большое значение имеет теория множеств для теории функций действительного переменного.

Множество считается заданным, если относительно любого предмета можно сказать, принадлежит он множеству или не принадлежит. Иными словами, множество вполне определяется заданием всех

принадлежащих ему предметов. Если множество M состоит из предметов a, b, c, . . . , и только из этих предметов, то пишут

M = {а, b, с, . . .}.

Предметы, составляющие какое-либо множество, принято называть его элементами. Тот факт, что предмет m является элементом множества М, записывается в виде

и читается: «m принадлежит M», или «m есть элемент М». Если же предмет n не принадлежит множеству М, то пишут: n∉М. Каждый предмет может служить лишь одним элементом заданного множества; иными словами, все элементы одного и того же множества отличны друг от друга.

Элементы множества M могут сами быть множествами, однако, во избежание противоречий, приходится требовать, чтобы само множество M не было одним из своих собственных элементов: М∉М.

Множество, не содержащее ни одного элемента, называется пустым множеством. Например, множество всех действительных корней уравнения

есть пустое множество. Пустое множество в дальнейшем будем обозначать через θ.

Если для двух множеств M и N каждый элемент х множества M является также элементом множества N, то говорят, что M входит в N, что M есть часть N, что M есть подмножество N или что M содержится в N; это записывается в виде

Например, множество М={1, 2} есть часть множества N = {1, 2, 3}.

Ясно, что всегда M⊆М. Удобно считать, что пустое множество есть часть любого множества.

Два множества равны, если они состоят из одних и тех же элементов. Например, множество корней уравнения x2 — 3х+2 = 0 и множество M={1, 2} между собою равны.

Определим правила действий над множествами.

Объединение или сумма. Пусть имеются множества M, N, Р, . .. Объединением или суммой этих множеств называется множество X, состоящее из всех элементов, принадлежащих хотя бы одному из «слагаемых» M, N, Р,. . .

При этом, даже если элемент х принадлежит нескольким слагаемым, то он входит в сумму X лишь один раз. Ясно, что

М+М = M,

и если M⊆N, то

M + N = N.

Пересечение. Пересечением или общей частью множеств M, N, Р, .. . называется множество Y, состоящее из всех тех элементов, которые принадлежат одновременно всем множествам M, N, Р, . .,

Ясно, что M ⋅ М = М, и если M⊂N, то M ⋅ N = М.

Если пересечение множеств M и N пусто: M ⋅ N = θ, то говорят, что эти множества не пересекаются.

Для обозначения операции суммы и пересечения множеств употребляют также знаки Σ и Π. Таким образом,

есть сумма множеств Ei, а

— их пересечение.

Читателю рекомендуется доказать, что сумма и пересечение множеств связаны обычным распределительным законом

а также законом

Разность. Разностью двух множеств M и N называется множество Z всех тех элементов из М, которые не принадлежат N:

Если N ⊂ М, то разность Z = M — N называют также дополнением к множеству N относительно М. Нетрудно показать, что всегда

Таким образом, правила действий над множествами значительно отличаются от обычных правил арифметики.

Конечные и бесконечные множества. Множества, состоящие из конечного числа элементов, называются конечными множествами. Если же число элементов множества неограниченно, то такое множество

называется бесконечным. Например, множество всех натуральных чисел бесконечно.

Рассмотрим два каких-либо множества M и N и поставим вопрос о том, одинаково или нет количество элементов в этих множествах.

Если множество M конечно, то количество его элементов характеризуется некоторым натуральным числом — числом его элементов. В этом случае для сравнения количества элементов множеств M и N достаточно сосчитать число элементов в М, число элементов в N и сравнить полученные числа. Естественно также считать, что если одно из множеств M и N конечно, а другое бесконечно, то бесконечное множество содержит больше элементов, чем конечное.

Однако, если оба множества M и N бесконечны, то путь простого счета элементов ничего не дает. Поэтому сразу возникают такие вопросы: все ли бесконечные множества имеют одинаковое количество элементов, или же существуют бесконечные множества с большим и меньшим количеством элементов? Если верно второе, то каким способом можно сравнивать между собой количество элементов в бесконечных множествах? Этими вопросами мы теперь и займемся.

Взаимно однозначное соответствие. Пусть снова M и N — два конечных множества. Как узнать, какое из этих множеств содержит больше элементов, не считая числа элементов в каждом множестве? Для этого будем составлять пары, объединяя в пару один элемент из M и один элемент из N. Тогда, если какому-нибудь элементу из M не найдется парного к нему элемента из N, то в M больше элементов, чем в N. Поясним это рассуждение примером.

Пусть в зале находится некоторое число людей и некоторое число стульев. Чтобы узнать, чего больше, достаточно попросить людей занять места. Если кто-нибудь остался без места, значит, людей больше, а если, скажем, все сидят и заняты все места, то людей столько же, сколько стульев. Описанный способ сравнения количества элементов во множествах имеет то преимущество перед непосредственным счетом элементов, что он без особых изменений применяется не только к конечным, но и к бесконечным множествам.

Рассмотрим множество всех натуральных чисел

М = (1, 2, 3, 4, ...)

и множество всех четных чисел

N = {2, 4, 6, 8, ...}.

Какое множество содержит больше элементов? На первый взгляд кажется, что первое. Однако мы можем образовать из элементов этих множеств пары, как указано ниже.

Таблица 1

M

1

2

3

4

N

2

4

6

8

Ни один элемент M и ни один элемент N не остается без пары. Правда, мы могли бы также образовать пары и так:

Таблица 2

M

1

2

3

4

5

. . .

N

2

4

. . .

Тогда многие элементы из M остаются без пар. С другой стороны, мы могли бы составить пары и так:

Таблица 3

M

1

2

3

...

N

2

4

6

8

10

12

14

. . .

Теперь многие элементы из M остаются без пар.

Таким образом, если множества А и В бесконечны, то различным способам образования пар соответствуют разные результаты. Если существует такой способ образования пар, при котором у каждого элемента А и каждого элемента В имеется парный к нему элемент, то говорят, что между множествами А и В можно установить взаимно однозначное соответствие. Например, между рассмотренными выше множествами M и N можно установить взаимно однозначное соответствие, как это видно из табл. 1.

Если между множествами А и В можно установить взаимно однозначное соответствие, то говорят, что они имеют одинаковое количество элементов или равномощны. Если же при любом способе образования пар некоторые элементы из А всегда остаются без пар, то говорят, что множество А содержит больше элементов, чем В, или что множество А имеет большую мощность, чем В.

Таким образом, мы получили ответ на один из поставленных выше вопросов: как сравнивать между собой количество элементов в бесконечных множествах. Однако это нисколько не приблизило нас к ответу на другой вопрос: существуют ли вообще бесконечные множества,

имеющие различные мощности? Чтобы получить ответ на этот вопрос, исследуем некоторые простейшие типы бесконечных множеств.

Счетные множества. Если можно установить взаимно однозначное соответствие между элементами множества А и элементами множества всех натуральных чисел

Z={1, 2, 3. ...},

то говорят, что множество А счетно. Иными словами, множество А счетно, если все его элементы можно занумеровать посредством натуральных чисел, т. е. записать в виде последовательности

Табл. 1 показывает, что множество всех четных чисел счетно (верхнее число рассматривается теперь как номер соответствующего нижнего числа).

Счетные множества это, так сказать, самые маленькие из бесконечных множеств: во всяком бесконечном множестве содержится счетное подмножество.

Если два непустых конечных множества не пересекаются, то их сумма содержит больше элементов, чем каждое из слагаемых. Для бесконечных множеств это правило может и не выполняться. В самом деле, пусть Ч есть множество всех четных чисел, H — множество всех нечетных чисел и Z — множество всех натуральных чисел. Как показывает табл. 4, множества Ч и Н счетны. Однако множество Z = Ч+H вновь счетно.

Таблица 4

Ч

2

4

6

8

. . .

H

1

3

5

7

. . .

Z

1

2

3

4

. . .

Нарушение правила «целое больше части» для бесконечных множеств показывает, что свойства бесконечных множеств качественно отличны от свойств конечных множеств. Переход от конечного к бесконечному сопровождается в полном согласии с известным положением диалектики — качественным изменением свойств.

Докажем, что множество всех рациональных чисел счетно. Для этого расположим все рациональные числа в такую таблицу:

Здесь в первой строке помещены все натуральные числа в порядке их возрастания, во второй строке 0 и целые отрицательные числа в порядке их убывания, в третьей строке — положительные несократимые дроби со знаменателем 2 в порядке их возрастания, в четвертой строке — отрицательные несократимые дроби со знаменателем 2 в порядке их убывания и т. д. Ясно, что каждое рациональное число один и только один раз находится в этой таблице. Перенумеруем теперь все числа этой таблицы в том порядке, как это указано стрелками. Тогда все рациональные числа разместятся в порядке одной последовательности:

Номер места, занимаемого рациональным числом

1

2

3

4

5

6

7

8

9 . . .

Рациональное число

1,

2,

0,

3,

-1,

1/2,

4,

-2,

3/2, ...

Этим установлено взаимно однозначное соответствие между всеми рациональными числами и всеми натуральными числами. Поэтому множество всех рациональных чисел счетно.

Множества мощности континуума. Если можно установить взаимно однозначное соответствие между элементами множества M и точками отрезка 0⩽x⩽1 то говорят, что множество M имеет мощность континуума. В частности, согласно этому определению, само множество точек отрезка 0⩽x⩽1 имеет мощность континуума.

Из рис. 1 видно, что множество точек любого отрезка AB имеет мощность континуума. Здесь взаимно однозначное соответствие устанавливается геометрически, посредством проектирования.

Нетрудно показать, что множества точек любого интервала а<х<b и всей числовой прямой —∞ < х < + ∞ имеют мощность континуума.

Значительно более интересен такой факт: множество точек квадрата 0 ⩽ x ⩽ 1, 0 ⩽y ⩽ 1 имеет мощность континуума. Таким образом, грубо говоря, в квадрате «столько же» точек, сколько и в отрезке.

§ 3. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА1

Развитие понятия о числе подробно изложено в главе I (том 1). Здесь мы дадим читателю беглое представление о теориях действительных чисел, которые возникли в XIX в. в связи с обоснованием основных понятий анализа.

Рациональные числа. Мы предполагаем, что читатель знаком с основными свойствами рациональных чисел. Не вдаваясь в подробности, напомним эти свойства. Рациональные числа, т. е. числа вида

где m и n — целые и n≠0, представляют собою множество чисел, в котором определены две операции (сложение и умножение). Эти операции подчиняются ряду законов (аксиом). В дальнейшем а, b, с, . . . обозначают рациональные числа.

I. Аксиомы сложения.

1) а + b = b + а (коммутативность),

2) а + (b + с) = (а + b) + с (ассоциативность),

3) уравнение

a + X = b

имеет единственное решение (существование обратной операции).

Из этих аксиом непосредственно вытекает, что имеет однозначный смысл выражение а + b + с, что существует рациональное число О (нуль), для которого a+0 = a, и что для сложения существует обратная операция — вычитание, так что имеет смысл выражение b — а.

Таким образом, с алгебраической точки зрения, по отношению к операции сложения все рациональные числа образуют коммутативную группу.

Рис. 1.

1 При написании этого параграфа использованы ценные консультации А. Н. Колмогорова.

II. Аксиомы умножения.

1) ab = ba (коммутативность),

2) a (bc) = (ab) с (ассоциативность),

3) уравнение

ay = b,

где а ≠ 0, имеет единственное решение (существование обратной операции).

Из этих аксиом вытекает, что имеет смысл выражение abc, что существует рациональное число 1, для которого а∙1=а и что для рациональных чисел, отличных от 0, существует обратная операция — деление. Все рациональные числа, исключая число 0, образуют коммутативную группу по отношению к операции умножения.

III. Аксиома дистрибутивности.

1) (a+b)c = ac+bc.

Все аксиомы I—III показывают, что по отношению к операциям сложения и умножения рациональные числа образуют так называемое алгебраическое поле.

IV. Аксиомы упорядоченности.

1) Для любых двух рациональных чисел а и b имеет место одно и только одно из трех соотношений: либо а < b, либо а > b, либо а = b.

2) Если a<b и b<c, то a<c.

3) Если а<b, то а+с<b+с (монотонность сложения).

4) Если а<b и с>0, то ас<bс (монотонность умножения на с>0).

Все эти аксиомы позволяют назвать множество рациональных чисел упорядоченным полем.

Кроме рациональных чисел, существуют и другие системы объектов, которые удовлетворяют этим аксиомам и, следовательно, являются упорядоченными полями.

Отметим два важных свойства рациональных чисел.

Плотность: для любых а и b, а<b, найдется такое с, что а <с < b.

Счетность: множество всех рациональных чисел счетно (см. § 2).

Об измерении величин. Недостаточность одних лишь рациональных чисел для математики проявляется уже при рассмотрении такой важной задачи, как задача об измерении величин. Мы рассмотрим ее на простейшем примере задачи об измерении длин отрезков.

Представим себе прямую, на которой отмечены определенное направление, начало отсчета (точка 0) и единица масштаба. Тогда понятно, что такое отрезок OA с концом в точке 1/2, 1/3, 2/3, —1/3 и т. д. Вообще, каждому рациональному числу а можно поставить в соответствие точку А на прямой, а именно точку с координатой

х = а. В таком случае число а определяет длину направленного отрезка ОА. Однако при такой конструкции длина не всякого отрезка измеряется некоторым (рациональным) числом. Например, как это было известно уже древним грекам, длина диагонали квадрата со стороной, равной единице, не измеряется никаким рациональным числом. Иначе говоря, точек на прямой больше, чем рациональных точек. Естественный выход из этого положения — установление взаимно однозначного соответствия между числами и длинами, т. е. дальнейшее расширение понятия числа.

Действительные числа. Мы пришли к выводу, что одних рациональных чисел для измерения величин недостаточно и что понятие числа должно быть расширено таким образом, чтобы между числами и точками на прямой существовало взаимно однозначное соответствие. С этой целью постараемся выяснить, нельзя ли определить положение произвольной точки на прямой при помощи одних лишь рациональных точек. Аналогичная конструкция в области рациональных чисел и приведет нас к понятию действительного числа.

Пусть α — произвольная точка на прямой. Тогда все рациональные точки а можно разделить на две части: к одной части отнесем все те точки а, которые расположены левее α, a к другой — те точки а, которые находятся правее α. Что же касается самой точки а (если она случайно оказалась рациональной), то ее можно отнести к любой из частей. Такое разбиение рациональных точек принято называть сечением. Сечения будем считать тождественными, если совокупности рациональных точек, входящих в левые и правые части сечений, совпадают (с точностью до одной точки). Теперь нетрудно видеть, что различные точки α и ß определяют разные сечения. В самом деле, так как рациональные точки расположены на прямой всюду плотно, то найдутся рациональные точки r1 и r2, расположенные строго между α и β. Тогда для одного сечения они попадут в его правую часть, а для другого — в левую.

Итак, каждая точка на прямой определяет сечение в области рациональных точек и разным точкам соответствуют разные сечения. Очень важно, что сечения можно определить и несколько иначе, чем это было сделано выше, и притом так, чтобы само число а не фигурировало в этом определении. Именно, будем называть сечением в области рациональных точек такое разбиение всех рациональных точек на два непустых непересекающихся множества А и B, таких, что а <b для любых а∈А, b∈В. При таком определении по сечению можно однозначно восстановить ту точку (рубеж), которая производит его. Иными словами, при помощи сечений в области рациональных точек можно определить любую точку на прямой. Изложенная конструкция была предложена немецким математиком Р. Дедекиндом и носит название дедекиндова сечения.

Сечения — не единственный возможный способ определения положения любой точки при помощи рациональных точек. К обычной практике измерений ближе лежит следующий способ Г. Кантора. Пусть снова а — произвольная точка на прямой. Тогда можно найти две сколь угодно близкие рациональные точки а и b, такие, что а заключено между а и b. Точки а и 6 определяют приближенно положение точки а. Представим себе этот процесс приближенного определения точки а неограниченно продолженным, и притом так, что на каждом следующем шаге его точность все более и более увеличивается. Тогда мы получим систему отрезков [аn, bn] с концами в рациональных точках, таких, что [an+1, bn+1]⊆[an, bn] и bn — an→0 (n→ ∞). Система отрезков, удовлетворяющая этим условиям, называется стягивающейся системой отрезков. Ясно, что такая система отрезков однозначно определяет положение точки а.

При помощи аналогичных построений в области рациональных чисел можно определить действительные числа. Далее определяются действия между действительными числами и устанавливается, что они удовлетворяют тем же аксиомам, что и действия над рациональными числами. Теперь уже каждой точке на прямой соответствует действительное число и обратно. В силу этого совокупность всех действительных чисел часто называют числовой прямой.

Принципы непрерывности. Между множеством всех рациональных чисел и множеством всех действительных чисел имеется существенное различие. Именно, совокупность всех действительных чисел обладает рядом свойств, характеризующих непрерывность этого множества, в то время как множество всех рациональных чисел такими свойствами не обладает. Эти свойства принято называть принципами непрерывности. Перечислим здесь важнейшие из них.

Принцип Дедекинда. Если множество всех действительных чисел разбито на два непустых множества X и Y без общих элементов, так что для любых х∈Х, y∈Y выполняется неравенство х<у, то существует единственное число ξ (рубеж), для которого х⩽ξ⩽y для любых х∈Х, y∈Y. Множество действительных чисел х, удовлетворяющих неравенствам а⩽х⩽b, называется отрезком числовой прямой и обозначается через [а, b]. Система отрезков [an, bn] называется стягивающейся, если

Принцип Кантора. Для любой стягивающейся системы отрезков [аn, bn] существует одно и только одно действительное число с, принадлежащее каждому из этих отрезков.

Принцип Вейерштрасса. Всякая неубывающая ограниченная сверху последовательность действительных чисел сходится.

Будем говорить, что последовательность действительных чисел {xn} фундаментальна, если для любого е>0 найдется такое натуральное число N, что для всех n>N и всех натуральных р

Принцип Коши. Всякая фундаментальная последовательность действительных чисел сходится.

Поскольку мы не провели аккуратного построения действительных чисел, мы не имеем возможности установить, что для множества действительных чисел выполняются эти принципы. Наша ближайшая цель — рассмотреть, как эти принципы связаны друг с другом. Именно, допустим, что для действительных чисел имеет место один из принципов непрерывности, и исследуем, какие из остальных принципов непрерывности вытекают отсюда.

Общий вывод, к которому мы придем, это — что все принципы непрерывности эквивалентны.

Будем говорить, что число b является верхней гранью множества Е

если 1) x ⩽ b для любого х∈Е и 2) не существует числа b'<b, обладающего тем же свойством.

Покажем, что из принципа Дедекинда вытекает следующее предложение: каждое непустое ограниченное сверху множество чисел Е имеет верхнюю грань. В самом деле, разобьем все действительные числа на два класса X и Y по следующему признаку: положим х∈Х, если существует такое а∈Е, что а⩾х, и положим у∈Y, если для любого а∈Е имеем а<у. Легко проверить, что это — сечение. Согласно принципу Дедекинда, оно имеет рубеж ξ; этот рубеж и будет верхней гранью множества Е.

Покажем теперь, что из принципа Дедекинда вытекает принцип Вейерштрасса. Пусть {xn} — неубывающая ограниченная сверху последовательность действительных чисел. По только что доказанному она имеет верхнюю грань Е. Согласно определению верхней грани xn⩽ξ (n = 1, 2,...), для любого ε>0 найдется номер n0, такой, что xn0>ξ — ε. В силу монотонности последовательности {xn} отсюда вытекает, что ξ — ε<xп⩽ξ для всех п>п0, т. е. последовательность {xn} сходится и имеет предел

Для доказательства обратного соотношения между принципами Дедекинда и Вейерштрасса отметим, что из принципа Вейерштрасса вытекает так называемый

Принцип Архимеда. Каковы бы ни были действительные числа а>0 и b, можно найти такое натуральное число n, что nа > b.

Этот принцип означает, что для любого действительного числа b последовательность {b/n} (n = 1, 2,...) сходится к нулю.

Допустим, что выполняется принцип Вейерштрасса и не выполняется принцип Архимеда. Последнее означает, что существует такое

а>0, что последовательность xn = na ограничена. Кроме того, она возрастающая. По принципу Вейерштрасса она имеет некоторый предел ξ. Отсюда вытекает, что отрезок [ξ — a/2 , ξ] содержит некоторую точку xn = nа нашей последовательности. Но тогда xn+1 = (n + 1)а > ξ, что противоречит тому, что ξ есть верхняя грань {xn}.

Из принципа Вейерштрасса вытекает принцип Дедекинда. Пусть множество всех действительных чисел разбито на сумму двух непересекающихся множеств X и Y, так что х<у для любых х∈Х, y∈Y. Покажем, что это сечение имеет единственный рубеж ξ. Пусть m — целое, n — натуральное. Обозначим через xn наибольший элемент вида m/2n∈X, так что xn+1/2n∈Y. Так как множество элементов вида m/2n содержится в множестве элементов вида m/2n+1, то хn⩽xn+1. Кроме того, последовательность {xn}ограничена ^(апример, числом x1 + 1/2]. Отсюда по принципу Вейерштрасса она имеет некоторый предел ξ. Докажем, что ξ и есть рубеж нашего сечения. Действительно, если х<ξ, то х∈Х. Если же y>ξ, то y∈Y, так как из принципа Архимеда вытекает, что найдется такой номер n, что

а тогда

и, следовательно, y∈Y.

Можно также установить, что принципы Кантора и Коши эквивалентны. Однако из выполнения, например, принципа Коши еще не вытекает, что выполняется принцип Дедекинда. Это утверждение надо понимать в следующем смысле: существует упорядоченное поле, для которого принцип Коши выполняется, а принцип Дедекинда не выполняется. Если же заранее предположить, что выполняется принцип Архимеда, то все четыре принципа эквивалентны.

Несчетность континуума. Покажем, что множество всех точек отрезка 0⩽x⩽1 несчетно. Докажем это предложение от противного. Предположим, что множество всех точек отрезка 0⩽x⩽1 счетно. Тогда все точки х этого отрезка можно занумеровать при помощи натуральных чисел

(1)

Выберем на отрезке [0,1] отрезок σ1 так, чтобы его длина была меньше, чем 1, и чтобы он не содержал точки x1. Такой отрезок наверняка найдется. Далее, внутри отрезка σ1 выберем отрезок σ2 так, чтобы длина σ2 была меньше, чем 1/2 и чтобы отрезок σ2 не содержал точек х1 и x2. Вообще, после того как выбран отрезок σn-1 мы выбираем в нем отрезок σn так, чтобы длина его была меньше, чем 1/n и чтобы

отрезок σn не содержал точек x1, x2, . . ., xn. Мы построим таким образом бесконечную последовательность отрезков

такую, что каждый последующий отрезок содержится в предшествующем и длины отрезков стремятся к нулю с возрастанием n. Тогда в силу принципа Кантора (см. стр. 15) существует единственная точка х отрезка [0, 1], принадлежащая всем отрезкам σn. Так как, по нашему предположению, все точки отрезка [0, 1] записаны в ряду (1), то и точка X, общая всем отрезкам σn, совпадает с какой-то точкой xm этого ряда. Но по построению уже отрезок μ не содержит точки xm, и, следовательно, х≠хm. Таким образом, мы пришли к противоречию. Поэтому исходное предположение о счетности множества всех точек отрезка [0, 1] ложно, и, значит, множество всех точек отрезка [0, 1] несчетно, что и требовалось доказать.

Эта теорема показывает, что существуют различные бесконечные мощности, и, следовательно, дает положительный ответ на первый из вопросов, поставленных на стр. 8.

§ 4. ТОЧЕЧНЫЕ МНОЖЕСТВА

В предыдущем параграфе мы уже встречались со множествами, элементами которых являются точки. В частности, мы рассматривали множество всех точек какого-либо отрезка, множество всех точек (х, у) квадрата 0⩽x⩽1, 0⩽y⩽1. Теперь мы займемся более подробно изучением свойств таких множеств.

Множества, элементами которых являются точки, называются точечными множествами. Таким образом, можно говорить о точечных множествах на прямой, на плоскости, в каком-либо пространстве. Ради простоты мы ограничимся рассмотрением точечных множеств на прямой.

Между действительными числами и точками на прямой имеется тесная связь: каждому действительному числу можно отнести точку на прямой и обратно. Поэтому, говоря о точечных множествах, мы будем причислять к ним и множества, состоящие из действительных чисел — множества на числовой прямой. Обратно: для того чтобы задать точечное множество на прямой, мы будем обычно задавать координаты всех точек нашего множества.

Точечные множества (и, в частности, точечные множества на прямой) обладают рядом особых свойств, отличающих их от произвольных множеств и выделяющих теорию точечных множеств в самостоятельную математическую дисциплину. Прежде всего имеет смысл говорить о расстоянии между двумя точками. Далее, между точками на прямой можно установить соотношения порядка (левее, правее); в соответствии

с этим говорят, что точечное множество на прямой является упорядоченным множеством. Наконец, как уже отмечалось выше, для прямой справедлив принцип Кантора; это свойство прямой принято характеризовать как полноту прямой.

Введем обозначения для простейших множеств на прямой.

Отрезок [а, b]—множество точек, координаты которых удовлетворяют неравенствам а⩽х⩽b.

Интервал (а, b)—множество точек, координаты которых удовлетворяют условиям а<х<b.

Полуинтервалы [a, b) и (а, b] определяются соответственно условиями: а⩽х<b и а<х⩽b.

Интервалы и полуинтервалы могут быть несобственными. Именно, (—∞, ∞) обозначает всю прямую, а, например, (—∞, b]—множество всех точек, для которых х⩽b.

Начнем с рассмотрения различных возможностей расположения множества в целом на прямой.

Ограниченные и неограниченные множества. Множество Е точек на прямой может либо состоять из точек, расстояния которых от начала координат не превосходят некоторого положительного числа, либо иметь точки, сколь угодно далекие от начала координат. В первом случае множество Е называется ограниченным, а во втором — неограниченным. Примером ограниченного множества может служить множество всех точек отрезка [0, 1], а примером неограниченного множества—множество всех точек с целыми координатами.

Нетрудно видеть, что если а — фиксированная точка на, прямой, то множество Е будет ограничено в том и только в том случае, если расстояния от точки а до любой точки х ∈ Е не превосходят некоторого положительного числа.

Множества, ограниченные сверху и снизу. Пусть Е — множество точек на прямой. Если на прямой существует такая точка A, что любая точка х∈Е расположена левее точки А, то говорят, что множество Е ограничено сверху. Аналогично, если на прямой существует такая точка а, что любая точка х ∈ Е расположена правее точки а, то множество Е называется ограниченным снизу. Так, множество всех точек на прямой с положительными координатами ограничено снизу, а множество всех точек с отрицательными координатами ограничено сверху.

Ясно, что данное выше определение ограниченного множества эквивалентно следующему: множество Е точек на прямой называется ограниченным, если оно ограничено сверху и снизу. Несмотря на то, что эти два. определения очень похожи друг на друга, между ними имеется существенное различие: первое основано на том, что между точками на прямой определено расстояние, а второе, что эти точки образуют упорядоченное множество.

Можно также сказать, что множество ограничено, если оно целиком расположено на некотором отрезке [а, b].

Верхняя и нижняя грань множества. Пусть множество Е ограничено сверху. Тогда на прямой существуют точки .4, правее которых нет ни одной точки множества Е. Используя принцип Кантора, можно показать, что среди всех точек А, обладающих этим свойством, найдется самая левая. Эта точка называется верхней гранью множества Е. Аналогично определяется нижняя грань точечного множества.

Если во множестве Е есть самая правая точка, то она, очевидно, и будет верхней гранью множества Е. Однако может случиться, что во множестве Е нет самой правой точки. Например, множество точек с координатами

ограничено сверху и не имеет самой правой точки. В таком случае верхняя грань а не принадлежит множеству Е, но сколь угодно близко к а имеются точки множества Е. В приведенном выше примере а = 1.

Расположение точечного множества вблизи какой-либо точки на прямой. Пусть Е — точечное множество и х— какая-либо точка на прямой. Рассмотрим различные возможности расположения множества Е вблизи точки Х. Возможны следующие случаи:

1. Ни точка х, ни достаточно близкие к ней точки не принадлежат множеству Е.

2. Точка X не принадлежит Е, но сколь угодно близко к ней имеются точки множества Е.

3. Точка X принадлежит Е, но все достаточно близкие к ней точки не принадлежат Е.

4. Точка X принадлежит Е, и сколь угодно близко к ней имеются другие точки множества Е.

В случае 1 точка х называется внешней к множеству Е, в случае 3 — изолированной точкой множества Е, а в случаях 2 и 4 —предельной точкой множества Е.

Таким образом, если х ∈ Е, то точка х может быть либо внешней к Е, либо предельной для него, а если х ∈ Е, то она может быть либо изолированной точкой множества Е, либо его предельной точкой.

Предельная точка может принадлежать и не принадлежать множеству Е и характеризуется тем условием, что сколь угодно близко к ней имеются точки множества Е. Иными словами, точка х является предельной точкой множества Е, если любой интервал содержащий точку x, содержит бесконечно много точек множества Е. Понятие предельной точки является одним из весьма важных понятий теории точечных множеств.

Если точка х и все достаточно близкие к ней точки принадлежат множеству Е, то такая точка х называется внутренней точкой Е. Всякая точка X, которая не является для Е ни внешней, ни внутренней, называется граничной точкой множества Е.

Укажем несколько примеров, поясняющих все эти понятия.

Пример 1. Пусть множество E1 состоит из точек с координатами

Тогда каждая точка этого множества является его изолированной точкой, точка 0 есть предельная точка E1 (не принадлежащая этому множеству), а все остальные точки на прямой — внешние к E1.

Пример 2. Пусть множество E2 состоит из всех рациональных точек отрезка [0, 1]. Это множество не имеет изолированных точек, каждая точка отрезка [0, 1] является предельной точкой E2, а все остальные точки на прямой — внешние к E2. Ясно, что среди предельных точек множества E2 имеются как принадлежащие к нему, так и не принадлежащие ему.

Пример 3. Пусть множество E3 состоит из всех точек отрезка [0,1]. Как и в предыдущем примере, множество E3 не имеет изолированных точек, и каждая точка отрезка [0, 1] является его предельной точкой. Однако, в отличие от предыдущего примера, все предельные точки E3 принадлежат этому множеству.

Пример 4. Пусть множество E4 состоит из всех точек с целыми координатами на прямой. Каждая точка E4 является его изолированной точкой; множество E4 не имеет предельных точек.

Отметим также, что в примере 3 всякая точка интервала (0, 1) является внутренней точкой E3, а в примере 2 всякая точка отрезка [0, 1] — граничная точка E2.

Из приведенных выше примеров видно, что бесконечное множество точек на прямой может иметь изолированные точки (E1, E4), а может их не иметь (E2, E3); точно так же оно может иметь внутренние точки (E3) и может их не иметь (E1, E2, E4). Что же касается предельных точек, то лишь множество E4 примера 4 не имеет ни одной предельной точки. Как показывает следующая важная теорема, это связано с тем, что множество E4 неограничено.

Теорема Больцано—Вейерштрасса. Всякое ограниченное бесконечное множество точек на прямой имеет хотя бы одну предельную точку.

Докажем эту теорему. Пусть Е — ограниченное бесконечное множество точек на прямой. Так как множество Е ограничено, то оно целиком расположено на некотором отрезке [а, b]. Разделим этот отрезок пополам. Так как множество Е бесконечно, то хотя бы в одном из полученных отрезков лежит бесконечно много точек множества Е. Обозначим этот отрезок через σ1 (если в обеих половинах

отрезка [a, b] лежит бесконечно много точек множества Е, то через σ1 можно обозначить, например, левую). Далее, разделим отрезок σ1 на два равных отрезка. Так как часть множества Е, расположенная на отрезке σ1, бесконечна, то хотя бы один из полученных отрезков содержит бесконечно много точек множества Е. Обозначим этот отрезок через σ2. Продолжим неограниченно процесс деления отрезков пополам и будем каждый раз брать ту половину, которая содержит бесконечно много точек множества Е. Мы получим последовательность отрезков σ1, σ2, ..., σn,... Эта последовательность отрезков обладает такими свойствами: каждый следующий отрезок σn+1 содержится в предыдущем σn; каждый отрезок σn содержит бесконечно много точек множества Е; длины отрезков σn стремятся к нулю. Первые два свойства последовательности непосредственно вытекают из ее построения, а для доказательства последнего свойства достаточно заметить, что если длина отрезка [а, b] равна l, то длина отрезка σn равна l/2n.

В силу принципа Кантора существует единственная точка х, принадлежащая всем отрезкам σn. Покажем, что эта точка х является предельной точкой множества Е. Для этого достаточно установить, что если δ есть некоторый интервал, содержащий точку х, то он содержит бесконечно много точек множества Е. Так как каждый отрезок σn содержит точку х и длины отрезков σn стремятся к нулю, то при достаточно большом n отрезок σn будет целиком содержаться в интервале δ. Но по условию σn содержит бесконечно много точек множества Е. Поэтому и δ содержит бесконечно много точек множества Е. Итак, точка х действительно является предельной точкой множества Е, и теорема доказана.

Упражнение. Покажите, что если множество Е ограничено сверху и не имеет самой правой точки, то его верхняя грань является предельной точкой Е (и не принадлежит Е).

Замкнутые и открытые множества. Одна из основных задач теории точечных множеств — изучение свойств различных типов точечных множеств. Мы познакомим читателя с этой теорией на двух примерах. Именно, мы изучим здесь свойства так называемых замкнутых и открытых множеств.

Множество называется замкнутым, если оно содержит все свои предельные точки. Если множество не имеет ни одной предельной точки, то его тоже принято считать замкнутым. Кроме своих предельных точек, замкнутое множество может также содержать изолированные точки. Множество называется открытым, если каждая его точка является для него внутренней.

Приведем примеры замкнутых и открытых множеств. Всякий отрезок [а, b] есть замкнутое множество, а всякий интервал (а, b) — открытое множество. Несобственные полуинтервалы (—∞, b] и [а, ∞)

замкнуты, а несобственные интервалы (—∞, b) и (а, ∞) открыты. Вся прямая является одновременно и замкнутым и открытым множеством. Удобно считать пустое множество тоже одновременно замкнутым и открытым. Любое конечное множество точек на прямой замкнуто, так как оно не имеет предельных точек. Множество, состоящее из точек

замкнуто; это множество имеет единственную предельную точку х = 0, которая принадлежит множеству.

Наша задача состоит в том, чтобы выяснить, как устроено произвольное замкнутое или открытое множество. Для этого нам понадобится ряд вспомогательных фактов, которые мы примем без доказательства.

1. Пересечение любого числа замкнутых множеств замкнуто.

2. Сумма любого числа открытых множеств есть открытое множество.

3. Если замкнутое множество ограничено сверху, то оно содержит свою верхнюю грань. Аналогично, если замкнутое множество ограничено снизу, то оно содержит свою нижнюю грань.

Пусть Е — произвольное множество точек на прямой. Назовем дополнением множества Е и обозначим через СЕ множество всех точек на прямой, не принадлежащих множеству Е. Ясно, что если х есть внешняя точка для Е, то она является внутренней точкой для множества СЕ и обратно.

4. Если множество F замкнуто, то его дополнение CF открыто и обратно.

Предложение 4 показывает, что между замкнутыми и открытыми множествами имеется весьма тесная связь: одни являются дополнениями других. В силу этого достаточно изучить одни замкнутые или одни открытые множества. Знание свойств множеств одного типа позволяет сразу выяснить свойства множеств другого типа. Например, всякое открытое множество получается путем удаления из прямой некоторого замкнутого множества.

Приступаем к изучению свойств замкнутых множеств. Введем одно определение. Пусть F — замкнутое множество. Интервал (а, b), обладающий тем свойством, что ни одна из его точек не принадлежит множеству F, а точки а и b принадлежат F, называется смежным интервалом множества F. К числу смежных интервалов мы будем также относить несобственные интервалы (а, ∞) или (—∞, b), если точка а или точка b принадлежит множеству F, а сами интервалы с F не пересекаются. Покажем, что если точка х не принадлежит замкнутому множеству F, то она принадлежит одному из его смежных интервалов.

Обозначим через Fx часть множества F, расположенную правее точки Х. Так как сама точка х не принадлежит множеству F, то Fx можно представить в форме пересечения

Каждое из множеств F и [х, ∞) замкнуто. Поэтому, в силу предложения 1, множество Fx замкнуто. Если множество Fx пусто, то весь полуинтервал ∞) не принадлежит множеству F. Допустим теперь, что множество Fx не пусто. Так как это множество целиком расположено на полуинтервале [х, ∞), то оно ограничено снизу. Обозначим через b его нижнюю грань. Согласно предложению 3, b∈Fx, а значит b∈F. Далее, так как b есть нижняя грань множества Fx, то полуинтервал [х, b), лежащий левее точки b, не содержит точек множества Fx и, следовательно, не содержит точек множества F. Итак, мы построили полуинтервал b), не содержащий точек множества F, причем либо b = ∞, либо точка b принадлежит множеству F. Аналогично строится полуинтервал (а, х], не содержащий точек множества F, причем либо а = —∞, либо а ∈ F. Теперь ясно, что интервал (а, b) содержит точку х и является смежным интервалом множества F. Легко видеть, что если (a1, b1) и (a2, b2) — два смежных интервала множества F, то эти интервалы либо совпадают, либо не пересекаются.

Из предыдущего следует, что всякое замкнутое множество на прямой получается путем удаления из прямой некоторого числа интервалов, а именно смежных интервалов множества F. Так как каждый интервал содержит по крайней мере одну рациональную точку, а всех рациональных точек на прямой — счетное множество, то легко убедиться, что число всех смежных интервалов не более чем счетно. Отсюда получаем окончательный вывод. Всякое замкнутое множество на прямой получается путем удаления из прямой не более чем счетного множества непересекающихся интервалов.

В силу предложения 4, отсюда сразу вытекает, что всякое открытое множество на прямой представляет собой не более чем счетную сумму непересекающихся интервалов. В силу предложений 1 и 2, ясно также, что всякое множество, устроенное, как указано выше, действительно является замкнутым (открытым).

Как видно из нижеследующего примера, замкнутые множества могут иметь весьма сложное строение.

Канторово совершенное множество. Построим одно специальное замкнутое множество, обладающее рядом замечательных свойств. Прежде всего удалим из прямой несобственные интервалы (—∞, 0) и (1, ∞). После этой операции у нас останется отрезок [0, 1]. Далее, удалим из этого отрезка интервал (1/3, 2/3), составляющий его среднюю треть.

Из каждого из оставшихся двух отрезков [0, 1/3] и [2/3, 1] удалим его среднюю треть. Этот процесс удаления средних третей у остающихся отрезков продолжим неограниченно. Множество точек на прямой, остающееся после удаления всех этих интервалов, называется канторовым совершенным множеством; мы будем обозначать его буквой Р.

Рассмотрим некоторые свойства этого множества. Множество Р замкнуто, так как оно образуется путем удаления из прямой некоторого множества непересекающихся интервалов. Множество Р не пусто; во всяком случае в нем содержатся концы всех выброшенных интервалов.

Замкнутое множество F называется совершенным, если оно не содержит изолированных точек, т. е. если каждая его точка является предельной точкой. Покажем, что множество Р совершенно. Действительно, если бы некоторая точка х была изолированной точкой множества Р. то она служила бы общим концом двух смежных интервалов этого множества. Но, согласно построению, смежные интервалы множества Р не имеют общих концов.

Множество Р не содержит ни одного интервала. В самом деле, допустим, что некоторый интервал δ целиком принадлежит множеству Р. Тогда он целиком принадлежит одному из отрезков, получающихся на n-м шаге построения множества Р. Но это невозможно, так как при n→∞ длины этих отрезков стремятся к нулю.

Можно показать, что множество Р имеет мощность континуума. В частности, отсюда следует, что канторово совершенное множество содержит, кроме концов смежных интервалов, еще и другие точки. Действительно, концы смежных интервалов образуют лишь счетное множество.

Разнообразные типы точечных множеств постоянно встречаются в самых различных разделах математики, и знание их свойств совершенно необходимо при исследовании многих математических проблем. Особенно большое значение имеет теория точечных множеств для математического анализа и топологии.

Приведем несколько примеров появления точечных множеств в классических разделах анализа. Пусть f(x) — непрерывная функция, заданная на отрезке [а, b]. Зафиксируем число а и рассмотрим множество тех точек х, для которых f(x)⩾α. Нетрудно показать, что это множество может быть произвольным замкнутым множеством, расположенным на отрезке [а, b]. Точно так же множество точек х, для которых f(x)> α, может быть каким угодно открытым множеством G⊂[а, b]. Если f1(x), f2(x), ..., fn(x), ... есть последовательность непрерывных функций, заданных на отрезке [а, b], то множество тех точек X, где эта последовательность сходится, не может быть произвольным, а принадлежит к вполне определенному типу.

Математическая дисциплина, занимающаяся изучением строения точечных множеств, называется дескриптивной теорией множеств. Весьма большие заслуги в деле развития дескриптивной теории множеств принадлежат советским математикам— Н. Н. Лузину и его ученикам П. С. Александрову, М. Я. Суслину, А. Н. Колмогорову, М. А. Лаврентьеву, П. С. Новикову, Л. В. Келдыш, А. А. Ляпунову и др.

Исследования Н. Н. Лузина и его учеников показали, что имеется глубокая связь между дескриптивной теорией множеств и математической логикой. Трудности, возникающие при рассмотрении ряда задач дескриптивной теории множеств (в частности, задач об определении мощности тех или иных множеств), являются трудностями логической природы. Напротив, методы математической логики позволяют более глубоко проникнуть в некоторые вопросы дескриптивной теории множеств.

§ 5. МЕРА МНОЖЕСТВ

Понятие меры множества является далеко идущим обобщением понятия длины отрезка. В простейшем случае (которым только мы и будем заниматься) задача состоит в том, чтобы дать определение длины не только для отрезков, но также и для более сложных точечных множеств, расположенных на прямой.

Примем за единицу измерения отрезок [0, 1]. Тогда длина произвольного отрезка [а, b], очевидно, равна b— а. Точно так же если имеется два непересекающихся отрезка [a1, b1] и [а2, b2], то под длиной множества Е, состоящего из этих двух отрезков, естественно понимать число (b1— a1)+(b2 — a2). Однако далеко не так ясно, что следует понимать под длиной множества более сложной природы, расположенного на прямой; например, чему равна длина канторова множества Р, рассмотренного в § 4 этой главы? Отсюда вывод: понятие длины множества, расположенного на прямой, нуждается в строгом математическом определении.

Задача определения длины множеств, или, как говорят еще, задача измерения множеств, весьма важна, так как она имеет существенное значение для обобщения понятия интеграла. Понятие меры множества применяется и в других вопросах теории функций, а также в теории вероятностей, топологии, функциональном анализе и т. д.

Ниже излагается определение меры множеств, предложенное французским математиком А. Лебегом и лежащее в основе данного им определения интеграла.

Мера открытого и замкнутого множества. Начнем с определения меры произвольного открытого или замкнутого множества. Как уже отмечалось в § 4, всякое открытое множество на прямой является конечной или счетной суммой попарно не пересекающихся интервалов.

Мерой открытого множества называется сумма длин составляющих его интервалов.

Таким образом, если

и интервалы (ai, bi) попарно не пересекаются, то мера G равна Σ(bi — ai). Обозначая вообще меру множества Е через μЕ, можем написать

В частности, мера одного интервала равна его длине

Всякое замкнутое множество F, содержащееся в отрезке [а, b] и такое, что концы отрезка [а, b] принадлежат F, получается из отрезка [а, b] путем удаления из него некоторого открытого множества G. В соответствии с этим мерой замкнутого множества F⊆.[a, b], где a∈F, b∈F, называется разность между длиной отрезка [а, b] и мерой открытого множества G, дополнительного к F (относительно [а, b]).

Итак,

(2)

Нетрудно усмотреть, что, согласно этому определению, мера произвольного отрезка равна его длине

а мера множества, состоящего из конечного числа точек, равна нулю.

Общее определение меры. Для того чтобы дать определение меры множеств более общей природы, чем открытые и замкнутые, нам понадобится одно вспомогательное понятие. Пусть Е — некоторое множество, лежащее на отрезке [а, b]. Рассмотрим всевозможные покрытия множества Е, т. е. всевозможные открытые множества V (Е), содержащие Е. Мера каждого из множеств V (Е) уже определена. Совокупность мер всех множеств V (Е) есть некоторое множество положительных чисел. Это множество чисел ограничено снизу (хотя бы числом 0) и потому имеет нижнюю грань, которую мы обозначим через μeЕ. Число μeE называется внешней мерой множества Е.

Пусть μеЕ — внешняя мера множества Е, а μеСЕ — внешняя мера его дополнения относительно отрезка [а, b].

Если удовлетворяется соотношение

(3)

то множество Е называется измеримым, а число μеЕ — его мерой: μE = μeE; если соотношение (3). не удовлетворяется, то говорят, что множество Е неизмеримо; неизмеримое множество не имеет меры.

Отметим, что всегда

(4)

Сделаем несколько пояснений. Длина простейших множеств (например, интервалов и отрезков) обладает рядом замечательных свойств. Укажем важнейшие из них.

1. Если множества E1 и Е измеримы и E1⊆E, то

т. е. мера части множества Е не превосходит меры всего множества Е. 2. Если множества E1 и E2 измеримы, то множество Е = Е1 + Е2 измеримо и

т. е. мера суммы не превосходит суммы мер слагаемых.

3. Если множества Ei (i = 1, 2,...) измеримы и попарно не пересекаются, EiEj = θ (i≠j), то их сумма Е = ΣЕi измерима и

т. е. мера конечной или счетной суммы попарно непересекающихся множеств равна сумме мер слагаемых.

Это свойство меры называется ее полной аддитивностью.

4. Мера множества Е не меняется, если его сдвинуть как твердое тело.

Желательно, чтобы основные свойства длины сохранялись и для более общего понятия меры множеств. Но, как можно совершенно строго показать, это оказывается невозможным, если приписывать меру произвольному множеству точек на прямой. Поэтому-то в данном выше определении и появляются множества, имеющие меру или измеримые, и множества, не имеющие меры или неизмеримые. Впрочем, класс измеримых множеств настолько широк, что это обстоятельство не вносит каких-либо существенных неудобств. Даже построение примера неизмеримого множества представляет известные трудности.

Приведем несколько примеров измеримых множеств.

Пример 1. Мера канторова совершенного множества Р (см. § 4). При построении множества Р из отрезка [0, 1] выбрасывается сперва один смежный интервал длины 1/3, затем два смежных интервала длины затем четыре смежных интервала длины 1/27 и т. д.

Вообще, на n-м шаге выбрасывается 2n-1 смежных интервалов длины 1/3n.

Таким образом, сумма длин всех выброшенных интервалов равна

Члены этого ряда представляют собою геометрическую прогрессию с первым членом 1/3 и знаменателем 2/3. Поэтому сумма ряда S равна

Итак, сумма длин всех смежных к канторовому множеству интервалов равна 1. Иначе говоря, мера дополнительного к Р открытого множества G равна 1. Поэтому само множество имеет меру

Как показывает этот пример, множество может иметь мощность континуума и тем не менее иметь меру, равную нулю.

Пример 2. Мера множества В всех рациональных точек отрезка [0, 1]. Покажем прежде всего, что μеR = 0. В § 2 было установлено, что множество В счетно. Расположим точки множества В в последовательность

Далее, зададим ε>0 и окружим точку rn интервалом δn длины .

Сумма δ = Σδn есть открытое множество, покрывающее В. Интервалы δn могут пересекаться, поэтому

Так как е можно выбрать сколь угодно малым, то μeR = 0. Далее, согласно (3)

Так как СR содержится в отрезке [0, 1], то

Итак, откуда

(5)

Этот пример показывает, что множество может быть всюду плотным на некотором отрезке и тем не менее иметь меру, равную нулю.

Множества меры нуль во многих вопросах теории функций не играют никакой роли, и ими следует пренебрегать. Например, функция f(x) интегрируема по Риману в том и только в том случае, если она ограничена и множество ее точек разрыва имеет меру нуль. Можно было бы привести значительное число таких примеров.

1 То же самое рассуждение показывает, что всякое счетное множество точек на прямой имеет меру нуль.

Измеримые функции. Переходим к одному из наиболее блестящих приложений понятия меры множеств, а именно к описанию того класса функций, с которыми фактически оперирует математический анализ и теория функций. Точная постановка задачи такова. Если последовательность функций (fn(х)}, заданных на некотором множестве Е, сходится в каждой точке Е, кроме, быть может, точек множества N меры нуль, то будем говорить, что последовательность (fn(x)} сходится почти всюду.

Какие функции можно получить из непрерывных функций путем повторного применения операции построения предела почти всюду сходящейся последовательности функций и алгебраических операций?

Для ответа на этот вопрос нам потребуется несколько новых понятий.

Пусть функция f(x) определена на некотором множестве Е и а — произвольное действительное число. Обозначим через

E [f(x)>α]

множество тех точек Е, для которых f(x)>α. Например, если функция f(x) определена на отрезке [0, 1] и на этом отрезке f(x) = x, то множества E [f(x)>α] равны [0, 1] для α<0, равны (α, 1] для 0⩽α<1 и пусты для α⩾1.

Функция f(x), определенная на некотором множестве Е, называется измеримой, если само множество Е измеримо и для любого действительного числа а измеримо множество Е [f(х)> α].

Можно показать, что произвольная непрерывная функция, заданная на отрезке, измерима. Однако к числу измеримых функций принадлежат также и многие разрывные функции, например функция Дирихле, равная 1 для иррациональных точек отрезка [0, 1] и равная 0 для остальных точек этого отрезка.

Отметим без доказательства, что измеримые функции обладают следующими свойствами.

1. Если f(x) и φ(х) — измеримые функции, определенные на одном и том же множестве Е, то функции

также измеримы (последняя, если φ≠0).

Это свойство показывает, что алгебраические операции над измеримыми функциями снова приводят к измеримым функциям.

2. Если последовательность измеримых функций {fn(x)}, определенных на множестве Е, сходится почти всюду к функции f(x), то эта функция также измерима.

Таким образом, операция построения предела почти всюду сходящейся последовательности измеримых функций вновь приводит к измеримым функциям.

Эти свойства измеримых функций были установлены Лебегом. Глубокое исследование измеримых функций было произведено советскими математиками Д. Ф. Егоровым и Н. Н. Лузиным. В частности, Н. Н. Лузин показал, что всякую измеримую функцию, заданную на отрезке, можно превратить в непрерывную, изменив ее значения на некотором множестве сколь угодно малой меры.

Этот классический результат Н. Н. Лузина и перечисленные выше свойства измеримых функций позволяют показать, что измеримые функции и представляют собой тот класс функций, о котором шла речь в начале этого пункта. Измеримые функции имеют также большое значение для теории интегрирования, именно, понятие интеграла может быть обобщено таким образом, чтобы всякая ограниченная измеримая функция оказалась интегрируемой. Подробнее об этом рассказывается в следующем параграфе.

§ 6. ИНТЕГРАЛ ЛЕБЕГА

Переходим к центральному вопросу этой главы — определению и описанию свойств интеграла Лебега.

Чтобы понять принцип устройства этого интеграла, рассмотрим следующий пример. Пусть имеется большое количество монет различного достоинства и требуется сосчитать общую сумму денег, заключенную в этих монетах. Это можно сделать двумя способами. Можно откладывать монеты подряд и прибавлять стоимость каждой новой монеты к общей стоимости всех ранее отложенных. Однако можно поступить и иначе: сложить монеты стопочками так, чтобы в каждой стопочке были монеты одного достоинства, затем сосчитать число монет в каждой стопочке, умножить это число на стоимость соответствующей монеты, а затем сложить полученные числа. Первый способ счета денег соответствует процессу интегрирования Римана, а второй — процессу интегрирования Лебега.

Переходя от монет к функциям, мы можем сказать, что для вычисления интеграла Римана производится деление на мелкие части области задания функции (оси абсцисс; рис. 2а), а для вычисления интеграла Лебега производится деление области значений функции (оси ординат; рис. 2б). Последний принцип применялся практически задолго до Лебега при вычислении интегралов от функций, имеющих колебательный характер, однако Лебег впервые развил его во всей общности и дал его строгое обоснование при помощи теории меры.

Рассмотрим, как связаны между собою мера множеств и интеграл Лебега. Пусть Е — какое-либо измеримое множество, расположенное на некотором отрезке [а, b]. Построим функцию φ(x), равную 1 для х,

принадлежащих Е, и равную 0 для х, не принадлежащих Е. Иными словами, положим

Фунцкию φ(x) принято называть характеристической функцией множества Е. Рассмотрим интеграл

Рис. 2а.

Рис. 2б.

Мы уже привыкли считать, что интеграл равен площади фигуры 7), ограниченной осью абсцисс, прямыми х = а, х = b и кривой у = у(х) [см. главу II (том 1)]. Так как в данном случае «высота» фигуры D отлична от нуля и равна 1 для точек х ∈ Е и только для этих точек, то (согласно формуле, площадь равна длине, умноженной на ширину) ее площадь должна быть численно равна длине (мере) множества Е. Итак, I должно быть равно мере множества Е

(6)

Именно так и определяет Лебег интеграл от функции φ(x).

Читатель должен твердо уяснить себе, что равенство (6) является определением интеграла ∫φ(x)dx как интеграла Лебега. Может случиться, что интеграл I не будет существовать в том смысле, как это понималось в главе II (том 1), т. е. как предел интегральных сумм. Даже если это последнее имеет место, интеграл I как интеграл Лебега существует и равен μЕ.

В качестве примера подсчитаем интеграл от функции Дирихле Ф(х), равной 0 в рациональных точках отрезка [0, 1] и равной 1 в иррациональных точках этого отрезка. Так как, согласно (5), мера множества иррациональных точек отрезка [0, 1] равна 1, то интеграл Лебега

равен 1. Нетрудно проверить, что интеграл Римана от этой функции не существует.

Одно вспомогательное предложение. Пусть теперь f(x) — произвольная ограниченная измеримая функция, заданная на отрезке [а, b]. Покажем, что всякую такую функцию можно сколь угодно точно представить в виде линейной комбинации характеристических функций множеств. Чтобы убедиться в этом, разобьем отрезок оси ординат между нижней и верхней гранями значений функции А и В точками y0=А, y1, ..., yn = В на отрезки длины меньшей ε, где ε — произвольное фиксированное положительное число. Далее, если в точке х∈ [а, b]

то положим в этой точке

a если в точке х

то положим

Построение функции φ(х) показано на рис. 3.

Согласно построению функции φ(х), в любой точке отрезка [а, b]

Кроме того, так как функция φ(х) принимает лишь конечное число значений y0, y1, ... yn, то ее можно записать в виде

(7)

где φi(x) — характеристическая функция того множества, где φ(х) = yi, т. е. yi ⩽ f(х) < yi+1 (в каждой точке х∈[а, b] лишь одно слагаемое в правой части формулы (7) отлично от нуля!) Этим наше предложение установлено.

Определение интеграла Лебега. Переходим к определению интеграла Лебега от произвольной ограниченной измеримой функции. Так как функция φ(x) мало отличается от функции f(x), то в качестве приближенного значения интеграла от функции f(x) можно принять интеграл от функции φ(х). Но, замечая, что функции φi(x) являются характеристическими функциями множеств, и пользуясь формально обычными правилами вычисления интеграла, получаем

Рис. 3.

где μеi есть мера множества ei тех х, для которых

Итак, приближенным значением интеграла Лебега от функции f(x) является «интегральная сумма Лебега»

В соответствии с этим интеграл Лебега определяется как предел интегральных сумм Лебега S, когда

что соответствует равномерной сходимости функций φ(x) к функции f(x).

Можно показать, что интегральные суммы Лебега имеют предел для любой ограниченной измеримой функции, т. е. любая ограниченная измеримая функция интегрируема по Лебегу. Интеграл Лебега можно также распространить на некоторые классы неограниченных измеримых функций, но мы не будем этим заниматься.

Свойства интеграла Лебега. Интеграл Лебега обладает всеми хорошими свойствами обычного интеграла, именно, интеграл от суммы равен сумме интегралов, постоянный множитель можно выносить за знак интеграла и т. д. Однако интеграл Лебега обладает еще одним замечательным свойством, которым обычный интеграл не обладает : если измеримые функции fn (х) ограничены в совокупности :

для любого n и любого X из отрезка [а, b] и последовательность {fn(x)} сходится почти всюду к функции f(x), то

Иными словами, интеграл Лебега допускает безотказный переход к пределу. Именно это свойство интеграла Лебега делает его весьма удобным, а часто и неизбежным инструментом во многих исследованиях. В частности, интеграл Лебега совершенно необходим в теории тригонометрических рядов, в теории функциональных пространств (см. главу XIX) и других разделах математики.

Приведем пример. Пусть f(х) — периодическая функция с периодом 2π и

— ее ряд Фурье. Если, например, функция f(x) непрерывна, то, как нетрудно показать,

(8)

Это тождество носит название равенства Парсеваля. Рассмотрим такой вопрос: для какого класса периодических функций справедливо равенство Парсеваля (8)? Ответ на этот вопрос гласит: равенство Парсеваля (8) выполняется в том и только в том случае, если функция f(x) измерима на отрезке [0, 2π] и функция f2(х) интегрируема по Лебегу на этом отрезке.

ЛИТЕРАТУРА

Популярная литература

Лебег А. Об измерении величин. ГОНТИ, 1938.

Маркушевич А. И. Действительные числа и основные принципы теории пределов. Учпедгиз, 1948.

Университетские учебники

Александров П. С. Введение в общую теорию множеств и функций. Гостехиздат, 1948.

Александров П. С. и Колмогоров А. Н. Введение в теорию функций действительного переменного. Изд. 3-е, ГОНТИ, 1938.

Натансон И. П. Теория функций вещественной переменной. Гостехиздат, 1950.

Специальные монографии

Лебег А. Интегрирование и отыскание примитивных. ГТТИ, 1934.

Хаусдорф Ф. Теория множеств. ГОНТИ, 1937.

Глава XVI

ЛИНЕЙНАЯ АЛГЕБРА

§ 1. ПРЕДМЕТ ЛИНЕЙНОЙ АЛГЕБРЫ И ЕЕ АППАРАТ

Линейные функции и матрицы. Среди функций от одной переменной наиболее простой является так называемая линейная функция l(х) = ах+b. Ее графиком является, как известно, простейшая из линий — прямая.

Вместе с тем линейная функция — одна из важнейших. Дело в том, что всякая «гладкая» линия на малом участке похожа на прямую, и чем меньше участок кривой, тем теснее она примыкает к прямой линии. На языке теории функций это значит, что любая «гладкая» (непрерывно дифференцируемая) функция при малом изменении независимой переменной близка к линейной функции. Линейная функция может быть охарактеризована тем, что ее приращение пропорционально приращению независимой переменной. В самом деле: Δl(x) = l(x0+Δx) —

Обратно, если

то

Но из дифференциального исчисления мы знаем, что в приращении любой дифференцируемой функции естественным образом выделяется главная часть, так называемый дифференциал функции, пропорциональный приращению независимой переменной, и приращение функции отличается от ее дифференциала на бесконечно малую более высокого порядка, чем приращение независимой переменной. Таким образом дифференцируемая функция при бесконечно малом изменении независимой переменной действительно близка к линейной функции с точностью до бесконечно малой более высокого порядка.

Аналогично обстоит дело и с функциями от нескольких переменных.

Линейной функцией от нескольких переменных называется функция вида a1х1 + a2х2 + ... + anxn + b. Если b = 0, то линейная функция называется однородной. Линейная функция от нескольких переменных характеризуется следующими двумя свойствами:

1. Приращение линейной функции, вычисленное в предположении, что лишь одна из независимых переменных приобретает некоторое приращение при неизменных значениях для остальных, пропорционально приращению этой независимой переменной.

2. Приращение линейной функции, вычисленное в предположении, что все независимые переменные получают некоторое приращение, равно алгебраической сумме приращений, получающихся от изменения каждой переменной в отдельности.

Линейная функция от нескольких переменных играет среди всех функций от этих переменных ту же роль, что и линейная функция от одной переменной среди всех функций одной переменной. Именно, любая «гладкая» функция (т. е. функция, имеющая непрерывные частные производные по всем переменным) при малом изменении независимых переменных близка к некоторой линейной функции. В самом деле, приращение такой функции w = f(x1, x2, ...,xn) равно с точностью до малых высших порядков полному дифференциалу

который есть линейная однородная функция от приращений независимых переменных dx1, ...,dxn. Отсюда следует, что сама функция w, равная сумме ее начального значения и приращения, выражается через независимые переменные при малом их изменении в виде линейной неоднородной функции с точностью до малых высших порядков.

Задачи, решение которых требует рассмотрения функций от нескольких переменных, возникают в связи с изучением зависимости одной величины от нескольких факторов. Задача называется линейной, если оказывается линейной исследуемая зависимость. На основании указанных выше свойств линейной функции, линейная задача может быть охарактеризована следующими свойствами.

1. Свойство пропорциональности. Результат действия каждого отдельного фактора пропорционален его величине.

2. Свойство независимости. Общий результат действия равен сумме результатов действий отдельных факторов.

То, что любая «гладкая» функция при малых изменениях переменных может быть в первом приближении заменена линейной, есть отражение общего принципа — любая задача, об изменении некоторой величины в зависимости от действия нескольких факторов может рассматриваться в первом приближении, при малых воздействиях, как задача линейная, т. е. обладающая свойствами независимости и пропорциональности. Часто оказывается, что такое рассмотрение дает удовлетворительный для практики результат (классическая теория упругости, теория малых колебаний и т. д.).

Изучаемые физические величины часто сами характеризуются несколькими числами (сила— тремя проекциями на оси координат, напряженное состояние упругого тела в данной точке — шестью компонентами так называемого тензора напряжения и т. д.). Поэтому возникает необходимость одновременного рассмотрения нескольких функций от нескольких переменных, а в первом приближении — нескольких линейных функций.

Линейная функция от одной переменной настолько проста по своим свойствам, что не требует никакого специального рассмотрения. Иначе обстоит дело с линейными функциями от нескольких переменных, где наличие многих переменных вносит некоторые специфические особенности. Дело еще более осложняется, если перейти от одной функции нескольких переменных x1, x2,...,xn к совокупности нескольких функций y1, y2, ...,ym от тех же переменных. Здесь в качестве «первого приближения» появляется совокупность линейных функций:

Совокупность линейных функций есть уже довольно сложный математический объект, и его исследование богато интересным и нетривиальным содержанием.

Учение о линейных функциях и их совокупностях и составляет в первую очередь предмет той ветви алгебры, которая называется линейной алгеброй.

Исторически первой задачей линейной алгебры является задача о решении системы линейных уравнений:

Простейший случай этой задачи рассматривается в школьном курсе элементарной алгебры. Задача о приемах возможно более простого и наименее трудоемкого численного решения систем при больших n до сих пор привлекает пристальное внимание многих ученых, так как численное решение систем входит как важная составная часть во многие расчеты и исследования.

Линейные однородные функции иначе называются линейными формами. Данная система линейных форм

описывается системой коэффициентов, так как свойства такой системы форм зависят именно от численных значений коэффициентов, а название переменных не является существенным.

Например, системы форм

обладают, конечно, одинаковыми свойствами и могут не считаться существенно различными.

Совокупность коэффициентов системы линейных форм естественно задавать в виде прямоугольной таблицы

Такие таблицы носят название матриц. Числа aij называются элементами матрицы. Потребность в рассмотрении матриц с необходимостью возникает из самого предмета линейной алгебры.

Важными частными случаями матриц являются матрицы, состоящие из одного столбца, называемые просто столбцами, матрицы, состоящие из одной строки, называемые строками, и, наконец, квадратные матрицы, т. е. такие, у которых число строк равно числу столбцов. Число строк (или столбцов) квадратной матрицы называется ее порядком. «Матрица» (а), состоящая из одного числа а, отождествляется с этим числом.

В связи с простейшими действиями над совокупностью линейных форм естественным образом определяются действия над матрицами. Пусть даны две системы линейных форм

Сложим эти формы соответственно

Естественно считать, что матрица получившейся системы форм

является суммой матриц

Аналогичным образом, произведение матрицы

на число с определяется как матрица коэффициентов в системе форм cy1, су2, ..., суm, где y1, y2, ..., ym — формы, коэффициенты которых образуют матрицу

Из этого определения видно, что

Наконец, действие умножения матрицы на матрицу определяется следующим образом. Пусть

(1)

Подставив в (1) выражения y1, y2, ..., ym через x1, x2, ..., xn, получим, что z1, z2, ..., zk выражаются через x1, x2, ..., xn тоже в виде линейных форм

Матрица коэффициентов

называется произведением матриц

и обозначается через

Нетрудно подсчитать, как выражаются элементы произведения двух матриц через элементы их сомножителей. Элемент есть коэффициент при xj в выражении zi через x1, ..., xn.

Следовательно,

откуда

Итак, элемент i-й строки и j-го столбца произведения двух матриц равен сумме произведений элементов i-й строки первого сомножителя на соответствующие элементы j-го столбца второго сомножителя. Например:

Хотя матрица является, так сказать, «составным» объектом, в состав которого входит много элементов, полезно и удобно обозначать ее одной буквой, сохраняя при этом для действий сложения и умножения обычные обозначения. Мы будем пользоваться для обозначения матриц большими буквами латинского алфавита. Применение таких сокращенных обозначений вносит простоту и обозримость в теорию матриц, охватывая в кратких формулах, напоминающих формулы обычной алгебры, сложные соотношения, связывающие множество чисел — эле-

ментов матриц, участвующих в этих формулах. Так, например, совокупность линейных форм

в матричных обозначениях выглядит как АХ, где А — матрица коэффициентов, X — «столбец», составленный из переменных x1, ...,xn. Система линейных уравнений

записывается как

АХ = В,

где А — матрица коэффициентов, X — столбец из неизвестных, В — столбец из свободных членов.

Основные действия над матрицами — действия сложения и умножения— определены, конечно, не всегда. Действие сложения имеет смысл для матриц одинакового строения, т. е. имеющих одинаковое число строк и столбцов. В результате сложения получается матрица того же строения. Действие умножения имеет смысл, если число столбцов первой матрицы равно числу строк второй. В результате получается матрица, число строк которой равно числу строк первого сомножителя, а число столбцов равно числу столбцов второго сомножителя.

Действия над квадратными матрицами подчиняются большей части законов действий над числами, но некоторые законы оказываются нарушенными.

Перечислим основные свойства действий над матрицами:

(переместительный закон для сложения).

(сочетательный закон для сложения).

(распределительные законы при умножении на число. Здесь с, c1, c2 — числа, а не матрицы).

(сочетательный закон умножения на число).

5. Существует «нулевая» матрица

такая, что

при любой матрице А.

6. с 0 = 0 А = 0; обратно, если сА = 0, то с = 0 или А = 0 (здесь с — число).

7. Для любой матрицы А существует противоположная матрица —А, т. е. такая, что A + (—А) = 0.

(распределительные законы для сложения и умножения матриц).

(сочетательный закон для умножения).

Эти свойства имеют место не только для квадратных, но и для любых прямоугольных матриц, с единственной оговоркой, что действия, входящие в каждую из перечисленных формул, должны быть определены. Для квадратных матриц одинакового порядка эта оговорка естественно отпадает.

Приведенные свойства действий аналогичны свойствам действий над числами.

Укажем теперь на две особенности действий над матрицами.

Во-первых, при умножении матриц, даже квадратных, переместительный закон может не иметь места, т. е. AB не всегда равно ВА. Например:

Во-вторых, известно, что произведение двух чисел равно нулю в том и только в том случае, если хотя бы один из сомножителей равен нулю. Эта теорема является, как известно, основной в теории алгебраических уравнений. При умножении матриц она оказывается неверной. Именно, произведение двух матриц может равняться нулевой матрице, хотя ни один из сомножителей не равен нулевой матрице. Например:

Отметим еще одно свойство умножения матриц. Матрица А будет называться транспонированной к матрице А, если в каждой строке А расположить элементы соответствующего столбца матрицы А с сохранением порядка. Например, для матрицы

транспонированной будет матрица

Действие умножения матриц связано с операцией транспонирования формулой

которая легко проверяется на основании правила умножения матриц.

Теория матриц составляет важную и неотъемлемую часть линейной алгебры, играя роль аппарата при постановке и решении ее задач.

Геометрические аналогии в линейной алгебре. Кроме описанного выше источника возникновения идей и задач линейной алгебры — потребностей математического анализа, геометрия, в частности аналитическая геометрия, тоже нуждается в развитии линейной алгебры и со своей стороны обогащает ее важными идеями и аналогиями. Известно, что аналитическая геометрия на плоскости и в еще большей мере в пространстве, в части, касающейся теории прямых и плоскостей, использует в простейшей форме аппарат линейной алгебры. Действительно, прямая линия на плоскости задается линейным уравнением с двумя переменными, которое связывает две координаты любой точки прямой. Плоскость в пространстве задается линейным уравнением с тремя переменными (координатами произвольной точки этой плоскости), прямая в пространстве — двумя линейными уравнениями.

Известно, что особенная простота и ясность вносятся в аналитическую геометрию, а следовательно, и в теорию простейших систем линейных уравнений, если использовать понятие вектора. Подобную же простоту и ясность вносит в линейную алгебру, в частности в общую теорию систем линейных уравнений, использование понятия вектора в некотором обобщенном смысле. Путь для этого обобщения следующий. Вектор (в пространстве) задается тремя числами — тремя проекциями на оси координат. Каждая тройка действительных чисел в свою очередь может быть изображена геометрически в виде вектора (в пространстве).

Для векторов определены действия сложения («по правилу параллелограма») и умножения на число. Эти действия определяются в соответствии с аналогичными действиями над силами, скоростями, ускорениями и другими физическими величинами, изображаемыми посредством векторов.

Если векторы задаются своими координатами (т. е. проекциями на координатные оси), то действиям сложения и умножения на число, производимым над векторами, соответствуют одноименные действия над строками (или столбцами) из их координат.

Таким образом, строку или столбец из трех элементов удобно геометрически интерпретировать как вектор в трехмерном пространстве, при этом основные действия над «строками» (или «столбцами») интерпретируются соответствующими действиями над векторами в пространстве, так что алгебра строк (или столбцов) из трех элементов формально

ничем не отличается от алгебры векторов трехмерного пространства. Это обстоятельство делает естественным введение в линейную алгебру геометрической терминологии.

Столбец (или строка) из n чисел

рассматривается как «вектор», т. е. как элемент некоторого n-мерного векторного пространства».

Суммой векторов

считается вектор

произведением вектора

на число с считается вектор

Совокупность всех векторов (столбцов) составляет, по определению, n-мерное арифметическое векторное пространство.

Наряду с n-мерным арифметическим векторным пространством можно ввести понятие n-мерного точечного пространства, сопоставляя каждому столбцу из n действительных чисел геометрический образ — точку. Тогда n-мерное векторное пространство определяется следующим образом. Каждой паре точек А и В сопоставляем вектор AB, идущий из точки А в точку В, считая, по определению, его координатами (проекциями на оси координат) разности соответствующих координат точек В и А. Два вектора считаются равными, если равны их соответствующие координаты, аналогично тому, как в трехмерном пространстве мы считаем векторы равными, если один из них получается из другого параллельным переносом.

Между векторами n-мерного векторного пространства и точками n-мерного точечного пространства естественным образом устанавливается взаимно однозначное соответствие.

Точка

принимается за «начало координат», и каждой точке соотносится вектор, соединяющий начало координат с этой точкой. Тогда каждому вектору сопоставляется точка, являющаяся концом этого вектора, в предположении, что его начало совмещено с началом координат. Введение точечного пространства создает новые аналогии, позволяющие лучше «видеть» в n-мерном пространстве.

Однако при дальнейших обобщениях (§ 2) строгое определение точечного пространства становится значительно более сложным и поэтому мы не будем использовать это понятие. Читателю, желающему пользоваться аналогиями, возникающими из рассмотрения точечного пространства, следует представлять себе элементы векторного пространства как векторы, исходящие из начала координат.

Введение геометрической терминологии дает возможность использовать в линейной алгебре аналогии, основанные на геометрической интуиции, создающейся при изучении геометрии трехмерного пространства.

Конечно, этими аналогиями нужно пользоваться с известной осторожностью, имея в виду возможность проверить строго логически каждое наглядно-геометрическое рассуждение и применяя только точные определения «геометрических» понятий и строго доказанные теоремы.

Характерной особенностью элементов n-мерного векторного пространства является наличие действий сложения и умножения на число, по своим свойствам напоминающих действия над числами. Именно, как уже было отмечено в описании свойств действий над матрицами, для действия сложения выполнены переместительный и сочетательный законы, верны распределительные законы (при умножении на число), действие сложения однозначно обратимо, произведение вектора на число дает нулевой вектор в том и только в том случае, если либо вектор есть нулевой вектор, либо число равно нулю.

Однако упомянутыми особенностями обладают не только столбцы (и строки). Ими обладают и совокупности матриц одинакового строения и физические векторные величины: силы, скорости, ускорения и т. д. Ими обладают и некоторые математические объекты совершенно другой природы, например: совокупность всех многочленов от одной переменной, совокупность всех непрерывных функций, заданных на данном отрезке [а, b], совокупность всех решений линейного однородного дифференциального уравнения и т. д.

Указанное обстоятельство делает полезным дальнейшее обобщение векторного пространства, именно введение общих линейных пространств. Элементами таких обобщенных пространств могут быть любые математические или физические объекты, для которых некоторым естественным образом определены действия сложения и умножения на число. Такой весьма общий и отвлеченный подход к понятию линейного пространства не вносит, как мы увидим далее, никаких осложнений в теорию: любое линейное (конечно, n-мерное; что это значит, будет объяснено в следующем параграфе) пространство по своему строению и свойствам ничем не отличается от арифметического линейного пространства, но область приложений при этом обобщении значительно расширяется, появляется возможность применять методы линейной алгебры к весьма широкому кругу задач теоретического естествознания.

§ 2. ЛИНЕЙНОЕ ПРОСТРАНСТВО

Определение линейного пространства. Переходим к строгому определению линейного пространства.

Линейным пространством называется совокупность объектов любой природы, для которых имеют смысл понятия суммы и произведения на число, удовлетворяющих следующим требованиям:

2. Существует «нулевой» элемент 0, такой, что X+0 = Х при любом X.

3. Для любого элемента X существует противоположный — X, такой, что Х+(—Х) = 0.

Здесь X, Y, Z—элементы линейного пространства; 1, c1, c2, с — числа.

Эти требования (называемые иначе аксиомами линейного пространства) весьма естественны и представляют собой формальное описание тех свойств действий сложения и умножения на число, которые неотъемлемо связывают с понятиями этих действий, в каком бы обобщенном смысле они ни понимались. Действия, имеющие тот или иной физический смысл, трактуются как сложение и умножение на число именно в тех случаях, когда эти действия удовлетворяют требованиям 1—8.

Отметим некоторые следствия из этих аксиом.

а) Нулевой элемент 0 пространства единственен, т. е. существует только один элемент, удовлетворяющий аксиоме 2.

б) Для данного элемента X существует единственный противоположный элемент.

в) Имеет смысл «вычитание», т. е. по данной сумме и одному из слагаемых всегда определяется второе слагаемое и при этом только одно. Именно: если X + Z= К, то Z=Y+(—X).

г) 0 — Х=с-0 = 0.

д) Если сХ = 0, то или с= 0, или Х = 0.

е) —Х=(—1)Х.

Доказательства этих следствий очень просты, и мы не будем на них останавливаться. В дальнейшем элементы линейного пространства мы будем называть векторами.

Линейная зависимость и независимость векторов. Перейдем теперь к важному понятию линейной зависимости и независимости векторов.

Линейной комбинацией векторов X1, Х2, ..Xm называется вектор c1Х1 +с2Х2 + . .. +cmXm при некоторых численных значениях коэффициентов c1, c2, .. ., cm. Если среди векторов X1, Х2, . .., Xm найдется

хотя бы один, являющийся линейной комбинацией остальных, то векторы X1, Х2, . . ., Xm называются линейно-зависимыми. Если же ни один из векторов X1, Х2, . . ., Xm не является линейной комбинацией остальных, то векторы X1, Х2,..., Xm называются линейно-независимыми.

Легко видеть, что для линейной независимости векторов X1, X2, . . ., Xm необходимо и достаточно, чтобы соотношение c1Х1 + c2Х2 + ... +cmXm = 0 выполнялось только при c1 = c2= ... = cm = 0.

Для векторов в обычном трехмерном пространстве понятия линейной зависимости и независимости имеют простой геометрический смысл.

Пусть имеются два вектора Х1 и Х2. Линейная зависимость их означает, что один из векторов является «лилейной комбинацией» другого, т. е. просто отличается от него численным множителем. Это значит, что оба вектора укладываются на общей прямой, т. е. они имеют одинаковое или противоположное направление.

Обратно, если два вектора укладываются на одной прямой, то они линейно-зависимы. Следовательно, линейная независимость двух векторов Х1 и Х2 означает, что эти векторы не могут быть уложены на одну прямую; их направления существенно различны.

Рассмотрим теперь, что означает линейная зависимость и независимость трех векторов. Допустим, что векторы X1, Х2 и Х3 линейно-зависимы, и положим для определенности, что вектор Х3 является линейной комбинацией векторов Х1 и Х2. Тогда Х3, очевидно, расположен в плоскости, содержащей векторы Х1 и Х2, т. е. все три вектора Хг, Х2, Х3 укладываются на одной плоскости. Легко видеть, что если векторы X1, Х2, Х3 лежат в одной плоскости, то они линейно-зависимы. Действительно, если векторы Х1 и Х2 не лежат на одной прямой, то Х3 можно разложить по Х1 и Х2, т. е. представить Х3 в виде линейной комбинации Х1 и Х2. Если же Х1 и Х2 лежат на одной прямой, то уже Х1 и Х2 линейно-зависимы.

Итак, линейная зависимость трех векторов Х1, Х2, Х3 равносильна тому, что они лежат в одной плоскости. Следовательно, Х1, Х2, Х3 линейно-независимы в том и только в том случае, если они не укладываются на одной плоскости.

Четыре вектора в трехмерном пространстве всегда линейно-зависимы. Действительно, если векторы Х1, Х2, Х3 линейно-зависимы, то при любом X4 векторы Х1, Х2, Х3, Х4 тоже линейно-зависимы. Если же X1, Х2, Х3 линейно-независимы, то они не лежат в одной плоскости и любой вектор Х4 можно разложить по Х1, Х2, Х3, т. е. представить в виде их линейной комбинации.

Проведенные рассуждения можно обобщить следующим образом.

В трехмерном пространстве векторы Х1, Х2,..., Хk (k⩾3) линейно-зависимы в том и только в том случае, если они укладываются в пространство (прямая или плоскость) с числом измерений, меньшим к.

В дальнейшем, после строгого определения подпространства и размерности, мы увидим, что и в общем случае линейная зависимость векторов X1, Х2, ..., Хк равносильна тому, что они укладываются в пространство, размерность которого меньше к, т. е. «геометрический» смысл линейной зависимости остается тот же самый, что для векторов в трехмерном пространстве.

В теории линейных пространств играет существенную роль следующая теорема. Если векторы X1, Х2, ..., Xm являются линейными комбинациями векторов Y1, Y2, . .., Yk и m > k, то векторы X1, Х2, ..., Xm линейно-зависимы (теорема о линейной зависимости линейных комбинаций).

Для к = 1 теорема очевидна. Для к>1 теорема легко доказывается методом математической индукции по числу к.

Базис и размерность пространства. В трехмерном пространстве любые три вектора X1, Х2, Х3, не лежащие в одной плоскости (т. е. линейно-независимые), образуют базис этого пространства, это значит, что любой вектор пространства может быть разложен по векторам Х1, Х2, Х3, т. е. представлен в виде их линейной комбинации.

Общие линейные векторные пространства могут быть резко разделены на два типа.

Возможно, что в пространстве существует сколь угодно большое число линейно-независимых векторов. Такие пространства называются бесконечномерными и их изучение выходит за рамки линейной алгебры, являясь предметом специальной математической дисциплины — функционального анализа (см. главу XIX).

Линейное пространство называется конечномерным, если в нем существует конечная граница для числа линейно-независимых векторов, т. е. такое число n, что в пространстве существует n линейно-независимых векторов, но любые векторы в числе, большем n, линейно-зависимы. Число n называется размерностью или числом измерений пространства.

Так, пространство векторов обычного геометрического трехмерного пространства трехмерно и в смысле данного общего определения. Действительно, в трехмерном геометрическом пространстве существует сколько угодно троек линейно-независимых векторов, но любые четыре вектора уже линейно-зависимы.

Пространство n-членных столбцов n-мерно в смысле данного определения. Действительно, в этом пространстве существует n линейно-независимых векторов, например векторы

(2)

но всякий вектор

этого пространства является их линейной комбинацией, именно: x1е1 +х2е2+ ... +xnеn. Следовательно, в силу теоремы о линейной зависимости линейных комбинаций, любые векторы в числе, большем n, линейно-зависимы.

Многочлены от одной переменной образуют линейное пространство. В самом деле, для многочленов естественным образом определены действия сложения и умножения на число, удовлетворяющие аксиомам 1—8. Однако это пространство бесконечномерно, ибо векторы 1, x, xN линейно-независимы при любом N. Совокупность же многочленов, степени которых не превосходят данного числа N, образуют конечномерное пространство, размерность которого равна N+1. Действительно, векторы 1, X, ..., хN линейно-независимы и число их равно N + 1. Всякий же многочлен, степень которого не превосходит N, является линейной комбинацией 1, x, ..., хN, и, следовательно, по той же теореме о линейной зависимости любые многочлены степени ⩽N, взятые в числе, большем N+1, линейно-зависимы.

Введем теперь важное понятие базиса для n-мерного пространства. Базисом называется такая совокупность линейно-независимых векторов пространства, что любой вектор пространства является линейной комбинацией векторов этой совокупности. Так, в пространстве столбцов базисом является, например, совокупность векторов (2). В пространстве многочленов степени ⩽N за базис можно принять «векторы» 1, X, ..., хN. В трехмерном геометрическом пространстве роль базиса играет любая тройка линейно-независимых векторов.

В n-мерном линейном пространстве любая совокупность из n линейно-независимых векторов (а существование хотя бы одной такой совокупности содержится в определении n-мерного пространства) образует базис пространства. Действительно, пусть e1, e2, ..., en — линейно-независимые векторы n-мерного линейного пространства и X — какой-либо вектор пространства. Тогда векторы X, e1, ..., en линейно-зависимы (ибо их число больше n), т. е. найдутся числа с, c1, c2, . .., cn, не равные нулю одновременно, такие, что сХ+с1е1+...+cnen = 0. При этом с≠0, ибо если бы с = 0, векторы e1, e2, en были бы линейно-зависимыми. Следовательно,

т. е. любой вектор

пространства есть линейная комбинация векторов e1, e2, ..., en.

Любой базис n-мерного линейного пространства состоит ровно из n векторов. Действительно, векторы базиса линейно-независимы, и потому число их не может быть больше n. С другой стороны, пусть e1, e2, ..., ek какой-либо базис n-мерного пространства. Уже установлено,

что к⩽п. Но любой вектор пространства, по определению базиса, является линейной комбинацией векторов e1, e2, ..., ek, и, в силу теоремы о линейной зависимости линейных комбинаций, любые векторы, взятые в числе, большем к, линейно-зависимы, откуда следует, что размерность пространства n не больше числа векторов базиса к. Итак, к = n, что и требовалось доказать.

Введем теперь координаты вектора относительно данного базиса e1, e2, ... en. Как уже было сказано выше, любой вектор X является линейной комбинацией векторов базиса. Такое представление единственно. Действительно, пусть вектор X выражается через базис e1, e2, ..., en двумя способами:

Тогда

откуда следует, в силу линейной независимости e1, e2, ..., en, что х = x1', ... , xn = х'n. Коэффициенты x1, x2, ..., xn в разложении произвольного вектора X через векторы базиса называются координатами вектора X в этом базисе. Таким образом, любому вектору, если только выбран базис пространства, естественным образом сопоставляется строка (или столбец) из его координат, и наоборот: любая строка (или столбец) из n чисел может рассматриваться как совокупность координат некоторого вектора.

Действиям сложения векторов и умножения вектора на число соответствуют одноименные действия над строками (или столбцами) из координат.

Поэтому любое n-мерное линейное пространство, независимо от природы его элементов (будут они функциями, матрицами, какими-либо физическими величинами и т. д.), по отношению к этим действиям ничем не отличается от пространства строк (или столбцов). Таким образом, как уже было сказано раньше, обобщенный, аксиоматический подход к понятию линейного пространства не вносит никаких усложнений по сравнению с трактовкой пространства как пространства строк, но значительно расширяет круг приложений этого понятия.

Тождественность свойств двух совокупностей объектов по отношению к заданной системе действий (или каких-либо других отношений между элементами) называется в математике изоморфизмом. Точное определение изоморфизма алгебраических систем будет дано в главе XX. Пользуясь этим термином, мы можем сказать, что все n-мерные линейные пространства, независимо от природы их элементов, изоморфны друг другу и изоморфны единой модели — пространству строк.

Подпространства. Совокупность векторов n-мерного линейного пространства Rn, удовлетворяющая требованию, что каждая линейная ком-

бинация любых векторов рассматриваемой совокупности тоже принадлежит к ней, называется подпространством этого пространства. Очевидно, что подпространство пространства Rn само является линейным пространством и, следовательно, имеет базис и размерность. Очевидно также, что размерность подпространства не превосходит размерности всего пространства и может равняться ей в том и только в том случае, когда подпространство совпадает со всем пространством.

Примерами подпространств трехмерного векторного пространства могут служить рассматриваемые с точностью до переноса плоскости и прямые, точнее, совокупности всех векторов, укладывающихся на одной плоскости или на одной прямой.

Наиболее часто приходится рассматривать подпространства, «натянутые» на систему векторов. Эти подпространства определяются следующим образом. Пусть дана система линейно-независимых или зависимых векторов X1, Х2, ..., Xm пространства Rn. Тогда совокупность всех линейных комбинаций этих векторов { c1Х1 + c2Х2 + ... + cmXm } образует подпространство пространства Rn, которое и называется подпространством, натянутым на векторы Х1, Х2, ..., Xm.

Размерность такого подпространства называется рангом системы векторов X1, Х2, ..., Xm. Легко видеть, что ранг системы векторов равен максимальному числу линейно-независимых векторов, содержащихся в этой системе.

«Совокупность», состоящая только из нулевого вектора, формально удовлетворяет требованиям, предъявляемым к подпространству. Размерность этого подпространства считается равной нулю.

Если даны два подпространства пространства Rn, то из них естественным образом конструируются еще два подпространства — их векторная сумма и пересечение.

Векторной суммой двух подпространств Р и Q называется совокупность всех сумм векторов, принадлежащих подпространствам Р и Векторную сумму можно рассматривать также как подпространство, натянутое на объединение базисов подпространств Р и Q.

Пересечением двух подпространств называется совокупность всех векторов, принадлежащих обоим подпространствам. Например, векторной суммой двух плоскостей (т. е. двумерных векторных подпространств) в обычном трехмерном пространстве является все пространство (если только плоскости не совпадают), а пересечением — прямая линия (при той же оговорке).

Размерности р и q двух данных подпространств, размерность t их векторной суммы и размерность s их пересечения удовлетворяют следующему интересному соотношению:

Доказательство этого утверждения мы опускаем.

Из этого соотношения можно сделать некоторые выводы, касающиеся пересечения подпространств в частных случаях. Например, две несовпадающие плоскости (т. е. двумерные подпространства) в пространстве четырех измерений пересекаются, вообще говоря, только в точке (размерность их пересечения равна нулю) и две плоскости пересекаются по прямой только в том случае, если их векторная сумма трехмерна, т. е. если обе плоскости укладываются в некоторое трехмерное подпространство. Действительно, в этом случае t+s = 2+2 = 4, откуда следует, что s = 1 только при t = 3.

Комплексное линейное пространство. При описании пространства строк и общего линейного пространства мы не уточняли, о каких числах идет речь, когда определяется действие умножения вектора на число. Так как мы исходили из обобщения обычных векторов, т. е. направленных отрезков в геометрическом трехмерном пространстве, то мы имели в виду любые действительные числа. Построенные таким образом линейные пространства, называемые действительными линейными пространствами, наиболее естественным образом обобщают трехмерное пространство обычных векторов. Однако для многих задач современной математики оказывается полезным рассмотрение комплексного линейного пространства. Под этим термином понимается совокупность объектов, для которых определены действия сложения и умножения на любое комплексное число, причем эти действия удовлетворяют всем аксиомам 1—8. Примером комплексного пространства может служить пространство строк, элементами которых являются любые комплексные числа.

Формально теория комплексных пространств ничем существенно не отличается от теории действительных пространств.

Однако даже двумерное комплексное пространство не имеет наглядной геометрической интерпретации. Дело в том, что n-мерное комплексное пространство можно рассматривать и как действительное, ибо поскольку для его элементов определено действие умножения на любые комплексные числа, тем самым определено и действие умножения на действительное число. Но размерность комплексного n-мерного пространства, рассматриваемого как действительное, будет равна 2n, т. е. вдвое больше. В самом деле, если e1, e2, . .., en есть базис комплексного пространства, то за базис этого пространства, рассматриваемого как действительное, можно принять, например, векторы

Следовательно, двумерное комплексное пространство может быть интерпретировано как действительное, но четырехмерное.

Далее, теория линейных пространств не претерпевает формально никаких изменений, если в качестве совокупности чисел, на которые

допускается умножение «векторов» пространства, брать какие-либо другие совокупности чисел, отличные от совокупности всех действительных и всех комплексных чисел, лишь бы результаты основных арифметических действий — сложения, вычитания, умножения и деления — над числами этой совокупности снова к ней принадлежали. Совокупности чисел, удовлетворяющие этим требованиям, носят название числовых полей. (Более подробно это понятие рассматривается в главе XX.) Примером числового поля может служить, например, поле рациональных чисел.

В некоторых разделах алгебры, близких к теории чисел, с успехом применяется теория линейных пространств над произвольным полем.

я-мерное эвклидово пространство. В предыдущем изложении еще не были обобщены некоторые важные понятия обычного векторного пространства, в частности понятия длины вектора и угла между векторами. Известно, что в аналитической геометрии в вопросах, касающихся пересечения прямых и плоскостей, параллельности и многих других, эти понятия и не используются. Свойства пространства, описание которых не нуждается в понятиях длины вектора и угла, могут быть охарактеризованы как свойства, не нарушающиеся при любых аффинных преобразованиях [см. главу III (том 1), § 11]. По этой причине линейные пространства, в которых не определены понятия длины вектора, называются аффинными пространствами.

Однако многие задачи математики требуют обобщения понятий длины вектора и угла на n-мерные пространства. Эти обобщения производятся посредством аналогий с теорией векторов на плоскости и в пространстве.

Рассмотрим сначала действительное пространство строк. Длина вектора Х=(x1, x2, ..., xn) считается, по определению, равной числу |X|= √x12 + x22 + ... +xn2. Это совершенно естественно, так как при n = 2 и n = 3 именно по этой формуле вычисляется длина вектора через его координаты относительно декартовых осей координат.

Понятие угла между векторами вводится естественным способом из следующих соображений. На плоскости и в пространстве угол между векторами X и Y есть угол при вершине А в треугольнике со сторонами АВ = |Х|, АС = |Y| и ВС = |Х— Y|.

Для n-мерного пространства естественно принять это за определение угла между векторами, т. е. как бы считать, что пару векторов можно «извлечь» из n-мерного пространства и «положить» на плоскость с сохранением их длин и угла между ними. Однако в таком определении имеется нестрогость: существование треугольника А ВС с длинами векторов |Х|, |Y| и |Х—Y| нуждается в доказательстве.

Пренебрегая этой неточностью, выведем формулу для вычисления угла. По известной формуле тригонометрии

откуда

Если, как и для трехмерного пространства, для произведения длин векторов на косинус угла между ними сохранить термин «скалярное произведение», то мы получим, что скалярное произведение векторов вычисляется по формуле

которая при n = 2 и n = 3 совпадает с известной формулой для скалярного произведения обычных векторов.

Строго говоря, выражение x1у1+ ... +xnуn нужно принять за определение скалярного произведения (ибо в определении скалярного произведения при помощи угла была допущена нестрогость), а затем определить угол между векторами по формуле

(3)

Так мы и сделаем.

Для законности такого определения угла необходимо доказать, что правая часть формулы (3) по абсолютной величине не превосходит 1, т. е. что (ХY)2⩽|X|2|Y|2.

В развернутой форме это неравенство имеет вид

Оно носит название неравенства Коши—Буняковского и может быть доказано непосредственным, но довольно громоздким вычислением. Мы докажем его путем следующего косвенного рассуждения.

Прежде всего отметим, что скалярное умножение векторов обладает следующими свойствами:

Выполнение этих свойств непосредственно следует из выражения скалярного произведения через координаты.

Введем теперь в рассмотрение вектор Y+ tX, где t — любое действительное число. Имеем | Y+tX|2⩾0, ибо квадрат длины вектора не может быть отрицательным. Но в силу свойств скалярного произ-

ведения

Далее известно, что

квадратный трехчлен может оставаться неотрицательным при всех значениях действительной переменной t только в том случае, если его корни мнимые или равные, т. е. если его дискриминант отрицателен или равен нулю. Но дискриминант трехчлена |Y|2 + 2tXY+t2|X|2 равен 4(XY)2 — 4 |X|2|Y|2, и, следовательно, (X⋅Y)2 — |X|2|Y|2⩽0, что равносильно неравенству Коши—Буняковского.

Из доказанного неравенства вытекает, что

и, следовательно, определение угла по формуле (3) законно. Далее, легко выводятся неравенства

из которых, в частности, следует существование треугольника со сторонами |Х|, |Y| и |Х—Y|, так что данное выше нестрогое, но геометрически наглядное определение угла также приобретает законную силу.

Аксиоматическое определение n -мерного эвклидова пространства. В предыдущем пункте мы ввели понятие длины вектора, угла и скалярного произведения в пространстве строк. В общем аксиоматически определенном n-мерном действительном линейном пространстве эти понятия определяются тоже аксиоматически, причем в основу кладется понятие скалярного произведения.

Скалярным умножением векторов линейного действительного пространства называется сопоставление каждой паре векторов X и Y действительного числа, называемого их скалярным произведением X⋅Y, причем это сопоставление должно удовлетворять следующим требованиям (аксиомам):

Далее, за длину вектора принимается число √Х⋅Х, за косинус угла между векторами X и Y—число, равное XY/|X||Y|. Для законности этого последнего определения необходимо установить справедливость неравенства Коши—Буняковского (X⋅Y)2⩽|X|2|Y|2. Но это делается совершенно так же, как было сделано в предыдущем пункте. В проведенном доказательстве как раз и были использованы только свойства 1', 2', 3' и 4' скалярного произведения, специфика пространства строк в этом доказательстве не играла никакой роли. Действительное линейное пространство, в котором введено скалярное умножение, удовлетворяющее аксиомам 1'—4', называется эвклидовым пространством.

В различных конкретных линейных пространствах, изучаемых в математике, скалярное произведение вводится различными способами, выбор которых обусловливается существом вопроса. Например, в пространствах, элементами которых служат функции от одной переменной X(t), определенные на заданном промежутке a⩽t⩽b, за скалярное произведение двух элементов X(t) и Y (t) часто принимается число

где р (t) — некоторая положительная функция. Легко видеть, что при каждом из этих определений все аксиомы 1'—4' выполняются.

Ортогональность. Ортонормальный базис. Два вектора эвклидова пространства называются ортогональными (или перпендикулярными), если их скалярное произведение равно нулю. Легко видеть, что попарно-ортогональные ненулевые векторы всегда линейно-независимы. Действительно, пусть X1, Х2, ..., Xm — попарно-ортогональные ненулевые векторы, и пусть c1Х1+с2Х2 + ...+cmXm = 0.

По свойству скалярного произведения Х1(c1Х1 + c2x2 + . . . +cmXm) = c1|Х1|2 = 0, откуда c1 = 0. Таким же образом доказывается, что c2=...=cm = 0. Следовательно, Х1, ..., Xm линейно-независимы.

Из доказанного следует, что в n-мерном пространстве может существовать не более n попарно-ортогональных ненулевых векторов, и каждая совокупность из n попарно-ортогональных векторов образует базис пространства. Если, кроме того, длины всех n попарно-ортогональных векторов равны единице, то образованный ими базис называется ортонормальным.

Нетрудно доказать, но мы на этом не будем останавливаться, что в эвклидовом пространстве существуют ортонормальные базисы и их даже бесконечно много. Более того, если в пространстве R выбрано некоторое подпространство Р, то ортонормальный базис подпространства можно дополнить посредством присоединения нескольких векторов до ортонормального базиса всего пространства.

Векторы в эвклидовом пространстве удобнее всего задавать координатами в каком-либо ортонормальном базисе, так как в этом случае получается особенно простое выражение для скалярного произведения. Действительно, если вектор X имеет координаты (x1, x2, ..., xn) в ортонормальном базисе e1, e2, ..., en, а вектор Y—координаты (y1,y2,.. .,yn), т.е.

то по свойству скалярного произведения

так как

В частности,

Таким образом, длина вектора и скалярное произведение выражаются через координаты ортонормального базиса по тем же формулам, что и в пространстве строк.

Переход от одной из моделей эвклидова пространства — пространства строк — к общему аксиоматически определенному эвклидову пространству не влечет за собой никаких осложнений, но только расширяет область приложения теории.

Рассмотрим еще вопрос об ортогональном проектировании векторов на подпространство. Пусть Rn— некоторое n-мерное эвклидово пространство и Pm— его m-мерное подпространство. Пусть, далее, e1, e2, ... ..., em, f1, ..., fn—m — ортонормальный базис Rn, включающий ортонормальный базис подпространства Pm. Подпространство Qn-m, натянутое на векторы f1, f2, fn—m, называется ортогонально-дополнительным к подпространству Pm. Его размерность равна n — m. Ортогонально-дополнительное подпространство Qn-m может быть охарактеризовано как совокупность всех векторов, ортогональных ко всем векторам подпространства Pm.

Любой вектор Z, принадлежащий Rn, может быть однозначно представлен в виде суммы векторов X и Y, из которых один принадлежит подпространству Pm, другой — подпространству Qn-m. Это ясно из возможности и однозначности представления вектора Z в виде

Вектор X называется ортогональной проекцией вектора Z на Pm.

Унитарное пространство. Понятия длины вектора и скалярного произведения векторов могут быть определены и в комплексном пространстве. В основу попрежнему кладется понятие скалярного умножения, которое определяется следующим образом. Каждой паре X и Y векторов комплексного пространства сопоставляется комплексное (не обязательно действительное) число, называемое их скалярным произведением X ⋅ Y. Действие скалярного умножения должно удовлетворять следующим аксиомам:

В пространстве строк с комплексными элементами за скалярное произведение векторов (x1, ..., xn) и (y1, ..., yn) можно принять число x1y'1" + ... + xny'n. Легко проверить, что при таком определении все аксиомы 1"—4" выполнены.

За длину вектора принимают число √X⋅Х. Понятие угла между векторами не определяется.

Комплексное линейное пространство со скалярным произведением, удовлетворяющим аксиомам 1"—4", называется унитарным пространством.

§ 3. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ

Системы двух уравнений с двумя неизвестными и трех уравнений с тремя неизвестными. Система двух линейных уравнений с двумя неизвестными выглядит в общем виде так:

Для решения этой системы умножим первое уравнение на b2, второе на —b1 и сложим. Получим

Аналогичным образом, умножив первое уравнение на —а2, второе на а и сложив, получим

Из этих равенств легко определяются х и у, если только выражение a1b2— a2b1, оказывающееся коэффициентом при неизвестных х и у отлично от нуля. Это выражение называется определителем матрицы

образованной коэффициентами системы. Определитель обозначается так:

Из данного определения следует, что определитель вычисляется по схеме

не требующей дальнейших пояснений.

Вернемся к решению системы. Выражения c1b2 — c2b1 и a1с2 — a2с1, согласно данному определению, тоже представляют собой определители, именно:

Таким образом, если определитель | | отличен от нуля, мы получаем следующие формулы для решения системы:

(4)

Строго говоря, проведенные рассуждения не полны. Действия над уравнениями, которые мы производили при выводе формул для решения системы, были осмыслены только в предположении, что х и у уже представляют собой числа, образующие решение системы. Логическая сущность проведенного рассуждения такова: если определитель из коэффициентов системы не равен нулю и решение системы существует, то оно вычисляется по формулам (4). Поэтому еще необходимо установить, что найденные значения для неизвестных действительно удовлетворяют обоим уравнениям системы. Это делается без труда.

Итак, если определитель матрицы из коэффициентов системы отличен от нуля, то система имеет единственное решение, которое дается формулами (4).

Для системы трех уравнений с тремя неизвестными

нетрудно провести аналогичные рассуждения и выкладки — для этого достаточно сложить уравнения, умножив их предварительно на такие множители, чтобы после сложения уничтожались сразу два неизвестных. В качестве множителей для уничтожения неизвестных у и z следует взять b2с3— b3с2, b3с1— b1с3 и b1с2— b2c1, что легко проверить вычислением.

В результате получится, что если выражение

отлично от нуля, то система имеет единственное решение, получаемое по формулам

где Δ1, Δ2, Δ3 — выражения, получающиеся из А посредством замены коэффициентов при соответствующих неизвестных свободными членами. Выражение А называется определителем матрицы

и обозначается через

Для вычисления определителя удобна следующая схема:

На первой из этих схем соединены линиями (диагональ и два треугольника) места, где находятся элементы, произведения которых входят в состав определителя со знаком плюс; на второй схеме — то же для слагаемых, входящих в состав определителя со знаком минус.

Мы получили для систем двух уравнений с двумя неизвестными и трех уравнений с тремя неизвестными совершенно сходные результаты. В обоих случаях система имеет единственное решение, если определитель матрицы коэффициентов отличен от нуля. Формулы для решений тоже аналогичны: в знаменателе каждой из неизвестных находится определитель матрицы коэффициентов, а в числителях — определители матриц, получающихся из матриц коэффициентов заменой коэффициентов при вычисляемой неизвестной свободными членами.

Непосредственное обобщение этих результатов на системы n уравнений с n неизвестными при любом n затруднительно. Это сравнительно легко удается сделать косвенными средствами: сперва обобщить понятие определителя на квадратные матрицы любого порядка и, изучив свойства определителей, применить их теорию к исследованию систем.

Определитель n-го порядка. Рассматривая развернутое выражение для определителей

и

замечаем, что в каждое слагаемое входят в качестве сомножителей по одному элементу из каждой строки и по одному из каждого столбца определителя, причем всевозможные произведения этого вида входят в состав определителя со знаком плюс или минус. Это свойство полагается в основу обобщения понятия определителя на квадратные матрицы любого порядка. Именно: определителем квадратной матрицы n-го порядка или, короче, определителем n-го порядка называется алгебраическая сумма всевозможных произведений элементов матрицы, взятых по одному из каждой строки и по одному из каждого столбца, причем полученные произведения снабжены знаками плюс и минус по некоторому вполне определенному правилу. Это правило вводится

довольно сложным образом, и мы не будем останавливаться на его формулировке. Существенно отметить, что оно устанавливается так, что обеспечивается следующее важнейшее основное свойство определителя:

1. При перестановке двух строк определитель меняет знак на противоположный.

Для определителя 2 и 3-го порядков это свойство легко проверяется непосредственным вычислением. В общем случае оно доказывается на основе не сформулированного нами здесь правила знаков.

Определители обладают целым рядом других замечательных свойств, которые дают возможность с успехом использовать определители в разнообразных теоретических и численных расчетах, несмотря на чрезвычайную громоздкость определителя: ведь определитель n-го порядка содержит, как нетрудно видеть, п\ слагаемых, каждое слагаемое состоит из n сомножителей и слагаемые снабжены знаками по некоторому сложному правилу.

Переходим к перечислению основных свойств определителей, не останавливаясь на их подробных доказательствах.

Первое из этих свойств уже сформулировано выше.

2. Определитель не меняется при транспонировании его матрицы, т. е. при замене строк на столбцы с сохранением порядка.

Доказательство основано на подробном исследовании правила расстановки знаков в слагаемых определителя. Это свойство дает возможность всякое утверждение, касающееся строк определителя, перенести на столбцы.

3. Определитель есть линейная функция от элементов какой-либо его строки (или столбца). Подробнее

(5)

где Аi1, Ai2, ..., Ain представляют собой выражения, не зависящие от элементов i-й строки.

Это свойство с очевидностью следует из того, что каждое слагаемое содержит по одному и только одному сомножителю из каждой, в частности i-й, строки.

Равенство (5) называется разложением определителя по элементам i-й строки, а коэффициенты Ai1, Ai2, ..Ain называются алгебраическими дополнениями элементов ai1, ai2, ...,ain в определителе.

4. Алгебраическое дополнение Аij элемента aij равно, с точностью до знака, так называемому минору Δij определителя, т. е. определи-

телю (n — 1)-го порядка, получающемуся из данного посредством вычеркивания i-й строки и j-го столбца. Для получения алгебраического дополнения минор нужно взять со знаком (—1)i+j. Свойства 3 и 4 сводят вычисление определителя порядка n к вычислению n определителей порядка n — 1.

Из перечисленных основных свойств вытекает ряд интересных свойств определителей. Перечислим некоторые из них.

5. Определитель с двумя одинаковыми строками равен нулю.

Действительно, если определитель имеет две одинаковые строки, то при их перестановке определитель не изменяется, ибо строки одинаковые, но вместе с тем он, в силу первого свойства, меняет знак на обратный. Следовательно, он равен нулю.

6. Сумма произведений элементов какой-либо строки на алгебраические дополнения другой строки равна нулю.

Действительно, такая сумма является результатом разложения определителя с двумя одинаковыми строками по одной из них.

7. Общий множитель элементов какой-либо строки можно вынести за знак определителя.

Это следует из свойства 3.

8. Определитель с двумя пропорциональными строками равен нулю.

Достаточно вынести множитель пропорциональности, и мы получим определитель с двумя равными строками.

9. Определитель не меняется, если к элементам какой-либо строки добавить числа, пропорциональные элементам другой строки.

Действительно, в силу свойства 3 преобразованный определитель равен сумме исходного определителя и определителя с двумя пропорциональными строками, который равен нулю.

Последнее свойство дает хорошее средство для вычисления определителей. Используя это свойство можно, не меняя величины определителя, преобразовать его матрицу так, чтобы в какой-либо строке (или столбце) все элементы, кроме одного, оказались равными нулю. Затем, разложив определитель по элементам этой строки (столбца), мы сведем вычисление определителя порядка n к вычислению одного определителя порядка n — 1, именно, алгебраического дополнения единственного отличного от нуля элемента выбранной строки.

Например, нужно вычислить определитель

Добавив ко второму столбцу первый, умноженный на —1, к третьему — первый, к четвертому — первый, умноженный на —2, получим

Разложив А по элементам первой строки, получим

Наконец, добавив к первой строке вторую и разложив по элементам первого столбца, получим

Определитель матрицы А обозначают через | А |. В заключение отметим еще одно очень важное свойство определителей.

Определитель произведения двух квадратных матриц равен произведению определителей сомножителей, т. е. в сокращенной записи |АВ| = |А||В|.

Это свойство дает, в частности, возможность умножать определители одинакового порядка по правилу умножения матриц.

Системы n линейных уравнений с n неизвестными. Теперь, используя аппарат определителей, легко обобщить результаты, полученные ранее для систем двух уравнений с двумя неизвестными и трех уравнений с тремя неизвестными, на системы n уравнений с n неизвестными в предположении, что определитель матрицы коэффициентов отличен от нуля.

Пусть

такая система. Обозначим через А определитель матрицы коэффициентов системы. Он, по предположению, отличен от нуля. Далее, через Aij обозначим алгебраическое дополнение элемента aij. Умножим первое уравнение на A1j, второе — на A2j; ..., n-е — на Anj и сложим. Получим

Действительно, коэффициенты при всех неизвестных, кроме xj, обращаются в 0, ибо они представляют собой суммы произведений алгебраи-

ческих дополнений элементов j-го столбца на элементы других столбцов (свойство 6, примененное к столбцам); коэффициент же при неизвестном xj равен сумме произведений элементов j-го столбца на их алгебраические дополнения, т. е. равен А. Таким образом,

(6)

Как уже говорилось выше, приведенные рассуждения осмыслены только в случае, если под x1, x2, ..., xn подразумевать решение системы, существование которого тем самым необходимо предполагать.

Таким образом, результатом рассуждения явилось следующее.

Если решение системы существует, то оно дается формулами (6) и тем самым единственно.

Для полноты изложения необходимо доказать существование решения, что достигается подстановкой найденных значений для неизвестных во все уравнения исходной системы. Легко убедиться, используя то же свойство определителя (в применении к строкам), что найденные значения действительно удовлетворяют всем уравнениям.

Итак, верна следующая теорема: если определитель матрицы коэффициентов системы n уравнений с n неизвестными отличен от нуля, то система имеет единственное решение, даваемое формулами (6).

Эти формулы можно еще преобразовать, заметив, что сумму b1A1j + ... +bnAnj можно записать в виде определителя, именно:

(свободные члены находятся в j-м столбце).

Таким образом, результаты, изложенные выше для систем уравнений с двумя и тремя неизвестными, полностью обобщены на систему n уравнений и даже формулы для решения получаются совершенно такими же по форме.

Отметим одно следствие из доказанной теоремы:

Если относительно системы уравнений заведомо известно, что она совсем не имеет решения или решение не единственно, то определитель матрицы из коэффициентов равен нулю.

Это следствие особенно часто применяется к однородным системам, т. е. таким, в которых свободные члены b1, b2, . .., bn все равны нулю. Однородные системы всегда имеют само собой разумеющееся «тривиальное» решение x1 = x2= ... = xn = 0.

Если же однородная система имеет, кроме тривиального, еще нетривиальное решение, то ее определитель равен нулю.

Это утверждение открывает возможность использовать теорию определителей в других разделах математики и в ее приложениях.

Рассмотрим, например, задачу из аналитической геометрии.

Найти уравнение плоскости, проходящей через три данные точки (x1, y1, z1), (x2, y2, z2) и (x3, y3, z3), не лежащие на одной прямой.

Из элементарной геометрии известно, что искомая плоскость существует. Пусть ее уравнение имеет вид A1 + B, + Cz+ D = 0. Тогда

Пусть x, y, z— координаты любой точки, лежащей на плоскости. Тогда и

Рассмотрим эти четыре уравнения как систему линейных однородных уравнений относительно коэффициентов А, В, С, D искомой плоскости. Эта система имеет нетривиальное решение, ибо искомая плоскость существует. Следовательно, определитель системы равен нулю, т. е.

(7)

Это и есть уравнение искомой плоскости. Действительно, оно есть уравнение 1-й степени относительно х, у, z, что следует из линейности определителя относительно элементов последней строки.

Используя то, что данные точки не лежат на одной прямой, нетрудно проверить, что не все его коэффициенты равны нулю. Следовательно, равенство (7) есть действительно уравнение плоскости. Плоскость эта проходит через данные точки, ибо координаты их, очевидно, удовлетворяют ее уравнению.

Матричная запись системы n уравнений с n неизвестными. Система n линейных уравнений с n неизвестными

может быть записана в матричных обозначениях в виде одного равенства

АХ = В.

Здесь А обозначает матрицу из коэффициентов, X — столбец, составленный из неизвестных, В — столбец из свободных членов.

Решение системы (если определитель матрицы А отличен от нуля) подробно записывается так [см. формулу (6)]:

или в матричной форме

Матрица, стоящая первым множителем в правой части равенства, называется матрицей, обратной к матрице А, и обозначается через А"1. Применяя это обозначение, получим решение системы АХ =В в следующем простом и естественном виде, напоминающем формулу для решения одного уравнения с одним неизвестным:

Нетрудно дать другое обоснование полученному результату в терминах алгебры матриц.

Для этого прежде всего следует отметить особую роль матрицы

называемой единичной матрицей.

Единичная матрица среди квадратных матриц играет такую же роль, какую играет число 1 среди всех чисел. Именно: при любой матрице А имеют место равенства АЕ=А и ЕА = А. Это легко проверяется на основании правила умножения матриц.

Определенная выше матрица А-1, обратная к матрице А, играет по отношению к ней роль, сходную с той, которую играет число, обратное к данному числу. Именно:

Справедливость этих равенств проверяется на основании правил умножения матриц и свойств 3 и 6 определителя.

Зная эти свойства единичной и обратной матриц, можно провести решение системы АХ=В следующим образом.

Пусть АХ = В. Тогда А-1(АХ) = А-1В. Но А-1(АХ) = (А-1А)X = ЕХ = X, и, следовательно, Х = А-1В.

Пусть теперь X = А-1В. Тогда АХ = АА-1В = ЕВ = В.

Итак, «уравнение» АХ = В имеет единственное решение X = А-1В, если только А-1 существует.

Мы установили существование обратной матрицы А-1 для матрицы А в предположении, что определитель матрицы А отличен от нуля. Это условие не только достаточно, но и необходимо для существования обратной матрицы. Действительно, пусть для матрицы А существует обратная A-1, т. е. такая, что АА-1 = Е. Тогда по свойству определителя произведения двух матриц

откуда следует, что определитель матрицы А не равен нулю.

Матрица, определитель которой отличен от нуля, называется невырожденной или неособенной. Мы установили, таким образом, что обратная матрица всегда существует для невырожденных матриц и только для них.

Введение понятия обратной матрицы оказывается полезным не только в теории систем линейных уравнений, но и во многих других задачах линейной алгебры.

В заключение отметим, что выведенные формулы для решения линейных систем являются незаменимым орудием в теоретических исследованиях, но мало применимы для численного решения систем.

Как мы уже отмечали, для численного решения систем разработано много различных способов и вычислительных схем, и ввиду большой важности этой задачи для практики исследовательская работа по упрощению численного решения систем (особенно с большим числом неизвестных) интенсивно ведется и в настоящее время.

Общий случай систем линейных уравнений. Обратимся к исследованию систем линейных уравнений в самом общем случае, даже не предполагая, что число уравнений равно числу неизвестных. В такой общей постановке нельзя, естественно, ожидать, что решение системы всегда существует или в случае существования оно окажется единственным. Естественно предполагать, что если число уравнений меньше числа неизвестных, то система имеет бесконечно много решений. Например, двум уравнениям 1-й степени с тремя неизвестными удовлетворяют координаты любой из точек прямой линии, являющейся линией пересечения плоскостей, определяемых уравнениями. Однако может быть, что в этом случае система совсем не имеет решений, именно когда плоскости параллельны. Если же число уравнений больше числа неизвестных, то система, как правило, решений не имеет. Однако и в этом

случае возможно, что система имеет решения и даже бесконечно много.

Для исследования вопроса о существовании и характере множественности решений системы в такой общей постановке обратимся к «геометрическому» истолкованию системы.

Систему уравнений

(8)

интерпретируем в m-мерном пространстве столбцов в виде

Здесь A1, A2, . .., An обозначают столбцы из коэффициентов при соответствующих неизвестных, В—столбец из свободных членов.

В этой интерпретации вопрос о существовании решения системы превращается в вопрос о том, является ли данный вектор В линейной комбинацией векторов A1, A2, ..., Аn.

Ответ на этот вопрос почти очевиден. Чтобы вектор В был линейной комбинацией векторов A1, A2,..., Аn, необходимо и достаточно, чтобы вектор В содержался в подпространстве, натянутом на A1, A2, ..., An, или, иными словами, чтобы подпространства, натянутые на системы векторов A1, A2, ...,An и A1, A2, ...,Аn, В совпадали.

Так как первое из этих подпространств содержится во втором, то для их совпадения необходимо и достаточно, чтобы были равны их размерности. Напомним, что размерность подпространства, натянутого на данную систему векторов, называется рангом этой системы векторов. Таким образом, необходимым и достаточным условием существования решения системы x1A1 + x2A2 + ..., xnAn = В является равенство рангов систем векторов A1, A2, ..., An и A1, A2, .., An, В.

Можно доказать, но мы на этом не будем останавливаться, что ранг системы векторов равен рангу матрицы, составленной из координат этих векторов. Здесь под рангом матрицы понимается наивысший из порядков отличных от нуля определителей, которые можно составить из данной матрицы посредством вычеркивания части ее строк и столбцов.

Так как координатами векторов A1, A2, . .. , An (в естественном для пространства столбцов базисе) являются коэффициенты системы, а координатами вектора В — ее свободные члены, то мы получаем следующую окончательную формулировку условия существования решения системы.

Для существования по крайней мере одного решения системы линейных уравнений

необходимо и достаточно, чтобы ранг матрицы, составленной из коэффициентов системы, равнялся рангу матрицы, составленной из коэффициентов и свободных членов.

Теперь исследуем характер множественности решений, если они существуют. Пусть — какое-либо решение системы (8).

Положим ..., xn = xi + yn. Тогда в силу того, что x01, x02, ...x0n образует решение системы (8), новые неизвестные y1, y2, ..., yn должны удовлетворять однородной системе

(9)

с той же матрицей коэффициентов. Обратно, если к исходному решению x01, x02, ...x0n системы (8) добавить любое решение однородной системы (9), то получится снова решение системы (8).

Таким образом, чтобы получить общее решение системы (8), нужно взять какое-либо ее частное решение и сложить с общим решением однородной системы (9).

Тем самым вопрос о характере множественности решений системы (8) сводится к тому же вопросу для однородной системы (9). Этот вопрос мы рассмотрим в следующем пункте.

Однородные системы. Однородную систему линейных уравнений

мы будем интерпретировать в n-мерном эвклидовом пространстве. (Тем самым мы предполагаем, что коэффициенты системы действительные. Для систем с комплексными коэффициентами можно дать аналогичную интерпретацию в унитарном пространстве, причем получатся аналогичные результаты).

Пусть А'1, А'2, ... А'm, Y—векторы эвклидова пространства, координатами которых в некотором ортонормальном базисе являются соответственно

Тогда система принимает вид

т. е. каждое решение системы определяет вектор, ортогональный ко всем векторам, интерпретирующим коэффициенты отдельных уравнений.

Следовательно, множество решений образует подпространство, ортогонально-дополнительное к подпространству, натянутому на векторы A'1, A'2,....,A'm. Размерность последнего подпространства равна рангу г матрицы, составленной из коэффициентов системы. Размерность же ортогонального дополнения, т. е. «пространства решений», равна n — r.

Во всяком подпространстве существует базис, т. е. система линейно-независимых векторов, в числе, равном размерности подпространства, линейными комбинациями которых заполняется все подпространство. Следовательно, среди решений однородной системы существует n — r линейно-независимых решений, таких, что все решения системы являются их линейными комбинациями. Здесь n обозначает число неизвестных, r — ранг матрицы из коэффициентов.

Таким образом, строение решений однородной системы, а следовательно, и неоднородной, выяснено до конца. В частности, однородная система имеет единственное тривиальное решение x1 = x2 = ... =xn = 0 в том и только в том случае, если ранг матрицы из коэффициентов равен числу неизвестных. В силу сказанного в конце предыдущего пункта, то же условие (при выполнении условия совместности) является условием единственности решения и для системы неоднородных уравнений.

Исследования систем, проведенные нами, наглядно показывают, как введение обобщенных геометрических понятий вносит простоту и обозримость в сложный алгебраический вопрос.

§ 4. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ

Определение и примеры. Во многих математических исследованиях возникает потребность в замене переменных, т. е. в переходе от одной системы переменных x1, x2, ..., xn к другой y1 y2, ..., yn, связанной с первой посредством функциональной зависимости:

Например, если переменные представляют собой координаты точки на плоскости или в пространстве, то переход от одной системы координат к другой системе влечет за собой преобразование координат, которые задаются выражениями исходных координат через новые, или наоборот.

Кроме того, преобразование переменных возникает при изучении изменений, переходов от одного положения или состояния к другому для таких объектов, положение или состояние которых описывается значениями переменных. Типичным примером этого рода преобразования может служить изменение координат точек некоторого тела при его деформации.

Отвлеченно заданное преобразование системы n переменных обычно интерпретируется именно как преобразование (деформация) n-мерного пространства, т. е. как сопоставление каждому вектору пространства (или его части) с координатами x1, x2,...,xn соответствующего ему вектора с координатами y1, y2, ...,yn.

Как уже было сказано выше, каждая «гладкая» (имеющая непрерывные частные производные) функция от нескольких переменных при малых изменениях этих переменных близка к линейной функции. Поэтому любое «гладкое» преобразование (т. е. такое, в аналитическом описании которого функции φ1, φ2, . ..,φn имеют непрерывные частные производные) на малой части пространства близко к линейному:

(10)

Уже одно это обстоятельство делает изучение свойств линейных преобразований одной из важнейших задач математики. Например, иг теории n линейных уравнений с n неизвестными мы знаем, что необходимым и достаточным условием однозначной разрешимости системы уравнений (10) относительно x1, x2, ..., xn, т. е. обратимости соответствующего линейного преобразования, является неравенство нулю определителя из коэффициентов. Это обстоятельство лежит в основе глубокой теоремы анализа: для того чтобы преобразование

гладкое в окрестности данной точки, имело гладкое обратное преобразование, необходимо и достаточно, чтобы в данной точке определитель

был отличен от нуля.

Изучение общего линейного преобразования (10) в основном сводится к изучению однородного преобразования с теми же коэффициентами

(11)

и в дальнейшем, говоря о линейных преобразованиях, мы всегда будем подразумевать однородные преобразования.

Линейные преобразования n-мерного пространства могут быть также определены своими внутренними свойствами, помимо формул (11), связывающих координаты соответствующих точек. Такое бескоординатное определение понятия линейного преобразования полезно тем, что оно не зависит от выбора базиса. Это определение состоит в следующем.

Линейное преобразование n-мерного линейного пространства есть функция Y = A(X), аргумент X и значения Y которой являются векторами. Функция эта удовлетворяет требованию линейности

(12)

В дальнейшем, говоря о линейном преобразовании пространства, мы будем его понимать именно в смысле этого определения.

Это определение равносильно предыдущему — координатному. Действительно, функция Y = A(X), сопоставляющая вектору X с координатами x1, x2, ...,xn вектор Y с координатами y1, y2,...,yn так, что при этом координаты y1, y2, ..., yn выражаются через координаты x1, x2, ..., xn в виде линейных однородных функций, очевидно, удовлетворяет требованию (12). Обратно, если функция Y = A(X) удовлетворяет требованию (12) и e1, e2, ..., en — какой-либо базис пространства, то

Обозначим координаты (в том же базисе) вектора А (ej) через

Тогда координаты вектора Y = А (X) будут

Таким образом, каждому линейному преобразованию линейного пространства соответствует относительно данного базиса некоторая квадратная матрица. Само преобразование записывается на языке матриц в виде Y=AХ. Здесь X — столбец из координат исходного вектора, Y — столбец из координат преобразованного вектора, А — матрица коэффициентов преобразования. Столбцы матрицы А образованы координатами тех векторов, в которые преобразуются векторы базиса. В соответствии с матричной записью мы будем в дальнейшем и само линейное преобразование часто записывать в виде Y = AX, опуская скобки.

Из формулы

следует, что все пространство при линейном преобразовании превращается в подпространство, натянутое на векторы А (e1), ..., А(en). Размерность этого подпространства равна рангу системы векторов А (e1), А (e2), . .., А (en), или, что то же самое, рангу матрицы, составленной из их координат, т. е. рангу матрицы A, сопоставляемой преобразованию. Подпространство это совпадает со всем пространством в том и только в том случае, когда ранг матрицы А равен n, т. е. когда определитель матрицы А отличен от нуля. В этом случае линейное преобразование называется неособенным или невырожденным.

Из теории систем линейных уравнений мы знаем, что невырожденные преобразования однозначно обратимы, и координаты исходного вектора выражаются через координаты преобразованного по формуле X = А-1Y.

Преобразование, матрица которого имеет равный нулю определитель, называется особенным или вырожденным. Вырожденное преобразование необратимо. Это следует из теории линейных уравнений или более наглядно из того, что оно преобразует все пространство в его часть.

Примером невырожденного преобразования может служить в первую очередь единичное преобразование, преобразующее все векторы в себя. Матрицей единичного преобразования в любом базисе является единичная матрица Е.

Невырожденными являются также преобразования подобия, состоящие в том, что все векторы пространства умножаются на одно и то же число. Матрица преобразования подобия не зависит от выбора базиса и имеет вид аЕ, где а — коэффициент подобия.

Важным частным случаем невырожденных преобразований являются преобразования ортогональные. Понятие ортогонального преобразования имеет смысл в применении к эвклидову пространству и определяется как линейное преобразование, сохраняющее длины векторов. Ортогональное преобразование есть обобщение на n-мерное пространство преобразования вращения пространства при неподвижном начале

координат или вращения, соединенного с отражением относительно какой-либо плоскости, проходящей через начало.

Легко видеть, что при ортогональном преобразовании сохраняются не только длины векторов, но и скалярные произведения, и, следовательно, ортогональные преобразования переводят ортонормальный базис пространства в систему попарно-ортогональных единичных векторов, которая в свою очередь неминуемо является базисом.

Матрица, связанная с ортогональным преобразованием, относительно ортонормального базиса обладает следующими специфическими свойствами.

Во-первых, сумма квадратов элементов каждого столбца равна 1, ибо такие суммы суть квадраты длин векторов, в которые переходят векторы выбранного базиса. Во-вторых, суммы произведений соответствующих элементов, взятых из двух различных столбцов, равны нулю, ибо такие суммы суть скалярные произведения векторов, в которые переходят векторы базиса.

В матричных обозначениях оба эти свойства записываются одной формулой

РР = Е.

Здесь Р — матрица ортогонального преобразования (относительно ортонормального базиса), Р — транспонированная с ней матрица, т. е. такая, строки которой являются столбцами матрицы Р с сохранением их порядка.

В самом деле, диагональные элементы матрицы РР по правилу умножения матриц равны сумме квадратов элементов соответствующего столбца матрицы Р, а недиагональные равны сумме произведений соответствующих элементов, взятых из различных столбцов матрицы Р.

Примером вырожденного преобразования может служить, например, ортогональное проектирование всех векторов эвклидова пространства на некоторое подпространство (см. § 2). Действительно, при этом преобразовании все пространство отображается на свою часть.

Преобразование координат. Рассмотрим теперь вопрос о преобразовании координат в n-мерном пространстве, т. е. вопрос о том, как изменяются координаты векторов при переходе от одного базиса к другому.

Пусть дан исходный базис e1, e2, ..., en и пусть f1, f2, . . ., fn — какой-либо другой базис пространства. Пусть далее

матрица, столбцы которой являются координатами векторов нового базиса f1, f2, ..., fn относительно исходного. Матрица С, очевидно, невырожденная в силу линейной независимости векторов f1, f2, ..., fn. Она называется матрицей преобразования координат.

Обозначим через x1, x2,...,xn координаты некоторого вектора X относительно базиса e1, e2, ..., en и через x'1, х'2, ..., х'n —координаты того же вектора относительно базиса f1, f2, ..., fn. Тогда X = x'1f1+x'2f + ... +x'nfn, и, следовательно, координаты вектора ^относительно исходного базиса образуют столбец

Итак, исходные координаты выражаются через преобразованные линейным однородным образом с матрицей С.

Формулы, выражающие зависимость между координатами относительно исходного и преобразованного базисов, формально совпадают с формулами, связывающими координаты соответствующих векторов при невырожденном линейном преобразовании пространства. Это обстоятельство дает возможность интерпретировать отвлеченно заданное линейное однородное преобразование переменных с невырожденной матрицей или как преобразование координат, или как линейное преобразование пространства. В каждом конкретном случае выбор одной из этих двух интерпретаций определяется содержанием рассматриваемой задачи.

Рассмотрим теперь вопрос о том, как изменяется матрица линейного преобразования пространства при преобразовании координат.

Пусть в базисе e1, e2, . .., en данное линейное преобразование имеет матрицу А, так что столбец У из координат преобразованного вектора связан со столбцом X исходного формулой

Y = AX.

Пусть теперь сделано преобразование координат с матрицей С; X', Y' обозначают соответственно столбцы из координат исходного и преобразованного векторов относительно нового базиса. Тогда

откуда

Итак, матрицей рассматриваемого преобразования относительно нового базиса является матрица С"-1АС.

Матрицы А и В, связанные соотношением В = С-1АС, где С — некоторая неособенная матрица, называются подобными. Одному и тому же линейному преобразованию по отношению к различным базисам соответствует класс попарно подобных между собой матриц.

Собственные векторы и собственные значения линейного преобразования. Важнейший класс линейных преобразований образуют преобразования, осуществляемые следующим образом.

Пусть e1, e2, .. en — какие-либо линейно-независимые векторы пространства. Пусть при преобразовании они умножаются на некоторые числа λ1, λ2, ..., λn. Если векторы e1, e2, . . en принять за базис пространства, то рассматриваемое преобразование описывается диагональной матрицей

Преобразования этого класса имеют простой и наглядный геометрический смысл (конечно, для действительных пространств и при n = 2 или n = 3). Именно, если все числа λi положительны, то описываемое преобразование заключается в растяжении (или сжатии) пространства по направлению векторов e1, e2, ...,en с коэффициентами λ1, λ2, ...,λп. Если некоторые из λi отрицательны, то деформация пространства сопровождается изменением направлений некоторых из векторов e1, e2,...,en на противоположные. Наконец, если, например, λ1 = 0, то происходит проектирование пространства параллельно e1 на подпространство, натянутое на e2, ..., en с последующей деформацией по этим направлениям.

Рассматриваемый класс преобразований важен тем, что он, несмотря на свою простоту, является весьма общим. Именно, устанавливается, что каждое линейное преобразование, удовлетворяющее некоторым, не очень жестким ограничениям, принадлежит к рассматриваемому классу, т. е. для него можно найти такой базис, в котором оно описывается диагональной матрицей.

Ограничения, накладываемые на преобразование, становятся особенно свободными, если рассматривать линейные преобразования комплексного пространства. В дальнейшем это и будет предполагаться.

Введем следующее определение.

Ненулевой вектор X, переходящий при линейном преобразовании А пространства в коллинеарный вектор λX, называется собственным вектором преобразования. Иными словами, ненулевой вектор X есть собственный вектор преобразования А в том и только в том случае, если АХ = λХ. Число же λ называется собственным значением преобразования А.

Очевидно, что если преобразование имеет в каком-либо базисе диагональную матрицу, то этот базис состоит из собственных векторов, а сами диагональные элементы являются собственными значениями. Обратно, если в пространстве существует базис, состоящий из собственных векторов преобразования А, то в этом базисе матрица преобразования А будет диагональной и составленной из собственных значений, соответствующих векторам базиса.

Перейдем к изучению свойств собственных векторов и собственных значений. С этой целью перейдем к координатной записи в определении собственного вектора. Пусть А есть матрица, соответствующая преобразованию А относительно некоторого базиса, X — столбец из координат вектора X в том же базисе. Равенство АХ = λХ при переходе к координатам запишется как АХ=λX или

В развернутой форме это равенство превращается в систему

Эту систему равенств можно рассматривать как систему линейных однородных уравнений относительно x1, x2, ..., xn. Нас интересует случай, когда эта система имеет нетривиальное решение, ибо координаты собственного вектора не должны равняться нулю одновременно. Мы знаем, что необходимым и достаточным условием существования нетривиального решения системы линейных однородных уравнений является требование, чтобы ранг матрицы из коэффициентов был меньше числа неизвестных, а это равносильно тому, что определитель системы равен нулю

Таким образом, все собственные числа преобразования А являются корнями многочлена |А—λЕ| и, обратно, каждый корень этого многочлена является собственным значением преобразования, так как каждому корню соответствует по крайней мере один собственный вектор. Многочлен |А—λЕ| называется характеристическим многочленом матрицы А. Уравнение же | А—λЕ| = 0 называется характеристическим или вековым уравнением матрицы А, а его корни — характеристическими числами матрицы1.

По основной теореме высшей алгебры (глава IV, том 1) каждый многочлен имеет по крайней мере один корень, следовательно, каждое линейное преобразование имеет по крайней мере одно собственное число и, следовательно, по крайней мере один собственный вектор. Но, конечно, при этом возможно, что, даже в случае, если преобразование описывается действительной матрицей, может оказаться, что все или

1 Название «вековое уравнение» возникло в небесной механике в связи с задачей о так называемых вековых возмущениях в движении планет.

часть его собственных чисел комплексны. И на самом деле, в действительном пространстве теорема о существовании (действительных) собственных чисел и собственных векторов для любого линейного преобразования оказывается неверной. Например, преобразование плоскости, заключающееся в повороте вокруг начала координат на некоторый угол, отличный от 180°, изменяет направления всех векторов плоскости, так что собственных векторов для этого преобразования не существует.

Корни характеристического многочлена матрицы А являются собственными числами преобразования А, и, следовательно, матрицы, отвечающие одному и тому же преобразованию в различных базисах, обладают одинаковыми совокупностями корней характеристического многочлена. Это делает правдоподобным предположение, что и сам характеристический многочлен линейного преобразования зависит только от преобразования, но не от выбора базиса. Это проверяется следующей изящной выкладкой, основанной на свойствах действий над матрицами и определителями.

Мы знаем, что если матрица А соответствует преобразованию А в некотором базисе, то в каком-либо другом базисе преобразование А имеет подобную матрицу С-1АС, где С — некоторая неособенная матрица. Но

Таким образом, матрицы, соответствующие одному и тому же преобразованию А в различных базисах, действительно имеют один и тот же характеристический многочлен, который может быть поэтому назван характеристическим многочленом преобразования.

Сделаем теперь предположение, что все собственные числа преобразования А различны. Докажем, что собственные векторы, взятые по одному для каждого собственного числа, линейно-независимы. Действительно, если допустить, что некоторые из них, именно e1, ...,ek, линейно-независимы, а остальные, в том числе и ek+1 являются их линейными комбинациями, то

(13)

Применив к обеим частям равенства линейное преобразование, получим

откуда, в силу определения собственного вектора, следует, что

Умножив равенство (13) на λк+1 и вычтя из него вновь полученное равенство, будем иметь

Отсюда следует, в силу линейной независимости e1, e2, ..., ek1 что

Но мы предположили, что все собственные числа различны и векторы взяты по одному для каждого собственного числа. Следовательно, , и равенство (13) неосуществимо, так как коэффициенты c1, c2, ..., ck не могут одновременно равняться нулю.

Теперь ясно, что если все собственные числа линейного преобразования различны, то существует базис, в котором матрица преобразования имеет диагональный вид. Действительно, за такой базис можно взять систему собственных векторов, взятых по одному для каждого собственного числа. Как мы доказали, они линейно-независимы, и их число равно числу измерений пространства, т. е. они действительно образуют базис.

Доказанная теорема в терминах теории матриц формулируется так. Если все собственные числа матрицы различны, то матрица подобна диагональной, диагональными элементами которой являются эти собственные числа.

Вопрос о преобразовании матрицы линейного преобразования к простейшему виду, в случае если среди корней характеристического многочлена имеются равные, значительно сложнее. Ограничимся кратким описанием окончательного результата.

«Каноническим ящиком» порядка m называется матрица вида

Все необозначенные элементы равны нулю.

Канонической матрицей Жордана называется матрица, вдоль главной диагонали которой расположены «канонические ящики», а все остальные элементы равны нулю:

Числа λi в различных «ящиках» не обязаны быть попарно различными. Любая матрица может быть приведена к подобной ей канонической матрице Жордана. Доказательство этой теоремы довольно сложно. Необходимо заметить, что эта теорема играет большую роль во многих приложениях алгебры к другим вопросам математики, в частности в теории систем линейных дифференциальных уравнений.

Матрица приводится к диагональной форме в том и только в том случае, если порядки всех ящиков равны единице.

§ 5. КВАДРАТИЧНЫЕ ФОРМЫ

Определение и простейшие свойства. Квадратичной формой называется однородный многочлен 2-й степени от нескольких переменных.

Квадратичная форма от n переменных x1, x2, ..., xn состоит из слагаемых двух типов: квадратов переменных и их попарных произведений с некоторыми коэффициентами. Квадратичную форму принято записывать в виде следующей квадратной схемы:

Пары подобных членов a12х1х2 и a21х2х1 и т. д. записываются с одинаковыми коэффициентами, так что каждый из них составляет половину коэффициента при соответствующем произведении переменных. Таким образом, каждая квадратичная форма естественным образом связывается с матрицей ее коэффициентов, которая является симметричной.

Квадратичную форму удобно представлять и в следующей матричной записи. Обозначим через X столбец из переменных x1, x2, ..., xn, через X — строку (x1, x2, ..., xn), т. е. матрицу, транспонированную с Х. Тогда

Квадратичные формы встречаются во многих разделах математики и ее приложений.

В теории чисел и кристаллографии рассматриваются квадратичные формы в предположении, что переменные x1, x2, ..., xn принимают только целочисленные значения. В аналитической геометрии квадратичная форма входит в состав уравнения кривой (или поверхности) 2-го порядка. В механике и физике квадратичная форма появляется для выражения кинетической энергии системы через компоненты обобщенных скоростей и т. д. Но, кроме того, изучение квадратичных форм необходимо и в анализе при изучении функций от многих переменных, в вопросах, для решения которых важно выяснить, как данная функция в окрестности данной точки отклоняется от приближающей ее линейной функции. Примером задачи этого типа является исследование функции на максимум и минимум.

Рассмотрим, например, задачу об исследовании на максимум и минимум для функции от двух переменных w = f(x, у), имеющей непрерывные частные производные до 3-го порядка. Необходимым условием для того, чтобы точка (x0, y0) давала максимум или минимум функции w, является равенство нулю частных производных 1-го порядка в точке (x0, y()). Допустим, что это условие выполнено. Придадим переменным х и у малые приращения h и к и рассмотрим соответствующее приращение функции Δw = f (x0+h, y0+к) — f(x0, y0)- Согласно формуле Тейлора это приращение с точностью до малых высших порядков равно квадратичной форме 1/2 (rh2 + 2shk +- tk2), где r, s и t — значения вторых производных, вычисленные в точке (x0, y0). Если эта квадратичная форма положительна при всех значениях h и к (кроме h = к = 0), то функция w имеет минимум в точке (x0, y0); если отрицательна, то — максимум. Наконец, если форма принимает и положительные и отрицательные значения, то не будет ни максимума, ни минимума. Аналогичным образом исследуются и функции от большего числа переменных.

Изучение квадратичных форм в основном заключается в исследовании проблемы эквивалентности форм относительно той или другой совокупности линейных преобразований переменных. Две квадратичные формы называются эквивалентными, если одна из них может быть переведена в другую посредством одного из преобразований данной совокупности. С проблемой эквивалентности тесно связана проблема приведения формы, т. е. преобразования ее к некоторому возможно простейшему виду.

В различных вопросах, связанных с квадратичными формами, рассматриваются и различные совокупности допустимых преобразований переменных.

В вопросах анализа применяются любые неособенные преобразования переменных; для целей аналитической геометрии наибольший интерес представляют ортогональные преобразования, т. е. те, которым соответствует переход от одной системы переменных декартовых координат к другой. Наконец, в теории чисел и в кристаллографии рассматриваются линейные преобразования с целыми коэффициентами и с определителем, равным единице.

Мы рассмотрим из этих задач две: вопрос о приведении квадратичной формы к простейшему виду посредством любых неособенных преобразований и тот же вопрос для преобразований ортогональных. Прежде всего выясним, как преобразуется матрица квадратичной формы при линейном преобразовании переменных.

Пусть f(x1, x2, ..., xn) = ХАХ, где А — симметричная матрица из коэффициентов формы, X — столбец из переменных.

Сделаем линейное преобразование переменных, записав его сокращенно Х = СХ'. Здесь С обозначает матрицу коэффициентов этого преобразования, X' — столбец из новых переменных. Тогда Х = Х'С, и, следовательно, ХАХ = X'(САС)Х', так что матрицей преобразованной квадратичной формы является С АС.

Матрица САС автоматически оказывается симметричной, что легко проверяется. Таким образом, задача о приведении квадратичной формы к простейшему виду равносильна задаче о приведении к простейшему виду симметричной матрицы посредством умножения ее слева и справа на взаимно транспонированные матрицы.

Преобразование квадратичной формы к каноническому виду посредством последовательного выделения квадратов. Установим, что любая (действительная) квадратичная форма может быть приведена к сумме квадратов новых переменных с некоторыми коэффициентами посредством действительного неособенного линейного преобразования.

Для доказательства установим прежде всего, что если форма не равна нулю тождественно, то за счет неособенного преобразования переменных можно сделать коэффициент при квадрате первой переменной отличным от нуля.

В самом деле, пусть

Если a11≠0, то никаких преобразований не требуется. Если a11 = 0, но какой-либо из диагональных коэффициентов akk≠0, то положим x1 = х'к, xk = х'1, приравнивая остальные исходные переменные соответ-

ствующим новым. Это неособенное преобразование приведет к цели. Наконец, если все диагональные коэффициенты равны нулю, то хотя бы один недиагональный коэффициент, например a12, отличен от нуля. Сделав неособенное преобразование

и приравняв остальные исходные переменные к новым, мы достигаем цели.

Таким образом, без нарушения общности можно принять a11≠0. Выделим теперь квадрат линейной функции так, чтобы все слагаемые, содержащие x1, вошли в этот квадрат. Это легко сделать. Действительно,

Раскрыв скобки во втором слагаемом и сделав приведение подобных членов, получим

где f1 есть форма уже от n — 1 переменных. Преобразование

очевидно, неособенное. Сделав это преобразование, приведем форму к виду

Продолжая процесс аналогичным образом, мы приведем форму к требуемому «каноническому» виду

Здесь z1, z2, ..zn — последние из введенных новых переменных.

Закон инерции квадратичных форм. При приведении квадратичной формы к каноническому виду имеется весьма значительный произвол в выборе осуществляющего это приведение преобразования переменных. Этот произвол виден хотя бы из того, что имеется возможность раньше, чем применить изложенный выше способ последовательного выделения квадратов, сделать любое неособенное преобразование переменных.

Однако, несмотря на этот произвол, в результате приведения данной формы получаются почти одинаковые канонические квадратичные формы независимо от выбора приводящего преобразования. Именно, число квадратов новых переменных, входящих с положительными, отрицательными и нулевыми коэффициентами, получается одним и тем же при любом способе приведения. Эта теорема носит название закона инерции квадратичных форм. На его доказательстве мы не будем останавливаться.

Закон инерции квадратичной формы решает задачу об эквивалентности действительной квадратичной формы относительно всех неособенных преобразований. Именно, две формы эквивалентны в том и только в том случае, если при приведении их к каноническому виду получаются канонические формы с одинаковым числом квадратов с положительными, отрицательными и нулевыми коэффициентами.

Особый интерес для приложений имеют квадратичные формы, которые после приведения к каноническому виду превращаются в сумму квадратов новых переменных со всеми положительными коэффициентами. Такие формы носят название положительно-определенных.

Положительно-определенные квадратичные формы характеризуются тем свойством, что все значения их при действительных значениях переменных, не равных одновременно нулю, положительны.

Ортогональное преобразование квадратичных форм к каноническому виду. Среди всевозможных способов приведения квадратичной формы к каноническому виду особый интерес представляют ортогональные преобразования, т. е. осуществляющиеся посредством линейного преобразования переменных с ортогональной матрицей. Именно такие преобразования представляют интерес, например, в аналитической геометрии — в задаче о приведении общего уравнения кривой или поверхности 2-го порядка к каноническому виду.

Для того, чтобы убедиться в возможности такого преобразования, целесообразно рассматривать квадратичную форму как функцию от вектора в эвклидовом пространстве, рассматривая переменные x1, x2, .... xn

как координаты переменного вектора относительно некоторого ортонормального базиса. Тогда ортогональное преобразование переменных интерпретируется как переход от одного ортонормального базиса к другому.

Свяжем с квадратичной формой

линейное преобразование А, имеющее по отношению к выбранному базису матрицу

Тогда сама квадратичная форма может рассматриваться как скалярное произведение АХ⋅X (где X—вектор с координатами x1, x2, ..., xn), а ее коэффициенты aij — как скалярные произведения Aei⋅ej, где e1, e2, ...,en — выбранный ортонормальный базис.

Легко видеть, что вследствие симметрии матрицы А для любых векторов X и Y имеет место равенство

Докажем прежде всего, что преобразование А имеет по крайней мере одно действительное собственное число и соответствующий ему собственный вектор.

Для этого рассмотрим значения формы АХ ⋅ X в предположении, что вектор X пробегает единичную сферу, т. е. совокупность всех единичных векторов. При этих условиях форма АХX будет иметь максимум. Покажем, что этот максимум λ1 есть собственное число преобразования A, а вектор Х0, для которого этот максимум достигается, есть соответствующий собственный вектор, т. е. АХ0 = λ1Х0.

Доказательство этого утверждения проведем косвенными средствами, установив, что вектор АХ0 ортогонален ко всем векторам, ортогональным к Х0.

Заметим, что для любого вектора Z справедливо неравенство AZ ⋅ Z⩽λ1|Z|2. Это очевидно из того, что Х = Z/|Z| есть единичный вектор, а λ1 — максимум значения формы АХ⋅X на единичной сфере. Рассмотрим Z = X0+εY, где ε — некоторое действительное число, Y — произвольный вектор, ортогональный к вектору Х0. Тогда

Кроме того,

ибо

Следовательно,

откуда, поделив на ε2, получим

(14)

Последнее неравенство должно выполняться при любом действительном ε, сколь угодно малом по абсолютной величине.

Но оно может выполняться только при условии АХ0 ⋅ У = 0, так как если АХ0 ⋅ У >0, то неравенство (14) невозможно при достаточно малом положительном е, если же АХ0⋅У<0, то оно невозможно при достаточно малом по абсолютной величине отрицательном е. Итак, АХ0 ⋅ У=0, т. е. АХ0 действительно ортогонален ко всякому вектору, ортогональному к Х0. Следовательно, АХ0 и Х0 коллинеарны, т. е. АХ0 = λ'Х0, где X' — некоторое действительное число. То, что λ' = λ1, легко проверить, именно

Теперь легко доказать, что каждая квадратичная форма действительно может быть приведена к каноническому виду посредством ортогонального преобразования.

Пусть e1, e2, ..., en — исходный ортонормалышй базис пространства, f1, f2, ..., fn — новый ортонормальный базис, в котором первый вектор f1 равен собственному вектору Х0 преобразования А. Пусть x1, x2, ...,xn— координаты вектора X в исходном базисе, a x'1, х'2, ... x'n —его же координаты в новом базисе. Тогда

где Р — ортогональная матрица.

Сделаем в квадратичной форме АХ ⋅ X переход к новым переменным. В новых переменных квадратичная форма будет иметь коэффициенты а'ij = Аfifj. Следовательно,

т. е. форма имеет вид

Итак, за счет ортогонального преобразования нам удалось выделить один квадрат новой переменной.

Проведя те же рассуждения с новой формой φ(x'2, ..., х'п) и т. д., мы придем в конце концов к тому, что форма посредством цепочки ортогональных преобразований окажется приведенной к каноническому виду. Но очевидно, что цепочка ортогональных преобразований равносильна одному ортогональному же преобразованию. Тем самым теорема доказана.

§ 6. ФУНКЦИИ ОТ МАТРИЦ И НЕКОТОРЫЕ ИХ ПРИЛОЖЕНИЯ

Функции от матриц. Приложения линейной алгебры к другим отделам математики весьма многочисленны и разнообразны. Не будет преувеличением сказать, что в большей части современной математики и теоретической физики в той или иной форме используются идеи и результаты линейной алгебры, главным образом в форме исчисления матриц.

Рассмотрим коротко один из путей приложения исчисления матриц к теории обыкновенных дифференциальных уравнений. Здесь важную роль играют функции от матриц.

Прежде всего определим степень квадратной матрицы А. Положим А° = Е, A1 = А, A2 = АА, A3 = A2А, A4 = A3А и т. д. При помощи сочетательного закона легко доказать, что АтАп= Ат+п для любых натуральных m и n. Для матриц были определены действия сложения и умножения на число. Это дает возможность естественным образом определить значение многочлена (от одной переменной) от матрицы. Именно, если φ (х) = a0xn + anxn-1 ... + an, то положим (по определению) φ(A) = a0An+а1An+1+ . .. +аnЕ. Таким образом определяется понятие наиболее простой функции от матричного аргумента — многочлена.

Посредством предельного перехода легко обобщить понятие функции от матричного аргумента на значительно более широкий класс функций, чем многочлен от одной переменной. Не касаясь этого вопроса во всей его общности, ограничимся рассмотрением аналитических функций.

Прежде всего введем понятие предела последовательности матриц. Последовательность матриц

называется сходящейся к матрице

(или имеющей пре-

делом матрицу А), если lim aij=aij для всех i, j. Далее, суммой ряда A1 + A2 + ... + Аk + ... называется предел сумм его отрезков lim (A1 + A2 + ... + Ak), если этот предел существует.

Пусть f (z) есть аналитическая функция, регулярная в окрестности z = 0. Тогда, как известно, f(z) разлагается в степенной ряд

Для любой квадратной матрицы А естественно положить

Оказывается, что такой ряд сходится для всех матрица, собственные числа которых лежат внутри круга сходимости степенного ряда

В приложениях представляют интерес элементарные функции от матриц.

Так, например, геометрическая прогрессия Е + А + A2 + . . . +Ак+... является сходящимся рядом для матриц, модули собственных чисел которых меньше 1, и суммой этого ряда является матрица (Е— А)-1, что находится в полном соответствии с формулой

Представление (Е — А)-1 в виде бесконечного ряда дает эффективное средство для приближенного решения систем линейных уравнений, матрицы коэффициентов которых близки к единичной. Действительно, записав такую систему в форме

получим

(15)

что дает удобную формулу для решения системы, если только ряд (15) сходится достаточно быстро.

Полезно рассматривать биномиальный ряд

который можно применять (если собственные числа А по модулю меньше 1) не только для натуральных показателей m, но и для дробных и отрицательных.

Особенно важной для приложений является показательная функция от матрицы

Ряд, определяющий показательную функцию, сходится при любой матрице А. Показательная функция от матриц обладает свойствами, напоминающими свойства обычной показательной функции. Так, если А и В коммутируют при умножении, т. е. АВ = ВА, то еА+в = еА ⋅ еВ. Однако при некоммутирующих А и В формула перестает быть верной.

Приложение к теории систем обыкновенных линейных дифференциальных уравнений. В теории систем обыкновенных линейных дифференциальных уравнений целесообразно рассматривать матрицы, элементы которых являются функциями от некоторой независимой переменной:

Для таких матриц естественным образом определяется понятие производной по аргументу t. Именно:

Нетрудно проверить, что для матриц справедливы некоторые элементарные формулы дифференцирования. Так

(Умножать нужно строго в том порядке, какой дан в формуле!)

Система обыкновенных линейных однородных дифференциальных уравнений

в этих обозначениях может быть записана в виде

где

т. е. в форме, аналогичной одному линейному однородному дифференциальному уравнению.

Если коэффициенты системы постоянные, т. е. матрица А постоянная, то и решение системы внешне выглядит так же, как решение уравнения у' = ау. Именно, в этом случае Y = eAtC, где С — столбец из произвольных постоянных.

Решение в этой форме очень удобно для исследования. Дело в том, что для любой аналитической функции f(z) имеет место равенство

Так как любую матрицу можно привести к канонической форме Жордана (см. § 4), то вычисление функции от любой матрицы сводится к вычислению функции от канонической матрицы, что легко осуществить. Поэтому если A=B-1LB, где L — каноническая матрица, то

где С' = ВС — столбец из произвольных постоянных.

Из этой формулы нетрудно получить явное выражение для всех составляющих искомого столбца Y.

Советский ученый И. А. Лаппо-Данилевский с успехом развил аппарат теории функций от матриц и впервые применил его к исследованию систем также и с переменными коэффициентами. Его результаты принадлежат к числу наиболее блестящих достижений математики за последние пятьдесят лет.

ЛИТЕРАТУРА

Гантмахер Ф. Р. Теория матриц. Гостехиздат, 1953.

Монография, содержащая богатый материал по приложениям линейной алгебры.

Гельфанд И. М. Лекции по линейной алгебре. Гостехиздат, 1951.

Содержит геометрическое изложение линейной алгебры с выходом в функциональный анализ.

Курош А. Г. Курс высшей алгебры. Гостехиздат, 1952.

Мальцев А. И. Основы линейной алгебры. Изд. 2, Гостехиздат, 1956.

Окунев Л. Я. Высшая алгебра. Гостехиздат, 1949.

Смирнов В. И. Курс высшей математики, т. III. Гостехиздат, 1953.

Фаддеева В. Н. Вычислительные методы линейной алгебры. Гостехиздат, 1950.

Излагаются методы численного решения основных задач линейной алгебры.

Глава XVII

АБСТРАКТНЫЕ ПРОСТРАНСТВА

С тех пор как Н. И. Лобачевский впервые показал возможность неэвклидовой геометрии и выдвинул новое представление об отношении геометрии к материальной действительности, предмет геометрии, ее методы и применения чрезвычайно расширились. Теперь математики изучают разные «пространства»: наряду с эвклидовым пространством рассматривается пространство Лобачевского, проективное пространство, различные n-мерные и даже бесконечномерные пространства, римановы, топологические и другие пространства; число таких пространств неограничено, и каждое из них имеет свои свойства, свою «геометрию». В физике используют понятия о так называемых фазовых и конфигурационных «пространствах»; теория относительности применяет представление о кривизне пространства и другие выводы абстрактных геометрических теорий.

Как и откуда возникли эти математические абстракции? Какое реальное основание, какое реальное значение и применение они имеют? Каково их отношение к действительности? Как они определяются и как их рассматривают в математике? Какое значение в математике имеют общие идеи современной геометрии?

На эти вопросы должна ответить настоящая глава. В ней не будут излагаться сами теории абстрактных математических пространств; это требовало бы гораздо большего объема изложения и гораздо большего обращения к специальному математическому аппарату. Задача состоит в том, чтобы выяснить сущность новых идей геометрии, т. е. ответить на поставленные вопросы, а это можно сделать без сложных доказательств и формул.

История вопроса восходит истоками к «Началам» Эвклида, к аксиоме или, как говорят еще, к постулату о параллельных линиях.

§ 1. ИСТОРИЯ ПОСТУЛАТА ЭВКЛИДА

В своих «Началах» Эвклид формулировал основные предпосылки геометрии в виде так называемых постулатов и аксиом. Среди них содержался V постулат (в других списках «Начал» — XI аксиома), который теперь формулируют обычно следующим образом: «Через точку, не лежа-

щую на данной прямой, нельзя провести более одной прямой, параллельной данной». Напомним, что прямая называется параллельной данной прямой, если обе прямые лежат в одной плоскости и не пересекаются, причем, говоря так, имеют в виду бесконечные прямые, а не конечные их отрезки.

Легко доказать, что через точку А, не лежащую на данной прямой я, всегда можно провести хотя бы одну прямую, параллельную данной.

Действительно, опустим из точки А перпендикуляр b на прямую а и проведем через А прямую с перпендикулярно b (рис. 1). Полученная фигура будет вполне симметрична относительно линии b, так как углы, образуемые прямой b по обе ее стороны с прямыми а и с, равны. Поэтому, перегибая плоскость по линии b, мы приведем половины прямых а и с в совпадение. Отсюда видно, что если бы а и с пересекались с одной стороны от AB, то они должны были бы пересекаться также с другой стороны. Выходило бы, что прямые а и с имеют две общие точки, a это невозможно, так как по основному свойству прямой через две точки может проходить только одна прямая (так что прямые, имеющие две общие точки, необходимо должны совпадать).

Итак, из основных свойств прямой и движения фигур (поскольку перегибание по линии AB есть вращение полуплоскости вокруг этой линии) следует, что хотя бы одна параллель к данной прямой всегда проходит через данную точку. Постулат же Эвклида дополняет этот вывод утверждением, что такая параллель только одна, никакой другой быть не может.

Среди других постулатов (аксиом) геометрии этот постулат занимает несколько особое место. У самого Эвклида он формулировался довольно сложно, но даже в приведенной выше обычной его форме он содержит известную трудность. Эта трудность заключается уже в самом понятии параллельных прямых: здесь речь идет о всей прямой. Но как убедиться, что данные прямые параллельны? Для этого нужно как бы пройти их в обе стороны «до бесконечности» и убедиться, что они нигде на всем бесконечном протяжении не пересекаются. Ясно, что такое представление имеет свою трудность. Все это, повидимому, и послужило причиной того, что постулат о параллельных занял уже у самого Эвклида несколько особое положение: в его «Началах» этот постулат применяется только начиная с 29-го предложения, в то время как в первых 28 предложениях Эвклид обходился без него. Ввиду сложности постулата желание обойтись без него могло возникнуть довольно естественно, и поэтому еще в древности появились попытки изменить определение параллельных линий, изме-

Рис. 1.

нить самую формулировку постулата или, что было бы лучше всего, вывести его как теорему из других аксиом и основных понятий геометрии.

Так, теория параллельных линий, основанная на V постулате, стала предметом комментирования и разработки в трудах многих геометров, начиная с древности. В цепи этих исследований главной задачей было вовсе избавиться от V постулата, выведя его как теорему из других основных положений геометрии.

Этой задачей занимались многие геометры: грек Прокл (V в. н. э.), комментировавший Эвклида, иранец Насирэддин Туси (XIII в.), англичанин Валлис (1616—1703), итальянец Саккери (1667—1733), немецкий философ и математик Ламберт (1728—1777), француз Лежандр (1752—1833) и многие другие; все они на протяжении более чем двух тысяч лет, прошедших со времени появления эвклидовых «Начал», изощрялись в тонкости и геометрическом остроумии, пытаясь доказать V постулат.

Однако результат этих попыток неизменно оставался отрицательным. Каждый раз выяснялось, что автор того или иного доказательства фактически опирался на какое-нибудь предположение, может быть, и очевидное, но вовсе не вытекающее с логической необходимостью из других предпосылок геометрии. Иными словами, дело сводилось каждый раз к замене V постулата другим утверждением, из которого этот постулат действительно вытекал, но которое само требовало доказательства1.

Глубже других в задачу проникли Саккери и Ламберт. Саккери первый попытался доказать V постулат от противного, т. е. он принял за исходное противоположное утверждение и, развивая из него следствия, надеялся придти к противоречию. Дойдя в этих выводах до результатов, казавшихся совершенно невообразимыми, он подумал, что решил задачу. Но ошибся, потому что противоречие с наглядным представлением не означает еще логического противоречия. Задача ведь состояла в логическом доказательстве эвклидова постулата на основе других положений геометрии, а не в том, чтобы еще раз убедиться в его наглядной верности. Этот постулат и сам по себе наглядно достаточно убедителен. Но, повторяем, наглядная убедительность и логическая необходимость вещи различные.

Ламберт оказался более глубоким мыслителем, чем Саккери и его предшественники. Идя по тому же пути, он не нашел логического противоречия и не допустил ошибки других; он не заявил, будто доказал

1 Таких утверждений, равносильных V постулату, было установлено много. Вот некоторые примеры: 1) прямая, параллельная данной, проходит от нее на постоянном расстоянии (Прокл); 2) существуют подобные (но не равные) треугольники, т. е. такие, углы которых равны, но стороны не равны (Валлис); 3) существует хотя бы один прямоугольник, т. е. такой четырехугольник, все углы которого прямые (Саккери); 4) прямая, перпендикулярная одной стороне острого угла, пересекает также другую его сторону (Лежандр); 5) сумма углов треугольника равна двум прямым (Лежандр); 6) существуют треугольники сколь угодно большой площади (Гаусс). Этот список теперь мы могли бы продолжать до бесконечности.

V постулат. Но и после него еще в начале XIX в. Лежандр снова «доказывает» V постулат, впадая в старую ошибку: постулат он опять-таки заменяет другими утверждениями, которые сами требуют доказательства.

Итак, к началу XIX в. проблема доказательства V постулата оставалась так же не решенной, как было во времена Эвклида. Усилия оставались тщетными, и задача, казалось, не продвинулась. Поистине то была глубокая загадка геометрии: задача, разрешимость которой казалась несомненной лучшим геометрам, никак не поддавалась решению в течение двух тысяч лет.

Теория параллельных стала в XIX в. одной из центральных задач геометрии. Ею занимались многие геометры: Гаусс, Лагранж, Даламбер, Лежандр, Вахтер, Швейкарт, Тауринус, Фаркаш Бойаи и другие.

Однако доказательство постулата не удается. В чем же дело: в неумении ли решить задачу, или, может быть, задача неверно поставлена? Этот вопрос уже начинал возникать перед некоторыми из геометров, превосходившими других глубиной мысли. Гаусс, знаменитейший немецкий математик, бьется над задачей начиная с 1792 г. и постепенно перед ним вырисовывается правильная постановка вопроса. Наконец, он решается отказаться от V постулата и начиная с 1813 г. развивает последовательность теорем, выводимых из противоположного утверждения. Несколько позже тем же путем идут немецкие математики Швейкарт в бытность его профессором права в Харькове и затем Тауринус. Но никто из них не нашел окончательного ответа на вопрос. Гаусс тщательно скрывал свои исследования, Швейкарт ограничился частным письмом к Гауссу, и лишь Тауринус выступил в печати с элементами новой геометрии, основанной на отрицании V постулата. Однако он сам исключал возможность такой геометрии. Таким образом, никто из них не решил задачи, и вопрос о правильности всей ее постановки оставался без ответа. Ответ впервые был дан Н. И. Лобачевским, молодым профессором Казанского университета: 23 февраля 1826 г. он прочел в заседании физико-математического факультета доклад о теории параллельных, а в 1829 г. опубликовал его содержание в журнале Казанского университета.

§ 2. РЕШЕНИЕ ЛОБАЧЕВСКОГО

1. Сущность решения проблемы V постулата, данного Лобачевским, выражена им самим в сочинении «Новые начала геометрии» (1835) в следующих словах:

«Всем известно, что в геометрии теория параллельных до сих пор оставалась несовершенной. Напрасное старание со времен Эвклида, в продолжение двух тысяч лет, заставило меня подозревать, что в самих понятиях еще не заключается той истины, которую хотели доказывать и которую проверить, подобно другим физическим законам, могут лишь опыты, каковы, например, астрономические наблюдения. В справедли-

вости моей догадки будучи, наконец, убежден и почитая затруднительный вопрос решенным вполне, писал об этом я рассуждение в 1826 году».

Разберем, что имел в виду Лобачевский в этом высказывании, в котором, как в фокусе, сконцентрирована новая его идея, не только давшая решение вопроса о V постулате, но повернувшая по-новому все понимание геометрии, да и не одной геометрии.

Н. И. Лобачевский еще в 1815 г. начал работать над теорией параллельных, пытаясь вначале, подобно другим геометрам, доказать V постулат. В 1823 г. он уже ясно осознал, что все доказательства, «какие были даны, могут называться только пояснениями, но не заслуживают быть почтены в полном смысле математическими доказательствами»1. Тут он увидел, что «в самих понятиях не заключается той истины, которую хотели доказывать», т. е., иными словами, из основных посылок и понятий геометрии нельзя вывести V постулат. Как он убедился, что такой вывод невозможен?

Он убедился в этом, далеко уйдя по тому пути, на котором первые шаги делали еще Саккери и Ламберт. В качестве предположения он ввел утверждение, противоположное эвклидовскому постулату, а именно: «через точку, не лежащую на данной прямой, можно провести не одну, а по крайней мере две прямые, параллельные данной». Примем это утверждение условно как аксиому и, присоединив его к другим положениям геометрии, будем развивать отсюда дальнейшие следствия. Тогда, если такое утверждение несовместимо с другими положениями геометрии, мы придем к противоречию, и тем самым V постулат будет доказан от противного: противоположное предположение приводится к противоречию. Однако поскольку такого противоречия не обнаруживается, приходим к двум выводам, которые и сделал Лобачевский.

Первый вывод состоит в том, что V постулат не доказуем. Второй вывод состоит в том, что на основе противоположной, только что сформулированной аксиомы можно развивать цепь следствий — теорем, которые не будут заключать противоречия. Эти следствия образуют тем самым некоторую логически возможную, непротиворечивую теорию, которая может рассматриваться как новая, неэвклидова геометрия. Лобачевский осторожно назвал ее «воображаемой», поскольку не мог еще найти ее реального объяснения. Но логическая ее возможность для него была ясна. Высказывая и отстаивая это твердое убеждение, Лобачевский проявил истинное величие гения, который не колеблясь отстаивает свои убеждения, а не прячет их от общественного мнения, опасаясь непонимания и критики.

Итак, первые два вывода, полученные Лобачевским, состояли в утверждении недоказуемости V постулата и в возможности развить на основе

1 Так писал Лобачевский в 1823 г. в своем курсе геометрии, который при его жизни не был, однако, опубликован. Этот курс «Геометрия» был впервые издан в 1910 г.

противоположной аксиомы новую геометрию, логически столь же содержательную и совершенную, как эвклидова, несмотря на противоречие ее выводов наглядным представлениям о пространстве. Лобачевский фактически развил эту новую геометрию, которая теперь носит его имя. В этом заключался общий результат огромной важности: логически мыслима не одна геометрия. Значение этого вывода во всем его объеме мы еще выясним; в нем, собственно, уже содержится не малая доля решения тех вопросов об абстрактных математических пространствах, которые были поставлены в начале этой главы.

Но вернемся к приведенному выше высказыванию Лобачевского. Он говорит, что геометрическую истину, подобно другим физическим законам, могут проверить лишь опыты. Это значит, во-первых, что под истиной нужно понимать соответствие отвлеченных понятий реальной действительности. Это соответствие может установить только опыт, и, следовательно, для проверки истинности тех или иных выводов нужны опытные исследования, одних же логических умозаключений для этого недостаточно. Хотя эвклидова геометрия отражает реальные свойства пространства очень точно, нельзя быть уверенным, что дальнейшие исследования не обнаружат только приближенную правильность эвклидовой геометрии как учения о свойствах реального пространства. Тогда геометрия как учение о реальном пространстве (а не как логическая система) потребует изменения и уточнения в согласии с новыми опытными данными.

Эта гениальная мысль Лобачевского нашла полное подтверждение в новом развитии физики — в теории относительности.

Сам Лобачевский предпринял вычисления на основе астрономических наблюдений, с тем чтобы проверить точность эвклидовой геометрии. Эти вычисления подтвердили тогда ее правильность в пределах доступной точности. Теперь положение изменилось, хотя нужно сразу оговорить, что и геометрия Лобачевского не оказалась более точной в применении к пространству, его свойства оказались другими, более сложными. Но еще раньше геометрия Лобачевского нашла свое обоснование и применение в другой связи, о чем мы будем подробно говорить дальше.

Нужно подчеркнуть, что Лобачевский вовсе не рассматривал свою геометрию просто как логическую схему, построенную на произвольно принятых предположениях. Главную задачу он видел не в логическом анализе оснований геометрии, а в исследовании их отношения к действительности. Поскольку опыт не может дать абсолютно точного решения вопроса о верности эвклидова постулата, постольку имеет смысл исследование тех логических возможностей, которые представляются более основными предпосылками геометрии. Это математическое исследование поможет наметить те пути, по которым должно идти физическое изучение свойств реального пространства. Тем более, что геометрия Эвклида есть предельный случай геометрии Лобачевского, и потому эта последняя включает более широкие возможности. С этой точки зрения ограничение

постулатом Эвклида было бы запретом для развития теории. Теория должна выходить за пределы уже известного, чтобы искать и указывать пути к открытию новых фактов и законов. Глубокое понимание связи математики с действительностью позволяет выделить из разнообразия логических возможностей именно те, которые имеют наибольшее основание оказаться полезными в познании природы. Если бы геометры вслед за Лобачевским не развивали математического учения о возможных свойствах пространства, современная физика не имела бы тех математических средств, которые позволили формулировать и развить положения теории относительности.

Итак, подведем итог того решения проблемы V постулата, которое дал Лобачевский.

1°. Постулат недоказуем.

2°. Присоединяя к основным положениям геометрии противоположную аксиому, можно развить логически совершенную и содержательную геометрию, отличную от эвклидовой.

3°. Правильность выводов той или иной логически мыслимой геометрии в применении к реальному пространству проверяется только опытом. Логически мыслимая геометрия должна разрабатываться не как произвольная логическая схема, а как теория, намечающая возможные пути и методы развития физических теорий.

Решение это совершенно отлично от того, что хотели получить геометры, пытавшиеся доказать эвклидов постулат. Оно настолько шло вразрез с установившимися представлениями, что не встретило понимания среди математиков. Оно было для них еще слишком новым и радикальным. Лобачевский как бы разрубил гордиев узел теории параллельных, а не распутал его, как то рассчитывали сделать другие.

2. Почти одновременно с Лобачевским недоказуемость V постулата и возможность неэвклидовой геометрии обнаружил венгерский геометр Янош Бойаи (1802—1860), который опубликовал свои выводы в виде дополнения к вышедшему в 1832 г. геометрическому трактату своего отца Фаркаша Бойаи. Предварительно отец послал работу сына на отзыв Гауссу и получил похвальный ответ, где Гаусс сообщал, что уже давно сам пришел к тем же выводам. Однако от печатных выступлений Гаусс все же воздержался. В одном из писем он объясняет это тем, что боится быть непонятым.

В науке всегда бывает так, что назревшие в ней выводы почти одновременно и независимо получаются разными учеными. Интегральное и дифференциальное исчисление развивали одновременно Ньютон и Лейбниц; к идеям Дарвина независимо пришел в то же время Уоллес; начала теории относительности одновременно с Эйнштейном наметил также Пуанкаре, и таких примеров можно привести много. Они доказывают лишний раз, что наука развивается необходимым образом путем решения назревших в ней задач, а не путем случайных открытий и догадок. Так

и к открытию возможности неэвклидовой геометрии подошли одновременно несколько геометров: Лобачевский, Бойаи, Гаусс, Швейкарт и Тауринус.

Однако, как это также постоянно бывает в науке, не все ученые, пришедшие к новому результату, играют в его установлении одинаковую роль, и не всем можно приписать одинаковую заслугу. Здесь имеет значение и первенство по времени, и ясность и глубина выводов, и последовательность и обоснованность их проведения. Ни Швейкарт, ни Тауринус не были убеждены в правомерности новой геометрии, а это как раз и было решающим в данном случае, тем более что отдельные ее выводы были получены еще Саккери и Ламбертом. Гаусс, хотя и имел, повидимому, это убеждение, но не был настолько тверд в нем, чтобы рискнуть выступить с ним открыто. Глубокий и разносторонний математик, он не имел мужества отстаивать новые идеи и не произвел поэтому в математике такого переворота, какой сделал Лобачевский. В этом Гаусс оставался типичным представителем немецкой интеллигенции той эпохи, с ее глубокой теоретической мыслью и политической трусостью. Этот дух выразился в философии Гегеля — современника Гаусса, который, как говорит Ленин, «гениально угадал, именно угадал, не более», диалектику природы и познания, но, угадав эту, по словам Герцена, «алгебру революции», подчинил ее своей идеалистической, реакционной системе философии.

Бойаи не проявил нерешительности, но он не дал новым идеям столь далекого и глубоко идущего развития, какое дал Лобачевский. Именно Лобачевский первый открыто — устно в 1826 г. и печатно в 1829 г. — высказал новые идеи и продолжал развивать и пропагандировать их в ряде трудов, кончая вышедшей в 1855 г. «Пангеометрией», которую он диктовал, будучи уже слепым стариком на склоне лет, сохраняя твердость духа и уверенность в своей правоте. Именно поэтому новая геометрия по праву носит его имя.

Н. И. Лобачевский не только развил новую геометрию, но и правильно поставил вопрос об отношении геометрии к действительности. У идеалистов большим почетом пользовалась подновляемая до сих пор философия Канта, согласно которой пространство не является реальной формой существования материи, а лишь врожденной формой нашего представления, априорной, т. е. не зависящей от опыта, формой созерцания. По Канту, следовательно, и геометрия является априорной, не зависящей от опыта. Лобачевский опроверг это идеалистическое воззрение. Он выступил против него как материалист, дав глубокое материалистическое понимание отношения геометрии к действительности. Он говорил, что истину проверить могут только опыты. Вопреки Канту, Лобачевский утверждал, что «первые», т. е. основные «понятия приобретаются чувствами, врожденным — не должно верить». Лобачевский не только настаивал на происхождении представлений и понятий из опыта (о чем говорили материалисты

и до него), но и показал, что отношение геометрии к действительности должно еще уточняться опытом. Тут заключалась уже идея развития геометрии, идея неограниченного приближения к абсолютной истине по мере развития наших знаний.

Таким образом, Лобачевский был не только гениальным геометром, но и философом-материалистом. Он был также энергичным и разносторонним деятелем на поприще русского просвещения, состоя профессором и в течение почти 20 лет ректором Казанского университета. В материализме Лобачевского, в мужестве и стойкости, с которыми он отстаивал свои идеи, вопреки непониманию и даже издевательствам, в его широкой деятельности как ученого, педагога и организатора выразились характерные черты лучших представителей русского образованного общества того времени. То была эпоха бурного подъема и расцвета русского гения и общественного самосознания — эпоха Пушкина, декабристов, Белинского. Россия выступала на мировую арену не как робкая и послушная ученица европейской культуры, а как сила, дающая свое, новое, такое, чего не знала еще Европа. Так, в математике Лобачевский решил проблему, стоявшую перед наукой две тысячи лет, и повернул ее развитие на новые пути. Его материализм, его научное мужество сродни материализму и мужеству Радищева, Пестеля и Белинского. Лобачевский был не только создателем новой геометрии, но ученым, мыслителем и гражданином — великим человеком в полном смысле этого слова. Последовавшее за Лобачевским развитие геометрии, конечно, далеко вышло за пределы, о каких он мог мыслить, но по праву от него нужно считать начало новой эпохи в геометрии и в математике вообще.

§ 3. ГЕОМЕТРИЯ ЛОБАЧЕВСКОГО

1. Итак, Лобачевский принял за основу утверждение, противоположное V постулату: в данной плоскости через точку можно провести по крайней мере две прямые, не пересекающие данную прямую. Отсюда он вывел ряд далеко идущих следствий, которые и образовали новую геометрию. Эта геометрия строилась, следовательно, как некоторая мыслимая теория, как совокупность теорем, логически доказываемых исходя из сделанного предположения, в соединении с другими1 основными посылками эвклидовой или, как говорил Лобачевский, «употребительной» геометрии.

В своих выводах Лобачевский получил все результаты, аналогичные результатам «употребительной» элементарной геометрии, т. е. дошел до неэвклидовой тригонометрии и решения треугольников, до вычисления площадей и объемов. Мы не можем здесь проследить эту цепь выводов Лобачевского не потому, что они слишком сложны, а прежде всего по недостатку места. Ведь и школьный курс «употребительной» геометрии

1 Эти, так сказать, «остальные» положения геометрии будут ниже (в § 5) тоже точно сформулированы.

довольно велик, а выводы Лобачевского, конечно, не проще и не короче этих «употребительных» выводов. Поэтому мы отметим здесь только некоторые поразительные результаты Лобачевского, отсылая читателя, интересующегося более глубоким изучением неэвклидовой геометрии, к специальной литературе. Дальше же мы выясним простой реальный смысл неэвклидовой геометрии.

Начнем с теории параллельных линий. Пусть дана прямая а и точка А вне ее. Опустим из А перпендикуляр AB на прямую а. По основному предположению существуют по крайней мере две прямые, проходящие через точку А и не пересекающие нашу прямую а. Тогда всякая прямая, идущая в угле между этими прямыми, также не пересекает а. На рис. 2 прямые b и b' при продолжении пересекут а вопреки предположению Лобачевского. Но в этом нет ничего удивительного. Ведь Лобачевский рассуждал не о чертежах, которые мы делаем на обычной плоскости; он развивал логические следствия из своего предположения, которое противоречит тому, что мы привыкли видеть на чертежах. Чертежи здесь играют только вспомогательную роль; на них не изображаются в точности факты неэвклидовой геометрии, поскольку мы проводим на чертеже обычные, в пределах точности чертежа — безусловно эвклидовы — прямые на обычной плоскости.

Это противоречие между логической возможностью и наглядным представлением было главной трудностью в понимании геометрии Лобачевского. Но если речь идет о геометрии как логической теории, то нужно заботиться о логической строгости рассуждений, а не о согласии с привычными чертежами.

2. Вернемся опять к нашей прямой а и точке А. Проведем из А полупрямую х, не пересекающую а (например, перпендикулярную AB), и будем вращать ее вокруг А так, чтобы угол о между А В и х уменьшался, не доводя, однако, эту полупрямую до пересечения с а. Тогда полупря-

Рис. 2.

Рис. 3.

мая x будет стремиться к предельному положению, отвечающему наименьшему значению угла φ. Эта предельная полупрямая с также не будет пересекать а.

Действительно, если бы она пересекала прямую а в какой-то точке X (рис. 3), то мы могли бы взять точку X' правее и получили бы полупрямую АХ', пересекающую а, но образующую с AB больший угол. А это невозможно, так как по построению полупрямой с любая полупрямая х, образующая с AB больший угол, прямую а уже не пересекает.

Следовательно, полупрямая с не пересекает а и является вместе с тем крайней из всех полупрямых, проходящих через точку А и не пересекающих прямую а.

По симметрии очевидно, что с другой стороны также можно провести полупрямую с', не пересекающую а и самую крайнюю из всех таких полупрямых. Если бы с и с' служили продолжением друг друга, то они образовали бы вместе одну прямую с+с'. Эта прямая была бы тогда единственной прямой, параллельной а и проходящей через данную точку А, потому что при малейшем ее вращении или с, или с' должна была бы пересечь а. А раз предположено, что параллельная не одна, а их по крайней мере две, то полупрямые с и c' не являются продолжением друг друга.

Итак, мы доказали первую теорему геометрии Лобачевского:

Из точки А, не лежащей на данной прямой а, можно провести две полупрямые с и с' так, что они не пересекают прямую а, но любая полупрямая, идущая в угле между ними, пересекает прямую а.

Если продолжить полупрямые с и с', то получим (рис. 4) две прямые, не пересекающие а и обладающие тем свойством, что всякая прямая, проходящая через А в угле α между этими прямыми, не пересекает прямую a, a всякая прямая, проходящая в угле ß, пересекает прямую а. Такие прямые с, с' Лобачевский назвал параллельными прямой а: прямую с — параллельной справа, прямую с' — параллельной слева. Половину угла ß Лобачевский назвал углом параллельности; он меньше прямого, поскольку ß меньше двух прямых.

3. Рассмотрим теперь, как меняется расстояние от точки X на прямой с до прямой а при движении X вдоль с (рис. 5). В эвклидовой

Рис. 4. Рис. 5.

геометрии расстояние между параллельными прямыми постоянно. Здесь же мы убедимся, что при движении точки X направо ее расстояние от а (т. е. длина перпендикуляра XY) убывает.

Опустим из точки A1 перпендикуляр A1B1 на прямую а. Из точки B1 опустим перпендикуляр B1A2 на прямую с (точка A2 лежит правее A1, так как угол у острый). Наконец, из точки A2 опустим перпендикуляр A2B2 опять на прямую а. Докажем, что A2B2 меньше A1B1.

Теорема о том, что перпендикуляр короче наклонной, верна и в геометрии Лобачевского, поскольку ее доказательство (которое можно найти в любом школьном учебнике геометрии) не опирается на понятие о параллельных прямых или связанные с ними выводы. А раз перпендикуляр короче наклонной, то B1A2 как перпендикуляр к прямой с короче A1B1 и аналогично A2B2 как перпендикуляр к а короче B1A2. Следовательно, A2B2 короче A1B1.

Далее, опуская на прямую с перпендикуляр B2A3 из точки B2 и повторяя то же рассуждение, можно убедиться, что A3B3 короче A2B2. Продолжая это построение, мы получим последовательность все более и более коротких перпендикуляров, т. е. расстояния точек A1, A2, . . . от прямой а убывают. Дальше, дополняя наше простое рассуждение, можно было бы доказать, что вообще если точка Х" на с лежит правее X', то перпендикуляр X"Y" короче X'Y'. Мы не будем на этом останавливаться. Проведенное рассуждение, мы надеемся, достаточно выясняет суть дела, а строгие доказательства не входят в нашу задачу.

Но замечательным оказывается, что, как можно доказать, расстояние XY не только убывает при движении точки X по прямой с вправо, но оно стремится к нулю, когда точка X удаляется в бесконечность. То-есть параллельные прямые а и с асимптотически сближаются! Вместе с тем можно доказать, что в противоположном направлении расстояние между ними не только увеличивается, но и растет до бесконечности.

В эвклидовой геометрии прямая, параллельная данной, проходит от нее на постоянном расстоянии. В геометрии же Лобачевского вообще не существует таких пар прямых, там прямые всегда расходятся до бесконечности или в одну сторону или в обе стороны. Линия же, проходящая на постоянном расстоянии от данной прямой, никогда не будет прямой, а является некоторой кривой, называемой эквидистантой, т. е. равноудаленной.

Эти выводы геометрии Лобачевского поистине поразительны и никак не вяжутся с привычными наглядными представлениями. Но как мы уже говорили, такое несоответствие не может быть аргументом против геометрии Лобачевского как отвлеченной теории, логически развиваемой из принятых предпосылок.

4. Рассмотрим теперь еще угол параллельности, т. е. тот угол γ, который образует прямая с, параллельная данной прямой а, с перпендикуляром CA (рис. 6). Докажем, что этот угол тем меньше, чем дальше

точка С от прямой а. Для этого докажем сначала следующее. Если две прямые b и b' образуют с секущей ВВ' равные углы α, α', то эти прямые имеют общий перпендикуляр (рис. 7).

Для доказательства проведем через середину О отрезка ВВ' прямую СС', перпендикулярную прямой b. Получим два треугольника ОВС и OB'С'. Их стороны OB и OB' равны по построению. Углы при общей вершине О равны, как вертикальные. Угол α" равен углу α', так как они тоже вертикальные. Угол же ос равен углу α' по условию. Следовательно, угол ос равен также углу α". Таким образом, у наших треугольников ОВС и OB'С' равны стороны OB и OB' и прилежащие к ним углы. А тогда по известной теореме треугольники равны, т. е. равны, в частности, их углы при С и С'. Но угол С прямой, так как по построению прямая СС' перпендикулярна b. Следовательно, угол С' также прямой, т. е. СС' перпендикулярна также и к прямой b'. Таким образом, отрезок СС является общим перпендикуляром к обеим прямым b и b'. Существование общего перпендикуляра доказано.

Теперь докажем, что угол параллельности убывает с увеличением расстояния от прямой. То-есть, если точка С' лежит от прямой а дальше, чем С, как на рис. 6, то параллель с', идущая из С", образует с перпендикуляром C'A меньший угол, чем параллель с, идущая из С.

Для доказательства проведем из С' прямую с' под тем же углом к C'A, под каким идет параллель с. Тогда прямые с и с" образуют с секущей СС равные углы. Поэтому, как только что доказано, они имеют общий перпендикуляр ВВ'. Тогда из основания В' этого перпендикуляра можно провести прямую с"', параллельную с и образующую с перпендикуляром угол меньше прямого, потому что, как мы уже знаем, параллель образует с перпендикуляром угол меньше прямого. Возьмем теперь в угле между с" и с"' любую точку M и проведем прямую С'М. Она войдет в угол между с", с"' и дальше уже не сможет пересечь с"'. Тем более она не будет пересекать прямую с. Но она образует с АС уже меньший угол, чем с", т. е. угол меньший γ. Тем более, еще меньший угол будет образовывать параллель с', поскольку она является самой крайней

Рис. 6.

Рис. 7.

из всех прямых, идущих из С' и не пересекающих а. Следовательно, параллель с' образует с С'А угол меньший, чем с, а это и значит, что угол параллельности убывает при переходе к более далекой точке С", что и требовалось доказать.

Итак, мы доказали, что угол параллельности убывает по мере удаления точки С от прямой а. Но оказывается, можно доказать и более того: если точку С удалять в бесконечность, то этот угол стремится к нулю. То-есть на сколь угодно большом расстоянии от прямой а параллель к ней образует с перпендикуляром к этой прямой сколь угодно малый угол1. Иначе говоря, если очень далеко от прямой а отклониться от перпендикуляра к ней на очень малый угол, то мы вовсе не пересечем прямую а, идя по «отклонившейся» прямой. Этот факт геометрии Лобачевского также производит удивительное впечатление. Но дальше можно получить и другие, не менее удивительные результаты.

Например, возьмем острый угол α, образуемый полупрямыми а и а'. Проведем перпендикуляр b к а настолько далеко от вершины О угла а, чтобы угол параллельности, соответствующий взятому расстоянию OB (рис. 8), был меньше α. Раз угол ос больше угла параллельности, то прямая b', проведенная из О параллельно b, образует с а меньший угол. Но она не пересекает прямую b. Следовательно, а' тем более ее не пересекает. Этим доказано, что перпендикуляр к стороне острого угла, проведенный достаточно далеко от вершины, не пересекает другую сторону.

5. Мы привели все предыдущие выводы с двоякой целью. Во-первых, и это главное, мы хотели показать на самых простых примерах, как фактически можно получать теоремы геометрии Лобачевского, исходя из принятых предпосылок. Это служит простейшим примером того, как вообще математики получают выводы в абстрактной геометрии, как вообще можно получить такие выводы, не связанные с привычными наглядными

Рис. 8. Рис. 9.

1 Если h — длина перпендикуляра, у — угол параллельности, то, как показал Лобачевский, tg -y/2 = , где к — постоянная, зависящая от единиц длины, а е — известное основание натуральных логарифмов. Очевидно , а с ним и у стремится к нулю при h → ∞.

представлениями. Во-вторых, мы хотели показать, сколь своеобразные результаты получаются в геометрии Лобачевского. Приведем еще примеры.

Две прямые в плоскости Лобачевского либо пересекаются, либо параллельны в смысле Лобачевского, и тогда они в одну сторону асимптотически сближаются, а в другую — бесконечно расходятся, либо они имеют общий перпендикуляр и в обе стороны от него бесконечно расходятся.

Если прямые a, b имеют общий перпендикуляр (рис. 9), то к прямой а можно провести два перпендикуляра с, d, параллельные (в смысле Лобачевского) прямой b, вся прямая b лежит в полосе между прямыми с, d.

Предел окружностей бесконечно увеличивающегося радиуса не есть прямая, а некоторая кривая, называемая предельной окружностью. Через три точки, не лежащие на одной прямой, не всегда можно провести окружность, а либо окружность, либо предельную окружность, либо эквидистанту (т. е. линию, образованную точками, равноудаленными от некоторой прямой).

Сумма углов треугольника всегда меньше двух прямых. Если треугольник увеличивается так, что все три его высоты неограниченно возрастают, то все три его угла стремятся к нулю.

Не существует треугольников сколь угодно большой площади.

Два треугольника равны, если их углы равны.

Длина окружности l не пропорциональна радиусу r, а растет быстрее (в основном по показательному закону). Именно, имеет место формула

(1)

где к — постоянная, зависящая от единиц длины. Так как

то из формулы (1) получаем:

(2)

И только при малых отношениях с достаточной точностью получается, что l = 2πr.

Все эти выводы являются логическими следствиями принятых предпосылок: «аксиомы Лобачевского» в соединении с основными положениями «употребительной» геометрии.

6. Чрезвычайно важное свойство геометрии Лобачевского заключается в том, что в достаточно малых областях она мало отличается от геометрии Эвклида; чем меньше область, тем это различие меньше.

Так, для достаточно малых треугольников связь сторон и углов с достаточной точностью выражается формулами обычной тригонометрии и притом тем точнее, чем меньше треугольник.

Формула (2) показывает, что при малых радиусах длина окружности с хорошей точностью пропорциональна радиусу. Точно так же сумма углов треугольника мало отличается от двух прямых и т. п.

В формулу для длины окружности входит постоянная k, зависящая от единиц длины. Если радиус мал в сравнении с к, т. е. если r/k мало, то, как видно из формулы (2), длина l близка к 2πr. Вообще, чем меньше отношение размеров фигуры к этой постоянной, тем точнее свойства фигуры подходят к свойствам соответствующей фигуры в эвклидовой геометрии1.

Мерой отклонения свойств фигуры геометрии Лобачевского от свойств фигуры эвклидовой геометрии служит отношение r/k, если r измеряет размеры фигуры (радиус окружности, стороны треугольника и т. п.).

Отсюда вытекает важный вывод.

Пусть мы имеем дело с реальным пространством и измеряем расстояние в километрах. Допустим, что постоянная к при этом очень велика, скажем равна 1012.

Тогда, например, по формуле (2) для окружности с радиусом даже в 100 км отношение ее длины к радиусу будет отличаться от 2π меньше, чем на одну миллиардную. Того же порядка будут отклонения от других соотношений эвклидовой геометрии. В пределах одного километра они будут уже порядка 1/k , т. е. 10-12, а в пределах метра — порядка 10-15, т. е. будут совсем ничтожными. Таких отклонений от эвклидовой геометрии уже нельзя было бы заметить, потому что даже размеры атома в сто раз больше (они составляют величину порядка 10-13 км).

1 Например, если а, b, с — катеты и гипотенуза прямоугольного треугольника, то вместо теоремы Пифагора имеет место соотношение

Разлагая в ряды, получим:

так что при большом к получаем теорему Пифагора c2 = a2 + b2. Далее, по формуле Лобачевского для угла параллельности у (см. сноску на стр. 106)

Если h/k мало, т. е. если параллельные близки, то

Таким образом, на малых расстояниях параллельные на плоскости Лобачевского мало отличаются от эвклидовых.

С другой стороны, для астрономических масштабов отношение ^

могло бы оказаться уже не слишком малым.

Поэтому Лобачевский и допускал, что, хотя в обычных масштабах геометрия Эвклида и верна с большой точностью, отклонения от нее можно будет заметить посредством астрономических наблюдений. Как уже было сказано, само это допущение оправдалось, но те незначительные отклонения от эвклидовой геометрии, которые обнаружены теперь в астрономических масштабах, оказываются еще более сложными.

Наконец, из приведенных рассуждений следует еще другой важный вывод. Именно: раз отклонения от эвклидовой геометрии тем меньше, чем больше постоянная А, то в пределе, при неограниченном увеличении ее, геометрия Лобачевского переходит в геометрию Эвклида. То-есть геометрия Эвклида есть не более как предельный случай геометрии Лобачевского. Поэтому если к геометрии Лобачевского присоединить и этот ее предельный случай, то она охватит также геометрию Эвклида, оказываясь в этом смысле более общей теорией. Соответственно этому Лобачевский называл свою теорию «пангеометрией», т. е. общей геометрией. Такое соотношение теорий постоянно обнаруживается в развитии математики и естествознания: новая теория включает старую как предельный случай, соответственно движению познания от более частных выводов к более общим.

Однако все приведенные рассуждения и выводы оставались как бы мало понятной игрой ума, если бы не был установлен сравнительно простой реальный смысл геометрии Лобачевского в системе уже привычных понятий эвклидовой геометрии. Решение этой задачи не было доведено до конца самим Лобачевским; оно осталось на долю его последователей и было получено почти 40 лет спустя после выхода в свет первой его работы. В чем состоит это решение, мы расскажем в следующем параграфе.

§ 4. РЕАЛЬНЫЙ СМЫСЛ ГЕОМЕТРИИ ЛОБАЧЕВСКОГО

1. Наглядное истолкование геометрии Лобачевского было получено впервые в 1868 г., когда итальянский геометр Бельтрами заметил, что внутренняя геометрия на некоторой поверхности — псевдосфере — совпадает с геометрией на куске плоскости Лобачевского. Напомним, что под внутренней геометрией поверхности понимают ту совокупность свойств фигур на ней, которые определяются только лишь измерением длин на самой поверхности. На рис. 10 слева изображена так называемая трактриса. Это кривая, обладающая тем свойством, что длина отрезка ее касательной от точки касания до пересечения с осью Oy для всех точек кривой постоянна. Ось Oy ее асимптота. Вращая трактрису

вокруг ее асимптоты, мы получаем изображенную на рис. 10 справа поверхность, которая и называется псевдосферой.

Истолкование геометрии Лобачевского по Бельтрами сводится к тому, что все геометрические соотношения на куске плоскости Лобачевского совпадают с геометрическими соотношениями на подходящем куске псевдосферы, если принять следующие условия. Роль прямолинейных отрезков играют кратчайшие линии на поверхности — геодезические. Расстояние между точками определяется как длина наиболее короткой линии, соединяющей их на поверхности. Фигуры считаются равными, если можно так сопоставить их точки, что внутренние расстояния между соответственными точками будут равны. Перемещение фигур на псевдосфере, сохраняющее их размеры с точки зрения внутренней геометрии, хотя и сопровождается изгибанием, изображает движение в плоскости Лобачевского. Длины, углы и площади измеряются на поверхности, как обычно и отвечают длинам, углам и площадям в геометрии Лобачевского.

Истолкование Бельтрами показывает, что при этих условиях, каждому утверждению геометрии Лобачевского, относящемуся к куску плоскости, отвечает непосредственный факт внутренней геометрии псевдосферы. Геометрия Лобачевского имеет стало быть совершенно реальный смысл: она есть не что иное, как абстрактно изложенная геометрия на псевдосфере.

Нужно сказать, что внутреннюю геометрию псевдосферы за 30 лет до открытия Бельтрами уже исследовал Ф. Миндинг, который фактически установил свойства, показывающие ее совпадение с геометрией

Рис. 10.

Лобачевского. Однако этого ни он, ни кто-либо другой не заметил, пока идеи Лобачевского не получили достаточного распространения. Бельтрами оставалось только сопоставить выводы Лобачевского и Миндинга, чтобы увидеть их связь.

Открытие Бельтрами сразу изменило отношение математиков к геометрии Лобачевского; из «воображаемой» она стала реальной1.

2. Однако, как было подчеркнуто, на псевдосфере реализуется геометрия не всей плоскости Лобачевского, а лишь ее куска2. Поэтому оставалась еще не решенной задача выяснения реального смысла геометрии Лобачевского на всей плоскости и тем более в пространстве. Эта задача и была вскоре, в 1870 г., разрешена немецким математиком Клейном. Изложим, в чем состояло данное им решение.

Возьмем на обычной эвлкидовой плоскости круг и будем рассматривать лишь внутренность этого круга, т. е. исключим из рассмотрения его окружность и область вне круга. Эту внутренность круга назовем условно «плоскостью» — она, оказывается, и будет играть роль плоскости Лобачевского. Хорды нашего круга назовем «прямыми», причем согласно принятому условию концы хорд как лежащие на окружности исключаются. Наконец, назовем «движением» любое такое преобразование круга, которое переводит его самого в себя и оставляет прямые прямыми, т. е. не искривляет его хорд. Простейшим примером

1 История установления реального смысла геометрии Лобачевского была в действительности еще более сложной. Во-первых, уже сам Лобачевский владел средствами доказательства ее непротиворечивости посредством так называемой аналитической модели, но не мог еще до конца выразить такое доказательство. Это было сделано гораздо позже. Во-вторых, немецкий математик Риман в 1854 г. выступил с теорией (см. § 10), в которой уже содержались выводы Бельтрами, но Риман не выразил их явно; его доклад не был понят и был опубликован лишь после его смерти в том же 1868 г., когда появилась работа Бельтрами. Вообще вся история геометрии Лобачевского от попыток доказательства постулата Эвклида до полного выяснения значения неэвклидовой геометрии чрезвычайно поучительна тем, что показывает, каких усилий и обходных путей требует часто открытие истины, которая потом оказывается простой и понятной.

2 Псевдосфера имеет всюду одинаковую отрицательную гауссову кривизну. Все поверхности постоянной отрицательной кривизны имеют (по крайней мере в малых кусках) ту же внутреннюю геометрию и тем самым могут служить для изображения геометрии Лобачевского. Однако, как доказал в 1901 г. Гильберт, никакая из этих поверхностей не может быть бесконечно продолжена во все стороны без особенностей и потому не может реализовать всю плоскость Лобачевского. С другой стороны, в 1955 г. молодой голландский математик Кейпер установил, что существуют гладкие поверхности, реализующие в смысле их внутренней геометрии всю плоскость Лобачевского, но такие поверхности, хотя и гладкие, не могут быть непрерывно изогнутыми, они не имеют определенной кривизны.

Заметим еще следующее. При реализации геометрии Лобачевского на поверхности постоянной отрицательной кривизны К постоянная k, фигурировавшая в формулах предыдущего параграфа, получает простой смысл: k2 = 1/K.

такого преобразования служит вращение круга вокруг центра, но оказывается, что таких преобразований гораздо больше. Каковы эти преобразования, будет сказано дальше.

Если ввести такие условные обозначения, то оказывается, что факты обычной геометрии внутри нашего круга превращаются в теоремы геометрии Лобачевского. И обратно: всякая теорема геометрии Лобачевского истолковывается как факт обычной геометрии внутри круга.

Например, по аксиоме Лобачевского через точку, не лежащую на данной прямой, можно провести по крайней мере две прямые, не пересекающие данную. Переводим эту аксиому на язык обычной геометрии согласно принятому условию, т. е. заменяя прямые хордами. Тогда мы получим утверждение: через точку внутри круга, не лежащую на данной хорде, можно провести по крайней мере две хорды, не пересекающие данную. Справедливость этого утверждения очевидна из рис. 11. Следовательно, аксиома Лобачевского здесь выполняется.

Вспомним далее, что в геометрии Лобачевского среди прямых, проходящих, через данную точку и не пересекающих данную прямую, есть две крайние,—те, которые по Лобачевскому только и называются параллельными данной прямой. Это означает, что среди хорд, проходящих через данную точку А и не пересекающих данную хорду ВС, есть две крайние хорды. И действительно, такими крайними хордами будут хорды, подходящие одна к точке В, другая — к точке С. Они ведь не имеют с хордой ВС общих точек, поскольку точки, лежащие на окружности, мы исключаем. Таким образом, эта теорема Лобачевского здесь выполняется.

Для дальнейшего перевода теорем Лобачевского на язык обычной геометрии внутри круга необходимо выяснить, как должны измеряться в круге отрезки и углы, чтобы это измерение отвечало геометрии Лобачевского. Конечно, это измерение не будет совпадать с обычным, потому что в обычном смысле хорда имеет конечную длину, а прямая, которую изображает хорда, бесконечна. В этом можно было бы даже усмотреть некоторое противоречие, но мы увидим, что никакого противоречия тут нет.

Прежде всего вспомним, что измерение длин отрезков производится следующим образом. Выбирается какой-либо отрезок AB, длина которого принимается равной единице, и длина любого другого отрезка XY определяется сравнением его с отрезком AВ. При этом отрезок AB откладывается вдоль отрезка XY. Если остается еще доля отрезка XY, меньшая AB, то отрезок AB делят, например, на 10 равных частей (равных в том смысле, что каждая получается из другой движением); эти доли откладывают на оставшейся части отрезка XY; потом, если нужно, делят отрезок AB на 100 частей и т. д. В результате длина отрезка XY выразится в виде десятичной дроби, которая может быть и бесконечной. Стало быть, измерение длины производится путем пере-

движения целого или части отрезка, принятого за единицу, т. е. измерение основано на движении. А раз движения уже определены (мы определили их в данном случае как преобразования круга, переводящие прямые в прямые), то тем самым известно, какие отрезки считаются равными и как нужно измерять длину. Словом, определение движения уже включает, хотя и в неявном виде, закон измерения длин. Совершенно так же углы измеряют откладыванием угла, принятого за единицу. Таким образом, закон измерения углов также содержится в определении движения.

Законы измерения длин и углов, отвечающие геометрии Лобачевского, получаются довольно простыми, хотя и существенно отличными от обычных. Приводить их вывод мы не будем, так как это не имеет в наших рассуждениях принципиального значения1.

Закон измерения длин оказывается таким, что хорда имеет бесконечную длину. И это потому, что если путем преобразования, принятого нами за движение, перевести отрезок AB в отрезок ВB1, далее в отрезок B1B2 и т. д., то получаемые отрезки ВкВк+1 будут становиться в обычном смысле все короче (хотя и будут равными в смысле нашей модели геометрии Лобачевского; рис. 12). Точки B1, B2, ..., Вk, ... будут сгущаться к концу хорды. Но хорда у нас не имеет конца: конец ее по условию исключен, и она уже в этом смысле «бесконечна». В смысле геометрии Лобачевского точки B1, B2, ... никуда не будут сгущаться, они будут уходить в бесконечность. Путем преобразования, принятого нами за движение, откладывая друг за другом равные отрезки, нельзя изнутри круга достигнуть его окружности.

Рис. 11. Рис. 12.

1 Закон измерения длин оказывается следующим. Пусть отрезок AB лежит на хорде CD (рис. 12). Измеряем отрезки обычным образом и составляем так называемое сложное отношение CB/CA : DB/DA. Его логарифм принимают за длину отрезка AB.

Для того чтобы лучше понять, как в модели откладывают отрезок, рассмотрим то преобразование, которое играет роль переноса вдоль прямой.

Пусть на плоскости введены прямоугольные координаты с началом в центре круга. Для определенности будем считать, что наш круг имеет радиус, равный единице, так что его окружность представляется уравнением x2+у2 = 1, а точки внутри круга удовлетворяют неравенству x2+у2 <1.

Рассмотрим преобразование, заданное формулами

(3)

где х', у' — кординаты точки, в которую переходит после преобразования точка, первоначально имевшая координаты х, у, а а —любое данное число, по абсолютной величине меньше единицы.

Если из формул (3) найти х и у, то получим, как легко проверить, обратное выражение х, у через х', у'

(4)

Преобразование (3) удовлетворяет двум условиям для «движений» в нашей модели: 1) оно переводит круг сам в себя; 2) оно переводит прямые в прямые.

Для доказательства первого свойства надо, собственно говоря, убедиться, что неравенство или равенство x2+у2 ⩽ 1 влечет за собой соответствующее соотношение х'2 + у'2 ⩽ 1 и обратно. Покажем, например, что при x2+у2—1 обязательно и х'2+у'2 = 1, т. е. что точки, лежавшие на окружности данного круга, остаются снова на ней.

Вычисляем х'2+у'2, пользуясь формулами (3) и считая x2 +y2 = 1.

Следовательно, при x2+у2=1 также х'2+у'2= 1. Аналогично проверяются остальные случаи.

Второе свойство преобразования (3) устанавливается столь же просто. В самом деле, мы знаем, что всякая прямая представляется линейным уравнением, и, обратно, всякое линейное уравнение представляет прямую. Пусть дана прямая

Ax + Ву+С = 0. (5)

После преобразования (4) получим

или, приводя к общему знаменателю,

Это уравнение линейное и, стало быть, представляет прямую. Это и есть та прямая, в которую при преобразовании переходит прямая (5).

Отметим еще, что преобразование (3) переводит ось Ох саму в себя, вызывая лишь смещение точек вдоль нее. Это ясно, так как на этой оси y = 0, а по формуле (3) тогда также у' = 0. На оси Ох преобразование задается одной формулой

(3')

На этой прямой отрезок x1х2 переходит в отрезок х'1х'2 по формуле (3'), и по условию эти отрезки считаются равными. Так и происходит «откладывание отрезка».

Для центра О круга х = 0 и, соответственно, х' = а, т. е. при преобразовании (3') центр переходит в точку А с координатой х = а.

Так как а можно задать любое, лишь бы было |а|⩽1, то центр можно перевести в любую точку на диаметре вдоль оси Ох.

При том же преобразовании точка, ранее находившаяся в А, перейдет в точку A1 с координатой

Таким образом, отрезок OA при преобразовании (3) переходит в отрезок АA1 — происходит «откладывание» этого отрезка на «прямой», изображаемой диаметром круга.

Повторяя то же преобразование, мы можем отложить тот же отрезок дальше сколько угодно раз. Точка An с координатой xn будет переходить в точку An+1 с координатой

Так мы будем получать точки A, A1, A2, ... с координатами

Поскольку все отрезки АnАn+1 получаются из OA преобразованием, изображающим движение, все они «равны» между собою — равны в смысле геометрии Лобачевского как она изображается на модели.

Легко доказать, что точки An сгущаются к концу диаметра. В смысле модели они удаляются в бесконечность.

Так как оси Ох можно придать любое направление, то такие же преобразования сдвига возможны вдоль любого диаметра. Комбинируя их с вращениями вокруг центра круга и отражениями в диаметре, получим все «движения», как они понимаются на модели; они составляются из сдвигов, вращений и отражений. Подробнее эти преобразования будут рассмотрены в следующем параграфе, где будет строго доказано, что действительно в нашей модели выполняется геометрия Лобачевского и что, в частности, преобразования, принятые за движения, удовлетворяют всем условиям (аксиомам), каким подчиняются движения в геометрии.

Повторим снова, какую же модель геометрии Лобачевского предложил Клейн. За плоскость принимается внутренность круга; точкой считается точка, прямой — хорда (концы исключены), движением считается преобразование, переводящее круг сам в себя и хорды в хорды; расположение точек (точка лежит на прямой; точка лежит между двумя другими) понимается в обычном смысле. Закон измерения длин и углов (а также и площадей) уже вытекает из того, что движение определено, и тем самым определено равенство отрезков и углов (и любых фигур), и тем же определена операция откладывания одного отрезка вдоль другого. При всех этих условиях всякой теореме геометрии Лобачевского на плоскости соответствует факт эвклидовой геометрии внутри круга, и обратно: всякий такой факт пересказывается в виде теоремы геометрии Лобачевского.

Совершенно аналогично строится модель геометрии Лобачевского в пространстве. За пространство принимается внутренность какого-либо шара (рис. 13), прямой считается хорда, плоскостью — круг с окружностью на поверхности шара, причем самая поверхность шара, а значит, концы хорд и окружности названных кругов исключаются; наконец, движение определяется как преобразование шара самого в себя, переводящее хорды в хорды.

Когда эта модель геометрии Лобачевского была дана, было установлено тем самым, что эта геометрия имеет простой реальный смысл. Геометрия Лобачевского истинна уже потому, что может быть понимаема как особое изложение геометрии в круге или в шаре. Этим же была доказана ее непротиворечивость: выводы ее не могут приводить к противоречию, так как всякий ее вывод можно пересказать на языке

Рис. 13.

обычной эвклидовой геометрии внутри круга (или внутри шара, если речь идет о геометрии Лобачевского в пространстве)1.

3. После Клейна другую модель геометрии Лобачевского дал французский математик Пуанкаре, который применил ее к выводу важных результатов в теории функций комплексной переменной2. Таким образом, в его руках геометрия Лобачевского привела к решению трудных проблем из совсем другой области математики. Геометрия Лобачевского нашла ряд других приложений в математике и теоретической физике; так, например, в 1913 г., физик Варичак дал ее применения в теории относительности.

Геометрия Лобачевского успешно развивается, в ней разрабатывается теория геометрических построений, общая теория кривых и поверхностей, теория выпуклых тел и др.

§ 5. АКСИОМЫ ГЕОМЕТРИИ, ИХ ПРОВЕРКА ДЛЯ УКАЗАННОЙ МОДЕЛИ

1. Для того чтобы строго математически доказать, что модель Клейна действительно дает истолкование геометрии Лобачевского, нужно прежде всего точно формулировать, что же собственно нужно доказывать. Проверять подряд теоремы Лобачевского было бы бессмысленно; их много, притом неограниченно много, поскольку можно доказывать все новые и новые теоремы. Достаточно будет, однако, показать, что в модели Клейна выполняются основные положения геометрии Лобачевского, из которых остальные уже могут быть выведены. По в таком случае нужно точно формулировать эти основные положения.

Таким образом, задача о доказательстве непротиворечивости геометрии Лобачевского приводит к задаче о точной и полной формулировке ее основных положений, т. е. аксиом. А так как посылки геометрии Лобачевского отличаются от посылок геометрии Эвклида одной аксиомой параллельности, то задача сводится к точной и полной формулировке аксиом эвклидовой геометрии. У Эвклида такой формулировки еще не было; у него, в частности, вовсе отсутствовало какое бы то ни было определение свойств движения или наложения фигур, хотя он ими, конечно, пользовался. Задача об уточнении и пополнении

1 Математики обычно говорят, что геометрия Лобачевского изображается в геометрии Эвклида, и тем самым она непротиворечива в той же мере, в какой непротиворечива геометрия Эвклида.

2 Модель Пуанкаре сводится к тому, что за плоскость Лобачевского принимается опять внутренность круга, но прямыми считаются уже дуги окружностей, перпендикулярные окружности данного круга; движением считается любое конформное преобразование круга самого в себя. (Связь с конформными преобразованиями и дает связь с теорией функций комплексного переменного.)

аксиом Эвклида встала во весь рост именно в связи с развитием геометрии Лобачевского, а также в связи с наметившимся в конце прошлого столетия общим течением к уточнению основ математики.

В результате исследований ряда геометров вопрос о формулировке аксиом геометрии был решен.

Вообще аксиомы можно выбирать различно, принимая в качестве основных разные понятия. Мы приведем здесь список аксиом геометрии на плоскости, в котором основными понятиями служат точка, прямая, движение и такие понятия, как точка X лежит на прямой а; точка В лежит между точками А и С; движение переводит точку X в точку У. (В таком случае другие понятия через них определяются; так, например, отрезок определяется как множество всех точек, лежащих между двумя данными.)

Аксиомы делят на пять групп.

I. Аксиомы сочетания

1) Через каждые две точки проходит прямая и притом только одна.

2) На каждой прямой есть по крайней мере две точки.

3) Существуют по крайней мере три точки, не лежащие на одной прямой.

II. Аксиомы порядка

1) Из любых трех точек прямой только одна лежит между двумя другими.

2) Если А, В — две точки прямой, то на той же прямой есть хотя бы одна точка С, такая, что В лежит между A и С.

3) Прямая делит плоскость на две полуплоскости (т. е. разбивает все не лежащие на ней точки плоскости на два класса так, что точки одного класса соединимы отрезком, ее не пересекающим, а разных — нет).

III. Аксиомы движения

(Движение понимается не как преобразование отдельной фигуры, а как преобразование всей плоскости.)

1) Движение переводит прямые в прямые.

2) Два движения, произведенные одно за другим, равносильны некоторому одному движению.

3) Пусть А, А' и а, а' — две точки и исходящие из них полупрямые, a а, а'— полуплоскости, ограниченные продолженными прямыми а и а; существует и притом единственное движение, переводящее A в A', а в а' и а в (Говоря наглядно, точка А переводится в A1

переносом, затем поворотом полупрямая а переводится в а', и тогда полуплоскость а либо совпадает с а', либо еще нужно будет произвести «переворот» вокруг прямой а.)

IV. Аксиома непрерывности

Пусть точки Х3, Х2, X3, . . . расположены на прямой так, что каждая следующая лежит правее предыдущей, но при этом есть точка А, которая лежит правее их всех1. Тогда существует такая точка В, которая тоже лежит правее всех точек X1, Х2, . . ., но так, что сколь угодно близко от нее есть точки Xn (т. е. какую точку С левее В ни взять, на отрезке СВ есть точки Xn).

V. Аксиома параллельности (Эвклида)

Через данную точку может проходить лишь одна прямая, не пересекающая данной прямой.

Таковы аксиомы, достаточные для построения эвклидовой геометрии на плоскости. Из них фактически можно вывести все теоремы школьного курса планиметрии, хотя вывод этот очень кропотлив.

Аксиомы геометрии Лобачевского отличаются только в части аксиомы параллельности.

V. Аксиома параллельности (Лобачевского)

Через лежащую вне прямой точку проходят по крайней мере две прямые, не пересекающие данной прямой.

Может показаться немного странным, что в списке аксиом есть, например, такая: «на каждой прямой есть по крайней мере две точки». Ведь по нашему представлению о прямой на ней есть даже бесконечное множество точек. Не мудрено, что ни Эвклиду, ни кому-либо из математиков до конца прошлого века не приходило в голову формулировать такую аксиому: она подразумевалась. Но теперь положение изменилось. Когда мы даем новое истолкование геометрии, то под прямой понимается уже не обычная прямая, а что-то другое: геодезическая линия на поверхности, хорда круга или еще что-нибудь. Поэтому встает задача точно и исчерпывающим образом формулировать явно все, что мы должны потребовать от тех объектов, которые будут изображать прямые. То же относится ко всем другим понятиям и аксиомам.

Таким образом, как это уже было сказано, появление разных толкований геометрии служит одним из важных стимулов к уточнению ее основных положений. Исторически так и было: точная формулировка аксиом появилась позже моделей Бельтрами, Клейна и Пуанкаре.

1 «Правее» можно соответственно заменить на «левее».

2. Теперь мы докажем, что в модели Клейна выполняются все перечисленные аксиомы, кроме эвклидовой аксиомы параллельности. Как уже было отмечено в предыдущем параграфе (рис. 11), здесь явно выполняется не она, а аксиома Лобачевского. Остается проверить аксиомы I—IV.

Плоскостью в модели служит внутренность круга (радиус его будем считать равным единице). Роль точек играют точки, роль прямых — хорды; понятия «точка лежит на прямой» и «точка лежит между двумя другими» понимаются в обычном смысле. Отсюда очевидно, что аксиомы сочетания, порядка и непрерывности выполняются. Так, например, третья аксиома порядка просто означает, что хорда делит круг на две части.

Остается проверить аксиомы движения. Движение определяется как преобразование, которое переводит круг сам в себя и прямые в прямые. Из этого определения очевидно, что эти преобразования удовлетворяют двум первым аксиомам движения: первой аксиоме — потому, что прямыми как раз считаются хорды и, стало быть, сохранение хорд означает сохранение прямых; второй аксиоме — потому, что если произвести два преобразования, переводящие круг в круг и хорды в хорды, то результирующее преобразование тем самым переведет круг в круг и хорды в хорды, т. е. будет одним из принятых за «движения».

Таким образом, остается лишь третья аксиома движения, и ее проверка представляет единственную имеющуюся здесь трудность.

Прежде всего заметим, что эта аксиома содержит два утверждения.

Пусть А, А'— две точки, а, а'— две исходящие из этих точек полупрямые, а, а' — две полуплоскости, ограниченные прямыми а, а.

Первое утверждение состоит в том, что существует движение переводящее А в А', а в а', а в а'.

Второе утверждение состоит в том, что такое движение только одно.

Можно было бы сослаться на то, что оба эти утверждения уже доказаны в главе III, § 14 (см. том 1), но мы предпочитаем привести здесь их доказательство, не связывая его, как в главе III, с другими, более общими вопросами.

Докажем для модели (т. е. в принятом понимании терминов «полупрямая», «полуплоскость», «движение») справедливость первого утверждения.

Допустим сначала, что точка А' лежит в центре круга. Выберем оси координат так, чтобы начало их лежало в центре круга, а ось Ох шла через точку А (рис. 14).

В предыдущем параграфе мы рассматривали преобразование

(6)

Там было доказано, что оно есть «движение» (т. е. переводит данный круг сам в себя и прямые — в прямые).

Пусть x0 — абсцисса точки А, ордината ее y0 = 0. Поэтому, если мы возьмем а = — x0, то, согласно формулам (6), точка А перейдет в точку с координатами (0, 0), т. е. в точку А'.

Так как прямые переходят при этом в прямые, то «полупрямая» (т. е. отрезок хорды) а примет некоторое положение а" (рис. 14). Поворотом вокруг центра можно будет перевести теперь а" в а'. «Полуплоскостью» а является один из сегментов, ограниченных «прямой» (хордой) а. Если он после движения совпадает с α', то преобразование кончено; если же не совпадает, то переворотом (отражением в диаметре а') переведем его в полукруг а'.

Таким образом, комбинируя «смещение» (6) с вращением и, если нужно, с отражением, мы перевели А, а, α в А', а', α'. Но результирующее всех этих «движений» тоже будет «движением»; это «движение» и переводит А, а, α в А', а', α', т. е. существование требуемого движения доказано.

Пока мы ограничивались частным случаем, когда точка А' лежит в центре. Допустим теперь, что она занимает любое положение Тогда, согласно только что доказанному, мы сможем перевести ее в центр некоторым «движением», которое обозначим B1. При этом «полупрямая» а' перейдет в какую-то «полупрямую» а", идущую из центра, а «полуплоскость» α' — в некоторую «полуплоскость» (полукруг) α" (рис. 15).

Как уже доказано, мы можем посредством некоторого «движения» D2 перевести и точку А в центр, «полупрямую» а — в а", «полуплоскость» α — в α''. Наконец, «движением», обратным D1, мы переведем А' на прежнее место и вместе с тем а", α" вернутся в исходные положения а', α'.1

Рис. 14. Рис. 15.

1 «Движение», обратное D1, изображается формулами (4) (§ 4), если D1 изображается формулами (3).

Таким образом, в результате комбинации «движения» D2 и «движения», обратного D1, мы переводим А, а, α в A', a',, α'. Но комбинация «движений» есть снова «движение»; тем самым установлено, что существует движение, переводящее А, а, α в А', а', α' уже при любом положении точек А и А' в круге. Этим первое утверждение, заключенное в третьей аксиоме движения, доказано в полном объеме.

Докажем теперь, что второе утверждение также выполняется в нашей модели. Согласно смыслу этого утверждения нужно доказывать следующее.

Пусть А, А' — две точки внутри круга; а, а' — исходящие из них отрезки хорд; а, а'— части круга, ограниченные этими хордами. Для ясности мы изображаем эти точки, хорды и части круга на двух разных чертежах (рис. 16), хотя, конечно, они лежат в одном рассматриваемом круге. Утверждается, что «движение», переводящее соответственно А в А', а в а', α в α',—единственное, т. е. оно вполне определяется этими данными.

При доказательстве мы будем рассматривать преобразование не только данного круга, но всей плоскости1. «Движение», согласно определению, переводит прямые в прямые. Преобразование, обладающее таким свойством, называется проективным. Стало быть, можно сказать, что «движением» у нас считается проективное преобразование, переводящее данный круг сам в себя. (На рис. 16 мы изображаем это так, что круг К переходит в круг К1. Нужно только параллельным переносом мысленно наложить круг К1 на К.)

Рис. 16.

1 Можно доказать, что преобразование круга в себя, переводящее прямые в прямые, однозначно распространяется с сохранением этого свойства на всю проективную плоскость, т. е. плоскость с присоединением бесконечно удаленных точек.

Проективные преобразования были рассмотрены в главе III (том 1), § 12, и здесь мы воспользуемся следующей доказанной там важной теоремой: проективное преобразование вполне определяется тем, куда переходят четыре точки, не лежащие по три на одной прямой.

Обратимся к рассматриваемому «движению». Оно переводит отрезок хорды а в α', а поэтому переводит точку В в В'. Так как оно переводит хорды в хорды, то оно переводит также точку С в С".

Далее, так как «движение» вообще переводит прямые в прямые и данный круг сам в себя, а в нашем изображении круг К — в круг К', то касательные в точках В и С переходят в касательные в точках В' и С. Поэтому точка D пересечения первых касательных переходит в точку D' пересечения вторых касательных1 (рис. 16).

Так как точка А к тому же переходит в А' и прямые переходят в прямые, то прямая AD переходит в прямую A'D'. Прямая AD пересекает окружность нашего круга в точках Е, F, а прямая A'D' пересекает ее в точках Е', F'. (На чертеже эти точки лежат на окружностях К и К'.) Так как круг переходит сам в себя, то точки Е, F переходят в точки Е', F'. Пусть точка Е лежит на дуге, ограничивающей часть a, a Е' — на дуге, ограничивающей часть α'. Тогда, поскольку а по условию переходит в α', то Е переходит именно в Е' и соответственно F в F'.

Итак, мы получили, что при рассматриваемом «движении» точки В, С, Е, F на окружности переходят в точки В', С, Е', F'. Точки В, С, Е, F, так же как, очевидно, и точки В', С', Е', F', не лежат по три на одной прямой. Поэтому, согласно приведенной выше теореме, проективное преобразование, переводящее В, С, Е, F в В', С', Е', F', — единственное. Но «движение» и есть проективное преобразование. Стало быть, наше «движение», переводящее А, а, α в А', а', α', единственное, что и требовалось доказать.

Таким образом, мы доказали, что в рассматриваемой модели действительно выполняются все аксиомы эвклидовой геометрии, кроме аксиомы параллельности, или, иными словами, что в модели выполняются все аксиомы геометрии Лобачевского. Модель, следовательно, на самом деле реализует геометрию Лобачевского. Эта геометрия как бы сведена к геометрии Эвклида внутри круга, изложенной особым образом, с тем условным пониманием терминов «прямая» и «движение», которое принято в модели. Кстати, это позволяет уже развивать геометрию Лобачевского на данной конкретной модели, что во многих вопросах оказывается более удобным.

С точки зрения логического анализа оснований геометрии приведенное доказательство показывает, во-первых, что геометрия Лобачев-

1 Если, например, касательные в точках В и С параллельны, то точка D' есть «бесконечно удаленная».

ского непротиворечива, а во-вторых, что постулат о параллельных заведомо не может быть выведен из перечисленных выше остальных аксиом.

§ 6. ВЫДЕЛЕНИЕ САМОСТОЯТЕЛЬНЫХ ГЕОМЕТРИЧЕСКИХ ТЕОРИЙ ИЗ ЭВКЛИДОВОЙ ГЕОМЕТРИИ

1. Принципиальное развитие геометрии параллельно с созданием геометрии Лобачевского шло еще по другому пути. В богатстве всех геометрических свойств пространства выделялись и подвергались самостоятельному изучению отдельные группы свойств, отличающиеся своеобразной замкнутостью и устойчивостью. Такие, обособленные по своим методам, исследования составили новые главы геометрии — науки о пространственных формах, подобно тому, как, например, анатомия или физиология составляют различные главы науки об организме человека.

Первоначально геометрия вообще не расчленялась. Она изучала главным образом метрические — связанные с измерением размеров фигур — свойства пространства. Лишь попутно рассматривались обстоятельства, связанные не с измерением, а с качественным характером взаимного расположения фигур, причем уже давно замечали, что часть таких свойств отличается своеобразной устойчивостью, сохраняясь при довольно существенных искажениях формы и изменениях положения фигур.

Рассмотрим, например, проектирование рисунка с одной плоскости на другую (рис. 17). Длины отрезков при этом меняются, изменяются углы, явно искажаются очертания предметов. Однако, например, свойство ряда точек лежать на одной прямой сохраняется, сохраняется свойство прямой касаться какой-нибудь линии и т. д.

О проектировании и проективных преобразованиях уже шла речь в главе III, где отмечалась их очевидная связь с перспективой — изображением пространственных фигур на плоскости. Исследование

Рис. 17.

свойств перспективы восходит к далеким временам до Эвклида, к работам древних архитекторов; перспективой занимались художники: Дюрер, Леонардо да Винчи, инженер и математик Дезарг (XVII в.). Наконец, в начале XIX в. Понселе впервые последовательно выделил и исследовал геометрические свойства, сохраняющиеся при любых проективных преобразованиях плоскости (или пространства), создав тем самым самостоятельную науку — проективную геометрию1.

Казалось бы, свойств, сохраняющихся при любом проективном преобразовании, немного и они весьма примитивны, но это далеко не так. Не сразу, например, обращаешь внимание на то, что теорема, утверждающая, что точки попарного пересечения продолжений противоположных сторон вписанного в круг шестиугольника лежат на одной прямой, верна и для эллипса, параболы и гиперболы. Она говорит лишь о проективных свойствах, а эти кривые получаются проектированием круга. Тем более не очевидно, что теорема о пересечении в одной точке диагоналей описанного шестиугольника является своеобразным аналогом указанной выше теоремы; их глубокая связь вскрывается именно в проективной геометрии. Не очевидно также, что при проектировании, несмотря на искажение расстояний, для всяких четырех точек А, В, С, D (рис. 18), лежащих на одной прямой, двойное отношение AC/CB : AD/DB остается неизменным

Рис. 18.

1 Понселе — французский военный инженер, занимавшийся геометрическими исследованиями во время пребывания в плену в России после 1812 г. Свой «Трактат о проективных свойствах фигур» он опубликовал в 1822 г.

Это влечет за собой соблюдение в перспективе многих соотношений. Например, используя это обстоятельство, легко по снимку уходящей в даль дороги (рис. 18), где видно расположение телеграфных столбов А', В', С', определить расстояние от них до пункта D'.

О проективной геометрии и использовании ее выводов в работах по аэрофотосъемке шла речь в главе III (том 1). Разумеется, ее законы используются в архитектуре, а также при построении панорам, декораций и т. п.

Выделение проективной геометрии сыграло важную роль в развитии самой геометрии.

2. Другим примером самостоятельной геометрии может служить аффинная геометрия. В ней исследуются те свойства фигур, которые не меняются при любых преобразованиях, в которых декартовы координаты первоначального (x, у, z) и нового (x', у', z') положения каждой точки связаны между собой линейными уравнениями:

(предполагается, что определитель

отличен от нуля).

Как оказывается, любое аффинное преобразование сводится к движению, может быть, еще отражению в плоскости, а затем к сжатиям или растяжениям пространства в трех взаимно перпендикулярных направлениях.

При любом из таких преобразований сохраняются уже довольно многие свойства фигур. Прямые остаются прямыми (вообще все «проективные» свойства сохраняются); кроме того, параллельные прямые остаются параллельными; сохраняется отношение объемов, отношение площадей фигур, лежащих в параллельных плоскостях или на одной и той же плоскости, отношение длин отрезков, лежащих на одной прямой или параллельных прямых, и т. д. Многие хорошо известные всем теоремы по существу принадлежат аффинной геометрии. Таковы, например, утверждения, что медианы треугольника пересекаются в одной точке, что диагонали параллелограма взаимно делятся пополам, что середины параллельных хорд эллипса лежат на одной прямой и т. д.

С аффинной геометрией теснейшим образом связана вся теория кривых (и поверхностей) 2-го порядка. Само разделение этих кривых на эллипсы, параболы, гиперболы основано между прочим на аффинных свойствах фигуры: при аффинных преобразованиях эллипс преоб-

разуется именно в эллипс, но никак не в параболу или гиперболу; аналогично, парабола может быть преобразована в любую другую параболу, но не в эллипс и т. д.

Важность выделения и подробного исследования общих аффинных свойств фигур усугубляется тем, что несравненно более сложные преобразования в бесконечно малом оказываются по существу линейными, т. е. аффинными, а применение методов дифференциального исчисления связано именно с рассмотрением бесконечно малых областей пространства.

3. В 1872 г. Клейн в лекции, прочитанной в университете в Эрлангене и известной поэтому под названием Эрлангенской программы, суммируя результаты развития проективной, аффинной и других «геометрий», четко сформулировал общий принцип их построения, именно: можно рассматривать любую группу взаимно однозначных преобразований пространства и исследовать те свойства фигур, которые сохраняются при преобразованиях этой группы1.

С этой точки зрения свойства пространства как бы расслаиваются по их глубине и устойчивости. Обычная эвклидова геометрия была создана путем отвлечения от всех свойств реальных тел, кроме геометрических; здесь, в специальных разделах геометрии, мы как бы совершаем еще одно абстрагирование уже внутри геометрии, отвлекаясь от ряда геометрических свойств, кроме определенного их круга, интересующего нас в данной отрасли.

По указанному Клейном принципу можно строить много геометрий. Например, можно рассматривать преобразования, сохраняющие углы между любыми линиями (конформные преобразования пространства), и, исследуя сохраняющиеся при таких преобразованиях свойства фигур, говорить о соответствующей конформной геометрии. Можно рассматривать преобразования не обязательно всего пространства. Так, рассматривая точки и хорды круга при всех его преобразованиях в себя, переводящих хорды в хорды, и выделяя свойства, сохраняющиеся при таких преобразованиях, мы получаем геометрию, которая, как было показано в §§ 4 и 5, совпадает с геометрией Лобачевского.

4. Развитие выделившихся таким образом теорий даже с принципиальной стороны (не говоря уже о фактическом содержании) не остановилось на том, что здесь было сказано.

Интересуясь, например, только аффинными свойствами фигур, мы можем, отвлекаясь от всех других свойств, мыслить себе пространство,

1 Слово «группа» используется здесь не просто в собирательном смысле. Говоря о группе преобразований (см. главу XX), имеют в виду такую совокупность преобразований, в которой заведомо содержится тождественное преобразование (оставляющее все точки на месте), где наряду с каждым нетождественным преобразованием имеется и ему обратное (возвращающее все точки на прежнее место) и где вместе с каждыми двумя преобразованиями этой совокупности содержится и преобразование, равносильное этим двум, последовательно произведенным.

а также геометрические фигуры в нем, обладающими только интересующими нас свойствами и как бы вообще не имеющими никаких других свойств. В этом «пространстве» фигуры вообще не будут иметь никаких других свойств, кроме аффинных. Естественно будет пытаться геометрию такого абстрактного пространства тоже излагать аксиоматически, т. е. считать, что речь идет о некоторых отвлеченных объектах: «точках», «прямых», «плоскостях», свойства которых (этих свойств будет, очевидно, меньше, чем в случае эвклидовой геометрии) указываются в некоторых аксиомах, причем выводимые из этих аксиом следствия будут соответствовать аффинным свойствам фигур обычного пространства.

Это действительно удается сделать; и такую совокупность абстрактных «точек», «прямых» и «плоскостей» с системой их свойств называют аффинным пространством.

Точно так же можно мыслить себе абстрактную систему объектов, обладающих только тем кругом свойств, которые соответствуют проективным свойствам фигур эвклидова пространства. (На этот раз отличие системы аксиом от аксиом обычной геометрии оказывается еще более существенным.)

5. Если дальше углубляться в природу геометрических образов, можно заметить, что в целом ряде вопросов играют роль свойства, еще более глубокие, чем проективные, и настолько прочно связанные с данной фигурой, что они сохраняются при любых искажениях фигур, если только эти искажения не приводят к разрыву или склеиванию частей фигуры. (Желая уточнить представление о таком непрерывном искажении, можно, кроме наглядного описания, сослаться на известное нам из анализа определение непрерывной функции и сказать, что речь идет о любом преобразовании всех точек фигуры в новое положение, при котором декартовы координаты точек в новом положении выражаются непрерывными функциями их прежних координат, а старые координаты в свою очередь могут быть выражены как непрерывные функции новых.)

Свойства фигур, сохраняющиеся при любых таких преобразованиях, называются топологическими, а наука, изучающая их, — топологией (см. главу XVIII).

Тесно связанные с фигурами топологические свойства для простейших фигур отличаются исключительной наглядностью. Почти очевидно, например, что на плоскости всякая линия, которую можно получить, непрерывно деформируя окружность, разбивает плоскость на две части, лежащие внутри и вне этого, сколь угодно извилистого контура; поэтому

Рис. 19.

свойство окружности делить плоскость — топологическое. Наглядно, пожалуй, очевидно, что поверхность тора (рис. 19) никак нельзя превратить непрерывным преобразованием в сферу, поэтому свойство какой-либо поверхности допускать непрерывное преобразование, скажем в поверхность тора, будет ее топологическим свойством, отличающим ее от многих других поверхностей.

Рассуждения, связанные с непрерывностью, отличаются наглядностью и часто столь хорошо поясняют суть дела, что представляется весьма заманчивым уметь превращать их в строгие доказательства, а тем более распространять аналогичные приемы на другие несравненно более сложные задачи.

Вот, например, рассуждение, поясняющее справедливость основной теоремы алгебры о том, что всякое уравнение

(7)

имеет хотя бы один действительный или комплексный корень.

Пусть z— точки одной комплексной плоскости, a w = f(z)— соответствующие им точки другой комплексной плоскости w, причем f(z) обозначает левую часть уравнения (7). При z очень больших по абсолютной величине функция f(z) относительно мало отличается от zn; функция же zn весьма проста. В частности, легко проверить, что если точка z, непрерывно двигаясь, опишет на комплексной плоскости окружность с центром в начале координат, то точка w1 = zn ровно n раз обойдет аналогичную окружность радиуса |z|n на плоскости w1. Точка же

Рис. 20.

1 В самом деле, если z = р (cos φ + i sin φ), то, как известно [см. главу IV (том 1), § 3], zn = ρn(cos φn + i sin φn) ; поэтому, с изменением аргумента φ числа z от 0 до 2π, аргумент числа zn будет изменяться от 0 до 2πn, т. е. идущий в точку zn радиус сделает при ее движении n полных оборотов.

w = f(z) опишет n петель, образующих какой-то контур Г, сравнительно близкий к линии, пройденной точкой w1 = zn (рис. 20).

Если теперь окружность, описываемую точкой z, непрерывно стягивать в одну точку, то и n раз запетленный контур Г, описываемый точкой w=f(z), будет непрерывно деформироваться, также стягиваясь в точку. Но довольно очевидно, что он не может стянуться в точку, ни разу не пересекая при этом начало координат О, которое этот контур первоначально охватывал. Значит, он хотя бы раз пройдет через О, и при таком z будет w = f(z) = 0. Это z и будет корнем уравнения (7). Собственно говоря, уже ясно, что корней в известном смысле должно быть именно n, так как каждая из n петель контура Г, стягиваясь, пересечет точку О.

Наше рассуждение требует, конечно, уточненного обоснования тех, как раз топологических, свойств контура и его деформации, которыми мы здесь воспользовались.

Можно было бы привести много примеров использования топологических свойств в самых различных, порой весьма далеких от геометрии разделах математики.

При исследовании топологических свойств перед нами опять встает возможность мыслить себе отвлеченную совокупность объектов, обладающих вообще только такого рода свойствами (см. § 7 главы XX). Такую совокупность называют абстрактным топологическим пространством.

Эта точка зрения уже несравненно шире, чем исследование топологических свойств именно геометрических фигур. Топологические пространства могут быть весьма разные; скажем, все точки поверхности тора с их общей закономерностью взаимного прилегания образуют одно топологическое пространство, все точки плоскости — другое, все эвклидово пространство— третье; все точки многолистных римановых поверхностей, о которых шла речь в главе IX (том 2), § 5, посвященной теории функций комплексного переменного, образуют другие, притом разные, топологические пространства. Но замечательнее всего, что между объектами, далеко не похожими на наше представление о геометрических точках, часто ясно устанавливается понятие близости и прилегания. Скажем, для всевозможных положений какого-нибудь шарнирного механизма можно ясно указать, что значит «близкие» положения, что значит одно положение «прилегает» к бесконечной серии других, среди которых есть положения, сколь угодно близкие к данному.

Мы видим, что понятие топологического пространства является чрезвычайно общим. В этой связи мы еще раз вернемся к нему в § 8.

Целью этого параграфа было не столько дать читателю представление о разных геометриях, сколько стремление показать, что самые конкретные задачи приводят к выделению и исследованию отдельных групп геометрических свойств; что их исследование влечет за собой создание представления об отвлеченных геометрических объектах,

обладающих только этими свойствами, т. е. что выделение этих свойств в их чистом виде приводит нас к представлению о соответствующем абстрактном пространстве.

О других путях, также приводящих к построению разного рода абстрактных пространств, будет идти речь в следующих параграфах.

§ 7. МНОГОМЕРНОЕ ПРОСТРАНСТВО

1. Важным этапом в развитии новых геометрических идей было создание геометрии многомерного пространства, о котором уже шла речь в предыдущей главе. Одной из причин ее возникновения служило стремление использовать геометрические соображения при решении вопросов алгебры и анализа. Геометрический подход к решению аналитических вопросов основан на методе координат. Приведем простой пример.

Требуется узнать, сколько целочисленных решений имеет неравенство x2+y2<N. Рассматривая х и у как декартовы координаты на плоскости, видим, что вопрос сводится к следующему: сколько точек с целочисленными координатами содержится внутри круга радиуса √N. Точки с целочисленными координатами— это вершины квадратов со стороной единичной длины, покрывающих плоскость (рис. 21). Число таких точек внутри круга приближенно равно числу квадратов, лежащих внутри круга, т. е. приблизительно равно площади круга радиуса √N. Таким образом, интересующее нас число решений неравенства приближенно равно πN. При этом нетрудно доказать, что допускаемая здесь относительная ошибка стремится к нулю при N→∞. Более точное исследование этой погрешности представляет собой весьма трудную задачу теории чисел, служившую в сравнительно недавнее время предметом rлубоких исследований.

В разобранном примере оказалось достаточным перевести задачу на геометрический язык, чтобы сразу получить результат, далеко не очевидный с точки зрения «чистой алгебры». Совершенно так же решается аналогичная задача для неравенства с тремя неизвестными. Однако, если неизвестных более трех, этот метод не удается применить, поскольку наше пространство трехмерно, т. е. положение точки в нем определяется тремя координатами. Для сохранения полезной геометрической аналогии в подобных случаях вводят представление об абстрактном

Рис. 21.

«д-мерном пространстве», точки которого определяются n координатами x1, x2, . . . , xn. При этом основные понятия геометрии обобщаются таким образом, что геометрические соображения оказываются применимыми к решению задач с n переменными; это сильно облегчает нахождение результатов. Возможность такого обобщения основана на единстве алгебраических закономерностей, в силу которого многие задачи решаются совершенно единообразно при любом числе переменных. Это позволяет применять геометрические соображения, действующие при трех переменных, к любому их числу.

2. Зачатки понятия о четырехмерном пространстве встречаются еще у Лагранжа, который в своих работах по механике рассматривал время формально как «четвертую координату» наряду с тремя пространственными. Но первое систематическое изложение начал многомерной геометрии было дано в 1844 г. немецким математиком Грассманом и независимо от него англичанином Кэли. Они шли при этом путем формальной аналогии с обычной аналитической геометрией. Эта аналогия в современном изложении выглядит в общих чертах следующим образом.

Точка в n-мерном пространстве определяется n координатами x1, x2, . . ., xn. Фигура в n-мерном пространстве — это геометрическое место, или множество точек, удовлетворяющих тем или иным условиям. Например, «n-мерный куб» определяется как геометрическое место точек, координаты которых подчинены неравенствам: а⩽хi⩽b (i = l, 2,..., n). Аналогия с обычным кубом здесь совершенно прозрачна: в случае, когда n=3, т. е. пространство трехмерно, наши неравенства действительно определяют куб, ребра которого параллельны осям координат и длина ребер равна b — а (на рис. 22 изображен случай а = 0, b = 1).

Расстояние между двумя точками можно определить как корень квадратный из суммы квадратов разностей координат

Это представляет собой прямое обобщение известной формулы для расстояния на плоскости или в трехмерном пространстве, т. е. при n = 2 или 3.

Теперь можно определить в n-мерном пространстве равенство фигур. Две фигуры считаются равными, если между их точками можно установить такое соответствие, при котором расстояния между парами соответственных точек равны. Преобразование, сохраняющее расстояния, можно назвать обобщенным движением1. Тогда по аналогии с обычной

1 Обобщение состоит не только в переходе к n измерениям, но также в том, что к движениям присоединяется еще отражение в плоскости, так как оно тоже не изменяет расстояний между точками.

эвклидовой геометрией можно сказать, что предмет n-мерной геометрии составляют свойства фигур, сохраняющиеся при обобщенных движениях. Это определение предмета n-мерной геометрии было установлено в 70-х годах и дало точную основу для ее разработки. С тех пор n-мерная геометрия служит предметом многочисленных исследований во всех направлениях, аналогичных направлениям эвклидовой геометрии (элементарная геометрия, общая теория кривых и т. п.).

Понятие расстояния между точками позволяет перенести на n-мерное пространство также другие понятия геометрии, такие как отрезок, шар, длина, угол, объем и т. п. Например, n-мерный шар определяется как множество точек, удаленных от данной не больше, чем на данное R. Поэтому аналитически шар задается неравенством

где a1, ..., an — координаты его центра. Поверхность шара задается уравнением

Отрезок AB можно определить как множество таких точек X, что сумма расстояний от X до А и В равна расстоянию от А до В. (Длина отрезка есть расстояние между его концами.)

3. Остановимся несколько подробнее на плоскостях различного числа измерений.

В трехмерном пространстве таковыми являются одномерные «плоскости»— прямые и обычные (двумерные) плоскости. В n-мерном пространстве при n > 3 вводятся в рассмотрение еще многомерные плоскости числа измерений от 3 до n— 1.

Как известно, в трехмерном пространстве плоскость задается одним линейным уравнением, а прямая — двумя такими уравнениями.

Путем прямого обобщения приходим к следующему определению: n-мерной плоскостью в n-мерном пространстве называется геометрическое место точек, координаты которых удовлетворяют системе n — к линейных уравнений

(8)

Рис. 22.

причем уравнения совместны и независимы (т. е. ни одно из них не является следствием других). Каждое из этих уравнений представляет (n — 1)-мерную плоскость, а все они вместе определяют общие точки n — k таких плоскостей.

То, что уравнения (8) совместны, означает, что вообще есть точки, им удовлетворяющие, т. е. n — к данных (n — 1)-мерных плоскостей пересекаются. То, что ни одно уравнение не является следствием других, означает, что ни одно из них нельзя исключить. Иначе система сводилась бы к меньшему числу уравнений и определяла бы плоскость большего числа измерений. Таким образом, говоря геометрически, дело сводится к тому, что k-мерная плоскость определяется как пересечение n — к штук (n — 1)-мерных плоскостей, представляемых независимыми уравнениями. В частности, если к = 1, то имеем n — 1 уравнений, которые определяют «одномерную плоскость», т. е. прямую. Таким образом, данное определение k-мерной плоскости представляет естественное формальное обобщение известных результатов аналитической геометрии. Польза этого обобщения обнаруживается уже в том, что выводы, касающиеся систем линейных уравнений, получают геометрическое истолкование, которое делает эти выводы более ясными. С таким геометрическим подходом к вопросам линейной алгебры читатель мог ознакомиться в главе XVI.

Важным свойством k-мерной плоскости является то, что она может рассматриваться сама как k-мерное пространство. Так, например, трехмерная плоскость сама есть обычное трехмерное пространство. Это дает возможность переносить на пространства высшего числа измерений многие выводы, полученные для пространств низшего числа измерений, подобно обычным рассуждениям от n к n +1.

Если уравнения (8) совместны и независимы, то, как доказывается в алгебре, из n переменных xi можно выбрать к так, что остальные n—к переменных можно через них выразить1. Например:

Здесь x1, x2, . .., xk могут принимать любые значения, а остальные x4 через них определяются. Это значит, что положение точки на k-мерной плоскости определяется уже к координатами, могущими принимать любые значения. Именно в этом смысле плоскость имеет к измерений.

1 Эти к переменных из вообще говоря, нельзя выбирать произвольно. Например, из системы x1 + x2 + x3 = 0, x1 — x2 — x3 = 0 значение x1 определяется однозначно: x1 = 0, и через него x2 и x3, очевидно, нельзя выразить. Утверждается, однако, что необходимые к из xi всегда можно выбрать.

Из определения плоскостей разного числа измерений можно чисто алгебраически вывести следующие основные теоремы.

1) Через каждые k + 1 точку, не лежащую на одной (к— 1)-мерной плоскости, проходит k-мерная плоскость и притом только одна.

Полная аналогия с известными фактами элементарной геометрии здесь очевидна. Доказательство этой теоремы опирается на теорию систем линейных уравнений и несколько сложно, так что мы не будем его излагать.

2) Если l-мерная и k-мерная плоскости в n-мерном пространстве имеют хотя бы одну общую точку и при этом l + k ⩾ n, то они пересекаются по плоскости размерности не меньшей, чем l + к— n.

Как частный случай отсюда вытекает, что две двумерные плоскости в трехмерном пространстве, если они не совпадают и не параллельны, пересекаются по прямой (n = 3, 1 = 2, к = 2, 1 +к — n = 1). Но уже в четырехмерном пространстве две двумерных плоскости могут иметь единственную общую точку. Например, плоскости, задаваемые системами уравнений:

очевидно, пересекаются в единственной точке с координатами x1 = 0, x2 = 0, x3 = 0, x4 = 0.

Доказательство сформулированной теоремы чрезвычайно просто: l-мерная плоскость задается n — l уравнениями; k-мерная задается n — к уравнениями; координаты точек пересечения должны удовлетворять одновременно всем (n— l)+(n — к) = n — (1+к — n) уравнениям. Если ни одно уравнение не является следствием остальных, то по самому определению плоскости в пересечении имеем (l + к — n )-мерную плоскость ; в противном случае получается плоскость большего числа измерений.

К двум указанным теоремам можно добавить еще две.

3) На каждой k-мерной плоскости есть по крайней мере k+1 точек, не лежащих в плоскости меньшего числа измерений. В n-мерном пространстве есть по крайней мере n + 1 точек, не лежащих ни в какой плоскости.

4) Если прямая имеет с плоскостью (любого числа измерений) две общие точки, то она целиком лежит в этой плоскости. Вообще, если l-мерная плоскость имеет с k-мерной плоскостью l +1 общих точек, не лежащих в (l — 1)-мерной плоскости, то она целиком лежит в этой k-мерной плоскости.

Заметим, что n-мерную геометрию можно строить, исходя из аксиом, обобщающих аксиомы, сформулированные в § 5. При таком подходе четыре указанные выше теоремы принимаются за аксиомы сочетания. Это кстати показывает, что понятие аксиомы относительно: одно и то же

утверждение при одном построении теории выступает как теорема, при другом — как аксиома.

4. Мы получили общее представление о математическом понятии многомерного пространства. Чтобы выяснить реальный физический смысл этого понятия, обратимся снова к задаче графического изображения. Пусть, например, мы хотим изобразить зависимость давления газа от объема. Берем на плоскости координатные оси и на одной оси откладываем объем V, а на другой — давление р. Зависимость давления от объема при данных условиях изобразится некоторой кривой (при данной температуре для идеального газа это будет гипербола согласно известному закону Бойля-Мариотта). Но если мы имеем более сложную физическую систему, состояние которой задается уже не двумя данными (как объем и давление в случае газа), а, скажем, пятью, то графическое изображение ее поведения приводит к представлению соответственно о пятимерном пространстве.

Пусть, например, речь идет о сплаве трех металлов или о смеси трех газов. Состояние смеси определяется четырьмя данными: температурой Т, давлением р и процентными содержаниями c1, c2 двух газов (процентное содержание третьего газа определяется тогда тем, что общая сумма процентных содержаний равна 100%, так что c3=100 — c1 — c2). Состояние такой смеси определяется, следовательно, четырьмя данными. Графическое его изображение требует или соединения нескольких диаграмм, или приходится представлять себе это состояние в виде точки четырехмерного пространства с четырьмя координатами T, p, c1, c2. Таким представлением фактически пользуются в химии; применение методов многомерной геометрии к задачам этой науки разработано американским ученым Гиббсом и школой советских физико-химиков академика Курнакова. Здесь введение многомерного пространства диктуется стремлением сохранить полезные геометрические аналогии и соображения, исходящие из простого приема графического изображения.

Приведем еще пример из области геометрии. Шар задается четырьмя данными: тремя координатами его центра и радиусом. Поэтому шар можно представлять точкой в четырехмерном пространстве. Специальная геометрия шаров, которую построили около ста лет назад некоторые математики, может рассматриваться поэтому как некоторая четырехмерная геометрия.

Из всего сказанного выясняется общее реальное основание для введения понятия многомерного пространства. Если какая-либо фигура, или состояние какой-либо системы и т. п. задается n данными, то эту фигуру, это состояние и т. п. можно мыслить как точку некоторого n-мерного пространства. Польза этого представления примерно та же, что польза обычных графиков: она состоит в возможности применить известные геометрические аналогии и методы для изучения рассматриваемых явлений.

В математическом понятии многомерного пространства нет, следовательно, никакой мистики. Оно представляет собой не более как некоторое абстрактное понятие, выработанное математиками для того, чтобы описывать на геометрическом языке такие вещи, которые не допускают простого геометрического изображения в обычном смысле. Это абстрактное понятие имеет вполне реальное основание, оно отражает действительность и было вызвано потребностями науки, а не праздной игрой воображения. Оно отражает тот факт, что существуют вещи, которые, как шар или смесь из трех газов, характеризуются несколькими данными, так что совокупность всех таких вещей является многомерной. Число измерений в данном случае есть именно число этих данных. Как точка, двигаясь в пространстве, меняет три свои координаты, так шар, двигаясь, расширяясь и сжимаясь, изменяет четыре свои «координаты», т. е. четыре величины, которые его определяют.

В следующих параграфах мы еще остановимся на многомерной геометрии. Сейчас же важно только понять, что она является методом математического описания реальных вещей и явлений. Представление о каком-то четырехмерном пространстве, в котором находится наше реальное пространство — представление, использовавшееся некоторыми беллетристами и спиритами, не имеет отношения к математическому понятию о четырехмерном пространстве. Если и можно говорить здесь об отношении к науке, то разве лишь в смысле фантастического искажения научных понятий.

5. Как уже говорилось, геометрия многомерного пространства строилась сначала путем формального обобщения обычной аналитической геометрии на произвольное число переменных. Однако такой подход к делу не мог полностью удовлетворить математиков. Ведь цель состояла не столько в обобщении геометрических понятий, сколько в обобщении самого геометрического метода исследования. Поэтому важно было дать чисто геометрическое изложение n-мерной геометрии, не зависящее от аналитического аппарата. Впервые это было сделано швейцарским математиком Шлефли в 1852 г., рассмотревшим в своей работе вопрос о правильных многогранниках многомерного пространства. Правда, работа Шлефли не была оценена современниками, так как для ее понимания нужно было в той или иной мере подняться до абстрактного взгляда на геометрию. Лишь дальнейшее развитие математики внесло в этот вопрос полную ясность, выяснив исчерпывающим образом взаимоотношение аналитического и геометрического подходов. Не имея возможности углубляться в этот вопрос, мы ограничимся примерами геометрического изложения n-мерной геометрии. Рассмотрим геометрическое определение n-мерного куба. Двигая отрезок в плоскости перпендикулярно самому себе на расстояние, равное его длине, мы зачертим квадрат, т. е. двумерный куб (рис. 23, а). Совершенно аналогично, двигая квадрат в направлении, перпендикулярном его плоскости, на расстояние, равное его

стороне, мы зачертим трехмерный куб (рис. 23, б). Чтобы получить четырехмерный куб, применяем то же построение: взяв в четырехмерном пространстве трехмерную плоскость и в ней трехмерный куб, двигаем его в направлении, перпендикулярном этой трехмерной плоскости, на расстояние, равное ребру (по определению прямая перпендикулярна k-мерной плоскости, если она перпендикулярна всякой прямой, лежащей в этой плоскости). Это построение условно представлено на рис. 23, в. Здесь изображено два трехмерных куба Q и Q' — данный куб в первоначальном и конечном положении. Линии, соединяющие вершины этих кубов, изображают те отрезки, по которым двигаются вершины при перемещении куба. Мы видим, что четырехмерный куб имеет всего 16 вершин: восемь у куба Q и восемь у куба Q'. Далее, он имеет 32 ребра: 12 ребер передвигаемого трехмерного куба в начальном положении Q, 12 ребер его в конечном положении Q' и 8 «боковых» ребер. Он имеет 8 трехмерных граней, которые сами являются кубами. При движении трехмерного куба каждая его грань зачерчивает трехмерный куб, так что получается 6 кубов — боковых граней четырехмерного куба, и, кроме того, имеются еще две грани: «передняя» и «задняя», соответственно первоначальному и конечному положению передвигаемого куба. Наконец, четырехмерный куб имеет еще двумерные квадратные грани общим числом 24: по шести у кубов Q и Q', и еще 12 квадратов, которые зачерчивают ребра куба Q при его перемещении.

Итак, четырехмерный куб имеет 8 трехмерных граней, 24 двумерных грани, 32 одномерных грани (32 ребра) и, наконец, 16 вершин; каждая грань есть «куб» соответствующего числа измерений: трехмерный куб, квадрат, отрезок, вершина (ее можно считать нульмерным кубом).

Аналогично, перемещая четырехмерный куб «в пятое измерение», получим пятимерный куб, и так, повторяя это построение, можно построить куб любого числа измерений. Все грани n-мерного куба сами

Рис. 23.

являются кубами меньшего числа измерений: (n — 1)-мерные, (n — 2)-мерные и т. д. и, наконец, одномерные, т. е. ребра. Любопытной и нетрудной задачей является найти, сколько граней каждого числа измерений имеет n-мерный куб. Легко убедиться, что он имеет 2n штук (n — 1)-мерных граней и 2я вершин. А сколько будет, например, ребер?

Рассмотрим еще один многогранник n-мерного пространства. На плоскости простейшим многоугольником является треугольник — он имеет наименьшее возможное число вершин. Чтобы получить многогранник с наименьшим числом вершин, достаточно взять точку, не лежащую в плоскости треугольника, и соединить ее отрезками с каждой точкой этого треугольника. Полученные отрезки заполнят трехгранную пирамиду — тетраэдр (рис. 24). Чтобы получить простейший многогранник в четырехмерном пространстве, рассуждаем так. Берем какую-нибудь трехмерную плоскость и в ней некоторый тетраэдр Т. Затем, взяв точку, не лежащую в данной трехмерной плоскости, соединяем ее отрезками со всеми точками тетраэдра Т. На самом правом из рис. 24 условно изображено это построение. Каждый из отрезков, соединяющих точку О с точкой тетраэдра Г, не имеет с тетраэдром других общих точек, так как в противном случае он целиком помещался бы в трехмерном пространстве, содержащем Т. Все такие отрезки как бы «идут в четвертое измерение». Они заполняют простейший четырехмерный многогранник — так называемый четырехмерный симплекс. Его трехмерные грани суть тетраэдры: один в основании и еще 4 боковых грани, опирающиеся на двумерные грани основания; всего 5 граней. Его двумерные грани — треугольники; их всего 10: четыре у основания и шесть боковых. Наконец, он имеет 10 ребер и 5 вершин.

Повторяя такое же построение для любого числа n измерений, получим простейший n-мерный многогранник — так называемый n-мерный симплекс. Как видно из построения, он имеет n+1 вершину. Можно убедиться, что все его грани тоже являются симплексами меньшего числа измерений: (n — 1)-мерные, (n—2)-мерные и т. д.1

Рис. 24.

1 Любые m вершин симплекса определяют «натянутый на них» (m — 1)-мерный

Рис. 25.

Легко также обобщить понятия призмы и пирамиды. Если мы будем параллельно переносить многоугольник из плоскости в третье измерение, то он зачертит призму. Аналогично, перенося трехмерный многогранник в четвертое измерение, получим четырехмерную призму (условно это изображено на рис. 25). Четырехмерный куб есть, очевидно, частный случай призмы.

Пирамида строится следующим образом. Берется многоугольник Q и точка О, не лежащая в плоскости многоугольника. Каждая точка многоугольника Q соединяется отрезком с точкой О и эти отрезки заполняют пирамиду с основанием Q (рис. 26). Аналогично, если в четырехмерном пространстве дан трехмерный многогранник Q и точка О, не лежащая с ним в одной трехмерной плоскости, то отрезки, соединяющие точки многогранника Q с точкой О, заполняют четырехмерную пирамиду с основанием Q. Четырехмерный симплекс есть не что иное, как пирамида с тетраэдром в основании.

Совершенно аналогично, отправляясь от (га — 1)-мерного многогранника Q, можно определить n-мерную призму и n-мерную пирамиду.

Вообще n-мерный многогранник есть часть n-мерного пространства, ограниченная конечным числом кусков (га — 1)-мерных плоскостей; k-мерный многогранник есть часть k-мерной плоскости, ограниченная конечным числом кусков (к — 1)-мерных плоскостей. Грани многогранника сами являются многогранниками меньшего числа измерений.

Теория n-мерных многогранников представляет собой богатое конкретным содержанием обобщение теории обычных трехмерных многогранников. В ряде случаев теоремы о трехмерных многогранниках обобщаются на любое число измерений без особого труда, но встречаются и такие

Рис. 26.

симплекс: (m — 1)-мерную грань данного n-мерного симплекса. Число (m — 1)-мерных граней n-мерного симплекса равно поэтому числу сочетаний из всех n+1 его вершин по m, т. е. равно

вопросы, решение которых для n-мерных многогранников представляет огромные трудности. Здесь можно упомянуть глубокие исследования Г. Ф. Вороного (1868—1908), возникшие, кстати сказать, в связи с задачами теории чисел; они были продолжены советскими геометрами. Одна из возникших задач — так называемая «проблема Вороного» — все еще не решена полностью1.

Примером, на котором обнаруживается существенная разница между пространствами разных измерений, могут служить правильные многогранники. На плоскости правильный многоугольник может иметь любое число сторон. Иными словами, имеется бесконечно много разных видов правильных «двумерных многогранников». Трехмерных правильных многогранников всего пять видов: тетраэдр, куб, октаэдр, додекаэдр, икосаэдр. В четырехмерном пространстве есть шесть видов правильных многогранников, но уже в любом пространстве большего числа измерений их всего три. Это: 1) аналог тетраэдра — правильный π-мерный симплекс, т. е. симплекс, все ребра которого равны; 2) n-мерный куб; 3) аналог октаэдра, который строится следующим образом: центры граней куба служат вершинами этого многогранника, так что он как бы натягивается на них. В случае трехмерного пространства это построение произведено на рис. 27. Мы видим, что в отношении правильных многогранников двух, трех и четырехмерные пространства занимают особое положение.

6. Рассмотрим еще вопрос об объеме тел в n-мерном пространстве. Объем n-мерного тела определяется аналогично тому, как это делается в обычной геометрии. Объем — это сопоставляемая фигуре численная характеристика, причем от объема требуется, чтобы у равных тел были равные объемы, т. е. чтобы объем не менялся при движении фигуры как твердого целого, и чтобы в случае, когда одно тело сложено из двух, его объем был равен сумме их объемов. За единицу объема принимается объем куба с ребром, равным единице. После этого устанавливается, что объем куба с ребром а равен an. Это делается так же, как на плоскости и в трехмерном пространстве, путем заполнения куба слоями из кубов (рис. 28). Так как кубы укладываются по га направлениям, то это и дает an.

Чтобы определить объем любого n-мерного тела, его заменяют приближенно телом, сложенным из весьма малых n-мерных кубов, подобно

Рис. 27.

1 Речь идет об отыскании таких выпуклых многогранников, которыми можно заполнять пространство, прикладывая их друг к другу параллельно по целым граням. Для случая трехмерного пространства эта задача была поставлена и решена в связи с потребностями кристаллографии Федоровым; Вороной и его последователи продвинули ту же задачу для n-мерного пространства, но окончательно решена она только для пространств двух, трех и четырех измерений.

тому, как на рис. 29 плоская фигура заменяется фигурой из квадратиков. Объем тела определяется как предел таких ступенчатых тел при безграничном измельчении составляющих их кубиков.

Совершенно аналогично определяется k-мерный объем k-мерной фигуры, лежащей в какой-нибудь k-мерной плоскости. Из определения объема легко выводится важное его свойство: при подобном увеличении тела, когда все его линейные размеры увеличиваются в λ раз, k-мерный объем увеличивается в λk раз.

Если тело разбить на параллельные слои, то его объем представляется как сумма объемов этих слоев

Объем каждого слоя можно приближенно представить как произведение его высоты Δhi, на (n — 1)-мерный объем («площадь») соответствующего сечения Si. В результате объем всего тела приближенно представится суммой

Переходя к пределу при всех Δhi → 0, получим представление объема в виде интеграла

(9)

где H — протяжение тела в направлении, перпендикулярном проводимым сечениям.

Все это совершенно аналогично вычислению объемов в трехмерном пространстве. Например, у призмы все сечения равны, и, следовательно, их «площадь» S не зависит от h. Поэтому для призмы V = SH, т. е. объем призмы равен произведению «площади» основания на высоту. Определим еще объем n-мерной пирамиды. Пусть дана пирамида с высотой H и площадью основания S. Пересечем ее плоскостью, параллельной основанию, на расстоянии h от вершины. Тогда отсечется пирамида высоты h. Площадь ее основания обозначим через s (h). Эта мень-

Рис. 28. Рис. 29.

шая пирамида, очевидно, подобна исходной: все ее размеры во столько же раз меньше, во сколько h меньше Н, т. е. они умножаются на h/H.

Поэтому (n— 1)-мерный объем (т. е. «площадь») ее основания будет равен

поскольку при изменении линейных размеров (n— 1)-мерной фигуры в 1 раз, ее объем умножается на λn-1.

Объем всей пирамиды согласно формуле (9) равен

откуда

т. е. объем n-мерной пирамиды равен —й произведения «площади» [(n— 1)-мерного объема] основания на высоту. При га, равном 2 или 3, получаем, как частные случаи, известные результаты: площадь (двумерный объем) треугольника равна половине произведения основания на высоту, а объем трехмерной пирамиды — одной трети произведения площади основания на высоту.

Шар можно приближенно представить как составленный из очень узких пирамид с общей вершиной в центре шара. Высоты этих пирамид равны радиусу R, а из площадей их оснований #si складывается приближенно вся поверхность шара S. Так как объем каждой пирамиды равен ≈Rgh то, складывая эти объемы, получим для объема шара

В пределе это дает точную формулу: V = 1/n RS, т. е. объем шара равен 1/n-й произведения радиуса на его поверхность. Для n, равного 2 или 3, эта связь широко известна1.

Отметим важное свойство шара, доказываемое для n-мерного пространства, вообще говоря, буквально так же, как для трехмерного: среди всех тел данного объема наименьшую площадь поверхности имеет шар и только шар.

1 Вычисление объема шара можно осуществить также, применяя формулу (9); сечения n-мерного шара будут (n—1) мерными шарами, и потому объем n-мерного шара вычисляется переходом от n—1 и n.

7. Мы ограничивались пока элементарной геометрией n-мерного пространства, но в нем можно развивать также «высшую» геометрию, например, общую теорию кривых и поверхностей. В n-мерном пространстве поверхности могут быть разного числа измерений: одномерные «поверхности», т. е. кривые, двумерные поверхности, трехмерные, и, наконец, (n — 1)-мерные поверхности. Кривую можно определить как геометрическое место точек, координаты которых непрерывно зависят от какой-либо переменной — параметра t

Кривая есть как бы траектория движения точки в n-мерном пространстве с изменением t. Если наше пространство служит для изображения состояний какой-либо физической системы, как об этом говорилось в п. 4, то кривая изображает непрерывную последовательность состояний или ход изменения состояния в зависимости от параметра t (например, времени). Это обобщает обычное графическое изображение процесса изменения состояний посредством кривых.

С каждой точкой кривой в n-мерном пространстве связывают не только касательную («одномерную соприкасающуюся плоскость»), но и соприкасающиеся плоскости всех измерений от 2 до n — 1. Скорость вращения каждой из этих плоскостей по отношению к скорости прохождения длины кривой дает соответствующую кривизну. Таким образом, кривая имеет га — 1 соприкасающуюся плоскость, от одномерной до (n — 1)-мерной, и соответственно n — 1 кривизну. Дифференциальная геометрия в n-мерном пространстве оказывается гораздо более сложной, чем в трехмерном. На теории поверхностей мы не имеем возможности останавливаться.

До сих пор речь шла об n-мерной геометрии, обобщающей непосредственно обычную эвклидову геометрию. Но мы уже знаем, что, кроме эвклидовой геометрии, существует еще геометрия Лобачевского, проективная геометрия и др. Эти геометрии так же легко обобщаются на любое число измерений.

§ 8. ОБОБЩЕНИЕ ПРЕДМЕТА ГЕОМЕТРИИ

1. Говоря в предыдущем параграфе о реальном смысле n-мерного пространства, мы вплотную подошли к вопросу об обобщении предмета геометрии, к вопросу об общем понятии пространства в математике. Но прежде, чем дать соответствующие общие определения, рассмотрим еще ряд примеров.

Опыт показывает, что нормальное человеческое зрение, как это впервые отметил еще М. В. Ломоносов, трехцветно, т. е. всякое цветовое ощущение — цвет Ц — есть комбинация трех основных ощущений:

красного К, зеленого З и синего С, с определенными интенсивностями1. Обозначая эти интенсивности в некоторых единицах через х, у, z, можно написать, что Ц = хК + уЗ + zС. Подобно тому, как точку можно двигать в пространстве вверх и вниз, направо и налево, вперед и назад, так и ощущение цвета — цвет Ц — может непрерывно изменяться в трех направлениях с изменением составляющих его частей красного, зеленого и синего. По аналогии можно поэтому сказать, что совокупность всевозможных цветов есть «трехмерное цветовое пространство». Интенсивности х, у, z играют роль координат точки — цвета Ц. (Важное отличие от обычных координат состоит в том, что интенсивности не могут быть отрицательными. Когда x = y = z = 0, получаем совершенно черный цвет, отвечающий полному отсутствию света.)

Непрерывное изменение цвета можно изображать как линию в «пространстве цветов»; такую линию образуют, например, цвета радуги; цветовую линию представляет также ряд ощущений, вызываемых предметом однородной окраски при непрерывном изменении яркости освещения. В этом случае меняется только интенсивность ощущения, его «цветность» остается неизменной.

Далее, если даны два цвета, скажем красный К и белый Б, то, смешивая их в разных пропорциях2, получим непрерывную последовательность цветов от К до Б, которую можно назвать отрезком КБ. Представление о том, что розовый цвет лежит между красным и белым, имеет ясный смысл.

Таким образом, возникает понятие о простейших геометрических фигурах и отношениях в «пространстве цветов». «Точка» есть цвет, «отрезок» AB— совокупность цветов, получаемых смешением цветов А и В; то, что «точка D лежит на отрезке AB», означает, что цвет D есть смесь цветов А и В. Смешение трех цветов дает кусок плоскости— «цветовой треугольник». Все это можно также описать аналитически, пользуясь координатами цветов х, у, z, причем формулы, задающие цветовые прямые и плоскости, будут вполне аналогичны формулам обычной аналитической геометрии3.

1 Речь идет об ощущении цвета, а не о свете. Ощущение цвета есть также объективное явление — реакция на свет. Одно и то же ощущение может вызываться разными световыми волнами. Так, например, зеленый цвет может получаться не только от спектрально чистого зеленого света, но также и от смешения красного и синего. С другой стороны, у людей, страдающих «цветной слепотой» (дальтонизмом), есть только два основных ощущения; случаи «полной цветной слепоты», когда есть только одно основное ощущение цвета, крайне редки.

2 Такое смешение можно получить, смешивая в разных пропорциях очень тонкие цветные порошки, при условии, что освещение остается неизменным.

3 Например, если цвета Ц0 и Ц1 определяются интенсивностями — координатами x0, y0, z0 и xlt ух, zl, то цвет Ц, лежащий между Ц0 и Цх, имеет координаты

где t есть доля Цвета Ц1, а (1 — t) — доля цвета Ц0 в смеси, образующей цвет Ц.

В пространстве цветов выполняются соотношения эвклидовой геометрии, касающиеся расположения точек и отрезков. Учение об этих отношениях образует аффинную геометрию, и можно сказать, что в совокупности всех возможных цветовых ощущений реализуется аффинная геометрия. (Это, правда, не вполне точно, потому что, как уже сказано, координаты цвета х, у, z не могут быть отрицательными. Поэтому пространство цветов отвечает только той части пространства, где в данной системе координат все координаты точек положительны или нули.)

Далее, мы имеем естественное представление о степени различия цветов. Так, например, понятно, что бледнорозовый ближе к белому, чем густой розовый, а малиновый ближе к красному, чем синий, и т. д. Таким образом, мы имеем качественное понятие о расстоянии между цветами, как о степени их различия. Этому качественному понятию можно дать количественную меру. Однако определять расстояние между цветами так же, как в эвклидовой геометрии по формуле r= √(x0 — x1)2 + (y0 — y1)2 + (z0—z1)2, оказывается неестественным. Так определяемое расстояние не соответствует реальному ощущению; при таком определении получалось бы в ряде случаев, что два цвета, в разной степени отличные от данного, находились бы от него на одном расстоянии. Определение расстояния должно отображать реальные отношения между цветовыми ощущениями.

Руководствуясь этим, в пространстве цветов вводят особое измерение расстояний. Делают это следующим образом.

При непрерывном изменении цвета человек не сразу ощущает это изменение, а лишь тогда, когда оно достигает известной степени, доходя до так называемого порога различения. В связи с этим считают, что все цвета, находящиеся от данного как раз на пороге различения, равноудалены от него. Тогда, само собой, приходим к тому, что расстояние между любыми двумя цветами нужно измерять наименьшим числом порогов различения, которое только можно проложить между ними. Длина цветовой линии измеряется числом укладывающихся на ней таких порогов. Расстояние между двумя цветами определяется длиной самой короткой соединяющей их линии. Это сходно с тем, как расстояние двух точек на поверхности измеряют длиной самой короткой соединяющей их линии.

Таким образом, измерение длин и расстояний в цветовом пространстве производится очень малыми, как бы бесконечно малыми шагами.

В результате в пространстве цветов определяется некоторая своеобразная неэвклидова геометрия. Эта геометрия имеет вполне реальный смысл: она описывает на геометрическом языке свойства совокупности всевозможных цветов, т. е. свойства реакций глаза на световое раздражение.

Понятие о цветовом пространстве возникло около ста лет назад. Геометрию этого пространства изучали многие физики, из которых можно назвать, например, Гельмгольца и Максвелла. Эти исследования продол-

жаются; они имеют не только теоретическое, но и практическое значение. Они дают точную математическую основу для решения вопросов о различении цвета сигналов, о красках в текстильной промышленности и др.

2. Рассмотрим другой пример, о котором уже говорилось в предыдущем параграфе.

Пусть мы изучаем какую-либо физико-химическую систему, как то: смесь газов, сплав и т. п. Пусть состояние этой системы определяется n величинами (так, состояние газовой смеси определяется давлением, температурой и концентрациями составляющих ее компонентов). Тогда говорят, что система имеет n степеней свободы, выражая этим, что ее состояние может меняться, так сказать, в n независимых направлениях с изменением каждой из определяющих это состояние величин. Эти величины, определяющие состояние системы, играют как бы роль его координат. Поэтому совокупность всех ее состояний рассматривают как n-мерное пространство — так называемое фазовое пространство системы.

Непрерывные изменения состояния, т. е. процессы, происходящие в системе, изображаются линиями в этом пространстве. Отдельные области состояний, выделяемые по тем или иным признакам, будут областями фазового пространства. Состояния, пограничные для двух областей, образуют поверхности в этом пространстве.

В физической химии особенно важно изучить форму и взаимное прилегание тех областей фазового пространства системы, которые соответствуют качественно различным состояниям. Поверхности, разделяющие эти области, соответствуют таким качественным переходам, как плавление, испарение, выпадение осадка и т. п. Состояние системы с двумя степенями свободы изображается точкой на плоскости. Примером может служить однородное вещество, состояние которого определяется давлением р и температурой Т; они и служат координатами точки, изображающей состояние. Тогда дело сводится к линиям раздела областей, отвечающих качественно различным состояниям. В случае воды, например, такими областями будут области льда, жидкой воды и пара (рис. 30). Линии их раздела отвечают плавлению (затвердеванию), испарению (конденсации), возгонке льда (выпадению кристаллов льда из пара).

При изучении систем со многими степенями свободы требуются методы многомерной геометрии.

Понятие фазового пространства применяется не только к физико-химическим, но также к механическим системам, и вообще оно может применяться к любой системе, если ее возможные состояния образуют некоторую непрерывную совокупность. В кинетической теории газов

Рис. 30.

рассматривают, например, фазовые пространства системы материальных частиц — молекул газа. Состояние движения одной частицы в каждый момент определяется ее положением и скоростью, что дает всего шесть величин: три координаты и три составляющие скорости (по трем осям координат). Состояние N частиц задается 6N величинами, и так как молекул очень много, то 6N — огромное число. Это нимало не смущает физиков, говорящих о 6N-мерном фазовом пространстве системы молекул.

Точка в этом пространстве изображает состояние всей массы молекул с их координатами и скоростями. Движение точки изображает изменение состояния. Такое абстрактное представление оказывается очень полезным во многих глубоких теоретических выводах. Словом, понятие фазового пространства прочно вошло в арсенал точного естествознания и применяется в разнообразных вопросах.

3. Приведенные примеры позволяют уже придти к выводу о том, как обобщается предмет геометрии.

Пусть мы исследуем какую-либо непрерывную совокупность тех или иных объектов, явлений или состояний, например совокупность всевозможных цветов или совокупность состояний группы молекул. Отношения, имеющиеся в такой совокупности, могут оказаться сходными с обычными пространственными отношениями, как «расстояние» между цветами или «взаимное расположение» областей фазового пространства. В таком случае, отвлекаясь от качественных особенностей изучаемых объектов и принимая во внимание только эти отношения между ними, мы можем рассматривать данную совокупность как своего рода пространство. «Точками» этого «пространства» служат сами объекты, явления или состояния. «Фигурой» в таком пространстве будет любая совокупность его точек, как, например, «линия» цветов радуги или «область» пара в «пространстве» состояний воды. «Геометрия» такого пространства определяется как раз теми пространственно-подобными отношениями, которые имеются между данными объектами, явлениями или состояниями. Так, «геометрия» цветового пространства определяется законами смешения цветов и расстояниями между цветами.

Реальное значение такой точки зрения состоит в том, что она дает возможность использовать понятия и методы отвлеченной геометрии для изучения разнообразнейших явлений. Область применения геометрических понятий и методов расширяется, таким образом, чрезвычайно. В результате обобщения понятия пространства термин «пространство» получает в науке два значения: с одной стороны, это обычное реальное пространство — универсальная форма существования материи, с другой стороны, это «абстрактное пространство» — совокупность однородных объектов (явлений, состояний и т. п.), в которой имеются пространственно-подобные отношения.

Стоит заметить, что обычное пространство, как мы его себе несколько упрощенно представляем, тоже можно понимать как совокуп-

ность однородных состояний. Именно, его можно понимать как совокупность всех возможных положений предельно малого тела — «материальной точки». Это замечание не претендует на то, чтобы дать определение пространства, но имеет целью сделать более ясной связь двух понятий пространства. Понятие абстрактного пространства мы еще поясним ниже, об отношении же абстрактной геометрии к обычному реальному пространству речь будет идти в последнем параграфе этой главы.

4. Наиболее широкое применение понятие абстрактного пространства находит в самой математике. В геометрии рассматривают «пространство» тех или иных фигур, как, например, «пространство шаров», о котором уже шла речь, «пространство прямых» и т. п.

Этот метод оказывается, в частности, чрезвычайно плодотворным в теории многогранников. Так, например, в § 5 главы VII (том 2) упоминалась теорема о существовании выпуклого многогранника с данной разверткой. Доказательство этой теоремы основано на рассмотрении двух «пространств»: «пространства многогранников» и «пространства разверток». Совокупность выпуклых многогранников, имеющих данное число вершин, рассматривается как своего рода пространство, где точка изображает многогранник; соответственно совокупность допустимых разверток также трактуется как некоторое пространство, где точка изображает развертку. Склеивание многогранников из разверток устанавливает соответствие между многогранниками и развертками, т. е. соответствие между точками «пространства многогранников» и «пространства разверток». Задача состоит в том, чтобы доказать, что каждой развертке отвечает многогранник, т. е. каждой точке одного пространства отвечает точка другого. Это как раз и доказывается посредством применения топологии.

Аналогично доказывается целый ряд других теорем о многогранниках, причем этот «метод абстрактных пространств» в ряде случаев (как в теореме о существовании многогранника с данной разверткой) оказывается самым простым из известных методов доказательства таких теорем. К сожалению, однако, этот метод все же довольно сложен, и мы не имеем здесь возможности дать о нем более точное представление.

Широкое применение обобщенное понятие пространства находит также в анализе, алгебре и теории чисел. Начало этого лежит в обычном представлении функций посредством кривых. Значениям одной переменной X обычно сопоставляются точки на прямой. Аналогично, значениям двух переменных сопоставляются точки на плоскости, значениям n переменных — точки в n-мерном пространстве; набор значений переменных x1, x2,..., xn представляют точкой с координатами x1, x2 ,..., xn. Говорят об «области изменения переменных» или об «области задания» функции этих переменных f (x1, x2,..., xn); говорят о точках, линиях или поверхностях разрыва функции и т. п. Этот геометрический язык употребляется постоянно, и это не только способ выражения; геометрические представ-

ления делают многие факты анализа «наглядными» по аналогии с обычным пространством и позволяют применять геометрические методы доказательства, обобщенные на n-мерное пространство.

То же имеет место в алгебре, когда речь идет об уравнениях с n-неизвестными или об алгебраических функциях от га переменных. В предыдущем параграфе отмечалось, что линейное уравнение с га неизвестными определяет в n-мерном пространстве плоскость, m таких уравнений определяют m плоскостей, а всякое их решение изображает точку, общую для всех этих плоскостей. Плоскости могут вовсе не пересекаться, пересекаться в одной точке, по целой прямой, по двумерной или вообще по некоторой k-мерной плоскости. В целом вопрос о разрешимости системы линейных уравнений изображается как вопрос о пересечении плоскостей. Этот геометрический подход имеет ряд преимуществ. Вообще, «линейную алгебру», которая объемлет учение о линейных уравнениях и линейных преобразованиях, обычно излагают в большой степени геометрически, как это сделано в главе XVI.

5. Во всех рассмотренных примерах речь шла о том, что непрерывная совокупность тех или иных объектов трактуется как своего рода пространство. Объектами этими служили цвета, состояния той или иной системы, фигуры, совокупности значений переменных. Во всех случаях объект задавался конечным числом данных, и потому соответствующее пространство имело конечное число измерений, равное числу этих данных.

Однако в начале нашего столетия в математике начали рассматривать также «бесконечномерные пространства» — совокупности таких объектов, каждый из которых не может быть задан конечным числом данных. Это прежде всего «функциональные пространства».

Мысль трактовать совокупность функций того или иного типа как своего рода пространство является одной из основных идей новой отрасли анализа — функционального анализа — и оказывается чрезвычайно плодотворной в решении многих вопросов. Читатель получит об этом представление из главы XIX, специально посвященной функциональному анализу.

Можно рассматривать пространства непрерывных функций одной или нескольких переменных. Как «пространства» рассматривают также различные классы разрывных функций, определяя расстояние между функциями тем или иным способом в зависимости от характера подлежащих решению задач. Словом, число возможных «функциональных пространств» неограничено, и фактически в математике изучают много таких пространств.

Совершенно так же можно рассматривать «пространство кривых», «пространство выпуклых тел», «пространство возможных движений данной механической системы» и т. п. В § 5 главы VII (том 2) были, например, упомянуты теоремы о том, что на всякой замкнутой выпуклой по-

верхности существуют по крайней мере три замкнутые геодезические и что каждые две точки соединимы бесконечным числом геодезических линий. При доказательствах этих теорем используются пространства кривых на поверхности: в первой теореме — пространство замкнутых кривых, во второй — пространство кривых, соединяющих две данные точки. В совокупности всевозможных кривых, соединяющих две данные точки, вводится своего рода расстояние, и таким путем эта совокупность превращается в пространство. Доказательство теоремы основывается на применении некоторых глубоких результатов топологии к этому пространству. Формулируем теперь общий вывод.

Под «пространством» в математике понимают вообще любую совокупность однородных объектов (явлений, состояний, функций, фигур, значений переменных и т. п.), между которыми имеются отношения, подобные обычным пространственным отношениям (непрерывность, расстояние и т. п.). При этом, рассматривая данную совокупность объектов как пространство, отвлекаются от всех свойств этих объектов, кроме тех, которые определяются этими принятыми во внимание пространственно-подобными отношениями. Эти отношения определяют то, что можно назвать строением или «геометрией» пространства. Сами объекты играют роль «точек» такого пространства; «фигуры» — это множества его «точек».

Предмет геометрии данного абстрактного пространства составляют те свойства пространства и фигур в нем, которые определяются принятыми в расчет пространственно-подобными отношениями. Так, например, при рассмотрении пространства непрерывных функций вовсе не занимаются свойствами отдельных функций самих по себе. Функция играет здесь роль точки и, стало быть, «не имеет частей», не имеет в этом смысле никакого строения, никаких свойств вне связи с другими точками; точнее, от всего этого отвлекаются. В функциональном пространстве свойства функций определяют только через их отношения друг к другу — через их расстояния и через другие отношения, которые можно вывести из расстояния.

Разнообразию возможных совокупностей объектов и различных отношений между ними отвечает неограниченное разнообразие пространств, изучаемых в математике. Пространства можно классифицировать по типам тех пространственно-подобных отношений, которые кладутся в основу их определения. Не имея в виду охватить все разнообразие типов абстрактных пространств, отметим прежде всего два наиболее важных типа: топологические и метрические пространства.

6. Топологическим пространством (см. главу XVIII) называют любую совокупность — множество каких-либо элементов — точек, где определено отношение прикосновения одной точки к множеству точек и соответственно отношение прикосновения или прилегания двух множеств (фигур) друг к другу. Это есть обобщение наглядно понятного отношения прикосновения или прилегания фигур в обычном пространстве.

Еще Лобачевский с замечательной прозорливостью указывал, что из всех отношений фигур самым основным является отношение прикосновения. «Прикосновение составляет отличительную принадлежность тел и дает им название геометрических, когда в них удерживаем это свойство, не принимая в рассуждение все другие, существенные ли то будут или случайные»1, Например, любая точка на окружности прилегает к совокупности всех внутренних точек круга; две части связного целого тела прилегают друг к другу. Как показало дальнейшее развитие топологии, именно свойства прикосновения лежат в основе всех остальных топологических свойств.

Понятие прикосновения выражает представление о бесконечной близости точки к множеству. Поэтому всякая совокупность объектов, где имеется естественное понятие о непрерывности, о бесконечном приближении, тем самым оказывается топологическим пространством.

Понятие топологического пространства является чрезвычайно общим, и учение о таких пространствах — абстрактная топология — представляет собой не что иное, как наиболее общее математическое учение о непрерывности.

Строго математическое определение общего топологического пространства может быть дано следующим образом.

Общим топологическим пространством называем множество R каких-либо элементов — «точек», если в этом множестве для каждого содержащегося в нем множества M определены точки прикосновения так, что выполнены следующие условия — аксиомы:

1) Каждая точка множества M считается его точкой прикосновения. (Вполне естественно считать, что множество прикасается к каждой своей точке.)

2) Если множество M2 содержит множество M2, то множество точек прикосновения M1 заведомо содержит все точки прикосновения M2. (Говоря короче, но менее точно, у большего множества не меньше точек прикосновения.)

К этим аксиомам добавляют обычно еще другие, определяя таким путем те или иные типы топологических пространств.

Пользуясь понятием прикосновения, легко определить ряд важнейших топологических понятий. Эти понятия являются вместе с тем наиболее основными и общими понятиями геометрии, а их определения оказываются наглядно вполне ясными. Приведем примеры.

1) Прилегание множеств. Будем говорить, что множества M1 и M2 прилегают друг к другу, если одно из них содержит хотя бы одну точку прикосновения другого. (В этом смысле, например, окружность прилегает к внутренности круга.)

2) Непрерывность, или, как говорят математики, связность фигуры. Фигура, т. е. множество точек M, связна, если ее нельзя разбить на неприлегающие друг к другу части. (Например, отрезок связен, а отрезок без средней точки несвязен.)

1 Н. И. Лобачевский, Собрание сочинений, т. II, 1949, стр. 168.

3) Граница. Границей множества M в пространстве R называется множество всех точек, которые прилегают как к самому М, так и к его дополнению R — М, т. е. к остальной части пространства R. (Это, очевидно, вполне естественное понятие границы.)

4) Внутренняя точка. Точка множества M называется внутренней, если она не лежит на его границе, т. е. если она не прилегает к его дополнению R — M.

5) Непрерывное отображение или преобразование. Преобразование множества M называется непрерывным, если оно не нарушает прикосновений. (Едва ли можно дать более естественное определение непрерывного преобразования.)

К этому списку можно было бы добавить еще другие важные определения, как, например, определение понятия сходимости последовательности фигур к данной фигуре или понятие о числе измерений пространства.

Мы видим, что через прикосновение определяются наиболее основные геометрические понятия. Значение топологии, в частности, состоит в том, что она дает этим понятиям строгие общие определения, дает основание для строгого применения соображений, связанных с наглядно понимаемой непрерывностью.

Топология есть учение о тех свойствах пространств, фигур в них и их преобразований, которые определяются отношением прикосновения.

Общность и фундаментальность этого отношения делает топологию наиболее общей геометрической теорией, проникающей в различные области математики — всюду, где только речь идет о непрерывности. Но точно так же в силу своей общности топология в своих наиболее абстрактных отделах уже выходит за рамки собственно геометрии. И все-таки в основе ее лежит обобщение свойств реального пространства, и наиболее плодотворные и сильные ее результаты связаны с применением методов, имеющих источник в наглядных геометрических представлениях. Таков, например, метод приближения общих фигур многогранниками, развитый П. С. Александровым и распространенный им, хотя и в абстрактной форме, на чрезвычайно общие типы топологических пространств.

Сейчас любой специалист, какие бы объекты он ни исследовал, обнаружив, что для них естественным образом вводится понятие близости, прилегания, немедленно получает в свои руки уже готовый, тонко разветвленный аппарат топологии, позволяющий делать выводы, далеко не тривиальные даже в их частных проявлениях.

7. Метрическим пространством называется множество каких-либо элементов — точек, между которыми определено расстояние, т. е. каждой паре точек X, Y отнесено число r(X, Y) так, что выполнены следующие условия — аксиомы метрического пространства:

1) r(Х, Y) = 0 тогда и только тогда, когда точки X, У совпадают.

2) Для любых трех точек X, Y, Z

Это условие называется «неравенством треугольника», поскольку оно вполне аналогично известному свойству обычного расстояния между точками A1, A2, A3 эвклидова пространства (рис. 31):

Примерами метрических пространств могут служить:

1) эвклидово пространство любого числа измерений n,

2) пространство Лобачевского,

3) любая поверхность с ее внутренней метрикой (том 2, глава VII, § 4),

4) пространство С непрерывных функций с расстоянием, определенным по формуле

5) описываемое в главе XIX гильбертово пространство, которое есть не что иное, как «бесконечномерное эвклидово» пространство.

Гильбертово пространство является важнейшим из пространств, применяемых в функциональном анализе; оно тесным образом связано с теорией рядов Фурье и вообще с теорией разложения функций в ряды по ортогональным функциям (координаты x1, x2, ... оказываются здесь коэффициентами таких рядов). Это пространство играет важную роль в математической физике и приобрело большое значение в квантовой механике. Оказывается, что совокупность всевозможных (не только стационарных) состояний какой-либо атомной системы, например атома водорода, с абстрактной точки зрения может рассматриваться как гильбертово пространство.

Число примеров метрических пространств, фактически рассматриваемых в математике, можно было бы еще значительно умножить; кстати, в следующем параграфе мы познакомимся с одним важным классом метрических пространств, называемых римановыми, но и приведенных пока примеров достаточно, чтобы видеть широту объема общего понятия метрического пространства.

В метрическом пространстве всегда можно определить все топологические понятия, а сверх того ввести также другие — «метрические» понятия. Таково, например, понятие длины кривой. Длина определяется в любом метрическом пространстве буквально так же, как обычно, и основные ее свойства при этом сохраняются. Именно, под длиной кривой понимают предел сумм расстояний между точками, последовательно расположенными на кривой X1, Х2, ..., Xn, при условии, что эти точки располагаются на кривой все гуще и гуще.

Рис. 31.

8. В математике рассматривают многие типы пространств помимо общих топологических или метрических. С целым классом таких пространств мы уже, собственно говоря, познакомились в § 6. Это пространства, в каждом из которых задана какая-либо группа преобразований (например, пространства проективное и аффинное). В таких пространствах можно определить «равенство» фигур. Фигуры «равны», если они переводятся одна в другую преобразованием из данной группы.

Мы не будем углубляться в определения возможных типов пространств; они достаточно разнообразны, и читатель может обратиться к специальной литературе по различным современным разделам геометрии.

Какой, однако, смысл в том, чтобы так расширять круг геометрических понятий? Для чего, например, нужно вводить понятие о пространстве непрерывных функций? Не достаточно ли решать задачи анализа его обычными средствами, не поднимаясь до таких абстрактных построений?

Общий ответ на этот вопрос состоит коротко в том, что, вводя в рассмотрение то или иное пространство, мы открываем путь применению геометрических понятий и методов, которые могут дать очень много.

Особенность геометрических понятий и методов состоит в том, что они основаны в конечном счете на наглядных представлениях и сохраняют, хотя бы и в абстрактной форме, их преимущества. То, чего аналитик достигает путем долгих выкладок, геометр может порой ухватить сразу. Начальный пример тому можно видеть в графике, который делает совершенно ясным ход той или иной зависимости между величинами. Геометрический метод можно характеризовать как метод синтетический, охватывающий целое, в отличие от метода аналитического. Конечно, в абстрактных геометрических теориях непосредственная наглядность исчезает, но остаются наглядные соображения по аналогии, остается синтетический характер геометрического метода.

Читатель уже знаком с применением геометрических картин в анализе, с геометрическим изображением комплексных чисел и функций от комплексной переменной, с геометрическими рассуждениями в доказательстве основной теоремы алгебры и с другими применениями геометрических понятий и методов. Всюду он может заметить то, о чем мы говорим здесь в общем виде. Мы упоминали в начале § 7, а также здесь, в п. 5, примеры теорем, доказываемых посредством применения многомерной геометрии. Укажем еще один пример задачи из анализа, которая решается уже на основе применения понятия о функциональном пространстве.

В топологии доказывается, что если взять на обычной плоскости любую область, имеющую форму деформированного круга, и затем как

угодно деформировать ее непрерывным образом, так, однако, чтобы в итоге она оказалась вложенной внутрь своего первоначального контура, то хотя бы одна точка области попадает после преобразования на место, где она была раньше. Этот факт — чисто топологический.

Рассмотрим теперь совершенно далекую от геометрии проблему: разыскивается функция у (x), удовлетворяющая дифференциальному уравнению1

(10)

и принимающая при х = 0 значение у = 0.

Очевидно, вместо этого уравнения можно искать решение уравнения

(11)

Возникает естественный вопрос, а существует ли вообще удовлетворяющая этому условию функция у (х)?

Взглянем на задачу иначе. Представим себе всякую непрерывную функцию у (х) точкой некоторого абстрактного пространства. Результат вычисления интеграла

будет снова непрерывной функцией от х, т. е. «точкой» нашего абстрактного пространства. Беря различные «точки» у, т. е. разные функции у(х), будем получать, вообще говоря, разные точки z. Тем самым совокупность точек нашего пространства отображается снова в его же точки. Вопрос о наличии решения уравнения (11) свелся к вопросу о том, найдется ли «точка» нашего абстрактного пространства, которая после такого преобразования попадет на свое прежнее «место»?

Естественный вопрос из теории дифференциальных уравнений оказался вопросом о свойстве абстрактного функционального пространства. Аналогия с упомянутой выше теоремой подсказывает нам, что речь идет, повидимому, о топологическом свойстве соответствующего пространства.

На этом пути при помощи необходимых топологических исследований получают, пожалуй, наиболее краткие доказательства многих теорем о существовании решений дифференциальных уравнений, в частности выясняют, что уравнение (10) действительно имеет решение при любой непрерывной функции f(x, у).

1 f (х, y) предполагается непрерывной функцией переменных х и у.

§ 9. РИМАНОВА ГЕОМЕТРИЯ

1. Изложенная выше идея о том, что любую непрерывную совокупность однородных явлений можно трактовать как своего рода пространство, была впервые высказана Риманом в его лекции «О гипотезах, лежащих в основании геометрии», прочитанной в Геттингенском университете в 1854 г. Это была пробная лекция, нечто вроде доклада или диссертации, которую поступающий на должность доцента или профессора должен был читать перед факультетом. В своей лекции Риман наметил в общих чертах без выкладок и математических доказательств исходные идеи обширной геометрической теории, называемой теперь римановой геометрией. Говорят, что никто из слушателей ее не понял, кроме старого уже тогда Гаусса. Формальный аппарат теории Риман изложил в другой работе в применении к задаче теплопроводности, так что абстрактная риманова геометрия рождалась в тесной связи с математической физикой. Идеи Римана были следующим после Лобачевского решающим шагом в развитии геометрии. Однако работы Римана не были сразу оценены должным образом. Его лекция и работа о теплопроводности были опубликованы лишь в 1868 г., после его смерти. Стоит отметить, что в 1868 г. появилось первое истолкование геометрии Лобачевского, данное Бельтрами, а в 1870 г.—ее второе истолкование, данное Клейном. В 1872 г. Клейн формулирует общий взгляд на различные геометрии: эвклидову, Лобачевского, проективную, аффинную и др., как на учение о свойствах фигур, не изменяющихся при преобразованиях из той или иной группы. В те же годы окончательно укрепляется в математике многомерная геометрия. Таким образом, 70-е годы XIX в. были тем переломным моментом в истории геометрии, когда новые геометрические идеи, складывавшиеся в течение предшествующих пятидесяти лет, наконец были поняты широким кругом математиков и прочно вошли в науку. Тогда работы Римана были продолжены, а к концу прошлого столетия риманова геометрия уже достигла значительного развития и нашла приложения в механике и физике. Когда же в 1915 г. Эйнштейн в своей общей теории относительности применил риманову геометрию к теории всемирного тяготения, это привлекло к римановой геометрии особое внимание, и в результате последовало ее бурное развитие и разнообразные обобщения.

2. Идеи Римана, имеющие столь блестящее продолжение, оказываются достаточно простыми, если отвлечься от математической разработки и обратить внимание лишь на их основную сущность. Такая простота свойственна собственно всем большим идеям. Не была ли проста идея Лобачевского, рассматривать выводы из отрицания V постулата как некоторую возможную геометрию? Не проста ли идея эволюции организмов или идея атомного строения вещества? Все это просто и вместе с тем очень сложно, ибо новые идеи, во-первых,

должны прокладывать себе широкую дорогу, а не укладываться в сложившиеся рамки, а во-вторых, их многостороннее обоснование, развитие и применение требуют массы труда, изобретательности и невозможны без специального аппарата науки. Для римановой геометрии таким аппаратом служат ее формулы; они сложны и потому доступны лишь специалистам. Но мы не будем думать о сложных формулах, а обратимся к сущности идей Римана. Как уже сказано, Риман начинает с рассмотрения любой непрерывной совокупности явлений как своего рода пространства. В этом пространстве координатами точки являются величины, определяющие соответствующее явление среди других, как, например, интенсивности х, у, z, определяющие цвет Ц = хК+уЗ+zС. Если таких величин n, скажем x1, x2, ...,xn, то говорим об n-мерном пространстве. В этом пространстве можно рассматривать линии и ввести измерение их длин малыми (бесконечно малыми) шагами, подобно измерению длины кривой в обычном пространстве.

Для того чтобы мерить длины бесконечно малыми шагами, достаточно задать закон, определяющий расстояние от любой данной точки до любой к ней бесконечно близкой. Этот закон определения (измерения) расстояний называют мероопределением или метрикой. Самый простой случай,—когда этот закон оказывается тем же, что в эвклидовом пространстве. Такое пространство будет эвклидовым в бесконечно малом. Иными словами, геометрические соотношения эвклидовой геометрии будут в нем выполняться, но лишь в каждой бесконечно малой области; правильнее сказать, они выполняются в любой достаточно малой области, но не точно, а с точностью тем большей, чем меньше область. Пространство, в котором расстояния измеряются по такому закону, называют римановым; геометрию же таких пространств называют римановой. Риманово пространство есть, следовательно, пространство, являющееся эвклидовым «в бесконечно малом».

Простейший пример риманова пространства представляет любая гладкая поверхность с ее внутренней геометрией. Внутренняя геометрия поверхности есть риманова геометрия двух измерений. Действительно, вблизи каждой своей точки гладкая поверхность мало отличается от касательной плоскости, и это отличие тем меньше, чем меньшую область поверхности мы рассматриваем. Поэтому и геометрия в малой области поверхности мало отличается от геометрии на плоскости; чем область меньше, тем меньше это отличие. Однако в больших областях геометрия кривой поверхности оказывается отличной от эвклидовой, как это было выяснено в § 4 главы VII (том 2) и как это легко видеть на примерах шара или псевдосферы. Риманова геометрия есть не что иное, как естественное обобщение внутренней геометрии поверхности с двух измерений на любое число n. Подобно поверхности, рассматриваемой лишь с точки зрения ее внутренней геометрии, трехмерное риманово пространство, будучи эвкли-

довым в малых областях, в больших областях может отличаться от эвклидова. Например, длина окружности может не быть пропорциональной радиусу; она будет с хорошим приближением пропорциональной радиусу лишь для малых окружностей. Сумма углов треугольника может не равняться двум прямым (при этом в построении треугольника роль прямолинейных отрезков играют линии кратчайшего расстояния, т. е. линии, имеющие наименьшую длину среди всех линий, соединяющих данные точки).

Можно представить себе, что реальное пространство оказывается эвклидовым лишь в областях, небольших в сравнении с астрономическими масштабами. Чем меньше область, тем точнее выполняется эвклидова геометрия, но можно думать (и так оно и оказывается), что в очень больших масштабах геометрия уже несколько отлична от эвклидовой. Эту идею, как мы знаем, выдвинул еще Лобачевский. Риман обобщил ее, допуская мысль о любой геометрии, эвклидовой в бесконечно малом, а не только о геометрии Лобачевского, которая оказывается частным случаем римановой геометрии.

Из сказанного видно, что риманова геометрия возникла на основе синтеза и обобщения трех идей, выдвинутых развитием геометрии. Первой явилась идея о возможности геометрии, отличной от эвклидовой; второй было понятие о внутренней геометрии поверхностей третьей — понятие о пространстве любого числа измерений.

3. Для того чтобы уяснить, как математически определяется риманово пространство, вспомним прежде всего закон измерения расстояний в эвклидовом пространстве.

Если на плоскости ввести прямоугольные координаты x, у, то по теореме Пифагора расстояние между двумя точками, координаты которых отличаются на Δх и Δу, выражается формулой

В трехмерном пространстве аналогично

В n-мерном же эвклидовом пространстве расстояние определяют общей формулой

Отсюда легко заключить, как нужно задавать закон измерения расстояний в римановом пространстве. Закон этот должен совпадать с эвклидовским, но лишь в бесконечно малой области вблизи каждой точки. Это приводит к следующей формулировке этого закона.

Риманово n-мерное пространство характеризуется тем, что вблизи любой его точки А можно ввести координаты x1, x2, ..., xn так, чтобы расстояние от точки А до бесконечно близкой точки X выражалось формулой

(12)

где dx1, ...,dxn — бесконечно малые разности координат точек А и Х. Точнее это можно выразить иначе, а именно: расстояние от точки А до любой близкой точки X выражается той же формулой, что в эвклидовой геометрии, но лишь с некоторой точностью, которая тем выше, чем ближе точка X к точке А, т. е.

где ε — величина малая в сравнении с первым слагаемым и притом тем меньшая, чем меньше разности координат Δx1 ..., Δxn1.

Это и есть точное математическое определение римановой метрики и риманова пространства. Отличие римановой метрики, т. е. закона измерения расстояний, от эвклидовой состоит в том, что такой закон имеет место только вблизи каждой данной точки. Кроме того, координаты, в которых он так просто выражается, приходится брать разные для разных точек2. Отличие общей римановой метрики от эвклидовой мы еще уточним дальше.

То, что риманово пространство совпадает в бесконечно малом с эвклидовым, позволяет определить в нем основные геометрические величины, подобно тому как это делается во внутренней геометрии поверхностей посредством приближения бесконечно малого куска поверхности плоскостью (том 2, глава VII, § 4). Например, бесконечно малый объем выражается так же, как в эвклидовом пространстве. Объем конечной области получается суммированием бесконечно малых объемов, т. е. интегрированием дифференциала объема. Длина кривой определяется суммированием бесконечно малых расстояний между ее бесконечно близкими точками, т. е. интегрированием вдоль кривой дифференциала длины ds. Это и есть строгое аналитическое выражение того, что длина определяется откладыванием малого (бесконечно малого) масштаба вдоль кривой. Угол между кривыми, исходящими из одной точки, определяется точно так же, как в эвклидовом пространстве. Далее, в n-мерном римановом пространстве можно задавать поверхности разного числа измерений от 2 до n — 1. При этом легко доказывается, что каждая такая поверхность представляет в свою очередь некоторое риманово пространство соответствующего числа измерений, совершенно подобно тому, как поверхность в обычном эвклидовом пространстве оказывается двумерным римановым пространством.

1 Обычно точный смысл формулы (12) выражают следующим образом. Пусть из точки А исходит кривая, так что координаты ее точек X заданы как функции x1 (t), x2(t), ..., xn(t) некоторой переменной t. Тогда дифференциал ds длины дуги этой кривой в точке А выражается формулой (12).

2 Если бы можно было во всем пространстве ввести координаты так, что для любой пары близких точек имел бы место такой закон измерения расстояний, то пространство было бы эвклидовым.

Доказано также, что риманово пространство всегда может быть представлено поверхностью в эвклидовом пространстве достаточно большого числа измерений, именно: для всякого n-мерного риманова пространства найдется в n(n+1)/2-мерном эвклидовом пространстве n-мерная поверхность, которая с точки зрения ее внутренней геометрии не отличается от этого риманова пространства (по крайней мере в данной ее ограниченной части).

4. Для того чтобы действительно получить в римановой геометрии аналитические выражения разных геометрических величин, нужно прежде всего дать общее выражение для закона измерения длин в римановом пространстве, не связанное специально с особыми для каждой точки координатами. Ведь формула (12) имеет место для каждой точки А при специальном для этой точки выборе координат, так что при переходе от одной точки к другой нужно менять и сами координаты, а это, конечно, неудобно. Избавиться от этого, оказывается, легко, именно можно доказать следующее.

Пусть в какой-либо области риманова пространства введены какие угодно координаты y1, y2, ..., yn. Тогда «бесконечно малое расстояние», или, как говорят, «элемент длины» ds от точки А с координатами y1, y2, ..., yn до точки X с координатами yl+dy1, y2 + dу2,. . ., yn + dyn выражается формулой

(13)

где коэффициенты gik являются функциями координат y1, y2, ..., yn точки А.

Выражение, стоящее в последней формуле справа, называется квадратичной формой относительно дифференциалов координат dy1, ..., dуn1. В развернутом виде она пишется так:

Так как dy1dy2 = dy2dyl, то второй и третий члены удобно считать одинаковыми: g22 = g21 и вообще gik = gki; это возможно, поскольку важна только их сумма

Квадратичная форма (13) положительна, так как, очевидно, ds2>0, кроме того случая, когда все дифференциалы dyi равны нулю.

Имеет место также обратное. Именно, если в n-мерном пространстве, где введены координаты y1, y2,..., yn, задать элемент длины формулой (13) с тем условием, что стоящая там квадратичная форма положительна (т. е. всегда больше нуля, кроме того случая, когда все

1 Квадратичной формой от некоторых величин называют алгебраическое выражение, являющееся по отношению к этим величинам однородным многочленом 2-й степени.

dyi = 0), то пространство будет римановым. Иными словами, вблизи каждой точки А можно будет ввести новые специальные координаты x1, x2,..., xn так, что в новых координатах в этой точке элемент длины будет выражаться простой формулой (12)

Таким образом, риманова метрика (т. е. определение длин, эвклидовское в бесконечно малом) может задаваться любой положительной квадратичной формой (13) с коэффициентами gik, являющимися функциями координат yi.. Таков общий метод задания римановой метрики.

Кривая в римановом пространстве задается тем, что все n координат точки меняются в зависимости от одного параметра t, изменяющегося в некотором промежутке

(14)

Длина кривой выражается интегралом

В случае кривой, заданной уравнениями (14),

поэтому

(15)

Так как gik являются известными функциями координат y1,...,yn, а эти последние зависят известным образом от t по формулам (14), то в формуле (15) под знаком интеграла стоит вполне определенная для данной кривой функция от t. Стало быть, интеграл от нее имеет определенное значение, и тем самым кривая имеет определенную длину.

Длина кратчайшей из кривых, соединяющих две данные точки A, В, принимается за расстояние между этими точками. Сама эта кривая — геодезическая — играет роль аналога прямолинейного отрезка AВ. Можно доказать, что в малой области любые две точки соединяются единственной кратчайшей линией. Сама задача нахождения геодезических (кратчайших) линий есть задача о придании минимума интегралу (15). Это есть задача вариационного исчисления, с которым читатель мог познакомиться в главе VIII (том 2). Стандартное применение методов вариационного исчисления позволяет вывести дифференциальное уравнение, определяющее геодезические

линии, и установить их общие свойства для любого риманова пространства.

Докажем высказанное ранее основное утверждение, что риманова метрика в любых координатах задается общей формулой (13).

Пусть в некоторой области риманова пространства введены какие-либо координаты y1, y2, ..., yn. Возьмем в этой области произвольную точку А, и пусть xl, x2, . . . , xn— те специальные для точки А координаты, в которых элемент длины в этой точке выражается формулой (12) или, что то же самое,

(16)

Координаты xi выражаются через координаты yj (i, j = 1 ,... , n) какими-то формулами

Тогда

и аналогично для dx2, ..., dxn. Подставим эти выражения в формулу (16). Тогда, возводя правые части в квадрат и объединяя члены с dy12, dy1dy2, dyy22 и т. д., получим выражение вида

где коэффициенты g11, g12, . . . gnn как-то выражаются через частные производные dfi/dyi (вид этих выражении для нас несущественен). Но это и есть не что иное, как формула (13), написанная в развернутом виде, и тем самым наше утверждение доказано.

Докажем теперь, что, обратно, формула (13) определяет риманову метрику, т. е. что при специальном для каждой точки выборе координат xi ее можно привести к простому виду (16). Пусть

причем gik являются функциями координат y1, .. . , yn, и стоящая справа квадратичная форма положительна. Возьмем какую-либо точку А и рассмотрим данную форму только в этой точке Тогда коэффициенты gik оказываются данными числами, а переменными, от которых зависит форма, будут dy1, . . . , dyn. Из алгебры известно, что всякую положительную квадратичную форму (с любыми численными коэффициентами) можно путем линейного преобразования переменных привести к сумме квадратов (см. главу XVI)1, т. е. существует такое преобразование

(17)

что после подстановки этих выражений в формулу (13) получим

1 Не существенно, что у нас переменные в форме — дифференциалы: мы можем рассматривать их просто как какие-то независимые переменные.

Если мы сделаем замену координат y1, .,, , yn на x1, .,. , xn по формулам

то дифференциалы dyj выразятся через дифференциалы dxi как раз по формулам (17). Стало быть, такая замена координат решает поставленную задачу: в координатах x1, ... , xn в выбранной нами точке квадрат дифференциала ds2 выражается в простом «эвклидовском» виде (16). Тем самым доказано, что общая формула (13) действительно задает риманову метрику.

5. Эвклидово пространство есть простейший частный случай риманова пространства1. Важной задачей римановой геометрии было дать аналитическое выражение отличия общего риманова пространства от эвклидова, определить, так сказать, меру неэвклидовости риманова пространства. Этой мерой служит так называемая кривизна пространства.

Нужно прежде всего подчеркнуть, что понятие о кривизне пространства вовсе не связано с представлением о том, что пространство находится в каком-либо высшем объемлющем пространстве, где оно как-то искривлено. Кривизна определяется внутри самого данного пространства и выражает его отличие от эвклидова в смысле его внутренних геометрических свойств. Это нужно ясно понимать, чтобы не связывать понятие о кривизне пространства ни с чем посторонним. Когда говорят, что наше реальное пространство имеет кривизну, это значит лишь, что его геометрические свойства отличны от свойств эвклидова пространства. Но это вовсе не означает, что наше пространство лежит в каком-то высшем пространстве, где оно как-то искривлено. Такое представление не имеет никакого отношения к применению римановой геометрии к реальному пространству, а принадлежит области спекулятивных фантазий.

Понятие кривизны риманова пространства обобщает на n измерений понятие гауссовой кривизны поверхности. Как было сказано в § 4 главы VII (том 2), гауссова кривизна служит мерой отклонения внутренней геометрии поверхности от геометрии на плоскости и может рассматриваться с чисто внутренне-геометрической точки зрения. Она

1 В эвклидовом пространстве элемент длины в прямоугольных координатах выражается формулой (16): ds2 = Σdxi2. Если перейти к другим координатам, то, согласно выводам п. 4, ds2 выразится некоторой квадратичной формой (13). Стало быть, в любых координатах и в эвклидовом пространстве имеет место такая же общая формула (13) для элемента длины. Эвклидово пространство отличается, однако, от любого другого тем, что в нем можно ввести координаты (и это будут прямоугольные координаты) так, что формула (16) при одних и тех же координатах будет выполняться всюду, а не только вблизи той или иной точки, как это имеет место в общем римановом пространстве.

есть не что иное, как кривизна того двумерного риманова пространства, которое представляет собою данная поверхность.

Напомним для примера две формулы внутренней геометрии, в которые входит гауссова кривизна. Пусть на поверхности вблизи какой-либо точки О имеется малый треугольник, стороны которого — геодезические линии; пусть его углы будут α, β, γ, a площадь σ. Величина a+ß + γ — π выражает отличие суммы его углов от суммы углов треугольника на плоскости.

Если треугольник стягивается к точке О, то отношение a + ß + γ — π к его площади σ стремится к гауссовой кривизне К в точке О. Иными словами, для малого треугольника

где ε→0, когда треугольник стягивается к точке О. Это как раз показывает, что гауссова кривизна К служит мерой отличия суммы углов треугольника на поверхности от суммы углов треугольника на плоскости.

Рассмотрим еще малую окружность на поверхности с центром в точке О (т. е. геометрическое место точек, равноудаленных от О в смысле расстояния по поверхности). Если r — радиус окружности, а l — ее длина, то

где К — опять гауссова кривизна в точке О, а ε обозначает величину, малую по сравнению с r3.

Здесь гауссова кривизна выступает как мера отклонения длины малой окружности от величины 2πr, которой она равна в эвклидовой геометрии.

Аналогичную роль играет кривизна риманова пространства. Она может быть определена, например, следующим образом. В данном римановом пространстве проводится гладкая поверхность F, образованная геодезическими линиями, проходящими через данную точку О. Гауссова кривизна этой поверхности и принимается за кривизну пространства в точке О в направлении поверхности F. Вообще говоря, эта кривизна будет различной не только в разных точках О, но и для разных геодезических поверхностей F, проходящих через одну и ту же точку О. Кривизна пространства в данной точке не характеризуется, стало быть, одним числом. Еще Риман ввел общий закон, связывающий кривизны разных поверхностей F в одной и той же точке. Благодаря этим связям кривизна в точке вполне характеризуется некоторой системой чисел — так называемым тензором кривизны .

Однако мы не можем вдаваться здесь в объяснения по этому поводу, так как это потребовало бы привлечения большого математического аппарата. Важно усвоить только, что кривизна есть мера неэвклидовости риманова пространства; она определяется внутри него самого как мера отклонения его метрики от метрики эвклидова пространства. Она определяет, например, отличие суммы углов треугольника от π и отличие длины окружности от 2πr. В разных точках она имеет, вообще говоря, различные значения, но и в одной точке она задается не одним числом, а некоторой системой чисел.

Риманово пространство может не быть однородным по своим свойствам, и тогда в нем невозможно свободное движение фигур без изменения расстояний между их точками. Встает вопрос о тех римановых пространствах, в которых свободное движение фигур возможно и притом с тем же числом степеней свободы, что и в эвклидовом пространстве. Это будут наиболее однородные римановы пространства.

Оказывается, что эвклидово пространство есть однородное пространство без кривизны (пространство нулевой кривизны). Другой тип однородного пространства представляет пространство Лобачевского, так что геометрия Лобачевского, так же как геометрия Эвклида, оказывается частным случаем общей римановой геометрии.

Вообще римановы пространства, в которых возможно свободное движение фигур, — это пространства постоянной кривизны: в них кривизна имеет одно и то же значение во всех точках и для всех геодезических поверхностей. (Вместо «тензора кривизны», меняющегося от точки к точке, она задается на этот раз одним числом, общим для всех точек.) Пространство нулевой кривизны будет эвклидовым, пространство отрицательной кривизны — пространством Лобачевского; пространство положительной кривизны имеет ту же геометрию, что и n-мерная сфера в (n + 1)-мерном эвклидовом пространстве.

6. Приложения римановой геометрии не заставили себя долго ждать. Сам Риман, как мы уже говорили, применил ее формальный аппарат к решению задач теплопроводности, но это было пока применение лишь ее формул, а не идеи абстрактного пространства с эвклидовским измерением расстояний в бесконечно малых областях. Такое приложение было дано к цветному пространству, где расстояние между близкими цветами стали выражать, пользуясь римановой метрикой; пространство цветов стали трактовать как особое трехмерное риманово пространство.

Появилось также важное приложение римановой геометрии в механике. Чтобы понять его сущность, рассмотрим сначала движение точки по поверхности. Представим себе материальную точку, например дробинку, которая может свободно двигаться по некоторой гладкой поверхности, но не покидает эту поверхность. Точка как бы движется в самой поверхности. На поверхности можно ввести какие-либо коор-

динаты x1, x2; тогда движение точки вполне определяется зависимостью этих ее координат от времени, а скорость — скоростями изменения координат, т. е. их производными по времени x1, x2. Получается, что точка как бы движется в двумерном пространстве, но это пространство не эвклидово, а имеет свою геометрию — внутреннюю геометрию поверхности. Законы движения можно преобразовать так, чтобы в них входили только координаты x1, x2 точки на поверхности, их первые и вторые производные.

Если на точку действует сила, то ее составляющая, перпендикулярная поверхности, погашается сопротивлением — реакцией поверхности и остается лишь составляющая, касательная к поверхности; она действует уже только вдоль поверхности. Таким образом, и силы, действующие на точку, можно считать действующими в самой поверхности. Внутренняя геометрия поверхности есть частный случай римановой геометрии. Поэтому движение точки по поверхности есть движение в двумерном римановом пространстве. Законы ее движения имеют тот же характер, что обычные законы движения, с той лишь разницей, что в них учитывается внутренняя геометрия поверхности. Это становится особенно ясным из следующего факта, упоминавшегося в § 4 главы VII (том 2): точка, движущаяся на поверхности по инерции и без трения, движется по геодезической линии с постоянной скоростью. Так как геодезические линии играют на поверхности роль прямых, то указанный факт аналогичен закону инерции; это — тот же закон инерции, но для движения на поверхности или, абстрактно, для движения в двумерном римановом пространстве.

Конечно, в этом абстрактном представлении пока не видно никаких преимуществ, поскольку речь идет все же о движении по обычной поверхности.

Выгода этой абстрактной точки зрения обнаружится сразу, когда мы перейдем к механическим системам, расположение которых задается более чем двумя величинами. Тогда изображение их движения движением точки на поверхности станет невозможным. С таким обстоятельством мы уже встречались в § 7, когда говорили о том, как графические методы перерастают в абстрактное представление о многомерном пространстве.

Итак, пусть имеется механическая система, конфигурация которой, т. е. расположение ее частей, задается n величинами x1, x2,..., xn. Если речь идет о системе из нескольких материальных точек, то расположение их определяется заданием всех их координат, по три на каждую точку. Другим примером может служить волчок (колесо, вращающееся на оси, которая сама может вращаться вокруг неподвижной точки). Поворот волчка вокруг оси задается углом поворота, а наклон оси — двумя углами, которые она образует с двумя данными

направлениями. Получается всего три величины, определяющие положение такого волчка (рис. 32).

Каждую конфигурацию — расположение частей системы — можно мыслить как «точку» пространства всех возможных ее конфигураций. Это будет так называемое конфигурационное пространство системы1. Число его измерений равно числу величин x1, x2, определяющих конфигурацию. Эти величины служат координатами «точки» в конфигурационном пространстве. Для системы, скажем, из трех материальных точек получим по три координаты у трех точек — всего девять координат. Для случая волчка имеем три координаты — три угла, так что конфигурационное пространство волчка трехмерно.

Движение системы представляется движением точки в конфигурационном пространстве. Скорость этого движения определяется скоростями изменения координат x1, x2,..., xn.

О таких пространствах в связи с их топологической структурой еще будет идти речь в главе XVIII. Здесь же мы хотим подчеркнуть, что в конфигурационном пространстве можно ввести специальный закон измерения расстояний, тесно связанный с механическими свойствами системы. Именно, если кинетическая энергия системы выражается формулой

где Xi —скорость изменения соответствующей координаты, то квадрат бесконечно малого расстояния задается формулой

Таким образом, конфигурационное пространство становится римановым пространством. При этом движение системы не только представляется движением точки в конфигурационном пространстве, но и самые уравнения, описывающие движение системы, совпадают с уравнениями движения этой точки; словом, механика системы изображается как механика точки в конфигурационном пространстве. В частности, движение системы по инерции, т. е. без воздействия сил

Рис. 32.

1 Не следует смешивать его с «фазовым пространством», упомянутым в § 8, п. 2. В фазовом пространстве точка определяет не только расположение, но и скорости движения точек системы в каждый момент.

(подобно свободному вращению волчка), представляется равномерным движением точки по геодезической линии в этом пространстве.

Это изображение оказывается в ряде случаев полезным, и им, как и некоторыми его обобщениями и видоизменениями, пользуются в теоретической механике.

Таким образом, риманова геометрия находит себе применение как метод абстрактно-геометрического описания физических явлений. Это описание вовсе не произвольно и не является игрой математического ума, оно отражает реальные закономерности рассматриваемых явлений, но отражает их в абстрактной форме. Такова, однако, природа всякого математического описания физических явлений. Такова же природа всякого применения абстрактной геометрии. Разница состоит лишь в том, что здесь применяются более сильные, более тонкие абстракции, но сущность остается той же самой.

Наиболее блестящее приложение риманова геометрия нашла в теории относительности. Но об этом мы будем говорить в следующем параграфе, потому что здесь речь идет о важном и трудном вопросе отношения абстрактной геометрии к свойствам реального пространства.

7. За последние 30 лет геометрия различных неэвклидовых пространств подверглась значительному развитию и обобщениям в разных направлениях. Возникли новые теории, в которые риманова геометрия была включена как частный случай. Первой из них была так называемая финслерова геометрия, идея которой восходит еще к Риману1; затем — общая теория пространств крупнейшего французского геометра Э. Картана, соединившего риманову геометрию с Эрлангенской программой Клейна, и другие теории. Не имея возможности говорить об этих новейших направлениях геометрии, заметим только, что они разрабатываются в основном посредством специально приспособленного для них аналитического аппарата. В развитии этих новых направлений участвует группа советских геометров; тут можно было бы назвать новую «полиметрическую» геометрию, созданную П. К. Рашевским, исследования В. В. Вагнера, простирающиеся от наиболее общих проблем теории кривых пространств до приложений неэвклидовой геометрии в механике, и др.

§ 10. АБСТРАКТНАЯ ГЕОМЕТРИЯ И РЕАЛЬНОЕ ПРОСТРАНСТВО

1. Следуя в предыдущем изложении развитию геометрических идей начиная от Лобачевского, мы углубились в абстрактные пространства и довольно далеко ушли от первоначального предмета геометрии — того реального пространства, в котором протекают все явления. Теперь мы обратимся к этому пространству в обычном смысле, и нашей задачей

1 Финслер — немецкий математик, начавший в 1916 г. детальную разработку упомянутой геометрии.

будет выяснить, что дало развитие абстрактной геометрии для познания его свойств.

Мы знаем, что геометрия возникла из опыта, из опытного исследования пространственных форм и отношений тел: из измерений земельных участков, объемов сосудов и т. п. Таким образом, по происхождению она есть такая же физическая теория, как, скажем, механика. Аксиомы эвклидовой геометрии — это четко сформулированные выводы из длительного опыта; они выражают законы природы, и их можно называть законами геометрии так же, как основные законы механики часто теперь называют аксиомами механики1. Но нельзя утверждать, что эти законы являются абсолютно точными и никогда не потребуют уточнения и обобщения в связи с новыми опытными данными; реальные свойства пространства могут в той или иной мере отличаться от того, что дает эвклидова геометрия.

Эти рассуждения мы уже приводили, и теперь они представляются, пожалуй, совсем очевидными. Но не так было сто лет назад, когда идеи Лобачевского еще не завоевали общего признания. До Лобачевского и Гаусса никому и в голову не приходило, что эвклидова геометрия может оказаться не совсем точной, что реальные свойства пространства могут быть несколько иными. Лобачевский развивал свою геометрию как теорию возможных свойств реального пространства. Позже Риман и некоторые другие ученые также ставили вопрос о возможных свойствах пространства, о возможных законах измерения длин, которые могли бы обнаружиться при уточнении измерений. Вообще абстрактная геометрия в некоторых своих частях могла и может рассматриваться как теория возможных свойств пространства. Все это оставалось, однако, в области гипотез, пока в 1915 г. Эйнштейн в своей общей теории относительности не подтвердил идей Лобачевского и Римана. Эта теория утверждает, что геометрия реального пространства действительно несколько отлична от эвклидовой, и это обнаруживается именно в астрономических масштабах, как того ожидал Лобачевский.

В том, что было только-что сказано о пространстве, скрыты по крайней мере три трудности. К их выяснению и сводится в конечном счете проблема отношения абстрактной геометрии к физической геометрии, т. е. к свойствам реального пространства.

Первая трудность состоит в том, чтобы по возможности представить себе, как и в каком смысле свойства реального пространства могут отли-

1 Абстрактное понимание аксиом, отвлекающее аксиомы от их первоначального содержания, возникло всего лет пятьдесят назад, и оно ничего не меняет в том факте, что аксиомы эвклидовой геометрии выражают законы природы. Говоря об аксиомах, а не о законах геометрии или механики, хотят выдвинуть на первый план логическое дедуктивное построение этих наук, но от этого эти науки не теряют своего опытного основания. Какое-либо положение теории называется аксиомой, если оно принято за основу при дедуктивном построении теории, когда другие положения теории (теоремы) выводятся из основных (аксиом) путем логических рассуждений.

чаться от того, что дает эвклидова геометрия. Мы слишком привыкли к ней, чтобы легко вообразить себе что-нибудь другое, и разъяснения тут, конечно, необходимы.

Вторая трудность заключена в самом выражении «свойства реального пространства». Пространство само по себе мыслят как пустое и однородное. Казалось бы, в самом понятии пространства уже заключено представление о его однородности. И как пустое пространство, т. е. «пустота», может иметь какие-то свойства? Мы говорим «свойства пространства», не задумываясь над этими вопросами, но стоит в них вдуматься, как указанная трудность станет достаточно ощутимой.

Третья трудность заключена в понятии об истинности той или иной геометрии. Казалось бы, дело очень просто: та геометрия истинна, которая соответствует действительности. Это, конечно, так. Но, с другой стороны, мы видели, например, что геометрию внутри круга можно понимать как геометрию Лобачевского, поскольку всякий геометрический факт внутри круга можно изложить как теорему геометрии Лобачевского. Следовательно, оказывается, что одни и те же геометрические факты можно излагать и как теоремы геометрии Эвклида и как теоремы геометрии Лобачевского. Значит, обе геометрии соответствуют действительности. Так, какая же из них истинна и в каком смысле, и почему мы все-таки считаем, что в круге на самом деле выполняется эвклидова геометрия, а геометрия Лобачевского в нем лишь изображается, интерпретируется?

Ясно, что в этих вопросах имеется известная трудность, о которую в свое время споткнулись и некоторые крупные математики.

Разъяснения следует начать со второй из названных трудностей, потому что из понимания того, что такое «свойства пространства», последует решение и других затруднений.

2. Предмет геометрии — «свойства пространства» — составляют свойства реальных тел, их материальные отношения и формы. В реальном пространстве «место», «точка», «направление» и т. п. определяется материальными телами. «Здесь» и «там», «туда» и «сюда» и т. п. имеют смысл лишь в связи, в отношении к тем или иным материальным предметам. «Здесь» может означать «на земле», «в этой комнате» или что-нибудь в том же роде; словом, «здесь» — это всегда означает место, определенное теми или иными материальными признаками. Точно так же, например, прямая линия не существует сама по себе, а лишь как натянутая нить, или край линейки, или луч света. Прямая же вообще, «прямая как таковая», есть абстракция, отражающая общие свойства этих материальных прямых, точно так же, как, скажем, «дом вообще» есть абстракция, отражающая общие свойства домов; «дом вообще» не существует вне и независимо от отдельных реальных домов.

Этот объективный характер свойств пространства выражен известным положением диалектического материализма: пространство есть форма существования материи. Форма предмета определяется связями и отно-

шениями его частей. Структура пространства есть общая закономерность ряда отношений материальных тел и явлений. Это — пространственные отношения, пространственный порядок предметов, их взаимное расположение, расстояния и т. п. Но как всякая форма неотделима от содержания иначе, как в абстракции и в известных рамках, так и пространство неотделимо от материи. Представление о пространстве «самом по себе», пространстве без материи, есть абстракция, которой нельзя злоупотреблять. Реальные пространственные отношения и формы: «здесь», «между», «внутри», «прямая», «шар» и т. д. и т. п. — это всегда отношения и формы материальных тел. Геометрия же рассматривает их отвлеченно. Это отвлечение от конкретности необходимо, ибо иначе нет возможности познать общее в разнообразных конкретных отношениях предметов. Но нельзя это отвлечение абсолютизировать, подменять отвлеченными понятиями саму объективную реальность.

В абсолютно пустом пространстве, вовсе лишенном следов материи, ничем не различались бы ни места, ни направления, тут, следовательно, нет ни места, ни направлений, так что абсолютно пустое пространство превращается в ничто. Даже в абстрактном представлении пустого пространства молчаливо подразумевают, что в нем различимы разные места и направления. Другими словами, в отвлеченном представлении о пространстве удерживают свойства различимости места, направления, расстояния, которые в реальном пространстве существуют именно потому, что это пространство неразрывно связано с материальными телами.

Итак, пространство есть форма существования материи; «свойства пространства» — это, следовательно, свойства материи, свойства известных отношений материальных тел, их взаимного расположения, размеров и т. п.

Далее, для того чтобы теоремы геометрии имели физический смысл, нужно знать, что в них следует понимать под «прямой», «расстоянием» и другими геометрическими понятиями. В § 4 мы видели, что одна и та же геометрическая теория допускает разные толкования.

Следовательно, сравнивая геометрию с опытом, нужно по возможности точно определять физический смысл геометрических понятий, поскольку геометрия описывает свойства реального пространства лишь при том условии, что ее понятиям приписывается соответствующий физический смысл. Без этого физического смысла теоремы геометрии имеют абстрактно математический, формальный характер. В этом и состоит решение указанного выше второго затруднения. Это затруднение возникает потому, что, вместо реального пространства, неразрывно связанного с материей, хотят мыслить «чистое» пространство, пространство «как таковое», которое есть, однако, не более как абстракция.

3. Теперь легко будет понять, как решаются два других затруднения.

Как, во-первых, можно представить себе, что реальное пространство по своим свойствам отлично от эвклидова? Пусть мы хотим проверить

какое-либо утверждение эвклидовой геометрии, например, то, что сумма углов треугольника равна 180°, или то, что длина окружности равна 2πR. Для проверки первого нужно определить, какие физически определенные треугольники будут рассматриваться и как будут определяться их углы. Пусть сторона треугольника — это луч света в пустоте. В таком случае нет ничего невероятного в том, что очень точные опыты покажут отличие суммы углов треугольника от 180°. Точно так же можно мыслить, что измерение радиуса и окружности одним и тем же масштабом приведет к результатам, не удовлетворяющим в точности соотношению l=2πR. Кстати, так это и есть на земной поверхности, rде длина окружности не пропорциональна радиусу, а растет медленнее и достигает максимума, когда радиус делается равным половине меридиана. На это можно возразить, что ведь на земной поверхности роль прямых играют дуги больших кругов, так что радиус понимается здесь в другом смысле, и потому наш результат не противоречит эвклидовой геометрии. Однако, согласно теории относительности, вблизи тел большой массы отношение длины окружности к «настоящему» радиусу все-таки несколько отличается от 2π, а именно верна следующая приближенная формула для отношения длины экватора однородного шарообразного тела к его радиусу:

где M — масса тела (в т), R — радиус тела (в км), с=300 000 км/сек — скорость света, к — постоянная тяготения, равная при указанном выборе единиц измерения 66,6 ⋅ 10-18.

Таким образом, мы видим, что отношение длины окружности к радиусу не равно 2π, а несколько меньше. Как показывает вычисление, на поверхности Солнца это отношение отличается от 2π приблизительно на 0,000 004, а на поверхности спутника Сириуса, средняя плотность которого в 50 000 раз больше плотности воды, отклонение достигает уже 0,00014.

Можно, конечно, возразить, что все это тем не менее нельзя себе представить, что в наглядном представлении пространство всегда будет эвклидовым. Такое возражение не должно нас смущать, во-первых, потому, что задача науки состоит не в том, чтобы дать наглядное представление явлений, но в том, чтобы достигнуть их понимания. Наглядное представление ограничено и вращается в кругу привычных образов, доставляемых нашими органами чувств. Поэтому мы не в состоянии наглядно представить ни ультрафиолетовых лучей, ни распространения радиоволн, ни движения электрона в атоме, ни многого другого, иначе как подставляя на место этих явлений какие-нибудь модели. Но это вовсе не значит, что эти явления нам непонятны. Напротив, успехи радиотехники, например, ясно показывают, что мы вполне овладели радиовол-

нами и, следовательно, понимаем их достаточно хорошо. Во-вторых, решение вопроса о том, что можно себе представить, а чего нельзя, зависит от привычки и тренировки воображения. Можно ли представить себе антиподов, которые по отношению к нам ходят вниз головой? Теперь мы можем себе это представить, а в свое время «невообразимость» антиподов служила аргументом против шарообразности Земли.

4. Теперь обратимся к последней трудности, т. е. к вопросу о том, какую геометрию следует считать истинной. При самой постановке этого вопроса было указано, что геометрические факты внутри круга можно излагать как теоремы и геометрии Эвклида и геометрии Лобачевского. Следовательно, обе эти геометрии отвечают действительности, т. е. обе они истинны. И в этом нет, в конце концов, ничего удивительного. Одно и то же явление всегда можно описывать разными способами; одну и ту же величину можно измерять разными единицами; одну и ту же кривую можно задавать разными уравнениями в зависимости от выбора системы координат. Совершенно так же данную выделенную совокупность геометрических соотношений (как в рассматриваемом примере соотношения внутри круга) можно описывать разными способами. Но мы ставим вопрос не о какой-то изолированной совокупности геометрических фактов, а о пространственных отношениях во всей их общности. Пространство есть универсальная форма существования материи, и, стало быть, при постановке вопроса о свойствах пространства никакая область фактов не может быть искусственно выделена.

При такой постановке вопроса геометрические величины, геометрические факты нельзя рассматривать изолированно от других явлений, с которыми они необходимо связаны. Например, длина отрезка определяется путем откладывания твердого масштаба, так что измерение длин необходимо связано с движением твердых тел, т. е. с механикой. Геометрия неотделима от механики. Между тем измерение длин внутри круга при интерпретации геометрии Лобачевского производится совсем иначе, как это было указано в § 4; хорда получает при этом бесконечную длину. Ясно, что так определенное измерение не соответствует первоначальному представлению об измерении, возникшему именно на основе механического перемещения сравниваемых реальных тел. Вообще фигуры, равные в смысле эвклидовой геометрии, это, по самому происхождению эвклидовой геометрии, те фигуры, которые накладываются друг на друга путем механического движения. В интерпретации геометрии Лобачевского равенство определяется иначе, роль движений там играют другие преобразования. Следовательно, если геометрические факты внутри круга брать в их необходимой связи с механикой, то мы должны признать, что на самом деле внутри круга имеет место (с большой точностью) именно эвклидова геометрия.

Эвклидова геометрия — это та, в которой роль движения играет обычное механическое движение твердых тел. Именно поэтому люди

открыли сперва эвклидову, а не какую-либо другую геометрию. Но развитие физики привело теперь к выводу, что законы ньютоновской механики и вместе с ними законы эвклидовой геометрии являются лишь приближением к более точным и общим законам. В этом изменении законов геометрии, в переходе от эвклидовой к римановой геометрии, осуществляемом в теории относительности, играла роль не только механика: не меньшее, если не большее, значение имела здесь теория электромагнитных явлений и оптика. Геометрия, как наука о свойствах пространства, связана с физикой, зависит от нее и может быть отделена от нее лишь в абстракции, в известных рамках.

Зависимость геометрии от физики, зависимость свойств пространства от материи была явно указана еще Лобачевским, который предвидел возможность изменения законов геометрии при переходе к новой области физических явлений. В противоположность этой материалистической точке зрения, известный математик Пуанкаре еще сравнительно недавно утверждал, будто выбор той или иной геометрии диктуется лишь соображениями простоты или «экономии мышления» в духе известного идеалиста Маха. На этом основании Пуанкаре предсказывал даже, что наука легче откажется от закона прямолинейного распространения света, чем от эвклидовой геометрии, поскольку она «самая простая». Однако Пуанкаре не дожил всего трех лет до окончательного построения общей теории относительности, в которой поступают как раз наоборот: отказываются от эвклидовой геометрии, но сохраняют закон распространения света, правда, в обобщенной форме: свет распространяется по геодезическим линиям. И это был не первый случай крушения махистских предсказаний. На пороге нашего столетия махисты и другие идеалисты близких толков утверждали, будто атомы являются лишь мысленными символами или чем-нибудь в этом роде, но никак не объективной реальностью. Между тем не прошло и нескольких лет, как реальность атомов была доказана самыми убедительными опытами. Несмотря на все это, идеалистическое понимание геометрии, как и других наук, еще сохраняется среди тех буржуазных ученых, для которых буржуазная идеология оказывается сильнее объективной истины.

Итак, мы приходим к следующим выводам. Одну и ту же выделенную совокупность фактов можно, вообще говоря, описывать по-разному, и все такие описания истинны, раз они отражают действительность. Однако геометрические факты во всей их общности никак нельзя рассматривать в отрыве от других явлений. Только так можно устанавливать свойства пространства, поскольку оно является универсальной формой существования материи. А беря геометрию в связи с физикой, мы необходимо должны приспосабливать их друг к другу, и тогда выявляется существенное различие между разными «геометриями», которые в отрыве от физики могут казаться отличающимися лишь большей или меньшей простотой. Эвклидова геометрия появилась не потому, что она проще других, а по-

тому, что она соответствует механике. Теперь же именно в связи с развитием физики в теории относительности переходят к более сложной геометрии — римановой.

Словом, в отношении к свойствам реального пространства истинна та геометрия, которая достаточно точно отражает свойства пространственных отношений во всей их общности и которая, стало быть, отвечает не только чисто геометрическим фактам, но также механике и вообще всей физике.

5. То немногое, что было сказано выше о теории относительности, не касается, однако, главного в ее содержании. В понимании проблемы пространства она пошла существенно дальше, чем об этом думали Лобачевский и Риман.

Наиболее существенное и основное положение теории относительности состоит в том, что пространство неотделимо полностью от времени, и что они вместе образуют единую форму существования материи: четырехмерное многообразие пространства-времени. События в мире характеризуются местом и временем, а следовательно, четырьмя координатами: тремя пространственными и четвертой временной — временем события. События образуют в этом смысле четырехмерную совокупность. Эту-то четырехмерную совокупность с точки зрения ее структуры, в отвлечении от свойств отдельных явлений и рассматривает прежде всего теория относительности. Она не является в своей основе и сущности ни теорией быстрых движений, ни космологией, ни новой теорией пространства или времени, — это именно теория пространства-времени как единой формы существования материи.

Конечно, и в ньютоновской механике можно объединить пространство и время в одно четырехмерное многообразие. Как мы уже имели случай упомянуть, сама идея многомерного пространства зародилась впервые у Лагранжа именно так, что, рассматривая движение материальной точки, он присоединял к пространственным координатам х, у, z еще временную t. Движение точки изображается тогда линией в четырехмерном пространстве с координатами х, у, z, t; при движении точки меняются все четыре координаты: положение (х, у, z) и время t. Однако тут объединение пространства и времени носит чисто формальный характер. Никакой внутренней необходимой связи между пространством и временем здесь не устанавливается. Конечно, в законе движения каждого данного тела есть своя зависимость пространственного положения от времени. Но это касается только каждого данного движения, никакой всеобщей внутренней связи между пространством и временем ни в механике, ни вообще в физике не было установлено до теории относительности. Всегда однозначно различались пространственные отношения, пространственный порядок вещей и явлений от их отношений и порядка во времени. Временная последовательность событий, продолжительность промежутков времени считались абсолютными, определенными безотносительно к чему

бы то ни было. Короче, в физике безраздельно господствовало понятие абсолютного времени.

Величайшим открытием Эйнштейна, составившим не только краеугольный камень теории относительности, но и поворотный пункт в общем физическом и философском понимании проблемы пространства и времени, было открытие того, что абсолютного времени в действительности нет. Вскоре после того, как Эйнштейн построил в 1905 г. свою теорию1, Минковский показал, что суть ее состоит не столько в отказе от абсолютного времени, сколько в установлении взаимосвязи пространства и времени, в силу которой имеется единая абсолютная форма, существования материи: пространство-время. Отделение же пространства — пространственных координат — от времени, от временной координаты t является в известной мере относительным, зависящим от той материальной системы, — «системы отсчета», в отношении которой определяется пространственный и временной порядок явлений. События, одновременные по отношению к одной системе, могут не быть таковыми в отношении к другой системе.

В определении порядка явлений, конечно, нет и не может быть полной зависимости от системы отсчета. Порядок событий, связанных прямым взаимодействием, само собой разумеется, остается в отношении всех систем одним и тем же, так что действие всегда предшествует его результату. Но для событий, не связанных взаимодействием, порядок во времени оказывается относительным. Поскольку пространственный порядок (в его чистом виде) относится к одновременным событиям, а одновременность относительна, выделение чисто пространственных отношений из общей совокупности пространственно-временных отношений оказывается относительным, зависящим от системы отсчета. Пространство в абстрактном смысле оказывается как бы «сечением» четырехмерного многообразия пространства-времени, проведенным через одновременные (в отношении данной системы) события.

В нашу задачу не может входить изложение основ теории относительности, мы постараемся лишь в самых кратких словах охарактеризовать ее основы в том виде, как их представляется наиболее естественным понимать в связи с идеями абстрактной геометрии. Это понимание, кстати сказать, существенно отлично от того, которое исходит от самого Эйнштейна.

Мир, вселенную можно рассматривать как множество разнообразных событий. Под событием понимается при этом не какое-либо явление, простирающееся в пространстве и длящееся во времени, но как бы мгновенно-точечное явление, наподобие мгновенной вспышки точечной лампы. Говоря языком геометрии, события — это точки четырехмерного многообразия вселенной.

1 Теория, построенная Эйнштейном в 1905 г., называется специальной теорией относительности в противоположность «общей», построенной Эйнштейном в 1915 г.

Пространство-время есть форма существования материи, форма этого мирового многообразия. Структура пространства-времени, его «геометрия», есть не что иное как некоторая общая стуктура мира, т. е., согласно нашему рассмотрению, «геометрия» множества событий. Структура эта определяется некоторыми всеобщими материальными взаимосвязями и отношениями событий.

Во-первых, как мы уже разъясняли выше для пространственных отношений, это должны быть именно материальные отношения и взаимосвязи. То же верно для отношений явлений во времени. Пространственные и временные отношения сами по себе, в чистом виде, суть лишь абстракции.

Во-вторых, отношения событий, определяющие структуру пространства-времени, должны иметь всеобщий характер согласно универсальному характеру пространства-времени.

Такое всеобщее материальное отношение событий представляет их причинно-следственная связь. Всякое событие так или иначе, прямо или косвенно воздействует на некоторые другие события и в свою очередь испытывает воздействие других событий. Это отношение воздействия одних событий на другие и определяет структуру пространства-времени.

Таким образом, теория относительности позволяет дать следующее определение. Пространство-время есть множество всех событий, отвлеченное от их конкретных свойств и от ношений, кроме общего отношения воздействия одних событий на другие. Само это отношение так же следует понимать здесь в общем смысле, в отвлечении от его разнообразных конкретных форм.

В специальной теории относительности пространство-время считается максимально однородным. Это означает, что многообразие событий допускает преобразования, которые не нарушают отношения воздействия между событиями, и группа таких преобразований, в известном смысле, максимально возможная. Пусть, например, имеются две пары событий А, В и А', В', и как А не воздействует на В, так и В не воздействует на А, и аналогичное верно для А' и В'. Тогда существует такое соответствие между событиями, при котором А соответствует А', а В соответствует В', и при этом для любых пар событий отношение воздействия (или невоздействия) не нарушается, т. е. если X воздействует на Y, то соответствующее событие X' также воздействует на Y', и если X не воздействует на У, то и X' не воздействует на У'.

В соответствии с этим оказывается, что с точки зрения специальной теории относительности пространство-время есть своего рода четырехмерное пространство, геометрия которого определяется некоторой группой преобразований. Эти преобразования и есть не что иное как знаменитые преобразования Лоренца. Законы геометрии и физики не изменяются при этих преобразованиях. Такой взгляд соответствует взгляду на геомет-

рию, выдвинутому Клейном в его Эрлангенской программе, о которой говорилось в § 6.

6. Общая теория относительности идет дальше, она отказывается от представления об однородности пространства-времени. Она считает, что пространство-время однородно лишь с известным приближением в достаточно малых областях, но в целом неоднородно. Неоднородность пространства-времени определяется согласно теории Эйнштейна распределением и движением материи. В свою очередь структура пространства-времени определяет законы движения тел, и это обнаруживается в явлении всемирного тяготения. Общая теория относительности оказывается, собственно, теорией тяготения, объясняющей тяготение связью стуктуры пространства-времени с движением материи.

Представление о пространстве-времени, однородном лишь с известным приближением в малых областях, аналогично представлению о римановом пространстве, которое является эвклидовым лишь «в бесконечно малом». Математически пространство-время в общей теории относительности и трактуется как своего рода риманово пространство, правда, в существенно измененном смысле.

Именно, в четырехмерном римановом пространстве вблизи каждой точки можно ввести координаты так, что квадрат линейного элемента выражается формулой ds2=dx12+dx22+dx32+dx42.

В пространстве-времени можно в окрестности каждого события ввести координаты х, уу z, t так, что линейный элемент представляется формулой ds2=dx2+dy2+dz2—c2dt2, где с — скорость света, которую при соответствующем выборе единиц измерения можно считать равной единице. Здесь х, у, z — пространственные координаты, а t — время. Минус при dt2 дает формальное выражение существенного, коренного отличия временной координаты от пространственных, времени — от пространства.

В теории тяготения важнейшую роль играет понятие о кривизне пространства-времени. Основные уравнения этой теории, данные Эйнштейном, как раз связывают величины, характеризирующие кривизну пространства-времени, с величинами, характеризующими распределение и движение материи. Эти уравнения есть вместе с тем уравнения поля тяготения и из них же, как показали Эйнштейн с сотрудниками и В. А. Фок, выводятся законы движения тел в поле тяготения.

Структура пространства-времени по общей теории относительности оказывается сложной, и пространство нельзя отделить от времени даже в такой степени, как это допускает специальная теория относительности. Однако с известным приближением и при известных предположениях это можно сделать. Пространство оказывается эвклидовым с достаточной точностью в областях, малых в сравнении с космическими масштабами, но в больших областях обнаруживается отклонение от эвклидовой геометрии. Это отклонение зависит от распределения и движения масс

материи и достигает заметных, хотя все же очень малых, величин вблизи звезд большой массы, а также в целом в космических масштабах. В ряде гипотез о структуре вселенной в целом приближенно предполагают массы распределенными в среднем равномерно. В одной из таких гипотетических теорий, предложенных советским физиком и математиком Фридманом, геометрия пространства в целом совпадает с геометрией Лобачевского.

В теории относительности абстрактная геометрия находит свое применение не только как математический аппарат; самые идеи абстрактного пространства дают средство наиболее глубокой формулировки основ этой теории. Возможности, намеченные абстрактной геометрией, открываются в действительности, и теоретическое мышление празднует здесь свой блестящий триумф. Абстрактная геометрия, сама выросшая из опытного изучения пространственных отношений и форм тел, противостоит теперь изучению реального пространства как готовый математический метод. Таков общий путь науки: от непосредственно данного в опыте она поднимается к теоретическим обобщениям и абстракциям, которые опять обращаются к опыту, как инструмент более глубокого познания сущности явлений, давая объяснение известных и предсказание новых явлений, направляя практическую деятельность людей и находя в этом свое оправдание и источник дальнейшего развития.

ЛИТЕРАТУРА1

Александров А. Д. Геометрия. БСЭ, т. 10, стр. 533—550.

Делоне Б. Н. Краткое изложение доказательства непротиворечивости планиметрии Лобачевского. Изд. 2-е, Гостехиздат, 1956.

Широков П. А. и Каган В. Ф. Строение неэвклидовой геометрии, Гостехиздат, 1950.

Книга содержит доступное и сравнительно полное изложение геометрии Лобачевского.

Каган В. Ф. Геометрические идеи Римана и их современное развитие. ГТТИ, 1933.

Блохинцев Д. И. и Драбкина С. И. Теория относительности А. Эйнштейна, Гостехиздат, 1940.

Фок В. А. Современная теория пространства и времени. «Природа», № 12, 1953.

Статья в возможно доступной форме освещает основы современных представлений о геометрии реального пространства.

Фок В. А. Теория пространства, времени и тяготения, Гостехиздат, 1955.

Систематические курсы

Ефимов Н. В. Высшая геометрия. Изд. 3-е, Гостехиздат, 1953.

Рашевский П. К. Риманова геометрия и тензорный анализ, Гостехиздат, 1953.

Картан Э. Геометрия римановых пространств, ОНТИ, 1936.

Специальная монография, широко освещающая предмет для подготовленного читателя.

1 См. также литературу к главам VII (том 2) и XVIII.

Глава XVIII

ТОПОЛОГИЯ

§ 1. ПРЕДМЕТ ТОПОЛОГИИ

«Прикосновение составляет отличительную принадлежность тел и дает им название геометрических, когда в них удерживаем это свойство, не принимая в рассуждение все другие, существенные ли то будут или случайные».

Этими словами Н. И. Лобачевский начинает первую главу своего сочинения «Новые начала геометрии»1.

Пояснив только что приведенные слова чертежом (рис. 1), Лобачевский продолжает: «Два тела А, В, касаясь друг друга, составляют одно геометрическое тело С. . . Обратно, всякое тело С произвольным сечением S разделяется на две части А, В».

Эти понятия прикосновения, соседства, бесконечной близости, а также в некотором смысле двойственное им понятие рассечения тела — понятия, положенные Лобачевским в основу здания всей геометрии, и являются по существу основными, преимущественными понятиями топологии во всем том объеме, в котором мы теперь понимаем эту дисциплину. Поэтому правы современные комментаторы великого геометра, когда они говорят2, что «Лобачевский делает первую в истории математических наук попытку исходить в построении геометрии от топологических свойств тел... Понятия поверхность, линия, точка определяются у Лобачевского в терминах сечений и прикосновений тел». Некоторое представление о разнообразии конкретного геометрического содержания, которое могут отражать понятия прикосновения и сечения тел, как их представлял себе Лобачевский, можно получить из прилагаемых чертежей (рис. 2), заимствованных из уже упомянутого его сочинения.

Рис. 1.

1 Н. И. Лобачевский. Полн. собр. соч., т. II, Гостехиздат, 1949, стр. 168.

2 Примечания к «Новым началам геометрии». Там же, стр. 465.

Всякое преобразование геометрической фигуры, при котором не разрушаются отношения прикосновения различных частей фигуры, называется непрерывным; если прикосновения не только не разрушаются, но и не возникают вновь, то преобразование называется топологическим. Следовательно, при топологическом преобразовании какой-либо фигуры, части этой фигуры, находящиеся в соприкосновении, остаются соприкасающимися, а части, не соприкасавшиеся, не могут стать соприкасающимися; короче говоря, при топологическом преобразовании не происходит ни разрывов, ни склеиваний. В частности, две различные точки не могут слиться в одну точку (в этом случае произошло бы новое прикосновение; рис. 3). Поэтому топологическое преобразование всякой геометрической фигуры, рассматриваемой как множество образующих ее точек, есть преобразование не только непрерывное, но и взаимно однозначное: каждые две различные точки фигуры преобразуются в две различные точки. Таким образом, топологические преобразования являются взаимно однозначными и взаимно непрерывными.

Наглядно, топологическое преобразование какой-либо геометрической фигуры (линии, поверхности и т. п.) можно себе представить следующим образом.

Предположим, что наша фигура изготовлена из какого-нибудь гибкого и растяжимого материала, например из резины. Тогда можно подвергать ее всевозможным непрерывным деформациям, при которых она в одних своих частях будет растягиваться, в других — сжиматься и вообще будет всячески изменять свои размеры и свою форму. Например, придав замкнутой резиновой нити форму окружности, мы можем затем растянуть ее

Рис. 2.

Рис. 3.

в чрезвычайно вытянутый эллипс, можем придать ей форму правильного или неправильного многоугольника, а также формы весьма причудливых замкнутых кривых, некоторые из которых изображены на рис. 4. Но мы не можем посредством топологического преобразования превратить окружность в восьмерку (для этого пришлось бы склеить две различные точки окружности; рис. 5) или в отрезок (для этого пришлось бы склеить одну полуокружность с другой или, наоборот, разорвать окружность в какой-либо ее точке). Окружность есть простая замкнутая линия — она образует лишь одну петлю в отличие от восьмерки, которая образует две петли, или от трехлепестковой кривой (рис. 5), которая образует три петли. Свойство окружности быть простой замкнутой линией является свойством, сохраняющимся при произвольном ее топологическом преобразовании, или, как говорят, топологическим свойством.

Если мы возьмем шаровую поверхность, которую можно представлять себе в виде тонкого резинового мячика, то мы снова посредством топологического преобразования можем чрезвычайно изменить ее форму (рис. 6). Но мы не сможем посредством топологического преобразования превратить нашу сферическую поверхность в квадрат или в кольцевидную поверхность (поверхность баранки или спасательного круга), называемую тором (рис. 7). В самом деле, поверхность сферы обладает следующими двумя свойствами, каждое из которых сохраняется при любом топологическом преобразовании. Первое свойство заключается в замкнутости нашей поверхности: у нее нет краев (а у квадрата есть край); второе свойство заключается в том, что всякая замкнутая линия на сферической

Рис. 4.

Рис. 5.

поверхности является, по выражению Лобачевского, ее сечением; если по данной замкнутой линии, начерченной на нашем резиновом мячике, сделать разрез, то поверхность распадется на две не связанные между собой части. Тор этим свойством не обладает: если разрезать тор по его меридиану (рис. 7), то он не распадется на части, а превратится в поверхность, имеющую вид согнутой трубки (рис. 8), которую потом уже легко превратить топологическим преобразованием в цилиндр (разогнуть).

Итак, в отличие от сферы, на торе не всякая замкнутая линия является сечением. Поэтому сферическую поверхность нельзя топологическим преобразованием превратить в тор. Говорят, что сфера и тор суть топологически различные поверхности или поверхности, принадлежащие к различным топологическим типам, или, наконец, что эти поверхности не гомеоморфны между собой. Наоборот, сфера и эллипсоид и вообще любые ограниченные выпуклые поверхности принадлежат к одному и тому же топологическому типу, т. е. гомеоморфны между собой. Это значит, что они могут быть переведены одна в другую топологическим преобразованием.

Рис. 6.

Рис. 7.

Рис. 8.

§ 2. ПОВЕРХНОСТИ

Как уже упоминалось выше, всякое свойство геометрической фигуры, сохраняющееся при любом ее топологическом преобразовании, называется топологическим свойством. Топология изучает топологические свойства фигур; кроме того, она изучает топологические, а также любые непрерывные преобразования геометрических фигур.

Мы только что привели некоторые примеры топологических свойств. Так, топологическими свойствами являются: свойство замкнутости кривой или поверхности, свойство замкнутой линии быть простой замкнутой линией (т. е. образовывать лишь одну петлю), свойство замкнутой поверхности, состоящее в том, что всякая лежащая на ней замкнутая линия является сечением поверхности (этим свойством шаровая поверхность обладает, а кольцевидная нет), и др.

Наибольшее число замкнутых линий, которые можно провести на данной поверхности таким образом, чтобы эти линии не образовывали сечения, т. е. чтобы поверхность не распадалась на части, если по всем этим линиям сделать разрезы, называется порядком связности поверхности. Это число, пожалуй, дает нам самую важную информацию о топологическом устройстве поверхности. Мы видели, что для сферической поверхности оно равно нулю (всякая замкнутая линия на такой поверхности является сечением). На торе можно найти две замкнутые линии, которые в своей совокупности не образуют сечения: за одну из них можно принять любой меридиан, а за другую — параллель тора (рис. 7). Однако на торе невозможно провести три замкнутые линии, которые в своей совокупности не образовывали бы сечения; порядок связности тора равен двум. Порядок связности поверхности кренделя (рис. 9) равен четырем и т. д. Вообще возьмем сферическую поверхность и сделаем в ней 2 р круглых отверстия (на рис. 10 изображен случай р — 3). Эти отверстия распределим в р пар и к каждой паре отверстий приклеим (по краям) цилиндрическую трубку («ручку»). Получим сферу с р «ручками» или, как говорят, нормальную поверхность рода р. Порядок связности этой поверхности равен 2р.

Все такие поверхности, по выражению Лобачевского, являются «сечениями» пространства: каждая из них разбивает пространство на две

Рис. 9.

области, внутреннюю и внешнюю, и является совместной границей этих двух областей. Это обстоятельство стоит в связи с другим, а именно с тем, что каждая из наших поверхностей имеет две стороны: внешнюю и внутреннюю (одну сторону можно покрасить в один цвет, а другую — в другой).

Однако наряду с этим существуют и так называемые односторонние поверхности, у которых нет этих двух раздельных сторон. Простейшей из них является всем известная «лента Мёбиуса», получающаяся, если взять прямоугольную полоску бумаги ABCD и склеить две противоположные узкие стороны AB и CD прямоугольника ABCD так, чтобы вершина А совпала с вершиной С, а вершина В с вершиной D. Получится поверхность, изображенная на рис. 11, она и называется лентой или листом Мёбиуса. Нетрудно проверить, что на ней нет двух сторон, которые можно было бы выкрасить в разные цвета: идя по средней линии поверхности и начав свое движение, скажем, в точке Е, мы, обойдя всю поверхность, придем в точку Е, но уже с другой стороны поверхности, хотя и не перейдем при этом через ее край. Кстати, край поверхности Мёбиуса состоит из одной единственной замкнутой линии.

Возникает вопрос, существуют ли замкнутые односторонние поверхности, т. е. односторонние поверхности, не имеющие краев. Оказывается, что существуют, но такие поверхности, как бы мы их ни располагали в трех-

Рис. 10.

Рис. 11.

мерном пространстве, всегда имеют самопересечения. Типичный пример замкнутой односторонней поверхности изображен на рис. 12 — это так называемый «односторонний тор» или поверхность Клейна. Если, не боясь самопересечений, мыслить себе два экземпляра листа Мёбиуса склеенными по их краям (край листа Мёбиуса, как уже упоминалось, состоит лишь из одного контура), то получится поверхность Клейна.

Теперь мы можем сформулировать основную теорему топологии поверхностей в применении к двусторонним поверхностям: всякая замкнутая двусторонняя поверхность гомеоморфна некоторой нормальной поверхности рода р, т. е. «сфере с р ручками»; две замкнутые двусторонние поверхности гомеоморфны тогда и только тогда, когда у них один и тот же род р (тот же порядок связности 2р), т. е. когда они гомеоморфны сфере с одним и тем же числом ручек р.

Для односторонних поверхностей также имеются «нормальные формы», аналогичные нормальным формам двусторонних поверхностей рода р, но их труднее себе представить. Для этого надо взять сферу, проделать в ней р круглых отверстий и заклеить каждое из них поверхностью Мёбиуса, склеив край этой поверхности с краем соответствующего отверстия. Трудность, возникающая при попытке представить себе такое склеивание, происходит от того, что осуществить его физически нельзя: при попытке такого склеивания возникнут как раз те самопересечения поверхности, которые неизбежны при всяком осуществлении односторонней замкнутой поверхности в виде пространственной модели.

Не следует думать, что замкнутые односторонние поверхности относятся к области математических курьезов, не связанных с серьезными задачами науки. Чтобы убедиться в ошибочности такого мнения, достаточно вспомнить, что одним из основных достижений геометрической мысли явилось создание так называемой проективной геометрии, элементы которой входят в настоящее время в курсы геометрии университетов и педагогических институтов. Практические истоки проективной геометрии лежат в теории перспективы, возникшей еще

Рис. 12.

в эпоху Возрождения (Леонардо да Винчи) в связи с потребностями архитектуры, живописи и технического проектирования. К XVI—XVII вв. относится открытие первых теорем проективной геометрии. Возникнув, таким образом, в связи с вполне определенными практическими потребностями, проективная геометрия явилась в своем полном развитии одним из значительнейших идейно-теоретических обобщений геометрии. На ее почве, в частности, впервые была до конца понята неэвклидова геометрия Лобачевского1.

Переход от обычной плоскости, как ее изучает элементарная геометрия, к проективной плоскости заключается в пополнении плоскости новыми абстрактными элементами, так называемыми несобственными или «бесконечно удаленными» точками. Только после такого пополнения операция проектирования одной плоскости на другую (например, проектирования на экран посредством проекционного фонаря) становится взаимно однозначным преобразованием одной плоскости в другую. Пополнение плоскости несобственными точками, которому в аналитической геометрии соответствует переход от обыкновенных декартовых координат к однородным координатам, происходит следующим образом. Каждая прямая дополняется одной единственной несобственной («бесконечно удаленной») точкой, причем две прямые тогда и только тогда имеют одну и ту же несобственную точку, когда они параллельны. Пополненная единственной бесконечно удаленной точкой прямая становится замкнутой линией, а совокупность бесконечно удаленных точек всевозможных прямых по определению образует несобственную или бесконечно удаленную прямую.

Так как параллельные прямые имеют общую бесконечно удаленную точку, то для того, чтобы представить себе весь процесс пополнения плоскости несобственными точками, достаточно рассмотреть прямые, проходящие через одну какую-нибудь точку плоскости, например через начало координат О (рис. 13). Несобственные точки этих прямых уже исчерпают все вообще несобственные точки проективной плоскости (так как каждая прямая имеет ту же несобственную точку, что и параллельная ей прямая, проходящая через точку О). Поэтому мы получим «модель» проективной плоскости, рассматривая ее как круг «бесконечно большого» радиуса с центром в О и считая, что любая пара диаметрально противоположных точек А, А' окружности этого круга должна быть склеена в одну «беско-

Рис. 13

1 См., например, главу XVII, § 6, или книжку П. С. Александрова «Что такое неэвклидова геометрия» (М., 1951).

нечно удаленную» точку прямой АА'. Сама окружность нашего круга превращается при этом в бесконечно удаленную прямую, но при этом надо твердо помнить, что любые две диаметрально противоположные точки этой окружности должны мыслиться как отождествленные между собой. Отсюда сразу видно, что проективная плоскость есть замкнутая поверхность, никаких краев у нее нет.

Если мы рассмотрим на проективной плоскости кривую второго порядка, которую рисуем в виде гиперболы (см. рис. 13), то ясно, что эта гипербола на проективной плоскости представляет собой замкнутую кривую (лишь разрезанную на две ветви бесконечно удаленной прямой). Имея в виду, что диаметрально противоположные точки окружности нашего основного круга склеены между собой, мы без труда убеждаемся, что заштрихованная на рис. 13 внутренность нашей гиперболы гомеоморфна внутренности обыкновенного круга, а дополнительная, незаштрихованная часть проективной плоскости гомеоморфна ленте Мёбиуса. Таким образом, проективная плоскость с топологической точки зрения есть результат склеивания круга (в нашем случае — внутренности гиперболы) с листом Мёбиуса по их краю. Отсюда следует, что проективная плоскость, т. е. основной объект изучения плоской проективной геометрии, есть замкнутая односторонняя поверхность.

Пример проективной плоскости, кроме своего большого принципиально геометрического значения, интересен еще и потому, что на нем рельефно выделяется одна особенность современного геометрического мышления, сформировавшегося на основе открытий Лобачевского. Геометрическое мышление всегда, по самому характеру понятия геометрической фигуры, было абстрактным. Теперь оно поднимается на новую ступень абстракции, проявляющуюся в нашем случае в пополнении обычной плоскости новыми абстрактными элементами — несобственными точками. Конечно, и эти абстрактные элементы отражают реальную действительность (каждая «несобственная точка» есть не что иное, как абстракция пучка параллельных прямых), но входят они в наши рассмотрения как отвлеченные геометрические элементы, которые мы лишь несовершенно можем себе представить в виде результата (физически не осуществимого) «склеивания» диаметрально противоположных точек окружности некоторого круга. Аналогичные абстрактные построения имеют очень большое значение во всей современной топологии, особенно при переходе от поверхностей к многообразиям трех и более измерений.

§ 3. МНОГООБРАЗИЯ

Рассмотрим следующий простой прибор, иногда называемый двойным плоским маятником (рис. 14), Он состоит из двух стержней OA и AB, скрепленных шарниром в точке А; точка О остается неподвижной, стержень OA свободно вращается в постоянной плоскости вокруг точки О, а стержень AB свободно вращается в той же плоскости вокруг точки А.

Каждое из возможных положений нашей системы вполне определяется, если задать угол φ и угол ψ, которые образуют стержни OA и А В с каким-нибудь постоянным направлением в плоскости, например с положительным направлением оси абсцисс. Эти два угла, изменяющиеся от 0 до 2π. мы можем рассматривать как «географические координаты» точки на торе, отсчитываемые соответственно от «экватора» тора и одного из его «меридианов» (рис. 15).

Таким образом, мы можем сказать, что многообразие всех возможных состояний нашей механической системы есть многообразие двух измерений, а именно — тор. Заменяя каждый из углов φ, ψ соответствующей ему точкой некоторой окружности, на которой дана начальная точка и направление отсчета дуг (рис. 16), мы можем также сказать, что каждое

возможное состояние нашей механической системы будет вполне охарактеризовано, если будет задано по точке на каждой из двух окружностей (на одной из них отсчитывается широта φ, а на другой — долгота ψ). Другими словами, совершенно так же, как в аналитической геометрии, мы отождествляем точку плоскости с парой чисел — ее координат, так и в нашем случае мы можем отождествить точку тора (а значит и любое положение нашего маятника) с парой ее географических координат, т. е. с парой точек, из которых одна лежит на одной, а другая на другой окружности. Это положение вещей характеризуют, говоря, что многообразие всех возможных состояний нашего двойного плоского маятника, т. е. тор, есть топологическое произведение двух окружностей.

Видоизменим теперь наш прибор следующим образом. Пусть он попрежнему состоит из двух стержней OA и AB, причем стержень OA может свободно вращаться в определенной плоскости вокруг точки О, тогда как стержень AB теперь скреплен со стержнем OA шаровым шарниром в точке А, так что при данном положении этой точки он может свободно вращаться вокруг нее уже в пространстве, принимая направление любого исходящего из точки А луча. Теперь положение нашей системы задается тремя параметрами, из которых первый есть попрежнему угол φ, образуемый стержнем OA с положительным направлением оси абсцисс, а вторые

Рис. 14. Рис. 15-

два определяют направление стержня AB в пространстве. Последнее направление может быть определено, например, заданием той точки B' единичной сферы с центром в начале координат О, в которой пересекает эту сферу радиус OB', параллельный стержню А В, или заданием на сфере двух географических координат точки В'. Таким образом, многообразие всех положений нашей новой шарнирной системы есть некоторое трехмерное многообразие, и читатель легко поймет, что его можно трактовать как топологическое произведение окружности и сферы. Это многообразие замкнуто, т. е. оно не имеет краев, поэтому его невозможно реализовать в виде фигуры, лежащей в трехмерном пространстве. Для того чтобы тем не менее представить себе это многообразие сколько-нибудь наглядно, рассмотрим часть пространства, заключенную между двумя концентрическими сферами. Каждый луч, идущий из общего центра этих сфер, прокалывает их в двух точках. Если считать каждую пару таких точек отождествленной (склеенной в одну точку), то мы и получим трехмерное многообразие, являющееся топологическим произведением сферы на окружность.

Мы можем подвергнуть наш шарнирный прибор еще дальнейшему усложнению, не только скрепив шаровым шарниром стержни OA и AB в точке А, но предположив, кроме того, что и стержень OA может свободно вращаться в пространстве вокруг точки О. Множество возможных положений полученной системы будет уже четырехмерным замкнутым многообразием, а именно — произведением двух сфер.

Мы видим, таким образом, что уже простейшие механические рассмотрения (кинематические) приводят к топологическим многообразиям и притом трех и более измерений. При реальном, более подробном рассмотрении механических проблем еще большее значение имеют многообразия (вообще говоря, также многомерные), являющиеся так называемыми фазовыми пространствами динамических систем, где принимаются в расчет не только конфигурации, которые может иметь данная механическая система, но и скорости, с которыми движутся различные составляющие ее точки. Ограничимся одним из простейших примеров. Пусть мы имеем точку, способную двигаться по окружности с произвольной скоростью. Каждое состояние этой системы определяется двумя данными: положением точки на окружности и скоростью ее в данный момент. Многообразием состояний (фазовым пространством) данной механической системы является, очевидно, бесконечный цилиндр (произведение окружности на прямую).

Число измерений фазового пространства растет вместе с ростом числа степеней свободы данной системы. Многие динамические характеристики

Рис. 16.

той или иной механической системы находят свое выражение в топологических свойствах ее фазового пространства. Так, например, каждому периодическому движению данной системы соответствует замкнутая линия в ее фазовом пространстве.

Изучение фазовых пространств динамических систем, поставленное на очередь различными проблемами механики, физики и астрономии (небесная механика, космогония), привлекло внимание математиков к топологии многомерных многообразий. Именно в связи с этими проблемами великий французский математик Пуанкаре предпринял в девяностых годах прошлого века систематическое построение топологии многообразий, применив при этом так называемый комбинаторный метод, являющийся с тех пор одним из основных методов топологии.

§ 4. КОМБИНАТОРНЫЙ МЕТОД

Исторически первой теоремой, относящейся к топологии, является теорема или формула Эйлера (повидимому, известная еще Декарту). Она заключается в следующем. Возьмем поверхность произвольного выпуклого многогранника. Обозначим через α0 число ее вершин, через число ребер и через α2 число граней; тогда имеет место следующее соотношение, которое и известно под названием формулы Эйлера:

(1)

Эта геометрическая теорема именно потому относится к топологии, что наша формула, очевидно, останется верной, если мы подвергнем рассматриваемый выпуклый многогранник произвольному топологическому преобразованию. При таком преобразовании ребра, вообще говоря, перестанут быть прямолинейными, грани — плоскими, поверхность многогранника перейдет в кривую поверхность, но соотношение (1) между числом вершин и числами теперь уже кривых ребер и граней останется в силе. Наиболее важен случай, когда все грани треугольные и мы имеем так называемую триангуляцию (разбиение нашей поверхности на треугольники — прямолинейные или криволинейные). К этому случаю легко приводится общий случай любых многоугольных граней: достаточно разбить эти грани на треугольники (например, проведением диагоналей из какой-либо вершины данной грани). Таким образом, мы можем ограничиться именно случаем триангуляций. Комбинаторный метод в топологии поверхностей и заключается в том, что изучение этой поверхности заменяется изучением ее триангуляций, причем нас интересуют, конечно, только те свойства триангуляций, которые не зависят от случайного выбора той или иной триангуляции, а, будучи общими для всех триангуляций данной поверхности, выражают некоторое свойство самой поверхности.

Формула Эйлера приводит нас к одному из таких свойств, и мы им сейчас займемся несколько подробнее. Левая часть формулы Эйлера, т. е.

выражение α0—α1+α2, где α0 — число вершин, α1 — число ребер и α2 — число треугольников в данной триангуляции, называется эйлеровой характеристикой этой триангуляции. Теорема Эйлера утверждает, что для всех триангуляций поверхности, гомеоморфной сфере, эйлерова характеристика равна двум. Оказывается, что для всякой поверхности (а не только поверхности, гомеоморфной сфере) все триангуляции этой поверхности имеют одну и ту же эйлерову характеристику.

Легко сообразить, каково будет значение эйлеровой характеристики для различных поверхностей. Прежде всего, для цилиндрической поверхности оно равно нулю. В самом деле, удалив из какой-либо триангуляции сферы два не соприкасающиеся между собой треугольника, но сохраняя границы этих треугольников, мы, очевидно, получим триангуляцию поверхности, гомеоморфной боковой поверхности цилиндра. При этом число вершин и ребер осталось прежним, а число треугольников уменьшилось на 2, поэтому эйлерова характеристика полученной триангуляции равна нулю. Возьмем теперь поверхность, полученную из триангуляции сферы посредством удаления 2р треугольников этой триангуляции, попарно не соприкасающихся (т. е. не имеющих ни общих вершин, ни общих сторон)1. При этом эйлерова характеристика уменьшается на 2р единиц. Легко убедиться в том, что при заклеивании каждой пары образовавшихся в поверхности сферы отверстий цилиндрической трубкой эйлерова характеристика не изменится. Это происходит оттого, что характеристика самой приклеиваемой трубки равна, как мы видели, нулю, а на краях этой трубки число вершин равно числу ребер. Итак, замкнутая двусторонняя поверхность рода р имеет эйлерову характеристику 2—2р (факт, впервые доказанный французским адмиралом де Жонкьером).

Приведем еще одно важное свойство триангуляций, удовлетворяющее так называемому условию топологической инвариантности (т. е. принадлежащее каждой триангуляции данной поверхности, если оно принадлежит хотя бы одной из них). Это — свойство ориентируемости. Прежде чем его формулировать, заметим, что каждый треугольник можно ориентировать, т. е. снабдить его границу определенным направлением обхода. Каждая из двух возможных ориентаций треугольника задается определенным порядком следования его вершин2. Предположим теперь, что на какой-нибудь поверхности даны два треугольника, примыкающие

1 Для того чтобы это можно было сделать, надо только, чтобы рассматриваемая триангуляция была достаточно «мелкой». Этого всегда можно достигнуть надлежащим подразделением любой триангуляции.

2 При этом легко видеть, что два порядка вершин тогда и только тогда определяют одну и ту же ориентацию (одно и то же направление обхода), когда они переходят друг в друга посредством «четной» перестановки. Так, (ABC), (ВСА), (CAB) определяют одну, а (ВАС), (АСВ), (СВА) другую ориентацию треугольника. (О четных и нечетных перестановках см., например, главу XX, § 3.)

друг к другу по общей стороне и не имеющие других общих точек (рис. 17). Две ориентации этих треугольников называются согласованными, если они порождают на общей стороне треугольников противоположные направления. (На плоскости или на любой другой двусторонней поверхности это означает, что оба треугольника — если смотреть на них с одной стороны поверхности — обходятся в одном направлении, т. е. либо оба против, либо оба по часовой стрелке.) Триангуляция данной замкнутой поверхности называется ориентируемой, если ориентации всех входящих в эту триангуляцию треугольников можно выбрать так, что любые два прилегающие по общей стороне треугольника окажутся ориентированными согласованно. Имеет место такой факт: всякая триангуляция двусторонней поверхности ориентируема, всякая триангуляция односторонней поверхности неориентируема. Поэтому двусторонние поверхности называются также ориентируемыми, а односторонние — неориентируемыми. Взяв произвольную триангуляцию листа Мёбиуса, читатель без труда убедится в ее неориентируемости. Чтобы получить простейшую триангуляцию проективной плоскости, надо на ней провести какие-либо три прямые, не проходящие через одну точку (рис. 18). Они разобьют проективную плоскость на четыре треугольника, из которых один лежит в конечной части плоскости, а три других рассечены, каждый на две части, бесконечно удаленной прямой. На рис. 18 один из этих трех уходящих в бесконечность треугольников заштрихован. На этом же чертеже видно, что, пытаясь придать всем четырем треугольникам согласованные ориентации, мы неизбежно приходим к неудаче. В частности, при сделанном на рис. 18 выборе ориентаций наших четырех треугольников, мы в качестве алгебраической суммы их границ вместо нуля, который получился бы при согласованных ориентациях, получаем дважды взятую прямую AB.

Эйлерова характеристика и свойство ориентируемости пли неориентируемости замкнутых поверхностей дают нам, как говорят, полную систему топологических инвариантов замкнутых поверхностей. Смысл

Рис. 17. Рис. 18.

этого высказывания заключается в том, что две поверхности тогда и только тогда гомеоморфны, когда триангуляции этих поверхностей, во-первых, имеют одну и ту же эйлерову характеристику и, во-вторых, обе ориентируемы или обе неориентируемы.

Комбинаторный метод применяется не только к изучению поверхностей (двумерных многообразий), но и многообразий любого числа измерений. Но, например, в случае трехмерных многообразий роль обычных триангуляции играют уже разбиения на тетраэдры. Их называют трехмерными триангуляциями или симплициальными разбиениями многообразия. Под эйлеровой характеристикой трехмерной триангуляции понимается число α0 — α1 + α2 — α3, где αi, i=0, 1, 2, 3, есть число i-мерных элементов этой триангуляции (т. е. α0 — число вершин, α1 — число ребер, α2 — число двумерных граней, α3 — число тетраэдров). При числе измерений n>3 многообразие разбивают на n-мерные симплексы, т. е. простейшие выпуклые n-мерные многогранники, аналогичные треугольникам (n = 2) и тетраэдрам (n = 3). Симплексы, на которые разбито n-мерное многообразие, и их грани образуют n-мерную триангуляцию этого многообразия. Попрежнему можно говорить об эйлеровой характеристике, понимая под ней сумму Σ(—1)iαi, где αi — число входящих в данную триангуляцию i-мерных элементов (i = 0, 1, 2,..., n), и попрежнему эйлерова характеристика имеет одно и то же значение для всех триангуляций данного n-мерного многообразия (и всех многообразий, гомеоморфных данному), т. е. является топологическим инвариантом. Но о полной системе инвариантов (в том смысле, в каком она для поверхностей дается эйлеровой характеристикой и ориентируемостью) мы даже для трехмерных многообразий при настоящем уровне наших знаний не можем и мечтать!

Значение комбинаторного метода в современной топологии очень велико. Этот метод открывает возможность применять некоторые алгебраические приемы в решении топологических задач. Возможность такого алгебраического подхода внимательный читатель мог уже усмотреть выше, когда мы говорили об алгебраической сумме границ ориентированных треугольников в триангуляции проективной плоскости. В самом деле, если треугольник ориентирован, т. е. снабжен определенным направлением обхода, то за его границу естественно принять совокупность его сторон, взятых каждая также с определенным направлением — тем, которое порождается имеющимся обходом треугольников.

Рассмотрим теперь все треугольники Ti2, i = 1, 2, ..., α2, входящие в данную триангуляцию некоторой поверхности. Каждому из них можно придать две ориентации; треугольник Тi2. с одной из двух

возможных ориентаций обозначим через ti2, а тот же треугольник с другой (противоположной) ориентацией — через t2. Точно так же каждый из одномерных элементов (ребер) Тk1 (k = 1, 2, . . . , α3), входящих в данную триангуляцию, можно ориентировать, т. е. снабдить его одним из двух возможных направлений. Отрезок Tk1 с одной из ориентаций обозначим через tk1, с другой — через tk1. Тогда, если сторонами треугольника Т2 являются отрезки T11, Т21, Т31, то границей ориентированного треугольника ti2 является совокупность тех же сторон, но взятых с определенными направлениями, т. е. граница состоит из направленных отрезков ε11, ε2t21, ε3t31; здесь εi =1, если это направление для ребра Ti1 совпадает с его собственным направлением ti1 и εi = —1 в противном случае. Границу t2 обозначают через Δt2. Как видим, Δti2 = Σεktk1, причем эту сумму можно представлять себе распространенной на все ребра нашей триангуляции, считая, что коэффициенты εk при отрезках, не входящих в границу треугольника ti2, равны нулю.

Становится естественным рассматривать вообще суммы вида x1=Σakt1k, распространенные по всем ребрам данной триангуляции1. Геометрический смысл таких сумм очень прост: ведь каждое слагаемое суммы есть некоторый отрезок, входящий в нашу триангуляцию, взятый с определенным направлением и определенным коэффициентом (определенной «кратностью»). Вся же написанная алгебраическая сумма выражает составленный из отрезков путь, в котором каждый отрезок считается столько раз, сколько указывает стоящий при нем коэффициент. Например, если мы сначала проходим многоугольник ABCDEF (рис. 19) в показанном стрелкой направлении, потом переходим по отрезку АА' на многоугольник A'B'C'D'E'F', проходимый в указанном на нем направлении, затем возвращаемся по отрезку А'А назад и проходим многоугольник ABCDEF снова в том же, что и раньше, направлении, то получаем сумму, в которую отрезки AB, ВС, CD, DE, EF, FA войдут с коэффициентом 2, отрезки AB', В'С', C'D', D'E', E'F', F'А' — с коэффициентом 1, а отрезок АА' вовсе не войдет (он будет иметь коэффициент нуль, так как он оказывается пройденным два раза в двух противоположных направлениях).

Суммы вида x1 = Σaktk1 называются одномерными цепями данной триангуляции. С алгебраической точки зрения они представляют собой линейные формы (однородные многочлены первой степени); их можно складывать и вычитать, а также умножать на любое целое число по обычным правилам алгебры. Среди одномерных цепей особенно важными являются так называемые одномерные циклы. Геометрически они соот-

1 Коэффициенты ak будем считать целыми числами.

ветствуют замкнутым путям (именно о таком пути была только что речь в связи с рис. 19).

Для чисто алгебраического определения цикла условимся из двух вершин направленного отрезка AB считать конечную вершину В входящей в границу отрезка AB со знаком плюс (с коэффициентом +1), а начальную вершину А — со знаком минус (с коэффициентом —1). Тогда границу отрезка AB можно записать в виде Δ(АВ) = В — А.

Приняв такое соглашение, мы непосредственно замечаем, что сумма границ отрезков AB, ВС, CD,..., FA, образующих замкнутый (в обычном смысле слова) путь, равна нулю. Это делает естественным общее определение одномерного цикла, как такой одномерной цепи z1 = Σakt1k, сумма границ звеньев которой, т. е. сумма Σakt1k равна нулю.

Легко к проверить, что сумма двух циклов есть цикл. Умножая цикл как алгебраическое выражение на какое-либо целое число, получим опять цикл. Это позволяет говорить о линейных комбинациях циклов z11, z21, . . . , zs1, т. е. о циклах вида z = Σcvz1v, где cv — целые числа.

Аналогично понятию одномерной цепи данной триангуляции можно говорить и о двумерных цепях этой триангуляции, т. е. о выражениях вида x2 = Σaiti2, где ti2 — ориентированные треугольники данной триангуляции. Так как граница каждого ориентированного треугольника есть одномерный цикл, то циклом является и цепь ΣaiΔti2. Именно этот цикл считается границей Δx2 цепи x2 = Σaiti2.

Понятие границы цепи позволяет далее сформулировать понятие гомологии: одномерный цикл z1 данной триангуляции называется гомологичным нулю в этой триангуляции, если он является границей некоторой двумерной цепи этой триангуляции. Во всякой триангуляции замкнутой выпуклой поверхности и вообще любой поверхности, гомеоморфной сфере, всякий одномерный цикл гомологичен нулю; геометрически это совершенно ясно: каждый замкнутый многоугольник на выпуклой поверхности является границей некоторого куска этой поверхности. Не то на торе: меридиан тора, так же как и его экватор, не является границей какого-либо куска этой поверхности. Если взять какую-либо триангуляцию тора, то в ней найдутся циклы, аналогичные

Рис. 19.

меридиану и экватору тора, и эти циклы не будут гомологичны нулю.

Совершенно новое явление мы наблюдаем на построенной выше триангуляции проективной плоскости. Если рассматривать прямую, например прямую AB (см. рис. 18), как цикл этой триангуляции, то этот цикл не гомологичен на ней нулю. Однако та же прямая, взятая с коэффициентом 2, уже оказывается гомологичной нулю. Таким образом, привлечение коэффициентов, отличных от +1, при определении цепи, которое кажется сначала формальным и ненужным, позволяет уловить важные геометрические свойства поверхностей и вообще многообразий. В данном случае это так называемое свойство кручения, заключающееся в существовании циклов, которые в данном многообразии не гомологичны нулю (не ограничивают никакого куска поверхности), но становятся гомологичными нулю, если снабдить их некоторым целочисленным коэффициентом.

В связи со сказанным введем, наконец, чрезвычайно важное понятие гомологической независимости циклов. Циклы z1, ..., zs называются гомологически независимыми в данной триангуляции, если никакая их линейная комбинация Σcizi, в которой хотя бы один коэффициент ci отличен от нуля, не гомологична нулю в этой триангуляции. Примерами гомологически независимых циклов на торе могут служить какой-либо меридиан и экватор тора, рассматриваемые как циклы некоторой триангуляции тора.

Основные понятия всей комбинаторной топологии — понятия границы, цикла, гомологии — определены нами для одномерных образований, но они дословно переносятся и на любое число измерений. Так, например, двумерная цепь z2 = Σaiti2 называется циклом, если ее граница Δz2 = ΣaiΔti2 равна нулю. Трехмерная цепь есть выражение вида x3 = Σahth3, где ti3 — ориентированные трехмерные симплексы (тетраэдры).

Как и в случае треугольника, ориентация трехмерного симплекса (тетраэдра) задается определенным порядком его вершин, причем два порядка вершин, переходящие друг в друга при четной перестановке, определяют одну и ту же ориентацию. Граница трехмерного ориентированного симплекса t3 = (ABCD) есть двумерная цепь (цикл) M3 = (BCD) — (ACD) + (ABB) — (ABC) (рис. 20). Граница трехмерной цепи определяется как сумма границ ее симплексов, взятых с теми коэффициентами, с которыми эти симплексы входят в данную цепь. Читатель легко проверит, что граница любой трехмерной цепи есть

Рис. 20.

двумерный цикл (это достаточно доказать для границы одного трехмерного симплекса). Мы говорим, что двумерный цикл гомологичен нулю в данном многообразии, если он является границей некоторой трехмерной цепи этого многообразия. И так далее. Заметим, что из данного выше определения ориентируемых и неориентируемых триангуляций1 сразу следует, что во всякой ориентируемой триангуляции имеются (в случае поверхностей — двумерные) циклы, отличные от нуля, а в неориентируемых триангуляциях таких циклов нет; этот результат также непосредственно обобщается на любое число измерений.

Введенные понятия позволяют определить порядок одномерной, двумерной и т. д. связности данных многообразий произвольного числа измерений. Максимальное число имеющихся в какой-либо триангуляции данного многообразия гомологически независимых одномерных, двумерных и т. д. циклов не зависит от выбора триангуляций данного многообразия и называется его порядком связности, или числом Бетти (соответствующей размерности).

Одномерное число Бетти замкнутой ориентируемой поверхности рода р равно 2р (т. е. порядку связности поверхности, как он определялся в § 2). Одномерное число Бетти проективной плоскости равно 0. (Там всякий цикл, не уходящий в бесконечность, ограничивает часть плоскости, т. е. гомологичен нулю, а цикл, уходящий в бесконечность, например проективная прямая, оказывается гомологичным нулю, если взять его дважды.) Двумерное число Бетти всякой неориентируемой поверхности равно нулю (на такой поверхности нет ни одного отличного от нуля двумерного цикла).

Двумерное число Бетти всякой ориентируемой поверхности равно 1. Действительно, если ориентировать надлежащим образом все треугольники какой-нибудь триангуляции ориентируемой поверхности, получим цикл (так называемой основной цикл поверхности). Нетрудно проследить, что всякий двумерный цикл получается из основного цикла умножением его на какое-нибудь целое число. Эти результаты непосредственно обобщаются и на n-мерные многообразия. Заметим еще, что нульмерное число Бетти связного (т. е. не распадающегося на куски) многообразия считается равным 1.

Числа Бетти различных измерений связаны с эйлеровой характеристикой многообразия замечательной формулой, доказанной Пуанкаре и обобщающей теорему Эйлера. Эта формула, известная под названием формулы Эйлера—Пуанкаре, имеет следующий простой вид:

1 Это определение, данное выше для триангуляции поверхностей, переносится и на случай триангуляций многообразий любого числа измерений.

Здесь слева стоит эйлерова характеристика произвольной триангуляции данного многообразия, а числа рr справа суть числа Бетти различных размерностей r этого многообразия. В частности, для ориентируемых поверхностей имеем, как мы только что видели, p0 = p2 = i, p1 = 2p, где р — род поверхности. Это и дает нам теорему Эйлера для ориентируемых поверхностей

α0 — α1 + α2 = 2—2р.

§ 5. ВЕКТОРНЫЕ ПОЛЯ

Рассмотрим простейшее дифференциальное уравнение

(2)

заданное в данной плоской области G. Его геометрический смысл заключается в том, что в каждой точке (x, у) области G определено направление, угловой коэффициент которого равен F(x, у), где F (х, у) — некоторая непрерывная функция точки (x, у). Как говорят, в области G задано непрерывное поле направлений; мы можем его легко превратить в непрерывное векторное поле, беря, например, в каждом из заданных направлений вектор единичной длины. Задача интегрирования дифференциального уравнения (2) заключается в том, чтобы разложить, если это возможно, данную плоскую область на попарно не пересекающиеся кривые («интегральные кривые» уравнения) таким образом, чтобы в каждой точке области заданное в ней направление было направлением касательной к единственной интегральной кривой, проходящей через эту точку.

Рассмотрим, например, уравнение

В каждой точке M (х, у) на плоскости отнесенное ей направление есть очевидно направление луча ОМ (где О — начало координат). Интегральные кривые суть прямые, проходящие через точку О. Через каждую отличную от О точку плоскости проходит единственная интегральная кривая. Что же касается начала координат, то это особая точка данного дифференциального уравнения (так называемый «узел»), через нее проходят все интегральные кривые.

Если мы возьмем дифференциальное уравнение

то увидим, что оно относит каждой отличной от О точке M (х, у) направление, которое перпендикулярно ОМ. Интегральные кривые

в этом случае — окружности с центром в точке О, которая снова является особой точкой нашего дифференциального уравнения, но особой точкой совсем другого типа. Это уже не «узел», а так называемый «центр». Существуют и другие типы особых точек (см. том 2, главу V, § 6), некоторые из них изображены на рис. 21, 22. У дифференциального уравнения dy/dx = x/y нет замкнутых интегральных кривых. Напротив, дифференциальное уравнение dy/dx = -x/y имеет только замкнутые интегральные кривые. Возможны интегральные кривые, спирально закручивающиеся вокруг особой точки, которая в этом случае называется фокусом.

Чрезвычайно важным в разнообразных приложениях является случай так называемого предельного цикла — замкнутой интегральной кривой, на которую спиралевидно накручиваются другие интегральные кривые. Возможны и многие другие случаи взаимного расположения интегральных кривых, а также их расположения по отношению к особым точкам. Все проблемы, касающиеся формы и расположения интегральных кривых дифференциального уравнения, а также числа, характера и взаимного расположения его особых точек, относятся к качественной теории дифференциальных уравнений. Как показывает само название, качественная теория дифференциальных уравнений оставляет в стороне непосредственное интегрирование дифференциального уравнения «в конечном виде», равно как и методы приближенного, численного интегрирования. Основным предметом качественной теории является по существу топология поля направлений и системы интегральных кривых данного дифференциального уравнения.

Качественный подход к дифференциальным уравнениям, включающий такие вопросы, как существование замкнутых интегральных кривых, в частности все вопросы, связанные с существованием, числом и возникновением предельных циклов, продиктован в первую очередь проблемами механики, физики и техники. Впервые эти вопросы возникли в связи с исследованиями Пуанкаре по небесной механике и космогонии, которые, как уже упоминалось, и явились поводом для топологических изысканий французского геометра. В нашей стране топологическая проблематика теории дифференциальных уравнений заняла одно из центральных мест в проведенных советскими учеными выдающихся исследованиях, которые относятся к теории колебаний и радиотехнике — я имею в виду школу Л. И. Мандельштама и выросшую из нее школу А. А. Андронова, ставшую одним из основных центров разработки качественной, в значительной степени топологической теории дифференциальных уравнений. Другим центром разработки качественной теории дифференциальных уравнений в значительной мере топологическими методами является школа В. В. Степанова и В. В. Немыцкого в Московском университете. В работах ленинградских, свердловских и казанских математиков по вопросам

качественной теории дифференциальных уравнений также все возрастающую роль играют топологические методы.

Теория дифференциальных уравнений приводит к изучению векторных полей не только на плоскости, но и в многомерных многообразиях; уже простейшие системы многих дифференциальных уравнений интерпретируются геометрически как поля направлений в многомерных эвклидовых пространствах. Привлечение так называемых первых интегралов уравнения означает выделение среди совокупности всех интегральных кривых тех, которые лежат на некотором многообразии, определяемом данными первыми интегралами. Всякая динамическая система (в классическом смысле этого слова) приводит, вообще говоря, к многомерному многообразию ее возможных состояний (см. § 3) и к системе дифференциальных уравнений, интегральные кривые которой, заполняя данное фазовое пространство, представляют собой возможные движения данной системы. Каждое отдельное из этих движений определяется теми или иными начальными условиями. Следовательно, основным объектом изучения и в этом случае является поле направлений и система траекторий на данном многообразии. Многочисленные приложения, появившиеся особенно в последние годы, делают понятным развитие качественной теории дифференциальных уравнений в ее самом широком аспекте, а следовательно, и развитие топологии как основы этой теории. Именно этой механической и физической, а также астрономической тематике и обязана современная топология своим быстрым ростом, составляющим значительную часть общего развития математики в течение истекшего полустолетия. Читателю, желающему ознакомиться с топологической проблематикой в теории дифференциальных уравнений в ее конкретном физическом и техническом аспекте, можно порекомендовать известную книгу Л. А. Андронова и С. Э. Хайкина «Теория колебаний».

В качестве примера конкретной задачи, решенной в теории векторных полей на многомерных многообразиях, рассмотрим вопрос об алгебраическом числе особых точек такого векторного поля.

Пусть нам дано какое-нибудь гладкое многообразие. Для простоты будем представлять себе гладкую замкнутую поверхность. Предположим, что в каждой точке этого многообразия задан касательный к нему вектор, и по длине и по направлению непрерывно зависящий от точки. Особые точки такого векторного поля суть те точки многообразия, в которых отнесенный к ним вектор равен нулю, т. е. не имеет определенного направления. Мы предположим, что каждая из этих точек изолированная. В случае замкнутого многообразия это означает, что имеется лишь конечное число особых точек. (Иначе часть этих точек сгущалась бы около некоторой предельной точки, которая по непрерывности поля также была бы особой точкой, не будучи изолированной.)

Для изолированной особой точки можно определить ее индекс — понятие, в известном смысле аналогичное понятию кратности корня алгеб-

раического уравнения. Для определения индекса окружаем данную особую точку какой-либо «изолирующей ее» замкнутой линией С (на плоскости — просто окружностью), т. е. такой линией, которая сама не проходит ни через одну особую точку, а внутри содержит лишь одну, рассматриваемую нами, особую точку. Во всех точках кривой С направление ноля однозначно определено. Для простоты будем считать, что включающая кривую С окрестность нашей особой точки плоская (в общем случае можно отобразить на плоскость интересующую нас окрестность вместе с заданным на ней полем). При обходе кривой в положительном направлении угол, который направление поля образует с каким-либо фиксированным направлением, возвращается к своему начальному значению, возрастая по дороге на некоторое слагаемое вида 2kπ, где к — какое-то целое, вполне определенное число. Это число и называется индексом особой точки, а также вращением поля вдоль кривой С. Заметим, что оно не зависит от специального выбора замкнутой линии, изолирующей данную особую точку. На рис. 21, 22 изображены особые точки соответственно с индексами +3 и —2. Аналогичным, но более сложным образом определяется индекс и для особой точки поля векторов (направлений), определенного на n-мерном многообразии при n>2. Оказывается, что имеет место следующая замечательная теорема, доказанная немецким математиком Хопфом в 1926 г.: если на данном многообразии определено непрерывное векторное поле, имеющее лишь конечное число особых точек, то сумма индексов, или, как говорят, алгебраическое число этих особых точек, не зависит от поля и всегда равна эйлеровой характеристике многообразия.

Из теоремы Хопфа следует, что векторные поля без особенностей возможны лишь на таких многообразиях, эйлерова характеристика которых равна нулю; на последних же многообразиях, как оказывается, всегда можно построить векторное поле без особенностей. Таким образом, из всех замкнутых поверхностей только на торе и так называемом

Рис. 21. Рис. 22.

одностороннем торе (поверхности Клейна) можно построить векторное поле, не имеющее особенностей.

С теорией векторных полей тесно связана теория непрерывных отображений многообразий в себя и особенно ее результаты, касающиеся существования неподвижных точек при таких отображениях. Точка х называется неподвижной точкой данного отображения f, если ее образ при этом отображении совпадает с самой точкой, т. е. если

f(x)=x.

Чтобы пояснить характер этой связи, рассмотрим простейший случай — случай непрерывного отображения f круга К в себя. Соединяя каждую точку X круга К с ее образом f(x), получим вектор ux=x,f(x). Этот вектор обращается в нуль тогда и только тогда, когда f(x)=x, т. е. когда х — неподвижная точка данного отображения. Докажем, что такая точка действительно существует. Для этого предположим противное и определим вращение нашего векторного поля вдоль окружности С круга К.

При непрерывном видоизменении нашего поля его вращение вдоль окружности С, очевидно, может меняться также лишь непрерывно. Являясь при этом целым числом, оно должно оставаться постоянным. Отсюда уже следует, что вращение поля вдоль окружности С равно 1. В самом деле, так как любая точка, принадлежащая кругу К, отображается в этот же круг, то для точки х, лежащей на окружности С, вектор их (согласно нашему предположению отличный от нуля) направлен внутрь круга и потому образует острый угол с радиусом Ох, который мы рассматриваем как вектор, направленный к центру О.

Подвергнем непрерывному видоизменению направления всех векторов их для точек X, лежащих на окружности С. Видоизменение это будет заключаться в том, что мы повернем все эти векторы на соответствующие острые углы так, чтобы они оказались направленными в центр О. Как было только что сказано, при этом вращение поля вдоль окружности С не изменится. Но в результате такого преобразования наше исходное поле перейдет на С в поле радиальных векторов, которое, очевидно, имеет вращение 1. Итак, наше первоначальное поле также имело вдоль окружности С вращение 1.

В силу непрерывности исходного векторного поля его вращение вдоль двух окружностей с одним и тем же центром О н мало отличающимися но длине радиусами имеет одно и то же значение1. Поэтому вращение поля вдоль всех окружностей с центром О, лежащих в круге К, имеет одно и то же значение, а именно 1. Но так как по предположению вектор их определен и отличен от нуля во всех точках круга, в том числе и в его

1 Вследствие предположенного отсутствия у отображения f неподвижных точек рассматриваемое поле всюду определено и отлично от нуля, это и позволяет говорить о его вращении вдоль любой кривой в круге К.

центре 0, вращение поля вдоль окружности достаточно малого радиуса с центром в О непременно равно нулю. Мы пришли к противоречию и доказали, таким образом, что при непрерывном отображении круга в себя всегда имеется хотя бы одна неподвижная точка. Эта теорема является частным случаем весьма важной теоремы Брауэра, утверждающей, что при всяком непрерывном отображении в себя n-мерного шара имеется хотя бы одна неподвижная точка.

В настоящее время вопрос о существовании неподвижных точек при отображении тех или иных типов детально изучен и составляет существенную часть топологии многообразий.

§ 6. РАЗВИТИЕ ТОПОЛОГИИ

Топология замкнутых поверхностей — единственная область топологии, которая была более или менее разработана уже к концу прошлого столетия. Построение этой теории было связано с развитием в течение XIX в. теории функций комплексного переменного. Эта последняя, составляя одно из значительнейших явлений в истории математики прошлого века, строилась несколькими различными методами. Одним из наиболее плодотворных в смысле понимания существа изучаемых явлений оказался геометрический метод Римана. Метод Римана, с большой убедительностью показавший, что в общей теории функций комплексного переменного невозможно ограничиться одними лишь однозначными функциями, привел к построению так называемых римановых поверхностей. Эти поверхности в простейшем случае алгебраических функций комплексного переменного всегда оказываются замкнутыми ориентируемыми поверхностями. Изучение их топологических свойств в известном смысле эквивалентно изучению данной алгебраической функции. Дальнейшее развитие идей Римана было произведено Пуанкаре, Клейном и их последователями и привело к установлению неожиданных и глубоких связей между теорией функций, топологией замкнутых поверхностей и неэвклидовой геометрией, а именно— теорией группы движений на плоскости Лобачевского1. Таким образом, впервые топология оказалась органически включенной в целый сгусток принципиально значительных проблем, относящихся к весьма различным областям математики.

При дальнейшем развитии этой проблематики оказалось, что одной топологии поверхностей недостаточно, что необходимо решение и определенных задач n-мерной топологии. Первой из них была задача о топологической инвариантности числа измерений пространства. Задача эта заключается в том, чтобы доказать невозможность топологически отобразить n-мерное эвклидово пространство на m-мерное при n≠m. Эта

1 См. по этому поводу книгу А. И. Маркушевича «Теория аналитических функций». Гостехиздат, 1950.

трудная задача была решена в 1911 г. Брауэром1. В связи с ее решением были открыты новые топологические методы, которые привели к быстрому построению начал теории непрерывных отображений многомерных многообразий и теории векторных полей на них. Во всех этих исследованиях оказались необходимыми и первые основные понятия так называемой теоретико-множественной топологии, возникшей на почве общей теории множеств, построенной Кантором в последней четверти прошлого века.

В теоретико-множественной топологии сам объект исследования, т. е. класс рассматриваемых геометрических фигур, чрезвычайно расширился и охватил если не все вообще множества, лежащие в эвклидовых пространствах, то по крайней мере все замкнутые множества. В быстром развитии нового теоретико-множественного направления топологии приняли участие ученые разных стран, причем особо следует отметить польскую топологическую школу.

Существенно новое направление развитие теоретико-множественной: топологии получило в работах советских топологов, особенно в построенной выдающимся, безвременно погибшим советским математиком П. С. Урысоном (1898—1924) общей теории размерности, которая заложила основы классификации самых общих точечных множеств по основному признаку — числу измерений. Эта классификация оказалась чрезвычайно плодотворной и повлекла за собой совершенно новые точки зрения в изучении наиболее общих геометрических форм2. Идеи Урысона, развитые в его теории размерности, послужили той почвой, на которой возникли замечательные работы Л. А. Люстерника (совместно с Л. Г. Шнирельманом) по вариационному исчислению.

В этих работах наряду с другими результатами было дано исчерпывающее положительное решение знаменитой проблемы Пуанкаре о существовании трех замкнутых годезических линий без кратных точек на всякой поверхности, гомеоморфной сфере.

С другой стороны, на почве теории размерности произошло перенесение П. С. Александровым алгебраических методов комбинаторной топологии в область теории множеств, что в свою очередь повело к новым

1 В сущности, для развития теории функций комплексного переменного необходимо было решить даже еще более трудную задачу, а именно доказать, что лежащий в n-мерном пространстве топологический образ n-мерной области в свою очередь всегда есть область. Эта задача также была решена Брауэром.

2 Индуктивное определение размерности множеств, предложенное Урысоном, можно рассматривать как наиболее полное развитие идей Лобачевского о сечении как основной геометрической операции. В самом грубом приближении оно сводится к следующему. Множество нульмерно, если оно может быть представлено в виде суммы сколь угодно малых частей, не находящихся между собой попарно в соприкосновении. Множество n-мерно, если (n — 1)-мерными подмножествами его можно «рассечь» на сколь угодно малые, попарно не соприкасающиеся части и если этого нельзя достигнуть, рассекая его посредством множеств размерности меньше чем n — 1. (Точное определение соприкосновения, как оно понимается в современной топологии, будет дано в § 7.)

направлениям топологических исследований, в которых математики СССР, вплоть до самых молодых, прочно удерживают первое место1.

Что касается собственно комбинаторной топологии, то после работ Пуанкаре и Брауэра, примерно около 1915 г., начинается цикл исследований американских топологов — Веблена, Биркгофа, Александера, Лефшеца. Ими были достигнуты очень значительные результаты. Так, Александер доказал топологическую инвариантность чисел Бетти, а также свою основную теорему двойственности, послужившую отправной точкой дальнейших исследований Л. С. Понтрягина; Лефшец дал известную формулу об алгебраическом числе неподвижных точек при любых непрерывных отображениях многообразий и тем заложил основы общей алгебраической теории непрерывных отображений, развитой далее Хопфом; Биркгофу наука обязана существенным продвижением теории динамических систем в ее чисто топологическом и в метрическом аспекте и т. д. Дальнейшее очень глубокое развитие топология многообразий и их непрерывных отображений получила в работах Хопфа, который наряду со многими другими результатами доказал существование бесконечного числа непрерывных отображений трехмерной сферы на двумерную, существенно различных между собой в том смысле, что никакие два из этих отображений не могут быть непрерывным видоизменением переведены друг в друга. Хопф, таким образом, становится основателем нового направления — так называемой гомотопической топологии. В настоящее время в гомотопической топологии, как и вообще во всей комбинаторной топологии, произошел новый большой сдвиг, вызванный работами новой французской топологической школы (Лерэ, Серр и др.).

Фундаментальные исследования Урысона были, как уже упоминалось, началом деятельности советских математиков в области топологии. Эти исследования относились к теоретико-множественной топологии, но уже с конца двадцатых годов советские топологи включают в круг своих интересов и комбинаторную топологию. Это включение произошло очень самобытным образом — посредством приложения комбинаторных методов к изучению замкнутых множеств, т. е. объектов очень общей природы. На этой почве произошло одно из значительнейших геометрических открытий текущего столетия — формулировка и доказательство Л. С. Понтрягиным его общего закона двойственности, устанавливающего глубокие и в известном направлении исчерпывающие связи между топологическим строением данного замкнутого множества, лежащего в n-мерном эвклидовом пространстве, и дополнительной к нему части пространства. В связи со своим законом двойственности Л. С. Понтрягин построил общую

1 Здесь следует указать на так называемую гомологическую теорию размерности П. С. Александрова, на относящиеся к ней замечательные построения Л. С. Понтрягина и на дальнейшее развитие гомологической теории размерности в работах М. Ф. Бокштейна, В. Г. Болтянского и особенно К. А. Ситникова. О законе двойственности Л. С. Понтрягина еще будет идти речь.

теорию характеров коммутативных групп, что привело его и к дальнейшим исследованиям в области общих топологических и классических непрерывных групп Ли — области, которая совершенно преобразована работами Л. С. Понтрягина. В дальнейшем Л. С. Понтрягин и его ученики произвели ряд выдающихся исследований по топологии многообразий и их непрерывных отображений (В. Г. Болтянский, М. М. Постников и др.). В этих исследованиях нашел свое применение новый метод — так называемых у"гомологий, введенный в комбинаторную топологию А. Н. Колмогоровым и, независимо от него, Александером. Этот метод, занимающий сейчас первое место во всей гомотопической топологии, позволил в совершенно различных направлениях продолжить теорию двойственности Л. С. Понтрягина, что повело к теоремам двойственности А. Н. Колмогорова (и Александера), П. С. Александрова и К. А. Ситникова, принадлежащим к значительным результатам современной топологии. Этот же метод нашел важные приложения и в новейших работах Л. А. Люстерника по вариационному исчислению.

§ 7. МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА

В начале нашего изложения мы говорили о прикосновении (различных частей данной фигуры) как об основном топологическом понятии и определили непрерывные преобразования как такие, которые сохраняют это отношение. Однако точного определения этого основного понятия дано не было; сделать это достаточно общим образом можно лишь на основе понятий теории множеств. Это и составляет задачу настоящего параграфа; ее решение завершается введением понятия топологического пространства.

Теория множеств позволила придать понятию геометрической фигуры широту и общность, недоступную так называемой «классической» математике. Объектом геометрического, в частности топологического, исследования становятся теперь любые точечные множества, т. е. любые множества, элементами которых являются точки n-мерного эвклидова пространства. Между точками n-мерного пространства определено расстояние: именно, расстояние между точками А = (x1, x2,..хn) и В = (y1, y2,. . yn) по определению равно неотрицательному числу

Понятие расстояния позволяет определить прикосновение сначала между множеством и точкой, затем — между двумя множествами. Мы говорим, что точка А есть точка прикосновения множествам, если в множестве M имеются точки, расстояние которых от точки А меньше всякого наперед заданного положительного числа. Очевидно, любая точка данного множества есть его точка прикосновения, но и точка, не являющаяся точкой данного множества, может быть его точкой прикосновения. Возьмем, например, открытый промежуток (0,1) на числовой прямой, т. е.

множество всех точек, лежащих между 0 и 1; сами точки 0 и 1 не принадлежат этому промежутку, но являются его точками прикосновения, так как в промежутке (0, 1) имеются точки, сколь угодно близкие к нулю, и точки, сколь угодно близкие к единице. Множество называется замкнутым, если оно содержит все свои точки прикосновения. Например, отрезок [0,1] числовой прямой, т. е. множество всех точек х, удовлетворяющих неравенству 0⩽x⩽1, замкнуто.

Замкнутые множества на плоскости и тем более в пространстве трех и более измерений могут иметь чрезвычайно сложную структуру; именно они и являются по преимуществу предметом изучения теоретико-множественной топологии n-мерного пространства. Мы скажем далее, что два множества Р и Q соприкасаются между собой, если хотя бы одно из них содержит точку прикосновения другого. Согласно этому определению, два пересекающихся (т. е. имеющих общие точки) множества всегда соприкасаются. Из предыдущего следует, что два замкнутых множества соприкасаются лишь в том случае, когда они имеют хотя бы одну общую точку; но, например, отрезок [0, 1] и промежуток (1, 2), не имея общих точек, соприкасаются, так как точка 1, принадлежащая отрезку [0, 1], в то же время является точкой прикосновения промежутка (1, 2). Теперь мы можем сказать, что множество R разбивается («рассекается») лежащим в нем множеством S, или что S является «сечением» множества R, если множество R—S, состоящее из всех точек множества R, не принадлежащих S, может быть представлено как сумма двух не соприкасающихся между собой множеств.

Таким образом, идеи Лобачевского о соприкосновении и рассечении множеств получают в современной топологии свое точное и в высшей степени общее выражение. Мы уже видели, как на этих идеях основывается данное Урысоном определение размерности любого множества (см. примечание на стр. 206); формулировка этого определения получает теперь совершенно точное содержание. Это же относится и к определению непрерывного отображения или преобразования: отображение f множества X на множество Y называется непрерывным, если при этом отображении сохраняется соприкосновение, т. е. если из того, что некоторая точка А множества X есть точка прикосновения какого-либо подмножества Р множества У, следует, что образ f (А) точки А есть точка прикосновения образа f(P) множества Р. Наконец, взаимно однозначное отображение множества X на множество Y называется топологическим, если оно само непрерывно и если обратное ему отображение множества Y на множество X также непрерывно. Эти определения подводят точную базу всему сказанному в первых параграфах настоящей статьи.

Однако теоретико-множественная топология не ограничивается той степенью общности, которая достигается рассмотрением в качестве геометрических фигур всех точечных множеств. Оказывается естественным вводить понятие расстояния не только между точками какого-либо эв-

клидова пространства, но и между другими объектами, казалось бы вовсе не относящимися к геометрии.

Рассмотрим, например, множество всех непрерывных функции, определенных, скажем, на отрезке [0, 1]. Определим расстояние ρ(f, g) между двумя функциями f и g как максимум выражения | f(x)—g(x)|, когда X пробегает весь отрезок [0, 1]. Это «расстояние» обладает всеми основными свойствами расстояния между двумя точками пространства: ρ(f, g) между двумя функциями f и g равно нулю тогда и только тогда, когда эти функции совпадают, т. е. когда f(x)=g(x) для любой точки х; далее, расстояние, очевидно, симметрично, т. е. ρ(f, g) = ρ(g, f); наконец, оно удовлетворяет так называемой аксиоме треугольника: для любых трех функций f1, f2, f3 имеем ρ(f1, f2)+ρ(f2, f3) ⩾ρ (f1, f3). Принято говорить, что приведенное определение расстояния превращает наше множество функций в метрическое пространство (обычно обозначаемое через С). Под метрическим пространством вообще понимается множество каких угодно объектов, условно называемых точками метрического пространства, если только между любыми двумя точками определено расстояние, являющееся неотрицательным числом, удовлетворяющим приведенным только что «аксиомам расстояния».

Если дано какое-нибудь метрическое пространство, то можно говорить о точках прикосновения его подмножеств, а следовательно, и о соприкосновении его подмножеств между собою и вообще о топологических понятиях (замкнутых множествах, непрерывном отображении и дальнейших понятиях, вводимых на основе этих простейших). Таким путем открывается обширное и чрезвычайно плодотворное поле применения топологических и вообще геометрических идей к таким кругам математических объектов, в применении к которым, казалось бы, совершенно невозможно говорить ни о какой геометрии. Приведем поясняющий пример.

Возьмем снова дифференциальное уравнение (2)

Если y = φ(x) при 0⩽x⩽1, есть решение этого уравнения, принимающее, положим, для значения X = 0 значение y = 0, то функция φ(x), очевидно, удовлетворяет интегральному уравнению

(3).

Рассмотрим теперь интеграл G(f) = ∫F(х, f(x))dx, где 0⩽x⩽1 и f(x)—какая-нибудь непрерывная функция, определенная на отрезке [0,1].

Этот интеграл есть некоторая непрерывная функция g(x), также определенная на отрезке [0, 1]. Так, выражение G(f)= ∫F(x, f(x))dx ставит в соответствие каждой функции f функцию g = G(f); другими словами, мы имеем отображение G, как легко видеть — непрерывное, метрического пространства С в себя. Чем же характеризуется при этом функция φ(х) (их может быть несколько), являющаяся решением уравнения (2) или эквивалентного ему уравнения (3)? Тем, очевидно, что при нашем отображении она переходит сама в себя, т. е. является неподвижной точкой нашего отображения G. Оказывается, такая неподвижная точка у отображения G действительно существует — это вытекает из весьма общей теоремы о неподвижных точках непрерывных отображений метрических пространств, доказанной в 1926 г. П. С. Александровым и В. В. Немыцким. В настоящее время рассмотрение различных метрических пространств, точками которых являются те или иные функции (такие пространства называются функциональными), является постоянно применяемым аппаратом анализа, а изучение функциональных пространств посредством отчасти топологических, а главным образом, в широком смысле слова, алгебраических методов, составляет содержание функционального анализа (см. главу XIX).

Функциональный анализ, как уже упоминалось в вводной главе, занимает в современной математической науке чрезвычайно видное место ввиду многообразия своих связей со всевозможными другими частями математики и по своему значению для естествознания, в первую очередь для теоретической физики. Исследование топологических свойств функциональных пространств тесно связано с вариационным исчислением и теорией уравнений с частными производными (исследования Л. А. Люстерника, Морса, Лерэ, Шаудера, М. А. Красносельского и др.). Вопросы существования неподвижных точек при непрерывных отображениях функциональных пространств занимают в этих исследованиях значительное место.

Топология функциональных и вообще метрических пространств — всё еще не последнее слово общности в современных топологических теориях. Дело в том, что в метрических пространствах основное топологическое понятие прикосновения вводится на основе расстояния между точками, которое само по себе не является топологическим понятием. Поэтому возникает задача непосредственного, аксиоматического определения прикосновения. Так мы приходим к понятию топологического пространства — самому общему понятию современной топологии.

Топологическое пространство есть множество объектов любой природы (называемых точками топологического пространства), в котором для каждого подмножества тем или иным способом заданы его точки

прикосновения. При этом требуется соблюдение некоторых естественных условий, называемых аксиомами топологического пространства (например, каждая точка данного множества является его точкой прикосновения, точка прикосновения суммы двух множеств является точкой прикосновения по крайней мере одного из слагаемых и т. п.). Теория топологических пространств — в настоящее время глубоко разработанная область математики. В ее развитии приняли ведущее участие советские математики П. С. Урысон, П. С. Александров, А. Н. Тихонов и др. Из новейших результатов в теории топологических пространств, имеющих принципиальное значение, следует отметить найденное молодым математиком Ю. М. Смирновым необходимое и достаточное условие метризуемости топологического пространства, т. е. условие, при котором между точками пространства можно определить расстояние таким образом, чтобы имеющаяся «топология» пространства могла рассматриваться как порожденная этим понятием расстояния. Иными словами, чтобы точки прикосновения всевозможных множеств в полученном метрическом пространстве были теми же самыми, что и определенные с самого начала в данном топологическом пространстве.

ЛИТЕРАТУРА

Александров П. С. Комбинаторная топология. Гостехиздат, 1947.

Обширное систематическое руководство, предъявляющее довольно большие требования к читателю.

Александров П. С. Теоремы двойственности в комбинаторной топологии. Юб. сборник, посвящ. 30-летию Великой Октябрьской социалистической революции, т. 1, Изд-во АН СССР, 1947.

Александров П. С. Введение в общую теорию множеств и функций. Гостехиздат, 1948.

Эта книга является и введением в теоретико-множественную топологию (метрических и топологических пространств).

Александров П. С. Топологические теоремы двойственности, ч. 1, Замкнутые множества (Труды Математического института им. В. А. Стеклова АН СССР, т. 48, 1955).

Может служить первой книгой для чтения но комбинаторной топологии, доводящей читателя до современных исследований в одной из важных областей топологии (теории двойственности).

Александров П. С. и Ефремович В. А. Очерк основных понятий топологии. М.—Л., 1936.

Книга представляет собою введение в комбинаторную топологию с довольно подробным изложением топологии поверхностей.

Понтрягин Л. С. Основы комбинаторной топологии. Гостехиздат, 1947.

Очень сжатое, но безукоризненно полное изложение основных предложений n-мерной комбинаторной топологии.

Глава XIX

ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ

Возникновение и развитие в XX в. функционального анализа обусловлено в основном двумя причинами. С одной стороны, появилась необходимость осмыслить с единой точки зрения богатейший фактический материал, накопленный в различных, часто мало связанных между собой, разделах математики в течение XIX в. При этом основные понятия функционального анализа возникали и выкристаллизовывались с разных сторон и по разным поводам. Многие из основных понятий функционального анализа появились естественным образом в процессе развития вариационного исчисления, в задачах о колебаниях (при переходе от колебаний систем с конечным числом степеней свободы к колебаниям сплошных сред), в теории интегральных уравнений, в теории дифференциальных уравнений, обыкновенных и с частными производными (в краевых задачах, в задачах о собственных значениях и т. д.), при развитии теории функций действительного переменного, в операционном исчислении, при рассмотрении задач теории приближения функций и др. Функциональный анализ позволил понять с единой точки зрения многие имеющиеся в этих областях результаты и часто способствовал получению новых. Подготовленные при этом понятия и аппарат были использованы в последние десятилетия в новом разделе теоретической физики — в квантовой механике.

С другой стороны, изучение математических проблем, связанных с квантовой механикой, явилось переломным моментом в ходе дальнейшего развития самого функционального анализа и сформировало и формирует в настоящее время основные направления его развития.

Функциональный анализ еще далек от своего завершения. Однако несомненно, что и в дальнейшем его развитии задачи и потребности современной физики будут иметь для него такое же значение, какое классическая механика имела для возникновения и развития в XVIII в. дифференциального и интегрального исчисления.

Мы далеки от мысли охватить в этой главе все, хотя бы основные, вопросы функционального анализа. Многие важные разделы остались за пределами этой статьи. Мы хотели тем не менее, ограни-

чившись несколькими избранными вопросами, познакомить читателя с некоторыми основными понятиями функционального анализа и проиллюстрировать по мере возможности те связи, о которых мы здесь упомянули. Эти вопросы по существу разобраны в начале XX в. в основном в классических работах Гильберта — одного из основоположников функционального анализа. С тех пор функциональный анализ очень сильно развился и широко применяется почти во всех разделах математики: в дифференциальных уравнениях в частных производных, в теории вероятностей, в квантовой механике, в квантовой теории полей и т. д. К сожалению, это дальнейшее развитие функционального анализа здесь не отражено. Для того, чтобы описать это дальнейшее развитие нужно было бы написать отдельную большую статью и мы ограничиваемся поэтому одним из наиболее старых вопросов — теорией собственных функций.

§ 1. n-МЕРНОЕ ПРОСТРАНСТВО

В дальнейшем мы будем пользоваться основными понятиями, относящимися к n-мерному пространству. Хотя в главах о линейной алгебре и абстрактных пространствах эти понятия и вводились, мы считаем нелишним повторить их здесь коротко в том виде, в котором они далее встретятся. При чтении этого параграфа читателю достаточно знания основ аналитической геометрии.

Мы знаем, что точка в аналитической геометрии трехмерного пространства задается тройкой чисел (f1, f2, f3) — координат точки. Расстояние этой точки до начала координат равно √f12 + f22 + f32. Если считать точку концом вектора, ведущего в эту точку из начала координат, то длина вектора также равна √f12 + f22 + f32. Косинус угла между ненулевыми векторами, ведущими из начала координат в две различные точки A(f1, f2, f3) и B(g1, g2, g3), определяется формулой

Из тригонометрии мы знаем, что |cosφ|⩽1. Поэтому имеет место неравенство

и, значит, всегда

(1)

Это последнее неравенство носит алгебраический характер и справедливо для любых шести чисел (f1, f2, f3) и (g1, g2, g3), так как любые шесть чисел могут служить координатами двух точек пространства.

В то же время неравенство (1) получено из чисто геометрических соображений и тесно связано с геометрией, что позволяет сделать его наглядным.

При аналитической формулировке ряда геометрических соотношений часто оказывается, что соответствующие факты остаются справедливыми при замене тройки чисел на n чисел. Например, выведенное нами неравенство (1) может быть обобщено на 2n чисел (f1, f2, . . . , fn) и (g1, g2, . . . , gn). Это значит, что для любых 2n чисел (f1, f2, . . . , fn) и (g1, g2, . .. , gn) справедливо неравенство, аналогичное (1), а именно:

(1')

Это неравенство, частным случаем которого является неравенство (1), может быть доказано чисто аналитически1. Подобным образом обобщаются на n чисел многие другие соотношения между тройками чисел, полученные из аналитической геометрии. Такая связь соотношений между числами (количественных соотношений), примером которых является указанное выше неравенство, с геометрией становится особенно выпуклой, когда вводится понятие n-мерного пространства. Это понятие было введено в главе XVI. Мы здесь вкратце его повторим.

Совокупность n чисел (f1, f2, . . . , fn) называют точкой или вектором n-мерного пространства (мы чаще будем употреблять последнее название). Вектор (f1, f2, . . . , fn) будем в дальнейшем коротко обозначать одной буквой f.

Подобно тому, как в трехмерном пространстве при сложении векторов складываются их компоненты, сумма векторов

определяется как вектор

и обозначается

Произведение вектора

на число л есть вектор

Длина вектора

аналогично длине вектора

в трехмерном пространстве, определяется как

Угол φ между двумя векторами

в n-мерном пространстве задается своим косинусом, также совершенно аналогично тому, как определяется угол между векторами в трехмерном пространстве. Именно, он определяется формулой

(2)

Скалярным произведением двух векторов называется произведение длин этих векторов на косинус угла между ними. Таким образом, если

1 См. стр. 56—57.

2 То, что |cos φ| ⩽ 1, следует из неравенства (1').

f=(f1, f2, . . . , fn} и g = {g1, g2, . . . , gn} то, так как длины векторов равны соответственно их скалярное произведение, которое обозначается через (f, g), задается формулой

(3)

В частности, условием ортогональности (перпендикулярности) двух векторов является равенство cos φ = 0, т. е. (f, g) = 0.

При помощи формулы (3) читатель может убедиться, что скалярное произведение в n-мерном пространстве обладает следующими свойствами:

4. (f, f)⩾0, причем знак равенства имеет место, только при f=0.

т. е. когда f1=f2 = . .. =fn = 0.

Скалярное произведение вектора f самого на себя (f, f) равно квадрату длины вектора f.

Скалярное произведение оказывается очень удобным средством при изучении n-мерных пространств. Мы не будем здесь изучать геометрию n-мерного пространства, а ограничимся лишь одним примером.

В качестве такого примера рассмотрим в n-мерном пространстве теорему Пифагора: квадрат гипотенузы равен сумме квадратов катетов. Для этого выберем такое доказательство этой теоремы на плоскости, которое легко переносится на случай n-мерного пространства.

Пусть f и g— два перпендикулярных вектора на плоскости. Рассмотрим прямоугольный треугольник, построенный на векторах f и g (рис. 1). Гипотенуза этого треугольника равна по длине вектору f+-g. Запишем векторно теорему Пифагора в наших обозначениях. Так как квадрат длины вектора равен скалярному произведению вектора на себя, то в терминах скалярных произведений теорема Пифагора запишется так:

Рис. 1. Рис. 2.

Доказательство непосредственно следует из свойств скалярного произведения. Действительно,

а два средних слагаемых равны нулю в силу ортогональности векторов f и g.

В приведенном выше доказательстве мы пользовались лишь определением длины вектора, перпендикулярности векторов и свойствами скалярного произведения. Поэтому в доказательстве ничего не изменится, если мы предположим, что f и g — два ортогональных вектора n-мерного пространства. Тем самым теорема Пифагора доказана для прямоугольного треугольника в n-мерном пространстве.

Если задано три попарно ортогональных вектора в n-мерном пространстве f, g и h, то сумма этих векторов f+g+h является диагональю прямоугольного параллелепипеда, построенного на этих векторах (рис. 2), и имеет место равенство

которое означает, что квадрат длины диагонали параллелепипеда равен сумме квадратов длин его ребер. Доказательство этого утверждения, вполне аналогичное приведенному выше доказательству теоремы Пифагора, мы предоставляем читателю. Точно так же, если в n-мерном пространстве имеется к попарно ортогональных векторов f1, f2, . . . , fk, то столь же просто доказываемое равенство

означает, что квадрат длины диагонали «k-мерного параллелепипеда» в n-мерном пространстве также равен сумме квадратов длин его ребер.

§ 2. ГИЛЬБЕРТОВО ПРОСТРАНСТВО (БЕСКОНЕЧНОМЕРНОЕ ПРОСТРАНСТВО)

Связь с n-мерным пространством. Введение понятия n-мерного пространства оказалось полезным при изучении ряда вопросов математики и физики. В свою очередь это понятие дало толчок дальнейшему развитию понятия пространства и его приложению к различным областям математики. В развитии линейной алгебры и геометрии n-мерных пространств большую роль сыграли задачи о малых колебаниях упругих систем.

Рассмотрим следующий классический пример такой задачи (рис. 3). Пусть AB— гибкая нить, натянутая между точками А и В. Представим себе, что в некоторой точке С нити прикреплен грузик. Если вывести его из положения равновесия, он начнет колебаться с некоторой частотой ω, которую можно вычислить, зная силу натяжения нити,

Рис. 3.

массу m и положение груза. Положение системы в каждый момент времени задается при этом одним числом, а именно отклонением y1 массы m от положения равновесия нити.

Расположим теперь на нити AB n грузиков в точках C1, C2, . .. , Сn. Нить при этом будем считать невесомой. Это значит, что ее масса настолько мала, что по сравнению с массами грузиков мы можем пренебречь ею. Положение такой системы задается n числами y1, y2, . . . , yn, равными отклонениям грузиков от положения равновесия. Совокупность чисел y1, y2, . . . , yn можно (и это оказывается во многих отношениях полезным) считать вектором (y1, y2, . . . , yn) n-мерного пространства.

Само исследование малых колебаний, проведенное в таком изложении, оказывается тесно связанным с основными фактами геометрии n-мерных пространств. Укажем, например, что определение частот колебаний такой системы может быть сведено к задаче о нахождении осей некоторого эллипсоида в n-мерном пространстве.

Рассмотрим теперь задачу о малых колебаниях натянутой между точками А и В струны. При этом мы имеем в виду идеализированную струну, т. е. гибкую нить, обладающую конечной массой, непрерывно распределенной вдоль нити. В частности, под однородной струной понимается струна, плотность которой постоянна.

Так как масса распределена вдоль струны непрерывно, то положение струны уже нельзя задать конечным числом чисел y1, y2, . . . , yn, а нужно задать отклонение у(х) каждой точки х струны. Таким образом, положение струны в каждый момент времени задается некоторой функцией у(х).

Положение нити с n грузами, прикрепленными в точках с абсциссами x1, x2, . . . , xn, изображается графически ломаной линией с n звеньями (рис. 4). Если число грузов увеличится, то соответствующим образом увеличится число звеньев ломаной линии. Если число грузов неограниченно возрастает, а расстояние между соседними грузами стремится к нулю, то в пределе мы получим непрерывное распределение масс вдоль нити, т. е. идеализированную струну. Ломаная линия, изображающая положение нити с грузами, перейдет при этом в кривую, изображающую положение струны (рис. 5).

Рис. 4.

Рис. 5.

Мы видим, таким образом, что между задачами о колебании нити с грузами и о колебании струны существует тесная связь. В первой задаче положение системы задавалось точкой или вектором n-мерного пространства. Поэтому естественно функцию f(x), задающую положение колеблющейся струны во второй задаче, также рассматривать как вектор или точку некоторого, уже бесконечномерного пространства. К той же идее рассмотрения пространства, точками (векторами) которого являются функции f(x), заданные на некотором интервале, приводит целый ряд аналогичных задач1.

Рассмотренный выше пример задачи о колебаниях, к которому мы еще вернемся в § 4, подсказывает нам, как следует вводить основные понятия в бесконечномерном пространстве.

Гильбертово пространство. Мы рассмотрим здесь одно из наиболее распространенных и важных для приложений понятий бесконечномерного пространства, а именно понятие гильбертова пространства.

Вектор n-мерного пространства определялся как совокупность n чисел где i меняется от 1 до n. Аналогично, вектор бесконечномерного пространства определяется как функция f(x), где х меняется от а до b.

Сложение векторов и умножение вектора на число определяется как сложение функций и умножение функции на число.

Длина вектора f в n-мерном пространстве определялась формулой |/Σfi2. Так как для функций роль суммы играет интеграл, то длина вектора f(x) гильбертова пространства задается формулой

(5)

1 В качестве еще одной такой задачи рассмотрим электрические колебания, возникающие в цепочке связанных между собой электрических контуров (рис. 6).

Рис. 6.

Состояние такой цепочки выражается набором n чисел u1, u2, . . . , un, где ui — напряжение на конденсаторе i-го контура цепочки. Совокупность n чисел (u1, . . . , un) является вектором n-мерного пространства.

Представим себе теперь двуxnроводную линию, т. е. линию, состоящую из двух проводов, имеющих конечную емкость и индуктивность, распределенные вдоль линии. Электрическое состояние линии выражается некоторой функцией u (x), задающей распределение напряжения вдоль линии. Эта функция является вектором бесконечномерного пространства функций, заданных на интервале (а, b).

Расстояние между точками f и g в n-мерном пространстве определяется как длина вектора f — g, т. е. как

Аналогично «расстояние» между элементами f(t) и g(t) в функциональном пространстве равно

Выражение j [f(t) — g(t)]2dt называется средним квадратичным уклонением функций f (t) и g(t). Таким образом, за меру расстояния двух элементов гильбертова пространства принимается их среднее квадратичное уклонение.

Перейдем к определению угла между векторами. В n-мерном пространстве угол φ между векторами f = {fi} и g= {gi} определяется формулой

В бесконечномерном пространстве суммы заменяются соответствующими интегралами и угол φ между двумя векторами f и g гильбертова пространства будет определяться аналогичной формулой

(6)

Такое выражение можно считать косинусом некоторого угла φ, если стоящая справа дробь по абсолютной величине меньше единицы, т. е. если

(7)

Это неравенство действительно имеет место для любых двух функций f(t) и g(t). Оно играет важную роль в анализе и носит название неравенства Коши — Буняковского. Докажем его.

Пусть f(x) и g(x)— две функции, нетождественно равные нулю, заданные на интервале (а, b). Возьмем произвольные числа λ и μ и составим выражение

Так как функция [λf(x) — μg(x)]2, стоящая под знаком интеграла, неотрицательна, то имеет место неравенство

т. е.

Введем для краткости обозначения

(8)

В этих обозначениях неравенство перепишется следующим образом1:

(9)

Это неравенство остается справедливым для любых значений λ и μ; в частности, мы можем положить

(10)

Подставив эти значения λ и μ в неравенство (9), получаем

Заменяя А, В и С их выражениями по формуле (8), получаем окончательно неравенство Коши — Буняковского.

В геометрии скалярное произведение векторов определяется как произведение их длин на косинус угла между ними. Длины векторов f и g в нашем случае равны

1 Мы можем взять в качестве С модуль интеграла за счет произвольности в знаке λ или μ.

а косинус угла между ними определяется формулой

Перемножая эти выражения, мы приходим к следующей формуле для скалярного произведения двух векторов гильбертова пространства:

(11)

Из этой формулы видно, что скалярное произведение вектора f на себя есть квадрат его длины.

Если скалярное произведение ненулевых векторов f и g равно нулю, то это значит, что cosφ = 0, т. е. приписанный им нашим определением угол φ равен 90°. Поэтому функции f и g, для которых

называются ортогональными.

В гильбертовом пространстве, как и в n-мерном, справедлива теорема Пифагора (см. § 1). Пусть f1(x), f2(x), ..., fN(x) представляют собой N попарно ортогональных функций, а

их сумму. Тогда квадрат длины f равен сумме квадратов длин f1, f2, ..., fN.

Так как длины векторов в гильбертовом пространстве задаются при помощи интегралов, то теорема Пифагора в этом случае выражается формулой

(12)

Доказательство этой теоремы ничем не отличается от изложенного выше (§1) доказательства той же теоремы в n-мерном пространстве.

Мы не уточнили до сих пор, какие именно функции следует считать векторами гильбертова пространства. В качестве таких функций следует взять все функции, для которых имеет смысл интеграл ∫f2(x)dx. Казалось бы естественным ограничиться непрерывными функциями, для

которых ∫f2(x)dx заведомо всегда существует. Однако наибольшую законченность и естественность теория гильбертова пространства получает, если интеграл ∫ f2 (х) dx понимать в обобщенном смысле, а именно в смысле так называемого интеграла Лебега (см. главу XV).

Это расширение понятия интеграла (и соответственно — класса рассматриваемых функций) необходимо для функционального анализа так же, как для обоснования дифференциального и интегрального исчисления необходима строгая теория действительных чисел. Таким образом, созданное в начале XX в. в связи с развитием теории функций действительного переменного обобщение обычного понятия интеграла оказалось весьма существенным для функционального анализа и связанных с ним разделов математики.

§ 3. РАЗЛОЖЕНИЕ ПО ОРТОГОНАЛЬНЫМ СИСТЕМАМ ФУНКЦИЙ

Определение и примеры ортогональных систем функций. Если на плоскости выбрать какие-нибудь два взаимно перпендикулярных вектора e1 и e2 единичной длины (рис. 7), то произвольный вектор в той же плоскости можно разложить по направлениям этих двух векторов, т. е. представить его в виде

где а1 и a2 — числа, равные проекциям вектора f на направления осей e1 и e2. Так как проекция f на ось равна произведению длины f на косинус угла f с осью, то, вспоминая определение скалярного произведения, мы можем написать

Аналогично, если в трехмерном пространстве выбрать какие-нибудь три взаимно перпендикулярных вектора e1, e2, e3 единичной длины, то произвольный вектор f в этом пространстве можно представить в виде

где

Рис. 7.

В гильбертовом пространстве также можно рассматривать системы попарно ортогональных векторов этого пространства, т. е. функций

Такие системы функций называются ортогональными системами функций и играют большую роль в анализе. Они встречаются в самых различных вопросах математической физики, интегральных уравнений, приближенных вычислений, теории функций действительного переменного и т. п. Упорядочение и объединение понятий, относящихся к таким системам, были одним из стимулов, приведших в начале XX в. к созданию общего понятия гильбертова пространства. Дадим точные определения. Система функций

называется ортогональной, если любые две функции этой системы ортогональны между собой, т. е. если

(13)

В трехмерном пространстве мы требовали, чтобы длины векторов системы равнялись единице. Вспомнив определение длины вектора, мы видим, что в случае гильбертова пространства это требование записывается так:

(14)

Система функций, удовлетворяющая требованиям (13) и (14), называется ортогональной и нормированной.

Приведем примеры таких систем функций.

1. На интервале (—π, π) рассмотрим последовательность функций

Каждые две функции из этой последовательности ортогональны между собой. Это проверяется простым вычислением соответствующих интегралов. Квадрат длины вектора в гильбертовом пространстве есть интеграл от квадрата функции. Таким образом, квадраты длин векторов последовательности

суть интегралы

т. е. последовательность наших векторов ортогональна, но не нормирована. Длина первого вектора последовательности равна √2π, а все

остальные имеют длину √π. Поделив каждый вектор на его длину, мы получим ортогональную и нормированную систему тригонометрических функций

Эта система является исторически одним из первых и наиболее важных примеров ортогональных систем. Она возникла в работах Эйлера, Д. Бернулли, Даламбера в связи с задачей о колебаниях струны. Ее изучение сыграло существенную роль в развитии всего анализа1.

Появление ортогональной системы тригонометрических функций в связи с задачей о колебаниях струны не случайно. Каждая задача о малых колебаниях среды приводит к некоторой системе ортогональных функций, описывающих так называемые собственные колебания данной системы (см. § 4). Например, в связи с задачей о колебаниях сферы появляются так называемые сферические функции, в связи с задачей о колебаниях круглой мембраны или цилиндра появляются так называемые цилиндрические функции и т. д.

2. Можно привести пример ортогональной системы функций, каждая функция которой является многочленом. Таким примером является последовательность многочленов Лежандра

т. е. Рп(х) есть (с точностью до постоянного множителя) производная n-го порядка от (x2—l)n. Выпишем первые несколько многочленов этой последовательности:

Очевидно, что вообще Pn(х) есть многочлен я-й степени. Мы предоставляем читателю самому убедиться, что эти многочлены представляют собой ортогональную последовательность на интервале (—1, 1).

Общую теорию ортогональных многочленов (так называемые ортогональные многочлены с весом) развил замечательный русский математик П. Л. Чебышев во второй половине XIX в.

Разложение по ортогональным системам функций. Подобно тому как в трехмерном пространстве каждый вектор можно представить

1 См. главу XII (том 2), § 1.

в виде линейной комбинации трех попарно ортогональных векторов e1, e2, e3 единичной длины

в функциональном пространстве возникает задача о разложении произвольной функции f в ряд по ортогональной и нормированной системе функций, т. е. о представлении функции f в виде

(15)

При этом сходимость ряда (15) к функции f понимается в смысле расстояния между элементами в гильбертовом пространстве. Это значит, что среднее квадратичное уклонение частичной суммы ряда Sn (t) = от функции f(t) стремится к нулю при x→∞, т. е.

(16)

Такая сходимость называется обычно «сходимостью в среднем».

Разложения по тем или иным системам ортогональных функций часто встречаются в анализе и являются важным методом для решения задач математической физики. Так, например, если ортогональная система есть система тригонометрических функций на интервале

то такое разложение есть классическое разложение функции в тригонометрический ряд1

Предположим, что разложение (15) возможно для любой функции f из гильбертова пространства, и найдем коэффициенты an такого разложения. Для этого умножим обе части равенства скалярно на одну и ту же функцию φm нашей системы. Мы получим равенство

из которого в силу того, что (φm, φn) = 0 при m≠n и (φm, φm) = 1, определяется значение коэффициента am

Мы видим, что, как и в обычном трехмерном пространстве (см. начало этого параграфа), коэффициенты am равны проекциям вектора f на направления векторов φk.

1 Такое разложение часто встречается в различных вопросах физики при разложении колебаний на гармонические составляющие. См. главу VI (том 2), § 5.

Вспоминая определение скалярного произведения, получаем, что коэффициенты разложения функции f (х) по ортогональной и нормированной системе функций φ1(х), φ2(x), ..., φn(x), ...

(17)

определяются по формулам

(18)

В качестве примера рассмотрим ортогональную нормированную тригонометрическую систему функций, приведенную выше:

Тогда где

Мы получили формулу для вычисления коэффициентов разложения функции в тригонометрический ряд в предположении, конечно, что это разложение возможно1.

Мы установили вид коэффициентов разложения (18) функции f(x) по ортогональной системе функций в предположении, что такое разложение имеет место. Однако бесконечная ортогональная система функций φ1, φ2, . .., φn, ... может оказаться недостаточной для того, чтобы по ней можно было разложить любую функцию из гильбертова пространства. Чтобы такое разложение было возможно, система ортогональных функций должна удовлетворять дополнительному условию — так называемому условию полноты.

Ортогональная система функций называется полной, если к ней нельзя добавить ни одной, не равной тождественно нулю функции, ортогональной ко всем функциям системы.

Легко привести пример неполной ортогональной системы. Для этого возьмем какую-нибудь ортогональную систему, например ту же

1 О тригонометрических рядах см. также главу XII (том 2), § 7.

систему тригонометрических функций, и исключим одну из функций этой системы, например cos x. Оставшаяся бесконечная система функций

будет попрежнему ортогональной, но, конечно, не будет полной, так как исключенная нами функция cos х ортогональна ко всем функциям системы.

Если система функций не полна, то не всякую функцию из гильбертова пространства можно по ней разложить. Действительно, если мы попытаемся разложить по такой системе нулевую функцию f0(x), ортогональную ко всем функциям системы, то, в силу формул (18), все коэффициенты окажутся равными нулю, в то время как функция f0(x) не равна нулю.

Имеет место следующая теорема: если задана полная ортогональная и нормированная система функций в гильбертовом пространстве φ1(х), φ2(x), ..., φn(x), ..., то всякую функцию f(х) можно разложить в ряд по функциям этой системы1

При этом коэффициенты an разложения равны проекциям векторов f на элементы ортогональной нормированной системы

Имеющаяся в § 2 теорема Пифагора в гильбертовом пространстве позволяет найти интересное соотношение между коэффициентами ak и функцией f (х). Обозначим через rn(х) разность между f (х) и суммой первых n членов ее ряда, т. е.

Функция rn(х) ортогональна к φ1(х), φ2(x), ..., φn(x). Действительно, проверим, что она ортогональна к φ1(х), т. е. что

Мы имеем

1 Этот ряд относится к своей сумме в том смысле, как это было определено формулой (16).

2 Остальные интегралы равны нулю, так как функции φk(х) ортогональны между собой.

Так как

то отсюда следует, что

Итак, в равенстве

(19)

отдельные слагаемые правой части ортогональны между собой. Значит, в силу теоремы Пифагора, сформулированной в § 2, квадрат длины вектора f (х) равен сумме квадратов длин слагаемых правой части равенства (19), т. е.

Так как система функций φ1, φ2, . .., φn нормирована [равенство (14)], то

(20)

Ряд

сходится в среднем. Это значит, что

т. е. что

Но тогда из формулы (20) мы получаем равенство

(21)

утверждающее, что интеграл квадрата функции равен сумме квадратов коэффициентов ее разложения по замкнутой ортогональной системе функций. Условие (21), если оно имеет место для любой функции из гильбертова пространства, называется условием полноты.

Обратим внимание еще на следующее важное обстоятельство. Какие числа аk могут служить коэффициентами разложения функции из гильбертова пространства?

Равенство (21) утверждает, что для этого должен сходиться ряд Σak2. Оказывается, что этого условия достаточно, т. е. для того, чтобы последовательность

1 Геометрически это значит, что квадрат длины вектора гильбертова пространства равен сумме квадратов его проекций на полную систему взаимно ортогональных направлений.

чисел ak была последовательностью коэффициентов разложения по ортогональной системе функций из гильбертова пространства, необходимо и достаточно, чтобы сходился ряд Σak2.

Заметим, что эта существенная теорема имеет место, если определить гильбертово пространство как совокупность всех функций с интегрируемым квадратом в смысле Лебега (см. § 2, стр. 223). Если в гильбертовом пространстве ограничиться только, например, непрерывными функциями, то решение вопроса о том, какие числа ak могут служить коэффициентами разложения, было бы ненужным образом весьма усложнено.

Приведенные здесь соображения являются лишь одной из причин, приведших к необходимости использовать при определении гильбертова пространства интегралы в обобщенном (по Лебегу) смысле.

§ 4. ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ

В этом параграфе мы познакомим читателя с одним из важных и исторически одним из первых разделов функционального анализа, а именно с теорией интегральных уравнений, сыгравших также существенную роль в дальнейшем развитии функционального анализа. В развитии теории интегральных уравнений, кроме внутренних потребностей математики [например, краевые задачи для уравнений в частных производных (том 2, глава VI)], имели большое значение различные задачи физики. Наряду с дифференциальными уравнениями в XX в. интегральные уравнения являются одним из важных средств математического изучения различных вопросов физики. В этом параграфе мы изложим некоторые сведения из теории интегральных уравнений. Те факты, которые мы здесь изложим, тесно связаны и в значительной степени возникли (прямо или косвенно) в связи с изучением малых колебаний упругих систем.

Задача о малых колебаниях упругих систем. Вернемся к рассмотренной в § 2 задаче о малых колебаниях. Найдем уравнения, описывающие такие колебания. Для простоты предположим, что мы имеем дело с колебаниями линейной упругой системы. Примерами таких систем могут служить, скажем, струна длины l (рис. 8) или упругий стержень (рис. 9). Предположим, что в положении равновесия наша упругая система расположена по отрезку Ol оси Ох. Приложим в точке х единичную силу. Под действием этой силы все точки системы получат некоторое отклонение. Отклонение, возникшее в точке у (рис. 8), обозначим через к(х, у).

Функция к (х, у) является функцией двух точек: точки х, в которой приложена сила, и точки у, в которой мы измеряем отклонение. Она называется функцией влияния.

Из закона сохранения энергии можно вывести важное свойство функции влияния к (x, y), а именно так называемый закон взаимности: отклонение, возникающее в точке у под действием силы, приложенной

в точке х, равно отклонению, возникающему в точке х под действием той же силы, приложенной в точке у. Другими словами, это значит, что

(22)

Найдем, например, функцию влияния для продольных колебаний упругого стержня (на рис. 8 изображались другие, поперечные, смещения). Рассмотрим стержень AB длины l, закрепленный на концах (рис. 9). Приложим в точке С силу l, действующую в направлении В. Под действием этой силы стержень деформируется и точка С сместится в положение С. Величину смещения точки С обозначим через h. Найдем сначала h. При помощи h мы сможем затем найти смещение в любой точке у. Для этого воспользуемся законом Гука, утверждающим, что сила пропорциональна относительному растяжению (т. е. отношению величины смещения к длине). Аналогичное соотношение имеет место и при сжатии.

Под действием силы l часть стержня АС растягивается. Возникающую при этом силу реакции обозначим через T1. В то же время часть стержня СВ сжимается, порождая силу реакции Т2. В силу закона Гука

где X — коэффициент пропорциональности, характеризующий упругие свойства стержня. Условие равновесия сил, действующих на точку С, дает нам

Отсюда

Для того чтобы найти смещение, возникающее в некоторой точке у, лежащей на отрезке АС, т. е. при у<х, заметим, что из закона Гука следует, что при растяжении стержня относительное растяжение (т. е. отношение смещения точки к расстоянию ее от неподвижного конца)

Рис. 8.

Рис. 9.

не зависит от положения точки. Обозначим смещение точки у через к. Тогда, приравняв относительные смещения в точках х и у, получаем

отсюда

Аналогично, если точка лежит на отрезке СВ (у > х), получаем

Вспоминая, что функция влияния к у) есть отклонение в точке у под действием единичной силы, приложенной в точке х, получаем, что для продольных колебаний упругого стержня функция влияния имеет вид

Можно было бы более или менее подобным образом найти функцию влияния для струны. Если натяжение струны Т, а длина l, то под действием единичной силы, приложенной к точке х, струна приобретает форму, изображенную на рис. 8, и смещение к(х, у) в точке у задается формулой

совпадающей с выведенной нами функцией влияния для стержня.

Через функцию влияния можно выразить отклонение системы от положения равновесия для того случая, когда на нее действует непрерывно распределенная сила с плотностью f(y). Так как на интервал длины Δy действует сила f(y)Δу, которую мы приближенно можем считать сосредоточенной в точке у, то под действием этой силы в точке х возникает отклонение к(х, у) f(y) Δy. Отклонение под действием всей нагрузки будет приближенно равно сумме

Переходя к пределу при Δy→0, получаем, что отклонение u (x) в точке X под действием силы f(y), распределенной вдоль системы, задается формулой

(23)

Предположим, что наша упругая система не подвержена действию внешних сил. Если вывести ее из положения равновесия, то она придет в движение. Эти движения называются свободными колебаниями системы.

Напишем теперь при помощи функции влияния к (х, у) уравнение, которому подчиняются свободные колебания рассматриваемой упругой системы. Для этого обозначим через u (x, t) отклонение от положения равновесия в точке х в момент времени t. Тогда ускорение в точке х в момент t равно —.

Если р — линейная плотность тела, т. е. ρdy — масса элемента длины dy, то по основному закону механики мы получим уравнение движения, заменив в формуле (23) силу f(y)dy произведением массы на ускорение —, взятым с обратным знаком.

Таким образом, уравнение свободных колебаний имеет вид

Важную роль в теории колебаний играют так называемые гармонические колебания упругой системы, т. е. движения, при которых

Они характеризуются тем, что каждая фиксированная точка совершает гармонические колебания (движется по синусоидальному закону) с некоторой частотой о, причем эта частота одна и та же для всех точек х.

Мы увидим дальше, что каждое свободное колебание может быть составлено из гармонических колебаний.

Подставим

в уравнение свободных колебаний и сократим на sinωt. Мы получим тогда следующее уравнение для определения функции u (x)

(24)

Такое уравнение называется однородным интегральным уравнением относительно функции u (x).

Ясно, что уравнение (24) при любом ω имеет неинтересное для нас решение u(x) = 0, отвечающее состоянию покоя. Те значения ω, при которых имеются отличные от нуля решения уравнения (24), называются собственными частотами системы.

Так как не при всяком значении ω имеются отличные от нуля решения, система может совершать свободные колебания лишь с определенными частотами. Наименьшая из них называется основным тоном системы, а остальные — обертонами.

Оказывается, что у каждой системы существует бесконечная последовательность собственных частот, так называемый спектр частот

Ненулевое решение un(х) уравнения (24), отвечающее собственной частоте ωn, задает нам форму соответствующего собственного колебания.

Так, например, если упругая система представляет собой струну, натянутую между точками О и l и закрепленную в этих точках, то возможные частоты собственных колебаний для такой системы равны

где а — коэффициент, зависящий от плотности и натяжения струны, а именно а — ⋅ Основным тоном является здесь ω1 = а обер-

Рис. 10.

тонами ω2 = 2ω1, ω3 = 3ω1, ..., ωn = nω1. Формы соответствующих гармонических колебаний задаются равенствами

и имеют вид, изображенный для n=1, 2, 3, 4 на рис. 10.

Мы рассматривали свободные колебания упругих систем. Если же во время движения на упругую систему действует гармоническая внешняя сила, то, определяя гармонические колебания под действием этой силы, мы придем для функции u (x) к так называемому неоднородному интегральному уравнению

(25)

Свойства интегральных уравнений. Выше мы познакомились с примерами интегральных уравнений

(26) (27)

из которых первое получилось при решении задачи о свободных колебаниях упругой системы, а второе — при рассмотрении вынужденных колебаний, т. е. колебаний под воздействием внешней силы.

Неизвестной функцией в этих уравнениях является функция f(x). Заданная функция к(х, у) называется ядром интегрального уравнения.

Уравнение (27) называется неоднородным линейным интегральным уравнением, а уравнение (26) — однородным. Оно получается из неоднородного при h(x) = 0.

Ясно, что однородное уравнение всегда имеет нулевое решение, т. е. решение f(x) = 0. Между решениями неоднородного и однородного интегральных уравнений существует тесная связь. Укажем для примера на следующую теорему: если однородное интегральное уравнение имеет лишь нулевое решение, то соответствующее неоднородное уравнение разрешимо для всякой функции k(x).

Если для некоторого значения X однородное уравнение имеет решение f(x), не равное тождественно нулю, то это значение λ называется собственным значением, а соответствующее решение f(x) — собственной функцией. Мы видели выше, что когда интегральное уравнение описывает свободное колебание упругой системы, то собственные значения тесно связаны с частотами колебаний системы (а именно λ = ρω2). Собственные же функции задают форму соответствующих гармонических колебаний.

Для задачи о колебаниях из закона сохранения энергии следовало, что

(28)

Ядро, удовлетворяющее условию (28), называется симметрическим.

Для уравнения с симметрическим ядром собственные функции и собственные значения обладают рядом важных свойств. Оказывается, что у такого уравнения всегда существует последовательность действительных собственных значений

Каждому собственному значению отвечает одна или несколько собственных функций. При этом собственные функции, отвечающие различным собственным значениям, всегда ортогональны между собою1.

Таким образом, для всякого интегрального уравнения с симметрическим ядром система собственных функций есть ортогональная система функций. Возникает вопрос о том, когда эта система полна, т. е. когда можно всякую функцию из гильбертова пространства разложить в ряд по системе собственных функций интегрального уравнения. В частности, если уравнение

(29)

удовлетворяется лишь при f(y) = 0, то система собственных функций интегрального уравнения

является полной ортогональной системой2.

Таким образом, всякую функцию f(x) с интегрируемым квадратом можно в этом случае разложить в ряд по собственным функциям. Рассматривая те или иные интегральные уравнения, мы получаем общий

1 Это последнее утверждение будет доказано в следующем параграфе (стр. 243).

2 В том случае, когда к (х, у) есть функция влияния для упругой системы, условие (29) приобретает простой физический смысл. В самом деле [см. формулу (23)], мы видели, что под действием распределенной вдоль системы силы f (у) отклонение системы от положения равновесия выражается формулой

Таким образом, условие (29) означает, что всякая отличная от нуля сила выводит систему из положения равновесия.

и сильный метод для доказательства замкнутости различных важных ортогональных систем, т. е. разложимости функций в ряд по ортогональным функциям. Этим методом можно доказать полноту системы тригонометрических функций, цилиндрических функций, сферических функций и многих других важных систем функций.

То обстоятельство, что произвольную функцию можно разложить в ряд по собственным функциям, в случае колебаний означает, что любое колебание может быть разложено на сумму гармонических. Такое разложение представляет собой метод, широко применяемый при решении задач о колебаниях в различных областях механики и физики (колебания упругих тел, акустические колебания, электромагнитные волны и т. д.).

Развитие теории линейных интегральных уравнений явилось толчком для создания общей теории линейных операторов, в которую теория линейных интегральных уравнений органически входит. В последние несколько десятилетий общие методы теории линейных операторов сильно способствовали дальнейшему развитию теории интегральных уравнений.

§ 5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ И ДАЛЬНЕЙШЕЕ РАЗВИТИЕ ФУНКЦИОНАЛЬНОГО АНАЛИЗА

В предыдущем параграфе мы видели, что задачи о колебаниях упругой системы приводятся к вопросу о разыскании собственных значений и собственных функций интегральных уравнений. Заметим, что эти задачи можно также свести к отысканию собственных значений и собственных функций линейных дифференциальных уравнений1. К задачам вычисления собственных значений и собственных функций линейных дифференциальных или интегральных уравнений сводятся и многие другие физические задачи.

Укажем еще один пример. В современной радиотехнике широко используются для передачи электромагнитных колебаний высоких частот так называемые волноводы, т. е. полые металлические трубы, внутри которых распространяются электромагнитные волны. Известно, что по волноводам могут распространяться электромагнитные колебания не слишком большой длины волны. Отыскание критической длины волны сводится к задаче на собственные значения некоторого дифференциального уравнения.

Кроме того, задачи на собственные значения встречаются в линейной алгебре, в теории обыкновенных дифференциальных уравнений, в задачах на устойчивость и т. д.

Возникла необходимость в рассмотрении всех этих сходных между собой вопросов с единой общей точки зрения. Такой точкой зрения

1 См. том 2, главу VI, § 5.

явилась общая теория линейных операторов. Многие вопросы, относящиеся к собственным функциям и собственным значениям в различных конкретных задачах, удалось понять до конца только в свете общей теории операторов. Таким образом, в этом и ряде других направлений общая теория операторов сама оказалась весьма плодотворным орудием исследования в породивших ее областях.

В дальнейшем развитии теории операторов существеннейшим этапом явилась квантовая механика, широко использующая методы теории операторов. Основным математическим аппаратом квантовой механики и является теория так называемых самосопряженных операторов. Постановка математических задач, возникающих в квантовой механике, явилась и является важнейшим стимулом для дальнейшего развития функционального анализа.

Операторная точка зрения на дифференциальные и интегральные уравнения оказалась чрезвычайно полезной также для развития практических приближенных методов решения этих уравнений.

Основные понятия теории операторов. Перейдем к изложению основных определений и фактов, относящихся к теории операторов.

В анализе мы уже встречались с понятием функции. В простейшем виде это было соответствие, которое каждому числу х (значению независимой переменной) ставило в соответствие число у (значение функции). При дальнейшем развитии анализа возникла потребность в рассмотрении соответствий более общего типа.

Такие более общие соответствия рассматриваются, например, в вариационном исчислении (том 2, глава VIII), где каждой функции сопоставляется число. Если каждой функции ставится в соответствие число, то мы говорим, что нам задан функционал. Примером функционала может служить сопоставление каждой функции y=f(x) (а⩽х⩽b) длины дуги изображаемой ею кривой. Мы получим другой пример функционала, если каждой функции y = f(x) (a⩽x⩽b) поставим в соответствие ее определенный интеграл ∫f(x)dx.

Если считать f(x) точкой бесконечномерного пространства, то функционал есть не что иное, как функция от точки бесконечномерного пространства. С этой точки зрения в вариационном исчислении изучаются задачи об отыскании максимумов и минимумов функции от точки бесконечномерного пространства.

Для того чтобы определить, что означает непрерывный функционал, нужно определить, что означает близость двух точек бесконечномерного пространства. В § 2 мы задавали расстояние между двумя функциями [точками бесконечномерного пространства f(x) и g(x)] как

Такой способ задания расстояния в бесконечно-

мерном пространстве часто употребляется, но не является, конечно, единственно возможным. В других вопросах могут оказаться лучшими другие способы задания расстояния между функциями. Укажем, например, на задачи теории приближения функций (см. том 2, главу XII, § 3), где расстояние между функциями, характеризующее меру близости двух функций f(x) и g(x), задается, например, формулой

Другие способы задания расстояния между функциями употребляются при изучении функционалов в вариационном исчислении.

Различные способы задания расстояния между функциями приводят нас к различным бесконечномерным пространствам.

Таким образом, разные бесконечномерные (функциональные) пространства различаются между собой запасом функций и определением расстояния между ними. Так, например, если взять совокупность всех функций с интегрируемым квадратом и определить расстояние как

то мы придем к введенному в § 2 гильбертову пространству; если же взять совокупность всех непрерывных функций и определить расстояние как max|f(x) — g(x)|, то мы получим так называемое пространство (С).

При рассмотрении интегральных уравнений мы сталкиваемся с выражениями вида

При заданном ядре к (х, у) написанное равенство указывает закон, по которому каждой функции f(x) ставится в соответствие другая функция g (х).

Такого рода соответствие, относящее одной функции f другую функцию g, называется оператором.

Будем говорить, что нам задан линейный оператор А в гильбертовом пространстве, если дан закон, по которому каждой функции f ставится в соответствие функция g. Соответствие может быть задано и не для всех функций гильбертова пространства. В этом случае множество тех функций f, для которых существует функция g = Af, называется областью определения оператора А (аналогично области задания функции в обычном анализе). Само соответствие обозначается обычно так:

g = Af. (30)

Линейность оператора означает, что сумме функций f1 и f2 ставится в соответствие сумма Af1 и Л/2, а произведению функции f на число λ ставится в соответствие функция λAf, т. е.

(31) (32)

Иногда от линейных операторов требуют также непрерывности, т. е. требуют, чтобы при сходимости последовательности функций fn к функции f последовательность Afn сходилась к функции Af.

Приведем примеры линейных операторов.

1°. Поставим в соответствие каждой функции f(x) функцию g(x) = ∫f(t)dt, т. е. неопределенный интеграл от функции f. Линейность этого оператора вытекает из обычных свойств интеграла, т. е. из того, что интеграл от суммы равен сумме интегралов и постоянный множитель можно выносить за знак интеграла.

2°. Поставим в соответствие каждой дифференцируемой функции f (х) ее производную f (х). Этот оператор обозначается обычно буквой D, т. е.

Заметим, что этот оператор определен не для всех функций из гильбертова пространства, а только для функций, имеющих производную, и притом принадлежащую гильбертову пространству. Эти функции составляют, как уже сказано, область определения данного оператора.

3°. Примеры 1° и 2° были примерами линейных операторов в бесконечномерном пространстве. С примерами линейных операторов в конечномерных пространствах мы встречались в других главах этой книги. Так, в главе III (том 1) изучались аффинные преобразования. Если аффинное преобразование плоскости или пространства оставляет начало координат на месте, то оно является примером линейного оператора в двумерном, соответственно трехмерном, пространстве. В главе XVI вводились линейные преобразования n-мерного пространства, являющиеся линейными операторами в n-мерном пространстве.

4°. В интегральных уравнениях мы уже по существу встречались с весьма важным и имеющим широкое применение в анализе классом линейных операторов в функциональном пространстве — так называемыми интегральными операторами. Зададим некоторую определенную функцию к (х, у). Тогда формула

ставит в соответствие каждой функции f некоторую функцию g. Символически мы можем это преобразование записать следующим образом:

g=Af.

Оператор А называется в этом случае интегральным оператором. Можно было бы привести еще много важных примеров интегральных операторов.

В § 4 мы говорили о неоднородном интегральном уравнении

В обозначениях теории операторов это уравнение перепишется так:

(33)

где λ — заданное число, h — заданная функция (вектор бесконечного пространства), f — искомая функция. Однородное уравнение в тех же обозначениях переписывается следующим образом:

f=λAf. (34)

Классические теоремы об интегральных уравнениях, как, например, сформулированная в § 4 теорема о связи между разрешимостью неоднородного и соответствующего однородного интегральных уравнений, справедливы не для всякого операторного уравнения. Однако можно указать некоторые общие условия, накладываемые на оператор А, при которых эти теоремы верны.

Эти условия формулируются в топологических терминах и состоят в том, чтобы оператор А переводил единичную сферу (т. е. совокупность векторов, длины которых не превосходят единицы) в компактное множество.

Собственные значения и собственные векторы операторов. Задача о собственных значениях и собственных функциях интегрального уравнения, к которой нас привели задачи о колебаниях, формулировалась следующим образом: найти значения X, при которых имеются отличные от нуля функции f, удовлетворяющие уравнению

Как и ранее, это уравнение может быть переписано так:

или

(35)

Будем теперь понимать под А произвольный линейный оператор. Тогда вектор f, удовлетворяющий равенству (35), называется собственным вектором оператора А, а число 1/λ соответствующим собственным значением.

Так как вектор 1/λ f по направлению совпадает с вектором f (отличается от f лишь численным множителем), то задача разыскания собственных векторов может быть еще сформулирована как задача о разыскании ненулевых векторов f, не меняющих своего направления при преобразовании А.

Такая точка зрения на проблему о собственных значениях позволяет объединить задачу о собственных значениях интегральных уравнений (если А — интегральный оператор), дифференциальных уравнений (если А — дифференциальный оператор) и задачу о собственных значениях в линейной алгебре [если А является линейным преобразованием в конечномерном пространстве; см. главу VI (том 2) и главу XVI]. Для случая трехмерного пространства эта проблема встречается при отыскании так называемых главных осей эллипсоида.

В случае интегральных уравнений ряд важных свойств собственных функций и собственных значений (например, вещественность собственных значений, ортогональность собственных функций и т. д.) является следствием симметричности ядра, т. е. равенства к (х, у) = к(у, х).

Для произвольного линейного оператора А в гильбертовом пространстве аналогом этого свойства является так называемая самосопряженность оператора.

Условие самосопряженности оператора А в общем случае заключается в том, что для любых двух элементов f1 и f2 имеет место равенство

(Af1, f2) = (f1, Af2),

где (Af1, f2) означает скалярное произведение вектора Af1 на вектор f2.

Требование самосопряженности оператора в задачах механики является обычно следствием закона сохранения энергии. Поэтому оно удовлетворяется для операторов, связанных, например, с колебаниями, при которых не имеет места потеря (диссипация) энергии.

Большинство операторов, встречающихся в квантовой механике, также являются самосопряженными.

Проверим, что интегральный оператор с симметрическим ядром к (x, у) является самосопряженным. Действительно, в этом случае Af1 есть функция ∫ k (x, y)f1(y)dy. Поэтому скалярное произведение (Af1, f2), равное интегралу от произведения этой функции на f2, задается формулой

Аналогично

Равенство (Af1, f2) = (f1, Af2) есть непосредственное следствие симметричности ядра к(х, у).

Произвольные самосопряженные операторы обладают рядом важнейших свойств, полезных при применении этих операторов к решению разного рода задач. Именно оказывается, что собственные значения самосопряженного линейного оператора всегда действительны и собственные функции, отвечающие различным собственным значениям, ортогональны между собой.

Докажем, например, последнее утверждение. Пусть λ1 и λ2 — два различных собственных значения оператора A, a f1 и f2 — соответствующие им собственные векторы. Это значит, что

(36)

Умножим скалярно первое из равенств (36) на f2, а второе — на f1. Мы имеем

(37)

Так как оператор А самосопряженный, то (Af1, f2) = (Af2, f1). Вычитая из первого равенства (37) второе, получаем

Так как λ1≠λ2, то (f1, f2) = 0, т. е. собственные векторы f1 и f2 ортогональны.

Исследование самосопряженных операторов внесло ясность во многие конкретные вопросы и задачи, связанные с теорией собственных значений.

Остановимся подробнее на одной из них, а именно на задаче о разложении по собственным функциям в случае непрерывного спектра.

Чтобы пояснить, что значит непрерывный спектр, обратимся снова к классическому примеру колебаний струны. Мы указывали выше, что для струны длины l собственные частоты колебаний могут принимать последовательность значений

Отложим на числовой оси Оλ точки этой последовательности. Если увеличивать длину струны l, то расстояние между любыми двумя соседними точками последовательности будет уменьшаться, и они будут всё более плотно заполнять числовую ось. В предельном случае, когда l→∞, т. е. для бесконечной струны, собственные частоты заполнят числовую полуось λ⩾0. В этом случае говорят, что система имеет непрерывный спектр.

Мы уже говорили, что разложение в ряд по собственным функциям для струны длины l есть разложение в ряд по синусам и косинусам nπ/lx т. е. в тригонометрический ряд

Для случая бесконечной струны снова можно показать, что более или менее произвольную функцию можно разложить по синусам и косинусам. Однако, поскольку собственные частоты распределены теперь по числовой прямой непрерывно, это разложение будет не разложением в ряд, а разложением в так называемый интеграл Фурье

Разложение в интеграл Фурье было давно известно и широко использовалось уже в XIX в. при решении различных задач математической физики.

Однако в более общих задачах с непрерывным спектром1 многие вопросы, относящиеся к разложению функций по собственным функциям, не были выяснены. Только создание общей теории самосопряженных операторов внесло необходимую ясность в эти вопросы.

Отметим еще один круг классических задач, получивших свое разрешение на основе общей теории операторов. К этим задачам относится рассмотрение колебаний при наличии диссипации (рассеяния) энергии.

В этом случае мы снова можем искать свободные колебания системы в виде u(x)φ(t). Однако, в отличие от случая колебаний без диссипации энергии, функция φ(t) не есть просто cosωt, а имеет вид e-ktcosωt, где к>0. Таким образом, соответствующее решение имеет вид u (x) e-kt cos ωt. Каждая точка х в этом случае снова совершает колебания (с частотой со), однако колебания являются затухающими, так как

1 Примерами могут служить колебания неоднородной упругой среды, а также многие задачи квантовой механики.

при t → ∞ амплитуда этих колебаний, содержащая множителем е-kt, стремится к нулю.

Удобно записывать собственные колебания системы в комплексной форме: u(x)e-iλt, где при отсутствии трения число λ действительно, а при наличии трения комплексно.

Задача о колебаниях системы с диссипацией энергии опять приводит к задаче о собственных значениях, но уже не для самосопряженных операторов. Для них характерно наличие комплексных собственных значений, свидетельствующих о затухании свободных колебаний.

Используя методы теории операторов в соединении с методами теории аналитических функций, М. В. Келдыш в 1950—1951 гг. изучил этот класс задач, доказав для него полноту системы собственных функций.

Связь функционального анализа с другими разделами математики и квантовой механикой. Мы уже упоминали выше, что создание квантовой механики явилось решающим моментом в развитии функционального анализа.

Так же, как возникновение дифференциального и интегрального исчисления в XVIII в. диктовалось потребностями механики и классической физики, развитие функционального анализа происходило и происходит под сильнейшим влиянием современной физики, главным образом квантовой механики. Основным математическим аппаратом квантовой механики являются разделы математики, относящиеся по существу к функциональному анализу. Мы лишь вкратце укажем на имеющиеся здесь связи, поскольку изложение основ квантовой механики выходит за рамки этой книги.

В квантовой механике состояние системы задается при ее математическом описании вектором гильбертова пространства. Такие величины, как энергия, импульс, момент количества движения, исследуются с помощью самосопряженных операторов. Например, возможные энергетические уровни электрона в атоме вычисляются как собственные значения оператора энергии. Разности этих собственных значений дают частоты излучаемого атомом света, определяя, таким образом, структуру спектра излучения данного вещества. Соответствующие состояния электрона описываются при этом как собственные функции оператора энергии.

Решение задач квантовой механики часто требует вычисления собственных значений различных (обычно дифференциальных) операторов. В сколько-нибудь сложных случаях точное решение этих задач оказывается практически невозможным. Для приближенного решения этих задач широко используется так называемая теория возмущений, позволяющая по уже известным собственным значениям и функциям некоторого самосопряженного оператора А находить собственные значения

мало отличающегося от него оператора A1. Отметим, что теория возмущений далека от полного математического обоснования, которое является интересной и важной математической проблемой.

Независимо от приближенного определения собственных значений часто можно много сказать о данной задаче при помощи качественного исследования. Это исследование в задачах квантовой механики проводится на основе имеющихся в данной задаче симметрий. Примерами таких симметрий могут служить свойства симметрии кристаллов, сферическая симметрия в атоме, симметрия относительно отражений и др. Так как симметрии образуют группу (см. главу XX), то групповые методы (так называемая теория представлений групп) дают возможность ответить без вычислений на ряд вопросов. Укажем, например, на классификацию атомных спектров, ядерные превращения и другие вопросы.

Таким образом, квантовая механика широко использует математический аппарат теории самосопряженных операторов. В то же время продолжающееся в настоящее время развитие квантовой механики приводит к дальнейшему развитию теории операторов, ставя перед этой теорией новые задачи.

Влияние квантовой механики, а также и внутриматематическое развитие функционального анализа, привело к тому, что в последние годы алгебраические проблемы и методы стали играть значительную роль в функциональном анализе. Это усиление алгебраических тенденций в современном анализе не лишне сопоставить с возросшим значением алгебраических методов в современной теоретической физике по сравнению с методами физики XIX в.

В заключение подчеркнем еще раз, что функциональный анализ является одним из интенсивно развивающихся разделов современной математики. Его связи и применения в современной физике, дифференциальных уравнениях, приближенных вычислениях и использование общих методов, выработанных в алгебре, топологии, теории функций действительного переменного и т. п. делают функциональный анализ одним из основных узлов современной математики.

ЛИТЕРАТУРА

Университетские учебники

Колмогоров А. Н. и Фомин С. В. Элементы теории функций и функционального анализа, вып. 1. Метрические и нормированные пространства. Изд-во МГУ, 1954.

Курант Р. и Гильберт Д. Методы математической физики, т. I. Гостехиздат, 1951.

В книге, наряду с другим материалом, изложены связи теории колебаний с теорией собственных значений.

Люстерник Л. А. и Соболев В. И. Элементы функционального анализа. Гостехиздат, 1951.

Рисс Ф. и Секефальви-Надь Б. Лекции по функциональному анализу. ИЛ, 1954.

Книга, требующая от читателя значительной математической подготовки.

Шилов Г. Е. Введение в теорию линейных пространств. Изд. 2, Гостехиздат, 1956.

Для чтения этой книги достаточно знания основ анализа и аналитической геометрии.

Литература, относящаяся к вопросам, затронутым в конце главы

Ван дер Варден Б. Метод теории групп в квантовой механике. Харьков, 1938.

Гельфанд И. М. и Шапиро З. Я. Представления группы вращений трехмерного пространства и их применения. Успехи матем. наук, 7, № 1, 3—117, 1952.

Ландау Л. О. и Лифшиц Е. А. Квантовая механика. Гостехиздат, 1948.

Глава XX

ГРУППЫ И ДРУГИЕ АЛГЕБРАИЧЕСКИЕ СИСТЕМЫ

§ 1. ВВЕДЕНИЕ

В главе IV (том 1), посвященной алгебре многочленов, уже шла речь об основных путях развития алгебры, ее месте среди других математических дисциплин, об изменениях во взглядах на самый предмет алгебры. Цель настоящей главы заключается в том, чтобы дать читателю представление о тех новых алгебраических теориях, которые, возникнув еще в прошлом веке, достигли полного развития в текущем столетии и оказали большое влияние на современные математические исследования.

Современная алгебра, так же как классическая, есть учение о действиях, о правилах вычислений. Но она не ограничивается изучением свойств действий над числами, а стремится изучать свойства действий над элементами все более общей природы. Эта тенденция диктуется потребностями практики. Так, в механике складываются силы, скорости, повороты. В линейной алгебре (см. главу XVI), идеи и методы которой находят широкое применение в практических расчетах, областью действий являются матрицы, линейные преобразования, векторы n-мерного пространства.

Особо выдающуюся роль в современной алгебре играет теория групп, которой и будет посвящена большая часть этой главы. Из других алгебраических теорий мы остановимся на теории гиперкомплексных систем, являющейся необходимым и важным этапом в историческом процессе развития понятия числа. Этими двумя теориями, конечно, далеко не исчерпывается содержание современной алгебры, но ее идеи и методы освещаются ими достаточно ясно.

Теория групп возникла из необходимости найти аппарат для изучения таких важных закономерностей реального мира, как закономерность симметрии.

Познание свойств симметрии каких-либо геометрических тел или других математических и физических объектов иногда дает ключ к выяснению строения этих тел и объектов. Однако, несмотря на всю наглядность понятия симметрии, точная и общая формулировка того, что такое симметрия, и в особенности количественный учет свойств симметрии требуют использования аппарата теории групп.

Теория групп возникла сравнительно давно: в конце XVIII и начале XIX в. Первоначально она развивалась лишь как вспомогательный аппарат для задачи о решении уравнений высших степеней в радикалах. Это было вызвано тем, что именно в указанной задаче впервые было замечено, что свойства равноправности, симметрии корней уравнения являются основными для решения всей задачи. В течение XIX и XX вв. важная роль закономерностей симметрии выявилась во многих других разделах науки: геометрии, кристаллографии, физике, химии. Благодаря этому методы и результаты теории групп получили широкое распространение. Поскольку каждая область приложений ставила перед теорией групп свои особенные задачи, рост числа этих областей оказывал и обратное воздействие, вызывая развитие новых отделов теории групп, приведшее к тому, что современная теория групп, являясь единой по своим основным понятиям, фактически распадается на ряд более или менее самостоятельных дисциплин: общая теория групп, теория конечных групп, теория непрерывных групп, дискретные группы преобразований, теория представлений и характеров групп. Постепенно развиваясь, методы и понятия теории групп оказались важными не только для изучения закономерностей симметрии, но и для решения многих других вопросов.

В настоящее время понятие группы стало одним из важнейших обобщающих понятий современной математики, а теория групп заняла видное место среди математических дисциплин. Выдающийся вклад в развитие теории групп и ее приложений внесли Е. С. Федоров, О. Ю. Шмидт, Л. С. Понтрягин. Исследования советских математиков в области теории групп занимают ведущее место и в современном развитии этой теории.

§ 2. СИММЕТРИЯ И ПРЕОБРАЗОВАНИЯ

Простейшие виды симметрии. Начнем с напоминания простейших видов симметрии, знакомых читателю из повседневной жизни. Одним из таких видов симметрии является зеркальная симметрия геометрических тел или симметрия относительно плоскости.

Точка А пространства называется симметричной точке В относительно плоскости а (рис. 1), если плоскость пересекает отрезок AB в его середине перпендикулярно этому отрезку. Говорят также, что точка В является зеркальным образом точки А относительно плоскости а. Геометрическое тело называется симметричным относительно плоскости, если эта плоскость разбивает тело на две части, из которых каждая является зеркальным отражением другой относительно данной плоскости. Сама плоскость называется в этом случае плоскостью симметрии тела. Зеркальная симметрия очень распространена в природе. Например, форма человеческого тела, форма тела зверей, птиц имеет обычно плоскость симметрии.

Симметрия относительно прямой определяется аналогичным образом. Говорят, что точки А, В лежат симметрично относительно прямой, если эта прямая пересекает отрезок AB в его средней точке и перпендикулярна AB (рис. 2). Геометрическое тело называется симметричным относительно прямой или имеющим эту прямую своей осью симметрии 2-го порядка, если для каждой точки тела симметричная точка также принадлежит телу.

Тело, имеющее ось симметрии 2-го порядка, совмещается с собой при повороте тела вокруг этой оси на половину полного поворота, т. е. на угол в 180°.

Понятие оси симметрии естественным образом обобщается. Прямая называется осью симметрии порядка n для данного тела, если это тело совмещается с собой при повороте вокруг оси на угол 1/n 360°. Так, правильная пирамида, основанием которой является правильный n-угольник, имеет осью симметрии порядка n прямую, соединяющую вершину пирамиды с центром основания (рис. 3).

Прямая называется осью вращения тела, если тело совмещается с собой при повороте вокруг оси на любой угол. Так, оси цилиндра и конуса, любой диаметр шара суть их оси вращения. Ось вращения является вместе с тем осью симметрии любого порядка.

Наконец, важным типом симметрии является также симметрия относительно точки или центральная симметрия. Точки А и В называются симметричными относительно центра О, если отрезок, соединяющий точки А и В, делится точкой О пополам. Тело называется симметричным относительно центра О, если все его точки распадаются на пары точек, симметричных относительно О. Примерами центрально

Рис. 1. Рис. 2.

Рис. 3.

симметричных тел могут служить шар и куб, центры которых являются их центрами симметрии (рис. 4).

Знание всех плоскостей, осей и центров симметрии тела дает довольно полное представление о свойствах его симметрии.

Однако понятие симметрии имеет смысл не только в применении к геометрическим фигурам. Например, имеет совершенно ясный смысл утверждение, что в многочлене x13 + x23 + x33 + x43 переменные x1, x2, x3, x4 входят симметрично, а в многочлене x13 + x22 + x32 + x43 входят симметрично переменные x1 и x4, x2 и x3, в то время как, например, переменные x1 и x2 играют различную роль. Число таких примеров можно легко увеличить. Это заставляет поставить важный вопрос: что же такое симметрия в общем случае и как можно математически учитывать отношения симметрии? Оказывается, точный ответ на этот вопрос связан с понятием преобразования, которое уже много раз встречалось в этой книге, начиная с самых первых ее глав. Чтобы иметь возможность дать общее определение симметрии, охватывающее такие разнородные случаи, как симметрия пространственных тел и симметрия многочленов, необходимо и понятие преобразования сформулировать в очень общем виде.

Преобразования. Пусть M обозначает конечную или бесконечную совокупность совершенно произвольных объектов. Например, M может быть совокупностью чисел 1, 2, . . . , n, совокупностью независимых переменных x1, x2, x3, x4, множеством всех точек плоскости. Если каждому элементу множества M поставлен в соответствие вполне определенный элемент того же множества, то говорят, что задано преобразование множества М. Каждое преобразование конечного множества M можно задать посредством таблицы, состоящей из двух строк: в верхней строке пишутся в произвольном порядке обозначения элементов множества M и под каждым из них записывается обозначение соответствующего ему элемента. Например, таблица ( ) означает преобразование совокупности чисел 1, 2, 3, 4, при котором числа 1, 2, 3, 4 переходят соответственно в числа 2, 3, 2, 1. Располагая в верхней строке числа 1, 2, 3, 4 в порядке 3, 4, 1, 2, мы можем то же самое преобразование записать и таблицей ( ).

Если множество M бесконечно, но имеется возможность перечислить (перенумеровать) его элементы, расположив их обозначения в одну

Рис. 4.

строку (например, если M есть множество всех чисел натурального ряда 1, 2, 3,...), то преобразование можно задавать аналогичным образом.

Изучая преобразования, нужно ввести для них целесообразные обозначения. Будем обозначать преобразования просто буквами А, В и т. д., причем если какое-либо преобразование множества M будет обозначено буквой A, то через m А, где m — произвольный элемент из М, будет обозначаться образ элемента m, т. е. тот элемент, в который переходит m при преобразовании А. Пусть, например, тогда

Укажем несколько преобразований, играющих важную роль в геометрии.

Выберем в пространстве какую-либо прямую а и поставим в соответствие каждой точке Р пространства точку Q, получаемую путем поворота точки Р вокруг оси а на фиксированный угол φ (рис. 5). Тем самым мы определили преобразование совокупности всех точек пространства, называемое поворотом пространства на угол φ вокруг оси а.

Заметим, что слово «поворот» в механике означает некоторый процесс, в результате которого точки тела переходят в новое положение.

Здесь же термин «поворот» употребляется в смысле преобразования пространства. При этом отвлекаются от самого процесса движения и рассматривают только его конечный результат — соответствие начального и конечного положения точек.

Другим важным преобразованием пространства является параллельный перенос всех точек в данном направлении на заданное расстояние. Из рис. 6, на котором для произвольных точек Р1, Р2, Р3 указаны соответствующие точки Q1, Q2, Q3, видно, что, зная при параллельном переносе соответственную точку лишь для одной точки пространства, можно найти соответственные точки для всех других точек пространства.

Рис. 5- Рис. 6.

Выше были определены понятия плоскости, оси и центра симметрии пространственной фигуры. Каждому из этих понятий отвечает определенное преобразование пространства: отражение относительно плоскости, вращение относительно прямой и отражение относительно центра. Например, отражение относительно плоскости есть преобразование, при котором каждой точке пространства ставится в соответствие точка, симметричная относительно этой плоскости. Аналогично определяется вращение относительно прямой и отражение относительно центра.

Мы говорили о преобразованиях пространства. Соответствующие преобразования плоскости: поворот плоскости вокруг ее точки на данный угол, параллельный перенос плоскости по самой себе в данном направлении, отражение относительно прямой, лежащей в плоскости, — определяются аналогичным образом и являются еще более наглядными, чем аналогичные преобразования пространства.

Взаимно однозначные преобразования. При рассмотрении всевозможных преобразований одного и того же множества прежде всего замечается фундаментальное различие между взаимно однозначными отображениями множества на себя и отображениями не взаимно однозначными. Преобразование А множества M называется взаимно однозначным отображением этого множества на себя, если не только каждому элементу множества M отвечает определенный единственный элемент множества М, — это содержится в определении преобразования, — но если также для каждого элемента у множества M существует один и только один элемент x, который переходит в элемент у. Иными словами, преобразование А является взаимно однозначным, если «уравнение» хА=у для каждого у из M имеет одно и только одно «решение» X в М.

Все рассмотренные выше преобразования пространства — отражения, повороты и переносы — являются взаимно однозначными, так как при этом не только для каждой точки X существует точка, в которую X переходит, но также существует единственная точка, которая переходит в X.

Легко привести и противоположные примеры; так, преобразование множества чисел 1, 2, 3, 4, заданное таблицей ( ), не является взаимно однозначным, так как при нем в число 4 ничто не переходит. Преобразование множества всех натуральных чисел 1, 2, 3, . . . , заданное таблицей ( ), также не является взаимно однозначным. Хотя здесь для каждого числа n имеется число 2n, которое в него переходит, но число 2n не единственное, обладающее этим свойством, поскольку 2n — 1 также переходит в n. Вообще для преобразований, заданных таблицами, очень легко установить признак, при котором преобразования будут взаимно однозначными. Для этого, очевидно,

необходимо и достаточно, чтобы в нижней строке таблицы встречался каждый элемент множества и притом только один раз.

Иногда в математике рассматривают и не взаимно однозначные преобразования. Например, известно, какое большое значение имеет операция проектирования пространства на плоскость. Это преобразование не взаимно однозначное, так как при нем в каждую точку проектируется не одна, а целый ряд точек пространства. Но в большинстве случаев приходится иметь дело лишь с взаимно однозначными преобразованиями; эти преобразования, в частности, играют основную роль, когда рассматриваются физические процессы, при которых элементы изучаемой системы не сливаются друг с другом, не уничтожаются и не возникают.

В дальнейшем, говоря о преобразованиях, мы будем подразумевать преобразования взаимно однозначные; их часто называют также подстановками, особенно в случаях, когда речь идет о преобразованиях конечного множества.

Для каждого (взаимно однозначного) преобразования А множества M на себя легко определить обратное преобразование А-1. Если преобразование А переводит произвольный элемент х множества M в элемент у, то преобразование, переводящее элемент у в х, называется обратным преобразованию А и обозначается А-1. Например, если А = ( ), то A-1 = ( )=( ); если А — поворот пространства вокруг оси на угол у, то А-1 — поворот вокруг той же оси на угол φ в противоположном направлении, и т. д.

Иногда может случиться, что обратное преобразование будет совпадать с данным. Таким свойством, в частности, обладают отражения относительно плоскости или точки в пространстве. Тем же свойством обладает подстановка

Заметим, что говорить об обратном преобразовании для преобразований не взаимно однозначных нельзя, так как эти преобразования в отдельные элементы могут или ничего не переводить или переводить несколько элементов.

Общее определение симметрии. В математике и ее приложениях очень редко возникает потребность рассмотрения всех преобразований данного множества. Дело в том, что сами множества редко приходится мыслить только как простое объединение своих элементов, ничем не связанных друг с другом. Это и естественно, так как множества, рассматриваемые в математике, являются отвлеченными образами реальных совокупностей, элементы которых всегда находятся в бесконечном числе взаимосвязей друг с другом и в связях с тем, что находится за пределами рассматриваемого множества. При этом в математике приходится отвлекаться от большей части этих связей, но наиболее суще-

ственные сохранять и учитывать. Это заставляет в первую очередь рассматривать такие преобразования множеств, которые не нарушают тех или иных учитываемых связей между элементами. Такие преобразования часто называют допустимыми преобразованиями или автоморфизмами по отношению к учитываемым связям элементов множества. Например, для точек пространства важным является понятие расстояния между двумя точками. Наличие этого понятия учитывает связь между точками, заключающуюся в том, что любые две точки находятся на определенном расстоянии одна от другой. Преобразованиями, не нарушающими этих связей, являются такие преобразования, при которых расстояния между точками не изменяются. Эти преобразования называются «движениями» пространства.

Пользуясь понятием автоморфизма, не трудно дать общее определение симметрии. Пусть дано некоторое множество М, в котором учитываются определенные связи между элементами, и пусть Р есть некоторая часть М. Говорят, что совокупность Р симметрична или инвариантна относительно допустимого преобразования А множества М, если преобразование А переводит каждый элемент множества Р снова в элемент множества Р. Поэтому симметрия множества Р характеризуется совокупностью допустимых преобразований объемлющего множества М, преобразующих Р в себя. Понятие симметрии тел в пространстве вполне подходит под данное определение. Роль множества M играет все пространство, роль допустимых преобразований — «движения», роль Р—данное тело. Симметрия тела Р характеризуется, таким образом, совокупностью движений, при которых тело Р совмещается с собой.

Рассмотренные ранее отражения, параллельные переносы и повороты пространства около заданной прямой являются частными случаями движений, так как расстояния между точками при этих преобразованиях, очевидно, не меняются. Более подробное исследование показывает, что каждое движение плоскости есть либо перенос, либо поворот около центра, либо отражение относительно прямой, либо комбинация отражения относительно прямой с переносом вдоль этой прямой. Аналогично каждое движение пространства есть либо параллельный перенос, либо поворот около оси, либо винтовое движение, т. е. поворот вокруг оси, сопровождаемый переносом вдоль этой оси, либо же отражение относительно плоскости, сопровождаемое, может быть, еще переносом вдоль плоскости отражения или поворотом вокруг перпендикулярной к этой плоскости оси.

Параллельные переносы, повороты и винтовые движения пространства называются его собственными движениями, или движениями 1-го рода. Остальные «движения» (включающие в себя отражение) носят название несобственных движений, или движений 2-го рода. На плоскости движениями 1-го рода будут параллельные переносы и повороты,

а отражения относительно прямой и отражения, сопровождаемые поворотом или переносом, будут движениями 2-го рода.

Легко сообразить, что преобразования, являющиеся движениями 1-го рода, можно получить как результат непрерывного движения пространства самого в себе или плоскости самой по себе. Движения 2-го рода таким образом получить невозможно, так как этому препятствуют зеркальные отражения, входящие в их состав.

Часто говорят, что плоскость симметрична во всех своих частях или что все точки плоскости равноправны. На точном языке преобразований это утверждение означает, что любую точку плоскости можно совместить с любой другой ее точкой посредством подходящего «движения».

Рассмотренные ранее случаи симметрии тел или фигур также охватываются общим определением симметрии. Так, например, тело, симметричное относительно плоскости а, совмещается само с собой при отражении относительно плоскости ос; тело, симметричное относительно центра О, совмещается само с собой при отражении относительно О. Поэтому степень симметричности тела или пространственной фигуры вполне характеризуется совокупностью тех движений 1-го и 2-го рода пространства, которые совмещают тело или фигуру самое с собой. Чем богаче и разнообразнее указанная совокупность движений, тем большей степенью симметричности обладает тело или фигура. В частности, если эта совокупность не содержит никаких движений, кроме тождественного преобразования, то тело можно назвать несимметричным.

Степень симметричности квадрата на плоскости характеризуется совокупностью движений плоскости, совмещающих квадрат сам с собой. Но если квадрат совмещается сам с собой, то точка пересечения его диагоналей также должна совмещаться сама с собой. Поэтому искомые движения оставляют центр квадрата неподвижным и потому являются либо поворотами около центра, либо отражениями относительно прямых, проходящих через центр. Из рис. 7 легко усматриваем, что квадрат ABCD симметричен относительно поворотов вокруг его центра О на углы, кратные 90°, а также по отношению к отражениям относительно диагоналей АС, BD и прямых KL, MN. Эти восемь движений и характеризуют симметрию квадрата.

Совокупность симметрий прямоугольника сводится к поворотам около центра на 180° и отражениям относительно прямых, соединяющих середины противоположных сторон, а совокупность симметрий параллелограмма (рис. 8) состоит лишь из поворотов вокруг центра на углы, кратные 180°, т. е. из отражения относительно центра и тождественного преобразования.

Рис. 7.

Выше мы приводили алгебраический пример симметрии; именно, было отмечено, что имеет смысл понятие симметрии многочлена от нескольких переменных.

Рассмотрим, как можно охарактеризовать симметрию многочлена. Будем говорить, что в многочлене F(x1, x2, ..., xn) сделана подстановка неизвестных A = ( ), или короче A = ( ), если в данный многочлен всюду вместо буквы хг поставлена буква хi1, вместо x2 поставлена xi2 и т. д. Полученный таким образом многочлен обозначается через FА. Так, если

Симметрия данного многочлена характеризуется совокупностью тех подстановок неизвестных, которые, будучи выполнены над многочленом, его не изменяют. Например, симметрия многочлена

характеризуется четырьмя подстановками:

а симметрия многочлена

характеризуется лишь двумя подстановками:

§ 3. ГРУППЫ ПРЕОБРАЗОВАНИЙ

Умножение преобразований. Изучая свойства преобразований, легко заметить, что некоторые преобразования можно составить из нескольких других. Так, винтовые движения составляются из поворотов вокруг оси и сдвигов вдоль оси. Этот процесс составления новых преобразований из заданных носит название умножения преобразований. Производя над произвольным элементом х множества M какое-либо преобразование А и затем к новому элементу хА применяя преобразование В, получим элемент (хА)В. Преобразование, переводящее х непосредственно в (хА)В, называется произведением преобразования А на B и обозначается через AВ. Следовательно, по определению, имеем

х(АВ) = (хА)В.

Пример:

Рис. 8.

Действительно, первая подстановка переводит 1 в 2, а вторая 2 переводит в 4, поэтому результирующая подстановка должна переводить 1 в 4 и т. д. Вот еще несколько примеров:

Последние два примера показывают, что умножение преобразований есть, как говорят, действие некоммутативное: его результат зависит от порядка сомножителей. Это же легко подтверждается и для умножения движений плоскости. Пусть, например, А есть поворот плоскости на 90° вокруг начала О, а В — перенос вдоль оси Ох на единицу.

Посмотрим, во что переводят преобразования AB и В А точку О. По определению, имеем (рис. 9)

т. е. АВ≠ВА.

Чтобы ближе выяснить геометрическую природу преобразования ВА, рассмотрим точку Р. Имеем

т. е. точка Р остается при преобразовании ВА неподвижной. Исходя из этого, легко показать, что ВА есть просто поворот плоскости на 90° вокруг точки Р. Аналогично

и AB есть поворот плоскости на 90° вокруг точки Q.

Умножение движений плоскости или пространства происходит в общем случае по довольно сложным законам. Однако в двух важных случаях законы умножения очень просты. Во-первых, если умножаются повороты плоскости вокруг одной и той же точки или повороты пространства вокруг одной и той же прямой на углы φ и ψ, то результирующее преобразование будет соответственным поворотом на угол φ + ψ. Во-вторых, если умножаются переносы, характеризуемые векто-

Рис. 9.

рами MN и NP, то произведение будет также переносом, характеризуемым вектором MP, т. е. суммой первоначальных векторов.

Сам термин «умножение» преобразований вызван некоторой аналогией между умножением чисел и умножением преобразований. Однако эта аналогия неполная. Так, при умножении чисел имеет место коммутативный (переместительный) закон. Мы уже видели, что при умножении преобразований этот закон может быть нарушен. Второй же основной закон арифметики — сочетательный закон (ассоциативность) умножения — в полной мере сохраняется для преобразований. Именно, для любых преобразований А, В, С множества M имеет место равенство А (ВС) = (AB) С.

В самом деле, если m — произвольный элемент из М, то

Ассоциативный закон позволяет вместо двух произведений А (ВС) и (AB) С преобразований А, В, С говорить лишь об одном произведении А (ВС) = (AB) С = ABС. Этот же закон показывает, что и произведение четырех и более преобразований не зависит от расстановки скобок.

Далее, среди преобразований имеется преобразование, играющее роль числа 1, это — тождественное или единичное преобразование Е, которое оставляет каждый элемент множества M неизменным. Ясно, что АЕ = ЕА = А, каково бы ни было преобразование А.

Отметим еще следующий важный факт: произведение взаимно однозначных преобразований есть преобразование взаимно однозначное. В самом деле, чтобы найти элемент х множества М, который произведением AB переводится в данный элемент а, достаточно найти элемент x1, переводимый преобразованием В в а, и затем найти элемент x2, переводимый преобразованием А в x1. Так как x2(АВ) = (x2А) В = — x1А = а, то x2 и будет искомым элементом х.

Произведение преобразования А на обратное преобразование А-1 есть единичное преобразование, т. е.

Это непосредственно следует из определения обратного преобразования.

Рассмотренный выше пример умножения переноса плоскости на поворот показывает, что свойства произведения преобразований не всегда легко усмотреть, исходя из свойств сомножителей. Однако произведение преобразований вида С — В-1АВ представляет важное исключение: свойства С здесь очень просто связаны со свойствами А и В. Именно, если элемент m множества M преобразованием А переводится в n, то «сдвинутый» посредством преобразования В элемент тВ преобразованием С переводится в «сдвинутый» элемент пВ.

Доказательство: (mВ)В-1АВ = mАВ = nВ.

Преобразование В-1АВ называют полученным из А путем преобразования его при помощи В или сопряженным с А посредством В.

Преобразуем, например, поворот Р0 плоскости около точки О при помощи переноса V. Согласно приведенному правилу, чтобы найти пары начальных и конечных положений точек для преобразованного движения С = V-1PoV, надо сдвинуть при помощи V соответственные пары точек для преобразования РО. Так как точка О при повороте Pq отвечает самой себе (рис. 10), то и точка OV относительно преобразования С отвечает самой себе. Далее, если точка M переводится преобразованием Р в точку N, то сдвинутая точка MV будет переводиться преобразованием С в точку NV. Из рис. 10, таким образом, видно, что преобразование С будет поворотом около точки OV на тот же угол φ, что и поворот Р.

Аналогично может быть доказано, что если перенос плоскости, характеризуемый вектором MN, преобразовать посредством поворота Pq на угол φ, то получится снова перенос плоскости, характеризуемый повернутым вектором.

Указанное выше правило для отыскания преобразования В-1АВ весьма изящно формулируется также в случае, когда преобразования задаются таблицами. Пусть

тогда

т. е. чтобы преобразовать подстановку А при помощи подстановки В, нужно все элементы верхней и нижней строк подстановки А подвергнуть преобразованию, предусмотренному подстановкой В. Например, если

то

Заметим, что хотя в общем случае произведение двух преобразований зависит от порядка сомножителей, в отдельных случаях произ-

Рис. 10.

ведения AB и ВА могут быть одинаковыми. Тогда преобразования А и В называются перестановочными или коммутирующими. Если АВ = ВА, то

В-1АВ = В-1ВА = A.

Таким образом, преобразование данной подстановки при помощи коммутирующей с ней подстановки не меняет данную подстановку.

Группы преобразований. Совокупности преобразований, характеризующих симметрию некоторой фигуры, не могут быть произвольными, они заведомо должны обладать следующими свойствами:

1. Произведение двух преобразований, принадлежащих совокупности, само принадлежит этой совокупности.

2. Тождественное преобразование принадлежит совокупности.

3. Если преобразование принадлежит совокупности, то обратное преобразование также принадлежит совокупности.

Эти свойства оказались очень важными для изучения преобразований, ввиду чего всякую совокупность взаимно однозначных преобразований множества М, обладающую перечисленными тремя свойствами, стали называть группой преобразований множества М, независимо от того, характеризует эта совокупность симметрию некоторой фигуры или нет.

С точки зрения алгебры свойства 1—3 являются очень существенными, так как они позволяют, исходя из некоторых преобразований А, В, С,..., принадлежащих заданной совокупности, составлять различные новые преобразования вида ABAC, А-1ВСВ-1 и т. п., причем свойства 1—3 гарантируют, что все получаемые преобразования не выходят за пределы заданной совокупности преобразований.

Число преобразований, составляющих группу, называется порядком группы; последний может быть и конечным и бесконечным. Соответственно этому и группы разделяются на конечные и бесконечные. Выше была рассмотрена группа симметрии квадрата на плоскости. Эта группа оказалась содержащей всего восемь преобразований. С другой стороны, бесконечная совокупность точек Ai плоскости, изображенная на рис. 11, преобразуется в себя следующими движениями плоскости: переносами вдоль оси О А в том и другом направлениях на расстояния, кратные расстоянию OA; отражениями относительно пунктирных прямых; отражением относительно оси OА. Отсюда видно, что группа симметрий этой фигуры бесконечная.

Совокупность преобразований, сохраняющих некоторый объект, т. е. характеризующих его симметрию, всегда является группой. Этот

Рис. 11.

способ задания групп в виде групп симметрий принадлежит к числу важнейших. По этому принципу получаются наиболее важные группы. К ним прежде всего следует отнести группы движений плоскости и пространства. Большой интерес представляют также группы симметрий правильных многогранников. Как известно, в пространстве существует всего пять типов правильных многогранников (4, 6, 8, 12 и 20-гранники). Беря какой-либо из правильных многогранников и рассматривая все движения пространства, совмещающие данный многогранник с собой, мы получим группу — группу симметрий этого многогранника. Если вместо всех движений рассматривать только движения 1-го рода, совмещающие многогранник с самим собой, то получим опять группу, являющуюся частью полной группы симметрий многогранника. Эта группа называется группой вращений многогранника. Поскольку при совмещении многогранника с собой его центр также совмещается с самим собой, то все движения, входящие в группу симметрий многогранника, оставляют неподвижным центр многогранника и потому могут быть только или поворотами около осей, проходящих через центр, или отражениями относительно плоскостей, проходящих через центр, или, наконец, отражениями в таких плоскостях, сопровождаемыми поворотами вокруг осей, проходящих через центр и перпендикулярных к этим плоскостям.

Пользуясь этим замечанием, легко найти все группы симметрий и группы вращений правильных многогранников. В табл. 1 указаны порядки групп симметрий и групп вращений правильных многогранников. Все эти группы являются конечными.

Таблица 1

Число граней.........

4

6

8

12

20

Порядок группы симметрий . .

24

48

48

120

120

Порядок группы вращений . .

12

24

24

60

60

Группы подстановок. Из групп преобразований исторически первыми рассматривались в математике группы подстановок переменных x1, x2,..., xn в многочленах от этих переменных. Рассмотрение таких групп тесно связано с вопросом о решении в радикалах уравнений высших степеней. Очевидно, что совокупность всех подстановок переменных, не меняющих значений одного или нескольких многочленов от этих переменных, является группой. Многочлены, не меняющиеся при всех подстановках переменных, называются симметрическими многочленами. Например, x1+x2+ ... +xn есть симметрический многочлен. Соответственно, совокупность всех подстановок дан-

ного множества переменных называется симметрической группой подстановок этого множества.

Число переставляемых переменных называется степенью симметрической группы. Вместо подстановок переменных x1, ..., xn можно рассматривать просто подстановки чисел 1, 2,..., n. Так как каждую подстановку чисел можно записать в виде ( ), где а1, a2, ..., an — числа 1, 2,..., n, записанные в некотором порядке, то число всех подстановок равно числу перестановок n элементов, т. е. порядок симметрической группы равен n! = 1 ⋅ 2 ⋅ 3 ... n. Этот порядок очень быстро растет со степенью n, и порядок группы подстановок 10 переменных равен уже 3 628 800.

Рассмотрим многочлен

(1)

Ясно, что каждая подстановка переменных или оставляет величину многочлена F неизменной или меняет лишь его знак. Подстановки первого рода называются четными. Подстановки, меняющие знак F, называются нечетными. Совокупность четных подстановок образует группу симметрий многочлена (1). Она называется знакопеременной группой подстановок.

Произведение двух четных подстановок есть четная подстановка, ибо четные подстановки образуют группу. Произведение двух нечетных подстановок есть подстановка четная.

Действительно, если А и В — нечетные подстановки, то

Таким же образом доказывается, что произведение четной и нечетной подстановок есть нечетная подстановка и что подстановка обратная к четной или нечетной подстановке есть подстановка той же четности.

Примером нечетной подстановки может служить подстановка S = ( ), меняющая местами элементы 1 и 2.

Разложение подстановок на циклы. При изучении групп подстановок большое значение имеет представление подстановок в виде произведений так называемых циклов. По определению символом (m1, m2, ..., mk) обозначается подстановка, переводящая m1 в m2, m2 в m3,..., mk-1 в mk, mk снова в m1, а все остальные элементы рассматриваемого множества оставляющая на месте. Так, например, если рассматриваются подстановки чисел 1, 2, 3, 4, 5, то

Подстановка вида (m1, m2, ..., тк) называется циклической или циклом длины k; m1, m2,...,mk называются элементами цикла. Единичная подстановка условно записывается в виде циклов (1) = (2) = ... длины 1. Циклы длины 2 называются транспозициями. Переставляя элементы цикла в циклическом порядке, мы получаем ту же самую подстановку, например (1, 2, 3) = (2, 3, 1) = (3, 1, 2), (5, 6) = (6, 5).

Легко проверяется, что циклы без общих элементов, например (2, 3) и (1, 4, 5), являются коммутирующими подстановками, и поэтому при перемножении таких циклов можно не обращать внимания на порядок сомножителей в произведении.

Значение циклов в общей теории основывается на следующей теореме: всякая подстановка может быть представлена в виде произведения циклов без общих элементов, причем это представление однозначно с точностью до порядка сомножителей.

Доказательство теоремы непосредственно видно из способа такого представления. Допустим, что мы желаем разложить подстановку A = ( ). Мы видим, что A переводит 1 в 4, 4 в 3, 3 в 6, 6 в 1. В результате имеем первый множитель (1, 4, 3, 6). Берем оставшееся число 2 и видим, что А переводит 2 в 5, 5 в 2. Поэтому второй множитель будет (2, 5). Поскольку все числа рассмотрены, то

(2)

Разложение подстановок на циклы, имеющие общие элементы, также возможно, но уже неоднозначно. Например,

Докажем, что каждый двойной цикл есть нечетная подстановка. Мы уже убедились в этом для цикла (1, 2). Но любой цикл (i, j) есть S-1(1,2)S, где S — любая подстановка ( ), переводящая 1 в i и 2 в j. Подстановка S-1 (1, 2)S есть нечетная подстановка, ибо (1, 2) нечетная, a S и S-1 одновременно или четные или нечетные.

Согласно формуле (3), цикл длины m+1 может быть представлен в виде произведения m нечетных подстановок. Поэтому цикл длины m+1 есть подстановка нечетная, если m+1 четно, и четная, если m+1 нечетно. Это дает возможность быстро подсчитать четность подстановок, разложение которых на циклы известно. В частности, подстановка ( ) четна, так как она, согласно формуле (z), есть произведение двух нечетных подстановок.

Подгруппы. Часть группы, сама являющаяся группой, называется подгруппой данной группы. Так, знакопеременная группа подстановок

переменных x1, x2,...,xn является подгруппой симметрической группы подстановок этих переменных. Совокупность собственных движений плоскости есть группа, являющаяся подгруппой группы всех собственных и несобственных движений плоскости.

С формальной точки зрения единичное (тождественное) преобразование само по себе уже образует подгруппу. Точно так же и любая группа может быть рассматриваема как своя подгруппа. Однако, кроме этих тривиальных подгрупп, почти всегда группы содержат много других подгрупп. Знание всех подгрупп данной группы дает довольно полное представление о внутреннем строении заданной группы.

Одним из распространенных способов образования подгрупп является указание так называемых образующих подгрупп.

Пусть A1, A2, ..., Аm — какие-либо преобразования, принадлежащие группе G. Совокупность H всех преобразований, которые можно получить, перемножая между собой в произвольном числе заданные преобразования и преобразования, им обратные, будет группой. Действительно, единичное преобразование принадлежит к этой совокупности, так как его можно представить в виде A1А-1. Далее, если преобразования В и С можно представить в виде произведений, то, перемножая эти произведения, мы получим требуемое представление и для ВС. Наконец, если В выражается в виде произведения, например, В = А-1A2A1A1А-1, то и В-1 можно представить в виде требуемого произведения, так как В"1 = A2А-1A1—1A2-1A1.

Группа H является, очевидно, подгруппой группы G и называется подгруппой, порожденной преобразованиями A1,..., Am, а сами преобразования A1, ..., Am называются образующими подгруппы Н. Может случиться, что H совпадает с G, тогда A1,..., Am называются образующими самой группы G. Нетрудно убедиться на примерах, что одна и та же подгруппа может порождаться самыми различными системами образующих.

Подгруппа, порождаемая одним преобразованием А, называется циклической подгруппой. Ее элементами являются преобразования

которые, естественно, называются степенями преобразования А. Именно:

Легко доказывается, как в обычной арифметике, что

(4)

Преобразование называется периодическим, если некоторая его положительная степень равна тождественному преобразованию. Наименьший положительный показатель степени, в которую нужно возвести периодическое преобразование, чтобы получить тождественное, назы-

вается порядком преобразования. Условно говорят, что порядок непериодического преобразования бесконечен.

Рассмотрим несколько примеров. Пусть А — поворот плоскости вокруг точки О на 360°/n, где n — данное положительное целое число, большее единицы. Тогда A2 будет поворотом на угол 2 360°/n, A3 — поворотом на 3 360°/n, An-1 — поворотом на (n—1) 360°/n, An — поворотом на 360°, т. е. будет тождественным преобразованием. Это показывает, что поворот на 360°/n есть периодическое преобразование порядка n.

Пусть А — перенос плоскости вдоль некоторой прямой. Тогда A2, A3, ... будут также переносами вдоль той же прямой соответственно на двойное, тройное и т. д. расстояния. Поэтому никакая положительная степень А не есть тождественное преобразование, и порядок А бесконечен.

Элементами циклической группы, порожденной элементом А, являются

(5)

Если А—преобразование бесконечного порядка, то все преобразования в последовательности (5) различны, и группа бесконечна. Действительно, в противном случае мы имели бы равенство вида Ak = Al (k<l), откуда Al-k = E, l — k>0, что противоречит непериодичности А.

Предположим теперь, что А — периодическое преобразование порядка m. Тогда

т. е. последовательность (5) состоит из одних и тех же периодически повторяющихся преобразований Е, А, A2, Ат-1. Они между собою различны, так как, если бы оказалось Ак = A1 (0⩽к<l<m), то было бы Ai-k = Е, 0<l — k<m, что противоречит выбору m. Следовательно, циклическая подгруппа, порожденная преобразованием порядка m, содержит ровно m различных преобразований.

Группа, все элементы которой коммутируют друг с другом, называется коммутативной или абелевой, по имени норвежского математика Абеля, открывшего важное значение таких групп для теории уравнений.

Формулы (4) показывают, что степени одного и того же преобразования всегда коммутируют друг с другом: АmAn = АnАm = Аm+n. Поэтому циклические подгруппы всегда абелевы.

В арифметике чисел наряду с умножением важную роль играет действие деления. В теории групп, вследствие некоммутативности умно-

жения, приходится говорить о двух делениях: правом и левом. В самом деле, решение уравнения A1 = В, где А, В — данные преобразования, а X — искомое преобразование, естественно назвать правым частным, а решение уравнения уА =В — левым частным от деления В на А. Умножая обе части первого равенства на А-1 слева, а обе части второго на A-1 справа, получим: x = A-1B, у = ВА-1. Таким образом, в качестве «частного» преобразований В и А можно рассматривать А-1В или ВА-1.

На многочисленных примерах мы видели, что в группах, вообще говоря, АВ≠ВА. «Частное» (AB)(ВА)-1 или (ВА)-1(AB) можно принять за «меру» некоммутируемости подстановок А и В. Второе из этих выражений, именно (ВА)-1(АВ) = A-1B-1AB, называют коммутатором А и В и обозначают (А, В). Из формулы

(А, В) = А-1В-1АВ

следует, что коммутатор можно представлять себе и как частное от «деления» сопряженного преобразования В-1АВ на первоначальное А.

Если, например, А — перенос плоскости, то сопряженное преобразование будет также переносом, а частное двух переносов, очевидно, есть перенос. Поэтому коммутатор переноса и любого движения плоскости есть перенос. Пусть A—поворот на угол φ вокруг некоторой точки О, а В — поворот или перенос. Тогда сопряженное преобразование будет снова поворотом на угол φ, но вокруг смещенной точки O'. Следовательно, коммутатор (А, В) в рассматриваемом случае есть произведение поворота вокруг точки О на отрицательный угол φ и поворота вокруг точки О' на положительный угол φ. Из рис. 12 видно, что результирующее преобразование есть перенос под углом π/2 - φ/2 к отрезку ОО' на расстояние 2 ⋅ ОО' sin φ/2.

Таким образом, мы приходим к интересному факту, что для плоскости коммутатор любых двух движений 1-го рода есть параллельный перенос или тождественное преобразование. Поскольку (A, В) = Е означает, что AB = ВА, то на плоскости любая некоммутативная группа движений 1-го рода содержит параллельные переносы.

Подгруппа, порожденная коммутаторами всевозможных элементов группы G, называется коммутантом группы G. Вспоминая соответствующие определения, можно сказать, что коммутант группы G состоит из тех и только тех ее элементов, которые можно представить в виде

Рис. 12.

произведения коммутаторов. Поскольку для плоскости коммутатор любых двух движений 1-го рода есть параллельный перенос, а произведения параллельных переносов суть также параллельные переносы, можно утверждать, что коммутант группы движений плоскости 1-го рода состоит лишь из параллельных переносов.

Коммутант абелевой группы состоит из единичного преобразования, так как из АВ = ВА следует (А, В) = Е.

Пусть G— симметрическая группа всех подстановок чисел 1, 2, . . . n. Покажем, что коммутатор любых двух подстановок А, В всегда будет подстановкой четной. В самом деле, подстановки AB, В А, а следовательно и (ВА)-1, всегда имеют одинаковую четность; тогда коммутатор (А, В) = (В А)-1 (AB), как произведение подстановок одинаковой четности, есть подстановка четная.

Мы видим, что коммутант симметрической группы состоит лишь из четных подстановок. Легко можно доказать, что он совпадает со всей знакопеременной группой.

Коммутант группы G называется также производной группой и обозначается через G'; коммутант коммутанта G называется вторым коммутантом группы G и обозначается через G". Повторяя этот процесс, мы получим определение коммутанта любого порядка группы G.

Если из коммутантов группы G хотя бы один (а тогда и все последующие) состоит лишь из единичного преобразования, то группа G называется разрешимой. Название это возникло в теории уравнений, где разрешимости группы соответствует разрешимость уравнения в радикалах. Группа движений 1-го рода для плоскости разрешима, так как уже ее 2-й коммутант равен единице. Симметрические группы 2, 3 и 4-й степени также разрешимы, поскольку их соответственно 1, 2 и 3-й коммутанты обращаются в единицу. Напротив, симметрические группы 5-й и более высоких степеней неразрешимы, так как можно доказать, что их 2-й коммутант совпадает с 1-м и отличен от единицы.

§ 4. ФЕДОРОВСКИЕ ГРУППЫ

Группы симметрий конечных плоских фигур. Как уже было установлено, симметричность фигуры или тела характеризуется группой движений плоскости или пространства, совмещающих фигуру с собой.

Наиболее просто находятся группы симметрий конечных фигур на плоскости1. В самом деле, пусть дана какая-либо конечная фигура на плоскости и пусть эта фигура совмещается сама с собой некоторым движением А. Тогда центр тяжести фигуры О должен движением А

1 Конечность понимается в том смысле, что вся фигура расположена в ограниченной части плоскости, например в некотором круге.

также совмещаться сам с собой, т. е. А есть или поворот около О, или отражение относительно прямой, проходящей через О. Итак, группа симметрий любой конечной плоской фигуры может состоять лишь из поворотов около ее центра тяжести и из отражений относительно прямых, проходящих через центр.

Рассмотрим последовательно различные случаи, которые могут представиться при рассмотрении групп симметрий конечной плоской фигуры.

1. Группа симметрий К1 состоит лишь из единичного (тождественного) преобразования. Это — группа симметрий любой несимметричной фигуры (рис. 13).

2. Группа симметрий К2 состоит из единичного преобразования и отражения около одной прямой (рис. 14).

Заметим, что если группа К содержит отражения около двух прямых а, b, проходящих через О и образующих угол φ между собой, то произведение этих отражений будет поворотом вокруг О на угол 2φ (рис. 15). Отсюда видно, что группа К2— единственная из групп симметрии, не содержащая поворотов.

3. Группа симметрий К3 состоит лишь из одних поворотов, среди которых нет поворотов на сколь угодно малый угол. В таком случае среди поворотов в группе К3 найдется поворот на наименьший положительный угол. Пусть этот угол равен α°. Докажем, что любой другой поворот, содержащийся в группе, будет кратен α°. Обозначим число градусов в этом повороте через ß и найдем такое целое число h, чтобы hα0<ß°<(h + l)α°, откуда 0⩽ß° — hα°<α°. Группа К3, имея повороты на α° и ß°, будет иметь и поворот на ß° — hα°. Но 0⩽ß°— hα° <α°, a группа не содержит положительных поворотов меньше чем на α°. Поэтому ß°— hα° = 0, т. е. ß° = hα°. В частности, поскольку группа К3 содержит поворот на 360°, то для некоторого целого n имеем nα° = 360°, откуда α° = 360°/n.

Рис. 13. Рис. 14. Рис. 15.

Итак, группа К3 состоит из поворотов на

Придавая n значения 2, 3,4,.... мы получим все типы групп К3. Пример фигур, группа симметрии которых состоит только из поворотов вокруг О на углы, кратные 360°/n, при n = 19, n = 3, приведенна рис. 16.

4. Группа симметрий К4 состоит из одних поворотов и содержит сколь угодно малые повороты. Тогда поворот на произвольный угол ос можно с любой степенью точности составить из поворотов, принадлежащих группе K4. Нас здесь интересуют, конечно, только замкнутые фигуры, т. е. такие, которые включают в себя все свои граничные точки (см. главу XVII, § 9). Легко установить, что для замкнутых фигур группа K4 содержит повороты на любой угол φ. Это — случай направленной круговой симметрии, примером которой может служить окружность, кольцевая полоса и т. п., снабженные некоторым направлением обхода (рис. 17). Здесь при всех допустимых преобразованиях должна совмещаться не только сама фигура, но и направление ее обхода, что исключает отражения относительно прямой.

Нам остается рассмотреть еще смешанные случаи, когда группа симметрий К содержит и повороты и отражения. Опуская соответствующие доказательства, которые и здесь остаются очень простыми, укажем лишь результат: кроме групп K1 — K4, существуют еще группы только следующих двух типов.

5. Группа симметрий К5 состоит из n отражений относительно прямых, проходящих через О, делящих плоскость на 2n равных углов, и

Рис. 16.

Рис. 17.

Рис. 18.

Рис. 19.

из поворотов на углы, кратные 360°/n. Такой группой симметрии обладает, например, правильный n- угольник (рис. 18).

6. Группа симметрии К6 состоит из всех поворотов около О и отражений относительно всевозможных прямых, проходящих через центр О. Это — случай полной круговой симметрии, примером которой может служить симметрия ненаправленной окружности или ненаправленного кругового кольца.

Группы симметрий бесконечных плоских фигур. Нахождение всевозможных групп симметрий бесконечных плоских фигур — задача более сложная. Конечно, практически нам никогда не бывает дана вся бесконечная плоскость. Однако кусок плоскости часто бывает покрыт столь мелкими фигурами, что сам кусок представляется по сравнению с ними бесконечно большим. Например, гладко отшлифованная плоскость куска стали оказывается покрытой узорами микроскопических размеров. Правильность этих узоров свидетельствует о внутренней однородности структуры металла.

Другим примером могут служить росписи стен и тканей повторяющимися фигурами. Искусство такой росписи — искусство орнамента — широко развито у большинства народов, начиная с древнейших времен и кончая нашими днями. На рис. 19 дан образец египетской росписи потолка, восходящей к середине второго тысячелетия до нашей эры.

Уже для групп симметрий конечных фигур мы были принуждены