Энциклопедия элементарной математики / Акад. пед. наук РСФСР ; под ред. П. С. Александрова, А. И. Маркушевича и А. Я. Хинчина. — Кн. 1: Арифметика. — М. ; Л. Госиздат, 1951. — 448 с. — Библиогр. в конце статей и в прим. — Алф. указ.: с. 442—448.

ЭНЦИКЛОПЕДИЯ ЭЛЕМЕНТАРНОЙ МАТЕМАТИКИ

I

АРИФМЕТИКА

АКАДЕМИЯ ПЕДАГОГИЧЕСКИХ НАУК РСФСР

ЭНЦИКЛОПЕДИЯ ЭЛЕМЕНТАРНОЙ МАТЕМАТИКИ

ПОД РЕДАКЦИЕЙ

П. С. АЛЕКСАНДРОВА, А. И. МАРКУШЕВИЧА и А. Я. ХИНЧИНА

КНИГА ПЕРВАЯ

АРИФМЕТИКА

ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО ТЕХНИКО-ТЕОРЕТИЧЕСКОЙ ЛИТЕРАТУРЫ

МОСКВА 1951 ЛЕНИНГРАД

11-5-2

Редактор А. 3. Рывкин. Техн. редактор Н. Я. Мурашова.

Подписано к печати 12/XII 1950 г. Бумага <SQX92Vie- 14 бум. л. 28 печ. л. 30,11 уч.-изд. л. 44.444 печ. знак, в печ. л. Т-09193. Тираж 50000 экз. Цена книги 10 р. 55 к. Переплёт 2 р

Заказ № 875.

2-я типография «Печатный Двор» им. А. М. Горького Главполиграфиздата при Совете Министров СССР. Ленинград, Гатчинская. 26.

ОГЛАВЛЕНИЕ

Предисловие.................................... 6

ПРОИСХОЖДЕНИЕ СИСТЕМ СЧИСЛЕНИЯ

(И. Г. Башмакова и А. П. Юшкевич)

Введение ...................................... 11

§ 1. Начальная стадия развития счёта ................. 15

§ 2. Непозиционные системы счисления................ 27

§ 3. Алфавитные системы нумерации.................. 31

§ 4. Поместные или позиционные системы счисления........ 38

§ 5. Распространение позиционного принципа записи чисел в Западной Европе и в России................... 50

§ 6. Дроби................................... 57

Заключение..................................... 72

ПОНЯТИЯ МНОЖЕСТВА, ГРУППЫ, КОЛЬЦА И ПОЛЯ. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АРИФМЕТИКИ

(И, В. Проскуряков)

Введение....................................... 77

Глава I. Множества.............................. 80

§ 1. Понятие о множестве......................... 80

§ 2. Операции над множествами..................... 82

§ 3. Функция, отображение, мощность................. 84

§ 4. Конечные и бесконечные множества............... 89

§ 5. Упорядоченные множества...................... 95

Глава II. Группы, кольца и поля..................... 100

§ 6. Группа.................................. 100

§ 7. Кольцо.................................. 108

§ 8. Поле................................... 113

§ 9. Аксиоматическое построение математики. Изоморфизм . . . 120

§ 10. Расположенные кольца и ноля................... 125

Глава III. Натуральные числа....................... 133

§ 11. Аксиомы натуральных чисел.................... 133

§ 12. Сложение................................ 135

§ 13. Умножение............................... 139

§ 14. Порядок................................. 142

§ 15. Индуктивные определения. Сумма и произведение нескольких чисел................................ 145

§ 16. Вычитание и деление......................... 150

§ 17. Замечания о системе аксиом натуральных чисел....... 152

Глава IV. Кольцо целых чисел....................... 157

§ 18. Принцип расширения в арифметике и алгебре......... 157

§ 19. Эквивалентность и разбиение на классы............ 159

§ 20. Определение кольца целых чисел................. 160

§ 21. Свойства целых чисел........................ 168

Глава V. Поле рациональных чисел................... 172

§ 22. Определение поля рациональных чисел............. 172

§ 23. Свойства рациональных чисел................... 179

Глава VI. Поле действительных чисел.................. 188

§ 24. Полные и непрерывные поля. .................. 188

§ 25. Определение поля действительных чисел............ 202

§ 26. Свойства действительных чисел..................

§ 27. Аксиоматическое определение действительных чисел .... 222

Глава VII. Поле комплексных чисел................... 227

§ 28. Определение поля комплексных чисел.............. 227

§ 29. Свойства комплексных чисел.................... 233

§ 30. Гиперкомплексные числа, кватернионы............. 241

Литература................................... 252

ЭЛЕМЕНТЫ ТЕОРИИ ЧИСЕЛ (А Я- Хинчин)

Глава I. Делимость и простые числа................... 255

§ 1. Введение................................. 255

§ 2. Однозначное разложение чисел на простые множители. . . 256

§ 3. О простых числах........................... 262

Глава II. Метод сравнений.......................... 271

§ 4. Введение................................ 271

§ 5. Сравнения и их основные свойства............... 272

§ 6. Классификация чисел по данному модулю........... 277

§ 7. Сравнения, содержащие неизвестные ............. 282

Глава III. Алгорифм Евклида и цепные дроби............ 291

§ 8. Алгорифм Евклида.......................... 291

§ 9. Элементарная теория цепных дробей . ............ 297

Глава IV. Представление чисел систематическими и цепными дробями................................. 307

§ 10. Введение................................. 307

§ 11. Систематические дроби....................... 308

§ 12. Цепные дроби............................. 315

Глава V. Цепные дроби и диофантовы приближения....... 322

§ 13. Подходящие дроби в роли наилучших приближений..... 322

§ 14. Диофантовы приближения...................... 335

Глава VI. Алгебраические и трансцендентные числа........ 342

§ 15. Теорема Лиувилля и первое появление трансцендентных чисел................................... 342

§ 16. Метод Кантора............................. 347

§ 17. Арифметическая природа классических постоянных..... 349

Литература................................... 352

УСТНЫЙ И ПИСЬМЕННЫЙ СЧЁТ. ВСПОМОГАТЕЛЬНЫЕ СРЕДСТВА ВЫЧИСЛЕНИЙ

(В. М. Брадис)

Глава I. Общие сведения о счёте и приближённых вычислениях 357

§ 1. Общие соображения об изучении счёта в школе........ 357

§ 2. Счёт устный............................... 359

§ 3. Счёт письменный............................ 362

§ 4. Вспомогательные средства вычисления.............. 365

§ 5. Приближённые значения....................... 377

§ 6. Различные способы оценки точности приближённых значений. 380

§ 7. Обработка результатов измерений................. 383

Глава II. Учёт погрешностей....................... 388

§ 8. Вычисления со строгим учётом погрешностей по способу границ.................................. 388

§ 9. Вычисления со строгим учётом погрешностей по способу границ погрешностей......................... 392

§ 10. Предельные погрешности результатов действий над приближёнными значениями. Правила подсчёта цифр...... 400

§ 11. Средние квадратические погрешности результатов действий над приближёнными числами. Принцип академика А. Н. Крылова............................. 405

§ 12. Распределение погрешностей в результатах вычислений . . 411

§ 13. Практические применения правил подсчёта цифр. Сводка этих правил............................... 413

Глава III. Различные вопросы....................... 421

§ 14. Приближённые формулы. Сокращённые приёмы действий . 421

§ 15. Математические таблицы...................... 427

§ 16. Графические вычисления...................... 429

§ 17. Счётная логарифмическая линейка................ 431

§ 18. Вычислительная работа в разные годы обучения....... 437

Литература .................................. 441

Алфавитный указатель......................... 442

ПРЕДИСЛОВИЕ

Издание «Энциклопедии элементарной математики» задумано Академией педагогических наук РСФСР как пособие для учителей математики средней школы и студентов физико-математических факультетов педагогических и учительских институтов. Его назначение— дать систематическое изложение научных основ школьного предмета математики. Отсюда вытекают особенности этого издания. Прежде всего труд этот не может служить для первоначального изучения предмета. Он предназначается для людей, изучавших элементарную математику и уже ставших или готовящихся стать преподавателями элементарной математики. Он не следует, как правило, ни порядку, ни способу изложения математики в средней школе, так как то и другое обусловлено возрастными особенностями учащихся и общеобразовательными целями средней школы, т. е. соображениями, которые не играют роли по отношению к подготовленному читателю-профессионалу. Логика нашего издания — это логика систематического, по возможности простого и доступного, изложения тех вопросов математической науки, из которых строится школьный курс, а также и тех, которые хотя и не находят в этом курсе прямого выражения, однако необходимы для правильного и сознательного его понимания и создают перспективы для дальнейшего развития содержания и методов школьного курса.

Всё издание рассчитано на 7 книг объёмом от 350 до 450 страниц в каждой. Хотя эти книги и их разделы подчинены единому плану, всё же, как правило, ими можно пользоваться независимо одна от другой. Более того, разделы этих книг также могут читаться в большой мере независимо друг от друга. В то же время в отдельных статьях книги встречаются ссылки на ту или иную статью «Энциклопедии»1). Вот общий план издания:

Книга первая. Арифметика.

Происхождение систем счисления. Понятия множества, группы, кольца и поля; теоретические основы арифметики. Элементы теории чисел. Устный и письменный счёт; вспомогательные средства вычислений.

1) Ссылки на статьи из той же книги сопровождаются указанием соответствующих страниц; при ссылках на статьи, помещённые в других книгах «Энциклопедии», указывается «См. Э. э. м.» и приводятся номер книги и название статьи.

Книга вторая. Алгебра.

Векторные пространства и линейные преобразования. Кольцо многочленов и поле рациональных функций. Численные и графические методы решения уравнений.

Книга третья. Анализ.

Функции и пределы; рациональная, степенная, показательная и логарифмическая функции; тригонометрические функции и обратные им. Элементы дифференциального и интегрального исчислений. Элементарные функции комплексного переменного.

Книга четвёртая. Геометрия, часть I.

Топологические понятия. Основания геометрии. Понятие о неевклидовых геометриях. Элементы аналитической и проективной геометрии. Геометрические преобразования. Измерение площадей, длин, объёмов и поверхностей.

Книга пятая. Геометрия, часть II.

Многоугольники и многогранники. Круги и сферы. Применения к геодезии и астрономии. Замечательные кривые и поверхности. Задачи на построение. Методы графических изображений.

Книга шестая. Различные вопросы.

Комбинаторика. Элементы теории вероятностей и математической статистики. Знаменитые математические задачи. Математические парадоксы и софизмы. Математические развлечения и игры.

Книга седьмая. Методология и история математики.

Математика и её место среди других наук, основные этапы её развития, методы и задачи. Очерк истории математики. Математика в Советском Союзе. Приложение. Терминологический словарь.

Первая книга открывается статьёй И. Г. Башмаковой и А. П. Юшкевича, посвященной системам счисления и нумерации, рассматриваемым в культурно-историческом разрезе.

Далее идёт обширная статья И. В. Проскурякова, задача которой заключается в построении теоретических основ арифметики. В двух первых главах статьи рассматриваются весьма общие математические понятия, значение которых далеко выходит за пределы арифметики и которые неоднократно используются как в первой книге, так и в дальнейших. Это понятия множества, группы, кольца и поля.

Центральное место в статье занимает аксиоматическое изложение теории натуральных чисел; это — теоретический фундамент всей арифметики. На основе теории натуральных чисел развёртывается в порядке последовательного обобщения теория целых, рациональных, действительных и, наконец, комплексных чисел. Автор знакомит также с дальнейшими обобщениями понятия числа (гиперкомплексные числа). Вся статья в целом принадлежит к числу наиболее

трудных и отвлечённых во всём настоящем издании; трудности здесь коренятся в самом существе дела. Читатель, не заинтересованный в первую очередь вопросами логического обоснования арифметики, может опустить эту статью, обращаясь по мере надобности для справок к её первым двум главам.

Статья А. Я. Хинчина излагает наиболее элементарные и важные вопросы теории чисел. Сюда относятся вопросы, связанные с теорией делимости, в частности теория цепных (непрерывных) дробей и вопросы приближения иррациональных чисел посредством рациональных.

Наконец, статья В. М. Брадиса посвящена вопросам округления чисел, правилам приближённых вычислений, подсчёта погрешностей и вспомогательным средствам вычислений, включая логарифмическую линейку.

Существенным дополнением к первой книге должны служить сведения об этапах исторического развития понятия числа, о постепенном и весьма длительном формировании общего понятия натурального числа, о развитии понятия дроби, о том прообразе позднейшей теории действительных положительных чисел, который сложился у древних греков (в «Началах Евклида»), о развитии понятия отрицательных и комплексных чисел в связи с теорией уравнений, а впоследствии — аналитической геометрией и анализом. Эти сведения не выделяются нами в отдельную статью; они включаются в общий очерк истории математики, помещаемый в последней книге всего издания.

Редакция

И. Г. БАШМАКОВА и А. П. ЮШКЕВИЧ

ПРОИСХОЖДЕНИЕ СИСТЕМ СЧИСЛЕНИЯ

ВВЕДЕНИЕ

Целью всякой нумерации является изображение любого натурального числа с помощью небольшой группы индивидуальных знаков. Этого можно было бы достичь при помощи одного единственного знака 1 (единицы). Каждое натуральное число тогда записывалось бы путём повторения символа единицы столько раз, сколько в этом числе содержится единиц. Сложение свелось бы к простому приписыванию единиц, а вычитание — к их вычёркиванию. Лежащая в основании такой системы идея весьма проста, однако система эта является крайне неудобной. Для записи больших чисел она практически неприменима и ею пользовались только народы, счёт которых не простирался дальше одного-двух десятков.

Наиболее совершенным принципом записи чисел является тот, на котором основана наша десятичная система нумерации. В этой нумерации все числа от 1 до 9 обозначаются индивидуальными символами 1, 2, 3, ... , 9. К ним присоединяется знак 0 для нуля. Любое натуральное число может быть изображено при помощи только этих десяти знаков по принципу поместного или позиционного значения.

Всякое натуральное число п однозначно представимо в виде

п = ат10т + ат_110т-1+ ... -fai10 + a0,

где at могут принимать значение 0, 1, 2, ... , 9. Тогда число п в позиционной системе запишется так:

п = атат_1 ... ata0.

Каждый символ а£ получает значение, определяемое: 1) его начертанием, 2) его положением в записи числа. Если, например, мы хотим записать четыре тысячи, мы должны поставить цифру 4 на четвёртое место, считая справа; остальные три разряда в данном случае отсутствуют, поэтому на их место ставятся нули: 4000. Таким же образом символ 4 может означать 4 единицы, 4 десятка, 4 сотни и т. д., смотря по тому положению, которое он занимает.

Несмотря на кажущуюся простоту такой системы записи, она явилась продуктом длительного исторического развития, и в создании её принимали участие целые народы. Можно сказать даже, что

создание такой системы является делом всего человечества. Известный французский математик и физик XVIII — XIX вв. Лаплас писал: «Мысль выражать все числа 9 знаками, придавая им, кроме значения по форме, ещё значение по месту, настолько проста, что именно из-за этой простоты трудно понять, насколько она удивительна. Как нелегко было притти к этой методе, мы видим на примере величайших гениев греческой учёности Архимеда и Аполлония, от которых эта мысль осталась скрытой».

В качестве основания позиционной системы могут быть взяты и другие числа, отличные от 10. Многие учёные, например, считали, что более удобным основанием было бы число 12, имеющее больше делителей: 2, 3, 4, 6. Особенно широкое распространение десятичной системы связано с количеством пальцев на наших руках. На это обстоятельство впервые обратил внимание Аристотель в своих «Проблемах». Десятичная система на самом деле не обладает какими-либо особыми преимуществами, выделяющими её из позиционных систем с другим основанием. Выбор основания является принципиально произвольным. Разумеется, оно не должно быть слишком большим, так как в этом случае система будет содержать слишком много цифр, очень громоздка будет в ней таблица умножения и т. д. С другой стороны, оно не должно быть и слишком маленьким1).

Свидетельством того, что не во все эпохи системы нумерации совпадали с нашей современной, служит уже наша речь. В названиях числительных вовсе не заметно того единообразия, которое имеет место в их записи. Так, в нашем родном языке, кроме различных названий для девяти первых натуральных чисел 1, 2, ... , 9 и нуля, имеется специальное название для десяти (тогда как при письме мы обозначаем десять, как 10, т. е. с помощью 1 и 0). Такие же специальные названия существуют для ряда единиц высших разрядов: сорок2), сто, тысяча, миллион и т. д.

Далее, числа, начиная с 11 до 19, мы называем одиннадцать, ... , девят-на-дцать, т. е. называем некоторое число от 1 до 9 с добавлением «на десять». Частица «на» здесь, очевидно, не означает умножения, и о её происхождении мы скажем ниже.

Числа от 21 до 99 произносятся большею частью по тому же принципу, по которому они записываются: два-дцать один (два-десять один), тридцать два и т. д. Исключениями служат числительные сорок и девяносто3). Числа, имеющие индивидуальные, не

1) Сущность нумерации с произвольным основанием была впервые разобрана Б. Паскалем в сочинении De numeris multiplicibus ex sola characterum numericorum additione agnoscendis («О делимости чисел, выведенной с помощью одного сложения их цифр», 1654, опубл. 1665).

2) Число 40 в русской нумерации и у многих народов Востока играло особую роль, о чём будет сказано ниже.

3) Слово девяносто не относится к узловым (см. ниже). Есть предположение, что оно возникло как сочетание «девять до ста».

разложимые на составные числительные наименования (один, два, десять, сорок, сто, тысяча, .. .), мы будем называть узловыми. Числа, наименования которых получаются комбинированием наименований узловых чисел, мы будем называть алгорифмическими. Как мы увидим, отличие в наименовании тех и других отражает отличие в их происхождении1).

Аналогичные явления имеют место и в других языках. Например, во французском языке сохранились явные остатки двадцатиричной непозиционной системы. Двадцать является тем новым узловым числом, название которого не складывается из названий первых десяти чисел: vingt. Число 80 произносится, как «четыре-двадцать», quatre-vingts, 90—как «четыре-двадцать-десять», quatre-vingts-dix, 120 — как «шесть-двадцать», six-vingts. В старофранцузском языке, кроме того, 140 произносилось, как «семь-двадцать», 160 — как «восемь-двадцать», 300 — как «пятнадцать-двадцать» и т. д. В романских, немецком, английском языках, как и в русском языке, имеются специальные названия для ста, тысячи и т. д. Следы двадцатиричной системы сохранились, кроме французского, в английском, голландском языках. Так, по-английски слово score означает наряду с иными понятиями число 20, a three score, т. е. «три-двадцать»,— шестьдесят. В скандинавских языках сильны, кроме того, следы пятиричной системы.

Таким образом:

1) современная письменная система счисления является строго позиционной, а устная не является строго позиционной;

2) письменная является строго десятичной, устная сохраняет следы существования пятиричной и иных систем;

3) в письменной системе существует только десять узловых чисел 0, 1, 2, ... , 9, в устном счёте имеются и другие узловые числа, каждое из которых служит основанием своей местной системы, т. е. основанием некоторого отрезка числового ряда, а не всего числового ряда (например, в русском языке, начиная от ста, счёт идёт путём комбинирования ста с меньшими узловыми или алгорифмическими числами: сто один, сто два и т. д.).

Можно заметить, что наша устная речь отражает более раннюю стадию счёта, чем наша нумерация. Так, например, римская письменная нумерация, предшествовавшая появлению нашей позиционной системы, родственна по своей структуре устной нумерации современных европейских народов.

1) Различение «перстов» (числа до 10), «составов» (целых десятков) и «сочинений» (прочие числа в пределах до ста) имеется в «Арифметике» Л. Магницкого (1703). Наиболее ранний известный пример подобного распределения чисел встречается у Герберта в X в. (digiti, articuli, compositi). Очевидно, что мы имеем здесь дело с отражением того же разделения чисел на узловые и алгорифмические. Несомненна также связь терминов «персты» и «суставы» с пальцевым счётом.

Узловыми числами в римской нумерации являются: I — единица, V — пять, X — десять, L-—пятьдесят, С — сто, D — пятьсот, M — тысяча. Нуля там нет. Система эта является десятичной непозиционной с сильными следами пятиричной системы (индивидуальные символы для 5, 50, 500). Все алгорифмические числа получаются в результате сложения и вычитания узловых. Например, число 1948 в этой системе запишется так: MCMXLVIII.

Примерно в том же отношении, в каком римская письменная нумерация находится к современному устному счёту, способы счёта многих так называемых «первобытных» народов находились к римской системе нумерации. Уже из сказанного понятно, что для выяснения происхождения систем счисления (как современной позиционной, так и непозиционных) мы должны будем использовать и этнографический и языковедческий материал.

§ 1. Начальная стадия развития счёта

Понятие числа является одним из основных понятий современной математики. Оно является и одним из древнейших понятий. Все культурные народы, обладавшие письменностью, уже имели понятие о числе и те или иные системы счисления. О понятии числа в доисторические времена мы можем судить лишь по косвенным данным. Источником здесь является, во-первых, языкознание, во-вторых, этнография, позволяющая на основании изучения культуры народов, стоящих по классификации Энгельса на стадии дикости и варварства, судить об аналогичных периодах жизни предков современных культурных народов. К сожалению, долгое время собирание этнографического материала составляло монополию миссионеров и колонизаторов. А к концу XIX в., когда ходом развития науки внимание учёных было с особенной силой обращено к доисторическим временам жизни человечества, то оказалось, что так называемых «первобытных» народов почти нет. Империалистическая политика капиталистических стран привела к этому времени к почти поголовному истреблению многих туземных племён. Так, например, австралийское племя тасманийцев к началу XX в. было совершенно уничтожено. То же произошло и с когда-то многочисленным племенем абипонов— обитателей Южной Америки.

При восстановлении стадий развития числа приходится, таким образом, довольствоваться весьма скудным материалом. Однако вопрос о происхождении этого понятия настолько важен, что и та неполная картина, которую удаётся воссоздать, имеет большое значение, в частности для разоблачения существующей буржуазной идеалистической «теории», согласно которой понятие числа и даже всего натурального ряда является у человека врождённым. Известно, например, ходячее изречение Кронекера: «Целые числа создал господь бог, всё остальное — дело рук человеческих». Изучение начальных этапов развития числа и других основных математических понятий полностью опровергает подобные буржуазные «теории». Объективное исследование показывает связь происхождения этих понятий с производственной практикой коллективов первобытных обществ, выясняет, что сама наша «интуиция» не является категорией неизменной и что даже самые, казалось бы, «изначальные»

наши понятия вовсе не являются в действительности врождёнными. Изучение начальных этапов развития числа покажет нам, что и целые числа были созданы людьми, что и они — дело рук человеческих.

Среди буржуазных учёных XIX в. (Тейлор и др.) было также распространено мнение, что «первобытный» человек получал все свои знания о мире путём наблюдения явлений природы, сопоставления с ранее виденным и логических выводов. «Первобытный» человек при этом выступал как некий философ-созерцатель. В действительности человек начал не с теоретизирования, а с труда, с борьбы за существование, не с пассивного наблюдения природы, а с преобразования её.

Маркс в «Замечаниях на книгу А. Вагнера» писал, что отношение человека к природе с самого начала выступает не как теоретическое, а как практическое, т. е. основанное на действии. «Как и всякое животное, они (т. е. люди первобытного общества.— Авторы) начинают с того, чтобы есть, пить и т. д., т. е. не „стоять" в каком-нибудь отношении, а активно действовать, овладевать при помощи действия известными предметами внешнего мира и таким образом удовлетворять свои потребности»1).

Труд, — писал Энгельс в «Диалектике природы», — есть «первое основное условие человеческого существования, — и это в такой мере, что мы в известном смысле должны сказать: труд создал самого человека»2). Именно в процессе труда были созданы и такие основные понятия, как число, натуральный ряд, фигура, были выработаны простейшие правила счёта и навыки измерения длин, площадей и объёмов.

При этом понятия числа и фигуры и их основные свойства явились отражениями свойств и отношений реальных предметов внешнего мира.

«Понятия числа и фигуры, — писал Энгельс, — заимствованы именно из действительного мира. Десять пальцев, на которых люди учились считать, т. е. производить первое арифметическое действие, представляют что угодно, но только не свободное творение рассудка. Для счёта необходимы не только объекты счёта, но также уже и способность, при рассмотрении этих объектов, отвлекаться от всех их свойств, кроме их числа, а эта способность — продукт долгого исторического эмпирического развития»3).

Посмотрим же, каковы были представления о числе и натуральном ряде на первых стадиях культурного развития человечества, и проследим, как, постепенно меняясь и совершенствуясь, они достигли современного уровня.

1) К. Маркс и Ф. Энгельс, Сочинения, т. XV, стр. 461.

2) К. Маркс и Ф. Энгельс, Сочинения, т. XIV, стр. 452.

3) К. Маркс и Ф. Энгельс, Сочинения, т. XIV, стр. 39.

К сожалению, материалы, имеющиеся в нашем распоряжении, не позволяют достаточно определённо связать различные этапы развития счёта с данной Энгельсом в работе «Происхождение семьи, частной собственности и государства» периодизацией доисторических ступеней культуры.

Ещё и в наше время известны народы, в языке которых имеются только два числительных: один и два. У многих племён Австралии и Полинезии в самое недавнее время этим дело и ограничивалось. При помощи сочетания названных числительных эти племена образуют числа 3 = два-один, 4 = два-два, 5 = два-два-один, 6 = два-два-два. Так, например, у западных племён островов Торресова пролива единственными числительными являются 1—урапун и 2 — окоза. Далее они считают 3 = окоза-урапун, 4 = окоза-окоза, 5 = = окоза-окоза-урапун, 6 = окоза-окоза-окоза. Этот способ счёта положил начало древнейшей из всех систем счисления — двоичной системе1). Следы её мы находим неоднократно в египетском способе умножения и деления, в системе египетских дробей2), в том, что во многих языках, например в старославянском, наряду с единственным и множественным числами имеется и двойственное число3).

1) Для устной и письменной нумерации двоичная система неудобна, так как запись чисел , в ней слишком длинна (например, число 777 в ней запишется 1100 001 001), но она имеет и существенные преимущества.

На принципиальные достоинства двоичной системы первый обратил внимание Лейбниц, отмечавший особую простоту операций в ней (таблицы сложения и умножения сводятся к 1 + 1 = 10, 1 • 1 = 1; при делении не нужны догадки и пробы). Лейбниц не рекомендовал эту систему взамен десятичной для практического счёта, но подчёркивал, что «вычисление с помощью двоек, т. е. 0 и 1, в вознаграждение его длиннот, является для науки основным и порождает новые открытия, которые оказываются полезными впоследствии, даже в практике чисел, а особенно в геометрии: причиной чего служит то обстоятельство, что при сведении чисел к простейшим началам, каковы 0 и 1, всюду выявляется чудесный порядок» (в Explication de l'arithmétique binaire, qui se sert des seuls caractères 0 et 1, avec des remarques sur son utilité, 1703 в Leibnizens mathematische Schriften, hsg. v. С. I. Gerhardt, т. VII, Halle, 1863, стр. 225; ср. там же письма Лейбница к Шуленбургу от 1698 г.). Действительно, двоичная система оказалась весьма удобной в ряде теоретических исследований.

Лейбниц, однако, не предвидел, что двоичная система принесёт пользу в вычислительной математике, — именно будет положена в основу устройства электронных счётных машин, как это произошло в последнее время. Производство вычислений на таких машинах с избытком компенсирует затрату труда на переход от десятичной системы к двоичной в начале операций и обратный переход в окончательном результате. См. Л. Д. Кудрявцев, О принципах производства арифметических операций на вычислительных машинах. Успехи математических наук, т. V, вып. 3 (1950).

2) См. в параграфе, посвященном дробям, о роли половинного ряда в старинных русских дробях.

3) В некоторых языках существовало и тройственное число как пережиток троичной системы. На особую древность первых трёх числительных указывает и то обстоятельство, что во многих языках они в отличие от остальных числительных изменяются по родам (один, одна, одно; два, две; лат. tres, tria).

О числах выше 6 островитяне Торресова пролива говорят «много-много», «множество» или «неисчислимо»1). У некоторых племён слова «много», «неисчислимо» применяются для обозначения всех чисел ^ 3.

Таким образом, на этой стадии натуральный ряд является конечным и состоит подчас только из двух членов.

Но не следует думать, что племена, у которых существуют числительные только для единицы и для двух, не умеют сосчитывать совокупности, состоящие более чем из двух или шести предметов. Человек научился в известном смысле «считать» задолго до того, как появились названия чисел. Один из наблюдателей пишет об абипонах, у которых существовали лишь числительные один, два и три, что, сбираясь на охоту, они, сидя уже в седле, осматриваются вокруг, и если нехватает хотя бы одной из многочисленных собак, которых они содержат, то они принимаются звать её. Наблюдателя особенно удивило, каким образом, не умея считать, абипоны способны были сейчас же сказать, что среди такой значительной своры нехватает одной собаки.

Дело в том, что на этой стадии численность воспринимается как одно из свойств совокупности предметов, характеризующее эту совокупность наряду с другими свойствами: цветом, формой, размером и т. д. А именно, это свойство характеризует совокупность, во-первых, со стороны её целостности (все ли предметы данной совокупности имеются налицо), а во-вторых, в чисто порядковом соотношении с другими совокупностями, составленными из тех же предметов (больше или меньше одна совокупность, чем другие).

Очевидно, такой «счёт» был достаточен только на той стадии развития человечества, когда, грубо говоря, нечего было считать, когда ещё хозяйство племени стояло на очень низком уровне, а межплеменные связи не были налажены.

Итак, на первой стадии развития числа оно представляет собой отдельные числа-свойства или числа-качества конкретных совокупностей предметов с едва намечающимися порядковыми соотношениями.

В настоящее время уже не известны народы, счёт которых остановился бы на этой первой стадии, соответствующей в основном первой и второй ступеням дикости. «Счёт» числами-свойствами сохранился у некоторых племён только в качестве пережитка.

1) Следы того, что число 7 служило одновременно для обозначения неопределённой множественности и у наших предков, сохранились в русском языке в виде пословиц и поговорок, например: «Семеро одного не ждут», «Семь раз отмерь, один раз отрежь», «У семи нянек дитя без глаза» и т. д. Во всех этих пословицах слово «семь», очевидно, употребляется в смысле «много».

С изобретением лука и стрел, с переходом к систематическим охотам, с расселением деревнями и налаживанием связей, сначала — между отдельными деревнями, а затем и между племенами, короче — с переходом к высшей ступени дикости старый «счёт» числами-свойствами оказался уже недостаточным. Нужно было уже не только уметь определять «на-глаз» численность некоторой совокупности, но и уметь сообщать о её численности. Например, нужно было передать нескольким племенам, что через определённое количество новолуний назначается сбор для переговоров или совместной охоты, или передать, чтобы все союзные племена через определённый срок выставили бы некоторое число воинов. Для этого арунта (австралийцы) и полинезийцы пользуются следующим способом: когда число, подлежащее счёту, оказывается большим, туземцы прибегают к помощи различных частей тела, из которых каждая имеет своё название и своё точно обусловленное место в этой системе счисления. Определённое число перечисленных таким образом частей тела, начиная с мизинца одной из рук, означает такое же число воинов, дней или месяцев, судя по обстоятельствам.

Счёт обычно начинается с мизинца левой руки, перебираются все пальбы, затем переходят к запястью, локтю, плечу и т. д. до мизинца правой руки, после чего, если совокупность ещё не исчерпана, идут в обратном порядке. В деловых отношениях туземцу достаточно вспомнить, до какой части своего тела он дошёл при подсчёте предметов и, воспроизведя счёт, начиная со своего левого мизинца, вновь найти искомое число.

У островитян Торресова пролива на человеческом теле изображаются таким образом числа до 33. Если пересчитываемая совокупность имеет более 33 членов, то они прибегают к пучку палочек. Именно то обстоятельство, что при исчерпании всех частей тела, каждая из которых индивидуализирована, люди прибегают к пучку палочек (причём все палочки пучка примерно одинаковы), даёт нам ключ к пониманию первоначального назначения такой «живой» шкалы. Ясно, что сначала она была нужна не для индивидуализации чисел, а лишь для установления равночисленности двух совокупностей, или, иначе, для установления взаимно однозначного соответствия между предметами обеих этих совокупностей.

Пережитки такого способа счёта сохранились у многих племён, стоявших на более высокой стадии развития. Так, некоторые из них для тех же целей пользовались верёвкой с узелками, другие — чётками или просто бирками (деревянные палочки с зарубками). Племена Перу вели запись чисел при помощи верёвок с узелками (так называемое квипу, рис. 1). Верёвки связывались по четыре вместе и к ним присоединялась пятая верёвка, на которой при помощи узлов выражалось число, являющееся суммой чисел на первых четырёх верёвках. Узлы, обозначающие единицы, десятки и

Рис. 1

сотни в данном числе, были различной формы. В период владычества инков (XI—XVI вв. н. э.) при помощи таких квипу «записывались» настоящие бухгалтерские отчеты. Такие верёвки с узелками служили только для записи чисел1). Для производства арифметических операций употреблялись камешки или зёрна маиса.

Однако число на этой стадии не воспринималось как то общее, что имеют между собой все равночисленные совокупности. Тогда просто удовлетворялись констатированием равночисленности.

В тех случаях, когда сосчитываемая совокупность содержала небольшое количество предметов (^20), обычно выбиралась некоторая определённая совокупность из множества совокупностей, имеющих одинаковое число предметов, и про остальные совокупности этого множества говорили, что в них столько же предметов, сколько в этой выбранной. Например, чтобы выразить, что в некоторой совокупности пять предметов, говорили, что в ней столько же предметов, сколько пальцев на руке. Общее свойство всех равночисленных конечных множеств — число — выражалось через свойство «особенного» множества, некоторого выбранного частного множества из этой совокупности. Интересно, что у племён, стоящих на отмеченной стадии развития, применяется тот же приём для образования и других понятий. Так, у тасманийцев не было слов для обозначения общих понятий вроде твёрдый, горячий, холодный, круглый и т. д. Для обозначения твёрдости они говорили «как камень», чтобы выразить, что предмет круглый, говорили «как луна» или «как шар». То же имело место и для обозначения цветов. На этой стадии нет и таких общих понятий, как дерево или рыба, но существуют отдельные слова для обозначения каждого вида рыб или деревьев.

Итак, эта фаза в истории возникновения отвлечённых чисел характеризуется изображением сосчитываемых множеств при помощи частей тела, особенно пальцев рук и ног, палочек, узлов верёвки и т. д. Несмотря на крайнюю примитивность этого способа изображения, он сыграл исключительную роль в развитии понятия числа. Действительно, существенной стороной этого приёма является то, что в нём мы имеем способ изображения всех

1) Геродот следующим образом описывает распоряжение Дария, данное им ионийцам после переправы через реку Истр во время предпринятого им похода на скифов (VI в. до н. э.): «После этого царь завязал на ремне шестьдесят узлов, позвал на совещание всех ионийских тиранов и сказал им: „прежде высказанное мною решение относительно моста, ионийцы, я отменяю; теперь возьмите этот ремень и поступите так: начиная как раз с того времена, когда я пойду на скифов, развязывайте на ремне каждый день по одному узлу; если бы за этот промежуток времени я не явился бы назад и миновало бы число дней, обозначенное узлами, плывите обратно на родину; а до той поры оберегайте мост, приложите всяческое старание к защите его и сохранению в целости"».

исчисляемых множеств при помощи одной определённой системы, приведённой с ними в соответствие.

Такой способ счёта при своём дальнейшем развитии привёл к созданию пятиричной, десятичной и двадцатиричной систем счисления. Например, жители Миралуги (остров в Торресовом проливе) говорят: 5 = набигет, 10 = набигет, набигет, 15 = набикоку, 20 = набикоку, набигет. Гет означает руку, коку — ногу. При этом наблюдатель добавляет: «Не следует думать, что набигет является именем числительным 5, оно выражает только, что дело идёт о стольких же предметах, сколько на руке пальцев».

По сообщению нашего замечательного учёного-путешественника Н. Н. Миклухи-Маклая туземцы новой Гвинеи считают следующим образом: «Излюбленный способ счёта состоит в том, что папуас загибает один за другим пальцы руки, причём издаёт определённый звук, например, „бе, бе, бе"... Досчитав до пяти, он говорит „ибон-бе" (рука). Затем он загибает пальцы другой руки, снова повторяет „бе, бе"..., пока не доходит до „ибон-али" (две руки). Затем он идёт дальше, приговаривая „бе, бе"..., пока не доходит до „самба-бе" и „самба-али" (одна нога, две ноги). Если нужно считать дальше, папуас пользуется пальцами рук и ног кого-нибудь другого»1).

Аналогичные наименования числительных зарегистрированы и у многих других племён. С этой стадией развития числа и счёта связан получивший широкое распространение счёт на пальцах (так называемый инструментальный счёт). С пальцевым счётом, как говорилось, связано было и деление на «персты» и «суставы».

Все вышеописанные стадии развития, числа можно отнести ориентировочно к периоду дикости.

С дальнейшим развитием общества всё больший круг совокупностей попадает в число сосчитываемых. Простое установление равночисленности и ручной счёт уже не могут удовлетворять новых потребностей коллектива; хотя ручной способ счёта в качестве пережитка сохраняется ещё долгое время2), но основная линия развития, приведшая к созданию натуральных чисел, пошла в другом направлении. Появившаяся новая система счёта может быть названа групповой или иначе счётом при помощи чисел-совокупностей.

Зародыши такого счёта имелись и на более ранних ступенях развития. Так, наблюдатели отмечают у островитян западной части

1) Н. Миклухо-Маклай, Путешествия, Изд. АН СССР, 1940, т. I, стр. 280.

2) Ещё в 1529 г. в Базеле вышла написанная задолго до того книга Беды Достопочтенного (672—735), в которой излагаются способы счёта на пальцах, причём счёт этот распространяется на все числа вплоть до миллиона. Сравнительно до недавнего времени счётом на пальцах пользовались китайские и монгольские купцы.

Торресова пролива «отчётливо выраженную склонность считать группами по два, попарно». То же самое отмечает другой наблюдатель относительно счёта на острове принца Йоркского. При этом счёт одних предметов ведётся по преимуществу парами, других — десятками или сотнями и т. д. Таким образом, при счёте определённого вида предметов предметы эти всегда соединяются в определённые, устойчивые группы. В качестве пережитка такого счёта упомянем счёт дюжинами, вплоть до наших дней сохраняющийся в Европе для некоторых групп вещей (рубашки, стулья, посуда, карандаши, резинки, перья). При этом дюжина образовывала единицу счёта, дюжина дюжин составляла гросс, а дюжина гроссов — массу1). Особенное распространение такой счёт имел у племён, стоявших на первых двух ступенях варварства. Постепенно каждая такая устойчивая группа получала название, которое выражало как вид сосчитываемых предметов, так и их число. Такого рода группы, с помощью которых вёлся счёт, мы и будем называть числами-совокупностями.

На островах Фиджи и Соломоновых существуют собирательные имена, обозначающие десятки произвольно подобранных вещей: ни числа в отдельности, ни названия предметов они не выражают. На Фиджи имеются также названия для 100 челноков, 100 кокосовых орехов, для 1000 кокосовых орехов и т. п. Если две такие группы равночисленны, то это обычно отображается в названии соответствующих чисел-совокупностей. Так, у туземцев Флориды на-куа означает 10 яиц, на-банара—10 корзин с продовольствием, но отдельно слово «на», которое соответствовало бы числу 10, не употребляется. На одном из диалектов индейцев Западной Канады слово «тха» означает 3 вещи, тхане — 3 лица, тхат — 3 раза, тхатоэн — в трёх местах и т. д. Но слова, которое бы обозначало отвлечённое число три, там нет. Однако наличие в названиях всех равночисленных совокупностей одной и той же частицы показывает, что на этой стадии уже начинают констатировать, что все такие группы имеют нечто общее, именно, одну и ту же численность. На этой стадии развития не всякой группе предметов приписывается число, только те группы являются числами-совокупностями, которые часто встречаются в хозяйственном или ином обиходе племени. Если в VI в. до н. э. пифагорейцы объявили, что «всё есть число», то можно сказать, что на рассматриваемой стадии развития не всё было числом.

Числа на этой стадии были именованными по существу, отвлечённых чисел ещё не существовало. Постепенно устойчивые числа-совокупности начинают рассматриваться как новые единицы, которыми и ведётся счёт. Уже в этом взгляде на некоторую совокуп-

1) Двенадцатиричная система встречается и ныне у некоторых племён в Судане.

ность предметов как на новую единицу счёта заключена возможность создания системы счисления.

Со временем такими устойчивыми числами-совокупностями стали считать не только данные предметы, для которых эти числа были установлены, но и предметы, сходные с ними по форме или по употреблению. Таким образом, в некоторых первобытных языках образовалось несколько рядов числительных. Так, в языке чимшиенов (Британская Колумбия) имеется семь различных рядов чисел, употребляющихся для счёта 1) неопределённых предметов, 2) плоских предметов, 3) круглых предметов и деления времени, 4) людей, 5) длинных предметов (числа при этом комбинируются со словом дерево), 6) лодок, 7) мер. Пережитки счёта числами-совокупностями наблюдались ещё в Древней Греции. Так, Аристотель в «Метафизике» обсуждает вопрос о том, одинаковы ли единицы в одном и том же числе и являются ли они одинаковыми или различными в разных числах. Ещё Диофант (III в. н. э.) после цифр, выражающих некоторое число, всегда ставил M — первую букву слова julovœç — единица, т. е. записывал число некоторых одинаковых между собой единиц.

Под влиянием обмена один из рядов чисел начал вытеснять все другие. Это был тот числовой ряд, который служил для счёта денег (ими на первых порах являлись раковины или скот). Имена числительные, — как сообщает один наблюдатель, — представляются уму йорубов (йорубы — племя Центральной Африки) одновременно в двух значениях: во-первых, как число, во-вторых, как та вещь, которую йорубы преимущественно пересчитывают, т. е. «каури» — раковины, играющие у йорубов роль монет. Так возникали универсальные числа, т. е. такие, с помощью которых можно считать любые предметы.

Однако числа-совокупности явились прообразами только наших узловых чисел. Если счёт вёлся десятками, двадцатками или дюжинами некоторых предметов, то описанным только что образом не могли возникнуть, например, числа 17 и 19, т. е. алгорифмические числа. Более того, если бы все числа возникали по описанной схеме, то они существовали бы как не связанные между собой понятия, и количественные отношения между ними были бы совершенно неясны. Мы покажем далее, что алгорифмические числа возникли путём комбинаций узловых чисел как результат операций, производимых над узловыми числами.

При изучении языка кламатов, индейцев Северной Америки, а также племён Британской Колумбии оказалось, что при счёте ими употребляются специальные глаголы, названные исследователями глаголами-классификаторами. Эти глаголы служат для характеристики определённого способа размещения. Если число предметов устойчивой группы, с помощью которой ведётся счёт, равно 10, то первые 10 чисел не сопровождаются этими глаголами. Этот факт

исследователи объясняют особенностями счёта у индейцев. 10 первых сосчитываемых предметов они складывают на землю в стопку или в ряд, а с одиннадцатого предмета начинается новая стопка или ряд. Глаголы-классификаторы не сопровождают также чисел, кратных десяти. Таким образом, эти термины служат только для того, чтобы размещать по разрядам единицу или единицы, следующие за десятками, а не самые десятки. Так, чтобы выразить наличие 26 предметов, индеец должен был сказать: «на дважды десять плодов (или других предметов) я кладу сверху шесть». Таким образом, алгорифмические числа сразу же появляются как результат некоторых операций над узловыми числами. Операции эти вначале были, однако, не арифметическими, а двигательными. Следы этого сохранились во многих языках. Так, у нас в русском языке числительные от 10 до 19 произносятся, как соответствующее число единиц «на-десять»: двенадцать (два-на-десять), пятнадцать (пять-на-десять) и т. д. Здесь частичку «на», повидимому, следует понимать именно в смысле «положить на».

Хорошей иллюстрацией к способу счёта при помощи определённого расположения предметов могут служить числовые обозначения ацтеков1) в XV—XVI вв. Так у ацтеков число 6 обозначалось и т. д. Очевидно, основная группа состояла здесь из пяти предметов. Черта отделяла одну такую группу от следующей. Сама черта числового значения не имела.

Впоследствии непосредственно двигательный характер операций всё более и более утрачивается, и всё более и более выступает арифметический их смысл. Например, в угро-финских языках число 8 определяется как разность между узловым числом 10 и узловым числом 2. Произносится 8 на этих языках, как «два-десять», 80— как «два, сто» и 800 — как «два, десять, сто» (здесь «десять, сто» является обозначением для тысячи).

На этой стадии числовой ряд ещё не мыслится однородным. Узловые числа существуют в нём как некие индивидуальные островки, от которых в ту и в другую стороны располагаются алгорифмические числа. Основную роль в их образовании играет операция сложения, однако наряду с ней принимают участие вычитание и умножение. Так, упомянутые выше йорубы имеют следующую систему чисел:

11 = 10+1, 12 = 10 + 2, 15 = 10 + 5,

16 = 20 — 4, 17 = 20 — 3, . ., 19 = 20— 1.

Число 20 является новым узловым; с его помощью образуются дальнейшие числа, причём в их образовании принимают участие как

1) Индийское племя, проживающее в Мексике,

сложение и вычитание, так и умножение. Число 70 в этой системе получается, как 20-4— 10, 190 — как 20-10—10. Аналогичные приёмы сохранились в римской нумерации. Например, число XVIII читалось по-латыни: duo de viginti, т. е. 2 из 20.

Но числовой ряд на этой стадии не только не является однородным, он не является и неограниченным. С развитием понятия числа он сначала лишь всё более удлиняется. При этом слова «много», «неисчислимо», которые употреблялись раньше для обозначения всех чисел ^3 или ^10, отодвигаются всё дальше, обозначая числа ^100, ^1000 и т. д.1). Следующий шаг заключается в том, что это слово, означающее первоначально неопределённое множество, становится названием чисел 100 или 1000 в зависимости от развитости системы счисления данного народа. Так, например, одно и то же слово означает 3 на острове Менгоне, 10 — на острове Фиджи и 10 000 у маорийцев. Маорийцы и народы названных островов имеют примерно одинаковый язык, хотя и стоят на различных ступенях развития культуры.

Натуральный ряд не мыслился бесконечным ещё долгое время. Из предисловия к «Исчислению песка» Архимеда видно, что даже грекам в III в. до н. э. ещё не было очевидно, что можно выразить сколь угодно большие числа, например большие, чем число песчинок в сфере радиуса, равного расстоянию от Солнца до неподвижных звёзд. Основная цель сочинения Архимеда заключалась именно в создании систематического приёма построения и словесного обозначения сколь угодно больших чисел.

1) Одним из ярких примеров такого рода предельных чисел является число 40, которое служило в русском счёте для обозначения неопределённо большого множества. На такую роль этого числа указывает как его индивидуальное название, так и сохранившееся в качестве пережитка употребление его для обозначения неопределённо большого количества предметов — сорок сороков церквей, сорок сороков чёрных соболей. На ту же роль числа 40 указывает ряд связанных с ним религиозных обычаев и народных поверий: например, сороковой медведь считался последним в жизни охотника

«сорок медведей он взял на рогатину, па сорок первом сплошал»

(Н. А. Некрасов).

В более позднее время, когда число 40 перестало уже быть «предельным», оно стало играть большую роль в русской метрологии в качестве основания системы мер: пуд содержал 40 фунтов, бочка-сороковка — 40 вёдер и т. д.

Сорок играло роль предельного числа и у многих народов Ближнего Востока. Это нашло отражение, например, в знаменитом армянском эпосе «Давид Сасунский»:

«Спустился в яму Мсра-Мелик.

Вот сорок буйволовых шкур взвалили на него,

Огромных сорок жерновов взвалили на него...».

Кончается эпос поминанием всех его героев:

«Великих праотцев наших — сорок раз помянем добром. Сапасара и брата его Богдасара — помянем добром. Мгера старшего сорок раз помянем добром».

§ 2. Непозиционные системы счисления

К моменту возникновения письменности строение числового ряда представлялось примерно так: узловые числа, существовавшие как некие индивидуальные понятия, принимались каждое за основание своей, местной системы счисления. Наименьшее из узловых чисел принималось за основание первой системы. Далее, счёт шёл путём прибавления единиц к этому узловому числу, а также путём удвоения, утроения и т. д. этого числа, т. е. путём образования алгорифмических чисел, до тех пор пока не достигалось следующее узловое число. После этого начиналась следующая местная система счисления, основанием которой служило это второе узловое число, а алгорифмические числа этой второй системы составлялись путём комбинаций второго узлового числа с первым. Такие алгорифмические числа шли до следующего узлового числа, которое служило основанием третьей местной системы счисления и т. д.1).

Схема эта могла быть несколько иной: например, алгорифмические числа могли располагаться по обе стороны от каждого узлового числа, получаясь из него как путём сложения, так и путём вычитания меньших узловых чисел.

При записи, чисел, образованных по первой схеме, получались системы типа египетской иероглифической (табл. 1). Узловыми числами здесь являлись единица ff , десять Я) , сто ^ и тысяча ^2), причём символ для тысячи означал первоначально неопределённое множество.

Эта запись отражает представление о каждом узловом числе как о новой индивидуальности. Из способа записи не видно, что каждое последующее узловое число получается из предыдущего умножением на десять. Все узловые числа имеют абсолютный характер; fj) означает 10 единиц и не может означать, например, 10 десятков или 10 сотен. Алгорифмические числа в египетской системе получаются вполне единообразно при помощи единственной арифметической операции — сложения. Например, число 333 записывается в этой системе так: ^^ЙППООО .

1) Читатель, знакомый с канторовской теорией трансфинитов, легко заметит сходство подобного способа образования натурального ряда со способом, употреблённым Кантором. Действительно, Кантор вводит два принципа образования трансфинитов: 1) взятие кратного и прибавление единицы, 2) введение нового индивидуального числа, рассматриваемого как предел предшествующих. Разница та, что в натуральном ряде это новое число уже дано и всегда достижимо — это просто следующее узловое число.

2) Полагают, что иероглиф <Ь являлся изображением мерительной верёвки, делившейся на 100 частей, а иероглиф для тысячи — изображением цветка лотоса.

Таблица 1

Числовые знаки разных народов

Египетская система интересна ещё по той роли, которую там играет число два. Повидимому, оно служило первоначально основанием системы счисления. Три было уже символом неопределённой множественности. Это видно из того, что для выражения множественного числа некоторого предмета или понятия египтяне под знаком соответствующего иероглифа ставили три чёрточки.

Пережитки двоичной системы отразились в способе умножения египтян, которое они производили путём последовательного удвоения и сложения. Например, для умножения некоторого числа п на 15 египтяне поступали (схематически) так:

п- 15 = л(1 + 2 4- 22 + 23) = п • 1+я.2-|-л .22-f/z.23,

т. е. они представляли множитель по двоичной системе, а затем умножение производилось отдельно на каждый двоичный разряд. Следы двоичной системы носят на себе и египетские дроби, о чём будет сказано ниже.

Системами типа египетской иероглифической являются финикийская, сирийская, пальмирская, критская, греческая геродианова или аттическая (см. табл. 1).

Аттическая или геродианова нумерация1), как показывает само её название, возникла в Аттике. Древнейшая запись по этой системе относится к VI в. до н. э. Числовым знаком для единицы здесь, как и в Египте, является вертикальная черта, повторение которой образует знаки чисел до 4. Число 5 обозначается символом р, 10—Д, 100— Н, 1000— X , 10 000— M. Как теперь установлено (впервые на это обратил внимание ещё в XVII в. Валлис), символы эти являются первыми буквами названий соответствующих чисел. Действительно, пять по-гречески будет îtsvts (в аттических областях Г служила для обозначения буквы П, поэтому писалось TENTE), десять — АЕКА, сто — HEKAT0N, тысяча — XIAI0I и десять тысяч — MTPI0L Числа 50, 500 и 5000 записывались путём комбинирования знака для пяти со знаками для десяти, ста и тысячи: р =50, р =500, р=5000. Остальные числа записывались по аддитивному принципу. Так, число 325 записывалось, как НННДДР. Эта нумерация продержалась в Аттике вплоть до I в. н. э., хотя в других греческих землях она была задолго до того вытеснена более удобной ионийской системой нумерации.

Второй схеме образования натуральных чисел соответствует римская система нумерации. Подобного же типа (с применением вычитания), как мы видели, была и система йорубов. Конечно, римляне не стояли на той же стадии развития, что и йорубы. Римская

1) Геродиан — греческий историк II—III в. н. э., из произведений которого западноевропейские учёные впервые узнали об аттической нумерации.

Таблица 2

Числовые знаки разных народов

нумерация имеет очень древнее происхождение, причём известно, что раньше принцип вычитания применялся ещё шире. Так, 8 обозначалось ИХ. Само начертание «цифр» было заимствовано римлянами у более ранних обитателей Италии — этрусков. Знак для числа десять у этрусков был -j- или X» причём римляне переняли эту последнюю форму. Пять этруски писали \/ или Д — это была половина знака для десяти. Этрусское 50, писавшееся, как j , обратилось сначала в ^, затем в 1 и, наконец, в [_• Римский знак для ста С произошёл от этрусского знака ф, который обратился в ф, а затем и в С, и т. д.

Интересно отметить, что наряду с принципом сложения и вычитания римлянами употреблялся своеобразный принцип «деления». Так, знак для пяти есть половина знака для X. Более отчётливо этот принцип выступает в двадцатиричной непозиционной системе ацтеков. Число 400 там обозначается так: J, 300= J , 200= |

и 100= |! .

Ближе к позиционной системе стоят системы счисления с мультипликативной формой записи. Таковы старая китайская система, в которой мультипликативный принцип применялся, уже начиная с десятков (табл. 2), индусская система чисел карошти (см. табл. 2), где принцип этот применялся, начиная с сотен, и др. В старокитайской системе 20 или 30 изображались схематически, как 2, 10; 3, 10 и т. п. Сто, тысяча и десять тысяч имели индивидуальные обозначения. Сложные числа обозначались по аналогичной схеме, что и числа, кратные десяти. Число 333 записывалось схематически так: 3, 100, 3, 10, 3. В единообразном обозначении единиц высших и низших разрядов уже можно усмотреть первое приближение к позиционности. Подробнее об этом будет сказано в главе о происхождении позиционной системы. Здесь отметим только, что и в нашей устной нумерации играет большую роль мультипликативный принцип (двадцать = два, десять, триста = три, сто и т. д.).

§ 3. Алфавитные системы нумерации

Наиболее совершенной разновидностью непозиционных систем, не считая систем, основанных на мультипликативном принципе, являются алфавитные системы обозначения чисел. Примерами алфавитных систем могут служить ионийская система нумерации (Древняя Греция), славянская система (кириллица и глаголица), еврейская, арабская, а также грузинская и армянская системы нумерации.

Системой счисления, приближающейся по типу к алфавитной, является египетская иератическая система (см. табл. 1), существовавшая наряду с иероглифической уже в Древнем Египте за 2000 лет

до н. э. Она употреблялась в хозяйственных отчётах и других официальных документах, а также в математических папирусах (записи в обоих древнейших математических папирусах: Московском и Райнда сделаны по иератической системе), тогда как иероглифическое письмо применялось, если можно так выразиться, в «парадных случаях» — для надписей на памятниках и обелисках. Иератическое письмо первоначально возникло из иероглифического в результате сокращений и слияний отдельных символов, естественных при всякой скорописи. Однако при этом числа от 1 до 9, которые обозначались при иероглифическом письме простым повторением символа единицы, получили особые индивидуальные обозначения, т. е. впервые появились особые цифры для чисел первого десятка. Такие же индивидуальные символы образовались для обозначения десятков 10—90, сотен 100—900, тысячи, десяти тысяч и 108.

Таким образом, иератическая система счисления принципиально отличалась от иероглифической. На важность этого нового принципа, который можно назвать цифровым, указал ещё в 1911 г. выдающийся русский историк науки В. В. Бобынин1). Ч. Бойер недавно поставил цифровой принцип (по его терминологии — ciphirisation) на одну доску с принципом позиционности. «Введение египтянами идеи цифирного обозначения. — пишет Бойер, — представляет собой решающий шаг в развитии нумерации, и в этом отношении их вклад вполне сравним по значительности со вкладом вавилонян, введших позиционный принцип»2). Однако, как ни велика роль цифрового принципа, справедливо указанная В. В. Бобыниным, утверждение Бойера является сильным преувеличением. Позиционная система, как мы увидим, имеет неоспоримые преимущества перед системами типа иератической, даже если число применяемых цифр невелико, как это имело место в Вавилоне. Однако цифровой принцип был значительным шагом вперёд по сравнению с иероглифическими нумерациями. Мы будем подробнее говорить о его преимуществах в связи с алфавитной системой обозначения чисел. К тому же типу, что и египетская иератическая, относится и сингалезская нумерация. В самом Египте примерно в VI в. до н. э. получило распространение демотическое письмо, являющееся дальнейшим видоизменением иератического; в Греко-римскую эпоху оно стало в Египте общепринятым.

Алфавитная система нумерации впервые, повидимому, была применена в Греции. Древнейшая надпись, сделанная по этой системе, относится к середине V в. до н. э. (Галикарнасс в Малой Азии). Во всех алфавитных системах числа от 1 до 9, все десятки и сотни обозначаются индивидуальными символами при помощи последова-

1) См. В. В. Бобынин, Отзыв о сочинениях Н. М. Бубнова, СПБ, 1911.

2) Ch. Boyer, Fundamental Steps in the Development of Numeration, Isis, 1944, № 100, т. 35, стр. 158.

тельных букв алфавита (табл. 3). В греческой и славянской нумерации над буквами, означающими цифры, чтобы отличать числа от обычных слов, ставилась черта. Все числа до 999 записывались на основе принципа сложения из 27 индивидуальных знаков для цифр. Так как в обычном греческом алфавите только 24 буквы, то для числовых обозначений были использованы ещё три старые буквы: ^ (дигамма) для числа 6, Q (коппа) для 90 и 3 (сампи) для 900 (см- первый столбец табл. 3).

Число 444 по этой системе записывалось так: üjxS. В римской системе нумерации это число имело бы вид: CDXLIV, а в аттической системе ННННДДДДПИ.

Уже этот пример показывает неоспоримые преимущества алфавитных систем. То, что алфавитные системы явились нумерацией нового, более высокого типа, доказывается и всем ходом исторического развития. Возникнув в торговых греческих колониях, ионийская нумерация быстро стала распространяться в Аттике, вытесняя освящённую традицией геродианову систему, которую поддерживали и власти, долгое время разрешавшие применять в официальных документах только геродианову нумерацию.

Здесь мы видим ещё одно подтверждение сталинского положения о развитии через борьбу противоположностей, о неодолимости нового. Несмотря на все рогатки и преграды, несмотря на силу традиции, алфавитная система всё шире распространялась по Аттике. Она окончательно вытеснила геродианову после того, как при Птолемее Филадельфе была принята в Александрии.

Однако ряд историков математики, в том числе М. Кантор и Г. Ганкель, считали, что алфавитная система нумерации является шагом назад даже по сравнению с аттической. Отсюда они делали вывод, что греки, которым вообще принадлежит столь значительное место в развитии европейской культуры, для усовершенствования систем счисления решительно ничего не сделали. Такое мнение является совершенно неосновательным. Действительно, требования, которым должна удовлетворять удобная система счисления, таковы: 1) краткость и лёгкость записи, 2) удобство вычислений над числами, записанными в этой системе, 3) лёгкость овладения системой, 4) принципиальная возможность записи в этой системе любого сколь угодно большого числа. Мы видели, что первому требованию ионийская система удовлетворяет, причём запись чисел в этой системе гораздо короче, чем в аттической. Чтобы проверить, насколько трудно производить вычисления в этой системе, французский историк математики П. Таннери в 1882 г. овладел ионийской нумерацией и применил её к выкладкам, необходимым для вычислений в «Измерении круга» Архимеда. Он убедился при этом, что ионийская система имеет практические преимущества, о которых он едва мог подозревать ранее, и что операции в этой системе получаются не намного длиннее наших, если их проводить по современной

Таблица 3

Алфавитное обозначение чисел

схеме. К мнению П. Таннери присоединился и Т. Хисс. В упомянутой выше статье Бойер развивает дальше мысль о том, что лёгкость вычислений является не столько следствием позиционного принципа записи, сколько следствием схемы вычисления. Это близко к истине по отношению к не слишком большим числам. Нужно, однако, отметить, что современная схема умножения и деления чисел сама основана на позиционности расположения чисел, т. е. в ней используется в другом виде тот же позиционный принцип, что и в нашей нумерации.

То, что грекам приходилось запоминать 27 знаков для цифр вместо наших 10, также не может считаться существенным недостатком системы, так как, во-первых, запоминание это производилось раз и навсегда, а, во-вторых, для чисел не вводилось новых знаков; их обозначения запоминались вместе с алфавитом.

Против алфавитной системы М. Кантор сделал ещё следующее возражение: при нашей системе записи из того, что 2 -{— 3 = 5, сразу следует, что 20 —|— 30 = 50, тогда как при алфавитном способе из того, что ß-j-Y = e, не видно, что x-j-À=v. Отсюда, по его мнению, следовало, что грекам нужно было запоминать гораздо больше основных частных случаев умножения и сложения, чем нам. Однако процесс счёта имеет дело не только со знаками, но и со словами1). Заучивая, например, таблицу умножения, мы запоминаем не то, что символ 2, соединённый знаком умножения с символом 3, даёт символ б, а заучиваем её в словах «дважды три шесть», которые в случае надобности переводим на знаки. Но словесные обозначения чисел были у греков аналогичны нашим, поэтому грекам было не труднее, чем нам, из того, что дважды три равно шести, заключить, что двадцать на тридцать равно шестистам.

Итак, для записи сравнительно небольших чисел и для оперирования с ними при позиционной схеме вычислений алфавитная система была почти так же удобна, как и позиционная. Но в алфавитной системе непосредственно нельзя было записывать достаточно большие числа. Для этого пришлось к алфавитной системе прибавить новые принципы.

Попытки записать в этой системе числа больше тысячи привели к обозначениям, которые можно рассматривать как зачатки позиционной системы. Так, для обозначения тысячи применялась та же буква, что и для обозначения единицы, но снабжённая чёрточкой слева внизу (см. табл. 3):

5=1, ,5=1000,..., 6 = 9, ,6 = 9000.

При помощи букв со штрихами слева, таким образом, греки могли выразить все числа вплоть до 9999. Число 10 000 обознача-

1) Ср. М. Я. Выгодский, Арифметика и алгебра в древнем мире. М,—Л., 1941, стр. 184.

лось знаком M; знак M означал 20 000 и т. д. Здесь уже применяется мультипликативный принцип. При этом M можно было записать ещё как ßM или Mß. Если коэффициент M записывали позади соответственной буквы, то часто он заменялся просто точкой. Например, 43 458 записывалось так: 8.,yuvY]. Этот последний способ записи, применявшийся Диофантом, ближе всего к позиционному.

Наибольшее число, которое можно было записать при помощи ионийской системы счисления, было 108—1. Хотя, казалось бы, алфавитная нумерация наталкивала на мысль давать значение цифре не только по её написанию, но и по месту, которое она занимает, однако ни одна алфавитная нумерация не дала начала позиционной системе. Лишь два крупнейших математика древности, Архимед (287—212) и Аполлоний (265?—170), довольно близко подошли к мысли о позиционном принципе обозначения. Архимед в «Исчислении песка» предложил счёт «октадами». Все числа от 1 до 108—1 объединяются в первую октаду. Затем 108 принимается за новую единицу счёта, и все числа от 108 до 1016—1 относятся ко второй октаде и т. д. При этом все числа второй, третьей и последующих октад обозначались так же, как и числа первой октады. Аналогичную группировку дал в своём «Быстросчётчике», до нас, к сожалению, не дошедшем, Аполлоний, только вместо октад он пользовался тетрадами (104). Все числа от 1 до 104—1 он объединял в первую тетраду, от 104 до 108—1—во вторую и т. д.1).

И всё же ни Архимеду, ни Аполлонию не пришла мысль о единообразном обозначении всех чисел с помощью 10 знаков (например, 10 первых букв алфавита) по позиционному принципу, ни тем более мысль о введении нуля.

Это обстоятельство, как отмечает и М. Я. Выгодский, объясняется тем, что «ионийская система нумерации в пределах чисел, с которыми греческим математикам приходилось оперировать, вполне удовлетворяла требованиям практики»2). Поэтому даже тогда, когда греки уже применяли для дробей шестидесятиричную систему, заимствованную ими у вавилонян, причём пользовались и символом для нуля, они не изменили нумерации целых чисел. Этим же можно объяснить и то, что позиционная система, ставшая известной в Византии уже задолго до Максима Плануда (XIII в. н. э ), не получила там всё же распространения, и общеупотребительной продолжала оставаться алфавитная нумерация.

1) Тот же принцип применяется в приводимом Аполлонием способе умножения, совершенно аналогичном нашему. Умножение двух чисел, кратных десяти или ста, по этому способу сводилось к умножению их «коренных» чисел, т. е. к умножению чисел, выражающих число десятков или сотеп 3 этих числах.

2) М. Выгодский, Арифметика и алгебра в древнем мире, стр. 192.

Следы алфавитной нумерации сохранились вплоть до настоящего времени. Так, мы часто нумеруем буквами «пункты» докладов, резолюций и т. д., подобно тому как некогда были занумерованы буквами двадцать четыре песни «Илиады». Однако алфавитный способ у нас сохранился только для обозначения порядковых чисел. Количественные или кардинальные числа мы никогда не обозначаем буквами, тем более никогда мы не оперируем с числами, записанными по алфавитной системе.

Старинная русская нумерация также была алфавитной. Славянское алфавитное обозначение чисел возникло в X в. Введение такого обозначения приписывается составителю славянского алфавита Кириллу (ум. 869). Система обозначения чисел была построена по образцу ионийской, бывшей в ходу у византийцев, причём числовые значения получили лишь те буквы, которые соответствовали буквам греческого алфавита. Так, например (см. табл. 3), буква «буки» ( Б ) не имела числового значения, значение 2 имела буква «веди»( К ), так как она соответствовала букве ß греческого алфавита, а «буки» не имела своего прообраза среди греческих букв. Буква «фита» ( в ) имела числовое значение 9, хотя она стояла в славянском алфавите на предпоследнем месте, ибо соответствующая ей в греческом алфавите буква 6 отвечала числу 9. Этих особенностей совершенно не было во втором славянском способе обозначения чисел — глаголице1). Там числовые значения букв идут в строго алфавитном порядке. В обеих системах для выделения в тексте чисел над каждой буквой или над всем числом ставился знак (титло).

В западноевропейских странах в это время и позже применялась исключительно римская нумерация, принадлежащая к более низкому типу систем счисления.

Для обозначения тысяч в кириллице употреблялись те же буквы, только слева и внизу от них ставился знак £.

В славянском языке сложились две системы наименования высших десятичных разрядов: малое число, в котором названия не шли далее 106, и великое число или великое славянское число, куда входили числа до 1048, или 1049, или даже 10во («боле сего несть человеческому уму разумевати»). При этом одни и те же названия обозначали в обеих системах различные числа. Так «тьма» обозначала 10 000 в первой системе и миллион (т. е. тысячу тысяч) во второй; легион в первой системе обозначал 10 тем или 100 000, а во второй — тьму тем, т. е. миллион миллионов (1012), леодр в первой—10 легионов, т. е. миллион, а во второй — легион легионов (1024). Далее счёт шел на десятки, сотни и т. д. до ста

1) Глаголица — одна из славянских азбук, происхождение которой не выяснено точно до сйх пор. Возможно, что глаголица предшествовала кириллице. О более ранних обозначениях чисел славянами ничего достоверного не известно.

тысяч тем легионов (1047), а следующей единицей служил леодр леодров (Ю48), называвшийся вороном. Иногда 10во именовали колодой.

Из одной рукописной грамматики XVII в. известны старинные обозначения высших разрядов в «великом числе словенском». Буквы алфавита, соответствующие числам 1—9, обведённые кружком О» обозначали тьмы, обведённые кружком из точек О — легионы, а кружком из лучей — леодры. Символ v2> служил для обозначения ворона; колода обозначалась &1).

Несомненно, что обе эти системы нумерации, известные нам из рукописей XVII в., возникли значительно ранее. В русских математических рукописях XVII в. применялась уже современная система нумерации, вытеснявшая алфавитную. Вместе с алфавитной системой из обихода исчезли и описанные устные наименования высших десятичных разрядов.

Подобные двоякие значения названий в зависимости от того, к какой системе принадлежит данное число, существовали долгое время и в Западной Европе. Слово миллион, например, было впервые введено в XIV в. в Италии для обозначения «большой тысячи», т. е. (1000)2. Первоначально оно, повидимому, явилось названием конкретной меры —10 бочонков с золотом. В XV—XVI вв. это слово распространилось и в других европейских странах. Французский учёный конца XV в. Николай Шюке ввёл слова биллион (byllion), триллион (tryllion), квадриллион (quadrillion), ... , нониллион (nonyllion) для обозначения степеней миллиона: (1 000 000)2, (1 000 000)3,... ... , (1 000 000)9. Примерно с середины XVII в. во Франции числа стали разделять на периоды по три цифры в каждом. При этом биллион вместо старого значения (1 000 000)2 = 1012 получил значение 109. Слова триллион, квадриллион и т. д. стали обозначать соответственно 1012, 1018, ... Однако в Англии, Германии и других североевропейских странах слова эти до сих пор означают 1012, 1018, 1024, ...

§ 4. Поместные или позиционные системы счисления

Первой известной нам системой счисления, основанной на поместном или позиционном принципе, является шестидесятиричная система древних вавилонян, возникшая примерно за 2000 лет до н. э. Вавилоняне записывали все числа при помощи двух знаков: простого «клина» Т , означающего единицу, и лежачего «клина» означающего 10. Числа до 60 записывались при помощи повторения этих двух знаков по тому же аддитивному принципу, по

1) См. В. В. Бобынин, Очерки истории развития физико-математических знаний в России, вып. I, М., 1886, стр. 45—47,

которому строилась, например, египетская система нумерации. Число 32 в этой системе выглядело так:.

Направление письма шло слева направо, причем вначале всегда ставились десятки, а затем единицы. Отдельные клинья при написании чисел, содержащих более четырёх десятков или более четырёх единиц, соединялись в слитные группы (рис. 2).

Число шестьдесят снова изображалось символом Т , являясь единицей высшего разряда. Далее, для чисел от 60 до 3600—1 повторялись те же обозначения, что и для чисел от 1 до 59, только каждый символ имел в шестьдесят раз большее значение. Например, число 82 записывалось так: T^TI .

Однако эта же самая запись могла означать и 1 ът, или 82 • 60 и вообще 82 - 60—k. Более того, эта же запись могла соответствовать и числу 602-|-22 и всякому числу вида 60±fe+22 . 60±Л и т. п. Таким образом, позиционная запись по шестидесятиричной системе н е имела абсолютного характера. Каково действительное значение записанного числа, приходилось всякий раз определять по смыслу задачи. Такой неабсолютный характер записи обусловливался отсутствием в вавилонской системе цифр знака для нуля.

Отсутствие нуля на первых порах развития шестидесятиричной системы, когда приходилось оперировать со сравнительно небольшими числами, не было столь ощутительным, как это может показаться. Так, легко подсчитать, что для записи по вавилонской системе чисел от 1 до 3600 нуль нужен только 59 раз (а для записи чисел от 1 до 59 он вообще не нужен), тогда как при записи этих же чисел в нашей десятичной позиционной системе он встречается 917 раз. При оперировании с числами, большими 3600, потребность в нуле возрастает. Поэтому не удивительно, что в более поздних текстах, в которых вавилоняне в связи с потребностями практики, в первую очередь астрономии, оперировали уже с гораздо большими числами, появился междуразрядовый знак означающий пропуск шестидесятиричного разряда1). В конце числа, однако, этот знак никогда не ставился, и абсолютное значение написанного числа определялось только из контекста.

Рис. 2.

1) Первое появление междуразрядового знака относится к персидской эпохе (VI—V вв. до н. э.^,

Итак, система счисления вавилонян отличалась от современной десятичной позиционной системы (если отвлечься от различия в основаниях 60 и 10) следующими двумя чертами:

1. Позиционный принцип в ней не был проведён вполне последовательно.

2. Благодаря отсутствию символа для нуля позиционная запись у вавилонян не имела абсолютного характера.

Шестидесятиричная система вавилонян сыграла большую роль в математике и в астрономии. Следы этой системы сохранились до наших дней. Так, мы до сих пор делим час на 60 минут, минуту— на 60 секунд и т. д. Точно так же окружность мы, следуя вавилонянам, делим на 360 частей-градусов.

Вопрос о происхождении этой первой позиционной системы много лет занимает внимание учёных. Существует несколько конкурирующих гипотез, претендующих на объяснение появления этой системы.

М. Кантор первоначально предположил, что сумерийцы (первичное население долины Ефрата) считали год равным 360 суткам и что шестидесятиричная система имеет астрономическое происхождение. Однако в дошедших до нас сочинениях древнего Вавилона встречается лишь солнечный год в 365 дней и лунный год в 354 или 355 дней. Это обстоятельство, а также другие замечания критиков заставили Кантора отказаться от его гипотезы.

По гипотезе Г. Кевича в долине Ефрата встретились два народа, из которых у одного была десятичная система счисления, а у другого основанием системы было число 6 (возникновение такого основания Кевич объясняет особым счётом на пальцах, в котором сжатая в кулак рука означала 6). Благодаря слиянию обеих систем возникло «компромиссное» основание, равное 60. Согласно Леффлеру «благодаря наклонностям сумерийских жрецов к умозрению, их очень рано стали занимать игры с числами; они заметили, что из всех чисел ниже 100 число 60 обладает наибольшим числом малых множителей, как 2, 3, 4, 5, 6. Это открытие побудило их создать для научных целей систему с основным числом 60»1).

Гипотезы эти совершенно неисторичны; число их можно произвольно увеличить2). Последняя же гипотеза является даже антиисторичной, так как системы счисления никогда и нигде не создавались ни учёными, ни тем более жрецами «для научных целей», ни даже отдельными классами, а всегда были результатом длительного исторического развития, результатом творчества всего народа или нескольких народов.

1) Е. Леффлер, Цифры и цифровые системы культурных пародов в древности и в новое время, Одесса, 1913, стр. 33.

2) См. об этом примечания И. Ю. Тимченко в книге Ф. Кэджори, история элементарной математики, Одесса. 1918, стр. 313—317,

Более правдоподобна гипотеза о возникновении как основания 60, так и позиционной системы, предложенная в 1927 г. О. Нейгебауером1). В основу её положены следующие факты:

1) В эпоху, относящуюся к четвёртому тысячелетию до н. э., система чисел у сумеров была десятичной непозиционной. Имелись индивидуальные обозначения для единицы, 10 и 100, причём знак для 100 («шеи») означал на сумерийском языке также неопределённое множество. Таким образом, в это время система счисления у сумеров была примерно такой же, как у египтян, только ещё крайне неразвитой. Кроме того, существовала небольшая группа индивидуальных знаков для дробей

2) В эпоху расцвета сумерийской культуры, предшествовавшую появлению собственно математических текстов, появляется новый разряд: 60. Он обозначается тем же знаком, что и единица, но только большего размера. В этот период система счисления является шестидесятиричной непозиционной, хотя в ней сохраняется и самостоятельный знак для 100. Система эта сходна по типу с египетской, только в Египте разрядами, имеющими индивидуальные знаки, были 1, 10 и 100, а в Вавилонии—1, 10 и 60. Разумеется, никакого междуразрядного знака здесь ещё нет, да он и не нужен, так как разряды имеют абсолютные обозначения.

3) В дальнейшем 60 обозначается тем же знаком, что и единица. Единообразный принцип обозначения распространяется и на дроби, однако ещё долгое время сохраняются индивидуальные обозначения для дробей

Для объяснения этих фактов Нейгебауер рассматривает систему вавилонских мер. Особенно его внимание привлекают меры веса, так как эта система являлась здесь, как и почти всюду, основой денежной системы.

Нейгебауер приходит к заключению, что первоначально существовали две денежные системы у двух народов: сумеров и аккадян, семитского племени, покорившего сумеров. Основной единицей одной из систем был шекель, другой — мина. Каждая из этих денежных единиц давала начало рядам у, у, у, 1, 10.

Обе системы были десятичными. При этом первоначально соотношение между шекелем и миной не было установлено. Оба ряда сосуществовали, служа один для мелких, другой для крупных расчётов. Развитие централизованного Вавилонского государства с единой системой хозяйства привело к сравнительно ранней нормировке денежно-весовой системы. Естественно было установить соответствие так, чтобы дробные части большей единицы, мины

1) Ср. О. Нейгебауер, Лекции по истории античных математических наук, т. 1, перев. С. Я, Лурье, М—Л., 1937, стр. 120—125.

её части), выражались в меньшей единице (в шекелях) в целых числах. По Нейгебауеру, это было осуществлено путём приравнивания дробных частей мины десятикратным шекеля. Таким образом, соотношение между шекелем и миной было установлено 1 :60 (это соотношение примерно соответствовало соотношению их первоначальных весов).

Сначала соотношение это было абсолютным. Малые и большие единицы отличались друг от друга в написании либо размерами выражавших их знаков, либо сокращёнными названиями, ставившимися после соответствующих единиц.

Со временем система мер веса распространяется на другие области величин. При этом уже не имеет смысла ставить после единиц название той или иной меры веса. Первоначально позиционное обозначение «есть не что иное, как систематический отказ от обозначения единиц меры при письме». Процесс этот происходил бессознательно, иначе нельзя объяснить, почему не был введён знак обозначения недостающего разряда. Самый факт отсутствия в древних текстах такого знака показывает, что «несмотря на то, что числовые знаки были формально одни и те же, при каждом отдельном разряде подразумевалось конкретное обозначение соответствующей меры»1).

Описанный процесс можно сравнить с тем, который наблюдается и в нашем языке при именовании денег. Так, вместо того, чтобы сказать: 2 рубля 20 копеек, мы говорим: «два, двадцать». Название соответствующих разрядов здесь подразумевается2). Знак отделения на местах пропущенных разрядов появился позже, когда эта система была уже сознательно переработана для нужд математики. Эта последняя стадия, нашедшая своё выражение только в математических текстах, и является завершением создания неабсолютной позиционной шестидесятиричной системы вавилонян.

Таким образом, согласно этой гипотезе основные этапы процесса образования позиционной системы в Вавилоне были таковы:

1) установление количественного соотношения между двумя самостоятельно существовавшими системами мер3) и

2) опускание названий разрядовых единиц при письме.

Эти этапы возникновения позиционных систем автор излагаемой гипотезы считает совершенно общими. «Позиционная шестидесятиричная система ... оказалась вполне естественным конечным результатом долгого развития, ничем принципиально не отличающегося от аналогичных процессов в других культурах». Благоприятным обстоятельством, приведшим к тому, что такая система была впервые

1) О. Нейгебауер, Лекции, стр. 124.

2) М. Я. Выгодский, Арифметика и алгебра в древнем мире, стр. 69.

3) То, что эти системы мер были первоначально в ходу у двух разных народов (сумеров и аккадян), не существенно,

создана именно в Вавилоне, было то, что «нормировка денежно-весовой системы здесь падает на столь раннюю стадию развития, когда, с одной стороны, существовавшая и в Вавилоне первобытно-десятичная структура ещё лишь частично перешла за сто, а с другой,— натуральные дроби ещё ограничивались маленькой группой ~2 9 ~3,~3>>1), причём ещё не было выработано регулярных процедур счёта.

В изложенной гипотезе интересно стремление её автора связать процесс возникновения шестидесятиричной позиционной системы с развитием общественной экономики — систем мер, денежного хозяйства и т. п. Однако считать эту гипотезу твёрдо установленной теорией нельзя. Так, поддерживающий её в целом М. Я. Выгодский указывает, что в ней «есть гипотетические элементы: обстоятельства установления денежно-весовых эквивалентов не засвидетельствованы никакими положительными данными»2). Ряд возражений против этой гипотезы выдвинул в устных выступлениях И. Н. Веселовский3) (например, наличие в большом числе деловых текстов эпохи после Хаммураби непозиционных записей, плохо согласующееся с идеей о происхождении позиционной системы из денежно-весовой системы мер). Востоковед Ф. Тюро-Данжен также полагает, что, вопреки мнению Нейгебауера, появлению шестидесятиричной системы в метрологии должно было предшествовать её наличие в нумерации. Таким образом, общепринятого объяснения появления вавилонской нумерации мы ещё не имеем.

Появление позиционной системы обозначения чисел было одной из основных вех в истории культуры. Оно не могло быть случайным. Подтверждением этому является разновременное и самостоятельное возникновение позиционной системы по крайней мере у трёх различных народов: 1) более чем за две тысячи лет до н. э. в долине рек Тигр и Ефрат у вавилонян, 2) в начале н. э. у племени майя, бывших обитателей полуострова Юкатан в Центральной Америке, и 3) в VIII—IX вв. н. э. в Индии.

Расцвет культуры индейцев майя относится к VI — XIII вв. н.э. У майя были две системы записи чисел: 1) система, подобная египетской, применявшаяся в повседневной жизни, и 2) позиционная абсолютная система, употреблявшаяся главным образом для кален-

1) О. Нейгебауер, Лекции, стр. 124.

2) М. Выгодский, Арифметика и алгебра в древнем мире, стр. 69—70.

3) Основание 60 И. Н. Веселовский связывает со счётом по пальцам и суставам рук, позиционный принцип — с употреблением абака, о чём сказано ниже. И. Тимченко также допускал, что «шестидесятиричное счисление могло произойти от продолжения такого счёта на правой руке, а затем на другой стороне суставов правой и левой руки в обратном порядке», но считал возможным, что оно возникло из смешения 4-ричной и 15-ричной систем (встречающихся, например, в Бенгалии). См. его примечания к книге Ф. Кэджори, История элементарной математики. Одесса, 1917, стр. 316—317,

дарных расчётов, характерной особенностью которой было наличие нуля, символом для которого служило изображение полузакрытого глаза. Основанием системы служило число 20, хотя имелись и сильные следы пятиричной системы. Первые 19 чисел получались путём комбинации знаков точки (•) для единицы и черты (—) для пяти и записывались, например, так:

20 является единицей нового разряда, которая называется уинальс, или 20 дней, и обозначается знаком для единицы, надписанным над знаком для нуля. Однако единицу следующего разряда образуют не 20, а 18 уинальсов, называемые туном (360 дней). Это — единственное отступление от двадцатиричного принципа в системе майя. Оно объясняется тем, что год майя делили на 18 месяцев, по 20 дней в каждом, плюс ещё пять дней. 20 тунов образуют катун или 7200 дней, 20 катунов образуют единицу пятого разряда — цикл и, наконец, 20 циклов составляют большой цикл, равный 2 880 000 дням.

Таким образом, единицами различных разрядов в системе майя были: 1, 20, 20 . 18, 202 - 18, 203 • 18, .. •

В своих календарных и хронологических расчётах майя оперировали очень большими числами. Наибольшее число, найденное в их документах, есть 12 489781. Запись его в системе майя схематически будет выглядеть так:

Родоначальницей нашей современной нумерации была, повидимому, индусская система. К сожалению, нам очень мало известно о том, как и когда в Индии появилось обозначение чисел по позиционной системе. Работа исследователей очень трудна из-за большого количества подложных надписей. Так, из 17 древних цитат, содержащих позиционные записи, только две оказались неподдельными.

До возникновения позиционной системы в некоторых частях Индии пользовались цифрами карошти (kharosthi), наиболее ранние известные образцы которых найдены были в районе восточного Афганистана и Северного Пенджаба и относятся, вероятно, к III — I вв. до н. э. Это была десятичная непозиционная система с индивидуальными символами для 1, 4, 10, 20 и 100 (см. табл. 2). Особая роль чисел 4 и 20 в системе показывает, что они являлись узловыми. Числа 200, 300 и т. д. обозначались при помощи цифры 100 и приписывания справа соответственно значка для двух или трёх. Таким образом, начиная со 100, в системе действовал мультипликативный принцип. Видеть в цифрах карошти прообразы наших цифр не приходится.

Наряду с числами карошти с древнейших времён в Индии существовала другая система обозначения, знаки которой сходны с буквами так называемого алфавита брами (см. цифры из надписи в пещере Назик, табл. 2). В этой системе имелись специальные знаки для 9 первых чисел, для десятков 10—90 и для чисел 100 и 10001). Для обозначения 200, 300, 2000 или 3000 писались знаки для 100 или 1000 и приписывались к ним две или три чёрточки. Аналогичным образом числа от 400 до 900 и от 4000 до 70 000 (числа больше этого в известных нам записях не встречаются) записывались в виде сочетания знаков для 100 и 1000 со знаками для 4—9. Схематически запись числа 3451 по этой системе можно выразить так: 3 • «1000» 4 • «100» 5 • «10» 1.

Такая система цифр существовала вплоть до конца XIX в. на Цейлоне, куда индусская культура была занесена вместе с буддизмом в III в. н. э. и где она сохранилась почти без изменения.

Происхождение цифр брами в точности не известно, но есть основания думать, что они арамейского происхождения2). Быть может, цифры брами явились первичными формами, из которых развились позднее наши цифры.

В Индии существовала и третья система обозначения чисел, словесная, о которой мы скажем далее.

Запись в позиционной десятичной системе с употреблением знака нуля появилась в Индии, вероятно, около 500 г. н. э.; возможно, что знак нуля известен был Ариабхатте (476—550)3). Однако первая точно датированная надпись, в которой встречается знак

1) Предполагают, что сначала эти цифры, называемые сингалезскими, были начальными буквами соответствующих имён числительных.

2) Арамеи — аравийская семитическая народность, во второй половине 2-го тысячелетия до н. э. населявшая территории Сирии и части Месопотамии и создавшая там ряд государств.

3) Знак нуля в виде точки встречается в так называемой Бахшалийской рукописи, точное время составления которой не известно. Различные исследователи датируют её по-разному— от II в. н. э. до VIII и IX вв.

нуля, относится к 876 г.: в ней число 270 записано было в виде Х^о1). Как же перешли индусы к абсолютной позиционной системе?

Н. М. Бубнов связывал этот переход с употреблением в Индии и других странах Древнего Востока счётной доски, абака. Доска эта имела продольные желобки, каждый из которых соответствовал определённому десятичному разряду. В эти желобки помещались жетоны, которые были первоначально немеченными и указывали, таким образом, число единиц соответствующего разряда.

Согласно Н. Бубнову, наши числительные и цифры в конечном итоге урало-алтайского происхождения. От урало-алтайских народов они распространились далее, в частности в Халдею (юго-восточная часть Месопотамии). Отсюда в III в. до н. э. цифры эти, с одной стороны, перешли в Индию, где и употреблялись без нуля и без поместного значения, а с другой стороны — в Грецию, где попали на ранее немеченные жетоны греческого абака. Таким образом, для счёта на абаке стали употреблять меченные жетоны, жетоны со знаками цифр от 1 до 9. Здесь же к ним был присоединён десятый пустой жетон (сипос), означавший отсутствие единиц определённого разряда. Из Греции абак попадает на Восток и на Запад. В Индии, где числовые знаки греческого абака были уже известны, но без значения по положению, они приобретают таковое, переходя с жетонов на бумагу в том же порядке, в каком они располагались на абаке. Нужно было только уметь обозначать пропуск того или иного десятичного разряда. Для этого и начали изображать немеченный жетон, представляющий собой кружок с дыркой посредине, так сказать, материализованную модель нуля. Его сначала обозначали жирной точкой, а затем стали писать кружок О.

Гипотеза эта не лишена остроумия, однако она не подтверждается историческими фактами. Наоборот, против неё можно выставить следующие существенные возражения:

1) На всех дошедших до нас античных рисунках греческий абак изображается с немеченными жетонами. Поэтому лет основания полагать, что у древних греков были меченные жетоны. Наоборот, примеры русских счётов, китайского сван-пана, римского абака показывают, что меченные жетоны совершенно не нужны ни для фиксирования числа на такой счётной доске, ни для производства операций. Известно лишь, что абак с меченными жетонами существовал и получил широкое распространение в средние века.

2) Очень мало вероятно, чтобы на протяжении длинного периода странствования по Индии и Греции арамейские цифры сохранились без изменения.

1) См. D. Е. Smith and L. С. Karpinskу, The hindu-arabical numerals, N.-Y., 1911, стр. 43—44, 52.

3) Абак с древнейших времён был в употреблении у египтян, греков, китайцев, римлян, а между тем ни один из этих народов не пришёл к позиционной системе1).

Более правдоподобно предположить, что и абак и позиционная система возникли из одного и того же источника — группового счёта и благодаря одним и тем же историческим процессам.

Возникновение позиционной системы можно представить следующим образом. Принцип позиционности является по существу соединением двух принципов: 1) мультипликативности и 2) опускания при письме разрядовых единиц. Завершается позиционная система введением нуля. Для объяснения происхождения позиционного принципа прежде всего следует объяснить появление мультипликативной формы записи, являющейся, кстати, одновременно основой изображения числа на абаке.

Разберём сначала, чем принципиально отличается мультипликативная форма записи от аддитивной. С чисто алгебраической точки зрения запись, например, числа 30 в виде Шх или X111 является выражением закона дистрибутивности. Действительно:

С другой стороны, запись вроде Шх выражает тот факт, что при счёте десятки принимаются за новые единицы. То же имеет место и при счёте сотен, тысяч и т. д. Итак, мультипликативная форма записи наиболее отчётливо отражает тот факт, что при счёте определённое множество единиц первого разряда принимается за единицу следующего разряда, определённое множество единиц второго разряда принимается в свою очередь за единицу третьего разряда и т. д. Это достигается тем, что для выражения известного количества единиц различных разрядов применяются одни и те же числовые символы, после которых отмечается, к какому разряду принадлежат сосчитанные единицы. Этой же записью подчёркивается, что объектами счёта могут быть элементы любой природы (вещи, определённые множества вещей, десятки их, сотни и т. д.), а это в свою очередь выражает важнейшее свойство отвлечённого числа быть общей формой, свойственной самому различному конкретному бытию.

Но как раз такой способ счёта, как мы отмечали, имеет место при счёте числами-совокупностями. Так, африканские негры, ведущие счёт на камешках или орехах, складывают их в кучки по 5 предметов в каждой. Пять таких кучек они объединяют в новую кучу и т. д. Очевидно, здесь сначала ведётся счёт камешков, затем

1) Ср. примечания И. Тимченко к цит. книге Кэджори, стр. 318—320.— Следует отметить, впрочем, что И. Ю. Тимченко полагал, что «идея поместного значения знаков, весьма вероятно, родилась при употреблении абака, даже и не снабжённого меченными жетонами» (там же).

кучек, потом куч и т. д. При таком способе счёта подчёркивается то обстоятельство, что с кучами нужно поступать так же, как и с камешками. Точно так же ведет счёт и племя Центральной Африки — йорубы с тою лишь разницей, что объектами счёта у них являются раковины-каури, которые складываются в кучи по 20 предметов в каждой. Интересно, что само слово считать означает у них буквально «сметать в кучу», «сгребать». Точно так же у древних греков, различавших арифметику как науку о числе от логистики — искусства счёта, слово Хоуо<; имело своим корнем слово Хеу, что означает собирать.

Иллюстрацией дальнейшего развития счёта, приводящего к мультипликативной системе, может служить приводимый у Н. Н. Миклухи-Маклая пример счёта у туземцев Новой Гвинеи. Чтобы сосчитать количество бумажек, обозначавших число дней до возвращения корвета «Витязь», папуасы поступали следующим образом: «первый, раскладывая кусочки бумаги на колене, при каждом обрезке повторял „каре, каре" (один); другой повторял слово „каре" и загибал при этом палец, прежде на одной, затем на другой руке. Насчитав до десяти и согнув пальцы обеих рук, он опустил оба кулака на колени, проговорив „две руки" причём третий папуас загнул один палец руки. Со вторым десятком было сделано то же, причём третий папуас загнул второй палец; то же самое было сделано для третьего десятка»1).

Подобным же образом происходит счёт стад у южно-африканских племён (пример этот приводится Цейтеном). Для такого счёта нужны три человека: первый поднимает один за другим десять пальцев своих рук при прохождении каждой головы стада и постоянно повторяет тот же счёт до десяти. Второй считает таким же образом получаемые при этом десятки, третий — десятки, полученные вторым, т. е. сотни. Подобный способ счёта имел место и в других странах. Пример этот проливает свет на происхождение и абака и позиционной системы. В самом деле, если заменить пальцы первого, второго и третьего считающих камешками, помещёнными в различные желобки, или бусами, нанизанными на три проволоки, то получится простейший абак, причём как раз в том виде, в каком он возник. С другой стороны, если обозначить пальцы считающих символами I, X, С, то при перенесении некоторого числа с пальцев на бумагу мы получим мультипликативную форму записи. Число 323 запишется при этом по схеме ЗС2ХЗ.

Так как стадия счёта числами-совокупностями является совершенно общей, то она, конечно, имела место и в Индии. С древнейших времён, как мы видели, в Индии существовали мультипликативные числовые системы. Действительно, и система карошти и система

1) Н. Н. Миклухо-Маклай, Путешествия, т. I, стр. 58, Издательство АН СССР, 1940 г.

брами были построены по этому принципу. Таким образом, большие числа записывались в Индии по той же схеме, что и в Вавилонии, до того момента, как там стали опускать названия разрядов.

Следует иметь в виду также высокий интерес (и не только среди учёных) в Индии к проблеме записи любого числа. Так, в Лилаватистара, знаменитом произведении буддийской литературы, описывается состязание между женихами прекрасной Гопы (госпожи земли). Предметом состязания были письменность, арифметика, борьба и искусство метания стрел. Почти половина описания посвящена испытаниям по арифметике. Состязающиеся должны были, например, найти средство для выражения чисел, больших ста коти (1 коти =107). Победитель, Сарватасидда, придумал шкалу чисел, идущих в геометрической прогрессии со знаменателем 100, последним членом которой было число 107 + 9*46, содержащее 421 нуль. После этого он вычислил число «первичных атомов», заключённых в единице длины, для чего также составил таблицу обозначений чисел.

В Индии имелось и ещё одно благоприятное обстоятельство для возникновения позиционной системы. Мы упоминали уже о третьей, словесной системе обозначения чисел, находившей применение в трудах по астрономии и математике. Система эта возникла не позднее VI в. н. э. Единица в ней обозначалась каким-либо из слов «луна», «земля», «брама» и т. д., являющихся названиями предметов, встречающихся в единственном числе, два — каким-либо из слов «близнецы», «глаза», «руки», пять — словом «чувства» или «стрелы» (пять стрел Камадевы, бога любви индусской мифологии) и т. п. Обозначение чисел в этой системе строилось по позиционному принципу. Например, число 867 писалось: «giri — rasa—vasu», т. е. горы (7) — запахи (6) — боги (8), при этом запись следовала от единиц низшего разряда к единицам высшего. Кроме того, в санскритском языке (игравшем у индусов роль средневековой латыни) имелись специальные названия всех разрядов вплоть до 1016. Например, число 86 789325 178 читалось по-санскритски так: 8 kharva, 6 padma, 7 vyrbuda, 8 koti, 9 prayuta, 3 laksha, 2 ayuta, 5 sahasta, 1 gata, 7 daçan, 8. Такой способ обозначения подчёркивал равноправность разрядов. Нужно было только выработать систему записи, которая соответствовала бы уже существующему устному наименованию чисел. Такая система явилась дальнейшим развитием способа записи чисел по мультипликативному принципу.

Процесс опускания названий разрядовых единиц при письме мог итти в Индии так же, как и в Вавилоне. Для завершения позиционной системы нехватало последнего шага — введения нуля. Но при небольшом основании, каким являлось число десять, и при оперировании со сравнительно большими числами, особенно после того, как названия разрядовых единиц перестали отмечать, такое введение стало необходимым. При этом совершенно не существенно, был

ли первоначально символ нуля изображением пустого жетона абака или видоизменением простой точки, которую могли ставить на место пропущенного разряда. Так или иначе, но введение нуля было совершенно неизбежным этапом закономерного процесса развития, приведшего к созданию современной позиционной системы.

§ 5. Распространение позиционного принципа записи чисел в Западной Европе и в России

Нам остаётся проследить, как индусская позиционная система попала в Европу и как и когда она стала общепринятой у нас в России.

Принцип поместного значения распространился из Индии в другие страны. Некоторые народы переняли у индусов только этот принцип, сохранив своё старое начертание цифр (Китай), другие заимствовали у индусов и их цифры (Тибет, Монголия, народы Ближнего и Среднего Востока). Наиболее ранние рукописи на арабском языке, содержащие позиционную запись чисел, относятся к 874 и 878 гг. В самой Индии, в разных её областях написание цифр было очень различным. Различны были и цифры, распространённые в странах Восточного халифата и в мавританских государствах, расположенных на территории современной Испании. Восточно-арабские цифры впоследствии распространились по всему мусульманскому востоку, где употребляются и до сих пор в несколько видоизменённой форме. А цифры, бывшие в ходу в мавританских государствах, так называемые цифры «губар» (табл. 4, 1-я строка), стали прямыми родоначальниками наших цифр.

Таблица 4

При этом, однако, неясным остаётся вопрос, откуда произошли цифры «губар»? Если они индусского происхождения, то они могли

дойти до Испании только через страны Передней Азии. Как могла некоторая разновидность индусских цифр попасть непосредственно в мавританские государства, «перепрыгнув» страны Передней Азии?

Теория Вёпке, считавшаяся одно время общепринятой, объясняет эти факты следующим образом.

Ещё во II в. до н. э. благодаря установившимся торговым сношениям между Индией и Александрией индусские цифры (без нуля и поместного принципа) проникли в Александрию, а оттуда уже в Рим, в западную часть Африки и в Испанию. Подтверждением этой части своей теории Вёпке считал тот факт, что начертание цифр, сильно напоминающих цифры «губар», имеется в «Геометрии» римского учёного Боэция (480?—524). Боэций в этой книге говорит об абаке, устройство которого он приписывает пифагорейцам. Для счёта на этом абаке употребляются не камешки, а жетоны или апексы с начертанными на них цифрами. Сами эти цифры получили впоследствии название апексов. Они-то и походили по форме на цифры «губар». Позднее в Индии появились принцип поместного значения и знак нуля, которые и были заимствованы народами Среднего и Ближнего Востока вместе с новым начертанием цифр. В мавританских государствах употребляли для записи чисел те цифры, которые уже давно существовали в Испании, а знак нуля и поместный принцип обозначения были заимствованы маврами у своих восточных единоверцев.

К народам Европы начертание цифр и поместный способ обозначения перешли из Испании. Цифры эти назывались по-арабски «губар», т. е. пыль, песок. По мнению автора гипотезы, такое название служило напоминанием об индусском происхождении этих цифр (индусы записывали цифры на пыли или песке). С другой стороны, в самой Индии начертание цифр подверглось дальнейшему изменению, чем и объясняется отличие цифр «губар» от современных индусских цифр «девангари».

Слабыми местами теории Вёпке является то, что 1) наличие индусских цифр в Александрии во II в. до н. э. и даже много позднее не подтверждается никакими историческими фактами и 2) «Геометрия» Боэция, на которую ссылается автор, как теперь установлено, является скорее всего неподлинной и относится примерно к XI в. н. э. Эту гипотезу Вёпке раскритиковал Н. М. Бубнов в своей книге «Арифметическая самостоятельность европейской культуры» (Киев, 1908). Однако собственная гипотеза Бубнова является не лучше обоснованной, чем гипотеза Вёпке. Известный русский историк математики В. В. Бобынин подверг решительной критике гипотезу Н. М. Бубнова в «Отзыве о сочинениях Н. М. Бубнова и т. д.» (С.-Петербург, 1911). В. В. Бобынин писал по поводу теории Бубнова: «История наших цифр представляет не более, как ряд предположений, перемежающихся с произвольными допущениями, произ-

водящими иногда, вследствие предшествующего употребления метода внушения, впечатление как бы чего-то доказанного».

В настоящее время под руководством С. П. Толстова ведутся раскопки древнего Хорезма — крупнейшего культурного государства древности, находившегося на территории нашего Советского Союза. Можно надеяться, что раскопки эти прольют дополнительный свет на происхождение наших цифр.

Таким образом, мы до сих пор не имеем исторически обоснованной гипотезы, которая достаточно удовлетворительно объясняла бы происхождение наших цифр.

Однако бесспорно, что народы Европы заимствовали свою систему счисления у мусульманских государств, находившихся на территории современной Испании. В X в. культура мавританских государств начинает оказывать всё большее влияние на Европу. В частности, в Европу начинают проникать цифры губар, тогда как до того времени употреблялись по преимуществу римские цифры. Искусство письма было очень мало распространено в Европе того времени, кроме того, письменный счёт при помощи римских цифр крайне неудобен (пусть читатель для примера попробует перемножить два четырёхзначных числа, записанных римскими цифрами), поэтому для вычислений пользовались счётной доской — абаком.

Первое введение абака в Европе обычно связывается с именем Герберта (впоследствии папа Сильвестр II), наиболее выдающегося европейского математика X века (ум. 1003). Герберт написал два сочинения: «Правила вычисления с помощью абака» и «Книжка о делении чисел», в которых он излагал современные ему методы вычислений. Сохранились сведения о том, что по его заказу был изготовлен абак в виде кожаной счётной доски, имеющей 27 вертикальных столбцов, и к нему роговые марки с выбитыми на них девятью первыми числовыми знаками (апексами). По другим сведениям столбцов было тридцать, причём из них три предназначались для дробей, а остальные 27 разделялись на группы по три столбца в каждой. Столбцы были помечены буквами: M (monas) или S (singularis), D (decern, 10), С (centum, 100); далее ставились те же буквы, но с чертой наверху, причём каждая имела уже в тысячу раз большее значение. Например, С было пометкой столбца для 100 000. Последователи Герберта получили название абацистов. В течение ближайших веков абак значительно видоизменился: нумерованные жетоны были заменены ненумерованными, вертикальные желобки — горизонтальными. Такого рода абак был распространён в Германии, Франции и Англии.

Хотя первая запись арабо-индусскими цифрами, но без употребления нуля встречается в рукописях испанского монастыря Альбельдо ещё в 976 г. (так называемый codex vigilianus), а в рукописи X в. из Сан-Гала (университетская библиотека в Цюрихе) имеется уже знак нуля, однако арифметические приёмы народов Среднего

и Ближнего Востока начинают укрепляться в Европе, только начиная с XII столетия. В этом отношении имел колоссальное значение перевод арифметического труда замечательного хорезмского учёного Магомета сына Мусы-ал-Хваризми (т. е. из Хорезма; ум. около 840), в котором был изложен позиционный способ обозначения чисел1). Сам этот способ получил название алгорифма (искажённое прозвище ал-Хваризми). Большую роль сыграли также компилятивная «Книга об алгорифме» (Liber alghoarismi) еврейского учёного XII в. Иоанна Севильского, популярные сочинения по арифметике Александра де Вилла Деи и Джона Галифакса или Сакробоско, живших в середине XIII в. Образовалась целая школа арифметиков, придерживавшихся новых способов обозначения чисел и оперирования ими; она получила название школы алгорифмиков. Алгорифмики не употребляли абака при вычислениях. Они учили наряду с производством первых четырёх действий арифметики ещё и извлечению квадратного корня, а также применяли шестидесятиричные дроби, в то время как абацисты пользовались римскими двенадцатиричными дробями.

Новая нумерация не была воспринята сразу. Наоборот, она встретила ожесточённое сопротивление и со стороны официальной схоластической науки того времени и со стороны отдельных правительств. Так, в 1299 г. во Флоренции купцам было запрещено пользоваться индусскими цифрами в бухгалтерии и приказано пользоваться либо римскими цифрами, либо писать числа полностью словами. В официальных бумагах вплоть до XVIII в. разрешалось употреблять только римские цифры.

Достоинства позиционной системы, ясные для её пропагандистов, обнаруживались для широких кругов не сразу. Счёт на абаке долгое время сохранял в глазах многих преимущество. Здесь имели значение, кроме приверженности к рутине, дороговизна бумаги, производство которой было введено в Европе лишь в XII в., недостаток письменных принадлежностей (карандаши появились лишь в XVI в.), весьма постепенное совершенствование самих приёмов действия в новой системе счёта, особенно умножения и деления, и, наконец, чрезвычайное отличие в форме записи одних и тех же цифр у различных писателей2) вплоть до изобретения в XV в. книгопечатания.

1) Латинский перевод этого сочинения ал-Хваризми, сделанный в середине XII в., опубликован Бонкомпаньи: Trattati d'Aritmetica, Roma, 1857.

2) Вот как, например, варьировали в разных рукописях цифры для единицы:

и для двойки:

Однако ещё в XIII в. новая система начала распространяться среди итальянских купцов. Преимущества её, связанные с последовавшим упрощением арифметических операций, были столь велики, что, несмотря на все препятствия, позиционная система постепенно вытеснила старые способы счёта и старую нумерацию.

Интересным примером торжества новой нумерации явились записи, сделанные с помощью римских цифр, но с употреблением нуля и позиционного принципа. Так, Н. Окреат на рубеже XI—XII вв. писал III III (т. е. 33) или I. 0. VIII. IX (т. е. 1089) и т. д.1).

Леонардо Пизанский, или Леонардо Фибоначчи, в своём сочинении «Liber abaci» (1202)2) выступил убеждённым сторонником новой нумерации: «Девять индусских знаков, — писал он, — суть следующие: 9, 8, 7, 6, 5, 4, 3, 2, 1. С помощью этих знаков и знака 0, который называется по-арабски zephirum, можно написать какое угодно число». Здесь словом zephirum Леонардо передал арабское слово as-sifr, являющееся дословным переводом индусского слова sunya, т. е. пустое, служившего названием нуля. Слово zephirum дало начало французскому слову zéro (нуль) и итальянскому слову zero. С другой стороны, то же арабское слово as-sifr было передано через Ziffer, откуда произошли французское слово chiffre, немецкое Ziffer, английское cipher и русское цифра3). Вплоть до середины XVII в. это слово употреблялось специально для обозначения нуля. Например, в «Арифметике» Магницкого цифрой называется только нуль. Латинское слово nullus (никакой) вошло в обиход для обозначения нуля в XVI в.4).

В Германии, Франции и Англии новые цифры до второй половины и даже до конца XV в. почти не употреблялись. Первые монеты с индусскими цифрами появились в 1424 г. в Швейцарии5), в 1484 г. — в Австрии, в 1485 г. — во Франции, в 1489 г. — в Германии и в 1551 г. — в Англии. На могильных плитах эти цифры появились впервые в Бадене (1371) и Ульме (1388). В 1488 г. была напечатана книга «Об искусстве счисления» («De arte numerandi»), известная также под названием «Algorismus», в которой без примеров и доказательств сообщались правила «индусской» арифметики.

1) D. Smith and L. Karpinsky, The hindu-arabical numerals, стр. 119—120.

2) Слово «абак» стало в то время обозначать уже арифметику вообще, и таким образом, сочинение Леонардо — это «Книга по арифметике», а не о счётной доске — абаке.

3) Характерно, что в разгар борьбы алгорифмиков и абацистов слова «алгорифм» и «цифра» нередко служили насмешливыми синонимами для какой-либо бесполезной, пустой вещи!

4) Термины nulla figura, nullus circulus (никакая фигура, никакой кружок) для обозначения «нуля» появляются в XII в. в латинских переводах и обработках арифметических сочинений на арабском языке.

5) В Сицилии, тесней связанной с арабскими государствами, индусские цифры на монетах появляются не позднее 1138 г.

Книгу эту обычно приписывают упоминавшемуся уже раньше Джону Галифаксу, именуемому чаще Сакробоско. Лишь в XVI—XVII вв. новая нумерация почти полностью вытесняет старую. Однако ещё во второй трети XVI в. числа в календарях обычно печатались римскими цифрами.

В России первая дошедшая до нас математическая рукопись восходит к началу XII в. Это — «Кирика Диакона и Доместика Антониева монастыря учение, им-же ведати человеку числа всех лет». Числа в этой рукописи выражались в алфавитной системе нумерации. Это же относится и к спискам знаменитого юридического памятника, «Правды Русской», относящимся к XIV—XV вв. Новая система нумерации получила распространение в России лишь немногим позднее, чем в Западной Европе, где с нею смогли познакомиться ранее. Уже во всех без исключения математических рукописях XVII в. применялась позиционная десятичная нумерация. Как писал В. В. Бобынин, «Следы прежнего употребления древней греко-славянской системы встречаются только в древнейших из них, да и то в таких слабо выраженных формах, как пояснение значения арабских цифр соответствующими славянскими или встречающиеся время от времени обозначения данных чисел славянскими цифрами одними или же вместе с арабскими. Рукописи второй половины XVII столетия не содержат в себе даже и этих незначительных следов»1). В широкий обиход новая нумерация вошла, однако, не сразу.

В печатных сочинениях на славяно-русском языке индусские цифры появились впервые при нумерации страниц в двух книгах духовного содержания, изданных в Венеции в 1611 г. В книге, изданной в русской типографии («Псалтырь», напечатанная в местечке Евю), индусская нумерация страниц впервые встречается в 1638 г. В 1647 г. в Москве была издана книга «Учение и хитрость ратного строения пехотных людей», в которой все цифры на чертежах и в ссылках в тексте на чертежи были уже индусскими. Однако ещё долгое время в книгах приводились как «числа русские», так и «цифирные», т. е. индусские. Ещё в 1702 г. «Юрнал» об осаде Нотебурга, выпущенный в 2000 экземплярах, в 1000 экземпляров имел арабо-индусские, а в 1000 экземпляров — славянские цифры.

В знаменитом руководстве «Арифметика, сиречь наука числительная. С разных диалектов на славянский язык переведенная, и во едино собрана и на две книги разделена. В лето от сотворения мира 7211, от рождества Бога Слова 1703. Сочинися сия книга через труды Леонтиа Магницкого», по которому учился великий русский ученый М. В. Ломоносов, обозначения страниц—славянские, но вычисления в тексте производятся исключительно на

1) В. В. Бобынин, Очерки истории развития физико-математические теорий в России, вып, I, стр. 43,

Титульный лист «Арифметики» Магницкого,

индусских числах. Определение нумерации там даётся следующее: «Что есть нумерацио: нумерацио есть счисление еже совершенно вся числа речию именовати, яже в десяти знаменованиях или изображениях содержатся и изображаются: 1, 2, 3, 4, 5, б, 7, 8, 9,0». Заметим, между прочим, что нумерация в то время считалась ещё пятым действием арифметики.

Наиболее ранние русские монеты с индусскими цифрами — золотые монеты достоинством в 1/4 червонца с датой 1654 г. Чеканились они в основном не для денежного обращения, а для дарений, наград и т. п. Непосредственно затем на обращавшихся в нашей стране западноевропейских талерах («ефимках») поставлены были клейма с датой 1655 г. При Петре I индусские цифры на монетах полностью вытесняют славянские, в последний раз появившиеся на медных монетах 1718 г.1).

В послепетровские времена славянские цифры быстро исчезли из обихода.

§ 6. Дроби

В современной математике дроби вводятся как пары целых чисел (m, ri), для которых известным образом определено отношение равенства, подчиняющееся законам рефлексивности, симметричности и транзитивности, а также определены правила действия2). При этом целые числа можно рассматривать как частный случай таких дробей, а операции над целыми числами — как частный случай операций над дробями. После такого расширения области целых чисел до области рациональных чисел (или пар целых чисел) становится разрешимым каждое уравнение ах = Ь, где а, Ъ — целые и а ф 0.

Однако в действительности дроби возникали не как результат деления целых чисел; тем более не были они созданы для того, чтобы операция деления, обратная операции умножения, была всегда возможной.

Если бы дроби появились в результате деления целых чисел, то все они были бы с самого начала логически однородны, что отражалось бы в их трактовке и в обозначениях. Исторически же это было не так. Чтобы убедиться в этом, достаточно просмотреть прилагаемую здесь таблицу египетских дробей (рис. 3).

Во-первых, мы видим, что египтяне имели обозначения только для дробей вида — и для некоторых дробей вида ——. При п^5 все дроби — обозначались вполне единообразно при помощи символа «=>, обозначающего «часть», под которым подписывался

1) По данным И. Г. Спасского.

2) О трактовке дробей с этой, точки зрения см. в этой книге статью И. В, Проскурякова,

символ для числа п. Так, обозначалось, как Т. Следуя принятой нами раньше терминологии, мы будем все такие дроби называть алгорифмическими. Однако для обозначения у вместо знака If, который следовало бы ожидать, египтяне употребляли особый символ а а тг означал не а у. Символ у», который, казалось бы, должен означать единицу, на самом деле служил для обозначения 4-; 4~ в этих же записях обозначалось, как . Впоследствии -rj? уже служило для обозначения y , а -у по общему правилу представлялось, Но специальные значки для -н- и т сохранились неизменными.

Такие же индивидуальные обозначения, отступающие от общего правила, для группы небольших дробей имелись у вавилонян (рис. 4), греков и римлян.

Так, у обозначалась у греков символом < , тогда как все дроби ~ при п^З обозначались символом для соответствующего числа п со штрихом справа сверху ^например, y' означало у , а символ р, который должен был бы обозначать у, обозначал-j, т. е. картина обозначений здесь та же, что и в Египте. Аналогично этому по-аккадски для обозначения у употреблялось выражение sittâ qâtâ, т. е. «обе руки», а для у— salâstâ qâtâ, т. е. «три руки». У римлян эти же дроби выражались словами bes (binae partes) и très partes, т. е. две части и три части,

Рис. 3.

Нет ни одного языка, в котором слово для обозначения 1/2 являлось бы производным от слова «два». Так, по-латыни 4~ называется semis (а два — duo), по-немецки у — halb, в то время как 2— zwei, у нас по-русски: «половина» и т. д.

Рис. 4.

Дроби, имеющие индивидуальные названия или обозначения, мы будем называть узловыми. Различие в обозначениях узловых и алгорифмических дробей, как мы покажем, отражает различие в их происхождении. В то время как узловые дроби возникли непосредственно из практики, как самостоятельные числовые сущности, а не как производные от целых чисел, алгорифмические дроби явились результатом последующей математической обработки.

То обстоятельство, что дроби произошли не в результате деления, подтверждается не только указанной неоднородностью дробей, но и некоторыми известными из истории примерами деления целых чисел друг на друга. Так, в одной арабской рукописи XII в. н. э. имеется задача: «разделить 100 фунтов между одиннадцатью человеками поровну». Автор решения получает при делении остаток, равный 1 фунту. Для его распределения автор не прибегает к дробям— он предлагает променять этот фунт на яйца, которых, как он устанавливает, придётся 91 штука. Распределив 88 яиц по 8 на каждого человека, автор предлагает оставшиеся три яйца отдать за труды тому, кто делил, или же променять их на соль к яйцам. Подобным же образом поступает учёный Одо Клюнийский (ум. 942 или 943). Деля 1001 фунт на 100, он раздробляет полученную в остатке единицу в унции, драхмы и т. д., пока число долей не станет больше ста. Так как и после этого деление нацело невозможно, он предлагает получившийся маленький остаток совсем отбросить. Деление здесь не приводило, таким образом, к дробям, но осуществлялось путём введения более мелких именованных единиц, а незначительный остаток просто отбрасывался.

Для выяснения вопроса о происхождении дробей нужно обратиться не к счёту, а к другому процессу, появившемуся с самых древних времён наряду со счётом, — к измерению. Исторически дроби возникли в процессе измерения. В основе всякого измерения

всегда лежит некоторая область величин (длины, объёмы, веса и т. д.). Выбор той или иной единицы, служащей основанием системы мер, обусловливается конкретной исторической обстановкой.

Меры в своём развитии прошли примерно те же этапы, что и числа.

На первых стадиях развития человеческого общества измерение производилось «на-глаз». Мера воспринималась как некоторое свойство предмета, т. е. и здесь первоначально можно говорить лишь о мере — качестве. С дальнейшим развитием общества, когда такое измерение «на-глазок» стало явно недостаточным, появились некоторые натуральные меры, которыми были прежде всего, части человеческого тела: длина ступни, ширина ладони, расстояние от локтя до конца вытянутого среднего пальца и т. д.

О существовании таких древнейших мер говорит название мер длины, сохранившееся вплоть до наших дней. Такими мерами являются фут (длина ступни), дюйм (ширина большого пальца руки при его основании), ярд (локоть), пальма (ширина ладони). К этой же категории мер относятся маховая сажень (расстояние между средними пальцами разведённых рук) и косая сажень (расстояние между большим пальцем левой ноги, широко отодвинутой от правой, и средним пальцем вытянутой вверх правой руки), бывшие долгое время в употреблении у нас в России. Меры эти служили первоначально для установления равенства измеряемых величин (равновеликости), а также для установления того, какое кратное некоторой единицы меры содержится в измеряемой величине. При этом единицу меры Е повторяли целое число раз, до тех пор пока её кратное пЕ = Е-)-...+Е не становилось примерно равным измеряемой величине А (т. е. пока \А — /z£|<y£J. Этим устанавливалась связь измерения со счётом. Потребности более точного измерения привели к тому, что первоначальные единицы мер стали раздроблять на две, три или четыре части. Получившаяся в результате раздробления более мелкая единица меры получала индивидуальное название, и величины измерялись уже в этой, более мелкой единице.

Таким образом возникали первые конкретные дроби как определённые части некоторых определённых мер. Лишь много позднее названия этих конкретных дробей стали служить для обозначения таких же частей других величин, а затем и для отвлечённых дробей.

«Не следует путать „четверть" и „четь", как единицу измерения земельной площади или меры сыпучих тел, с „четвертью" или „четью", как дробью», — пишет Л. В. Черепнин1). Долгое время выражение «полчетверти» означало 1/8, но половина четверти как

1) Л. В. Черепнин, Русская метрология, М., 1944, стр. 53,

земельной меры обозначалась словом осьмина, употреблявшимся только как определённая земельная мера. Нельзя было сказать, например, осьмина книги или осьмина пути. Только много позднее осьмина стала служить для обозначения дроби Аналогично этому унция в римской системе мер первоначально означала часть денежной — весовой единицы асе. Однако постепенно слово унция начали употреблять как двенадцатую часть любой величины, т. е. в смысле отвлечённой дроби, и стало возможным говорить о пяти унциях пути или семи унциях книги.

Итак, первоначально узловые дроби служили названием определённых частей некоторых определённых мер. Отвлечённых дробей в это время ещё не существовало.

Это утверждение полностью подтверждается рассмотрением тех символов, которые первоначально употреблялись для обозначения индивидуальных дробей. Вавилонские символы для у, тт и у являлись одновременно изображениями сосудов, т. е. конкретных мер объёма. Египетской единицей площади был сетат — квадрат со стороной в один хет (один хет равен 100 локтям). Четверть сетата называлась «ломаной» и обозначалась % . Впоследствии слово «ломаная» стало общим названием дробей, а символ х начал обозначать в иератической системе отвлечённую дробь Есть основание предполагать, что половина сетата обозначалась знаком < (или i=). Единицей объёма служил «гекат», равный приблизительно 4 у л. Так как эта единица была очень мала, то обычно в качестве единицы принимали 100 гекатов. Половина и четверть этой единицы обозначались также при помощи символов < и % поставленных под символом, изображающим 100 гекатов1).

Обозначение типа * Г, где буквой Г мы условно обозначили символ геката, полностью аналогично употреблявшемуся римлянами выражению 5 унций пути. Такое перенесение названий определённой части одной меры для обозначений той же части другой меры явилось важнейшим шагом на пути создания абстрактного понятия дроби.

Другой единицей объёма у египтян было хену, равное геката; ^ хену называлась частью и обозначалась символом Впоследствии, как мы видели, этот символ употреблялся для обозначения части вообще.

1) И. Н. Веселовский, Египетская наука в Греции, стр. 437—440. Труды Института истории естествознания, т. II, 1948.

Таким образом, знаки для узловых дробей были первоначально знаками конкретных единиц мер. Затем эти знаки, написанные в сочетании с другими единицами мер, стали обозначать доли этих других единиц. То общее, что имеют определённые доли различных мер — дробь, выделялось постепенно. Далеко не сразу было замечено, что арифметические свойства дробей, получаемых первоначально путём повторения m раз я-й доли некоторой величины х: X = — Ху не зависят от свойств той области величин, к которой принадлежит лг. Процесс шёл много медленнее, чем процесс образования отвлечённого целого числа. Достаточно сказать, что даже римляне пользовались только конкретными дробями.

Есть все основания предполагать, что первоначально существовали только двоичные дроби. «Первой дробью, с которой познакомилось человечество, как нетрудно видеть а приори, была половина в её строго конкретной форме, именно в виде половины какого-нибудь реального предмета»1).

Вслед за половиной появляются дроби, идущие по двоичной системе. Этот этап развития нашёл своё выражение в древнеегипетской метрологии. Единицу площади сетат египтяне подразделяли на вторые, четвёртые, восьмые, шестнадцатые и тридцать вторые доли. Такие же подразделения имела и мера объёма — гекат. Для всех этих долей существовали индивидуальные названия. «В силу конкретности этих долей счёт их производился так же, как и счёт всяких целых предметов»2). Естественно, что числителями таких дробей могли быть только единицы. Позднее к этим дробям была присоединена -~ и её двоичные подразделения. Такие подразделения встречаются в более позднем египетском способе деления (образование половинного и двух-третних рядов). Подобным же образом строились и древнерусские меры. Так, единицей земельно-податной меры являлась соха, которая делилась на «полсохи», «треть сохи», «четверть сохи», «полтреть сохи», «пол-полтреть сохи» и «пол-пол-полтреть сохи». Другой земельной мерой была четверть, от которой бралась сначала треть, а потом половинные доли, наименьшей из которых была «пол-пол-пол-пол-пол-пол-пол-пол-пол-пол-третних».

Система древнерусских дробей строилась по тому же принципу, что и система мер. Основными дробями являлись:

числа, которая обозначалась словом «пол»,

«треть»,

1) В. В. Бобынин, Отзыв о сочинениях Н. М. Бубнова, стр. 114.

2) В. В. Бобынин, Цит. соч., стр. 115.

числа, которая обозначалась словом «четь, или четверть»,

«полтрети»,

«полчети», или «полчетверти»,

«пол-полтрети»,

«пол-полчети»,

«пол-пол-полтрети», или «малые трети»,

«пол-пол-полчети», или «малые чети».

Остальные дроби в древнерусских источниках часто выражались посредством сложения и вычитания этих «основных» дробей.

Так 24 схематически представлялось как "з + у2~~Г24' Эб^З* — 32*

Все эти соотношения выражались словами. Для обозначения какого-нибудь числа единиц без половины единицы употреблялось выражение «пол» этого неполного числа единиц. Так, 2 называлось «полтретьи», 3 -у — «полчетверти», 4 ~2--«полпяты», 5 -- «полшесты» и т. д. В качестве пережитка у нас до сих пор сохранилось выражение «полтора» для ly, т. е. «полвтора» — полвторого. Аналогичная система обозначения сохранилась у нас при счёте времени (полпятого, полшестого и т. д.)1).

По гипотезе И. Н. Веселовского египтяне от двоичных дробей перешли к дробям вида — в связи со счётом времени. При этом в качестве «числителя» дроби продолжали фигурировать только единицы. Число -|т> например, не могло быть выражено в египетской системе при помощи единого символа. Понятие o-jy, как о едином числе, единой дроби, у египтян не было. Все дроби вида ~, где т>1, они представляли по общим правилам в виде суммы

Так как число m можно пред-

1) Подобные же образования сохранились и в датском языке. Так 50 по-датски halvtresindstyve, что означает буквально полтри раза по двадцать.

ставить в двоичной системе т = 2л*-|- 2Л«—[— ... -j- 2nk, л, >л2> ... • ••>лА^0, то для представления — в виде суммы / — достаточно было уметь представлять в таком виде дроби —.И действительно, в египетских папирусах мы находим таблицы для подобного разложения —, /г=3, 5, 101. О том, как были составлены эти таблицы, существует много различных гипотез, которых мы здесь касаться не будем1). Отметим только, что уже при составлении этих таблиц, преследовавших чисто практические цели, египетскому вычислителю пришлось столкнуться с теоретико-числовыми проблемами.

В Греции, так же как и в Египте, употреблялись по преимуществу дроби вида —. Видимо, первоначально этой областью греческие дроби и ограничивались. Для обозначения дроби —, как мы говорили, писалось числовое значение п со штрихом справа. Так записывалась, как х*у' (х = 20, 7 = 3).

Герон Александрийский (I—II вв. н. э.) употреблял дроби вида —. Для их обозначения он сначала писал символ для m со штрихом справа, а затем дважды повторял символ для п, снабженный двумя штрихами справа. Например, дробь обозначалась, как ß's"e", а дробь g, как xfÀfÀf (х=20, Х = 30, т=3).

Диофант (III в. н. э.) обозначал дробь, как и мы, при помощи черты, только знаменатель он записывал над чертой, а числитель — под ней. Так, дробь он записывал в виде Дробь —Tn-ö-fT— выглядела так:

У Диофанта встречается и другое обозначение дробей: сначала записывается числитель, затем знаменатель, между которыми пишется слово uopwv (частица). Например:

Так же как и в Египте, в Греции было распространено представление дробей в виде суммы дробей с числителями единица.

Например,

(сложение заменялось простым приписыванием).

1) См. цитированную выше статью И. Н. Веселовского и статью С. А. Яновской «К теории египетских дробей*. Труды Ин-та истории естествознания, т. I, 1947.

Для астрономических расчётов греки употребляли вавилонские шестидесятиричные дроби, о которых мы скажем ниже.

Как уже говорилось, в отличие от греков римляне пользовались только конкретными дробями, а именно частями денежной единицы асе, подразделявшейся на 12 унций. Впоследствии унции стали применяться для измерения любой величины. Таким образом, Рим, знавший только именованные дроби, отставал в этом отношении даже от Египта более чем на полторы тысячи лет. Знаком для унции служила черта —, половина обозначалась буквой S (первая буква слова semis). Остальные двенадцатиричные дроби выражались комбинацией этих двух символов.

Например,

асса называлась семунцией (semunzia):

дуэллой (duella), сициликом (sicilicus), секстулой (sextula).

Второй ряд подразделений основной единицы шёл следующим образом: 1 = асе, = unzia, ^ = semunzia, ^gg = scrupel, g7g = simplium, т. е. каждая следующая дробь возникала из предшествующей попеременным умножением знаменателя на 2 и на 12. Весовая единица асе и её подразделения на унции долгое время сохранялись в аптекарском обиходе. Двенадцатиричные дроби римлян долгое время были в употреблении и у средневековых абацистов. На примере истории римских дробей можно видеть «непосредственное применение метрологической системы, выработанных для неё правил и приёмов счисления к отвлечённым дробям и выполнению над ними действий счёта»1). Такие случаи наблюдались и в других местах.

Индусы не распространили изобретённую ими десятичную позиционную систему на изображение дробей. Простые дроби они обозначали, надписывая числитель над знаменателем, но не ставили разделительной черты. Так, в Бахшалинской рукописи дробь изображается, как ^ . При изображении смешанной дроби целая часть надписывалась над числителем. Например, число 1 ~ схематически изображалось, как *. Такая запись впервые встречается у

1) В. В. Бобынин, Отзыв о сочинениях Н. М. Бубнова, стр. 119.

таджикского учёного ал-Насави (ум. ок. 1030 г. н. э.), причём в случае отсутствия целой части ал-Насави приписывал сверху нуль; -jy он изображал так А. Дробную черту мы встречаем у ал-Хассара (XII в.). Леонардо Пизанский применял её регулярно. Однако общеупотребительной она стала только в XVI в. Символы для изображения дроби в средние века были крайне разнообразны. Иногда числитель и знаменатель записывали при помощи римских цифр, своеобразно используя мультипликативный принцип. Так, в одной немецкой книге по арифметике (1514) дробь изображалась, как IIе

В манускрипте середины XIV в. встречаются обозначения 35 для — и 47 для у. Часто вместо у писали так 4 + означало 4 у. При произношении дроби в средние века всегда добавляли слово «части»: у произносилось, как две пятых части.

В России (XVI—XVII вв.) при выговаривании дроби со знаменателем от 5 до 10 прибавляли окончание «ина». Например, у — седьмина, ~ —десятина. Если знаменатель был более десяти, то к названию дроби добавлялось слово «жеребей», у^, например, читалось, как пять тринадцатых жеребьев. Дроби в русских рукописях назывались долями; позднее их стали именовать ломаными числами, что соответствовало латинскому термину numeri fracti. Такой терминологии придерживался и Магницкий в своей «Арифметике».

Единообразное алгорифмическое представление любых дробей впервые было проведено вавилонянами, обозначавшими дроби по той же шестидесятиричной позиционной системе, что и целые числа. При таком обозначении дроби подразумевалось известным, какие именно доли единицы берутся (60-е, 3600-е и т. д.); в записи непосредственно отмечалось только количество взятых долей. Индивидуальные обозначения небольшой группы дробей ^у, у, у и т. д.^ были почти полностью вытеснены из математических текстов. Даже -у впервые получила тут алгорифмическое представление в виде Щ (0,30). Шестидесятиричные дроби имели то неоспоримое преимущество, что оперировать с ними можно было по тем же правилам, что и с целыми числами. Благодаря этому шестидесятиричные дроби позднее распространились за пределы Вавилона.

Вероятно, не позднее середины II в. до н. э. дроби эти главным образом через посредство астрономических сочинений перешли в Александрию. Так как греческая алфавитная система нумерации была мало приспособлена для записи больших чисел и для оперирования с ними, то астрономам для вычислений таблиц нужно было либо ввести новую систему нумерации для целых чисел и принять радиус окружности равным достаточно большому целому числу (тогда хорды выражаются с нужной степенью точности в целых единицах этого радиуса), либо ввести новый способ представления дробей. Греческие астрономы выбрали последнее. Они оставили неизменной нумерацию целых чисел, а для дробей применили шестидесятиричную систему вавилонян, в которой они только изменили начертание цифр. Числа от 1 до 59 они обозначали не по аддитивному принципу при помощи знаков Т и (, а при помощи букв алфавита.

Знаменитый греческий астроном Клавдий Птолемей (II в. н. э.) делил окружность круга на 360 частей. Для этих частей Птолемей иногда употреблял слово т^'рлта, т.е. отрезки, которое было дословно переведено латинским словом segmentes. Чаще он называл их просто частями: fiolpai, сокращённо обозначая их fi°. Впоследствии начали писать один только верхний кружок, который сохранился до сих пор для обозначения градуса. Само слово «градус», по мнению Г. Нессельмана (1842), имеет арабское происхождение.

Каждую из получившихся частей (градусов) Птолемей делил в свою очередь на 60 частей, которые он называл словом Хетгта, дословно означающим «мелочь», или «первыми шестидесятыми». Следующие два шестидесятиричные подразделения он называл «вторыми шестидесятыми» и «третьими шестидесятыми». При переводе на латынь эти подразделения получили названия: minuta prima, minuta secunda, minuta tertia (т. е. первая минута, вторая минута и третья минута); слово «minuta» означает «уменьшенная» или «мелкая», являясь, таким образом, латинским переводом греческого слова «Хетгта». Отсюда произошли наши слова минута и секунда. Птолемей пользовался обычно не полными, а сокращёнными обозначениями шестидесятиричных разрядов, при этом его обозначение минут, секунд и терций совпадало с современным. Число 37°4'55" он записывал, как fj,°AC&'vs". Иногда символ \i° опускался, и тогда над числом градусов ставилась горизонтальная черта. При записи шестидесятиричных дробей греки употребляли символ о для обозначения пропущенного разряда, сходный по форме с нашим нулём. Так, число 12°0'24" записывалось, как ißo'xS" Целые числа продолжали записывать по обычной алфавитной системе. Буква о являлась в ней, как и прежде, символом для числа 70. В записи шестидесятиричных дробей число 70 встретиться не могло (так как число единиц в каждом шестидесятиричном разряде не превосходит 59), поэтому

букве о (омикрон) можно было приписать новое числовое значение. Предполагают, что знак 0 возник в результате сокращения слова oôôèv — ничего.

Заметим, что при специальном обозначении разрядов такой символ вовсе не был необходим, в то время как в вавилонской системе, когда отдельные разряды никак не отмечались при записи, введение межразрядового символа было очень существенным.

Шестидесятиричные дроби перешли от вавилонян не только к грекам, но и в страны Среднего и Ближнего Востока, а затем и в Западную Европу. Дроби эти употреблялись только в научных сочинениях; в общежитие они не вошли. В Средние века, таким образом, в Европе для представления целых чисел употреблялась десятичная позиционная система нумерации, а для дробей—либо шестидесятиричная система, либо различные представления в виде простых дробей1).

Некоторые намёки на десятичные дроби встречались ещё у индусов, которые при извлечении квадратного корня, в случае, если он не извлекался нацело, приписывали к подкоренному выражению столько пар нулей, сколько нужно было получить лишних знаков в корне. Однако десятичные дроби индусы всегда писали со знаменателем и не распространяли на них общей десятичной нумерации. Аналогичные приёмы употребляли и математики Среднего Востока, например ал-Насави.

В Европе подобный способ извлечения квадратных корней был впервые применён Иоанном Севильским в упоминавшемся уже нами сочинении «Практическая арифметика алгоризма» (XII в. н. э.). В середине XV в. при составлении тригонометрических таблиц учёные иногда принимали радиус крута равным 106 или 107 (Региомонтан и др.) и, таким образом, фактически получали значения тригонометрических величин в десятичных дробях.

В XV — XVI вв. дроби с десятичными знаменателями встречаются всё чаще. Так, мы находим довольно развитое учение о дробях с десятичными знаменателями у одного математика XIV в., жившего во Франции2). Подобные же дроби встречаются и у Кардана (XVI в.)3). Немецкий арифметик Грамматеус (1523)

1) Действия с дробями долгое время считались труднейшим и запутаннейшим отделом арифметики. У немцев до сих пор сохранилась поговорка— «попасть в дроби» (in die Brüche gerathen), употребляемая в смысле «попасть в тупик». Глава о дробях помещалась обычно в самом конце учебника, чтобы учащийся, не желающий себя слишком затруднять, мог овладеть остальными правилами арифметики без знания дробей. Большинство учеников так до этой главы и не добиралось.

2) О нём см.: Gandz, The invention of the decimal fractions and application of the exponential calculus by Immanuel Bonfils of Tarascon (Isis, XXV (1), 1936).

3) Самаркандский математик и астроном Джиат-Эддин Джемшид ал-Каши около 1420 г. выразил в виде десятичной дроби более чем с 15 знаками отношение длины окружности к радиусу.

советовал применять такие дроби для сравнения простых дробей. Чтобы узнать, какая из дробей у и "з" больше, он приписывал к каждому из числителей нули, т. е. раздроблял их в десятичные доли, а затем делил их на знаменатели: -g-= 62 у и -g-= 66-g-, откуда -g- .

Французский учёный Оронс Финэ (примерно 1550) при извлечении квадратного корня из 10 приписал к 10 шесть нулей, также получив фактически выражение искомого корня в десятичных дробях. Однако он сразу же перевёл полученное выражение в привычные шестидесятиричные дроби. Этот пример ясно показывает, что, несмотря на фактическое появление десятичных дробей, вплоть до последней четверти XVI в. они не применялись сколько-нибудь систематически.

Впервые начал последовательно применять десятичные дроби фламандский инженер и учёный Симон Стевин (1548—1620). В 1584 г. он издал на фламандском языке, а вскоре после этого и на французском таблицу процентов, а в следующем году опубликовал сочинение «La disme enseignant facilement expédier par nombres entiers sans rompuz tous comptes se rencontrans aux affaires des hommes» («Десятая, обучающая легко производить все расчёты, встречающиеся в людских делах, с помощью целых чисел, без дробей»). В этой брошюре, содержавшей всего семь страниц, и были введены десятичные дроби. Стевин вполне понимал значение десятичных дробей и распространил на них все действия арифметики. Он видел, что десятичные дроби были бы особенно полезны при условии введения десятичной системы мер, первым энергичным поборником которой он и сделался. Его желанием как можно шире распространить десятичную систему объясняется и то, что он написал «La disme» не по-латыни, а на разговорных фламандском и французском языках.

Обозначение десятичных дробей, предложенное Стевином, значительно отличалось от современного. Вместо нашей запятой он употреблял нуль, заключённый в кружок, а после каждого десятичного разряда указывался его порядковый номер, который также помещался в кружок. Например, число 35,912 записывалось им так: 3f>(0)tt(T)l($)2(3). В этом способе записи применяется тот же принцип, что и в предложенном Стевином обозначении показателей степеней неизвестных.

В 1608 г. «La disme» была переведена на английский язык Ричардом Нортоном, а в 1619 г. в Англии было опубликовано сочинение Генри Ляйта по десятичной арифметике.

Однако десятичные дроби далеко не сразу вытеснили все остальные. Им, как и десятичной позиционной системе счисления,

пришлось с трудом пробивать себе дорогу, завоёвывая себе место в упорной борьбе со старой традицией.

На континенте после Стевина десятичные дроби систематически применял Бюрги (1552—1632), швейцарец по рождению, рукописные сочинения которого относятся примерно к 1592 г. Бюрги употребил в качестве знака отделения целой части числа от дробной нуль, поставленный над цифрой для единиц.

В 1603 г Бейер во Франкфурте-на-Майне выпустил сочинение «Logistica Decimalis» («Десятичная арифметика»), в котором излагал правила действия с десятичными дробями. Эти дроби Бейер считал своим собственным изобретением. Бейерово обозначение десятичных дробей напоминает господствовавшее в то время обозначение для шестидесятиричных дробей. Число 123,459872 он записывал в виде 12 3-4-5-9-8-7-2 или короче в виде 123-459-872. Число 54 означало в его системе 0,000054. Бейер замечает, что его дроби отличаются от обычных тем, что при их обозначении знаменатель надписывается над числителем.

В течение XVI—XVII вв. продолжали существовать различные обозначения для десятичных дробей.

Первое введение в качестве разделительного знака запятой приписывается Бюрги и Кеплеру (1571—1630), употреблявшим её наряду со скобкой.

Десятичными дробями занимался и Непер (1550—1617), изложивший теорию этих дробей в своём сочинении «Rabdologia». В этой книге дроби, как правило, обозначаются тем же способом, каким мы теперь записываем градусы, минуты, секунды и т. д. Дробь 28,675 записывалась у него так: 2806'7/,5'", что читалось, как 28 целых, 6 прим, 7 секунд, 5 терций. Иногда разряды у него разделялись ещё двумя точками., В этом же сочинении Непер применил в качестве разделительного знака точку, применяющуюся до сих пор в качестве разделительного десятичного знака в Англии и Америке1). Однако наряду с десятичными дробями на протяжении всего XVII в, встречаются ещё и шестидесятиричные дроби, которые были окончательно вытеснены только в XVIII в.

У нас, в России, изложение учения о десятичных дробях впервые встречается в «Арифметике» Л. Магницкого (1703). Магницкий различал арифметику — логистику или астрономскую, т. е. оперирующую с шестидесятиричными дробями, которые он записывал в виде 51 25 42 51 25, и иную арифметику, «яже децималь или десятичная именуется», которую он употреблял только в геометрии. Излагая эту десятичную арифметику, он описывает десятичные меры длины и площади. В качестве мер длины там вводилась рута (гер-

1) Впервые употреблял (не систематически) десятичную точку Хр. Клавий (1593),

манская сажень), равная 10 футам; 1 фут = 10 долей, или пальцев; цоль = 10 гран, или зёрен; гран =10 скрупелей, или дробей.

В XVIII в. десятичные дроби получают всё большее распространение. Окончательно они укрепились в связи с введением десятичной системы мер и весов1). Теперь и в житейском обиходе, не говоря уже о статистике, чаще употребляют проценты (т. е. десятичные дроби), чем простые дроби.

1) Единая десятичная система мер и весов была впервые введена только после Французской буржуазной революции 1789 г. У нас, в СССР, метрическая система была введена постановлением Совнаркома от 14 января 1918 г. К 1926/27 г. она вытеснила окончательно старую систему.

Англия, США и некоторые другие страны до сих пор не ввели у себя обязательной метрической системы.

ЗАКЛЮЧЕНИЕ

С возникновением десятичных дробей десятичная позиционная система достигла завершения, приобрела необходимую для нумерации полноту и в основном стала господствовать в научном и житейском обиходе. Наряду с нею сохранились только крайне незначительные пережитки других систем, частью в речи, частью в расчётах (шестидесятиричное деление часа и градуса, применение ряда простых дробей: у, у, -j и т. д.), иногда при порядковой нумерации (с помощью букв алфавита).

Вместе с тем современная нумерация, которая возникла первоначально лишь для представления целых чисел, с введением десятичных дробей распространялась на все действительные числа1). При этом к ней не пришлось добавлять никаких существенно новых принципов; обозначение всех чисел с её помощью производится вполне единообразно.

Десятичная позиционная система, как легко видеть, полностью удовлетворяет всем требованиям, которые можно предъявить к удобной системе нумерации (см. стр. 33 настоящей статьи). Она одинаково удобна для представления и весьма больших и весьма малых чисел, которыми, начиная с эпохи Возрождения, человечеству приходится пользоваться во всё возрастающей мере и особенно в наш век исследований сверхгалактик, с одной стороны, и внутриатомного микромира, с другой. Этим требованиям в сколько-нибудь полной мере не удовлетворяла ни одна из предшествующих систем нумерации. Поэтому-то при поступательном движении человечества вперёд все они должны были уступить место десятичной позиционной системе, вопреки многовековой традиции и иным препятствиям.

Как мы видели, десятичная позиционная система явилась плодом долгого исторического развития. В создании её, растянувшемся на тысячелетия, приняли участие многочисленные народы Востока и Запада. История её происхождения представляет интерес не только в рамках одной дисциплины — математики, но имеет и более общее значение.

1) О действительных числах см. стр. 188, И. В. Проскуряков, Понятия множества, группы, кольца и поля. Теоретические основы арифметики,

1. Прежде всего подлинно научная и объективная история нумерации опровергает идеалистические учения об априорном характере понятия числа, о его мнимой прирождённости человеческому сознанию. История нумерации показывает, что понятие натурального числа (как и дроби), с его свойствами и законами возникло в результате отвлечения от определённых и вполне конкретных количественных свойств и отношений предметов реального мира, подобно тому как геометрия «...даёт свои законы, абстрагируясь от конкретных предметов, рассматривая предметы, как тела, лишённые конкретности, и определяя отношения между ними не как конкретные отношения таких-то конкретных предметов, а как отношения тел вообще, лишённые всякой конкретности»1).

2. Далее, история нашей нумерации показывает, что развитие систем счисления шло от разнообразия и разнородности к единству и однородности. Чем ниже был хозяйственный и культурный уровень общества, тем разнообразнее были употребляемые в нём системы счисления.

Первой всеобщей формой нумерации явились системы счисления типа иероглифической, основанные на аддитивном (а иногда и субтрактивном) принципе. Фазу иероглифической нумерации, соответствующую ещё очень примитивному устному счёту, в более или менее развитой её форме прошли, повидимому, все народы. Хотя принцип её построения в различных странах был один и тот же, но в выборе узловых чисел, каждое из которых служило основанием своей особой системы, а также в начертании их наблюдался полный разнобой.

Нумерацией нового типа, сменившей иероглифические системы, была алфавитная система счисления, явившаяся важнейшим шагом на пути создания современной универсальной нумерации. Она была хорошо приспособлена к оперированию с не очень большими числами в соответствии с хозяйственным диапазоном античной рабовладельческой формации или раннего феодализма.

Все алфавитные системы строились на общем им цифирном принципе и были десятичными. Эти два обстоятельства являлись важным шагом на пути создания единой нумерации. Однако то, что каждый народ применял при этом свой собственный алфавит, препятствовало созданию такой единой системы.

Наконец, последнюю стадию развития нумерации составляет наша десятичная позиционная система счисления, первая единообразная система, принятая во всём мире. Единым здесь является не только принцип её построения, но и начертание цифр.

3. Вместе с тем история нумерации служит дополнительной иллюстрацией сталинского положения о развитии через борьбу,

1) И. Сталин, Относительно марксизма в языкознании, Издательство «Правда», 1950, стр. 23.

борьбу нового и передового со старым и консервативным, о неодолимой и всепобеждающей силе прогрессивных элементов человеческого общества и человеческой культуры. Действительно, всякая система нумерации фиксирует уже существующий устный счёт. Счёт этот продолжает развиваться и совершенствоваться вместе с дальнейшим прогрессом общества. При этом зафиксированная в символах система счисления часто отстаёт от фактически существующих способов счёта. Тогда с неизбежностью появляются новые, более совершенные системы счисления. Мы видели, с каким трудом приходилось им всякий раз пробивать себе дорогу. Так, алфавитной системе пришлось преодолевать вековую традицию аттических государств, а десятичной позиционной системе противостояли реакционные силы европейского средневековья.

4. Наконец, история происхождения позиционной системы вновь показывает единство законов общественного развития. Подходом к позиционному принципу, как мы видели, служили мультипликативные системы, которые привели к созданию позиционности и введению нуля в Древнем Двуречье, у племени Майя, в позднеантичную эпоху и, наконец, в Индии. Создание современной позиционной системы не было, таким образом, случайным, а явилось закономерным завершением неизбежного исторического процесса.

История нумерации во многом сходна с историей языков, о которой И. В Сталин пишет: «Язык порождён не тем или иным базисом, старым или новым базисом, внутри данного общества, а всем ходом истории общества и истории базисов в течение веков. Он создан не одним каким-нибудь классом, а всем обществом, всеми классами общества, усилиями сотен поколений. Он создан для удовлетворения нужд не одного какого-либо класса, а всего общества, всех классов общества. Именно поэтому он создан, как единый для общества и общий для всех членов общества общенародный язык. Ввиду этого служебная роль языка, как средства общения людей, состоит не в том, чтобы обслуживать один класс в ущерб другим классам, а в том, чтобы одинаково обслуживать всё общество, все классы общества»1). История систем счисления показывает, что наша нумерация также была создана всем ходом истории общества и истории базисов в течение веков, усилиями сотен поколений и создана для обслуживания всего общества, всех его классов как система, единая для общества и общая для всех его членов.

1) И. Сталин, Относительно марксизма в языкознании, Издательство «Правда», 1950, стр. 5—6.

И. В. ПРОСКУРЯКОВ

ПОНЯТИЯ МНОЖЕСТВА, ГРУППЫ, КОЛЬЦА И ПОЛЯ ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АРИФМЕТИКИ

ВВЕДЕНИЕ

Понятие числа, возникшее на самых ранних ступенях развития человеческого общества из потребностей счёта, является одним из основных завоеваний человеческой культуры. Число является постоянным и незаменимым орудием всей нашей практической деятельности. Возможность применять числа для изучения и изменения окружающего нас материального мира обусловлена тем, что сами числа взяты человеком из этого мира, и все свойства чисел являются лишь абстрактным (освобождённым от ряда частных конкретных признаков) выражением реальных отношений материального мира. Так, число пять является лишь отражением в нашем уме реального свойства, общего пяти пальцам руки, цветку о пяти лепестках и всем прочим пятёркам материальных предметов независимо от их формы, размера, цвета и других конкретных свойств.

Энгельс об этом пишет: «...совершенно неверно, будто в чистой математике разум имеет дело только с продуктами собственного творчества и воображения. Понятия числа и фигуры взяты не откуда-нибудь, а только из действительного мира. Десять пальцев, на которых люди учились считать, т. е. производить первую арифметическую операцию, представляют собой всё, что угодно, только не продукт свободного творчества разума. Чтобы считать, надо иметь не только предметы, подлежащие счёту, но обладать уже способностью отвлекаться при рассматривании этих предметов от всех прочих их свойств, кроме числа, а эта способность есть результат долгого, опирающегося на опыт, исторического развития»1).

Такова суть математики с точки зрения диалектического материализма.

Противоположные взгляды высказываются буржуазными учёными-идеалистами. По их мнению, математика — продукт свободного творчества человеческого духа, а её основные понятия присущи нашему разуму априорно, т. е. до всякого опыта, даны человеку уже при его рождении.

Вздорность подобного взгляда на математику доказывается миллионы раз и на каждом шагу всей нашей практической деятель-

1) Ф. Энгельс, Анти-Дюринг, Госполитиздат, 1948, стр. 36—37.

ностью, когда применение математики даёт ожидаемые нами результаты. Последнее возможно только потому, что математические истины являются лишь отражением объективных закономерностей природы.

Число является основным орудием, при помощи которого математика изучает закономерности реального мира. Современное понятие о числе явилось результатом сложного и длительного процесса исторического развития. После натуральных чисел появились числа дробные, затем иррациональные и, наконец, отрицательные, комплексные. Настоящая статья лишь в самых общих чертах касается истории развития понятия числа, ставя своей задачей выяснение логической сущности этого понятия в его современном виде. Читатель не найдёт здесь большого числа новых для него свойств чисел. Не знакомство с новыми свойствами, а обоснование свойств чисел, известных каждому со школьной скамьи, — главная цель данной статьи.

Доказательство даже самых простых свойств чисел, как, например, переместительного или сочетательного закона сложения, требует точного определения числа и встречает поэтому значительные трудности. Тем не менее нам кажется, что учителю, ежедневно говорящему учащимся об этих свойствах чисел, нужно самому иметь представление о том, как они доказываются. Это весьма полезно с точки зрения развития общей математической культуры и для наиболее одарённых и интересующихся математикой школьников старших классов. По тем же соображениям статью можно рекомендовать студентам педагогических институтов. Так как построение действительных чисел входит в курс математического анализа, а комплексных чисел — в курс высшей алгебры физико-математических факультетов университетов, то соответствующие главы статьи можно рекомендовать студентам указанных факультетов.

Кроме обоснования свойств чисел, второй целью статьи является введение читателя в круг основных идей и понятий современной математики. К числу таких идей принадлежит представление об изоморфизме, а к числу понятий — понятия о множестве, группе, кольце и поле. Применение указанных общих понятий позволяет избежать многократного и утомительного повторения одних и тех же рассуждений при доказательстве аналогичных свойств чисел той или иной природы и позволяет читателю охватить свойства различных числовых областей с общей точки зрения. Конечно, у читателя, не знакомого с этими понятиями, такое изложение вызовет дополнительные трудности, так как этому новому взгляду на числа ему придётся действительно учиться. Ознакомление с этими идеями и понятиями современной математики представляет значительную часть того нового, что узнает читатель из настоящей статьи. Изложение обоснования понятия числа с точки зрения теории колец и полей может, как нам кажется, заинтересовать также и специалиста.

В главе первой даны необходимые сведения из теории множеств. В главе второй рассматриваются понятия группы, кольца и поля, причём в общем виде изучаются свойства алгебраических операций, которые затем многократно применяются при изучении чисел той или иной природы. В дальнейших главах последовательно вводятся натуральные, целые, рациональные, действительные и комплексные числа. В последнем параграфе рассматриваются также кватернионы и разбирается вопрос о возможности дальнейшего расширения числовых областей.

Имея в виду логическое обоснование свойств чисел, мы при использовании уже доказанных свойств обычно даём в скобках ссылку на соответствующую теорему из предыдущих глав. Поэтому читателю, желающему проверить правильность обоснования данного свойства, нужно либо читать всю предшествующую часть статьи, либо те части её, которые указаны в этих ссылках. Однако читателю, специально интересующемуся обоснованием свойств чисел данной природы и желающему принять свойства предыдущих числовых областей как известные, можно после первых двух глав и § 19 главы IV, где вводятся понятия, необходимые для понимания всего дальнейшего, читать сразу интересующую его главу. При таком чтении можно просто не обращать внимания на ссылки в скобках, так как свойства чисел, о которых идёт речь, сами по себе известны каждому школьнику. Так, приняв известными свойства рациональных чисел, можно после первых двух глав и § 19 читать сразу главу VI о действительных числах, приняв же известными свойства действительных чисел, можно читать главу VII о комплексных числах.

ГЛАВА I

МНОЖЕСТВА

§ 1. Понятие о множестве

Любая область математики изучает те или иные объекты не каждый в отдельности, а в их совокупности. Объекты, обладающие теми или иными общими свойствами, объединяются вместе в одну совокупность и изучаются совместно.

Совокупность всех натуральных чисел включается в более широкую совокупность целых чисел. Расширяя уже полученную числовую область, мы приходим, далее, к рациональным, действительным и, наконец, комплексным числам. В алгебре рассматриваются такие совокупности, как многочлены и алгебраические дроби. В геометрии, изучая свойства треугольника, отвлекаются от его положения на плоскости или даже от его размеров, получая теоремы, справедливые для всех равных или же всех подобных треугольников; в других случаях рассматриваются совокупности точек, обладающих тем или иным общим свойством (геометрические места) и т. д.

Мы ограничимся здесь лишь начальными сведениями из теории множеств, отсылая читателя, желающего детально с ней ознакомиться, к книгам П. С. Александрова [1] и Н. Н. Лузина [2].

Множество — это совокупность объектов, рассматриваемая как одно целое. Эти слова не следует принимать за определение понятия множества, ибо чем слово «совокупность» лучше слова «множество»? Понятие множества принимается за основное, т. е. не сводимое к другим понятиям. Объекты, составляющие данное множество, называются его элементами. Основное отношение между элементом а и содержащим его множеством А обозначается так: a Ç А (словами: а есть элемент множества А; или а принадлежит А, или А содержит а). Если а не является элементом множества Л, то пишут а^А (словами: а не входит в Л, Л не содержит а). Множество можно задать указанием всех его элементов, причём в этом случае употребляются фигурные скобки. Так {а, Ь, с} обозначает множество трёх элементов. Аналогичная запись употребляется и в

случае бесконечных множеств, причём невыписанные элементы заменяются многоточием. Так, множество натуральных чисел обозначается {1, 2, 3,...}, а множество чётных чисел {2, 4, 6,...}, причём под многоточием в первом случае подразумеваются все натуральные числа, а во втором — только чётные.

Два множества А и В называются равными, если они состоят из одних и тех же элементов, т. е. если каждый элемент множества А принадлежит В и, обратно, каждый элемент В принадлежит Л. Тогда пишут А = В. Таким образом, множество однозначно определяется его элементами и не зависит от порядка записи этих элементов. Например, множество из трёх элементов а, Ь, с допускает шесть видов записи:

{а, Ь, с} = {а, с, b\ = {b, а, с} = {Ь, с, а} = {с, a, b} = {c, Ь, а].

Из соображений формального удобства вводят ещё так называемое «пустое множество», а именно, «множество», не содержащее ни одного элемента. Мы будем обозначать его символом 0 (совпадение с обозначением числа нуль не ведёт к путанице, так как смысл символа каждый раз ясен).

Если каждый элемент множества А входит во множество В, то А называется подмножеством В, a В называется надмножеством Л. Пишут Ас^-В, В^эА (словами: А входит в В или А содержится в В, В содержит А). Очевидно, что если Лс5 и Вс^А, то А = В. Пустое множество по определению считается подмножеством любого множества.

Если каждый элемент множества А входит в В, но множество В содержит хотя бы один элемент, не входящий в А, т. е. если Лс5 и Л^Д то Л называется собственным подмножеством В, a В — собственным надмножеством Л. В этом случае пишут AczB, В =э Л. Например, запись Л ф О и Л =z> 0 означает одно и то же, именно, что множество Л не пусто.

Заметим ещё, что надо различать элемент а и множество {а}, содержащее а в качестве единственного элемента. Такое различие диктуется не только тем, что элемент и множество играют неодинаковую роль (отношение а Ç Л не симметрично), но и необходимостью избежать противоречия. Так, пусть А = {а, Ь\ содержит два элемента. Рассмотрим множество {Л}, содержащее своим единственным элементом множество Л. Тогда Л содержит два элемента, в то время как {А} — лишь один элемент, и потому отождествление этих двух множеств невозможно. Поэтому мы не будем применять запись aczA, сохраняя обозначение а СЛ.

Примеры множеств. Примеров множеств можно привести сколько угодно. Так, можно говорить о множестве всех букв данной книги, причём одна и та же буква на разных страницах или разных строках одной страницы считается за два различных элемента множества, о множестве всех людей земного шара, причём надо сделать предположение, что в рассматриваемый момент времени

никто не рождается и не умирает, о множестве молекул воды в данном стакане и т. д.

Всё это — конечные множества. Приведём некоторые примеры бесконечных множеств, кроме упоминавшихся выше множеств натуральных чисел, чётных натуральных чисел, рациональных чисел, действительных чисел и др.

Пусть а и b — два действительных числа, причём а<b. Множество всех действительных чисел х, для которых а^х^Ь, называется отрезном с концами a, b и обозначается через [а, Ь]. Множество (а, Ь) всех х, для которых а<х<b, называется интервалом с концами а, Ь. Далее полуинтервалами называются множества [а, Ь) тех х, для которых а^х<b, и (а, Ь] тех х, для которых а<х^Ь. Введём ещё два символа: -|-оо (плюс бесконечность), — оо (минус бесконечность). Они не являются числами и вводятся лишь для удобства записи. Тем не менее для более лёгкого обращения с ними условимся говорить, что +оо больше, а —оо меньше любого действительного числа. Тогда можно ввести обозначения, аналогичные приведённым выше, для бесконечных полуинтервалов и интервалов. Именно: [а, -|-оо) — множество чисел лг, для которых а^х, (—оо, Ь] — множество чисел х, для которых X =^ Ь, (а, + оо) — множество чисел лг, для которых а < х, (— оо, Ь) — множество чисел лг, для которых х<b, (—оо, --(-оо) — множество всех действительных чисел.

§ 2. Операции над множествами

Объединением множеств Л и В называется множество элементов, принадлежащих по крайней мере одному из данных множеств (т. е. либо Л, либо By либо одновременно и А и В). Пишут A (J В и читают «объединение А и В».

Пересечением множеств А и В называется множество элементов, принадлежащих одновременно и А и В. Пишут А {] В и читают «пересечение А и В».

Разностью множеств А и В называется множество элементов, принадлежащих Л и не принадлежащих В. Пишут А\В и читают «разность Л и В»1).

Пример 1. Пусть Л есть отрезок [1, 3], В — отрезок [2,4]; тогда объединением Л (JВ будет отрезок [1, 4], пересечением А[\В— отрезок [2, 3], разностью А\В — полуинтервал [1, 2), В\А — полуинтервал (3, 4].

Пример 2. Пусть Л есть множество прямоугольников, В — множество всех ромбов на плоскости. Тогда А[)В есть множество всех квадратов, А\В — множество прямоугольников с неравными сторонами, В\А — множество всех ромбов с неравными углами.

1) Некоторые авторы применяют обозначения А+В, AB, А — В, но в алгебре это не удобно из-за смешения с алгебраическими операциями.

Операции объединения и пересечения множеств обладают многими свойствами сложения и умножения чисел, например переместительным, сочетательным и распределительным свойствами.

Понятия объединения и пересечения множеств дословно переносятся на случай более двух множеств и даже на случай любого конечного или бесконечного множества множеств.

Для удобства речи будем называть системами такие множества, элементами которых служат другие множества. Тогда объединением множеств некоторой системы называется множество, состоящее из элементов, принадлежащих по крайней мере одному множеству данной системы. Пересечением множеств некоторой системы называется множество, состоящее из элементов, входящих во все множества данной системы.

Применяются следующие обозначения. В случае конечной системы множеств Alf Л2,Ап объединение 5 и пересечение D обозначаются:

В случае бесконечной последовательности множеств Аи Л2,... ..., Апу..., т. е. системы, множества которой занумерованы всеми натуральными числами, пишут:

Пример 3. Пусть Ап есть множество точек плоскости, лежащих в круге радиуса 2п с центром в точке О, причём п принимает все целые значения от — оо до + оо. Тогда объединение совпадает со множеством точек всей плоскости, а пересечение содержит лишь одну точку О.

Наконец, в случае произвольной системы {Ат} множеств Ат, индексы которых составляют некоторое множество М, пишут:

Пример 4. Пусть X—множество всех положительных чисел X и Ах—множество точек круга радиуса х с центром в точке О.

Тогда снова объединение JJ Ах будет множеством всех точек плоскости, а пересечение Ах содержит лишь одну точку О.

§ 3. Функция, отображение, мощность

Понятие функции играет в математике такую же существенную роль, как понятие множества. Что же такое функция? Часто говорят, что функция есть переменная величина, зависящая от другой переменной величины (аргумента). В применении к обычным функциям, изучаемым в школе, как y = sinx, это определение вполне подходит и может применяться в преподавании. Наша задача, однако, состоит в более точном уяснении сущности этого понятия и получении современного его определения. Прежде всего, если взять функцию

_y = sin2.*;+cos2 X,

то её значение уже не зависит от значения х. Далее, под величинами принято понимать такие объекты, которые можно сравнивать между собой, т. е. такие, между которыми существуют отношения больше и меньше. Между тем в математике рассматриваются также и функции, для которых эти отношения не установлены, как, например, в случае комплексных чисел или вообще элементов некоторого множества. Внимательное рассмотрение показывает, что в понятии функции существенно не столько её изменение с изменением аргумента, сколько сам закон соответствия, в силу которого по каждому значению аргумента однозначно определяется соответствующее ему значение функции. Так функцию

у = sin1 X+cos? X

можно определить, просто сказав, что каждому действительному числу X она ставит в соответствие число 1. Соответствие есть закон, позволяющий для каждого элемента х некоторого множества X однозначно указать некоторый объект (соответствующий данному элементу). Эти слова лишь поясняют понятие соответствия, но не должны пониматься как его определение. Понятие соответствия, как и понятие множества, принимается за основное, не подлежащее определению. Тогда наиболее общее определение функции будет такое:

Определение 1. Функцией, заданной (или определённой) на некотором множестве X, называется соответствие, в силу

которого любой элемент х множества X определяет некоторый (соответствующий ему) объект f(x).

Множество X называется областью определения функции, а множество Y — объектов, соответствующих всем элементам множества X, — областью значений функции.

Пример 1. Пусть y = s\nx. За область определения функции можно принять множество действительных чисел. Тогда областью значений функции будет отрезок [—1, +1].

Пример 2. Пусть y = tgx. За область определения функции можно принять множество действительных чисел, отличных от чисел вида пъ +y, где п пробегает все целые значения (ибо для этих значений х функция не определена). Тогда областью значений функции будет множество всех действительных чисел.

Пример 3. Функция Дирихле:

0 при X рациональном,

1 » X иррациональном.

Область определения здесь — множество действительных чисел, область значений — множество {О, 1} из двух элементов.

Замечательно, что гениальный русский математик Н. И. Лобачевский более ста лет назад дал определение функции, весьма близкое к приведённому. В противовес господствовавшему тогда взгляду на функцию как на аналитическое выражение (т. е. как на формулу) он подчёркивал значение идеи соответствия в определении понятия функции.

«Это общее понятие, — писал Лобачевский о понятии функции, — требует, чтобы функцией от х называть число, которое даётся для каждого X и вместе с х постепенно изменяется. Значение функции может быть дано или аналитическим выражением или условием, которое подаёт средство испытать все числа и выбирать одно из них, или, наконец, зависимость может существовать и оставаться неизвестной»1).

Весьма близким к понятию функции является понятие отображения.

Определение 2. Пусть даны два множества X и Y. Такое соответствие, при котором каждому элементу х^Х соответствует (единственный) элемент Y4 называется отображением множества X в множество Y; в частности, если каждый элемент y^Y соответствует по крайней мере одному элементу х^Х, то такое соответствие называется отображением X на Y.

1) Н. И. Лобачевский, Об исчезании тригонометрических строк. Учёные записки Казанского университета, кн. II, 1834.

Если элементу х соответствует у, то у называется образом элемента х, а х — прообразом элемента у. Пишут: х-+у или у = =f(x). Множество Л всех элементов х£Х, имеющих один и тот же образ у£ Y, называется полным прообразом элемента у.

Пример 4. Пусть D — множество действительных чисел. Соответствие х->\х\ будет отображением множества D в себя же и отображением D на множество неотрицательных чисел. Прообразом числа 0 будет один 0, число у>0 имеет два прообраза: -J--V и —у.

Пример 5. Поставим в соответствие каждой точке квадрата её проекцию на основание. Получим отображение квадрата на отрезок. Полным прообразом каждой точки основания будет множество всех точек квадрата, лежащих на перпендикуляре к основанию, восставленном в данной его точке.

Примеры 4 и 5 показывают, что при отображении множества X в Y, с одной стороны, некоторые элементы из Y могут вовсе не иметь прообразов, а, с другой стороны, могут быть элементы, имеющие несколько (даже бесконечно много) прообразов. Если нет ни того, ни другого, то отображение называется взаимно однозначным. Таким образом, мы приходим к следующему определению:

Определение 3. Взаимно однозначным соответствием между множествами X и Y (или отображением X на Y) называется соответствие (соответственно, отображение), обладающее следующими тремя свойствами: 1) каждому элементу множества X соответствует один и только один элемент множества Y; 2) двум различным элементам множества X всегда соответствуют два различных элемента множества Y; 3) всякий элемент множества Y соответствует хотя бы одному элементу множества X.

Заметим, что первые два свойства дают взаимно однозначные отображения X на некоторое подмножество Y. В этом случае говорят о взаимно однозначном отображении X в К.

Если y=f(x) есть взаимно однозначное отображение X на Y, то каждому у£ Y можно поставить в соответствие тот единственный элемент х\Х, образом которого при отображении / является у. Это соответствие называется обратным отображением для отображения / и обозначается через В качестве упражнение предлагается доказать, что f~l есть также взаимно однозначное отображение Y на X и что обратным для отображения f~l будет исходное отображение /.

Определение 4. Два множества X и Y, между которыми можно установить взаимно однозначное соответствие, называются равномощными (или эквивалентными), что обозначается символом Xr^Y.

О равномощных множествах говорят также, что они имеют одинаковую мощность. Условимся считать, что пустое множество равномощно только самому себе.

Замечание. Выше мы дали определение понятия равномощности, но не понятие мощности. Можно сказать, что мощность есть то общее, что имеется у всех равномощных между собой множеств. Впрочем, всюду достаточно понятие равномощности.

Соотношение равномощности обладает следующими тремя основными свойствами:

1) рефлексивность: Х~Х;

2) симметрия: если X~Y, то Y^X;

3) транзитивность: если Х^У и Y<~^Z, то X^Z.

Для доказательства, например, первого из них достаточно каждому элементу х^Х поставить в соответствие его же самого (тождественное отображение), что уже даёт взаимно однозначное отображение множества X на себя. Доказательство остальных двух свойств предоставляется читателю.

Мощность множества характеризует, так сказать, «количество» его элементов. Однако при этом может оказаться, что «часть равна целому», т. е. множество может иметь одинаковую мощность с его собственным подмножеством.

Пример 6. Функция у=10ху где х — действительное число, устанавливает равномощность отрезка [0, 1] и в 10 раз более длинного отрезка [0, 10]. Таким образом, в смысле мощности «количество» точек обоих отрезков одинаково.

Пример 7. Два любых отрезка [а, Ь] и [с, d], a также два любых интервала (а, Ь) и (с, d) равномощны.

Для доказательства достаточно рассмотреть функцию

Во-первых, каждому действительному числу х однозначно соответствует у, причём легко видеть, что а-+с и b-+d. Далее, пусть

Согласно определению отрезка и интервала (см. стр. 82) а<b и

Следовательно,

Поэтому Ух<Уъ. Итак, если

Значит, точкам отрезка [а, Ь] соответствуют точки отрезка [с, d], причём различные точки переходят в различные же (и то же верно в случае интервалов). Наконец, обратное отображение обладает теми же свойствами, откуда следует, что для каждого у из [с, d] найдётся один (и даже только один) прообраз х из [а, Ь]

(то же для интервалов). Этим доказано, что [a, b\ ~ [с, d] (соответственно, (а, b)~(c, d)).

Пример 8. Функция y=tgx устанавливает эквивалентность интервала

множеству всех действительных чисел.

Пример 9. Считая соответствующими друг другу числа, стоящие одно под другим в следующих строках:

(рп — п-е — простое число),

мы заключаем, что множества всех натуральных чисел, чётных чисел, нечётных чисел, степеней 10, простых чисел все имеют одну и ту же мощность, хотя первая из них является собственным надмножеством остальных.

Пример 10. Множество натуральных чисел равномощно множеству рациональных чисел. В самом деле, любое рациональное число, отличное от нуля, однозначно записывается в виде несократимой дроби —, где принято q>0 (т. е. знак отнесён к числителю).

Из возможных записей для нуля: выберем одну:

Тогда запись вида однозначно определена для всех рациональных чисел (в частности, при q= 1 получатся все целые числа).

Высотой числа ~ назовём натуральное число \р | q, где \р\ — абсолютная величина р. Тогда все рациональные числа можно расположить в одну последовательность, располагая их в порядке возрастания высоты, а числа с одинаковой высотой — в порядке возрастания числителя. Таким образом, получим последовательность

Так как чисел данной высоты п — лишь конечное число [именно, не более 2{п—1), ибо числитель меняется от —(п—1) до -\~(п—1)> исключая значение 0], то перед каждым данным числом в последовательности стоит лишь конечное число чисел. Поэтому, нумеруя числа последовательно по порядку натуральными числами, мы действительно занумеруем все рациональные числа, что и доказывает требуемую равномощность.

§ 4. Конечные и бесконечные множества

Все указанные в предыдущем параграфе множества, равномощные собственным подмножествам, были бесконечны. Мы сейчас увидим, что это не случайно (см. ниже теорему 1). Однако сначала необходимо дать строгое определение понятия конечного и бесконечного множества. При этом нам придётся существенно использовать свойство натуральных чисел, строгое обоснование которых будет дано лишь в главе III. Читателю нужно убедиться, что в наших рассуждениях нет порочного круга. Для этого достаточно проверить, что при обосновании в главе III свойств натуральных чисел, применяемых в первых двух главах, мы нигде не пользуемся полученными в этих главах результатами.

Определение 1. Множество натуральных чисел, меньших или равных некоторому натуральному числу п, называется отрезком натурального ряда и обозначается через | 1, п\.

Определение 2. Множество, равномощное отрезку натурального ряда, а также пустое множество, называется конечным. Множество, не являющееся конечным, называется бесконечным.

Иными словами, конечное множество (если оно не пусто) есть такое множество, элементы которого можно «пересчитать», т. е. перенумеровать так: аи а2,..., ап, причём все элемента- будут занумерованы, все числа от 1 до л будут использованы и различные элементы получат различные номера. Бесконечное же множество такое, элементы которого так «пересчитать» нельзя.

Из свойств 2) и 3) равномощности, приведённых в предыдущем параграфе, следует, очевидно, что множество, равномощное конечному (или бесконечному) множеству, само будет конечным (соответственно, бесконечным).

Теорема 1. (Основная теорема о конечных множествах.) Конечное множество не равномощно никакому его собственному подмножеству и собственному надмножеству.

Доказательство. Каждое из двух утверждений теоремы (о неравномощности подмножеству и надмножеству) легко следует из другого, так как, если А ~ В и A zd В, то из конечности одного из множеств А и В, как было отмечено выше, следует конечность другого. Докажем, например, что конечное множество А не равномощно его собственному подмножеству. Для пустого множества А = 0 теорема верна, так как пустое множество вовсе не имеет собственных подмножеств. Пусть А ф 0. Тогда по определению конечного множества множество А равномощно (по крайней мере одному) отрезку натурального ряда (1, п\. Докажем индукцией по числу п1), что А нельзя взаимно однозначно отобразить на его соб-

1) Заметим, что нельзя вести индукцию по числу элементов множества А так как понятие о числе элементов вводится ниже с применением теоремы 1.

ственное подмножество В. Для п=1 это очевидно, так как 1| и содержит лишь один элемент. Единственным его собственным подмножеством будет В = 0, причём А не равномощно В.

Предположим, что теорема доказана для натурального числа ri, и докажем её для числа л-j-l. Итак, пусть Л~|1, п+ 1 |, и/ есть взаимно однозначное отображение А на В. Занумеровав элементы А соответствующими им числами, получим:

А = {аг, а2,ап+1}.

Для В = 0 утверждение справедливо. Если В^/ЬО, то без ограничения общности можно предположить, что ап+1 £ В. Иначе берём элемент Ь^В и строим новое множество Ви полученное из В заменой элемента b на ап+1, и новое отображение fu которое совпадает с / для всех элементов множества Л, кроме элементов а со свойством f(a) = b, причём для этого элемента а полагаем /1(а) = = ап+1. Тогда fx будет взаимно однозначным отображением А на собственное подмножество Ви содержащее ап+1. Далее, без ограничения общности можно считать, что f(an+1) = an+1. Иначе пусть f(ai) = an+1 и f(an+1) = aj. Тогда строим новое отображение fu совпадающее с / для всех элементов А, кроме at и ап+1, причём полагаем /, (а,) = af и /, (ая+1) = ап+1. Итак, пусть ап+1 (.В и/ (ая+1) = — ап+\> пусть также А' = А\\ап+1} и B' = B\{an+i\. Так как В — собственное подмножество Л, то существует элемент а'£А\В. Так как an+1ÇB, то а!фапЛг1. Поэтому а'^А^В'. Значит, В' есть собственное подмножество А'. Так как/(ал+1) = ад+1, то отображение / устанавливает равномощность множеств А' и В', но А' = — {а19 а2,ап}^| 1, п|. Мы получили противоречие с предположением индукции, чем наше утверждение, а значит, и вся теорема доказаны.

Из теоремы 1 легко следует

Теорема 2. Всякое непустое конечное множество равномощно одному и только одному отрезку натурального ряда.

Доказательство. По определению 2 непустое конечное множество А равномощно по крайней мере одному отрезку натурального ряда. Если бы оно было равномощно двум различным отрезкам т\у п\, тфПу, то по свойствам равномощности будет: |1, п\, что противоречит теореме 1, так как один из двух различных отрезков натурального ряда является собственным подмножеством другого.

Определение 3. Однозначно определённое для данного непустого конечного множества А натуральное число п такое, что п |, называется числом элементов множества А. Числом элементов пустого множества называется число 0.

Из свойств равномощности следует, что два конечных множества тогда и только тогда равномощны, когда они имеют одно и то же

число элементов. Поэтому число элементов можно принять за определение мощности конечного множества.

Теорема 3. Любое подмножество конечного множества само конечно. Любое надмножество бесконечного множества само бесконечно.

Доказательство. Каждое из двух утверждений теоремы следует из другого. Так, если первое утверждение верно, то верно и второе, так как если А бесконечно иЛс5} то и В бесконечно, ибо если бы В было конечно, то по первой половине теоремы и А было бы конечно. Достаточно поэтому доказать первое утверждение. Итак, пусть А конечно и & ЕЕ А. Если А = О, то и В = О, теорема справедлива. Пусть А zd 0. Тогда Л^|1, п\ для некоторого натурального числа п. Применим индукцию относительно п. При п=1 теорема верна, так как А содержит один элемент, и либо В = 0У либо В = А. Пусть утверждение верно для некоторого п. Докажем его для числа п+1. Итак, пусть /—взаимно однозначное отображение А на отрезок I 1, Если В = АУ то В конечно. Пусть BœzA. Существует элемент а£ А\В. Можно считать, что /(а) = #-|-1. Иначе f(a') = n+ 1, где а'£Л, а фа. Если тогда /(а) = /, то строим новое отображение fl9 полагая fx (а) = п+1, f1(a') = i и /i=/ для остальных элементов множества А. Итак, пусть f(a) = n+1. Положим Л'=Л\{а}. Тогда /определяет взаимнр однозначное отображение множества Ä на отрезок 11, п\, и Z?czА'. Следовательно, по предположению индукции В конечно. Теорема доказана.

Согласно теореме 3 понятие о числе элементов имеет смысл для любого подмножества данного конечного множества. При этом имеет место

Теорема 4. Число элементов конечного множества А всегда больше числа элементов его собственного подмножества В.

Доказательство. Пусть m — число элементов А и п — число элементов В. Предположим, что п^т. Так как A id В, то АфО, п>0 и Л~|1, т\. Также и n^m>0f следовательно,

(1)

При взаимно однозначном отображении А на отрезок 11, т\ множество В отображается также взаимно однозначно на некоторое собственное подмножество В' отрезка 11, т\% таким образом,

(2)

(3)

Но из (1) и (2) вытекает B'^j 1, я], что в силу (3) противоречит теореме 1, ибо отрезок | 1, п\ оказывается равномощным своему собственному подмножеству В'.

До сих пор мы ещё не доказали бесконечности какого-либо множества. Но из теоремы 1 следует

Теорема 5. Множество N всех натуральных чисел, а также любое множество, содержащее подмножество, равномощное N, бесконечны.

Доказательство. Множество N бесконечно, ибо отображение f(n) = п +1 для любого натурального числа п отображает взаимно однозначно N = { 1, 2, 3, ...} на его собственное подмножество Nx = { 2, 3, 4, ... }. Значит, любое множество N1, равномощное N, бесконечно, а по теореме 3 и любое множество, содержащее подмножество N', равномощное N, также бесконечно.

Примеры. Множества действительных или комплексных чисел содержат множество N натуральных чисел и, следовательно, бесконечны. Отрезок [0, 1] также есть бесконечное множество, так как он содержит множество N' чисел вида — (п=1> 2, 3, ... ), равномощное N.

Определение 4. Множество, равномощное множеству натуральных чисел, называется счётным.

Иными словами, счётное множество — это такое множество, элементы которого можно «перенумеровать» при помощи натуральных чисел так, чтобы при этом все числа были использованы и различные элементы всегда имели бы различные номера. Таким образом, счётное множество А всегда можно записать в виде

А = { аи а2, ... , ап, ... }.

Как показывают примеры в конце предыдущего параграфа, множества чётных или нечётных чисел, а также множество рациональных чисел счётны.

Определение 5. Множество, не являющееся конечным или счётным, называется несчётным.

Следующий пример показывает, что такие множества действительно существуют1).

Множество всех действительных чисел несчётно. Заметим сначала, что из примеров 2 и 3 предыдущего параграфа следует равномощность этого множества интервалу (0, 1). Достаточно поэтому доказать несчётность последнего.

Мы будем считать известным, что каждое число интервала (0, 1) записывается в виде конечной или бесконечной десятичной дроби вида

О, аг а2 аг ...

1) Существует даже бесконечно много различных мощностей, на чём мы останавливаться не будем, отсылая желающих к уже упомянутым выше книгам Г1], стр. 40 или [2].

При этом хотя бы одна из цифр а£ отлична от нуля (ибо число 0 = 0,000... не принадлежит интервалу). Далее, для чисел, имеющих запись в виде конечной десятичной дроби, существует и другая запись, где все цифры аь начиная с некоторого места, равны 9. Например,

0,53000 ... =0,52999 ...

Остальные числа (т. е. иррациональные и те рациональные, которые разлагаются в периодическую дробь с периодом, не равным 9) имеют единственную запись1). Из двух возможных записей для первых чисел мы выберем какую-нибудь одну, например, в виде конечной десятичной дроби. Тогда все числа интервала (0, 1) будут единственным образом записываться в виде

0, ах а2 аъ ... ,

где не все а£ равны 0 и никогда все цифры, начиная с некоторой, не могут равняться 9. Обратно, всякая такая десятичная дробь даёт число интервала (0, 1).

Легко видеть, что интервал (0, 1) есть бесконечное множество, ибо он содержит множество

равномощное множеству натуральных чисел (см. теорему 5). Покажем, что (0, 1) не является счётным множеством.

Предположим обратное. Тогда все числа интервала можно занумеровать так:

(0, 1) = {си с2, с3, ... }.

Запишем каждое число десятичной дробью указанного вида:

(4)

Построим теперь число

с = 0, Ьх Ь2 Ьъ ...

следующим образом: берём цифру Ьи отличную от ап, 0 и 9; берём £2, отличную от а22, 0 и 9; ЬЪу отличную от а33, 0 и 9; Ьп, отличную от апп, 0 и 9, ... Наличие десяти цифр оставляет для такого

1) См, стр. 253, А. Я. Хинчин, Элементы теории чисел.

выбора достаточно возможности (именно, каждый раз в нашем распоряжении остаётся ещё семь цифр). Дробь 0, b1b2 Ъъ ... обладает нужными свойствами и даже в усиленной форме — она вовсе не имеет цифр 0 и 9. Значит, число с принадлежит интервалу (0, 1). Но запись с отлична от записей всех чисел (4). В самом деле, запись с отличается от си ибо Ьг^а1и от с2, ибо &2 7^ #22 и т. д. Но дробью нашего типа числа интервала записываются однозначно. Значит,

Оказалось, что число с не входит во множество чисел (4), тогда как мы предположили, что в (4) перенумерованы все числа интервала. Полученное противоречие доказывает наше утверждение.

Среди всех бесконечных множеств счётные множества являются наименьшими в следующем смысле:

Теорема 6. Всякое бесконечное множество содержит счётное подмножество.

Доказательство. Пусть M — бесконечное множество. Тогда МфО. Выберем какой-нибудь из его элементов и обозначим его через av Пусть в M уже выбраны п различных между собою элементов аи аъ ... , ап. Так как M бесконечно, то

iM\{alf а2, ... , ап]

и можно выбрать элемент

£М\{аи а2, ... , ап}.

Он отличен от всех ранее выбранных элементов. По принципу индукции доказано, что для любого п существует в M подмножество An = {alt а2, ... , ап} из п элементов, причём множество Ап+1 получается из Ап присоединением одного нового элемента ап+1. Очевидно, что объединение

является счётным подмножеством М.

Теперь легко доказать, что свойство конечного множества не иметь равномощного ему собственного подмножества (см. теорему 1) для бесконечных множеств никогда не выполняется. Именно имеет место

Теорема 7. Всякое бесконечное множество M равномощно некоторому собственному подмножеству.

Доказательство. По теореме 6 множество M содержит счётное подмножество

Пусть М\А = В, В^эО. Определим отображение / множества M в себя следующим образом:

f(an) = an+l (я=1, 2, ... ), №=Ь

для любого b ^ В. Очевидно, что / является взаимно однозначным отображением множества M на его собственное подмножество Äf\(aib что и доказывает теорему.

Дадим теперь другое определение понятий конечного и бесконечного множеств.

Определение 2'. Множество, не имеющее равномощного с ним собственного подмножества, а также пустое множество, называется конечным. Множество, не являющееся конечным, называется бесконечным.

Из теорем 1 и 7 следует эквивалентность определения 2' прежнему определению 2. В самом деле, если множество конечно в смысле определения 2, то по теореме 1 оно конечно и в смысле определения 2'. Обратно, если множество конечно в смысле определения 2', то оно должно быть конечно и в смысле определения 2, так как иначе оно было бы бесконечно в смысле определения 2 и по теореме 7 бесконечно также в смысле определения 2', что невозможно. Итак, оба определения конечных множеств эквивалентны. Отсюда (посредством рассуждения от противного) сразу вытекает эквивалентность определений бесконечных множеств.

Отметим, что определение 2' имеет то (правда, лишь формальное) преимущество перед определением 2, что оно формулировано в терминах общей теории множеств, тогда как определение 2 предполагает известными свойства натурального ряда.

§ 5. Упорядоченные множества

До сих пор мы изучали лишь такие свойства множеств, которые были связаны с основным отношением, существующим между множеством и его элементами. Мы не рассматривали никаких соотношений между элементами одного и того же множества; все они были для нас совершенно равноправны. Однако в математике такие, так сказать, «чистые» множества встречаются редко. Обычно изучаются множества, между элементами которых существуют те или иные отношения, та или иная зависимость. Так, в геометрии две прямые в одной плоскости могут пересекаться или быть параллельными. Между тремя точками прямой существует отношение, выражаемое словами «одна из трёх точек лежит между двумя другими». В арифметике между числами существуют отношения а+Ь = с или ab = c и др. Одним из важнейших отношений, существующих между числами, является отношение порядка. Числа той или иной совокупности естественным образом располагаются в определённом

порядке, именно, в возрастающем порядке. Так, для множества натуральных чисел таким естественным порядком будет расположение

1, 2, 3, ...

В настоящем параграфе рассматривается понятие порядка в самом общем виде, т. е. для любых множеств.

Определение 1. Множество M называется упорядоченным, если между его элементами установлено некоторое отношение а<b1) (читают: «а предшествует Ь»), обладающее следующими свойствами: 1) между любыми двумя элементами а и b существует одно и только одно из трёх соотношений: a = bf a<b, b<a; 2) для любых трёх элементов a, b и с из а<b, Ь<с следует а<с.

Пустое множество считается упорядоченным.

Замечание. Знак = мы всегда понимаем в смысле тождества, совпадения элементов. Запись а = Ь просто означает, что буквами а и b обозначен один и тот же элемент множества М. Поэтому из свойства 1) следует, что между двумя различными элементами выполняется одно и только одно из двух соотношений а<b или £<а.

Если а предшествует bt то говорят, что b следует за а и пишут: Ь>а.

Отношение а>b обладает, как легко проверить, свойствами, аналогичными 1) и 2). Его можно принять за основное, определив тогда через него отношение а<b (см. ниже § 9).

Если в упорядоченном множестве M поменять ролями отношения < и т. е. вместо а<b писать а>b, и наоборот, то получится новое упорядоченное множество М\ порядок которого называется обратным относительно порядка М. Например, для приведённого выше порядка во множестве натуральных чисел обратным будет порядок:

... , 3, 2, 1.

Два упорядоченные множества, составленные из одних и тех же элементов, но расположенные в разном порядке, считаются различными. Поэтому при задании упорядоченного множества через его элементы необходимо указать их порядок. Мы будем считать, что запись слева направо соответствует порядку элементов, и сохраним прежнее обозначение фигурными скобками. Одно и то же множество можно упорядочить различным образом (если оно содержит не менее двух элементов). Так, множество натуральных чисел можно упорядочить обычным образом или в обратном порядке, можно нечётные числа поставить впереди чётных или наоборот, располагая те и дру-

1) Не следует смешивать смысла этой записи с неравенствами чисел.

гие в возрастающем или убывающем порядке. Получим упорядоченные множества

{ 1, 2, 3, ...}, (1)

{ . - - , 3, 2, 1 }, (2)

{ 1, 3, 5, ... , 2, 4, 6, ... }, (3)

{ 1, 3, 5, ... , б, 4, 2}, (4)

{... , 5, 3, 1, 2, 4, 6, ...}, (5)

{... , 5, 3, 1, ... , 6, 4, 2}. (6)

Элемент, не имеющий предшествующего, называется первым, а элемент, не имеющий следующего, — последним. Элементы а и b называются соседними, если не существует с, для которого а<с<b или Ь<с<а. Если а и b — соседние и а<b, то говорят, что а непосредственно предшествует b, a b непосредственно следует за а. Упорядоченное множество (1) имеет первый элемент и не имеет последнего, множество (2), наоборот, имеет последний элемент, но не имеет первого, множество (4) имеет как первый элемент, так и последний, а множество (5) — ни первого элемента, ни последнего, множество (3) содержит два элемента, не имеющих непосредственно предшествующего, множество (6) —два элемента, не имеющих непосредственно следующего. Во всех этих множествах каждый элемент имеет соседний. Множество рациональных чисел, расположенных по возрастанию, не имеет соседних элементов, так как между любыми числами а и b лежит число

Если а = Ь или а<b, то пишут: а^Ь; если а — Ь или а>b, то пишут: а^Ь. Из определения 1 легко вытекает справедливость следующих двух теорем:

Теорема 1. Если а^Ь и Ь^а, то а — Ь.

Теорема 2. Если а^Ь и Ь^с, то а^с. Если а^Ь и Ь ^с, то а ^ с. При этом, если хотя бы в одном из данных неравенств имеется строгое неравенство, то и в полученной неравенстве будет строгое неравенство.

Определение 2. Два упорядоченных множества А и В называются подобными, если между ними можно установить взаимно однозначное соответствие, сохраняющее порядок элементов, т. е. такое, что из

следует bï<C^b2.

Из определения 2 следует, что все множества, содержащие лишь один элемент, подобны и пустое множество подобно лишь самому себе. О подобных множествах говорят, что они имеют один и тот же тип. Отношение подобия обозначается так: А^В.

Читателю предоставляется доказать, что отношение подобия обладает следующими тремя свойствами:

I. Рефлексивность: А^А.

II. Симметрия: если А^В, то В^А.

III. Транзитивность: если А^В и В^С, то Л^С.

Сравнивая определение подобия с определением равномощности (§ 3, определение 4), мы убеждаемся, что первое включает второе, т. е. верна следующая

Теорема 3. Подобные множества равномощны; из А^В следует А>^ В.

Обратное утверждение не верно. Так, множества (1) и (2) равномощны (даже просто равны как неупорядоченные множества), но не подобны, так как множество (1) имеет первый элемент, а множество (2) — не имеет, тогда как при соответствии подобия первому элементу одного множества должен соответствовать первый элемент другого. Тем не менее для конечных множеств теорема, обратная теореме 3, также верна. А именно:

Теорема 4. Если конечные, упорядоченные множества равномощны, то они подобны.

Эта теорема ввиду свойств I — III подобия является непосредственным следствием приведённой ниже теоремы 7. Для любых множеств в известной мере обратной теореме 3 является следующая теорема:

Теорема 5. Любое множество А, равномощное упорядоченному множеству В, само можно упорядочить, т. е. определить для его элементов отношение порядка, обладающее свойствами I и II1), и притом так, что полученное упорядоченное множество подобно В.

Доказательство. Если ах и а2 — любые элементы множества А, Ьх и #2 — соответствующие им, при взаимно однозначном отображении А на В, элементы В, и Ь1<bЬ то положим ах<а^ Легко проверить, что определённое так отношение порядка в А обладает свойствами I и II и, очевидно, А подобно В.

Теорема 6. Любое конечное упорядоченное множество А содержит первый и последний элемент (если только А непусто).

Доказательство. Пусть А не имеет последнего элемента. Берём любой элемент ах Ç А. Так как он не последний, то существует а2 6 А такой, что аг < а2; так как а2 — не последний, то существует а3 £ А такой, что а2<Саз- Если элемент ап построен, то существует an+i 6^ такой, что ап<ап+1. По индукции элемент ап построен для любого п. Пусть

N' = {alf а2, аъ, ...}

1) Справедлива даже теорема, что любое множество можно, как говорят, вполне упорядочить (см. стр. 99), но её доказательство выходит за рамки нашей статьи.

— множество всех построенных элементов. Очевидно, что из i<k следует по свойству II ai<aky откуда по свойству I at Ф ak. Значит, N' равномощно множеству натуральных чисел. Поэтому множество Л бесконечно (§ 4, теорема 5), что невозможно. Существование первого элемента доказывается аналогично.

Теорема 7. Любое конечное множество можно упорядочить. Все конечные упорядоченные множества с одним и тем же числом элементов #>0 подобны отрезку | 1, п \ натурального ряда и, значит, подобны между собой.

Доказательство. Пустое множество упорядочено по определению. Если А фО — конечное множество, то Л~|1,я|. Отрезок 11, л|, очевидно, есть упорядоченное множество. По теореме 5 множество Л можно упорядочить. Пусть теперь Л — любое конечное упорядоченное множество с числом элементов п>0. По теореме 6 множество Л содержит первый элемент аг. Если #>1, то множество

и снова содержит первый элемент а2, причём а1<а2- Пусть уже построен элемент at. Если 1<п, то

и по теореме 6 оно содержит первый элемент ам, причём а£<ам. Так мы построим элементы at для всех i^n. Множество

Ai = { av аъ> • • • у ап}~ 11» п\г^А.

Множество Л не равномощно собственному подмножеству (§ 4, теорема 1). Значит,

А = Ап = {аи а%, ... , ал}.

Очевидно, что из i<k следует at<aki т. е. Л подобно отрезку 11, п\.

Из этой теоремы следует, что все ni возможных перестановок множества с п элементами имеют один и тот же тип.

ГЛАВА II

ГРУППЫ, КОЛЬЦА И ПОЛЯ

§ 6. Группа

Арифметика и алгебра имеют дело с объектами различной природы: целыми, рациональными, действительными или комплексными числами, многочленами, алгебраическими дробями и т. д. При этом в первую очередь рассматриваются свойства основных четырёх действий: сложения, вычитания, умножения и деления.

Свойства этих действий для различных объектов во многом оказываются одними и теми же. Вот почему вполне естественным и весьма целесообразным является построение в современной алгебре самых общих образований, обладающих интересующими нас свойствами.

В таком абстрактном виде легче выяснить значение и взаимозависимость данных свойств, так как в конкретной области чисел, многочленов и т. д. дело осложняется наличием ряда других свойств помимо тех, которые мы желаем изучать.

В последующих главах будут изучаться основные числовые области. Чтобы лучше уяснить значение различных их свойств и одновременно избежать многократного повторения одних и тех же рассуждений в применении к каждой из этих областей, мы рассмотрим в настоящей главе основные понятия абстрактной алгебры. Читателю, желающему глубже изучить эти вопросы, рекомендуем статью Л. Я. Окунева1) и книги Л. Я. Окунева [3] и Б. Л. Ван-дер Вардена [4]. С точки зрения теории множеств любое из четырёх основных действий есть некоторое отношение между тройками элементов данного множества (см. начало § 5). Эти отношения отличаются, однако, от других (как, скажем, от отношения порядка, рассмотренного в § 5) тем, что во всех четырёх случаях по двум элементам находится третий (результат данного действия), дающий с двумя данными тройку элементов, находящихся в данном отношении. Отношения такого типа получили особое название, а именно:

1) Э. э. м., кн. 2., Л. Я. Окунев, Кольцо многочленов и поле рациональных функций.

Определение 1. Соответствие, в силу которого каждой паре a, b элементов множества М, взятых в данном порядке, соответствует единственный третий элемент с того же множества М, называется алгебраической операцией, определённой в М.

Используя понятие функции (§ 3, определение 1), можно сказать короче, что алгебраическая операция, определённая во множестве М, есть функция, определённая на множестве всех упорядоченных пар элементов М, значения которой принадлежат М.

Примерами алгебраических операций могут служить четыре арифметических действия: сложение а+Ь = с, вычитание а — Ь = с, умножение а»Ь = с, деление а:Ь = с, рассматриваемые хотя бы на множестве всех действительных чисел, причём в случае деления нужно исключить число 0, деление на которое не определено. Дальнейшими примерами являются сложение, вычитание, умножение и деление комплексных чисел, сложение векторов по правилу параллелограмма, сложение, вычитание и умножение многочленов и т. д.

Как известно, две или более алгебраических операций могут быть связаны между собою переменой роли данных и искомых элементов. Так, если a + b = с, то с — а — Ь\ если ab = с, то а = ~.

Эта связь операций выражает понятие обратной операции, которое в общем виде определяется так:

Пусть дана операция, ставящая в соответствие паре элементов a, b из M элемент с. Те две операции, которые получатся из данной путём перемены в ней роли одного из элементов a, b и элемента с (одного из данных элементов с искомым), называются обратными для данной операции.

Таким образом, первая обратная операция паре с, b ставит в соответствие а, а вторая — паре с, а ставит в соответствие Ь. Как хорошо известно, обратные операции не всегда существуют или не всегда единственны. Так, для натуральных чисел определены операции сложения и умножения, но обратные операции — вычитание и деление — не всегда выполнимы.

Операция называется коммутативной, если её применение к парам a, b и b, а всегда даёт один и тот же результат. Ниже мы увидим, что если для коммутативной операции существует одна из обратных операций, то существует и другая и обе они совпадают. Для некоммутативной операции это уже неверно.

Так, для положительных действительных чисел операция f(a,b) = ab не коммутативна, ибо аъ фЬа. Первая обратная операция /, (с, b)= у с существует; вторая же—/2 (с, a) = \oga с не определена для а=1 и сф 1, а также для таких а и с, когда l°ga с^О (ведь мы рассматриваем нашу операцию лишь на множестве положительных чисел). В тех же случаях, когда вторая операция также определена, она не совпадает с первой операцией.

В одном и том же множестве может быть задано несколько алгебраических операций. Желая изучать общие свойства сложения и умножения чисел, мы рассмотрим сначала множества с одной алгебраической операцией. Таким образом, мы приходим к первому из основных понятий современной алгебры, именно к понятию группы.

Определение 2. Непустое множество G называется группой, если в нём определена алгебраическая операция, называемая умножением, которая каждым двум элементам a, b из G ставит в соответствие элемент ab также из G, называемый их произведением, и обладает нижеследующими свойствами:

I. (Закон ассоциативности.) a (be) = (ab) с1);

II. (Закон обратимости.) Для любых а и b из G уравнения ах = Ь и уа = Ь разрешимы в G, т. е. в G существуют элементы cud такие, что ac = b, da — b. Если групповая операция коммутативна, т. е. ab — ba для любых a, b из G, то группа G называется коммутативной2).

Приведём несколько примеров групп.

Пример 1. Все целые, все рациональные, все действительные и все комплексные числа являются группами относительно операции сложения чисел, играющего роль групповой операции умножения.

Ни одно из этих множеств не является группой относительно операции умножения чисел, ибо уравнения 0 • лг= 1 не имеют решения.

Пример 2. Все рациональные, все действительные и все комплексные числа, исключая число 0, являются группами относительно операции умножения чисел.

Пример 3. Множество G двух элементов е и а с операцией, заданной равенствами ее — аа — е, еа = ае = а, является группой.

Все эти группы коммутативны.

Пример 4. Пусть G — множество всех взаимно однозначных отображений множества M на себя (§ 3, определение 3). Образ элемента а£М при отображении si G будем обозначать через as. Произведением st двух отображений s и t из G назовём отображение, полученное в результате последовательного выполнения данных отображений (сначала s, затем t), т. е. полагаем

a (st) = (as) t

для любого а СУН3). При таком определении операции умножения множество G является группой. В самом деле, закон ассоциативности I

1) Знак = обозначает, как всегда, совпадение элементов.

2) Коммутативные группы называются также абелевыми.

3) Можно под произведением st понимать выполнение сначала t, а затем s. Тогда образ элемента а при отображении s удобнее обозначить через sa.

выполнен, так как если г, s, t— три любых элемента из G, то для любого а из M находим:

а [г (st)] = (ar) (st) = [(ar) s] t.

Но также

a [(rs) t] = [a (rs)] t = [(ar) s] t.

Таким образом,

a[r(st)] = a[(rs)t]

для любого a из M. Это значит, что г (st) = (rs) t (оба отображения получаются в результате последовательного выполнения данных отображений г, s, t).

Докажем выполнение в G закона обратимости II. Пусть s и t — любые отображения из G. Для взаимно однозначного отображения 5 существует также взаимно однозначное обратное отображение s'1 (§ 3). Именно, если as = b, то bs~l = a. Очевидно, что ss~l = s~1s = e, где е — тождественное отображение множества M на себя, и что ех = хе=х для любого отображения х из G. Предположим, что в G существует отображение и такое, что su = t. Умножая это равенство слева на s"1, получим:

s"1 (su) = s~4.

По закону ассоциативности найдём: s~l (su) = (s^s) и = еи = и, т. е. ii==s~1t. Итак, уравнение sx = t может иметь решение лишь s~4. Но это отображение действительно удовлетворяет уравнению sx = tf так как

5 (s~4) = (ss'1) t = et = t.

Аналогично доказывается, что уравнение ys = t имеет единственное решение y = ts~1.

Итак, G — группа. Она называется группой преобразования множества М. Для конечного M группа G называется также группой подстановок множества М.

Если M содержит более двух элементов, то группа подстановок G не коммутативна. Так, группа подстановок трёх чисел 1, 2, 3 содержит шесть элементов. Обозначая каждую подстановку двумя строками, где под каждым числом стоит число, ему соответствующее, запишем их в виде

Перемножая, находим:

т. е. произведение меняется при перемене порядка сомножителей.

Группы подстановок имеют большое значение в алгебре. С ними связано решение вопроса о разрешимости уравнения в радикалах, данное французским математиком Эваристом Галуа (1811 — 1832).

Следствия из законов ассоциативности и коммутативности. Закон ассоциативности I позволяет говорить о произведении трёх элементов a, b и с группы G, понимая под этим любое из равных произведений a {be) и {ab) с, и писать рядом abc без скобок. Можно, однако, и без закона ассоциативности индуктивно определить произведение

для любых п элементов al,ai,...ian из G (обоснование законности индуктивного определения будет дано в гл. III). Именно:

Определение 3.

Согласно этому определению имеем, например:

#1#2а3 = (а1а2) аз>

a1a^a9ai=[(a1a2) а3] а4, а1а2ага^аъ = {[{а1а2)аг]а^\аГ) и т. д.

Произведение двух произведений также можно представить в виде произведения всех встречающихся элементов, а именно:

(a.ja-2 ... ат){ат+1ат+2 ... ап) = а1а2 ... ап

или в сокращённой записи:

(1)

Докажем равенство (1) при заданном m индукцией по п. При п—\ оно вытекает прямо из определения 3. Если (1) верно для

числа п, то, применяя определение 3 и закон ассоциативности, на ходим:

что и доказывает (1) для числа #+1.

Можно определить произведение любого конечного числа элементов группы с любым распределением скобок и доказать его независимость от распределения скобок [5].

Для коммутативной группы G произведение п элементов не зависит от порядка сомножителей, т. е. если f(J) — любое взаимно однозначное отображение множества 1, 2, ... , п на себя, то

(2)

Наметим лишь ход доказательства, предоставляя читателю его детальное проведение. 1) Пользуясь правом вводить и отбрасывать скобки и законом коммутативности, доказываем, что произведение п элементов не меняется от перестановки двух соседних множителей. 2) Перестановку двух любых множителей сводим к ряду перестановок соседних множителей. 3) Любую перестановку множителей сводим к ряду перестановок двух множителей.

Следствия из законов обратимости. Заметим, что свойство II ещё не означает наличия в G операций, обратных умножению, так как II утверждает лишь существование, но не единственность элементов с и d. Для доказательства единственности этих элементов введём понятия единицы и обратного элемента.

Определение 4. Единицей группы О называется элемент е такой, что еа = ае = а для любого а из G. Обратным для элемента а из G называется элемент а'1 такой, что аа~х = а~1а = е, где е — единица группы G.

Теорема 1. В любой группе G существует единица е и притом только одна; для любого элемента а существует обратный элемент а~* и притом только один; существующие по закону обратимости II решения уравнений ах = Ь и уа — Ь являются единственными для любых а и b из G.

Доказательство. Пусть е— решение уравнения yb = b для некоторого b из G, т. е. eb = b. Для любого а уравнение Ьх = а имеет решение с, т. е. Ьс = а. Тогда

еа = е (be) = (eb) c = bc = a.

Итак, еа — а для любого а из G. Так же доказывается существование в G элемента е' такого, что ае' = а для любого а из G.

Тогда е = ее' = е. Итак, е — единица группы G. Если е1 и е2 — две единицы, то ei = e1e2 = е2, чем доказана единственность единицы е.

Далее, по закону обратимости II существуют элементы b и с, для которых Ьа — е и ас = е. Тогда b = be = b (ac) — (ba) с = ес = с, т. е. Ь = с.

Итак, элемент сГх = Ь обладает свойством ааГ1 — а~1а = еу т. е. является обратным для а. Если b и с — два любых элемента, обратных для а, то, как выше, докажем, что b = bac = c, чем доказана единственность обратного элемента.

Если сх и Со — любые решения уравнения ах = Ь, то ас1 = Ь и ас2 = Ь. Значит, ас1 = ас2. Умножая слева на а-1, найдём с1 = с2. Так же доказывается единственность решения уравнения уа = Ь. Теорема доказана.

Заметим, что из существования во множестве G единицы и обратных элементов при наличии закона ассоциативности следует выполнение в G законов обратимости. В самом деле, уравнение ах = Ь имеет решение сГ1Ь и уравнение уа = Ь имеет решение ЬаГ1. Таким образом, группу можно было бы определить как множество с ассоциативной операцией, обладающее единицей и обратными элементами.

В примере 1 групп чисел по сложению единицей будет число О и обратным элементом для числа а — противоположное число — а. В примере 2 групп чисел по умножению единицей будет число 1 и обратным элементом для числа а — обратное число —. В примере 3 единицей будет е и каждый из элементов е и а будет обратным для самого себя. В примере 4 единицей будет тождественное отображение множества M на себя, и обратным элементом для отображения 5 будет обратное отображение s~l.

Произведение п одинаковых сомножителей а называется п-й степенью а и обозначается через ап.

Это определение имеет смысл для любого натурального числа /г. Для п = 0 определяем а°=е, где е — единица группы G. Для целого отрицательного п = — m степень ап = а~т можно определить либо как (сГ1)т, либо как (ат)~г. Оба эти определения эквивалентны, так как

откуда

Свойство произведения (1) при совпадении сомножителей обращается в известное свойство степени

атап = ат+п. (3)

Далее, индукцией по п легко доказать, что

(ат)п = атп. (4)

Для коммутативных групп из возможности перестановки сомножителей (2) следует:

(ab)n = anbn. (5)

Мы указали, как равенства (3), (4) и (5) доказываются для натуральных чисел m и п, однако эти равенства остаются верными для любых целых чисел m и я, что можно проверить путём рассмотрения всевозможных случаев m ^ О, п^О.

Из однозначности решений уравнений ах = Ь и уа = Ь следует наличие в группе G обеих обратных операций для операции умножения. В случае коммутативной группы G обе эти обратные операции совпадают. В самом деле, если с — решение уравнения ах = Ь, то ас = Ь. Значит, са = Ь, т. е. с — решение уравнения уа — Ь.

Определение 5. Операция, обратная для операции умножения в коммутативной группе G, называется делением. Её результат для элементов а и Ь, т. е. решение уравнений ах = Ъ и уа — Ь, называется частным элементов о и а и обозначается через о : а или —.

Аддитивная запись. Групповая операция может обозначаться через а+Ь и называться сложением. Тогда говорят об аддитивной записи группы. В этом случае группа обычно предполагается коммутативной. При аддитивной записи вместо 1 говорят о нуле и вместо обратного элемента а"1 о противоположном элементе — а. Далее, вместо степени ап говорят о кратном па (не следует понимать па как произведение п и а, ибо целое число может и не быть элементом группы G). Итак,

па = а+а+а+ ... +а.

п раз

Для аддитивно записанной группы G сумма п элементов обозначается так:

и соответственно изменяется вид равенств (1) — (5). В частности, равенства (3) — (5) принимают вид

(m + ri) а = та -|- па, (6)

m (па) = (т/г) а, (7)

n(a+b) = na+ nb. (8)

Операция, обратная операции сложения в аддитивно записанной коммутативной группе, называется вычитанием, а её результат для элементов а и Ь, т. е. решение уравнений а+х = Ь и у а = Ь, называется разностью элементов b и а и обозначается через £ — а.

Подгруппа. Определение 6. Подмножество H группы G называется подгруппой этой группы, если оно само является группой при той же групповой операции, что и в G.

При выяснении того, является ли данное подмножество H подгруппой, можно пользоваться следующей теоремой:

Теорема 2. Непустое подмножество H группы G будет подгруппой тогда и только тогда, когда 1) произведение двух любых элементов а и b из H принадлежит Н, 2) элемент а'1, обратный для любого элемента а из Н, принадлежит к Н.

Доказательство. Необходимость этих условий очевидна. Если, обратно, для H выполнены условия 1) и 2), то H (как непустое множество) содержит элемент а, значит, по свойству 2) оно содержит и а-1 и по свойству 1) аа~х = е. Таким образом, H содержит единицу е и вместе с любым элементом а содержит обратный элемент а-1. Так как закон ассоциативности автоматически переходит с G на И, то И—подгруппа группы G.

Мы ограничимся лишь этими основными свойствами групп, отсылая читателя, интересующегося более глубокими свойствами, к специальной литературе (см. [6] и [7]).

§ 7. Кольцо

Мы рассмотрели в предыдущем параграфе свойства одной алгебраической операции. Однако в случае чисел, которыми мы будем заниматься в дальнейшем, налицо две операции — сложение и умножение,— связанные между собою дистрибутивным (распределительным) законом. В этом и следующем параграфах мы и рассмотрим общие свойства множеств с двумя операциями. При этом мы ограничимся лишь нужным для чисел случаем коммутативных операций.

Определение 1. Непустое множество R называется кольцом, если в нём определены две алгебраические операции: сложение, ставящее в соответствие каждым двум элементам a, b элемент а+Ь, называемый их суммой, и умножение, ставящее в соответствие каждым двум элементам a, b элемент ab, называемый их

произведением, причём эти операции обладают следующими свойствами:

I. (Коммутативность сложения.) a+b = b+a\

II. (Ассоциативность сложения.) а+(Ь+с) = (а + Ь) + с;

III. (Обратимость сложения.) Для любых а и b из R уравнение а+х = Ь имеет (по крайней мере одно) решение, т. е. существует элемент c^R такой, что а+с — Ь)

IV. (Коммутативность умножения.)1) ab — ba\

V. (Ассоциативность умножения.) a(bc) = (ab)с;

VI. (Дистрибутивность умножения относительно сложения.)

(a + b) с = ас + be.

Примеры колец. При обычных операциях сложения и умножения кольцом является:

1. Множество целых чисел.

2. Множество рациональных чисел.

3. Множество действительных чисел.

4. Множество комплексных чисел.

5. Множество, состоящее лишь из одного числа 0.

6. Множество чётных чисел и вообще множество целых чисел, кратных некоторому числу п.

7. Множество комплексных чисел a+bi с целыми а и b (так называемое кольцо целых комплексных чисел).

8. Множество действительных чисел a+b-\f2, где а и b — целые числа.

Множество натуральных чисел, а также множество всех положительных рациональных чисел кольцами не являются, так как не выполняется аксиома III.

9. Большую роль в алгебре играет кольцо многочленов с одним или несколькими неизвестными и коэффициентами из некоторого кольца R.

При этом за операции сложения и умножения принимаются обычные действия над многочленами, известные из школьной алгебры. Эти действия имеют смысл, так как они сводятся к сложению и умножению коэффициентов многочленов, а последние принадлежат к кольцу /?, где указанные действия определены.

10. Пары (а, Ь) целых чисел образуют кольцо, если операции определены по формулам

(a, b)+(c, d) = (a+c, b+d)f (а, b)(c, d) = (ac, bd).

1) В литературе термин «кольцо» применяется также ко множествам с некоммутативным или даже неассоциативным умножением. Формулировки других свойств также меняются. В конце данной статьи при обобщении понятия числа нам понадобятся кольца без коммутативности умножения.

Проверить справедливость аксиом I—VI во всех этих примерах предоставляется читателю.

Для сложения и умножения в кольце справедливы все следствия, полученные из законов ассоциативности и коммутативности в предыдущем параграфе. В частности, можно определить сумму и произведение любого конечного числа элементов (§ 6, определение 3), для которых верны правила оперирования, аналогичные (1) из § 6 и которые не зависят от порядка данных элементов [§ 6, (2)].

Свойства I—III показывают, что кольцо относительно операции сложения является коммутативной группой. Поэтому во всяком кольце существует элемент 0, называемый нулём кольца, со свойством

а+0 = 0+ а = а

для любого а. Далее, для любого а существует противоположный элемент —а такой, что

а + (— а ) = ( — а ) + а — О.

При совпадении слагаемых или сомножителей мы получаем /г-кратное па или п-ю степень ап элемента а. При этом степень ап определена вообще лишь для натурального п, так как её определение для п ^ 0 требовало существование единицы и обратного элемента а~1у что в кольце может не выполняться. Свойства степени (3) — (5) из § 6 сохраняются также лишь для натуральных показателей. В отличие от этого понятие /г-кратного па элемента а и его свойства (б) — (8) из § 6 остаются верными в случае кольца (как группы по сложению) для любых целых чисел.

Из законов сложения I—III следует (как для всякой коммутативной группы) существование в любом кольце операции вычитания, обратной сложению. Умножение может и не обладать обратной операцией, как, например, в кольце целых чисел или в кольце многочленов.

Следствие закона дистрибутивности. До сих пор мы рассматривали свойства каждой из двух операций кольца отдельно. Переходим к изучению их связи между собой. Эта связь определяется законом дистрибутивности VI.

Прежде всего из VI и IV следует, очевидно, вторая форма закона дистрибутивности:

a(b+c) = ab+ac.

Далее, обе формы закона дистрибутивности оказываются верными также и для разности, т. е.

(1)

Для доказательства первого равенства надо проверить, что элемент (а— Ь)с удовлетворяет определению разности элементов ас и be. Но действительно

Ьс+(а — Ь) с = [b + (а — Ь)]с = ас.

Второе равенство доказывается аналогично. Докажем теперь, что нуль кольца обладает обычным свойством при умножении:

Теорема 1. Если один из сомножителей равен нулю, то и всё произведение равно нулю, т. е.

а-0 = 0, 0 . а = 0 (2)

для любого а.

Докажем лишь первое из равенств, так как второе вытекает из первого при помощи IV. По определению нуля и разности 0 = Ь — b для любого Ь. Отсюда а»0 = а(Ь — b) = ab — ab = 0.

Однако теорема, обратная теореме 1, верная для чисел, уже не сохраняется для любых колец, иными словами, если произведение двух элементов кольца равно нулю, то нельзя утверждать, что хотя бы один из них равен нулю. Так, в приведённом выше примере 10 кольца, составленного из пар (а, Ь) целых чисел, нулём является, очевидно, пара (0, 0). Если взять целые числа а ф 0 и b ф 0, то пары (а, 0) и (0, Ь) отличны от нуля кольца, но (а, 0)(0, Ь) = (0, 0).

Определение 2. Элементы а и b кольца, для которых афО, b z^b 0, но ab = 0, называются делителями нуля. Кольцо без делителей нуля называется также областью целостности.

Теорема 2. Из ab = ac следует Ь = с, если только афО и не является делителем нуля.

Доказательство. Из ab —ас следует ab — ас = 0 или а(Ь — с) = 0. Но так как а ф 0 и не делитель нуля, то b — c = Q, b = c.

В дальнейшем нам придётся иметь дело исключительно с кольцами без делителей нуля. Для них из ab = ac и а ф 0 следует Ь = с. При умножении справедливы обычные правила знаков1), а именно:

a(—b) = — ab, (—a)b = — ab, (—a)(—b) = ab. (3)

Первое из этих равенств доказывается так:

ab + a(— b) = a[b+(—b)] = a -0 = 0, откуда а(—Ь) = — ab.

1) Заметим, что не следует пользоваться терминами «положительный» и «отрицательный» элемент, как для чисел. Эти понятия для любых колец будут введены в § 10. Пока же элементы а и —а вполне равноправны, каждый из них является противоположным для другого, и если обозначить — а через Ъ, то а придётся обозначить через — Ъ.

Второе вытекает из первого:

(— à)b = b (— а) = — Ьа = — ab.

Третье следует из первых двух:

(— а) (— Ь) = — (— a) b == — (— ab) = ab.

По индукции законы дистрибутивности обобщаются на любое конечное число слагаемых, а затем и на произведение двух сумм. Справедливы, таким образом, равенства

(4)

Отсюда и из свойств кратного [§ 6, (7)] при совпадении слагаемых каждой суммы, т. е. при

at = a (1=1, 2, ... , п), bk = b (k = 1, 2, ... , m),

следует далее:

(5)

В главе IV нам понадобятся следующие свойства разности элементов кольца:

Теорема 3. (Свойства разности.) В любом кольце разность элементов обладает следующими свойствами:

а) а — Ь = с — d тогда и только тогда, когда a+d = b +с;

б) (a — b) + (c — d) = (a + c) — (b + d);

в) (a — b) — (c — d) = (a+d) — (b+c);

г) (а — b) (c — d) = (ас + bd) — (ad -f be).

Доказательство. Прибавляя b+d к обеим частям равенства а — Ь = с — d, получим: a+d = b +с. Обратно, прибавляя (—^)-f"(—*0 к обеим частям второго из этих равенств, получим первое. Этим доказано а). Равенства б), в) и г) доказываются аналогично.

Подкольцо. Определение 3. Подмножество M кольца R называется подкольцом, если оно само является кольцом при тех же операциях сложения и умножения, которые определены в кольце R.

Так, кольцо чётных чисел является подкольцом кольца целых чисел, а последнее в свою очередь — подкольцом кольца рациональных чисел.

При выяснении того, является ли данное множество кольца подкольцом, нет надобности проверять справедливость всех свойств кольца. Большинство из них автоматически переходит с кольца на любое его подмножество. Удобнее всего пользоваться для этого такой теоремой:

Теорема 4. Для того чтобы непустое подмножество M кольца R было его подкольцом, необходимо и достаточно, чтобы сумма, разность и произведение любых двух элементов из M снова принадлежали М.

Доказательство. Для доказательства необходимости этих условий предположим, что M является подкольцом /?. Сложение в M совпадает со сложением в R. Но из единственности обратной операции следует, что и вычитание в M совпадает с вычитанием в R. Поэтому сумма, разность и произведение любых двух элементов из M (определённые в кольце R) должны принадлежать снова к М, так как иначе одна из этих операций для данных двух элементов M была бы невыполнима в М, что противоречит определению кольца (см. определение 1) и следующей из него выполнимости вычитания.

Для доказательства достаточности предположим, что множество M удовлетворяет условиям теоремы. Так как сумма и произведение (определённее в R) любых элементов из M снова принадлежат к М, то их можно принять за результат сложения и умножения в М. Этим в M будут определены сложение и умножение. Свойства I, II, IV, V и VI переносятся автоматически с R на любое его подмножество и, значит, выполнены в М. Пусть а и b — элементы М. Тогда b — а = с также есть элемент М. Но по свойству разности в R имеем:

а+(Ь — а) = Ь или а+с = Ь.

Таким образом, и свойство III выполнено в М, и M является подкольцом кольца R.

§ 8. Поле

Примеры колец, приведённые в предыдущем параграфе, показывают, что в отношении обратной операции для умножения (в отличие от сложения) различные кольца обладают совершенно различными свойствами. Так, в кольце целых чисел деление выполняется лишь в исключительных случаях, причём все элементы кольца делятся на +1 и — 1. В кольце же рациональных чисел деление всегда возможно (кроме деления на 0). Желая изучить свойства обратной операции для умножения, мы приходим к важнейшему частному случаю кольца — полю.

Определение 1. Полем называется кольцо Р, обладающее следующими свойствами:

VII. (Обратимость умножения.) Для любых а и b из Р, где афО, уравнение ах — Ь имеет (по крайней мере одно) решение, т. е. существует элемент q£P такой, что aq = b.

VIII. Р содержит по крайней мере один элемент, отличный от нуля.

Примеры полей. Из примеров 1—10 колец, приведённых в предыдущем параграфе, только 2, 3 и 4, т. е. рациональные, действительные и комплексные числа, являются полями. В примере 5 свойство VII выполнено, так как вообще нет элемента а ф 0, но не выполнено свойство VIII. В остальных примерах не выполняется свойство VII. Приведём ещё следующие примеры полей.

1. Множество комплексных чисел а+Ы с любыми рациональными a, b (так называемое поле рациональных комплексных чисел; сравнить с примером 7 из § 7).

2. Множество действительных чисел вида а+Ь j/2 с любыми рациональными а и b (сравнить с примером 8 из § 7).

3. Множество всех рациональных функций с действительными коэффициентами от одного или нескольких переменных.

4. Множество из двух элементов, которые мы обозначим через 0 и 1, при следующем определении операций:

0 + 0=1+1=0, 0+1 = 1+ 0 = 1, 0 . 0 = 0 . 1 = 1 . 0 = 0, 1-1 = 1.

Проверку свойств I — VIII мы предоставляем читателю.

Все теоремы из § 7, выведенные для колец, остаются верными, в частности, для полей. Кроме того, из свойства VII вытекают теоремы, аналогичные тем, которые были выведены в § 7 из свойства III.

Как всякое кольцо, поле является группой относительно операции сложения. Все элементы поля, не равные нулю, образуют группу относительно операции умножения. В самом деле, если а ф 0 и b ф 0, то уравнение ах = Ь имеет решение q ф 0, ибо а • 0 = 0 ф b (§ 7, теорема 1). Поэтому свойства умножения IV, V (§ 7, определение 1) и VII доказывают наше утверждение. Группа по сложению всех элементов поля называется аддитивной, а группа по умножению всех его элементов, отличных от нуля, — мультипликативной группой поля. Поле вполне определяется заданием двух этих групп, заданием произведений нуля на все элементы и требованием дистрибутивного закона для любых его элементов, включая нуль. Отсюда уже следует, что произведение любого элемента на нуль равно нулю (§ 7, теорема 1).

Из свойств мультипликативной группы (§ б, теорема 1) следует, что в поле существует единица, т. е. такой элемент е, что ае = еа = а для любого а из Р. В самом деле, для а ф 0 это следует из свойств единицы группы, а для а — 0 — из свойства нуля при умножении.

Далее, для любого афО существует обратный элемент а'1 такой, что аа~1 = а~1а = е. При этом единица е и обратный элемента"1 для данного а определяются однозначно.

Если в кольце существует единица, то только одна, ибо, если ех и е2 — единицы, то е1 = е1е2 — е2. Если для элемента а кольца с единицей существует обратный элемент, то только один, ибо, если b и с — обратные элементы для а, то b = Ьас = с.

Но в кольце с единицей может и не быть обратных элементов, как, например, в кольце целых чисел. Существуют также кольца без единицы, как, например, кольцо чётных чисел или кольцо целых чисел, кратных числу я>1.

Если в кольце R существует единица е^О и для любого афО существует обратный элемент а"1, то элементы кольца, отличные от нуля, образуют группу по умножению (§ 6), и значит, кольцо R будет полем.

Так как мультипликативная группа поля коммутативна, то умножение обладает обратной операцией — делением. При этом частное — однозначно определено для любого а, не равного нулю, и любого Ь. Для Ь^ЬО это следует из свойств мультипликативной группы поля (§ 6), а для Ь = 0 имеем: ■—■=0, так как а. 0 = 0.

Дополнительное требование а^О, входящее в свойство VII, нарушает симметрию свойств сложения и умножения поля. Отбросить это требование и тем самым восстановить указанную симметрию, однако, невозможно. В самом деле, уравнение ах = Ь при а = 0 и b ф 0 не имеет решения в поле или даже в кольце, содержащем элементы, отличные от нуля. Действительно, если q— решение указанного уравнения, то aq = 0 • q = Q = b, что невозможно. Поэтому деление на нуль невозможно, если делимое отлично от нуля. Частное -g может равняться любому элементу кольца, так как для любого q имеем: 0«^ = 0.

Теорема 1. Поле не имеет делителя нуля (§ 7, определение 2), т. е. если ab = 0, то либо а = 0, либо Ь = 0.

Доказательство. Если ab = 0 и афО, то, умножая обе части равенства на а"1, найдём 1 *Ь = аГ1 • 0, т. е. Ь = 0.

Итак, поле является кольцом без делителей нуля. Утверждение, обратное этому, вообще неверно: существуют кольца без делителей нуля (например, кольцо целых чисел), не являющиеся полями. Однако для конечных колец обратная теорема также верна. А именно:

Теорема 2. Всякое конечное кольцо без делителей нуля, содержащее более одного элемента, является полем.

Доказательство. Достаточно проверить свойство VII. Пусть а Ф 0. Каждому элементу х кольца поставим в соответствие элемент у = ах. Если ххфх2, то также У\фу» ибо иначе axt=ax2 и хх =х2 (§ 7, теорема 2). Значит, х-*у есть взаимно однозначное

отображение всего кольца R на некоторое его подмножество М, т. е. R<-^M. Но по теореме 1 из § 4 конечное множество R не равномощно своему собственному подмножеству. Поэтому R = M, т. е. для любого элемента b 6 R существует в R элемент q такой, что q->bt т. е. aq = bt что и доказывает VII.

Так как все элементы поля, отличные от нуля, образуют по умножению коммутативную группу, то для любого элемента аф О степень ап определена при любом целом показателе п, причём справедливы обычные свойства степени [см. § б, (3) — (б)].

Для частного элементов любого поля верны те же правила оперирования, что и для обыкновенных дробей. В главе V нам понадобятся следующие свойства частного:

Теорема 3. (Свойства частного.) а) Если b ф О, d ф О, то ~ = -^ тогда и только тогда, когда ad = bc;

Доказательство. Помножая обе части равенства у = —на bdt получим: ad = bc. Если, обратно, дано равенство ad = bc, где ЬфО и d^Oy то, полагая ~^=ху -j ==у, получим: bdx = ady bdy = bcf откуда bdx = bdy. Умножая обе части равенства на Ь'1 и d"1, получим: х=у, т. е. ~ = ~,

Этим утверждение а) доказано. Утверждения б) и в) доказываются аналогично второй части утверждения а). Наконец, для доказательства утверждения г) достаточно убедиться, что

Но это равенство следует, очевидно, из в) и а). Теорема доказана.

Характеристика поля. Существуют поля, содержащие элементы афО такие, что па = 0 при целом п, отличном от нуля. Так, в поле из двух элементов 0 и е (см. пример 4 в начале этого параграфа) имеем: 2е = е+е = 0. Справедливо утверждение:

Теорема 4. Для любого поля Р имеет место один из двух случаев:

а) для любого элемента афО и любого целого числа пфО кратное па также отлично от нуля;

б) существует единственное простое число1) р такое, что ра = 0 для любого элемента а.

Доказательство. Пусть случай а) не имеет места, т. е. существуют элемент поля а^О и целое число пфО, для которых па = 0. Докажем, что тогда имеет место случай б). Для любого b£ Р существует q такое, что aq = b. Тогда по (5) из § 7 также

nb = n (aq) = (па) q = О • q = 0.

Достаточно поэтому доказать, что случай б) имеет место для какого-нибудь одного элемента а^О, например для единицы е. По доказанному пе = 0, значит, и (—п)е = — пе = 0. Одно из чисел п и —п — положительное. Существуют, следовательно, натуральные числа k такие, что ke = 0. Пусть р будет наименьшее из чисел k с этим свойством2).

Покажем, что р — число простое; рф1, так как 1-е = еф0 и ре = 0. Если р делится на q, где l<q<p, то p = qr и также 1<V</?. Тогда по (5) из § 7

ре = (qr) (ее) = (qe) (re) = 0,

и ввиду отсутствия делителей нуля (теорема 1) либо qe = 0, либо ге = 0, что невозможно, ибо р — наименьшее натуральное число, обладающее этим свойством. Пусть k — любое натуральное число такое, что ke = 0; деля k на р, найдём: k=pq -j- г, где остаток г удовлетворяет условию 0^г<р. Тогда из (6) § 6 и (5) §7 следует:

ke = (pq +r)e = (pq) e+re = q (ре) -j- re = 0 + re = re = 0.

Значит, должно быть г=0, так как г>0 противоречит выбору р. Итак, k=pq, т. е. k делится на р, и если k отлично от р} оно не может быть простым. Значит, р — единственное простое число, для которого ре=^=0.

Эта теорема позволяет дать следующее определение:

Определение 2. Характеристикой поля Р называется число 0, если пафО для любого элемента а ф 0 и любого целого числа пфО и простое число р такое, что ра = 0 для любого элемента а в противном случае.

Так как для числа 1 и любого целого п будет п • 1=п, то все числовые поля имеют характеристику 0.

Пример поля характеристики р>0. Пусть /г — любое натуральное число, большее единицы. Тогда все целые числа могут быть разбиты на классы, так что к одному классу принадлежат все

1) Под простым числом понимается натуральное число, отличное от 1 и не делящееся ни на какое натуральное число, кроме 1 и самого себя.

2) Что всякое непустое множество натуральных чисел содержит наименьшее число, будет доказано в главе III.

числа, дающие при делении на п один и тот же остаток. Если класс чисел, дающих при делении на п остаток г, обозначить через (г), то мы получим всего п различных классов: (0), (1), (2), ... , (п—1). Очевидно, что два числа а и b тогда и только тогда принадлежат к одному классу, когда их разность а — b делится на п1). Пусть Сп — множество всех определённых таким образом классов целых чисел. Определим в Сп операции сложения и умножения. Если (г) и (s)— два класса, причём класс (г) содержит число а и (s)— число Ь, то суммой (r)+(s) данных классов назовём класс, содержащий число a+b, и произведением (г) • (s) — класс, содержащий число ab. Сумма и произведение классов определены однозначно, т. е. не зависят от выбора представителей а и b этих классов. В самом деле, если а и а' — два числа из класса (г) и b и Ь' — два числа из класса (s), то числа а — а' и b — b' делятся на п. Поэтому также

(a+b) — (a' + b') = (a — a') + (b — Ь')

и

ab — a'b' = (ab — a'b) + (ab — a'b') = (a — a')b+ a' (b — b')

делятся на п. Но это значит, что числа а + b и а' + Ь' принадлежат к одному классу и то же верно для чисел ab и a'b'.

Свойства кольца I—VI (§ 7, определение 1) для классов автоматически выполняются, так как эти свойства верны для целых чисел, и операции над классами определены через операции над представителями. Итак, Сп является кольцом. Оно называется кольцом вычетов по модулю п. Нулём кольца Сп является, очевидно, класс (0), состоящий из всех чисел, делящихся на п.

Если n = kl — число составное, то кольцо Сп содержит делитель нуля, так как (k) ф (0) и (/) ф (0), но (k) - (/) = (0). Если же п =р — число простое, то кольцо Ср не имеет делителей нуля, так как, если (г) • (s) = (0)y то rs делится на /?, и значит, либо г, либо 5 делится на р, т. е. либо (г)=0, либо (s) = 0.

Так как кольцо Ср содержит р элементов и, значит, конечно, то по теореме 2 оно будет полем. Класс р (г) содержит число ргу делящееся на р. Поэтому р • (г) = (0) для любого класса (г) поля Ср.

Значит, р — характеристика поля Ср.

Подполе. Простое поле.

Определение 3. Множество M поля Р называется подполем Р, если оно само является полем при тех же операциях сложения и умножения, которые заданы в поле Р. Тогда Р называется надполем или расширением поля М.

Так, поле рациональных чисел является подполем поля действительных чисел, а последнее — подполем поля комплексных чисел.

1) По существу мы имеем здесь дело со сравнениями по модулю п (см, статью А. Я. Хинчина в этой книге).

Теорема 5. Для того чтобы множество M поля Р, содержащее не менее двух элементов, было подполем, необходимо и достаточно, чтобы сумма, разность, произведение и частное (если только оно существует в Р) любых элементов из M снова принадлежали к М.

Доказательство вполне аналогично проведённому для соответствующей теоремы о кольцах (см. § 7, теорема 4), и мы его приводить не будем.

Всякое подполе M поля Р содержит 0 как разность а — а, где а i М, и единицу как частное —, где ai М, а^О.

Теорема 61). Пересечение (в смысле пересечения множеств; см. § 2) любого множества подполей поля Р опять является подполем поля Р.

Доказательство. Пусть { Ms } есть некоторое множество подполей, где индексы s образуют множество S и D [) Л43 — пересечение всех подполей Ms данного множества; 0 и 1 входят в каждое подполе Ms и, значит, в D. Итак, D содержит не менее двух элементов. Если а и b — элементы D, то они входят в каждое Ms и по теореме 5 a+b, а — b, ab, а при b ф О и ~ также входят в Ms, а значит, и в D. В силу теоремы 5 D — подполе поля Р.

Определение 4. Поле, не имеющее подполей, отличных от него самого, называется простым.

Примерами простых полей могут служить поле рациональных чисел и поля вычетов по простому модулю р.

Любое подполе M поля Р рациональных чисел содержит число 1, а значит, и все его кратные п» 1—п, т. е. все целые числа, а значит, и все их частные, т. е. все рациональные числа. Итак, М = Р, т. е. Р — простое поле. Точно так же любое подполе M поля Ср вычетов по простому модулю р содержит класс (1), служащий единицей Cpi а значит, любой класс (г) как г-кратиое класса (1). Итак, М=Ср, т. е. Ср — простое поле.

Можно доказать, что этими полями в некотором смысле исчерпываются все простые поля.

Теорема 7. Любое поле содержит простое подполе и притом только одно.

Доказательство. Поле Р вообще содержит подполя (например, само Р). Пусть D есть пересечение всех подполей поля Р. По теореме 6 D является подполем Р и по самому определению входит в любое подполе. Пусть M — подполе D, отличное от D.

1) Соответствующая теорема верна и для колец, т. е. пересечение любого множества подколец кольца R есть подкольцо кольца R. Доказательство её вполне аналогично данному здесь для полей и предоставляется читателю.

Из определения 3 следует, очевидно, что M будет подполем и для Я, и D не входит в М, что невозможно. Итак, D — простое подполе Р. Если П — также простое подполе поля Р, то пересечение D" = D [} D' будет опять подполем поля Р, причём D" Ç=Z) и D"czZ)'. Но из определения 3 следует, что в таком случае D" будет подполем как для Z), так и для Z)', а так как D и Z)' — простые подполя, то D = D" — D', чем доказана единственность простого подполя.

§ 9. Аксиоматическое построение математики. Изоморфизм

Каждая математическая теория изучает множества с теми или иными отношениями элементов, обладающими теми или иными свойствами. Содержание теории заключается в определении одних отношений (или понятий) через другие и в доказательстве одних свойств этих отношений (или понятий) на основании других свойств. Так, в теории упорядоченных множеств одно из отношений «больше» и «меньше» определяется через другое, с их помощью определяется понятие «первый элемент» и т. д. (§ 5); в теории колец отношение а— Ь = с и понятие «нуль» определяются через отношение а+Ь = с.

Ясно, что определить все понятия и отношения и доказать все их свойства невозможно по причинам чисто логического характера: каждое определение лишь сводит данное понятие к другим, а каждое доказательство лишь выводит данное свойство из других. Приходится поэтому некоторые отношения (или понятия) оставлять без определения. Они называются основными отношениями или понятиями. Точно так же приходится некоторые свойства этих основных отношений оставлять без доказательства. Эти свойства называются основными свойствами или аксиомами. Список основных понятий и аксиом и составляет фундамент данной математической теории, на котором вся она строится логическими средствами.

Основной особенностью, придающей современному построению математических наук абстрактный характер, является изучение свойств интересующих нас понятий и отношений в применении к любым множествам, в которых данные понятия и отношения могут быть определены. При этом конкретный смысл элементов множеств и все их конкретные свойства (помимо изучаемых в данной математической теории) для данной теории совершенно безразличны. Так именно было, например, в трёх последних параграфах при определении группы, кольца и поля как множеств элементов с данными отношениями (операциями сложения и умножения), обладающими данными основными свойствами; так обстоит дело при аксиоматическом построении геометрии (см. [8] и [9]), где точки, прямые и плоскости — объекты, природа которых для формального построения геометрии совершенно безразлична, лишь бы между ними были определены

основные отношения («точка лежит на прямой» и т. п.), удовлетворяющие основным условиям (аксиомам геометрии).

Но если так, то можно думать, что существует не одна, а много теорий колец и полей, не одна, а много различных геометрий в зависимости от того, какое конкретное множество положено в основу данной теории. Выход из этого затруднения следует, однако, уже из сказанного выше и заключается в точном определении содержания данной математической теории. Ведь данная теория, как было указано, изучает не все свойства элементов множества, а лишь те из них, которые относятся к основным отношениям, заданным для этих элементов, и которые вытекают из основных свойств (аксиом), которым подчиняются основные отношения. Все остальные свойства (сами по себе, может быть, весьма важные) просто не являются предметом изучения в данной теории. Она абстрагируется от этих свойств. Поэтому все множества, для элементов которых определены (для каждого множества по-своему, на основе конкретных свойств его элементов) основные отношения и у которых все свойства этих отношений одинаковы, с точки зрения данной теории неразличимы между собой.

Но так как основные отношения определяются для каждого множества, исходя из конкретных свойств его элементов, то, изучая в абстрактной форме свойства основных отношений, данная теория изучает, таким образом, некоторые конкретные свойства целого класса конкретных множеств. Это диалектическое единство абстрактного и конкретного свойственно всякой науке, но в математике оно проявляется, пожалуй наиболее ярко. Конечно, математика изучает не все свойства материальных тел, а лишь те из этих свойств, которые поддаются количественной оценке или пространственному описанию. Основные для всей математики понятия числа и фигуры являются абстрактным выражением именно этих свойств материальных тел. Таким образом, несмотря на абстрактный характер построения современной математики, для неё остаётся в силе определение, данное Энгельсом1):

«Чистая математика имеет своим объектом пространственные формы и количественные отношения действительного мира, стало быть — весьма реальный материал. Тот факт, что этот материал принимает чрезвычайно абстрактную форму, может лишь слабо затушевать его происхождение из внешнего мира».

Понятие множеств, имеющих одинаковые свойства отношений между их элементами и поэтому неразличимых в рамках данной математической теории, получает точное выражение в следующем общем понятии изоморфизма:

Определение 1. Два множества M и М, в каждом из которых определены отношения элементов, образующие некоторую

1) Ф. Энгельс, Анти-Дюринг, 1948, стр. 37.

систему отношений S, называются изоморфными (запись М^М) относительно данной системы отношений (короче просто изоморфными), если между ними существует взаимно однозначное соответствие, сохраняющее все отношения системы S, т. е. такое, что если любые элементы M находятся в любом из отношений системы S, то соответствующее им элементы M находятся в том же отношении, и обратно.

Можно сказать, что аксиоматическая теория изучает множества лишь с точностью до изоморфизма относительно системы основных отношений данной теории.

Понятие изоморфизма обладает, очевидно, тремя основными свойствами:

1) Мд^М,

2) если М^М, то М'^М,

3) если Мд^М и М'^М", то Мд^М".

Например, в случае отсутствия каких-либо отношений (в случае, когда система отношений 5 есть пустое множество) определение 1 обращается в определение эквивалентности (§ 3), а в случае одного отношения «а предшествует Ь» при выполнении соответствующих аксиом — в отношение подобия (§ 5).

То, что понятие изоморфизма действительно выражает одинаковость всех рассматриваемых свойств множеств, можно формулировать в виде следующего общего положения:

Если множества M и M изоморфны относительно некоторой системы отношений S, то любое свойство множества М, формулированное в терминах отношений системы S (и, значит, и отношений, определяемых через отношения системы S), переносится на множество M, и обратно.

Разберём это положение на конкретном примере.

Пусть в множествах M и M определено отношение «больше», и они изоморфны относительно этого отношения; тогда, если M упорядочено, т. е. если в M выполнены свойства 1) и 2) из § 5, то они выполнены и в M.

Докажем свойство 1). Пусть а! и V — элементы M и а и b — соответствующие элементы М. В силу условия 1) в M выполнено одно из соотношений a = b, a>b, Ь>а. Отображение M на M сохраняет отношение «больше». Значит, выполнено одно из соотношений a' = b', a'>b', Ь'>а'. Если бы в M выполнялось более одного из них, то из сохранения отношения «больше» при отображении M на M следовало бы выполнение более одного отношения для а и Ь, что противоречит условию 1).

Докажем свойство 2). Если а>b' и Ь'>с', то также а>b и Ь>с. В самом деле, в M должно быть а>с. Значит, а'>с'.

Займёмся теперь изоморфизмом групп колец и полей. Ввиду того, что здесь отношения а+Ь = с и ab = c удовлетворяют дополнительным требованиям, что для любых а и b существует одно и

только одно с, для которого а+Ь = с или ab = c (эти два требования являются по существу двумя дополнительными аксиомами), причём эти требования предполагаются выполненными как в М, так и в M, определение изоморфизма групп колец и полей можно упростить по сравнению с определением 1, а именно требовать сохранения основных отношений лишь при переходе от Ж к M'. Ограничиваясь случаем колец и полей, нужным в дальнейшем при определении числовых областей (случай групп отличается от рассмотренного лишь тем, что налицо одна операция вместо двух), получаем таким образом:

Определение 2. Кольцо (или поле) R называется изоморфным кольцу (соответственно полю) R' (запись R^R'), если существует взаимно однозначное отображение R на R', при котором сумме и произведению любых элементов R соответствуют сумма и произведение соответствующих элементов R'.

Покажем, что это определение является частным случаем общего определения 1. Для этого надо лишь убедиться, что обратное отображение R' на R также сохраняет сумму и произведение. Пусть в R' имеем: а+Ь' = с', и элементам а', Ь\ с' при обратном отображении соответствуют а, Ь, с из R. Надо доказать, что а+Ь = с. Но если а+Ь = аф с, то из определения 2 следовало бы a -f b' — = а'фс\ что противоречит однозначности операции сложения в R'.

В последнем рассуждении мы не пользовались аксиомами кольца I — VI. Поэтому определение 2 дословно переносится на любые множества, в каждом из которых задано две алгебраические операции — сложение и умножение.

Теорема 1. Пусть R и R' —множества, в каждом из которых определены операции сложения и умножения. Пусть R изоморфно R' (в смысле определения 2). Тогда, если R есть кольцо (или поле), то и R' будет кольцом (соответственно полем).

Доказательство. Достаточно убедиться в справедливости для R' аксиом I — VI или I — VIII (§ 7, определение 1 и § 8, определение \у. Во всех случаях (кроме аксиомы VIII, где доказательство очевидно) рассуждение совершенно одинаково. Докажем, например, аксиому III. Пусть а' и Ь' — элементы R' и а и b — их прообразы в R. Так как в R аксиома III выполнена, то существует элемент cdR такой, что а+с = Ь. Если с —с', то в силу изоморфизма также а'4-с' = Ь', т. е. с' есть решение уравнения а'+х' = Ь'. Значит, R' также обладает свойством III. Читателю рекомендуется доказать справедливость в R' остальных аксиом.

Вместе с основными свойствами при изоморфизме сохраняются и все другие свойства, являющиеся следствиями основных. Так, при изоморфизме колец R и R' нулю R соответствует нуль R', и если R содержит единицу, то и R' содержит единицу, причём она соответствует единице из /?, В самом деле, из а+0 = а в R следует

а'+0' = а' в R' и из а- 1=а в /? следует а Г = а' в /?' для любого элемента а' из

Большое значение при построении числовых полей будет иметь следующая, почти очевидная:

Теорема 2. Пусть R — подкольцо кольца S и R' — кольцо, изоморфное R и не имеющее общих элементов с S. Тогда для любого данного изоморфного отображения f кольца R на R' существует кольцо S', содержащее в качестве подкольца R' и изоморфное кольцу S, причём существует изоморфное отображение g кольца S на S', совпадающее на R с данным отображением f, т. е. такое, что g(a)=f(a) для любого элемента а из R. Если S — поле, то и S' будет полем. Если R — подполе S, то и R' — подполе S'.

Доказательство. Пусть S' — множество, полученное из 5 путём замены элементов R на элементы /?', т. е. 5' = (5\/?) [_]/?'. Строим такое отображение g множества S на S': если а £ S\R, то положим g(a) = a; если a £R, то положим g(a)=f(a)f rub f(a) — элемент R', соответствующий а при данном изоморфизме /.

Так как /—взаимно однозначное отображение R на R', g — взаимно однозначное отображение на себя и множества .S и R' не имеют общих элементов (достаточно даже, чтобы и R' не имели общих элементов), то g является взаимно однозначным отображением 5 на S'.

Операции сложения и умножения в 5' определим через операции в S путём перенесения их в S' с помощью отображения g, т. е. положим

g(a) + g(b)=g(ai-b), g(a)g(b) = g(ab) (1)

для любых элементов а и b из 5. Так как в силу взаимной однозначности отображения g для любого а' из S существует один и только один элемент а из 5 такой, что g(a) = a\ то g (а) и g(b) — любые элементы 5', и равенства (1) действительно определяют алгебраические операции в

Одновременно равенства (1) показывают, что относительно сложения и умножения изоморфно 5 и по предыдущей теореме .S — кольцо. Если vS—поле, то и — поле.

Покажем, что операции в S' для элементов R' совпадают с операциями, заданными в кольце R'. Так как /—изоморфное отображение R на R', то справедливы равенства

/(а)+/(£)=/(<* + &), f(a)f(b)=f(ab) (2)

для любых а и b из R.

Но если в (1) g (а) и g(b) принадлежат R', то a, b, а+Ь и ab принадлежат R, и по построению отображения g равенства (I) со-

впадают с равенствами (2), где сложение и умножение в левых частях означают операции, заданные в кольце R'. Этим указанное совпадение операций доказано. Значит, R' — подкольцо 5'. Если R — подполе S, то по предыдущей теореме R' — также поле, т. е. подполе Теорема доказана.

§ 10. Расположенные кольца и поля

До сих пор мы рассматривали либо множества без всяких отношений между элементами (§ 1—4), либо множества с одним отношением порядка (§ 5), либо множества с одной или двумя алгебраическими операциями (§ 6—9). Однако важнейшую роль в математике играют числовые множества, где существуют одновременно и отношения порядка и операции. Мы рассмотрим упорядоченные кольца и поля с целесообразной связью порядка и операций.

С отношением порядка в кольце связаны понятия положительности, отрицательности и абсолютной величины элементов (см. § 7, определения 1 и 3).

Наличие операций позволяет несколько упростить введение порядка в кольце. Оказывается достаточным задать лишь порядок всех элементов относительно нуля. Далее, для сохранения обычных свойств чисел приходится наложить дополнительные требования на связь порядка с операциями. Именно:

Определение 1. Кольцо (в частности, поле) R называется расположенным, если для его элементов определено свойство быть положительным, удовлетворяющее следующий требованиям:

IX. Для любого элемента а 6 R имеет место одно и только одно из трёх соотношений: а = 0, а положителен, —а положителен.

X. Если а и b положительны, то а+Ь и ab также положительны.

Если —а положителен, то а называется отрицательным.

Теорема 1. Если в расположенном кольце R определить порядок, считая а>b тогда и только тогда, когда элемент а — b положителен, то R будет упорядоченным множеством (в смысле § §), причём нуль будет меньше всех положительных и больше всех отрицательных элементов.

Доказательство. Пусть а и b— элементы R. Если а—b =0, то а = Ь, если а — b положителен, то а>b, если —(а — b) — b — а положителен, то Ь>а. Из свойства IX следует, что имеет место один и только один из этих трёх случаев (§ 5, свойство 1). Далее, если а>b и Ь>с, то а — b и b — с положительны. По свойству X тогда (а — b)+(b — с) = а — с положителен, т. е. а>с (§ 5, свойство II). Итак, R — упорядоченное множество.

Если а положителен, то из а —а — 0 следует а>0; если а отрицателен, то из —а = 0 — а следует 0>а, а<0.

Эта теорема показывает, что условия IX и X достаточны для введения порядка в R, причём X даёт обычную для чисел связь порядка с операциями кольца.

Теорема 2. (Законы монотонности для сложения и умножения.) Для любых элементов а, Ьу с расположенного кольца R из a) a>bf a — by a<b следует соответственно б) а+с>b +с, a+c = b+c, а+с<b+с и при с>0 соответственно в) ac>bc, ac = bcf ac<bc, а при с<0 — соответственно: г) ас<bс, ас = beу ас>bс.

Доказательство. Если a>bf то

(а + с) — (Ь + с) = а — 6>0,

т. е. а+с>b+с. Если a —by то ас = Ьс по однозначности сложения. Если а<b, то Ь>а, и по первому случаю

b + с > а -|- с, а+ с<b + с.

Случай б) доказан.

Если а>b, с>0, то а — Ь>0, и по условию X

(а — Ь)с = ас — be > 0, ас >

Если с<0, то —£>0, и по правилу знаков при умножении [§ 7, формула (3)] имеем:

ac = (b — а)с=[— (b — a)] (—c) = (a — b) (— с)>0, be > ас, ас < be.

Итак, оба первых случая в) и г) доказаны. Остальные случаи вытекают из первых дословно, как при доказательстве б). Справедливы также обратные теоремы, а именно:

Теорема 3. Из

а+с>b+с, а+с = Ь +с, а+с<b+с

следует соответственно

a>b, a = by а<b.

Из

ас > be у ас = be у ас < be следует при с>0 соответственно

a>by a = by а<b, а при с<0 — соответственно

а<b> a —b, a>b.

Доказательство. В теореме 2 посылки а) обладают тем свойством, что одна (и только одна, что сейчас неважно) из них наверное имеет место, а следствия [в каждом случае б), в), г) отдельно] — тем свойством, что они взаимно исключают друг друга. Для теорем такого рода обратные теоремы всегда верны, причём их можно доказать методом «от противного». Докажем, например, что из ас = Ьс следует а = Ь при с>0. Предположим противное, что афЬ. Тогда имеет место какая-то из других посылок а) теоремы 2. Но если а>b, то по теореме 2 ас>bс, если же а<b, то ас<bс, что невозможно ввиду ас —be, чем исключаются неравенства ас>bс и ас<bс.

Следствие 1. В расположенном кольце из а)

а — ьЩс — d следует соответственно б)

а+аЩь~{-с,

и обратно.

В самом деле, прибавляя к обеим частям а) сумму b+d, получим б). Обратные теоремы верны, так как в а) и б) исчерпаны все случаи и они исключают друг друга.

Следствие 2. В расположенном поле при bd>0 из а)

а ^ с Т~=<с d

следует соответственно б)

ad ^ be,

и обратно.

Доказательство аналогично предыдущему.

Из теоремы 2 вытекают обычные для чисел правила действий с неравенствами. А именно:

Теорема 4. Из а>b и c>d следует а+c>b-j-d и, если все элементы а, Ь, с, d положительны, то ac>bd, если же все они отрицательны, то ac<bd. Верна также теорема, получающаяся из данной, если знаки > и < поменять местами.

Доказательство. По теореме 2 из а>b следует а+ +с>bс, из c>d следует b+c>b+d, откуда a+c>b+d. Точно так же доказывается, что при положительных а, Ь, с, d будет ac>bd. Пусть а, Ь, с, d отрицательны. Тогда из а>b следует ас<bс и из c>d следует bc<bd, откуда ac<bd.

Как следствие из теоремы 3 получаем:

Теорема 5. Расположенное кольцо не имеет делителей нуля (§ 7, определение 2).

Доказательство. Пусть ab = 0. Тогда ab = a-0 и по теореме 3 при афО, т. е. а>0 или а<0, должно быть Ь = 0.

Теорема 6. Характеристика (см. § 8, определение 2) расположенного поля Р равна нулю.

Доказательство. Пусть а ф О, ai Р. Если а>0, то по свойству X для любого натурального п также па>0, а так как (—п)а = — па, то пафО при любом целом п. Если а<0, то — а>0 и п(—а) ф О, при любом целом я. Значит, /га 0, если афО и /г ф 0.

Теорема 7. Сумма квадратов (и, в частности, всякий квадрат) конечного числа элементов расположенного кольца больше или равна нулю, причём равенство может иметь место лишь в том случае, когда все данные элементы равны нулю.

Доказательство. Для одного элемента, если аг = 0, то а\ = 0. Если же аг ф 0, то или а, > 0, или — ах > 0 и тогда

Для п=1 теорема верна. Пусть она верна для п элементов. Тогда

как сумма неотрицательных слагаемых (см. свойство X). Если одно из двух слагаемых >0, то и сумма их >0. Значит, в случае равенства нулю оба слагаемых равны нулю, т. е.

Отсюда по доказанному ап+1 = 0 и по предположению индукции а1=а2= . . ,=ап — 0.

Определение 2. Абсолютной величиной элемента а расположенного кольца (и, в частности, поля) называется неотрицательный из элементов au — а. Абсолютная величина элемента а обозначается через \ а \.

Согласно этому | 0 | = 0 и при афО всегда | а | > 0.

Теорема 8. Абсолютная величина суммы конечного числа элементов меньше или равна сумме абсолютных величин слагаемых. При этом равенство имеет место тогда и только тогда, когда все слагаемые неположительны или все неотрицательны. Абсолютная величина произведения конечного числа элементов равна произведению абсолютных величин сомножителей.

Доказательство. Ограничимся случаем двух элементов, так как проведение индукции не представляет затруднений. Итак, надо доказать, что

\a+b\^\a\ + \b\, (1)

причём равенство имеет место тогда и только тогда, когда либо а ^ 0, b ^0, либо а^О, b ^0, a также доказать, чю

|oft| = |a|.|*|. (2)

Если а^О и £ ;>= О, то также а+Ь^0 и

|o + ô| = o + ô = |a|4-|&|.

Если a=sO и Ь^О, то —а5= 0, —ôSsO и

_(а + о) = (-а) + (—*)^0,

откуда

|a + ô| = — (a-fô) = (— а) + (— ô) = |a| + lô|.

Итак, в этих двух случаях (1) имеет место при знаке =. По симметрии а и b в (1) из двух оставшихся случаев а>0, Ь<0 и а<0, £>0 достаточно разобрать лишь первый. По теореме 2, прибавляя а к неравенству Ь<—Ь, получим:

а+*<а + (—*) = |«| + 1Н

Точно так же, прибавляя —ô к неравенству — а<а, получим:

_(а + *)=(— а)+(— &)<а + (-о) = |а| + |Н

Но I а -j- 61 совпадает либо с а -|- £, либо с — (а + Поэтому

|а + *|<|а| + |П

Итак, в этих двух случаях (1) имеет место при знаке Равенство (2), очевидно, выполнено, если хотя бы один из элементов a, b равен нулю. Остаётся разобрать три случая:

1) а>0, &>0. По свойству X а£>0 и | а£ | = ае = | а ! - | b

2) а<0, 6<0, — а>0, — £>0, (— а)(— £)>0 и по правилу знаков (3) из § 7

Из неравенства (1) следует

(3)

для любых элементов а и b расположенного кольца /?. В самом деле, так как а+Ь = а — (—Ь) и |#| = | — Ь\, то достаточно

доказать (3) для случая разности а — Ь. Но из а = (а — b)+b и Ь = (Ь — а)+а по (1) найдём: |а|^|а — + и

\b\^\b — а\ + \а\ = \а — Ь\ + \а\,

откуда

\а\ — \Ь\*£\а — Ь\ и |*| —|а|«|а —*|;

поэтому

|а| —1*1 |^|а-*| = |а + (-*)|^|а| + |*|.

Замечание. Точно так же известные из элементарной алгебры правила сравнения и действий над «относительными числами» через сравнение и действия над их абсолютными величинами остаются справедливыми для любого расположенного кольца R.

Именно, положительный элемент кольца R больше отрицательного, что ясно из сравнения с нулём. Из двух положительных элементов тот больше, абсолютная величина которого больше, ибо положительные элементы совпадают с их абсолютными величинами. Из двух отрицательных элементов тот больше, абсолютная величина которого меньше. В самом деле, если а и b отрицательны, то а — b = (— b) — (— а) = J b I — I а I и поэтому a>b тогда и только тогда, когда |а|<|£|.

Если по симметрии с обозначением элемента, противоположного а, через —а обозначить сам элемент а через +at то каждый элемент можно выразить через его абсолютную величину так: a = do\a\, где знак + берётся для положительного и — для отрицательного элемента а. В этом смысле можно говорить о знаке данного элемента. Тогда имеют место следующие правила действий.

Чтобы сложить два элемента одного знака, надо сложить их абсолютные величины и поставить тот знак, который имели слагаемые. В самом деле, если а>0 и Ь>0, то это очевидно; если же а<0 и &<0, то в + & = (_|а|) + (—|*|) = -(|а| + |*|).

Чтобы сложить два элемента разных знаков, надо из большей абсолютной величины вычесть меньшую (при равенстве абсолютных величин сумма равна нулю) и поставить знак того слагаемого, у которого абсолютная величина больше. Пусть а>0 и Ь<0. Если I а IX b I, то

а + Ь=а-(-Ь)=+(\а\-\Ь\).

Если же j а \ <| b |, то

а+* =—(— * — а)=-(|*| — |а|).

Чтобы из одного элемента вычесть другой, надо к первому элементу прибавить элемент, противоположный второму. Это верно даже для любых колец.

Чтобы умножить (разделить) один элемент на другой, надо абсолютную величину первого элемента умножить (разделить) на абсолютную величину второго и поставить знак -j-, если знаки данных элементов одинаковы, и знак —, если различны. Для умножения это следует из правила знаков в любом кольце [§ 7, (3)], ибо ab = (±I а I ) • (±\Ь\), а для деления (если оно выполнимо) выводится отсюда так: если -^- — с, то a = bc, \а\ = \Ь\-\с\, откуда

При умножении на положительный элемент знак сохраняется, а на отрицательный — меняется. Поэтому из а = Ьс следует, что при одинаковых знаках а и b частное с положительно, а при разных знаках отрицательно.

Мы видим, таким образом, что обычные правила оперирования с неравенствами и абсолютными величинами верны не только для чисел, но и для элементов любых расположенных колец. Эти правила являются следствием аксиом I—VI, IX и X.

Есть, однако, одно важное свойство чисел, которое уже не переносится на любые расположенные кольца. Это — выполнение так называемой аксиомы Архимеда, согласно которой, складывая само с собой любое данное положительное число (как бы мало оно ни было) достаточное число раз, мы можем получить число, превосходящее любое (сколь угодно большое) данное число. Поэтому кольца, обладающие аналогичным свойством, нуждаются в особом определении.

Определение 3. Кольцо (в частности, поле) называется архимедовски расположенным, если оно обладает свойством:

XI. (Аксиома Архимеда.) Для любых элементов а и b кольца, где Ь>0, существует натуральное число п такое, что nb>a.

В случае поля достаточно выполнения этого условия лишь для единицы поля е, т. е. свойство XI эквивалентно свойству

ХI'. Для любого элемента а поля существует натуральное число п такое, что пе>а.

Действительно, если Ь>0, то существует натуральное число п, для которого пе>-^-, и, умножая на Ь>0, получим: nb>a.

Пример 1. Кольцо целых, поле рациональных и поле действительных чисел архимедовски расположены (доказательства даны в соответствующих главах).

Пример 2. Пусть R есть кольцо многочленов

/(лО=а0+ . . - + апхП

с рациональными коэффициентами (при обычных операциях сложения

и умножения). Будем считать многочлен f(x) положительным, если его старший коэффициент ап положителен. Легко видеть, что аксиомы IX и X определения (1) выполняются, т. е. R— расположенное кольцо. Но хотя 1>0, п • 1 =п<х при любом натуральном (даже при любом рациональном) /г, так как х — /г>0. Значит, R — неархимедовски расположенное кольцо. Алгебраические дроби вида ^-4, где f(x) и g(x) — многочлены кольца R, образуют поле Р. Читателю предлагается доказать, что поле Р будет расположено, если дробь : : считать положительной, когда f(x) и g(x) имеют одинаковые знаки при указанном выше расположении R. Так как снова п • \<Сх, то Р — неархимедовски расположенное поле.

ГЛАВA III

НАТУРАЛЬНЫЕ ЧИСЛА

§ 11. Аксиомы натуральных чисел

Аксиоматическое построение данной теории начинается (см. § 9) с перечисления основных отношений (принимаемых без определения) и основных свойств или аксиом (принимаемых без доказательства), которым удовлетворяют данные отношения. При аксиоматическом построении натуральных чисел вводится одно основное отношение и четыре аксиомы, а именно:

Определение 1. Натуральными числами называются элементы всякого непустого множества N, в котором для некоторых элементов a, b существует отношение «Ь следует за а* (число, следующее за а, будем обозначать через а), удовлетворяющее следующим аксиомам:

I. Существует число 1, не следующее ни за каким числом^ т. е. а! ф\ для любого числа а1).

II. Для любого числа а существует следующее число а' и притом только одно, т. е. из а = Ь следует а'= Ь\

III. Любое число следует не более чем за одним числом, т.. е. из а' = Ь' следует а = Ь.

IV. (Аксиомa индукции.) Любое множество M натуральных чисел, обладающее свойствами:

А) 1 принадлежит М,

Б) если число а принадлежит М, то следующее число а' также принадлежит М,

содержит все натуральные числа, т. е. совпадает с N-

Приведённая здесь аксиоматика натуральных чисел представляет собой лишь несущественное изменение системы аксиом, предложенной в 1891 г. итальянским математиком и логиком Пеано.

Может показаться, что наше определение натуральных чисел плохо тем, что согласно ему натуральными числами называются

1) Как всегда, знак = обозначает совпадение, а знак ф — различие элементов множества.

элементы всякого множества N, обладающего перечисленными свойствами.

Действительно, возможны различные множества, удовлетворяющие определению 1, но все они изоморфны относительно основного отношения «Ь следует за ат> (см. определение 1 из § 9) и поэтому обладают совершенно одинаковыми свойствами, касающимися этого отношения, если только эти свойства вытекают из аксиом I — IV.

Отложив до конца главы (§ 17) доказательство упомянутого изоморфизма и другие вопросы, касающиеся самой системы аксиом, займёмся теми следствиями, которые из неё проистекают.

Поясним, прежде всего, смысл аксиомы индукции. Обычное доказательство по индукции состоит в следующем. Пусть надо доказать некоторую теорему, в формулировке которой участвует натуральное число п (как, например, в формуле бинома Ньютона). Тогда доказывают эту теорему, во-первых, для й=1 и, во-вторых, для числа л+1, предполагая, что она верна для числа я. После этого теорема считается доказанной для любого числа п. То, что теорема действительно доказана для любого п, обычно обосновывается так: теорема верна для 1, а значит, и для 2, раз она верна для 2, значит, верна и для 3; раз для 3, значит, и для 4 и т. д. Но что значит это «и т. д.»? Можем ли мы, рассуждая так, перебрать все натуральные числа? Разумеется, нет. так как этих чисел бесконечно много. Аксиома индукции IV и служит как раз формальным средством доказательства такого рода теорем сразу для всей бесконечной совокупности натуральных чисел. А именно, верна такая теорема:

Теорема 1. (Теорема о законности индуктивных доказательств.) Если некоторая теорема Т, формулировка которой содержит натуральное число п, доказана для числа lue предположении, что она верна для числа п, доказана для следующего числа п'1), то эта теорема верна для любого числа п.

Доказательство. Пусть M есть множество тех натуральных чисел, для которых верна рассматриваемая теорема Т. Тогда

А) число 1 входит в М, так как для 1 теорема Т доказана;

Б) пусть число п принадлежит М\ это значит, для числа п теорема Т верна. Но в таком случае теорема Т доказана, т. е. также верна и для следующего числа п\ а это значит, что число п' также принадлежит М. Итак, множество M обладает свойствами А) и Б) аксиомы IV. В силу этой аксиомы оно должно содержать все натуральные числа, что означает (по самому определению множества М), что теорема Т верна для любого натурального числа п. Этим теорема 1 доказана.

1) Для того чтобы считать п' = п+\, надо ещё определить сложение натуральных чисел.

Определение 2. Если b следует за а, то говорят, что а предшествует Ь.

Согласно аксиоме I число 1 не имеет предшествующего. Но это — единственное число с таким свойством.

Теорема 2. Любое число аф \ имеет предшествующее число и притом только одно.

Доказательство. Пусть M—множество, содержащее 1 и все числа, имеющие хотя бы одно предшествующее число.

А) 1 принадлежит М, Б) если а принадлежит М, то и а' также принадлежит М, ибо а' имеет предшествующее число а (предположение, что а принадлежит М, здесь даже излишне). По аксиоме IV M содержит все числа. Значит, любое число а ф 1 имеет по крайней мере одно предшествующее. Единственность предшествующего числа следует из аксиомы III, согласно которой любое число имеет не более одного предшествующего.

Теорема 3. Если числа, следующие за данными числами, различны, то и данные числа различны, т. е. из а' ф Ь' следует афЬ.

Доказательство. По аксиоме II из а = Ь следует а' = Ь'.

Теорема 4. Если данные числа различны, то и следующие за ними различны, т. е. из афЬ следует а' ф Ь'.

Доказательство. По аксиоме III из а' = Ь' следует а = Ь.

Теорема 5. Любое число отлично от следующего за ним числа, т. е. аф а' для любого а.

Доказательство. Пусть M — множество чисел, для которых теорема верна.

А) По аксиоме I V ф 1. Следовательно, 1 принадлежит М.

Б) Если а принадлежит М, то а ф а. Значит, по теореме 4 также (а')' ф а, т. е. а принадлежит М. По аксиоме IV M содержит все числа, т. е. аф а' для любого а.

§ 12. Сложение

Определение. Сложением натуральных чисел называется такое соответствие, которое с каждой парой натуральных чисел а и b сопоставляет одно и только одно натуральное число а+Ь, обладающее следующими свойствами:

1 ) а + 1 = а' для любого а,

2) а+b'= (а+Ь)' для любых а и Ь.

Числа а и b называются слагаемыми, а число а+Ь — суммой1).

Сразу возникает вопрос, существует ли такое соответствие, и если да, то будет ли оно единственным. Приведённое определение является примером так называемого индуктивного определения. Пусть

1) Сложение является, таким образом, частным случаем более общего понятия алгебраической операции (см. § 6, определение 1) или ещё более общего понятия функции (см. § 3, определение 1).

выбрано определённое число а. Тогда условия 1) и 2) определяют число а +1 и число а + если уже определено число а+Ь. Поэтому на основании аксиомы индукции IV можно, казалось бы, считать число а+Ь определённым для любого Ьу а так как а выбиралось произвольно, то и для любых а и Ь. Так полагали автор аксиоматики натуральных чисел Пеано и его ученики. Такое изложение принято в большинстве математических книг. Однако в этом рассуждении имеется ошибка. В самом деле, каждый раз, применяя аксиому индукции, мы должны вполне точным образом определить то множество Ж, для которого надо доказать свойства А) и Б). В доказанной выше теореме 1 (§11) множество M состоит из тех натуральных чисел, для которых верна некоторая теорема Т о натуральном числе я. Нам удалось доказать, что это множество обладает свойствами А) и Б), что и доказывало теорему Г. Этим снимается то возражение, что при доказательстве теоремы Т для n +1 мы предполагаем её уже доказанной для п, хотя она ещё только доказывается. Мы пока и не пользуемся тем, что теорема Т верна для п, а доказываем лишь предложение в условной форме: «Если теорема Т верна для п, то она верна и для #-|-1», что соответствует условной форме свойства Б).

Попробуем теперь выяснить, к какому множеству M надо применить аксиому IV в случае определения сложения? Можно ли сказать, что при выбранном а множество M состоит из тех Ь, для которых число а+Ъ определено? Нельзя, потому что мы ещё только хотим доказать, что число а+Ъ определено свойствами 1) и 2). В этом и состоит как раз отличие индуктивного определения от индуктивного доказательства, где множество M чисел, для которых теорема Т верна, имеет вполне определённый смысл независимо от того, доказана эта теорема Т или нет. Слова «при данном а число а+Ь со свойствами 1) и 2) определено» имеют лишь такой точный смысл: «при данном а существует соответствие, сопоставляющее с числом b число а+Ь и обладающее свойствами 1) и 2)», но это утверждение касается не одного, а сразу всех чисел b и потому его нельзя доказать индукцией по b простой ссылкой на свойства 1) и 2). Зато это утверждение касается одного определённого числа а, и можно пытаться доказать его индукцией по а (что и будет сделано ниже). Заметим, что мы утверждаем ошибочность доказательства индукцией по b того, что условия 1) и 2) определяют число а+Ь, но отнюдь не ошибочность самого этого утверждения. Индуктивные определения законны, что можно доказать, опираясь только на понятие о порядке натуральных чисел (см. § 15). Понятие же порядка будет нами введено (см. § 14) на основе сложения. Таким образом, вопрос о существовании сложения приходится решать иным путём.

Теорема 1. Сложение натуральных чисел существует и притом только одно, т. е. существует одно и только одно соот-

ветствие, сопоставляющее с любыми числами а и Ъ число а+Ь так, что

1) а+\=а' для любого а,

2) а~\-Ь'= (а+Ь)' для любых а и Ъ. Иными словами, сложение всегда выполнимо и однозначно.

Доказательство, а) Сначала докажем, что при данном а существует не более чем одно соответствие, сопоставляющее с каждым числом b число хь и обладающее свойствами: х1=а', хь'=(хь)' для любого Ь. Пусть уъ— любое соответствие с теми же свойствами, т. е. у1 = а, уь'=(уьУ для любого Ь. Пусть M — множество тех чисел Ь, для которых хь=уъ.

A) xi — a'=yi\ 1 принадлежит М.

Б) Если b принадлежит М, то хь—уь, значит, по аксиоме II (*ьУ = (УьУ> следовательно, хь> = (хь)' = (уь)' =уъ,, т. е. Ь' принадлежит М. По аксиоме IV M содержит все натуральные числа, т. е. хь=уь для любого Ь. Единственность сложения доказана при данном а. Но по произвольности а она доказана для любых а и Ь.

б) Покажем теперь, что при данном а существует [и согласно а) только одно] соответствие, сопоставляющее с каждым b число а+Ь и обладающее свойствами: а -|-1 == а', а+Ь' = (а+Ь)' для любого b (при данном а). Пусть M — множество тех чисел а, для которых такое соответствие существует [и по а) только одно].

А) При а=1 положим для любого Ь, что a+b = b'. Это соответствие обладает нужными свойствами, так как

a -f 1 = 1 ' = а', а + Ь' = (*')' = (а + &)'.

Значит, 1 принадлежит М.

Б) Если а принадлежит М, то число a -j- b определено и обладает свойствами: a+l=a, а+Ь' = (a-j-Ь)'. Числу b поставим в соответствие число a +b = (a+ b)'. Это соответствие обладает нужными свойствами для а', так как

а' +1 = (а + 1)' = (а% а' + V=(а + Ь')' = [(а + &)']' = (а' + Ь)\

Значит, число а' принадлежит М. По аксиоме IV M содержит все натуральные числа, т. е. для любого а существует соответствие, сопоставляющее с каждым b число а+Ь и обладающее свойствами

а+ 1=а', а + *' = (а + &)'

для данного а и любого о. Но число а является произвольным. Следовательно, доказано существование и единственность соответствия, сопоставляющего с любыми а и b число а+Ь и обладающее свойствами 1) и 2). Теорема доказана.

Теорема 2. (Закон ассоциативности сложения.)

(a + ô) + c=a + (ô + c).

Доказательство. Пусть выбраны числа а и b и пусть M — множество тех чисел с, для которых равенство справедливо.

A) (a + *)+l=(a + ô)' = a + *f = a + (* + l);

1 принадлежит М. Б) Если с принадлежит М, то (а+Ь)+с = = а+(Ь+с), откуда

(e + *) + c- = [(a + *} + «]' = [a + (J + «)]' = e + (*+«)' =

= а+(* + 0,

т. е. с' принадлежит Ж. По аксиоме IV равенство (а+Ь)+с = = а+(Ь+с) справедливо для любых a, b и с.

Теорема 3. (Закон коммутативности сложения.)

a+b = b + а.

Доказательство, а) Докажем, что а-(- 1 = 1 +а индукцией по а. Пусть M—множество тех а, для которых это верно. А) 1, очевидно, принадлежит Ж. Б) Если а принадлежит М, то а —|— 1 = = 1 + а. Тогда

а'+1=(а+1)+1=(1+а)+1=(1 + аУ = 1+а',

т. е. а принадлежит М. По аксиоме IV доказано, что a-j- 1 = 1 -j-a.

б) Докажем индукцией по Ь, что a+b = b -j-a. Пусть M — множество тех Ь, для которых это верно при данном а. А) По доказанному в а) 1 принадлежит М. Б) Если b принадлежит М, то a + b = b + a. Тогда, используя теорему 2, находим:

a + ô' = (a + *)f = (é + a)' = *4-af = * + (a+l) = * + (l+a) =

=(ô-fl) + a==ô, + a,

т. е. b' принадлежит M. По аксиоме IV теорема доказана.

Теорема 4.

а + ЬфЬ.

Доказательство. Теорема верна для Ь = 1, ибо а-(-1 = = а'у^1 по аксиоме I. Если а^-ЬфЬ, то по теореме 4 из § 11 также

a+b' = (a+b)' фЬ'.

Теорема 5. Для любых чисел а и b имеет место один и только один из случаев: 1) а = Ь\ 2) существует число k такое, что a = b^k; 3) существует число I такое, что b = a+L

Доказательство. Из теоремы 4 следует, что имеет место не более чем один из этих случаев, так как, очевидно, 1) и 2), а также 1) и 3) не могут иметь места одновременно. Если бы имели место 2) и 3), то

a==b+k = (a+l) + k = a+(l+k),

что снова противоречит теореме 4. Докажем, что хотя бы один из этих случаев всегда имеет место.

Пусть выбрано число а, и M—множество тех Ь, для каждого из которых при данном а имеет место 1), 2) или 3). А) Если а=1, то имеем случай 1) для Ь = 1. Если аф 1, то по теореме 2 из § 11 a—k'=k+1 = 1+ é, т. е. имеем случай 2) для b = l. Итак, 1 принадлежит М. Б) Пусть £ принадлежит М. Тогда или a = b, и следовательно, b' = b+l=a+l, т. е. случай 3) для Ь'\ или а = # + &, и если А = 1, то а = й+1=£', т. е. случай 1) для если же k-ф. 1, то k = ni и

a = ô + m'=ô + (m+l)=ô + (l+/H)=(ô + 1) + /ю=£' + /ю,

т. е. случай 2) для или £ = а + / и

£' = (а + /)' = а + /',

т. е. случай 3) для b\ Во всех случаях Ь' принадлежит М. Теорема доказана.

Пользуясь этой теоремой, можно было бы уже теперь дать определение порядка и доказать основные его свойства (см. § 14), но мы рассмотрим сначала свойства умножения, чтобы затем сразу рассмотреть связь понятия порядка с обеими основными операциями.

Задача. Определив натуральные числа

2=1', 3 = 2', 4 = 3', 5 = 4', 6 = 5',

доказать на основании определения суммы, что

1 + 1=2, 1+2 = 3, 2 + 2 = 4, 2 + 3 = 5, 2 + 4 = 3 + 3 = 6.

§ 13. Умножение

Определение. Умножением натуральных чисел называется такое соответствие, которое с каждой парой натуральных чисел а и b сопоставляет одно и только одно натуральное число ab (или а • b или а X Ь), обладающее следующими свойствами:

1) а • 1 =а для любого а;

2) ab' = ab+a для любых а и Ь.

Число а называется множимым, b — множителем, оба числа а и b называются также сомножителями, а число ab — произведением.

На первый взгляд может показаться странным, зачем давать это индуктивное определение, вместо того чтобы остаться при всем известном школьном определении произведения ab как суммы b слагаемых, каждое из которых равно множимому а. Но что означает выражение «Ь слагаемых», где b выступает в роли количественного числительного? Количество слагаемых имеет лишь один точный смысл, именно, — это мощность некоторого множества

(см. § 3, определение 4). Правда, для конечных множеств (с которыми мы и имеем дело при определении умножения) мы дали другое определение «числа элементов» (см. § 4, определение 3) и доказали, что оно совместимо с понятием числа элементов как мощности множества, но мы существенно использовали при этом понятие отрезка |1,л| натурального ряда как множества натуральных чисел, не превосходящих п. Это понятие предполагает уже установленным порядок во множестве натуральных чисел; правда, мы могли бы определить порядок до умножения и установить с помощью определения 3 из § 4 соответствие, позволяющее отождествить натуральные числа с мощностями конечных множеств. Это дало бы натуральным числам количественный характер. Однако арифметика натуральных чисел в этом не нуждается. Всю её можно построить, не используя понятия о мощности, а лишь на основе определения 1. Построенные таким путём натуральные числа называют порядковыми числами в отличие от мощностей, называемых количественными числами.

Для того чтобы теория натуральных чисел не осталась пустой логической игрой, а стала тем основным орудием практической деятельности человека, которым она на самом деле является, необходимо установить соответствие между мощностями конечных множеств и независимо от них построенными порядковыми натуральными числами, придав им тем самым количественный смысл. В этом и состоит значение определения 3 и теоремы 2, на которой оно основано, приведённых в § 4.

Относительно определения умножения сохраняют силу все замечания, которые были сделаны в предыдущем параграфе по поводу определения сложения. В частности, из него ещё неясно, что соответствие с этими свойствами существует. Поэтому большое принципиальное значение имеет следующая теорема, аналогичная теореме 1 из § 12.

Теорема 1. Умножение натуральных чисел существует и притом только одно. Иными словами, умножение всегда выполнимо и однозначно.

Доказательство, а) Сначала докажем, что при данном а существует не более чем одно соответствие, сопоставляющее с каждым числом b число хъ и обладающее свойствами х^ = а, хь> =хь +а для любого Ь. Пусть уь — любое соответствие с теми же свойствами и M — множество тех Ь, для которых хъ=уъ.

A) xl=a=y1; 1 принадлежит М. Б) Если b принадлежит М, то хЬ' =хь+а=уь+а=у&\ Ь' принадлежит М. По аксиоме IV Хъ—Уъ для любого Ь. Единственность умножения доказана при данном а, а по произвольности а она доказана для любых а и Ь.

б) Покажем теперь, что при данном а существует [и согласно а) только одно] соответствие, сопоставляющее с каждым b число ab и обладающее свойствами а • 1 =а, ab' = ab+a для любого b (при

данном а). Пусть M — множество тех чисел а, для которых такое соответствие существует [и по а) только одно].

А) При а=1 положим для любого Ь, что ab = b. Это соответствие обладает нужными свойствами, так как

а . 1 = 1 =а, ab' = Ь' =zb+\= ab+ а;

1 принадлежит М.

Б) Если а принадлежит М, то любому b соответствует ab, причём а-\=а, ab' = ab+a. Для а' строим такое соответствие: числу b соответствует число а' - b = ab+ Ь. Оно обладает нужными свойствами, так как

а • 1 = а • 1 1 = a +1 = а', a'.fc' = a*#4-ô'==(aô + a)4-ô'=^aé4-(a + ô')==aô4-(a + ô),= = a£ + (£ + a)' = a£ + (£ + a') = (a£-f &) +а' = а . é+а';

а' принадлежит Ж. Соответствие с нужными свойствами построено при любом а для каждого Ь, т. е. для любых а и Ь. Теорема доказана.

Теорема 2. (Правый закон дистрибутивности.) (а -|- Ь) с = ас -j-

Доказательство. Для данных а и b применим индукцию по с.

A) (a-j-£)«l=a+£ = ael-l-£'b Для с = 1 теорема верна. Б) Если теорема верна для с, то (а~\- b)c = ac+bc.

Используя ассоциативность и коммутативность сложения, находим:

(a + é) c' = (a + b)c + (a + b) = (ac + bc)+(a+b) =

= (ac a) + + *) = ac' + ^c'>

т. е. теорема верна и для с'. По аксиоме IV теорема доказана.

Теорема 3. (Закон коммутативности умножения.)

ab = ba.

Доказательство, а) Индукцией по b докажем теорему при а=1, т. е. 1 *b = b' 1; M — множество b с этим свойством. А) 1 принадлежит М. Б) Если 1 • b = b • 1, то

1 .Ô' = l .&4-* = ô . l-fl=£-fl =£' = £'. 1; принадлежит M.

б) Индукцией по a докажем, что ab = ba при данном b\ M — множество а с ab = ba.

А) Согласно а) 1 принадлежит М.

Б) Если а принадлежит М, то ab = ba. Тогда, используя предыдущую теорему, найдём:

о!-b=(a+l)b = ab+l -b = ba+b- \=ba+b = bd\

а! принадлежит M.

Теорема 4. (Левый закон дистрибутивности.)

с (a + b) = са -j- cb.

Доказательство следует из теорем 2 и 3.

Теорема 5. (Закон ассоциативности умножения.)

(ab)c = a(bc).

Доказательство. Пусть даны а и b\ M — множество тех с, для которых равенство имеет место.

А) (ab) • 1 =ab = a (b - 1); 1 принадлежит M.

Б) Если с принадлежит М, то (ab) с —a (be). Тогда, используя теорему 4, найдём:

(ab) с' = (ab) c~x-ab = a (be) -j- ab = a(bc~\-b) = a (be');

с' принадлежит M. Теорема доказана.

Задача. Определив попрежнему 2 = Г, 3 = 2', 4 = 3', доказать равенство 2-2 = 4, 3-2 = 6.

§ 14. Порядок

При определении натуральных чисел (§ 11, определение 1) мы исходили из одного основного отношения «Ь следует за а». Уже сам выбор слова «следует» указывает на связь этого основного отношения с понятием порядка, введённым в § 5 для любых множеств. Правда, аксиомы II и III показывают, что отношение «следует» для чисел отличается от одноимённого отношения порядка. Оно связывает каждый элемент лишь с двумя «соседними», так как по аксиоме II за каждым числом следует только одно, а по аксиоме III каждое число следует не более чем за одним числом. Но можно определить отношение порядка для любых натуральных чисел, совпадающее с уже заданным отношением «следует» между а и а'. Для этого нового отношения мы будем пользоваться словом «больше».

Определение. Если для данных чисел а и b существует число k такое, что a = bA-k, то говорят, что а больше Ь, b меньше а и пишут: a>b, Ь<а. Если а>b или а = Ь, то пишут: а^Ь. Если а<b или а — Ь, то пишут: а^Ь.

Теорема 1. а) Для любых чисел a, b имеет место одно и только одно из трёх соотношений: a = b, a>b, Ь>а. 6) Из a>b, Ь>с следует а>с. Иными словами, множество N натуральных чисел с только что определённым отношением «больше» является упорядоченным множеством в смысле определения 1 § 5

(то, что в § 5 основное отношение обозначалось знаком <, значения не имеет).

Доказательство. Утверждение а) является лишь перефразировкой теоремы 5 из § 12. Утверждение б) доказывается так: если a>b, Ь>су то a = b+k, b = c+l, откуда

Отношение «больше» совпадает в частном случае соседних чисел с отношением «следует», так как а' = а+1, т. е. а'>а.

Что касается связи порядка с операциями сложения и умножения, то для натуральных чисел сохраняют силу многие из теорем, доказанных в § 10 для упорядоченных колец. Так как, однако, натуральные числа, как мы увидим, не образуют кольца, то эти теоремы (если только они опирались на свойства кольца) приходится доказывать заново.

Теорема 2. (Законы монотонности сложения и умножения.) Из а) а^Ь следует соответственно

Доказательство. 1) Пусть а>b. Тогда a = b+k,

а + с = (Ь+к) + с = с + (Ь + к) = (с + Ь) + к = (Ь + с)+к,

откуда а+с>b+с, а также ac — (b+k)c = bc+kc>bc.

2) Пусть а = Ь. Тогда по однозначности сложения и умножения также а+с = Ь+с и ас = Ьс.

3) Пусть а<b, тогда Ь>а, и по доказанному в 1) b+c>a+c, bc>ac, откуда а+c<b+с, ас<bс.

Справедливы утверждения, обратные теореме 2.

Теорема 3. Из а+сЩ^Ь+с или из асЩ.Ьс следует соответственно а^р.

Доказательство. Так как посылки и следствия в теореме 2 исчерпывают все возможности и взаимно исключают друг друга, то обратные теоремы также верны (см. доказательство теоремы 3 из § 10).

Из теоремы 2 уже дословным повторением доказательства теоремы 4 из § 10 получаются известные правила оперирования с неравенствами;

Теорема 4. Из аЩ^Ь, сЩ.а следует соответственно

Теорема 5. Единица — наименьшее из натуральных чисел, т. е. а ^ 1 для любого а.

Доказательство. Если 1, то по теореме 2 (§ 11)

a = ô' = ô-j-l>l.

Теорема 6. Во множестве натуральных чисел выполнена аксиома Архимеда (§ 10, определение 3), т. е. для любых а и b существует с, для которого Ьс>а.

Доказательство. Достаточно взять с>а, так как из£^1 ввиду теорем 2 и 4 следует Ьс>а- 1 = а.

Теорема 7. При установленном порядке натуральных чисел числа а и а+1 являются соседними (§ 5), т. е. не существует числа b такого, что а+\>b>а и, значит, из Ь>а следует b^a+l и из Ь<а+\ следует Ь^а.

Доказательство. Если Ь>а, то b = a+k. По теореме 5 k^l. По теореме 2 a+ k^a-j- I, т. е. Ь^а+\. По теореме 1 этим исключается соотношение a+l>b. Теорема доказана.

Очень часто применяется следующая:

Теорема 8. Любое непустое множество А натуральных чисел содержит наименьшее число, т. е. меньшее всех других чисел данного множества.

Доказательство. Пусть M — множество тех чисел а, которые равны или меньше, чем все числа множества А. По теореме 5 1 принадлежит М. Не все числа принадлежат М, так как если b принадлежит множеству А, то число а = Ь+ \ >b и не принадлежит М. Поэтому множество M должно содержать такое число а, для которого число a -j- 1 не принадлежит M (иначе по аксиоме IV M содержало бы все числа). Так как а принадлежит М, то для любого b из А должно быть а^Ь. Число а принадлежит А, так как иначе для любого b из А будет а<b и по теореме 7 a +1 ^ Ь, т. е. а+1 принадлежит М, что противоречит выбору числа а.

На этой теореме основана вторая форма индуктивного доказательства.

Теорема 9. (Сравнить с теоремой 1 § 11.) Если некоторая теорема Т доказана для числа 1 и в предположении, что она верна для всех чисел, меньших числа п, где п> 1, доказана для п, то она верна для любого п.

Доказательство. Если теорема Т верна не для всех чисел, то множество M чисел, для которых она неверна, непусто. По теореме 8 множество M содержит наименьшее число п. Раз п принадлежит М, то для п теорема Т неверна и #>1. Но п — наименьшее число М, стало быть теорема Т верна для всех чисел, меньших п, и должна быть верна для п, что невозможно.

После введения порядка для натуральных чисел первая форма индуктивного доказательства, т. е. теорема 1 из § 11, допускает следующие видоизменения:

Теорема 10. Если некоторая теорема Т доказана для какого-либо натурального числа k и если в предположении, что она верна для числа n^k, она доказана для числа п+\, то эта теорема Т верна для любого натурального числа n^k.

Доказательство. Предположим, что теорема Т верна не для всех чисел n^k. Тогда множество А тех чисел n^k, для которых теорема Т неверна, непусто и по теореме 8 содержит наименьшее число l^k, и для / теорема Г неверна. Поэтому l>k. По теореме 5 1ф\ и потому имеет предшествующее число п (§ 11, теорема 2), т. е. число п, для которого п' = п+1 =/, причём n^k, ибо если n<k, то по теореме 7 l = n+l^k.

Из 1 = п+1 следует п<1. Поэтому п не принадлежит множеству А, т. е. для п теорема Т верна. Но тогда она верна и для числа п+1=1. Полученное противоречие доказывает нашу теорему.

Аналогичное видоизменение допускает и вторая форма индуктивного доказательства (т. е. теорема 9), а именно:

Теорема 11. Если некоторая теорема Т, касающаяся натурального числа, доказана для числа k и в предположении, что она верна для всех чисел а с условием k^a<n, доказана для числа п, то эта теорема Т верна для любого числа n^k.

Доказательство аналогично доказательству теоремы 10 и предоставляется читателю.

Справедливо ещё следующее положение, дополняющее теорему 8:

Теорема 12. Любое непустое и ограниченное сверху множество А натуральных чисел содержит наибольшее число (при этом под множеством, ограниченным сверху, понимается множество, все числа которого меньше одного и того же натурального числа k).

Доказательство. Пусть В есть множество натуральных чисел, не меньших чем числа множества Л. Так как А ограничено сверху, то В непусто. По теореме 8 В содержит наименьшее число Ь. По определению В имеем Ь^а для любого а из А. Покажем, что число b принадлежит А и, следовательно, является наибольшим числом в Л. Если b не принадлежит А, то Ь>а для любого а из А. По теореме 7 тогда b—l^a для любого а из А. Таким образом, число b— 1 принадлежит В и b— 1 <£, что противоречит выбору числа Ь.

§ 15. Индуктивные определения. Сумма и произведение нескольких чисел

С индуктивными определениями мы уже имели дело при определении сложения и умножения. В обоих случаях при выборе определённого значения а дело шло о построении некоторой функции f(b) числа b (значения которой — натуральные числа),

обладающей двумя свойствами: 1) известно значение функции для Ъ=\ [в случае сложения f(l) — a', в случае умножения /(1) = а]; 2) дано рекуррентное соотношение, однозначно определяющее значение функции для любого числа, отличного от 1, через её значение для предыдущего числа (в случае сложения f(b)' = [/(&)]'» в случае умножения f(b')=f(b)+a).

По поводу определения сложения мы уже указывали (§ 12), что такое определение ещё не доказывает (простым применением аксиомы индукции IV) существования и единственности функции f(b) с указанными свойствами 1) и 2). Однако существование и единственность были доказаны разными путями как для сложения, так и для умножения. После определения порядка натуральных чисел можно доказать законность индуктивных определений и притом более общего типа, чем в случае сложения и умножения. А именно:

Определение 1. Индуктивным определением (или построением) функции f(a) на множестве натуральных чисел называется её определение по следующим двум свойствам:

1) задано значение функции f(l) = x1 для числа 1;

2) значение функции f(a) для натурального числа а>1 однозначно выражено через её значения f(b) для натуральных чисел Ь<а при помощи данной системы S рекуррентных соотношений.

Отметим, что значения определяемой индуктивно функции /(а) вовсе не обязательно должны быть натуральными числами. Они могут быть элементами некоторого кольца или вообще некоторого множества А, причём между его элементами определены отношения, при которых имеют смысл рекуррентные соотношения системы

Что индуктивное определение действительно определяет (и притом однозначно) функцию /(а), показывает следующая:

Теорема 1. (Теорема о законности индуктивного определения.) При данной системе S рекуррентных соотношений существует одна и только одна функция f(a), заданная на множестве всех натуральных чисел и обладающая свойствами 1) и 2), указанными в определении 1.

Докажем сначала такую лемму:

Лемма. Пусть даны: а) натуральное число п, б) элемент xt некоторого множества Л, в) при /г>1 система S рекуррентных соотношений, которая для любого натурального числа а (где 1 < а ^ п) и любых элементов хь (где Ь<а) множества А однозначно определяет элемент ха того же множества А1).

Тогда существует одна и только одна функция fn(a), заданная на отрезке2) | 1, п\, значения которой принадлежат множе-

1) При этом для а > п рекуррентные соотношения могут вообще не задаваться.

2) Отрезком натурального ряда (согласно определению 1 из § 4) называется множество 11, л I натуральных чисел а^.п.

ству А и которая обладает свойствами: 1) f(l)=xlf 2п) при п>1 и 1<а^п значение /(а) связано со значениями f(b) (где Ь<а) рекуррентными соотношениями данной системы S.

Доказательство леммы. Пусть M — множество тех п, для которых лемма верна.

А) Для п = 1 условие в) и свойство 2Л) отпадают. Очевидно, f(l)=xt будет тогда единственной функцией, заданной на отрезке 11, 1 I и обладающей свойством 1); 1 принадлежит М.

Б) Если п принадлежит М, то для п лемма верна. Пусть условия а), б), в) леммы выполнены для числа Тогда эти условия выполняются также и для числа п [при той же системе 5 рекуррентных соотношений в пункте в) и том же xt в б)]. Стало быть, существует одна и только одна функция /п(а), заданная на отрезке | 1, п \ и обладающая свойствами 1) и 2Л). Мы строим тогда функцию /Л+, (а) следующим образом: для любого а^п полагаем: fn+î(a)=fn(a). Значение же /Л+1 (/z-J-1) определяем по значениям fn+i(a) для OL<n+l из рекуррентных соотношений данной системы 5, что возможно, так как условие в) выполнено для числа п+1. Тогда функция fn+i(a) задана на отрезке | 1, л —f— 1J и обладает свойствами 1) и 2л+1). Если g (а) — любая функция, заданная на отрезке | 1, /г —|— 1 | и обладающая свойствами 1) и 2л+1), то эта функция g (а) задана также на отрезке | 1, п\ и обладает свойствами 1) и 2Л). В силу единственности такой функции (для п лемма верна) должно быть: g(a)=fn(a) для а^п. Но g (а) обладает свойством 2л+1). Следовательно, значение g(n+l) однозначно определяется значениями g(a) для а^п+1. Но для а<п+1, т. е. а^п,

g(a)=fn(a)=fn+1 (а).

Поэтому также g(n +1) = fn+i (п ~Ь Итак, на всём отрезке I 1, #-J-l| функция g (а) совпадает с fn+1(a), чем доказана единственность функции fn+1 (а). Лемма доказана для числа п+1; п+1 принадлежит множеству Ж. По аксиоме IV M содержит все натуральные числа, т. е. лемма верна для любого натурального числа п.

Доказательство теоремы 1. Условия 1 ) в определении 1 и лемме совпадают. Из условия 2) определения 1 следует, что условие в) леммы выполнено при любом #>1. Согласно лемме для любого п существует одна и только одна функция /л(а), заданная на отрезке | 1, п\ и обладающая свойствами 1) и 2Л). Если т<п, то функция fn(a) задана на отрезке | 1, т \ как части отрезка |1, п\ и обладает свойствами 1) и 2Л), а стало быть и свойством 2т). По единственности такой функции /л(а)=/ш(а) для а^т. Итак, все функции fn(a), определённые для числа а (т. е. при п^а), имеют для этого а одно и то же значение. Значение всех /п(а) при п^а и примем за значение f(a) искомой функции для числа а; /(1) совпадает с /п(1), а так как/п(а) обладает свойством 1), то/(а) обладает свойством 1). Если а>1 и #^а, то

f(a)=fn(a) и f(a) также удовлетворяет рекуррентным соотношениям, т. е. функция f(a) обладает свойством 2). Если g (а)— любая функция, заданная на множестве натуральных чисел и обладающая свойствами 1) и 2), то она задана на любом отрезке 11, п\ и обладает там теми же свойствами. По единственности такой функции g(a)=fn(a)=f(a) при п^а. Таким образом, g(a)=f(a) для любого а. Этим единственность функции /(а), обладающей требуемыми свойствами, доказана.

На доказанной выше лемме основано введение понятий суммы и произведения нескольких натуральных чисел.

Определение 2. Пусть даны натуральные числа1) аи а2, ..., ап, где п — также натуральное число2).

Суммой этих чисел называется число, которое обозначается через

и определяется условиями

(1)

(2)

для любого числа k<n.

Произведением этих чисел называется число, которое обозначается через

и определяется условиями

(3) (4)

для любого числа k<n.

1) Это определение и все результаты данного параграфа дословно переносятся на любые кольца и вообще на любые множества, в которых определены операции сложения и умножения, подчинённые законам коммутативности и ассоциативности.

2) Строго говоря, на отрезке | 1, п\ задана функция f(b)~ab.

Условия (1) и (3) определяют значения данных функций числа k для k — l9 а условия (2) и (4) играют роль рекуррентных соотношений в пункте в) леммы. По лемме существуют единственные функции ^ at и J J ait заданные на отрезке 11, п\ и обладающие соответственно свойствами (1), (2) и (3), (4). Поэтому определение 2 имеет точный смысл.

Замечание. До сих пор при построении арифметики натуральных чисел (начиная с § 11) мы нигде не пользовались теоремами первых двух глав; с другой стороны, в этих двух главах использовались лишь те понятия и факты из теории натуральных чисел (а именно, понятие отрезка натурального ряда, индуктивное доказательство и индуктивное определение), которые нами уже изложены. Поэтому, не делая порочного круга, мы можем в дальнейшем построении теории натуральных чисел опираться на факты из первых двух глав. В частности, верны основные свойства суммы и произведения [см. § 6, (1), (2)]:

(5) (6)

При совпадающих слагаемых или сомножителях сумма и произведение по определению дают кратное и соответственно степень натурального числа а. Для них верны обычные правила оперирования [см. § 6, (3) —(8)].

Итак, определением кратного и степени числа служат равенства

(7) (8)

Но обозначение ап в (7) имело уже раньше другой смысл. Так обозначалось произведение натуральных чисел а и п. Нужно доказать, что оба истолкования записи ап совпадают. Когда это будет доказано, то, придав натуральному числу п количественное значение (как мощности множества), мы придём к школьному определению произведения ап как суммы п слагаемых, равных а.

Аналогично можно придти к определению степени ап как произведения п сомножителей, равных а. Итак, докажем теорему:

Теорема 2. Для любых натуральных чисел а и п справедливо равенство

(1)

где ап означает произведение чисел а и п (в смысле определения из § 13). В частности,

т. е. любое натуральное число п равно сумме п единиц.

Доказательство. Для п=\ согласно свойству 1) определения из § 13 и свойству (1) суммы имеем:

Если ап=^а, то по свойству 2) определения § 13 и свойству (2) суммы имеем:

По аксиоме IV теорема доказана.

§ 16. Вычитание и деление

Основные вопросы арифметики натуральных чисел, обоснование которых содержит трудности, связанные с аксиоматическим построением, нами уже изложены. Остановимся ещё на свойствах обратных операций.

Определение 1. Вычитанием натуральных чисел называется действие, обратное сложению, т. е. соответствие, которое с числами а и b сопоставляет число а — b (называемое разностью а и Ь) такое, что

(a — b) + b = a. (1)

Отсюда в связи с определением и теоремой 3 из § 14 находим: Теорема 1. Разность а — b существует тогда и только тогда, когда а>b. Если разность существует, то она единственна.

Из (1), далее, имеем:

а — b <[ а. (2)

Здесь и ниже предполагается (если нет других указаний), что все встречающиеся разности существуют. Справедливо равенство

(а — Ь)с = ас — be, (3)

ибо

(а— b)c+bc = ac.

Далее из (1) и (3) следует

а) а — Ь = с — d (4)

тогда и только тогда, когда a+d = b+ с;

б) (а — 6) +(с — d) = (a + c) — (b + d);

в) (a — b) — (c — d) = (a + d) — (b + c);

г) (а — Ь) (с — d) = (ас + öd) — (ad + öc).

Теорема 2. Яз а) ô ^ с следует соответственно б) a — bl^ta — с, и обратно.

Доказательство. Докажем, что из б) следует а). Прибавив к обеим частям б) Ь+с, получим (§ 14, теорема 2) : a с ^ a -j- ô, откуда (§ 14, теорема 3) со, Ь^с. Таким образом из а) следует б).

Определение 2. Делением называется действие, обратное умножению, т. е. соответственно сопоставляющее с числами а и b число ~ = а:Ь (называемое частным а и Ь) такое, что

-b'b = a. (5)

Из 1 ^ b следует:

а ^ ab у (6)

причём знак = имеет место лишь для Ь=\. Отсюда и из (5)

(7)

со знаком = лишь при 6=1.

Как и в случае вычитания, здесь и ниже предполагается, что все написанные частные существуют.

Теорема 3. Из а) Ь^с следует соответственно б)т^-, и обратно. с

Доказательство аналогично данному для теоремы 2.

Для частных справедливы правила сравнения и оперирования.

а)

тогда и только тогда, когда

б)

в)

г)

Доказываются они на основе теоремы 3 из § 14 дословно как соответствующие свойства частного в любом поле (§ 7, теорема 8). При этом в пунктах б), в) и г) из существования частных в левой части вытекает их существование в правой части.

Далее, из (6) и теоремы 3 § 14 находим:

Теорема 4. Для того чтобы существовало частное —, необходимо (но, как сейчас увидим, недостаточно), чтобы было а^Ь. Если частное существует, то оно единственно.

Что из а^б ещё не следует существования частного у, показывают простые примеры. Так, определяя числа

2 = 1', 3 = 2', 4 = 3',

убеждаемся, что не существует а, для которого 2а = 3. Из (6) должно быть а<3, т. е. или а=1, или а = 2, но 2 • 1 = 2 и 2-2 = 4.

Это обстоятельство обусловливает коренное различие свойств вычитания и деления и приводит к ряду свойств чисел, составляющих так называемую теорию делимости1).

§ 17. Замечания о системе аксиом натуральных чисел

Отправляясь от системы аксиом I—IV (§ 11), мы построили арифметику натуральных чисел. Вернёмся теперь снова к вопросам аксиоматического обоснования этой теории.

При оценке системы аксиом всякой аксиоматической теории приходится решать три основных вопроса (правда, неодинаковой трудности и значения) — это вопросы о непротиворечивости, полноте и независимости аксиом.

1) О свойствах делимости см. статью А. Я. Хинчина, помещённую в этой книге.

Непротиворечивость. Для приемлемости любой системы аксиом нужно, прежде всего, убедиться, что построенная на её основе теория не содержит противоречий, т. е. что с помощью этих аксиом нельзя доказать двух взаимно исключающих друг друга предложений. Как же можно доказать непротиворечивость аксиом данной системы в этом смысле? Разберём этот вопрос на примере плоской геометрии. При её аксиоматике точки и прямые, а также и основные отношения между ними («точка лежит на прямой», «одна точка прямой лежит между двумя другими» и т. д.) понимаются формально (абстрактно). Эти понятия связаны данной системой аксиом. С другой стороны, имеется другая аксиоматическая теория — поле действительных чисел. В аналитической геометрии устанавливается, что точкам плоскости соответствуют пары чисел (координаты точки), а прямым — уравнения (уравнения прямых). Отношениям между точками и прямыми соответствуют известные числовые отношения этих пар и уравнений, причём аксиомам геометрии соответствуют предложения (теоремы), которые можно доказать на основе аксиом и свойств чисел. Таким образом, одна аксиоматическая теория (геометрия плоскости) включается как часть в другую (теорию действительного числа). Если бы геометрия содержала противоречие в указанном выше смысле, то и для действительных чисел можно было бы найти противоречие (доказать на основе аксиом чисел два взаимно исключающих предложения). Если аксиоматика чисел непротиворечива, то то же верно и для аксиоматики геометрии. В этом смысле непротиворечивость аксиом геометрии доказана.

Представление одной аксиоматической теории при помощи понятий другой теории, разобранное нами на примере плоской геометрии и арифметики, применяется в математике весьма часто и не только для сведения непротиворечивости одной теории к непротиворечивости другой. Поэтому мы дадим для него следующее определение:

Определение 1. Любое множество, для элементов которого определены основные отношения и выполнены аксиомы данной аксиоматической теории, называется интерпретацией этой теории.

Интерпретация данной аксиоматической теории не разрешает вопроса о её непротиворечивости, а лишь сводит его к вопросу о непротиворечивости той теории, в которой осуществлена данная интерпретация.

Непротиворечивость теории натуральных чисел доказана не формально-логическими средствами, а многовековой практикой человечества, показавшей отсутствие противоречий в этой теории и её соответствие с действительными соотношениями реального мира.

Полнота. Далее, возникает вопрос, насколько хорошо описывает система аксиом данную теорию? Можно ли с помощью данной системы аксиом доказать или опровергнуть любое предположение,

высказанное в терминах данной теории? Австрийский математик Гедель в 1931 г. доказал, что для ряда теорий, в том числе и для аксиоматической теории натуральных чисел, полнота в этом смысле отсутствует, т. е. существуют неразрешимые данными средствами предложения. Мы будем считать систему полной в ином смысле, именно, если она вполне определяет, т. е. до изоморфизма однозначно описывает, данное множество. Итак,

Определение 2. Система аксиом называется полной, если две любые её интерпретации изоморфны (§ 9, определение 1).

Примером неполной системы аксиом может служить система свойств I—VI, определяющая понятие кольца (§ 7). Ведь существуют неизоморфные кольца (хотя бы конечные и бесконечные). Более того, основной интерес теории колец и лежит в описании всех типов колец.

Докажем, что система аксиом I — IV натуральных чисел полна., Пусть Nt и N2 — две интерпретации этой системы. Числа в этих интерпретациях будем отличать индексами 1 и 2. Строим по индукции (§ 15, определение 1) функцию /(хх), заданную на всём множестве Afj, значение которой принадлежит и такую, что 1) /00= lt. 2) /«)=[/(a,)]'.

По теореме 1 из § 15 такая функция существует и только одна. Покажем, что соответствие f(al) = a2 является изоморфизмом Nt и Af2. Если at ф 1„ то ах=Ь\ и

Итак, 12 имеет единственный прообраз в А^, именно lt. Пусть а2 имеет единственный прообраз ах. Тогда

f (<)=[/(at)]'=at.

Стало быть, а^ имеет хотя бы один прообраз. Если Ьх—любой прообраз для а2, то по 1) Ъх ф llf т. е. Ьх = с[, и

a2=f(b1)=f(c[)=[f(cl))'.

По аксиоме III следует: а2=/(с1), а так как ах— единственный прообраз а2, то с1 = а1 и по аксиоме II Ь1 = с[ = а[. Следовательно, ах — единственный прообраз для а'2. По аксиоме индукции IV любой элемент в N% имеет один и только один прообраз в А^. Соответствие f(al) = a2 взаимно однозначно. Из 2) следует, что отображение

/(aj) = a2, Nt на N2

сохраняет основное отношение «следует». Остаётся доказать это для обратного отображения /~1(а2) = а1. Но из f(a[)= [f(a1)]' = a'2 следует f~l(a2) = a[, т. е. и обратное отображение сохраняет отношение «следует».

Таким образом, система аксиом I — IV натуральных чисел полна. О значении этого факта уже говорилось в § 11. Только благодаря полноте системы аксиом I — IV мы можем с равным успехом пользоваться любой интерпретацией натуральных чисел (применяются ли римские или арабские цифры, десятичная или двоичная система счисления).

Независимость. Более простым и имеющим скорее практическое, чем принципиальное значение, является вопрос о независимости аксиом. При выборе той или иной системы аксиом для данной теории желательно достичь минимального числа положений, принимаемых за аксиомы. Если, например, одна из аксиом в действительности является теоремой, т. е. её можно доказать с помощью остальных аксиом, то нет надобности сохранять её в списке аксиом.

Определение 3. Система аксиом называется независимой, если ни одна из аксиом не является следствием остальных.

Доказательство независимости системы аксиом проводится так. Для каждой аксиомы строится интерпретация, где выполнены все остальные аксиомы, тогда как данная аксиома не выполняется. Если бы эта аксиома была следствием остальных, то такая интерпретация была бы, очевидно, невозможна.

Докажем независимость системы аксиом I — IV натурального ряда. Заметим, что доказательство независимости аксиомы I имеет ту особенность, что если аксиома I не выполнена, то аксиома IV становится бессодержательной, так как множеств М, содержащих единицу, вообще не существует, ибо не существует числа единицы. Поэтому для доказательства независимости аксиомы I от остальных аксиом мы несколько видоизменим формулировку аксиомы IV, заменив её следующей:

IV. Любое непустое множество M натуральных чисел, обладающее свойствами: А) если существует число 1, не следующее ни за каким другим числом, то оно принадлежит М; Б) если число а принадлежит М, то и следующее число а! принадлежит M — содержит все натуральные числа.

Очевидно, что система аксиом I — III, IV эквивалентна системе I — III, IV, т. е. из первой системы следуют аксиомы второй, и обратно (достаточно убедиться, что из I — III, IV следует IV и из 1 — III, IV следует IV). Если одна из эквивалентных систем непротиворечива или полна, то то же верно и для другой. Итак, система аксиом I — III, IV также непротиворечива и полна. Докажем её независимость.

1. Независимость аксиомы I. Пусть N—множество трёх элементов а, Ъ, с с таким определением отношения «следует»1)

а=Ъ, Ь' = с, с' = а.

1) Можно взять любое конечное множество с числом элементов ^2, расположенных в круговом порядке.

Так как всякий элемент следует за другим, то I не выполнено. II, III, IV выполнены. Если Ж^Ои, например, ЫМ> то по 2) также Ь' = с$М и c' = aç.M, M=N.

2. Независимость аксиомы II. Пусть N—множество двух элементов а и Ь> причём а' = Ь. Тогда а будет единицей. Аксиома II не выполнена, так как b не имеет следующего элемента.

Прочие аксиомы выполнены.

3. Независимость аксиомы III. Пусть N—множество четырёх элементов а, Ь> с, d, причём

а' = Ь, Ь' = с, c' = d, d' = b.

Аксиома III не выполнена, так как b следует за а и d, из a' = d' не следует a = d. Остальные аксиомы выполнены, причём а играет роль единицы.

4. Независимость аксиомы IV (или также IV). Пусть N—множество всех натуральных чисел 1, 2, 3, п, ... и всех чисел вида п -}- ~ с любым целым п, причём для натуральных чисел

отношение «следует» имеет прежний смысл и

Аксиома IV не выполнена. В самом деле, роль единицы играет само число 1 (только оно не следует ни за каким другим). Множество M всех натуральных чисел обладает свойствами А') и Б) [или А) и Б) при аксиоме IV], но не содержит всех элементов множества Af.

Таким образом, система аксиом I —III, IV натуральных чисел независима.

ГЛАВА IV

КОЛЬЦО ЦЕЛЫХ ЧИСЕЛ

§ 18. Принцип расширения в арифметике и алгебре

Понятие числа прошло длинный путь исторического развития. Натуральные числа как средство счёта известны человеку на самых ранних ступенях развития. Древнегреческие математики пользовались как натуральными, так и дробными положительными числами, но не знали отрицательных чисел. Употребление положительных и отрицательных чисел (толкуемых как «имущество» и «долг») впервые появилось у индусов (Арьябхатта, р. 476 г.; Брамагупта, 588?— 660 гг.; Бхаскара р. 1114 г.).

Современное обозначение положительных и отрицательных чисел знаками +и — введено в конце XIV в. немецким математиком Видманном. Однако ещё в XVI в. многие математики не признавали отрицательных чисел. Так, французский математик Виет (1540—1603) при выводе соотношений между корнями и коэффициентами уравнения ограничивался случаем положительных корней. Полное признание отрицательные числа получили лишь в XVII в.

Таким образом, дробные числа появились в математике намного раньше отрицательных. Возникновение дробных чисел связано с задачами измерения.

Отступая от исторического пути развития по соображениям большей логической простоты, мы введём сначала все целые числа, а затем уже числа дробные.

Натуральные числа служат фундаментом, на котором чисто конструктивным путём можно построить все другие числовые множества. Мы последовательно определим целые, рациональные, действительные и комплексные числа. Каждое из перечисленных числовых множеств содержит предыдущее. При этом мы стремимся построить расширение, обладающее известными свойствами по отношению к расширяемому множеству. Если множество А расширяется до множества В, то эти свойства сводятся к следующему:

1) А есть подмножество В.

2) Интересующие нас операции или вообще отношения элементов множества А определены также и для элементов множества В,

причём их смысл для элементов А, рассматриваемых уже как элементы В, должен совпадать с тем, какой они имели в Л до расширения.

3) В В должна быть выполнима операция, которая в А была невыполнима или не всегда выполнима.

Это требование служит основной целью, для достижения которой строится расширение. Разберём его на примерах. Для натуральных чисел не всегда выполнимо вычитание. В области целых чисел оно всегда выполнимо. Для целых чисел не всегда выполнимо деление. Для рациональных чисел оно выполнимо всегда (кроме деления на 0, что вообще невозможно). Для рациональных чисел не всегда выполнима операция перехода к пределу. Для действительных чисел она всегда выполнима. Для действительных чисел не всегда выполнима операция извлечения корня. Для комплексных чисел она уже всегда выполнима.

Наконец, требования логической завершённости диктуют ещё одно условие:

4) Расширение В должно быть минимальным из всех расширений данного Л, обладающих свойствами 1) — 3), и определяться данным А однозначно с точностью до изоморфизма.

Так, мы расширяем множество натуральных чисел до целых, а не сразу до действительных или комплексных.

Целые числа подразделяются на положительные (или натуральные), отрицательные и число 0. Идея отрицательного числа (всё равно целого, рационального или вообще действительного) связана с измерением величины, имеющей два противоположных смысла. Таковы, например, длины отрезков, откладываемых на прямой направо или налево от данной точки, показания термометра вверх и вниз от точки 0 и т. д. Тогда уславливаются величины одного смысла или направления измерять при помощи обычных чисел, называемых теперь положительными, а величины другого, противоположного смысла теми же числами, но снабжёнными особым знаком «—» для отличия их от чисел, служащих для выражения величин первого смысла. Затем формально вводится число 0, отделяющее положительные числа от отрицательных. Не останавливаясь на деталях такого введения «относительных» чисел, заметим, что это построение наиболее естественно, так как связано с их возникновением и может быть проведено строго формально. Так, для построения целых «относительных» чисел можно формально натуральным числам a, ... поставить во взаимно однозначное соответствие новые объекты a, b, ... и ввести ещё один объект 0. Затем определить сумму, произведение и отношение «больше» по известным школьным правилам и доказать (путём проверки всех случаев) справедливость всех законов действий и порядка.

Руководствуясь, однако, единством идеи, мы примем другое построение. Дело в том, что, желая при расширении сделать вы-

полнимой в В некоторую операцию, не всегда выполнимую в Л, мы можем ввести формально в В те же правила оперирования, которые для данной операции имели место в Л в тех случаях, когда она была там выполнима. Это формальное перенесение старых правил на новое множество и приводит к конструкции желаемого расширения. Так, разность а— b для натуральных чисел вполне определяется парой чисел а, Ь. Такую пару мы и примем за исходный пункт определения целого числа, сохраняя правила оперирования, справедливые для разностей а — b натуральных чисел. Та же идея лежит в основе конструкции рациональных и комплексных чисел, а также алгебраических дробей. Эта конструктивная идея носит название теории пар. Заметим, что во всех указанных случаях конструкция приводит не сразу к желаемому расширению В для области Л, а лишь к области В', изоморфной области В и содержащей подмножество Л', изоморфное Л. Искомое расширение В получится из В' заменой в нём Л' на Л. Но до проведения такого построения целых чисел необходимо сделать некоторые замечания, связанные с основными свойствами равенства.

§ 19. Эквивалентность и разбиение на классы

Равенство а = Ь элементов некоторого множества мы всегда понимаем как отношение между элементами, заключающееся в их совпадении или тождестве1).

Отсюда по чисто логическим основаниям вытекают следующие основные свойства равенства: а) а = а (рефлексивность или закон тождества); б) если а = Ь, то Ъ = а (симметрия); в) если а = Ь и Ь = Су то а = с (транзитивность).

Но теми же свойствами обладают, как мы видели, и другие отношения, именно: равномощность А<~->В (§ 3), подобие А^В (§ 5), изоморфизм Aç^B (§ 9).

Для всех таких отношений мы докажем следующую общую теорему.

Теорема. Если для элементов множества M определено отношение эквивалентности а^Ь (словами', а эквивалентно Ь), обладающее следующими свойствами: 1) а^а, 2) если а^Ь, то br^t а, 3) если а^Ъ и b ~ с, то а^ с, то этим однозначно определено разбиение множества M на попарно непересекающиеся подмножества, обладающие тем свойством, что любые элементы одного и того же подмножества эквивалентны и любые элементы различных подмножеств неэквивалентны (разбиение на классы эквивалентных элементов).

1) Многие авторы считают равенство некоторым понятием, подлежащим определению или аксиоматическому описанию.

Обратно, для любого разбиения множества M на непересекающиеся подмножества можно так определить отношения эквивалентности, что данное разбиение M будет разбиением на классы эквивалентных элементов.

Доказательство, а) Пусть дано отношение эквивалентности. Для каждого ai M обозначим через Ма множество всех элементов х, для которых хг^а. Из 1) следует, что а(.МаУ т. е. любой элемент множества M принадлежит некоторому из этих подмножеств. Пусть Ь£Маи ciMa. Тогда Ь^а, с^а; по 2) также а^с и по 3) b ~ с. Следовательно, два элемента из Ма эквивалентны. Если аг^Ьу то Ма = Мь. В самом деле, если с(-Ма, то с^ау а^Ъ и по 3) сr^b, т. е. с6Мъ. Если же ciMby то сг>b и а^Ь\ по 2) ô^a и по 3) с^а, т. е. с£Ма. Отсюда также имеем: если ЫМаУ то Мь = Ма, т. е. все элементы множества Ма равноправны при определении этого множества. Если множества Ма и Мъ имеют общий элемент с, то Мс — Ма, МС = МЬ, откуда Ма = Мъ. Таким образом, два различных множества не могут иметь общих или эквивалентных элементов. Элементы различных множеств неэквивалентны.

б) Пусть дано разбиение множества M на непересекающиеся множества. Определим отношение эквивалентности элементов M так: аг>bу если а и b принадлежат одному и тому же множеству данного разбиения. Очевидно, что тогда разбиение на классы эквивалентных элементов и будет данным разбиением.

Доказанная теорема найдёт в будущем неоднократное применение, позволяя опускать приведённое рассуждение в каждом конкретном случае.

§ 20. Определение кольца целых чисел

Для натуральных чисел не всегда выполнима операция, обратная сложению, т. е. вычитание (§ 16, теорема 1). Поставим задачу расширить множество N натуральных чисел до такого множества С, где были бы заданы операции сложения и умножения, обладающие теми же свойствами, какими они обладают для натуральных чисел, причём вычитание было бы всегда возможно. Это значит, что С должно быть кольцом (§ 7, определение 1). Будем искать минимальное из таких расширений в смысле следующего определения:

Определение 1. Кольцом целых чисел называется минимальное кольцо С, содержащее множество N всех натуральных чисел, т. е. множество, обладающее свойствами: 1) С содержит N; 2) С есть кольцо; 3) сложение и умножение натуральных чисел совпадают с одноимёнными операциями над этими числами в кольце С; 4) кольцо С не содержит отличного от него подкольца, содержащего множество N. Элементы кольца С называются целыми числами,

Из этого определения ещё неясно, существует ли такое кольцо С и будет ли оно единственным. Отложив пока вопрос о существовании кольца целых чисел, покажем, что если оно существует, то будет единственным с точностью до изоморфизма.

Теорема 1. Кольцо С, содержащее множество N натуральных чисел1), тогда и только тогда будет кольцом целых чисел (т. е. минимальным), когда каждый его элемент равен разности натуральных чисел.

Доказательство. А) Если кольцо С содержит N и каждый элемент С равен разности натуральных чисел, то С минимально, так как любое подкольцо, содержащее N, содержит и все разности натуральных чисел (§ 7, теорема 4) и, следовательно, совпадает с С.

Б) Пусть, обратно, кольцо С минимально. Во всяком кольце разность элементов обладает следующими свойствами (§ 7, теорема 3):

а) а — b = с — d . тогда и только тогда, когда a+d = b+c;

б) (a_é) + (c_d) = (a + c)-(ô + rf); > (1)

в) {a_b)-(c-d) = {a + d)-{b + c); \

г) (a — b)(c — d) = (ac + bd) — (ad + bc). >

Пусть R — множество всех элементов С, каждый из которых равен разности натуральных чисел. Из (1) следует, что сумма, разность и произведение двух элементов множества R снова принадлежат R, следовательно, R — подкольцо С. Любое натуральное число равно, конечно, разности натуральных чисел, например а = (а + Ь) —bf где b — также натуральное число. Так как операции в N и С совпадают, то R содержит N, и следовательно, R = C в силу минимальности С. Это значит, что любое целое число равно разности натуральных чисел.

Теорема 2. Все минимальные кольца, содержащие натуральные числа, изоморфны, т. е. кольцо целых чисел единственно с точностью до изоморфизма.

Пусть С1 и С2— два таких кольца. По предыдущей теореме любой элемент в Сх и С2 равен разности натуральных чисел. Строим такое отображение / кольца Сх на С2: если cldCl и сх = а — b в С1з где а и b — натуральные числа, то в С2 будет: а — Ь = с22).

1) Здесь и ниже, говоря, что кольцо содержит натуральные числа или что одно кольцо содержит другое, мы всегда будем подразумевать, что операции в подмножестве совпадают с соответствующими операциями в надмножестве.

2) Из с1 = а — b и с2 = а — Ь не следует сх = с2, так как вычитание в Ci и С2 может иметь разный смысл. Конечно, сх = с2 при а>Ь, так как тогда а — b существует в N и по совпадению операций ct и с2 равны одному и тому же натуральному числу а — Ь.

Тогда положим f(c1) = c2; с2 не зависит от выбора чисел а и Ь. В самом деле, если также сх = с — d, то а— Ь = с — d и по (1) а+ d = b + с, следовательно, и в С2 также а — Ь = с — d. Если схфаи то по (1) также /\сх) ф f\dx). Любой элемент сх£Сх равен разности натуральных чисел и то же верно для С2. Итак, /—взаимно однозначное отображение Сх на С2. Из б), г) следует, что

f(cx + dx)=f(cx)+f(dx) и f(cxdx)=f(cx)f{dx)

для любых с„ dx из Сх, т. е. / — изоморфизм колец Сх и С2 (§ 9, определение 2). Рассмотрим, например, первое из этих равенств. Если в Сх имеем: сх — а— b, dx = c— d, то в С2 будет:

/ (ci) = a — b, f (dx) = c — dy

откуда

/(c,)+/№)=(a-*) + (c-d) = (a + c)-(ô + d), но в Cx

ci + di = (a + c) — (b +

т. е. элементы q-J-û^êC! и /(ci)-)-/№) 6 C2 равны разности одних и тех же натуральных чисел a+c и b+d.

Это следует из определения / и, таким образом,

Аналогично доказывается и второе соотношение. Теорема доказана.

Замечание. Изоморфное отображение / обладает ещё тем свойством, что на множестве N оно является тождественным, т. е. при этом отображении Сх на С2 каждое натуральное число отображается само на себя. В самом деле, при сх = а — b в Сх и с2 = a — b в С2 элементы сх и с2 тогда и только тогда будут сами натуральными числами, когда а>b. При этом с2=/(сх) = а— Ь = сХщ

Теорема 3. Любое кольцо R, содержащее множество натуральных чисел N, содержит и кольцо целых чисел.

Доказательство. Пересечение всех подколец кольца R9 содержащих N, есть опять подкольцо (§ 8, теорема 6), содержащее N, и при этом минимальное, так как оно входит в любое подкольцо, содержащее N. Согласно определению 1 это подкольцо будет кольцом целых чисел.

Мы ещё пока не доказали существования кольца целых чисел, так как не построили ни одного примера (ни одной интерпретации) этого понятия. Перейдём теперь к построению такого примера.

Конструкция одного из изоморфных колец целых чисел подсказывается теоремой 1. Если С—кольцо целых чисел, то элементами С будут разности натуральных чисел. Можно было бы за элементы искомого кольца принять самые символы этих разностей а — Ь, но, во-первых, два таких символа, различных между собой, должны были бы считаться при некоторых условиях согласно (1)

равными (а — b = с — d, если a -J- d = b + с), что не согласуется с нашим условием понимать под равенством элементов любого множества их совпадение, а, во-вторых, мы желаем сохранить обозначение а — b за операцией вычитания в искомом кольце.

За исходный элемент конструкции примем пару a, b натуральных чисел, взятых в данном порядке. Пусть M — множество всех таких пар. Определим отношение эквивалентности пар так, чтобы разности чисел эквивалентных и только эквивалентных пар были равны одному и тому же элементу искомого кольца. Согласно (1) определяем эквивалентность так:

(а, Ь)~ (с, d), (2)

тогда и только тогда, когда a~\-d = b +с.

Далее, определяем сложение и умножение пар так, чтобы в искомом кольце этим операциям соответствовали сложение и умножение разностей чисел, образующих данные пары. Согласно б), г) мы поэтому определяем:

(а, Ь) + (с, d) = (a + c, b + d), (3)

(а, b) (с, d) = (ac+bd, ad+bc). (4)

Теорема 4. Сложение и умножение пар коммутативны, ассоциативны и связаны законом дистрибутивности.

Доказательство. Эти свойства вытекают из соответствующих свойств натуральных чисел и доказываются непосредственной проверкой. Докажем, например, ассоциативность умножения:

Получившиеся в итоге пары равны, т. е.

Отношения эквивалентности пар (2) обладают свойствами 1)—3) из теоремы § 19. Действительно,

1) (a, b)~(a, Ь), ибо a+b = b+a.

2) Если (а, Ь) ~ (с, d), то (с, d) ~ (а, Ь), ибо если a + d = = 6+c, то c+b = d+a

3) Если (а, b)r^(cy d) и (с, d)~(e, /), то (а, Ь)~(е, /), ибо, складывая равенства a+d = b + с, c+f=d+e, получим: d + с +/= b +c+d+e, откуда a +/= & -}~ e (§ 14, теорема 3).

Итак, отношение эквивалентности определяет разбиение множества M всех пар на классы эквивалентных пар. Будем обозначать эти классы малыми греческими буквами a, ß, у, 8, ...

Определение 2. Пусть С0 есть множество всех классов эквивалентных пар множества М. Суммой (произведением) двух классов а и ß назовём тот класс a -j- ß (соответственно aß), который содержит сумму (произведение) пары класса а и пары класса ß.

Как всегда при определении операций над классами через операции над представителями этих классов, надо показать, что результат операции не зависит от выбора представителей. Это следует, очевидно, из такой теоремы:

Теорема 5. Если

то

Доказательство. Докажем, что из (alf b1)^(a2t b%) для любой пары (с, d) следует: (аи Ьх)+(су d)~(a2, b2)+(c, d) и (a„ bt)(c, d)~(a,y £2)(с, d).

В самом деле, at -j- £2 = a2 -j- bl9 откуда

т. е.

Умножая обе части равенства at + Ьг = bx + ^2 на с и — после перестановки левой и правой его частей — на d, получим:

Складывая, находим:

откуда

Применяя дважды только что доказанные законы коммутативности сложения и умножения пар, найдём:

Итак, определение 2 действительно вводит во множестве С0 классов эквивалентных пар однозначно определённые операции сложения и умножения.

Теорема 6. Множество С0 с операциями, указанными в определении 2, есть кольцо.

Доказательство. Нужно проверить выполнение в С0 аксиом I—VI (§ 7, определение 1). Так как операции в С0 определены для классов через представителей этих классов, то выполнение аксиом I, II, IV, V и VI следует из теоремы 4.

Займемся аксиомой III. Пусть даны две пары (а, Ь) и (с, d). Если бы существовала пара (х, у), для которой (а, Ь)+(х, у) = = (с, d), то а+х = с, b+y = d, т. е. а<с, b<d. Поэтому, если имеет место хотя бы одно из условий а^с, b^d, то такой пары (лг, у) не существует. Таким образом, вычитание пар не всегда возможно, т. е. сами пары кольца не образуют. Тем не менее С0 будет кольцом. Пусть аир два класса из С0, причём а содержит пару (а, Ь) и ß — пару (с, d). Надо найти класс у такой, что а —|— y = ß. Если (х, у) — пара искомого класса у, то вовсе не нужно, чтобы выполнялось равенство (а, Ъ) -|- (х, у) = (с, d), a достаточно лишь эквивалентности (a, b)+(x, у)^(с, d). Предположим сначала, что пара (х, у) с этим свойством существует. Тогда (а+х, b +у) d), откуда a+x+d = b+y+c или (a+d)+x = (b +с)+у. По определению эквивалентности (2) (X, y)~(b+c, a+d).

По теореме 5 достаточно проверить, что хотя бы одна пара (Ху у) с этим условием обладает требуемым свойством, т. е. удовлетворяет соотношению (a, b)+(x, у)^(с, d). Но сама пара (b+Cy a+d) обладает нужным свойством. Действительно,

(а, &) + + a + d) = (<a + b+c1 é-J-a+d)~(cf rf).

Этим доказано существование класса у, для которого а —[— y = ß/ Теорема доказана.

Из существования класса у со свойством а4"Т = Р вытекает его единственность (§ б, теорема 1).

Выясним, какой смысл имеют в кольце С0 нуль и противоположный элемент.

Нуль по его определению — такой класс 0, что а-|-0 = а для любого класса а. Если а содержит пару (а, Ь) и 0 — пару (х, y)f то должно быть (а, Ь) + (<%> у) ~ (я, £)• Отсюда, как в доказательстве последней теоремы, с заменой (с, d) на (а, £) получим:

(лг, .у)~(6 + я, а-|-&) = (а-|-&, а+6) = (£, £).

По (2) любая такая пара действительно удовлетворяет условию

(a, b)+(k, k)~(a, b).

Итак, нулём кольца С0 является класс 0, содержащий все пары с равными элементами.

Противоположный элемент для класса а — это такой класс —а, для которого —а) = 0. Если а содержит (а, Ь) и —а содержит (лг, 3/), то (а, b)+(x, y) = (k, k). Здесь можно писать не ~, а =, так как по (2) пара, эквивалентная паре (k, k)> сама имеет

равные элементы; следовательно, а+х = Ь +у, откуда (х, у) = = (Ь, а). Но сама пара (Ь, а) обладает нужным свойством, ибо

(а, *) + (*, а) = (а + Ь, Ь + а)

принадлежит классу 0. Назовём пару (Ь, а) противоположной (о, Ь). При замене пары (а, Ь) эквивалентной противоположная пара также заменяется на эквивалентную; любая пара класса —а противоположна некоторой паре класса а.

Итак, класс —а, противоположный классу а, состоит из пар, противоположных парам класса а.

Построенное нами кольцо С0 является изоморфным кольцу целых чисел. Если строить целые числа лишь с точностью до произ вольного изоморфизма, то само С0 можно считать кольцом целых чисел. Однако, при расширении данной системы чисел до новой мы будем считать эту данную систему определённой вполне однозначно, т. е. из всех её интерпретаций выбираем какую-нибудь одну. При этом условии кольцо С0 не удовлетворяет определению 1, так как С0 не содержит натуральных чисел, ибо его элементы — классы эквивалентных пар натуральных чисел.

Так как натуральные числа сами ещё не являются элементами кольца С0, то для получения из С0 кольца целых чисел (определение 1) надо включить в С0 множество натуральных чисел N.

Сначала найдём в кольце С0 множество, изоморфное множеству натуральных чисел. Любой класс а кольца С0, отличный от нуля, состоит из пар (а, Ь), где афЬ. Назовём класс а классом первого рода, если а>b, и второго рода, если а<b. Это определение не зависит от выбора пары (а, Ь) в классе <х, так как если (а, ~(с, d), то a+d = b +с. Поэтому из а>b следует (§ 16, теорема 2) d<cy c>d, из a<b следует также c<d. Пусть и 7V2—соответственно множества классов первого и второго рода. Покажем, что множество Nt классов первого рода изоморфно множеству N натуральных чисел относительно операций сложения и умножения. Построим взаимно однозначное отображение / множества Afj на N. Если класс а из Nt содержит пару (а, Ь), то а>b и, следовательно, существует натуральное число k такое, что а = = b+k (§ 14). Мы положим f(a) = k. Число k не зависит от выбора пары класса а, так как из (a, b)^(c, d), т. е. a+d = b +с при a = b+k, следует b~\-k+d = b+c, откуда также c = d+k. Разным классам соответствуют разные числа, так как если а содержит (а, Ь) и р содержит (с, d), причём /(<x)=/(ß) = £, то a = b+k, c = d+k и, складывая крест-накрест, найдём:

a+d+k*=b+k+c, a+d = b+cy (a, b)r^(c, d), a = ß.

Любое число k является образом некоторого класса ос, именно содержащего пару (a+k.é а). Этим доказано, что отображение / взаимно однозначно (§ 3, определение 3).

Покажем, что Nt и N изоморфны относительно определённых в них сложения и умножения, т. е. покажем справедливость

равенств /(«)+/(ß) =/(« + ß), /(a)/(ß)=/(«ß). (5)

В самом деле, если а содержит пару (a+k, а) и ß— пару (b -j- /, b), то a -j- ß содержит пару (a -f - b + £ + а 4" *)» и> следовательно,

/(ce+ß)=* + /=/(a)+/(ß).

Далее, aß содержит

где c = 2ab +al+bk. Следовательно,

/(aß)=^=/(«)/(ß).

Построим теперь искомое кольцо целых чисел С. Рассуждения будут аналогичными с доказательством соответствующей теоремы о кольцах (§ 9, теорема 2). Пусть С — множество, полученное из кольца С0 путём замены всех классов первого рода натуральными числами, соответствующими этим классам при отображении /. Если дополним определение отображения /, полагая /(a) = a для любого класса a второго рода и для а = 0, то получим взаимно однозначное отображение С0 на С. Определим сложение и умножение во множестве С следующими равенствами:

/(«)+/(?) =/(«-Н). /(«)/(?)=/(«?)■ (5')

Здесь a и ß — любые классы кольца С0. Так как /—взаимно однозначное отображение С0 на С, то /(а) и /(ß) — любые элементы С. Далее, сумма a —|— ß и произведение aß определены в С0 однозначно, и равенства (5') действительно определяют операции сложения и умножения для любых элементов множества С.

Итак, С—множество с двумя операциями. Одновременно равенства (5') показывают, что множество С с так определёнными операциями изоморфно кольцу С0 и само является кольцом (§ 9, теорема 1).

Теорема 7. Кольцо С, построенное выше, есть кольцо целых чисел.

Доказательство. Надо доказать, что С обладает свойствами 1) — 4), указанными в определении 1 в начале этого параграфа. Мы уже знаем, что 1) С содержит множество N натуральных чисел и

2) С есть кольцо.

Если k=f(a) и /=/(ß) — натуральные числа, то a и ß — классы первого рода. Тогда равенства (5'), определяющие в кольце С сумму k -j- / и произведение kl, совпадают соответственно с равенствами (5), где сложение и умножение в левых частях являются операциями, определёнными для натуральных чисел в §§ 12, 13. Итак;

3) Сложение и умножение натуральных чисел совпадают с одноимёнными операциями для этих чисел в кольце С.

Покажем, что любой элемент кольца С равен разности натуральных чисел. Любой элемент С имеет вид /(а), где а — класс кольца С0 и /—построенное выше отображение С0 на С. Пусть а содержит пару (k, I), причём k=f($), /=/(у). По определению отображения / класс ß состоит из пар вида (b+k, b) и у — из пар вида (с+1, с), следовательно, класс a +у содержит пару {k, /)+ + c)=(k+c+l, l+c), принадлежащую ß, откуда a-f ï = P-

Итак, по определению сложения в кольце С, т. е. по (5')1):

/(«)+/(T)=/№). т.е. /(a)=/(ß)-/(T) = £-/2).

Любое подкольцо С, содержащее натуральные числа, должно содержать все их разности и совпадает с С. Следовательно,

4) Кольцо С не содержит никакого подкольца, содержащего N и отличного от самого С.

Итак, одно из изоморфных между собой колец целых чисел нами построено. Его элементами (т. е. целыми числами) являются: во-первых, все натуральные числа, во-вторых, число 0, т. е. класс всех пар натуральных чисел с равными элементами, в-третьих, все классы второго рода, т. е. классы эквивалентных пар (a, Ь) натуральных чисел с условием а<b. Этим решён вопрос о существовании кольца целых чисел.

Пока читателю трудно узнать в построенном выше кольце С так хорошо известное ему кольцо целых чисел. В следующем параграфе мы рассмотрим простейшие свойства этого кольца и увидим, что оно ничем не отличается от всем известной совокупности целых чисел.

§ 21. Свойства целых чисел

Замечание 1. Для целых чисел как для элементов кольца верны все правила оперирования, доказанные в § 7. Так, произведение нуля на любое число равно нулю [§ 7, (2)], верны обычные правила знаков при умножении [§ 7, (3)] и т. д.

Теорема 1. Натуральными числами 1, 2, 3, числом О и числами—1,—2,—3, противоположными натуральным, исчерпывается всё кольцо целых чисел С, т. е. для любого элемента ad С имеет место один и только один из трёх случаев: а — натуральное число, а = 0, —а — натуральное число.

Доказательство. Пусть а = /(<х), где a — класс кольца С03). Выше было доказано, что a либо первого рода, либо 0, либо

1) Заметим, что нельзя применять (5), так как класс а не обязательно первого рода.

2) Для класса второго рода и 0, содержащихся в С, доказанное означает, что класс, содержащий пару (k, I), равен разности k — /.

3) Мы применяем, таким образом, для чисел, отличных от натуральных, обозначения как греческими, так и латинскими буквами, считая a = o.

второго рода. Эти случаи несовместимы, так как если (k, t) — пара класса а, то соотношения k>l, k = l, k<l несовместимы (§ 14, теорема 1). Если а — второго рода, то k<l. Тогда противоположный класс —а содержит пару (/, k), где l>k, т. е. он первого рода. При изоморфизме / свойство элементов быть противоположными друг другу сохраняется, т. е.

/(_«)=-/(а)=-а.

Если а первого рода, то а=/(а)— натуральное число по определению /; если <х = 0, то а = а = 0; если а — второго рода, то — а —первого рода и — а =—/(<х)=/( — а)—натуральное число.

Теорема 2. Кольцо целых чисел есть область целостности (§ 7, определение 2) с единицей, причём единицей служит натуральное число 1.

Доказательство. Будем вместо а писать, если нужно, также -|-а. Покажем, что произведение ab целых чисел лишь тогда равно нулю, когда один из сомножителей равен нулю. Пусть а ф 0 и b ф 0. По предыдущей теореме а ==ч- с и b =-н d, где с и d —натуральные числа. Тогда ab = zhcd, где берём знак-(-при одинаковых знаках a, b и знак — при разных; cd ф 0, так как произведение натуральных чисел является натуральным числом, следовательно, ab ф 0.

Покажем, что а«1=а для любого а. Если а — натуральное число, то это верно по определению умножения (§ 13).

Если а = 0, то а • 1=0» 1 = 0 = а. Если а = — Ь, где b — натуральное число, то а*1=(—Ь) • 1 = — (£*1) = — Ь = а. Теорема доказана.

Перейдём к понятиям о положительном и отрицательном числах и сравнению целых чисел по величине.

Теорема 3. Кольцо целых чисел С может быть расположено (§ 10, определение 1) и притом единственным образом. При этом расположении все натуральные числа положительны, а все противоположные им числа —1, —2,—3, ... — отрицательны.

Доказательство. Если считать натуральные числа и только их за положительные, то кольцо С будет расположено. В самом деле, по теореме 1 для любого числа а либо а положительно, либо а = 0, либо — а положительно, т. е. аксиома IX (§ 10) выполнена. Так как сумма и произведение натуральных чисел — числа натуральные, то выполнена и аксиома X. Раз натуральные числа положительны, то по самому определению противоположные им числа отрицательны. Покажем, что данное расположение — единственно возможное. Пусть кольцо С расположено каким угодно образом. По аксиоме IX одно из чисел +1 и — 1 положительно. Тогда по аксиоме X число 1 = 1 • 1=(—1)«(—1) как произведение положительных само положительно. Тогда также по аксиоме X и любое натуральное число п как сумма п единиц (§ 15, теорема 2) поло-

жительно, т. е. противоположное число—п по аксиоме IX неположительно. По теореме 1 числа 0 и ± п, где п—любое натуральное число, исчерпывают С. Таким образом в С положительны натуральные числа и только они. Итак, любое расположение С совпадает с расположением, указанным в начале доказательства.

Замечание 2. Целые числа обладают всеми свойствами элементов любого расположенного кольца, приведёнными в § 10. Так, считая а>b, если а — b — положительно, мы вводим порядок» при котором 0 меньше всех положительных и больше всех отрицательных чисел (§ 10, теорема 1). Для этого порядка верны законы монотонности и правила оперирования с неравенствами (§ 10, теоремы 2—4). Определяя абсолютную величину | а | числа а как неотрицательное из чисел ±а (см. § 10, определение 2), получим обычные её свойства и обычные правила сравнения и правила действий над числами через сравнение и действия над их абсолютными величинами (§ 10, теорема 8 и следующее за ней замечание).

Теорема 4. Порядок натуральных чисел (§ 14) совпадает с их порядком в кольце целых чисел.

Доказательство. Если а и b — целые числа и а>b, то а — b = k, где k — число положительное, т. е. натуральное, тогда a — b+k. Для натуральных а и b это означает, что а>b в смысле определения из § 14.

Так как среди целых чисел нет наименьшего, то теорема 8 из §14 для них уже неверна. Для справедливости утверждений такого рода необходимы дополнительные условия.

Определение. Множество А целых чисел называется ограниченным сверху (соответственно снизу или просто ограниченным), если существует целое число k такое, что k>x (соответственно k<x или существуют два числа k и I такие, что k<x<t) для любого числа х из А. Пустое множество ограничено.

Теорема 5. Любое непустое и ограниченное сверху (соответственно снизу или ограниченное) множество целых чисел А содержит наибольшее (соответственно наименьшее или как наибольшее, так и наименьшее) число.

Доказательство. Пусть А ограничено сверху. Если А содержит хотя бы одно натуральное число, то множество натуральных чисел, входящих в Л, непусто и содержит наибольшее число а (§ 14, теорема 2). Число а, очевидно, будет наибольшим и в Л. Если Л не содержит натуральных чисел, но оно содержит число 0, то 0 и будет наибольшим в А. Если Л содержит лишь отрицательные числа, то множество В, содержащее числа, противоположные числам из Л, состоит из натуральных чисел и содержит наименьший элемент b: Ь^у для любого у из В. Умножая на —1, найдём (§ 10, теорема 2): —b ^—у или, полагая а — — b и х = —у, а^х для любого х из Л. Если Л ограничено снизу, то определённое выше В ограничено сверху, и по доказанному В содержит наи-

большее число £. Тогда число а = — b будет наименьшим в А. Наконец, если А ограничено, то оно ограничено и сверху, и снизу, и по доказанному содержит как наибольшее, так и наименьшее число.

На этой теореме основаны различные формы односторонней или двусторонней индукции. Например:

Теорема 6. Если некоторая теорема Т, касающаяся целого числа, верна для целого числа а и

а) если из того, что теорема Т верна для числа х = а, следует, что она верна для числа Х+1, то она верна для любого числа Ь^а;

б) если из того, что теорема Т верна для числа х^а, следует, что она верна для числа х—1, то она верна для любого числа Ь^а;

в) если из того, что теорема Т верна для любого числа х, удовлетворяющего неравенству xt <х<х%, где xt^a^x2, следует, что она верна для чисел хх и х2, то она верна для любого целого числа Ь.

Доказательство. Все подобные утверждения доказываются одинаково. Докажем, например, утверждение в). Если теорема Т верна не для всех целых чисел, то существует целое число Ь, для которого она неверна. Пусть Ь>а (в случае Ь<а рассуждение аналогично) и пусть А есть множество тех целых чисел х>А, для которых Т неверна. Множество А ограничено снизу числом а и непусто, ибо содержит число Ь. По предыдущей теореме это множество содержит наименьшее число лг2. Если положим хг равно а—1, то теорема Т верна для любого числа х такого, что х1<х<х%, причём xl<a<xi. Следовательно, теорема Т верна и для чисел хх и х2. Но число х% принадлежит множеству А, т. е. для х2 теорема Т неверна. Полученное противоречие доказывает утверждение в).

Теорема 7. Кольцо целых чисел архимедовски расположено (§ 10, определение 3).

Доказательство. Пусть а и b — целые числа и Ь>0. Если а ^ 0, то 1 • b с= b > а. Если а 0, то а и b — натуральные числа и для них аксиома Архимеда выполнена (§ 14, теорема 6). Поэтому существует натуральное число п такое, что nb>a.

На свойствах делимости целых чисел мы останавливаться не будем, так как они рассматриваются в статье А. Я. Хинчина,

ГЛАВА V

ПОЛЕ РАЦИОНАЛЬНЫХ ЧИСЕЛ

§ 22. Определение поля рациональных чисел

В настоящей главе будут построены рациональные числа, положительные, отрицательные и число нуль. Дробные числа появились в глубокой древности задолго до отрицательных чисел. Их возникновение связано с задачами измерения. В случае, когда единица измерения не укладывалась целое число раз в измеряемой величине, естественно возникало понятие о дробном числе. Заметим, что принятый нами порядок изложения отличается от школьного тем, что мы сначала определяем целые отрицательные числа, а затем все рациональные числа, тогда как в школе отрицательные числа появляются уже после дробных. Такое построение нами принято с целью получить возможно раньше числовую область (целых чисел), которая является кольцом, с тем, чтобы далее применять общую теорию, построенную в главе II. Укажем, однако, на то, что без каких-либо существенных изменений в рассуждениях можно было бы переставить местами построения «относительных» чисел из § 20 и рациональных чисел из данного параграфа. Тем самым будет сохранён обычный для школы порядок изложения.

Расширение множества целых чисел до множества чисел рациональных производится по общему плану, указанному в § 18 для любого расширения, и рассуждения при этом аналогичны проведённым в § 20 при расширении натуральных чисел до целых. Всё отличие состоит в том, что тогда речь шла о свойствах сложения, а теперь — о свойствах умножения.

Во множестве целых чисел не всегда выполнима операция, обратная умножению, т. е. деление, даже при условии, что делитель отличен от нуля. Поставим задачу расширить кольцо С целых чисел до такого множества Г, где были бы заданы операции сложения и умножения, обладающие теми же свойствами, какими они обладали для целых чисел, причём деление на элементы множества, отличные от нуля кольца С, было бы всегда возможно. Это означает, что множество Г должно быть полем (§ 8, определение 1). Будем

искать минимальное из таких расширений в смысле следующего определения:

Определение 1. Полем рациональных чисел называется минимальное поле Г, содержащее кольцо С целых чисел, т. е. множество, обладающее свойствами:

1) Г содержит С; 2) Г является полем; 3) сложение и умножение целых чисел совпадают с одноимёнными операциями над этими числами в поле Г; 4) поле Г не содержит отличного от него самого подполя, содержащего С.

Элементы поля Г называются рациональными числами.

Из этого определения ещё неясно, существует ли такое поле и будет ли оно единственным. Покажем сначала, что поле рациональных чисел определено однозначно с точностью до изоморфизма.

Теорема 1. (Ср. § 20,теорема 1.) Поле Г, содержащее кольцо С целых чисел1), тогда и только тогда будет полем рациональных чисел (т. е. минимальным), когда каждый его элемент равен частному целых чисел.

Доказательство, а) Если поле Г содержит С и каждый элемент Г равен частному целых чисел, то Г минимально, так как любое подполе, содержащее Г, содержит и все частные целых чисел (§ 8, теорема 5) и совпадает с Г.

б) Пусть, обратно, поле Г минимально. Во всяком поле частное элементов обладает следующими свойствами (§ 8, теорема 3):

а)

б) в) г)

Пусть M — множество всех элементов поля Г, каждый из которых равен частному целых чисел. Из (1) следует, что сумма, разность, произведение и частное (если делитель отличен от нуля) любых двух элементов множества M снова принадлежат к М, т. е. M — подполе поля Г (§ 8, теорема 5). Любое целое число

ab

равно, конечно, частному целых чисел, например а —-у, где b — целое число, отличное от нуля. Из совпадения операций в С и Г

1) Здесь и ниже подразумевается, что операции над элементами подмножества совпадают с одноимёнными операциями над теми же элементами в надмножестве.

следует поэтому, что M содержит С, и в силу минимальности Г М = Т. Это значит, что любое рациональное число равно частному целых чисел.

Теорема 2. (Ср. § 20, теорема 2.) Все минимальные поля, содержащие кольцо С целых чисел, изоморфны, т. е. поле рациональных чисел единственно до изоморфизма.

Доказательство. Пусть 1\ и Г2—два таких поля. По предыдущей теореме любой элемент Tt и Г2 равен частному целых чисел. Строим отображение / поля 1\ на Г2 так: если сх £ Ти с1==-|- в 1\, где а и b — целые числа и с2 = у в Г2, то положим f(c1) = ci. Ввиду полной аналогии дальнейших рассуждений с доказательством теоремы 2 из § 20 ограничимся лишь указанием, что взаимная однозначность этого отображения следует из свойства а). Далее, из свойства б) следует:

/(Cl+ (О+/№),

и из в) следует

/М,)=/(с,)/№)

для любых сг и dx из Г, что и доказывает изоморфизм полей 1\ и Г2.

Теорема 3. (Ср. § 20, теорема 3.) Любое поле Р, содержащее кольцо целых чисел С, содержит и поле рациональных чисел.

Доказательство. Пересечение всех подполей поля Р, содержащих С, будет опять подполем (§ 8, теорема 6), содержащим С и при этом минимальным, так как оно входит в любое подполе, содержащее С. Согласно определению 1 это подполе будет полем рациональных чисел.

Переходим к доказательству существования поля рациональных чисел. Как и в случае кольца целых чисел, это доказательство проводится путём построения примера (интерпретации) поля, удовлетворяющего определению 1.

Конструкция одного из изоморфных полей рациональных чисел подсказывается теоремой 1. Ведь если Г — поле рациональных чисел, то элементами Г будут частные целых чисел. Правила сравнения и операции сложения и умножения для этих частных задаются формулами (1).

За исходный элемент построения поля рациональных чисел принимаем опять пару (а, Ь) целых чисел, взятых в данном порядке, причём второе число пары b отлично от нуля. Пусть M — множество всех таких пар. Определяем отношение эквивалентности, сложение и умножение пар так, чтобы им соответствовали равенства, сложения и умножения частных чисел этих пар в искомом поле. Именно, согласно (1) полагаем

(a, d) (2)

тогда и только тогда, когда ad = bc,

{а, Ь)+(с9 d) = (ad + bc, bd), (3)

(а, b){c, d) = (ac, bd). (4)

Отметим, что пары в правых частях (3) и (4) снова принадлежат множеству М, так как из^Оий^О следует М^О для любых целых чисел b и d (§ 21, теорема 2).

Теорема 4. Сложение и умножение пар коммутативны, ассоциативны, а вместо закона дистрибутивности верна эквивалентность

[(а, Ь) + {с, d)] (е, /) ~ (а, Ь) (е, /) + (с, d) (е, f). (5)

Доказательство. Все эти свойства доказываются непосредственной проверкой с использованием свойств целых чисел как элементов кольца (§ 20, определение 1). Проверим, например, эквивалентность (5). Преобразуем левую и правую части отдельно:

Но из определения эквивалентности (2) следует, что получившиеся в итоге пары эквивалентны.

Отношение эквивалентности пар (2) обладает тремя основными свойствами равенства (§ 19), а именно:

1) (a, b)<s(a, b), ибо ab = ba;

2) если (a, b)^{c, d), то (с, d)~{a, b)\ ибо если ad = bc, то cb = da;

3) если (а, Ь)~(с, d) и {с, d)~{e,f), то {a, t))~(e,f), ибо умножая равенство ad = bc на / и равенство cf=de на Ь, находим: adf= bcf= bde, т. е. adf= bde, откуда af= be, так как d ф 0.

Это отношение определяет разбиение множества M на классы эквивалентных пар. Будем обозначать эти классы малыми греческими буквами а, ß, у, 8, ...

Определение 2. Пусть Г0 есть множество всех классов эквивалентных пар множества М. Суммой {произведением) двух классов а и ß назовём тот класс а + ß {соответственно, aß), который содержит сумму (произведение) пары класса а и ла/ш класса ß.

Как и в предыдущей главе, независимость суммы и произведения классов от выбора их представителей вытекает из такой теоремы: Теорема 5. Если (av #i)~(#2> b%) и (си dt)r^{c2y d2), то

Доказательство. Как и прежде (§ 20, теорема 5), достаточно доказать, что для любой пары (с, d) будет:

(о,, + d)~(a2, Ь2)+(с, d)

и

(a„ ûT)~(a2, 62)(c, d)-

По условию эквивалентности (2) имеем:

axb2 = a2bx.

Умножим обе части на d. Найдём:

a1b2d = a2bxd.

Прибавим к обеим частям bxcb2. Получим:

axb2d + btcb2 = a2bLd + btcb2.

Умножим обе части снова на d и вынесем общие множители за скобки. Будем иметь:

{axd + bxc) b2d = (a2d + b2c) bxd,

откуда

(axd+bxc, b1d)r^(a2d+b2c, b2d).

Умножим обе части равенства a1b2 — a2bt на cd. Найдём: (atc) (b2d) = (a2c) (btd),

откуда

(atc, bxd)r^ (a2c, b2d).

Итак, определение 2 действительно вводит во множестве Г0 классов эквивалентных пар однозначно определённые операции сложения и умножения.

Теорема 6. Множество Г0 с операциями, указанными в определении 2, является полем.

Доказательство. Нужно проверить выполнение в Г0 аксиом I—VI (§ 7, определение 1) и VII, VIII (§ 8, определение 1). Так как операции в Г0 определены для классов через их представителей, то выполнение аксиом I, II, IV, V и VI следует из теоремы 4. Так как, очевидно, множество Г0 содержит более одного элемента, то выполнена аксиома VIII. Выполнение аксиомы III следует из того, что если класс а содержит пару (а, Ь), класс ß — пару (с, d), то из

(a, b)+(bc — ad, bd) = (abd+bh — abd, ЬЧ)~(с, d)

следует, что класс у» содержащий пару {be — ad, bd), удовлетворяет условию <x-|-7 = ß.

Итак, уже доказано, что Г0 является кольцом. Выясним, какой смысл имеют в этом кольце нуль и противоположный элемент. Все

пары вида (О, Ь) эквивалентны между собой. Обратно, любая пара (*> У)у эквивалентная паре (О, Ь), сама имеет тот же вид, так как из xb=y-0 и ЬфО следует х = 0. Таким образом, все пары вида (О, Ь) образуют один класс, который, очевидно, является нулём кольца Г0. Далее, очевидно, что противоположным для класса а, содержащего пару (а, Ь), является класс, содержащий пару (—а, Ь). Будем его обозначать через—а.

Проверим теперь выполнение аксиомы VII. Пусть даны классы anß, причём класс а отличен от нуля. Если а содержит пару (а, Ь) и р — пару (с, d), то а ф 0. Существует поэтому пара (be, ad). Пусть у — класс, содержащий эту пару. Из

(a, b)(bc, ad) = (abc, abd)^(c, d)

следует ay = ß, что и доказывает VII. Итак, Г0 является полем.

Выясним ещё, какой смысл имеют в поле Г0 единица и обратный элемент. Если ае = а, где а отлично от нуля, а содержит (а, Ь), где а ф 0, е содержит (х, у), то (а, b) (х, у) ~ (а, Ь), откуда abx = = аЬу, х=у. Очевидно, что, обратно, пара вида (х, х), хфО удовлетворяет условию

(а, Ь)(х, х)~(а, Ь).

Все пары этого вида составляют один класс, играющий, очевидно, роль единицы в поле Г0.

Обратным для класса а, содержащего пару (а, Ь), афО, будет класс, содержащий пару (Ь, а), так как (a, b)(b, a) = (ab, ab) принадлежит единичному классу.

Построенное поле Г0 является изоморфным полю рациональных чисел. Само поле Г0 не удовлетворяет определению 1, так как не содержит среди своих элементов целых чисел.

Займёмся теперь включением в поле Г0 кольца целых чисел. Сначала найдём в поле Г0 множество, изоморфное кольцу целых чисел С. Пусть класс а содержит пару (Ь, с), где b делится на с, т. е. Ь=ас. Очевидно, что две пары вида (асх, с,) и (ас2, с2) эквивалентны. Обратно, всякая пара, эквивалентная паре (ас, с), сама будет вида (acv сх). В самом деле, из (bv ct) ~ (ас, с) следует: Ь1с=с1ас, откуда Ь1 = ас1. Итак, класс а состоит из пар вида (ас, с) с данным а и любым с ф 0.

Пусть С—множество всех классов пар (Ь, с), где b делится на с. Каждому классу а из С поставим в соответствие число а такое, что пара (ас, с) принадлежит этому классу а. Так как (act, ct)^(ac2, с2), то этим определено однозначное отображение а=/(а) множества классов С во множество целых чисел С. Двум разным классам соответствуют разные числа, и любое число а соответствует некоторому классу, именно классу, содержащему пару (ас, с). Таким образом, / есть взаимно однозначное отображение С на С.

Покажем, что / будет изоморфным отображением множества С с операциями над классами на кольцо целых чисел. Достаточно доказать равенства

/(«)+/№) =/(« + ?), Л«)-/(Р)=/(«Р)- (6)

Но если класс а содержит пару (ас, с) и класс (3—пару (be, с), то (а —(— ß) содержит пару

(ас, c) + (bc, с)=[(а + Ь)с\ с2]

и класс aß — пару

(ас, с) (be, c) = (abc2, с1),

откуда

/(a+ß) = a + *=/(«)+/(ß) /(aß)=a£=/(a)./(ß).

Построим теперь искомое поле рациональных чисел Г. Пусть Г — множество, полученное из поля Г0 путём замены каждого класса множества С соответствующим ему при отображении / целым числом. Для определения операций в Г дополним определение отображения /, положив /(a) = a для любого класса из Г0, не входящего в С. Тогда / будет взаимно однозначным отображением Г0 на Г. Сложение и умножение в Г определяем равенствами

/(«)+/(?)=/(«+Р). /(«)•/(?)=/(«?)• (7)

Здесь a и ß—любые элементы Г0, следовательно /(а) и /(ß) — любые элементы Г. Поэтому равенствами (7) действительно определены операции во множестве Г.

Теорема 7. Множество Г с операциями, определёнными равенствами (7), является полем рациональных чисел.

Доказательство. Надо показать, что множество Г обладает свойствами 1)—4) из определения 1.

1) Г содержит кольцо целых чисел С по построению.

2) Г является полем, так как равенства (7), определяющие сложение и умножение в Г, вместе с тем показывают, что множество Г относительно этих операций изоморфно полю Г0. Но множество с двумя операциями, изоморфное полю, само является полем (§ 9, теорема 1).

3) Сложение и умножение целых чисел совпадают с одноимёнными операциями над этими числами в поле Г. В самом деле, при отображении / целые числа являются образами элементов множества С из поля Г. Но если а и ß — классы из С, то для них равенства (7) совпадают с (6), где сложение и умножение в левых частях равенств означают операции над целыми числами, определённые в § 20.

4) Поле Г не содержит отличного от него самого подполя, содержащего С. Чтобы в этом убедиться, покажем, что любой элемент поля Г равен частному целых чисел. Любой элемент из Г имеет вид /(а), где а — некоторый класс поля Г0.

Пусть класс а содержит пару (k, /) целых чисел, причём / ф 0. Тогда &=/(ß), /=/(у). По определению отображения / класс ß состоит из пар вида (kc, с) и у— из пар вида (/с, с), следовательно класс ау содержит пару

(&, c) = (klc, lc)^(kc, с),

откуда ay=ß. Согласно определению умножения в Г [второе из равенств (7)] отсюда находим: /(a)-/(y)=/(ß), откуда

Любое подполе поля Г, содержащее все целые числа, должно содержать и все их частные, т. е. по доказанному всё поле Г, чем и завершается доказательство теоремы.

Итак, одно из изоморфных полей рациональных чисел нами построено. Его элементами являются, во-первых, все целые числа и, во-вторых, классы эквивалентных пар целых чисел вида (а, b)f где b ф 0 и а не делится на Ь. Этим решён вопрос о существовании поля рациональных чисел, т. е. поля, удовлетворяющего определению 1. Остаётся ввести для рациональных чисел обычные обозначения с помощью дробей и показать, что эти числа обладают обычными, всем известными, свойствами.

§ 23. Свойства рациональных чисел

Введём для рациональных чисел, рассматриваемых как элементы построенного в предыдущем параграфе поля Г, обычные обозначения с помощью дробей. Каждое рациональное число а является образом некоторого класса а поля Г0, т. е. а=/(а). Класс а однозначно определяется любой входящей в него парой (é, /) целых чисел, где / ф 0. Таким образом, любое рациональное число а однозначно определяется парой (k, I) из класса а. Будем обозначать это число а через у , а символы у, где k и / — целые числа и 1ф0, будем называть дробями1).

1) Таким образом, в отличие от молчаливо принимаемого обычно понимания дробей как чисел особой категории мы считаем дроби не числами, а лишь символами для обозначения чисел. В самом деле, различные дроби могут обозначать одно и то же число. Так,

Но тот же символ у в поле Г обозначает частное от деления k на /. Это не ведет, однако, к противоречию, так как по доказанному в конце предыдущего параграфа, если а=/(а) и класс а содержит пару (£, /), то действительно а = у ,где -j--частное от деления k на /.

Все дроби, составленные из пар одного класса а, обозначают одно и то же рациональное число а=/(а). Таким образом, по определению эквивалентности пар (2) имеем

i-i (1)

тогда и только тогда, когда ad = bc.

Отсюда, в частности, вытекает основное свойство дроби, т. е. равенство

(2)

для любого с ф 0. На этом свойстве основаны, как известно, сокращение дробей и приведение дробей к общему знаменателю. k

Заметим, что a = -j будет целым при условии, что k делится на L Простейшим обозначением целого числа а дробью будет дробь у. Для целых чисел мы будем применять наряду с дробями также и прежние обозначения. Так,

Так как дробь у обозначает рациональное число, равное частному от деления k на / в поле Г, то для действий сложения, вычитания, умножения и деления над числами, обозначенными дробями, верны правила (1), б), в), г) § 22, т. е. обычные правила оперирования с дробями.

Рациональные числа, не являющиеся целыми, будем называть дробными (таким образом, мы будем различать термины «дробь» и «дробное число»). Итак, целые и дробные числа вместе составляют все рациональные числа.

Замечание 1. Для рациональных чисел как элементов поля Г верны все теоремы, доказанные для любых колец и полей в §§ 7, 8. Так, верны правила знаков при умножении [§ 7, (3)]; существует единица, причём она равна числу 1, соответствующему единичному классу поля Г0 при изоморфном отображении / (ибо этот класс состоит из пар вида (с, с) = (с • 1, с), где с ф 0); любое число

у ф 0 имеет обратное, причём это будет число — ; отсутствуют делители нуля (§ 8, теорема 1) и т. д.

Переходим к свойствам расположения поля рациональных чисел. Теорема 1. Поле Г рациональных чисел может быть расположено (§ 10, определение 1) и притом единственным образом, k

При этом число & = -j положительно, если целое число kl положительно. Это расположение в частном случае целых чисел совпадает с расположением целых чисел, определённым ранее (§ 21, теорема 3).

Доказательство. Будем считать рациональное число а = у, где k^O, положительным, если целые числа k и /—одного знака, т. е. или оба положительны, или оба отрицательны, иначе говоря, a = -j- положительно (в символах: а>0), если kl>0 в смысле расположения целых чисел. Это определение положительности числа а не зависит от его записи в виде дроби. В самом деле, если а=-ф-=ф~ и А1/1>0, то, умножая последнее неравенство на положительное целое число 1{у получим:

Ш\ = ( V») (Ш = (Vi) (Ш = *М > о.

Но /?]>0, следовательно k2l2>0 (§ 10, теорема 3).

Покажем, что данное определение положительных чисел удовлетворяет аксиомам IX и X из § 10. Пусть а = у. Так как для целых чисел аксиома IX выполнена, то выполнено одно и только одно из трёх соотношений kl>0, kl=0y —kl>0.

Если kl>0, то а>0, если kl=0y то k = 0 и а = 0, если — kl>0, то—а = -=^->0. Итак, аксиома IX справедлива и для рациональных чисел. Если

то

ибо

А также

ибо

Итак, аксиома X для рациональных чисел выполнена. Поле Г расположено.

Легко видеть, что аксиомы IX и X, выполненные для некоторого кольца или поля, остаются справедливыми для любого его подкольца. Поэтому расположение поля Г рациональных чисел порождает некоторое расположение содержащегося в нём кольца С целых чисел. Но кольцо целых чисел допускает единственное расположение (§21, теорема 3). Поэтому любое расположение (в частности, определённое выше) поля рациональных чисел сохраняет расположение кольца целых чисел, определённое ранее (§ 21).

Покажем, что построенное расположение поля рациональных чисел является единственным. Пусть дано какое-то его расположение. Оно сохраняет неизменным расположение целых чисел. Покажем, что рациональное число # = у тогда и только тогда положительно, когда целое число kl положительно. В самом деле, если у>0, то, умножая на /*>0, найдём kl>0. Если, обратно, kl>0, то и у]>0, так как иначе--J^®> и> умножая на /2>0, найдём — kl^:Oy что противоречит kl>0.

Итак, любое расположение поля рациональных чисел совпадает с определённым в начале доказательства. Теорема доказана.

Замечание 2. Рациональные числа обладают всеми свойствами элементов любого расположенного поля, приведёнными в § 10. Так, считая а>b, если а — b положительно, мы вводим порядок, при котором 0 меньше всех положительных и больше всех отрицательных чисел (§ 10, теорема 1). Для этого порядка верны законы монотонности и правила оперирования с неравенствами (§ 10, теоремы 2—4). Поле рациональных чисел имеет характеристику 0 (§ 10, теорема 6). Определяя абсолютную величину числа а как неотрицательное из чисел ±а, получим обычные её свойства, в том числе обычные правила сравнения двух чисел по величине и правила четырёх арифметических действий через действия над абсолютными величинами (§ 10, теорема 8 и следующие за ней замечания).

Пусть Р — любое поле характеристики 0 (§ 8, определение 2) и е — единица поля Р. Определим произведение ах любого элемента X поля Р на любое рациональное число а. Если a=-j-с целыми I и 1ф0, то и le -ф 0, и мы положим:

Для целого а это определение совпадает с данным в § 7, ибо из а = -^- следует al=k и по (5) из § 7

откуда ае = -^-. Тогда {ае)х = а {ех) = ах, т. е. произведение ах в новом смысле при целом а совпадает с произведением в смысле § 7.

Элементы ае при целом а называются целыми, а при рациональном а—рациональными элементами поля Р.

Теорема 2. Любое поле Q характеристики О содержит одно и только одно подполе П, изоморфное полю рациональных чисел Г. Это подполе П состоит из всех рациональных элементов ае поля Q, и существует только одно изоморфное отображение П на Г, а именно, переводящее элемент ае в число а. В частности, поле Г не имеет отличных от него самого подполей, т. е. является простым полем (§ 8, определение 2) и допускает лишь одно изоморфное отображение на себя, а именно, тождественное. Поле Q изоморфно полю Р, содержащему Г в качестве подполя, причём любое изоморфное отображение Q на Р сохраняет указанное выше отображение П на Г. Если поле Q расположено, то и поле Р может быть расположено так, что изоморфизм Р и Q сохраняет отношение порядка.

Доказательство. Для любых целых чисел тип имеем [§ 6, (б) и § 7 (б)]:

а) те + ne = {m -f - n) e, {me) {ne) = {mn) e.

Так как характеристика поля Q равна нулю, то ne ф 0 для любого целого пфО. Если тфп, то m — п ф 0 и те — пе = {т — n) е ф 0. Таким образом, соответствие п ► ne между кольцом С целых чисел и множеством 5 целых элементов поля Q взаимно однозначно и в силу а) изоморфно.

Точно так же из соотношений а) и правил сложения и умножения частных б), в) (§ 8, теорема 3) имеем для любых рациональных

Отсюда, как выше, если афЬ, то ае ф be, и, следовательно, отображение а «—* ае поля Г на множество П взаимно однозначно и в силу б) изоморфно. Так как Г — поле, то и П будет полем (§ 9, теорема 1). Пусть поле Г каким угодно образом отображено изоморфно на некоторое подполе IT поля Q. Числу 1 соответствует тогда единица е из Q, а потому по свойствам изоморфизма для

натурального п также

(О слева — число, а справа — элемент Q). Итак, п *—+ ne для любого целого п. А тогда для любого рационального а = -^- также а = — * BL — ae% Таким образом, П' совпадет с П, и любой изоморфизм между Г и П совпадает с изоморфизмом а ► ае.

Так как поле Q содержит подполе П, изоморфное Г, то оно изоморфно полю Р, содержащему подполе Г и полученному из Q путём замены элементов П соответствующими им числами из Г (§ 9, теорема 2). При этом любой изоморфизм Р и Q должен сохранять данный изоморфизм Г и П, так как Г только одним способом изоморфно отображается в П.

Если поле Q расположено и y=f(x)— любое изоморфное отображение Р на Q, то, считая элемент х из Р положительным, если соответствующий ему элемент y=f(x) из Q положителен, получим, как легко видеть, расположение поля Р, причём изоморфизм / сохраняет отношения порядка. Теорема доказана.

Эта теорема показывает, что поле рациональных чисел в известном смысле является минимальным среди всех полей характеристики нуль. Именно, если изучать поля лишь с точностью до изоморфизма, то можно сказать, что любое поле характеристики нуль содержит в качестве подполя поле рациональных чисел.

Теорема 3. Поле Г рациональных чисел архимедовски расположено (при единственно возможном его расположении).

Доказательство. Для выполнения аксиомы Архимеда в Г, как и в любом расположенном поле, достаточно, чтобы для любого числа с существовало натуральное число /г, большее с. В самом деле, тогда для любых а и Ь> где #>0, существует #>у, и, умножая на Ь, получим nb>a.

Пусть а — любое рациональное число. Если а=^0, то п>а для любого натурального п. Если а>0, то его можно представить дробью а = у, где k и /—натуральные числа, ибо по теореме 1 &/>0, т. е. k и / одного знака, а по (2) знаки k и I можно менять одновременно. Тогда /^1, и, умножая на а>0, найдём k^af откуда n = k+l>a. Теорема доказана.

Теория делимости для поля рациональных чисел, как и для всякого поля, бессодержательна и сводится к положению, что любое число делится на любое другое число, отличное от нуля.

Для применения математики в технике и других науках в известном смысле слова достаточно одних рациональных чисел и даже не

всех рациональных чисел, а, например, чисел, выражаемых конечными десятичными дробями. В самом деле, во всех измерениях и вычислениях прикладного характера достаточно знать результат вычисления лишь с некоторой определённой степенью точности. При этом нужной точности можно достигнуть, используя лишь числа указанного рода. Для точного уяснения смысла этого утверждения введём такое понятие.

Определение. Пусть дано натуральное число п. Все рациональные числа вида mnk, где m и k — любые целые числа, называются п-ично рациональными или п-рациональными.

При п = 2, 3, 10 получим двоично-рациональные, троично-рациональные или десятично-рациональные (т. е. десятичные дроби) числа.

При k = 0 найдём, что все целые числа я-рациональны для любого п.

То, что для всех приближённых вычислений рациональные числа можно заменить /г-рациональными, вытекает из следующих двух предложений, которые мы докажем не для поля рациональных чисел Г, а в более общем виде, так как в этом виде они нам понадобятся в следующей главе.

Теорема 4. Пусть Р — архимедовски расположенное поле, содержащее поле рациональных чисел Г, а — элемент Р и п — натуральное число, большее единицы. Тогда для любого целого числа k существует целое число m такое, что

mnk^а<(т+ l)nk.

Доказательство. Из я>1>0 следует nk>0. Так как поле Р архимедовски расположено, то существуют натуральные числа 1Х и /2 такие, что ltnk>a и /2#fe> — а, откуда (—l%)nk<a. Следовательно, множество А целых чисел для которых tnk^a, содержит — /2, т. е. непусто, и ограничено сверху, так как из lnk^a<lxnk следует 1<1\- Поэтому А содержит наибольшее число m (§21, теорема 5). Так как m принадлежит А и т+1>т уже не принадлежит Л, то по определению множества А имеем:

mnk^a<(m+ l)nk,

что и требовалось доказать.

Теорема 5. Пусть Р—архимедовски расположенное поле, содержащее поле рациональных чисел Г, п — натуральное число, большее единицы. Для любого положительного элемента а поля Р существует натуральное число k такое, что —^-<а.

Доказательство. Сначала докажем неравенство

nk>k (3)

для любого натурального числа #>1 и любого целого числа k.

Так как nk>0, то для k^O это неравенство выполнено. Для натурального k докажем его индукцией по числу k при данном п. По условию пг = п>1, т. е. для k—\ неравенство верно. Если оно верно для числа ky то nk>ky откуда

т. е. неравенство верно и для числа A+1. Так как а>0, то по аксиоме Архимеда найдётся натуральное число k, для которого l<ka. По (3) тогда также l<nka. Умножая на n~k>0, найдём n~k<ay что и требовалось доказать.

Заметим, что ввиду теоремы 2 последние две теоремы остаются верными для любого архимедовски расположенного поля Р с заменой в их формулировках рациональных чисел на соответствующие им элементы (т. е. числа г на элемент геу где е — единица Р).

Из теорем 4 и 5 вытекает, что для целей приближённых вычислений рациональные числа можно заменить ^-рациональными при данном п. В частности, можно применять числа, изображаемые конечными десятичными дробями (/г =10), что и делают на практике. В самом деле, мы скажем, что результат вычисления найден при помощи рациональных чисел с точностью до данного рационального числа с>0, если найдены два рациональных числа а и b (результаты вычисления по недостатку и по избытку) такие, что а<bу b — а<с и искомый результат вычисления заключён (в определённом смысле для данного вычисления) между а и Ь. Но по теореме 5 существует целое k такое, что

Далее, по теореме 4 найдутся целые числа I и m такие, что

а1 = /л*^а<(/+ l)nk и (m — I) nk ^ b <mnk = bi.

Так как интервал (au bx) шире (a, b)y то естественно считать результат вычисления заключённым между аг и bv Далее,

Таким образом, ах и Ьх служат приближениями по недостатку и по избытку с помощью л-рациональных чисел с тою же степенью точности с. Рассуждая аналогично, можно и число с заменить меньшим уже ^-рациональным числом.

Однако для точного выражения результата вычисления недостаточно не только ^-рациональных, но и всех рациональных чисел.

Пусть, например, надо найти длину отрезка MN, если отрезок AB принят за единицу измерения. Искомая длина есть отношение отрез-

ков MN и AB. Если отрезки AB и MN соизмеримы, то имеется их общая мера CD, содержащаяся р раз в MN и q раз в AB. Тогда MN:AB=-^--число рациональное. Обратно, если отношение MN:AB = y — рационально, то делим отрезок AB на q частей (одна из них р раз уложится в MN), следовательно MN и AB будут соизмеримы. Из геометрии известно, что существуют несоизмеримые отрезки. Так, диагональ квадрата несоизмерима с его стороной. Приняв стороны квадрата за единицу измерения отрезков, мы не можем выразить длину его диагонали никаким рациональным числом.

Рациональных чисел недостаточно также для извлечения корней из положительных рациональных чисел и даже из натуральных чисел. В самом деле, если, например, р — простое число, п — натуральное число, большее единицы, то typ не может равняться рациональному числу. Иначе, typ= ~ с натуральными q, г (если для чётного п взять положительное значение корня). Тогда р = -рр и

prn=qn. (4)

Если в разложении числа q на простые множители р встречается а раз, а в разложении числа г встречается b раз, то в левой части равенства (4) р войдёт множителем /za+l, а в правой части — nb раз. Но па +1 ф nb, так как второе число делится на п, а первое не делится. Таким образом, в разложении на простые множители левой и правой частей равенства (4) простое число р входит неодинаковое число раз, что противоречит однозначности разложения натурального числа на простые множители1).

В следующей главе мы займёмся расширением поля рациональных чисел до поля действительных чисел, в котором измерение отрезков и извлечение корня из положительного числа дают точный результат.

1) См. статью А. Я. Хинчина.

ГЛАВА VI

ПОЛЕ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ

§ 24. Полные и непрерывные поля

Ещё в Древней Греции было известно существование несоизмеримых отрезков. Стремление получить для их отношения точное числовое значение должно было бы привести к понятию иррационального числа. Однако строгое обоснование этого понятия оказалось не под силу учёным древности. Стремясь к строгому обоснованию математических положений, они придавали им геометрическую форму. Примером этой своеобразной геометрической алгебры могут служить «Начала» Евклида.

В Средние века индусы пользовались иррациональными выражениями, не вдаваясь в вопросы их обоснования. С развитием анализа в XVII и XVIII вв. действительные числа становятся основным объектом исследования. При этом с ними оперировали на основе наглядных представлений, изображая числа точками прямой линии.

Ко второй половине XIX в. потребность формального построения теории действительного числа назрела настолько, что она была построена рядом математиков (Дедекинд, Кантор, Вейерштрасс). Все эти построения, по форме совершенно различные, равноправны в том смысле, что приводят к изоморфным числовым областям. Мы приведём ниже построение Кантора как наиболее тесно связанное с понятием предела, рассмотренным выше. В литературе чаще встречается построение Дедекинда, с которым читатель может познакомиться по книге самого автора [10]; прекрасное изложение теории Дедекинда, богатое ценными методологическими указаниями, дано в книге А. Я. Хинчина [11].

Как было показано в конце § 23, отношение отрезков и корень из положительного рационального числа не всегда выражаются рациональными числами. Мы хотим теперь расширить поле рациональных чисел Г до поля действительных чисел D, в котором эти задачи (а также широкий класс других задач) были бы всегда разрешимы.

Чтобы понять, какие свойства чисел нужны для разрешимости этих задач, и притти тем самым к целесообразному определению поля действительных чисел, разберём эти две задачи подробнее.

Пусть надо найти отношение отрезков AB и MN. Тогда мы откладываем на отрезке MN от точки M отрезок ММ1 — AB, затем от М1 в том же направлении MtM2 = AB и т. д. По геометрической аксиоме Архимеда найдётся натуральное число п такое, что, отложив таким образом л раз отрезок AB, мы получим отрезок п • AB>MN. Таким образом, множество тех целых чисел k, для которых k • AB ^ MN, ограничено сверху и непусто, ибо число О ему принадлежит. Поэтому это множество содержит наибольшее число а0 (§ 21, теорема 5). Если а0 + 1 = то

а0. AB^MN<b0> AB.

Естественно считать, что искомое отношение MN:AB лежит между а0 и Ь0. Далее, делим AB на 10 равных частей и для одной из них AiBl повторяем наше рассуждение. Получим целые числа а[ и b[ = a[+ 1, для которых,

а[. Afi^MN^bl - AtBu

или, полагая

имеем:

Так как

AtBt =а0 - AB^MN<b0 - АВ= ЮЬ0 - AtBv

то по максимальности а[ будем иметь:

откуда и

Повторяя те же рассуждения, получим две последовательности чисел ап и Ью удовлетворяющие условиям

(1)

Искомое отношение отрезков MN и AB естественно считать лежащим между ап и Ьп. Числа каждой из этих последовательностей всё более приближаются к этому отношению. Каково бы ни было данное положительное рациональное число е, можно найти такое натуральное число п0, что числа ап и Ьп различаются между собой (а значит, и от искомого отношения) меньше чем на е при любом n>nQ. В самом деле, существует п0, для которого у^-<е(§23, теорема 5), а потому Ьп — аЛ = у^<е при п>п0.

Пусть надо найти у а , где а — положительное рациональное и k > 1 — натуральное число. Будем говорить лишь о положительном значении корня. Берём любое целое число п^О. Так как 10~л>0, то по аксиоме Архимеда существует натуральное число m такое, что 10~п>а+ I. Для любого рационального Ь>1 и любого натурального &>1 имеем: bR~l>l (§ 10, теорема 4), откуда bk>b. Поэтому

(т . 10-n)*>/«. 10-л>а+1>а.

Множество А тех целых чисел /, для которых (/ • 10~n)k ^ а, ограничено сверху и непусто, так как содержит число 0. Поэтому оно содержит наибольшее число а'п. Если

Ь'п=а'п+1, an = än.\0-\ bn = b'n.\0-\

то

a^a<Tbk.

Естественно считать, что искомый корень у а лежит между ап и Ьп. Далее, Ьп — ая=10~л. Так как числа вида m • 10~л являются также числами вида

то

Так как то

откуда

Итак, мы снова получаем последовательности ап и Ьп с теми же свойствами (1). Мы принимаем, что искомый корень при любом п лежит между ап и Ьп. О приближений этих чисел к значению корня можно сказать точно то же самое, что было сказано в случае отношения отрезков.

Всё дело заключается, однако, в том, что такого числа, к которому числа ап и Ьп приближались бы вышеописанным образом, среди рациональных чисел может не быть. Для того чтобы такое число нашлось для любых последовательностей рациональных чисел ап и Ъп со свойствами (1), приходится вводить новые (нерациональные) числа. Для их введения надо точно определить понятие последовательности и её свойства.

Определение 1. Последовательностью элементов данного непустого множества M называется функция (§ 3, определение 1) f(n) = an, определённая на множестве N всех натуральных чисел, значение которой принадлежит множеству М. Иными словами, последовательностью называется всякое соответствие, сопоставляющее с каждым натуральным числом п некоторый элемент ап множества М.

Последовательность обозначается символами al9 а2, а3, ... или {ап). Элемент ап называется п-м членом последовательности {ап}.

Заметим, что члены последовательности не обязательно должны быть различными элементами множества М.

Приведём несколько примеров последовательности.

1. Последовательность натуральных чисел 1, 2, 3, ... = {#}.

где ап есть остаток от деления п на 2.

6. 2, 3, 5, 7, ... = {/7л}, где рп — п-е простое число. Здесь мы не можем дать общую формулу для п-го числа рп. Тем не менее данная последовательность точно определена. Надо лишь воспользоваться индуктивным определением (§ 15, определение 1), положив /(1) = 2, /(/г) есть наименьшее простое число, большее числа f(n— 1). Эти условия определяют единственную функцию, заданную на множестве всех натуральных чисел (§ 15, теорема 1). Этот пример показывает, что функция не обязательно должна задаваться некоторой формулой, определяющей её значение через значение аргумента.

Нижеследующие понятия имеют смысл не для любого множества, а лишь для упорядоченного множества или расположенного кольца. Мы ограничимся, однако, только нужным для дальнейшего случаем расположенного поля, содержащего поле рациональных чисел.

Итак, во всём этом параграфе под Р следует понимать расположенное поле, содержащее в качестве подполя поле рациональных чисел Г. Всё сказанное в этом параграфе о поле Р остаётся справедливым (в силу изоморфизма, установленного в § 23, теорема 2) для любого расположенного поля Q с заменой рациональных чисел г на соответствующие им элементы re, где е — единица поля Q.

Определение 2. Последовательность {ап\ элементов поля Р называется ограниченной сверху (соответственно снизу), если существует элемент а поля Р такой, что ап<а (соответственно ап>а) для всех п. Она называется ограниченной, если она ограничена и сверху и снизу или (что то же самое) если существует элемент а>0 поля Р такой, что | ап|<а для всех п.

Среди приведённых выше примеров последовательность 4 не ограничена ни сверху, ни снизу, а 2, 3, 5 ограничены.

Следующее понятие является одним из основных понятий всей математики.

Определение 3. Элемент а поля Р называется пределом последовательности {ап\ элементов Р, если для любого положительного элемента е из Р существует (зависящее от е) натуральное число п0 такое, что \ап — а | < е для любого п > п0. Пишут: а= \iman («предел ап при п, стремящемся к бесконечности») или просто a = \iman («предел ап»). Последовательность {ап}, имеющая предел а, называется сходящейся к а или просто сходящейся. Последовательность, не имеющая предела (в Р), называется расходящейся.

Из приведённых выше последовательностей только две сходятся: последовательность 2 к числу 0 и последовательность 5 к числу 2. В самом деле, для последовательности 2 имеем:

для последовательности 5 также

Но по аксиоме Архимеда для поля рациональных чисел (§ 23, теорема 3) для любого рационального е>0 существует натуральное я0>у. Тогда '^"<С^"<С6 для любого п>п0.

Последовательность 3 расходится. Правда, для любого е>0 и любого п0 найдётся п'>п0 такое, что \ant — 0 | = 0<е и п">п0 такое, что \апч—1 | = 0<е, но для s^l не существует такого щ, чтобы одно из указанных неравенств выполнялось для любого п>п0. В самом деле, если, например, \ап — 0| = |ал]<е^ 1, то ап = 0. Следовательно, ап+1 = 1 и | апН — 01 = 1 ^ е.

Понятие предела последовательности сходно с понятием алгебраической операции (§ б, определение 1). Там упорядоченной паре элементов, а здесь упорядоченной по типу множества натуральных чисел {1, 2, 3, ...} системе элементов соответствует некоторый элемент того же множества. Поэтому иногда говорят об «операции

предельного перехода». Разумеется, это уже не алгебраическая операция в смысле определения 1 из § 6.

Возникает вопрос о выполнимости и однозначности операции предельного перехода. Что не всякая последовательность имеет предел, мы уже видели на примере последовательности 3. Вопрос об единственности предела решается утвердительно. Именно:

Теорема 1. Если последовательность элементов поля Р имеет предел, то только один.

Доказательство. Пусть \\тап = а и Ь ф а. Покажем, что b уже не будет пределом нашей последовательности. Наглядное представление говорит, что элементы ап, приближаясь к а, отойдут для больших номеров от Ь. Формально это доказывается так. Так как афЬ, то \а — £|>0 и ^-^^>0. Если также \\тап = Ь, то существуют натуральные числа пх и п2 такие, что \ап — а\<С—2 при любом п>пх и I ап — £j<'-^-^-! при любом п>п2.

Если nQ — большее из чисел пх и п2, то при п>п0 получим:

т. е. \а — Ь\<\а— b \, что невозможно.

Отложив пока вопрос об условиях существования предела, найдём некоторые свойства операции предельного перехода в случае её выполнимости.

Теорема 2. а) Если одна из последовательностей \ап] и \Ьп) элементов поля Р сходится и если lim(an — Ьп) = 0, то и другая последовательность сходится, причём Inn ап = lim bn.

Обратно, если обе последовательности сходятся и если Мтап = = lim bn, то \ш(ап — Ьп) = 0.

Далее, если последовательности {ап} и {Ьп} из Р сходятся, то

б)

в) г)

при условии, что limЬпфО и ЬпфО при любом п.

Сходимость последовательностей в левых частях равенств б), в), г) не предполагается, а следует из сходимости последовательностей {ап\ и {Ьп}.

д) Если lim ап > lim bn, то существует элемент е>0 из Р и натуральное число щ такие, что ап — Ьп>е при любом п>п0. Если существует натуральное число п0 такое, что ап^Ьп при любом п>щ, то lim ап^lim bn.

Доказательство, а) Пусть, например, последовательность {ап\ сходится, причём \\тап = а. Тогда для любого е 0 из Р существуют натуральные числа пх<Щ такие, что \ ап — а[<у при любом n>nt и \ап — #Л|<С~§~ ПРИ ЛК)бом п>п.2. Если п0 — большее из чисел пх и /г2, то

Таким образом,

Второе утверждение пункта а) следует из пункта б).

Пусть теперь последовательности {ап) и {Ьп\ сходятся, причём lim ап = а и lim bn = b.

б) Для любого е>0 существуют натуральные числа пх и я2 такие, что \ап — а\<~ при любом п>пх и \Ьп — ^1<4" при любом /г>/г2. Если п0 — большее из чисел пг и /г2, то при любом п>п0 будет:

Таким образом,

в) Сначала покажем, что сходящаяся последовательность {ап\ ограничена (см. определение 2). Так как lim ап = а, то существует р такое, что \ап — а|<0 при любом п>р. Тогда

при п>р. Среди конечной совокупности элементов \at\9 |а8|, ... ...,|ар|, 1-(-|а| поля Я существует наибольший элемент а' (§ 5, теорема 6). Если положим с = а'+19 то с^1>0 и \ап\<с для всех п.

Далее, берём любой элемент d>\b\, например d = \b\+l. Тогда, очевидно, d>0. Так как \\тап = а и \imbn = b, то для любого е>0 из Р существуют натуральные числа пх и /г2 такие, что \ап — а1<С^пРи любом л и |&д — ^1^^ при любом #>#2* Если я0 — большее из чисел щ и /г2, то

при любом /г ]>/?()• Таким образом,

lim (anbn) = ab = lim an • lim bn.

r) Сначала докажем, что при условии Hm bn = b ф 0 существует натуральное число пх такое, что \Ьп\>-^- при любом n>nt. Существует натуральное число р такое, что \Ьп — #|<^ при любом п>р. Если бы доказываемое утверждение было неверно, то для числа р нашлось бы число q>p такое, что \bq |<С 2 • Тогда

т. е. |&|<|&), что невозможно. Последовательность \ап} сходится, а потому ограничена, т. е. существует элемент с>0 из Р такой, что \ап\<с при любом п.

Наконец, из \\тап = а и \\mbn = b следует, что для любого е}>0 из Р существуют натуральные числа я2 и п3 такие, что I ап — а\<С 2^ при любом п>щ и \Ьп — Ь\<г-^- при любом п>пъ (ибо для b ф О всегда £2 = |£|2>0). Пусть п0 — наибольшее из чисел пи п2 и пг. Тогда

при любом п>п0. Таким образом,

д) Пусть а>b. Берём е = ^-у-^>0. Существуют натуральные числа пх и #2 такие, что \ап — а | <е при любом п>гп и \Ь п — Ь\<е при любом п>По. Пусть щ — большее из чисел пх и п2. Если при некотором п>п0 будет ап — Ьп^е, то для такого п найдём:

a — b = (a — aj + (an — b)+(bn — £)<е + е-|-е = Зе = а — Ь9

что невозможно. Стало быть, ап — Ьп>е при любом п>п0. Пусть, обратно, ап — Ьп^0 при любом п>п0. Если бы было а<b, то по доказанному существовали бы е>0 и пх такие, что Ьп — ая>е>0 при любом n>nv Беря любое п больше как /г0, так и п19 получим: ап^^п и Ьп>ап> что невозможно. Следовательно, а^Ь. Теорема доказана.

Если последовательность имеет предел, то её члены, приближаясь к этому пределу, должны сближаться между собой по мере роста их номеров. Дадим точное определение этого свойства последовательности.

Определение 4. Последовательность {ап\ элементов поля Р называется фундаментальной (или последовательностью Коши), если для любого элемента е>0 из Р существует натуральное число п0 (зависящее от е) такое, что\ар — aq\<e для любых р и q, больших п0.

Теорема 3. Всякая сходящаяся последовательность элементов поля Р является фундаментальной.

Доказательство. Пусть \\тап = а. Для любого е>0 из Р существует натуральное число п0 такое, что \ап — а|< при любом п>п0. Если тогда р>п0 и q>nQ, то по свойству абсолютных величин [§ 10, (3)] найдём:

т. е. последовательность {ап} — фундаментальная.

Эта теорема даёт необходимый признак сходимости последовательности: для того чтобы последовательность была сходящейся, необходимо, чтобы она была фундаментальной. Однако это условие не для любого поля Р является достаточным. Так, в поле рациональных чисел, как мы сейчас увидим, существуют фундаментальные последовательности, не имеющие (в этом поле) предела.

Вернёмся ещё к задачам об отношении отрезков и извлечении корня. Для каждой из них мы построили две последовательности рациональных (даже десятично-рациональных) чисел ап и Ьп со свойствами (1). Легко видеть, что каждая из них будет фундаментальной. Для любого рационального е существует натуральное п0 такое, что тол"0<Се (§ 23, теорема 5). Тогда для любых рид, где, например, р^д>п0, получим:

и аналогично этому \Ър — bq\<e.

Если данная задача имеет решением рациональное число с, то с должно быть пределом обеих последовательностей {ап\ и {Ьп\. В самом деле, в случае отрезков с • AB = MN<C^bn* AB, откуда C<CV Также ап • AB^MN=c - AB, откуда ап^с. В случае корней с* = а, откуда ап^ с<Ьп, так как из ап>с следует akl>ck = a и из Ьп^с следует bk^ck = a, что противоречит построению

чисел ап и Ьп. Но из ап^с<bп следует, что для любого е>0 существует п0 такое, что у^-<Се» и тогда при п>по будет:

и аналогично

Итак, каждый раз, как задача имеет решение, она решается предельным переходом.

Обратно, если, например, последовательность {ап\ имеет рациональный предел с, то и \imbn = c, причём число с решает данную задачу. В самом деле, из lim ап = с следует ап^ с^Ьп для любого п. Иначе при некотором пх будет аП1>с и при любом п>пх имеем:

или же при некотором щ будет bnçf<c и при любом п>п2 имеем:

^<*«^*iij<c» \ап — с\ = с — ал>с — Ьпъ

что противоречит определению предела. Но из ай^с^bni как выше мы видели, следует lim ап = lim bn = с.

То, что число с решает поставленную задачу, будет для извлечения корня следовать из более общей теоремы и притом сразу для всех действительных чисел. Здесь мы докажем, что если построенные в начале параграфа для рационального числа а>0 и натурального числа k>l последовательности рациональных чисел {ап} и {Ьп\ имеют рациональный предел с, то ck = a. Предположим, что ск<а. Так как \\mbn = cy то по теореме 2, в) также \\mbki = ck. Следовательно, существует натуральное число п0 такое, что | bkn — C*\<C <а — ск при любом п>п0. Но из Ьп^с^ап^О следует Ькп^ск. Поэтому

откуда Ь^<ау что противоречит построению числа Ьп. Так лее доказывается, что не имеет места неравенство ск>а. Таким образом, с = а, с=у а.

Если рациональное число а>0 таково, что не существует рационального числа с, для которого ск = а (см. конец § 23), то последовательности \ап\ и {Ьп\у построенные для этих а и k> не имеют предела в поле рациональных чисел, хотя являются фундаментальными.

В случае отношения отрезков надо доказать, что если построенные для отрезков AB и MN последовательности рациональных чисел {ап} и \Ьп) сходятся к рациональному числу с, то с и будет отношением этих отрезков, т е. ç*AB — MN. Пусть это не так,

тогда, например, с • AB<MN, или с • AB = MNV причём отрезок MNi составляет часть отрезка MN. Как бы мал ни был отрезок MtM, по геометрической аксиоме Архимеда найдётся натуральное k такое, что k • MtM>AB. Но I0fe>£ [§ 23, (3)] и 10/с • МхМ>АВ, откуда AB Wk^^iN. Число ак определялось так, что

где

Но из ak^c следует, что

что невозможно ввиду bk - АВ> МЫ. Также придём к противоречию, предположив, что с- AB>ММ. Таким образом с- AB = MN.

Если отрезки AB и ММ несоизмеримы, то их отношение не может выражаться рациональным числом, а потому построенные для отрезков последовательности рациональных чисел \ап\ и \Ьп) не имеют предела в поле рациональных чисел, хотя и являются фундаментальными.

Итак, в поле рациональных чисел существуют фундаментальные последовательности, не имеющие предела.

Определение 5. Расположенное поле называется полным, если оно обладает следующим свойством:

XII (аксиома полноты). Любая фундаментальная последовательность элементов данного поля сходится, т. е. имеет предел в этом поле.

Из сказанного выше вытекает

Теорема 4. Поле рациональных чисел Г не является полным.

Мы дали выше два доказательства этой теоремы, построив расходящиеся фундаментальные последовательности рациональных чисел для несоизмеримых отрезков и для рационального числа, не являющегося k-й степенью никакого рационального числа. Доказательство с помощью отрезков опиралось на положения геометрии, которые здесь не обосновывались. Другое же доказательство опиралось лишь на доказанные нами свойства рациональных чисел и потому может считаться доведённым до конца.

Замечание. Введённые выше понятия фундаментальной последовательности, её предела и связанное с ними понятие полного поля имеют одно свойство, коренным образом отличающее их от введённых ранее понятий: алгебраических операций, расположения и архимедовского расположения. Именно, пусть дано поле Р и его подполе Р'. Если для элементов а, Ь, с из подполя Р' имеет место соотношение а+Ь = с, то это соотношение по самому определе-

нию подполя (§ 8, определение 3) сохраняется и в поле А Обратно, если а+Ь = с в Я, причём элементы а, Ь> с входят в Р\ то и в Р' будет а -|- Ь = с. То же верно для отношения ab = с. Если поле Р расположено, то этим порождается расположение Р\ Именно, считаем а)>0 в Р' тогда и только тогда, когда а)>0 в Р. Легко видеть, что свойства расположения IX и X (§ 10, определение 1) будут в Р' выполнены, т. е. Р' будет расположенным полем. Такое свойство расположения Р' быть архимедовским не зависит от того, рассматриваем ли мы Р' само по себе или как подполе поля Р. В самом деле, отношение пе>а для элементов е и а из Р' тогда и только тогда имеет место в Р\ когда оно имеет место в Р (при условии совпадения порядка). В этом смысле понятия, введённые в главе II, являются абсолютными. Они не зависят от объемлющего поля. Понятия же данного параграфа, указанные выше, зависят от поля, в котором данные элементы рассматриваются, и в этом смысле эти понятия относительны. Так, отношение \iman = a означает, что для любого элемента е>0 из поля Р существует натуральное число п0 такое, что \ап — #|<Се ПРИ любом п>п0. Определение фундаментальной последовательности также содержит упоминание любого элемента е>0 поля Р. Но запас этих элементов е зависит от выбора поля Р\ и нет основания ожидать, что если все эти элементы последовательности \ап] и а входят в подполе Р' поля Я, то смысл отношения 1^0^ = 0: и свойство фундаментальности последовательности \ап\ в Р и в Р будут совпадать. Ясно лишь, что из выполнения одного из условий в Р следует его выполнение в Р', ибо то, что верно для любого е>0 из Р и для данных элементов из Р\ останется верным, в частности, и для любого е>0 из Р'\ но обратного заключить нельзя. Покажем на примере, что это действительно так.

Пусть Р—поле рациональных функций (т. е. алгебраических fix) дробей)—^Л, где f(x)ug(x)— многочлены с рациональными коэффициентами. Считая функцию ~v^ положительной, если старшие коэффициенты многочленов f(x) и g(x) имеют одинаковые знаки, получим расположение поля Р. Оно не будет архимедовским, так как при любом натуральном л будет х — п = —j—>0, откуда п-\<х. Итак, X больше всех рациональных чисел. Если а>0 рационально, то и а-1>0 рационально и а'1 <х. Умножая на ~>0, найдём — < а. Итак, — меньше всех положительных рациональных чисел. Поле Р содержит подполе Г рациональных чисел.

В Г последовательность !—}, п=1, 2, 3, ..., сходится к числу 0 и, следовательно, фундаментальна, но в поле Р будет — = — }> — при любом /г, и 0 уже не будет пределом этой последовательности,

В Р она вообще не может иметь предела, так как не будет фундаментальной. В самом деле, при р ф q число

и рационально. Таким образом

Легко видеть, что в поле Р последовательность рациональных чисел \ап) фундаментальна тогда и только тогда, когда она становится стационарной, т. е. существует рациональное а и п0 такие, что ап = а при любом п>п0. Тогда, очевидно, \iman = a. Таким образом, перенося операцию предельного перехода с поля Р на подполе Г, мы получим полное поле, хотя Г неполно в смысле данного выше определения 5.

Тем не менее в одном случае введённые в этом параграфе понятия остаются абсолютными. Именно:

Теорема 5. Для того чтобы понятия предела и фундаментальной последовательности в поле Р совпадали с теми же понятиями в любом его подполе Р\ необходимо и достаточно, чтобы расположение поля Р было архимедовским1).

Доказательство. Если поле Р расположено неархимедовски, то существует элемент с такой, что п<с для любого натурального п. Так как поле рациональных чисел Г архимедовски расположено, то а<с для любого рационального а. Тогда при а>0 и рациональном, умножая а<с на — >0, найдём —<—, т. е. 0< — <b, где ^ = ~—любое рациональное положительное число. Очевидно, последовательность |—1, п—\, 2, 3, ... , рациональных чисел в поле Г сходится к числу 0 и потому фундаментальна. Но та же последовательность в поле Р не является фундаментальной и потому не имеет предела. В самом деле, берём: е = у >0. Тогда при рфс будет: у — -^-|>е. Стало быть не существует числа п0 со свойством --у <е при любых рид, больших п0. Необходимость доказана.

Пусть теперь поле Р архимедовски расположено. Покажем независимость свойства последовательности {ап\ быть сходящейся или

1) Из доказательства этой теоремы следует, что архимедовость расположения поля Р необходима даже для того, чтобы понятия предела и фундаментальной последовательности совпадали в поле Р и содержащемся в нём поле рациональных чисел Г. Другими словами, если фундаментальные и сходящиеся последовательности в поле Г остаются такими же и в поле Р, то поле Р архимедовски расположено. Этим мы воспользуемся в начале следующего параграфа.

фундаментальной от подполя Р', содержащего элементы ап и (для случая сходимости) предел a = liman. Из выполнения этих свойств в Р следует их выполнение в Р'. Пусть, например, \\тап = а в Р'. Покажем, что то же будет и в Р. Берём любой элемент е>0 из Р. Так как Р архимедовски расположено, то существует натуральное #>у, откуда 0< — = е'<е. Число е'>0 входит в любое подполе поля Р, а следовательно, и в Р'. Так как в Р дано \iman = a, то существует натуральное п0 такое, что \ап — а|<е'<е при любом п>п0. Это означает, что \\тап = а также и в поле Р. Теорема доказана.

Определение 6. Полное, архимедовски расположенное поле называется непрерывным.

В непрерывном поле задачи об отношении отрезков и извлечении корня из положительного элемента всегда разрешимы. К задаче об извлечении корня мы ещё вернёмся в § 26. Скажем несколько слов об отношении отрезков. Если бы нам удалось расширить поле рациональных чисел Г до непрерывного поля Р, то по последней теореме последовательности рациональных чисел \ап\ и \Ьп}, построенные выше для данных отрезков AB и MN, были бы фундаментальными не только в Г, но и в Р. Так как поле Р полно, то они имели бы общий предел с [теорема 2, а)]. Элемент с по определению можно принять за отношение данных отрезков, т. е. считать, что MN: АВ = с или MN=c- AB. Это новое определение отношения в случае соизмеримых отрезков согласуется, как выше показано, с прежним определением (см. конец § 23). Но, в то время как прежнее определение годилось лишь для соизмеримых отрезков, новое определение даёт определённый элемент поля Р для любых отрезков независимо от их соизмеримости. В этом смысле задача об отношении отрезков разрешима в непрерывном поле Р. Мы рассмотрели эту задачу лишь для иллюстрации важности понятия непрерывного поля и не можем остановиться на этой геометрической задаче подробнее.

Заметим уже без доказательства, что определённое выше отношение отрезков обладает всеми нужными свойствами. Именно, для любых отрезков А В и CD и любых элементов с>0 и d>0 непрерывного поля Р будет:

Далее, для любого отрезка А В и любого элемента с>0 из Р существует отрезок MN такой, что MN:AB = c.

К задаче о длине отрезка сводится задача о длине окружности. Мы строим две последовательности правильных многоугольников (вписанных и описанных) путём удвоения числа сторон. Зная

отношение отрезков, мы можем найти периметры ап и Ъп п-го вписанного и п-го описанного многоугольника. Известными из школы рассуждениями можно показать, что ах <а>2<... и Ьх> >*«>... Далее ая<*я и Ш(ЬЛ—ап) = 0.

Отсюда легко вывести, что обе последовательности, { ап } и { Ьп }, элементов поля Р фундаментальны и в силу полноты Р имеют в нём общий предел с. Элемент с поля Р по определению принимается за длину окружности. Аналогично определяется длина дуги данной окружности. Можно показать, что длина дуги заключена между нулём и длиной окружности с и, обратно, для каждого элемента с' поля Р такого, что 0<с'<с, можно найти дугу данной окружности длины с'. В этом смысле задача о длине дуги окружности также решается в непрерывном поле Р.

В следующем параграфе мы увидим, что непрерывное поле и будет полем действительных чисел.

§ 25. Определение поля действительных чисел

В поле рациональных чисел Г не всегда выполнима операция предельного перехода для фундаментальной последовательности, т. е. поле Г не является полным (§ 24, теорема 4). Следуя общему плану расширения числовых совокупностей, намеченному в § 18, мы расширим поле Г до нового поля D, в котором было бы определено расположение и любая фундаментальная последовательность имела бы предел. При этом мы хотим, чтобы операция предельного перехода, не всегда выполнимая в Г для фундаментальных последовательностей, в новом поле D для тех же последовательностей из Г была уже выполнима. Стало быть, фундаментальные последовательности из Г должны оставаться фундаментальными и в D. Это означает, что D должно быть полным и архимедовски расположенным полем (§ 24, теорема 5). Иными словами, D должно быть непрерывным полем. Как и в случае целых (§ 20) и рациональных (§ 22) чисел, мы ищем минимальное расширение с нужными свойствами. Однако оказывается, что условие минимальности будет выполнено само собой, так как требование непрерывности определяет поле однозначно с точностью до изоморфизма. Поэтому было бы излишним включать в определение требование минимальности. Так, мы приходим к определению:

Определение 1. Полем действительных чисел называется непрерывное поле D, содержащее в качестве подполя поле рациональных чисел Г. Элементы поля D называются действительными числами.

Доказательство существования и единственности поля D, удовлетворяющее этому определению, проходит аналогично случаю кольца целых чисел (§ 20) и поля рациональных чисел (§ 22). Начнём ç доказательства единственности.

Теорема 1. Расположенное поле Р, содержащее поле рациональных чисел Г1) архимедовски расположено тогда и только тогда, когда каждый элемент поля Р равен пределу последовательности рациональных чисел.

Доказательство, а) Пусть элемент а поля Р равен пределу последовательности рациональных чисел {ап}. Тогда существует k такое, что \ak — а\<1, откуда

a^\a\ = \(a — ak) + ak\^\a — ak\ + \ak\<l + \ak\.

Так как 1 —|— | ää | — рациональное число и поле рациональных чисел архимедовски расположено, то существует натуральное число п такое, что 1 +1ah\<Сп- Тогда а<п, т. е. поле Р архимедовски расположено (§ 10, ХГ).

б) Пусть поле Р архимедовски расположено. Тогда для любого элемента а из Р и любого натурального числа п существуют натуральные числа mt и 1щ такие, что

откуда (—Щ) • — <Са- Следовательно множество А тех целых чисел /, для которых /.~^а, ограничено сверху числом т1 и непусто, ибо содержит целое число —т%. Поэтому множество А содержит наибольшее число m (§ 21, теорема 5). Тогда, очевидно,

~-^а<—"j—• Вычтя — из обеих частей неравенства, найдём: ^ а — — . Положим — = а„ и покажем, что lim а„ = а. Для любого £>0 из Р существует натуральное #0>~~> откуда

при любом п>п0. Это и значит, что \iman = a в поле Р.

Теорема 2. Все поля действительных чисел изоморфны, т. е. поле действительных чисел определено однозначно до изоморфизма. Точнее, если Dx и D2 — два поля действительных чисел, то существует только одно изоморфное отображение Dx на D2, сохраняющее отношения порядка. При этом изоморфизме рациональные числа остаются на месте. В частности, существует только одно изоморфное отображение поля действительных чисел на себя, сохраняющее отношения порядка, а именно тождественное. (В силу теоремы 2 из § 23 данная теорема остаётся справедливой

1) Условие Я zd Г можно здесь и ниже опустить, заменив рациональные числа на рациональные элементы поля (§ 22, теорема 2).

для любых непрерывных полей с заменой рациональных чисел рациональными элементами1).

Доказательство. Строим отображение / поля Dx в поле D* следующим образом. Пусть dt—любой элемент поля Dv Так как Dx архимедовски расположено, то по теореме 1 dt = lim ап с рациональными ап. Таким образом, последовательность {ап\ фундаментальна в Du а потому и в его подполе Г. Так как Tœ:D2 и D2 архимедовски расположено, то последовательность {аЛ}, фундаментальная в Г, будет фундаментальной и в D2 (§ 24, теорема 5). Так как Z)2 полно, то \iman=d<i в D2. Мы положим f(dl) = d2.

Покажем, что элемент d2 не зависит от выбора последовательности рациональных чисел \ап}. Если ещё \imbn— dt с рациональными Ьп> то \\man=\imbn, откуда Пш(ад — Ьп) = 0 [§ 24, теорема 2, а)] в Du а следовательно, в Г. Рассуждая, как выше, мы найдём, что Нт(аЛ — Ьп) = 0 bD2 и lim an = \im bn = d2. Если dx— рациональное число, то \\man = dv где an = d1 при любом п. Таким образом, f(dt)=du т. е. отображение /оставляет на месте рациональные числа.

Если с1 ф dv и c1 = \iman, dî = \imbn, то \im(an — Ьп)фО и lim ап ф lim bn в D2, т. е. f(ct)^f(di). Итак, отображение / является взаимно однозначным отображением Dx в D2- Оно зависит от определения предела в Dt и D2, а потому зависит от отношений порядка в этих полях.

Покажем, что / есть изоморфное отображение Dx в D2. Надо показать, что для любых элементов сх и dx из Dx будет:

/(с, + dt) =f(Cl) +/(</,), f^dr) =f(c1)f(dl).

Это легко следует из теоремы 2, б), в) § 24, именно, если сх = lim ani dt= lim bn, то, применяя определение отображения/, имеем:

и аналогично доказывается второе равенство.

Покажем, что отображение / сохраняет отношение порядка. Пусть c1<d1 в поле Dt и сх = \\тап, dl = \imbn. Тогда существует п0 такое, что ап<bп при любом п>п0 [§ 24, теорема 2, д)] и \\man^\\mbn в D2, т. е. f(ci)^f(di)-

Но из Cj ф dx следует:/^) ф f(dx). Таким образом,/(Ci)<]/(rfi).

Покажем, что / является единственным изоморфным отображением Dt в D2, сохраняющим отношения порядка. Пусть g — другое

1) В § 26 мы увидим, что ограничение изоморфизмами, сохраняющими отношения порядка, можно отбросить, так как поле действительных чисел допускает единственное расположение.

отображение такого рода. При изоморфизме g поле рациональных чисел Г, содержащееся в Dv отобразится изоморфно на поле рациональных элементов поля D2, причём рациональное число г перейдёт в элемент re, где е — единица поля D2 [§ 23, теорема 2]. Но D2 содержит Г, т. е. e=l, ге = г • 1 — г. Следовательно, g(r) = r для любого рационального г. Так как отображение g отлично от /, то существует элемент dx из Dt такой, что a2=f(d1)^g(d1) = b<2. Найдём рациональное число с, лежащее между а2 и ô2. Пусть, например, а2<£2. Рассуждая, как и в доказательстве теоремы 1, пункт б), найдём сначала натуральное п такое, что —<Ъ2 — аъ а затем целое число m такое, что —=^а2<С——• Если с =--, то получим:

Так как с = f(c) и / по доказанному сохраняет отношения порядка, то из f(d1) = a2<c следует: dt<c. Так как g (с) —с и g также сохраняет порядок, то

что противоречит построению числа с.

До сих пор мы не использовали полноты поля Dv Стало быть, всё доказанное выше верно для любого архимедовски расположенного поля Dv Нам осталось доказать, что построенное отображение / является отображением поля Dx на всё поле Dq. Для этого нужна полнота поля Dx. Надо для любого элемента d2 из D2 найти элемент dt из Dt такой, что f(d1) = d<2. Так как D2 архимедовски расположено, то по теореме 1 ^2 = Нтад с рациональными ап. Последовательность {ап\, фундаментальная в D2, будет фундаментальной в Гс=:£)2, а следовательно, и в поле DjCuT. Так как Dx полно, то существует d1 = \iman в Dt. По определению /тогда f(d1) = d9l. Теорема доказана.

Теорема 3. Любое архимедовски расположенное поле Р изоморфно некоторому подполю поля действительных чисел D. Существует лишь одно изоморфное отображение Р в D, сохраняющее отношения порядка. В частности, поле Р только одним способом, а именно тождественно, может быть изоморфно и с сохранением порядка отображено само на себя1).

1) В отличие от теоремы 2 условие о сохранении порядка здесь опустить нельзя. В самом деле, пусть Р— поле_всех чисел вида а+Ъ У 2 с рациональными а и Ь. Отображение а+ЬУ2*—^ — b ]/"2 изоморфно относительно сложения и умножения и отлично от тождественного. Ко оно не сохраняет порядка, заданного в поле Р, как подполе поля действительных чисел, ибо

Доказательство. Поле Р изоморфно и с сохранением порядка отображается на расположенное поле Q, содержащее поле рациональных чисел. Так как Р архимедовски расположено, то то же верно для Q. Для поля Q теорема получается попутно при доказательстве теоремы 2, если заменить там Dx на Q, так как везде, кроме последнего абзаца доказательства, мы не пользовались полнотой поля Dv В силу изоморфизма Р и Q теорема 3 верна также для поля Р.

Итак, если поле действительных чисел D существует, то только одно (до изоморфизма).

Переходим к доказательству его существования. Как и в случае целых и рациональных чисел, достаточно построить одно поле (одну интерпретацию поля), удовлетворяющее определению 1.

Существует несколько приёмов построения такого поля. Мы приведём построение Кантора.

Конструкция одного из изоморфных полей действительных чисел подсказывается теоремой 1. Если D — искомое поле, то каждый элемент поля D равен пределу фундаментальной последовательности рациональных чисел, и любая такая последовательность должна иметь предел в D в силу непрерывности поля.

За исходный элемент построения поля действительных чисел D мы принимаем фундаментальную последовательность рациональных чисел аи а2, а3,... = { ап }, т.е. последовательность, обладающую таким свойством: для любого рационального числа е>0 существует натуральное число п0 такое, что \ар — а7|<е при любых рис, больших л0(§ 24, определение 4). Пусть M—множество всех таких последовательностей. Определяем отношение эквивалентности, сложение и умножение последовательностей из M так, чтобы им соответствовали равенство, сложение и умножение элементов искомого поля D% равных пределам этих последовательностей [§ 24, теорема 2, а), б), в)], а именно,

{«Л-4M (1)

тогда и только тогда, когда

(2) (3)

Надо, конечно, доказать, что (2) и (3) действительно определяют операции во множестве М, т. е. что последовательности в правых частях этих равенств снова являются фундаментальными.

В случае сложения берём рациональное число е>0. Так как {ап} и {Ьп\ фундаментальны, то существуют натуральные

числа /Zj и #2 такие, что \ар— ад\<-^- при любых р, q>nx и I Ьр—^|<у при любых р, <7>/г2. Если /г0 — большее из чисел nv По, то при любых p,q>n0, т. е. последовательность {ап+Ьп} — фундаментальная.

В случае умножения сначала докажем, что любая фундаментальная последовательность {сп} ограничена (§ 24, определение 2). В самом деле существует п0 такое, что \ср — cq | < 1 при любых Ру Я>Щ- Тогда при любом /г>#0. Беря рациональное число с, большее всех чисел \СЛ> I с2 \ спХ кло+iH-1 (например, сумму всех этих чисел плюс 1), получим \сп\<с при любом п.

Итак, существуют рациональные числа а и b такие, что \ап\<а и \bn\<b при любом п. Пусть дано рациональное число е>0.

Существуют натуральные числа пг и /г2 такие, что \ар— ag\<C~^f при любых р, q>nt и \Ьр — Ьд\<-^ при любых р, q>n2. Если п0 — большее из чисел пи щ, то при любых p,q>n0, т. е. последовательность {апЬп\ — фундаментальная.

Последовательность {ап ) из M назовём положительной, если существуют рациональное число s>0 и натуральное число п0 такие, что ап>е при любом п>п0.

Отношение эквивалентности последовательностей (1) обладает основными свойствами равенства (§ 19). Именно:

[§ 24, теорема 2, б)].

По теореме из § 19 это отношение определяет разбиение множества M на классы эквивалентных последовательностей. Будем обозначать эти классы малыми греческими буквами а, ß, 7, 8,...

Определение 2. Пусть D0 есть множество всех классов, эквивалентных последовательностей множества М. Суммой (произведением) двух классов а и ß назовём тот класс а —f- ß (соответственно aß), который содержит сумму (произведение) последовательности класса а и последовательности класса ß. Класс а назовём положительным, если последовательность этого класса положительна.

Покажем, что сумма, произведение и свойство класса быть положительным не зависят от выбора представителей данных классов. Пусть

{ап}~{Ьп\ и {cn}~{dn\.

Тогда

\\т(ап — Ьп) = 0 и \im(cn — dn) = 0,

откуда

lim [(ап + сп) — (Ъп + dn)] = lim (ап — Ьп) + lim (сп — dn) = О,

т. е. {an + cn\~{bn + dn\.

Так как последовательность { сп } — фундаментальная, то она ограничена. Поэтому существует рациональное число с>0 такое, что \сп\<с при любом п. Пусть теперь дано рациональное число е>0. Существует щ такое, что \ап — Ьп\<— при любом п>п0. Тогда Wcn — bncn\ = \an — bn\. (cj<y.c = e при любом п>п0. Следовательно, \\т(апсп — Ьпсп) = 0, т. е.

{anCn}~{f>nC,i}'

Применяя доказанное и очевидную коммутативность умножения последовательностей, находим:

{ апсЛ } ~ { ЬЛсп } = {спЬп} ~ {cndn }.

Наконец, если последовательность { ап } положительна и { ап} ~ {Ьп}, то существует рациональное е)>0 и натуральное щ такие, что {ап}>е при любом n>nv Далее, для данного е существует щ такое, что \ап — Ьп\<-^ при любом п>щ. Если п0 — большее из чисел nv пг, то, применяя свойство абсолютных величин

\а—Ь\^\\а\-\Ь\\

[§ 10, (3)], находим

при любом п>п0, т. е. последовательность {Ъп} также положительна.

Итак, определение 2 действительно вводит во множество DQ операцию сложения и умножения, и положительность класса из DQ определяется любой из его последовательностей.

Теорема 4. Множество D0 при операциях сложения и умножения и определении положительности, указанных в определении 2, является непрерывным полем (§ 24, определение 6).

Доказательство. Нужно проверить выполнение в DQ всех свойств I—XII (см. § 7, определение 1, § 8, определение 1, § 10, определения 1 и 3, § 24, определение 5). Так как операции (2) и (3) над последовательностями определены через операции над их элементами, то из выполнения свойств кольца I—VI для рациональных чисел следует их выполнение для множества Ж, а потому и для множества Ь0. Итак, M и DQ—кольца.

Выясним, какой смысл имеют в кольце DQ нуль и противоположный элемент. Очевидно, что нулём в D0 будет класс, содержащий фундаментальную последовательность {0} = 0, 0, 0,... Мы его обозначим через (0). Этот класс состоит из всех последовательностей { ап}, эквивалентных {0}, т. е. таких, для которых НтаЛ = 0. Мы будем называть их нулевыми последовательностями. Любая последовательность класса (0) эквивалентна { 0 } и потому нулевая. Обратно, любая нулевая последовательность, как сходящаяся, фундаментальна и эквивалентна {0}, а потому принадлежит классу (0).

Класс —а, противоположный классу а, содержащему последовательность { ап }, содержит, очевидно, последовательность {—ап }, противоположную {ап}, и все последовательности, эквивалентные • —ап\. Из ап — Ьп = — [(—ап) — (—Ьп)] легко следует, что если an}r^J{&n}> 10 {—ап)^{—*я Ь и обратно. Таким образом, класс —а состоит из всех последовательностей, противоположных последовательностям класса а.

Свойство VII поля уже не следует, как выше I—VI, прямо из аналогичного свойства чисел. В самом деле, если не все члены последовательности { ап } из M равны нулю, то { ап} отлична от последовательности {0}, являющейся нулём кольца М. Но если ещё а1 = 0, то уравнение { ап }•{ хп } = { Ьп } при Ьхф0 неразрешимо. Следовательно, кольцо M не является полем. Тем не менее Do будет полем. Пусть а и ß— классы из DQJ причём а^:(0). Берём { ап } из а и { Ьп} из ß. Существуют рациональное число а>0 и натуральное пх такие, что \ап\>а при любом n>nv Допуская противное, для любого е>0 найдём р такое, что \ап — aq\<^ при любых п, q>p- Затем берём q>p такое, что |яд|<Су. Тогда получим

при любом п>р. Это значит, что limart = 0. Но это невозможно, так как { ап } принадлежит классу а ф (0).

Без ограничения общности можно считать ап ф 0 при любом п. В самом деле, в силу |аЛ|>а>0 при любом n>nt, лишь конечное число членов ап (при п ^ пх) может равняться нулю. Заменяя их любыми рациональными числами, отличными от нуля, получим, очевидно, последовательность, эквивалентную {ап}, т. е. принадлежащую классу а и не имеющую членов, равных нулю.

Покажем, что последовательность { сп } = \ — } является фундаментальной. Последовательность {Ьп} как фундаментальная ограничена, т. е. существует рациональное число b такое, что \bn\<b при любом п. Пусть дано рациональное е>0. Так как {ап\ и {Ьп\ фундаментальны, то существуют натуральные щ и пг такие, что \ар-aq\<~2b при любых Р> Я>ПЧ и \Ьр-bq\<-Y при любых р, д>пг. Пусть п0 — наибольшее из чисел л1, #2 и пг. Тогда при любых /?, q>n0; таким образом, последовательность {сп} = = {"я5"} действительно фундаментальна.

Пусть у — класс, содержащий {сп }. Из { ап } • { сп } = { Ъп} следует ay = ß, чем свойство VII доказано.

Свойство VIII выполнено, ибо D0 содержит, очевидно, более одного элемента.

Докажем выполнение в D0 свойства IX. Надо показать, что для любого класса а имеет место один и только один из трёх случаев: а положителен, — а положителен, а = (0). Пусть ни а, ни —а не положительны. Берём последовательность { ап} класса а и рациональное число е]>0. В силу фундаментальности { ап} существует п0 такое, что \ар — ас|<С-|-при любых р, с>Щ- Так как а не положителен, то существует г>п0 такое, что аг^ у. Так как—а не положителен и содержит последовательность {—ап), то существует 5 >п0 такое, что—as^Y* Тогда при любом п>п0 будет одновременно

Поэтому |aJ<Te при любом n>n0t т. е. Нтал = 0, откуда а=(0).

Итак, один из трёх указанных выше случаев обязательно имеет место. Если класс а положителен, то существует рациональное а>0 и п0 такие, что ап>а, —ап<С—а ПРИ любом п>п0. Этим исключается как lim ап = 0, т. е. а = (0), так и положительность класса — а. Аналогично показывается, что положительность — а исключает два других случая. Этим уже доказано, что все три случая несовместимы, т. е. свойство IX выполнено.

Свойство X выполнено, так как сумма и произведение положительных последовательностей, очевидно, снова положительны.

Итак, доказано, что D0 — расположенное поле. Считая a>ß, если а—ß положительный класс, введём в DQ порядок, при котором положительные элементы и только они будут больше нуля (§ 10, теорема 1).

Легко видеть, что единицей поля DQ будет класс, содержащий последовательность { 1 } = 1, 1,1,...и все последовательности { ап }, ей эквивалентные, т. е. такие, для которых lim ап = 1. Будем обозначать этот класс через (1).

Покажем, что в DQ выполнена аксиома Архимеда XI. Пусть класс а содержит последовательность { ап}. Выше мы показали, что фундаментальная последовательность ограничена. Поэтому существует рациональное число а такое, что \ап\<а и потому а — ал>0 при любом п. Так как в поле рациональных чисел аксиома Архимеда выполнена (§ 23, теорема 3), то существует натуральное число k>a-\~l. Тогда k — сьп>1 при любом п и, следовательно, класс £•(1)— а положителен, т. е. £«(1)>а. Отсюда для поля DQ вытекает XI.

Наконец, покажем, что в D0 выполнена аксиома полноты XII (§ 24, определение 5). Заметим сначала, что если класс а содержит последовательность { ап }, где ап^0 при любом п, большем некоторого натурального числа /г0, то а^(0), так как, очевидно, неравенство а<(0) невозможно. Поэтому, если а содержит {ап( и р содержит то из ап^Ьп при любом /г>я0 следует a^ß. Аналогично тому, как классы, содержащие последовательности { 0} и { 1 }, мы обозначили через (0) и (1), мы теперь для любого рационального числа а обозначим через (а) класс, содержащий последовательность {а\ = а, а, а,... Такие последовательности, все члены которых равны, мы будем называть стационарными. Очевидно, что соответствие а*—*(а) является изоморфным отображением поля Г рациональных чисел на множество Г' всех классов, содержащих стационарные последовательности. Следовательно, Г' также является полем (§ 9, теорема 1).

В поле D0, как в любом архимедовски расположенном поле, определены понятия предела и фундаментальной последовательности,

не меняющие смысла при переходе к подполю (§ 24, определения 3 и 4, замечание и теорема 5).

Покажем, что если класс а содержит последовательность { ап }, то lim (ап) = а. Пусть е>(0) — элемент поля D0, содержащий последовательность {еп\. Тогда существует рациональное число е>0 и натуральное m такие, что еп>е при любом п>т, т. е. е^(е). Берём рациональное число е' такое, что е>е'>0 (например, е =— у)« Тогда (е') < (е) ^ е. Так как последовательность { ап } фундаментальна, то существует натуральное п0 такое, что | ар— ад\<е при любых /?, q>n0. Поэтому для данного п>п0 будем иметь: ар — ап<е и ап — aq<Cs при любых р, q>n0. Переходя при данном п от последовательностей к содержащим их классам, по доказанному выше получим:

«-«К (О и (а„)-«<(е'),

откуда \(ап) — а|<(е')<0 при любом п>п0; это и означает, что lim (ап) = а.

Мы доказали, что любая фундаментальная последовательность элементов (ап) подполя Г имеет предел в D0. Отсюда уже нетрудно вывести полноту поля D0, Пусть { ап } — любая фундаментальная последовательность элементов поля DQ. Так как по доказанному каждый класс ап равен пределу классов из подполя Г', то для данного п [ввиду ^—j >(0)] существует элемент (ап) из Г' такой, что |Яя — (a*)l^(n"r докажем, чт0 последовательность {(ап) } фундаментальна. Пусть е > (0) — любой элемент D0. Как было показано выше, из аксиомы Архимеда вытекает, что существует рациональное число е>0 такое, что (е)<е. Существует натуральное п^^— или — <С"з • Далее, в силу фундаментальности {<хл } существует натуральное п2 такое, что \ар — а?1<С(у) при любых p,q>n2. Если п0 — большее из чисел пг и #2, то

при любых р, q>n0.

Из изоморфизма полей Г и Г' (сохраняющего, очевидно, отношения порядка) вытекает, что последовательность {ап} рациональных чисел сама фундаментальна. Пусть а — класс из D0, содержащий {ап\. Выше было доказано, что lim(an) = a. Но \im[(an)—ап] = 0.

В самом деле, для любого ê>0 из D0 берём рациональное е>0 такое, что (е)<е, и натуральное я0 такое, что — <Ге. Тогда

|(а„)— ал ] <-ij <(е)<е при любом n>nQ. Таким образом, последовательность {ап } также сходится и притом

lim ап = lim (ап) = ос.

Этим доказано свойство XII, а значит, и теорема 4.

Поле D0 с точностью до изоморфизма и является полем действительных чисел. Однако оно не содержит поля рациональных чисел Г, от которого мы отправлялись при его построении. Элементами поля D являются классы эквивалентных фундаментальных последовательностей рациональных чисел, но не сами рациональные числа.

Но выше мы видели, что D0 содержит подполе Г' классов, содержащих стационарные последовательности, изоморфное Г. Поэтому существует поле D, содержащее поле Г в качестве подполя и изоморфное (относительно сложения и умножения) полю D (§ 9, теорема 2). Перенесём отношения порядка с D0 на D при помощи данного изоморфного отображения / поля D на DQ. Именно, элемент d поля D будем считать положительным, если соответствующий ему элемент f(d) = dQ поля D0 положителен. Тогда поле D будет расположено, и данный изоморфизм / сохраняет отношения порядка. Порядок D порождает порядок его подполя Г, совпадающий с определённым прежде для рациональных чисел, ибо поле Г вообще допускает единственное расположение (§ 23, теорема 1). При изоморфизме D и £>0 поле Г изоморфно отображается на некотором подполе Г" из D0. Но так как Г изоморфно Г' и Г допускает единственное изоморфное отображение в D0 (§ 23, теорема 2), то Г" = Г', и при изоморфизме D и D0 рациональному числу а из Г соответствует класс (а) из Г'.

Из сохранения отношений порядка при изоморфизме D и D0 следуют для поля D: сохранение всех свойств расположения, в частности выполнение аксиомы Архимеда, совпадение фундаментальности и сходимости последовательностей и полнота. Стало быть, из непрерывности поля D0 следует непрерывность поля D.

Итак, поле действительных чисел D построено. Его элементами, т. е. действительными числами, являются, во-первых, все рациональные числа и, во-вторых, классы эквивалентных и не имеющих рационального предела фундаментальных последовательностей рациональных чисел.

Из свойств поля D0 вытекает, что любая фундаментальная последовательность { ап} рациональных чисел имеет своим пределом в D либо рациональное число, либо тот класс, которому принадлежит данная последовательность { ап }.

§ 26. Свойства действительных чисел

Поле действительных чисел D обладает всеми свойствами расположенных полей, доказанными в главе II. Так, в этом поле отсутствуют делители нуля (§ 7, определение 2 и теорема 2, § 8, теорема 1). Имеют смысл понятия положительного и отрицательного чисел (§ 10, определение 1) и вводится порядок, при котором нуль меньше всех положительных и больше всех отрицательных чисел (§ 10, теорема 1). Справедливы закон монотонности и обычные правила оперирования с неравенствами (§ 10, теоремы 2—4). Квадрат любого числа, кроме нуля, положителен (§ 10, теорема 7). Имеет смысл понятие абсолютной величины (§ 10, определение 2), причём абсолютная величина обладает обычными свойствами и верны обычные правила сравнения и оперирования над членами через сравнение и оперирование над их абсолютными величинами (§ 10, теорема 8 и следующие за ней замечания).

Действительные числа, не являющиеся рациональными, называются иррациональными.

Переходим к задаче об извлечении корня из любого действительного числа. Решение этой задачи мы получим, рассмотрев гораздо более общую задачу о нахождении значения аргумента, при котором непрерывная функция принимает данное значение. Понятие о непрерывной функции, связанное с понятием предела последовательности, играет основную роль во всём математическом анализе.

Общее понятие функции нам уже известно (§3, определение 1). Здесь мы будем рассматривать лишь функции, связанные с полем действительных чисел.

Определение 1. Действительной функцией (или функцией действительного переменного) y=f(x) (или короче /), заданной на множестве X действительных чисел, называется соответствие, сопоставляющее с каждым числом х множества X одно определённое действительное число y=f(x). Число х называется значением аргумента, а у — значением функции при данном значении аргумента X (или в точке х).

Всюду в этом параграфе под функциями мы, не оговаривая этого, будем понимать действительные функции.

Определение 2. Функция y = f(x), заданная на множестве X действительных чисел, называется непрерывной в точке х0 множества X, если для любого действительного числа s > 0 существует действительное число Ъ>0 такое, что из \х — jc0 | <S следует \/(х) —f(x0) | <е для любого числа х множества X. Функция y=f(x) называется непрерывной на множестве, если она непрерывна в каждой его точке (т. е. для любого числа х0 из X).

Связь понятия непрерывности функции с понятием предела определяется теоремой;

Теорема 1. Функция /, заданная на множестве X, тогда и только тогда непрерывна в точке х0 из X, когда из \imxn = x0 следует \imf(xn) =f(x0) для любой последовательности {хп} множества X. Функция f (х) тогда и только тогда непрерывна на множестве X, если из \imxn = x0 следует \imf(xn)=f(x0) для любого числа х0 из X и любой последовательности {хп} чисел множества X.

Доказательство. Достаточно, очевидно, доказать часть теоремы, относящуюся к непрерывности в точке.

а) Пусть f(x) непрерывна в точке х0 и \imxn = x0. Берём любое число е>0. По определению непрерывности существует число 8>0 такое, что из \х — ^0|<С^ следует \f(x)—/(лг0)|<е для любого X из X. По определению предела (§ 24, определение 3) для этого числа 8 существует натуральное число п0 такое, что \*п — -Д^оI<d^ ПРИ любом п>пг По выбору числа 8 отсюда следует, что I f(xn) — f(xQ) I < е при любом п > щ. По определению предела это значит, что

limf(xn)=f(x0).

б) Пусть \imf(xn) = f(x0) для любой последовательности {хп} из X. Если функция f(x) не является непрерывной в точке х0, то существует число е>0, для которого нельзя найти числа 8 с требуемым в определении 2 свойством. Иными словами, при выбранном таким образом е для любого числа 8>0 существует число х множества X такое, что \х — ^0|<8, но \f(x)—f(x0)\^e. Поэтому для любого натурального числа п существует число хп из X такое, что

(1)

(2)

при любом п.

Так как поле действительных чисел по определению архимедовски расположено (§ 25, определение 1), то для любого действительного числа е0>0 существует натуральное п0> —.Тогда из (1) находим I хп — х0 I ^—^—^Ч при любом n>nQ, т. е. limxn = х0. По условию тогда также lim f(xn)=f(x0)9 что, очевидно, противоречит (2). Таким образом, f(x) непрерывна в точке х0.

Определим сумму, разность, произведение и частное двух функций /. (х) и /2 (х), заданных на множестве X, как функцию, сопоставляющую с каждым числом х из X соответственно сумму, разность, произведение и частное значений данных функций в точке х, т. е.

f(x) равна соответственно

для любого числа х из X (в случае частного предполагается, что /2 (х) ф 0 для любого X из X).

Из теоремы 1 и свойств предела [§ 24, теорема 2, б), в), г)] непосредственно следует

Теорема 2. Сумма, разность и произведение двух функций fx и /2, непрерывных на множестве X, также непрерывны на множестве X. Частное функций fx и /2, непрерывных на множестве X, есть функция, непрерывная на множестве X' тех чисел х из X, для которых /2 (х) ф 0.

Рассмотрим примеры непрерывных функций.

Пример 1. Функция f(x) = xk для любого целого числа k ^ 0 определена и непрерывна на множестве всех действительных чисел. В самом деле, при k = 0 функция f(x) = l при любом х и непрерывна как любая константа, ибо | f(x)—f(x0) | = 0; очевидно, непрерывна и функция f(x) = x. Применяя теорему 2, легко доказать непрерывность функции хк индукцией по k.

Пример 2. Из примера 1 и теоремы 3 индукцией по числу членов получаем непрерывность на множестве всех действительных чисел функции, заданной многочленом f(x) = aQ+a1x+... +апх^ с действительными коэффициентами а0, а19 ... , ап. Отсюда опять по теореме 2 получается непрерывность функции, заданной на множестве X всех чисел х, для которых g(x)фOf дробью : ; , где f(x) и g (х) — многочлены с действительными коэффициентами. Сами эти функции называются многочленами или целыми рациональными функциями и, соответственно, дробными рациональными функциями.

Пример 3. Функции sinx и cos л; непрерывны на множестве всех действительных чисел. Функция tgx непрерывна во всех точках, где она определена, т. е. где cosjc^O. Функция ctg л; непрерывна во всех точках, где sin х ф 0. Чтобы доказать это, надо дать точное определение указанных функций. Любой угол а как геометрическая фигура определяет дугу круга радиуса 1. Так как поле действительных чисел непрерывно, то в нём существует число х, равное длине данной дуги. Это число х называется радианной мерой угла а. Обратно, для данного числа х можно построить дугу длины X, а для неё — центральный угол а. Тогда угол а будет иметь радианную меру х. Если ввести углы, большие 360°, и отрицательные углы, как это обычно делается, то можно установить взаимно однозначное соответствие между всеми действительными числами и всеми углами, при котором числу х соответствует угол а с радианной мерой X. Поэтому обычно под углом и понимают не геометрическую фигуру, а число, равное радианной мере угла. Тогда sin X определяется как функция, сопоставляющая с любым действи-

тельным числом х действительное число, равное отношению линии синусов к радиусу круга при известном из тригонометрии соглашении о знаках. Также определяются другие тригонометрические функции. Подчёркиваем ещё раз, что трудность принципиального характера при таком определении тригонометрических функций лежит в задаче об измерении дуг окружности, которая разрешима в поле действительных чисел благодаря непрерывности поля1).

Отметим, что соответствие между углами и их радианными мерами таково, что сумме углов oc+ß соответствует сумма х+у их радианных мер и произведению аа угла а на число а соответствует произведение ах радианной меры х угла на то же число а. Отсюда можно вывести, что все тригонометрические формулы, доказанные для функций углов, остаются верными для функций от радианных мер этих углов.

Для доказательства непрерывности sin X убедимся, что | sin х | ^ | х | при любом действительном х. Так как sin( — х) = — sin л;, то достаточно рассмотреть числа х^О, а так как |sinjc|^l, то достаточно рассмотреть числа х, для которых О^х^-у-. Эти углы лежат в первой четверти. Очевидно, линия синусов MP равна половине хорды MN, стягивающей дугу MAN = 2х (рис. 1). Но все ломаные, вписанные в дугу MAN, длиннее хорды MN А потому длина 2х дуги ЖАЛА как предел последовательности длин вписанных хорд не меньше длины хорды MN.

Итак, MN^ 2х, ^ х, т. е. sin лг ^ jc. Но х^О и sin^^O. Поэтому I sinx I ^ I X I .

Пусть дано действительное число е>0. Положим: 8 = у. Тогда, применяя формулу

и неравенство | cos а | ^ 1, находим, что из | х—х0 | <Ъ следует:

что и доказывает непрерывность

Рис. 1.

1) В курсах математического анализа даётся другое определение этих функций (с помощью бесконечных рядов), не опирающееся на измерение дуг и на геометрию вообще.

Непрерывность cos je доказывается аналогично или проще выводится из соотношения cos je = sin — х\. Из непрерывности синуса и косинуса по теореме 2 следует непрерывность тангенса и котангенса во всех точках х} где они определены.

Из этих примеров видно, насколько широким является класс непрерывных функций. Для всех таких функций мы докажем следующее предложение.

Теорема 3. (Теорема о промежуточном значении.) Пусть f(x) — функция, заданная и непрерывная на отрезке [а, Ь] (т. е. на множестве действительных чисел х, для которых а^х^Ь, см. конец § 1). Пусть, далее, f(a) = a и f(b) = §. Тогда для любого числа у, принадлежащего отрезку [ос, ß] (при а ^ ß) или отрезку [ß, а] (при ß ^ а), существует число с отрезка [a, b] такое, что /(с) = у. Иными словами, функция, заданная и непрерывная на некотором отрезке, принимает на этом отрезке все значения, промежуточные по отношению к её значениям в концах отрезка.

Доказательство. Если cc = ß, то а = у = ß, и можно положить: с = а или с = Ь. Пусть <x<ß (в случае ß<<* доказательство аналогично). Если T = ß, то можно положить: с = Ь. Итак, пусть as^Y<ß. Применим весьма распространённый метод деления отрезка пополам. Строим две последовательности действительных чисел {ап \ и { Ьп}, принадлежащие отрезку [а, Ь] и обладающие свойствами

(3) (4)

(5)

для любого натурального числа п.

Положим: ах^=а, ЪХ=Ъ. Если уже определены числа ап и Ъп отрезка [а, Ь], то число ап~^п также принадлежит отрезку [а, Ь], и значит, для этого числа функция / определена. Если

то положим:

Если же

то положим:

Этими свойствами последовательности {ап} и { Ьп} однозначно опре-

делены (§ 15, теорема 1). Покажем, что выполнены свойства (3), (4), (5). Выполнение свойства (4) непосредственно следует из определения чисел ап+1 и bn+l. Выполнение свойств (3) и (5) докажем индукцией по п. Так как a^y<ß, то эти свойства выполнены при п=1. Пусть они выполнены для числа я, т. е. /(ап) ^ у<f(Ьп) и Ъп — ап = - ^па . Тогда по определению ап+1 и Ьп+1, очевидно,

Из (4) вытекает, что если p<q, то ap^aq. Покажем, что { ап} есть фундаментальная последовательность. Так как поле действительных чисел архимедовски расположено, то для любого числа £>0 существует натуральное число п0 такое, что -^-<^ _fl (§ 23, теорема 5) и ^~ <е ( из а ф ß следует аф Ь, т. е. b — а>0). Тогда, если p^q, то при любых р, q>nr

В силу полноты поля действительных чисел последовательность { ап} имеет предел с. Из (5) (снова применяя теорему 5 из § 23) легко находим, что \im(an—bn) = 0, а потому последовательность { Ьп } также сходится, причём lim ап = \хт Ьп = с [§ 24, теорема 2, а)].

Так как функция f(x) непрерывна на отрезке [а, Ь]9 то по теореме 1 находим: Нт/(аЛ) = lim/(£,,)=/(с). Но из (3) получаем: lim/(aJ^Y^lim/(^) [§ 24, теорема 2, д)], или/(с)^у^/(с), /?(с) = у, что и требовалось доказать.

Из многочисленных приложений этой теоремы укажем лишь на извлечение корня и определение угла по значению синуса, что будет использовано в следующей главе.

Теорема 4. Для любого действительного числа а>0 и любого натурального числа п существует одно и только одно действительное число Ь>0 такое, что Ьп = а. Иными словами,у а имеет одно и только одно положительное значение Ь. Если п четно, то этот корень имеет ещё одно и только одно отрицательное значение —be той же абсолютной величиной. Если а —0, то единственное значение корня будет ]/а = 0. Еслиа<0, то при нечётном п существует одно и только одно действительное значение корня и притом отрицательное, а при чётном п в поле действительных чисел у а значении не имеет.

Доказательство. Функция f(x) = xn задана и непрерывна на множестве всех действительных чисел, а следовательно, на любом отрезке. Пусть а>0. Берём число с=а+1. Из с>1>0 следует

cn~l ^ 1 (знак = получим лишь при п=1) и сп^с>а. Применим теорему о промежуточном значении функции хп на отрезке [0, с]. Так как Оп<а<сп, то существует число b отрезка [0, с], для которого bn = a, Vа = Ь. Очевидно, Ь>0. Если также У)>0 и Ь'фЬ, то при ô'<ô будет Vn<bn, а при ô'>ô будет о'я>о,1(§ 10, теорема 4), т. е. о'я ^ а, чем доказана единственность положительного значения "[/а. При чётном /г также

(— ft)* = [( — bf] 2 = (ft2) 2=Ьп = а,

т. е. —ô есть другое значение корня. Если ô'<0 и о' ф— Ь, то при ft'<]— С будет: ft'2>ft2>0, откуда

b'n = (ft'2)^ > (ft2)"*" = bn = a.

Аналогично при —b<b'<0 будет: b,n<a. Этим доказана единственность отрицательного значения —Ь = \/ а.

Если п нечётно, хо"\/а отрицательных значений не имеет, ибо из Ь'<0 следует: Ь'п<0<а.

Если а = 0, то 0я = 0 = а. Других значений ]/0 не имеет, ибо из Ьп = 0 следует Ь = 0, так как поле не имеет делителей нуля.

Если а<0 и п нечётно, то по доказанному выше существует одно и только одно число ft и притом положительное, для которого Ьп = —а. Тогда

(—ftf=(—lf Ьп = а.

Если Ь' ф — Ьу то, как и выше, убедимся, что Ь'пф{—Ь)п = а.

Итак, у а имеет единственное значение — Ь.

Наконец, если а<0 и п четно, то Y а не имеет значений в поле действительных чисел. В самом деле, так как поле действительных чисел является расположенным полем (§ 10, определение 1), то для любого числа b должно быть ft2^0 (§ 10, теорема 7).

Поэтому Ьп = (Ь2У^0у т. е. Ьп Ф а.

Остановимся на разыскании угла по значению его синуса.

Теорема 5. Для любого числа а отрезка [0, 1] существует одно и только одно число b отрезка |о, такое, что а = sin ft.

Доказательство. Функция f(x) — sinх задана и непрерывна на множестве всех действительных чисел, а следовательно, на отрезке £о, JJ . Так как sin 0 ^ а ^ sin у, то по теореме о промежуточном значении существует число b отрезка Го, , для кото-

рого sin b — a. Для доказательства единственности числа b воспользуемся свойством функции sinx возрастать с ростом угла от нуля до в Это известно из тригонометрии и доказывается так: если О ^ хг < х% ^ у, то большему углу соответствует и большая дуга, но 0 < 2хг < 2лг2 ^ тс, и для таких дуг большая дуга стягивается большей хордой. Половина хорды, стягивающей дугу длины 2х, является линией синусов угла х. Отсюда ясно, что sinx1<slnx^

Если теперь Ь'фЬ— другое число отрезка j^O, yj, то при b<b' будет: sin£<sin£', а при b'<b будет: —sin b'<sin b. Следовательно, sin b' ф a.

Рассмотрим в заключение этого параграфа некоторые свойства поля действительных чисел как непрерывно расположенного поля.

Теорема 6. Поле действительных чисел D может быть расположено лишь одним способом (при сохранении операций сложения и умножения) и допускает лишь одно изоморфное (относительно сложения и умножения) отображение в себя, а именно, тождественное отображение на самого себя.

Доказательство. Пусть D — поле действительных чисел, расположенное обычным образом (§ 25, определение 2 и ниже), и D' — поле, совпадающее с D по составу элементов и по операциям сложения и умножения, но расположенное произвольным образом. Из совпадения сложения следует, что нуль поля D будет нулём и в D'. Далее, если а>0 в D, то по теореме 4 существует число b такое, что а = Ь* в D, а по совпадению умножения — и в D'. Так как D' — расположенное поле, то его элемент а как квадрат элемента b положителен (§ 10, теорема 7), ибо а ф 0, т. е. а>0 в D'. Если û<(0 в Д то —а>0 в D, а поэтому и в D\ т. е. а<0 также в D'. Отсюда следует, что если а)>0 в то а)>0 в Д ибо исключено, что а^О в Ö. Таким образом, а тогда и только тогда положительно в D', когда оно положительно в D, т. е. расположенное поле D' совпадает с D; поле D допускает лишь одно расположение.

Пусть x'—f(x) — любое изоморфное (относительно сложения и умножения) отображение поля действительных чисел D на некоторое его подполе Р. Если число а>0, то а = Ь2, где b ф 0. В силу свойств изоморфизма тогда

a'=/(a)=/(^) = |/(ô)]2>0,

т. е. при изоморфизме / положительное число переходит в положительное.

Между двумя различными действительными числами а и b всегда лежит рациональное число с.

В самом деле, пусть a<b, b — а>0. По аксиоме Архимеда существует натуральное число тогда-^-<-—а. Далее, существуют натуральные числа тх и /гс2, для которых

т. е. (—Щ)-^<Са. Поэтому множество А тех целых чисел k, для которых &~>а, непусто (ибо содержит тх) и ограничено снизу числом —/я2. Следовательно, оно содержит наименьшее число m (§21, теорема 5). Тогда т п 1 =^ а < , откуда

т. е. рациональное число — лежит между а и о.

При изоморфном отображении / поля D в себя поле рациональных чисел тождественно отображается на себя (§ 23, теорема 2). Если бы отображение / не было тождественным отображением поля D на себя, то существовало бы действительное число а такое, что /(а) = Ьфа. Пусть, например, а<b. По доказанному существует рациональное число с такое, что а<с<b, откуда

а — с<0<b— с и с — а>0>с — Ь.

Но

f(c — a)=f(c)-f(a) = c-b,

т. е. число с — а>0 перешло в число с — Ь<0, что невозможно.

Оперировать с действительными числами как классами фундаментальных последовательностей рациональных чисел практически неудобно ввиду громоздкости такого изображения. На практике при вычислениях с действительными числами применяется их запись десятичными дробями1).

§ 27. Аксиоматическое определение действительных чисел

Совокупность натуральных чисел мы определили при помощи основного отношения «следует», подчинённого системе аксиом Пеано (§ 11, определение 1). Такое построение математической теории является аксиоматическим. Далее, с помощью натуральных чисел мы последовательно определили целые, рациональные и действительные числа. Во всех этих трёх случаях новая числовая об-

1) См. статью А. Я. Хинчина «Элементы теории чисел», гл. IV.

ласть определялась через старую при помощи наложения дополнительных требований, обеспечивающих однозначное до изоморфизма определение новой области. Каждый раз мы строили интерпретацию (конкретный пример) определяемой области. Ввиду изоморфизма всех множеств, удовлетворяющих данному определению, мы могли бы в каждом случае саму интерпретацию принять за определение данной области. Такое определение числовых областей называется конструктивным. Возникает вопрос, можно ли определить каждую из упомянутых областей аксиоматически?

Расширяя числовую область, мы каждый раз налагали новые требования (возможность вычитания, деления и, наконец, непрерывность) при условии минимальности расширения. В отношении действительных чисел требование минимальности оказалось уже излишним. Это означает, что совокупность свойств, предъявленных ко множеству действительных чисел, характеризует это множество однозначно до изоморфизма. Тем самым эта совокупность свойств даёт аксиоматическое определение действительных чисел. Таким образом, определение действительных чисел как непрерывного расположенного поля является их аксиоматическим определением. Собирая вместе все свойства, включённые в это понятие, приходим к такому определению.

Определение. Полем действительных чисел называется непустое множество D, в котором двум любым элементам а и b соответствуют элемент а+Ь, называемый их суммой, и элемент ab, называемый их произведением, и определено свойство элемента быть положительным, причём выполнены условия:

I. (Коммутативность сложения.) a+^ = 6-)-û.

II. (Ассоциативность сложения.) а+ (Ь + с) = = (а + *) + С.

III. (Обратимость сложения.) Для любых элементов аиЬ множества D существует элемент с из D такой, что а+с = Ь,

IV. (Коммутативность умножения.) ab = ba.

V. (Ассоциативность умножения.) a (be) = (ab) с.

VI. (Дистрибутивность умножения относительно сложения.) (а + Ь) с = ab + be.

Эти свойства означают, что D есть кольцо. Стало быть, определено умножение элементов D на натуральные числа; существует единственный элемент 0 такой, что а+0 = 0+а = а для любого а из D; для данного а существует единственный противоположный элемент —а такой, что a-f~( — а) = (— а)+а = 0; для данных а и b существует единственный элемент b — а, называемый их разностью, такой, что а+(Ь — а) = (Ь — а)+а = Ь.

Далее:

VII. (Обратимость умножения.) Для любых элементов а и b множества D, где афО, существует элемент q из D такой, что aq — b.

VIII. (Аксиома мощности.) Множество D содержит по крайней мере два различных элемента.

Условия I — VIII означают, что D — поле (§ 8, определение 1). Стало быть, определено понятие подполя поля D (§ 8, определение 3). Далее:

IX. Для любого элемента а множества D имеет место один и только один из трёх случаев: а положителен, а = 0, —а положителен.

X. Сумма и произведение положительных элементов положительны.

Условия I — X означают, что D — расположенное поле. Стало быть, определяя a>ô, если элемент а — b положителен, превратим D в упорядоченное множество (§ 10, теорема 1). Далее:

XI. (Аксиома Архимеда.) Для любых элементов а и b множества D, где Ь>0, существует натуральное число п такое, что nb>a.

Условия I — XI означают, что D — архимедовски расположенное поле. Стало быть, в D определены понятия предела последовательности и фундаментальной последовательности, не меняющиеся при замене D любым его подполем, содержащим все рассматриваемые элементы (§ 24, теорема 5). Наконец:

XII. (Аксиома полноты.) Любая фундаментальная последовательность элементов множества D имеет предел в этом множестве.

Условия I — XII означают, что D — непрерывное поле (§ 24, определение 6).

Отметим, что это определение предполагает уже построенные натуральные числа. Иначе аксиома Архимеда XI теряет смысл. Ниже мы приведём другую систему аксиом, не опирающуюся на понятие натурального числа.

Возникает вопрос о непротиворечивости, полноте и независимости системы аксиом I — XII.

Для доказательства непротиворечивости системы аксиом I—XII достаточно найти для неё хотя бы одну интерпретацию (§ 17, определение 1). Но поле DQ, построенное в § 25 (определение 2, теорема 4), даёт такую интерпретацию. Правда, построение поля D0 опирается на поле рациональных чисел, но, беря конструктивное определение его, т. е. поле Г0 (§ 22, определение 2), где за кольцо целых чисел принято его конструктивное определение С0 (§ 20, определение 2), мы сводим построение поля D0 к натуральным числам. Этим непротиворечивость системы аксиом I—XII сведена к непротиворечивости (в смысле существования интерпретации) системы аксиом для натуральных чисел.

Для доказательства полноты системы аксиом I—XII достаточно показать, что две любые интерпретации этой системы изоморфны (§ 17, определение 3). Но это, по сути дела, нами уже доказано.

В самом деле, если Рг и Я2 — две интерпретации системы аксиом I—XII (т. е. два непрерывных поля), то для одной и той же интерпретации Г поля рациональных чисел существуют поля Dx и D2, содержащие в качестве подполя поле Г и изоморфные (относительно сложения, умножения и расположения) соответственно Рх и Р2 (§ 23, теорема 2). В силу этого изоморфизма поля Dx и Z)2 сами непрерывны и, следовательно, изоморфны относительно обеих операций и порядка (§ 25, теорема 2). Но тогда по свойствам изоморфизма поля Pi и Р2 изоморфны между собой (также относительно сложения, умножения и расположения).

Этим полнота системы аксиом I—XII доказана.

Поскольку непротиворечивость и полнота системы аксиом I — XII доказаны, эта система точно определяет поле действительных чисел и является фундаментом для построения теории действительного числа. Такое построение было в известных пределах выполнено нами в предыдущем параграфе.

Вопрос о независимости системы аксиом I — XII (§ 17, определение 3) не имеет такого принципиального значения, и мы им заниматься не будем. Укажем лишь, что каждая из аксиом XI и XII независима от остальных аксиом I—XII.

Мы определили непрерывность расположенного поля при помощи аксиомы Архимеда и аксиомы полноты (§ 24, определение 6). Существует много других форм аксиом непрерывности. Приведём две из них. Чтобы их формулировать, нужно ввести некоторые новые понятия.

Сечением упорядоченного множества (и, в частности, расположенного поля) Р называется пара непустых подмножеств X, Y множества Р, не имеющих общих элементов, объединение которых (§ 2) равно Ру т. е.

X[)Y = 0, Х[]Г=Р,

причём х<у для любых элементов х^Х и y€Y. Если элемент а является наибольшим элементом в Ху причём Y не имеет наименьшего элемента или же а является наименьшим элементом Y, причём X не имеет наибольшего элемента, то элемент а называется рубежом данного сечения.

Элемент b упорядоченного множества Р называется предельным элементом множества А, если для любых элементов Ъх и #2 таких, что ЬХ<b<b<>, существует бесконечное множество элементов а из А, для которых bx<a<b2.

Легко убедиться, что для расположенного поля Р это определение эквивалентно такому:

Элемент b называется предельным для множества А, если для любого элемента е>0 из Р существует бесконечное множество элементов а из А, для которых \а — b|<[е.

Подмножество А упорядоченного множества (и, в частности, расположенного поля) Р называется ограниченным, если существуют элементы Ьх и Ь2 из Р такие, что bx<a<b^ для любого элемента а множества А.

Следующие три свойства расположенного поля Р эквивалентны.

а) В поле Р выполнены аксиомы XI и XII.

б) (Дедекинд). Любое сечение поля Р имеет рубеж.

в) (Вейерштрасс). Любое бесконечное ограниченное множество элементов поля Р имеет предельный элемент.

Таким образом, поле действительных чисел аксиоматически можно определить свойствами I — X и любым из свойств а), б), в). Доказательство эквивалентности свойств а), б), в) можно найти в книге И. В. Проскурякова [5].

Поле рациональных чисел аксиоматически можно определить как простое поле характеристики нуль. В самом деле, любое такое поле совпадает со своим подполем рациональных элементов и, следовательно, изоморфно полю рациональных чисел Г (§ 23, теорема 2).

Кольцо целых чисел аксиоматически можно определить, как кольцо R с единицей е, не содержащее отличного от него подкольца с единицей и обладающее тем свойством, что пефО для любого натурального числа п. В самом деле, легко показать, что множество всех элементов вида ne изоморфно множеству N натуральных чисел относительно сложения и умножения. Следовательно, кольцо R содержит подкольцо R0, изоморфное кольцу целых чисел С (§ 20, теорема 3). Но так как R0 содержит единицу, то оно совпадает с R. Таким образом, R изоморфно кольцу целых чисел.

ГЛАВА VII

ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ

§ 28. Определение поля комплексных чисел

Уже в древности при решении задач, выражаемых на современном языке квадратными уравнениями, встречались случаи, связанные с комплексными корнями уравнений. В таких случаях считали задачу неразрешимой. Однако решение в радикалах кубичного уравнения, найденное итальянскими математиками в первой половине XVI в., приводило к выражению действительных корней уравнения с действительными коэффициентами через квадратные корни из отрицательных чисел. Это заставило математиков того времени оперировать новыми числами, которые назывались «мнимыми», «невозможными», «воображаемыми» и т. д., применяя для них те же правила действий, которым подчинялись действительные числа. Однако смысл новых чисел оставался неясным, что и нашло своё отражение в терминологии. Так, Кардан называет новые числа «ложными, поистине софистическими» числами. Первое формальное обоснование действий с комплексными числами дано в «алгебре» итальянского математика Бомбелли (1572). Однако наглядное геометрическое изображение этих чисел (как точек или векторов на плоскости) было дано только в начале XIX в.1).

После этого изучение комплексных чисел пошло очень быстро, и в настоящее время теория функций комплексного переменного является основной частью математического анализа. Эта теория находит приложение в самых разнообразных областях науки, например в аэродинамике. Свойства комплексных чисел столь же хорошо обоснованы как, скажем, свойства чисел рациональных или действительных.

В поле действительных чисел операция извлечения корня не всегда выполнима. Именно, корень чётной степени из отрицатель-

1) Впервые геометрическое изображение действий над комплексными числами было дано датским землемером К. Бесселем в 1799 г. и независимо от него французским математиком Аргандом в 1805 г. Однако общее признание оно получило лишь после нового обоснования, данного Гауссом в 1831 г.

ного числа не имеет действительных значений, т. е. при действительном а<0 и чётном натуральном п не существует действительного Ь, для которого Ьп — а (§ 26, теорема 4). Следуя общему плану расширения числовых областей, намеченному в § 18, мы расширим теперь поле действительных чисел D до поля комплексных чисел К, в котором операция извлечения корня уже всегда выполнима. При этом получается существенно новый результат и для тех случаев, когда эта операция была выполнима в поле D. Именно, в новом поле К Уа при любом а^Ои любом натуральном п будет иметь ровно п значений1).

Как мы увидим, достаточно расширить поле D до такого поля, где V—1 имеет хотя бы одно значение, т. е. существует элемент z, для которого £2 =—1. Мы будем искать минимальное расширение такого рода в смысле следующего определения:

Определение 1. Полем комплексных чисел называется минимальное поле К, содержание поле действительных чисел D и элемент I со свойством 12 = —1, т. е. множество К, обладающее следующими свойствами:

1) К является полем, содержащим в качестве подполя поле действительных чисел D и элемент I со свойством £9 = — 1.

2) Поле К не содержит никакого подполя, отличного от него самого и обладающего теми же свойствами. Элементы поля К называются комплексными числами.

Сначала докажем единственность (как всегда, с точностью до изоморфизма) определённого таким образом поля К.

Теорема 1. Поле К, содержащее поле действительных чисел D2) и элемент i со свойством Р = — 1, будет минимальным (т. е. полем комплексных чисел) тогда и только тогда, когда каждый элемент х из К можно представить в виде

x = a+bi, (1)

где а и b — действительные числа. При этом такое представление единственно, т. е. для данного элемента х из К существует лишь одна пара действительных чисел a, b (взятых в данном порядке), удовлетворяющих равенству (1).

1) Значения ~\Га являются, очевидно, корнями уравнения хп — я = 0. Уравнения такого вида называются двучленными. Таким образом, в поле комплексных чисел К разрешимы все двучленные уравнения. Справедливо более сильное утверждение, что в поле К разрешимы все алгебраические уравнения, т. е. уравнения вида f(x) = 0, где f(x) — любой многочлен степени п^1 с любыми комплексными коэффициентами. Доказательство этой теоремы см. Э. э. м., книга 2, Л. Я. О кун ев, кольцо многочленов и поле рациональных функций, гл. I, § 6.

2) Как всегда, говоря, что одно поле содержит другое, мы подразумеваем, что операции в меньшем поле совпадают с одноимёнными операциями в большем иоле.

Доказательство, а) Пусть каждый элемент х поля К представим в виде (1) с действительными а и b и пусть Р — любое подполе поля К, содержащее поле действительных чисел D и некоторый элемент j со свойством ß = —1. Так как /2=/2 =—1, то (l+j)(l—/) = *2— U+fi—у2 = 0. Но поле К не имеет делителей нуля (§ 8, теорема 1), следовательно, либо г —j— у = 0, либо I—у = 0, откуда j = ±L Для любого х из К тогда x — a+bl = = a±bj, т. е. X принадлежит Р, Р совпадает с АТ. Этим доказана минимальность поля R.

б) Пусть, обратно, поле К минимально. Покажем, что любой элемент х из АТ представим в виде (1). Пусть M есть множество всех элементов поля К, представимых в виде (1). Покажем, что выполняются следующие свойства:

а) aArbi = c+ dl тогда и только тогда, когда а = с и b — d\

б) (a + Ы) =t(c + dt) = (a±c) + (b±d) I;

в) (a + bi) (с + dl) = (ас — bd) -j- (ad + be) i;

г)

где с+аЬфО.

В самом деле, если а = с и b = d, то из однозначности суммы и произведения в поле К следует, что a+bi = c+di. Обратно, если а —|— Ы = с -j— dl, то из b — d следует bl = dl, а потому а = с

Если же b ф d, то г = , т. е. г принадлежит полю действительных чисел, что невозможно, ибо 12 = —1<0, а квадрат действительного числа не отрицателен (§ 10, теорема 7). Таким образом, b = d и а = с, чем доказано утверждение а).

Так как из свойств нуля очевидно, что 0 —[— 0 • г = 0, то из а), в частности, следует, что а+Ь1 = 0 тогда и только тогда, когда а = Ь = 0.

Равенства б) и в) следуют непосредственно из свойств сложения и умножения в поле К-

Если с +dl^0, то либо с ф 0, либо d ф 0 и по доказанному выше также с — dl^O. В этом случае также с*+сР>0. Умножая делимое и делитель в левой части равенства г) на с — dl^O, мы не изменим частного и легко приведём его к выражению, стоящему в правой части равенства.

Из а) следует однозначность представления элемента х в виде (1).

Из б), в) и г) следует, что сумма, разность, произведение и частное (если делитель отличен от нуля) двух элементов множества M снова принадлежат М, т. е. M есть подполе поля Р (§ 8,

теорема 5). Так как а = а+0 • i и 1 = 0-\~11 принадлежат A4 и К—минимально, то К=М, т. е. любой элемент из К представим в виде (1).

Теорема 2. Все поля комплексных чисел изоморфны между собой, т. е. поле комплексных чисел определено однозначно с точностью до изоморфизма.

Доказательство. Пусть Кг и — два поля комплексных чисел, причём К\ содержит элемент iv a К% — элемент i2 со свойством i\ = i\ = —1. По предыдущей теореме все элементы К\ записываются в виде а+Ых и все элементы из К% — в виде а+Ы2 с действительными а и Ь, причём однозначно. Отсюда легко вывести, что соответствие f(a+bi1) = a+bl2 является взаимно однозначным отображением К\ на К%. Из равенств (2), б), в) следует, что сложение и умножение элементов из Kt и сводится к одним и тем же действиям над действительными числами. Отсюда легко вывести, что отображение / изоморфно. Надо доказать, что

/0*1+л)=/(*,)+/(>,), /(^tVi)=/(*i)/0'i)

для любых хг и уг из Кх. Проверим лишь первое из этих соотношений, так как для второго рассуждение аналогично. Пусть xt = a+biv y1 = c+di1. Тогда

Теорема доказана.

Замечание. При изоморфизме / любое действительное число а отображается само на себя, а элемент lt переходит в /2.

Теорема 3. Любое поле Р, содержащее поле действительных чисел D и элемент I со свойством i2 = — 1, содержит поле комплексных чисел.

Доказательство. Пусть К—множество всех элементов поля Р, представимых в виде а+Ы с действительными а и Ь.

Как в доказательстве теоремы 1 [п. б)], убеждаемся, что К—подполе поля Р; К содержит поле действительных чисел D и элемент и Так как любой элемент из К имеет вид aA-bi, то по теореме 1 поле К минимально в смысле определения 1, т. е. Л" является полем комплексных чисел. Теорема доказана.

Теперь докажем существование поля комплексных чисел. Как и в случае целых рациональных и действительных чисел, достаточно построить интерпретацию (конкретный пример) поля, удовлетворяющего определению 1. Можно было бы элементами этого поля просто считать символы a+bï, где а и b — действительные числа, а I — символ, подчинённый условию i" = —1. Но тогда надо показать,

что в это поле можно включить действительные числа так, что символ а+Ы в новом поле будет совпадать с суммой а и произведения b на и Такое построение ввиду неясности смысла, придаваемого символу I, может показаться слишком формальным. Поэтому мы поступим несколько иначе. По идее, приведённой ниже, построение очень близко к упомянутому выше, но все применяемые в нём символы имеют вполне конкретный смысл.

Конструкция одного из изоморфных полей комплексных чисел подсказывается теоремой 1. В самом деле, каждый элемент искомого поля должен иметь вид a+bl, т. е. определяется парой действительных чисел а, Ь, причём разным парам соответствуют и разные элементы. Таким образом, в данном случае нам не нужно определять эквивалентность пар и переходить к классам эквивалентных пар, как в случае целых или рациональных чисел.

Определение 2. Пусть KQ есть множество всех пар вида (а, Ь), где а и b — действительные числа, порядок которых существенен. Сложение и умножение во множестве К0 определяем по формулам

(а, b) + (c, d) = (a + c, b+d), (3)

(а, b) (с, d) = (ас — bd, ad + be). (4)

Операции в К0 определены так, чтобы им соответствовали те же операции в искомом поле, которые должны удовлетворять равенствам (2), б), в).

Теорема 4. Множество К0 с операциями, определёнными по формулам (3) и (4), является полем.

Доказательство. Надо проверить выполнение в К0 свойств I — VIII (§ 7, определение 1 и § 8, определение 1).

Так как сложение пар сводится к сложению соответствующих элементов, то свойства I — III для пар непосредственно вытекают из соответствующих свойств действительных чисел.

Свойства IV — VI проверяются непосредственно. Проверим, например, дистрибутивность умножения относительно сложения (свойство VI):

Обе окончательно полученные пары совпадают, чем и доказано VI.

Итак, К0 является кольцом. Легко видеть, что нулём этого кольца является пара (0, 0), а противоположная пара и разность пар определяются равенствами

— (а, Ь) = (— а, — Ь), (а, b) — (c, d) = (a — c, b — d).

Проверяем обратимость умножения (свойство VII). Пусть (а, Ь) и (с, d) — две любые пары, причём (а, Ь) ф (0, 0). Последнее означает, что либо а ф 0, либо Ъ ф 01).

Так как а и & — действительные числа, то а2-|**£2>0 (§ 10, теорема 7). Надо найти пару (х, у), удовлетворяющую уравнению

(а, Ь){х, У) = (с, d). (5)

Предположим сначала, что такая пара существует. Тогда

(ах — by у ay+bx) = (c, d),

откуда ах—by = c, bx +ay = d. Решая эту систему уравнений относительно х и у, найдём:

Этим доказано, что если пара (х, у)у удовлетворяющая (5), существует, то только одна, именно та, где х и у определяются из написанных для них выражений. Легко проверить, что такая пара действительно удовлетворяет равенству (5). В самом деле,

Этим свойство VII доказано.

Так как К0 содержит более одного элемента, то свойство VIII выполнено. Теорема доказана.

Отметим, что единицей поля К0 является пара (1, 0), так как (а, &)•(!, 0) = (а. 1-е« 0, а .0 + * • 1) = (а, Ь).

Мы увидим, что поле К0 с точностью до изоморфизма является полем комплексных чисел. Это поле не удовлетворяет определению 1, ибо оно не содержит действительных чисел.

Займёмся включением в поле К0 поля действительных чисел D. Пусть D' — множество всех пар поля К0 вида (а, 0). Из формул (3) и (4), определяющих сложение и умножение пар, легко следует, что отображение а -> (а, 0) является изоморфным отображением поля D на множество D'. Следовательно, D' само является полем (§ 9, теорема 1). Далее, существует поле К, содержащее D в ка-

1) Равенство и неравенство пар, как и элементов любых множеств, мы понимаем просто как тождество или различие. Таким образом (х, y) = (z, t) тогда и только тогда, когда х = zt у = t

честве подполя и отображающееся на К0 изоморфно так. что каждое число а из D отображается при этом на соответствующую ему пару (а, 0) из D' (§ 9, теорема 2):

Теорема 5. Поле К является полем комплексных чисел.

Доказательство. По построению поле К содержит поле D. Далее, поле К содержит пару (0, 1). Обозначим эту пару через I, т. е. положим: r = (0, 1). В поле К0 мы имеем:

(0, 1)2 = (0, 1)(0, 1) = (0.0— 1 - 1, 0.1 + 1 -0) = (— 1, 0).

Но при построенном выше изоморфном отображении К0 на К элементу (— 1, 0) из К0 соответствует число —1 из К. Следовательно, в К должно быть i2 =—1. Итак, поле К обладает свойством 1) из определения 1.

Остаётся доказать минимальность поля К. По теореме 1 для этого достаточно показать, что любой элемент х из К представим в виде х = а+Ы с действительными а и Ь. Пусть при упомянутом изоморфизме К и К0 элементу х из К соответствует пара (а, Ь) из К0. Легко проверить справедливость равенства

(а, b) = (a, 0) + (£, 0)(0, 1)

в Кг Отсюда в силу нашего изоморфизма между К0 и К находим: х = а+ Ы. Теорема доказана.

§ 29. Свойства комплексных чисел1)

Поле комплексных чисел обладает всеми свойствами колец и полей, рассмотренными в §§ 7, 8.

Так как поле комплексных чисел содержит поле рациональных чисел, то его характеристика равна нулю.

Так как в любом расположенном поле a2^s0 для любого элемента а (§ 10, теорема 7), а в поле комплексных чисел i2 = —1, то поле комплексных чисел не может быть расположено.

Геометрическое представление комплексных чисел. Возьмём на плоскости две взаимно перпендикулярные прямые — горизонтальную Ох и вертикальную Oy, — пересекающиеся в точке О (рис. 2). Далее, выберем некоторый отрезок MN за единицу измерения отрезков. Тогда все

Рис. 2.

1) Здесь мы остановимся лишь на обосновании элементарных свойств комплексных чисел. Читателю, желающему ознакомиться с другими интересными свойствами этих чисел (например, с теорией делимости так называемых целых комплексных чисел), рекомендуем книгу Р. О. Кузьмина и Д. К. Фаддеева [13].

комплексные числа можно изобразить точками плоскости Оху. Именно, для числа z = a+bl откладываем на Ох от точки О отрезок OA длины \а\ и притом вправо, если а>0, и влево, если а<0. На прямой Oy откладываем отрезок OB длины \Ь\ и притом вверх, если Ь>0, и вниз, если £<0. Через точку А проводим прямую, параллельную Oy, а через В — прямую, параллельную Ох. Точка Z пересечения этих прямых и принимается за изображение числа z. Легко убедиться, что любая точка нашей плоскости является изображением некоторого комплексного числа и что данное соответствие между комплексными числами и точками плоскости Оху взаимно однозначно. Очевидно, что при этом число z = a+bi изображается точкой Z(a, b) с прямоугольными декартовыми координатами а и Ь.

Действительные числа и только они изображаются точками прямой Ох. Числа вида Ы, называемые чисто мнимыми, и только они изображаются точками прямой Oy. Поэтому прямая Ох называется действительной, а Oy — мнимой осью. Направления вправо по Ох и вверх по Oy называются положительными, а влево по Ох и вниз по Oy — отрицательными. Точка О называется началом координат, а прямые Ох и Oy — осями координат.

Во всём дальнейшем мы не будем непосредственно опираться на геометрическое представление комплексных чисел для доказательства каких-либо их свойств; мы будем, однако, прибегать к геометрическому представлению для придания наглядности этим свойствам.

Тригонометрическая форма комплесного числа.

Определение. Тригонометрической формой комплексного числа z называется его запись в виде

z = r (cos а-|-j sin а),

где г и а — числа действительные, причём г^О. Число г называется модулем, а а — аргументом комплексного числа z.

Теорема 1. Любое комплексное число можно записать в тригонометрической форме. При этом модуль z определён однозначно и равен нулю тогда и только тогда, когда z=0, а аргумент для z = 0 может быть произвольным числом, а для гфО определён с точностью до слагаемого, кратного 2тг.

Доказательство. Если z = 0, то 0 • (cos а -)- i sin а) при любом а будет тригонометрической формой числа z. Обратно, если г (cos a +1 sin а) = О, то из sin2a + cos2a = 1 следует, что cos а + -j-isin а ф О и, следовательно, г = 0. Этим все утверждения теоремы, касающиеся случая z = 0, доказаны.

Пусть z-=a+bi ф 0. Тогда числа а и b не равны нулю одновременно и а*+Ь*>0. В поле действительных чисел j/a2 -|- #2 имеет два значения: положительное и отрицательное (§ 26, теорема 4). Пусть г — положительное значение этого корня. Так как а2^г2 и

Существует число а0 такое, что

(§ 26, теорема 5). Так как

Если — = cos а0 и у = sin а0, то положим а = а0; если у= — cos а0 и — = sina0, то положим: а0 = тс — ах и а = аг\ если — = — sinccj, то положим: а1 = — а. Всегда получим число а такое, что

и таким образом

Итак, z записано в тригонометрической форме. Очевидно, что, прибавляя к а число 2Ы с любым целым А, мы получим тригонометрическую форму того же числа г.

Докажем единственность модуля. Пусть а+Ы = т (cos a sin а). Тогда

Возводя эти равенства в квадрат и складывая, находим: а2-|-£2 = г2, т. е. г=|/а2 + ^2. Мы берём положительное значение корня, ибо г>0. Этим единственность г доказана.

Наконец, если даны две тригонометрические формы числа z:

то при z ф О также г Ф 0, откуда

и, как известно из тригонометрии, тогда а2 = а2 —(— 2^тс с целым k. Теорема доказана.

Выясним геометрический смысл модуля и аргумента. Пусть числу z = r (cos a + i sin a) соответствует точка Z плоскости Oxy (рис. 3). Соединим эту точку отрезком прямой с началом координат О и опустим из точки Z на действительною ось Ох перпендикуляр ZP. Если z = a+ bi, то длина отрезка ОР равна \а\, а длина ZP равна \Ь\. Поэтому

ог* = ор*-}-гр*=а*+ь*=г\

откуда r = OZ. Итак, модуль числа z равен расстоянию точки Z от

Рис. 3.

начала координат. Если ß— радианная мера угла, образуемого лучом OZc положительным направлением действительной оси, отсчитываемого от нее в направлении, совпадающем с кратчайшим поворотом от положительного направления действительной до положительного направления мнимой оси, то, проведя окружность радиуса г с центром О, мы видим, что а и b по абсолютной величине и по знаку совпадают с линией косинуса и линией синуса угла ß. Таким образом, в силу (1) должно быть:

откуда а = ß —[— 2^тс. Итак, аргумент числа z с точностью до слагаемого, кратного 2тс, равен углу луча OZ с положительным направлением действительной оси.

Из доказанного вытекает, что модуль и аргумент числа z являются полярными координатами соответствующей точки Z в системе полярных координат, у которой полюс лежит в начале координат О, а полярная ось совпадает с положительным направлением действительной оси Ох.

Умножение комплексных чисел, заданных в тригонометрической форме, выглядит особенно просто.

Теорема 2. При умножении любого конечного числа комплексных чисел модули их перемножаются, а аргументы складываются.

Доказательство. Ограничимся случаем двух сомножителей, так как проведение индукции не представляет затруднений. Итак, надо доказать:

(2)

Но

Отсюда непосредственно вытекает (2). Так как из /^^О, г2^0 следует г^^О, то гхгг — модуль и «i+Oj — аргумент произведения данных чисел, чем теорема для случаев двух сомножителей доказана.

Из этой теоремы вытекает

Теорема 3. При делении комплексных чисел модули делятся, а аргументы вычитаются, точнее

(3)

Доказательство. Частное, как и любое комплексное число, можно записать в тригонометрической форме. Пусть эта запись будет: г0 (cos а0 +1 sin а0). По определению частного тогда

откуда, включая в а0 слагаемое, кратное 2тг, находим: r1=r2r0,

a1=a2+a0, т. е. г0 = —, a0 = a1—a2»

чем теорема доказана.

При совпадении сомножителей из теоремы 2 получается так называемая формула Муавра

[г (cos а + i sin а)]п = rn (cos па -f - i sin па). (4)

Теперь легко решается вопрос об извлечении корня из комплексного числа.

Теорема 4. Пусть z — комплексное un — натуральное число.

В поле комплексных чисел \f z имеет при z = 0 единственное значение 0, а при z ф 0 имеет п различных значений. Если

z = r (cos a + i sin a),

то эти значения находятся по формуле

(5)

Доказательство. 0п = 0 и из хп = 0 в силу отсутствия делителей нуля в поле К (§ 8, теорема 1) следует х = 0. Таким образом, при z = 0 единственное значение у z есть 0. Пусть

z = г (cos a -f -1 sin a) ф 0.

Тогда г ф0 и аргумент a определён с точностью до кратного 2тг.

Предположим, что у z имеет значение х в поле комплексных чисел. Это означает, что xn = z. По теореме 1 число х можно записать в тригонометрической форме:

х = г' (cos a' + i sin a'), r' > 0. Тогда по формуле Муавра (4) находим:

откуда

Можно считать, что целое число k удовлетворяет условию O^k^n—1. В самом деле, деля k на я, находим: k = nq+klf где q и kt—целые числа и О^^^я—1. Тогда

но так как аргумент числа х определён лишь с точностью до кратного от 2тс, то можно считать, что он равен —!-.

Итак,

Мы доказали, что если существует значение -\f z, то оно совпадает с одним из п чисел zk, определяемых равенством (5).

Легко показать, что все числа zk, определяемые из (5), действительно являются значениями у z и притом даже при любом целом В самом деле,

Наконец, покажем, что все п чисел zk при k = 0, 1, 2, п—1 различны между собой. Если k ф I, то по теореме 1 из г^О и Zu = z, следует

с целым т, откуда k — 1=тп. Но из 0^r~k<n и 0^ 1<п следует \k — 1\<п, т. е. \тп\<п, |/я|<1, и так как m — целое, то т = 0, k = l, что невозможно. Теорема доказана.

Из равенств (5) ясно, какой геометрический смысл имеют значения yfz при z ф 0. Так как модуль у всех чисел zk общий, то точки, изображающие эти числа, лежат на окружности радиуса У г с центром в начале координат. Аргументы соседних чисел zk и zk+1 отличаются на — , и следовательно, точки, изображающие числа zk, лежат в вершинах правильного я-угольника, вписанного в упомянутую окружность, причём одна из вершин изображает число z0 с аргументом —, чем однозначно определяется положение остальных вершин.

После выяснения геометрического смысла значений у z полученные прежде (§ 26, теорема 4) свойства корней из действительных чисел получают наглядное истолкование.

Пусть надо найти действительные значения у z из действительного числа z ф 0. Эти значения изобразятся вершинами указанного выше правильного я-угольника, лежащими на действительной оси. Отсюда сразу ясно, что действительных значений может быть не более двух, и если их два, то они равны по абсолютной величине и противоположны по знаку. Если z>0, то его аргумент а = 0 и вершина, изображающая число zQ, лежит на положительной действительной полуоси. При чётном п противоположная вершина также попадает на действительную ось, и мы получим два действительных значения корня; при нечётном же п другая вершина не может попасть на действительную ось, и мы получаем одно действительное значение. Если z<0, то <х = те. Число zk будет действительным, если его аргумент кратен те. При нечётном п аргумент ——-= те—— будет кратен те при k = —^—, и мы получим одно действительное значение корня с аргументом те, т. е. отрицательное, а при четном п аргумент те -^— не может быть кратным те, и мы вовсе не получим действительных значений корня.

Свойства модуля. Модуль комплексного числа z обозначается через I z |. Совпадение этого обозначения с обозначением абсолютной величины в случае действительного z не ведёт к противоречию, ибо если z=a+bi — действительное число, то Ь = 0, и для модуля z находим:

т. е. модуль действительного числа совпадает с его абсолютной величиной.

Комплексные числа

z = a -j- Ы и z = а — Ы

называются сопряжёнными. Очевидно, что сопряжённые числа имеют одинаковый модуль. Далее, произведение сопряжённых чисел равно квадрату их модуля:

Отсюда

(6)

Модуль комплексного числа обладает свойствами, аналогичными свойствам абсолютной величины элемента расположенного поля (§ 10, теорема 8), а именно:

\ху\ = \х\-\у\, (7)

\х+У 1^1*1+1^1 (8)

для любых комплексных чисел х и у.

В самом деле, равенство (7) содержится в теореме 2. Если же не использовать тригонометрическую форму чисел, а принять за определение модуля | z | равенство (6), то (7) можно доказать так:

Для доказательства (8) сначала докажем равенство

+ (9)

Пусть z = a+bi. Тогда

откуда I 1 +z |^ 1 -|-| z\, т. е. (9) доказано.

Теперь докажем (8). Для х = 0 неравенство (8), очевидно, выполнено. Если X -ф 0, то

что и требовалось доказать.

Определения предела последовательности, фундаментальной последовательности и полноты поля (§ 24, определения 3—5) используют лишь понятия абсолютной величины элементов, а доказательства свойств этих понятий (§ 24, теоремы 1—3) используют лишь свойства абсолютной величины, доказанные в теореме 8 из § 9, т. е. I а j > 0 для афО,

\аЬ\ = \а\\Ь\, |а + *|<|а| + |*|.

Равенства (7) и (8) показывают, что модуль | z | комплексного числа z обладает аналогичными свойствами. Поэтому в поле комплексных чисел имеют смысл понятие предела последовательности и другие вышеуказанные понятия и сохраняют силу многие из свойств этих понятий. Точно так же основные понятия и теоремы математического анализа сохраняют силу при переходе от поля действительных к полю комплексных чисел. Их рассмотрение составляет обширную и стройную теорию, называемую теорией функций комплексного переменного1).

1) См. Э. э. м., кн. 3, В. Л. Гончаров, Элементарные функции в комплексной области.

§ 30. Гиперкомплексные числа, кватернионы

В этом параграфе нам придётся пользоваться понятиями векторного пространства и основными его свойствами, а также свойствами многочленов с комплексными или действительными коэффициентами. Нужные свойства мы будем точно формулировать, но за их доказательствами отсылаем читателя ко второй книге «Энциклопедии»1).

Любое комплексное число представляется в виде

а + Ы = а • 1 + Ы

(§ 28, теорема 1), т. е. линейно выражается через два числа 1 и I с действительными коэффициентами а и Ь. После того как комплексные числа получили всеобщее признание в науке, естественно возник вопрос, нельзя ли построить числа, более общие, чем комплексные, которые линейно выражались бы через данные п из них с действительными коэффициентами. В середине XIX столетия английским математиком Гамильтоном были построены такие числа для я = 4, названные им кватернионами. Однако для этого пришлось отказаться от коммутативности умножения. Позднее было доказано, что это не случайно: поле действительных чисел (при п=\) и поле комплексных чисел (при п = 2) оказались единственными полями такого рода.

Имея в виду кватернионы и более общие системы, играющие в современной алгебре важную роль, мы в настоящем параграфе будем понимать под кольцом более общее образование, чем до сих пор. Именно, мы откажемся от коммутативности умножения (§ 7, свойства 1, IV). Тогда вместо одного закона дистрибутивности (§ 7, VI) надо требовать выполнения двух условий:

VI'. (a+b)c = ac+bc, c(a+b) = ca+cb.

Соответствующее обобщение даётся понятию поля. Здесь вместо одного закона обратимости (§ 8, свойства I, VII) требуется:

VU'. Для любых а и Ь, где афО, уравнения ax = bf ya = b имеют решения.

В отличие от колец здесь принято изменение терминологии. Множество Р с операциями сложения и умножения, обладающими свойствами I — III, V из § 7, VI' и Vir и содержащее более одного элемента, называется телом.

Элементы тела, отличные от нуля, образуют группу (вообще говоря, некоммутативную). Поэтому, как и в случаях поля, тело обладает единицей, а всякий его элемент, отличный от нуля, — обратным элементом.

1) См. Э. э. м., кн. 2, А. И. Узков, Векторные пространства и линейные преобразования.

Определение 1. Множество R называется n-мерным векторным пространством над данным полем Р, если в R определена операция сложения, относительно которой R является коммутативной группой (§ б, определение 2), и если, кроме того, определено умножение элементов из R на элементы поля Р, обладающее следующими свойствами:

1) Произведение ах любого элемента а из Р на любой элемент X из R есть некоторый элемент из R.

2) а(х+у) = ах+ау для любых а из Р и х, у из R.

3) (a+b)x = ax+bx для любых a, b из Р и х из R.

4) (ab)x = a (Ьх) для любых a, b из Р и х из R.

б) В R существует п элементов е19 ..., еп (базис R) таких, что любой элемент х из R однозначно представляется в виде

X = avex + a2é>2 + • • • + апеп>

где аи а2, ..., ап — элементы поля Р, называемые компонентами вектора х.

Отсюда легко следует, что сложение двух векторов сводится к сложению их компонент и умножение вектора на элемент поля Р— к умножению компонент на данный элемент. Поэтому /г-мерное векторное пространство над полем Р можно также определить, как совокупность всех упорядоченных систем (аи а2, ..., ап) из п элементов поля Р с указанными выше сложением и умножением на элементы из Р.

Определение 2. n-мерное векторное пространство R над полем Р называется алгеброй (или гиперкомплексной системой) ранга п над полем Р, если в R, кроме сложения, определена операция умножения, причём относительно этих двух операций R является кольцом (не обязательно коммутативным) а умножение в R связано с умножением его элементов на элементы из поля Р следующим условием:

6) (ах)у = х{ау) = а{ху)

для любых а из Р и х, у из R.

Если при этом кольцо R является телом, то R называется алгеброй с делением.

Из 6) следует:

(ах)(Ьу)=(аЬНху) (1)

для любых a, b из Р и х, у из R.

Отсюда в силу законов дистрибутивности VI' следует, что произведения любых элементов из R вполне определяются произведениями базисных элементов, так как если

(2)

Каждое произведение e^j в силу 5) линейно выражается через базис в виде

(3)

где Cijk — элементы поля Р, однозначно определяющие произведения e^j.

Условиями (2) и (3) произведение любых элементов из R вполне определено, причём законы дистрибутивности VT будут автоматически выполнены. Для выполнения закона ассоциативности умножения для любых элементов из R достаточно потребовать его выполнение для элементов базиса. Это даёт условия

(eiej)ek = ei(ejek) & /,*=!, 2,.м,4 (4)

Вычисляя здесь произведение элементов базиса согласно (3), мы получаем условия, связывающие элементы с^Л, при выполнении которых в R справедлив закон ассоциативности умножения. Таким образом, алгебры ранга п над полем Р вполне определяются заданием поля Р ранга п и rii элементов ciJk (i, j, k= 1, 2, ..., ri) из поля Pt удовлетворяющих условиям (3) и (4), где еи е2> еп — данный базис пространства R; пг элементов c{J-k поля Р называются структурными константами или постоянными умножения данной алгебры R.

Приведём простейшие примеры алгебр.

Пример 1. Поле действительных чисел D является одномерным векторным пространством над тем же полем D с базисным элементом 1. Считая произведение ах вектора х на числа а совпадающим с обычным произведением чисел а и х, получим алгебру ранга 1 над полем D. При базисном элементе 1 единственная структурная константа сш=1. Если за базисный элемент принять любое число а ф О, то из а2 = а • а следует, что новая структурная константа будет: c'Ui = a. Очевидно, что D — алгебра с делением и притом коммутативная.

Пример 2. Поле комплексных чисел К является двумерным векторным пространством над полем действительных чисел D с базисом из двух элементов 1, /, так как любое комплексное число представляется в виде а-\+Ы с действительными а и Ь. Считая произведение ах вектора х на действительное число а совпадающим с обычным произведением а и х, получим алгебру ранга 2 над D. Из правил умножения базисных элементов (1*1 = 1,

i-i =—1, I • i = i . l=i) находим значения всех 23 = 8 структурных констант в данном базисе:

К—коммутативная алгебра с делением.

Пример 3. Тело кватернионов. Существует ещё одна алгебра с делением над полем действительных чисел D и притом ранга 4. Это — алгебра кватернионов Q.

Будем считать, что Q содержит поле действительных чисел D. Приняв за первый элемент базиса число 1 и обозначив остальные его элементы через /, /, ky находим, что любой кватернион q единственным образом представляется в виде

q = a+bi+cj+ dk, (5)

где а, Ь, с, d — действительные числа. Для полного описания алгебры достаточно задать таблицу умножения базисных элементов. Мы положим:

(6)

Кроме того, число 1 обладает обычным свойством при умножении, т. е. 1-1 = 1, 1 • i = l -l=i и т. д. Таким образом,

I] = — Д jk = — kjy kl = — iky

т. е. алгебра Q некоммутативна.

Остаётся проверить ассоциативность умножения базисных элементов (4). Так как соотношения (6) симметричны относительно I, j, k, то достаточно проверить равенства, в которых совпадают все три элемента, или два элемента, или все элементы различны, т. е. равенства

Проверку этих равенств предоставляем читателю.

Покажем, что алгебра Q является телом. Из того, что 1 обладает обычным свойством при умножении на элементы базиса, применяя свойства 2) и 6) и выражение (5) для кватернионов q, получим: I • q = q - l=q для любого q, т. е. число 1 играет роль единицы кольца Q.

Кватернион

называется сопряжённым кватерниону

q = a + Ы + cj+dß.

Пользуясь таблицей умножения (6), законом дистрибутивности и соотношением (1), легко проверить, что

qq = qq = а* + Ъ* + с8 + Л

Число

называется нормой кватерниона q = a+bi+cj+dk. Очевидно, что N(q) = N(q) и Л/^сО^О, причём N(q)>Ot если q^O. Так как

для любого q фО, то любой кватернион # ^ О обладает обратным элементом

Отсюда уже следует (см. § 6), что множество всех кватернионов, отличных от нуля, образует группу относительно операции умножения. Поэтому кольцо Q является телом, т. е. алгеброй с делением над полем действительных чисел D.

Для ознакомления с другими свойствами кватернионов, в частности с их геометрическим представлением, отсылаем читателя к книге Э. Чезаро [14], стр. 393—412.

Мы рассмотрели три алгебры с делением над полем действительных чисел, а именно ранга 1, 2 и 4. Справедлива замечательная теорема о том, что других алгебр такого типа не существует. Точнее любая алгебра с делением над полем действительных чисел изоморфна одной из этих трёх алгебр.

Чтобы доказать это, сделаем несколько замечаний, касающихся алгебры над любым полем Р. Если читателя затрудняет рассмотрение любого поля, то он может ограничиться нужным для дальнейшего <лучаем поля действительных чисел.

Замечание 1. Любой элемент х алгебры R над полем Р является корнем некоторого многочлена с коэффициентами из поля Р, не все из которых равны нулю.

В самом деле, если п — ранг /?, то любые лг —]— 1 элементов хи...,хп+1 из R линейно зависимы. В частности, элементы X, X2, хп+1 линейно зависимы, т. е. ахх + а2х2 -|- ... . ..+ап + \хп+1 — 0, где av а2, ап+1 не все равны нулю. Это значит, что элемент х является корнем многочлена axz + a^z1 + .., ...-4-ая+1гл+1 с коэффициентами из Р.

Замечание 2. Равенства вида f(z)+g(z)=h(z) nf(z) • g(z) = z=r-h (z), где/(г), g(z), h(z) — многочлены от одного неизвестного z с коэффициентами из поля Р1), сохраняют силу при замене неизвестного z любым элементом х алгебры R над полем Р.

В самом деле, из 3) следует, что f(x)+g(x) = h(x) Далее, хт • хп = хт+п [§ б, (3)]. Отсюда из законов дистрибутивности VI и из соотношений (1) и 3) следует, что

f(x)-g(x) = h(x).

Замечание 3. Если алгебра R над полем Р содержит единицу е (в частности, если R — алгебра с делением), то R изоморфна алгебре, содержащей поле Р. В самом деле, из 3) и (1) следует:

ate -j- а2е = (a, -f а2) е$

(ate) (а2е) = Oi^) = (^1^2) е-

Таким образом, множество Р' всех элементов алгебры R вида ае изоморфно полю Р (§ 9, определение 2). По теореме 2 из § 9 (где коммутативность умножения несущественна) существует кольцо R', содержащее Р и изоморфное кольцу R. Определим произведение ах' элемента а из Р на элемент х' из R' как элемент R', соответствующий произведению ах из R, где х — элемент из R, соответствующий элементу х' Нетрудно показать, что тогда R' будет алгеброй над полем Р, причём для элемента х' из Р определённое выше произведение ах' совпадает с произведением элементов а и х'у заданным в поле Р. Поэтому единица поля Р будет в то же время единицей алгебры R\.

Замечание 4. Алгебра с делением не имеет делителей нуля (§ 7, определение 2). Доказывается это так же, как в случае полей: если ху = 0 и хфОу то, умножая обе части равенства слева на X"1, получим: у = 0.

Теорема 1. Любая коммутативная алгебра с делением R над полем действительных чисел D изоморфна либо полю действительных чисел D, либо полю комплексных чисел R и имеет ранг 1 или 2. Обратно, любая алгебра с делением R над полем действительных чисел D ранга 1 или 2 изоморфна соответственно полю действительных или комплексных чисел и коммутативна.

Доказательство, а) Пусть R — алгебра с делением над полем действительных чисел Д содержащая D, но не совпадающая с D.

Покажем, что для любого элемента х, не входящего в D, существуют действительные числа а и Ъ, где а ф 0, такие, что эле-

1) Понятие многочлена и операций сложения и умножения с коэффициентами из некоторого поля Р вполне аналогично соответствующим понятиям для многочленов с числовыми коэффициентами. Разница лишь в том, что коэффициенты многочленов будут не числами, a элементами данного поля

мент i — ax+b обладает свойством Р = —1. (Заметим для дальнейшего, что при этом мы не пользуемся коммутативностью алгебры R.) Согласно замечанию 1 элемент х является корнем многочлена f(z) с действительными коэффициентами, не все из которых равны нулю. Но известно, что любой такой многочлен разлагается на множители первой или второй степени с действительными коэффициентами1). Пусть

/(*)=/.(*)/.(*).../*(«)

такое разложение. Тогда, согласно замечанию 2,

Но f(x) = 0, и по замечанию 4 алгебра R не имеет делителей нуля. Поэтому ft(x) = 0 для некоторого l^k. Если х — корень многочлена z — с первой степени, то х — с = 0, х = с, т. е. х принадлежит полю D, что противоречит условию. Таким образом, X есть корень многочлена второй степени, т. е. х2, -j- рх +q = О,

где р и q — действительные числа, причём ~--q<®> ибо иначе х

был бы корнем многочлена первой степени. Полагая

с действительным /, получим:

откуда, деля на t2, находим:

Полагая а = у и b = ^j, получим элемент l = ax+by для которого 12 = —1, что и нужно.

б) Пусть R — коммутативная алгебра с делением над полем действительных чисел Д содержащая D. Если R^ D, то по доказанному в R существует элемент i такой, что г2 = —1. Поэтому элемент i не входит вой элементы 1, i линейно независимы. Пусть R0 — множество всех элементов х алгебры R вида х = а+Ы с любыми действительными а и Ь. Очевидно, что R0 — алгебра ранга 2 над полем D — изоморфна полю комплексных чисел R.

Покажем, что RQ = R. Полагая, Ь = 0 в равенстве x = a+bU получим: х = а. Следовательно, RQ содержит поле действительных

1) См. Э. э. м., кн. 2, Л. Я. Окунев, Кольцо многочленов и поле рациональных функций, гл. I, § 6.

чисел D. Пусть х— любой элемент алгебры R, не входящий в D. По доказанному в пункте а) существуют действительные числа с, d, где сфОу для которых элемент j = cx+d обладает свойством /2 = —1. Из коммутативности R следует, что ij=ji, откуда

(i +/) (i —Л =** - V -rß -/ = о-

Так как согласно замечанию 4 в R отсутствуют делители нуля, то либо i—у = 0, либо i+j= 0, т. е. j = ±i, а потому-

Поэтому X принадлежит /?0, откуда RQ = R.

Итак, алгебра /? либо совпадает с D, либо изоморфна полю комплексных чисел R. Согласно замечанию 3 любая коммутативная алгебра с делением над полем действительных чисел изоморфна некоторой алгебре R (очевидно, также коммутативной и с делением), т. е. изоморфна либо полю действительных чисел D, либо полю комплексных чисел R.

в) Пусть R — любая алгебра с делением ранга 1 над полем действительных чисел D, содержащим D. Приняв за базисный элемент число 1, получим, что любой элемент х из R имеет вид Х = а*\=а с действительным а, следовательно, R = D. По замечанию 3 любая алгебра с делением ранга 1 над D изоморфна полю действительных чисел D.

г) Пусть R — любая алгебра с делением ранга 2 над полем действительных чисел D, содержащая D. Тогда R ф D. По доказанному в пункте а) в R существует элемент i со свойством i2 = —1. Элементы 1, i линейно независимы, так как иначе ах • 1 -j-—j- = 0 с действительными аи а2, отличными от нуля (ибо в силу отсутствия делителей нуля из ^ = 0 следует а2 = 0, и обратно).

Тогда / =--—, т. е. принадлежит Д что невозможно ввиду £2 = —1 (§ 10, теорема 7). Так как в /г-мерном векторном пространстве любые п линейно независимых векторов образуют базис1) и R — алгебра ранга 2, то элементы 1, i образуют базис Таким образом, любой элемент х из R однозначно представляется в виде х — а-\~Ы с действительными а и Ъ. Если х = а+Ы и у — с+ ~\-di — любые два элемента из R, то из таблицы умножения элементов легко находим:

x+y=(a + c) + (b+d)i,

ху = (ас — bd) + (ad -f - be) и

Итак, алгебра R изоморфна полю комплексных чисел К. По замечанию 3 любая алгебра с делением ранга 2 над полем

1) См. Э. э. м., кн. 2, А. И. Узков, Векторные пространства и линейные преобразования.

действительных чисел D изоморфна полю комплексных чисел К. Теорема доказана.

Если отказаться от коммутативности умножения, то возможна еще одна алгебра с делением над полем D — алгебра кватернионов, а именно:

Теорема 2. (Теорема Фробениуса.) Любая алгебра с делением R над полем действительных чисел D изоморфна полю действительных чисел D, либо полю комплексных чисел К, либо телу кватернионов Q и имеет ранг 1, 2 или 4.

Доказательство. Пусть R — любая алгебра с делением ранга п над полем действительных чисел D, содержащая D. По теореме 1, если я = 1, то R изоморфна полю действительных чисел D, а если п = 2, — полю комплексных чисел К. Пусть R имеет ранг л>2. Тогда R ф D. По доказанному в пункте а) в R существует элемент i, для которого Р = —1.

Как в пункте г), докажем, что элементы 1, I линейно независимы. Так как ранг R больше двух, то в R существует элемент х, который нельзя представить в виде а+Ы с действительными а и Ь. По доказанному в пункте а) существуют действительные числа а' и Ь\ где а' ф 0, такие, что элемент хх = а'х + b' обладает свойством х\ = —1. Элемент хх нельзя представить в виде а+Ы с действительными а и Ь, так как иначе и элемент

также представлялся бы в указанном виде. Поэтому элементы 1, I, Х\ линейно независимы. В самом деле, если

ау • 1 -|- аг1 + аъхх = О

с действительными alf а2, а3, то а3 = 0 (ибо иначе хх линейно выражался бы через 1, г), а по линейной независимости 1, t тогда также а1 = а2 = 0. Рассуждая, как в пункте а), находим, что элементы I —|— X} и I — хх являются корнями квадратных уравнений с действительными коэффициентами, откуда

Поэтому

(7)

где ру q, r, s — действительные числа. Складывая эти равенства, получаем:

откуда в силу линейной независимости элементов 1, 1% хх находим:

р Jrr = 0, р — г— 0, т. е р — г— О, Тогда из (7) следует:

где t = ^(q+2)— действительное число. Положим теперь х2 =— xx+ti\ элементы 1, I, х2 линейно независимы, так как иначе элементы 1/ i, хх были бы линейно зависимы. Из (8) следует:

X*=— 1 -f / (ix, + xxï) — fi=fi — 1.

Число fi — 1 — отрицательное действительное число, так как если fi—1>0, то fi—1=к2 с действительным и. Из перестановочности х2 и и находим:

(х2 + и) (х2 — и) = х\ — и2 = О,

т. е. х2 = ± и — действительное число, что противоречит линейной независимости элементов 1, i, х2.

Положим х\ — —с2, где с — действительное число и пусть

Тогда j* = —1 и элементы 1, i, j линейно независимы, ибо 1, г", х2 линейно независимы. Далее, в силу (8)

откуда

(9)

Положим k=lj и покажем, что k нельзя выразить линейно через 1, i, j. Если k = a+bi+ cj с действительными а, Ь, с, то, умножая это равенство слева на I, получим:

ik — I (ij) = — j=ai — b+ck = al — b + с (a + bi + cj),

откуда

(ac _ b) + (a + bc) i + (fi + 1 )j = 0,

и в силу линейной независимости элементов 1, i, j должно быть с2 —[— 1 = 0, с2 =—1, что невозможно, так как с — число действительное. Рассуждая, как выше (для 1, г, хг) докажем, что элементы 1, г, у, k линейно независимы. Таким образом, ранг алгебры R не меньше четырёх.

Покажем, что элементы i, /, k обладают таблицей умножения (6). Мы уже имеем: i2=/2 =—1 и j=k. Далее, в силу (9):

Таким образом, все соотношения (6) выполнены. Как было отмечено в конце замечания 3, число 1 является единицей алгебры R. Поэтому совокупность Q всех элементов х из /?, имеющих вид x = a+bi+cj +dk, с действительными а, Ь, с, d является телом кватернионов. Покажем, что R = Q. В противном случае в R существует элементу, не принадлежащий Q. По доказанному в пункте а) существуют действительные числа а и bf где а ф 0, такие, что элемент l=ay+b обладает свойством /2 = —1, элемент / лежит вне Q, так как иначе У — — I—— лежал бы в Q. Рассуждая, как при выводе (8), найдём:

где а, Ь, с — действительные числа. Отсюда находим:

т. е.

Умножая это равенство справа на k, получим:

— 21 = ai + bj + cky

т. е. элемент / принадлежит Q, что невозможно, следовательно, R = Q. Итак, либо R = D, либо R = K, либо R = Q. Согласно замечанию 3 любая алгебра с делением над полем действительных чисел D изоморфна алгебре R (также с делением), содержащей Д т. е. изоморфна либо полю действительных чисел D, либо полю комплексных чисел К, либо телу кватернионов. Теорема доказана.

Заменяя в примерах 1—3 поле действительных чисел D полем рациональных чисел Г получим ещё три алгебры с делением, но уже над полем Г, именно: само поле рациональных чисел Г, поле комплексных чисел вида а+Ы с рациональными а и b (так называемое числовое поле Гаусса) и тело рациональных кватернионов, т. е. кватернионов вида a~\-bl~\-cj+dk с рациональными а, Ь, с и d.

Заметим, что, заменяя в тех же примерах 1—3 поле действительных чисел D на поле комплексных чисел К, мы в примере 1

получим само поле Л", а в примерах 2 и 3 получим алгебры над К, уже не являющиеся алгебрами с делением. В самом деле, согласно замечанию 1 любой элемент х алгебры R над К, содержащей Л", является корнем многочлена f{z) с комплексными коэффициентами. Известно1), что любой многочлен с комплексными коэффициентами разлагается на множители первой степени также с комплексными коэффициентами. Если R — алгебра с делением, то, рассуждая, как в а), найдём, что х является корнем многочлена первой степени с комплексными коэффициентами и, следовательно, сам является комплексным числом. Поэтому R = K-

Итак, если R есть алгебра над полем К ранга, большего единицы (как в примерах 2 и 3), то она не является алгеброй с делением.

Литература

1. Александров П. С, Введение в общую теорию множеств и функций, Гостехиздат, М.—Л., 1948.

2. Лузин Н. Н., Теория функций действительного переменного, Учпедгиз, М., 1948.

3. Окунев Л. Я., Основы современной алгебры, Учпедгиз, 1941.

4. Вандер Варден Б. Л., Современная алгебра, ч. 1, Гостехиздат, 1947.

5. Проскуряков И. В., Числа и многочлены, Издательство АПН РСФСР, 1949.

6. Шмидт О. Ю., Абстрактная теория групп, Гостехиздат, 1933.

7. Курош А. Г., Теория групп, Гостехиздат, 1944.

8. Ефимов Н. В., Высшая геометрия, 2-е изд., Гостехиздат, 1949.

9. Костин В. И., Основания геометрии, 2-е изд., Учпедгиз, М.—Л., 1948.

10. Дедекинд Э., Непрерывность и иррациональные числа, Одесса, 1923.

11. Хинчин А. Я., Восемь лекций по математическому анализу, Гостехиздат, 1943.

12. Курош А. Г., Курс высшей алгебры, 2-е изд., Гостехиздат, М.—Л., 1950.

13. Кузьмин Р. О. и Фаддеев Д. К., Алгебра и арифметика комплексных чисел, Учпедгиз, 1939.

14. Чезаро Э., Элементарный учебник алгебраического анализа и исчисления бесконечно малых, ОНТИ, 1936.

1) См. Э. э. м., кн. 2, Л. Я. Окунев, Кольцо многочленов и поле рациональных функций, гл. I, § 6.

А. Я. ХИНЧИН

ЭЛЕМЕНТЫ ТЕОРИИ ЧИСЕЛ

ГЛАВА I

ДЕЛИМОСТЬ И ПРОСТЫЕ ЧИСЛА

§ 1. Введение

Значительная часть наиболее актуальных проблем теории целых чисел от глубокой древности до наших дней прямо или косвенно связана с понятием делимости чисел. Причину этого явления легко понять: из четырёх основных арифметических действий только деление не всегда выполнимо в области целых чисел, и поэтому только в отношении деления можно разумным образом ставить вопрос о том, при каких условиях оно выполнимо. Уже самые элементарные понятия теории делимости — наибольший общий делитель, наименьшее общее кратное, взаимно простые числа, абсолютно простые числа и т. п. — не имеют себе никаких аналогов в случае других арифметических действий именно в силу неограниченной выполнимости этих действий.

С другой стороны, исторический ход развития арифметической науки показал, что теория делимости чисел, исходя из простейших и наиболее естественных задач, связанных с этим понятием, неизбежно и очень скоро приходит к образованию новых, более сложных понятий и к постановке новых, более трудных задач. Общеизвестно, как часто здесь возникают задачи, не только содержание, но и естественность постановки которых понятны и убедительны даже учащемуся средней школы, между тем как решение их подчас веками не поддаётся усилиям величайших учёных. Это делает понятным, почему учение о целых числах всегда казалось учёным неисчерпаемым полем для исследования и во все времена привлекало к себе внимание наиболее выдающихся умов.

В этих исследованиях русские, а позднее советские научные школы всегда занимали и до сих пор занимают одно из ведущих мест. Со времён Эйлера наша Академия наук давала — и даёт до настоящего времени — блестящие образцы создания как новых глубоких проблем, так и сильнейших методов их решения. Достаточно упомянуть созданную нашим великим Чебышевым замечательную школу арифметических исследований, равной которой за

последнее столетие не было и нет во всём мире и традиции которой в руках блестящей плеяды советских математиков и сегодня ещё приводят к глубочайшим достижениям1).

Нам предстоит здесь в кратком очерке проследить развитие некоторых разделов этого учения от древнейших времён до наших дней, уделяя — там, где это нужно, — особое внимание методологической и педагогической стороне дела.

§ 2. Однозначное разложение чисел на простые множители

Для всех многообразных разветвлений теории делимости центральное место занимает теорема об однозначной разложимости чисел на простые множители:

Основная теорема. Всякое натуральное число, кроме 1, может быть представлено как произведение простых множителей; это представление единственно, если отвлечься от порядка множителей.

Последнее означает, что если мы имеем

n=PiP2 ••• Pr=4i4% ■•• 4s>

где все pi и qj— простые числа, то s = r и числа qj лишь порядком расположения могут отличаться от чисел pt.

Примечание. Число р> 1 называется простым (или абсолютно простым), если оно не имеет других делителей, кроме р и 1, Все другие числа, превосходящие 1, называются составными; число 1 занимает особое положение, не будучи ни простым, ни составным. К сожалению, до недавнего времени почти все наши учебники причисляли единицу к простым числам; да и сейчас ещё сохранились среди методистов влиятельные сторонники этой традиции, несмотря на её грубую ошибочность, многократно доказанную. Вопрос о том, считать ли единицу простым числом, не есть, как это могло бы казаться, вопрос терминологии или вкуса. Называя единицу простым числом, мы немедленно делаем неверными почти все теоремы, связанные с простыми числами. Достаточно указать, что только что формулированная нами основная теорема при этом становится неверной, ибо, например, число 5 может быть разложено на простые множители бесконечным множеством способов:

5 = 1-5=1-1.5 = 1-1-1.5=...;

если 1 — простое число, то все эти разложения различны между собою (хотя бы потому, что число множителей в них различно).

1) Важнейшие этапы развития этой школы очень детально изложены в книге Б. Н. Делоне, Петербургская школа теории чисел, Издательство АН СССР, 1947.

Перейдём теперь к доказательству основной теоремы, которое во многих отношениях представляет методологический интерес.

Прежде всего очень легко доказать возможность разложения. Пусть я>1—любое натуральное число. Среди его делителей существуют числа, превосходящие 1 (например, само число /г). Пусть рх — наименьший из таких его делителей; очевидно, рх есть простое число, ибо иначе оно имело бы такой делитель а, что ^<а<Р\<> но а, будучи делителем pv было бы и делителем числа п, что, очевидно, противоречит определению числа рх\ итак, п=р1п1, где рх — простое число. Если пх>1, то, поступая с ним так же, как мы только что поступили с числом п, мы представим его в виде п1=роП2, где р2 — простое число; отсюда п=Р\РъП£ если ещё /22>1, то этот процесс, очевидно, можно продолжать и далее. Так как при этом п>пх>п2> ... , то проводимый нами процесс после конечного числа шагов должен прекратиться, что может наступить лишь при условии, что какое-либо пк=\. Но тогда

V—PiPî

где pl9 р2, pk — простые числа. Этим и доказана возможность разложения любого натурального числа п>1 на простые множители.

Теперь мы должны убедиться в единственности такого разложения, что представляет собою задачу значительно более трудную. Исторически очень интересно, что неочевидность этой единственности (а значит, и необходимость её доказательства) была осознана сравнительно поздно, после того как долгое время уже пользовались ею как самоочевидным фактом. Повидимому, Гаусс впервые настойчиво указывал на то, что невозможность двух существенно различных разложений одного и того же числа на простые множители отнюдь не самоочевидна и нуждается в строгом доказательстве. Даже такие выдающиеся учёные, как, например, Лежандр, писавший незадолго до Гаусса, не замечали этого. Дальнейшее развитие теории чисел показало, в какой мере Гаусс оказался прав не только с формально-логической, но и с идейной точки зрения. В XIX столетии учёным пришлось исследовать законы делимости для областей, более сложных, чем числа натурального ряда,— для так называемых целых алгебраических чисел. Законы эти во многом напоминали то, что мы имеем в области натуральных чисел, но вместе с тем иногда оказывались и существенно иными; в частности, здесь имеются простые числа, и любое число разлагается на простые множители; но разложение это, вообще говоря, неоднозначно, и именно это обстоятельство создало в арифметике алгебраических чисел новую, своеобразную трудность, совершенно незнакомую обычной арифметике натуральных чисел и в настоящее время успешно прёодолённую.

Доказательство единственности разложения натуральных чисел на простые множители обычно имеет своим основанием следующее весьма замечательное предложение, которое оказывается полезным и во многих других задачах теории чисел.

Теорема 1. Если натуральные числа а и b взаимно просты, то существуют такие целые числа х и у, что

ах — by — 1.

Эту теорему обычно доказывают, опираясь на алгорифм Евклида и теорию цепных дробей. Мы увидим в главе III, как это может быть сделано. Здесь же мы приведём другое, методологически очень поучительное доказательство, данное Гауссом и свободное от применения каких бы то ни было алгорифмов.

Пусть d есть наименьшее положительное число, которое может быть представлено в виде

d — ax — by (1)

при надлежащем выборе целых чисел х и у. Мы должны доказать, что d—1; а так как числа а и b взаимно просты, т. е. не имеют других положительных общих делителей, кроме 1, то для этого достаточно убедиться, что как а, так и b делятся на d. В силу полного равноправия чисел а и b достаточно, разумеется, провести доказательство для какого-нибудь одного из них; мы покажем, что а делится на d.

Пусть а при делении на d даёт в частном m и в остатке г, так что

a = md+r (0^r<d).

Отсюда

г=а — md = а — m (ах — by) = а (1 — тх) — b (— ту) = ах'—by', где положено:

х' = 1 — тх, у' = — ту.

Таким образом, число г может быть представлено в виде ах' — by' с целыми х', у'. Так как r<d, a d есть по определению наименьшее положительное число, представимое в форме ах — by, то число г не может быть положительным; следовательно, г~0 и a = md, т. е. а делится на d, что и требовалось доказать.

Заметим, что мы в сущности доказали теорему, применимую к любым целым числам а и b (не обязательно взаимно простым), а именно:

Наименьшее положительное число d, представимое в виде ах — by с целыми х и у, есть наибольший общий делитель чисел а и Ь.

В самом деле, что d есть общий делитель чисел а и Ь, нами уже доказано; но этот общий делитель является наибольшим, так

как само соотношение (1) показывает, что d делится на любое число, служащее общим делителем чисел а и Ь.

Заметим, наконец, что весь этот круг вопросов, в особенности если присоединить к нему то, что будет по этому поводу изложено в главе III, в связи с алгорифмом Евклида, может служить превосходным — нетрудным и вместе с тем увлекательным — материалом для работы математического кружка средней школы.

Воспользуемся теперь теоремой 1 для доказательства следующего очень важного предложения теории делимости (известного уже Евклиду):

Теорема 2. Если числа а и b взаимно просты, а произведение ас делится на Ь, то и число с делится на Ь.

В самом деле, в силу теоремы 1 целые числа х и у могут быть выбраны так, что

ах — Ъу= 1,

откуда

асх — Ьсу = с.

Так как по условию ас делится на Ь, то пусть ac = bk, где k — целое число; мы получаем:

с = асх — bcy = bkx — bcy = b (kx — су),

откуда и видно, что с делится на Ь.

Пусть теперь р — простое число и а — любое натуральное число; очевидно, что тогда возможно только одно из двух: либо а делится на р, либо а взаимно просто с р. В самом деле, если а не взаимно просто с р, то а и р имеют общего делителя d>l; но р, будучи числом простым, делится только на 1 и р\ поэтому d=p и а делится на р.

Это простое замечание позволяет вывести из теоремы 2 следующее важное

Следствие. Если произведение ab делится на простое число р, то по меньшей мере один из сомножителей делится на р.

В самом деле, если, например, а не делится на р, то в силу только что сделанного замечания а взаимно просто с р; но тогда из делимости произведения ab на р в силу теоремы 2 вытекает, что b делится на р, что и требовалось доказать.

Это правило, доказанное нами для произведения двух сомножителей, легко способом индукции распространить и на любое число сомножителей. Пусть, например, произведение abc делится на простое число р; если а не делится на р, то согласно доказанному произведение be должно делиться на р, а тогда, как мы знаем, либо Ь, либо с делится на р. В конечном счёте, следовательно, из делимости на простое число р произведения abc вытекает делимость на р по меньшей мере одного из сомножителей. Таким же путём от трёх сомножителей можно, очевидно, перейти к четырём,

пяти и вообще любому числу сомножителей. Таким образом, мы можем считать установленным следующее общее предложение, которое и было целью всех предшествующих рассуждений:

Теорема 3. Если произведение нескольких чисел делится на простое число р, то по меньшей мере один из сомножителей делится на р.

Теорема 3 позволяет уже легко установить единственность разложения любого натурального числа (кроме 1) на простые множители. В самом деле, пусть мы имеем:

n=PiP* --Pr=Çi9* 9s> (2)

где все pi и все qj — простые числа; требуется доказать, что числа Qu Qz> • - • t Qs лишь порядком расположения могут отличаться от чисел р19 /?2, ... , рг. Другими словами, в если предположить, что как числа р£, так и числа qj расположены в порядке возрастания (т. е. рг^р2^ ... ^рп qi^Çi^ ... ^qs)> т° требуется просто доказать, что r — s и pi = qi(l ^i^r). Именно так мы и поступим.

Докажем сначала, что p1 = ql. В самом деле, пусть, например, 4\>Pv в силу равенства (2) произведение <7i<72 • • • 4* делится на Pil поэтому в силу теоремы 3 по меньшей мере одно из чисел qj делится на рх\ но все qj — простые числа, а потому то из них, которое делится на pv должно просто совпадать с рх\ это же невозможно, так как согласно нашему предположению

Pl<Çl^Ç2^-'-^Çs-

Итак, pî = ql; но тогда соотношение (2) даёт:

P*Pz---Pr=9*9z---9s-Очевидно, отсюда мы можем, в точности повторяя только что проведённое рассуждение, доказать, что p2 = q2; это же даёт:

P9Pi---Pr=9z9i---9s> откуда /73 = ^а и т. д. Этот процесс мы можем продолжать до тех пор, покуда и налево, и направо у нас ещё сохраняются простые множители; он обрывается, как только тут или там простые множители исчерпаны; но очевидно, что это должно наступить налево и направо одновременно, т. е. что мы должны иметь r — s. В самом деле, если бы, например, мы имели r<s, то согласно вышесказанному доказали бы, что p1=qv p^ — q^ ... , pr = qn и после сокращений получили бы:

1 = qr+i qr+2 ... qs,

что очевидным образом неверно. Итак,

т. е. оба разложения числа п на простые множители полностью совпадают между собою. Этим фундаментальная теорема теории делимости полностью доказана.

Мы видим, что ключом к её доказательству нам служила важная теорема 2. Все доказательства фундаментальной теоремы так или иначе базируются на этом предложении; различия их касаются лишь того пути, каким мы приходим к теореме 2. Выше мы выбрали путь, идущий через теорему 1. Методологически этот путь важен и интересен тем, что он не предполагает известными свойства наибольшего общего делителя и наименьшего общего кратного двух чисел (для реализации этого пути нет даже надобности в знакомстве с этими двумя понятиями); дело в том, что исследование этих двух понятий с максимальной простотой и прозрачностью проводится, как известно, на основе самой фундаментальной теоремы.

Однако методологически интересно показать, что решающая теорема 2 может быть доказана и совсем иным путём, обходящимся без теоремы 1 и опирающимся на элементарные свойства наименьшего общего кратного двух чисел. Проследим теперь этот путь.

Прежде всего здесь надо установить структуру совокупности всех общих кратных двух данных чисел а и Ь, т. е. всех чисел, делящихся как на а, так и на Ь. Если m — наименьшее положительное число, делящееся на а и на b (т. е. наименьшее общее кратное чисел а и b), а т!— какое-либо другое общее кратное тех же чисел, то пусть q— частное, а г—остаток от деления m! на m, так что

m' = qm+ г (О ^ г<ш);

отсюда

r—m! — qm.

Так как m' и m оба делятся на а и Ь, то число г также будет общим кратным чисел а и о; но r<m, a m есть наименьшее положительное общее кратное чисел а и Ь. Следовательно, г = 0 и m'=qmy т. е. всякое общее кратное чисел а и b делится на т. Так как, очевидно, и обратно — всякое число вида qm есть общее кратное чисел а и Ь, то совокупность общих кратных чисел а и b совпадает с совокупностью чисел, кратных некоторого одного числа m (которое есть наименьшее общее кратное чисел а и Ь).

Теперь мы покажем, что наименьшее общее кратное двух взаимно простых чисел равно их произведению.

Пусть числа а и b взаимно просты и m — их наименьшее общее кратное. Так как произведение ab есть общее кратное чисел а и b, то согласно предыдущему

где q — целое число. Но вытекающие отсюда соотношения

показывают, что q есть общий делитель взаимно простых чисел а и Ъ\ следовательно, q=l и m = ab, что и требовалось доказать.

Теперь уже совсем легко установить теорему 2. Так как, по предположению, ас есть общее кратное взаимно простых чисел а и b, то ас делится на наименьшее общее кратное этих чисел, которое, как мы только что установили, равно ab. Делимость же ас на ab равносильна делимости с на Ьу чем теорема 2 и доказана.

§ 3. О простых числах

Простые числа в теории делимости играют роль первичных, неразложимых элементов, из которых путём перемножения затем создаются все другие натуральные числа, как этому учит вышеустановленная фундаментальная теорема. Множество простых чисел служит как бы мультипликативным (т. е. развивающимся путём перемножения) базисом натурального ряда. Эта основоположная роль совокупности простых чисел во все времена привлекала к ней внимание исследователей. Каково это множество, сколько чисел оно содержит, как эти числа расположены, каким закономерностям подчиняется чередование простых и составных чисел в натуральном ряду? Все эти вопросы естественно вставали перед учёными самых различных эпох, от античного мира до наших дней, и в значительной степени они стоят ещё в центре внимания и современной арифметической науки, в особенности потому, что решение их оказалось связанным с чрезвычайно большими трудностями.

Прежде всего здесь, разумеется, встаёт вопрос о том, конечно или бесконечно множество простых чисел. Важно отметить, что фундаментальная теорема, доказанная нами выше, ничего об этом не говорит, по крайней мере непосредственно. Её утверждение как будто бы ничем не противоречит ни конечности, ни бесконечности множества простых чисел.

Эта задача была единственной проблемой теории простых чисел, которую удалось решить математикам древнего мира. Приведём простое и остроумное рассуждение Евклида, доказывающее бесконечность множества простых чисел; впрочем, идея бесконечности, столь излюбленная современной наукой, была чужда Евклиду, и он формулирует свою теорему так: простых чисел имеется больше, чем любое число их. («Начала Евклида», кн. IX, предложение 20.)

Пусть pv р2, pk — любая конечная группа простых чисел. Требуется доказать, что найдётся простое число /?, не входящее в эту группу. С этой целью рассмотрим число Р-(-1, где Р= = Р\Ръ • • • Pk> и обозначим через р наименьший делитель этого

числа, отличный от 1. Очевидно, что р есть простое число; но р не может совпадать ни с одним из чисел ри р2, ..., pki так как р есть делитель числа P+1, которое при делении на любое из чисел pv /72, ..., pk даёт в остатке 1 и, следовательно, не делится нацело. Таким образом, р есть новое простое число, не входящее в состав заданной группы, и теорема Евклида доказана.

В вопросе о законах чередования простых чисел в натуральном ряду можно отметить, повидимому, ещё только один факт, доказывающийся столь же просто, как теорема Евклида: существуют сколь угодно длинные участки натурального ряда, вовсе не содержащие простых чисел и, следовательно, сплошь состоящие из чисел составных.

В самом деле, если я>1 —любое натуральное число, то в ряду чисел

п\4-2, я! + 3, я! + 4, п\+п

(представляющих собой участок натурального ряда длины п—1) не может содержаться ни одного простого числа, так как я!-|-2 делится на 2, п\+3—на 3 и т. д., наконец, п\+п делится на п, причём во всех случаях делитель меньше делимого.

Вопрос о распределении простых чисел в натуральном ряду почти совершенно не был продвинут от Евклида до Эйлера. С целью подметить какие-либо закономерности в чередовании простых чисел были составлены таблицы этих чисел, начиная от 2 и до весьма больших пределов (в настоящее время примерно до десяти миллионов). Изучение этих таблиц показывало, что, продвигаясь в натуральном ряду, мы в среднем встречаем простые числа всё реже и реже; но это — только в среднем. Уменьшение количества простых чисел происходит чрезвычайно нерегулярно; после значительных разрежений снова появляются «сгустки», причём до сих пор не установлена закономерность чередования этих сгустков и разрежений.

Это придаёт проблеме распределения простых чисел её исторически известную влекущую силу.

Важнейший из результатов Эйлера в этой области является теоретическим обоснованием этого постепенного з^меньшения количества простых чисел во всё более удалённых частях натурального ряда, с которым мы, как уже было сказано, встречаемся при изучении таблиц. Условимся обозначать через ъ(п) число простых чисел, не превышающих числа п} так что, например, тс (10) = 4, ъ(23) = 9 и т. д. Тогда отношение ъ(п)/п (которое, конечно, всегда заключено между нулём и единицею) можно рассматривать как долю, как «среднюю плотность» простых чисел в отрезке натурального ряда от 1 до я. Чем эта дробь меньше, тем меньшая доля натуральных чисел отрезка (1, п) принадлежит множеству простых чисел.

Теорема Эйлера. При неограниченном возрастании числа п

Это означает, что во всех достаточно больших начальных отрезках натурального ряда подавляющее большинство чисел будет составным, и лишь ничтожная доля будет входить в совокупность простых чисел.

Чтобы доказать эту теорему Эйлера, нам понадобится предварительно установить следующее вспомогательное предложение:

Лемма. Пусть pv р2, ... означают простые числа, расположенные в порядке возрастания (так что р1 = 2, /?2 = 3 и т. д.). Тогда

при неограниченном возрастании п.

Для доказательства заметим, что для любого k

Поэтому

Все п множителей правой части представляют собой абсолютно сходящиеся ряды, которые, как известно1), можно перемножать почленно как конечные суммы. Общий член произведения будет иметь вид

где а;,, а2, ап — любые числа ряда 0, 1, 2,---- Таким образом, мы можем написать:

где суммирование производится (в любом порядке) по всем комбинациям чисел а„ а2, <хп. Но в виде р^рр ... р*п, при надлежащем выборе чисел at-, может быть, очевидно, представлено любое

1) См. Э. э. м. кн. 3, Дифференциальное и интегральное исчисление.

натуральное число, не имеющее других простых делителей, кроме Pu Рч> • - •, Рп> и> в частности, любое натуральное число, не превосходящее рп. Таким образом, если 1 ^ m ^ рп, то дробь — обязательно найдётся среди слагаемых правой части полученного равенства. Поэтому

Но ряд У — («гармонический» ряд), как известно, расходится1).

Поэтому, сколь бы мало ни было положительное число е, если п (а следовательно, и рп) достаточно велико, мы будем иметь:

и следовательно, в силу предыдущего неравенства

откуда

Это неравенство выполняется, таким образом, для всех достаточно больших пу что ввиду произвольной малости числа е и доказывает лемму.

Переходя теперь к доказательству теоремы Эйлера, мы обозначим через Рп произведение рхр»и ... рп первых п простых чисел. Для нашей цели важно знать число Qn чисел ряда

1, 2, ...,/>„, (3)

не делящихся ни на одно из простых чисел piy р2у ..., рп. Оказывается, что

Подробный вывод этой формулы читатель найдёт в главе II (стр. 282).

Пусть теперь 5 и г — любые натуральные числа. Тогда, очевидно, для того чтобы число sPn+r делилось на какое-либо из чисел Pu Piy --->Рп> необходимо и достаточно, чтобы такою делимостью обладало число г. Поэтому ряд чисел

1) См. предыдущее подстрочное примечание.

при любом s^ö содержит столько же чисел, не делящихся ни на одно из простых чисел pv /?2, ..., рп, сколько их имеется в ряду (3), т. е. Qn.

Если теперь задано сколь угодно малое положительное число е, то, прежде всего, выберем число п так, чтобы было:

что возможно в силу доказанной нами леммы. Если теперь q— любое натуральное число, то пусть оно при делении на Рп даёт в частном s и в остатке г, так что

q = sPn + r (0^г</>„).

Оценим число iz(q) простых чисел в отрезке (1, q). В число этих простых чисел могут, прежде всего, входить п чисел plt р2, ..., рп. Все остальные простые числа отрезка (1, q) не делятся ни на одно из чисел pv /72, рп, а потому число их в отрезке (1, q) не превосходит числа тех чисел этого отрезка, которые не делятся ни на одно из чисел ри р%, ..., рп. Но таких чисел, как мы уже знаем, имеется в точности Qn = PnTLn в каждом из отрезков (1, Рп), (Рл+1, 2Рп\ (2Ря+1, 3PJ, ((s — l)Pn+l, sPn), т. е. в точности sQn = sPnIln в отрезке (1, sPn); наконец, в отрезке (1, q) — = (1, sPn+r) их не более чем

Таким образом, откуда

Если теперь число q (а следовательно, и s) сделать достаточно большим (сохраняя п неизменным), то первое слагаемое правой части может быть сделано меньшим, нежели е; а так как Пя<е по выбору числа я, то

для всех достаточно больших q, т. е.

и теорема Эйлера доказана.

Этот замечательный результат говорит о том, что простые числа расположены в натуральном ряду в известном смысле «редко» — реже, например, чем члены любой арифметической прогрессии (с как угодно большой разностью). Однако это — только в среднем. У нас

нет никаких основании представлять себе дело так, будто где-то там,, очень далеко в натуральном ряду, каждое простое число стоит в одиночестве, не имея близких соседей ни в ту, ни в другую сторону. Напротив, изучение таблиц показывает, повидимому, что мы от времени до времени всё вновь и вновь встречаем в натуральном ряду очень близких простых соседей, даже так называемых «близнецов», отстоящих друг от друга всего на две единицы, как (5, 7), (41, 43), (101, 103) и т. д. Правда, вопрос о том, существует ли бесчисленное множество таких «близнецов», в настоящее время наукой ещё не решён; у нас, однако, нет никаких оснований считать такое существование невозможным.

Сделаем ещё следующее интересное замечание. Та лемма, которую мы доказали выше, привела нас к теореме Эйлера, говорящей о сравнительной «редкости» расположения простых чисел в натуральном ряду. Но та же самая лемма даёт возможность установить (и притом гораздо более простым путём), что простые числа расположены в натуральном ряду всё же и достаточно густо. В самом деле, из теории бесконечных произведений1) известно, что стремление к нулю произведения

при неограничено возрастающем п равносильно расходимости ряда

т. е. тому, что сумма

неограниченно возрастает с возрастанием п\ в этом отношении ряд простых чисел ведёт себя так же, как весь натуральный ряд ^расходимость «гармонического» ряда 1 —j—i- —[- —[— • • • 4~ ~ Ч~ •••)> в противоположность, например, ряду «полных квадратов» I2, 22,

Это показывает, что простые числа

в некотором смысле расположены «гуще», чем полные квадраты.

Все эти элементарно доказуемые факты, установленные примерно к началу XIX столетия, дают, однако, ещё только весьма смутное представление о густоте расположения простых чисел в натуральном ряду. Учёные той эпохи давно уже лелеяли мечту о завоевании гораздо более значительном: найти для функции ъ (п) (число простых

1) См. А. Я. Хинчин, Восемь лекций по математическому анализу, Гостехиздат, 1948.

чисел, не превосходящих ri) хорошее приближённое выражение в виде какой-нибудь простой аналитической функции от /г, исследовать рост которой не представляло бы никаких затруднений. Представлялась, например, очень заманчивой мысль найти для функции тс(/г) «асимптотическое» аналитическое выражение, т. е. такую аналитическую функцию ср (п), чтобы

(иначе говоря, чтобы тс (ri) и ср (п) были «эквивалентными» бесконечно большими). Однако наука той эпохи не располагала ещё необходимыми средствами для решения этой важной задачи. Изучение таблиц показывало, что среди элементарных функций имеется одна очень простая, именно^-, дающая (в пределах таблиц) при больших п хорошее приближение для тс (п), и многие крупнейшие учёные того времени (Лежандр, Гаусс) настойчиво пытались теоретически обосновать эту лишь эмпирически подмеченную близость. Задача оказалась, однако, непомерно трудной, и ни одного результата в этом направлении не удалось получить вплоть до середины XIX столетия, когда замечательные исследования нашего великого учёного П. Л. Чебышева сдвинули, наконец, вопрос с мёртвой точки.

Маячившей перед всеми исследователями целью было, как уже сказано, доказательство соотношения

(4)

На пути к этой цели, которая в ту эпоху ещё не могла быть достигнута, Чебышев впервые доказал несколько важных фактов, среди которых отметим два следующих:

1. Если предел

существует, то этот предел равен единице.

2. Для всех достаточно больших п

Значительность этих замечательных достижений, уже довольно близко подводящих нас к окончательной цели (4), в особенности подчёркивается двумя обстоятельствами: во-первых, тем, что до Чебышева в этом направлении не удавалось доказать ровно ничего, так что наш великий математик не имел предшественников и все идеи и методы доказательств должен был создавать совершенно заново; во-вторых, замечательно то, что Чебышев получил свои

важнейшие результаты вполне элементарными арифметическими приёмами, не прибегая к средствам высшей математики.

Вслед за работами Чебышева появилось исследование немецкого математика Римана, указавшего на совершенно новый, сложный аналитический подход к задаче распределения простых чисел. Сам Риман не получил своим методом ни одного арифметического результата. Однако значительно позже, уже в самом конце XIX столетия, метод Римана в связи с развившейся к тому времени теорией функциий комплексной переменной обнаружил замечательную мощность. В частности, в 1894 г. французскому учёному Адамару удалось, наконец, достигнуть давно преследуемой цели — доказать соотношение (4), показывающее, что функция -j^- действительно служит асимптотическим выражением для числовой функции тс (/г).

Дальнейшие усилия вплоть до настоящего времени были направлены на уточнение этого результата, т. е. на возможно более точную оценку разности

которая согласно теореме Адамара бесконечно мала при п-^- оо. Выдающиеся результаты в этом направлении получены в последние годы советской школой теории чисел, руководимой акад. И. М. Виноградовым, одним из величайших творцов арифметической науки нашей эпохи.

Другая линия развития теории простых чисел, также идущая от теоремы Евклида о бесконечности множества простых чисел, стремится установить существование бесконечного множества простых чисел в той или иной части натурального ряда, т. е. среди натуральных чисел того или иного определённого вида. Классическим результатом в этом направлении является теорема Дирихле о существовании бесконечного множества простых чисел в любой арифметической прогрессии, первый член и разность которой взаимно просты. Однако до сих пор наука не смогла продвинуться существенно дальше этого результата (для которого, кстати сказать, мы до сих пор не имеем вполне элементарного доказательства). Теорема Дирихле утверждает, что если числа а и b взаимно просты, то существует бесчисленное множество простых чисел вида ах+Ь (где х — целое число). Следующим естественным шагом было бы исследование в том же смысле выражений второй степени, т. е. выражений вида ах2 +bx+ с. Однако в этом направлении ничего сделать не удалось. Современная наука не знает никакого подхода даже к простейшему частному случаю этой задачи — к вопросу о том, существует ли бесчисленное множество простых чисел среди чисел вида лг2-|-1» т. е. в ряду чисел 2, 5, 10, 17, 26, 37, ...

Наконец, особый и очень интенсивно культивируемый круг вопросов теории простых чисел составляют задачи, группирующиеся

около знаменитой проблемы Гольдбаха. Уже давно было замечено, что чётные числа, начиная с 4, повидимому, могут все быть представлены в виде суммы двух простых чисел (4 = 2 —|— 2, 6 = 3 —j— 3, 8 = 3-}-5, 10 = 3 —|— 12 = 5+7 и т. д.), а следовательно, нечётные числа — в виде суммы трёх простых чисел. Проблема Гольдбаха состоит в решении вопроса о том, действительно ли это так для всех чётных (соответственно, нечётных) чисел.

Двадцать лет назад казалось, что наука не знает никакого подхода к этой труднейшей задаче. После бесплодных попыток, продолжавшихся более столетия, замечательный успех в направлении решения проблемы Гольдбаха был достигнут в 1930 г. молодым советским учёным Л. Г. Шнирельманом. Он впервые доказал существование такого постоянного числа что всякое натуральное число, кроме 1, может быть представлено в виде суммы не более чем k простых слагаемых. До работы Шнирельмана к этому результату столь же мало умели подойти, как и к самой проблеме Гольдбаха; тем более замечательно, что всё исследование Шнирельмана проведено настолько элементарными арифметическими методами, что могло бы быть в точности в том же виде выполнено и 100 лет назад, в эпоху Чебышева.

Постоянная оцениваемая непосредственно по исследованиям Шнирельмана, оказывалась очень большою; многие учёные сейчас же занялись попытками её снижения с помощью столь же элементарных приёмов, и в несколько лет удалось снизить её до 69.

Однако уже в 1936 г. И. М. Виноградов, работая созданным им самим аналитическим методом, полностью доказал гипотезу Гольдбаха для всех достаточно больших нечётных чисел, т. е. показал, что любое достаточно большое нечётное число может быть представлено в виде суммы трёх простых слагаемых; из этого результата непосредственно вытекает, что все достаточно большие чётные числа представляются как суммы четырёх простых слагаемых; таким образом, постоянная k Шнирельмана сразу снижается до 4. Учитывая историческую знаменитость проблемы Гольдбаха и огромное количество потраченных на неё во всём мире усилий, следует признать этот результат И. М. Виноградова одним из крупнейших достижений советской математики.

ГЛАВА II

МЕТОД СРАВНЕНИЙ

§ 4. Введение

Особая трудность, которою во все времена были отмечены задачи теории чисел, заставляла исследователей искать всё новых и новых методов в этой ветви математической науки. И в настоящее время мы имеем в теории чисел такое методологическое многообразие, как, пожалуй, ни в одной другой математической дисциплине. Характерной чертой для всех этих методов является сравнительная ограниченность их приложений; каждый такой метод, как правило, может быть применён к решению лишь более или менее узкого круга родственных между собою задач; как только мы выходим за пределы такого круга, приходится искать новых, подчас весьма инородных методов.

Различные методологические приёмы теории чисел можно разделять по их предметной природе: мы имеем ряд элементарных методов (метод эратосфенова решета, метод алгорифма Евклида и ряд других); но наряду с ними мы имеем и несколько мощных аналитических методов; всё более и более возрастает, наконец, значение методов геометрических, ведущих своё начало от исследований Минковского. С другой стороны, методы эти могут быть различаемы и в другом отношении. В одних из них объединяющим началом служит та или иная предметно-содержательная идея (таков, например, метод «геометрии чисел» Минковского), в основе же других лежит некоторый формальный приём; встречаются, разумеется, и смешанные методологические типы.

Среди формальных элементарно-арифметических методов особое значение приобрёл так называемый метод сравнений, созданный Гауссом. На этот метод надо смотреть, как на некий формальный аппарат, не заключающий в себе большого идейного содержания, но представляющий значительную техническую ценность; овладение им позволяет в большом числе случаев со сравнительной лёгкостью получать такие результаты, к которым другие пути обременительно длинны. Вместе с тем простейшие основы теории

сравнений оказались таким формальным инструментом, овладение которым оказывает заметную помощь при решении почти любых задач теории чисел, какими бы содержательно-определёнными методами мы над этими задачами ни работали. Можно поэтому без преувеличения считать теорию сравнений (едва ли не единственным) универсальным методом теории чисел, понимая под этим именно то, что основные положения и приёмы этой теории могут оказать существенную, хотя и чисто формальную помощь почти во всех областях арифметической науки. Без овладения элементами этой теории работа в любой области теории чисел была бы в известной мере обречена на отсталый, «кустарный» научный стиль. Однако не надо вместе с тем и преувеличивать значения теории сравнений: даже самое полное овладение её методом вооружает исследователя только технически, не давая ему ещё почти никаких руководящих идей.

В этой главе мы дадим краткий по необходимости очерк основных положений теории сравнений и её простейших приложений. Непревзойдённое по полноте и глубине изложение этой теории читатель может найти в классическом труде П. Л. Чебышева «Теория сравнений»1).

§ 5. Сравнения и их основные свойства

Идея сравнения имеет своим основанием то простое замечание, что два числа а и Ь, дающих при делении на натуральное число m один и тот же остаток, в вопросах делимости обнаруживают по отношению к числу m целый ряд одинаковых свойств. Самое важное из этих свойств состоит в том, что всякий общий делитель чисел а и m будет вместе с тем и общим делителем чисел b и т, и обратно. В частности, наибольший общий делитель (а, т) чисел а и m совпадает с наибольшим общим делителем (Ьу т) чисел b я т.

В самом деле, если, как предположено, а и b дают при делении на m один и тот же остаток г, то

а = km + г, Ъ = Im + г,

так что разность

а — b = (k — 1)т

делится на т. Отсюда

а = qm + b, b = a — qm;

эти соотношения и показывают непосредственно, что всякий общий делитель чисел m и b является вместе с тем и делителем числа а, и обратно.

1) П. Л. Чебышев, Полное собрание сочинений, т. I, Теория чисел, Издательство АН СССР, 1944,

Это общее свойство чисел а и Ь, вытекающее из их «равноостаточности» при делении на т, оказывается настолько важным, что представляется целесообразным формально зафиксировать такую равноостаточность, придавая ей особое наименование и особое обозначение. Принято называть числа а и Ь, дающие одинаковые остатки при делении на т, сравнимыми по модулю m и обозначать это так:

Например, 3 = —17 (mod 5).

Сравнимость (т. е. равноостаточность) двух чисел по данному модулю m делает их, как мы видели, в какой-то мере родственными, сходными между собою в их отношении к числу т. Отношение сравнимости есть, таким образом, некое сходство, подобие двух чисел, и установление и использование важнейших свойств этого родственного отношения двух чисел и составляют собою руководящую идею теории сравнений. Надо только твёрдо помнить, что понятие сравнимости всегда связано с определённым модулем, так что то родство или подобие двух чисел, о котором здесь идёт речь, свойственно этим числам не самим по себе, а лишь в их отношении к числу т. Два числа, сравнимые между собою по модулю т, вообще говоря, не будут иметь друг с другом ничего общего по другому модулю т'.

При определении сравнимости двух чисел требование равноостаточности может быть заменено равносильным ему, но более удобным для проверки в конкретных случаях требованием, чтобы разность двух данных чисел делилась на модуль. Так, в только что приведённом примере нет, разумеется, надобности находить остатки чисел 3 и — 17 при делении на 5; достаточно убедиться, что разность этих двух чисел 3 — (—17) = 20 делится на 5.

Следующие основные теоремы показывают, что со сравнениями можно в значительной мере оперировать, как с обычными равенствами.

Теорема 1. Сравнения по одному и тому же модулю можно почленно складывать, вычитать и перемножать. Пусть

Требуется доказать, что

Из (1) вытекает:

откуда

(а±а')— (*±ft') = (a — b)±(ä — b') = m(q — q'), и следовательно,

а±а = b±b' (modm).

Далее*

aa' — bb, = a(a' — b')+b'(a — b) = (aq, + b'q)m, и следовательно,

aa' = bb' (mod m),

что и требовалось доказать.

Примечание. В частности, к обеим частям сравнения можно прибавить одно и то же число, и обе части сравнения можно умножить на одно и то же число.

Мы доказали теорему 1 в предположении двух сравнений. Однако, разумеется, она автоматически распространяется от двух на три, от трёх на четыре и вообще от п на n +1 сравнений, так что в силу принципа полной индукции мы можем считать её установленной для любого числа сравнений.

Следствие. Если

a = b (mod m), (2)

то

ah = bh (mod/я),

где k — любое натуральное число или нуль.

Для доказательства достаточно почленно перемножить k тождественных между собою сравнений (2).

Комбинируя друг с другом полученные нами до сих пор результаты, мы, очевидно, приходим к следующему важному выводу:

Теорема 2. Пусть Р (х) — любой многочлен с целыми коэффициентами. Тогда из

х=у (mod m)

следует:

Р(х) = Р(у) (mod m).

Это предложение представляет большой интерес и для школьного курса арифметики, так как оно служит теоретическим основанием для вывода наиболее важных признаков делимости. Если в десятичной системе число п изображается, считая слева направо, цифрами а, Ь, с, ... , é, /, то

поэтому в силу теоремы 2

ЛЕ=а + е + с+ ••• + ' (mod3) и (mod 9),

т. е. по модулям 3 и 9 каждое число сравнимо с суммой своих цифр. Но отсюда следует, что наибольший общий делитель с числом 3 (или 9) число п имеет тот же, что и сумма его цифр. В частности, п делится на 3 (или 9) тогда и только тогда, если на это число делится сумма его цифр. Подобным же образом сравнение

10 = — 1 (mod 11)

в силу теоремы 2 даёт:

п = {— l)*a-f(— \)s~yb+ ... — £-)-/ (mod 11),

откуда непосредственно вытекает известный признак делимости на 11.

Теорема 1, устанавливающая ничем не ограниченную возможность почленного сложения, вычитания и умножения сравнений, ничего не говорит нам о четвёртом арифметическом действии — делении. В частности, мы не знаем ещё, всегда ли возможно деление обеих частей сравнения на одно и то же число (при условии, конечно, что такое деление может быть выполнено без остатка). Мы не случайно отложили рассмотрение этого вопроса; дело в том, что здесь мы впервые встречаемся с таким положением, когда сравнения ведут себя несколько иначе, чем равенства; теперь мы должны подробно разобраться в этом вопросе.

Прежде всего простые примеры легко показывают, что деление, о котором идёт речь, не всегда возможно. Так,

45-^27 (mod 6);

обе части сравнения делятся на 9; однако, выполняя это деление, мы пришли бы к неверному сравнению

5 = 3 (mod 6). Рассмотрим теперь вопрос в общем виде. Пусть

a = b {mount), (2)

причём а и b делятся на одно и то же число d, так что

a = da', b = db'.

Спрашивается, при каких условиях сравнение (2) можно «сократить» на d, т. е. при каких условиях из (2) следует:

a' = b' (mod/я)?

Сравнение (2) означает, что разность а — b = d(a' — b') делится на т; при каких условиях из этого будет следовать, что и разность

а—b' должна делиться на т? На этот вопрос отвечает нам теорема 2 главы I: это будет всегда, если числа d и m взаимно просты. Отсюда следует важное правило: обе части сравнения всегда можно разделить на одно и то же число, взаимно простое с модулем. Напротив, если число d не взаимно просто с модулем т, то деление обеих частей сравнения на d, вообще говоря, невозможно, как этому учит вышеприведённый пример, где деление привело к неверному результату именно потому, что мы делили на число 9, не взаимно простое с модулем 6.

Обнаруженное нами различие в поведении сравнений и равенств имеет своей причиной то весьма важное обстоятельство, что сравнения, вообще говоря, не подчиняются одному из основных принципов теории равенств: если произведение двух чисел равно нулю, то по меньшей мере один из сомножителей также равен нулю. В теории сравнений аналогичный принцип, очевидно, гласил бы: если произведение дв}/-х чисел сравнимо с нулём по модулю т, то по меньшей мере один из сомножителей также сравним с нулём по модулю т. Но сравнимость с нулём по модулю m есть не что иное, как делимость на т; поэтому наш принцип гласил бы: если произведение двух чисел делится на т, то по меньшей мере один из сомножителей должен делиться на т. Это же, вообще говоря, неверно: 4 X 15 = 60 делится на б, между тем как ни 4, ни 15 на 6 не делятся. Именно незаконное применение этого принципа, как легко видеть, и привело нас в нашем предыдущем примере к неправильному результату.

Однако теорема 3 главы I учит нас, что есть один случай, когда этот принцип всё же оказывается верным: если модуль р есть простое число, то из делимости на р произведения двух чисел обязательно вытекает делимость на р по меньшей мере одного из сомножителей. Этот замечательный факт имеет своим следствием то, что сравнения по простому модулю в значительно большей степени аналогичны равенствам, нежели сравнения по модулю составному.

В частности, в известном смысле можно сказать, что вопрос о возможности деления обеих частей сравнения на одно и то же число в случае простого модуля решается в точности так же, как для равенств. В самом деле, выше мы убедились, что обе части сравнения всегда можно делить на одно и то же число d, взаимно простое с модулем т; но если m есть число простое, то «быть взаимно простым с т» означает просто «не делиться на т», или, что то же, «не быть сравнимым с нулём по модулю т». Таким образом, в случае простого модуля запрещается делить обе части сравнения лишь на такие числа, которые сравнимы с нулём по данному модулю. Но числам, сравнимым с нулём по данному модулю, в теории равенств по аналогии соответствует обыкновенный нуль, деление на который ведь также запрещается. Таким образом, мы

видим, что в этом вопросе, как и во многих других, сравнения по простому модулю ведут себя в точности аналогично равенствам. Что касается сравнений по составному модулю, то здесь мы, напротив, наблюдаем существенно иные закономерности, нежели в теории равенств.

§ 6. Классификация чисел по данному модулю

Мы назвали два числа сравнимыми по модулю т, если они дают одинаковые остатки при делении на т\ отсюда непосредственно следует, что если каждое из двух чисел а и b сравнимо по модулю m с одним и тем же числом с, то и a = ô (mod. m). А это обстоятельство позволяет нам в свою очередь объединить все числа, сравнимые с данным числом а (а значит, и сравнимые между собой) по модулю т, в один класс. Таким образом, все целые числа распадаются на классы по модулю т\ все числа одного и того же класса сравнимы между собою по модулю т, но два числа разных классов никогда по модулю m не сравнимы друг с другом.

Как число и взаимоотношения классов, так и внутренняя структура их очень легко обозримы. Все числа одного и того же класса дают при делении на модуль m один и тот же остаток. Но остатками при делении на m могут быть только следующие m чисел:

О, 1, 2, ... , т—1.

Следовательно, число классов по модулю m равно т. Класс, характеризуемый данным остатком г(0^г^т — 1), образуют числа вида тх+г> где х — любое целое число; очевидно, эти числа образуют бесконечную в обоих направлениях арифметическую прогрессию с разностью т. Таким образом, разбиение множества всех целых чисел на классы по модулю m есть просто разбиение этого множества на m арифметических прогрессий с разностью т.

Если мы произвольным образом выберем по одному числу в каждом из классов, то мы будем иметь группу из m чисел, характеризуемую тем, что никакие два числа этой группы не сравнимы между собою по модулю m и что, с другой стороны, любое целое число сравнимо по модулю m с одним из чисел выбранной группы. Такую группу чисел называют полной системой вычетов по модулю т. Очевидно, что таких полных систем вычетов по любому модулю существует бесчисленное множество. Так, полной системой вычетов по модулю 3 может служить любая из троек чисел (0, 1, 2), (10, 11, 12), (—4, б, — 5), и бесчисленное множество других.

Так как во многих вопросах теории делимости числа одного и того же класса могут, как мы знаем, заменять друг друга, то в вопросах подобного рода обычно бывает безразлично, какую из бесчисленного множества полных систем вычетов мы изберём для нашего рассуждения; это обстоятельство создаёт такой элемент про-

извола, которым часто удаётся воспользоваться для упрощения расчётов (например, для замены больших чисел значительно меньшими).

В теоретических применениях понятия полной системы вычетов важную роль играет следующая

Теорема 3. Если числа а и m взаимно просты и в выражении ах+Ъ число X пробегает полную систему вычетов по модулю т, то и получаемые значения этого выражения образуют полную систему вычетов по модулю т.

Так как число получаемых значений выражения ах+Ь равно т, то для того, чтобы убедиться, что они образуют полную систему вычетов по модулю т, достаточно показать, что все они принадлежат разным классам по модулю т. Но если бы для каких-либо двух чисел хх и Хо, принадлежащих разным классам по модулю т, мы имели

ахх +Ь = ах2 + b (mod m).

то отсюда следовало бы:

ахх = ах2 (mod/я);

так как а взаимно просто с т, то, как мы знаем, обе части сравнения можно разделить на а; это даёт:

x1=xi (mod m),

что неверно. Таким образом, теорема 3 доказана. Скоро мы встретимся с её важными применениями.

Мы уже знаем, что все числа, принадлежащие одному и тому же классу, имеют с модулем одних и тех же общих делителей и, значит,— одного и того же наибольшего общего делителя. В частности, если одно из чисел данного класса взаимно просто с модулем, то так же обстоит дело и для всех чисел данного класса. Мы можем поэтому говорить о классах, взаимно простых с модулем. Группа чисел, содержащая по одному представителю от каждого класса, взаимно простого с модулем, называется приведённой (в отличие от полной) системой вычетов по данному модулю. Самый простой способ получить приведённую систему вычетов по модулю m состоит, очевидно, в том, чтобы отобрать в ряду чисел

1, 2, ..., т,

представляющих собою полную систему вычетов по модулю т, те, которые взаимно просты с т. Таким образом, число классов, взаимно простых с m (или, что то же, число членов любой приведённой системы вычетов по модулю т), равно числу натуральных чисел, не превосходящих m и взаимно простых с т. Это число, зависящее, очевидно, только от //г, и обозначаемое через ср(т), есть одна из важнейших арифметических функций натурального числа т. Мы увидим дальше, как просто может быть найдено значение этой функции, если известно разложение числа m на простые множители.

Для приведённой системы вычетов имеет место следующее важное предложение, аналогичное теореме 3 для полной системы вычетов:

Теорема 4. Если числа а и m взаимно просты и если в выражении ах число X пробегает какую-либо приведённую систему вычетов по модулю т, то и получаемые значения этого выражения образуют приведённую систему вычетов по модулю т.

Следует обратить внимание на то, что фигурирующее в теореме 3 произвольное число b в теореме 4 обязательно равно нулю; это показывает, что свойство полных систем, выражаемое теоремой 3, значительно шире того свойства приведённых систем, которое выражается теоремой 4.

Для доказательства теоремы 4 достаточно заметить, что, когда х пробегает какую-либо приведённую систему вычетов по модулю т, получающиеся при этом 9 (т) значений произведения ах все взаимно просты с m и, как было показано при доказательстве теоремы 3, все принадлежат различным классам по модулю т.

Теорема 4 позволяет легко доказать одно интересное и важное предложение, найденное Эйлером. Пусть числа а и m взаимно просты и пусть

Гц г2, ... , г5, (3)

где для краткости положено 9 (m) = sy—любая приведённая система вычетов по модулю т. В силу теоремы 4 числа

arl9 аг2, ... , ars (4)

также представляют собою приведённую систему вычетов по модулю т. Таким образом, каждое из чисел (4) сравнимо по модулю m с одним из чисел (3), т. е.

где ряд индексов iv i%, ... , is есть расположенный только в другом порядке ряд чисел 1, 2, ... , s. Перемножая эти сравнения почленно, мы находим:

а* С*> ГзГ2 ... rs = rh rh ... ris = ... rs (mod /и).

Так как каждое ri взаимно просто с т, то и произведение их взаимно просто с m , и, следовательно, мы можем разделить на это произведение обе части последнего сравнения. Это и приводит нас к теореме Эйлера, утверждающей, что если а взаимно просто с т> то

Пример. ф (10) = 4; 34 = 81 = l(mod 10); 74 = 2401 = ее 1 (mod 10).

В частном случае, когда модулем служит простое число р, в ряду 1, 2, р взаимно простыми с р будут все числа, кроме р\ таким образом, ср(р) = р—1; соответствующий случай теоремы Эйлера был ранее доказан Ферма.

Теорема Ферма. Если р — простое число и а не делится на р, то

аР~х -zz1 (mod р).

Примечание. Это предложение часто называют «малой теоремой Ферма» в отличие от так называемой «великой теоремы Ферма» о невозможности решения в целых положительных числах уравнения xn+yn = zn при целом /г>2 (это утверждение, доказательством которого Ферма, по его свидетельству, обладал, как известно, не доказано до настоящего времени). Если измерять важность той или другой теоремы её ролью и значением в развитии данной отрасли науки, то следовало бы, пожалуй, принять обратную терминологию. Если «великая» теорема когда-либо будет доказана, то сам этот факт, насколько здесь возможно предвидение, не даст науке никакой опорной точки для значительных новых достижений и, по всей вероятности, останется более или менее изолированным. Напротив, установленная нами «малая» теорема уже давно стала важнейшим орудием исследования и притом не только в теории целых чисел, но и в значительно более широких областях арифметики и алгебры.

Мы переходим теперь к установлению вида функции ф(/я), означающей число натуральных чисел, не превосходящих m и взаимно простых с т.

Прежде всего мы докажем, что если числа тип взаимно просты, то

ф (тп) = 9 (т) ср (п).

Чтобы подсчитать ср(тп), удобно расположить натуральные числа от 1 до тп в следующую таблицу:

и постараться определить, сколько эта таблица содержит чисел, взаимно простых с произведением тп. Но для того, чтобы быть

взаимно простым с произведением тп, число должно быть взаимно простым как с т> так и с п. Поэтому мы можем наш подсчёт вести так: сначала отобрать из таблицы все числа, взаимно простые с т, а потом уже из них выбрать те, которые взаимно просты и с п. Так мы и поступим.

В нашей таблице, очевидно, все числа, стоящие в одном столбце, принадлежат одному классу по модулю m и, значит, либо все взаимно просты с т, либо все не взаимно просты. Мы можем поэтому говорить о «столбцах, взаимно простых с т». Число таких столбцов проще всего определить, подсчитывая, сколько чисел, взаимно простых с т, содержит верхняя строка нашей таблицы 1, 2, ..., т. Очевидно, таких чисел будет ср(т)> и под каждым из них лежит столбец чисел, взаимно простых с т.

Выберем теперь любой из этих ср (т) столбцов, например

k, m+k, 2т+k, (п—l)m+k, (5)

и подсчитаем, сколько в нём будет чисел, взаимно простых с п. Числа этого столбца представляют собою значения выражения mx+k, когда х пробегает ряд чисел 0, 1, 2, п — 1, т. е. полную систему вычетов по модулю п. Так как m взаимно просто с п, то в силу теоремы 3 числа (5) также образуют полную систему вычетов по модулю п; но любая полная система вычетов по модулю п содержит в точности ср (п) чисел, взаимно простых с п; итак, любой столбец нашей таблицы содержит ср (п) чисел, взаимно простых с п.

Резюмируем: наша таблица содержит <?(т) столбцов, взаимно простых с т, и в каждом из этих столбцов имеется <р(я) чисел, взаимно простых с п\ таким образом, таблица содержит <ф(т)ср(п) чисел, взаимно простых как с т, так и с п\ но это и будут числа, взаимно простые с произведением тп, так что действительно

ср(тп) = ср(т)ср(п)у

что и требовалось доказать.

Теперь уже легко найти общее выражение для функции ср(т). Пусть разложение числа m на простые множители имеет вид

где рг, р2, рг — различные между собой простые числа, a <Xj, а2, ..., аг — любые натуральные числа. Тогда согласно только что доказанному свойству функции ср(т)

(б)

Но ср(р*£ ) (1 ^ г) есть число натуральных чисел, не превосходящих рал и взаимно простых с рру т. е. просто не делящихся

на pi\ чтобы подсчитать это число, заметим, что в ряду чисел

кратными pt будут числа

т. е. всего

чисел. Остальные

чисел этого ряда и будут не делящимися на р., т. е. взаимно простыми с рал\ таким образом,

Поэтому соотношение (6) даёт нам:

Эта формула и решает поставленную нами задачу. Интересно отметить, что выражение, полученное нами для ср {tri), не зависит явным образом от чисел а£, так что для вычисления ср (т) нет надобности знать те показатели, с которыми различные простые числа входят в выражение т: достаточно знать только сами эти простые числа.

Пример.

Заметим еще, что на стр. 265 главы I нам нужно было найти число Qn натуральных чисел от 1 до Рп = рг р2 ... рп, не делящихся ни на одно из простых чисел pv /?2, ..., рп. Очевидно, что это число есть не что иное, как ср(Рп); и формула для Qn, которую мы там привели без доказательства, очевидно, представляет собою частный случай полученной нами теперь общей формулы.

§ 7. Сравнения, содержащие неизвестные

Подобно тому как мы делим равенства на тождества и уравнения, мы можем, конечно, и среди сравнений различать тождественные (т. е. такие, которые либо вовсе не содержат букв, либо выполняются при любых значениях входящих в них букв) и содержащие неизвестные (т. е. содержащие такие буквы, значения которых

должны быть специально выбраны для того, чтобы сравнение удовлетворилось). Примерами тождественных сравнений могут служить:

103 = 1 (mod 17), (a + b)2 = a2 (mod b).

Примером сравнения, содержащего неизвестное, может служить:

*2+l=0 (mod 10).

Мы будем здесь говорить только о сравнениях с одним неизвестным. Такое сравнение называется алгебраическим степени п, если оно имеет вид

Р(х) = 0 (mod яг),

где Р (х) = а0хп+atхп"х+ ... +ап_хх+ап — многочлен степени п с целыми коэффициентами, причём а0 ф 0 (mod m) (т. е. а0 не делится на модуль), подобно тому как от алгебраического уравнения степени п мы требуем, чтобы коэффициент при х*1 не равнялся нулю.

В силу теоремы 2 мы непосредственно видим, что если число х0 удовлетворяет некоторому алгебраическому сравнению по модулю т, то и любое число х, сравнимое с х0 по модулю т, также будет ему удовлетворять. Для алгебраических сравнений, таким образом, характерно, что корни их образуют целые классы по данному модулю; поэтому обычно решением алгебраического сравнения по модулю m принято называть не отдельное число, а целый класс (по модулю т) чисел, удовлетворяющих данному сравнению. Соответственно этому под числом решений данного алгебраического сравнения по модулю m понимают не число чисел, ему удовлетворяющих (таких чисел всегда имеется либо ни одного, либо бесконечное множество), а число классов по модулю т, состоящих из удовлетворяющих ему чисел.

Мы, прежде всего, подробно рассмотрим наиболее важный случай линейных сравнений (т. е. сравнений первой степени) с одним неизвестным, общий вид которых

ах = Ъ (mod m). (7)

Если число а взаимно просто с модулем т, то при пробегании х полной системы вычетов по этому модулю соответствующие значения произведения ах в силу теоремы 3 будут представлять собой полную систему вычетов по модулю яг, так что одно и только одно из этих значений будет сравнимо с Ь. Наше сравнение имеет, таким образом, в этом случае в точности одно решение аналогично уравнению первой степени с одним неизвестным.

Один из возможных способов фактического нахождения этого решения даёт нам теорема Эйлера: так как

и мы непосредственно видим, что число bctf (т)~х удовлетворяет сравнению (7); так как единственность решения уже установлена, то полное решение сравнения (7) даётся формулой

*=*a*(m)-1 (mod/и). (8)

Очевидно, рассматриваемый нами частный случай всегда имеет место, если m есть простое число. В самом деле, число а, которое по самому определению степени сравнения не должно делиться на т, будет при этом условии взаимно просто с т\ таким образом, сравнение первой степени по простому модулю всегда имеет в точности одно решение, даваемое в силу теоремы Ферма формулой

x = bam~2 (mod m) (9)

[надо только иметь в виду, что практически отыскание решений с помощью формул (8) или (9) в большинстве случаев не является кратчайшим путём к цели; кратчайший путь даётся алгорифмом Евклида, см. главу III]. Мы видим, что и в этом вопросе сравнения по простому модулю подчиняются законам, вполне аналогичным соответствующим законам теории уравнений.

Решениями сравнения (7) служат числа х, для которых разность ах — b делится на т, т. е. имеет вид ту, где у — также целое число. Поэтому задача решения сравнения (7) равносильна задаче решения в целых числах х, у уравнения

ах — b = ту,

или, что то же,

ах — ту = Ь. (10)

Это есть общий вид уравнения первой степени с двумя неизвестными. Мы видим, таким образом, что все результаты теории сравнений первой степени с одним неизвестным могут быть истолкованы и вне теории сравнений как законы «неопределённого» или «диофантова» анализа (т. е. учения о решении уравнений в целых числах) первой степени с двумя неизвестными. В частности, основной полученный нами результат может, очевидно, быть сформулирован следующим образом:

Если числа а и m взаимно просты, то уравнение (10) всегда может быть решено в целых числах) если (х0, у0) есть одно из его решений, то все решения даются формулами

x = x0+mk, y=y0+ak,

где k—любое целое число.

В частности, при b=l задача решения уравнения (10) (при взаимно простых а и т) уже рассматривалась нами в главе I. Там мы доказали (теорема 1) существование решения методом Гаусса. Теперь мы имеем второе доказательство той же тео-

ремы1). Это новое доказательство удовлетворительнее прежнего, так как оно не только доказывает существование решения, но даёт метод фактического получения всех решений уравнения (10). Метод этот, однако, не является, как мы уже заметили, кратчайшим из возможных; и в следующей главе мы в третий раз вернёмся к этой задаче, чтобы дать уже практически наилучшее её решение.

Обратимся теперь к случаю, когда наибольший общий делитель d чисел а и m больше 1:

(a, m) = d>l.

Пусть a = da, m = dm!, так что (а, т')=1 (т. е. числа а и ni взаимно просты). Если b не делится на d, то, как легко видеть, сравнение (7) вовсе не может иметь решений. В самом деле, если какое-нибудь число х удовлетворяет этому сравнению, то

ах — Ь = ту, Ь = ах — my = d(ах — m'y),

т. е. b должно быть кратно d. Если же b делится на d, то пусть b=db'; делимость ах — b = d(a'x— b') на m = dm' равносильна делимости ах — Ь' на т', т. е. сравнение (7) равносильно сравнению

a'x = b' (modm).

Но это последнее сравнение, в котором (а', т')=1, имеет, как мы уже знаем, в точности одно решение по модулю т'\ другими словами, числа, удовлетворяющие сравнению (7), в рассматриваемом случае образуют один класс по модулю т' = ~ ; но легко видеть, что один класс по модулю т' распадается на d классов по модулю т; в самом деле, если этот класс по модулю т' записать в виде xQ -j- m'z, где z — любое целое число, то, очевидно, числа этого класса

хо> хо"hм-'у хо-f"2т', .*., xQ+(d — 1)m!

будут все разных классов по модулю т, дальше же пойдут повторения:

х0+dm =х0-\~т = х0 (modm), х0 + (d -j- 1 ) m! = x0 + m -(- m = x0 + m! (mod m),

и т. д. Согласно принятой нами терминологии мы должны сказать, что в этом случае сравнение (7) имеет d решений.

Таким образом, вопрос о числе решений сравнения (7) первой степени с одним неизвестным нами теперь разобран до конца. Общий

1) То обстоятельство, что это новое доказательство содержит ссылку на теорему 2 гл. I, не создаёт, конечно, ложного круга, так как в гл. I мы показали (стр. 261), что теорема 2 может быть доказана независимо от теоремы 1.

результат может быть формулирован в виде следующего простого предложения:

Теорема 5. Пусть в сравнении (7) (a, m) = d. Тогда это сравнение имеет d решений, если b делится на d, и ни одного решения в противном случае.

При этом рассмотренный нами ранее случай d=l полностью укладывается в эту общую формулировку, не требуя никаких оговорок.

Очевидно, мы можем формулировать полученный общий результат и в терминах уравнений первой степени с двумя неизвестными. Пусть в уравнении

ах — ту = b

(a, m) = d. Тогда, если b делится на d, то данное уравнение имеет бесчисленное множество целых решений, причём если (х0, у0) есть одно решение, то все решения содержатся в формулах

Если же b не делится на d, то данное уравнение вовсе не имеет целых решений.

Переходя теперь к алгебраическим сравнениям высших степеней, мы ограничимся рассмотрением лишь сравнений по простому модулю р, так как только для них аналогия с уравнениями может быть проведена сколько-нибудь далеко. Таким образом, мы будем иметь дело со сравнениями вида

Р(х) = а0хп + а1хп~1+ ... ^an_tx + an = 0 (mod/0, (11)

где р — простое число и а0 не делится на р.

Прежде всего мы докажем для таких сравнений предложение, аналогичное так называемой «теореме Безу» для алгебраических уравнений.

Теорема 6. Если х=а (mod р) есть решение сравнения (11), то существует такой многочлен Q(x) степени п — 1 с целыми коэффициентами, что тождественно (т, е. для любого целого х)

P(x) = (x — a)Q(x) (mod/?). (12)

Доказательство этой теоремы легко проводится в точной аналогии с обычным доказательством теоремы Безу. Обычное алгебраическое деление многочлена Р(х) на двучлен х — а даёт в частном некоторый многочлен Q(x) степени п—1 с целыми коэффициентами и в остатке некоторое целое число г, так что тождественно

F (x)—(x—à) Q (х) + г..

Полагая х = а, находим:

r = P(a)e=0 (mod/?);

поэтому мы имеем тождественно

Р (х) = (х — a)Q{x) (mod/7),

что и требовалось доказать.

Если, кроме решения х = а (mod /?), сравнение (11) имеет ещё отличное от него решение x=b (mod/7), то, полагая в сравнении (12)х = Ь, мы находим:

(Ь — a)Q(b) — 0 (mod/?);

но b — а не делится на d, так как b по условию есть решение сравнения (11), отличное от а; следовательно,

<?(£) = О (mod/7),

т. е x = b (mod /7) есть решение сравнения Q(jc) = 0 (mod/7), а значит, в силу теоремы 6 тождественно

Q(x) = (x — b)R(x) (mod/7), (13)

где R(x)— многочлен степени п — 2 с целыми коэффициентами. Из (12) и (13) следует тождественно

Р(х)~(x — a)(x — b)R(х) (modр).

Продолжая этот процесс, мы, очевидно, приходим к следующему общему выводу: если сравнение (11) имеет k^n различных решений x = Xi (mod/7)(l ^ i =^ k), то имеет место тождественное сравнение

Р(х) = (х — хх)(х — х2) ... (х — xk)L(x) (mod/7),

где L(x) — многочлен степени п — k с целыми коэффициентами. Заметим, кстати, что коэффициенты старших членов в многочленах Р(х), Q(x), R(x) и L(x) все равны а0, ибо каждый из этих многочленов есть частное от деления предыдущего многочлена на двучлен вида X — а. Этот результат немедленно приводит к следующему важному выводу:

Теорема 7. Сравнение степени п по простому модулю не может иметь более п решений.

В самом деле, если бы сравнение (11) имело —{— 1 различных решений x = Xi (mod/7)(l ^i^n+ 1), то в силу только что проведённого общего рассуждения мы, полагая k = n, имели бы тождественно:

Р (х) = а0(х — хх) (х — jc2) ... (х — хп) (mod р).

Полагая здесь х = хп+1 и пользуясь тем, что Р(хп+1) = 0 (mod/7), мы нашли бы:

что невозможно, так как ни один из множителей левой части не может делиться на р.

Это важное предложение, весьма сближающее теорию алгебраических сравнений по простому модулю с теорией алгебраических уравнений, теряет силу в случае составного модуля: мы уже видели, что сравнение первой степени по составному модулю может иметь более одного решения.

Теорема Ферма даёт нам очень ценный пример такого типа сравнений, число решений которых всегда равно показателю степени. В самом деле, согласно этой теореме сравнению

х^1 — 1 = 0 (mod/?) (14)

при любом простом р удовлетворяют все числа, не делящиеся на р; но эти числа по модулю р образуют р — 1 классов, так что сравнение (14) действительно при любом простом р имеет р — 1 решений. Как мы уже знаем, отсюда следует, что тождественно выполняется сравнение

хр-1 — \ — {х— 1 )(* —2) ... (х—р + 1) (mod/?).

Полагая в этом сравнении х = 0, мы находим:

—1)^(^ — 1)1 (mod/;);

если р>2> то (—1)р~1 = 1, и следовательно,

(р — 1)1 + 1=0 (mod р); (15)

но при р = 2 сравнение (15) получает вид

2 = 0 (mod 2)

и, следовательно, также имеет место. Таким образом, сравнение (15) выполняется для любого простого р; это составляет содержание известной теоремы Вильсона, дающей своеобразный критерий для простых чисел. Дело в том, что ни для одного составного числа сравнение (15) не может иметь места, так как при составном /?, как легко убедиться, (р —1)1+1 никогда не может делиться на р1). Правда, этот критерий Вильсона до сих пор не удалось использовать ни для каких теоретических выводов; тем не менее сам по себе он представляет значительный интерес.

Однако теорема Ферма приводит в этом круге идей и к другим, более общим и важным выводам. Умножая обе части сравнения

хр~1 = 1 (mod/?)

(выполняющегося согласно теореме Ферма для всех х, не

1) В самом деле, если р имеет такой делитель d, что l<d</?, то, очевидно, (р—1)! делится на d; но тогда (р—1)1 + 1 не может делиться на dp а тем более на р.

делящихся на р) на лг, мы приходим к сравнению

хр = х (mod/?),

которое, конечно, также выполняется для всех упомянутых значений х\ но оно тривиальным образом выполняется и для значений х, делящихся на р. Таким образом,

хр = х (mod/?)

есть тождественное сравнение, выполняющееся для любого целого числа; иначе говоря, число хр — х при любом целом х делится на р.

Из этого, прежде всего, вытекает возможность при исследовании алгебраических сравнений по простому модулю р ограничиться сравнениями, степень которых не превосходит р — 1.