В. Г. БОЛТЯНСКИЙ А. П. САВИН

БЕСЕДЫ О МАТЕМАТИКЕ

КНИГА 1

ДИСКРЕТНЫЕ ОБЪЕКТЫ

В. Г. БОЛТЯНСКИЙ, А. П. САВИН

БЕСЕДЫ

о математике

КНИГА 1. ДИСКРЕТНЫЕ ОБЪЕКТЫ

МОСКВА

«ФИМА» • МЦНМО 2002

УДК 51(07) ББК 22.12 Б79

Б79 Болтянский В.Г., Савин А.П. Беседы о математике. Книга 1. Дискретные объекты. - М: ФИМА, МЦНМО, 2002. - 368 с. ISBN 5-89492-011-6 («ФИМА») ISBN 5-94057-040-2 (МЦНМО)

Книга вводит читателя в круг идей современной математики. В популярной форме рассказывается о теории множеств, комбинаторике, теории графов, теории вероятностей и других вопросах.

Издание будет интересно учителям математики. Специальная глава посвящена вопросам, связанным с поиском учащимися решений задач.

В то же время эта книга может служить основой курса математики для студентов гуманитарных специальностей, такой курс был прочитан авторами для психологов.

Учащиеся и учителя математических школ, лицеев и гимназий могут использовать издание в качестве учебного пособия.

© Болтянский В. Г., Савин А. П. 2002

© «ФИМА». Макет и оформление, 2002

© МЦНМО. Обложка, 2002

ISBN 5-89492-011-6 («ФИМА») ISBN 5-94057-040-2 (МЦНМО)

ОГЛАВЛЕНИЕ

ПРЕДИСЛОВИЕ.......................................................5

ВВЕДЕНИЕ............................................................6

Беседа 1. Предмет математики............................................6

1. Мнения о пользе математики...........................................6

2. Понятия математики и их возникновение................................8

3. Некоторые виды абстракции...........................................9

4. Многоступенчатые абстракции........................................11

5. Пространственные и пространственноподобные формы...................13

6. Количественные отношения реального мира............................16

Глава I. МНОЖЕСТВА И ОТОБРАЖЕНИЯ.............................20

Беседа 2. Конечные и бесконечные множества..............................20

7. Множество и его элементы............................................20

8. Взаимно однозначное соответствие.....................................25

9. Счетные множества..................................................28

10. Понятие мощности множества........................................32

Беседа 3. Операции над множествами.....................................38

11. Пересечение множеств...............................................38

12. Объединение множеств..............................................45

13. Дополнение множеств...............................................51

14. Произведение множеств..............................................56

Беседа 4. Отображения..................................................60

15. Общее понятие отображения и школьная математика...................60

16. Некоторые виды отображений........................................65

17. Обратное отображение..............................................69

18. Композиция отображений............................................73

19. Классификация.....................................................80

Беседа 5. Упорядоченные множества......................................88

20. Понятие упорядоченного множества...................................88

21. Минимальные элементы и математическая индукция....................91

22. Трансфинитные числа и аксиома выбора..............................98

Глава II. КОМБИНАТОРИКА.........................................104

Беседа 6. Размещения, сочетания и родственные задачи....................104

23. Размещения с повторениями.........................................104

24. Системы счисления.................................................107

25. Размещения без повторений.........................................110

26. Сочетания без повторений..........................................113

27. Сочетания с повторениями..........................................116

28. Бином Ньютона...................................................118

29. Производящие функции.............................................122

30. Принцип Дирихле..................................................126

Беседа 7. События и вероятности........................................130

31. События..........................................................130

32. Классическое понятие вероятности...................................134

33. Свойства вероятности..............................................140

34. Условная вероятность..............................................144

35. Независимые события и серии испытаний.............................149

Беседа 8. Случайные величины..........................................156

36. Математическое ожидание и дисперсия...............................156

37. Нормальное распределение..........................................162

38. Закон больших чисел...............................................167

Беседа 9. Информация.................................................170

39. Чет — нечет....................................................... 170

40. Количество двоичных цифр......................................... 172

41. Задачи на взвешивание............................................. 176

42. Понятие об энтропии............................................... 179

Беседа 10. Комбинаторные задачи о графах...............................185

43. Графы и их элементы...............................................185

44. Цепи и циклы в графах.............................................188

45. Плоские графы....................................................194

46. Формула Декарта—Эйлера..........................................197

47. Правильные многогранники и паркеты...............................201

48. Проблема четырех красок...........................................208

49. Ориентированные графы............................................210

50. Конечные позиционные игры........................................214

51. Понятие о сетевом планировании....................................218

ГЛАВА III. РАССУЖДЕНИЯ..........................................221

Беседа 11. Теоремы....................................................221

52. Существование и общность.........................................221

53. Структура теоремы.................................................226

54. Отрицание........................................................232

55. Необходимое и достаточное условие.................................237

56. Конъюнкция и дизъюнкция.........................................242

Беседа 12. Понятие об аксиоматическом методе...........................248

57. Возникновение аксиоматического метода в математике.................248

58. Метрические пространства..........................................252

59. Коммутативные группы.............................................256

Беседа 13. Непротиворечивость, независимость, полнота....................262

60. Непротиворечивость и понятие модели...............................262

61. Математические примеры моделей...................................264

62. Построение аксиоматики геометрии..................................267

63. Геометрия Лобачевского............................................270

64. Модель геометрии Лобачевского.....................................274

65. Изоморфизм моделей...............................................276

66. Полнота аксиоматики..............................................279

Глава IV. ПОИСК РЕШЕНИЙ.........................................282

Беседа 14. Инсайт.....................................................282

67. Цикл озарения.....................................................282

68. Сфера достижимости...............................................286

69. Анализ и синтез...................................................291

70. Обратимый анализ.................................................295

71. Анализ — поиск решения...........................................297

72. Поиск решения нестандартных задач.................................299

73. Соединение анализа с синтезом......................................302

Беседа 15. Наглядность. Аналогия. Интуиция.............................306

74. Формула наглядности — изоморфизм плюс простота..................306

75. Наглядность и математическая эстетика..............................315

76. Аналогия — общность аксиоматики..................................320

77. Прогнозирование..................................................326

78. Несколько слов о математической интуиции..........................332

РЕШЕНИЯ ЗАДАЧ И УПРАЖНЕНИЙ.................................335

Любимой подруге жизни Эрике посвящаю

В. Болтянский

ПРЕДИСЛОВИЕ

Математика в системе наук занимает особое место. Ее методами пользуются все существующие науки. «Во всякой науке ровно столько науки, сколько в ней математики» — в справедливости этого высказывания теперь никто уже не сомневается.

Однако если достижения других наук — физики, химии, биологии, астрономии — систематически освещаются в средствах массовой информации и через короткое время попадают на страницы школьных учебников, то о новых математических открытиях прочесть в газете или журнале не удастся. Единственной математической теоремой, время от времени появлявшейся в широкой печати, была Великая теорема Ферма. Но и к ней исчез интерес у журналистов после появления ее доказательства, занимающего сотни страниц и использующего аппарат, недоступный среднему интеллигенту.

Причиной этому — дедуктивный характер математики. Для того, чтобы понять то или иное достижение в алгебре, геометрии или теории вероятностей, как правило, требуется знание огромного фундамента, на котором появилось это достижение. К тому же математика выработала свой специфический язык, овладение которым сродни овладению трудным иностранным языком.

В конце 40-х годов XX века американские математики Р. Курант и Г. Роббинс предприняли удачную попытку рассказать широкому кругу читателей, в первую очередь учителям математики в школе и школьникам, о содержании и методах современной математики в книге «Что такое математика». Эта книга не раз издавалась и на русском языке.

С тех пор прошло полвека и назрела необходимость еще раз попытаться ответить на вопрос «Что такое математика?». Эта книга написана именно с этой целью. Первый ее том «Дискретные объекты» вы держите в руках. Вторым томом предполагается «Непрерывность», а третьим «Экстремум».

Основной текст книги написан В. Г. Болтянским. А. П. Савину принадлежит составление задач и упражнений к материалу книги и написание решений этих задач. Такое построение книги делает возможным ее использование в качестве учебного пособия. Большую и существенную работу проделал редактор книги А. Н. Виленкин, которому авторы чрезвычайно благодарны.

Авторы

ВВЕДЕНИЕ

Беседа 1. Предмет математики

1. Мнения о пользе математики

Наш великий соотечественник Михаил Васильевич Ломоносов говорил: «Математику уже затем учить надо, что она ум в порядок приводит». Но, может быть, за те два с лишним столетия, которые прошли со времен Ломоносова, математика утратила свою актуальность? Приведем свидетельство наших дней.

Американский президент Рональд Рейган в последний год своего правления представил доклад «Нация в опасности». «...Кичась своей демократичностью, Америка позволила старшеклассникам называть, по своему выбору, три главных, с их точки зрения, учебных предмета, по которым они хотели бы быть аттестованными. Разумеется, лишь 10 - 12% молодых людей пожелали видеть среди этих трех предметов математику. И результат не замедлил сказаться: за десятилетие с лишним эта демократичность привела к тому, что молодые юристы стали хуже логически мыслить, молодые врачи стали лечить хуже, чем их более зрелые коллеги в бытность их в том же возрасте, вновь испеченные экономисты стали хуже понимать законы рынка». Президент поставил задачу срочно выбраться из этой интеллектуальной ямы и добиться, чтобы американская молодежь лучше всех знала математику. (Кстати, некоторые наши руководители образования чуть не затолкали нас в эту же яму, пытаясь на этом заработать популярность у сердобольных родителей.)

А известный польский математик и популяризатор Г. Штейнгауз выразил ту же мысль иначе, в виде шутливого принципа: «Математик это сделает лучше», добавив при этом, что его принцип универсален. Не в том, конечно, смысле, что медиков и юристов надо вербовать только среди математиков, но с назиданием, что представитель каждой специальности, владеющий стилем и методом мышления, почерпнутым при творческом изучении математики, будет и в своей области работать лучше.

Впрочем, некоторые ученые (особенно часто — физики) считают, что математика — лишь формалистическая одежда к важнейшим естественно-научным открытиям, тогда как сами эти открытия и не нуждаются в этой скучной, бесполезной с их точки зрения науке. Есть остроумный анекдот (наверное, придуманный физиками) на эту тему. Однажды Шерлок Холмс и доктор Ваттсон задумали распутать сложную криминальную историю. В селение, где случилось происшествие, не вела хорошая дорога, и они решили воспользоваться воздушным шаром. Однако, ввиду ненастной погоды, воздушный шар покрылся корочкой льда, и наши герои куда-то шлепнулись, к счастью, благополучно.

— Где мы находимся? — спросил Шерлок Холмс у стоящего невдалеке человека.

— В кабине вашего воздушного шара, — подумав, ответил тот.

— Он — математик! — воскликнул Шерлок Холмс. На вопрос доктора Ваттсона, откуда он это узнал, Холмс ответил, пожав плечами:

— Это очевидно: он ответил не сразу, а подумав; его ответ был абсолютно точен и совершенно бесполезен!

Конечно, физики, мягко говоря, не очень искренни в этом своем мнении. Великий Эйнштейн, создатель теории относительности, взял основную идею о пространственно-временном интервале у крупнейшего математика А. Пуанкаре, а также пользовался идеями и понятиями математика М. Гроссмана, чтобы облечь свои идеи по специальной теории относительности в точную форму. Что же касается общей теории относительности, то и здесь огромное значение имеют исследования выдающегося математика Давида Гильберта, который также внес большой вклад в создание этой теории.

Математический стиль мышления нужен всем, а в естественных науках (в том числе физике) также нужны фундаментальные математические результаты и теории.

Бытует и еще одно мнение. Нередко люди, далекие от математики и ее приложений, полагают, что наука эта сухая и неинтересная (хотя, может быть, и полезная), что все в ней давно уже открыто и ничего нового не придумаешь (все те же «дважды два — четыре», все те же квадратные уравнения и та же теорема Пифагора), а ученый-математик — это тот, кто умеет хорошо считать. Теперь же, поскольку появились быстродействующие вычислительные машины, сама профессия математика скоро будет ненужной.

Однако подобные рассуждения в корне ошибочны. Компьютеры (и даже карманные калькуляторы) действительно лучше справляются с утомительными и скучными арифметическими подсчетами, чем считающий вручную вычислитель. Но математик видит интерес и пользу своей науки вовсе не в вычислениях, а в богатстве ее идей и приложений. Ведь алгоритм вычислений должен дать компьютеру человек.

Ошибочно и мнение о том, что в математике не появляется ничего нового. Напротив, именно сейчас эта наука бурно развивается, движется семимильными шагами по непроторенным, неизведанным путям. Школьникам известны алгебра, геометрия, начала математического анализа. Инженер может добавить к этому еще несколько разделов так называемой высшей математики: интегральное исчисление, теорию дифференциальных уравнений, теорию вероятностей, математическую статистику... Современная же математика включает десятки новых направлений и областей, превосходящих по объему и идейному богатству названные разделы. Причем многие из них обязаны своим развитием нескольким последним десятилетиям и даже годам.

В нашей стране издается реферативный журнал «Математика», в котором кратко излагается содержание научных работ, публикуемых математиками всего мира. Аналогичные журналы (Mathematical Reviews, Zentral Blatt) выпускаются и за рубежом. За год эти журналы

помещают десятки тысяч рефератов. И в каждой реферируемой работе есть что-то новое, какое-то продвижение вперед (хотя, может быть, не всегда крупное). Таких темпов развития математика не знала никогда.

Но если умение хорошо считать — далеко не самое важное в математике, то какие же проблемы волнуют представителей этой науки? Откуда эти проблемы возникают? И почему именно сейчас так велики темпы развития математики? Постараемся ответить на эти вопросы.

2. Понятия математики и их возникновение

Как и другие науки, математика использует много различных понятий. Все они почерпнуты из жизни и являются плодом многовековых наблюдений человечества. Сами математические термины убедительно свидетельствуют о возникновении математических понятий путем абстракции от реальных предметов и отношений.

Так, термин трапеция (рис. 1) происходит от древнегреческого слова τραπεζιον («трапезион»), означавшего столик (рис. 2) — вспомните древнерусское слово трапеза. Математическому термину линия основой возникновения послужило латинское слово linum, означающее лен, льняная нить. Английский термин line означает не только «линия», но также «прямая». Вообще, слово «линия» часто употребляется в смысле «прямая линия» (отсюда происходит термин «линейка»). Очевидно, понятие прямой линии является абстракцией от натянутой льняной нити.

От греческого слова σφαίρα (означавшего мяч), происходит математический термин сфера (рис. 3). От слова πρίσμα (означавшего опиленная) происходит термин призма (рис. 4). От греческого слова κωνοζ (сосновая шишка) возник термин конус (рис. 5); заметим, что до сих пор в английском языке слово cone означает и конус, и шишку хвойного дерева (pine cone — сосновая шишка, рис. 6).

Слово точка означало в древнерусском языке отточенное перочинным ножом острие гусиного пера (рис. 7), которым писали (и ставили «точки») в древности. Математические термины круг, окружность имеют, очевидно, общее происхождение с общеязыковыми словами кружить, окружать, округа.

Понятия возникают в голове человека (в результате его практической деятельности) посредством процесса абстракции. Много тысячелетий люди наблюдали предметы, сгруппированные парами: две

Рис. 1 Рис. 2 Рис. 3

Рис.4 Рис.5 Рис.6 Рис.7

руки, два глаза, два уха у человека, два рога у коровы... Отвлекаясь, абстрагируясь от конкретных особенностей этих предметов и оставляя лишь существенное, общее свойство предметов, сгруппированных в пары (неважно, руки это, глаза или уши; существенно что имеется пара этих предметов), мы постепенно формируем в своем сознании абстрактное понятие два. А возникновение термина (в данном случае, «два») завершает, закрепляет формирование абстрактного понятия и является символом, знаком, словесным эквивалентом этого понятия.

Заметим, что ребенок, проходящий путь познания окружающего мира, гораздо легче усваивает абстрактные понятия в сравнении с теми трудностями, которые в процессе исторического развития преодолело человечество при первоначальной выработке этих абстрактных понятий. Объясняется это тем, что родители, уже владеющие абстрактными понятиями, сознательно акцентируют внимание ребенка на соответствующих предметах и обстоятельствах, используя термины, выражающие нужное понятие: «У тебя две ручки, два глазика», «Смотри: на лугу две коровки» и т. д. Повторение термина «два» помогает возникновению абстрактного понятия в сознании ребенка.

Другой причиной, облегчающей ребенку формирование, скажем, абстрактных геометрических понятий, является «овеществление» этих понятий в окружающих геометрических формах. Первобытный человек почти не имел перед глазами предметов, помогающих выработке абстрактных понятий прямая линия, окружность, прямой угол и т. д. Сегодня ребенок на каждом шагу видит прямолинейные углы зданий, ребра прямоугольных коробок, прямые углы в переплетах окон и страницах книги...

3. Некоторые виды абстракции

Современная теория познания различает несколько видов абстракции, и все они играют важную роль при образовании математических понятий. Самой простой является абстракция отождествления. Ребенок сотни раз держит в руках ложку и приучается пользоваться ею. Но это не одна и та же ложка. Он видит чайную и столовую ложку; деревянную, стальную или серебряную; свою ложку и мамину; ложку строгой формы или украшенную орнаментом, инкрустацией... Но эти индивидуальные отличия ложек являются второстепенными, несущественными. Главным же отличием ложек от

других предметов является их функциональное назначение: столовый прибор, предназначенный для набора жидкой или вязкой пищи при еде. Мы объединяем предметы этого класса по их основному признаку (в данном случае по их функциональному назначению), отвлекаясь, абстрагируясь от индивидуальных, несущественных особенностей. Мы как бы отождествляем между собой все предметы этого класса: ложка «вообще». Абстракция отождествления, завершенная введением термина, и приводит к формированию абстрактного понятия.

Формирование отмеченного выше абстрактного понятия «два» также является, конечно, результатом абстракции отождествления. Выработка абстрактных понятий «один», «два», «три» и т. д. была многовековой и мучительной. Достаточно сказать, что еще в XIX столетии у некоторых племен, населявших Полинезию, были в употреблении три сорта чисел: одни для пересчета людей, другие для счета животных, третьи — для пересчета оружия, утвари и других неодушевленных предметов. Абстракция отождествления, позволяющая перейти к одной системе чисел, тогда еще не была проведена до конца у этих народов.

Другим видом абстракции, имеющим особенно важное значение для математики (в частности, для геометрии), является абстракция идеализации. Сущность ее состоит в том, что мы не просто отождествляем между собой предметы определенного класса, но также идеализируем их, наделяем такими свойствами, которыми реальные предметы не обладают. Так, понятие геометрической точки мы получаем, отождествляя между собой предметы очень малых, пренебрежимых размеров по сравнению с другими предметами, встречающимися в рассматриваемой ситуации. Однако мы не просто отождествляем эти предметы между собой, а наделяем их идеальным, воображаемым свойством. Мы считаем, что предметы совсем не имеют размеров, и такие идеализированные предметы считаем точками. Мы абстрагируемся не только от цвета, температуры, материала предмета, но и от его размеров. В реальном мире не существует предмета, о котором можно было бы сказать, что это — геометрическая точка. Понятие линии, имеющей протяженность только в одном направлении (имеющей длину, но не обладающей толщиной), также является результатом применения абстракции идеализации. То же относится и к любой геометрической фигуре. Коробка, шкаф, высотный дом являются реальными прототипами понятия прямоугольный параллелепипед, но ни об одном из этих предметов нельзя сказать, что это и есть прямоугольный параллелепипед. Мы не только должны отвлечься от второстепенных деталей (ручек, окон и т. п.), но и наделить предмет идеальными свойствами: абсолютно ровные грани, в точности прямолинейные ребра и т. д. Мы не только отождествляем предметы похожей формы, но и идеализируем их, наделяя свойствами, которыми реальные предметы обладают лишь с определенной степенью приближения.

Отметим еще абстракцию потенциальной бесконечности. Мы говорим, что прямая неограниченно продолжается в обе стороны, гово-

рим, что натуральных чисел 1, 2, 3, ... бесконечно много. В действительном мире нет предмета, обладающего такой протяженностью, как бесконечная геометрическая прямая, нет такого набора предметов, для пересчета которого потребовалось бы «бесконечное» множество чисел. Понятие о натуральном числе мы получаем, пересчитывая небольшое количество предметов (десятки, в крайнем случае сотни). Но, составив свое мнение о свойствах этих не очень больших чисел, мы позволяем себе мысленно раздвинуть эти ограничительные рамки, вообразить бесконечное множество всех натуральных чисел.

4. Многоступенчатые абстракции

Математике свойственны многоступенчатые абстракции, т. е. абстракции над абстракциями. Разумеется, они свойственны и другим областям знания. Абстрактные понятия идти, работать, говорить приводят (с помощью абстракции отождествления) к понятию глагола. Это уже абстракция второй ступени, абстракция от абстракций. А еще один шаг, и мы объединяем понятия глагол, существительное, наречие и т. п. одним абстрактным синтаксическим понятием часть речи. Это уже абстракция следующей ступени. Таким образом, грамматические абстракции являются многоступенчатыми.

Для математики особенно свойственно образование многоступенчатых абстракций. Абстрактные понятия два, три, пять, ... приводят к следующей ступени абстракции — понятию натурального числа. Первоначально оно было связано с непосредственным пересчетом, исчислением предметов (откуда и происходит современный термин число). Еще одна ступень абстракции (на этот раз абстракции потенциальной бесконечности), и мы приходим к понятию натурального ряда. Оно как бы существует само по себе, со всеми его свойствами. К ним относятся действия: сложение, умножение, причем эти действия неограниченно выполнимы и обладают обобщенными свойствами. Таковы коммутативность (переместительность) сложения и умножения, выражаемая формулами

ассоциативность (сочетательность) этих действий:

дистрибутивность (распределительность):

И когда вам говорят «некоторое натуральное число», то вы в первую очередь имеете в виду именно весь натуральный ряд чисел и эти его свойства, а не вспоминаете пересчет конкретных предметов или, тем более, два уха и четыре ножки у стола.

Но, несмотря на очень высокую ступень абстракции, натуральное число — это далеко не последняя ступень обобщения. В процессе исторического развития математики (и, разумеется, в связи с прак-

тической деятельностью человека) возникли нуль и отрицательные числа, рациональные числа. Затем появились действительные числа, а впоследствии и комплексные числа. Теперь уже складывать и умножать можно не только натуральные, но также действительные (или комплексные) числа, причем и в этом случае сохраняются коммутативность, ассоциативность, дистрибутивность. Но и на этом ряд абстракций не кончается. Возникают векторы, которые также можно складывать (и умножать на числа), и вновь указанные свойства действий сохраняются.

Абстрагируясь от конкретных (теперь уже второстепенных) черт тех объектов, которые мы складываем, применяя снова абстракцию отождествления, мы приходим к понятию группы (точнее, коммутативной группы). Иными словами, коммутативная группа — это множество каких-то элементов (не обязательно чисел или векторов), для которых определена операция сложения, обладающая отмеченными выше свойствами. Точнее, сложение в коммутативной группе обладает свойствами коммутативности и ассоциативности:

a + b = b + a, a + (b + c) = (a + b) + c. (1)

Кроме того, в группе имеется элемент 0 (нуль), обладающий тем свойством, что

а + 0 = а (2)

для любого элемента а\ наконец, для каждого а имеется противоположный элемент -а, для которого выполняется соотношение

а + (-а) = 0. (3)

К высшим ступеням абстракции относится также понятие поля (получающееся при рассмотрении множеств с двумя операциями — сложением и умножением). Ряд высших ступеней абстракции связан и с геометрическими понятиями (метрическое пространство, риманово пространство, топологическое пространство). В каком-то смысле каждая область современной математики является сложным переплетением алгебраических и топологических конструкций. Эту мысль образно выразил французский математик Андре Вейль, который говорил, что «за душу каждого математика борются ангел топологии и дьявол абстрактной алгебры».

Высокая абстрактность математических понятий и теорий привела к появлению у некоторых философов-математиков мнения о том, что математические теории — это не более чем «свободная игра разума». Это мнение можно пояснить следующим образом. Коммутативная группа — это собрание некоторых символов, не имеющих никакого конкретного смысла и связи с реальной действительностью, важно лишь, чтобы было указано, какие символы получаются при «сложении» двух других, и выполнялись указанные выше свойства сложения (1), (2), (3). Можно также свободным творением разума предписать формальным символам следовать не этим свойствам

(аксиомам), а любым другим, создаваемым игрой воображения, и тогда получится не коммутативная группа, а иное математическое понятие. Делом чистой удачи является нахождение таких аксиом, которые приводят к «математически интересным» понятиям, допускающим достаточно длинную цепочку логических выводов, умозаключений, следствий... Именно такой игрой символов и занимается математика. А тот факт, что эта математическая игра символов иногда приводит к выводам, которые оказываются полезными и применимыми на практике, является удивительным и необъяснимым...

Современная теория познания смотрит на математику иначе. Окружающий материальный мир, воздействуя на наши органы чувств, вызывает ощущения, приводящие к образованию в нашем сознании представлений, образов, абстрактных понятий. Самая сложная идея, связанная с высокими ступенями абстракции, может быть с помощью возвратного самоанализа прослежена и сведена к все более и более простым понятиям, а в конце концов, к образам и представлениям, являющимся отражениями реальных предметов и процессов — подобно тому, как огромное мозаичное панно оказывается при более детальном рассмотрении сложенным из фрагментов и отдельных разноцветных камешков. Самая дерзкая и неожиданная идея ученого-математика, как бы она ни казалась «свободной» игрой разума, всегда имеет отдаленные аналогии и связи с представлениями, образами, понятиями, «подсмотренными» в окружающей действительности. Именно в том, что даже самые абстрактные математические понятия отражают определенные черты реальности, и заключается причина того, что из этих понятий могут быть построены математические модели, которые правильно, адекватно описывают (с той или иной точностью) определенные стороны реальных процессов и явлений.

5. Пространственные и пространственноподобные формы

Многие математические понятия имеют гораздо более абстрактный характер, чем понятия других естественных наук. Это означает, что математик, наблюдая окружающий мир, отвлекается от большего количества черт и признаков реальных процессов и явлений, чем его коллеги биологи, химики, физики. В связи с этим в поле зрения математика остаются наиболее глубинные черты предметов и явлений. Именно этим объясняется то, что математика находит применения во всех других науках. Мы говорим, что молекула воды содержит два атома водорода, отмечаем векторный характер силы и скорости, рассматриваем группу Лоренца в специальной теории относительности...

Как же охарактеризовать те глубинные черты реальной действительности, которые находят отражение в математических понятиях? Иными словами, что изучает математика, каков ее предмет?

Энгельс писал в своей «Диалектике природы», что математика изучает количественные отношения и пространственные формы реального мира. Например, числа и действия над ними, уравнения, функции и их свойства (в том числе такие относящиеся к ним понятия,

как производная и интеграл) — все это математические понятия и закономерности, являющиеся отражениями количественных отношений реального мира. Геометрические фигуры и их свойства относятся к пространственным формам. Имеются и сложные переплетения количественных отношений и пространственных форм друг с другом. Так, измерение геометрических величин (длин, площадей, объемов) дает некоторые количественные характеристики геометрических фигур. Другим примером взаимопроникновения количественных отношений и пространственных форм является графическое изображение функциональных зависимостей, лежащее в основе аналитической геометрии и открытое великим французским математиком и философом Рене Декартом. Это соединение числа и фигуры, функции и линии (ее графика) является мощным математическим средством описания реальных процессов и познания мира, и это взаимопроникновение количественного и пространственного весьма характерно и существенно для современной математики.

Однако в связи с развитием современной математики ученые приходят сегодня к выводу, что энгельсово определение математики как науки о количественных отношениях и пространственных формах реального мира является несколько ограничительным и нуждающимся в расширении, уточнении. Академик А. Д. Александров считал, что следует говорить не только о пространственных, но и о пространственноподобных формах реального мира. Так, в математике (и не только в теоретической, абстрактной математике, но и в приложениях к физике, химии, экономике, биологии и другим наукам) систематически рассматриваются многомерные пространства (четырехмерное, я-мерное и даже бесконечномерное). Геометрические фигуры, изучаемые в элементарной геометрии, расположены в трехмерном пространстве, и именно это является отражением пространственных форм реального мира.

Вообразим себе двумерное существо, живущее в плоскости и могущее свободно перемещаться в ней. Для такого существа окружность будет замкнутой «тюремной камерой» (рис. 8). Но стоит только заметить, что плоскость лежит в трехмерном пространстве, как мы, трехмерные существа, сможем освободить узника, вынув его из плоскости и затем положив обратно, но вне «тюремной камеры» (рис. 9). Освобождение реального узника в нашем трехмерном пространстве

Рис. 8 Рис. 9

Рис.10 Рис.11 Рис.12

можно было бы сделать, если бы оно было вложено в «реально существующее» четырехмерное пространство. Тогда можно было бы выйти из камеры заключения в четвертое измерение, а затем снова вернуться в наше трехмерное пространство, но уже вне пределов тюрьмы. Однако такой возможности реально нет: наше пространство трехмерно, и никакого четвертого измерения реально, в буквальном смысле, не существует. Никто, даже самый гениальный математик, не в состоянии видеть, зрительно ощущать четырехмерные (а тем более многомерные) фигуры. Но это вовсе не означает, что многомерные пространства являются заумной, надуманной и никому не нужной математической функцией. Состояния механических систем, имеющих более трех степеней свободы, адекватно описываются именно точками многомерных пространств, а расчеты таких систем, осуществляемые на основании формул многомерной геометрии, хорошо подтверждаются на практике. Например, механическое состояние материальной точки, движущейся в плоскости, определяется четырьмя координатами: двумя геометрическими координатами и двумя компонентами скорости (рис. 10). Иначе говоря, ее механическое состояние изображается точкой четырехмерного пространства. А механическое состояние системы, состоящей из двух материальных точек, соединенных жестким стержнем (рис. 11), описывается точкой десятимерного пространства. Вот еще пример. Для расчета наиболее выгодного плана вывоза сырья, скажем, с двух складов на четыре завода (при строго регламентированной потребности заводов в сырье) требуется ввести четыре параметра, характеризующие количество сырья, вывозимого на заводы с первого склада (тогда со второго склада надо будет довезти на заводы недостающее количество сырья). Поэтому каждый возможный план перевозок изображается точкой четырехмерного пространства. А все возможные планы перевозок, как можно доказать, образуют выпуклый четырехмерный многогранник. Не трехмерный (рис. 12), а четырехмерный. И самый выгодный план перевозок изображается одной из вершин этого многогранника. А при большем количестве складов и заводов для описания ситуации требуются пространства еще больших размерностей. Именно геометрия многомерных пространств позволяет рассчитывать оптимальные планы перевозок и решать многие другие задачи математической экономики. Российский ученый, академик Леонид Канторович, от-

крывший эту новую область математики и ее приложения к экономике, за это открытие был удостоен Нобелевской премии.

Фигуры, формулы, закономерности многомерных пространств, изучаемые математикой, являются, таким образом, «слепками», моделями, имитациями реальных процессов, но относятся они не к пространственным, в буквальном понимании, а к пространственноподобным формам реального мира.

И хотя в буквальном смысле «видеть» многомерные фигуры никому не дано, но, переходя от двумерного случая (плоскости) к трехмерному пространству и рассуждая далее по аналогии (с учетом математических формул многомерной геометрии), можно выработать многомерные представления и интуицию, которые заменяют «видение» многомерных фигур обычным зрением. Именно в этом смысле математики охватывают мысленным взором геометрические фигуры и открывают закономерности в многомерных и даже бесконечномерных пространствах (находящих важные приложения, например, в квантовой физике). А аналитические расчеты позволяют точно подтвердить правильность этих наглядно подмеченных фактов многомерной геометрии.

Такое «многомерное зрение» настолько характерно для современной математики и ее приложений, что геометрия сегодня не только является наукой о непосредственно наблюдаемых пространственных формах реального мира, но и служит средством осмысления математических (в том числе количественных) соотношений и закономерностей с помощью образов многомерной геометрии, служит средством переработки и организации математической информации. Это — своеобразное «геометрическое мировоззрение» современного математика, физика, биолога.

Многомерная геометрия — это лишь один (хотя и очень важный) пример пространственноподобных отношений реального мира. Наиболее общие пространственноподобные отношения изучаются в топологии, одном из наиболее абстрактных и в то же время имеющих широкие приложения разделов современной математики.

6. Количественные отношения реального мира

Понимание количественных отношений, составляющих другую часть энгельсова определения математики, также нуждается в уточнении и расширении. При непосредственном, численном понимании количественных отношении мы имеем в виду: результат счета; результат измерения длин, площадей, объемов, скоростей, температур и других величин; функциональную зависимость (связывающую значения двух или нескольких переменных величин и позволяющих найти значение зависимой переменной, если известно значение независимой переменной, называемой аргументом), а также дальнейшие числовые характеристики, связанные с этими понятиями — производная, интеграл, дифференциальное уравнение и его решения и т. д. Разумеется, буквенные обозначения, идущие от работ Рене Декарта и Франсуа Виета, и связанное с ними дальнейшее развитие алгебры (тождества,

уравнения, многочлены — вплоть до понятий группы, поля и дальнейших обобщений) также подпадают под категорию количественных отношений. Все это приводит к численным результатам (или предполагает возможность свести, в конце концов, все к численным результатам). Однако за последнее время весьма важное значение приобрело качественное выражение количественных закономерностей реального мира. Приведем несколько примеров для пояснения того, о чем здесь идет речь.

При работе паровой машины (или другого двигателя) угловая скорость вращения вала не является, конечно, строго постоянной. Некоторые флуктуации давления пара в котле, небольшие колебания нагрузки и другие «возмущения», как говорят математики и инженеры, приводят к тому, что угловая скорость вращения вала то и дело отклоняется от номинального значения. Однако возникшие отклонения гаснут, и угловая скорость вновь и вновь приближается к этому значению. В таком случае говорят, что работа паровой машины является устойчивой.

Мы специально остановили внимание на паровой машине, этом несколько старомодном двигателе, чтобы рассказать об исторических фактах, существенно связанных с развитием математики. В XIX столетии паровые машины становились все более совершенными. Увеличивались скорости вращения и, в связи с этим, уменьшались размеры и массы маховиков (массивный маховик большого размера может разорваться при быстром вращении), более массивными становились заслонки паропроводов и в связи с этим увеличивалась масса шаров центробежного регулятора Уатта (напомним, что этот великолепный по своему замыслу регулятор, схематически показанный на рис. 13, приводит к расхождению шаров при чрезмерном увеличении скорости вращения, благодаря чему прикрывается заслонка паропровода и скорость вращения начинает уменьшаться). Кроме того, совершенствование машин было связано с улучшением обработки поверхностей и уменьшением трения... И вдруг наступил кризис в машиностроении. Одна за другой вновь спроектированные паровые машины ломались, шли вразнос.

Русский инженер И. А. Вышнеградский изящным математическим исследованием вскрыл причину этого кризиса.

Он изучил дифференциальное уравнение, приближенно описывающее работу паровой машины, и обнаружил, что у прежних (устойчиво работавших) машин корни соответствующего «характеристического уравнения» были расположены в плоскости комплексных чисел слева от мнимой оси (рис. 14), чем и гарантировалась устойчивая работа машин. Уменьшение маховиков, увеличение массы шаров регулятора, уменьшение трения в сочленениях привело к постепенному перемещению корней характеристического уравнения вправо. В конце концов корни «перешагнули» через мнимую ось, вследствие чего работа машины стала неустойчивой: малейшее отклонение от положения равновесия приводило к увеличению, а не уменьшению амплитуд отклонений, происходила все увеличивающаяся раскачка,

Рис. 13 Рис. 14

машина «шла вразнос». И поскольку уменьшение маховиков и увеличение шаров регулятора было необходимым объективным условием увеличения мощности машин, Вышнеградский выдвинул тезис: надо искусственно вводить дополнительное «вязкое» трение при помощи специальных устройств, демпферов. Этот вывод — качественный, характеризующий глубокое понимание существа происходящих процессов, хотя выражался он через количественные расчеты и, в свою очередь, позволял видоизменять конструкции и расчеты в нужном направлении. Вскоре возникла новая ветвь математики, теория устойчивости, в создание и развитие которой наибольший вклад внесли академик А. А. Ляпунов (1857 - 1918) и другие русские математики.

Второй пример относится к области экологии. В скалистых фиордах Норвегии водятся белые куропатки, являющиеся важным объектом охотничьего промысла. Было замечено, что значительную часть куропаток уничтожают орланы. И тогда было решено истребить конкурентов-орланов, для чего за убитого орлана была назначена цена, несколько превышающая цену куропатки. Охотники переключились на этот более выгодный промысел, и вскоре орланы были выбиты почти полностью. Результат был обнадеживающим: поголовье куропаток стало расти из года в год. И вдруг, через 17 лет, наступила катастрофа. Без всяких видимых причин наступил страшный мор в стаях куропаток, и они почти исчезли.

Математическое исследование дает хорошо подтверждающуюся качественную картину этого явления. Куропатки болеют вирусным орнитозом. Больные птицы менее подвижны, и именно они в первую очередь становились добычей орланов. Подобно волкам в наших лесах, орланы были санитарами, отбраковывающими больных птиц. А в отсутствие орланов скученность растущего поголовья куропаток привела к эпидемии. Расчеты, связанные с составлением и решением

дифференциальных уравнений «совместного существования видов», позволили дать полную качественную картину. Без учета орланов уравнение описывало «совместное существование двух видов» (куропатки — вирусы), решение которого обнаруживало устойчивый периодический процесс (возрастание поголовья куропаток — возникновение эпидемии — медленное восстановление небольшой популяции сохранившихся куропаток — новое возрастание поголовья и т. д.). И неважно, дает ли расчет точно 17 лет в качестве периода повторения процесса или 15, или 20. Важно, что он дает правильную качественную картину, позволяющую правильно вести охотничье хозяйство. И действительно, через много лет, когда восстановилось поголовье орланов-санитаров, все вошло в прежнее устойчивое состояние.

В рассмотренных примерах качественный характер проявления количественных закономерностей был совершенно различным. В первом примере изучалась устойчивость приближения к равновесному режиму, во втором — периодический, колебательный характер проявляющихся видоизменений. Количественные отношения реального мира проявляются здесь в их качественном выражении. Отражением этого является возникновение в современной математике теории устойчивости, качественной теории дифференциальных уравнений, теории катастроф и других разделов, в которых количественное исследование направлено на получение не численных, а качественных результатов.

Таким образом, несмотря на уточнения, которые должны быть сегодня сделаны в понимании пространственных форм и количественных отношений реального мира, энгельсово определение предмета математики (даже в применении к современному ее развитию) правильно отражает наличие в ней двух основополагающих начал. Пространственное и количественное порождают всю математику, взаимопроникая друг в друга и обогащаясь все новыми связями. Учитывая те уточнения в понимании пространственного и количественного, которые были отмечены выше, можно в итоге сформулировать следующее определение предмета математики: предметом математики являются, во-первых, пространственные (а также пространственноподобные) формы реального мира, и, во-вторых, количественные отношения (в их численном или качественном выражении) реального мира. Взаимосвязь и взаимопроникновение этих двух ее частей обусловливают все многообразие разделов и направлений современной математики.

Заметим в заключение, что мы здесь обсуждали только предмет математики, оставив вне рассмотрения ее методы. Они также весьма специфичны. Здесь и дедукция, и математический аспект индукции, анализ и синтез, аналогия и многое другое. Здесь также аксиоматический метод, интересный подход к пониманию непротиворечивости теории, глубокое обобщение аристотелевской логики. Но о методах математики мы поговорим позже, постепенно раскрывая содержание различных разделов этой науки.

Глава I. МНОЖЕСТВА И ОТОБРАЖЕНИЯ

Беседа 2. Конечные и бесконечные множества

7. Множество и его элементы

Мы часто говорим о стае птиц, наборе фломастеров, коллекции минералов, собрании картин и т. д. Обобщая, можно сказать, что речь идет о множестве некоторых предметов. Термин множество широко применяется в математике. Предметы, входящие в рассматриваемое множество, называются его элементами. Кроме основного термина множество, в математике иногда используются его синонимы: система, семейство, класс и др. Например, мы говорим о системе уравнений, о семействе всех прямых на плоскости, о классе всех непрерывных функций и т. п. Однако эти синонимы используются лишь в целях разнообразия языка, и каждый из них может быть заменен универсальным термином «множество».

Множество является первоначальным математическим понятием, т. е. никакого определения понятия «множество» не предусматривается. А апелляция к общеязыковым словам стая, набор, коллекция, собрание — это не определение (в точном математическом смысле), а лишь пояснение смысла этого понятия. Однако есть одно непременное требование к математическому понятию множество: о каждом предмете, каждом элементе должно быть возможно точное выяснение того, принадлежит ли он рассматриваемому множеству или нет.

Обозначим, например, через F множество всех цифр, используемых при десятичной записи чисел. Тогда 5 есть элемент этого множества, 8 тоже его элемент, а 12 и -1 не являются элементами множества F. Это записывают следующим образом:

Знак g говорит о том, что элемент принадлежит рассматриваемому множеству (или включается в данное множество). Он называется знаком включения и изображается одним из видов написания греческой буквы эпсилон. Тот же знак, но перечеркнутый (е), говорит о том, что рассматриваемый элемент не принадлежит рассматриваемому множеству.

Когда мы говорим о том, что для каждого предмета должно быть возможным точное выяснение того, принадлежит ли он рассматриваемому множеству, речь вовсе не идет о том, насколько просто это может быть выяснено. Речь идет лишь о принципиальной возможности выяснения этого. Например, в математике и ее приложениях часто используется число 71 = 3,141592653... . На 4-м и 8-м местах после запятой в этой записи стоит цифра 5. Обозначим через Р множество всех «адресов» пятерок, т. е. таких натуральных чисел п, что на п-м месте после запятой в десятичной записи числа к стоит цифра 5. Как видно из записи нескольких первых цифр, множеству Р принадлежат

числа 4 и 8. А принадлежит ли число миллиард множеству Р? Сегодня этого никто не знает, но нельзя сказать, что этот вопрос в принципе не может быть решен. Существует некий способ вычисления, алгоритм вычисления знаков числа к. Математик Шенкс, живший в XIX столетии, потратил много лет жизни на вычисление десятичных знаков числа к. Он нашел 707 знаков после запятой (правда, вследствие ошибки, вкравшейся в его вычисления, верными из них были лишь первые четыре сотни цифр).

Современные компьютеры позволили найти несколько тысяч знаков числа 71. Проведя огромное количество вычислений (что потребует огромного времени работы компьютера), можно найти, какая цифра стоит на миллиардном месте после запятой в записи числа к и, тем самым, какая из формул 109е Р, 109£ Р верна.

Но, скажем, множество всех молекул воды, налитой в стакан, не является математически точно определенным вследствие непрерывно происходящих процессов испарения и конденсации.

Приведем пример, показывающий, что иногда «определение» множества, кажущееся вполне четким, может оказаться математически некорректным. В одном взводе был взводный парикмахер. Командир приказал ему брить тех и только тех солдат, которые не бреются сами. Обозначим множество этих солдат через В. Казалось бы, множество это вполне четко определено. Но принадлежит ли этому множеству сам парикмахер? Если да, то, значит, он не бреется сам. Но тогда его должен брить парикмахер, т. е. он сам. Выходит, что он все же бреется сам, т. е. он не принадлежит множеству В. Но в таком случае парикмахер не должен его брить, т. е. он не бреется сам. Поэтому он все же принадлежит множеству В. Получающийся парадокс показывает, что множество В не определено корректно.

Вот еще пример. Зададим А как множество всех натуральных чисел, которые можно определить при помощи не более двадцати слов русского языка. Это множество конечно (поскольку слов в русском языке имеется лишь конечное множество). Пусть это будут числа Яр п2, пк. Возьмем теперь число m -п^ + п2 + ... + пк. Иначе говоря, m есть сумма всех натуральных чисел, каждое из которых определяется не более чем двадцатью словами русского языка. Поскольку m описано фразой, содержащей менее двадцати слов, это число принадлежит множеству А, т. е. совпадает с одним из чисел п^, п2, пк. Но это невозможно, поскольку число т = п^ + п2 + ... + пк больше каждого из чисел Яр п2, п}<. Полученное противоречие показывает, что множество А не определено корректно.

В рассмотренном примере мы употребили термин «конечное множество», имея в виду множество, содержащее лишь конечное число элементов. Смысл этого термина совершенно ясен. Но в математике рассматриваются и бесконечные множества, т. е. такие, которые содержат бесконечно много элементов. Например, множество N всех

натуральных чисел бесконечно. Также бесконечным является и множество всех рациональных чисел (т. е. чисел, представимых в виде отношения — двух целых чисел, где знаменатель q отличен от нуля), множество всех действительных чисел, множество всех многочленов, множество всех окружностей на плоскости и т. д. Если множество конечно и притом содержит небольшое число элементов, то его можно задать явным перечислением всех его элементов. Для этого используют фигурные скобки. Например, рассмотренное выше множество F всех цифр можно задать следующим образом:

Иногда приходится рассматривать пустое множество, т. е. такое, которое не содержит ни одного элемента. Его обозначают символом 0. Например, множество людей, у которых жизнь продолжалась более тысячи лет, пусто (даже с учетом библейских сказаний). Необходимость рассмотрения пустого множества связана с тем, что иногда о вполне корректно определенном множестве мы заранее не знаем, содержит ли оно хотя бы один элемент. Интересный пример такого рода дает так называемая Великая теорема Ферма. Чтобы рассказать о ней, мы сначала рассмотрим более простой вопрос.

Известно, что существуют такие тройки натуральных чисел, в которых сумма квадратов двух из них равна квадрату третьего, т. е. натуральные числа х, у, z, удовлетворяющие уравнению

(1)

Согласно теореме Пифагора, такие числа позволяют построить прямоугольный треугольник с целочисленными длинами сторон (рис. 15). Поэтому такие тройки чисел называют пифагоровыми. Например, равенства З2 + 42 = 52, 52 + 122 = 132, 82 + 152 = 172 дают пифагоровы тройки 3, 4, 5; 5, 12, 13; 8, 15, 17. В древнем Египте первый из этих треугольников (рис. 16) применялся для разметки прямых углов на местности, и поэтому его называют египетским треугольником. Пифагоровым треугольникам придавали в античном мире мистические свойства. Но сейчас все тройки пифагоровых чисел известны. Именно, любая такая тройка может быть получена по формулам

Рис. 15 Рис. 16

где к, m, п — натуральные числа (причем тфп).

Решение неопределенных уравнений (т. е. содержащих более одного неизвестного в одном уравнении) в натуральных числах (как, например, уравнения (1)) изучалось древнегреческим математиком Диофантом, и потому эти уравнения называют диофантовыми уравнениями. Великий математик Пьер Ферма, основатель теории чисел и один из создателей математического анализа, доказал ряд важных теорем о свойствах чисел. В частности, он рассмотрел диофантово уравнение

(2)

при п > 2, т. е. задачу о нахождении натуральных чисел х, у, z, которые удовлетворяют соотношению (2) при заданном натуральном п > 2. На полях книги Диофанта «Арифметика» Ферма сформулировал эту задачу и написал, что ни при каком натуральном п > 2 уравнение (2) не имеет натуральных решений. Иными словами, множество таких натуральных п>2, для которых уравнение (2) имеет хотя бы одно решение в натуральных числах, является пустым множеством.

Ферма приписал к формулировке этого утверждения, что он нашел удивительное его доказательство, но поля книги слишком узки, чтобы его уместить. В других бумагах Ферма доказательство найдено не было. Долгие годы многие математики пытались доказать это утверждение, названное «Великой теоремой Ферма». Она была установлена для п-Ъ, затем для всех п до ста, затем еще для многих п, но полного доказательства найти не удавалось. Таким образом, было неизвестно заранее, является ли множество натуральных чисел п > 2, для которых уравнение (2) имеет хотя бы одно натуральное решение, пустым или непустым. И лишь в 1993 году решение получил американский математик Эндрю Уайлс: он установил, что это множество в самом деле пусто, т. е. теорема, которая была сформулирована Ферма, верна.

В заключение укажем еще одно бесконечное множество, которое имеет важное значение в математике. Напомним, что натуральное число р > 1 называется простым, если оно не имеет других натуральных делителей, кроме 1 и р. Вот несколько первых простых чисел:

2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, ... . (3)

Получать простые числа можно при помощи следующего приема, называемого решетом Эратосфена. Мы выписываем какое-то количество натуральных чисел; скажем, числа от 1 до 50:

Здесь первое число 1 вычеркнуто, поскольку оно не считается простым (простое число должно быть больше единицы). Следующее число, т. е. 2, простое — оно подчеркнуто. Теперь можно вычеркнуть все числа, делящиеся на 2 (т. е. четные числа 4, 6, 8, ...), — простыми они не являются, поскольку делятся не только на себя и единицу, но также на 2. Мы их вычеркиваем:

а первое из оставшихся чисел, т. е. 3, подчеркиваем — оно простое. Теперь вычеркиваем все числа, кратные числу 3, т. е. 6, 9, 12, .... Получается следующая картина:

в которой снова подчеркнуто первое оставшееся число, т. е. 5, — оно простое. Продолжая таким образом, мы постепенно вычеркиваем все числа, не являющиеся простыми. Остаются лишь простые числа — это и дает последовательность чисел (3), т. е. простых чисел, меньших 50.

Естественно возникает вопрос, как много имеется простых чисел? И прежде всего: конечное или бесконечное множество чисел остается после просеивания чисел решетом Эратосфена, т. е. конечно или бесконечно множество всех простых чисел? Замечательный результат — доказательство бесконечности множества простых чисел — был установлен еще в древней Греции; он содержится в книге Евклида «Начала», написанной свыше двух тысяч лет назад. Рассмотрим это изящное евклидово доказательство.

Допустим, что простых чисел существует лишь конечное число. Обозначим их в порядке возрастания через pv р2, р, (р. =2, /?2 = 3 мы уже нашли, дальше идут еще какие-то простые числа, а последнее рк — наибольшее простое число).

Рассмотрим теперь число

(4)

Как и всякое натуральное число, большее 1, оно либо само является простым, либо может быть разложено на простые множители, т. е. представлено в виде произведения нескольких сомножителей, каждый из которых есть одно из чисел /?р р2, р^. Но число п не

делится ни на одно из чисел р^р2-> •••>Р/<> что видно из его выражения (4) (поскольку рхр2...рк делится на любое из чисел pvp2, ••••>Р]<-> а после прибавления единицы получается число, не делящееся ни на одно из них). Таким образом, остается единственная возможность: число п само является простым, т. е. совпадает с одним из чисел р^ р2, рк. Но это невозможно, поскольку, согласно (4), число п больше рк, т. е. больше каждого из чисел pv р2, рк. Итак, предположение о том, что имеется лишь конечное число простых чисел, приводит к противоречию, т. е. это предположение должно быть отброшено как ложное. Значит, множество простых чисел является бесконечным.

Задачи и упражнения

1. Мадемуазель Рембо любит домашних животных. Известно, что у нее не менее трех животных. Все ее животные, кроме двух — собаки; все кроме двух — кошки; все кроме двух — попугаи; все, кроме собак, кошек и попугаев — тараканы. Опишите множество животных у мадемуазель Рембо.

2. В люстре 5 лампочек. Переключатель имеет 6 положений, при которых горит разное количество лампочек: от 0 до 5. Однажды несколько лампочек перегорело. Может ли человек, не знающий схемы работы переключателя, определить множество перегоревших лампочек?

3. В комнате находятся 12 человек. Некоторые из них всегда говорят правду, а остальные всегда лгут. Каждый сказал по фразе. Первый сказал: «Здесь нет ни одного правдивого человека», второй: «Здесь не более одного правдивого человека», третий: «Здесь не более двух правдивых людей», и т. д., двенадцатый: «Здесь не более одиннадцати правдивых людей».

Определите, кто из них принадлежит множеству правдивых людей.

4. По полю проходит прямолинейная дорога. Человек, находящийся на дороге в точке А, может идти по полю со скоростью не больше 3 км/ч, а по дороге со скоростью не больше 6 км/ч. Определите множество точек, в которых он может оказаться через час.

5. На плоскости дан равносторонний треугольник ABC. Укажите множество точек А/, для которых оба треугольника АВМ и АСМ — равнобедренные.

8. Взаимно однозначное соответствие

Студенты приехали на машинах копать картошку. Привезли и лопаты. Как узнать, хватит ли лопат? Конечно, можно пересчитать студентов и отдельно пересчитать лопаты. Но организаторы мероприятия решили вопрос иначе. Они предложили студентам подходить по одному и брать лопаты. Очень быстро все лопаты были разобраны и их, по счастливой случайности, как раз хватило. Этим было установлено, что студентов и лопат одинаковое количество. Как это было выяснено? Было установлено взаимно однозначное соответствие между множеством студентов и множеством лопат. Это означает, что каждому элементу первого множества (студенту) был поставлен в соответствие один определенный элемент второго множества (лопата, которую взял этот студент), причем каждый элемент второго множества (лопата) был поставлен в соответствие одному и только одному элементу первого множества.

Рис. 17 Рис. 18 Рис. 19 Рис. 20

На рис. 17 схематически показано это взаимно однозначное соответствие. Если бы был некоторый избыток лопат (рис. 18) или если бы некоторым студентам не хватило лопат (рис. 19), то взаимно однозначного соответствия не было бы. Возможность установления взаимно однозначного соответствия между элементами двух множеств означает, что в этих множествах «одинаково много» элементов. Такие множества называются эквивалентными.

Вот другой пример. На танцплощадке собрались юноши и девушки. Оркестр заиграл вальс, и юноши стали приглашать девушек на танец. Если окажется, что все пришедшие на танцплощадку распределились по парам, то этим будет установлено взаимно однозначное соответствие между множеством всех юношей и множеством всех девушек: каждому элементу первого множества (юноше) поставлен в соответствие в точности один элемент второго множества (девушка, которую он пригласил танцевать), причем каждый элемент второго множества поставлен в соответствие одному и только одному элементу первого множества. Это соответствие показывает, что оба множества эквивалентны, т. е. юношей присутствует столько же, сколько девушек.

Заметим, что каждый из нас многие тысячи раз устанавливает взаимно однозначное соответствие между множествами. Ребенок, трогая пальчиком один за другим разложенные перед ним предметы, производит пересчет, т. е. произносит «один», «два», «три», «четыре». Этим он устанавливает взаимно однозначное соответствие между множеством расположенных перед ним предметов и множеством {1, 2, 3, 4}, т. е. между заданным множеством предметов и отрезком натурального ряда, состоящим из нескольких первых натуральных чисел. Именно наличие универсального счетного множества, т. е. натурального ряда, позволяет сегодня ребенку легче постичь абстракцию числа. Число, названное последним (в данном случае «четыре»), отвечает на вопрос, сколько предметов (элементов) имеется в заданном множестве.

Натуральные числа позволяют сформировать первоначальное понятие «меньше» (или «больше»). Предположим, что мы пытаемся

установить взаимно однозначное соответствие между двумя множествами предметов, постепенно группируя их парами: «элемент из А» <г^ «соответствующий элемент из В», «элемент из А» <г^ «элемент из В» и т. д. (рис. 20). Если при этом окажется, что мы исчерпали все элементы множества ^, но в множестве В остались «лишние» элементы (не поставленные в соответствие элементам из А, как на рис. 18), то мы говорим, что в множестве А меньше элементов, чем в В (а в множестве В больше элементов, чем в А). В этом случае установлено взаимно однозначное соответствие между множеством А и частью множества В. «Часть меньше целого», гласит один из принципов, выдвинутых великим древнегреческим мыслителем Аристотелем, создателем логики. А универсальное счетное множество (натуральный ряд) позволяет с помощью пересчета установить, в каком множестве меньше элементов, не группируя предметы парами (что было бы неудобно, если предметы громоздкие или тяжелые). Если при пересчете оказалось, что в множестве А восемь элементов, а в множестве В — десять, то мы заключаем, что в А меньше элементов, чем в В, поскольку число 8 стоит в натуральном ряду раньше числа 10. И мы убеждены, что в этом случае можно установить взаимно однозначное соответствие между всем множеством А и частью множества В.

Все вышесказанное относится к конечным множествам. В древности рассматривали почти исключительно конечные множества. Построение бесконечного натурального ряда чисел и замечательное доказательство Евклида бесконечности множества простых чисел являются первыми прорывами в математику бесконечного.

Особенно характерно разграничение конечного и бесконечного в древнегреческой геометрии. Понятие «геометрического места точек», восходящее к Платону, является отголоском этого разграничения. Поскольку геометрическая точка имеет «нулевые» размеры, какое бы (конечное!) число точек мы ни «прикладывали» друг к другу, ничего, кроме точки, получиться не может. Поэтому, по мнению древнегреческих мыслителей, прямая (или окружность, или иная линия) не может «состоять» из точек, не может быть представлена как множество точек, а есть лишь «место», где могут располагаться точки.

Евклиду (или его предшественникам — скорее всего, Евдоксу) принадлежит хорошо известная теорема, которую можно сформулировать следующим образом: множество всех точек, равноудаленных от двух заданных точек А и В, есть прямая, перпендикулярная отрезку AB и проходящая через его середину (рис. 21).

Иными словами, точка M в том и только в том случае одинаково удалена от точек А а В, если она расположена на указанном перпендикуляре, и в этом смысле этот перпендикуляр есть «место» таких точек. Сегодня мы говорим, что прямая есть бесконечное множество точек (и вообще любая геометрическая фигура есть

Рис. 21

некоторое множество точек), но древнегреческим ученым такая идеология была чужда.

Впервые перешагнуть пропасть между конечным и бесконечным попытался в XIX столетии чешский ученый Бернард Больцано. Именно он пришел к понятию взаимно однозначного соответствия. Но трудности, к которым вело это понятие применительно к бесконечным множествам, остановили его. Несмотря на много интересных идей и результатов, содержавшихся в труде Б. Больцано (опубликованном лишь через много лет после его смерти), задача построения общей теории множеств им не была решена. Ее решение дал выдающийся немецкий математик Георг Кантор. О трудностях, связанных с рассмотрением бесконечных множеств, которые обнаружил Больцано и которые были преодолены Кантором, мы и поговорим в следующем пункте.

Задачи и упражнения

6. На балу каждый кавалер станцевал ровно с тремя дамами, а каждая дама — ровно с тремя кавалерами. Докажите, что дам и кавалеров было поровну.

7. У кондуктора автобуса две катушки билетов: в одной билеты с номерами от 573000 до 573999, в другой — с номерами от 426000 до 426999. В какой из катушек больше «счастливых» билетов, т. е. таких, что сумма первых трех цифр номера билета равняется сумме следующих трех цифр?

8. На окружности отмечены 2001 белая точка и одна красная. Рассмотрим всевозможные многоугольники с вершинами в этих точках. Каких многоугольников будет больше — с красной точкой или без нее?

9. Число 222122111121 получается, если в некотором слове заменить буквы на их номера в русском алфавите. Какое это слово?

10. Имеется 3 синих и 5 красных палочек разной длины. Сумма длин синих палочек равна сумме длин красных. Можно ли распилить эти палочки так, чтобы их потом можно было расположить парами палочек равной длины и разного цвета?

9. Счетные множества

В одном театре было бесконечно много мест, и они были занумерованы натуральными числами: первое место, второе, п-е место, ... Соответственно и в гардеробе было бесконечно много крючков: № 1, № 2, № 3, ... Однажды на интересную премьеру все билеты были раскуплены, и в театр пришло бесконечно много зрителей: первый (т. е. обладатель билета на место № 1), второй, ... День был дождливый, все зрители пришли с зонтиками, которые они повесили в гардеробе (в порядке самообслуживания) на соответствующие крючки: первый — на крючок № 1, второй зритель — на крючок № 2 и т. д. После спектакля, впопыхах, первый зритель взял зонтик с крючка № 2, второй зритель взял зонтик с крючка № 3, п-й зритель взял зонтик с крючка с номером (я+1), ... (рис. 22). В результате все зрители ушли с зонтиками, но (к удивлению администрации этого бесконечного театра) на крючке № 1 остался «лишний» зонтик. Таким образом, если мы обозначим зрителей символами sv s2, а

Рис. 22 Рис. 23

зонтики — символами и2, то ситуацию можно описать следующим образом. Каждый зритель пришел со своим зонтиком, т. е. имелось взаимно однозначное соответствие между множеством S= {Sj, s2, •••} всех зрителей и множеством U= {Wp и2, ...} всех зонтиков (рис. 23). Однако после спектакля было установлено другое соответствие (рис. 22), при котором взаимно однозначно соответствовали друг другу множество S={s^9 s2, ...} и часть {uv Uy ...} множества U всех зонтиков. Выходит, что часть {ы2, ...} множества U всех зонтиков содержит «столько же» элементов, сколько и все множество U (поскольку каждое из этих множеств может быть приведено во взаимно однозначное соответствие с множеством S всех зрителей).

Это означает, что аристотелевский принцип «часть меньше целого», подмеченный при рассмотрении конечных множеств, рушится при переходе к бесконечным множествам. Вообще, в любом бесконечном множестве M можно выбрать такую его часть М., (содержащую не все элементы множества М), что существует взаимно однозначное соответствие между M и М., т. е. между множеством и его частью. Это — характерное отличие бесконечных множеств от конечных. (Не захочет ли читатель попытаться доказать это утверждение?)

Прежде чем переходить к осмыслению этого факта, опишем события, которые происходили в этом «бесконечном» театре во время других спектаклей, чтобы лучше представить себе специфику бесконечных множеств.

Во время одного из спектаклей также была дождливая погода, и все зрители пришли с зонтиками. Пока первый зритель беседовал с режиссером после спектакля, остальные забрали зонтики и ушли. При этом второй зритель взял зонтик № 1, третий зритель взял второй зонтик и т. д. (рис. 24). В результате первый зритель остался без зонтика! В один из дней (также дождливый) после спектакля первый

Рис. 24 Рис. 25

зритель взял второй зонтик, второй взял четвертый зонтик, п-й зритель взял зонтик с крючка с номером 2п, ... (рис. 25). В результате все ушли с зонтиками, но в гардеробе осталось бесконечно много зонтиков (а именно, зонтики с нечетными номерами).

На следующий день все пришли без зонтиков по случаю солнечной погоды. Но за время спектакля погода испортилась, хлынул дождь. Однако администрация успокоила зрителей, сказав, что в гардеробе как раз имеется бесконечно много не востребованных вчера зонтиков. Значит, натуральный ряд как бы содержит «вдвое больше» элементов, чем всего в нем имеется...

Теперь читатель подготовлен к восприятию некоторых основных определений, связанных с бесконечными множествами. Как мы говорили, два множества называются эквивалентными, если между ними возможно установить взаимно однозначное соответствие. Если множества Р и Q эквивалентны, это вовсе не означает, что при любой попытке сгруппировать их элементы парами (один элемент из Р и один элемент из Q, еще один элемент из Р и еще один из Q и т. д.) мы непременно получим взаимно однозначное соответствие. Так, хотя в рассмотренном выше примере множества S и U эквивалентны (как показывает рис. 23), но изображенная на рис. 22 попытка сгруппировать элементы парами не приводит к установлению взаимно однозначного соответствия.

Однако наличие неудачных попыток ничего не означает. Если существует хотя бы один «удачный» способ, при котором устанавливается взаимно однозначное соответствие между рассматриваемыми множествами, то эти множества эквивалентны.

Каждое множество, эквивалентное натуральному ряду N= {1,2, 3, ...}, называется счетным. Иными словами, множество M является счетным, если оно бесконечно, и при этом все его элементы можно

Рис. 26 Рис. 27

перенумеровать натуральными числами, т. е. записать это множество в виде M- т2, т^,...}.

Например, множество всех целых чисел (содержащее натуральные числа, нуль и отрицательные целые числа) является счетным. В самом деле, все целые числа встречаются в следующей последовательности:

О, 1, -1, 2, -2, 3, -3, ...

и теперь не представляет труда их все перенумеровать.

Несколько неожиданным является утверждение о том, что все целочисленные точки координатной плоскости (т. е. точки, у которых обе координаты являются целыми числами, рис. 26) также составляют счетное множество. Однако это становится понятным при рассмотрении того способа нумерации, который показан на рис. 27: идя вдоль спиралевидной ломаной, мы последовательно встретим (и перенумеруем) все целочисленные точки координатной плоскости.

Наконец, еще один пример. Целочисленные точки расположены на координатной прямой равномерно и изолированно (рис. 28). Рациональные же числа, т. е. числа, представимые в виде дробей — с целыми р, q (q^O), изображаются на координатной прямой всюду плотно, т. е. на любом отрезке, как бы мал он ни был, имеются рациональные точки.

Интуитивно кажется, что рациональных точек «существенно больше», чем целых. Во всяком случае целые числа составляют лишь часть множества всех рациональных чисел и, на первый взгляд, часть лишь «незначительную». Тем не менее, множество всех рациональных чисел счетно, т. е. их все можно перенумеровать натуральными числами, и в этом смысле рациональных чисел столько же, сколько и целых (или натуральных).

Рис. 28

В самом деле, назовем весом дроби — натуральное число \р\ + \q\, т. е. сумму модулей ее числителя и знаменателя. Например, обе дроби -т- и ^ имеют вес 5. Каждое рациональное число может быть представлено (и притом однозначно) в виде несократимой дроби с натуральным знаменателем. Например, все дроби - представляют одно и то же рациональное число, но только дробь — дает запись этого числа в виде несократимой дроби с натуральным знаменателем. Теперь будем последовательно нумеровать все несократимые дроби с натуральными знаменателями (т. е. рациональные числа), беря сначала дроби веса 1, затем дроби веса 2, веса 3 и т. д. Поскольку дробей каждого веса имеется лишь конечное число, мы постепенно перенумеруем все рациональные числа. Вот в какой последовательности они будут встречаться:

Этим и устанавливается, что множество всех рациональных чисел счетно.

Задачи и упражнения

11. Докажите, что множество всех рациональных точек на координатной плоскости (т. е. точек, у которых обе координаты рациональны) счетно.

12. Докажите, что множество окружностей, имеющих центры в рациональных точках координатной плоскости и рациональные радиусы, счетно.

13. Докажите, что множество всех многочленов

данной степени п с рациональными коэффициентами счетно.

14. Фигуру на плоскости назовем «буквой Т», если она состоит из двух перпендикулярных отрезков, причем второй имеет один из концов в середине первого отрезка. Докажите, что любое бесконечное множество непересекающихся «букв Т» на плоскости счетно.

15. Число называется алгебраическим, если оно является корнем некоторого многочлена с целыми коэффициентами (например, числа 1, V3 + V2, V6 являются алгебраическими). Докажите, что множество алгебраических чисел счетно.

10. Понятие мощности множества

Выше мы имели ряд примеров счетных множеств. Естественно возникает вопрос: все ли бесконечные множества счетны или же существуют несчетные множества? Ответ был дан Георгом Кантором. Он доказал, что множество R всех действительных чисел несчетно.

Приведем его весьма элегантное доказательство, известное под названием канторовского диагонального процесса.

Для простоты рассмотрим не все действительные числа, а лишь те, которые расположены между 0 и 1, и докажем, что это множество несчетно (следовательно, множество всех действительных чисел подавно несчетно). Допустим, напротив, что множество D всех действительных чисел X, удовлетворяющих условию 0 < х < 1, счетно, и занумеруем все эти числа:

(5)

Каждое действительное число записывается в виде бесконечной десятичной дроби (если десятичная дробь конечна, то это означает, что, начиная с некоторого места, все цифры десятичной записи равны нулю; например, — = 0,4 = 0,4000...). Запишем числа (5) в виде десятичных дробей; пусть, скажем,

(6)

В этой таблице подчеркнуты цифры, стоящие на диагонали. Создадим теперь бесконечную десятичную дробь (число z) по следующему правилу: если у числа хп на диагональном (т. е. п-м) месте после запятой стоит цифра 7, то у числа z мы ставим на п-м месте цифру 3; во всех остальных случаях у числа z стоит на п-м месте цифра 7. Так, в рассматриваемой таблице, первые четыре строки которой выписаны выше, только у числа х2 диагональная (подчеркнутая) цифра равна 7, а у чисел Ху х4 диагональные цифры отличны от 7. Поэтому в числе z вторая цифра равна 3, а остальные цифры (из первых четырех) равны 7:

z = 0,7377...

И дальше, если у очередного числа из (6) диагональная цифра равна 7, то вместо нее мы поставим на соответствующем месте в z цифру 3, а если диагональная цифра не 7, то на соответствующем месте ставим у числа z цифру 7. Таким образом, на первом месте у числа z стоит цифра, отчинная от первой цифры числа хх\ на втором месте у числа z стоит цифра, отличная от второй цифры числа х2, и т. д. Вообще, на п-м месте у числа z стоит цифра, отличная от п-и цифры числа X . Значит, число z не совпадает с х^ (поскольку первые цифры у них различны). Число z не совпадает и с х2 (у них вторые

цифры различны). Вообще, z не совпадает ни с одним числом хп (поскольку на п-м месте у числа z и у числа хп стоят различные цифры). Таким образом, z не содержится среди чисел (5). Однако это противоречит тому, что среди чисел (5) имеются все действительные числа, заключенные между 0 и 1.

Мы видим, что предположение о счетности множества D приводит к противоречию. Значит, это предположение ложно, т. е. множество D несчетно. Поэтому и множество R всех действительных чисел несчетно.

Доказанная теорема послужила поводом для введения понятия мощности множества. Вспомним, что, рассматривая класс эквивалентных между собой конечных множеств, мы с помощью абстракции отождествления приходим к понятию числа. Например, рассматривая множество всех ножек обычного стола и рассматривая всевозможные эквивалентные (т. е. содержащие столько же элементов) множества, мы приходим, абстрагируясь от всех конкретных свойств множеств и элементов, к понятию числа 4. Подобно этому для эквивалентных бесконечных множеств мы говорим, что у них одинаковая мощность (аналог «числа элементов»). Все счетные множества эквивалентны между собой, т. е. имеют одну и ту же мощность. Она обозначается, согласно Кантору, символом буква К («алеф») — первая в древнееврейском алфавите.

Мощность множества R всех действительных чисел обозначается готической буквой Ê («цэ»); ее называют мощностью континуума (от латинского слова continuum — непрерывный). Согласно доказанной выше теореме Кантора, действительных чисел больше, чем элементов любого счетного множества, т. е. (5 > Xq. В свою очередь, мощность К0 больше мощности любого конечного множества: KQ > п для любого натурального п.

Заметим, что К0 — наименьшая бесконечная мощность. Это означает, что из любого бесконечного множества можно выбрать счетную часть, или, как говорят, счетное подмножество. В этом нетрудно убедиться. В самом деле, пусть M— бесконечное множество. Возьмем произвольный его элемент и обозначим его через а^. Так как множество M бесконечно, то кроме а^ в нем имеются еще элементы. Пусть а2 — один из них. Кроме а^иа2в множестве M имеются еще элементы (поскольку M бесконечно); обозначим через а^ какой-либо из них. Продолжая таким образом, мы построим счетное множество Mj = {tfp а2» ciy ...}, содержащееся в множестве M (т. е. являющееся его подмножеством). Значит, множество M содержит не меньше элементов, чем счетное множество Мр т. е. мощность множества M не меньше ХЛ.

Рис. 29 Рис. 30 Рис. 31

Что же касается мощности континуума (5, то она не является «наибольшей» мощностью. Канторовский диагональный процесс (в несколько усложненной форме) позволяет доказать, что каково бы ни было бесконечное множество М, можно построить множество, которое имеет еще большую мощность, чем М. Математики называют мощности также кардинальными числами. Это как бы «бесконечно большие» числа. Сказанное выше означает, что существует бесконечно много различных кардинальных чисел.

Весьма интересна связь мощностей с геометрическими понятиями. Для начала рассмотрим один софизм. Софизмом называют рассуждение, которое на первый взгляд выглядит вполне логичным и не вызывающим сомнения, тогда как вывод, к которому приводит это рассуждение, является явно абсурдным. Раскрыть софизм — значит указать ошибочное место в этом внешне логичном рассуждении и тем самым показать, почему это рассуждение приводит к абсурдному выводу.

Софизм, о котором идет речь, утверждает, что «все отрезки имеют одинаковую длину». В самом деле, возьмем два отрезка AB и CD, не равные между собой, и расположим их параллельно друг другу (рис. 29). Прямые АС и BD пересекаются в некоторой точке О. Теперь для любой точки X отрезка AB мы проведем прямую ОХ, которая пересечет второй отрезок в некоторой точке Y. Эту точку Г мы и поставим в соответствие точке Ig AB. Этим устанавливается взаимно однозначное соответствие между отрезками AB и CD, т. е. эти отрезки содержат одинаковое количество точек. Значит, они имеют одинаковую длину.

Раскрытие этого софизма несложно. Действительно, оба отрезка «содержат одинаковое количество точек», т. е. имеют одинаковую мощность. Однако мощность и длина — понятия разные, и из совпадения мощностей не вытекает равенство длин.

Заметим, что вся бесконечная прямая содержит «столько же» точек, сколько и любой отрезок. В самом деле, если отрезок изогнуть в виде дуги полуокружности с центром О (рис. 30), то центральное проектирование этой полуокружности из центра О на прямую, параллельную диаметру PQ полуокружности (рис. 31), устанавливает взаимно однозначное соответствие между точками первоначального отрезка и всеми точками прямой. Правда, концы отрезка (или концы Р, Q полуокружности) не поставлены в соответствие никаким точкам прямой, как видно из рис. 31, т. е. отрезок содержит «на две точки

Рис. 32

больше», чем прямая. Однако это несущественно, так как добавление к бесконечному множеству конечного числа точек не изменяет его мощности. (Не может ли читатель доказать это?) Таким образом, любой отрезок имеет ту же мощность, что и прямая, т. е. мощность любого отрезка равна (5. Вообще, любая ломаная, любая окружность, любая ее дуга имеют мощность ©.

Обратимся теперь к плоским фигурам. Кажется наглядно «очевидным», что квадрат (или круг) содержит «больше» точек, чем отрезок. Однако это не так; здесь интуиция обманывает нас. Подобно тому, как рациональных точек на плоскости столько же, сколько рациональных точек на прямой (оба множества являются счетными), так и всех точек на плоскости «столько же», сколько и точек на прямой. Иными словами, мощность множества всех точек плоскости (или даже пространства) равна ©, т. е. совпадает с мощностью всех точек прямой.

Чтобы примирить читателя с его интуицией (которая, возможно, протестует против такой «несправедливости»), мы приведем канторовское доказательство того факта, что в квадрате «столько же» точек, сколько и в его стороне.

Рассмотрим на координатной плоскости квадрат с вершинами (0; 0), (1; 0), (0; 1), (1; 1) (рис. 32). Каждая точка M этого квадрата имеет две координаты х, у, причем каждая из этих координат представляет собой действительное число, принадлежащее отрезку [0; 1], т. е. 0<х<1, 0<у<\. Это означает, что числа х, у могут быть записаны в виде бесконечных десятичных дробей:

(7)

(заметим, что мы всегда можем считать целую часть равной нулю, т. е. если х = 1, то мы можем написать х = 0,9999...). Теперь мы «перемешаем» десятичные цифры чисел х и у, выписывая их поочередно, т. е. рассмотрим число

Это число z мы и поставим в соответствие точке M квадрата (с координатами х, у). Получается взаимно однозначное соответствие между всеми точками квадрата и точками отрезка [0; 1]. Это показывает, что квадрат содержит «столько же» точек, сколько и отрезок, т. е. мощность квадрата равна (S. (Может ли читатель доказать, что в кубе «столько же» точек, сколько и в отрезке?)

Рассмотрим теперь вопрос о связи мощностей с неравенствами. Прежде всего уточним понятие подмножества. Мы говорим, что некоторое множество А является подмножеством множества М, если

каждый элемент множества А является также и элементом множества М. Это выражают записью AczM. Заметим, что, согласно этому определению, само множество M является своим подмножеством: MœM. Всякое же другое подмножество А множества M (т. е. такое, что в M найдется хотя бы один элемент, не принадлежащий А), называется собственным подмножеством множества М. В аристотелевском постулате «часть меньше целого» под частью понимается именно собственное подмножество. На языке теории множеств аристотелевский постулат означает, что если А есть собственное подмножество множества М, то мощность множества А (т. е. число его элементов) меньше мощности множества М. Обозначая мощности этих множеств готическими буквами % («а») и Ж («эм»), мы можем записать аристотелевский постулат неравенства:

(8)

Однако мы теперь знаем, что этот постулат верен лишь для конечных множеств.

В случае же бесконечных множеств из того, что А есть собственное подмножество множества М, для их мощностей и Ш вытекает лишь нестрогое неравенство

(9)

Примеры мы уже имели выше. Достаточно напомнить, что хотя множество {2, 4, 6, ...} всех четных чисел является собственным подмножеством натурального ряда {1, 2, 3, ...}, но их мощности равны (оба множества имеют мощность KQ). Точно так же если отрезок PQ является собственным подмножеством отрезка AB, то из этого не следует, что отрезок PQ имеет меньшую мощность: в самом деле, как мы знаем, оба отрезка имеют одну и ту же мощность (£. Таким образом, в применении к бесконечным множествам аристотелевский принцип должен быть уточнен: часть (т. е. собственное подмножество) множества M имеет либо меньшую, либо ту же самую мощность, что и целое (т. е. все множество М). Иными словами, при переходе от конечных множеств к бесконечным мы должны заменить аристотелевское строгое неравенство (8) нестрогим неравенством (9).

Заметим, впрочем, что аристотелевский принцип «часть меньше целого» относится не только к числу элементов множества и его собственного подмножества («части»), но также к длинам отрезков, площадям фигур, объемам. О смысле аристотелевского постулата применительно к этим случаям мы еще будем иметь случай поговорить в дальнейших беседах.

Задачи и упражнения

16. Докажите, что счастливых автобусных билетов (см. упр. 7) столько же, сколько билетов, у которых сумма цифр равна 27.

17. В языке племени Ододо всего два звука: «Д» и «О». Два слова обозначают одно и то же, если одно получается из другого при помощи

следующих операций: исключения идущих подряд звуков ДО или ООДД и добавления в любое место сочетания ОД. Означают ли слова ОДД и ДОО одно и то же? Какова мощность множества различных слов этого языка?

18. На плоскости имеется некоторое количество непересекающихся треугольников. Докажите, что это множество конечно или счетно. (Треугольник вместе со своим контуром содержит и внутренность этого контура.)

19. Докажите, что множество точек куба имеет ту же мощность, что и множество точек отрезка.

20. Докажите, что множество всех подмножеств непустого множества m имеет мощность большую, чем мощность самого множества м.

Беседа 3. Операции над множествами

11. Пересечение множеств

Прежде чем переходить к рассмотрению операций над множествами, мы рассмотрим один очень удобный и часто применяемый прием наглядного изображения взаимоотношений между множествами. Речь идет о так называемых диаграммах Эйлера-Венна, в которых множества изображаются фигурами на плоскости (чаще всего кругами), по расположению которых можно легко судить о рассматриваемых множествах.

Так на рис. 33 некоторые два множества А и В изображены кругами, причем видно, что В содержится в множестве А и, кроме того, В является собственным подмножеством множества А, т. е. не совпадает с ним. Для множеств А и В, изображенных на рис. 34, также справедливо включение BczA, но при этом множества А и В совпадают. Таким образом, запись BœA означает, что либо В является собственным подмножеством множества А, либо А - В. А на рис. 35 изображены два множества, ни одно из которых не является подмножеством другого.

Пусть, например, А есть множество всех натуральных чисел, не превосходящих 10, В — множество всех нечетных натуральных чисел, не превосходящих 10, а С — множество всех простых чисел, не превосходящих 10. Иначе говоря,

Диаграмма Эйлера-Венна, показанная на рис. 36, наглядно изображает взаимоотношения между этими множествами. Каждое из

Рис. 33 Рис. 34 Рис. 35

Рис. 36 Рис. 37 Рис. 38

множеств В, С является подмножеством множества А, т. е. BczA, СczA, причем В и С— собственные подмножества множества А. Что же касается множеств В и С, то ни одно из них не является подмножеством другого, и это также наглядно показано на рис. 36 — каждая из фигур, изображающих множества В и С, выходит за пределы другой фигуры.

Перейдем теперь к рассмотрению операции пересечения множеств. Пусть А и В — два множества. Все те элементы, которые принадлежат как множеству А, так и множеству В, составляют, вместе взятые, некоторое множество, которое называется пересечением множеств А и В; оно обозначается записью А п В (рис. 37). Если множества А и В не имеют общих элементов, т. е. А Г\В = 0, множества А и В называются непересекающимися (рис. 38). Например, для множеств В и С, рассмотренных выше, справедливо соотношение ВГ\ О 0, т. е. пересечение этих множеств непусто:

Проиллюстрируем понятие пересечения множеств на фигурах из школьного курса геометрии. Рассмотрим полосу, т. е. часть плоскости между двумя параллельными прямыми (рис. 39).

Любой параллелограмм может быть представлен как пересечение двух полос А = В п С (рис. 40). Треугольник можно рассматривать как пересечение трех полуплоскостей: Т=АГ\ВГ\С (рис. 41). Выпуклый многоугольник с п вершинами является пересечением п полуплоскостей (случай п = 5 представлен на рис. 42). Сегмент круга (рис. 43) можно себе представлять как пересечение круга и полуплоскости.

Рис. 39 Рис. 40 Рис. 41

Рис. 42 Рис. 43 Рис. 44

Однако не только отдельные геометрические фигуры дают повод для использования понятия пересечения множеств. Существует важный метод решения геометрических задач (особенно задач на построение), который основан на применении пересечения множеств. Мы рассмотрим этот метод на примере двух задач.

В качестве первого примера возьмем следующую задачу. На плоскости даны три точки А, В, С, не лежащие на одной прямой; требуется построить окружность, проходящую через эти три точки (рис. 44). Чтобы решить эту задачу, мы разобьем требование задачи на две части: 1) искомая окружность должна проходить через точки А и В\ 2) искомая окружность должна проходить через точки А и С.

Если нам удастся найти окружность, удовлетворяющую как условию 1, так и условию 2, то задача будет решена.

Если окружность удовлетворяет условию 1, то ее центр О находится от точек А и В на. одинаковом расстоянии (равном радиусу, рис. 45). Следовательно, точка О находится на серединном перпендикуляре РАВ к отрезку AB. Верно и обратное: если О находится на этом серединном перпендикуляре, то окружность с центром (9, проходящая через точку А, пройдет и через точку В. Иначе говоря, прямая РАВ есть множество всех центров окружностей, удовлетворяющих условию 1. Аналогично, серединный перпендикуляр Р АС к отрезку АС (рис. 46) есть множество всех центров окружностей, удовлетворяющих условию 2. Но искомая окружность должна удовлетворять обоим условиям 1 и 2. Значит, ее центр О должен принадлежать каждому из множеств Р АВ, Рдг, т. е. Так как пересе-

Рис. 45 Рис. 46 Рис. 47

чение Рдв^Рдс состоит только из одной точки, то эта точка и является центром искомой окружности (рис. 47), т. е. поместив иголку циркуля в эту точку и проведя окружность, проходящую через точку А, мы и решим задачу — эта окружность пройдет также через точки В и С.

Решенную задачу можно интерпретировать следующим образом. В трех пунктах А, В, С удар грома услышали одновременно; указать место, где ударила молния. Известно, что звук распространяется с постоянной скоростью примерно 330 м/с. Поскольку в пунктах А, В и С удар грома был услышан одновременно, время от грозового разряда до момента его восприятия (на слух) было одинаковым для всех трех пунктов. Обозначим это время (в секундах) через t. За это время звук распространяется на расстояние 330г. Таким образом, окружность с центром в месте грозового разряда и радиусом ЗЗОг проходит через все три точки А, В, С (рис. 48), и потому рассмотренная выше геометрическая задача дает возможность найти место, где ударила молния. Кстати, это решение позволяет также приближенно определить расстояние (от любого из пунктов А, В, С) до места грозового разряда, поскольку звук распространяется за 3 секунды примерно на 1 километр, а свет — практически мгновенно (около 300 ООО км в секунду). Скажем, если время от зрительного восприятия молнии до слухового восприятия грома составляет 12 секунд, то грозовой разряд произошел на расстоянии 4 км.

Приведенный пример хорошо иллюстрирует приближенность всякого математического описания реального явления. Хотя в самом математическом решении (по формуле s = vt, относящейся к равномерному прямолинейному движению) вычисления осуществляются абсолютно точно, но математическая модель явления, так называемая его идеализация, дает лишь приближенное описание процесса.

Ведь скорость звука зависит от влажности воздуха, атмосферного давления, наличия препятствий, которые влияют на распространение звуковых волн, и т. п. Кроме того, хотя свет распространяется практически мгновенно (в данной задаче), но все же с некоторой скоростью, вспышка молнии происходит на некоторой высоте над землей. Имеется определенная (физиологическая) погрешность в фиксации тех моментов времени, когда обнаружены молния и гром. Пренебрегая всеми этими деталями (второстепенными для данного рассмотрения явления), мы и получаем некоторую модель явления, некоторую его идеализацию: пункты А, В, С и место разряда являются геометрическими точками, которые находятся в одной плоскости, моменты грозового удара фиксируются точно, звук распространяется прямолинейно и с фиксированной скоростью — км в секунду.

Вообще, для математического решения

Рис. 48

Рис. 49 Рис. 50 Рис. 51

любой жизненной задачи требуется, прежде всего, составить идеализированную математическую модель явления. И если результаты расчетов не соответствуют реальному ходу явления, то это лишь означает (если, конечно, нет ошибок в расчетах), что выбранная идеализация неадекватна действительному явлению и должна быть заменена более точной моделью. Следует также иметь в виду, что и сама математика не всегда дает точный численный ответ, а нередко использует приближенные методы расчета (не говоря уже о том, что в некоторых случаях нас интересует не точный численный расчет, а качественный прогноз).

Рассмотренный прием решения является типичным для многих геометрических задач, особенно для задач на построение. Геометрическая фигура задается обычно конечным числом характеристических точек. Например, отрезок задается двумя его концевыми точками; многоугольник (в частности, треугольник) задается его вершинами; окружность (или круг) задается двумя точками: центром и одной точкой на окружности (или тремя точками, лежащими на окружности) и т. п. Поэтому любая задача типа «построить геометрическую фигуру с такими-то свойствами» сводится, в конечном итоге, к построению нескольких точек. Но наши чертежные инструменты (карандаш, фломастер, рапидограф и т. д.) приспособлены к вычерчиванию линий. Конечно, они фактически воспроизводят узкие полоски, но, идеализируя, мы говорим о математических линиях, не имеющих ширины. Точка же может быть определена как пересечение двух линий на плоскости (рис. 49).

Разумеется, иногда три или большее число линий пересекаются в одной точке (например, три диагонали, соединяющие противоположные вершины правильного шестиугольника, пересекаясь, определяют его центр, рис. 50). Однако пересечения двух линий достаточно, чтобы задать точку. Именно поэтому мы обычно расчленяем требования, сформулированные в задаче на построение, на два отдельных условия (подобно условиям 1 и 2 рассмотренной выше задачи), каждое из которых определяет некоторое множество точек (чаще всего линию, или, как говорили в старину, «геометрическое место точек»), а пересечение этих двух множеств задает искомую точку (или несколько точек — в тех случаях, когда задача допускает несколько решений).

Рис. 52 Рис. 53 Рис. 54

Рассмотрим, например, следующую задачу. Звук грома достиг пункта А через 5 секунд после вспышки молнии, а пункта В — через 3 секунды; найти точку, где произошел грозовой разряд. Для решения достаточно заметить, что (в той же идеализации) за 5 с звук распространяется на j км, а за 3 с — на 1 км. Поэтому множество всех точек, из которых звук разряда доходит до пункта А за 5 с, есть окружность с центром А и радиусом — км, а множество всех точек, из которых он доходит до В за 3 с, есть окружность радиуса 1 км с центром В. Искомая точка принадлежит пересечению этих двух множеств (рис. 51), т. е. совпадает с одной из двух точек Р, Q.

Геометрически обе точки равноправны и дают решение задачи. Практически же, если мы заметим, в каком направлении была видна вспышка молнии, то можем из этих двух точек отобрать одну; однако это означает привлечение дополнительных данных, не указанных в сформулированной вначале задаче.

Еще один яркий пример — графическое решение уравнений. Рассмотрим следующую систему уравнений:

Решить эту систему — значит найти пару чисел х, у (или все такие пары, если их несколько), которые удовлетворяют обоим этим уравнениям. Множество всех точек координатной плоскости, удовлетворяющих только первому уравнению, представляет собой параболу, вершина которой (т. е. нижняя точка) имеет координаты (1; -5) — это становится ясным, если записать первое уравнение в виде у = (х- 1) - 5 (рис. 52). Второе уравнение задает окружность с центром в начале координат и радиусом 4 (рис. 53). Точки же (х;у), удовлетворяющие обоим уравнениям, составляют пересечение этих двух

линий (рис. 54). Эта графическая интерпретация показывает, что рассматриваемая система имеет четыре решения. Вот приближенное значение чисел, составляющих эти решения (их можно вычислить с помощью компьютера или даже микрокалькулятора):

В заключение приведем еще один практический пример применения понятия пересечения множеств. При отборе детей для участия в конкурсе решили использовать результаты обследования их по четырем параметрам и, v, w, х. Начало таблицы обследования приведено ниже (результаты указаны в процентах):

Фамилия, инициалы

и

v

w

X

1

Малинин И. И.

82%

47%

51%

43%

2

Куликова Е. А.

73%

61%

52%

42%

3

Комаров В. Г.

69%

39%

53%

63%

4

Закиров Н. И.

71%

63%

51%

41%

Было решено отобрать детей, имеющих по параметрам и, v, w, X результаты не ниже, чем соответственно 70%, 60%, 50%, 40%. Комиссия вначале стала последовательно исследовать результаты детей по списку. Однако это было признано неудобным, так как все время приходилось переключать внимание от критерия 70% к критерию 60% и т. д. Вместо этого решили применить другой метод. Комиссию разделили на 4 группы экспертов, каждой из которых выдали копию таблицы обследования. Первая группа экспертов вычеркивала фамилии детей, не прошедших по критерию и, вторая — по критерию v и т. д. Вот как выглядели результаты работы первой группы:

Фамилия, инициалы

и

v

w

X

1

Малинин И. И.

82%

47%

51%

43%

2

Куликова Е. А.

73%

61%

52%

42%

3

Комаров В. Г.

69%

39%

53%

63%

4

Закиров Н. И.

71%

63%

51%

41%

Аналогичную работу провели остальные группы. Обозначим теперь через U множество всех детей, пропущенных (т. е. невычеркнутых) первой группой, через V — второй, W — третьей, X — четвертой. Ясно, что множество детей, отобранных для участия в конкурсе, совпадает с пересечением 17 п W[\X. Это множество было определено сразу: листки сложили вместе и на просвет стал виден список детей, не вычеркнутых ни одной из групп, т. е. вошедших в пересечение 17 п WC\X (хотя таких могло и не оказаться).

Задачи и упражнения

21. Опишите множество, являющееся пересечением множества четных чисел и множества чисел, делящихся на 5.

22. Опишите множество четырехугольников, являющихся одновременно прямоугольниками и ромбами.

23. В Монреале 80% жителей знают французский язык и 70% — английский. Сколько процентов жителей знают оба языка, если каждый житель знает хотя бы один из этих языков?

24. Дан куб. Проведите плоскость так, чтобы ее пересечение с кубом было правильным шестиугольником.

25. Сколько корней имеет уравнение: 10sinx = .x?

12. Объединение множеств

Все элементы множества А и все элементы множества /?, взятые вместе, составляют объединение множеств А а В. Оно обозначается через A \JB. Диаграмма Эйлера-Венна, приведенная на рис. 55, показывает взаимоотношение между множествами А, В, их пересечением и объединением. Двойной штриховкой обозначено пересечение множеств А и В, а вся заштрихованная фигура (хотя бы одной штриховкой) — их объединение. Чтобы получить объединение A u В, можно взять все элементы множества А и добавить к ним те элементы множества В, которые в А не входят (или наоборот: взять все элементы множества В и добавить к ним те элементы множества А, которые в В не входят). Из сказанного ясно, что пересечение множеств А и В содержится в их объединении: А п В a A u В.

Для любого элемента множества A u В имеются три возможности:

1) либо взятый элемент принадлежит А, но не принадлежит В (элемент х на рис. 55);

2) либо же взятый элемент принадлежит В, но не принадлежит А (элемент у на рис. 55);

3) либо же, наконец, взятый элемент принадлежит каждому из множеств А и В, т. е. принадлежит их пересечению (элемент z на рис. 55).

Несомненно, представление об объединении двух непересекающихся множеств (скажем, соединение двух отдельных «кучек» предметов в одну общую «кучку») предшествовало возникновению понятия о сумме двух чисел. Если два конечные множества А и В не пересекаются (т. е. не имеют общих элементов), причем первое из них содержит а элементов, а второе содержит Ъ элементов, то множество

Рис. 55 Рис. 56

A \J В содержит а + Ь элементов (рис. 56). При этом «смешивание в одну кучку» не зависит от того, в каком порядке мы берем «кучки» А и В, т. е.

и, в соответствии с этим, сумма чисел не зависит от порядка слагаемых:

(1)

Разумеется, это не есть «доказательство» коммутативного свойства сложения, выражаемого равенством (1), а лишь пояснение. Подмеченное при смешивании «кучек», содержащих небольшое число реальных предметов, коммутативное свойство сложения («от перестановки слагаемых сумма не изменяется») было впоследствии сформулировано, как общее свойство сложения натуральных чисел. Формулировка этого свойства, выражаемая равенством (1), есть результат многовековой практики человечества и сложного процесса абстракции.

Таким образом, в теории натуральных чисел коммутативность сложения фактически применяется без доказательства, т. е. является аксиомой. Согласно довольно распространенному мнению, аксиомами называются истины, принимаемые в рассматриваемой теории без доказательства «ввиду их очевидности». Однако математики придерживаются несколько иного взгляда. Ведь то, что кажется «очевидным» одному человеку, может быть вовсе не «очевидным» другому. И даже для одного индивидуума ощущение «очевидности» может меняться в процессе его интеллектуального развития и приобретения знаний. Правильнее будет сказать, что аксиомы — это первоначальные (и именно поэтому не доказываемые) утверждения, лежащие в основе рассматриваемой теории и служащие для вывода (доказательства) дальнейших ее утверждений, называемых теоремами. Что же касается «очевидности» аксиом, их «простоты» и, может быть, «априорности», то эти вопросы в самой теории не рассматриваются; они связаны с историей развития науки (вскрывающей происхождение аксиом) и с пояснением наглядного смысла аксиом в процессе изучения или преподавания теории. Об аксиомах и о доказательствах теорем мы еще будем иметь случай поговорить в дальнейших беседах, а сейчас вернемся к операции объединения множеств.

Рассмотрим вопрос о мощности объединения множеств. Для удобства условимся обозначать мощность множества А символом \А\. Как мы отмечали выше, для конечных множеств А, В, не имеющих общих элементов, справедливо равенство

(2)

Посмотрим, как видоизменяется это соотношение в случае, когда пересечение А п В непусто, а также в случае, когда хотя бы одно из

множеств А, В бесконечно. Нетрудно доказать, что для конечных множеств при А Г\В^0 соотношение (2) заменяется следующим:

(3)

Иными словами, если множество А содержит а элементов, множество В содержит Ъ элементов, а их пересечение А п В содержит р элементов, то число элементов множества A\JB равно а + Ь-р. В самом деле, пересчитав все элементы множества А, а затем все элементы множества В, мы насчитаем а + Ь элементов, но при этом каждый из р элементов, входящих в пересечение А п В, засчитаем дважды, тогда как в множестве A u В каждый из них следует засчитывать лишь один раз. В качестве упражнения рекомендуем читателю написать формулу, аналогичную (3), для объединения A u В u С трех конечных множеств.

Обратимся теперь к случаю, когда хотя бы одно из множеств А, В бесконечно. В этом случае формула (2) существенно изменяется. Именно, если мощность множества Л не меньше мощности множества В, т. е. \А\ > \В\, причем множество А бесконечно, то независимо от того, имеют ли А и В общие элементы, справедливо равенство

(4)

В частности, по аналогии с равенством (2) можно написать следующие соотношения:

в которых через п обозначена любая конечная мощность (т. е. натуральное число). Например, второе из этих соотношений означает, что объединение двух счетных множеств также является счетным множеством. В самом деле, если

то, «перемешав» элементы этих множеств, мы запишем их объединение в виде

(не обращая внимания на то, что в правой части могут встречаться повторяющиеся элементы), откуда видно, что элементы множества

Рис.57 Рис.58 Рис.59 Рис.60

A и В можно перенумеровать натуральными числами, т. е. это множество счетно.

Рассмотрим теперь некоторые примеры применения понятия объединения множеств в школьной математике. Всякая ломаная есть объединение составляющих ее отрезков (называемых звеньями этой ломаной). Например, ломаная с последовательными вершинами А, В, С, D, Е (рис. 57) представляет собой объединение четырех отрезков

Развернутый угол (содержащий 180°, рис. 58) представляет собой полуплоскость. Угол, меньший развернутого, можно представить в виде пересечения двух полуплоскостей (рис. 59). Угол, больший развернутого, представить в таком виде не удается; однако он является объединением двух полуплоскостей (рис. 60). Всякий четырехугольник можно разбить диагональю на два треугольника, причем это верно не только для выпуклых четырехугольников (рис. 61), но и для невыпуклых (рис. 62). Иными словами, всякий четырехугольник представляет собой объединение двух треугольников, которые не перекрывают друг друга, т. е. не имеют общих внутренних точек. Вообще, любой я-угольник можно разбить диагоналями на п - 2 треугольника. Для этого в выпуклом многоугольнике достаточно провести все диагонали, выходящие из одной его вершины (рис. 63). Для невыпуклого многоугольника не всякая диагональ пригодна (рис. 64), однако и в этом случае можно подобрать такие диагонали, которые делят его на п-2 треугольника (рис. 65). Таким образом, всякий многоугольник представляется в виде объединения нескольких треугольников, не перекрывающих друг друга. Так как известны формулы, позволяющие вычислить площадь любого треугольника, то с помощью разбиения на треугольники можно найти площадь любого многоугольника.

Рис. 61 Рис. 62 Рис. 63

Рис. 64 Рис. 65

Можно привести и ряд других геометрических примеров. Приведенные примеры показывают, что само понимание фигуры как множества точек и использование только терминов «объединение», «пересечение» создает удобства в осмыслении традиционного школьного материала и в выражении мыслей.

Приведем теперь некоторые примеры из области алгебры.

В левой части уравнения

(5)

стоит произведение двух многочленов

Ясно, что каждый корень первого многочлена (т. е. такое число х^ при подстановке которого этот многочлен обращается в нуль) является также и корнем уравнения (5), поскольку при умножении нуля на любое число снова получается нуль. Точно так же любой корень многочлена g{x) является корнем уравнения (5). Если же число х не является корнем ни одного из многочленов f(x), g(x), то оно не является и корнем уравнения (5), поскольку произведение двух отличных от нуля чисел также отлично от нуля. Иначе говоря, множество всех корней уравнения (5) является объединением u Gq, где — множество корней многочлена f(x), a GQ — множество корней многочлена g(x). Вообще, если левая часть некоторого уравнения р(х) = О представляет собой произведение многочленов или иных функций, то для нахождения всех корней этого уравнения следует взять объединение нескольких множеств, каждое из которых представляет собой множество всех корней одного из сомножителей (о методах решения уравнения и о так называемых «посторонних» корнях мы еще поговорим в п. 18).

В качестве второго примера рассмотрим неравенство

(6)

График многочлена, записанного в левой части, показан на рис. 66. Из рассмотрения графика видно, что этот многочлен принимает неотрицательные значения при всех х < -3, а также при х > 2 (рис. 67). Иначе говоря, множество M всех решений неравенства (6) представляет собой объединение двух лучей (-<*>; -3] и [2; оо)5 т. е. это множество можно записать в виде

(7)

Заметим попутно, что символы -<*> и оо вовсе не означают какие-то «бесконечные» действительные числа, а лишь символически выражают изображенные на рис. 67 лучи. Например, второй из них условно записывается неравенствами 2<х<оо5 которые показывают, что можно брать лишь числа, не меньше 2, но как угодно большие, т. е. этот луч простирается вправо «до бесконечности».

Наконец, еще один алгебраический пример. Рассмотрим решение неравенства, в левой части которого стоит тот же многочлен (5):

(8)

Число X в том и только в том случае удовлетворяет этому неравенству, если либо оба многочлена f(x), g(x) принимают в точке х положительные значения, либо оба принимают отрицательные значения. Обозначим через F множество тех действительных чисел, для которых многочлен f(x) принимает положительное значение, G — где g(x) положительно и аналогично через F и G — множества тех чисел, в которых многочлены отрицательны. Тогда F+ П G+ есть множество всех точек х, в которых оба многочлена f(x), g(x) имеют положительные значения, a F П G — где оба принимают отрицательные значения. Следовательно, объединяя эти пересечения, мы и получаем множество всех решений неравенства (8): (F+ П G+) U (F_ П G J.

Эти алгебраические примеры (число которых можно было бы увеличить) показывают, что, как и в случае геометрии, речь идет об использовании терминов «множество», «пересечение», «объединение», и этим создаются удобства в осмыслении традиционного школьного материала и в выражении мыслей, т. е. обозначения, связанные с множествами, упрощают математический язык и облегчают изучение материа-

Рис. 66 Рис. 67

ла. По существу, символы g, g, с, П, U являются лишь стенографическими знаками (и к тому же общепринятыми в математике) для сокращения и упрощения записи.

Более того, использование указанных терминов и знаков роднит геометрию и алгебру, показывает единство математики, общность ее методов и терминологии.

Задачи и упражнения

26. Докажите, что для конечных множеств справедливо равенство \АивиЦ = \А\ + \В\ + \Ц-\АПВ\-\АПЦ-\ВПЦ + \АПВПЦ.

27. На плоскости даны три точки А, В и С, не лежащие на одной прямой. Эти точки являются серединами трех сторон некоторого выпуклого четырехугольника. Укажите множество точек, в которых может лежать середина четвертой стороны. Укажите множество точек, в которых могут лежать вершины этого четырехугольника.

28. Даны три точки А, В и С. Через точку С проводятся всевозможные прямые. Опишите множество проекций отрезка А В на эти прямые.

29. Среди математиков каждый седьмой — философ, а среди философов каждый десятый — математик. Кого больше — философов или математиков?

30. Докажите, что если А П В= С, то (А П В) U С= (A U В) П С.

13. Дополнение множеств

Прежде чем переходить к рассмотрению следующей операции, укажем один «парадокс» теории множеств; его обнаружил известный английский математик Бертран Рассел.

Как правило, множества не содержат себя в качестве элемента. Например, множество А всех целых чисел содержит в качестве элементов только целые числа; так как само А не есть целое число, а есть множество целых чисел, то А себя в качестве элемента не содержит. Условимся называть такие множества «ординарными». Но могут существовать и такие множества, которые содержат себя в качестве элемента. Рассмотрим, например, множество S, определенное следующим образом: «S содержит в качестве элементов все множества, которые можно определить посредством предложения, содержащего меньше двадцати слов». Так как само множество S определяется предложением, содержащим менее двадцати слов, то выходит, что оно является элементом множества S. Такие множества назовем «экстраординарными». Как бы то ни было, большинство множеств — ординарные; попробуем не иметь дела с дурно ведущими себя экстраординарными множествами и будем рассматривать только множество всех ординарных множеств. Обозначим его буквой С. Каждый элемент множества С представляет собой множество, притом ординарное множество. Но вот возникает вопрос: а само множество С — ординарное или экстраординарное? Несомненно, оно должно быть или тем, или другим. Если С— ординарное множество, то оно содержит себя в качестве элемента, так как С определено как множество всех ординарных множеств. Раз дело обстоит так, значит С — экстраординарное множество, так как экстраординарными согласно определению названы множества, содержащие себя в качестве элемен-

та. Получается противоречие. Значит, С должно быть экстраординарным множеством. Но тогда множество С содержит себя в качестве элемента; так как С есть экстраординарное множество, это противоречит определению С как множества всех ординарных множеств. Итак, мы видим, что уже одно только допущение существования множества С внутренне противоречиво.

Описанный выше парадокс Рассела — не единственный, обнаруженный в теории множеств. Эти парадоксы несколько обескуражили математиков, находившихся после успехов, достигнутых Г. Кантором, в состоянии некоторой эйфории. Как же избежать этих противоречий? Очевидно, нужно ограничиваться рассмотрением лишь таких множеств, которые определены четко и без противоречий (вспомните парикмахера в п. 7). Выход был найден в том, что в каждом случае, при каждом рассуждении рассматривается некоторое фиксированное корректно определенное множество U, называемое универсальным множеством, и изучению подлежат только элементы (и подмножества) этого универсального множества. Если рассуждение не выходит за эти пределы, оно не приводит к противоречию. В беседе 13 мы еще вернемся к вопросу о противоречивости и непротиворечивости, а пока ограничимся сказанным.

Возьмем, например, следующее рассуждение Кантора, которое произвело на математиков весьма сильное впечатление. Алгебраических чисел, т. е. чисел, являющихся корнями алгебраических уравнений с рациональными коэффициентами, имеется лишь счетное множество (см. задачу 15). В то же время множество всех действительных чисел несчетно. Значит, кроме алгебраических чисел существуют действительные числа, не являющиеся алгебраическими; их называют трансцендентными. Более того, трансцендентных чисел существенно больше, чем алгебраических: мощность множества всех трансцендентных чисел равна È. До того времени математики нашли лишь очень немного трансцендентных чисел, да и это было связано с существенными трудностями. Кантор же подарил математическому миру целый континуум трансцендентных чисел! Но корректно ли это канторовское рассуждение, нет ли в нем противоречия? Безусловно корректно, поскольку можно взять в качестве U множество всех действительных чисел, а все рассуждения Кантора о несчетности (и применение к трансцендентным числам) проводятся только внутри этого универсального множества, не выходя за его пределы.

Теперь можно перейти к рассмотрению следующей операции над множествами. Будем предполагать, что фиксировано некоторое универсальное множество U. В дальнейшей части этого пункта слово «множество» будет означать некоторое подмножество этого универсального множества U. Для любого множества А условимся через с А обозначать дополнение множества А, т. е. множество всех элементов X Е U, не принадлежащих множеству А (обозначение с А происходит от английского слова complement — дополнение).

Рис. 68 Рис. 69

В планиметрии (т. е. геометрии на плоскости) целесообразно взять всю плоскость U в качестве универсального множества, поскольку любая фигура, изучаемая в планиметрии, расположена в этой плоскости, т. е. является подмножеством универсального множества U. Например, если А — круг, то сА есть внешность этого круга (рис. 68), т. е. то, что остается, если «вырезать» круг А из плоскости U. При этом, если круг А рассматривается замкнутым, т. е. содержащим все точки ограничивающей его окружности, то его дополнение с А будет открытым множеством, т. е. ни одна точка этой окружности множеству сА не принадлежит. Далее, при решении уравнений (и при рассмотрении ряда других алгебраических вопросов) в качестве универсального множества целесообразно принять множество R всех действительных чисел. (Впрочем, в некоторых случаях, которые мы в этой беседе не рассматриваем, в качестве универсального множества удобно принять множество всех комплексных чисел.) Например, множество М, дающее решение неравенства (6) (см. (7)), имеет своим дополнением сМ множество всех решений противоположного неравенства X2 + X - 6 < 0. Это множество (рис. 69) представляет собой интервал (-3; 2); концевые точки х = -3 и х-2 ему не принадлежат (поскольку они принадлежат множеству М). Ограничимся этими примерами, достаточно ясно показывающими, что такое дополнительное множество.

Теперь мы рассмотрим еще одну операцию, выражающуюся через рассмотренные ранее. Пусть А и В — два множества. Их разность А\В состоит из всех тех элементов множества А, которые не принадлежат В (заштрихованное множество на рис. 70). Таким образом, разность А \В содержит все элементы х, для которых ig А, х <£ В, или, что то же самое, все элементы х, для которых х g А и, в то же время, ig сВ. Иначе говоря, разность А\В есть пересечение множеств А и сВ: А \ В = А Г\ сВ.

Рис. 70 Рис 71

Например, для любого множества А справедливо соотношение

А диаграмма Эйлера-Венна, приведенная на рис. 71, показывает, что справедливо соотношение

Для любых трех множеств А, В, С справедливы соотношения дистрибутивности :

и соотношения двойственности:

(10)

Диаграммы, приведенные на рис. 72 - 74, иллюстрируют первое из соотношений дистрибутивности, а рис. 75- 77 — первое соотношение двойственности. Не приводя аналогичные диаграммы для вторых соотношений (9) и (10) (читатель может изобразить их самостоятельно), мы дадим лишь жизненные примеры, иллюстрирующие их.

Во вторник в одном классе проходило занятие физического кружка. В нем принимали участие все мальчики этого класса, а также все интересующиеся физикой девочки. В среду в этом же классе проходило занятие химического кружка, где присутствовали все мальчики и интересующиеся химией девочки. Таким образом, обозначая через А множество всех мальчиков этого класса, через В — множество девочек, интересующихся физикой, а через С — множество девочек, интересующихся химией, мы заключаем, что во вторник присутствовало множество учащихся A U В, а в среду A\JC.

Рис. 72 Рис. 73 Рис. 74

Рис. 75 Рис. 76 Рис. 77

Кто же из учеников присутствовал на заседаниях обоих кружков? Ясно, что это были все мальчики, а также все девочки, одновременно интересующиеся и физикой, и химией: A U (В П С). С другой стороны, так как во вторник присутствовало множество учащихся A U В, а в среду A U С, то на заседания обоих кружков присутствовало множество учащихся (A U В) П (A U С). Таким образом, одно и то же множество учащихся может быть записано двумя способами — в полном соответствии со вторым соотношением дистрибутивности.

Второй пример также возьмем из области кружковой работы. В одном классе работали фотокружок и кружок рисования. Обозначим через А множество участников первого кружка, а через В — второго. Были учащиеся, которые принимали участие в работе обоих кружков, а были и такие, которые не посещали ни один кружок. Охарактеризуем множество учащихся, не работавших ни в одном из этих кружков. Для этого в качестве универсального множества U возьмем множество всех учеников класса. Тогда A U В есть множество учеников, работавших хотя бы в одном кружке, а его дополнение с(А \J В) как раз и есть множество учащихся, не посещавших ни один из кружков. С другой стороны, сА есть множество учащихся, не посещавших первый кружок, а с В — не посещавших второй. Значит, их пересечение (сА) П (сВ) представляет собой множество учащихся, не посещавших ни один из кружков. Это дает два способа записи одного и того же множества — в соответствии со вторым соотношением (10).

Заметим в заключение, что соотношения дистрибутивности и двойственности справедливы и для большего числа множеств. Например, первое соотношение (9) обобщается следующим образом:

Читателю предлагается самостоятельно найти «кружковую» иллюстрацию этого соотношения и других обобщений равенств (9) и (10).

Задачи и упражнения

31. В классе 40% мальчиков. Математический кружок посещают 40% учеников, при этом 40% участников математического кружка составляют девочки. Какая часть мальчиков посещает математический кружок?

32. Докажите, что (сА) П (сВ) П (cQ = c(A\jB\jQ.

33. Учитель задал на уроке замысловатую задачу. В результате количество мальчиков, решивших эту задачу, оказалось равным количеству девочек, ее не решивших. Кого в классе больше — решивших задачу или девочек?

34. На шахматном турнире каждый участник выиграл белыми фигурами столько же партий, сколько все остальные — черными. Докажите, что все участники выиграли одинаковое количество партий.

35. Из 100 студентов колледжа 28 изучают английский язык, 42 -французский, 30 — немецкий, 8 — английский и немецкий, 10 — английский и французский, 5 — немецкий и французский, 3 — все три языка. Сколько студентов не изучает ни одного языка? Сколько студентов изучает только французский язык?

14. Произведение множеств

На билете для посещения кинотеатра написано: «ряд 4, место 5». Пара чисел 4 и 5 определяет положение места в зрительном зале. Можно было просто написать (4; 5), имея в виду, что первое число — номер ряда, а второе — номер места в этом ряду (рис. 78). Числа 4 и 5 — координаты места в зрительном зале. И если А — множество номеров всех рядов в зрительном зале, скажем, А = {\, 2, .... 20}, а В — множество чисел, которыми нумеруются места в каждом ряду (скажем, В - {1, 2, 25} — мы считаем, что все ряды одинаковые), то каждое место зрительного зала определяется парой чисел (х;у), где хеА, у g В. Иными словами, множество мест в зрительном зале находится во взаимно однозначном соответствии с множеством всех пар {х\у), где х g А, у g В.

Аналогично этому, если в плоскости выбрана координатная система, то положение каждой точки на плоскости определяется парой чисел (х;у), где х — абсцисса рассматриваемой точки, а у — ее ордината (рис. 79). Иными словами, множество всех точек плоскости находится во взаимно однозначном соответствии с множеством всех пар (х;у), где х g R, у е R (т. е. х и у — действительные числа). Существенно, что (как и в первом примере) пары {х\у) — упорядоченные, т. е. четко различается, какое число в паре является первым, а какое — вторым; пары (х;у) и (у;х) означают при хфу разные точки плоскости (рис. 80). Принято говорить «точка (х\у)у>, т. е. отождествлять точку плоскости и пару чисел (х;у) — ее координат.

На собрание кооператива пришло некоторое количество его членов; А — множество пришедших мужчин, В — множество женщин. Решено было избрать председателя и секретаря собрания, причем председателем должен быть мужчина, а секретарем — женщина. Сколькими способами можно их избрать? Здесь речь идет о выборе пары {х\у), где х g А, у g В. Число способов выбора председателя равно \А\, т. е. равно численности (мощности) множества А, поскольку любой из пришедших мужчин может быть выбран председателем. И, независимо от этого (т. е. на каждый способ выбора председателя), имеется \В\ способов выбрать секретаря. Таким образом, при указанных условиях всего имеется \А[\В\ способов выбрать руководство собрания, т. е. пару (председатель; секретарь).

В этих случаях (и ряде других) рассматриваются два множества А, В и берется множество всех пар (х;у), где хе А, у е В. Это множество пар называется произведением взятых множеств А, В и обозначается через АхВ.

В кинотеатр пришло несколько учеников класса. Они купили оставшиеся разрозненные билеты и сели в разных местах зала. Отождествляя каждое место с соответствующей парой чисел {х\у), мы можем сказать, что множество мест, на которых сидели пришедшие в кино ученики, есть некоторое подмножество произведения АхВ, где

Рис. 78 Рис. 80

А — множество номеров рядов, а В — множество номеров мест (мы здесь снова рассматриваем лишь случай, когда в каждом ряду содержится одно и то же число мест). Если, например, это подмножество имеет вид {(5; 13), (6; 11), (12; 9)}, то это означает, что в кино пришли три ученика, первый сидел в 5-м ряду на 13-м месте, второй — в 6-м ряду на 11-м месте и третий — в 12-м ряду на 9-м месте (рис. 81).

Так как координатная плоскость есть произведение RxR, то график функции, например, многочлена у = х^ + 2х2 -5х-6, представляет собой некоторое подмножество этого произведения (рис. 82). Однако вовсе не любое подмножество G координатной плоскости RxR является графиком некоторой функции; необходимо (и достаточно), чтобы каждая прямая, параллельная оси ординат, пересекала G не более чем в одной точке (рис. 83). Подробнее мы поговорим об этом в беседе 4.

Рис. 81 Рис. 82 Рис. 83

Рис. 84 Рис. 85

Вернемся к примеру о собрании членов кооператива. Выяснилось, что некоторые из присутствующих состоят в родственных отношениях — являются мужем и женой; в связи с этим было решено, что председатель и секретарь не должны быть из одной семьи. В этих условиях пару (председатель; секретарь) следует выбирать не из всего произведения АхВ, а из некоторого его подмножества, поскольку некоторые пары являются запрещенными (рис. 84, на котором кольца изображают семейные пары).

Допустим, что планируется шахматный турнир, А — множество всех его участников (будем считать, что в А четное число элементов, так что в каждом туре заняты все участники). При составлении расписания на один из туров следует в произведении АхА исключить диагональные клетки, поскольку никакой участник не может играть «с самим собой», и отметить в таблице \А\ клеток, попарно симметричных относительно диагонали (если третий играет с первым, то это означает также, что первый играет с третьим), причем так, что каждая строка (и каждый столбец) таблицы имеет ровно одну отмеченную клетку (рис. 85). Любое такое подмножество произведения АхА может служить графиком расписания для одного из дней турнира.

Наконец, рассмотрим еще вопрос о связи произведения множеств с произведением чисел. На рис. 86 изображена ситуация, в которой рассматривается набор из пяти предметов, взятый (повторенный) три раза. Объединяя все эти предметы, мы получаем случай, когда складываются три одинаковых слагаемых: 5 + 5 + 5. Или, как еще гово-

Рис. 86 Рис. 87

Рис. 88 Рис. 89

рят, «надо пять взять три раза». Такое многократное сложение одинаковых слагаемых называется умножением (натуральных чисел). В данном случае речь идет о действии 5-3.

Таким же способом вычисляется площадь прямоугольника (с целыми длинами сторон, рис. 87), в связи с чем и возникает формула S = ab, выражающая площадь прямоугольника через длины его сторон (о единицах длины и площади, используемых при таком вычислении, нам еще предстоит поговорить впоследствии).

Связь с произведением множеств здесь непосредственно прослеживается. В самом деле, перенумеруем предметы в наборе (в случае, изображенном на рис. 86, нумерация осуществляется числами из множества А = {1, 2, 3, 4, 5}) и сами наборы (нумерация осуществляется числами из множества В = {1, 2, 3}). Тогда каждый предмет на рис. 86 обозначается парой чисел (х;у), где х g А, у g В. Например, первый предмет из первого набора — пара (1; 1); третий предмет из второго набора — пара (3; 2) и т. д. (рис. 88). А всего предметов взято столько, сколько есть элементов (х;у) в произведении АхВ.

В общем случае (для конечных множеств) произведение АхВ имеет \A\-\B\ элементов, т. е. произведению множеств соответствует произведение чисел.

Эта связь между произведением множеств и произведением чисел дает хорошую наглядную иллюстрацию свойства коммутативности умножения натуральных чисел: достаточно повернуть рисунок на 90°, и мы получаем модель произведения 3-5, хотя число предметов, очевидно, не изменилось (рис. 89). Таким образом, 5-3 = 3-5, и вообще, тп = пт для любых натуральных чисел т, п. Как и в случае сложения, это не есть «доказательство» свойства коммутативности, а лишь его наглядное пояснение.

В теории натуральных чисел коммутативность умножения является аксиомой, а соображения, подобные тем, которые связаны с рассмотренными рисунками, поясняют происхождение этой аксиомы.

Задачи и упражнения

36. Опишите геометрический образ произведения отрезка на окружность.

37. Каков будет геометрический образ произведения двух окружностей?

38. Огромный военный оркестр демонстрировал свое искусство на площади. Сначала музыканты построились в виде квадрата, а затем перестроились в прямоугольник, причем число шеренг увеличилось на 5. Сколько музыкантов в оркестре?

39. Сколько ладей можно поставить на шахматной доске так, чтобы они не били друг друга? Сколько способов такой расстановки?

40. Опишите множество точек координатной плоскости, координаты которых удовлетворяют соотношению |*| + [у| = 1.

Беседа 4. Отображения

15. Общее понятие отображения и школьная математика

Мы говорим, что задано отображение f множества А в множество /?, если указано правило, сопоставляющее каждому элементу х g А один вполне определенный элемент множества В, называемый образом элемента х и обозначаемый через f{x). Задание отображения / множества А в множество В обозначается записью /: А —> В или А —> В (а иногда просто А —> В, если из текста понятно, о каком отображении идет речь). Для отображения /: А —> В множество А называется его областью определения. На рис. 90 схематически показано некоторое отображение множества А в множество В: от каждого элемента из А проведена стрелка к его образу.

Заметим, что один и тот же элемент множества В может оказаться образом нескольких элементов из А. Так, на рис. 90 элемент ре В является образом каждого из элементов Ъ, с, т. e.f(b)=p и f(c)=p. Может оказаться, далее, что некоторый элемент множества В не является образом никакого элемента из А. Например, на рис. 90 нет в А элемента, образ которого совпадал бы с q. Но для любого отображения А —> В непременно должно быть выполнено условие: каждому X g А сопоставлен только один элемент множества В в качестве его образа. Соответствие, показанное на рис. 91, отображением не является, поскольку элементу с g А не поставлен в соответствие никакой элемент множества В (т. е. от с не идет стрелка к какому-либо элементу множества В). Соответствие на рис. 92 также

Рис. 90 Рис. 91 Рис. 92

Рис. 93 Рис. 94

отображением не является, так как от элемента a е А ведут две стрелки к элементам множества В, а не одна.

Отображения, рассматриваемые в алгебре и математическом анализе, называют функциями. Чаще всего функции задаются формулами. Например, запись

(1)

означает, что каждому действительному числу х сопоставляется в качестве его образа (или, как говорят, значения этой функции в точке х) число, определенное правой частью равенства (1). Например, /(2) = 3,/(0) = 5,/(-2) = 15. Поскольку в качестве х может быть взято любое действительное число, областью определения этой функции является все множество R действительных чисел. И образ f(x) (т. е. значение этой функции в точке х) также является действительным числом, т. е. формула (1) задает функцию (отображение) /: R —> R. Функция g(x) = лЬс - 5 имеет своей областью определения луч [5;оо)5 т. е. множество всех действительных чисел, удовлетворяющих неравенству X > 5 (поскольку при X < 5 выражение под корнем становится отрицательным), т. е. эта запись определяет функцию (отображение)

А запись

(2)

определяет функцию (отображение) k. А —> R, где множество А, являющееся областью определения этой функции, имеет вид А = (0; 5) U (5; °о)5 т. е. представляет собой объединение интервала (0; 5), определяемого неравенствами 0 < х < 5, и луча (5; оо)5 состоящего из всех точек, удовлетворяющих неравенству х>5. Отметим, что от отрезка [а\ Ь], состоящего из всех чисел, удовлетворяющих неравенствам а<х<Ь (рис. 93), интервал {а\Ь) отличается тем, что он не содержит концевые точки х = а и х = Ъ, т. е. определяется неравенствами а<х<Ь (рис. 94).

Вообще, когда говорят, что рассматривается некоторая числовая функция f(x), то имеют в виду задание некоторого отображения /: А —> R, где А с R. Числовые функции могут задаваться не только формулами, но и описательно. Такова, например, функция Дирихле, определяемая следующим образом:

Например, /(1) = 1,

Несмотря на то, что эта функция не записана формулой, она принимает вполне определенное значение (0 или 1) для любого х g R.

В качестве еще одного примера рассмотрим так называемую характеристическую функцию множества. Пусть А — некоторое подмножество числовой прямой R. Зададим числовую функцию ф(х), определенную на всей числовой прямой R, следующим образом:

Это и есть характеристическая функция множества А. Если, например, А есть множество всех рациональных чисел, то характеристическая функция этого множества совпадает с рассмотренной выше функцией Дирихле.

Отображения рассматриваются и в геометрии. Все геометрические преобразования, играющие важную роль в этой области математики, являются отображениями. Например, центральная симметрия с центром О есть отображение, которое каждой точке А, отличной от О, ставит в соответствие такую точку В, что отрезок АВ имеет О своей серединой. Точке же О ставится в соответствие сама точка О, т. е. как говорят, точка О является неподвижной точкой этого отображения. На рис. 95 образом точки А при центральной симметрии относительно точки О является точка В, образом точки В является А, образом точки С является D, образом точки D является С, образом точки О является О. Обозначая эту симметрию буквой s, мы можем написать: s(A) = B, s(B) = A, s(C) = D, s(D) = C, s(0) = 0.

Поворот r плоскости P на угол — вокруг центра О также представляет собой некоторое отображение г. Р —> Р этой плоскости на ту же самую плоскость. Точку А, отличную от О, это отображение переводит в такую точку В = г(А), что А и В лежат на одной окружности с центром О и величина угла АОВ, отсчитываемая в положительном направлении (т. е. против хода часовой стрелки), равна ^

(рис. 96). Точка О переводится рассматриваемым поворотом в ту же точку О, т. е. О является неподвижной точкой этого отображения. Вообще, любое геометрическое преобразование/плоскости Р (осевая симметрия, параллельный перенос, гомотетия и многие другие) представляет собой некоторое отображение f: Р—> Р . Иначе говоря, каждое геометрическое преобразование / плоскости Р есть как бы «геометрическая функция», которая, однако, в отличие от числовой

Рис. 95 Рис. 96

функции, имеет своей областью определения не некоторое множество чисел, а множество Р, состоящее из точек, и образами также являются не числа, а точки, т. е. для любой точки A е Р ее образ В = f(A) также есть некоторая точка плоскости Р.

Таким образом, рассмотрение не только множеств, но и отображений сближает алгебру и геометрию, т. е. составляет некоторый общий взгляд на эти разделы школьной математики.

Попытки модернизировать школьный курс математики, весьма сильно отстававший от современной науки, были сделаны во многих странах мира в середине XX столетия. Чтобы рассказать об этом, мы начнем издалека.

Три русских писателя, братья Жемчужниковы и Алексей Константинович Толстой, выпустили интересную и весьма известную книгу, назвав ее сочинениями Козьмы Пруткова. Этим псевдонимом они охарактеризовали напыщенного и самонадеянного вымышленного автора, который назидательно высказывал вроде бы банальные, но, если вдуматься, очень глубокие истины. А в середине XX столетия группа французских математиков (Картан, Дьедонне и ряд других ученых) создала «математического Козьму Пруткова», издав серию книг под псевдонимом Никола Бурбаки. Художники создали и портрет этого вымышленного самодовольного автора, генерала в отставке, который решил остаток жизни посвятить написанию трактатов о математических науках. Книги Бурбаки по разным разделам математики являются ультрасовременными и содержат много интересных идей, объединяющих общим взглядом различные ветви математики, главным образом на базе теории множеств и топологии. Эти десятки трактатов Бурбаки внесли существенный вклад в формирование математических взглядов современных ученых, особенно молодых. Любопытен эпизод, связанный с международным математическим конгрессом, проходившим в 1966 году в Москве. При подготовке этого конгресса оргкомитет разослал во все страны мира извещение о предстоящем математическом форуме. Каждый математик, имевший научные публикации, получил приглашение принять участие в работе конгресса, для чего он должен был написать о своем согласии и выслать оргвзнос в размере 40 американских долларов. Получил такое приглашение и Никола Бурбаки, автор десятков широко известных книг. Эта шутка московского оргкомитета была подхвачена

французскими математиками, которые не пожалели 40 долларов и сообщили, что известный французский математик выражает свое согласие участвовать в работе конгресса. И перед началом одного из пленарных заседаний конгресса в фойе было вывешено кричащее объявление, извещавшее о том, что в этот день, после заседаний, в пресс-центре конгресса состоится встреча с известным французским математиком Никола Бурбаки...

Модные теоретико-множественные концепции Бурбаки сопровождались и некоторой ревизией математических обозначений. Так, числовой интервал, издавна записываемый в виде (а; Ь), Бурбаки предложил обозначать символом ]а\ Ь[, в котором «вывернутые» квадратные скобки должны были символизировать то, что, в отличие от отрезка [а; Ь] интервал ]а; Ь[ не содержит своих концевых точек, т. е. описывается неравенствами а<х<Ь.

Всеобщее увлечение идеями Бурбаки совпало по времени с процессом модернизации школьного образования (а может быть, не только «совпало» по времени, но и было органически связано с этим процессом). Новые учебники, изданные в ряде стран мира, уделяли существенное внимание рассмотрению множеств и отображений. В алгебре это выражалось, в частности, в том, что рассматривалось множество всех решений уравнения или неравенства, и оно записывалось с помощью знаков g , е, U, П. Мы это видели на примере неравенства (6) и его решения (7) в пункте 12.

Разумеется, дело не в обозначениях, а в самих идеях множества и отображения, в удобстве математического языка, использующего эти понятия и объединяющего алгебру с геометрией. В геометрии идеи этого круга были связаны с прогрессивной тенденцией, восходящей к замечательному немецкому математику и педагогу Феликсу Клейну, который говорил о широком использовании геометрических преобразований взамен устаревших евклидовых приемов геометрических доказательств (об этом еще будет идти более подробный разговор в последующих беседах).

В России попытка модернизировать школьный курс математики и связанная с нею реформа школьного обучения были особенно драматичны. Инициатором и активным руководителем реформы школьного математического образования стал выдающийся математик XX столетия академик Андрей Николаевич Колмогоров. Правда, созданный по новой программе курс геометрии оказался трудным. Но в идейном плане это был совершенно новый курс, содержавший современные идеи и способствовавший более глубокому осмыслению математики, чем прежние учебники. И хотя новые учебники были трудными для школьного учителя, но в течение 2-3 лет работы по этим учебникам школьные преподаватели их освоили, «пропустили через свое сердце» и стали на три головы выше в своем идейном понимании математики.

И тут грянул гром среди ясного неба. Начался «крестовый поход» против колмогоровских идей и против употребления в школе множеств и других новых для школы понятий, возглавленный академиком Л. С. Понтрягиным. Личность Л. С. Понтрягина весьма противоречива в истории науки. Талантливый математик, получивший ряд первоклассных результатов в топологии

и других областях математики, он в последние годы жизни придерживался весьма реакционных взглядов в области организации науки и школьного образования.

Понтрягин написал статью, в которой попытался философскими, социологическими фразами и малоубедительными соображениями о школьном преподавании ниспровергнуть колмогоровскую концепцию математического образования, остановить наметившиеся прогрессивные тенденции в школьном преподавании (и, в частности, введение понятий множества и отображения). Эта статья была поддержана идеологическим отделом большевистской партии. К началу понтрягинской статьи, ниспровергавшей идеи Колмогорова, были присоединены философские фразы, и она была опубликована в журнале «Коммунист».

Вскоре после этого в школах был введен учебник геометрии, написанный академиком А. В. Погореловым. Это был лишь несколько обновленный вариант учебника геометрии, написанного еще в первой половине века талантливым преподавателем А. П. Киселевым. Великолепный в плане обучения, учебник А. П. Киселева стал уже несовременным по содержанию. И тогда А. В. Погорелов несколько «подштопал» обветшавший, но хорошо написанный киселёвский учебник, добавив свою систему аксиом (как оказалось, математически противоречивую). Никаких новых задач, никакой замены архаичных евклидовых методов геометрических доказательств в этом учебнике не было. Но под нажимом партийных органов учебник Погорелова был введен в школьное преподавание. Начатая А. Н. Колмогоровым тенденция обновления учебников в духе Клейна и Бурбаки была прервана. Однако его прогрессивная деятельность все же привела к некоторому улучшению последующих учебников; в частности, были введены векторы и геометрические преобразования. К этому мы еще вернемся в беседе 15.

Задачи и упражнения

41. Являются ли отображениями следующие соответствия для множества живущих людей?

а) Каждому человеку ставится в соответствие его дочь.

б) Каждому человеку ставится в соответствие его мать.

в) Каждому человеку ставится в соответствие его год рождения.

42. Пусть f и g — характеристические функции множеств а и В, расположенных во множестве ls. Докажите, что характеристической функцией множества а Г\ В является функция h = fg. Запишите характеристическую функцию множества a U В через функции / и g.

43. Через Q(x) обозначают характеристическую функцию луча [0; °°), она называется функцией Хэвисайда. Докажите тождество: \х\ = х(20(х)- 1).

44. Участникам математической олимпиады было предложено пять задач. Является ли функцией соответствие, сопоставляющее каждому участнику:

а) номера решенных им задач;

б) сумму номеров решенных им задач?

45. Найдите область определения функции

16. Некоторые виды отображений

Пусть/: А —> В — некоторое отображение. Возьмем произвольный элемент b е В и рассмотрим в А подмножество, состоящее из всех тех

Рис. 97 Рис. 98 Рис. 99

элементов, образ которых совпадает с Ь. Это подмножество называется прообразом элемента Ъ и обозначается через f~\b).

Так, для отображения, показанного на рис. 90, прообраз элемента р g В состоит из двух элементов: /~ V) = {Ь, с}', прообраз каждого из элементов r, s состоит лишь из одного элемента: f~\r) = a, f~\s) = d\ что же касается q g В, то его прообраз пуст — совсем не содержит элементов: f~\q) = 0.

В качестве второго примера рассмотрим в плоскости круг А и прямую В, а через g: А —> В обозначим ортогональное проектирование круга на эту прямую (рис. 97). В этом случае прообраз каждой из точек Р, Q содержит лишь один элемент: g~\P) = M, g_1(0 = N; далее для любой другой точки R отрезка PQ ее прообраз g~\R) есть отрезок; если же Se B\PQ, то прообраз g~\S) есть пустое множество (через PQ мы здесь обозначаем отрезок с концами Р, Q).

Отображения различаются по своим свойствам, прежде всего, тем, каковы прообразы различных точек. Если прообраз каждого элемента содержит не более одного элемента (т. е. либо содержит один элемент, либо пуст), то f.A—>B называется вложением (или, в соответствии с французской терминологией, инъективным отображением, рис. 98). Таким образом, если/: А —> В — вложение, то, отождествляя каждый элемент a g А с его образом f(a) g В, мы как бы «вкладываем» множество А в В в качестве его подмножества (рис. 99), откуда и происходит термин «вложение». Вообще говоря, если f.A—>B — вложение, то во множестве В могут быть «лишние» элементы, не являющиеся образами каких-либо элементов из А. Иными словами, вложение f.A—>B устанавливает взаимно однозначное соответствие между множеством А и некоторым подмножеством f(A) множества В.

Далее, если для любого be В прообраз f~\b) непуст, то f:A—>B называется наложением (или сюръективным отображением, в соответствии с французской терминологией), или еще отображением на множество В (рис. 100). Иначе говоря, отображение /: А —> В представляет собой наложение, если в В нет «лишних» элементов, т. е.

Рис. 100 Рис. 101 Рис. 102

каждый элемент множества В является образом хотя бы одного элемента из А.

Вообще, пусть /: А —> В — произвольное отображение; через f(A) обозначим образ множества А, т. е. множество всех элементов из В, являющихся образами элементов из А. Если f(A) совпадает с множеством В, то / является наложением', если же в В есть «лишние» элементы, т. е. f(A) — собственное подмножество множества В, то / наложением не является (рис. 101).

Наконец, отображение, одновременно являющееся вложением и наложением, называется взаимно однозначным (или биективным). Такое отображение f:A—>B устанавливает взаимно однозначное соответствие между множествами А а В (рис. 102). Ясно, что взаимно однозначное отображение множества А на множество В существует только в том случае, если эти множества имеют одинаковую мощность. Можно сказать и иначе: отображение /: А —> В в том и только в том случае взаимно однозначно, если уравнение f(x) = b имеет для любого be В единственное решение х е А.

Рассмотрим теперь понятие графика отображения. Пусть /: А —> В — некоторое отображение множества А в множество В. Для каждого элемента хе А рассмотрим пару (x;f(x)). Так как f{x) е В, то эта пара является элементом произведения АхВ (рис. 103). Множество всех таких пар и есть график рассматриваемого отображения /. Таким образом, если А представлять себе строкой в нижней части чертежа, а В — столбцом слева (как на рис. 103, 104), то в прямо-

Рис. 103 Рис. 104 Рис. 105

Рис. 106 Рис. 107 Рис. 108

угольной таблице, изображающей произведение АхВ, в столбце над элементом хе А должен быть отмечен лишь один элемент (х;у), а именно тот, в котором у есть образ элемента х. Все отмеченные таким образом элементы произведения АхВ и составляют, вместе взятые, график отображения /. Рис. 104 изображает график отображения, указанного на рис. 90.

На рис. 104 имеются два элемента Ъ, с, образы которых совпадают: f(b) =f(c) -р, т. е. в произведении АхВ имеется строка, содержащая более чем один элемент графика. Это означает, что отображение / не является вложением. На рис. 104 имеется в произведении АхВ строка, совсем не содержащая элементов графика. Это означает, что отображение /: А —> В не является наложением. Лишь в том случае, когда каждая строка произведения АхВ содержит роено один элемент графика, отображение /: А —> В взаимно однозначно (рис. 105).

В случае числовой функции /: А —> R (где A a R) ее график, согласно сказанному выше, есть множество всех таких пар (х;у), что х принадлежит области определения функции / (т. е. множеству А), а у = f(x) есть образ точки х, т. е. значение функции / в точке х. Это — обычное определение графика функции.

На рис. 106 имеются две точки xv х2, для которых их образы

(т. е. значения функции /) совпадают: f(x^) =f(x2). Иными словами, соответствующая «строка», т. е. прямая, параллельная оси абсцисс и проходящая через точку (x^',f(x^j), содержит две (или более) точки графика. Это означает, что отображение/не является вложением, т. е. по данному у соответствующее значение х не восстанавливается однозначно. А на рис. 107 имеется «строка», совсем не содержащая элементов графика, т. е. функция / отображает множество А не на всю числовую прямую R.

Впрочем, если числовую функцию f(x) рассматривать как отображение /: А —>В, где А — область ее определения, а В-f(A) — не вся числовая прямая, а образ множества А (т. е. множество всех значений функции /), то функция / автоматически становится наложением. Таким образом, числовую функцию можно в этом смысле всегда

считать наложением, т. е. сопоставляющей каждому х g А некоторую точку множества значений В. Взаимная однозначность будет в том и только в том случае, если для каждого у^ g В соответствующая прямая, состоящая из всех точек (х\у^), х g R, пересекает график в единственной точке (рис. 108).

Задачи и упражнения

46. Будут ли наложениями или вложениями отображения, определенные в упражнениях 41 в и 446?

47. Является ли наложением или вложением отображение, определенное в упражнении 45, если его рассматривать как отображение множества [-5; -4] U [4; 5] в множество действительных чисел?

48. Какое из следующих отображений множества действительных чисел в себя является наложением или вложением: а) у = х2\ б) у = х3\ в) у = 2Хс?

49. Для функции f(x), определенной в упражнении 45, найдите прообраз отрезка [1; 2].

50. Постройте график функции f(x) = [х], где [л:] — наибольшее целое число, не превосходящее числа х (эта функция называется целой частью числа х).

17. Обратное отображение

В случае, когда отображение f:A—>B взаимно однозначно, можно определить обратное отображение/_1: В —> А. Ввиду важности этого понятия остановимся на нем подробнее.

Пусть f.A—>B — некоторое взаимно однозначное отображение.

Тогда для каждого элемента^ g В его прообраз/~\у) содержит ровно один элемент х множества А, т. е. имеется только один элемент хе А, для которого f(x)=y. На рис. 109 от элемента х к элементу у ведет стрелка. Поставив в соответствие элементу у этот элемент x=f~^(y), мы получаем некоторое отображение множества В на множество А. Схематическое его изображение мы получим, если на всех стрелках, ведущих от элементов множества А к элементам множества В, мы изменим направление на противоположное (рис. 110). Получаемое отображение В —> А обозначается через /_1 и называется отображением, обратным отображению /. Иначе говоря, обратное

Рис.109 Рис. 110 Рис. 111 Рис. 112

Рис. 113 Рис.114 Рис.115

отображение определяется следующим образом: если f(x)=y, то Г1(У) = х.

На рис. 111 схематически показано взаимно однозначное отображение f.A^B. Оно определяется соотношениями: f(a) = q, f(b) = n, f(c) = m9 f(d)=p. Обратное отображение /_1 имеет вид: /~\т) = с, f~\ri) = b,f~^(p) = d,f~\q) = a (рис. 112). Отображение / «переводит» элемент а е А в элемент q е В, а обратное отображение /_1 как бы «возвращает» его на прежнее место: f(a) = q,f~\q) = a.

Для числовых функций нахождение их обратных функций представляет собой важную и интересную задачу. Чаще всего она рассматривается для непрерывных монотонных функций. О непрерывности мы поговорим в другой раз. Здесь же ограничимся наглядным пояснением, что числовая функция непрерывна, если ее график представляет собой плавную линию без разрывов (рис. 113), т. е. как бы может быть вычерчен без отрыва карандаша от бумаги. Функция на рис. 114 непрерывной не является — вблизи точки х = а она имеет разрыв.

Монотонными же называют возрастающие функции (т. е. такие, что при х2>х^ справедливо неравенство f(x2) >f(x^)9 рис. 115) и убывающие функции (т. е. такие, что при х2>х^ справедливо противоположное неравенство f(x^>f(x2), рис. 116). У возрастающих функций график при движении вправо поднимается вверх, а у убывающих он при движении вправо опускается вниз. На рис. 117 изображен график функции, которая не является монотонной.

Итак, рассмотрим непрерывную и монотонную функцию, скажем, возрастающую. Пусть, например, эта функция определена на отрезке

Рис.116 Рис.117

Рис. 118 Рис.119 Рис.120

[т;п], а множеством ее значений является отрезок \p\q\ (рис. 118), т. е. рассматриваемая функция имеет вид /: А —> В, где А = [т\ п] и В = \Р\Я\- Наглядно понятно, что каждая прямая, параллельная оси абсцисс и проходящая через некоторую точку отрезка \р\ q] (расположенного на оси ординат), пересекает график функции только в одной точке, т. е. имеется единственная точка ûg [m; л], для которой f(a) = b. Иначе говоря, f~\b) = а есть вполне определенная точка отрезка А = [т\ п]. Этим в данном случае и определяется обратная функция В —> А.

Заметим теперь, что при построении графика функции мы обычно точку, принадлежащую области определения функции, берем на оси абсцисс, а значение функции в этой точке откладываем по оси ординат (см., например, рис. 118). Но при рассмотрении обратной функции f~^:B^A мы берем точку Ь, принадлежащую области определения обратной функции (т. е. отрезку В-\р\ q]), а она находится на оси ординат; соответствующее значение a=f~\b) обратной функции оказывается отложенным по оси абсцисс. Чтобы исправить это неудобство, мы применим к графику, изображенному на рис. 118, осевую симметрию, причем в качестве оси симметрии возьмем биссектрису первого и третьего координатных углов (рис. 119). Эта симметрия удобна тем, что при ее применении ось абсцисс и ось ординат меняются местами. В частности, образ отрезка B-\p\q\, расположенного на оси ординат, окажется расположенным на оси абсцисс.

Теперь рис. 118 примет вид, показанный на рис. 120, и станет более удобным: точка be \p\q] окажется расположенной на оси абсцисс, а соответствующее значение a=f~\b) обратной функции будет отложено по оси ординат. Иначе говоря, рис. 120 даст нам как раз график обратной функции Вспомнив, что рис. 120 получен из рис. 118 с помощью осевой симметрии, мы получаем следующее удобное и важное правило.

Пусть линия L представляет собой график непрерывной и монотонной функции /; тогда линия L', симметричная L относительно бис сект-

рисы первого и третьего координатных углов, является графиком обратной функции f~\

Более коротко: график непрерывной монотонной функции и график ее обратной функции симметричны друг другу относительно указанной биссектрисы (рис. 121). Это правило применимо не только к функциям, определенным на отрезке, но также и к случаям, когда областью определения функции является луч или вся прямая.

В качестве примера рассмотрим функцию

Рис. 121 Рис. 122 Рис. 123

(3)

Она определена на всей числовой прямой, непрерывна и является монотонной (возрастающей). График ее приведен на рис. 122. Областью ее определения (и множеством значений) является вся числовая прямая, т. е. эта функция имеет вид/: R —> R. Найдем ее обратную функцию.

Если задано произвольное число b g R, то а = f~\b) есть прообраз точки Ь, т. е. такое число a g R, что f(a) - Ъ. Иными словами, a=f~\b) есть такое число, для которого (согласно (3)) справедливо равенство 2а - 4 = Ь. Из этого равенства, рассматриваемого как уравнение относительно а, мы находим:

Таким образом,

Это верно для любого b g R, т. е. обратная функция имеет вид

Ее график симметричен графику функции

(3) относительно биссектрисы первого и третьего координатных углов (рис. 123).

В качестве второго примера рассмотрим функцию

(4)

Она определена лишь при х > О, т. е. на луче [0; оо)5 непрерывна и является монотонной (возрастающей). График ее показан на рис. 124. Значения рассматриваемой функции также принадлежат лучу [0; оо)5 т. е. она имеет вид /: [0; <*>) —> [0; оо). Найдем ее обратную функцию.

Рис. 124 Рис. 125 Рис. 126

Если задано произвольное число b е [0; °о)5 то а =/ \b), есть прообраз точки Ъ, т, е. такое число ае [0; °о)5 что f(a) = b. Иными словами, а есть такое число, что Ь = ^1а~ (см. (4)), и потому а-Ь1, т. е. / (b) = b . Это верно для любого b е [0; °о)5 т. е. обратная функция f~x определена лишь на луче [0; °о)5 а ее значения даются формулой f~\x) -X1. Заметим, что функция у -х1 определена для всех действительных X (рис. 125), а не только на луче [0; <*>). Рассматривая ее только на луче [0; оо)5 мы и получаем искомую обратную функцию f~\x). Ее график (рис. 126) симметричен графику функции (4) относительно биссектрисы первого и третьего координатных углов.

Ограничимся пока этими примерами. Важные примеры обратных функций мы будем иметь в последующих беседах при рассмотрении тригонометрических и показательных функций. Существенную роль играют обратные отображения и в геометрии, о чем также будет идти речь впоследствии.

Задачи и упражнения

51. Рассмотрим отображение множества действительных чисел в себя, определенное следующим образом: f(x) = ^ если хфО, и /(0) = 0.

Существует ли у этого отображения обратное?

52. Укажите отрезки действительной прямой, на которых функция f(x) = X3 - X2 имеет обратную.

53. Рассмотрим функцию f(x) = х + [х\ (функция [л:] определена в упражнении 50), отображающую множество действительных чисел в себя. Имеет ли эта функция обратную? Имеет ли она обратную на интервале (100; 101)?

54. Существует ли отрезок, на котором функция Дирихле имеет обратную?

55. Пусть функции f(x) и g(x) отображают множество действительных чисел на себя и имеют обратные. Верно ли, что и их сумма также имеет обратную?

18. Композиция отображений

Рассмотрим три множества А, В, С, и пусть даны некоторые отображения /: А —> В, g: В —> С. Их можно записать в виде «цепочки»:

(5)

Для каждого элемента ае А определен его образ b = f(a), содержащийся в множестве В. В свою очередь для этого элемента b е В определен его образ c = g(b), содержащийся в множестве С (рис. 127). Поставим в соответствие элементу а сразу этот элемент с, минуя промежуточное множество В (пунктирная линия на рис. 127). Мы получаем таким образом некоторое отображение множества А в множество С (рис. 128). Оно называется композицией отображений / и g и обозначается через g ° /.

Обратите внимание: первое применяемое отображение (т. е. /) пишется справа, а отображение g, применяемое вторым, — слева. Такая форма записи применяется по следующим соображениям. Элемент с, который в результате композиции ставится в соответствие элементу а, имеет вид c = g(b), где b=f(a) — образ элемента а при первом отображении. Таким образом, с = g{b) = g(f(a)). В этой записи g(f(a)) отображение g оказывается записанным слева, и именно в таком порядке записываются / и g при обозначении композиции: / справа, g слева. Итак, по определению

для любого ае А.

Например, если / — центральная симметрия плоскости ß относительно точки Р, a g — центральная симметрия относительно точки Q (рис. 129), то композиция g ° / отображений /iß^ß H^-:ß^ß представляет собой параллельный перенос на вектор, вдвое больший, чем вектор PQ. Иначе говоря, для любой точки А е ß ее образ С при отображении g °/определяется равенством АС =2 PQ (рис. 130).

Еще один пример получается, если взять в качестве / осевую симметрию относительно прямой k, а в качестве g — осевую симметрию относительно прямой /, причем к и / пересекаются в некоторой точке О. Из рассмотрения рис. 131, на котором отмечены равные углы, нетрудно заключить, что точка А переводится композицией g о/в такую точку С, что угол АОС вдвое больше угла а между прямыми к и /, причем точки А а С находятся на одинаковом рас-

Рис. 127 Рис. 128 Рис. 129

стоянии от точки О. Иначе говоря, композиция g °/ представляет собой поворот плоскости ß вокруг точки О на угол 2а (рис. 132).

Приведенные примеры показывают, что операция композиции отображений играет важную роль при рассмотрении геометрических преобразований, а мы еще будем в последующих беседах говорить, следуя Феликсу Клейну, о том, что геометрические преобразования — это подлинная основа всей элементарной (и не только элементарной) геометрии. Композиция отображений играет важную роль и в алгебре, где она связана с понятием сложной функции. Рассмотрим этот вопрос подробнее.

Пусть fx) и g(x) — две числовые функции. Вначале для простоты рассмотрим случай, когда областью определения каждой из функций /, g является вся числовая прямая, т. е. они представляют собой отображения /: R —> R, g: R —> R. Тогда можно рассматривать сложную функцию g(f(x)), т. е. композицию g °/ этих отображений. Иначе говоря, сложная функция получается, если в функцию g(y) подставить вместо у значение у = fx).

Рассмотрим, например, биквадратный многочлен

(6)

Здесь удобно рассмотреть вспомогательную функцию у =fx) = х. Тогда многочлен (6) принимает вид у2-1у+ 12, и это дает повод ввести в рассмотрение еще одну функцию g(x) = х2 - 1х + 12. Композиция g °/ этих функций, т. е. сложная функция

совпадает с многочленом (6). Таким образом, h=g °f

Подобно этому, функция h(x) = sin 5х есть композиция двух функций fx) = 5x и g(x) = s'mx. В самом деле, полагая y=fx) = 5x, мы находим: g(f(x)) = g(y) = sin у = sin 5х, т. е. h=g °f

Представление заданной функции в виде композиции более простых функций часто используется при решении уравнений. Чтобы рассмотреть этот вопрос, вначале проведем некоторое общее рассуждение. Рассмотрим снова «цепочку» отображений (5). Пусть с —

Рис. 130 Рис. 131 Рис. 132

Рис. 133 Рис. 134

некоторый элемент множества С, и пусть g~ (с) = {b^ ...} с: В — его прообраз, т. е. Ь2, ... — все те элементы множества В, которые переводятся отображением g в элемент с (рис. 133). В свою очередь мы можем рассматривать прообразы f~\b^), f~\b2), ... этих элементов при отображении /. Как показывает рис. 134, объединение всех этих прообразов как раз представляет собой прообраз элемента с при отображении g ° /, т. е.

(7)

Пусть теперь задано уравнение

(8)

где g: R —> R и /:/?—>/? — некоторые числовые функции. Это уравнение имеет вид h(x) = О, где h=g ° f — сложная функция, стоящая в левой части уравнения (8).

Решить уравнение h(x) = О — значит найти множество всех его корней, т. е. действительных чисел, для которых значение функции h равно нулю. Иначе говоря, решение этого уравнения есть прообраз точки 0, т. е. Ьг\0), или, что то же самое, (g о f) !(()). Согласно сказанному выше, надо сначала найти прообраз g-1(0), т. е. найти все корни ôp Ь2, ... уравнения g(x) = 0. После этого, согласно формуле (7), надо найти все прообразы f" (ôj), j (b^, их объединение как раз и будет множеством всех корней уравнения (8). Но прообраз f~\b^) есть множество всех чисел х g R, для которых f(x) = b^ т. е. множество всех корней уравнения f{x) = by То же справедливо для f~\b2) и т. д.

В результате мы получаем следующее правило: для решения уравнения (8) надо сначала найти все корни ftp b2, ... уравнения g(x) = 0, затем рассмотреть отдельно все уравнения

(9)

тогда объединение множеств корней всех получаемых уравнений (9) и представляет собой множество всех корней уравнения (8). Например, для решения биквадратного уравнения

(10)

т. е. уравнения (8), в которомf{x) = х ,g(x) = х -7х+ 12, надо сначала решить квадратное уравнение g(x) = 0, т. е. уравнение х2 - 1х + 12 = 0. Оно имеет два корня = 3, Ь^ = А. Затем, согласно сформулированному выше правилу, надо рассмотреть отдельно уравнения (9), т. е. в данном случае уравнения х = 3, х = 4. Множество корней первого из них есть {л/3~, -л/3"}, а множество корней второго есть {2,-2}. Следовательно, их объединение {-2, и есть множество всех корней биквадратного уравнения (10).

Смысл рассмотренного приема состоит в том, что мы заменяем левую часть уравнения композицией более простых функций, в результате чего исходное сложное уравнение сводится к решению нескольких более простых. В школьных задачниках можно найти много уравнений, допускающих применение этого приема.

Существенно заметить, что сложная функция g(f{x)) может рассматриваться и для таких функций /(х), g(x), области определения которых не совпадают со всей числовой прямой. Область определения функции g(f{x)) состоит в этом случае из всех тех х е для которых, во-первых, X принадлежит области определения функции /, и, во-вторых, соответствующее значение f(x) принадлежит области определения функции g. Сформулированное выше правило решения уравнения (8) остается справедливым и в этом случае.

Рассмотрим в качестве примера уравнение

(11)

Его левую часть можно представить в виде Vy~-1, где у = х2 - х - 5. Иначе говоря, взяв функции f(x) = х2 - х - 5, g(x) = ^lx~-l, мы как раз запишем уравнение (11) в форме (8). Здесь область определения функции g(x) не совпадает со всей числовой прямой, однако, как мы отмечали выше, это не препятствует применению описанного выше приема. Согласно описанию этого приема мы прежде всего должны рассмотреть уравнение g(x) = 0, т. е. в данном случае л/л7- 1 =0. Как легко видеть, это уравнение имеет единственный корень = 1. Следовательно, имеется только одно уравнение (9), а именно уравнение f{x) = bv т. е.

(12)

Решая его, находим два корня х^ = -2, х2 = 3. Таким образом, множество всех корней исходного уравнения имеет вид {-2; 3}.

Заметим, что для решения уравнения (11) могут быть применены и другие приемы. Один из них, часто применяемый при решении иррациональных уравнений (т. е. уравнений, содержащих знаки радикалов), состоит в том, что квадратный радикал надо «уединить», а затем возвести обе части уравнения в квадрат. Иначе говоря, надо переписать уравнение (11) в виде Vx2 - х - 5 = 1, а затем от него перейти «возведением в квадрат» к уравнению х2-х-5 = 1.

Как мы видим, получается то же уравнение (12), что и прежде, и это дает те же корни х^ =-2, х2 = 3. Однако возведение обеих частей уравнения в квадрат может привести к появлению так называемых посторонних корней, в связи с чем такой способ решения требует проверки каждого найденного корня (что, правда, в данном случае несложно). Прием же, рассмотренный ранее (связанный с рассмотрением сложной функции), никогда не приводит ни к потере корней, ни к появлению «посторонних» корней, и потому является более предпочтительным (в тех случаях, когда его удается применить).

Еще один прием решения уравнений заключается в использовании так называемой «области допустимых значений переменной» (сокращенно ОДЗ). Под этим понимается множество всех тех х g R, для которых все обозначенные действия выполнимы. В случае уравнения (11) это означает рассмотрение множества всех х g R, для которых выражение под знаком квадратного радикала неотрицательно:

Сразу же бросается в глаза, что это неравенство существенно сложнее уравнения (12) (например, квадратный трехчлен в левой части имеет корни ^-(1 ±л/2Т)); к тому же это неравенство вовсе не помогает решению уравнения (11).

Термин ОДЗ, употребляемый только в школе, применяется во многих пособиях для учащихся и даже в школьных учебниках, но его надо признать неудачным. Ниже, в беседах, посвященных математическим рассуждениям, мы остановимся на этом подробнее, здесь же отметим лишь терминологические соображения.

Выполнимость обозначенных действий для данного х е R означает, что X принадлежит области определения числовой функции (или пересечению областей определения — например, в случае уравнения типа f(x) = g(x)). Уже по этой причине использование (только в школе!) термина ОДЗ вместо общепринятого математического термина область определения означает ненужное противопоставление школьного математического преподавания традициям науки. Кроме того, при рассмотрении функции у = f(x) слово значение употребляется по отношению к у, т. е. это образ точки х при отображении /, это значение откладывается по оси ординат. Применение же термина «допустимое значение» для точки х, принадлежащей области определения (и

потому изображаемой на оси абсцисс), означает лишь создание в психологическом плане условий для путаницы понятий.

Ведь когда мы называем равенство (х + у)2 = х2 + 2ху + у2 тождеством, мы тем самым выражаем наше отношение к этому равенству, имея в виду, что оно справедливо для любых х, у, т. е. речь идет о некоторой теореме. Когда мы называем равенство f(x) = О «уравнением», это также определяет наше отношение к этому равенству, означает постановку вопроса о том, каково множество всех х е /?, удовлетворяющих этому равенству. И даже если бы термин ОДЗ выражал что-то математически новое, сам термин «область допустимых значений» этого вопроса не содержит и вряд ли уместен с языковой и психологической точек зрения. А иногда пишут еще «область допустимых значений уравнения» ...

В заключение скажем несколько слов о связи обратных отображений с понятием композиции отображений.

Пусть/: А —> В — некоторое взаимно однозначное отображение и В —> А — соответствующее обратное отображение. Тогда для любого a g А соотношения fa) = Ъ и f~\b) = а равносильны — при отображении / элемент а переводится в Ъ, стало быть, Ъ получается из а. Следовательно, композиция° f переводит элемент а снова в тот же элемент я, т. е. f~X{f(a)) =f~\b) = а. Иными словами,/-1 of есть тождественное отображение множества А, т. е. оно переводит каждый элемент a g А в себя. Это выражают записью/_1 °/= \л. Аналогично отображение/°/_1:представляет собой тождественное отображение множества В, т. е. /°/_1 = 1

Итак, для взаимно однозначного отображения /: А —> В и его обратного отображения f~^:B^A справедливы соотношения

Верно и обратное: если отображения /: А —> В и g: В —> А удовлетворяют соотношениям

(13)

то отображения /, g взаимно однозначны и являются взаимно обратными, т. е. g=f~X.

Заметим, что выполнение только одного из соотношений (13) не достаточно для того, чтобы /и g были взаимно обратными биективными отображениями. Так, отображения, показанные на рис. 135, 136, удовлетворяют первому из соотношений (13), однако взаимно однозначными не являются (первое из них — вложение, второе — наложение).

Рассмотрим в качестве примера функцию/: R —> R, заданную формулой fx) = 2x-4 (см. (3)), и обратную к ней функцию

Рис. 135 Рис. 136

Тогда

для любого X g R, и потому gof=\ß. Аналогично проверяется, что /° g= \R.

Для функции (4) и обратной к ней функции g=/_1 (рис. 126) находим для любого х g [0; <*>):

т. е. g(f(x)) = х для любого х g [0; °о)5 и потому g ° Точно так же для любого х g [0; <*>) получаем

(поскольку X > 0), т. е. f(g(x)) = х, и потому /о g = 1 [0; ^

Задачи и упражнения

56. Докажите, что композиция симметрий относительно двух заданных параллельных прямых есть параллельный перенос перпендикулярно этим прямым на расстояние, вдвое большее расстояния между этими прямыми.

57. Опишите преобразование плоскости, являющееся композицией поворота / на угол а вокруг точки О и поворота g на угол -а вокруг точки О'.

58. Заданы функции f(x) = Q(x) (см. упр. 43) и g(x) = x2-\. Постройте графики функций y=f(g(x)) и y = g(f(x)).

59. Найдите все корни уравнения х4 - 2х3 - 4х2 + 5х + 6 = 0.

60. Какое количество различных корней может иметь уравнение X2 + р\х\ + д = 0 в зависимости от значений р и q?

19. Классификация

Идея классификации хорошо известна; по своему существу она связана с множествами и отображениями. Волк, лошадь, горилла, дельфин принадлежат к классу млекопитающих; орел, голубь, гусь — классу птиц; крокодил, черепаха, ящерица — классу пресмыкающихся; щука, карась, осетр — классу рыб; амеба, инфузория «туфелька», вибрион холеры — классу простейших. Обозначим через А множество всех биологических видов животных, а через В = {млекопитающие, птицы, рыбы, пресмыкающиеся, простейшие} — множество всех клас-

сов. Тогда каждому элементу множества А, т. е. виду животных, естественно сопоставляется некоторый элемент множества В — тот класс, которому этот вид принадлежит. Получающееся отображение е\ А —> В является наложением (поскольку ни один класс не является пустым множеством); оно называется естественным отображением. Каждый элемент ае А является представителем того класса, которому он принадлежит. Например, щука — представитель класса рыб. Понятие класса возникает в результате абстракции отождествления. Все виды животных, вскармливающих своих детенышей молоком, объединены в одно подмножество множества А. Абстрагируясь от индивидуальных черт каждого вида (хищник это или травоядное, парнокопытное или нет, и т. п.), мы объединяем всех этих представителей животного мира по основному признаку, как бы отождествляем их в этом отношении, и это дает один из классов. Название «млекопитающие» отражает основной признак. (Правда, есть исключение: пингвин вскармливает своих детенышей молоком, однако он отнесен — по другим признакам — к классу птиц.) Два представителя, отнесенные к одному классу, называются (в смысле этой классификации) эквивалентными. Иначе говоря, эквивалентность означает принадлежность одному и тому же классу.

Вообще, идея классификации состоит в том, что, имея заданное множество А, мы объединяем его элементы в классы по определенному признаку эквивалентности, причем так, что получающиеся классы попарно не пересекаются и охватывают все элементы множества А. Иначе говоря, каждый элемент попадает в один и только один из классов, т. е. является представителем какого-то одного класса.

Какими же свойствами должен обладать признак эквивалентности (или, как говорят математики, отношение эквивалентности), чтобы с его помощью можно было осуществить классификацию, т. е. разбить множество А на классы, объединение которых дает все множество А и которые попарно не пересекаются? Иначе говоря, каким должно быть отношение эквивалентности, чтобы, объединяя вместе эквивалентные элементы, мы получили разбиение множества А на классы?

Условимся для краткости считать, что запись а ~ Ъ означает: «элемент а эквивалентен элементу Ь». Далее, если а — элемент множества А, то через [а] условимся обозначать класс элемента а, т. е. множество всех тех х g А, для которых х ~ а\

Чтобы выяснить, какими свойствами должно обладать отношение эквивалентности, рассмотрим некоторые примеры.

На рис. 137 изображены ученики а, Ь, с, d, e,f, выстроившиеся по росту. Рассмотрим отношение «не ниже» и будем его обозначать символом ~. Например, а ~ b, b~c, d~f, но отношение /~я не соблюдается (т. е. неверно, что «/ не ниже а»). Посмотрим, дает ли это отношение разбиение на классы. Класс элемента b содержит, кроме самого Ь, еще а и с, поскольку каждый из учеников а и с не

ниже b, т. е. а ~ Ъ, с ~ Таким образом, должно быть [Ь] = {а, Ь, с}. Аналогично [d\= {a,b,c,d,e}. Это означает, что классы [Ь] и [d\ различны, но имеют общие элементы. Однако это противоречит идее классификации, поскольку различные классы должны быть непересекающимися (т. е. два класса должны либо совпадать, либо не иметь общих элементов). Это произошло потому, что рассмотренное отношение «не ниже» не обладает свойством симметричности, т. е. из а ~ b не вытекает b ~ а (или иначе, а ~ b и b ~ а означают не одно и то же). Этот пример показывает, что для осуществления классификации отношение эквивалентности ~ должно быть симметричным:

(14)

Однако одного свойства симметричности не достаточно. Чтобы убедиться в этом, рассмотрим еще один пример.

Пусть А — некоторое множество людей, и для двух элементов а, b этого множества а ~ b означает «а и b знакомы» (под этим мы будем понимать, что каждый из них знает другого). На рис. 138 изображено некоторое множество А людей. Наличие отрезка, соединяющего двух из них, означает, что они знакомы; например, а ~ b, b ~ с, b ~ d.

Отношение знакомства ~ обладает свойством симметричности: «х знаком с г/» и «г/ знаком с х» означает одно и то же (т. е. означает: «х и у знакомы»). Из рассмотрения рис. 138 видно, что [а] = {a,b,f}, [b] = {a,b,c,d} (мы, естественно, считаем, что каждый человек «знаком с самим собой», т. е. а - а). Опять классификация не получается: классы [а] и [Ь] имеют общие элементы а, Ь, но не совпадают. Происходит это потому, что для данного отношения не выполнено свойство транзитивности:

(15)

В самом деле, на рис. 138 а и b знакомы, b и с тоже знакомы, но а и с не знакомы.

Итак, чтобы послужить основой для классификации, отношение эквивалентности должно быть симметричным и транзитивным.

Заметим еще, что при рассмотрении последнего примера мы нашли «естественным» выполнение свойства рефлексивности:

(16)

Рис. 137 Рис. 138 Рис. 139

(каждый человек знаком с самим собой). Однако, несмотря на его «естественность», свойство рефлексивности должно быть четко указано как одно из свойств отношения эквивалентности. Рассмотрим пример, показывающий важность этого свойства. Для этого возьмем множество А всех прямых, на плоскости и записью а ~ Ъ (для двух элементов из А) будем обозначать отношение «прямая а параллельна Ь». Это свойство симметрично (если одна прямая параллельна другой, то и вторая параллельна первой) и вроде бы транзитивно (две прямые, параллельные третьей, параллельны друг другу). Рефлексивно ли это отношение? Это зависит от определения параллельности прямых — если прямая «сама себе параллельна», то рефлексивность есть.

В старом учебнике геометрии А. П. Киселева параллельными назывались прямые, лежащие в одной плоскости и не имеющие общих точек. Поэтому только две различные прямые могли быть параллельными, т. е. две совпадающие прямые параллельными не считались. В результате отношение параллельности не было рефлексивным. То же было повторено в учебнике А. В. Погорелова (и в ряде других учебников). К чему это приводит? На рис. 139 изображена равнобедренная трапеция MNPQ и точка R на ее основании. Обозначим через а серединный перпендикуляр к отрезку MN, через b — серединный перпендикуляр к отрезку MR, а через с — серединный перпендикуляр к отрезку PQ. Тогда а \\ b и b || с, т. е., обозначая временно это отношение знаком ~, мы находим а ~ /?, b ~ с. Однако прямые а и с совпадают, т. е. не параллельны, согласно терминологии Киселева и Погорелова. Выходит, что утверждение «две прямые, параллельные третьей, параллельны» у них должно быть сформулировано в виде: «две прямые, параллельные третьей, либо параллельны, либо совпадают». Подобных сложностей, связанных с нерефлексивностью принятого определения отношения параллельности, в учебнике А. В. Погорелова немало. Без рефлексивности отношение параллельности не устанавливает классификации прямых: класс [а] прямой а состоит из всех прямых, параллельных а, но не содержит самой прямой а (по Киселеву и Погорелову), т. е. а <£ [а].

В учебнике по курсу А. Н. Колмогорова совпадающие прямые считаются параллельными, т. е. свойство рефлексивности соблюдается и получается полная классификация: каждый класс содержит все параллельные между собой прямые, без всяких исключений.

Итак, для того, чтобы быть основой для классификации, отношение эквивалентности должно быть рефлексивным, симметричным и транзитивным, т. е. для любых трех элементов а, Ь, с рассматриваемого множества (которое мы хотим разбить на классы с помощью этого отношения эквивалентности) должны выполняться свойства (16), (14), (15).

Замечательно, что и обратное утверждение справедливо, т. е. если отношение эквивалентности, введенное в множестве А, рефлексивно, симметрично и транзитивно, то оно осуществляет в А классификацию. Иначе говоря, рассматривая для каждого a g А его класс эквивалентности [а], мы получаем разбиение множества А на классы, каждые два из которых либо совпадают, либо не пересекаются (как и требует классификация).

Рис. 140 Рис. 141

Отношение параллельности (рефлексивное, как у Колмогорова) является примером такого отношения эквивалентности, т. е. оно разбивает все прямые на классы попарно параллельных прямых. Вот еще примеры.

Будем называть фигуры на плоскости эквивалентными, если они имеют одинаковую площадь. Легко видеть, что это отношение рефлексивно, симметрично и транзитивно (Евклид говорил: «порознь равные третьему, равны между собой» — в данном случае «равные» в смысле площади). Значит, это отношение эквивалентности разбивает все плоские фигуры на классы эквивалентности: в один класс попадают все фигуры одинаковой площади (или, как иногда говорят, равновеликие фигуры).

В качестве следующего примера отметим подобие фигур. Будем писать F ~ (7, если фигура F подобна фигуре (7, т. е. существует такое взаимно однозначное соответствие F —> G (рис. 140), при котором расстояния между парами соответствующих точек имеют одно и то же отношение (называемое коэффициентом подобия):

Отношение подобия F ~ G рефлексивно, симметрично и транзитивно, т. е. является отношением эквивалентности, разбивающим все фигуры на классы подобных фигур. Например, все квадраты образуют один класс эквивалентности (т. е. все квадраты подобны между собой, и любая фигура, подобная квадрату, также является квадратом, рис. 141). Ромбы же входят в один класс в том и только в том случае, если они имеют равные углы (рис. 142). Все окружности также образуют один класс (они все подобны, рис. 143).

Рис. 142 Рис. 143 Рис. 144

Наконец, отметим еще два примера, имеющие существенное значение. Первый из них касается рациональных чисел, т. е. чисел, представимых в виде дроби ^, где р и q — целые, причем q Ф 0. Две дроби — и - считаются эквивалентными, если ps = qr. Например, эквивалентными являются дроби — и —, поскольку 2-6 = 3-4. Это отношение эквивалентности является рефлексивным, симметричным и транзитивным, т. е. множество всех дробей разбивается на классы эквивалентности. Каждый такой класс эквивалентности и есть рациональное число.

Дроби \ w% представляют одно и то же рациональное число, поскольку эти дроби эквивалентны. Именно рациональные числа, а не отдельные дроби изображаются точками на числовой оси. Ведь нет отдельных точек для —, — или —. Эти дроби (и все другие, эквивалентные им) изображаются одной точкой (рис. 144). Надо было бы писать j^-J = ^ , т. е. класс, содержащий дробь -|, совпадает с классом, содержащим дробь у (и именно этот класс, т. е. рациональное число, изображается точкой на числовой оси). Однако для простоты мы опускаем квадратные скобки, т. е. пишем ^-"^ (вместо более четкой записи ~ у).

Заметим еще, что сложение (а также умножение) рациональных чисел выполняется по представителям. Пусть, например, г2~[з"]? т. е. — рациональное число, представителем которого является дробь —, а г2 — число, представляемое дробью у. По правилу сложения дробей — + — =-—— = — и мы принимаем за сумму рассматриваемых рациональных чисел класс получающейся дроби —, т. е. rx +r2 = \j$ •

Если бы мы взяли других представителей чисел и г2, например, -г и —, то, согласно правилу сложения дробей, мы нашли бы (взяв

Рис. 145 Рис. 146 Рис. 147

30 в качестве общего знаменателя):

эквивалентные дроби, т. е. они представляют одно и то же рациональное число

Иначе говоря, беря различных представителей чисел ^ и /*2 и выполняя сложение этих дробей (представителей), мы получаем дроби, представляющие одно и то же рациональное число, которое и принимается за сумму + г2.

Таким образом, хотя сложение рациональных чисел определяется по представителям, но оно определено математически корректно, т. е. результат (сумма г^+г^) не зависит от выбора представителей чисел и Yj. В связи с этим мы обычно опускаем квадратные скобки; надо было бы писать

но для краткости мы пишем проще, т. е. без скобок:

Заключительный пример — понятие конгруэнтности геометрических фигур. Каждая фигура (например, на плоскости) представляет собой некоторое множество точек. Как всегда, два множества А и В считаются равными, если они совпадают, т. е. любая точка множества А принадлежит также множеству В и обратно. Точно так же две геометрические фигуры А, В следует считать равными, если они совпадают, т. е. если А и В — это одна и та же фигура. Фигуры же, которые могут быть совмещены друг с другом при помощи некоторого движения, называются по принятой в математике традиции не равными, а конгруэнтными. Например, на рис. 145 фигуры А и В конгруэнтны: симметрия s относительно точки О переводит фигуру А в фигуру В, т. е. s(A) = В. Но А и В — это все же различные фигуры, т. е. на рис. 145 имеются две фигуры А и В, а вовсе не одна и та же фигура; «равными» (т. е. совпадающими) считать эти две фигуры было бы неправильным. Конгруэнтность фигур А и В обозначается обычно записью А=В. Примем и мы это обозначение. Таким образом, на рис. 145

т. е. фигуры А и В конгруэнтны, а образ фигуры А при симметрии s равен фигуре В, т. е. совпадает с ней (и, точно так же, образ фигуры В совпадает с А).

В учебнике А. В. Погорелова (вслед за более ранним учебником А. П. Киселева) понятия равенства и конгруэнтности не различаются, во всех случаях говорится о «равных» фигурах. Иными словами, «равными» называются (по Погорелову) не только две совпадающие фигуры, но и две различные фигуры, если они могут быть совмещены движением («наложением» по Киселеву). Например, любые две точки «равны»; любые две прямые «равны». При погореловской терминологии использование общепринятых функциональных обозначений (не только удобных, но и сближающих алгебру с геометрией) становится математически некорректным и бессмысленным. Так, применяя к рисунку 145 функциональные обозначения, мы можем написать s(M) = N, s(P) = Q, т. е. точка s(M) (образ точки М) равна N, совпадает с ней; точка s{P) равна точке Q, т. е. s{P) и Q — это одна u та же точка. Так обстоит дело в общепринятой математической терминологии. Но по Погорелову любые две точки «равны» (например, M = N = Р = Q), и потому функциональная запись s(M) = N ничего не выражает, поскольку s(M) есть точка, N — тоже точка и потому они, конечно, «равны». С такой же обоснованностью можно было бы написать s{M) = Р, s{M) = Q и т. п. (ведь любые же две точки «равны»!). Таким образом, упрощенчество, связанное с отказом от термина конгруэнтность, перечеркивает идею функциональных обозначений. Мы далее сохраняем общепринятый математический термин конгруэнтность и обозначение а = В, что дает право в полной мере использовать функциональные обозначения.

Теперь укажем, как это связано с идеей классификации. Отношение конгруэнтности геометрических фигур рефлексивно, симметрично и транзитивно, т. е. оно разбивает все множество фигур на классы. Мы обычно говорим, что задача о построении треугольника по длинам трех сторон а, Ь, с имеет единственное решение (при условии, конечно, что каждое из чисел а, Ь, с меньше суммы двух других). Это построение легко осуществить циркулем и линейкой (рис. 146). Но ведь в действительности имеется бесконечно много треугольников с данными длинами сторон (рис. 147), а вовсе не «один» такой треугольник. Однако все треугольники, дающие решение этой задачи, конгруэнтны между собой, т. е. составляют один класс конгруэнтных фигур.

Правильнее было бы сказать, что с точностью до конгруэнтности задача имеет единственное решение, т. е. решением является один класс конгруэнтных треугольников. Задача же построить треугольник по двум сторонам и высоте, сходящимся в одной вершине, имеет два решения (рис. 148). Точнее, два решения с точностью до конгруэнтности, т. е. имеются два класса конгруэнтных треугольников, служащих решениями этой задачи.

Рис. 148

Задачи и упражнения

61. Может ли служить отношением эквивалентности целых чисел наличие у них общего делителя, большего 1?

62. Покажите, что во множестве целых чисел, больших единицы, следующее отношение является отношением эквивалентности: наибольший из делителей числа, не равный самому числу, один и тот же. Опишите класс чисел, у которых этот делитель равен 7, и класс чисел, у которых он равен 12.

63. Является ли классификацией следующее разбиение четырехугольников: трапеции, параллелограммы, ромбы, остальные четырехугольники?

64. Является ли отношением эквивалентности во множестве треугольников равенство радиусов вписанных окружностей? А у четырехугольников?

65. Два города назовем эквивалентными, если количество жителей одного отличается от количества жителей другого не более, чем на 5000 человек. Является это отношение отношением эквивалентности?

Беседа 5. Упорядоченные множества

20. Понятие упорядоченного множества

Прежде чем ввести отношение порядка, которому посвящен этот пункт, мы снова рассмотрим два примера, хорошо нам известных. В качестве первого примера возьмем множество R всех действительных чисел. В этом множестве введены неравенства. Мы говорим, что число а меньше b и пишем а < b (или b> a, b больше а), если разность Ъ-а есть положительное число. Графически неравенство а< b означает, что точка b расположена на числовой оси правее точки а (рис. 149). Неравенства обладают свойством транзитивности (рис. 150):

(1)

Иногда рассматриваются также нестрогие неравенства а < b (или Ь>а). Запись а < b (словами: а меньше или равно Ь) означает, что выполнено какое-либо одно из условий а< 6, а-Ь. Например, неравенство 5 < 7 верно (одно из условий 5 < 7, 5 = 7 верно, а именно первое из них); неравенство 4 < 4 также верно (одно из условий 4<4, 4 = 4 верно, а именно второе из них). Иными словами, запись а < b означает, что число а не больше Ь, т. е. а либо совпадает с Ь, либо расположено на числовой оси левее Ь. Так, числовой отрезок [а; Ь] состоит из всех действительных чисел х, удовлетворяющих двойному нестрогому неравенству а<х<Ь. Таким образом, все числа х, расположенные между а и b (рис. 151), принадлежат этому отрезку; концевые точки а и b также ему принадлежат.

В качестве второго примера рассмотрим некоторое универсальное множество U и обозначим через S множество всех его подмножеств.

Рис. 149 Рис. 150 Рис. 151

Рис. 152 Рис. 153 Рис. 154 Рис. 155

Для двух элементов А, В g S (т. е. подмножеств множества U) условимся писать А <В, если А — собственное подмножество множества В (рис. 152). Нестрогое неравенство А <В означает, что либо А<В, либо А = В, т. е. А либо есть собственное подмножество множества В, либо же А совпадает с В. Иначе говоря, нестрогое неравенство < равносильно включению е. Введенные таким образом в множестве S неравенства обладают свойством транзитивности (1) (рис. 153).

В обоих рассмотренных примерах (в множестве R и в множестве S) введены неравенства между элементами, причем свойство транзитивности выполняется в обоих случаях. Однако между этими примерами имеется и существенное различие. В R для любых двух элементов a, b (т. е. двух действительных чисел) обязательно справедливо какое-либо одно из условий

(2)

т. е. точка а (если она не совпадает с Ь) расположена либо слева, либо справа от b (рис. 154). В множестве же S имеются несравнимые элементы, т. е. такие подмножества А, В универсального множества U, что ни одно из них не является подмножеством другого (рис. 155), т. е. ни одно из соотношений (2) места не имеет. Таким образом, в обоих множествах R, S выполнено условие исключительности: для любых двух элементов a, b имеет место не более чем одно из соотношений (2), т. е. эти соотношения исключают друг друга.

Теперь будут понятны следующие определения. Множество М, в котором по некоторому правилу введены неравенства, т. е. указано, для каких элементов a,b g M справедливо соотношение а < b (и тогда b > а), называется упорядоченным множеством, если в нем выполнено условие транзитивности (1) и условие исключительности, т. е. для любых a, b выполнено не более чем одно из соотношений (2). Само отношение а < b (удовлетворяющее условиям транзитивности и исключительности) называется отношением порядка. В общем случае в упорядоченном множестве могут существовать несравнимые элементы а, Ь, т. е. такие, для которых ни одно из соотношений (2) места не имеет. Таковым было упорядоченное множество S. Если же для любых двух a, be M выполнено одно из соотношений a<b, а = Ь, а > Ь, т. е. несравнимых элементов нет, то M называется цепью. Таковым было упорядоченное множество R.

Рис. 156 Рис. 157 Рис. 158 Рис. 159

На рис. 156 упорядоченное множество Г, содержащее элементы а, Ь, с, d, е, /, показано в виде направленного графа: каждая стрелка идет от меньшего элемента к большему (для наглядности стрелки направлены вверх). Таким образом, если a<b,b< с и, следовательно, а < с (в соответствии со свойством транзитивности (1)), то в треугольнике с вершинами а, Ъ, ^вектор ас равен сумме векторов, идущих по двум другим сторонам (ас = ab + be). То же справедливо для треугольника def и других аналогичных треугольников. Однако такого треугольника pqr, в котором стрелки идут, скажем, в направлении обхода по часовой стрелке (рис. 157), быть не может, поскольку это означало бы выполнение неравенства р <q, q <r, r <р — вопреки свойству транзитивности.

Заметим, что в упорядоченном множестве Т (рис. 156) имеется один максимальный элемент с (т. е. не существует в Т элемента, большего с) и два минимальных элемента a, d (т. е. не существует элемента, меньшего а, и также не существует элемента, меньшего d). В упорядоченном множестве S имеется один максимальный элемент U и один минимальный элемент 0, т. е. для любого подмножества X множества U справедливы неравенства Х< U и Х> 0. Для наглядности на диаграмме Эйлера-Венна (рис. 158) показаны три подмножества А, В, С множества U, а на рис. 159 — соответствующий направленный граф. А в R нет ни максимальных, ни минимальных элементов. В самом деле, какое бы число a g R мы ни взяли, всегда в R найдется большее число х, т. е. число а не является максимальным.

Задачи и упражнения

66. Для двух человек A и В запишем А > В, если В является потомком А. Будет ли в этом случае множество людей упорядоченным?

67. В волейбольном турнире каждая команда сыграла с каждой по одной игре (ничьих в волейболе не бывает). Запишем А > В, если команда А выиграла у команды В. Будет ли в этом случае множество команд упорядоченным?

68. На конкурсе красоты выступало 5 претенденток на звание «Мисс изящество». Судили конкурс трое судей, каждый из которых расположил претенденток в порядке предпочтения. Для претенденток A и В запишем А > В, если большее число судей поставило А выше, чем В. Всегда ли множество претенденток окажется упорядоченным? Обязательно ли в нем найдутся максимальный и минимальный элементы?

69. Для точек М^х^у^ и МЛх' у ) (на координатной плоскости) запишем A/j > М2 при Xj>x2, а если х1=х2, то при ух>ут Станет ли это множество упорядоченным?

70. Двадцать восьмиклассников выстроились в шеренгу, за ними встала шеренга из двадцати девятиклассников. Оказалось, что каждый девятиклассник выше стоящего перед ним восьмиклассника. Через некоторое время школьники в каждой шеренге перестроились, встав по росту. Докажите, что вновь перед каждым девятиклассником окажется восьмиклассник, меньший его по росту.

21. Минимальные элементы и математическая индукция

В историческом процессе познания мира (а иногда, в естественных науках, и поныне) важную роль играла экспериментальная индукция, т. е. заключение о том, что многократно наблюдаемое явление должно (в аналогичных условиях) повторяться и впредь. Тысячелетиями люди замечали, что вечером солнце исчезает за горизонтом на западе, а утром снова появляется на востоке. И это (так же как смена времен года) было экспериментально установленным фактом — задолго до того, как была выяснена причина этих явлений, связанная с вращением Земли и ее движением вокруг Солнца. Экспериментальная индукция имеет значение и в математике, но роль ее здесь несколько иная.

Квадратный трехчлен f(n) = n2-n + 4\ при подстановке в него (вместо п) последовательных натуральных чисел 1, 2, 3, ... принимает следующие значения: /(1) = 41, /(2) = 43, /(3) = 47, /(4) = 53, /(5) = 61, /(6) = 71, ... . Все эти значения являются простыми числами. Если продолжить вычисления, то можно убедиться, что при подстановке вместо п следующих чисел 7, 8, 9, 10 снова получаются простые числа. Можно ли считать «экспериментально установленным», что для любого натурального п значение f(ri) является простым числом? Математика отвечает на этот вопрос отрицательно. Какое бы конечное число проб мы ни сделали, это не служит доказательством того, что для любого натурального п значение f(ri) является простым числом. Это — лишь гипотеза, предположение. Но достаточно найти один контрпример (т. е. натуральное п, для которого f(ri) не будет простым), и высказанное общее утверждение будет ниспровергнуто, т. е. будет показано, что сформулированная гипотеза ошибочна. И такой пример нетрудно найти: /(41) = 412 - 41 + 41 = 412, т. е. число /(41) не является простым. Кстати, это — минимальное п, являющееся контрпримером, т. е. для всех п- 1, 2, 3, .... 40 число f(ri) — простое.

Еще более впечатляющим является квадратный трехчлен g(ri) = n -19п + 1601. И здесь последовательные значения g(l)= 1523, g(2) = 1447, g(3) = 1373 являются простыми. В этом нетрудно убедиться с помощью микрокалькулятора. Действительно, попробовав делить 1523 на простые числа 2, 3, 5, 7, 11, 37, мы найдем, что на них 1523 не делится; но тогда 1523 не делится и на большие простые

числа, поскольку если m не простое, то у него непременно имеется простой множитель, не превосходящий ^т (кстати, почему?). Таким образом, 1523 — простое число, и можно убедиться, что дальнейшие значения 1447, 1373 тоже являются простыми. Правда, эти значения убывают, но все же отрицательных значений трехчлен g(n) не имеет, поскольку его дискриминант 792 - 4 1601 = -163 отрицателен; в этом также можно убедиться, рассматривая график функции g(x) = X - 19х + 1601 (рис. 160), принимающей наименьшее значение при X = ~2~- Например, значение g(40) = 41, так же как g(39) = 41, снова представляет собой простое число (это будет наименьшее значение, которое принимает g(n) для натуральных п).

И все же гипотеза о том, что для любого натурального п значение g(n) является простым числом, ошибочна. Контрпримером является число 80: g(80) = 802- 79-80+ 1601 = 1681 = 412 (и это — минимальное натуральное п, служащее контрпримером, т. е. для всех п- 1, 2, 3, 79 число g{n) — простое).

Наконец, рассмотрим третий, весьма эффектный пример.

Великий математик XVII столетия Пьер Ферма (о котором мы уже говорили выше) высказал предположение, что для любого натурольного п число 2+1 — простое. Эта его гипотеза основывалась на том, что при я=1, 2, 3, 4 получающиеся числа 22 + 1 = 22+ 1 = 5, 22'+ 1 = 24 + 1 = 17, 2Г + 1 = 28 + 1 = 257, 22' + 1 = 216 + 1 = 65 537 являются, в самом деле, простыми. При подстановке следующего значения я = 5 получается число 22 + 1 = 2j2 + 1 =4 296 961 297. Проверить «вручную» отсутствие у него простых делителей затруднительно. Однако Леонард Эйлер обнаружил изящным рассуждением, что это число не простое, оно делится на 641. Тем самым получился контрпример к гипотезе Ферма.

Вот как это было установлено Эйлером. Прежде всего, он замечает, что

(3)

Стоящее в скобках число Эйлер записывает в виде

Наконец, он пользуется тем, что многочлен х2п - 1 делится на х2 - 1 и, значит, делится на х + 1. В частности, (2 -5) - 1 делится на 2 -5 + 1, т. е. на 641. Таким образом, число 232 + 1 представлено, согласно (3), в виде разности двух чисел, каждое из которых делится на 641, а потому и число 2 + 1 делится на 641.

Проследить за этими преобразованиями нетрудно, но остается загадкой, почему именно так действовал Эйлер, какая фантазия и сила интуиции подсказали ему, что 232 + 1 делится на таинственное число 641 и, следовательно, не является простым.

Рис. 160 Рис. 161 Рис. 162

Итак, если имеется некоторая общая гипотеза («для любого натурального п справедливо то-то и то-то ... »), то ошибочность этой гипотезы устанавливается указанием хотя бы одного контрпримера. Для того же, чтобы подтвердить истинность этой гипотезы, необходимо провести некоторое общее рассуждение (и никакое конечное число подтверждающих примеров не заменяет такого общего доказательства).

Каким же образом может быть проведено математически корректное общее рассуждение, доказывающее, что некоторый факт имеет место для любого натурального ni Наиболее употребительным для этого является метод математической индукции. Сущность его мы рассмотрим на следующем примере: для любого натурального п сумма п первых натуральных чисел равна

(4)

Существует красивое геометрическое рассуждение, показывающее правильность этой формулы. Изобразим последовательные вертикальные столбики, содержащие 1, 2, 3, 4, 5 элементов (черные кружки на рис. 161). Затем поместим над ними добавочные вертикальные столбики, содержащие 5, 4, 3, 2, 1 элементов (белые кружки на рис. 161). Количество черных кружков равно S5 =1+2 + 3 + 4 + 5, и столько же имеется белых кружков, т. е. всего на рисунке изображено 2S5 кружков. Но ясно, что у нас получилось 5 столбиков, в каждом из которых имеется 5 + 1 кружков, т. е. всего в этой прямоугольной диаграмме содержится 5-(5 + 1) кружков. Значит, 2S5 = 5-(5 + 1), т. е.

Это означает, что для /7 = 5 формула (4) справедлива. Для /7 = 6 (рис. 162) к прямоугольной (5x6) диаграмме точек для /7 = 5 добавится столбик справа и строка сверху. Получится прямоугольная диаграмма 6x7, поэтому

И так далее. Но вот это «и так далее» как раз представляет собой суть метода математической индукции.

Покажем теперь, как можно подробно изложить индуктивное рассуждение, доказывающее справедливость формулы (4). Обозначим через Т утверждение о том, что формула (4) (для рассматриваемого

натурального п) верна. Например, на рис. 161 дана иллюстрация справедливости утверждения Т5, а на рис. 162 — иллюстрация утверждения

Справедливость утверждения Т для п = 1 (или для небольших п-2, 3, ...) непосредственно проверяется. Но как убедиться в справедливости этого утверждения для любого натурального п?

Здесь применяется прием рассуждения, называемый переходом от п к п + 1. Допустим, что формула (4) верна для некоторого натурального п, т. е. что утвержение Тп истинно, и докажем ее справедливость для следующего натурального числа п+ 1, т. е. установим утверждение Тп+у В самом деле,

а это и означает, что утверждение 7^+1 также истинно. Но теперь «ясно», что утверждение Тп верно для любого натурального п. Ведь Tj верно, а потому рассматриваемое утверждение верно для следующего натурального числа п = 2, т. е. Т2 истинно. Но тогда, поскольку Т2 истинно, это утверждение верно и для следующего натурального числа, т. е. истинно. А так как 7\ истинно, то верно и следующее утверждение Г4 и т. д. Поэтому утверждение Тп верно для любого натурального п.

Это и есть рассуждение, проведенное методом математической индукции. Таким образом, чтобы доказать, что некоторое утверждение Тп справедливо для любого натурального п, мы, во-первых, убеждаемся в справедливости его для п=\, и, во-вторых, осуществляем переход от п к п + 1, т. е. доказываем, что если для некоторого п верно Т , то тогда верно и Ту Если это сделано, то утверждение Тп считается доказанным «по индукции».

Следует заметить, что возможность применения метода математической индукции, какой бы «понятной» она ни представлялась, является аксиомой, описывающей некоторое свойство натурального ряда N- {1, 2, 3,...}. Она означает, что, переходя от натурального числа 1 к следующему числу 2, затем к следующему, затем еще к следующему и т. д., мы переберем все натуральные числа.

Важно заметить, что существенны оба элемента математической индукции: и начало индукции (т. е. проверка истинности утверждения 7"j), и общий шаг индукции (т. е. переход от п к п+ 1: в предположении, что Т верно, показать, что в таком случае Т ^ также верно). Если мы не проведем общего шага индукции, а лишь проверим, что

Рис. 163 Рис. 164

утверждение Тп верно для нескольких первых значений п, то это означает, что мы ограничиваемся экспериментальной индукцией, которая, как мы видели, не дает корректного математического доказательства. Не менее важно и начало индукции; пренебрежение им может привести к ошибочным выводам. Мы рассмотрим это на следующем примере.

Задача, которую мы хотим решить, состоит в том, чтобы найти, на сколько частей разбивают плоскость п прямых, если никакие две из них не параллельны и никакие три не пересекаются в одной точке.

Обозначим это число частей через Р , т. е. пусть п прямых (удовлетворяющих указанным условиям) разбивают плоскость на Рп частей. Проведем теперь (п + 1)-ю прямую (рис. 163). Она пересечет каждую из проведенных ранее прямых (поскольку прямые попарно не параллельны), причем все п точек ее пересечения с проведенными ранее прямыми различны (поскольку никакие три прямые не пересекаются в одной точке). Обозначим эти точки пересечения через а^, а2, ау ап. Если мы будем двигаться по (п + 1)-й прямой «из бесконечности», проходя последовательно точки а^, а2, а^, ап и вновь «удаляясь в бесконечность», то легко сможем подсчитать, сколько новых частей возникло в результате проведения (п + 1)-й прямой. В самом деле, подходя к точке а^, мы заметим, что та из прежних частей, по которой мы двигались, разделилась на две части, т. е. добавилась одна новая часть. Подходя затем к точке а2, мы обнаружим, что еще одна из прежних частей разделилась на две, т. е. опять появилась одна новая часть и т. д. Таким образом, подойдя к точке ап, мы обнаружим, что появилось п новых частей. Наконец, продолжая движение по (п + 1)-й прямой «в бесконечность», мы получим еще одну новую часть. Итак, проведение (п + 1)-й прямой добавляет п + 1 новую часть, т. е.

(5)

Соотношение такого типа, т. е. соотношение, выражающее Рп+^ через предыдущее значение, называют рекуррентным.

Но ведь в предыдущем примере, т. е. при доказательстве соотношения (4), мы как раз, осуществляя переход от п к п+ 1, добавляли к

Получается, что и в рассматриваемом примере мы получаем то же значение, т. е.

Но верно ли это заключение? На рис. 164 показан случай трех прямых.

По вроде бы доказанной формуле мы должны получить Р3 = —= 6, т. е. три прямые должны разбить плоскость на 6 частей. Но это неверно: рис. 164 показывает, что три прямые разбивают плоскость на семь частей! За счет чего возникла эта ошибка? Именно за счет того, что мы осуществили только переход от п к п+ 1, пренебрегая началом индукции.

Корректное решение выглядит следующим образом. Одна прямая разбивает плоскость на две части, т. е. Р^ = 2 (в то время как было равно 1). Далее, добавив вторую прямую, мы (согласно рекуррентному соотношению (5)) добавим еще две части, т. е. Р2 = 4, (тогда как ранее было S2 = 1+2 = 3. Вроде бы получается, что Рп всегда на единицу больше, чем Sn, т. е.

(6)

Это — наша гипотеза, которую надо доказать методом математической индукции. При этом начало индукции уже проведено, т. е. Р^ как раз получается по формуле (6). Остается осуществить переход от п к п + 1. Но ясно, что это делается дословно так же, как и в предыдущем примере, поскольку прибавление единицы одновременно к Sn и Sn+^

ничего не меняет (педантичный читатель может заново провести переход от п к п + 1). Теперь математическая индукция проведена полностью и мы получаем окончательный результат: число частей, на которые п прямых разбивают плоскость (при указанных условиях их расположения), дается формулой (6).

В заключение мы отметим принцип наименьшего числа и его связь с методом математической индукции. Указанный принцип состоит в том, что в любом непустом подмножестве множества N натуральных чисел имеется наименьший элемент.

Справедливость этого принципа нетрудно обосновать. Пусть M — непустое подмножество множества N. Так как M непусто, то найдется натуральное число т, принадлежащее подмножеству М. Рассмотрим теперь пересечение МП {1, 2, ...,т}. Оно является конечным множеством, содержащимся в N, и потому в нем имеется наименьший элемент mQ (это достаточно «очевидно», но может быть строго доказано индукцией по числу элементов рассматриваемого конечного подмножества). Остается заметить, что т^ является наименьшим элементом не только конечного подмножества

МП {1,2,m}, но и всего множества М, что доказывает справедливость принципа наименьшего числа.

Таким образом, если возможность проведения доказательств методом математической индукции принимается в качестве аксиомы, то принцип наименьшего числа доказывается как теорема. Верно и обратное: если принять принцип наименьшего числа за аксиому, то возможность применения метода математической индукции доказывается как теорема. В самом деле, допустим, что утверждение Тп (для которого проведено начало индукции и переход от п к п+ 1) верно не для всех натуральных п. Обозначим через M множество всех п, для которых Тп неверно. Оно, по предположению, непусто. Согласно принципу наименьшего числа в множестве M имеется наименьшее число т. Следовательно, обозначая через п число m - 1, мы заключаем, что Т верно, а Т ^ неверно. Но это невозможно, поскольку был проведен переход от п к п+\. Таким образом, предположение о непустоте множества M приводит к противоречию. Следовательно, M пусто, т. е. утверждение Т верно для всех натуральных п.

Теперь мы можем ввести еще одно, очень важное определение. Пусть некоторое упорядоченное множество является цепью. Это множество называется вполне упорядоченным, если в нем имеет место принцип наименьшего элемента, т. е. любое непустое подмножество имеет наименьший элемент. Согласно сказанному выше, множество N всех натуральных чисел является вполне упорядоченным. Множество же всех действительных чисел (или всех рациональных чисел) является упорядоченным, но не вполне упорядоченным. В самом деле, интервал (а; Ь), являющийся подмножеством множества R, не имеет наименьшего элемента. В заключительном пункте этой беседы вполне упорядоченные множества будут играть особо важную роль. Однако, если он покажется сложным, читатель может его пропустить без ущерба для понимания дальнейшего изложения.

Задачи и упражнения

71. Пользуясь принципом математической индукции, докажите, что сумма всех нечетных чисел от 1 до 2/7+ 1 равна (/7 + I)2.

72. Докажите, что

73. Докажите, что

74. Найдите ошибку в следующем рассуждении, проведенном по методу математической индукции.

«Пусть имеется неограниченное число разноцветных шариков. Докажем, что если мы возьмем несколько шариков, то все они будут одного цвета. Для /7=1 это верно. Пусть это верно для п- /с, докажем, что это верно для n = k + 1. Возьмем к+ 1 шарик и отложим один из них. Останется к шариков. По предположению все они одного цвета. Отложим еще один шарик и вернем первоначально отложенный. Получим вновь к шариков, которые по предположению имеют один цвет. Значит, отложенный в первый раз шарик имеет

тот же цвет, что и остальные. Итак, все к + 1 шариков имеют одинаковый цвет. По принципу индукции отсюда следует, что в любом наборе шарики будут одинакового цвета.»

75. Докажите, что неравенство п3 - 4 > 1 ООО/?2+ 3/7 выполняется при любом п > 2000.

22. Трансфинитные числа и аксиома выбора

В общеупотребительном языке мы различаем количественные и порядковые числительные. Например, в конечном множестве может быть десять элементов, а если оно упорядочено и притом является цепью, то в нем можно рассмотреть четвертый или седьмой элементы. Подобно этому помимо мощностей, являющихся для бесконечных множеств аналогом количественных числительных, Георг Кантор ввел еще трансфинитные числа («сверхконечные числа»), обобщающие порядковые числительные.

Натуральный ряд чисел 1, 2, 3,... является упорядоченным (и даже вполне упорядоченным) множеством, содержащим бесконечно много элементов. Чтобы охарактеризовать его «порядковый тип», вводится первое бесконечное трансфинитное число со. Его располагают вслед за всеми натуральными числами: 1, 2, 3, со.

Получающееся упорядоченное множество имеет порядковый тип со+ 1 (т. е. вслед за натуральными числами еще один элемент). Присоединив это новое трансфинитное число со+ 1, мы получаем упорядоченное множество 1, 2, 3, со, со + 1.

Его порядковым типом является со+ 2 (т. е. еще два элемента вслед за натуральными числами). Продолжая, мы получаем последовательность трансфинитных чисел

Порядковый тип этого множества можно обозначить как со + со или со-2. Теперь можно рассмотреть дальнейшие трансфинитные числа

Вслед за ними идет трансфинитное число coco = со2, затем где-то встретятся coJ, ... со4, ....

После со, со2, осг\ ... сол идет трансфинитное число со03, затем сою + 1, .... Продолжая, мы получим числа

после которых идет со03. Затем будут числа

вслед за которыми идет

А после всех чисел будет идти трансфинитное число, для которого уже нет принятых алгебраических обозначений и для него надо будет ввести какое-то новое обозначение, скажем у, и т. д.

Каждое из указанных трансфинитных чисел обладает тем свойством, что перед ним имеется лишь счетное множество трансфинитных чисел. Поэтому их называют счетными трансфинитными числами. Мы можем теперь взять множество всех счетных трансфинитных чисел. За ними всеми следует трансфинитное число, которое принято обозначать символом Q. Это — первое несчетное трансфинитное число, т. е. ему предшествует несчетное множество трансфинитных чисел. Но и на этом процессе образования трансфинитных чисел не обрывается. Вслед за числом Q идут числа Q+ 1, Q + 2, Q + co, Q + co + я, затем Q + Q (т. е. Q-2) и т. д. И какое бы бесконечное множество M мы ни взяли, всегда мы в конце концов можем найти такое трансфинитное число, что все предшествующие ему трансфинитные числа образуют множество большей мощности, чем \М\.

При этом, сколько бы мы ни построили трансфинитных чисел, их множество оказывается не только цепью, но и вполне упорядоченным множеством, т. е. в нем справедлив принцип минимального элемента. Иначе говоря, какое бы мы ни взяли подмножество множества трансфинитных чисел, в нем всегда найдется наименьший элемент.

И еще полезно заметить, что имеются трансфинитные числа двух видов. К первому виду относятся трансфинитные числа, которые имеют непосредственно предшествующее число. Таковы, например,

со + 1, со + 13, со-2 + 3, со2 + со-2 + 5, со03 + со-5 + 8 и т. п.

Трансфинитные числа второго вида (так называемые предельные трансфинитные числа) не имеют непосредственно предшествующих. Таковы, например,

со, со-3, со2, со2 + со, со03 + со2 + со-3 и т. п.

А теперь расскажем о трансфинитной индукции. Пусть р — некоторое трансфинитное число. Предположим, что для каждого трансфинитного числа а, меньшего р, сформулировано некоторое утверждение Та, и мы хотим доказать, что это утверждение верно для любого а < р. Как это можно было бы сделать? Для этого применяется трансфинитная индукция, которая состоит в следующем.

Во-первых, надо проверить утверждение Та для наименьшего трансфинитного числа ос= 1, т. е. доказать утверждение Ту Это — начало трансфинитной индукции.

Во-вторых, надо осуществить индуктивный переход (вспомните «переход от п к п + 1» при обычной индукции), т. е. доказать, что если

ß — произвольное трансфинитное число, меньшее р, и если для всех а < ß утверждение Та верно, то верно и утверждение Т^.

Если трансфинитная индукция проведена (т. е. осуществлены начало индукции, а также индуктивный переход), то утверждение Та считается доказанным для всех трансфинитных чисел, меньших р. Заметим, что если р = со, то множество всех трансфинитных чисел, меньших р, совпадает с натуральным рядом {1, 2, 3, ...}, и в этом случае трансфинитная индукция сводится к обычной математической индукции. Если же р таково, что множество всех трансфинитных чисел, меньших р, несчетно, то приходится прибегать к трансфинитной индукции. Для удобства множество всех трансфинитных чисел, меньших р, обозначим через (0; р); это — интервал в множестве трансфинитных чисел. Таким образом, трансфинитная индукция позволяет доказать утверждение Та для всех a g (0; р).

Правомерность применения трансфинитной индукции вытекает из того, что множество трансфинитных чисел вполне упорядочено, т. е. в нем справедлив принцип наименьшего элемента. В самом деле, допустим, что утверждение Та (для которого проведены начало индукции и индуктивный переход) справедливо не для всех a g (0; р), т. е. множество M всех а g (0; р), для которых Т неверно, является непустым. Пусть ß — наименьший элемент множества М, т. е. неверно, но для всех а < ß утверждение Та верно. Однако существование такого ß противоречит индуктивному переходу (возможность которого предполагается доказанной). Полученное противоречие означает, что множество M не может быть непустым. Следовательно, M пусто, т. е. Т верно для любого a g (0; р). Тем самым правомерность метода трансфинитной индукции установлена.

В качестве примера применения трансфинитной индукции докажем следующую теорему: для любого множества А существует такое трансфинитное число ос, что интервал (0; а) эквивалентен множеству А, т. е. существует взаимно однозначное отображение fi (0; а) —>А.

В самом деле, допустим, что эта теорема неверна. Выберем такое трансфинитное число р, что интервал (0; р) имеет большую мощность, чем множество А. Докажем теперь, что можно для любого a g (0; р) выбрать элемент хае А, отличный от ранее выбранных элементов.

Это утверждение мы обозначим через Та и будем его доказывать с помощью трансфинитной индукции. Начало индукции ясно: мы выбираем произвольный элемент множества А и обозначаем его через Ху Осуществим теперь индуктивный переход. Пусть элементы х^ уже выбраны для всех ^<а; тогда, полагая f(^) = x^, мы получаем вложение fi (0; а) —> А. Это вложение не является взаимно однозначным

отображением интервала (0; а) на все множество А (поскольку мы предположили, что доказываемая теорема неверна). Значит, можно найти в А элемент, не являющийся образом какого-либо элемента Ç g (0; а). Мы выберем такой элемент и обозначим его через ха. Этот элемент отличен от всех ранее построенных элементов х^, т. е. утверждение Та верно. Этим осуществлен индуктивный переход. Проведенная трансфинитная индукция доказывает, что Т верно для всех a g (0; р). Иначе говоря, полагая f(a) = xa, мы получаем вложение интервала (0; р) в множество А. Однако это невозможно, поскольку мощность интервала (0; р) больше мощности множества А. Полученное противоречие и показывает, что предположение о ложности рассмотренной теоремы ошибочно, чем и завершается доказательство.

В этом доказательстве имеется некоторый пробел (который, возможно, не был замечен читателем). Однако, прежде чем указать этот пробел и поговорить о его исправлении, мы поясним смысл доказанной теоремы.

Интервал (0; р) трансфинитных чисел представляет собой вполне упорядоченное множество. Значит, согласно доказанной теореме, любое множество А может быть поставлено во взаимно однозначное соответствие с некоторым вполне упорядоченным множеством. Иначе говоря, любое множество может быть вполне упорядочено. Можно сказать и иначе: элементы любого множества А могут быть обозначены в виде Xç, где £ пробегает некоторый интервал (0; а) трансфинитных чисел, т. е. элементы любого множества А могут быть пронумерованы трансфинитными числами из этого интервала. Это уже кажется невероятным с интуитивной точки зрения. Например, все действительные числа (их несчетное множество) могут быть пронумерованы одно за одним — пусть не обычными целочисленными номерами, а трансфинитными, но все же пронумерованы. Интуиция протестует против такой возможности.

Может быть, где-то в доказательстве рассмотренной теоремы была допущена ошибка? Нет, доказательство было проведено корректно, но в нем неявно была использована аксиома выбора, сформулированная в 1904 году математиком Э. Цермело. В несколько упрощенном виде ее использование можно пояснить так. Пусть в процессе рассуждения рассматривается некоторое семейство множеств; тогда представляется возможным выбрать в каждом из этих множеств по одному элементу. В приведенном выше доказательстве (которое также принадлежит Цермело) такими множествами были дополнения к множествам уже пронумерованных элементов {*а}, и для каждого трансфинитного числа ß из интервала (0; р) мы выбрали в соответствующем дополнении один элемент х^. Именно аксиома выбора привела к результату, с которым интуиция не хочет мириться, т. е. аксиома выбора находится в противоречии с нашей интуицией.

В этой связи уместно упомянуть о замечательном результате, который в 1963 году был получен английским математиком П. Коэном. Но прежде чем о нем рассказать, мы сформулируем континуум-гипотезу, высказанную в 1878 году Георгом Кантором. Как мы видели в беседе 2, мощность континуума © больше К0, т. е. больше мощности любого счетного множества. В то же время выше (в рассказе о трансфинитных числах) мы говорили о числе Q, которое является первым несчетным трансфинитным числом. Это означает, что интервал (0; Q) имеет мощность большую, чем и притом эта мощность — самая маленькая из тех, которые больше Эту мощность обозначают через Следовательно, © > поскольку (5 > Kq, a Kj — наименьшая из мощностей, которые больше

Гипотеза континуума состоит в том, что © совпадает с Кр т. е. что © и есть та наименьшая мощность, которая превосходит Xq. Верно ли это? Ответ на этот вопрос (ждавший своего решения почти столетие), а также на вопрос, «верна ли» аксиома выбора, и был дан П. Коэном. Он установил, что на эти вопросы невозможно дать ответ. Несколько более точно: если к основным аксиомам теории множеств (так называемым аксиомам Цермело—Френкеля) мы присоединим в качестве аксиомы континуум-гипотезу, то мы получим столь же непротиворечивую теорию множеств, как и в том случае, если мы присоединим к основным аксиомам предложение, противоположное континуум-гипотезе (т. е. предположение, что © > Xj). Более того, если к основным аксиомам мы присоединим аксиому выбора, то получим столь же непротиворечивую теорию множеств, как и в том случае, если мы присоединим к основным аксиомам отрицание аксиомы выбора. Получается, что мы обладаем по крайней мере четырьмя различными теориями множеств (с континуум-гипотезой или без нее, с аксиомой выбора или без нее), и все они в одинаковой степени непротиворечивы! О том, что такое непротиворечивость, мы поговорим в беседе 13.

В заключение расскажем о лемме Цорна, применение которой часто бывает удобнее, чем непосредственное использование трансфинитной индукции. Прежде всего введем одно определение. Пусть M — упорядоченное множество. Цепь А, содержащаяся в М, называется ограниченной, если в M имеется такой элемент q (принадлежащий или не принадлежащий цепи А), что a<q для любого ае А.

Лемма Цорна. Если все цепи, содержащиеся в упорядоченном множестве М, ограничены, то M содержит (хотя бы один) максимальный элемент.

Мы докажем эту лемму с помощью трансфинитной индукции. Предположим, что все цепи, содержащиеся в упорядоченном множестве М, ограничены, но M не содержит ни одного максимального элемента, и приведем это предположение к противоречию. Выберем

такое трансфинитное число р, что интервал (0; р) имеет большую мощность, чем множество М. Мы докажем, что можно для любого a g (0; р) выбрать элемент ха g M, который больше любого из ранее выбранных элементов, т. е. х^ < ха при £ < ос. Это утверждение обозначим через Т и будем его доказывать с помощью трансфинитной индукции. Начало индукции ясно: мы выбираем произвольный элемент множества M и обозначаем его через Ху Осуществим теперь индуктивный переход. Пусть элементы х^ уже выбраны для всех £ < ос. Нетрудно видеть, что элементы х^, взятые для всех £ < ос, образуют цепь. В самом деле, пусть Ç и Г| — два различных трансфинитных числа, принадлежащих интервалу (0; а). Так как множество трансфинитных чисел вполне упорядочено, то в множестве {£, т)} имеется наименьший элемент; пусть, скажем £<Т|. Тогда х^ выбран ранее, чем jÇrç, и потому х^<х^. Таким образом, для любых т) g (0; а) элементы х^, х^ связаны одним из соотношений х^<х^, х^<х^ (в зависимости от того, будет ли £ < Т) или Г| < Ç). Это означает, что множество всех х^, взятых для Ç g (0; а), представляет собой цепь. Так как, по предположению, все цепи, содержащиеся в М, ограничены, то существует в M такой элемент q, что х^ < q для всех Ç g (0; а). Но мы предположили, что в M нет ни одного максимального элемента. Значит, элемент q не является максимальным в M и потому существует такой элемент ха g M, что q < ха. Но тогда х^ < q < ха для любого Ç g (0; а), т. е. ха больше всех ранее выбранных элементов. Этим осуществлен индуктивный переход.

Проведенная трансфинитная индукция означает, что элементы ха можно выбрать для всех a g (0; р), причем они попарно различны (поскольку х^<ха при £ < а). Иначе говоря, полагая f(a) = xa для любого ос g (0; р), мы получаем вложение интервала (0; р) в множество М. Однако это невозможно, поскольку мощность интервала (0; р) больше мощности множества М. Полученное противоречие означает, что предположение об отсутствии в M максимальных элементов ложно, т. е. в M найдется хотя бы один максимальный элемент, чем и завершается доказательство.

Читатель заметил, конечно, что мы и здесь применили аксиому выбора. Вообще, большинство математиков предпочитает работать в такой теории множеств, в которой аксиома выбора выполняется.

Глава II. КОМБИНАТОРИКА

Беседа 6. Размещения, сочетания и родственные задачи

23. Размещения с повторениями

Комбинаторику можно назвать количественной теорией конечных множеств. Допустим, мы имеем некоторое конечное универсальное множество U и рассматриваем его подмножества некоторого специального вида (скажем, содержащие данное число элементов). Сколько таких подмножеств имеется в IP. Или рассматриваются отображения U —> А некоторого специального вида (где А — заданное конечное множество). Сколько таких отображений существует? Решение этих и аналогичных задач и составляет содержание комбинаторики.

В этом пункте мы рассмотрим вторую из этих задач. Пусть множество U содержит к элементов, скажем U = {1,2,к}, а множество А содержит п элементов. Чтобы задать отображение f:U—>A, мы должны указать образы всех элементов 1, 2, т. е. указать некоторые элементы a^=f(\), a2=f(2), ak=f(k) множества А. Иначе говоря, мы должны задать некоторую последовательность av av aJ<9 состоящую из к элементов множества А, т. е. задать некоторое «слово», «буквами» которого являются элементы множества А, причем рассматриваются только слова, состоящие из к букв.

Пусть, например, к = 2, причем «алфавит» А состоит всего из трех букв: А = {а, Ь,с}. В этом случае имеется девять слов:

В самом деле, на первое место мы можем поставить любую из трех букв а, Ь, с, и, независимо от этого, мы можем на второе место поставить любую из трех букв, откуда и получается 3-3 = 9 двухбуквенных слов. А если алфавит А содержит п «букв», то имеется п-п = п2 двухбуквенных слов. Это можно пояснить и так: каждое двухбуквенное слово представляет собой пару (ßpß2) из двух элементов g A, üy g А, т. е. такое слово есть элемент произведения АхА, а это произведение содержит п элементов.

Далее, из алфавита А, содержащего п букв, можно составить rf трехбуквенных слов. В самом деле, мы имеем п2 двухбуквенных слов, и к каждому из них можно приписать на третьем месте любую из п букв, т. е. получается п-п = п трехбуквенных слов. Теперь уже понятно, что /:-буквенных слов, при составлении которых используется п букв, всего имеется п1х (на самом деле это «понятно» означает, что можно провести математическую индукцию по к). Например, из русского алфавита, содержащего 32 буквы (включая ё, й, ь, ъ), можно составить 324= 1048576 четырехбуквенных слов (если, конечно, не

обращать внимания на семантическую значимость, т. е. допускать любые слова, скажем, «иуэо» или «ьььь»).

Рассмотренную задачу можно охарактеризовать как задачу о размещении п букв на к последовательных местах, причем в одном слове могут повторяться одинаковые буквы. Поэтому говорят о размещениях с повторениями.

Возвращаясь к отображениям, мы можем сформулировать полученный результат следующим образом: существует п/х отображений множества U = {1,2,к} в множество А, содержащее п элементов.

Можно рассмотреть более общий случай, когда используются «буквы» из двух (или нескольких) «алфавитов». Пусть, например, рассматриваются слова из р + q букв, в которых первые р букв принадлежат алфавиту А, содержащему m букв, а последующие q букв принадлежат алфавиту В, содержащему п букв.

Тогда первые р букв дают слово из алфавита А (таких слов имеется тр), а последующие q букв составляют слово из алфавита В (таких слов имеется nq). Так как любому способу записать первые р букв можно сопоставить любой из способов записи последующих q букв, то всего имеется mpnq требуемых слов.

Пусть, например, номер автомашины содержит четыре цифры и три буквы (скажем, 6257 МТА), причем используются десять цифр О, 1, 2, 9 и 27 букв русского алфавита (поскольку ё, й, ь, ъ, ы исключаются). Тогда на первых четырех местах мы можем написать 104 комбинаций цифр, из которых, однако, надо исключить неиспользуемую комбинацию 0000, т. е. имеется 9999 допустимых комбинаций цифр. Буквенных же комбинаций имеется 27 . Таким образом, можно написать 9999-27J = 196 810 317 всех мыслимых автомобильных номеров рассматриваемого вида.

Отдельного рассмотрения заслуживает случай, когда «алфавит» А состоит только из двух букв А - {0, 1}. Сколько в этом случае существует отображений U —> Al Ответ не кажется интересным: поскольку п = 2, то из рассмотренного ранее общего результата вытекает, что имеется 2к отображений /:£/—» {0, 1}, если, как и прежде, U содержит к элементов. Однако этот подсчет допускает интересную трактовку.

Каждое отображение/: £/ —> {0, 1} однозначно определяется, если указано подмножество M =f~\\) множества U. В самом деле, тогда /_1(0) есть дополнение сМ множества M и, значит, для каждого ие U известен его образ: f(u)=\, если иеМ, и f(u) = 0, если и Е (сМ). Иначе говоря, каждое отображение /: £/—> {0, 1} представляет собой характеристическое отображение некоторого подмножества M с: U. Сколько подмножеств, столько и отображений, а отображений, как мы знаем, имеется 2к. Следовательно, множество U,

содержащее к элементов, имеет 2 подмножеств (включая пустое множество и само множество U).

В связи с этим множество всех подмножеств множества U принято обозначать через 2и (оно содержит 2^ элементов). Это обозначение применяется и в том случае, когда множество U бесконечно.

В этой связи отметим (хотя это и не относится к комбинаторике конечных множеств) следующую теорему Кантора: для всякого множества U множество всех его подмножеств имеет большую мощность, чем само множество U, т. е. \2и\ > \ U\ (см. упр. 20). В частности, если мы рассмотрим всевозможные подмножества множества R действительных чисел, то они образуют множество, мощность которого больше, чем мощность множества действительных чисел, т. е. 2® > (5 (иногда мощность 2^ называют гиперконтинуумом).

Заметим еще, что 2xo = ß — это также было установлено Кантором. Иначе говоря, в множестве натуральных чисел имеется столько же всевозможных подмножеств, сколько имеется действительных чисел. Рассмотрим идею доказательства. Для всякого подмножества MczN можно рассмотреть соответствующее «размещение с повторениями», т. е. последовательность из нулей и единиц, в которой единицы стоят на тех местах, номера которых принадлежат множеству M, а нули — на остальных местах. Например, множеству М, состоящему из всех четных чисел, соответствует последовательность 01010101... . Теперь условимся каждую такую последовательность считать бесконечной двоичной дробью, у которой целая часть равна нулю. В частности, множеству всех четных чисел соответствует двоичная дробь 0,01010101... (можно доказать, что она изображает число I"). Таким образом, каждой последовательности из нулей и единиц (т. е. каждому подмножеству множества N) соответствует некоторое действительное число, принадлежащее отрезку [0; 1]. Этим определяется некоторое отображение ф множества всех подмножеств множества N в отрезок, т. е. ср: 2^—» [0; 1]. Если бы это отображение было взаимно однозначным, то мы и получили бы доказательство равенства 2**о = ®. В действительности отображение ф является наложением, но взаимно однозначным оно не является; например, бесконечные двоичные дроби 0,10000... и 0,01111... изображают одно и то же число }г. Эту некорректность можно исправить, т. е. превратить идею в строгое доказательство, но как это сделать, мы здесь говорить не будем.

Задачи и упражнения

76. Сколько существует семизначных чисел, не содержащих цифру 7?

77. Шифр устроен следующим образом: каждой цифре соответствует одна из трех букв (см. таблицу), а знаку * — одна из двух букв или пробел.

Рассмотрим запись 5545643*8265. Сколькими способами можно ее восстановить? Какой из них содержателен?

78. Попробуйте найти хотя бы одну осмысленную расшифровку следующей записи: 5343934*150413*6*8156215044414*305041080.

79. Автомобильные номера содержат три буквы и пять цифр, например, Р 502 ВВ 77. Сколько может быть различных автомобильных номеров такого вида?

80. Известна легенда об изобретателе шахмат, который попросил у индийского раджи в награду следующее количество зерен пшеницы: одно на первую клетку, два на вторую, четыре на третью и т. д., удваивая каждый раз количество зерен. В результате получилось количество зерна, которое на земле можно получить лишь за несколько столетий.

Рассмотрим следующую задачу. На каждую клетку шахматной доски либо кладется одно зерно, либо не кладется зерна. Что больше: количество вариантов раскладки или количество зерен, потребованных изобретателем шахмат?

24. Системы счисления

Упомянутая выше двоичная система обозначения чисел (как и другие системы счисления) имеет непосредственное отношение к размещениям с повторениями.

Когда мы говорим «пять тысяч семьсот шестьдесят три», мы имеем в виду число 5-1000 + 7-100 + 6-10 + 3 = 5-Ю3 + 7-102 + 6-10 + 3, т. е. число, разложенное по степеням десятки с коэффициентами (цифрами), не превосходящими 9. Использование числа 10 в качестве основания системы счисления имеет историческое происхождение, несомненно связанное (полностью или частично) с наличием десяти пальцев на двух руках человека. Имеются и другие системы счисления. Сравнение денежных единиц мина и шеккель, бывших в ходу у древних шумеров и аккадян, привели к созданию шестидесятеричной системы счисления, остатки которой мы встречаем и сегодня (минута содержит 60 секунд, а час содержит 60 минут, т. е. 602 секунд; аналогично при измерении углов: градус, минута, секунда). Для представления цифровой информации на различных носителях (числовая информация на дисках компьютеров, звуковая информация на компакт-дисках и т. п.) широко используются двоичная, восьмеричная и шестнадцатиричная системы счисления.

В общем случае при использовании системы счисления, основанием которой служит натуральное число п> 1, числа записываются в форме

(1)

где Яр а2, af< — цифры числа с, каждая из которых может принимать значения 0, 1, п— 1 (причем обычно первая слева цифра

берется отличной от нуля, поскольку при а^=0 можно в записи (1)

просто отбросить первое слагаемое и считать, что число с имеет меньшее количество цифр). Любое натуральное число однозначно записывается в виде (1). В самом деле, рассмотрим все /:-значные числа в системе с основанием п, т. е. числа вида (1), или, короче,

(2)

где черта сверху и верхний индекс п означают, что рассматривается не произведение а^а2 ... ак, а запись числа в системе с основанием п.

При такой записи мы будем допускать, что и первые цифры могут быть нулями: например, «четырехзначными» в десятичной системе будут при таком соглашении числа 0001, 0019, 0162, 5837 и т. п., т. е. все числа, являющиеся при обычном понимании (т. е. без нулей слева) не более чем четырехзначными.

Количество /:-значных чисел (2), т. е. количество слов из к букв в алфавите А = {0, 1, ...,п - 1}, как мы видели выше, равно пк\ но так как запись 00 ... 0^ изображает нуль, а не натуральное число, то получается пк - 1 записей натуральных чисел в виде (2) (или, более подробно, в виде (1)). И как раз следующее натуральное число, т. е. п]\ представляет собой первое (к+ 1)-значное число и записывается в виде 1 -пк + 0-пк~1 + ... + 0-п + 0. Это рассуждение можно превратить с помощью индукции в корректное доказательство того, что любое натуральное число может быть записано (и притом однозначно) в системе счисления с основанием п.

В такой системе счисления действия выполняются по той же схеме, что и в привычной нам десятичной системе; надо только иметь под руками таблицу сложения и таблицу умножения цифр в этой системе. Например, в восьмеричной системе имеются 8 цифр, а таблицы сложения и умножения выглядят следующим образом:

Имея таблицы сложения и умножения, нетрудно производить обычные действия столбиком, повторяя про себя, скажем, «три пишем, пять в уме», и т. д. Например, в восьмеричной системе (мы не пишем для простоты записи верхний индекс (8)):

Особенно просто выполняются действия в двоичной системе, поскольку в ней очень компактно выглядят таблицы сложения и умножения:

Правда, эта простота не дается даром: запись чисел в двоичной системе гораздо длиннее их десятичной записи: 14^°) = 1110^, 37(10)= 100101(2) и т. п. Однако простота таблиц сложения и умножения оказывается чрезвычайно удобной для применения этой системы в электронных схемах компьютеров.

Интересно, что гениальный философ и математик Готфрид Вильгельм Лейбниц высоко ценил возможности двоичной системы. Лаплас писал: «В своей бинарной арифметике Лейбниц видел прообраз творения. Ему представлялось, что единица — божественное творение, а нуль — небытие, и что Высшее Существо создает все сущее из небытия подобно тому, как единица и нуль в его системе выражают все числа».

В заключение рассмотрим одну шуточную задачу, бытовавшую в довоенном мехматском фольклоре Московского университета. В то время на велосипеды выдавались шестизначные номера. Номер считался «несчастливым», если в нем есть хотя бы одна цифра 8 (поскольку «восьмерка» — один из дефектов велосипедного колеса). Вопрос заключается в том, чтобы решить, каких номеров больше, счастливых или несчастливых. На первый взгляд кажется, что поскольку 8 — лишь одна цифра из десяти возможных, то счастливых номеров в несколько раз больше. Но проведем точные расчеты.

Счастливый номер — это шестибуквенное слово в «алфавите», содержащем девять букв (все цифры, кроме восьмерки). Число таких слов равно 96 = 531 441, но слово 000000 непригодно в качестве велосипедного номера, т. е. число счастливых номеров равно 531 440. Остальные номера — несчастливые, их 999 999-531 440 = 468 559, т. е. ненамного меньше, чем счастливых. А если бы номера были семизначными, то счастливых номеров было бы меньше, чем несчастливых.

Задачи и упражнения

81. Запишите число 2002 в двоичной системе счисления.

82. Докажите, что число, записанное в троичной системе счисления, делится на 2, если сумма его цифр делится на 2.

83. Числа 1101е ^ и 11011е ' записаны в двоичной системе счисления. Чему равна их сумма в этой системе? А в десятичной?

84. При каком основании системы счисления имеет решение следующий числовой ребус: КИТО + КИОТО = ТОКИО? (Одинаковым буквам должны соответствовать одинаковые цифры, разным—разные; Кито, Киото и Токио — крупные города Японии.)

85. В какой системе счисления 132= 171?

25. Размещения без повторений

В пункте 23 мы рассмотрели всевозможные отображения /: U^ А. Число таких отображений равно пк, где к — число элементов множества U = {1, 2,...,к), а п — число элементов множества А. Теперь мы рассмотрим не произвольные отображения f.U—>A, а только вложения. Сколько вложений f:U—>A существует?

Как мы знаем, произвольное отображение f:U—>A представляет собой некоторое слово из к букв, причем буквами являются элементы «алфавита» А. При этом буквы /(1) = а^, f(2) = л2, ••• >Ак) = аь могут быть частично совпадающими, т. е. в слове могут быть повторяющиеся буквы. Отображение f: U—> А в том случае является вложением, если в нем нет повторяющихся букв, т. е. все элементы множества fiJJ) попарно различны. Иначе говоря, чтобы получить вложение /: U^A, мы должны задать некоторую последовательность, состоящую из к элементов а^, а2, ак множества А, но так, чтобы в этой последовательности не было повторяющихся элементов. Такие последовательности называются размещениями без повторений (состоящими из к элементов множества А). Разумеется, когда мы говорим о последовательности, то имеем в виду упорядоченное множество элементов множества А, так что перестановки элементов друг с другом не допускаются. Например, а^а2а^ ... ак и а2а^а^ ... а}< — это различные размещения.

Отличие между размещениями с повторениями и размещениями без повторений можно пояснить еще следующим образом. Предположим, что у нас имеется набор «образцов» букв (т. е. элементов, входящих в алфавит А). При употреблении какой-либо буквы мы изготавливаем ее копию, поэтому каждая буква может быть изготовлена во многих экземплярах, так что при наборе слова мы можем использовать любое число экземпляров каждой буквы. Тогда слова получаются с возможными повторениями букв, т. е. мы получаем размещения с повторениями.

Совершенно иная ситуация возникает, если каждый элемент множества А уникален, т. е. имеется лишь в единственном экземпляре. Тогда, если мы уже использовали элемент а в качестве буквы некоторого слова, то его уже больше нет среди оставшихся элементов множества А, т. е. повторно использовать его в качестве буквы в этом слове мы уже не можем. Это и дает размещения без повторений. Например, если мы хотим построить в некоторой последовательности

пять учеников данного класса, то мы не можем поставить некоторого ученика на двух разных местах в одной и той же последовательности (ведь это только в фантастических рассказах у человека могут быть «двойники», т. е. один и тот же человек может существовать в нескольких экземплярах!). Поэтому последовательность пяти построившихся учеников представляет собой размещение без повторений (содержащее пять элементов данного множества, т. е. класса).

Теперь, выяснив природу размещений без повторений, мы ответим на вопрос о числе таких размещений. Итак, нам нужно составить последовательность av а2, а}< элементов данного множества (без повторений). Так как множество А содержит п элементов, то у нас есть п возможностей выбрать первый элемент последовательности. После этого остался п-\ элемент множества А, и каждый из них может быть взят в качестве второго элемента последовательности. Значит, у нас имеется п(п-\) возможностей выбрать первые два элемента последовательности. Теперь осталось п- 2 элемента множества А, и каждый из них может быть выбран в качестве третьего элемента последовательности. Поэтому у нас имеется п(п-\)(п-2) возможностей выбрать первые три элемента последовательности. Аналогично, имеется п(п - \){п- 2)(п - 3) возможностей выбрать первые четыре элемента последовательности и т. д. Продолжая, мы получаем выражение

(3)

дающее число размещений без повторений по к элементов, взятых из п элементов множества А. Разумеется, при этом предполагается, что к<п. В самом деле, ведь в множестве А имеется только п элементов, и потому выбрать из них больше чем п элементов (без повторений) невозможно.

Если, в частности, к = п,т. е. мы хотим последовательно расположить все п элементов множества А, то, согласно (3), число таких последовательностей равно п(п - \)(п - 2)-...-2-1, т. е. равно произведению всех натуральных чисел от 1 до п (включительно). Это произведение обозначается через п\, т. е. п\ - \-2-...-(п- Х)п.

Итак, число всех последовательностей, в виде которых можно расположить все п элементов множества А, равно п\. Эти последовательности называют также перестановками (из п элементов множества А).

В качестве примера рассмотрим простой случай, когда п = 3, т. е. множество А= {а,Ь,с} содержит лишь три элемента, а к = 2, т. е. рассматриваются размещения по два элемента. Число размещений с повторениями равно 32 = 9. Вот эти размещения: аа, ab, ас; ba, bb, be; са, cb, ce.

Далее, число размещений без повторений, согласно формуле (3), равно 3-2 = 6. Эти размещения ab, ас; ba, be; са, cb получаются, если

Рис. 165 Рис. 166

в предыдущем списке вычеркнуть размещения, в которых имеются повторения.

Наконец, число перестановок, т. е. размещений без повторений, содержащих все три элемента, равно 3! = 1-2-3 = 6. Вот эти перестановки: abc, ach, bac, Ъеа, cab, cba.

В виде упражнения читатель может подсчитать, сколько имеется размещений и перестановок из четырех и из пяти элементов (т. е. для п = 4 или п = 5).

В заключение рассмотрим несколько примеров.

На плоскости даны п точек а^, а2, а (причем для наглядности будем считать, что никакие три из них не лежат на одной прямой). Сколько существует векторов (направленных отрезков), идущих от какой-либо одной из этих точек к некоторой другой? Чтобы задать вектор, надо выбрать одну из точек а^, а2, а в качестве его начала, а другую — в качестве его конца, т. е. надо рассматривать размещения (без повторений, поскольку вектор идет от одной из точек к некоторой другой) по два элемента, составленные из элементов множества А = {а^,а2, ...,^}. Согласно (3), число таких размещений (т. е. искомых векторов) равно п(п-\). Если, например п = 5, то получается 5-4 = 20 векторов (рис. 165).

Второй пример. На собрании членов кооператива присутствовали п человек. Надо выбрать председателя, его заместителя и секретаря. Сколькими способами это можно сделать? Речь идет о последовательности, содержащей три элемента из заданных п элементов, т. е. о размещениях без повторений (поскольку один человек не может быть председателем ив то же время его заместителем или секретарем) по 3 элемента из заданных п. Число таких размещений равно п(п - \){п- 2), что и дает ответ в рассмотренной задаче. Если, например, на собрании присутствовали 20 человек, т. е. п = 20, то число возможностей равно 20-19-18 = 6840.

Рассмотрим теперь пример на число перестановок, т. е. последовательностей, в которых участвуют все элементы множества А (без повторений). На гулянье собрались 7 девушек и баянист. Когда баянист заиграл хороводную, девушки решили стать в кружок (хоровод). Сколько есть у них возможностей организовать хоровод? Для реше-

ния отметим одну из девушек (скажем, старшую). Теперь надо указать, где будут располагаться остальные девушки: кто будет первой по кругу (против хода часовой стрелки) от старшей, кто будет второй, третьей, шестой (рис. 166). Значит, задача заключается в том, чтобы пересчитать все способы расположить шесть девушек в последовательность (первая по кругу от старшей, вторая, .... шестая). Иначе говоря, речь идет о всех перестановках из п элементов, где п = 6. Число таких перестановок равно п\ - 6! = 1-2-3-4-5-6 = 720.

Мы рассмотрели два крайних случая: размещения с повторениями, когда каждый элемент может повторяться в последовательности любое число раз, и размещения без повторений, когда каждый элемент может встречаться в последовательности не более чем один раз. Могут представляться и различные промежуточные случаи, рассмотрение которых оказывается более сложным. Например, представим себе, что каждая «буква» (т. е. элемент множества А) может копироваться не более двух раз. Тогда в качестве размещений могут быть взяты последовательности, в каждой из которых любая буква может встречаться не более двух раз.

Задачи и упражнения

86. Сколько имеется способов проставить оценки четырем студентам так, чтобы все они получили разные отметки?

87. Сколько существует пятизначных чисел, у которых цифры убывают, например, как у числа 76310?

88. 25 шахматистов проводят турнир. Его исходом считается указание того, кто занял первое место, кто — второе и кто — третье. Сколько исходов может иметь турнир?

89. В городе 10 музеев. Турист решил их все посетить, но никак не может решить в каком порядке это сделать. Сколько у него вариантов?

90. Сколькими способами можно сделать трехцветный флаг с горизонтальными полосами одинаковой ширины, если имеются материалы шести различных цветов?

26. Сочетания без повторений

Рассмотрим теперь первую из задач, упомянутых в начале этой беседы. Она формулируется более детально следующим образом. Имеется множество А, содержащее п элементов; сколько в нем имеется подмножеств, каждое из которых содержит к элементов? Число таких подмножеств обозначается через

Решение этой задачи, т. е. нахождение явного выражения для можно свести к рассмотрению ранее изученных задач. В самом деле, пусть некоторое подмножество, содержащее к элементов. Подмножество не является последовательностью, т. е. элементы в нем не считаются как-либо упорядоченными. Однако мы можем упорядочить эти элементы, т. е. расположить их в некоторой последовательности. Так как в рассматриваемом подмножестве имеется к элементов, то всевозможных таких последовательностей

Рис. 167 Рис. 168 Рис. 169

(т. е. перестановок элементов bf<) имеется к\. Если же мы возьмем в А всевозможные подмножества, содержащие к элементов, и для каждого из этих подмножеств возьмем все перестановки его элементов, то мы получим все размещения, состоящие из к элементов множества А. Отсюда получается соотношение

которое и дает решение интересующей нас задачи:

(4)

Это решение можно записать и иначе. Если умножить числитель и знаменатель полученной дроби на число (п-к)\= 1-2- ... -(п-к), то в числителе получится число п\. Значит,

(5)

Формула (5) представляется «более красиво» записанной, чем (4). Впрочем, в некоторых случаях выражение (4) более удобно для вычислений, чем (5).

Иногда говорят не о подмножествах, содержащих к элементов, а о «сочетаниях» из п элементов по к (где п — число всех элементов, имеющихся в множестве А). Формула (4) (или (5)) дает выражение для числа сочетаний.

В качестве примера рассмотрим следующую задачу: сколько диагоналей имеется в выпуклом ^-угольнике (рис. 167)? Так как в я-угольнике имеется п вершин, то в его множестве вершин существует подмножеств, содержащих по два элемента.

Каждое такое подмножество определяет либо сторону, либо диагональ (рис. 168). Значит, число всех сторон плюс число всех диагоналей равно f^J А так как у ^-угольника имеется п сторон, то число его диагоналей равно

(6)

Впрочем, этот же результат можно получить и с помощью другого комбинаторного рассуждения. Из каждой вершины /z-угольника исходят /7-3 диагонали (они идут из вершины А ко всем вершинам, кроме самой вершины А и двух смежных с ней вершин, рис. 169). Так как всего имеется п вершин, и из каждой исходят п-Ъ диагонали, то мы таким образом насчитаем п{п - 3) диагоналей. Однако при таком подсчете мы засчитаем каждую диагональ дважды (с одного и с другого конца). Значит, число диагоналей вдвое меньше, чем п(п - 3), что и дает полученный ранее результат (6).

Рассмотрим еще один геометрический пример. На плоскости даны п точек, никакие три из которых не расположены на одной прямой; сколько имеется треугольников с вершинами в этих точках? Ответ очевиден: чтобы получить треугольник, надо взять в качестве вершин какие-либо три из данных точек; поэтому число всевозможных треугольников с вершинами в этих точках равно

Например, для семи точек (т. е. при п = 7) получается 35 треугольников.

К задаче о числе сочетаний без повторений можно подойти и иначе. Выбрать из множества А = {а^а2, ...,ап} некоторое подмножество, содержащее к элементов, — это все равно что разбить множество А на две части, первая из которых содержит к элементов, а вторая — остальные п - к элементов. Число таких разбиений (т. е. число сочетаний из п элементов по к) равно

А сколько будет разбиений множества А на три части, первая из которых содержит к элементов, вторая содержит / элементов (отличных от выбранных к), а третья — остальные п-к-1 элементов? Ответ нетрудно получить с помощью формулы (5). В самом деле, выбрать из А какие-либо к элементов можно уЛ способами. Далее, выбрать из оставшихся п-к элементов какие-либо / элементов можно способами. А третье множество выбирать уже не нужно: в него войдут п-к-1 оставшиеся элементов. Значит, разбить множество А на три группы указанного вида можно способами.

Аналогичное рассуждение позволяет получить и более общий результат. Пусть дано некоторое множество А, содержащее п элемен-

тов, и мы хотим разбить его на q групп элементов, первая из которых содержит &j элементов, вторая содержит к2 элементов, .... q-я группа содержит к элементов (при этом, когда мы говорим о «разбиении», то предполагаем, что эти группы попарно не имеют общих элементов, а их объединение есть все множество А, т. е. к^ + к2 +... +к = п).

Сколько таких разбиений существует? Рассуждая так же, как и выше, мы найдем, что число таких разбиений равно

(7)

Например, во время военной игры девять мальчиков решили разбиться на три группы, первая из которых (разведка) должна содержать трех из них, вторая (группа захвата) — четырех, а третья (штаб) — двух мальчиков. Сколькими способами они могут разбиться на группы такого вида? Согласно (7), число способов равно

Задачи и упражнения

91. Докажите, что

92. Предлагается тест из 10 вопросов. Известно, что на половину из них следует ответить «да», а на вторую половину — «нет». Сколькими способами можно ответить на вопросы теста при данном условии?

93. Сколько различных слов (не обязательно осмысленных) можно получить, переставляя буквы в слове «МАТЕМАТИКА»?

94. Из 20 бусин различного цвета собирается ожерелье. Сколькими различными способами можно расположить на нем бусины?

95. В шахматном турнире Женя и Саша сыграли одинаковое количество партий, заболели и выбыли из турнира. Остальные участники турнира доиграли до конца. Всего было сыграно 28 партий. Играли ли Женя и Саша в турнире между собой?

27. Сочетания с повторениями

Теперь мы рассмотрим ситуацию, которая приведет нас к другому типу комбинаторных задач. Имеются рублевые марки четырех цветов: желтые, зеленые, красные и синие. На почтовый конверт надо наклеить 9 рублевых марок. Сколькими способами это можно сделать? Если мы условимся выклеивать марки в одну линию (скажем, по верхнему краю конверта), то получим уже известную нам задачу: составить слово из девяти букв, используя алфавит {Ж, 3, К, С} (начальные буквы цветов). Это — задача на размещения с повторениями, рассмотренная в п. 23. Она имеет пк решений, где в данном случае п = 4, к = 9, т. е. задача имеет 49 = 262 144 решения.

Однако рассмотрим другой вариант этой задачи — нам надо купить эти марки, а порядок расположения марок на конверте не играет роли (их можно клеить где угодно), важен лишь цветовой

состав выбираемых девяти марок. Тогда задача принимает следующую форму. Имеется папка (скажем, на почте), содержащая достаточно много марок типа Ж, 3, К и С. Сколькими способами можно выбрать из этой папки набор (неупорядоченный!), содержащий девять марок?

Для решения этой задачи будем характеризовать каждый интересующий нас набор следующим образом. Сначала выпишем последовательно столько единиц, сколько в наборе имеется марок типа Ж. Затем поставим нуль, после которого запишем столько единиц, сколько в наборе марок типа 3. После этого снова поставим нуль и столько единиц, сколько взято марок типа К. Наконец, нуль и столько единиц, сколько взято марок типа С. Например, запись 111101101011 означает, что в набор вошли четыре марки Ж, две 3, одна К и две С, а запись 111110001111 означает, что был взят набор, в котором пять марок Ж и четыре С, а 3 и К не было взято совсем.

Каждая получаемая запись содержит 9 единиц и 3 нуля, причем набор букв (типов марок) Ж, 3, К, С, описываемый этой записью, определяется тем, на каких местах стоят нули. Сколько есть записей (т. е. слов, состоящих из девяти единиц и трех нулей), столько и существует интересующих нас наборов из букв Ж, 3, К, С. Но число слов из девяти единиц и трех нулей равно числу сочетаний из 12 элементов по 3: надо из 12 мест выбрать три, на которых будут стоять нули. Значит, число решений равно

Как видим, отказ от рассмотрения порядка, в котором выклеиваются марки, существенно уменьшил число решений (т. е. наборов марок).

В рассмотренной задаче используются сочетания с повторениями. В общем случае эта комбинаторная задача может быть сформулирована следующим образом. Рассматривается алфавит А из п букв и имеется папка, содержащая достаточно большое число экземпляров каждой буквы. Нас интересует, сколькими способами можно выбрать из этой папки неупорядоченный набор, содержащий к букв. Такие наборы называются сочетаниями с повторениями из п элементов по к. Ответ получается дословно так же (выписыванием последовательностей из нулей и единиц), как и в рассмотренной выше задаче о почтовых марках: число сочетаний с повторениями из п элементов по к равно

Так, в задаче о почтовых марках мы имели п = 4, к = 9, т. е. п + к- 1 = 12 и потому число решений равно

Как и в случае размещений, мы рассмотрели два крайних случая задач на сочетания. В первом случае (сочетания без повторений) каждый элемент множества А был уникален, т. е. имелся в единственном экземпляре, и нас интересовали всевозможные подмножества

множества А, содержащие к элементов. Во втором случае (сочетания с повторениями) элементы множества А, т. е. «буквы», были изготовлены в неограниченном количестве экземпляров («касса букв»), и нас интересовало, сколько различных наборов, содержащих к букв, можно составить с помощью этой кассы. Возможны и различные промежуточные случаи. Скажем, буква может иметься в кассе в количестве экземпляров, буква а2 — в количестве т2 экземпляров, буква ап — в количестве тп экземпляров, и нас интересует, сколько сочетаний из к элементов может быть составлено с помощью этой кассы. Формулы для решения этой задачи являются более сложными.

Задачи и упражнения

96. В магазине продаются пирожные четырех сортов; эклеры, слоеные, песочные и бисквитные. Сколькими различными способами можно составить набор из десяти пирожных, если в наборе должно быть хотя бы одно пирожное каждого сорта?

97. В джаз-оркестре из 7 человек должны быть трубачи, ударники и саксофонисты (хотя бы по одному). Сколько различных составов таких оркестров может быть?

98. В фондовом магазине предлагаются акции семи компаний. Сколькими способами можно купить десять акций?

99. Король Эмирии учредил четыре военных ордена. Сколькими способами он может наградить семью орденами своего военного министра?

100. ООН формирует батальон миротворческих сил для поддержания мира в одной из стран. В создании этого батальона готовы принять участие 12 стран. Сколькими способами можно сформировать батальон, если в нем 6 взводов и каждая страна готова послать необходимое количество взводов?

28. Бином Ньютона

Биномом (или двучленом) называют сумму двух слагаемых, например, х + а. В школе хорошо известны формулы для квадрата и куба такого бинома:

Речь идет о нахождении формулы для (х + а)п в случае произвольного натурального п.

По определению (х + а)п = (х + а)(х + а)...(х + а), где в правой части имеется п множителей. Нам надо написать выражение, получающееся при раскрытии скобок. Это выражение является суммой одночленов, каждый из которых получается, когда из каждой скобки берется одно из слагаемых (х или а) и они перемножаются, а затем приводятся подобные члены; поэтому слагаемые имеют вид скхп~как. Если в каждой из скобок (х + а) мы возьмем первое слагаемое х, то получится произведение хп. Далее, если в одной из скобок взять я, тогда как во всех остальных взять х, то получится произведение хп~^а. Сколько

раз оно войдет в сумму, получающуюся при раскрытии скобок? Ясно, что оно получится столько раз, сколькими способами можно отметить одну скобку (в которой мы берем а) из имеющихся п скобок, т. е. столько, сколько имеется одноэлементных подмножеств в множестве {1,2, п). Поэтому при раскрытии скобок получится (j j-'2 слагаемых хп~^а:

Следующим возможным слагаемым будет

Таких слагаемых при раскрытии скобок получится столько, сколькими способами можно отметить две скобки (в которых мы берем а) из имеющихся п скобок, т. е. получится

Вообще, слагаемое хп как получится столько раз, сколькими способами можно выбрать к скобок (в которых мы берем а) из имеющихся п скобок, т. е. оно получится к J раз. Это и дает формулу Ньютона:

(8)

Здесь последнее слагаемое ап получается, если из всех скобок взять а; это можно сделать гч способами (т. е. единственным способом), и потому это слагаемое входит с коэффициентом 1-

Аналогичными рассуждениями может быть получена более общая формула

(9)

в которой знак (суммирование) распространен на всевозможные способы представить п в виде п = к^ + к2 + ••• +к . В самом деле, произведение хк\ хк22... xkq4 получится при раскрытии скобок столько раз, сколько есть разбиений множества {1,2, п) (т. е. множества номеров скобок) на q групп, в первой из которых имеется к^ элементов

(это будут те скобки, из которых мы берем Xj), во второй к2 элементов

(это будут скобки, из которых мы берем х2), в q-и элементов.

Число таких разбиений дается формулой (7), откуда и вытекает соотношение (9).

Например, если п = 3 т. е. имеется только три слагаемых xv х2, Ху то получается следующее соотношение:

Коэффициент при последнем слагаемом получается как

Вернемся к формуле Ньютона (8). Полагая в ней х= 1, а - 1, мы получаем интересное соотношение

(10)

Впрочем, это соотношение станет очевидным, если мы заметим, что 1 есть число пустых подмножеств в множестве А - {1,2, п}, далее |^есть число одноэлементных подмножеств в А, u J— число к-элементных подмножеств в А и т. д., так что в целом сумма в левой части (10) означает число всевозможных подмножеств множества А. Но мы знаем, что число всех подмножеств ^-элементного множества А равно 2п (это мы видели в п. 23), т. е. как раз получается соотношение (10) — без применения формулы Ньютона.

Однако при х - 1, а--\ из (8) получается соотношение, которое не столь очевидно:

т. е. в биноминальной формуле (8) сумма коэффициентов, стоящих на четных местах, равна сумме коэффициентов на нечетных местах. Это особенно интересно для четных п\

Если выписать строка за строкой коэффициенты, встречающиеся в формуле (8), для /7 = 0, 1, 2, то получается таблица, называемая треугольником Паскаля'.

Эта таблица может быть легко построена и без формулы (8), если заметить, что в ней каждое число равно сумме двух соседних с ним чисел верхней строки (см., например, выделенные числа).

То, что это действительно так, может быть доказано следующим образом. В /2-й строке имеется коэффициент ^(как видно из формулы (8)), а над ним, в п— 1-й строке стоят числа фрагмент таблицы имеет вид

Сформулированное выше правило (способ построения треугольника Паскаля) означает, что справедливо соотношение

(11)

Действительно, К j есть число всевозможных сочетаний из п элементов множества {1, 2, п} по к элементов. Но все эти сочетания можно разбить на две группы: содержащие элемент л и не содержащие элемент п. Сочетаний, содержащих элемент п, будет

поскольку к взятому элементу п надо добавить еще к - 1 элементов из {1, 2, п-\). А сочетаний, не содержащих элемент п, будет

Это и дает формулу (11), т. е. доказывает описанное выше правило построения треугольника Паскаля.

Заметим в заключение, что формула (8) была известна и до Ньютона. Ее знали в средние века Омар Хайям и другие среднеазиатские математики. Блез Паскаль, о котором мы еще будем говорить в связи с понятием вероятности (и который ввел рассматривавшийся выше треугольник Паскаля), также владел этой формулой задолго до Ньютона. Однако Ньютону принадлежит некоторое обобщение формулы (8): он нашел выражение для (х + а)п в случае нецелого показателя п.

Задачи и упражнения

101. Найдите разложение для (2х + а)4.

102. При какой степени х коэффициент будет наибольшим в биноме

103. Чему равен коэффициент при члене x2y3z2 в выражении (x + y + z)1?

104. Докажите равенство

105. Постройте треугольник Паскаля, используя «двоичную арифметику»: 0 + 0 = 0, 0+1 = 1+ 0 = 0, 1 + 1 = 10. Исследуйте получающиеся треугольники Паскаля.

29. Производящие функции

В формуле (8) коэффициентами при степенях переменного х являются числа fJM дающие решение комбинаторной задачи о сочетаниях (без повторений). Говорят поэтому, что (х + а)п является производящим многочленом для этой комбинаторной задачи. Производящие функции можно рассмотреть и для других комбинаторных задач.

Рассмотрим, например, следующую задачу: сколькими способами можно уплатить сумму к копеек, используя каждую монету достоинством в 1, 2, 3, 5, 10, 15, 20 и 50 копеек не более одного раза? Обозначим это число способов через Ьк (например, &ц — число способов уплатить 11 копеек указанными монетами). Мы можем тогда составить многочлен

(число 106 — это сумма достоинств всех взятых монет, т. е. максимальная сумма, которую мы можем уплатить). Это и есть производящий многочлен для рассматриваемой комбинаторной задачи. Но как найти числа Ь2, Ведь это и есть интересующий нас вопрос.

Оказывается, этот производящий многочлен можно записать и в другом виде:

(12)

Здесь показателями степени в правой части служат как раз достоинства взятых монет. Раскрывая скобки в правой части, мы получим явное выражение взятого производящего многочлена, и это даст возможность найти все коэффициенты т. е. полностью решить поставленную комбинаторную задачу.

Откуда же получается формула (12)? При раскрытии скобок в правой части получатся слагаемые вида хт\+т2+-+тр9 где тр т~, тр — некоторые из чисел 1, 2, 3, 5, 10, 15, 20, 50. Сколько раз

встретится слагаемое, у которого показатель т2+... + т^ равен заданному к, столько и будет способов уплатить сумму к копеек. Иными словами, хк встретится при раскрытии скобок столько раз, сколько есть способов уплатить к копеек, т. е. Ьк раз. Это и означает справедливость формулы (12).

Рассмотрим теперь другую комбинаторную задачу. Известно, что любую сумму к рублей, где к > 8, можно уплатить 3- и 5-рублевыми банкнотами (раньше такие банкноты были в ходу в России). В самом деле, 8, 9 и 10 рублей уплатить легко, а потом можно добавлять одни лишь трешки. Однако сколькими способами можно уплатить сумму к рублей, используя только трешки и пятерки? Обозначим это число способов через Ск и составим соответствующую производящую функцию:

она будет представлять собой уже не многочлен, а бесконечный ряд (если читатель слышал кое-что о сходимости бесконечных рядов, пусть он пока забудет это — мы сейчас будем производить «формальное» действие, не заботясь о сходимости). Однако, как явно вычислить этот ряд, т. е. получить решение интересующей нас задачи для любого kl В этом случае вместо (12) мы получаем другую формулу:

(13)

Перемножая ряды в правой части (т. е. производя формальное умножение последовательных членов этих рядов), мы и получаем явное выражение производящей функции:

Например, х18 получается дважды: х18 = х^-х15 и х18 = х181; это и дает два способа уплатить 18 рублей: одна трешка и остальное пятерками или же только трешки без пятерок. Детали читатель может продумать самостоятельно.

А если задача заключается в уплате суммы к рублей трешками, пятерками и десятками, то производящая функция примет вид

В приведенных задачах рассматривались разбиения числа к на слагаемые некоторого заданного вида, причем порядок этих слагаемых не учитывался. В самом деле, можно уплатить сначала одну трешку и затем три пятерки или, наоборот, сначала дать три пятерки

и потом трешку — это будет один и тот же способ уплатить 18 рублей трешками и пятерками. Нам важно лишь, какие купюры и в каком количестве используются, без учета порядка их уплаты. Есть однако, как мы видели выше, комбинаторные задачи, в которых существенно учитывается порядок. Рассмотрим производящие функции для некоторых из таких задач.

Как мы знаем, число размещений с повторениями из п элементов по к равно п/х. Здесь я, т. е. число элементов множества А = {О, 1, ...,/2}, из которых мы составляем размещения, предполагается фиксированным, а к (т. е. длина рассматриваемых «слов») может принимать значение 0, 1, 2, ... . Соответствующая производящая функция имеет вид бесконечного ряда

т. е. коэффициентом при хк является число размещений с повторениями по к элементов (т. е. число слов длины к). Заметим теперь, что справедливо следующее формальное тождество (еще раз подчеркиваем, что вопроса сходимости рассматриваемых рядов мы не затрагиваем):

(14)

В самом деле, раскрывая скобки, мы получаем в левой части

откуда видно, что все слагаемые, кроме 1, взаимно уничтожаются. В частности, при z = nx мы получаем из равенства (14)

откуда видно, что рассмотренная выше производящая функция для размещений с повторениями из п элементов может быть записана в виде

В заключение рассмотрим еще одну комбинаторную задачу с учетом порядка выбора элементов. Имеются (в достаточном количестве) рублевые, четырехрублевые и десятирублевые почтовые марки. На конверт надо наклеить четыре марки на общую сумму 22 рубля. Сколькими способами это можно сделать, если учитывается порядок расположения марок (выклеиваемых по правому краю конверта)? Для решения мы сразу выпишем соответствующую производящую функцию {х + X4 + X10)4. Чтобы пояснить ее смысл, мы запишем ее в виде

и условимся, что первая скобка характеризует первую марку, вторая — вторую и т. д. Если, например, мы взяли из первой скобки х, из

Рис. 170 Рис. 171

второй X , а из третьей и четвертой взяли х , то это соответствует выклеиванию марок, показанному на рис. 170; здесь получился набор марок на сумму 25 рублей, т. е. на большую сумму, чем следовало.

Если же мы раскроем скобки и найдем, сколько раз встретится х22, то мы и получим число способов требуемой выклейки марок. Иначе говоря,

(15)

где гк означает число способов, которыми можно (при поставленных условиях) выклеить марки на сумму к рублей. Раскрыв скобки, мы найдем, что ?22 = т> е> возможны 10 способов требуемой расклейки марок (рис. 171). Конечно, найти эти способы выклейки марок можно было бы и без использования производящей функции, но если мы хотим найти решение сразу для всех к, то проще всего раскрыть скобки в выражении, стоящем в левой части равенства (15).

Мы рассмотрели лишь несколько отдельных примеров. Вообще же метод производящих функций является важным приемом решения задач комбинаторики (и не только комбинаторики).

Задачи и упражнения

106. Найдите производящую функцию для геометрической прогрессии

107. С помощью производящей функции докажите тождество

Считается, что при s - к < 0 число равно нулю; кроме того, считается, что 0! = 1 и потому

108. Найдите производящую функцию для натурального ряда.

109. С помощью производящей функции, задаваемой биномом Ньютона, докажите равенство

110. Докажите, что

30. Принцип Дирихле

Зададим следующий риторический вопрос, ответ на который заранее ясен. Множество А содержит п + 1 элемент, а множество В содержит п элементов; существует ли вложение А —> В! Ответ, очевидно, отрицателен. Ведь множество А содержит больше элементов, чем В, и потому вложить А в множество В в качестве его подмножества невозможно. Иначе говоря, никакое отображение/: А —> В не является (при указанных условиях) вложением, т. е. найдутся два элемента а2е А, имеющие один и тот же образ: f(al)=f(a2) (рис. 172).

Несмотря на полную очевидность сказанного, дадим еще одно наглядное пояснение. Элементы множества А будем представлять себе зайцами, а элементы множества В — клетками. Отображение будет состоять в том, что мы сажаем зайцев в клетки, т. е. каждому зайцу поставлена в соответствие (в качестве его образа) та клетка, в которую он посажен. Поскольку зайцев больше чем клеток, это отображение не может быть вложением, т. е. не может оказаться так, что каждому зайцу предоставлена отдельная клетка, в которой сидит только он. Иными словами, если п+ 1 зайцев рассадить в п клеток, то хотя бы в одной клетке окажется не менее двух зайцев (рис. 173).

Указанный факт, несмотря на полную его очевидность, нередко используется в математических рассуждениях. Он называется принципом Дирихле (немецкий математик Петер Дирихле часто применял его в своих исследованиях по теории чисел). Приведем несколько примеров использования принципа Дирихле.

На плоскости даны три прямых и восемь точек, не лежащих на этих прямых. Можно ли среди этих точек найти такие две, что соединяющий их отрезок не пересекает ни одной из данных прямых? Для решения заметим, что если прямые не пересекаются в одной точке и попарно не параллельны, то они разбивают плоскость на семь частей, если же прямые пересекаются в одной точке или среди них есть параллельные, то число частей будет меньшим (рис. 174). Части плоскости будем считать «клетками», а точки — «зайцами». Так как

Рис. 172

Рис. 173

Рис. 174

Рис. 175 Рис. 176 Рис. 177

Рис. 178 Рис. 179 Рис. 180

точки не лежат на заданных прямых, то каждая из них попадает в некоторую клетку. Итак, у нас есть 8 зайцев, рассаженных в 7 или меньшее число клеток. Следовательно, в какой-либо из клеток окажется не менее двух зайцев, т. е. найдутся две точки, лежащие в одной и той же части плоскости (рис. 175). Отрезок, соединяющий эти две точки, не пересекается ни с одной из данных прямых. Таким образом, ответ на поставленный вопрос утвердителен.

Используя пример, рассмотренный в п. 21, читатель может обобщить этот результат следующим образом: если на плоскости даны п прямых и----h 2 точек, не лежащих на этих прямых, то среди этих точек найдутся такие две, что соединяющий их отрезок не пересекает ни одной из данных прямых. Заметим, что это — наименьшее число точек, для которых сформулированный результат верен: если взять на одну точку меньше, т. е.----h 1 точек, то может оказаться, что все зайцы сидят в отдельных клетках (случай п = 4 изображен на рис. 176), и потому любой отрезок, соединяющий две из этих точек, непременно пересекает хотя бы одну из данных прямых.

Следующий пример мы также возьмем из области геометрии. Внутри (или на границе) квадрата со стороной 1 взяты пять точек (рис. 177). Надо доказать, что среди этих пяти точек найдутся две точки, расстояние между которыми не превосходит Для доказательства разделим данный квадрат на четыре квадрата половинного размера (рис. 178), и эти меньшие квадраты будем считать «клетками».

Так как число точек («зайцев») равно 5, то, согласно принципу Дирихле, найдутся два зайца, сидящие в одной клетке, т. е. две точки, лежащие в одном квадрате-четвертушке (рис. 179). Но тогда рассто-

яние между ними не превосходит диагонали этого маленького квадрата, т. е. это расстояние не больше

Заметим, что в доказанном утверждении число -4= не может быть уменьшено: на рис. 180 изображены 5 точек в квадрате, среди которых нет двух точек, находящихся на расстоянии, меньшем ^= друг от друга.

Теперь расскажем о применении принципа Дирихле к десятичной записи рациональных чисел. Результат формулируется следующим образом: всякое рациональное число — изображается бесконечной периодической десятичной дробью, которая содержит не более q - 1 цифр в периоде. Например, обращая дробь — в десятичную, т. е. производя деление числа 1 на 7, получаем следующие цифры:

Продолжая деление, находим:

получается периодическая дробь, имеющая период из шести цифр 142857 (здесь g = 7, т. е. период содержит как раз q - 1 цифру). А для дроби I" находим десятичное представление у= 0,33333...; здесь q-Ъ, т. е. q - 1 = 2, но период содержит лишь одну цифру, т. е. меньше чем q-l.

Доказательство сформулированного общего результата можно получить с помощью принципа Дирихле следующим образом. При выполнении деления p:q «углом» мы получаем некоторый остаток (как, например, выше, при делении 1:7), затем приписываем справа 0, снова делим, снова получаем остаток и т. д. Если где-то встретится остаток, равный нулю (т. е. в каком-то месте деление осуществляется без остатка), то ^ записывается в виде конечной десятичной дроби.

Например, — = 0,350000..., т. е. в этом случае период содержит лишь одну цифру 0.

Рассмотрим теперь случай, когда все время получаются остатки, отличные от нуля. В этом случае остатками (при делении на q) могут быть числа 1, 2, q-\, т. е. возможны q - 1 различных остатков.

Их мы будем считать «клетками». Теперь рассмотрим q последовательно получающихся остатков: 1-й, 2-й, q-и. Числа 1, 2, q (номера получающихся остатков) будем считать «зайцами». Каждый из этих остатков равен одному из чисел 1, 2, q - 1, т. е. он попадает в одну из клеток. А так как зайцев больше, чем клеток, то найдется клетка, в которую попадает больше одного зайца. Иначе говоря, найдутся среди чисел 1, 2, q такие два числа, скажем, к и к + г, где к + г < q, и потому г < q, что к-и остаток совпадает с (к + г)-м остатком. Но каждая последующая цифра в процессе деления определяется лишь тем, какой был предыдущий остаток. Поэтому, начиная с (к + г)-го места, цифры будут те же, что и с к-го места, потом с (к + 2г)-то места снова пойдут те же г цифр и т. д. Таким образом, в десятичной записи числа —, начиная с к-то места, одни и те же г цифр будут все время повторяться. Так как г < q, то это и означает, что — записывается бесконечной десятичной дробью, которая (начиная с к-н цифры) будет периодической, причем период содержит не более q - 1 цифры.

В заключение расскажем о малой теореме Ферма. Пусть р — простое число и а — натуральное число, не делящееся на р. Рассмотрим числа а, а2, ар. Это — зайцы. Каждое из этих чисел дает некоторый остаток при делении на р, который может быть равен 1, 2, р- 1. Эти остатки — клетки. Так как число зайцев больше числа клеток, то найдутся два зайца, сидящие в одной и той же клетке. Иначе говоря, найдутся такие натуральные числа тик, что ат и ат+к дают одинаковые остатки при делении на р, причем т + к<р, т. е. к<р-\. Это означает, что число ат+к -ат = ат(ак - 1) делится на р, и потому ак - 1 делится на р. Мы можем предполагать, что к — наименьшее натуральное число, обладающее этим свойством (или выбрать среди таких к наименьшее). Тогда к является делителем числа р- 1, т. е. р- 1 - kl при некотором натуральном / (читатель может попробовать доказать это, используя идею классификации, изложенную в п. 19; мы к этому вернемся при рассмотрении конечных полей). Из тождества

(16)

при z = ak получаем ар 1 - 1 = (яА - 1)(1 + ... ), откуда видно, ар 1 - 1 делится на р. Это и есть малая теорема Ферма: Если р — простое число и а — натуральное число, не делящееся на р, то число ар~^ -1 делится на р.

Чтобы показать, как работает эта теорема, рассмотрим следующую задачу: доказать, что 102001 + 1 делится на 7. Число р = 1 —

простое, и потому, согласно малой теореме Ферма, число 10-1 делится на 7. Так как 1998 делится на 6, 1998 = 6-333, то из равенства (16) при z - 106, /= 333 получаем, что Ю1998 - 1 делится на 7. Иначе говоря, Ю1998 при делении на 7 дает остаток 1. Следовательно, число jq2001 _ jq1998.jq3 дает ПрИ делении на 7 такой же остаток, как и число 10J. Поэтому задача принимает вид: доказать, что 10J+ 1 делится на 7, т. е. 1001 делится на 7. Это проверяется непосредственно.

Таким же образом решаются и другие аналогичные задачи. Например: доказать, что число з100000 - 1 делится на 11; доказать, что число 100999999- 8 делится на 17, и т. п.

Задачи и упражнения

111. В комнате собралось 5 человек. Докажите, что среди них найдутся двое, имеющие среди собравшихся одинаковое число знакомых.

112. В классе 31 ученик, всем вместе 434 года. Можно ли выбрать 20 учеников, которым вместе не меньше 280 лет?

113. Редакция журнала получила в январе 160 писем. Докажите, что в один из дней было получено больше 5 писем.

114. Докажите, что равносторонний треугольник нельзя покрыть двумя меньшими равносторонними треугольниками.

115. Можно ли написать 55 различных двузначных чисел так, чтобы сумма любых двух из них не равнялась 100?

Беседа 7. События и вероятности

31. События

Игра в кости, карточные и другие азартные игры издавна привлекали интерес некоторого круга людей. Естественно, основной вопрос состоял в том, как делать ставки в игре, какой сделать ход, чтобы выигрыш был наиболее вероятен. Именно поэтому развитие теории вероятности было связано, в первую очередь, с азартными играми, и в качестве иллюстраций использовались именно игровые ситуации. В середине XVII столетия Блез Паскаль, Пьер Ферма и другие математики заложили научные основы этой теории, не сомневаясь, что теория случайных явлений найдет важные приложения во многих сферах человеческой деятельности. Однако и сейчас при изложении основных понятий теории вероятности ситуации с бросанием костей, подбрасыванием монет или выбором нескольких карт из колоды служат удобным материалом для примеров и иллюстраций.

Игральная кость — кубик с округленными углами, на гранях которого нанесены точки, изображающие числа от 1 до 6 (рис. 181). В детских играх обычно используется одна кость, при игре в нарды — две, а при игре в кости — и большее их количество. «Выпавшей» считается верхняя грань брошенной кости (на рис. 181 выпала «пятерка»).

Бросание кости представляет собой опыт, испытание, а его результат (выпавшее число очков) — исход этого испытания. При бросании монеты могут быть два исхода: О — выпадение орла или

Рис. 181 Рис. 182 Рис. 183

Р — выпадение решетки («решка»). Если через данную остановку проходят четыре маршрута трамвая (рис. 182), то угадывание номера показавшегося вдали трамвая является (если расписание нам неизвестно) испытанием, которое может иметь 4 исхода. Если мы наудачу выбираем одного ученика из списка учащихся данного класса и интересуемся месяцем, в котором он родился, то мы производим испытание, которое может иметь 12 исходов.

Рассмотрим теперь более сложные примеры испытаний. Бросим две кости, которые будем считать различными, скажем, одна (первая) — синяя, а другая (вторая) — красная (или одну кость бросим дважды: первое бросание, второе бросание). В этом случае исходами являются пары (1; 3), (2; 5), (4; 4), (6; 3) и т. п. — всего 36 исходов. Если мы бросаем монету, то при трехкратном бросании имеются 8 возможных исходов: ООО, OOP, ОРО, ОРР, POO, POP, РРО, РРР. Вообще, при /2-кратном бросании монеты имеются 2п возможных исходов этой серии испытаний, а при /2-кратном бросании кости возможны 6п исходов (вспомните размещения с повторениями!). Наконец, рассмотрим еще серию примеров с шарами. Имеются три ящика — левый, средний, правый; мы берем три одинаковых (т. е. неразличимых) шара и наудачу бросаем их в эти ящики (рис. 183). У такого испытания имеются 10 исходов (рис. 184). Если же шары пронумерованы, то будет У исходов. Вообще, если к пронумерованных шаров наудачу брошены в /2 пронумерованных ящиков, то имеется пк исходов (размещения с повторениями).

И еще пример с шарами. В мешке лежат п пронумерованных шаров (или /2 шаров разного цвета), и мы наудачу (не глядя) берем из мешка к шаров. Это испытание имеет u J исходов (сочетания без повторений).

Вернемся снова к бросанию одной кости. Обозначим через событие «выпадает единица», через Е2 — событие «выпадает двойка»

Рис. 184

Рис. 185 Рис. 186

Рис. 187 Рис. 188

и т. д. Эти события являются случайными; при бросании кости событие Е5 может в зависимости от случая либо произойти (выпадает пятерка), либо не произойти (выпадает другое число). Можно рассмотреть и другие события, скажем, событие А — выпадение нечетного числа, событие В — выпадение не менее четырех очков. События А н В разложимы: каждое из них может быть представлено в виде объединения некоторых событий Е2, Е^ (рис. 185):

События же £р Е2, Е6 являются элементарными (неразложимыми), т. е. они не предствляются в виде объединения других событий. Вообще, объединение двух событий состоит в том, что произойдет хотя бы одно из них. Например, объединение рассмотренных выше событий А а В заключается в выпадении любого числа очков, кроме двойки (рис. 185).

Пересечение двух событий состоит в том, что наступят, произойдут оба эти события. Например, пересечение А П В рассмотренных выше событий заключается в выпадении пятерки, т. е. АГ\В = Е5.

Наконец, для каждого события определено его дополнительное (комплементарное) событие, которое, как и дополнение множества, мы будем обозначать буквой с. Например, сА означает, что не наступит событие А, т. е. выпадет четное число очков (рис. 186); сВ означает выпадение не больше трех очков (рис. 187); сЕ^ означает выпадение менее шести очков (рис. 188) и т. п.

Как видим, над событиями можно производить те же операции (объединение, пересечение, дополнение), что и над множествами. Это и неудивительно: если мы обозначим через U объединение всех элементарных событий:

(1)

то любое событие будет подмножеством этого универсального множества U, и потому для событий выполнимы операции П, U, с. Заметим, что само U является достоверным событием, т. е. это событие происходит в любом случае, при любом исходе испытания. Что же касается пустого множества 0 (оно ведь тоже является подмножеством универсального множества U), то оно является невозможным событием, т. е. оно не происходит, каков бы ни был исход испытания.

Мы подробно рассмотрели элементарные и разложимые события, а также операции над событиями для случая бросания одной кости. Возьмем теперь случай двух бросаний одной кости: первое бросание, второе бросание. В этом случае каждое элементарное событие представляет собой выпадение той или иной пары значений: (4; 6), (5; 5), (6; 2) и т. п. А вот суммарное выпадение 10 очков при двух бросаниях есть объединение трех элементарных событий: (4; 6), (5; 5) и (6; 4). Вообще, любое событие есть объединение нескольких элементарных, и для любых событий определены операции П, U, с.

Если мы выбираем (или, как говорят, осуществляем выборку) к шаров из имеющихся в мешке п пронумерованных шаров, то имеется rj возможных исходов испытания, т. е. Çj?J элементарных событий.

В качестве неэлементарных событий здесь могут быть, например, следующие: наличие шара № 1 в выборке; отсутствие шаров № 2 и № 3 в выборке; совпадение суммы номеров выбранных шаров с заданным числом q и т. д.

В приведенных нами примерах испытаний было возможно лишь конечное множество исходов, т. е. множество элементарных (неразложимых) событий было конечным. Все другие рассматриваемые события являлись объединением конечного числа элементарных событий. Задачи о случайных событиях при таких условиях проведения испытаний рассматриваются довольно часто, хотя возможны испытания и с бесконечным множеством исходов, т. е. бесконечным множеством элементарных (неразложимых) событий.

Задачи и упражнения

116. Из колоды в 36 игральных карт вытаскиваются две карты. Сколько есть различных способов сделать это? В скольких из них обе карты будут одной масти?

117. Пусть в условиях задачи 116 рассматриваются такие события: А -обе карты — трефы, В — обе карты — дамы, С — одна из карт — туз. Опишите события A U В, А П В, А П С.

118. Из комплекта домино вытаскиваются две кости. В скольких случаях сумма значений на костях будет равна 15?

119. В электрической цепи имеются четыре лампочки (рис. 189). Событие Aj_ — перегорела лампочка № к. Запишите событие, состоящее в том, что ток по цепи не может пройти.

120. При условиях задачи 119 запишите событие, состоящее в том, что перегорели ровно две лампочки, но ток по цепи может пройти.

Рис. 189

32. Классическое понятие вероятности

Если монета ровная, неизогнутая, то можно ожидать, что при ее многократном бросании орел и решка будут выпадать одинаково часто, т. е. примерно в половине случаев будет выпадать орел, а в половине случаев — решка. Поэтому считают, что для такой монеты вероятность выпадения орла равна — и вероятность выпадения решки тоже равна —.

Подобно этому естественно ожидать, что при многократном бросании игральной кости на долю каждого из чисел 1, 2, 6 будет приходиться примерно шестая часть общего числа испытаний (т. е. бросаний кости). Поэтому считают, что вероятность выпадения каждой грани (т. е. каждого из чисел 1, 2, 6) равна Разумеется, это следует ожидать только в случае идеально правильной кости: достаточно сместить центр тяжести кубика в сторону одной из граней, например, вставив внутрь кубика вблизи одной из граней свинцовый шарик, и кубик будет подобно игрушке «Ванька-встанька» наиболее часто падать на эту грань, т. е. одно из чисел 1, 2, 6 будет выпадать чаще других.

Будем, однако, считать игральную кость идеальной. Какова в таком случае будет вероятность события А — выпадения нечетного числа очков? Легко понять, что эту вероятность следует считать равной —, т. е. —. Ведь всего имеется шесть возможных и одинаково вероятных исходов, т. е. наступления событий Е^, Е2, Е^, причем три из этих шести случаев (а именно Е^, Е^, Е5) «благоприятствуют» событию А, т. е. оно наступает в трех случаях из шести возможных. Событие же С («выпадение не менее пяти очков») имеет вероятность т-т? поскольку ему «благоприятствуют» два случая из шести (выпадение пятерки или шестерки). Вероятность события обычно обозначают буквой Р (от слова probability — вероятность). Таким образом, в случае идеально правильной игральной кости справедливы равенства

Вообще, если при некоторых условиях проведения испытаний имеется п элементарных событий Е^, Е2, Еп и если мы считаем эти элементарные события равновероятными, то каждое из этих элементарных событий имеет вероятность —:

Для события же, которому «благоприятствуют» к из этих элементарных событий (т. е. для события, которое является объединением к различных элементарных событий), вероятность его наступления (при каждом испытании) равна ^. Иначе говоря, в условиях равновероятности исходов элементарных событий вероятность любого события равна отношению числа благоприятных исходов к общему числу возможных исходов испытания. Это и есть классическое определение вероятности. О роли предположения равновероятности мы еще поговорим в следующей беседе, а сейчас рассмотрим некоторые примеры.

Игральная кость бросается четыре раза подряд. Какова вероятность того, что ни разу не выпадет единица? Возможными исходами в этом испытании являются четверки чисел (я; /3; с, d), каждое из которых может принимать значения 1, 2, 6. Все исходы (т. е. элементарные события) равновероятны, а число их равно п = 64= 1296. Событию М, состоящему в том, что ни разу не выпадет единица, соответствуют исходы, в которых каждое из чисел а, Ъ, с, d может принимать пять значений 2, 3, 4, 5, 6. Число таких исходов равно /: = 54 = 625. Таким образом, вероятность события M равна

Дополнительному событию сМ, т. е. выпадению хотя бы одной единицы при четырех последовательных бросаниях кости, соответствуют остальные исходы, число которых равно 1296-625 = 671. Следовательно,

Как видим, выпадение единицы хоть раз при четырех бросаниях немного вероятнее, чем невыпадение единицы ни разу.

С рассмотренным примером связана интересная история (парадокс де Мере). Игрок Шевалье де Мере практиковал, в числе других игр, следующую. Он 24 раза бросал пару костей; если при этом хоть раз выпадут две единицы, де Мере получал определенный выигрыш (в зависимости от ставки). Своему партнеру де Мере предлагал бросить в ответ одновременно 4 кости; если при этом выпадала хотя бы одна единица, партнер получал такой же выигрыш. Де Мере полагал, что вероятность выигрыша для обоих одинакова, т. е. что игра является честной. Однако на практике оказалось, что де Мере чаще проигрывал, чем выигрывал, и он обвинял в этом математиков, считая их виновными в дезинформации.

Проведем соответствующие вычисления. Выпадение двух единиц при бросании двух костей есть событие, имеющее один шанс из 36. Дополнительному событию, т. е. невыпадению пары (1; 1), соответствуют 35 случаев из 36. Число исходов при 24 бросаниях пары костей

равно 3624, а число неблагоприятных исходов (пара единиц не выпадает ни разу) равно 3524. Значит, вероятность того, что де Мере не выигрывает, равна

(2)

Математики установили, что выражение ^1 ~~j при увеличении числа m все более приближается к некоторому пределу, который равен где е = 2,7182818280... — число, играющее важную роль во многих разделах математики:

(3)

Сравнивая (2) и (3), мы заключаем, что вероятность невыигрыша для де Мере примерно равна

Что же касается его партнера, то для него вероятность невыигрыша (ни на одной из четырех костей не выпала единица), равна, как мы выше видели,

(4)

Выходит, что вероятность невыигрыша примерно одинакова для обоих (а потому и вероятность выигрыша примерно одинакова). Однако примерное равенство не есть точное равенство, и в этом кроется причина ошибки, которую допустил де Мере. В действительности выражение I 1 ~~\ возрастает при увеличении числа m (в этом легко убедиться, взяв калькулятор и принимая m = 2, 3, 4, 5, ...). Поэтому, хотя каждое из чисел (2) и (4) примерно равно fjj » но все же число (4) меньше числа (2), т. е. вероятность невыигрыша у партнера чуть меньше, чем у самого де Мере.

В качестве второго примера рассмотрим следующую задачу о бросании шаров. Имеются п ящиков, в которые случайным образом бросаются п шаров (рис. 190); какова вероятность того, что в каждый ящик попадет один шар? Здесь каждое бросание всех п шаров представляет собой испытание, причем удобно считать, что шары про-

Рис. 190

нумерованы и ящики пронумерованы. Число исходов испытания равно пп (размещения с повторениями), а число благоприятных исходов (когда в каждый ящик попадает один шар, т. е. расположение шаров в ящиках представляет собой некоторую перестановку п шаров) равно п\ Следовательно, искомая вероятность равна —. Например, при п-1 вероятность оказывается равной

(5)

Это можно интерпретировать следующим образом. Предположим, что в некотором городе за каждую неделю (от понедельника до воскресенья) происходит 7 автомобильных ДТП (дорожно-транспортных происшествий). Естественно назвать неделю «нормальной», если в течение этой недели каждый день происходит ровно одно ДТП. Какова вероятность того, что наудачу взятая календарная неделя является нормальной? Это как раз задача о случайном бросании семи шаров (т. е. ДТП) в семь ящиков (дней недели), и потому ответ дается формулой (5). Как видим, эта вероятность весьма мала: всего 6 шансов из 1000. И 994 шанса из 1000 за то, что неделя не будет нормальной, т. е. найдется день, в который произойдет не менее двух ДТП (а значит, найдется и такой день, когда не будет ни одного ДТП).

В рассмотренном примере вероятность того, что в каждый ящик попадет один шар, оказалась равной —, т. е. в ответе участвует факториал числа п. Во многих других случаях вычисление вероятности сводится к иным комбинаторным задачам, и в ответе участвуют сочетания или размещения, т. е. числа, также выражающиеся через факториалы (см. формулы (4) - (7) в предыдущей беседе). В связи с этим при вероятностных расчетах нередко приходится находить факториалы, и важным вычислительным средством является следующая формула Стирлинга, дающая приближенное значение факториала:

(6)

Здесь приближенное равенство понимается в том смысле, что отношение выражений, стоящих слева и справа от знака ~, стремится к единице при неограниченном возрастании п. Доказательство формулы Стирлинга мы рассмотрим впоследствии (оно проводится с помощью интегралов).

Заключительный пример относится к области биологии. В моравском городе Брно (столице Словакии) настоятель Августинского монастыря Грегор Мендель (1822 - 1884) занимался выращиванием садового гороха и других растений. Его аналитический, творческий ум

заставлял относиться к работе вдумчиво, и Мендель сделал гениальное открытие, на несколько десятилетий опередившее свое время.

Строение цветка садового гороха приспособлено к самоопылению, т. е. пыльца от другого цветка не проникает к рыльцу, и семяпочки оплодотворяются только собственной пыльцой. Поэтому каждый сорт гороха размножается как чистая линия, с устойчивым сохранением признаков: например, имеются сорта с гладкими горошинами и сорта с морщинистыми горошинами. Однако возможно искусственное перекрестное оплодотворение: пыльник цветка удаляется, а потом на рыльце наносится пыльца другого растения.

Производя искусственное скрещивание гладкого и морщинистого сортов, Мендель заметил, что у получающихся гибридов первого поколения все семена были гладкими, морщинистость исчезала. Это означает, что свойство иметь гладкие семена является более сильным (как мы бы сейчас сказали, доминантным) признаком, а морщинистость — более слабым (рецессивным). На следующий год Мендель посадил эти гибридные семена и позволил выросшим растениям самоопыляться. К его удивлению примерно четверть получившихся горошин (гибридов второго поколения) оказались морщинистыми. Скрытый, рецессивный признак вновь проявился в отношении 1:3. Мендель провел опыты и с другими признаками (сорта с желтыми и сорта с зелеными горошинами и т. п.) — результат был таким же. И Мендель гениально предугадал механизм наследственности и его законы.

Признаки передаются от родителей «дискретными единицами наследственности» (генами, как мы теперь говорим, от слова genus — род). Для каждого простого признака растение имеет, как предположил Мендель, две единицы наследственности, скажем, WW (случай доминантной чистой линии) или ww (рецессивная чистая линия). Это показано на рис. 191. Каждое растение получает одну единицу наследственности от материнского растения (через семяпочку) и одну единицу от отцовского растения (через пыльцу). Поэтому все гибриды первого поколения имеют состав единиц (генотип) Ww. В силу доминантности преобладает W, т. е. горошины оказываются гладкими. Среди гибридов второго поколения, полученных на следующий год, имеются (примерно в равном количестве) растения с генотипами WW, Ww, wW, ww (рис. 192), поскольку родители передают каждому потомку либо ген W (с вероятностью 1/2), либо ген w (тоже с вероятностью 1/2). Но растения с генотипами WW, Ww, wW обладают фенотипически (т. е. внешне) доминантным признаком — они имеют

Рис. 191 Рис. 192

Рис. 193 Рис. 194 Рис. 195

гладкие горошины, и лишь растения ww обладают рецессивным признаком (морщинистые горошины). Это и дает менделевское отношение 3:1, т. е. примерно три четверти гибридов второго поколения имеют гладкие горошины и лишь четверть — морщинистые.

Мендель рассмотрел также одновременное наследование двух признаков (гладкие — морщинистые, а также желтые — зеленые) и получил среди гибридов второго поколения отношение 9:3:3:1. Это также хорошо подтверждается вероятностными соображениями. Желтизна горошин определяется доминантным геном Y, а зеленый цвет — рецессивным геном у. При этом признак «гладкость — морщинистость» не является сцепленным с признаком цветовой окраски — эти признаки наследуются независимо один от другого. Поэтому среди гибридов второго поколения, имеющих морщинистую форму горошин, будет то же распределение 3:1 по цвету, т. е. примерно три четверти из них имеют желтые горошины (доминантный признак У), а четверть — зеленые (рис. 193). Иначе говоря, вероятность получения морщинистых зеленых горошин равна 1/16, а желтые морщинистые горошины получаются с вероятностью 3/16. Та же вероятность 3/16 соответствует гладким зеленым горошинам (рис. 194). И, наконец, в оставшихся 9 случаях из 16 горошины будут гладкие желтые (рис. 195). Это и дает менделевское распределение 9:3:3:1.

Работа Г. Менделя была доложена Брненскому обществу естествоиспытателей в 1865 году. Однако затем она была надолго забыта. Лишь в 1900 году его результаты были переоткрыты и подтверждены рядом других опытов в работах Августа Вейсмана, Хуго Де Фриза, Карла Корренса (которые затем «раскопали» работу Менделя и ссылались на его приоритет). К этому времени была уже детально исследована структура клетки и обнаружены содержащиеся в ядре хромосомы («окрашиваемые тела», выявленные при обработке препаратов клеток некоторыми красителями). При изучении поведения хромосом во время деления клеток была выдвинута гипотеза о том, что гены нанизаны на на хромосомные нити подобно бусинкам. А во второй половине нашего столетия была полностью расшифрована химическая структура молекул ДНК — двойных спиралей, составляющих основу хромосом. Были четко выделены те участки двойных спиралей, которые являются генами, и выяснено, что содержащуюся в них

наследственную информацию можно записать с помощью генетического кода — алфавита, содержащего четыре буквы А, Г, Т, Ц (по первым буквам названий азотистых оснований, входящих в состав нуклеиновых кислот: аденин, гуанин, тимин, цитозин). При этом наследственная информация, содержащаяся в каждом гене, записывается в виде слова из сотен букв этого алфавита.

В каждой клетке (кроме гамет — половых клеток) хромосомы группируются парами, благодаря чему одному и тому же простому признаку соответствуют два гена (содержащихся по одному на каждой из «параллельных» хромосом). Такие гены называются аллельными между собой. Это и есть две единицы наследственности, предугаданные Менделем. При образовании гаметы происходит расщепление, и в нее случайным образом попадает одна хромосома из каждой пары, что также было предугадано Менделем. В результате оплодотворения (слияния мужской и женской гамет) возникает зигота, т. е. клетка, содержащая полный (двойной) набор хромосом, из которой и развивается индивидуум. Например, в клетках садового гороха (Pisum sativum), с которым производил свои опыты Мендель, есть семь пар хромосом. В одной из этих пар имеются, наряду с другими, два гена, контролирующие гладкость или морщинистость горошин и существующие в двух формах: W или w. Если хотя бы один из этих генов находится в форме W, то горошины гладкие. В другой паре хромосом имеются два гена, контролирующие цвет горошин; если хотя бы один из них присутствует в доминантной форме Y, то цвет горошин — желтый. Это и обусловливает правильность законов Менделя.

Задачи и упражнения

121. Два раза бросается игральная кость. Какова вероятность того, что сумма выпавших очков равна 7?

122. В коробке лежат 10 шаров: 3 красных, 3 синих и 4 зеленых. Из коробки случайным образом достали 2 шара. Какова вероятность, что они одинакового цвета?

123. Из комплекта домино убраны дубли. Случайно выбираются две кости. Какова вероятность, что их можно приложить друг к другу по правилам домино?

124. Что вероятнее: выиграть у равносильного противника 3 партии из 4 или 5 партий из 8? Ничьих не бывает.

125. Какова вероятность того, что четырехзначный номер автомашины содержит ровно две одинаковые цифры? (Мы считаем, что номер 0000 возможен.)

33. Свойства вероятности

Классическое определение вероятности исходит из предположения о равновероятности элементарных событий. Однако это предположение оправдывается не всегда. Рассмотрим, например, правильную четырехугольную пирамиду, на боковых гранях которой написаны числа 1, 2, 3, 4, а на основании — число 5 (рис. 196). Если эту пирамиду бросить на плоскость стола, то она упадет на какую-

Рис. 196 Рис. 197 Рис. 198

либо грань, и написанное на этой грани число будем считать «выпавшим». Если пирамида выполнена из однородного материала и имеет идеальную геометрическую форму, то мы можем принять, что выпадение чисел 1, 2, 3, 4, написанных на боковых гранях (рис. 197), равновероятно. Однако выпадение числа 5, написанного на основании (рис. 198), будет более редким исходом, если высота пирамиды больше стороны основания. Поэтому следует принять, что элементарные события Еу Е2, Еу Е4 (выпадение боковых граней с числами 1, 2, 3, 4) имеют одну и ту же вероятность, которая однако больше, чем вероятность элементарного события Е5 (выпадение пятерки). Скажем, при определенной высоте пирамиды может оказаться, что каждое из событий Еу Е2, Еу Е4 имеет вдвое большую вероятность, чем Е^ т. е. вероятности этих событий соотносятся как 2:2:2:2:1. Иначе говоря,

Теперь мы можем сформулировать более общее понимание вероятности, чем то, которое содержится в классическом определении. Проводится некоторое испытание, имеющее п исходов, т. е. допускающее п элементарных событий Е^ Е2, Еп. По каким-либо соображениям (геометрическим, физическим или даже чисто произвольно) каждому элементарному событию Е. сопоставляется некоторое неотрицательное число называемое его вероятностью, причем числа эти выбраны так, что

(7)

Далее, вероятностью произвольного разложимого события А называется сумма вероятностей тех элементарных событий, которые составляют событие А\

(8)

где суммирование распространяется на все элементарные события, содержащиеся в событии А. В частности, для достоверного события U - Ej U Е2 U ... U Е его вероятность, в силу определения (8), равна

(см. (7)). Невозможное же событие 0 имеет вероятность 0 (поскольку для такого события правая часть формулы (8) не содержит ни одного слагаемого). Для любого события А справедливо двойное неравенство 0 < Р(А) < 1.

Для любых двух событий А, В справедливо соотношение

(9)

(рис. 199). Из этого вытекает, что для любых двух событий А, В имеет место неравенство Буля

(и аналогично для объединения не двух, а большего числа событий).

Если А Г\В = 0, т. е. одновременное наступление обоих событий А и В невозможно, то А и В называются несовместными событиями. В этом случае формула (9) принимает более простой вид

(10)

т. е. вероятность объединения двух несовместных событий равна сумме их вероятностей. То же верно для нескольких событий, если они попарно несовместны.

В частности, дополнительные события А и сА несовместны, т. е. к ним применима формула (10). Так как при этом их объединение A \J(cA) является достоверным событием, т. е. имеет вероятность 1, то из (10) вытекает, что

(11)

Рассмотрим пример, который относится к жизни популяций (сообществ). Кровь человека, помимо основных четырех групп, имеет еще одну характеристику — так называемый резус-фактор. Он может быть положительным или отрицательным и контролируется одним геном в доминантной форме R или рецессивной форме г. Отрицательный резус — рецессивный признак (генотип rf)\ генотипы RR и Rr соответствуют положительному резусу.

Известно, что отрицательным резусом стабильно обладает примерно 1/7 популяции. Можно ли по этим данным определить, какая часть населения обладает генотипом RR (доминантная гемозигота) и какая — генотипом Rr (гетерозигота)?

Для решения условимся соответствующие гены, имеющиеся у индивидуума, нумеровать: «первый» ген, «второй» ген. Вероятность

Рис. 199

того, что у случайно взятого индивидуума первый ген имеет рецессивную форму г, обозначим через р, т. е. р — частота, с которой встречается рецессивный ген г в популяции. Дополнительное событие (первый ген доминантен, т. е. имеет форму К) наступает с вероятностью q- 1 -р. Те же вероятности и для второго гена. Следовательно, вероятность того, что у случайно взятого индивидуума резус отрицателен, т. е. что он имеет генотип rr, равна р2. Но по условию эта вероятность равна — -0,143, т. е. р -0,143, и потому /7-^- 0,378.

Таким образом, q - 1 -/7-0,622. Из этого вытекает, что вероятность генотипа RR равна q2 - 0,387. Наконец, гетерозиготный генотип Rr (или, что то же самое, rR — ведь мы лишь условно обозначили гены, как «первый» и «второй») равна 2pq -0,470 (впрочем, это также вытекает из того, что сумма вероятностей всех трех генотипов равна единице).

Учет резус-фактора очень важен. Если роженица имеет отрицательный резус (генотип rr), а резус-фактор плода положителен (т. е. он имеет генотип Rr), то кровосмешение во время родов приводит к гемолитической болезни ребенка (и зачастую к его смерти). Поэтому при указанных генотипах применяется кесарево сечение, исключающее кровосмешение. Не менее важен учет резус-фактора и при переливании крови.

Наконец, еще один пример. В Бразилии встречаются случаи ахейроподии — ужасного генетического заболевания, при котором ребенок рождается без кистей рук и без стоп. Ахейроподия вызывается некоторым рецессивным геном, обозначим его буквой а — в отличие от соответствующего доминантного гена А. Статистика показывает, что ребенок, больной ахейроподией, рождается в одном случае из 10 000, т. е. с вероятностью 0,0001. Какая часть бразильской популяции обладает генотипом ЛА (доминантная гемозигота) и какая генотипом Аа (гетерозигота)?

Решение — дословно то же, что и в предыдущем примере, только число 1/7 надо заменить на 0,0001. Вероятность того, что у случайно взятого индивидуума «первый» ген рецессивен, т. е. имеет форму а, равна в этом случае /7 = 0,01; дополнительное событие (ген А) имеет вероятность q = 0,99. Следовательно, вероятность генотипа АА равна q2 - 0,98; вероятность же гетерозиготного генотипа Аа равна 2pq~ 0,02. Таким образом, примерно два процента бразильцев (внешне нормальных) являются носителями опасного гена а.

Задачи и упражнения

126. Допустим, что имеется «неправильная» игральная кость, для которой вероятность выпадения каждой грани пропорциональна числу, указанному на этой грани. Чему равна вероятность выпадения грани с тройкой?

127. Из слова «наугад» выбирается наугад одна буква. Какова вероятность, что это будет гласная?

128. Десять человек садятся за круглый стол. Какова вероятность, что два данных человека окажутся рядом?

129. В «Спортлото» на карточке с числами от 1 до 49 игрок отмечает 6 чисел; при проведении тиража также определяются 6 «выигрышных» чисел; выигрывают карточки, в которых с результатами тиража совпали 3, 4, 5 или 6 чисел. Какова вероятность угадать 6 номеров из 49 при игре в «Спортлото»?

130. Из колоды в 36 карт вытащили 6 карт. Какова вероятность, что среди них: а) есть все четыре масти; б) нет ровно одной масти?

34. Условная вероятность

Начнем с рассмотрения примера. В классе 30 учеников, из них 10 являются участниками фотокружка. В этом классе 12 девочек, причем из них только 3 участвуют в работе фотокружка. При этих условиях вероятность того, что наудачу выбранный из списка ученик является участником фотокружка, равна — = у.

Допустим однако, мы заметили, наудачу выбрав фамилию ученика из списка, что это — девочка. Какова при этом условии вероятность того, что выбранный учащийся работает в фотокружке? Поскольку девочек в классе только 12, причем из них в фотокружке работает 3, то эта вероятность равна — = —. Таким образом, вероятность события А (выбранный ученик — участник кружка) равна у но при условии, что произошло событие С (выбранный ученик — девочка), эта вероятность изменилась и стала равной —. Вероятность события А при условии, что наступило событие С, обозначается через Р(А1С) и называется условной вероятностью. В рассматриваемом случае эта вероятность равна — = ~j~2/3Ö' ^° ведь — это вероятность события А (т. е. что выбранный ученик и участвует в фотокружке, и является девочкой), а 12/30 — вероятность события С (рис. 200). Таким образом,

(12)

Мы рассмотрели испытание (выбор фамилии ученика из списка), имеющее 30 равновероятных исходов. По аналогии с этим и в общем случае (независимо от того, являются ли исходы испытания равновероятными или нет) формулу (12) считают определением условной вероятности, т. е. дробь, стоящую в правой части, принимают за вероятность события А при условии наступления события С.

Рассмотрение условных вероятностей позволяет написать формулу полной вероятности, которая полезна при решении многих задач. Допустим, что при некотором испытании выделены события Cj, С2, С , которые попарно несовместны (т. е. никакие два не могут наступить одновременно), а их объединение является достовер-

Рис. 200 Рис. 201

ным событием (т. е. при проведении испытания какое-либо одно из событий Ср С2, Сп непременно наступит). Тогда для любого события А мы имеем

Так как события попарно несовместны, то их вероятности складываются, т. е.

Но, согласно (12), для каждого /=1,2,п справедливо равенство

Следовательно, предыдущее соотношение

принимает вид

. (13)

Это и есть формула полной вероятности.

Пусть, например, Cj — выпадение четного числа очков при бросании игральной кости, а С2 — выпадение нечетного числа очков. События Cj и С2 несовместны, а их объединение является достоверным событием. Через А обозначим событие, заключающееся в выпадении не менее четырех очков (т. е. выпадение четверки, пятерки или шестерки). Тогда P(A) = -j, P(Cj) = -|, Р(С2) = -|. Далее, если известно, что выпало четное число очков (т. е. наступило событие Cj), то условная вероятность события А равна у поскольку из трех случаев, благоприятствующих событию Cj (выпадение двойки, четверки или шестерки), событие А имеет место в двух случаях (выпадение четверки или шестерки, рис. 201). Таким образом, Р(А/С^ = —. Аналогично Р(А1С2) = \г. Подставляя эти значения в формулу (13), получаем

соотношение - (как легко видеть, правильное). Это иллюстрирует формулу полной вероятности (13).

В качестве еще одного примера рассмотрим двухдетные семьи. Пол ребенка будем обозначать одной буквой М, Д (мальчик — девочка). Для простоты условимся считать, что рождение как мальчика, так и девочки имеет одну и ту же вероятность (равную —).

Какова вероятность того, что оба ребенка — мальчики, если известно, что в семье есть мальчик? Может показаться интуитивно, что эта вероятность равна —. Ведь один ребенок — мальчик; значит другой будет с вероятностью ^ тоже мальчиком.

Однако такое рассуждение ошибочно; точнее, оно дает решение совсем другой задачи. Если бы мы, например, знали, что старший ребенок — мальчик, то, действительно, вероятность наличия двух мальчиков была бы равна -г. Но нам лишь сказано, что в семье есть мальчик, т. е. хотя бы один ребенок — мальчик (неизвестно, старший или младший), а это уже другая ситуация. Произведем точный расчет. Условимся первой буквой обозначать пол старшего ребенка, а второй буквой — пол младшего. Событие А — наличие двух мальчиков, событие С— наличие хотя бы одного мальчика. Наша задача заключается в нахождении условной вероятности Р(А1С). Наудачу выбранной двухдетной семье соответствуют четыре возможных исхода ММ, МД, ДМ, ДД. Но нам известно, что наступило событие С: в семье есть мальчик, т. е. остаются три исхода ММ, МД, ДМ. Эти исходы равновероятны (поскольку никакой дополнительной информации у нас нет). Таким образом, событию А (два мальчика) благоприятствует один случай из трех, т. е. условная вероятность Р(А/С) равна —, (а не ]р. Иными словами, из двухдетных семей, имеющих хотя бы одного мальчика, примерно одна треть семей имеет двух мальчиков.

В заключение рассмотрим еще один пример из области генетики. В библейские времена браки между близкими родственниками (отца с дочерью, брата с сестрой) считались вполне респектабельными. Позднее браки между родственниками (даже брак двоюродных брата и сестры) стали редкими и представлялись нежелательными. Формула полной вероятности проливает свет на причину этого явления. Рассмотрим это на примере ахейроподии в бразильской популяции.

Допустим, родные брат и сестра (внешне здоровые, как и их родители) вступают в брак; какова вероятность события В — рождения у них больного ребенка (с генотипом аа)1 Рассмотрение этого вопроса надо начать с генотипов родителей этих брата и сестры —

дедушки и бабушки рождающегося ребенка. В следующей таблице приведены возможные варианты их генотипов (события Cj — С4) и соответствующие вероятности (из п. 23):

При условии наступления события Cj брат и сестра имеют оба генотип АА и вероятность рождения у них больного ребенка равна нулю, т. е. Р(В/С{) = 0.

При условии наступления события С2 от бабушки достанется здоровый ген А, тогда как от дедушки с вероятностью }г (каждому) ген а. Если и брат, и сестра будут иметь генотип Аа (это произойдет с вероятностью то у них может родиться больной ребенок (с генотипом аа), причем с вероятностью (по Менделю, как на рис. 192). Таким образом, при условии наступления события С2 вероятность рождения больного ребенка у брата и сестры равна

То же будет при условии наступления события Су

Наконец, при условии наступления события С4 вероятность того, что брат (внешне здоровый, т. е. имеющий хотя бы один ген А) имеет генотип АА, равна ^ (как и в предыдущем примере — только вместо M и Д надо рассматривать А и а). Значит, дополнительное событие — генотип Аа у брата — имеет вероятность —. То же и для его сестры. Следовательно, вероятность того, что оба они (брат и сестра) имеют генотип Аа, равна

При таких их генотипах у них опять с вероятностью — родится больной ребенок. Таким образом, при условии наступления события С4 вероятность рождения больного ребенка у брата и сестры равна

Теперь по формуле полной вероятности находим:

Таким образом, вместо обычной в популяции вероятности рождения больного ребенка Р = 0,0001 (при случайных браках) у родных брата и сестры эта вероятность оказывается равной 0,00289 — почти в 29 раз больше! Аналогично проводятся расчеты для браков других близких родственников.

Сказанное относится не только к ахейроподии, но также к синдрому Дауна и другим генетическим заболеваниям. Именно этим объясняется вырождение у малочисленных изолированно живущих народностей (или в случаях, когда допускаются лишь узко кастовые браки). И имеющийся у некоторых северных народов обычай класть гостя в постель с женой хозяина является для них не аморальным, а оправданным, поскольку это способствует внесению здоровых генов в популяцию.

Выведем теперь формулу Байеса, имеющую важные приложения в теории вероятностей. Пусть Cj, С2, Сп — полная группа попарно несовместных событий, т. е. событие Cj U C2U ... U Cn достоверно, a каждые два различные события С, С. несовместны. Пусть, далее, А — какое-либо событие, и нас интересует условная вероятность P(CJA). Согласно формуле (12)

Если теперь записать Р(А) по формуле полной вероятности (13), то мы получим

Это и есть формула Байеса. Ее применение мы рассмотрим в последующих задачах.

Задачи и упражнения

131. В письменном столе 6 ящиков. С вероятностью ^ в столе лежит письмо. В первых четырех ящиках письма не оказалось. Какова вероятность, что оно лежит в пятом?

132. В школе три первых класса. В классе «А» 10 мальчиков и 10 девочек, в классе «Б» — 13 мальчиков и 8 девочек, в классе «В» — 7 мальчиков и 12 девочек. Какова вероятность, что встреченная вами первоклассница учится в классе «А»?

133. Три стрелка стреляли в одну мишень. В мишени оказалось две пробоины. Первый попадает с вероятностью 0,9, второй — с вероятностью 0,8, третий — с вероятностью 0,7. Какова вероятность, что промахнулся именно третий?

134. В вазе лежали 10 конфет «Мишка» и 5 конфет «Каракум». Три конфеты взял младший брат, затем старший берет наугад одну конфету, не зная, какие именно конфеты взял младший. Какова вероятность, что он вытащит «Каракум»?

135. Игральная кость бросается два раза. Какова вероятность того, что сумма очков будет больше десяти, если при бросаниях ровно один раз выпадала шестерка? А при условии, что при первом бросании выпала шестерка?

35. Независимые события и серии испытаний

Мы уже знаем, что при определенных условиях происходит сложение вероятностей: если события А а В несовместны, то вероятность события A U В равна сумме их вероятностей (формула (10)). А теперь мы рассмотрим случай умножения вероятностей. Будем говорить, что событие А не зависит от события С, если вероятность события А остается одной и той же вне зависимости от того, произошло или не произошло событие С, т. е. если Р(А) = Р(А/С). Иначе говоря, событие А не зависит от С, если

(см. формулу (12)), т. е.

если выполнено соотношение

(14)

Это равенство симметрично относительно обоих событий А а С, поэтому если А не зависит от события С, то и С не зависит от А. В связи с этим говорят короче: события A и С независимы.

Равенство (14) можно считать определением независимости, т. е. два события называются независимыми, если вероятность их одновременного наступления равна произведению вероятностей этих событий. Но как можно убедиться в независимости событий A и С?. Можно, конечно, отдельно вычислить вероятности всех трех событий А, С, А П С и проверить, выполняется ли равенство (14). Однако чаще всего о независимости событий судят, исходя из некоторых общих соображений о том, что наступление события С «не влияет» на вероятность события А.

Пусть, например, два раза подряд бросается монета. Обозначим через С выпадение орла при первом бросании, а через А — выпадение орла при втором бросании. Мы считаем «из общих соображений», что наступление или ненаступление события С, связанного с первым бросанием монеты, никак не сказывается на результате второго бросания (ведь после первого бросания с монетой ничего не произошло, и мы отдельно, независимо бросаем ее второй раз). Иначе говоря, исход первого бросания и исход второго бросания не связаны друг с другом, независимы, т. е. первое и второе бросания происходят «при неизменных условиях». И так как при каждом отдельном бросании

выпадение орла имеет вероятность —, то событие А П С, т. е. выпадение орла при обоих бросаниях, имеет, согласно (14), вероятность P(AnQ = P(A).P(Q = y± = \.

Как видим, мы здесь использовали формулу (14) не для проверки того, что события А и С независимы, а для того, чтобы вычислить вероятность события АГ\С, будучи заранее уверенными в том, что события А а С независимы.

Фактически мы уже несколько раз использовали эти соображения, не указывая явно, что речь идет о независимых событиях. Вспомним, например, вероятностное обоснование законов Менделя. Все гибриды первого поколения имеют генотип Ww. Каждое растение следующего (второго) поколения гибридов с вероятностью — получает материнский ген w (через семяпочку) и независимо от этого с вероятностью — получает отцовский ген w (пыльца). Значит, согласно формуле (14) вероятность появления растения с генотипом ww (морщинистые горошины) равна ~2'~2=~^- А дополнительное событие (гладкие горошины) имеет согласно (11) вероятность —. Это и дает менделевское отношение 3:1.

Важным примером применения формулы умножения вероятностей являются повторные независимые испытания, рассмотренные выдающимся математиком Яковом Бернулли (1654 - 1705). Проводится серия: первое испытание, второе испытание, п-е испытание, причем они проводятся при совершенно одинаковых условиях и их результаты никак не сказываются на последующих испытаниях. Например, можно рассматривать последовательность бросаний монеты (или последовательность бросаний игральной кости). Рассматриваются два дополнительных события S и F, причем событие S («успех») имеет — при каждом испытании — вероятность р, а дополнительное событие F=cS («неудача») имеет вероятность q=\ -р. В случае бросания монеты можно принять за S выпадение орла, а за F — выпадение решки: тогда /? = — и q=l—p = —. При бросании игральной кости можно за S принять, например, выпадение единицы (успех), а за F— выпадение любого другого числа очков; в этом случае Р — ^а-\-р-\. Испытания считаются независимыми, поэтому можно применять формулу умножения вероятностей.

Рассмотрим некоторые типичные задачи, связанные с серией независимых повторных испытаний. Вероятность того, что при всех п

испытаниях нам будет сопутствовать успех, равна рп. В самом деле, вероятность успеха при каждом (первом, втором, п-м) испытании равна р, а вероятность пересечения этих событий (т. е. наступления успеха при всех испытаниях) равна, в силу независимости испытаний, произведению их вероятностей, т. е. равна р-р-...-р (где число множителей равно п).

Аналогично, вероятность того, что при всех п испытаниях нас будет преследовать неудача, равна qn. Следовательно, дополнительное событие (т. е. наступление хотя бы одного успеха при п испытаниях) имеет вероятность 1 - qn.

Например, при бросании кости (успех — выпадение единицы, т. е. /? = —, q = ~ß) вероятность наступления успеха при всех п испытаниях (каждый раз выпадала единица) равна . Вероятность неудачи при всех п испытаниях (ни разу не выпала единица) равна . А дополнительное событие (при п бросаниях хотя бы раз выпала единица) имеет вероятность

Если же бросается пара костей и успехом считается выпадение двух единиц, то вероятность успеха р = —, а вероятность неудачи

В случае, когда пара костей последовательно бросается п раз, вероятность успеха при всех п испытаниях равна

вероятность неудачи при всех испытаниях (ни разу не выпала пара единиц) равна

А дополнительное событие (при п бросаниях хотя бы раз выпала пара единиц) равна

В частности, при п = 24 вероятность неудачи при всех испытаниях равна (как мы видели при рассмотрении игры де Мере)

Особенно интересна при рассмотрении испытаний Бернулли задача о том, с какой вероятностью при п испытаниях успех осуществится ровно к раз. Случаи к = О или к = п были рассмотрены выше, а сейчас мы обратимся к рассмотрению произвольного к (где 0<к<п).

Сначала определим вероятность того, что первым к испытаниям будет сопутствовать успех, а всем последующим п-к испытаниям — неудача. Так как успех или неудача при каждом испытании представляют собой события, независимые от результатов других испытаний, то, согласно формуле умножения (см. (14)), искомая вероятность равна р-p...pqq...q, где первые к множителей равны р, а последующие п-к множителей равны q, т. е. эта вероятность равна pkqn~k. Та же вероятность соответствует событию, которое состоит в том, что при испытаниях с заданными к номерами (скажем, первыми к нечетными) осуществится успех, а при всех остальных испытаниях — неудача. Общее же событие «п испытаний привели к раз к успеху и п-к раз к неудаче» есть объединение стольких элементарных событий (рассмотренного типа), сколькими способами можно к букв S расставить на п местах (а на остальных местах поставить букву F). Это число способов равно ММ (сочетания без повторений). Каждое из этих элементарных событий имеет вероятность pkqn~k, а друг с другом они несовместны. Поэтому по формуле сложения вероятностей (см. (10)) вероятность получить ровно к успехов при п испытаниях равна

(15)

Последнее выражение получается с помощью формулы Стирлинга (6).

В качестве иллюстрации этой формулы заметим, что сумма всех чисел Р(к) (по к = 0, 1, п) должна быть равна единице, поскольку осуществление хоть какого-то числа успехов (от 0 до п) есть достоверное событие. И в самом деле, сумма всех чисел Р{к) по к = 0, 1, п согласно формуле бинома Ньютона (см. п. 28), равна (p + q)n= ln= 1.

Рассмотрим пример. Монета бросается 10 раз. Какова вероятность того, что ровно 5 раз выпадает орел и 5 раз решка? Здесь «успех» (орел) имеет вероятностьР-^ «неудача» (решка) тоже имеет вероятность q = ^- В данном случае я =10, к = 5. По формуле (15) находим искомую вероятность:

Результат может показаться странным: ведь вероятность выпадения орла равна — и естественно ожидать, что при 10 бросаниях выпадут как раз 5 орлов и 5 решек. А расчет дал для вероятности

Рис. 202 Рис. 203 Рис. 204

этого события значение 0,246, т. е. примерно — Иначе говоря, всего один шанс из четырех за то, что при 10 бросаниях монеты орел выпадет ровно 5 раз.

Аналогично вероятность выпадения орла ровно 4 раза (при десяти бросаниях) равна

Такова же вероятность выпадения орла ровно 6 раз. Значит, вероятность того, что орел выпадет 4, 5 или 6 раз, примерно равна 0,205 + 0,246 + 0,205 = 0,656, т. е. примерно равна —. Значит, имеется два шанса из трех за то, что при 10 бросаниях монеты орел выпадет 4, 5 или 6 раз.

На рис. 202 графически показаны вероятности выпадения орла к раз при десяти бросаниях монеты. «Колоколообразная» линия, соединяющая показанные точки, характерна для поведения вероятностей при испытаниях Бернулли.

В качестве второго примера рассмотрим шестикратное бросание игральной кости. «Успех» (выпадение единицы) имеет вероятность /? = —, тогда как «неудача» (выпадение не менее двух очков) — вероятность # = т- Вероятность одного успеха при шести бросаниях (п = 6, к - 1) равна

т. е. эта вероятность примерно равна — На рис. 203 графически показаны вероятности к успехов в этой задаче. И здесь наблюдается похожая колоколообразная кривая, но смещенная влево (это связано с тем, что вероятность р меньше половины). А если «успехом» при бросании кости мы будем считать выпадение не менее трех очков (здесь /> = т), то при восьми бросаниях (п = 8) мы получим картину, показанную на рис. 204. В этом случае колоколообразная кривая смещена вправо.

В заключение укажем формулу, которая была найдена известным французским математиком Симоном Пуассоном (1781 - 1840) и которая дает при определенных условиях приближенное значение веро-

ятности (15). Условия, при которых удобно применять формулу Пуассона, следующие: к невелико по сравнению с п (это обозначают так: к«п, читается: «к много меньше п») и, кроме того, вероятность успеха р имеет вид р = —, где Л, также невелико по сравнению с п (т. е. Х«п). Используя соотношения

мы можем переписать выражение (15) в виде

Здесь справа в первой дроби и в числителе, и в знаменателе стоят к множителей, примерно равных /г, и потому эта дробь приближенно равна 1. Далее,

(поскольку число m = z~ велико, а дробь-- близка к 1). Окончательно получаем:

(16)

Это и есть формула Пуассона, дающая приближенное значение вероятности того, что при п последовательных испытаниях Бернулли «успех» реализуется к раз.

Рассмотрим примеры применения формулы Пуассона. Вернемся снова к шестикратному бросанию игральной кости, причем успехом будем по-прежнему считать выпадение единицы, т. е. п = 6, Р = ^-

В формуле Пуассона принимается, что /? = —, т. е. в данном случае Х= 1. Теперь вероятности к успехов в этой задаче, вычисленные по формуле Пуассона, показаны на рис. 205 (точки), а для сравнения черточками показаны точные значения этих вероятностей (как на рис. 203). Мы видим, что для всех к значения вероятностей близки друг к другу, хотя вряд ли можно считать, что п = 6 «велико» по сравнению с к = 0, 1, 2, 3, ... . А при больших значениях п совпадение обеих частей приближенного равенства (16) еще более хорошее.

В качестве второго примера возьмем некоторую (случайно подобранную) группу из 100 бразильцев, которые все фенотипически нор-

Рис. 205 Рис. 206

мальны. Какова вероятность Pj того, что среди них имеются к лиц, имеющих генотип Ла, т. е. имеющих один рецессивный ген я, связанный с ахейроподией? Конечно, нас интересуют лишь небольшие значения к (скажем, к = 0, 1, 2, 3, 4).

Вероятность иметь ген а в данном случае, как мы видели, равна /7 = 0,02. Так как п= 100, то по формуле Р = ~ мы должны принять Х = 2. Здесь, в самом деле, к и X невелики по сравнению с п. Теперь по формуле Пуассона находим следующие приближенные значения вероятностей (рис. 206): 0,135, Pj - 0,270, Р^ 0,270, Ръ^ 0,180.

Рассмотрим еще один пример. В клубе 500 человек. Какова вероятность Рк того, что для к членов клуба их день рождения совпадает с праздником рождества (25 декабря)? Здесь вероятность «успеха»

(т. е. совпадение дня рождения с праздником рождества)

число испытаний п = 500. Следовательно,

т. е. X невелико по сравнению с п. По формуле (16) находим следующие приближенные значения вероятностей:

В частности, вероятность того, что хотя бы один из членов клуба родился в день рождества, равна 1 - PQ ~ 0,746, т. е. примерно три шанса из четырех за то, что кто-то из членов клуба отмечает день рождения в праздник рождества.

Наконец, приведем еще одну иллюстрацию. Допустим, что по статистике в час пик (1200 — 1300) в городе происходит дорожно-транспортное происшествие (ДТП) с вероятностью 0,732. Тогда вероятность ДТП в данную минуту равна р = -^-0,732 = 0,0122. Какова вероятность того, что в какую-то минуту произойдут одновременно два ДТП? А три? А ни одного ДТП?

Здесь n = 60 (исследуются 60 минут часа пик, т. е. последовательные испытания состоят в том, что берется первая минута, затем вторая, третья,60-я). В этой ситуации Х-пр- 60 0,0122 = 0,732, т. е. X невелико по сравнению с п. По формуле (16) находим:

Аналогичным образом по формуле Пуассона рассчитываются частоты телефонных вызовов (если X невелико, т. е. линия не очень загружена): вероятность PQ того, что в данную минуту часа нет ни одного вызова, вероятность Р^ поступления ровно одного вызова в данную минуту, вероятность Р2 двух одновременных вызовов (и тогда если линия занята первым вызывающим, то второй слышит частые гудки, а в современных телефонах можно поговорить втроем) и т. д. В частности, 1 - Р^ есть вероятность того, что в течение этой минуты будет хотя бы один вызов.

Задачи и упражнения

136. Вероятность попадания торпеды в цель равна 1/3. Сколько следует выпустить торпед, чтобы вероятность попадания в цель хотя бы одной была больше, чем 0,9?

137. На экзамене студенту задается 10 вопросов, на которые он должен ответить «да» или «нет». Какова вероятность, что он ответит правильно не меньше, чем на 7 вопросов, если он отвечает наугад?

138. Рейс из А в В совершают два самолета: двухмоторный и четырехмоторный. Вероятность выхода из строя каждого из моторов равна р. Двухмоторный самолет может продолжать полет и на одном моторе, а четырехмоторный — на трех и на двух моторах, а на одном уже не может. При каких значениях р безопаснее лететь на двухмоторном самолете?

139. В булочке с изюмом в среднем бывает 3 изюминки. Какова вероятность, что в купленной булочке не окажется изюминок?

140. Некоторую редкую группу крови имеет в среднем один человек на тысячу. У скольких людей нужно взять кровь на исследование, чтобы с вероятностью, большей 0,5, обнаружить человека с кровью этой группы?

Беседа 8. Случайные величины

36. Математическое ожидание и дисперсия

Сумма очков, выпавших на паре брошенных костей (скажем, синей и красной), может принимать значения 2, 3, 12 с вероятностями, указанными в следующей таблице:

Например, сумме очков 5 соответствуют возможности (1;4), (2; 3), (3; 2), (4; 1), каждая из которых реализуется с вероятностью 1/36, так что сумма очков 5 выпадает с вероятностью 4/36 = 1/9. Аналогично вычисляются и другие вероятности. Сумма очков, выпавших на паре брошенных костей, представляет собой случайную величину, которая может принимать значения 2, 3, 12 с указанными в таблице вероятностями.

Если случайная величина X может в результате испытания принимать числовые значения xv х2, *п с вероятностями pv р2, р , то число

(1)

называется математическим ожиданием этой случайной величины (от слова Expectation —ожидание).

Поясним смысл этого понятия на следующем примере. Колесо рулетки имеет по окружности длину 1. Эта окружность разделена на п дуг, имеющих длины pv р2, рп (так что/?, +р2 + ... +рп = 1), и на этих дугах написаны некоторые положительные числа хп (рис. 207). Если игрок запускает рулетку (производит испытание), то вращающаяся стрелка укажет после остановки некоторую дугу, и написанное на этой дуге число будет означать выигрыш игрока. Здесь случайная величина X (выигрыш) может принимать значения х^ х2, хп с вероятностями р2, р . Число (1) означает ожидаемый выигрыш (или «средний» выигрыш).

Пусть теперь испытание S состоит в пятикратном бросании монеты, и число выпадений орла считается «выигрышем». Таким образом, рассматривается случайная величина S5 (выигрыш), которая может принимать значения k = 0, 1, 2, 3, 4, 5 с вероятностями, которые несложно вычисляются по формуле (15), приведенной в предыдущей беседе:

Математическое ожидание числа выпадений орла, согласно (1), равно

Рис. 207

Результат этот очевиден: так как вероятность выпадения орла при каждом бросании равна —, то при пяти бросаниях естественно «ожидать» 5--^ выпадений орла. А при п бросаниях монеты математическое ожидание числа выпадении орла равно п-—.

В общем случае для серии испытаний Бернулли картина аналогична. При каждом из п испытаний событие S («успех») наступает с вероятностью /?, а дополнительное событие («неудача») — с вероятностью q= 1 -р. Число успехов при проведении п испытаний есть случайная величина — обозначим ее через Sn, — которая может принимать значения с вероятностями, вычисляемыми по формуле (15) из предыдущей беседы. Следовательно, ее математическое ожидание равно

(сумма по всем к = 0, 1, п). Читатель может проверить с помощью формулы бинома Ньютона, что E(Sn) = пр. Впрочем, интуитивно этот результат понятен: вероятность успеха S при каждом испытании равна р, и потому при п испытаниях можно «ожидать» пр успехов.

Рассмотрим, наконец, пуассоновскую случайную величину Г, которая может принимать значения к = О, 1, 2, ... с вероятностями

(2)

(к = 0, 1,2, см. формулу (16) в предыдущей беседе). Здесь случайная величина Y может принимать бесконечное множество значений 0, 1, 2, ... . Однако сумма их вероятностей по-прежнему равна единице:

Это вытекает из разложения функции ех в ряд (доказываемого в математическом анализе):

С помощью того же ряда читатель может вычислить математическое ожидание пуассоновской случайной величины Y. Оно оказывается равным E(Y) = X. Впрочем, интуитивно это понятно. Мы производим п испытаний Бернулли, вероятность успеха при каждом испытании равна

Поэтому E(Sn) = пр = Х. В пределе

(при п —» оо) случайная величина Sn превращается в пуассоновскую величину Г, и мы получаем E(Y) = X.

В качестве иллюстрации вернемся к игре Шевалье Де Мере. Он 24 раза бросал пару костей и считал успехом выпадение двух единиц.

Здесь вероятность успеха р-^гт. При я = 24 мы имеем рп = — -24 = — т. е. число Х-рп, в самом деле, невелико по сравнению с п. Поэтому можно применять приближенную формулу (16) из предыдущей беседы. В частности, при к = 0 получается вероятность

т. е. вероятность невыигрыша для Де Мере примерно равна \^J> как мы и видели раньше (см. соотношение (2) в предыдущей беседе). Далее, математическое ожидание количества выигрышей

Проигрыши де Мере объяснялись не «ошибочностью» математики, а тем, что он не учитывал приближенность замены бернуллиевой случайной величины S предельной (пуассоновской) случайной величиной Y.

Второй важной характеристикой случайной величины является ее дисперсия, показывающая разброс возможных значений вокруг математического ожидания (т. е. «среднего» значения). Пусть случайная величина X имеет математическое ожидание E(X) = [i (см. (1)). Тогда случайная величина X-[i представляет собой отклонение величины X от ее среднего значения . Это отклонение может быть положительным, отрицательным или нулем. Квадрат же этого отклонения есть неотрицательная случайная величина; ее математическое ожидание обозначается через D(X) и называется дисперсией случайной величины X:

(3)

Раскрывая скобки и учитывая равенствор^ +р2 + ... +рп = 1 и формулу (1), находим формулу для вычисления дисперсии:

(4)

В качестве примера снова рассмотрим пятикратное бросание монеты. Здесь, как мы видели, E(S5) = [i = —. Далее, квадрат (S5) случай-

ной величины S5 принимает значения О2, I2, 22, З2, 42, 52 с теми же вероятностями, что и раньше:

Поэтому

следовательно, по формуле (4) дисперсия D(S5) равна

Это можно понять так:

где п = 5 есть число бросаний, а вероятность успеха (и неудачи) при каждом бросании. Это справедливо и для любой серии испытаний Бернулли: случайная величина S , означающая число успехов при п испытаниях, в каждом из которых вероятность успеха равна /?, имеет, как мы видели, математическое ожидание пр\ дисперсия же ее равна npq\

(5)

Читатель может убедиться в этом, проводя тождественные преобразования с помощью формулы бинома Ньютона. Однако удобнее применить другой прием. Продифференцировав формулу бинома Ньютона

а затем умножив результат на X, находим

Снова применяя ту же операцию (дифференцирование с последующим умножением на х), после упрощений получаем

Если теперь в двух полученных соотношениях положить х = —, а затем умножить результаты на qn (где q - 1 -р), то мы найдем:

Рис. 208

Первое из этих соотношении означает, что [i = E(Sn) = np (см. (1)), а второе означает, что E((Sn) ) = npq + (i , т. е. D(Sn) = npq (согласно (4)). Читатель, возможно, обратил внимание на то, что мы здесь использовали производящую функцию и ее дифференцирование.

Укажем, наконец, что для пуассоновской случайной величины Y (см. (2)) дисперсия, как и математическое ожидание, оказывается равной Х\

(6)

В этом можно убедиться с помощью ряда для ех, причем и в этом случае удобно дважды применить ранее рассматривавшуюся операцию (дифференцирование с последующим умножением на х).

Смысл понятия дисперсии можно еще пояснить с помощью механической аналогии. Предположим, что единичная масса разделена на частичные массы т2, тп, которые расположены на числовой оси в точках с координатами х^, х2, хп (рис. 208). Тогда координата центра тяжести этой системы масс равна

Иначе говоря, если рассматривать х^ х2, хп как значения случайной величины X, аШ|, т2, тп — как вероятности этих значений, то координата \i центра тяжести есть математическое ожидание рассматриваемой случайной величины: E(X) = [i. Далее, согласно (3), т. е. дисперсия D(X) представляет собой момент инерции рассматриваемой системы масс относительно ее центра тяжести (который с механической точки зрения как раз характеризует разброс масс относительно центра тяжести системы).

Задачи и упражнения

141. Чему равняется математическое ожидание и дисперсия числа очков, выпадающих при бросании игрального кубика?

142. Ответьте на те же вопросы, если кубик имеет смещенный центр тяжести и вероятность выпадения каждой грани пропорциональна числу, указанному на этой грани.

143. Известна следующая игра. Игрок называет число от 1 до 6. Второй бросает три игральных кости (или три раза подряд одну кость). Если

выпадает один раз названное число очков — первый получает от второго один доллар, при двух костях с этим числом очков — два доллара и при трех - три. Если названное число очков не выпадает, то первый платит один доллар второму. Чему равно математическое ожидание величины выигрыша первого игрока?

144. Найдите математическое ожидание величины выигрыша в «Спортлото».

145. Подбрасывается монета до тех пор, пока не выпадет герб. Найдите математическое ожидание количества подбрасываний монеты.

37. Нормальное распределение

На рассматривавшихся ранее рисунках 202 - 206 показаны «колоколообразные» кривые для испытаний Бернулли с различными п, р, q. Схожесть этих кривых естественно приводит к вопросу: нельзя ли указать одну «универсальную» колоколообразную кривую, из которой любая бернуллиева кривая получалась бы сдвигом и растяжениями? Утвердительный ответ на этот вопрос был получен в начале XVIII столетия английским математиком Муавром де Абрахамом и, в более усовершенствованной форме, французским математиком Пьером Лапласом в начале XIX столетия. В этом пункте мы поясним их результат.

Для удобства сначала укажем ту функцию, график которой служит искомой «универсальной кривой»:

(7)

ее график показан на рис. 209. Укажем некоторые свойства этой функции и ее графика.

График функции ф(х) симметричен относительно оси ординат. Это непосредственно вытекает из того, что функция ф(х) четна (поскольку в ее выражение входит лишь х2, т. е. при подстановке х и -х получается одно и то же значение функции).

Функция ф(х) достигает максимума в точке х = 0 и монотонно убывает до нуля при увеличении аргумента. График функции ф(х) представляет собой «колоколообразную» кривую. Это также очевидно, поскольку показатель степени -— в формуле (7) отрицателен и возрастает по модулю ло бесконечности ппи х —» ©о.

Рис. 209 Рис. 210

Площадь, заключенная между графиком функции и осью абсцисс, равна 1 (рис. 210). Иначе говоря,

(8)

Теперь обратимся к теореме Муавра—Лапласа. Рассуждения будут носить интуитивный, поисковый характер. Пусть S — случайная величина, означающая число успехов при проведении п последовательных испытаний Бернулли, причем в каждом испытании вероятность успеха равна р. Как мы знаем, математическое ожидание этой случайной величины равно E(Sn) = пр. Будем для простоты считать, что число пр является целым, и найдем вероятность того, что число успехов будет равно пр. Используя формулу (15) предыдущей беседы (при k = np, n-k-nq), мы находим:

Можно убедиться (при помощи той же формулы (15)), что если к отличается от пр, то вероятность Р(к) наступления к успехов при п испытаниях будет меньше, чем , ^ Таким образом, функция Р(к) (к = 0, 1, п) достигает наибольшего значения при к-пр.

Теперь заметим, что правая часть формулы (15) определена при всех к > 0, а не только при целых (левую часть тоже можно доопределить при нецелых к, но это требует сложного математического аппарата). Рассмотрим функцию Р(х) и попытаемся сдвигами и растяжениями (сжатиями) приблизить ее к ф(х). Функция ф(х) достигает наибольшего значения при х = 0 (рис. 209), поэтому кривую, соответствующую испытаниям Бернулли (рис. 202-206), целесообразно для сравнения с ф(х) сдвинуть влево на расстояние пр, т. е. рассмотреть функцию Р* (х) = Р(х + пр) (рис. 211, который построен для случая /7=100, /7 = 0,25). Тогда функция Р*{х), как и функция ф(х), будет иметь наибольшее значение при х = 0. Но наибольшее значение функции Р*{х), т. е. Р*(0) = Р{пр), как мы видели, равно , , тогда как наибольшее значение функции ф(х) равно ф(0) = ~т==. Следовательно, чтобы сделать наибольшие значения рассматриваемых функций одинаковыми, надо вместо Р*(х) взять функцию ^npq Р*(х).

Далее, как мы знаем, Р(0) + Р(1) + ... + Р(п) = 1, поскольку вероятность того, что хоть какое-нибудь число успехов (от 0 до п) наступит при п испытаниях, равна единице. Это означает, что площадь под

Рис. 211 Рис.212

графиком кривой Р(х) равна единице (на рис. 212 площадь заштрихованного прямоугольника равна Р(1)). То же верно и для сдвинутой функции Р*(х), а для функции ^npq Р*(х) это неверно — все ее ординаты в ^npq раз больше ординат функции Р*(х), поэтому площадь под графиком функции Anpq Р*(х) равна Anpq. Это можно исправить следующим образом: сжать график функции Anpq Р*(х) к оси ординат в ^npq раз, т. е. рассмотреть функцию

(9)

площадь под ее графиком равна единице, как и для функции ф(х) (график функции Anpq P*(xAnpq) приведен на рис. 213).

Итак, функция (9) имеет максимальное значение при х = 0, это максимальное значение равно -р=, как и для функции ф(х), и площадь под графиком функции (9) равна 1, как и для функции ф(х). Иначе говоря, обе функции «похожи». Это и дает геометрическую форму теоремы Муавра—Лапласа: при я —> оо график функции (9) все более тесно прижимается к графику функции ф(х). Доказательство может быть получено предельным переходом (при п —> <*>) с помощью формулы (15).

А теперь сформулируем теорему Муавра—Лапласа в интегральной форме. Так как кривые (9) и ф(х) близки, то площадь под кривой (9) на участке а<х<Ь примерно равна аналогичной площади для кривой (7) (рис. 214), т. е. примерно равна

Но площадь под кривой (9) на указанном участке равна сумме вероятностей Р(Г) по всем /, для которых aAnpq +пр<1< bAnpq +пр. Это ясно из рис. 212, на котором площадь заштрихованного прямоугольника равна Р(Г). Иначе говоря, вероятность того, что значения случайной величины Sn (т. е. число успехов при п испытаниях) заключено между aAnpq +пр и bAnpq + пр, примерно равна указанному выше интегралу (и стремится к этому интегралу при п —> °о)

Рис. 213 Рис. 214

(10)

Это и есть предельная теорема Муавра—Лапласа. Часто в приложениях используют функцию

(11)

т. е. через Ф{х) обозначают площадь под кривой ф(г) на участке от -оо до X (рис. 215). Ясно тогда, что правая часть равенства (10) равна Фф)-Ф(а) (рис. 214).

В заключение остановимся на понятии распределения случайной величины и, в частности, определим смысл термина нормальное распределение. Пусть X— случайная величина, которая может принимать конечное число значений xv х2, хп. Говорят, что задано распределение случайной величины X, если заданы те вероятности р^ р2, р , с которыми величина X принимает эти значения: Р(Х = х^)=р^ Р(Х = х2) =р2, Р(Х = хп) = рп. Например, случайная величина Sn, т. е. число успехов при п испытаниях Бернулли, имеет распределение P(X = k) = ^jpkqn~k (см. формулу (15) в предыдущей беседе). Его называют биноминальным распределением, поскольку в его выражение входят биноминальные коэффициенты

Термин распределение употребляется и в том случае, когда случайная величина принимает бесконечное множество значений. Например, правая часть формулы (16), рассмотренной в предыдущей беседе, задает пуассоновское распределение Р(Х = к) = утХ/хе~^, приближенно описывающее число успехов при большом числе испытаний Бернулли, когда вероятность успеха при каждом испытании имеет вид

Рис. 215 Рис. 216

Р-~, где А, мало в сравнении с п. Здесь случайная величина может принимать, вообще говоря, бесконечное (счетное) множество значений.

Но случайная величина может принимать и несчетное множество значений. Например, если мы бросаем шарик в длинную узкую (по ширине равную диаметру шарика) коробку, то точка касания шарика с дном коробки может оказаться в любой точке некоторого отрезка на основании коробки. Обычно такое непрерывное распределение можно описать с помощью функции ф(х), которая представляет собой не вероятность того, что F точно примет значение х, а плотность вероятности в точке а. Говорят, что случайная величина F имеет плотность вероятности ф(х), если вероятность того, что F примет значение, принадлежащее отрезку [а; Ь], равна

Таким образом, чем меньше отрезок [а; Ь], тем меньше вероятность того, что F примет значение, принадлежащее этому отрезку. Вероятность того, что F примет какое-нибудь действительное значение, равна (согласно (8)) единице, как и следует ожидать, а вероятность того, что F примет в точности заданное значение а, равна

Непрерывное распределение с плотностью ф(х), определенное равенством (7), принято называть нормальным распределением.

Связь биноминального и нормального распределений (теорема Муавра—Лапласа) может быть в иной форме пояснена с помощью понятия функции распределения. Пусть X — некоторая случайная величина. Обозначим через fa) вероятность того, что случайная величина X примет значение, не превосходящее a: fa) = Р(Х<а). Тогда f(x), очевидно, представляет собой неубывающую функцию. Она называется функцией распределения случайной величины X. Для любой случайной величины X ее функция распределения удовлетворяет ус-

ловиям

(т. е. вероятность того, что х примет значение, «не превосходящее +оо»5 равна единице).

Для нормального распределения соответствующая функция распределения равна Ф(х) (см. (11)), ее график показан на рис. 216. Теперь интегральная теорема Муавра—Лапласа может быть сформулирована следующим образом: с точностью до сдвига и растяжения функция распределения для бернуллиевой случайной величины примерно совпадает с нормальной функцией распределения Ф(х) (чем больше п, тем точнее совпадение).

Биноминальное, пуассоновское и нормальное распределения представляют собой наиболее важные распределения — как в самой теории вероятностей, так и в ее приложениях.

Задачи и упражнения

146. Постройте график функции распределения для случайной величины, равной числу очков, выпадающих на грани игрального кубика.

147. Постройте аналогичный график для кубика со смещенным центром тяжести (см. задачу 142).

148. Если бы проводилась игра «Спортлото» 3 из 6 (см. задачу 129), то как выглядела бы функция распределения для числа угаданных номеров в этой игре?

149. Объясните, почему многие инженеры считают, что при нормальном распределении значения, большие 3, практически не возникают.

150. При каких значениях а и b функция f(x) = a arctg х + b может быть функцией распределения некоторой случайной величины?

38. Закон больших чисел

Допустим, что производится п бросаний монеты. Рассчитывать, что успех (орел) осуществится ровно в половине случаев, мы, конечно, не вправе. Однако какова вероятность того, что частота выпадений орла будет заключена между 0,49 и 0,51, т. е. < 0,01? Ответ легко может быть получен с помощью интегральной теоремы Муавра—Лапласа.

Здесь вероятность успехар-\- и легко найти те значения а, Ъ, для которых (см. (10))

Это будет при

(12)

Из этого следует, что при п —> оо, поскольку при я —> оо пределы интегрирования в (12) захватывают все большую часть числовой прямой. Например, при я =10 ООО вероятность (12) оказывается равной 0,9545 (это легко установить с помощью таблицы значений функции Ф(х), имеющейся во многих учебниках теории вероятностей), а при п = 40 ООО она становится равной 0,99994.

Аналогичный расчет показывает, что для испытаний Бернулли, в которых вероятность успеха при каждом испытании равна р, для любого £ > 0 справедливо соотношение

(13)

Иными словами, вероятность того, что средняя доля успехов при испытаниях Бернулли отклоняется от р более, чем на заданное положительное число £, стремится к нулю при я —> оо.

Это утверждение известно под названием закона больших чисел, который оправдывает наше интуитивное представление о вероятности как о частоте наступления успеха.

Закон больших чисел можно осмыслить еще следующим образом. Обозначим через X. случайную величину, означающую исход /-го испытания, /= 1, п. Она принимает значение 1 (успех) с вероятностью р и значение 0 (неудача) с вероятностью q-\ -р. Случайную величину X; можно назвать числом успехов при проведении i-го испытания. Теперь ясно, что Sn = Х^ + Х2 + ... + Хп, т. е. число успехов в п испытаниях равно числу индексов /, для которых величина Х[ принимает значение 1. Теперь закон больших чисел может быть сформулирован следующим образом.

Пусть Ху Ху, ••• — последовательность взаимно независимых случайных величин с одинаковыми распределениями и математическим ожиданием ц = Е(Х^. Тогда для £ —> 0

(14)

Выше мы обосновали справедливость этого утверждения лишь в случае, когда Х[ принимают лишь два возможные значения 1 и 0 с вероятностями р и q= 1 -р соответственно (так что [i=p). Но теперь это обстоятельство не постулируется, т. е. указанная формулировка относится к случаю, когда распределение случайной величины X произвольно. Тем не менее, и в такой более общей формулировке закон

больших чисел оказывается справедливым. Это было установлено русским математиком А. Я. Хинчиным в 1929 году.

Пусть, например, рассматривается последовательность бросаний не монеты, а игральной кости, и случайная величина — число очков, выпавшее при i-м бросании. Здесь математическое ожидание величины X; равно

есть среднее число очков, выпавших после п бросаний. Закон больших чисел в формулировке Хинчина утверждает, что при большом п это среднее число очков с вероятностью, близкой к 1, будет близким к —. Если при этом дисперсия D(Xt) конечна для всех /, то можно указать оценки, аналогичные (10); это было установлено Линденбергом в 1922 году. Однако в формулировке Хинчина (14) закон больших чисел справедлив без каких бы то ни было предположений о дисперсии.

Более того, был установлен закон больших чисел в усиленной форме. Для случая испытаний Бернулли он утверждает, что для любого £ > 0 с вероятностью 1 неравенство

(15)

осуществляется при неограниченном возрастании п лишь для конечного числа испытаний, т. е. левая часть неравенства (15) принимает большие значения крайне редко. Этот закон был сформулирован и доказан Кантелли в 1917 году. Еще более сильный результат (так называемый закон повторного логарифма) был найден в 1924 году А. Я. Хинчиным, а затем еще усилен (в 1929 году) выдающимся русским математиком А. Н. Колмогоровым. Мы здесь эти результаты не формулируем; отметим лишь, что в формулировке Колмогорова допускается рассмотрение последовательности случайных величин Ху Х2, ... с различными распределениями.

В заключение мы приведем одно приложение закона больших чисел, найденное в 1909 году известным французским математиком Борелем и впоследствии усиленное А. Я. Хинчиным.

Пусть X — действительное число, удовлетворяющее неравенствам 0 < X < 1, и пусть

(16)

— его десятичное разложение. Будем проводить последовательность независимых испытаний Бернулли, где /2-е испытание состоит в том, что мы рассматриваем п-ю цифру числа х. Испытание будем считать успешным, если эта цифра равна 5. Таким образом, с каждым числом (16) связана бесконечная последовательность указанных испытаний Бернулли. Здесь при каждом испытании вероятность успеха равна

/? = — (поскольку 5 — одна из десяти возможных цифр 0, 1, 9).

Обозначим через Sn(x) количество успехов в п испытаниях, т. е. количество пятерок среди первых п цифр числа х. Таким образом, отношение —-— есть частота появления пятерки среди первых п цифр числа X. Усиленный закон больших чисел утверждает, что почти для всех чисел х отношение —-— стремится к — при п —> <*>. Здесь вместо пятерки можно взять любую другую цифру, т. е. почти для всех х частота появления каждой из десяти цифр стремится к при я —> оо. Иначе говоря, почти все числа обладают тем свойством, что (при п —> оо) в них с одинаковой частотой, равной у^-, встречаются все десять цифр. То же верно не только в десятичной системе, но и в системе счисления с любым другим основанием. Таким образом, почти все числа нормальны, т. е. в любой системе счисления в них все цифры встречаются одинаково часто (когда мы берем все большее и большее число цифр после запятой). Здесь термин «почти все» понимается в смысле меры Лебега, о которой мы поговорим в другой раз.

Так что можно сказать, что действительных чисел, не являющихся нормальными, «ничтожно мало». Однако, как это ни странно, указать хотя бы одно нормальное число не удается!

Беседа 9. Информация

39. Чет — нечет

Мы начнем с рассмотрения следующей известной задачи. Конь стоит в углу шахматной доски (рис. 217); может ли он попасть в противоположный угол, побывав ровно один раз на каждой клетке шахматной доски? Вообще, в любой ли клетке может конь завершить путь, побывав ровно один раз на каждой клетке?

Для решения этой задачи заметим, что если конь стоит на черной клетке, то следующим ходом он попадает на белую (рис. 218) и наоборот. Иначе говоря, после каждого хода коня цвет клетки, на которой он находится, меняется. Следовательно, после нечетного числа ходов цвет клетки меняется (конь попадает на белую клетку), а после четного конь снова попадает на черную: нечет (белая) — чет (черная) — нечет (белая) — чет (черная) — ... Но ведь если конь находится на первой клетке (черной), то, чтобы побывать по разу на всех 64 клетках, ему нужно сделать 63 хода, т. е. нечетное число ходов. Значит, побывав по разу на каждой клетке, конь завершит путь на белой клетке, т. е. попасть в противоположный угол (на черную клетку) он не сможет. Это дает отрицательный ответ на первый из поставленных вопросов.

Рис. 217 Рис. 218 Рис. 219

А на второй вопрос проведенное рассуждение дает такой ответ: если и возможно, побывав на каждой клетке один раз, завершить путь в заданной клетке, то только в том случае, когда заданная клетка — белая. Иначе говоря, для возможности предписанного обхода доски необходимо, чтобы заданная конечная клетка была белой. В рассматриваемой задаче это необходимое условие является также и достаточным (что бывает далеко не всегда), т. е. для любой заданной белой клетки существует путь коня, обходящий по разу все клетки и оканчивающийся в заданной белой клетке. Однако это не вытекает из проведенного выше рассуждения, а требует отдельного обоснования.

Таким образом, чтобы знать, существует ли решение рассмотренной задачи, надо иметь ответ типа «да» — «нет» только на один вопрос: является ли белой заданная конечная клетка.

Рассмотрим еще один пример. На плоскости задана замкнутая линия L, не пересекающая себя. Какая бы она ни была сложная (рис. 219), эта линия разбивает плоскость на две области: внутреннюю (она заштрихована на рис. 220) и внешнюю. Две точки, принадлежащие одной и той же области, могут быть соединены ломаной, которая не пересекается с L (точки Л и В на рис. 220), тогда как две точки, лежащие в разных областях, не могут быть соединены такой ломаной. Это утверждение (теорема Жордана) на самом деле справедливо для любой замкнутой линии, которая не пересекает себя, но об этом мы поговорим впоследствии, а сейчас ограничимся случаем, когда L — ломаная. Возьмем некоторую точку Р, не лежащую на линии L (рис. 221). Как узнать, находится она во внутренней или во внешней области? Для этого нужно провести луч к, исходящий из точки Р и не

Рис. 220 Рис. 221

проходящий ни через одну из вершин ломаной L. Точка лежащая далеко на луче к (в бесконечности), принадлежит внешней области. Если же мы будем двигаться по лучу от точки Р к то при каждом пересечении линии L будем переходить из одной области в другую: нечет — чет — нечет — чет ... (внутренняя — внешняя — внутренняя — внешняя ...). Таким образом, если луч к пересекает линию L нечетное число раз, то точка Р находится во внутренней области, если четное — во внешней. Иными словами, чтобы знать, в какой области находится точка Р, надо иметь ответ типа «да» — «нет» только на один вопрос: является ли четным число точек пересечения луча к с ломаной L.

В качестве еще одного примера читатель может доказать, что любые две замкнутые ломаные линии на плоскости, у которых никакая вершина ломаной не принадлежит другой ломаной, имеют четное число точек пересечения.

Подобные задачи, в которых ответ меняется при каждом шаге (при каждом ходе коня, при каждом пересечении линии L и т. п.), т. е. определяется четностью числа шагов, встречаются нередко; их решение полностью определяется ответом типа «да» — «нет» только на один вопрос.

Задачи и упражнения

151. Можно ли покрыть шахматную доску доминошками (каждая закрывает ровно 2 клетки) так, чтобы остались свободными две угловые клетки на одной диагонали?

152. Можно ли разменять 25 рублей при помощи десяти купюр в 1, 3 и 5 рублей?

153. В ряд выписаны числа от 1 до 10. Можно ли расставить между ними знаки «+» и «-» так, чтобы значение полученного выражения было равно нулю?

154. Можно ли нарисовать 9-звенную ломаную так, чтобы каждое звено пересекалось ровно с одним из остальных звеньев?

155. По кругу стоят 99 корзин с арбузами. Может ли случиться, что в любой паре соседних корзин число арбузов отличается на единицу?

40. Количество двоичных цифр

Хорошо известна детская игра, в которой один играющий задумывает некоторый предмет или понятие, а другой должен отгадать его, задавая вопросы и получая на них только ответы «да» — «нет». Например: «живое?» — нет; «его едят?» — да; «его едят так, не поджаривая и не отваривая?» — да; «сладкое?» — нет; «белое?» — да; «это белый хлеб?» — да.

Однако в такой общей форме отгадывание может оказаться очень трудным делом. Как-то один из авторов предложил второму сыграть с ним в эту игру. «Живое?» — нет; «твердое?» — нет; «жидкое?» — нет; «газообразное?» — нет; «это абстрактное понятие?» — да; «черта характера?» — нет; «это какой-то процесс?» — да; «связанный с искусством?» — нет; «это связано с движением?» — да; «звук сопровождает этот процесс?» — нет; «процесс бесшумный?» — нет. Отга-

дывающий был поставлен в тупик, но продолжил вопросы. «Мы можем наблюдать этот процесс?» — нет. «Но все же это какой-то процесс?» — нет. Отгадывающий возмутился, поскольку ранее было указано, что задуман какой-то процесс. После еще нескольких противоречивых ответов он признал себя побежденным, и его коллега с улыбкой сообщил, что он задумал следующий процесс ответа на вопросы: если вопрос начинается с гласной буквы, он отвечает «да», а если с согласной — «нет».

Ясно, с чем здесь были связаны затруднения отгадывающего: не был четко очерчен круг задумываемых предметов, понятий, процессов. В более математизированном виде эта игра отгадывания может быть описана следующим образом. Имеется некоторое универсальное множество £/, состоящее, скажем, из 16 предметов. Сколько вопросов (с ответом «да» — «нет») следует задать, чтобы наверняка отгадать задуманный элемент этого множества? Легко понять, что следует применить следующую стратегию отгадывания. Мы разбиваем множество U на два подмножества А и В, содержащие по 8 элементов, и спрашиваем: «Содержится ли задуманный элемент в множестве ^4?». Любой ответ («да» или «нет») определяет восемь элементов, среди которых содержится задуманный. Теперь разделим эти восемь элементов на два подмножества Си/), содержащие по 4 элемента, и зададим второй вопрос: «Содержится ли задуманный элемент в множестве С?». Ответ определит четыре элемента, среди которых находится задуманный. Эти четыре элемента мы разбиваем на два подмножества по 2 элемента в каждом и, задав третий вопрос, определяем два элемента, среди которых находится задуманный. Наконец, мы выбираем один из этих двух элементов и задаем четвертый вопрос: «Этот ли элемент был задуман?» Получив ответ («да» или «нет»), мы сразу же находим задуманный элемент. Итак, задав 4 вопроса, мы отгадываем задуманное.

Эту стратегию отгадывания можно описать следующим образом. Будем для краткости обозначать ответ «да» цифрой 1, а ответ «нет» — цифрой 0, и запишем полученные ответы (на 4 вопроса) один за одним. Например, получив последовательно ответы «нет», «да», «да», «нет», мы можем записать это в виде ОНО, т. е. в виде некоторого одного числа в двоичной системе счисления. Разным последовательностям ответов соответствуют разные двоичные числа от 0000 до 1111 (т. е. от 0 до 15) — всего 16 чисел. Это делает понятным, почему, задав 4 вопроса, мы сможем отгадать, какой из 16 предметов был задуман.

Можно и еще более математизировать игру отгадывания: мы просим занумеровать 16 элементов множества U двоичными числами от 0000 до 1111 и задаем 4 вопроса в следующей форме: «Равна ли единице первая цифра?», «Вторая цифра?», «Третья?», «Четвертая?». На каждый из таких вопросов мы получаем 1 бит информации (слово «бит» возникло из английского словосочетания binary digit — двоичная цифра). Итак, для отгадывания задуманного предмета (из 16 элементов множества U) надо получить 4 бита информации.

А можно ли из 65 предметов отгадать задуманный, если мы задаем шесть вопросов (с ответами «да» — «нет»), т. е. получаем 6 битов информации? Шесть битов информации задают шестибуквенное слово, записываемое в алфавите {0, 1}. Например, 001101, 100111 и т. п. Всего таких слов имеется 26 = 64, т. е. у нас в наличии 64 «клетки». А «кроликов», т. е. задумываемых предметов, имеется 65. Значит, как бы мы ни задавали вопросы, какие-нибудь 2 кролика окажутся в одной клетке, и потому заданных 6 вопросов может оказаться недостаточно, чтобы однозначно указать задуманный предмет. Если же в множестве U содержится не более чем 64 предмета, то шести битов информации достаточно для однозначного определения задуманного предмета.

Вообще, пусть множество U содержит q предметов. Сколько битов информации нужно, чтобы отгадать задуманный элемент множества IP. Рассмотренные выше примеры дают подход к решению этого вопроса.

Пусть к — такое натуральное число, что 2/ч_1 < q < 2к. Тогда к-\ бит информации задает 2/ч_1 «клеток», т. е. {к- 1)-буквенных слов из алфавита {0, 1}, а этих «клеток» недостаточно, чтобы рассадить в них q «кроликов», не более одного в каждой «клетке». Иначе говоря, к - 1 битов информации может оказаться недостаточно для однозначного определения задуманного предмета. В то же время к битов информации достаточно для отгадывания. Например, чтобы определить задуманный предмет из 100 возможных, достаточно 7 битов информации, поскольку 26 < 100 <27.

Неравенства 2/ч_1 < q < 2к означают, что к - 1 < \og2q < к9 т. е. к — наименьшее натуральное число, для которого к > \og2q. Таким образом, чтобы отгадать задуманный элемент множества U, содержащего q элементов, надо иметь не менее \og2q битов информации. Например, log2100 ~ 6,664, и так как нецелое числе вопросов с ответами типа «да» — «нет» мы задать не можем, то следует задать семь вопросов. Иначе говоря, нужно получить 7 битов информации для угадывания одного задуманного из 100 элементов.

В заключение рассмотрим еще два примера. На листе бумаги начерчена шахматная доска (рис. 222). Сколькими взмахами ножниц можно разрезать ее на отдельные клетки, если после каждого разреза (рис. 223) разрешается класть отдельные полученные куски друг на друга и затем производить новый разрез (рис. 224). Для решения этого вопроса заметим, что каждая клетка после очередного разреза остается либо слева, либо справа от ножниц. Иначе говоря, на вопрос, где была интересующая нас клетка после очередного разреза, мы даем ответ 0 или 1 («слева» — «справа»). Сколько разрезов, столько и битов информации. Так как число клеток равно 64 и log264 = 6, то для отделения всех клеток надо не менее 6 битов информации, т. е.

Рис. 222 Рис. 223 Рис. 224

Рис. 225 Рис. 226 Рис. 227

не менее шести разрезов. Нетрудно убедиться, что шести разрезов и достаточно (первые два разреза показаны на рис. 225, 226).

В качестве второго примера возьмем куб 3x3x3 (рис. 227). Он состоит из 27 единичных кубов. Поставим задачу рассечь его на единичные кубы несколькими взмахами сабли (рис. 228), т. е. несколькими плоскими сечениями. При этом, как и в предыдущей задаче, разрешается после каждого разреза перекладывать части (рис. 229). Учитывая, что log227 ~ 4,752, мы заключаем, что потребуется не менее 5 битов информации, т. е. не менее пяти взмахов сабли. Однако в данном случае пяти взмахов недостаточно. В самом деле, рассмотрим внутренний единичный куб (расположенный в центре куба 3x3x3). Он имеет 6 граней, и любой взмах сабли позволяет открыть лишь одну из его граней. Поэтому, чтобы отделить внутренний единичный куб, нужно шесть взмахов.

Рис. 228 Рис. 229 Рис. 230

Заметим, что если куб 3x3x3 сделан из пластилина, а вместо сабли мы используем нож, лезвие которого загнуто под прямым углом (рис. 230), то пятью взмахами такого ножа можно разрезать куб на 27 единичных кубов. Плоских же разрезов (взмахов сабли) нужно, как мы видим, не 5, а 6.

Таким образом, подсчет информации дает лишь нижнюю оценку числа операций (ответов типа «да» — «нет», взмахов сабли и т. д.). Вопрос о том, является ли найденное число операций достаточным, требует отдельного рассуждения.

Задачи и упражнения

156. Среди 30 шариков имеется один радиоактивный. Имеется прибор, позволяющий установить для любой группы шариков наличие в ней радиоактивного. За какое наименьшее количество проверок всегда можно выделить радиоактивный шарик? А если радиоактивных шариков 2?

157. В начале книги, содержащей 1000 страниц, приведена теория и задачи, напечатанные крупным шрифтом, а дальше идут ответы, напечатанные мелким шрифтом. Мы пытаемся поскорее дойти до ответов, открывая книгу на некоторой странице. За сколько попыток можно найти страницу, с которой начинаются ответы?

158. Имеется предмет, масса которого равна целому числу граммов не более 200, и набор гирь в 1 г, 2 г, 4 г, 8 г, 16 г, 32 г, 64 г и 128 г. За какое наименьшее количество взвешиваний гарантированно можно найти массу этого предмета?

159. При каком наименьшем количестве гирь можно взвесить любой предмет массой от 1 г до 1 кг с точностью до 1 грамма? Гири можно класть лишь на одну из чашек весов.

160. Проводится турнир теннисистов по олимпийской системе (проигравший выбывает). Сколько туров будет в этом соревновании и сколько игр, если участвует 50 теннисистов?

41. Задачи на взвешивание

В задачном фольклорном творчестве студентов Московского университета имеется ряд задач о нахождении фальшивых монет при помощи взвешиваний на двухчашечных весах без гирь. Вот одна из этих задач.

Среди 27 монет одинакового достоинства одна — фальшивая, более тяжелая. С помощью трех взвешиваний на чашечных весах без гирь найти фальшивую монету.

Прежде чем переходить к решению, напомним, что вопросы с ответами «да» — «нет» позволяют разбить универсальное множество U на два подмножества А, В и с помощью одного вопроса выяснить, в каком из этих подмножеств находится задуманный элемент. Именно с помощью деления на два подмножества решались задачи, рассмотренные в предыдущем пункте, и именно этим объясняется использование логарифмов при основании 2 для оценки необходимого числа битов информации.

Весы с двумя чашками (рис. 231) позволяют разбить рассматриваемое множество монет U на три подмножества:

А — монеты, помещаемые на левую чашку весов;

В — монеты, помещаемые на правую чашку;

С — монеты, оставленные в стороне (не взвешиваемые).

Теперь понятно, что нам выгоднее всего распределить монеты на три равные кучки: 9 монет на одну чашку; 9 на другую и 9 в стороне. Если весы уравновесятся, то все монеты на весах настоящие, т. е. фальшивая монета находится среди 9 монет, оставленных в стороне. А если весы не уравновесятся, то фальшивая монета находится на более тяжелой чашке. Итак, после первого взвешивания мы выделим 9 монет, среди которых находится фальшивая. Теперь снова делим монеты на три равные кучки: 3 монеты на одну чашку, 3 на другую и 3 в стороне. В результате второго взвешивания мы выделим 3 монеты, среди которых находится фальшивая. А при третьем взвешивании мы кладем на каждую чашку по одной монете и одну оставляем в стороне. Это и позволит однозначно указать фальшивую монету, т. е. получить решение задачи.

Вообще, если даны Ък монет, причем известно, что среди них имеется одна фальшивая (более тяжелая), то п взвешиваний на чашечных весах без гирь позволят однозначно указать фальшивую монету.

То же справедливо для q монет, где 3/ч_1 <q<3/x.

Сравним рассмотренную задачу с предыдущими. Как мы видели в предыдущем пункте, для угадывания одного задуманного из q элементов нужно получить \og2q битов информации. В частности, при q = 3k мы находим, что для нахождения («угадывания») одной фальшивой (более тяжелой) монеты среди 3/ч монет нужно иметь log23/x' = к log23 битов информации. Так как нахождение фальшивой монеты может быть осуществлено к взвешиваниями, то это означает, что к взвешиваний дают не менее &log23 битов информации. Следовательно, каждое взвешивание дает log23 ~ 1,584 битов информации.

Эта численная оценка позволяет рассматривать и другие задачи. Пусть, например, даны 6 монет, из которых две — фальшивые (более тяжелые). Так как то имеется '5 способов выбрать две монеты из шести, и надо найти один из этих 15 способов (т. е. выбрать две фальшивые монеты). Значит, надо иметь log215~ 3,907 битов информации. Поскольку 3 взвешивания дают 31og23 ~ 4,752 битов, то можно ожидать, что тремя взвешиваниями удастся найти обе фаль-

Рис. 231

шивые монеты. Читателю предоставляется в качестве упражнения найти способ это сделать.

Пусть теперь даны 6 монет, среди которых три — фальшивые (более тяжелые). Так как fjl= 20, то имеется 20 способов выбрать три монеты из шести и надо найти один из этих 20 способов (т. е. выбрать три фальшивые монеты).

Значит, надо иметь log220 ~ 4,322 битов информации. Поскольку 2 взвешивания дают примерно 21og23 - 3,168 битов, а 3 взвешивания дают 31og23 ~ 4,752 битов, то двух взвешиваний явно недостаточно, но можно ожидать, что тремя взвешиваниями удастся найти все три фальшивые монеты. Однако это сделать не удается.

В самом деле, если положить по две монеты на каждую чашку, и при этом чашки уравновесятся, то на каждой чашке и среди двух оставшихся в стороне монет имеется ровно по одной фальшивой. Но оставшимися двумя взвешиваниями не удается выявить по одной фальшивой монете из этих трех кучек. (И если взвешивать не по две, а по одной или по три монеты, то тоже ничего не получится.) Это еще раз подтверждает, что подсчет информации дает лишь нижнюю оценку числа операций (в данном случае — взвешиваний). Иными словами, подсчет информации указывает заведомо необходимое число операций, но не гарантирует достаточность этого числа операций для решения задачи.

В заключение рассмотрим еще одну задачу, также пришедшую из фольклора мехмата Московского университета.

Из 12 монет одинакового достоинства одна — фальшивая (отличающаяся по весу); найти фальшивую монету тремя взвешиваниями.

Отличие этой задачи от предыдущих состоит в том, что мы не знаем, тяжелее или легче фальшивая монета, чем каждая из остальных монет. Здесь всего имеется 24 возможности (любая из 12 монет может оказаться фальшивой, причем она может быть либо легче, либо тяжелее каждой из остальных). Поэтому для решения нужно получить не менее log224 ~ 4,584 битов информации. Так как 3 взвешивания дают 4,752 битов, то похоже, что тремя взвешиваниями удастся решить задачу. Это, действительно, удается сделать (хотя перебор различных возможностей, появляющихся при взвешивании, является не очень простым).

А что если число монет равно 13, а не 12? В этом случае число возможностей равно 26 (а не 24), и потому для решения нужно получить log226 ~ 4,703 битов информации. Так как 3 взвешивания дают 4,752 битов, то кажется правдоподобным, что и в этом случае задача может быть решена тремя взвешиваниями. Однако это не так!

Если, скажем, при первом взвешивании положить на обе чашки по 4 монеты, то может оказаться, что весы уравновесятся, а тогда фальшивая монета находится среди оставшихся в стороне пяти монет,

что дает десять возможностей, и потому оставшимися двумя взвешиваниями выделить фальшивую монету не удастся. Это — еще один пример, показывающий, что подсчет информации дает лишь нижнюю оценку числа операций.

Задачи и упражнения

161. Имеется 5 грузиков разных масс и рычажные весы без гирь. Требуется расположить грузики по возрастанию массы. Сколько взвешиваний потребуется сделать?

162. Среди 10 одинаковых по виду монет могут быть одна или две фальшивые, отличающиеся от остальных по весу, но может и не быть ни одной фальшивой монеты. Все фальшивые монеты одинаковые, но легче они или тяжелее настоящих — неизвестно. Можно ли за три взвешивания узнать, есть ли среди этих 10 монет фальшивые и какие монеты тяжелее -фальшивые или настоящие?

163. Имеется 10 мешочков, в каждом из которых по 10 монет. В одном мешке все монеты фальшивые, а в остальных — настоящие. Настоящая монета весит 10 г, а фальшивая 9 г. Как за одно взвешивание определить мешочек с фальшивыми монетами, если пользоваться пружинными весами, указывающими вес с точностью до одного грамма?

164. Условие предыдущей задачи чуть изменили — в каждом из 10 мешочков по 9 монет. Можно ли теперь за одно взвешивание определить мешочек с фальшивыми монетами?

165. Условие предыдущей задачи тоже чуть изменили — в каждом из 10 мешочков по п монет. При каких п можно за одно взвешивание определить мешочек с фальшивыми монетами?

42. Понятие об энтропии

В предыдущих пунктах мы производили подсчет числа битов информации для некоторых комбинаторных задач. Здесь мы приведем вероятностную трактовку этих подсчетов.

Вспомним задачу об отгадывании одного задуманного предмета из 16 заданных предметов. Обозначим эту задачу через а. Как мы видели, для ее решения нужно получить 4 бита информации (4 ответа типа «да» — «нет»). Условимся в связи с этим говорить, что в задаче а неопределённость (или, как говорят, энтропия) равна четырем битам, и писать //(ос) = 4. Аналогично, для отгадывания одного из 2к предметов нужно получить к бит информации, т. е. для этой задачи (обозначим ее через ß) энтропия равна к бит: Нф) = к.

Вообще, если задано некоторое множество U, содержащее q элементов, то задача у об отгадывании одного задуманного элемента этого множества имеет энтропию //(у) = log2g. Иными словами, неопределенность (энтропия), вносимая всеми q элементами множества U, равна logy/, и потому можно считать, что каждый отдельный элемент множества вносит неопределенность, равную

т. е. равную

Заметим теперь, что каждый элемент множества

U с вероятностью Р~~ может оказаться искомым («задуманным»).

Таким образом, вместо -^Tog2^ можно написать -p\og2p, т. е. каждый отдельный элемент множества U вносит неопределенность, равную -p\og2p. Заметим, что число -p\og2p положительно, поскольку 0 <р < 1 и потому \og2p < 0.

Мы можем описать это следующим образом. Обозначим через Еу Е2, Е элементарные события, состоящие в том, что был задуман первый, второй, q-и элемент множества U. События Ev Е2, Ец равновероятны, т. е. любое из них имеет вероятность Р = ~- Как мы отмечали выше, каждое отдельное событие вносит неопределенность -p\og2p, а суммарная неопределенность в q раз больше, т. е. она равна , как мы и видели выше.

Наконец, перейдем к общему случаю, в котором элементарные события не обязательно предполагаются равновероятными. Итак, пусть производится некоторое испытание у и Е^ Е2, Е^ — элементарные события (исходы) этого испытания. Вероятности этих элементарных событий обозначим через pv р2, р . Тогда событие Е^ вносит неопределенность -р^ \og2pv событие Е2 вносит неопределенность -p2\og2p2 и т. д., т. е. общая неопределенность (энтропия) испытания равна

(1)

Приведенные рассуждения вовсе не служат «доказательством» формулы (1). Они приведены лишь с целью показать целесообразность такого понимания энтропии. Формулу (1) следует считать определением энтропии.

Например, в случае бросания монеты могут представиться два элементарных события Е^ Е2 (выпадение орла или решки), каждое из которых имеет вероятное i т. е. р, =р2 = \. Следовательно, по формуле (1) для этого испытания ô энтропия оказывается равной

т. е. неопределенность составляет один бит.

В качестве еще одного примера рассмотрим урну, в которой лежат 3 белых шара и 1 черный. Испытание £ заключается в том, что

наудачу выбирается один из этих шаров. Здесь имеются два элементарных события Еу Е2 — выбор белого или черного шара; вероятности их соответственно равны

Следовательно, по формуле (1)

Как видим, энтропия оказалась меньше одного бита, что и понятно, так как в урне больше белых шаров, чем черных, т. е. чаще при таком испытании должен появляться белый шар, и потому неопределенность исхода этого испытания меньше, чем 1 бит. Заметим, что если бы в урне все шары были белыми, то энтропия испытания (заключающегося в выборе из урны какого-либо шара) была бы равна нулю: всегда будет вынут белый шар, т. е. при таком испытании нет никакой неопределенности (или, иначе, исход опыта заранее известен).

Полезно отметить, что, согласно определению (формула (1)), энтропия представляет собой математическое ожидание неопределенностей отдельных исходов испытания, т. е. математическое ожидание случайной величины, которая принимает значения -\og2p^, -\og2p2, -log2/^ с вероятностями pv р2, pq.

Нетрудно проверить, что если испытания а и ß независимы, то энтропия испытания aß, заключающегося в последовательном (или одновременном) выполнении обоих испытаний a и ß, равна сумме их энтропии:

(2)

Например, если a имеет q равновероятных исходов, а ß имеет г равновероятных исходов, то испытание aß имеет qr равновероятных исходов, и потому #(aß) = log2 qr - log2 q + log2 r - Що) + Доказательство формулы (2) в общем случае можно предоставить читателю в качестве упражнения.

Если испытания a и ß не являются независимыми, то можно определить условную энтропию Нф/а), т. е. неопределенность испытания ß при условии, что произведено испытание а. Эта условная энтропия не превосходит энтропии испытания ß, т. е. О < H($la) < Формула (2) заменяется тогда соотношением

которое справедливо в любом случае (т. е. без предположения о том, что испытания a и ß независимы).

Соотношение //(ß/a) < //(ß) не противоречит тому, что для некоторых исходов испытания a условная энтропия может быть и больше,

чем //(ß). Рассмотрим следующий пример, который, впрочем, представляет собой лишь иную формулировку примера, приведенного в п. 34. Пусть испытание ß означает рождение ребенка (здорового или больного ахейроподией) в семье бразильских молодоженов. Это испытание имеет два исхода: больной ребенок рождается с вероятностью рх =0,0001, а здоровый — с вероятностью р2 = 0,9999. Следовательно, энтропия испытания ß равна

Эта энтропия очень мала; ведь исход «испытания» почти предопределен: 9999 шансов против 1 за то, что ребенок родится здоровым (в отношении ахейроподии). Теперь рассмотрим испытание а, заключающееся в том, чтобы выяснить, не являются ли молодожены родными братом и сестрой. Это испытание может иметь два исхода: — да, являются и Е2 — нет, не являются, причем вероятность р(Е^) очень мала. Как мы видели, если для испытания а осуществляется исход Еу т. е. молодожены являются братом и сестрой, то в этом случае вероятность рождения больного ребенка равна/?[ = 0,00289, тогда как вероятность рождения здорового составляет р2 =0,99711, и потому

Таким образом, энтропия Я(ß/£'1) больше энтропии Нф), и это свидетельствует о возрастании неопределенности, т. е. о существенно большей вероятности рождения больного ребенка.

В заключение — несколько слов об истории возникновения понятия энтропии и о ее роли в различных прикладных вопросах. В своем первоначальном, простейшем виде понятие энтропии возникло в статистической механике и было введено Паулем Эренфестом. В этой модели рассматривается газ, находящийся в сосуде, который разделен на две части проницаемой пленкой. Если общее число молекул газа равно п, а в первой части сосуда имеется к молекул, то во второй части п-к молекул. Распределить молекулы на такие две части можно ß) способами, и каждое такое распределение можно рассматривать как исход некоторого испытания. Энтропия этого испытания равна log Р\ В таком виде понятие энтропии (как меры неопределенности, беспорядка, хаоса) и было введено Эренфестом. Основание логарифма здесь не играет роли, поскольку при изменении основания число log u J лишь умножается на некоторый множитель (модуль перехода от логарифмов при одном основании к логарифмам при другом основании), т. е. лишь меняется единица, с помощью которой

мы измеряем энтропию. Всеобщее выравнивание температуры («тепловая смерть Вселенной») соответствует максимуму энтропии, тогда как жизнь, согласно У. Р. Эшби, имеет стремление приближать биохимические процессы к минимуму энтропии. Гейзенберговское соотношение неопределенности также является одним из факторов, способствующих применению понятия энтропии в физике.

Однако эренфестовское понимание энтропии, несмотря на его плодотворность в статистической физике, было лишь первоначальной догадкой на уровне той величины log2g (где q — число равновероятных исходов испытания), которая рассматривалась в п. 39 в связи с первоначальным подсчетом информации. Современное определение энтропии в виде формулы (1) и развитие на этой основе теории информации и теории кодирования связано с именем замечательного американского математика и инженера Клода Шеннона, который в 1947 - 1948 годах опубликовал ряд основополагающих работ в этой области. Конечно, шенноновская энтропия (1) зависит лишь от вероятностей Р\,р2> Pq различных исходов испытаний, но не учитывает, являются ли сами эти исходы близкими друг к другу или же они имеют большой разброс. Однако именно эти свойства энтропии, т. е. ее чисто статистический характер особенно важны для теории передачи сообщений по линиям связи и, вообще, для рассмотрения процессов, связанных с передачей и хранением информации любого вида.

В качестве примера рассмотрим исследование психических реакций человека на появление некоторых сигналов. Время Ar реакции на простой сигнал (скажем, нажатие кнопки при вспыхивании лампочки) составляет даже при определенной натренированности не менее 0,1 секунды. Если же может вспыхнуть любая из q лампочек (с равной вероятностью) и требуется нажать соответствующую кнопку, то время реакции возрастает и становится равным примерно AMog2g, т. е. это время реакции приблизительно пропорционально эренфестовской энтропии Ar-log2g. Для иллюстрации на рис. 232 приведен график, полученный американским психологом Р. Хайнманом для случая не более восьми равновероятно вспыхивающих лампочек {q < 8), где по оси абсцисс откладывается H — энтропия в битах, а по оси ординат Т — время реакции в микросекундах. При неравновероятном вспыхивании лампочек действует шенноновская энтропия (1).

Шеннон использовал введенную им энтропию для исследования кодов, применяемых при передаче информации. Известная «азбука Морзе» представляет собой фактически троичный код, поскольку она использует три сигнала: точку, тире и длинную паузу между буквами

Рис. 232

(двукратная длинная пауза означает пробел, т. е. отделяет слова друг от друга). Этот код требует большего времени для передачи сообщения, чем двоичный код Бодо, применяемый в телеграфных аппаратах (1— включение тока, 0 — пауза, причем оба эти элементарные сигнала имеют одинаковую длительность). Каждый элемент текста (буква, десятичная цифра, знак препинания, пробел) кодируется по Бодо шестью последовательными двоичными цифрами 0 или 1 (отсутствие или наличие тока). Так как шестью двоичными цифрами можно закодировать 64 комбинации, то этого достаточно для обозначения всех элементов текста. А декодирование вполне аналогично «отгадыванию» одного задуманного из 64 элементов, т. е. оно требует шести битов информации (Равна ли единице первая цифра шестерки? Равна ли единице вторая цифра? ... Шестая?). При таком «стандартном» способе кодирования передача текста, содержащего N элементов, требует N шестерок, т. е. 6N битов информации.

Однако 32 буквы русского алфавита, 10 цифр и 8 знаков препинания составляют всего 50 (а не 64) элементов текста, т. е. энтропия (если все знаки считаются равновероятными) равна log2 50 ~ 5,644 битов, что существенно меньше, чем 6 битов. А так как знаки не являются равновероятными (например, вероятность использования буквы Ы существенно меньше вероятности для П и т. д.), то шенноновская энтропия будет еще меньше. Если, скажем, она равна 5 битам, то передача текста, содержащего N элементов, потребует 5N битов информации, тогда как код Бодо использует 6N битов.

Это показывает возможность создания более экономичного кода передачи информации, чем код Бодо. Кроме экономичности, разумеется, важной чертой кода является его надежность, т. е. возможность однозначного декодирования, расшифровки. Таков шенноновский подход к созданию кодов передачи информация. На этой основе К. Шеннон и независимо от него Р. Фано предложили в 1948 - 1949 годах новые коды передачи информации, существенно более экономичные, чем код Бодо. Несколько позже Д. Харман разработал (для английских текстов) наиболее экономичный способ кодирования, также основанный на энтропийных соображениях.

В теории информации изучается, кроме того, проблема передачи сообщений при наличии помех, в решении которой основные результаты принадлежат К. Шеннону. Созданы также способы кодирования, которые позволяют обнаруживать и исправлять ошибки в поступающих сообщениях. Таким образом, появление понятия энтропии привело к созданию теории кодирования, которая является новой ветвью математики, важной как в теоретическом, так и в прикладном отношении.

Беседа 10. Комбинаторные задачи о графах

43. Графы и их элементы

На рис. 233 и других этого пункта изображены некоторые графы. Каждый граф имеет вершины и ребра, причем каждое ребро соединяет какие-либо две вершины. Чаще всего рассматривают графы, у которых множество вершин конечно и множество ребер также конечно. На рисунках вершины изображаются маленькими кружочками, а ребра — соединяющими их дугами (в частности, отрезками).

На рис. 234 граф содержит 6 вершин и 9 ребер, причем некоторые ребра изображены пересекающимися. Однако следует представлять себе, что этих «лишних» точек пересечения как бы не существует. Например, можно считать, что ребра являются некоторыми дугами в пространстве, и лишь за счет изображения графа на плоскости возникли эти «лишние» пересечения ребер. Иначе говоря, если р и q — два ребра некоторого графа и А — общая точка этих ребер, то А является концом каждого из этих ребер (рис. 235). Можно дать и иное пояснение: если в некотором графе имеется ребро р с концевыми вершинами А а В (рис. 236), то никакая внутренняя точка X дуги р не является ни вершиной этого графа, ни точкой, принадлежащей какому-либо другому ребру.

В графе, изображенном на рис. 237, вершины А и В соединены четырьмя ребрами, а вершины В и С — двумя. В таком случае говорят, что имеется четырехкратное ребро, соединяющее вершины А а В, а двукратное ребро, соединяющее В и С. Мы условимся в дальнейшем под термином «граф» понимать граф без кратных ребер

Рис. 233 Рис. 234 Рис. 235

Рис. 236 Рис. 237 Рис. 238

(если не оговорено специально, что допускается рассмотрение кратных ребер). Таким образом, если А и В — вершины графа, то либо существует одно ребро, соединяющее эти вершины, либо же вершины А и В ребром не соединены.

Граф с п вершинами, в котором каждые две вершины соединены ребром, называется полным графом с п вершинами. На рис. 238 изображен полный граф с пятью вершинами (напомним, что «лишние» точки пересечения ребер, связанные с изображением этого графа на плоскости, считаются как бы не существующими; например, ребра АС и BD не имеют общих точек в этом графе). Легко видеть, что полный граф с п вершинами содержит |^jpe6ep (т. е. ровно столько, сколько имеется пар вершин). Если же граф с п вершинами не является полным, то его можно получить следующим образом: взять полный граф с этими п вершинами (т. е. каждые две вершины соединить ребром), а затем ненужные ребра удалить. Из этого вытекает, что любой граф с п вершинами имеет не более f^J ребер.

Пусть, например, проводятся игровые спортивные соревнования — чемпионат, в котором участвует п команд, причем по условиям чемпионата каждые две команды должны провести между собой одну игру. Будем считать команды вершинами графа, а игру между двумя командами —ребром, содержащим соответствующие вершины. После завершения чемпионата мы получим полный граф с п вершинами, поскольку для любых двух вершин (команд) имеется соединяющее их ребро (игра между этими командами). Всего в течение чемпионат должно быть проведено игр — по числу ребер полного графа с п вершинами. Если же мы рассмотрим некоторый момент, когда часть игр уже проведена, но чемпионат еще не закончился, то получим граф с п вершинами, в котором проведены не все ребер, а лишь некоторые из них, соответствующие уже проведенным играм.

В качестве второго примера рассмотрим граф знакомства. Имеются п персон — будем считать их вершинами графа. Две вершины условимся соединять ребром, если соответствующие персоны знакомы друг с другом (для четкости будем считать, что два человека знакомы, если каждый из них знает другого по имени и хоть раз обменялся с ним рукопожатием). В зависимости от выбора рассматриваемой группы персон в этом графе может быть от 0 до ^ j ребер.

Пусть G — некоторый граф и а — его вершина. Индексом вершины а называется число ребер графа G, имеющих а своим концом, т. е. число ребер примыкающих к вершине а (или, как еще говорят, инцидентных вершине а). Этот индекс мы будем обозначать через та а (или, более полно, ind^ß). Например, на рис. 239 имеем \ndA = 3, ind В = 5. В графах, изображенных на рис. 234 и 240, каждая вершина имеет индекс 3, а в графе на рис. 238 каждая вершина имеет индекс 4.

Рис. 239 Рис. 240 Рис. 241

Вообще, в полном графе с п вершинами каждая вершина имеет индекс п-1.

Следующая несложно доказываемая теорема устанавливает связь между индексами вершин конечного графа и числом его ребер: во всяком конечном графе сумма индексов всех его вершин равна удвоенному числу ребер графа. Иначе говоря,

(1)

где сумма в левой части распространена на все вершины графа, а Р — число его ребер. В самом деле, в сумме, стоящей в левой части равенства (1), каждое ребро засчитывается дважды, с того и с другого конца. Потому эта сумма и равна удвоенному числу ребер.

Из доказанной формулы (1) вытекает, в частности, что если в конечном графе G все вершины имеют один и тот же индекс /:, то справедливо соотношение

(2)

где В — число вершин графа G.

В качестве примера рассмотрим следующую комбинаторную задачу из довоенного мехматского фольклора Московского университета. Можно ли 77 абонентов соединить телефонными линиями так, чтобы каждый абонент был соединен линиями ровно с тремя другими (на рис. 241 изображен фрагмент такой телефонной сети)? Ответ, как показывает формула (2), отрицательный. Действительно, если бы искомый граф (вершинами которого являются абоненты, а ребрами — соединяющие их линии связи) существовал, то в нем каждая вершина имела бы индекс 3, и потому левая часть в (2) была бы равна 77-3, т. е. была бы нечетным числом. Однако это невозможно, поскольку правая часть в (2) четна.

Более общим образом, из формулы (1) вытекает, что в любом конечном графе число вершин, имеющих нечетные индексы, является четным.

Задачи и упражнения

166. Семеро коллег послали друг другу поздравительные новогодние открытки, причем каждый послал открытки трем коллегам. Могло ли случиться, что каждый из них получил открытки именно от тех своих коллег, которым он послал поздравления?

167. 30 команд участвуют в первенстве по футболу в один круг (каждые две команды встречаются один раз). Докажите, что в любой момент состязаний найдутся две команды, сыгравшие одинаковое число матчей.

168. Существует ли граф с пятью вершинами, у которого индексы вершин все различны и равны 0, 1, 2, 3 и 4?

169. Докажите, что в любом графе число вершин с нечетными индексами всегда четно.

170. Пусть в графе с п вершинами только одна пара вершин имеет одинаковые индексы. Докажите, что в этом случае у графа имеется либо вершина индекса 0 (отдельная вершина), либо вершина индекса /7-1.

44. Цепи и циклы в графах

Последовательность ребер графа называется цепью, если эти ребра можно вычертить одно за другим, не отрывая карандаша и не проходя какое-либо ребро дважды. Если ребра Ру р2, pk образуют цепь, то их концы можно обозначить таким образом: р^=А^Ау р2 = А^А2, рк = Ак_^Ак, т. е. начало каждого следующего ребра совпадает с концом предыдущего. Вершины А^ и Ак называются концами цепи А^А\ ...А^. Если цепь замкнута, т. е. конечная вершина Ак совпадает с начальной вершиной А0, то цепь называется циклом.

Подчеркнем, что никакое ребро не может входить в цепь два или большее число раз. На рис. 242 ребра Ру р2, Ру р4, р2, р5 цепь не образуют. Ребра ру р2, р2, ръ на рис. 243 также не образуют цепь. В то же время цепь может пересекать себя, т. е. дважды (или большее число раз) проходить через некоторые вершины. На рис. 244 цепь дважды проходит через вершину А2 = А5, т. е. содержит «петлю» А2А^А4А5. Если же цепь А^Ау..Ак не пересекает себя, т. е. все вершины Aq, Ay Ак различны (рис. 245), то цепь называется простой. В частности, цикл без самопересечений называется простым циклом.

Рис. 242 Рис. 243 Рис. 244

Ясно, что если цепь с концами не является простой, т. е. имеет самопересечения, то можно, выбросив петли, получить простую цепь с теми же концами ßQ, а^. Так, на рис. 246 вместо А0А^AjAyA4АqA(A1 можно взять простую цепь AÇ)AXA1A^A1 с теми же концами.

Граф называется связным, если любые две его вершины могут быть соединены цепью. Несвязный граф может быть разбит на несколько отдельных связных графов, называемых компонентами исходного графа. На рис. 246 изображен граф, состоящий их трех компонент.

Пусть A Vi В — две вершины связного графа G. Наименьшее из таких чисел к, что в G существует цепь из к ребер, соединяющая вершины А и В, называется комбинаторным расстоянием между вершинами А и В в графе G. Наибольшее из комбинаторных расстояний между вершинами графа G называется комбинаторным диаметром графа G. Например, полный граф с п вершинами имеет комбинаторный диаметр 1. Граф, изображенный на рис. 247, имеет комбинаторный диаметр 2. Граф, представляющий собой простой контур с п вершинами (рис. 248), имеет своим комбинаторным диаметром число

(в зависимости от четности числа п). Доказать это предоставляется читателю.

Самая первая работа по теории графов появилась в 1736 году. Она принадлежит перу величайшего математика Леонарда Эйлера, о некоторых результатах которого мы уже говорили выше. Эйлер исследовал головоломку о Кенигсбергских мостах. Город Кенигсберг (ныне Калининград), расположенный на двух берегах реки Прегель и на двух островах, имел в то время семь мостов (рис. 249). Головоломка состояла в том, чтобы совершить прогулку по городу, маршрут которой проходил бы ровно один раз по каждому мосту. Сопоставим с планом города некоторый граф: на рис. 250 вершины L и R соответствуют левому и правому берегам, вершины А а В — островам, а каждое ребро — мосту. Заметим, что граф содержит кратные ребра: вершина В соединена с каждой из вершин L, R двумя ребрами. Задача заключается в том, чтобы решить, можно ли нарисовать этот граф

Рис. 245 Рис. 246 Рис. 247

«одним росчерком», т. е. найти в нем самопересекающуюся цепь, проходящую (по одному разу) по всем ребрам.

Можно поставить следующую, более общую проблему, которая и была решена Эйлером. Связный граф G, возможно, содержащий кратные ребра, называется уникурсалъным («одноросчерковым»), если его весь можно пройти непрерывным движением, не проходя одно и то же ребро дважды, т. е. если в нем существует самопересекающаяся цепь, содержащая в определенной последовательности все ребра. Головоломка о кенигсбергских мостах как раз и сводится к вопросу, является ли граф на рис. 250 уникурсальным.

Эйлер предложил следующее решение проблемы уникурсальности. Предположим, что связный граф G уникурсален, т. е. в нем существует путь, начинающийся в некоторой вершине А и оканчивающийся в некоторой вершине Z (возможно, совпадающей с А), который по одному разу проходит каждое ребро. Пусть С — произвольная вершина графа G, отличная от А и Z. Рассмотрим все ребра, имеющие вершину С своим концом. Рассматриваемый путь, обходящий граф G, подходя к вершине С по некоторому ребру, сразу же уходит из С по другому ребру (рис. 251). Если впоследствии он снова приходит в С по третьему ребру, то тут же уходит из С по четвертому (рис. 252) и т. д. Из этого видно, что в вершине С сходится четное число ребер, т. е. индекс вершины С четен. Итак, индексы всех вершин графа G, кроме может быть, А и Z, четны. Из аналогичных соображений вытекает, что вершины А и Z, если они не совпадают, имеют нечетные индексы. Если же А и Z совпадают (т. е. мы заканчиваем путь в той же вершине, из которой исходили), то и эта вершина имеет четный индекс.

Итак, если связный граф уникурсален, то все его вершины, кроме, может быть, двух, имеют четные индексы. Это и есть эйлерово условие уникурсальности. Оно, как показывают проведенные выше рассуждения, является необходимым, т. е. связный граф, который ему не удовлетворяет, уникурсальпым быть не может. На рис. 253 приведены примеры графов, не являющихся уникурсальными.

Однако эйлерово условие не только необходимо, но и достаточно, т. е. связный конечный граф G в том и только в том случае уникурсален, если он содержит не более двух вершин с нечетными индексами. Заметим, что только одну вершину с нечетным индексом граф иметь не

Рис. 248 Рис. 249 Рис. 250

может (в силу заключительного утверждения, содержащегося в предыдущем пункте).

Доказательство того, что эйлерово условие является не только необходимым, но и достаточным условием уникурсальности, чуть сложнее, но проводится аналогичным образом. В самом деле, пусть G — граф, все вершины которого имеют четные индексы, и А — произвольная его вершина. Будем, начиная от А, проводить цепь «как попало», пока это возможно. Сколько бы раз мы ни проходили вершину С, отличную от А, всегда останется хотя бы одно ребро, по которому можно уйти из вершины С (поскольку С имеет четный индекс). Поэтому вычерчиваемая цепь не может окончиться нигде, кроме А (а окончиться она должна, поскольку ребер конечное число). Если полученная замкнутая цепь К проходит по всем ребрам, наша цель достигнута.

Если же это не так, то найдется такая вершина Q цепи К, к которой примыкает ребро р\ не вошедшее в цепь К (рис. 254). В этом случае мы, идя вдоль цепи К от вершины А и достигнув вершины 2, не пойдем дальше вдоль цепи К, а сначала совершим вспомогательную прогулку, т. е. пойдем по ребру р' и будем идти «как попало» по ребрам, не вошедшим в цепь К. При этом мы обязательно вернемся к вершине Q (больше нигде эта вспомогательная прогулка окончиться не может в силу соображений четности). Вернувшись в вершину Q, мы затем пойдем дальше вдоль цепи К. В результате получится вместо К другая цепь, проходящая по большему числу ребер. Если эта новая цепь содержит все ребра, то цель достигнута. Если же нет, — мы снова применим тот же прием к цепи и т. д. В конце концов (в силу конечности числа ребер) мы получим цепь, обходящую все ребра графа G. Этим достаточность доказана для графа, все вершины которого имеют четные индексы.

Наконец, если граф G содержит две вершины А и Z с нечетными индексами, мы можем применить то же рассуждение, начав путь из вершины А и закончив его в Z.

Доказанная теорема позволяет, в частности, получить правило обхода лабиринта. Рассмотрим некоторый лабиринт (рис. 255). Пусть нам поставлена задача дойти до сокровища, запрятанного в глубине этого лабиринта, и вернуться обратно. Поскольку мы не знаем, где именно запрятано сокровище, мы должны обойти весь лабиринт,

Рис. 251 Рис. 252 Рис. 253

Рис. 254 Рис. 255 Рис. 256

включая возможные тупики. Проведем средние линии всех коридоров лабиринта — это будут ребра графа G, а вершинами станут перекрестки и тупики лабиринта (рис. 256). Теперь заменим каждое ребро графа G двукратным ребром (рис. 257). Получившийся граф обозначим через G*. В графе G* каждая вершина имеет четный индекс и потому он уникурсален (по теореме Эйлера), т. е. можно найти цепь, обходящую все его ребра. Если такую цепь нам удастся найти, то это означает, что мы пройдем дважды каждое ребро графа G, т. е. обойдем весь лабиринт, проходя каждый коридор два раза (например, туда и обратно).

Итак, начнем путешествие по лабиринту, отправляясь от вершины А графа G* (от входа в лабиринт; рис. 258). Чтобы не проходить никакой коридор более двух раз, условимся после прохождения каждого перекрестка ставить стрелку (по направлению движения) на стене того коридора, по которому мы ушли от этого перекрестка. Тогда второй раз мы в том же направлении по этому коридору не пойдем (а если когда-нибудь снова попадем на этот перекресток, то уйдем по другому коридору, еще не помеченному стрелкой). Это обеспечит нам возможность заведомо выйти из лабиринта (ибо цепь может окончиться только в начальной вершине А).

Однако это еще не все: хотя мы непременно выберемся из лабиринта, а не будем блуждать в нем вечно, но, возможно, мы обойдем не весь лабиринт и не доберемся до сокровища (рис. 258). Чтобы избежать этого, условимся, что когда мы в первый раз будем попадать на какой-то перекресток, мы будем ставить кружок на стене того

Рис. 257 Рис. 258 Рис. 259

Рис. 260 Рис. 261

коридора, по которому мы на этот перекресток пришли. Теперь правило обхода лабиринта гласит: от каждого перекрестка разрешается уходить по коридору, помеченному кружком, только после того, как все остальные коридоры, отходящие от этого перекрестка, уже были пройдены. Читатель докажет самостоятельно, что при соблюдении этого правила мы обойдем весь лабиринт и непременно завладеем сокровищем.

В заключение сформулируем проблему, в некотором смысле противоположную проблеме уникурсальности. Вопрос заключается в том, чтобы решить, существует ли в данном связном конечном графе G такой простой цикл, который проходит через все его вершины. Иными словами, существует ли в графе G «прогулка», позволяющая посетить все его вершины, причем каждую вершину только один раз. В отличие от задачи уникурсальности здесь надо пройтись не по всем ребрам, а через все вершины.

Проблема эта была на частном примере предложена известным ирландским математиком сэром Уильямом Гамильтоном в 1859 году. Гамильтон предложил обойти все вершины правильного додекаэдра (рис. 259), двигаясь по его ребрам и проходя каждую вершину лишь один раз. Головоломка эта имеет положительное решение (т. е. требуемый цикл на додекаэдре существует). Вскоре головоломку забыли, но проблему, сформулированную выше, назвали именем ее изобретателя: граф, в котором существует простой цикл, обходящий все вершины, называется гамильтоновым графом. В отличие от проблемы уникурсальности, эта проблема в общем случае не решена, т. е. неизвестно условие (необходимое и достаточное), при выполнении которого граф является гамильтоновым. Примеры гамильтоновых графов приведены на рис. 260, 261.

Задача эта имеет интересное обобщение: на ребрах гамильтонова графа указаны некоторые числа, означающие «стоимости проезда» по этим ребрам, и требуется найти «наиболее дешевый» гамильтонов цикл (т. е. обойти все вершины по разу с наименьшими затратами). Проблема эта, известная под названием «задачи о странствующем торговце», не решена в общем случае, т. е. метод нахождения требуемого пути в общем случае неизвестен.

Задачи и упражнения

171. Докажите, что граф с п вершинами, представляющий собой простой контур, имеет своим комбинаторным диаметром число ^ или П - - (в зависимости от четности числа ri).

172. Является ли уникурсальным граф, изображенный на рисунке 260?

173. Для каждого из 5 правильных многогранников рассмотрим граф, состоящий из всех его вершин и ребер. Какие из этих графов уникурсальны и какие гамильтоновы?

174. Верно ли, что можно обойти граф, пройдя каждое ребро ровно 3 раза, в том и только в том случае, если граф уникурсальный?

175. Является ли гамильтоновым граф, изображенный на рисунке 260?

45. Плоские графы

Любой граф можно изобразить на плоскости, взяв нужное число вершин и проведя линии, соединяющие некоторые пары вершин. Однако при этом проведенные линии (ребра графа) могут иметь «лишние» пересечения (как на рис. 234 и 238). Если граф можно так начертить на плоскости, что лишних пересечений не будет, то граф называется плоским.

Прежде чем изучать плоские графы, уточним, что значит «можно начертить граф на плоскости». На рис. 262 и 263 два графа Gj и G2 изображены на плоскости по-разному, но «устроены» они одинаково: в графе Gj вершины и соединены ребром, и в графе G2 соответствующие вершины 2?| и 2?3 тоже соединены; в графе Gj вершины А2 и А^ не соединены ребром и в графе G2 соответствующие вершины В2 и В5 тоже не соединены и т. д. «Одинаково устроенные» графы математики называют изоморфными (от греческих слов çao^ — одинаковый и |иорфГ| — форма).

Более точно, два графа Gj и G2 называются изоморфными, если они имеют одинаковое число вершин и при этом можно взаимно однозначно отобразить множество вершин первого графа на множество вершин второго таким образом, что две вершины графа Gj тогда и только тогда соединены ребром, когда образы этих вершин соединены ребром в графе G2. Например, на рис. 264 и 265 графы кажутся «непохожими», но в действительности они изоморфны (чтобы убедиться в этом, достаточно каждой вершине первого графа поставить в соответствие во втором графе вершину с тем же номером).

Теперь понятие плоского графа можно точно определить следующим образом: граф называется плоским, если существует на плоскости изоморфный ему граф, изображенный без «лишних» пересечений. Например, граф, показанный на рис. 262, является плоским, поскольку он изоморфен графу (рис. 263), расположенному на плоскости без «лишних» пересечений. Графы на рис. 266, 267 также являются плоскими, в чем читатель может убедиться самостоятельно.

Рис. 262 Рис. 263 Рис. 264

Рис. 265 Рис. 266 Рис. 267

А теперь мы рассмотрим два графа, которые не являются плоскими. Первый из них («домики и колодцы») получается следующим образом. На плоскости берутся шесть точек Др Д2, Д3 («домики») и Л*р К2, Л*3 («колодцы»). Эти точки являются вершинами графа, а его ребрами являются девять дуг («тропинок»), которые соединяют каждый домик с каждым колодцем (рис. 268). Как мы видим, на рис. 268 две «тропинки» имеют точку пересечения. Оказывается, расположить «тропинки» на плоскости совсем без пересечений не удается. Иными словами, рассматриваемый граф не является плоским.

Вторым примером графа, не являющегося плоским, может служить полный граф с пятью вершинами (рис. 238). Как бы мы ни провели девять непересекающихся ребер этого графа на плоскости (рис. 269), десятое ребро обязательно пересечет хотя бы одно из ранее проведенных ребер. Разумеется, сколько бы попыток, заканчивающихся неудачей, мы ни сделали, это не дает доказательства того, что рассматриваемый граф не является плоским.

Приведем идею общего рассуждения, доказывающего, что этот граф не является плоским. Начертим в виде ломаных линий все 10 ребер полного графа с пятью вершинами Av Av Ay А4, А5 (с «лишними» пересечениями, рис. 269). Два ребра будем называть несмежными, если они не имеют общих концов. Теперь обозначим через / число точек пересечения по всем парам несмежных ребер. На рис. 269 мы имеем /= 1, а для рис. 238 справедливо равенство /=5. В обоих случаях число / нечетно. Мы докажем, что и при любом способе проведения ребер число / будет нечетным (мы при этом предполага-

Рис. 268 Рис. 269 Рис. 270

ем, что каждые два несмежные ребра пересекаются «по-настоящему», т. е. таких общих точек, как на рис. 270а, нет — от них легко избавиться малым шевелением ребер, рис. 2706).

Предположим, что мы меняем положение, скажем, ребра т. е. заменяем другой ломаной с теми же концами А2 (рис. 271).

Вместе взятые, ребра рх и /?[ образуют замкнутый контур. Ребра р2, Ру р4, несмежные с ребром также образуют замкнутый контур.

Но любые два замкнутых контура на плоскости имеют четное число точек пересечения (об этом мы говорили в п. 39). Следовательно, число точек пересечения ребра рх с этим контуром Р2Р3Р4 имеет ту же четность, что и число точек пересечения ребрас этим контуром.

Это означает, что при замене положения ребра р^ любым новым положением /?[ четность числа / не меняется. То же справедливо не только для pv но и для любого другого ребра.

Из этого следует, что если мы последовательно заменим все ребра начерченного на плоскости полного графа с пятью вершинами любыми новыми положениями ребер, то четность числа / не изменится. А так как на рис. 269 число / нечетно, то оно останется нечетным при любом способе вычерчивания ребер. Значит, в любом случае 1ф0, т. е. без «лишних» пересечений ребер этот граф вычертить на плоскости невозможно.

Аналогично доказывается, что и граф «домики и колодцы» не является плоским, т. е. не может быть изображен на плоскости без «лишних» пересечений ребер.

Интересно отметить, что полный граф с пятью вершинами и граф «домики и колодцы» являются «эталонами» графов, не вложимых в плоскость: если граф не является плоским, то он непременно содержит один из двух указанных графов. Это было доказано польским математиком Казимиром Куратовским. Например, граф на рис. 234 изоморфен графу «домики и колодцы» и потому он не является плоским. Граф на рис. 272 содержит граф «домики и колодцы», следовательно, он не плоский. Полный граф с шестью вершинами (содержащий полный граф с пятью вершинами) также не является плоским.

Именно, рассмотрим произвольный выпуклый многогранник M и над его верхней гранью F, очень близко к ней, расположим лампочку (рис. 277). Если теперь мы представим себе, что ни внутри, ни на гранях многогранника M никакого материала нет (или он совершенно прозрачен), а вот ребра многогранника изготовлены в виде проволочного скелета, то тень от этого скелета на горизонтальной плоскости (центральная проекция многогранника М, рис. 278) будет представлять собой некоторый граф G. Вершин и ребер у этого графа столько же, сколько и у многогранника M, а число областей, на которые граф G делит плоскость, равно числу граней многогранника М. В самом деле, каждая грань многогранника М, кроме верхней грани F, дает на тени некоторую область, а грани F сопоставим внешнюю, неограниченную область графа G. Значит, для любого выпуклого многогранника M справедливо соотношение (3), где В, Р, Г — количество вершин, ребер, граней этого многогранника. Это и есть обычная формулировка теоремы Эйлера о выпуклых многогранниках. Читатель легко проверит справедливость этой формулы для куба, тетраэдра, октаэдра, призмы, пирамиды и других выпуклых многогранников. Теорема эта была, однако, известна еще Рене Декарту, за несколько десятилетий до Эйлера.

Заметим, что формулировка теоремы для графов является более общей, чем для многогранников, поскольку не каждый связный плоский граф может быть получен как «тень скелета» некоторого выпуклого многогранника. Например, граф на рис. 278 не является такой тенью, ибо он содержит вершины индекса 1, которых у тени многогранника быть не может.

Ниже мы приведем доказательство формулы Декарта—Эйлера (3), но прежде нам нужно будет рассмотреть одно вспомогательное предложение. Конечный связный граф, не содержащий циклов, называется деревом. Так как дерево является связным графом, то любые две его вершины могут быть соединены цепью. А так как дерево не содержит циклов, то любые две его вершины можно соединить единственной цепью. Итак, дерево — это граф, любые две вершины которого могут быть соединены единственной цепью. Это свойство дерева может быть принято за его определение (эквивалентное первоначальному).

Рис. 274 Рис. 275 Рис. 276

Рис. 271 Рис. 272 Рис. 273

Если же граф с пятью вершинами не является полным, то он — плоский. Иначе говоря, если мы потребуем, чтобы каждые две из пяти вершин, кроме одной пары вершин А, В, были соединены ребром, то такой граф можно расположить на плоскости без пересечения ребер (рис. 273). Как мы видим, на рис. 273 все ребра изображены прямолинейными отрезками. Это справедливо и в общем случае: каждый плоский граф можно таким образом начертить на плоскости, что все его ребра будут прямолинейными отрезками (если, конечно, граф не содержит кратных ребер).

Задачи и упражнения

176. В четырехугольнике отмечены середины всех сторон, проведены его диагонали и средние линии. Рассмотрим граф, вершинами которого являются вершины четырехугольника и отмеченные точки, а ребрами — отрезки его сторон и проведенные отрезки. Является ли этот граф плоским?

177. Правильный 7-угольник дополнили наименьшими диагоналями. Докажите, что полученный граф не является плоским.

178. Правильный 8-угольник дополнили наименьшими диагоналями. Докажите, что полученный граф может быть вложен в плоскость.

179. Обобщите результаты задач 177 и 178.

180. Правильный 2/7-угольник дополнили наибольшими диагоналями. Докажите, что при п > 2 полученный граф — не плоский.

46. Формула Декарта—Эйлера

Пусть G— некоторый связный граф, расположенный в плоскости, В — число его вершин, Р — число ребер. Через Г обозначим число областей («граней»), на которые этот граф разбивает плоскость. К числу этих областей относится и внешняя, неограниченная область, простирающаяся «до бесконечности». На рис. 274 изображен граф, для которого 5 = 20, Р = 30, Г= 12. Легко заметить, что сумма чисел В и Г на две единицы превосходит число Р, т. е.

(3)

Для графа на рис. 275 имеем В - 10, Р= 13, Г=5, т. е. соотношение (3) также выполнено. То же можно усмотреть и для графа на рис. 276. Леонард Эйлер доказал, что формула (3) справедлива для любого связного графа на плоскости. Точнее, его теорема говорила не о «графах», а была сформулирована в иных терминах.

Рис. 277 Рис. 278 Рис. 279

Всякое дерево является плоским графом. Это можно пояснить следующим описанием дерева. Возьмем в дереве G произвольную вершину А и рассмотрим все ребра, имеющие А одним своим концом (рис. 279), а другим — точки Bv В2, Bj, которые мы расположим «этажом выше». Каждая из точек В. либо имеет индекс 1 (если ребро АВ{ является конечным, «тупиковым»), либо же из нее «на следующий этаж» идут новые ребра ВС. (рис. 280). Каждая из точек Ср С2, С^, в которых оканчиваются эти новые ребра, также либо имеет индекс 1 (является «тупиком»), либо из нее выходят новые ребра. Продолжая таким образом, мы и начертим на плоскости дерево G.

Докажем теперь, что для каждого дерева G справедливо соотношение

В - Р = 1. (4)

где В — число вершин, а Р — число ребер дерева. Для доказательства проведем индукцию по числу вершин дерева. Если дерево содержит только одну вершину А, то В=1, Р = 0, т. е. соотношение (4) справедливо. Это — начало индукции. Совершим теперь переход от п к п+\. Предположим, что для любого дерева, содержащего п вершин, формула (4) справедлива, и рассмотрим дерево G, содержащее п + 1 вершину. Пусть CD — какое-либо «тупиковое» ребро дерева G, т. е. вершина D имеет индекс 1 (рис. 281). Отбросив ребро CD, мы получаем дерево G', содержащее п вершин. Для него, по предположению индукции, формула (4) верна. Но при переходе от дерева G к G мы добавляем одно новое ребро CD и одну новую вершину D, т. е. разность между числом вершин и ребер не изменяется. Следовательно, и для дерева G формула (4) остается справедливой. Таким образом, по индукции, формула (4) верна для любого дерева.

Теперь мы можем изложить идею доказательства формулы Декарта—Эйлера (3). Для доказательства проведем индукцию по числу Г, т. е. по числу областей, на которые связный граф G разбивает плоскость. Пусть сначала Г=\, т. е. на плоскости имеется только одна область, определяемая связным графом G. Тогда граф G является деревом (в противном случае в нем имелся бы цикл, вследствие чего

Рис. 280 Рис. 281 Рис. 282

плоскость оказалась бы разбитой на две или большее число областей, рис. 283). Так как G — дерево, то справедливо соотношение (4); кроме того, Г = 1, и потому В-Р + Г=(В-Р) + Г = 1 + 1 = 2, т. е. в этом случае соотношение (3) справедливо. Это — начало индукции.

Совершим теперь переход от я к Предположим, что для любого связного графа, разбивающего плоскость на п областей, формула (3) справедлива, и рассмотрим связный граф G, разбивающий плоскость на п + 1 область. Пусть АВ — какое-либо ребро, по которому примыкают друг к другу две из этих областей, скажем, области Fj и F2 (рис. 283). Если мы уберем из графа G ребро АВ (оставив вершины А и В), т. е. уберем «перемычку», разделяющую области Fj и F2, то эти области соединятся в одну область F (рис. 284), а остальные области останутся без изменения. Иначе говоря, убрав ребро АВ, мы получим вместо G связный граф G, который разбивает плоскость не на п+ 1, а на п областей. Следовательно, по предположению индукции, для графа G формула (3) справедлива. Но у графа G столько же вершин, сколько у графа G', тогда как ребер у G на одно больше; чем у графа G', и областей («граней») тоже на одну больше. Значит, при переходе от G к графу G число В-Р + Г не изменится, т. е. формула (3) останется справедливой и для графа G. Проведенная индукция показывает, что формула (3) справедлива для любого связного графа на плоскости.

Следует заметить, что проведенное рассуждение содержит основную идею, которая для получения корректного доказательства должна быть дополнена некоторыми уточненными деталями. Так, рассматривая граф G, разбивающий плоскость на п + 1 часть, мы взяли в нем ребро АВ, к которому примыкают две различные области Fj и F2 (рис. 283). Однако, как показывает рис. 285, могут существовать ребра, к которым с обеих сторон примыкает одна и та же область. Значит, в качестве АВ можно взять не любое ребро графа G. Однако требуемое ребро (к которому примыкают две различные области) все же можно найти. В самом деле, в графе G существует некоторый цикл (этот граф не может быть деревом, поскольку он разбивает плоскость на п + 1 часть, т. е. не менее чем на две области). Если взятый цикл

Рис. 283 Рис. 284 Рис. 285

является самопересекающимся, то, взяв лишь часть ребер, можно из этого цикла выделить простой цикл. Так как простой цикл разбивает плоскость на две области (внутреннюю и внешнюю), то любое ребро AB, входящее в этот цикл, обладает требуемым свойством, т. е. примыкающие к нему с двух сторон области являются различными (рис. 283). Этим заполняется указанный пробел в доказательстве. Имеются и другие, более мелкие уточнения, которые следует сделать, чтобы проведенное рассуждение стало полным, корректным доказательством. Мы оставляем это внимательному читателю.

Задачи и упражнения

181. Верна ли формула Декарта—Эйлера для несвязных графов? Как она должна формулироваться, если граф состоит из п связных частей (компонент)?

182. Внутри /7-угольника выбрано m точек. Некоторые из этих m + п точек как-то соединены друг с другом прямолинейными отрезками. В результате я-угольник разбился на треугольники. Чему равно число треугольников?

183. В плоском графе вершины имеют индекс 3, а грани имеют не более 5 ребер. Каково наибольшее возможное количество граней, являющихся пятиугольниками?

184. Как будет формулироваться теорема Декарта—Эйлера для связного графа на торе (см. рис. 471 на с. 340)?

185. Сформулируйте теорему Декарта—Эйлера для несвязного графа на торе.

47. Правильные многогранники и паркеты

На рис. 286 изображены пять выпуклых правильных многогранников. Их называют также Платоновыми телами (хотя они были известны еще задолго до Платона). У каждого правильного многогранника грани являются правильными ^-угольниками и из каждой вершины исходят к ребер. Эти числа полностью характеризуют правильный многогранник. Например, у куба п = 4 и к = 3, т. е. все грани — квадраты и в каждой вершине сходятся три ребра. А у икосаэдра п = 3, к = 5.

Почему существует (с точностью до подобия) только пять платоновых тел? Теория графов позволяет дать простой ответ на этот вопрос. Вершины и ребра правильного многогранника образуют граф (скелет многогранника), который можно центрально спроектировать

на плоскость (как на рис. 277; на рис. 274 изображена центральная проекция скелета додекаэдра). Эта проекция представляет собой правильный граф в том смысле, что каждая его грань имеет п ребер (включая и внешнюю, неограниченную грань), а из каждой вершины исходят к ребер. Число вершин, ребер и граней этого графа будем обозначать через В, Р, Г. Если каждую грань (включая и внешнюю, неограниченную) мы обойдем по контуру, считая ребра, то всего насчитаем пГ ребер. При этом каждое ребро мы засчитаем дважды (так как к нему примыкают две грани). Это дает соотношение

пГ=2Р. (5)

Из соотношений Вк = 2Р (см. (2)) и (5), учитывая равенство В + Г =2 + Р, вытекающее из формулы Декарта—Эйлера, получаем:

Эта формула позволит найти все правильные графы, т. е. найти все те п > 2 и к > 2, которые удовлетворяют найденному соотношению

(6)

Пусть сначала к = 2. Тогда из (6), (2) и (5) следует, что Р-п, Г-2, В-п. Этим определяется граф в виде замкнутой ломаной с п звеньями (рис. 287). Можно считать, что ему соответствует «многогранник» на сфере, у которого две «грани» (северное и южное полушария), а п вершин и п ребер расположены на экваторе (рис. 288). Аналогично при п = 2 мы получаем из (6), (2) и (5) следующие значения: Р = к, Г=к, В = 2.. Соответствующий граф (рис. 289) содержит одно /:-кратное ребро. Можно считать, что ему соответствует «многогранник» на сфере, у которого имеются две вершины (северный и южный полюсы) и к ребер (меридианов), тогда как каждая грань представляет собой «двуугольник», ограниченный двумя меридианами (рис. 290).

Рис. 286

Пусть теперь к = 3. Тогда уравнение (6) принимает вид — = р +

Так как здесь правая часть больше -jr, то п < 6. Таким образом, предоставляются следующие три возможности (для которых В и Г вычисляются по формулам (2) и (5):

(7) (8) (9)

Графы (7) - (9) соответствуют правильному тетраэдру, кубу и правильному додекаэдру (рис. 286).

Далее, пусть п = 3. Тогда аналогично мы получим еще раз граф (7) и два новых графа:

л = 3, к = 49 Р= 12, В = 6, Г=8; (10)

л = 3, к = 5, Р = 30, В =12, Г=20. (11)

Эти графы соответствуют правильному октаэдру и правильному икосаэдру (рис. 286).

Наконец, случаи, когда одновременно п>4 и к > 4, невозможны, поскольку тогда левая часть в (6) не больше -г, тогда как правая часть больше у. Таким образом, все правильные графы (а потому и правильные многогранники) найдены.

В проведенном выше рассуждении были изучены конечные правильные графы. Существуют, кроме того, бесконечные правильные графы на плоскости. На рис. 291 - 294 показаны паркеты, т. е. замощения плоскости конгруэнтными многоугольниками (треугольниками, четырехугольниками, шестиугольниками). На рис. 291, 294 стороны имеют неодинаковую длину (а грани не являются правильными многоугольниками). Тем не менее, граф, составленный из сторон многоугольников, и в этих случаях является комбинаторно правиль-

Рис.287 Рис.288 Рис.289 Рис.290

ным: каждая вершина имеет один и тот же индекс к, и каждая грань имеет одно и то же число сторон п.

А существуют ли комбинаторно правильные паркеты, составленные из многоугольников, у которых число сторон п отлично от 3, 4, 6? Ответ на этот вопрос может быть как положительным, так и отрицательным — в зависимости от точки зрения.

Прежде всего покажем, что конгруэнтными многоугольниками можно настлать правильный паркет на плоскости (евклидовой) только в том случае, если число сторон п многоугольника равно 3, 4 или 6. В самом деле, пусть M — такой многоугольник, что конгруэнтными ему многоугольниками можно настлать паркет на плоскости, п — число сторон многоугольника М. Через h обозначим диаметр многоугольника М, т. е. наибольшее из расстояний между его вершинами, а через S — его площадь. Мы предположим, что граф, составленный из ребер этого паркета, является правильным, и обозначим через к индекс каждой вершины этого графа.

Обозначим теперь через К круг радиуса г и рассмотрим все многоугольники паркета, имеющие с К общие точки. Они образуют конечный граф G (рис. 295), число вершин, ребер и граней которого обозначим через В, Р, Г (причем к числу граней причисляется и внешняя, неограниченная область FJ. Числа В, Р, Г удовлетворяют формуле (3).

Так как все рассмотренные многоугольники (т. е. все грани, определяемые графом G, кроме FJ) покрывают круг К, то сумма их площадей больше площади этого круга:

(12)

Далее, все многоугольники, имеющие общие точки с окружностью круга К (назовем эти многоугольники «крайними»: они на рис. 295 заштрихованы), содержатся в кольце, образованном окружностями радиусов r + h и r —h. Площадь этого кольца равна ъ(г + К) - п(г - h) = 4nrh и потому число у крайних многоугольников удовлетворяет условию yS<4nrh. Умножив это неравенство на неравенство, обратное (12), получаем

Рис. 291 Рис. 292 Рис. 293

Рис. 294 Рис. 295 Рис. 296

(13)

Посчитав ребра по всем граням, определяемым графом G, мы насчитаем п(Г- 1) + р ребер, где р — число ребер наружного контура графа G, причем каждое ребро мы засчитаем дважды. Следовательно, 2Р = п(Г- 1) + р, т. .е. 2Р-п(Г- 1) = р. Но число р (т. е. число ребер внешнего контура графа G) меньше, чем число всех сторон, посчитанных по всем крайним многоугольникам, т. е. меньше чем пу. Таким образом,

(14)

Теперь посчитаем все вершины по всем граням графа G, кроме внешней грани F^. Мы насчитаем п(Г- 1) вершин, причем каждую

вершину, не лежащую на внешнем контуре, мы засчитаем к раз, а каждую вершину внешнего контура — менее к раз. Значит, число kB - п(Г- 1) положительно, но меньше чем взятое к раз число вершин внешнего контура, т. е.

(15)

Из (14) и (15) получаем (учитывая (13)):

и потому

(16)

Наконец, записав формулу Декарта—Эйлера в виде

(17)

и переходя к пределу при г—>оо5 мы получаем (в силу (16), (17))

(18)

Но уравнение (18) имеет в натуральных числах п, к лишь следующие три решения: п = 3, к = 6; п = 4, к = 4; п = 6, к = 3. Это и означает, что правильный граф, осуществляющий на евклидовой плоскости паркет из конгруэнтных ^-угольников, существует лишь при я = 3, п = 4 или п = 6.

В приведенном выше доказательстве мы использовали конгруэнтность многоугольников, составляющих паркет, а также формулу площади круга, взятую из евклидовой геометрии. И то, и другое существенно. На рис. 296 показан фрагмент бесконечного правильного графа, дающего паркет из семиугольных областей. Правда, эти области не конгруэнтны между собой, да и паркет будет настлан не на всей плоскости, а лишь внутри круга. Но на плоскости Лобачевского такой паркет может быть осуществлен из конгруэнтных между собой правильных семиугольников и притом на всей плоскости. Вообще, для любых п > 3, к > 3 удовлетворяющих условию

можно построить на плоскости Лобачевского бесконечный правильный граф, имеющий в каждой вершине индекс к и разбивающий всю плоскость на конгруэнтные правильные я-угольники.

В заключение отметим, что существуют также полуправильные многогранники (так называемые архимедовы тела), т. е. выпуклые многогранники, гранями которых являются правильные многоугольники двух типов. Так, на рис. 297 изображен кубоктаэдр, гранями которого служат квадраты и равносторонние треугольники. Формула Декарта—Эйлера позволяет найти все архимедовы тела. Их существует 16 типов, причем 14 из них определены, с точностью до подобия, однозначно, а два типа (правильные призмы и антипризмы,

Рис. 297 Рис. 298 Рис. 299

Рис. 300 Рис. 301

рис. 298, 299) содержат бесконечно много представителей: их основаниями могут быть правильные многоугольники с любым числом сторон.

На плоскости можно также рассматривать паркеты, составленные из правильных многоугольников не одного, а двух типов. Они также могут быть все найдены с помощью формулы Декарта—Эйлера, причем на евклидовой плоскости таких паркетов имеется лишь конечное число (два примера приведены на рис. 300, 301), а на плоскости Лобачевского их бесконечно много.

Замечательной особенностью всех этих паркетов является их периодичность. Например, существует паркет, составленный из правильных двенадцатиугольников и треугольников, причем любой двенадцатиугольник может быть с помощью движения совмещен с любым другим двенадцатиугольником и при этом движении весь паркет снова целиком совместится с самим собой. Но в 1973 году Роджер Пенроуз обнаружил квазипериодические паркеты, которые сразу же привлекли внимание математиков и кристаллографов. На рис. 302 изображено разбиение ромба с углами 72° и 108° на два четырехугольника (один из которых— невыпуклый).

С помощью этих четырехугольников и с условием, что никакие два из них не складываются в виде ромба, как на рис. 302, можно построить бесконечное (даже континуальное) множество паркетов, причем ни один из этих паркетов не будет периодическим, хотя некоторые из них имеют симметрию пятого порядка (т. е. совмещаются сами с собой при повороте вокруг некоторой точки на угол

Рис. 302 Рис. 303 Рис. 304

Два примера таких паркетов приведены на рис. 303, 304. Однако любой паркет Пенроуза квазипериодичен, т. е. любой конечный (и притом как угодно большой) кусок паркета повторяется в этом паркете бесконечно много раз. Возможно, мы являемся свидетелями постепенного оформления новой ветви математики и кристаллографии — теории квазикристаллов.

Задачи и упражнения

186. Взят правильный многогранник. Какой многогранник получится, если его вершинами являются центры граней взятого многогранника, а ребрами — отрезки, соединяющие центры соседних граней взятого многогранника?

187. Докажите, что плоскость можно замостить конгруэнтными четырехугольниками произвольной формы.

188. Можно ли замостить плоскость конгруэнтными пятиугольниками?

189. Можно ли замостить плоскость конгруэнтными выпуклыми семиугольниками?

190. Можно ли замостить плоскость выпуклыми семиугольниками, не обязательно конгруэнтными?

48. Проблема четырех красок

Пусть G — конечный граф на плоскости. Он разбивает плоскость на конечное число областей («стран»). Поставим задачу раскрасить страны в разные цвета, причем таким образом, чтобы получилась «политическая карта». Разумеется, чтобы страны были хорошо видны, необходимо граничащие страны окрашивать в разные цвета. Однако в целях экономии количества красок разрешается не граничащие страны окрашивать одним цветом; при этом страны, имеющие общие точки в вершинах графа, но не имеющие общих ребер («границ»), будем считать не граничащими (страны А и Б на рис. 305). Какое минимальное количество красок надо иметь, чтобы можно было раскрасить любую карту на плоскости?

Эта задача была сформулирована в 1852 году лондонским студентом Гутри, который обнаружил, что для различения графств на карте Англии достаточно четырех красок, и выдвинул гипотезу о том, что четырех цветов достаточно для раскраски любой карты. Спустя почти сорок лет английский математик Хивуд доказал, что любую карту на плоскости можно раскрасить в пять цветов. Постепенно проблема четырех красок привлекала интерес все большего количества математиков. В 1968 году Оре и Стемпл доказали, что любую карту, имеющую не более 40 стран, можно раскрасить в четыре цвета.

В 1976 году было распространено мнение, что проблема четырех красок получила компьютерное решение (положительное) в работах американских математиков К. Аппеля и В. Хакена. С помощью компьютера (который «помогал» им постепенно совершенствовать первоначальную программу) они разбили все возможные карты почти на 2000 четко определенных типов. Для каждого из этих типов (кроме трех, которые были исследованы «вручную», поскольку компьютер с

ними не справлялся) компьютер решал задачу: может ли в рассматриваемом типе карт найтись такая, которая не раскрашивается в четыре цвета? Когда, выполнив десятки миллиардов арифметических и логических операций, компьютер давал ответ «нет», переходили к следующему типу карт и т. д. Получив ответ «нет» для всех типов карт, Аппель и Хакен объявили, что ими получено компьютерное решение проблемы четырех красок.

Новое компьютерное решение было предложено в 1978 году Д. Коэном. Число типов карт было у него существенно меньше, причем результат компьютерных вычислений по каждому типу и подтипу он получал не только в виде готового «нет», а в форме, допускающей «ручную» проверку. Исследование подтипа считалось завершенным, когда компьютер находил достаточно обозримый путь проверки окончательного «нет».

По мнению Коэна проверка найденного им решения проблемы четырех красок могла бы быть выполнена одним человеком в течение двух-трех лет (!) ежедневной восьмичасовой работы.

Однако гарантии правильности этих компьютерных решений нет. Ведь в каком-то, скажем, семнадцатом типе карт компьютер мог ответить «нет» не в результате безупречного анализа, а из-за сбоя в работе (что при длительной работе компьютера бывает нередко). Не зная об этом, вычислители переходят к восемнадцатому, девятнадцатому типу карт, фактически пропустив исследование семнадцатого типа. Не будет гарантии правильности решения даже в том случае, если мы, затратив много месяцев, повторим уникальный компьютерный эксперимент: может быть, где-то в многомиллиардной цепочке вычислений, связанных с тем же семнадцатым типом, и в нашем компьютере произойдет сбой?

Решение Коэна кажется более предпочтительным, поскольку оно допускает «ручную» проверку. Однако человек, занимавшийся с утра до вечера в течение двух лет нудной проверкой, вряд ли может гарантировать, что он нигде не допустил ни одной ошибки.

В довершение всего в последнее время возникли сомнения в самом принципе программирования: похоже, что нет уверенности в переборе всех мыслимых карт с помощью тех типов, которые были указаны. Одним словом, сегодня нет достаточной уверенности в полноте компьютерного решения. Все большее число скептиков склоняются сегодня к мнению о том, что проблема пока остается открытой.

Рис. 305 Рис. 306

Существует и иная формулировка проблемы четырех красок, также связанная с графами. Пусть на плоскости начерчена карта, требующая для своей раскраски С цветов. Выберем внутри каждой страны точку («столицу»). Для каждой из двух граничащих стран проведем по территории этих стран «железную дорогу», соединяющую их столицы (рис. 306), причем так, чтобы различные железные дороги не пересекались. Вместо окраски страны в некоторый цвет мы можем водрузить в ее столице флаг, имеющий этот цвет; если при этом две столицы соединены железной дорогой (т. е. страны граничат), то их флаги должны иметь разный цвет. Таким образом, надо покрасить вершины дуального графа G* (ребрами которого являются железные дороги) таким образом, чтобы любые две смежные вершины (соединенные ребром) имели разный цвет. Ясно, что хроматическое число графа G*, т. е. наименьшее число цветов, требуемых для его раскраски, равно С. Таким образом, проблема четырех красок может быть переформулирована следующим образом: доказать, что для любого плоского графа G*, т. е. графа, располагаемого на плоскости без «лишних» пересечений ребер, его хроматическое число не более четырех.

Проблема четырех красок связана с рассмотрением именно плоских графов. Для графов, которые не располагаются на плоскости, хроматическое число может быть и большим четырех. Например, полный граф с п вершинами имеет хроматическое число п (поскольку любые две вершины соединены ребром, все вершины должны быть окрашены в разные цвета). Однако, возможны и такие случаи, когда неплоские графы имеют маленькое хроматическое число. Например, граф «домики и колодцы» (рис. 268) имеет хроматическое число 2: домики надо окрасить одним цветом, а колодцы — другим.

Задачи и упражнения

191. Докажите, что карту на плоскости, полученную в результате проведения нескольких прямых, можно правильно окрасить двумя красками.

192. Докажите, что карту на плоскости, полученную в результате проведения нескольких окружностей, можно правильно окрасить двумя красками.

193. Карта на плоскости получена путем проведения нескольких окружностей и их диаметров (по одному в каждой окружности). Докажите, что полученную карту можно правильно раскрасить тремя красками.

194. На карте А страны являются многоугольниками. Проведена прямая, не проходящая ни через одну из вершин. Эта прямая разбивает некоторые страны на части, что дает карту В. Докажите, что если карта А раскрашиваема четырьмя красками, то и карта В тоже раскрашиваема четырьмя красками.

195. Покажите, что на торе можно расположить семь стран так, что каждые две граничат между собой.

49. Ориентированные графы

Граф называется ориентированным (или направленным) если на каждом его ребре указано (стрелкой) некоторое направление. Мы уже упоминали ориентированные графы в п. 20 в рассказе об упорядочен-

ных множествах: элементы упорядоченного множества рассматриваются как вершины графа, и ребро, идущее в направлении от А к В, имеется в том и только в том случае, если А < В. Однако при таком способе изображения упорядоченного множества мы обычно рисуем слишком много стрелок (рис. 307). Именно, если А < В н В < С, то в графе должны быть указаны не только ребра AB и ВС, но также и ребро АС, поскольку в силу условия транзитивности из А <В, В< С следует А < С. Будем говорить, что наличие ребра АС является следствием наличия ребер AB и ВС в силу транзитивности.

Условимся теперь не изображать ребра, являющиеся следствием в силу транзитивности. Тогда граф, изображающий отношение порядка на рис. 307, будет выглядеть существенно более обозримым образом (рис. 308). А недостающие ребра (являющиеся следствием по транзитивности) можно легко восстановить: соотношение X < Y имеет место на рис. 308 в том и только в том случае, если найдется в графе ориентированная цепь, идущая от I к Y (с учетом направления стрелок). Заметим, что в графе на рис. 308 нет ориентированных циклов. Это и понятно: если бы существовал ориентированный цикл XY, YZ, VW, WX, то это означало бы, что Х< Y, Y<Z, V<W, W<X, т. е. было бы Х< W, W<X, что в упорядоченном множестве невозможно.

Таким образом, ориентированный граф, изображающий отношение порядка, не содержит ориентированных циклов. Справедливо и обратное: если дан ориентированный граф, не содержащий ориентированных циклов, то, дополнив его ребрами по транзитивности, мы получаем некоторое отношение порядка в множестве его вершин. Это отношение порядка как раз и описывается указанным выше правилом: X < Y если существует в графе ориентированная цепь (хотя бы одна), ведущая от X к Y. Так, для отношения порядка, определяемого графом на рис. 309, мы имеем А < С (поскольку имеется ориентированная цепь от А к С). А элементы А и M несравнимы, так как от одного к другому не ведет никакая ориентированная цепь.

Рис. 307 Рис. 308 Рис. 309

В графе, изображающем отношение порядка, отсутствие стрелок, являющихся следствиями по транзитивности, означает, что мы соединяем вершины U и V стрелкой UV только в том случае, если V является элементом, непосредственно следующим за U, т. е. U< V, но нет элемента X, расположенного между ними (U<X< V).

Граф, изображающий отношение порядка, называется диаграммой Хассе, если он не содержит стрелок, являющихся следствиями по транзитивности, и при этим все стрелки идут в направлении снизу вверх, т. е. вершина, изображающая больший элемент, расположена выше, чем меньший. Так на рис. 310 изображена некоторая диаграмма Хассе. Она получается следующим образом: мы рассматриваем куб, диагональ АН которого перпендикулярна горизонтальной плоскости (рис. 311), и считаем, что из двух вершин куба та является большей, которая расположена выше (а две вершины, расположенные на одной высоте, несравнимы).

На рис. 310 граф изображен с «лишними» пересечениями ребер. Можно этот граф, точнее, изоморфный ему, расположить на плоскости и без пересечений (рис. 312), однако это уже не будет диаграммой Хассе: хотя вершина H является наибольшей, но на рис. 312 она не расположена выше других. Возникает естественный вопрос: в каком случае отношение порядка в некотором конечном упорядоченном множестве M может быть изображено диаграммой Хассе без самопересечений} Для случая, когда M содержит единственный максимальный и единственный минимальный элемент, ответ дается следующей теоремой, которую доказал канадский математик Прим.

Пусть M— упорядоченное множество, содержащее единственный максимальный и единственный минимальный элемент, и пусть G — ориентированный граф (без следствий по транзитивности), изображающий отношение порядка в М. Обозначим через Gj неориентированный граф, получающийся добавлением к G одного ребра, соединяющего минимальный и максимальный элементы. Диаграмма Хассе для упорядоченного множества M в том и только в том случае может быть изображена без пересечений, если граф Gj является плоским.

Например, для отношения порядка в множестве вершин куба, показанного на рис. 310, граф Gj получается добавлением к графу рис. 310 ребра АН (рис. 313). Этот граф не является плоским (он содержит граф «домики и колодцы», рис. 314). Поэтому, согласно теореме Прима, диаграмма Хассе для рассматриваемого отношения порядка не может быть изображена без самопересечений.

Возможность расположения некоторого графа (ориентированного или нет) на плоскости без пересечений может показаться математической игрушкой, малоинтересной для практики. Однако это не так. Например, при изготовлении печатных плат для радиоприемников, магнитофонов и других приборов на пластине диэлектрика монтируется некоторое количество контактов (для выводов от емкостей, трансформаторов и т. д.), которые, как вершины графа, нужно соеди-

Рис 312

Рис.310 Рис.311

Рис. 313 Рис. 314 Рис. 315

нить (соответственно схеме) сетью токопроводящих дорожек. Если получающийся граф является плоским, то его можно изготовить травлением или напылением металла (предварительно защитив не подлежащие соединению места лаком или каким-либо экраном) и это существенно упрощает и удешевляет технологию. Если же граф не является плоским, приходится перекидывать «мостики» или делать схему многослойной с изолирующими прослойками диэлектрика.

Диаграмма Хассе особенно удобна при расположении вершин «снизу вверх» в порядке возрастания узловых напряжений (в этом случае близкие друг к другу узлы имеют не очень большую разность потенциалов, и это уменьшает вероятность пробоя).

Задачи и упражнения

196. Закончился круговой турнир баскетболистов, в котором не было ничьих. Всегда ли можно занумеровать команды так, чтобы каждая команда была победителем во встрече с командой со следующим номером?

197. Дорожки бульвара расположены так, как показано на рисунке 315. По ним бегают спортсмены в направлениях, указанных стрелками, причем по первой дорожке каждую минуту пробегает один спортсмен, по второй — два и т. д. по десятой — десять спортсменов. Время бега по каждой дорожке равно одной минуте. Расставьте на рисунке номера дорожек.

198. Несколько команд разыграли первенство по волейболу. Докажите, что если какие-нибудь две команды одержали одинаковое количество побед, то найдутся такие команды А, В и С, что А выиграла у В, В — у С, а С у А.

199. Между 5 планетами Солнечной системы установлено космическое сообщение. Ракеты летают по маршрутам: Земля —» Меркурий, Земля —»

Плутон, Плутон —> Венера, Венера —> Марс, Марс —> Меркурий, Марс —> Земля и Меркурий —» Плутон. Можно ли добраться от Меркурия до Земли?

200. Докажите, что всякий полный ориентированный граф имеет простой ориентированный путь, проходящий через все его вершины.

50. Конечные позиционные игры

Интересно применение ориентированных графов к теории игр. Чаще всего игра двух (или нескольких) участников заключается в том, что играющие поочередно делают ходы, которые по определенным правилам позволяют переходить от одной игровой позиции к некоторой другой. Игра с полной информацией не зависит от случайных элементов (бросание кости, расклад карт, который партнеры друг другу не показывают, и т. д.), причем множество возможных игровых позиций конечно (хотя, может быть, необозримо велико). Правила игры задают некоторый ориентированный граф, по ребрам которого можно переходить от одной позиции к другой. Течение игры (партия) представляет собой ориентированную цепь, проходящую по некоторым вершинам графа (т. е. по некоторым игровым позициям) и обрывающуюся в некоторой завершающей позиции, которая однозначно расценивается как либо «выигрыш первого», либо «выигрыш второго», либо «ничья». Будем предполагать, что трехкратное повторение одной и той же позиции расценивается правилами как «ничья» (такое соглашение имеется в шахматах). Тогда каждая партия оканчивается после конечного числа ходов.

В этих условиях справедлива следующая теорема: каждая игра двух участников (при фиксированной начальной позиции и четко оговоренных правилах) при правильном выборе стратегий игроков либо имеет ничейный исход, либо же несправедлива по отношению к одному из играющих. Иными словами, либо первый игрок (делающий начальный ход) при правильной стратегии фатально выигрывает (что бы ни делал второй), либо первый фатально проигрывает (при правильной стратегии второго), либо же — при правильной игре — ни один не может одолеть другого и игра фатально оканчивается ничейным исходом. Однако в случае необозримо большого (как в шахматах) числа игровых позиций при отсутствии хорошей теории нахождение «правильной стратегии» (т. е. однозначного правильного ответа на каждый ход противника) выше возможностей человеческого интеллекта или возможностей компьютерного перебора позиций. В случае сравнительно несложных игр нахождение «правильной стратегии» возможно.

Рассмотрим в качестве примера следующую игру. Имеются две кучки предметов (скажем, пуговиц), в первой из которых 7, а во второй 8 предметов. При каждом ходе играющий берет либо один предмет из первой кучки, либо один предмет из второй кучки, либо же по одному предмету из каждой кучки. Выигрывает тот, кто забирает последний предмет (или оба последних предмета, если в каждой кучке осталось по одному).

Рис.316 Рис-317 Рис-318

В этой игре каждая позиция задается парой (х\у), где х — число предметов в первой кучке, а у — во второй. Иначе говоря, игровые позиции характеризуются целочисленными точками первого квадранта (рис. 316). Из каждой позиции внутри квадранта возможны три хода: на одну единицу влево (берем предмет из первой кучки), на одну единицу вниз (берем из второй кучки) или же по диагонали вниз налево. Если же игровая позиция находится на одной из осей (но не в начале координат), то возможен лишь один ход. Это и дает весь ориентированный граф возможных игровых позиций (вершин) и возможных ходов (ребер, рис. 317). Заметим, что в этой игре ничейных исходов нет (кто-то непременно возьмет последний предмет).

Теперь найдем выигрышную стратегию, производя исследование игры «с конца». На рис. 318 крестиком обозначен конец игры (все предметы взяты), а три кружка обозначают выигрышные позиции, т. е. если игрок попал в какую-либо из этих позиций, то он забирает все и выигрывает. Далее, на рис. 319 поставлены еще два крестика, изображающие проигрышные позиции: если игрок попал в такую позицию, то он может из нее перейти только к одному из кружков, т. е. он отдает другому игроку выигрышную позицию. Окаймляя эти крестики кружками, мы получаем еще шесть выигрышных позиций: если игрок попал в одну из этих позиций, то у него есть ход, после которого другой игрок окажется в позиции, отмеченной крестиком (рис. 320). Продолжая, мы обнаружим, что все точки с обеими четными координатами помечены крестиком, а остальные — кружками (рис. 321). Так как начальное положение (7; 8) отмечено кружком (не обе координаты четны), то первый игрок (которому предложено сде-

Рис.319 Рис.320 Рис.321

Рис. 322

лать начальный ход) выигрывает: он берет один предмет из первой кучки, после чего второй игрок оказывается в позиции (6; 8), помеченной крестиком. Затем после любого хода второго игрока первый снова может сделать обе координаты четными и т. д. — вплоть до выигрыша.

Итак, предложенная игра несправедлива в отношении второго игрока: он при указанной начальной позиции всегда проигрывает. Если же предложить другой вариант игры: те же правила, но с начальным положением (8; 10), то игра будет несправедлива в отношении первого игрока.

В качестве второго примера рассмотрим игру с одной кучкой, содержащей 21 предмет. Правила игры: игрок А, делающий ход первым, может взять один или два предмета (по своему усмотрению). Второй игрок В может взять 3 или 4 предмета. Затем ходит А (и берет 1 или 2 предмета), затем снова В (3 или 4) и т. д. Игрок, забирающий последний предмет, считается выигравшим; если же должен ходить В, но в кучке осталось менее трех предметов, т. е. В не в состоянии сделать ход («патовая позиция»), то игра считается закончившейся вничью.

Граф игры показан на рис. 322. Заметим, что при любом ходе одного из игроков другой может своим ходом дополнить число взятых предметов до 5 (т. е. сделать так, что оба вместе возьмут во время этих двух ходов 5 предметов). Теперь ясно, что при начальной позиции 21 игрок А заведомо может выиграть: он берет один предмет, предлагая игроку В позицию 20. Что бы В ни сделал, игрок А следующим ходом предложит ему позицию 15, затем 10, 5 и, наконец, последним ходом перейдет к позиции 0, т. е. заберет все.

Читатель может проследить аналогично, что если заданная начальная позиция имеет вид 5п + 1 или 5п + 2, то выигрывает А. Далее, если начальная позиция имеет вид 5я, то выигрывает В. Наконец, если начальная позиция имеет вид 5лг н- 3 или 5п + 4, то при правильном поведении игроков ни один из них не может одолеть другого, игра закончится патовым положением (ничья). Итак, при каждой фиксированной начальной позиции игра либо несправедлива в отношении одного на игроков, либо оканчивается вничью (если игроки не делают ошибок).

Теперь поговорим немного об играх типа «математические развлечения». Вот одно из таких развлечений.

При поездке в трамвае (или автобусе) пассажир компостирует проездной талон, содержащий некоторый шестизначный номер. За-

дача заключается в том, чтобы, расставив между этими цифрами знаки арифметических действий, получить в результате число 100.

Например, если номер талона имеет вид 482973, то это можно сделать так: 4-8 + 2 + 9- 7 + 3= 100.

Есть и другие возможности (с применением скобок):

Можно также две рядом стоящие цифры рассматривать как двузначное число: (4 + 8) : 2 + 97 - 3 = 100 и т. д.

Множество таких развлечений можно найти в книгах замечательного популяризатора Я. И. Перельмана. Решать подобные задачи гораздо интереснее, чем выполнять рутинные упражнения на сложение чисел, и не случайно задачи такого типа стали появляться уже в школьных учебниках.

Увлекательны и другие, ставшие уже классическими, математические развлечения — лабиринты, задачи на разрезание и складывание фигур, нахождение нескольких стертых цифр при выполнении умножения столбиком и т. п. Все эти игры укладываются в разобранный нами тип конечных позиционных игр с полной информацией, а процесс нахождения решения (достижения завершающей позиции) способствует совершенствованию вычислительных навыков, развитию элементов числовой комбинаторики, геометрической интуиции.

Особенно интересна в этом плане компьютерная реализация таких игр. За последние десятилетия рынок наводнился тысячами разнообразных компьютерных игр и развлечений. В некоторых из них надо сбить самолет «противника», поймать «преступника», убежать от хищных животных, выиграть гонку и т. п. Такими играми достигается тренировка быстроты реагирования (в связи с чем они нередко применяются в качестве тренажеров). Но есть и другие игры — действительно позиционные, в которых цель достигается за некоторое число шагов, причем на каждом шаге надо сравнительно небольшое число возможностей выстроить в виде «правильной» цепочки, приводящей к очередному успеху (например: найти ключ, выпустить на свободу «недоваренного» кота и т. п.). Компьютер оказался очень удобным инструментом для реализации таких игр — каждая позиция игры (вершина графа) изображается на мониторе, в каждой позиции простым нажатием клавиши мыши выбирается допустимый ход (ребро графа), переводящий в другую позицию, причем часто компьютер сам сообщает, правильный ли сделан ход.

Подобную реализацию допускают многие математические игры и развлечения и таких компьютерных реализаций для интеллектуальных, развивающих игр появляется все больше и больше. В компьютерном оформлении игра (скажем, выбор предметов из одной или двух кучек, задача на переливание жидкостей и т. п.) становится гораздо более привлекательной, а реализация игры — более удобной

и наглядной. Осваивающим программирование можно предложить такое упражнение: «поставить на компьютер» игры, описанные в этой беседе.

Задачи и упражнения

201. Разберите игру в «крестики-нолики» на доске 3x3, при которой каждый играющий может своим ходом поставить как «крестик», так и «нолик». Выигрывает, как обычно, тот, после хода которого на доске оказывается три одинаковых значка, стоящих на одной прямой.

202. Двое играют в такую игру: из кучки, в которой находится 25 спичек, берут по очереди — каждый себе — одну, две или три спички. Выигрывает тот, кто берет последнюю спичку. Кто выигрывает в этой игре — начинающий или его противник?

203. Рассмотрим игру «двойные шахматы», в которой все правила остаются прежними, но каждый игрок делает сразу два хода. Докажите, что начинающий не проигрывает при правильной игре.

204. У ромашки п лепестков. Двое по очереди отрывают лепестки. Разрешается отрывать один лепесток или два соседних лепестка. Выигрывает тот, кто оторвет последний лепесток. Кто из играющих может обеспечить себе победу?

205. На окружности расставлено 20 точек, являющихся вершинами правильного двадцатиугольника. За один ход разрешается соединить любые две из них отрезком, не пересекающим (внутри окужности) отрезков, проведенных ранее. Проигрывает тот, кто не сможет сделать ход. Кто?

51. Понятие о сетевом планировании

Подготавливается план осуществления некоторого мероприятия, скажем, постройка дачного домика. Вся работа разбивается на отдельные операции: составление плана, прокладка дороги по участку, подвоз материалов, сооружение фундамента, изготовление бревенчатого сруба, сборка стропил для крыши, настилка пола, установка оконных блоков, внутренняя отделка, установка дверных блоков, кровельные работы, оборудование чердака, установка водоподогревателя и отопления, проводка электричества, дымоход, лестница на чердак, запоры на окна и двери. Составленный проект изображается в виде ориентированного графа, вершинами которого служат результаты реализации отдельных операций, а ребра изображают выполнение операций и их зависимость. Для каждой операции определяются предшествующие ей операции. Например, установке оконных блоков предшествуют изготовление бревенчатого сруба и настилка полов, тогда как установление оконных блоков и установление дверных блоков не зависят друг от друга (т. е. эти вершины ребром не соединены). В результате появляется ориентированный граф («сетевой план», или ПЕРТ), на ребрах которого надписываются планируемые сроки выполнения каждой операции (рис. 323). Этот граф не должен содержать ориентированных циклов (поскольку никакая операция не может предшествовать самой себе), т. е. он устанавливает упорядочение в множестве его вершин. Стрелки, представляющие собой следствия по транзитивности, не изображаются.

На рис. 324 предыдущий граф изображен в виде диаграммы Хассе, в которой вершины располагаются снизу вверх в виде нескольких ярусов. Такое изображение графа всегда можно выполнить (возможно, с пересечениями ребер). Это позволяет более наглядно представить зависимость операций друг от друга и их последовательность: например, вершина 4 не может быть достигнута, пока не пройдены вершины 2 и 3.

Для исполнителя проекта особо важную роль играет критический путь, который представляет собой самую неблагоприятную (самую напряженную в смысле времени) ориентированную цепь, ведущую от начальной операции к завершающей, т. е. цепь, которая имеет максимальную сумму длительностей операций. На рис. 323, 324 критический путь вычерчен жирно. Сумма длительностей операций, взятая вдоль критического пути, представляет собой время выполнения проекта в целом.

Вершины, по которым проходит критический путь, называются критическими операциями. На их выполнение руководитель проекта должен обратить особое внимание, так как любая задержка в выполнении какой-либо из этих операций означает задержку завершения всей работы («сдачи объекта»). Напротив, некритические операции допускают некоторое запаздывание в их выполнении (что дает руководителю некоторые возможности переброски рабочей силы для поддержки критических операций).

Рассмотренный метод (сетевое планирование) представляет собой важное практическое применение теории графов. Для достаточно сложных проектов, содержащих много вершин, нахождение критического пути может представлять собой трудоемкую задачу, без решения которой однако нельзя обоснованно судить о времени возможной реализации проекта. В связи с этим созданы специальные математические алгоритмы нахождения критического пути. Некоторые из них были разработаны при участии Ричарда Беллмана, руководителя математического отдела американской корпорации RAND.

Сказанное выше относится к случаю, когда длительности выполнения операций точно определены (детерминированы). На практике же могут иметь место случаи, когда некоторые длительности выполнения операций зависят от случайных обстоятельств

Рис. 323

Рис. 324

Рис'325 Рис.326

(задержка выполнения поставок смежниками из других ведомств, влияние погодных условий и т. п.). В таком случае задача принимает стохастический (вероятностный) характер. Если известно распределение вероятностей для длительности выполнения отдельных операций, то можно вычислить математическое ожидание времени завершения проекта. Обычно распределение вероятностей оценивается (а иногда и корректируется в процессе работы) экспертами (метод экспертных оценок), а вычисления проводятся с помощью компьютеров, т. е. возникают «человеко-машинные» системы сетевого планирования.

Задачи и упражнения

206. Укажите на сетевом графике (рис. 325) критический путь. Чему равно время осуществления проекта?

207. Составьте сетевой график подготовки и проведения шахматного турнира в школе.

208. При проведении ремонта квартиры выполняются следующие операции: а) покупка обоев; б) покупка краски и других малярных материалов; в) шпаклевка потолков и стен; г) принятие решения о ремонте; д) договор с малярами; е) оклеивание стен обоями; ж) окраска дверей и оконных рам; з) побелка потолков; и) шпаклевка дверей и оконных рам.

Составьте сетевой график проведения ремонта квартиры.

209. При компьютерном решении некоторой задачи последовательность вычислений удалось разбить на несколько этапов. При этом каждый этап требует результатов некоторых других этапов и дает данные для проведения некоторых других этапов. На рис. 326 приведен сетевой график процесса решения этой задачи. Для решения задачи задействована сеть из нескольких работающих параллельно компьютеров, результаты вычислений каждого поступают в общую базу данных, но каждый этап вычислений должен выполняться целиком на одном компьютере. Если каждый этап вычислений выполняется в течение 10 секунд машинного времени и в сети достаточно компьютеров, то сколько машинного времени займут вычисления вдоль критического пути? Какое минимальное количество компьютеров будет при этом задействовано?

210. При перестановке мебели в малогабаритной квартире для установки нового шкафа оказалось необходимым произвести следующие операции: а) из прихожей вешалка убирается на кухню; б) шкаф заносится в прихожую; в) из гостиной сервант переносится в спальню; г) на место серванта ставится шкаф; д) вешалка возвращается в прихожую; е) диван переносится на кухню; ж) на место дивана ставится сервант; з) диван переезжает в спальню.

Составьте сетевой график и определите те операции, которые можно выполнить до приезда шкафа.

ГЛАВА III. РАССУЖДЕНИЯ

Беседа 11. Теоремы

52. Существование и общность

Предложение, о котором можно однозначно установить, истинно оно или ложно, называют высказыванием. Это, конечно, не точное определение, а лишь пояснение. Например, предложения:

А. «3 + 6 = 9»;

В\ «Москва — столица России»;

С: «через любые две точки проходит единственная прямая»;

D: «для любых трех точек А, В, С сумма длин отрезков AB и ВС не меньше длины отрезка АС» (рис. 327) являются истинными высказываниями, а предложения:

Е\ «Париж — столица Италии»;

F: «2x2 = 5» — ложными высказываниями.

Истинность или ложность некоторого высказывания вовсе не должны быть немедленно очевидными. Например, высказывание С представляет собой в евклидовой геометрии некоторую аксиому, т. е. истинность этого высказывания принимается в этой геометрии без доказательства. А высказывание D представляет собой теорему евклидовой геометрии, и истинность этого высказывания устанавливается при помощи некоторого рассуждения (доказательства).

В качестве еще одного примера рассмотрим высказывание

G: «на 1 ООО ООО 000-м месте после запятой в десятичном разложении числа 71 стоит цифра 5».

Мы не можем сказать, истинно это высказывание или ложно, поскольку такого количества цифр числа к сегодня не знает никто. Но принципиально решить этот вопрос можно, т. е. можно узнать, истинно или ложно утверждение G. Например, известно равенство . и существует точная оценка того, какова величина ошибки, которую мы сделаем, оборвав этот ряд на п-м члене, т. е. принципиально возможно вычислить любую цифру числа к (хотя требуемое для нахождения 1 ООО ООО 000-й цифры этого числа количество вычислений столь велико, что нынешние компьютеры не могут их выполнить в обозримый срок).

А утверждение «Сегодня хорошая погода» высказыванием не будет, даже если уточнить дату, под которой понимается «сегодня», и уточнить в каком именно месте земной поверхности обнаружива-

Рис. 327

ется «хорошая погода». Ведь смысл термина «хорошая погода» однозначно не определен, и потому вопрос об истинности или ложности высказанного утверждения может не иметь однозначного ответа. Никакое вопросительное предложение также не является высказыванием. Например, бессмысленно задавать вопрос о том, истинно или ложно вопросительное предложение «Сколько будет 57+ 168?».

Первое систематическое исследование о высказываниях и операциях над ними (о чем мы будем вести разговор ниже) было предпринято гениальным древнегреческим ученым Аристотелем, который заложил начала логики. Математическое исследование этих вопросов ведет свое начало от основополагающего труда Джорджа Буля, изданного в Лондоне в 1854 году. Этот труд Буля положил начало математической логики, систематическое развитие которой было достигнуто работами многих математиков XX века. Некоторое первоначальное представление о специфике этой области математики и о ее приложениях (в частности, к школьному курсу математики) мы и предложим читателю в этой главе. А в дальнейших беседах мы несколько расширим эти первоначальные представления.

Кроме высказываний в логике рассматриваются предикаты. Предикат — это как бы высказывание, содержащее неизвестную (или несколько неизвестных).

Рассмотрим следующее предложение, содержащее переменную п\ «п делится на 7». Обозначим это предложение через А(п). Предложение А(п) высказыванием не является: о его истинности мы ничего не можем сказать, пока не указано, какое конкретное значение принимает п. Например, при п- 1 получается высказывание А(\), которое словами выражается так: «1 делится на 7». Это высказывание ложно. Высказывание же ^(14), т. е. «14 делится на 7» — истинно.

Итак, А(п) представляет собой предложение, которое при каждом конкретном п превращается в некоторое высказывание. Такие предложения в математике называются предикатами. В данном случае предикат А(п) содержит переменную п, которая может принимать значения из множества натуральных чисел. Поэтому говорят, что предикат А(п) задан на множестве натуральных чисел.

Замечание. Слово «предикат» в переводе с латинского означает «сказуемое» (оно употребляется также в немецком, английском и других языках). Например, рассмотренное выше предложение А(п) содержит в качестве подлежащего букву п, а вся остальная часть предложения представляет собой сказуемое «делится» с подчиненными ему словами. Подставляя вместо п то или иное подлежащее (в данном случае числительные 1, 14 и т. д.), мы получаем некоторые высказывания. В дальнейшем в этом пункте высказывания и предикаты мы иногда будем заключать в фигурные скобки.

Аристотель ограничился в своей логике рассмотрением предикатов только от одной переменной. Но после работ Буля в рассмотрение вошли и предикаты от нескольких переменных. Вот пример предиката от двух переменных: {Писатель W написал книгу Ь). Это пока еще не высказывание, поскольку нам не указано, о каком писателе и о

какой книге идет речь. Но если вместо W и b мы подставим какие-либо конкретные значения, получится некоторое высказывание. Например, подставив W - Л. Н. Толстой, b = «Война и мир», мы получим истинное высказывание

{Писатель Л. Н. Толстой написал книгу «Война и мир»}.

А при подстановке W = И. С. Тургенев, b = «Анна Каренина» получится ложное высказывание.

Дадим теперь интерпретацию предикатов на языке теории множеств. Рассмотренный выше предикат А(п) задан на множестве TV всех натуральных чисел. Множество A с: TV, состоящее из чисел, делящихся на 7: А - {7, 14, 21, 28, 35, 42, 49, ... }, представляет собой множество всех тех значений п, для которых А(п) превращается в истинное высказывание. Его дополнение с A =N\A представляет собой множество всех тех значений п, при подстановке которых рассматриваемый предикат превращается в ложное высказывание. Например, 84 g А, потому что ^(84) — истинное высказывание (число 84 делится на 7), а 37 g с А, потому что А(Ъ1) — ложное высказывание.

Вообще, если задано некоторое универсальное множество U, на котором определен предикат В(х), то с точки зрения теории множеств это означает, что выделено некоторое подмножество В с U, состоящее из всех X g U, при подстановке которых В(х) превращается в истинное высказывание. Его дополнение сВ состоит из всех х g U, при подстановке которых В(х) превращается в ложное высказывание. Это множество В называется множеством истинности предиката В(х).

Рассмотрим теперь предикаты от двух переменных. Указанный выше предикат о писателях и книгах можно записать так:

L(W, b) = {Писатель W написал книгу Ь}.

Здесь переменная W пробегает множество А всех писателей, а переменная b пробегает множество В всех книг. Каждая пара (W\ b) представляет собой элемент множества АхВ, т. е. произведения множеств А и В:

Здесь точками обозначены элементы произведения АхВ, т. е. всевозможные пары (W\b), а «галочками» отмечено множество истинности Lez Ах В, т. е. множество тех пар (W\b), при подстановке которых рассматриваемый предикат превращается в истинное выска-

зывание. Дополнение же AxB\L состоит из пар, при подстановке которых получается ложное высказывание.

Если рассматривается предикат К(а, Ь, с) от трех переменных a g A, b g В, с g С, то его множество истинности представляет собой некоторое подмножество К с А х В х С.

Множества истинности предикатов нередко обозначают с помощью фигурных скобок. Например, запись А = {х е N: А(х)} означает, что А есть множество всех тех х g N, для которых имеет место А(х), т. е. множество истинности этого предиката. Более подробно:

В качестве второго примера рассмотрим запись

Она означает множество всех точек M (взятых на плоскости R2), для которых предикат AM-ВЫ превращается в истинное высказывание, т. е. множество всех точек плоскости, равноудаленных от двух заданных точек А и В. Как известно из школьного курса геометрии, это множество представляет собой серединный перпендикуляр к отрезку AB.

Вернемся к высказываниям С и D, рассмотренным выше. В них используются выражения «любые две точки», «для любых трех точек». Часто приходится формулировать и другие высказывания, в которых используются слова «все», «всякий», «каждый», «любой» и т. п. В математике принято вместо этих слов использовать знак V (перевернутая первая буква А английского слова АН — все), который называется знаком общности.

Рассмотрим следующие два утверждения:

(1) сумма величин углов треугольника ABC равна 180°;

(2) в треугольнике ABC угол А прямой.

Чтобы подчеркнуть общность утверждения (1), т. е. его справедливость для любого треугольника ABC, используется знак V: ( V ААВС) (ZA +ZB + ZC= 180°).

Читается: «для любого треугольника ABC сумма величин углов А, В и С равна 180°». Это — истинное высказывание.

Утверждение (2) такой общностью не обладает. И если перед этим утверждением записать (V ААВС), то получается ложное высказывание. Например, в треугольнике, изображенном на рисунке 328, угол А не прямой.

В качестве еще одного примера возьмем сформулированное выше высказывание D. В нем используется предикат AB + ВС > АС, в котором имеются три переменные: точки А, В, С. Само же высказывание D можно записать следующим образом:

Рис. 328 Рис. 329

Знак общности в этой записи показывает, что неравенство треугольника справедливо для любых точек А, В и С, а обозначение «т.» — сокращение слова «точка» (в дальнейшем для сокращения слова «прямая» будет применяться обозначение «пр.»).

Вообще, если к некоторому предикату, содержащему, скажем, переменную х, добавить слева запись (V х), т. е. «навесить» на переменную X знак общности (или, как говорят математики, квантор общности), то получится некоторое высказывание, истинное или ложное.

Возьмем, например, следующий предикат, определенный на множестве H всех людей: А(х) = {х имеет две ноги}.

Навесив на переменную х квантор общности, мы получим высказывание (Ухе Н) А(х), т. е. словами: «любой человек х имеет две ноги». Это высказывание, к сожалению, ложно.

Рассмотрим теперь еще один квантор, применяемый в математической логике — так называемый квантор существования.

Нам часто приходится формулировать высказывания, в которых используются слова: хотя бы один, найдется, существует и т. д. В математике принято вместо этих слов использовать знак 3 (перевернутая первая буква Е английского слова Exists — «существует»).

Рассмотрим, например, три предиката, заданные на множестве всех треугольников:

А(Т) = {в треугольнике Г сумма величин углов равна 180°};

В(Т)= {один из углов треугольника Т— прямой};

С(Т)= {два угла треугольника Т— прямые}.

Предикат А(Т) для всякого конкретного треугольника Г превращается в истинное высказывание. Иными словами, высказывание (V Т) А(Т) истинно (в любом треугольнике сумма величин углов равна 180°).

Предикат В(Т) не для всякого конкретного треугольника Т превращается в истинное высказывание; например, для треугольника 7"j на рис. 329 высказывание В(Т^) ложно. Поэтому мы не можем утверждать, что для любого Т имеет место В(Т) — не в любом треугольнике один из углов прямой. Иными словами, высказывание (V Т) В(Т) ложно. Вместе с тем существуют такие треугольники, для которых В(Т) истинно (например, треугольники 7^, на рис. 329). Этот факт записывают с помощью квантора существования 3:

(3 Т)В{Т). Словами эта запись читается так: существует Т, для которого справедливо В(Т) (т. е. существует треугольник Т, один из углов которого — прямой).

И, наконец, предикат С(Т) ни для какого треугольника Т не превращается в истинное высказывание (в Евклидовой геометрии).

Задачи и упражнения

211. Является ли высказыванием утверждение «У марсиан по три глаза»?

212. Найдите множество истинности следующего высказывания: сумму в п рублей можно уплатить купюрами в 3 и 5 рублей.

213. Используя кванторы, запишите высказывание: «Уравнение ах-Ъ имеет решение». Найдите множество истинности этого высказывания.

214. Используя кванторы, запишите высказывание: «Уравнение ах-Ъ имеет положительный корень». Найдите множество истинности этого высказывания.

215. Используя кванторы, запишите высказывание: «Существует целое число, которое делится на любое другое целое число, отличное от нуля». Истинно ли это высказывание?

53. Структура теоремы

В школьном курсе математики устанавливаются различные свойства геометрических фигур. В качестве примера рассмотрим следующее хорошо известное утверждение: диаметр, перпендикулярный хорде, делит эту хорду пополам (рис. 330). Иными словами, если через центр окружности провести прямую, перпендикулярную хорде AB, то проведенная прямая пройдет через середину этой хорды.

Проверить это можно было бы опытным путем: начертить окружность, провести в ней хорду и перпендикулярный ей диаметр, а затем, перегнув чертеж по диаметру, убедиться, что половинки хорды совмещаются. Такую проверку можно было бы повторить несколько раз для различных окружностей и хорд.

Однако сколько бы таких проверок мы ни произвели, это не может нас убедить в справедливости высказанного утверждения. Ведь по смыслу оно имеет общий характер, т. е. утверждается, что для любой хорды перпендикулярный к ней диаметр делит ее пополам. А общее утверждение, относящееся к любой хорде, не может быть доказано несколькими пробами. Для того, чтобы установить истинность некоторого общего утверждения, нужно провести рассуждение, убеждающее нас в его справедливости. Мы уже говорили об этом в п. 21 при рассказе о методе математической индукции. И справедливость сформулированного выше утверждения (о хорде и перпендикулярном ей диаметре) была установлена в курсе геометрии именно с помощью некоторого рассуждения, которое убедило нас в том, что это высказывание справедливо для любой окружности и любой ее хорды.

В математике часто встречаются общие высказывания, справедливость которых устанавливается при помощи рассуждений. Такие высказывания называют теоремами, а рассуждение, которое убеждает в справедливости теоремы, называют доказательством.

Рис.330 Рис.331 Рис.332 Рис.333

Таким образом, высказывание «диаметр, перпендикулярный хорде, делит эту хорду пополам» является теоремой.

Нередко в формулировках теорем встречаются выражения «если ... то», «из ... следует ...», «из ... вытекает ...» и т. д. Например, рассмотренную выше теорему можно сформулировать так: если диаметр перпендикулярен хорде, то он делит эту хорду пополам (или: из перпендикулярности диаметра к хорде вытекает, что он делит ее пополам).

Условимся серединный перпендикуляр к отрезку AB (т. е. ось симметрии точек А и В, рис. 331), обозначать через S(A,B). Рассмотрим в качестве еще одного примера следующую теорему: если расстояние от точки M до точек А а В одинаково, то точка M принадлежит серединному перпендикуляру к отрезку AB (рис. 332). Тогда рассматриваемая теорема кратко формулируется так:

При этом теорема имеет общий характер, т. е. она справедлива для любых точек А, В, М. Иными словами, какие бы три точки А, В, M мы ни взяли, если только AM-ВЫ, то непременно точка M принадлежит прямой S(A,B). Поэтому теорема может быть записана так:

(3)

Здесь знак => используется вместо словесных выражений «если ... то ...», «из ... следует ...» и т. д. Он называется знаком импликации.

Аналогичным образом могут быть записаны и другие теоремы: сначала ставится разъяснительная часть теоремы, т. е. запись вида ( V ААВС), ( V т. А , В, М) и т. п., а затем пишутся два утверждения, соединенные знаком =>. Первое из этих утверждений (стоящее после разъяснительной части и перед знаком =>) называется условием теоремы, второе (стоящее после знака =>) называется заключением теоремы. Например, одно из свойств равнобедренного треугольника может быть записано в виде следующей теоремы (рис. 333): ( V ААВС) (AB = СВ) => (ZA = ZC).

Здесь разъяснительная часть состоит в том, что рассматривается любой треугольник, вершины которого обозначены буквами А, В а С. Запись AB = СВ выражает условие теоремы (в рассматриваемом треугольнике ABC стороны AB и СВ имеют одинаковые длины, т. е.

конгруэнтны). Наконец, запись ZA = ZC выражает заключение теоремы (величины углов А и С равны, т. е. эти углы конгруэнтны).

Нередко эту теорему кратко формулируют так: в равнобедренном треугольнике величины углов при основании равны. Здесь подразумевается (но явно это не высказано), что теорема имеет общий смысл, т. е. в любом треугольнике ABC, если только АВ = СВ, то обязательно и ZA = ZC. Общий характер этой теоремы явно указан в записи (V ААВС).

Выше мы говорили, что импликация выражается словами: «если ... то», «вытекает», «следует» ... Но в каком случае мы можем применять эти слова? В каком случае импликация имеет место? Принято считать, что если A и В — два высказывания, то импликация только в том случае является ложным высказыванием, если А истинно, а В — ложно. Иными словами, из истины не вытекает ложь. Во всех остальных случаях импликация считается истинным высказыванием. Это отмечено в следующей таблице истинности, которую следует рассматривать как определение операции импликации:

Последние две строки этой таблицы означают, что из ложного высказывания вытекает любое высказывание (как истинное, так и ложное). По меткому выражению Ф. Хаусдорфа, автора одной из первых книг по теории множеств и топологии (к тому же великолепно написанной), «если дважды два — пять, то существуют ведьмы».

Возьмем в качестве иллюстрации теорему (3). Пусть А, В, M — три произвольные точки, АфВ. Если окажется, что расстояния AM и ВЫ не одинаковы, то высказывание AM-ВЫ ложно, а из ложного высказывания вытекает что угодно и, в частности, Mg S(A,B). Если же расстояния AM и ВМ одинаковы (рис. 332), то, как показывает несложное рассуждение, включение Mg S(A,B) справедливо. Таким образом, в любом случае импликация, указанная в теореме (3) имеет место. Это и выражено в записи (3) с помощью указания (V т. АфВ, М), т. е. могут быть взяты любые конкретные точки А, В, M (где А и В различны), и тогда импликация (AM = ВМ) => (Mg S(A, В)) представляет собой истинное высказывание.

Часто разъяснительная часть теоремы начинается словом «пусть», а переход к условию теоремы отмечается словом «тогда». Вот как в этом случае формулируются теоремы, рассмотренные выше.

а) Пусть А, В, M — три произвольные точки; тогда если расстояния от точки M до точек A и В одинаковы, то M принадлежит серединному перпендикуляру отрезка АВ.

Рис. 334

б) Пусть ЛВС — произвольный треугольник; тогда если стороны AB и СВ конгруэнтны, то величины углов А и С равны.

Важно заметить, что как условие теоремы, так и ее заключение являются предикатами, а разъяснительная часть постулирует общий характер теоремы. Опять рассмотрим в качестве примера теорему (3). Здесь АМ = ВМ (условие теоремы) есть предикат от трех переменных А, В, М. При подстановке вместо А, В, M конкретных точек он превратится в некоторое высказывание — истинное или ложное (в зависимости от того, какие точки взяты). Заключение теоремы Me S(A,B) также представляет собой предикат от трех переменных А, В, М. Знак импликации, соединяющий эти предикаты, и квантор общности (V т. АфВ, М), стоящий слева, дают высказывание (а не предикат), т. е. дают полную формулировку этой теоремы.

Кроме теорем, записываемых в форме импликации (как, например, (3)) в математике рассматриваются также теоремы существования, формулируемые символически с помощью квантора 3. Приведем несколько типично «школьных» примеров теорем существования.

Запись

(4)

выражает теорему о существовании описанной окружности для любого треугольника (рис. 334). Знак 3! (квантор существования с восклицательным знаком) означает: «существует и притом только один». Таким образом, словесно теорема формулируется следующим образом: для любого треугольника существует, и притом только одна, окружность, проходящая через все три его вершины. Запись

(5)

утверждает, что для любых чисел а и Ъ, первое из которых отлично от нуля, существует и притом только одно число х, являющееся решением уравнения ах - Ь. Для полноты можно было бы указать, что рассматриваются действительные числа, т. е. записать теорему более подробно:

В качестве еще одного примера укажем основную теорему алгебры. В ней идет речь о многочленах, коэффициентами которых могут быть произвольные комплексные числа (множество комплексных чисел, обозначаемое обычно буквой С, является расширением множества действительных чисел). Теорема (установленная Гауссом) утверждает, что каждый многочлен произвольной степени п > 1 (с действительными или комплексными коэффициентами) имеет хотя бы один корень

Рис. 335 Рис. 336 Рис. 337

— действительный или комплексный. Вот символическая запись этой теоремы:

(6)

Основная теорема алгебры представляет собой типичную теорему существования, т. е. в ней лишь утверждается наличие хотя бы одного корня, но ничего не говорится о том, как его можно найти. В этом она существенно отличается от теорем (4) и (5). Например, для теоремы (4) имеется четко описанный прием, позволяющий найти эту описанную окружность (надо провести к сторонам перпендикуляры через их середины, и тогда точка пересечения этих перпендикуляров как раз будет центром описанной окружности (рис. 335)). Для теоремы (6) такого общего приема нет: основная теорема алгебры только утверждает существование корня.

Несмотря на то, что теоремы существования, как правило, лишь утверждают факт существования какого-либо математического объекта без указания способа нахождения этого объекта (как это было, например, в случае теоремы (6)), они играют очень важную роль в современной математике. Приведем простой пример.

Известная теорема Больцано (теорема о промежуточном значении) записывается следующим образом:

Эта теорема имеет форму импликации, но в заключении теоремы использован квантор существования. Разъяснительная часть теоремы говорит о том, что рассматривается произвольная функция, непрерывная на отрезке [а\ Ь]. Теорема утверждает, что если в точках a и b функция принимает значения разных знаков (в точке а отрицательное, а в точке b положительное), то существует на отрезке [а\ Ь] хотя бы один корень уравнения f(x) = О, т. е. график этой функции хотя бы в одной точке пересекает ось абсцисс (рис. 336, 337). Например, всякий многочлен третьей степени f{x) = л° + ах2 + Ьх + с (или, вообще, нечетной степени) имеет хотя бы один действительный корень, поскольку для больших по величине отрицательных х значения много-

Рис. 338 Рис. 339 Рис. 340

члена fx) отрицательны, а для больших положительных х они положительны (рис. 338, 339).

Чтобы пояснить, как работает эта теорема, рассмотрим уравнение

(7)

Многочлен f(x), стоящий в левой части этого уравнения, принимает при X = 1 отрицательное значение: /(1) = -3. А при х = 2 он принимает положительное значение: f{2) = 5. Значит, на отрезке [1; 2] имеется корень уравнения. Разобьем отрезок [1; 2] на десять равных частей точками 1,1; 1,2; 1,3; ... . Вычисляя значения fx) в этих точках (это легко сделать с помощью калькулятора), мы найдем, что /(1,5) = -0,375 < 0, а /(1,6) = 0,456 > 0. Значит, искомый корень расположен на отрезке [1,5; 1,6]. Разобьем и этот отрезок на 10 равных частей точками 1,51; 1,52; ... . Теперь находим /(1,54) < 0,/( 1,55) > 0. Таким образом, искомый корень примерно равен х= 1,54.

Можем ли мы быть уверенными, что таким путем мы вычисляем именно корень взятого уравнения, а не что-то иное? Такую уверенность дает нам теорема Больцано. Всякий многочлен есть непрерывная функция, а потому имеется корень на отрезке [1; 2], на отрезке [1,5; 1,6], на отрезке [1,54; 1,55], ... Таким образом, сам факт существования корня делает наши действия осмысленными.

А теперь рассмотрим уравнение

Обозначая функцию, стоящую в левой части, через g(x), находим g(l) = -l < 0, g(2) = 3>0, т. е. в концах отрезка [1; 2] функция принимает значения разных знаков. Исследуя значения функции в точках 1,1; 1,2; находим: g( 1,7) = -24,5... < 0, g( 1,8) = 11,6... > 0. Далее получаем g(l,73) = -384,507... < 0, g( 1,74) = 99,275... > 0. Вроде, как в предыдущем случае, мы бы должны все более точно вычислять корень рассматриваемого уравнения (равный примерно 1,73...), однако подозрительно, что значения функции все более удаляются от нуля!

Дело в том, что рассматриваемая функция g(x) не является непрерывной на отрезке [1; 2]; это видно из поведения ее графика (рис. 340). Поэтому у нас нет оснований делать вывод о существовании корня,

в отличие от предыдущего случая, когда мы рассматривали уравнение (7).

В данном случае все ясно: знаменатель функции g(x) принимает нулевое значение при х = л/3~~ 1,73, а потому функция, хотя и меняет знак при переходе через х = л/3~, но «обращается в бесконечность» при этом значении (рис. 340). Однако и в более сложных случаях факт существования корня (или какого-либо другого математического объекта) является важным фактором при решении различных задач во многих вопросах математики и ее приложений.

Задачи и упражнения

216. Запишите с помощью кванторов следующую теорему: «Сумма любых трех последовательных целых чисел делится на 3».

217. Запишите с помощью кванторов следующую теорему: «Для любого треугольника существует единственная вписанная окружность».

218. Запишите утверждение: «В течение любого часа существует момент, во время которого минутная и часовая стрелка совпадают». Истинно ли это утверждение?

219. Запишите утверждение: «Среди любых трех целых чисел найдутся два, сумма которых четна». Истинно ли это утверждение?

220. Используя теорему Больцано, докажите, что при любых значениях ö, b и с многочлен х3 + ах2 + Ьх + с имеет действительный корень.

54. Отрицание

Из всякого высказывания можно получить новое высказывание, отрицая его, т. е. утверждая, что исходное высказывание не имеет места, не выполняется. Для записи отрицания используется знак -> (его называют знаком отрицания или, короче, знаком «не»).

Обозначим через А высказывание 5-7 = 35. Его отрицание можно записать так: 5-7 ф 35. В данном случае высказывание А истинно, а ~^А ложно.

Возьмем теперь следующее высказывание В\ «в нашем классе более 100 учеников». Его отрицание можно прочитать словами так: «в нашем классе не более 100 учеников». Обычно высказывание В ложно, а его отрицание ~^В истинно.

В качестве геометрического примера рассмотрим следующее высказывание: «в прямоугольном треугольнике с катетами, имеющими длины 4 и 5, длина гипотенузы равна 9». Его отрицание утверждает, что в прямоугольном треугольнике с катетами, имеющими длины 4 и 5, длина гипотенузы не равна 9. Здесь первоначальное высказывание ложно, а его отрицание истинно.

Из двух высказываний, одно из которых является отрицанием другого, одно истинно, а другое ложно.

Это положение математической логики называют законом исключенного третьего. Иными словами, либо А, либо не А \ третьего быть не может.

Операцию отрицания можно применять не только к высказываниям, но и к предикатам. Обозначим, например, через А(Т) еле-

дующий предикат, заданный на множестве всех треугольников: «треугольник Т— равносторонний». Отрицание ^А(Т) тоже представляет собой предикат: «треугольник Т не является равносторонним».

Дважды отрицая какое-либо высказывание А (или, как говорят, взяв его двойное отрицание), мы получаем высказывание -> ~^А, которое означает то же самое, что и первоначальное высказывание А.

Например, отрицанием высказывания 5-7 = 35 служит высказывание 5-7 ф 35. Взяв еще раз отрицание, получаем высказывание -I (5-7 ф 35). Оно означает, «неверно, что 5-7 ф 35», т. е., иными словами, оно утверждает, что 5-7 = 35. Таким образом, двойное отрицание -I -I (5-7 = 35) означает то же самое, что и первоначальное высказывание 5-7 = 35.

Заметим, что существует в математической логике школа интуиционистов, которые не признают абсолютной истинности закона исключенного третьего, т. е. считают неправомочной (во всяком случае, не очевидной) возможность отождествлять двойное отрицание -> ~^А с исходным высказыванием А. Из представителей отечественной науки к школе интуиционизма примыкал известный математик А. А. Марков.

Таким образом, интуиционистская логика отлична от излагаемой здесь (и принимаемой подавляющим большинством математиков) формальной логики, которая принимает закон исключенного третьего одной из логических аксиом. В дальнейшем мы будем оставаться в рамках формальной логики и, без всякого сомнения, будем отождествлять высказывания -> ~^А и А.

Сказанное означает, что операция отрицания определяется следующей таблицей истинности:

Из этой таблицы нетрудно заключить, что ~> ~^А совпадает с А, т. е. эта таблица относится всецело к формальной логике.

В том случае, если высказывание выражено простым предложением с одним сказуемым, для образования его отрицания достаточно добавить «не» к сказуемому (а если частица «не» уже стояла перед сказуемым, то для образования отрицания достаточно опустить эту частицу). Например:

А = {Париж находится в Италии};

~^А = {Париж не находится в Италии}.

Другой пример получим, рассматривая рис. 341, на котором точка С — середина стороны BD треугольника ABD:

Рис. 341

В = {площади треугольников ЛВС и ADC на рис. 341 равны} ;

= {площади треугольников ЛВС и ADC на рис. 341 не равны}.

Однако такой простой способ образования отрицаний применим только в том случае, если в высказывании нет знаков V, 3 (или равнозначных им слов). Чтобы пояснить сложность образования отрицаний для высказываний, содержащих кванторы, обратимся к следующему древнему софизму. В нем говорится о лжецах (всегда говорящих неправду), остальные же люди (не лжецы) всегда говорят правду. Вот этот софизм.

Один критянин (т. е. житель острова Крит) утверждал, что все критяне лжецы. Но он сам критянин и потому лжец. Значит, он сказал неправду, т. е. все критяне вовсе не лжецы, а правдивые люди. Но тогда он (как критянин) тоже правдивый человек. Значит, он все же сказал правду, и потому все критяне лжецы. Но это значит, что и он лжец, т. е. он сказал неправду, а потому критяне правдивы...

Как же выйти из этого порочного круга, т. е. как раскрыть этот софизм? На этот вопрос мы ответим чуть позже, когда детально рассмотрим взаимодействие отрицания с кванторами.

Рассмотрим, например, высказывание

Р = {в любом треугольнике ABC величины углов А а В равны}. Если просто добавить «не» к сказуемому, то получится высказывание

Q = {в любом треугольнике ABC величины углов А и В не равны}.

Легко видеть, что высказывание Q не является отрицанием высказывания Р (ведь оба высказывания Р и Q — ложные, а из двух высказываний Р и ~^Р одно должно быть истинным).

Как же составить отрицание высказывания Р? Запишем это высказывание знаками:

Отрицание его получается, если поставить знак -> перед всем высказыванием:

(8)

Словами высказывание ~> Р можно прочитать так: «не для любого треугольника ABC величины углов A и В равны». Это означает, что найдется (существует) ААВС, в котором не имеет места соотношение ZA=ZB:

(9)

Итак, чтобы образовать отрицание высказывания, начинающегося квантором V, можно либо поставить знак -> перед высказыванием (см (8)), либо же заменить квантор V на 3 и при этом поставить знак -> перед остальной частью высказывания (см. (9)).

Аналогично можно получить отрицание высказывания, начинающегося знаком 3. Рассмотрим в качестве примера следующее высказывание:

(10)

т. е. существует действительное число х, квадрат которого отрицателен. Его отрицание можно получить, поставив знак -> перед всем высказыванием:

(11l)

Это читается так: «не существует действительного числа х, для которого X2 отрицательно». Это означает, что, какое бы число х мы ни взяли, его квадрат не будет отрицательным числом:

(12)

Итак, чтобы образовать отрицание высказывания, начинающегося знаком 3, можно либо поставить знак -> перед всем высказыванием (см. (11)), либо же заменить знак 3 на V и при этом поставить знак -> перед остальной частью высказывания (см. (12)).

Если мы условимся знаки V и 3 называть противоположными, то правило составления отрицания можно сформулировать так:

Чтобы образовать отрицание высказывания, начинающегося одним из знаков V или 3, можно либо поставить знак -i перед всем высказыванием, либо 1) заменить начальный знак (V или 3) на противоположный и 2) поставить знак -> перед остальной частью высказывания.

Теперь мы можем вернуться к рассмотренному выше софизму. Обозначим через К множество всех критян, а через А(х) обозначим предикат «х — лжец». Тогда высказанное критянином утверждение можно записать так:

(13)

Первый вывод, указанный в софизме, совершенно правилен: если все критяне лжецы, то он сам лжец, т. е. он сказал неправду. Значит, написанное высказывание ложно, т. е. истинным является его отрицание: ->(Vxe К) А(х). Иначе говоря, не все критяне лжецы, т. е. существует (хотя бы один) критянин, не являющийся лжецом:

Итак, существует критянин, являющийся правдивым человеком. Но это вовсе не означает, что все критяне правдивы. Поэтому ниот-

куда не следует, что тот критянин, который высказал утверждение (13), правдив. Иначе говоря, мы не вправе заключить, что он сказал правду. На этом и обрывается приведенное в софизме рассуждение, т. е. никакого замкнутого круга не получается.

В заключение рассмотрим роль контрпримеров при решении вопроса о том, верно ли некоторое утверждение, содержащее кванторы V, 3.

Пусть В(х) — некоторый предикат, заданный на множестве М. Поставим вопрос: истинно ли высказывание (V х е M) В(х)1 Если множество M конечно, можно попытаться перебрать все его элементы и убедиться, что для любого элемента те M высказывание В(т) истинно. Если же множество M бесконечно (или конечно, но содержит очень много элементов), то такой перебор неосуществим, и потому в справедливости высказывания (Ухе М) В(х) можно убедиться только общим рассуждением.

Если разные попытки доказать справедливость высказывания (Ухе М) В(х) не приводят к успеху, то возникает предположение, что, быть может, это высказывание неверно, т. е. истинным является его отрицание -> (Ухе М)В(х). А как можно убедиться в правильности этого предположения? Для этого заметим, что высказывание -I (Ухе М) В(х) означает то же самое, что и (Big M) -> В(х). А вот для подтверждения этого утверждения достаточно указать один элемент m е М, для которого высказывание В(т) ложно, т. е., чтобы убедиться в ошибочности общего высказывания (Ухе М) В(х), достаточно привести один контрпример.

Рассмотрим еще один пример. Хорошо известна школьная теорема о том, что диагонали ромба перпендикулярны. Справедлива ли обратная теорема: «если диагонали четырехугольника F перпендикулярны, то он является ромбом»? Это высказывание можно записать в виде

(14)

где A(F) и B(F) — следующие предикаты:

A(F) = {диагонали четырехугольника F перпендикулярны}; B(F)= {четырехугольник F— ромб}.

Чтобы убедиться в ложности высказывания (14), нужно доказать, что истинно его отрицание -> ( V F) (A(F) => B(F)), т. е. что не для каждого четырехугольника F из справедливости A(F) вытекает справедливость B(F). Иначе говоря, нужно убедиться, что существует четырехугольник, у которою диагонали перпендикулярны, но который вместе с тем ромбом не является, т. е. для которого A(F) истинно и одновременно B(F) ложно. Таким образом, высказывания -I ( V F) (A(F) => B(F)) и (3 F) (A(F) и -> B(F)) означают одно и то же (или, как еще говорят, равносильны).

Чтобы убедиться в ложности высказывания

(15)

достаточно проверить истинность высказывания

Иными словами, чтобы убедиться в ложности высказывания вида (15), достаточно, как и всегда, привести один контрпример, причем в этом случае контрпримером будет элемент F, для которого одновременно истинны высказывания A(F) и ~> B(F). В случае рассмотренного выше предложения (14) контрпримером должен быть четырехугольник F, для которого A(F) истинно (диагонали перпендикулярны), a B(F) ложно (F не является ромбом). Такой контрпример есть, он приведен на рис. 342. Этот контрпример показывает, что теорема «если диагонали четырехугольника перпендикулярны, то он является ромбом» неверна.

Задачи и упражнения

221. Постройте отрицание высказывания: «Нет ничего лучше плохой погоды» (название одного из болгарских кинофильмов).

222. Постройте отрицание высказывания: «Каждому овощу свое время».

223. Постройте отрицание высказывания: «Среди ста двузначных натуральных чисел найдутся два равных». Какое из этих двух высказываний истинно?

224. Запишите теорему, обратную теореме Пифагора.

225. Запишите теорему, обратную теореме Больцано.

55. Необходимое и достаточное условие

В предыдущем пункте мы рассмотрели пример обратной теоремы. Вообще для каждой теоремы, записанной в форме импликации

(16)

можно составить обратную ей теорему, меняя местами условие и заключение (при сохранении той же разъяснительной части):

В качестве еще одного примера возьмем следующую теорему о натуральных числах:

(V ne N) (п делится на 6) => (последняя цифра числа п — четная). Эта теорема справедлива, но обратная ей теорема (V ne N) (последняя цифра числа п четная) => (п делится на 6) неверна.

Рис. 342

Рис. 343 Рис. 344

Таким образом, доказав некоторую теорему, мы еще не можем утверждать, что справедлива обратная теорема. Справедливость обратной теоремы требует отдельного доказательства.

Рассмотрим теперь теоремы, для которых обратные теоремы также справедливы. Вот пример:

(V ne N) (п делится на 9) => (сумма цифр числа п делится на 9).

Обратной является теорема

(V ne N) (сумма цифр числа п делится на 9) =^> (п делится на 9).

В этом случае и исходная теорема, и обратная ей — обе справедливы. Приведем геометрический пример. Следующая теорема выражает одно из свойств равнобедренного треугольника (рис. 343):

(17)

Обратная ей теорема также справедлива:

(18)

т. е. если в треугольнике величины углов при основании равны, то этот треугольник — равнобедренный.

В математике принято формулировать теоремы, имеющие форму импликации, с помощью слов необходимо, достаточно. Рассмотрим, например, снова теорему о перпендикулярности диагоналей ромба (рис. 344):

(19)

Эту теорему можно разъяснить так: достаточно знать, что четырехугольник ABCD является ромбом, и тогда мы можем утверждать, что его диагонали перпендикулярны. Или иначе: для перпендикулярности диагоналей четырехугольника достаточно, чтобы он был ромбом.

Вообще, если сказано, что выполнение некоторого утверждения Р является достаточным для Q, то это означает, что утверждается справедливость теоремы, в которой Р — условие, a ß — заключение (см. (16)).

Теорему (19) можно разъяснить еще и так: если ABCD — ромб, то непременно его диагонали перпендикулярны. В математике

принято эту формулировку выражать по-другому, используя слово «необходимо»: для того чтобы четырехугольник был ромбом, необходимо, чтобы его диагонали были перпендикулярны.

Вообще, если сказать, что выполнение некоторого утверждения Q является необходимым для Р, то это означает, что утверждается справедливость теоремы, в которой Р — условие, a Q — заключение (см. (16)).

Если для некоторой теоремы справедлива также и обратная ей теорема, то ее формулировку можно выразить по-другому, используя слова необходимо и достаточно. Например, теорема (17) и обратная ей теорема (18) обе справедливы. Иными словами, для того чтобы треугольник был равнобедренным, необходимо, чтобы у него величины углов при основании были равны (см. (17)); в то же время для того, чтобы треугольник был равнобедренным, достаточно, чтобы у него величины углов при основании были равны (см. (18)). Это кратко записывается в виде

и читается словами так: для того, чтобы треугольник был равнобедренным, необходимо и достаточно, чтобы у него величины углов при основании были равны.

А рассмотренный выше признак делимости на 9 можно выразить так: для того, чтобы натуральное число делилось на 9, необходимо и достаточно, чтобы сумма его цифр делилась на 9:

( V ne N) (п делится на 9) <=> (сумма цифр числа п делится на 9). (20)

Заметим еще, что слова «необходимое условие» часто заменяются словами: «только в том случае», «только тогда». Например, теорему (19) можно сформулировать еще и так:

четырехугольник только в том случае может быть ромбом, если его диагонали перпендикулярны.

Слова «необходимо и достаточно» нередко заменяются словами «тогда и только тогда, когда» или «в том и только в том случае, если». Например, четырехугольник в том и только в том случае является параллелограммом, если его диагонали, пересекаясь, делятся пополам.

Вместо того, чтобы сказать «достаточное условие», «необходимое условие», иногда говорят «достаточный признак», «необходимый признак». Иногда даже говорят просто признак, считая ясным, о каком из признаков (достаточном или необходимом) идет речь. Например, теорема (20) называется признаком делимости на 9; этот признак является необходимым и достаточным для делимости числа на 9.

В школьном обиходе термин «признак» также используется. Например, мы говорим о признаке параллельности двух прямых. Под этим понимается следующая теорема: две прямые в том и только в том случае параллельны, если при пересечении с третьей прямой

Рис. 345 Рис. 346 Рис. 347

(«секущей») они образуют конгруэнтные накрест лежащие углы (рис. 345). Таким образом, признак параллельности прямых является необходимым и достаточным условием.

В заключение рассмотрим метод доказательства от противного и связанное с ним понятие противоположной теоремы.

Рассмотрим в качестве примера следующую теорему: выпуклый многоугольник не может иметь более трех острых углов.

Для доказательства предположим, что это утверждение неверно, т. е., что верно его отрицание: существует выпуклый многоугольник М, имеющий не менее четырех острых углов.

Рассмотрим внешние углы выпуклого многоугольника М. Так как угол, смежный с острым, является тупым (рис. 346), то у многоугольника M не менее четырех тупых внешних углов. Значит, сумма величин всех внешних углов выпуклого многоугольника M больше 360°. Но это противоречит теореме о том, что сумма внешних углов выпуклого многоугольника всегда равна 360°. Полученное противоречие доказывает теорему.

Приведенное рассуждение было проведено методом доказательства от противного: мы предположили, что доказываемое утверждение неверно (т. е. верно его отрицание), и показали, что это приводит к противоречию. Тем самым была установлена ложность отрицания и, следовательно, истинность доказываемого утверждения.

Обратимся теперь к понятию противоположной теоремы. Из каждой теоремы, имеющей форму импликации

(21а)

(см. (16)), можно получить еще три теоремы, показанные на следующей схеме:

(21b) (21с) (21d)

По отношению к исходной теореме (21а) теорема (21b) является обратной. Теорема (21с) получается из исходной теоремы (21а) заменой условия и заключения их отрицаниями, она называется противоположной исходной теореме (21а). Теорема (21d) — противоположная обратной.

Проиллюстрируем схему (21) на примере теоремы о перпендикулярности диагоналей ромба. Для этого обозначим через M множество всех четырехугольников и рассмотрим следующие предикаты:

Р(х) = {х — ромб};

Q(x) = {диагонали четырехугольника х перпендикулярны}.

Тогда четыре теоремы, показанные на схеме (21) означают следующие утверждения:

(21а): если четырехугольник является ромбом, то его диагонали перпендикулярны;

(21b): если диагонали четырехугольника перпендикулярны, то он является ромбом;

(21с): если четырехугольник не является ромбом, то его диагонали не перпендикулярны;

(21d): если диагонали четырехугольника не перпендикулярны, то он не является ромбом.

Обратная (21Ь) и противоположная (21с) теоремы здесь неверны, это показывает контрпример, приведенный на рис. 342.

Теорема (21d), противоположная обратной, так же как и исходная теорема (21а), обе справедливы.

Вообще, теорема, противоположная обратной, равносильна исходной теореме, т. е. если истинна одна теорема, то истинна и другая. Поэтому, если доказательство исходной теоремы вызывает трудности, можно вместо нее доказать теорему, противоположную обратной. В этом и заключается метод доказательства от противного.

Итак, подведем итоги. По отношению к теореме (21а) теорема (21b) является обратной, теорема (21с) — противоположной, теорема (21d) — противоположной обратной. Как мы уже знаем, теоремы (21а) и (21d) равносильны.

Если же за исходную мы примем теорему (21Ь), то теорема (21а) будет обратной. Поэтому теоремы (21b) и (21с) также равносильны (рис. 347).

Для того, чтобы установить, что А(х) является необходимым и достаточным условием для В(х), нужно доказать, во-первых, одну из теорем (21а) или (21d) и, во-вторых, одну из теорем (21b) или (21с).

Заметим еще, что при формулировке обратной теоремы (а также теорем, противоположных к исходной и обратной) весьма существенную роль играет разъяснительная часть теоремы. Рассмотрим в качестве примера все ту же теорему о перпендикулярности диагоналей ромба. Обозначим через M множество всех четырехугольников, а через П— множество всех параллелограммов, и рассмотрим следующие две теоремы:

(22) (23)

Казалось бы, они различаются лишь по форме, но по существу выражают одно и то же: если четырехугольник (или параллелограмм)

является ромбом, то его диагонали перпендикулярны. Кратко эту теорему выражают так (пренебрегая разъяснительной частью): диагонали ромба перпендикулярны.

Однако при формулировании обратной и противоположной теорем именно форма записи оказывается весьма существенной. По отношению к (22) обратной является теорема ( V х е M) (Q(x) => Р(х)), т. е. если диагонали четырехугольника перпендикулярны, то он является ромбом. Эта теорема неверна (рис. 342). По отношению к (23) обратной является теорема ( V х g П) (Q(x) => Р(х)), т. е. если диагонали параллелограмма перпендикулярны, то он является ромбом. Эта теорема верна, в отличие от предыдущей!

Иначе говоря, теорема (23) содержит фактически необходимое и достаточное условие: (Ухе П) (Q(x) <=> Р(х)), т. е. параллелограмм в том и только в том случае является ромбом, если его диагонали перпендикулярны.

Задачи и упражнения

226. Является ли теорема, обратная теореме Пифагора, необходимым и достаточным условием прямоугольности треугольника?

227. Для теоремы: «Диагонали ромба перпендикулярны» составьте обратную, противоположную и обратную к противоположной теоремы. Какие из них истинны?

228. Для теоремы: «Диагонали прямоугольника равны» составьте обратную, противоположную и обратную к противоположной теоремы. Какие из них истинны?

229. Утверждение: «Если целое число оканчивается на 0, то оно делится на 5». Является оно необходимым, достаточным или необходимым и достаточным для делимости числа на 5? Составьте к этому утверждению обратное, противоположное и обратное к противоположному. Какие из них истинны?

230. Верно ли утверждение: «Два треугольника конгруэнтны тогда и только тогда, когда две стороны и заключенный между ними угол одного конгруэнтны двум сторонам и соответствующему углу другого»?

56. Конъюнкция и дизъюнкция

Нередко приходится рассматривать случаи, когда одновременно выполняются два каких-либо свойства. Возьмем, например, высказывание: существуют равнобедренные прямоугольные треугольники (рис. 348). Это высказывание означает, что существует ААВС, который одновременно обладает двумя свойствами: угол С прямой и АС = ВС.

В математике одновременное выполнение двух свойств принято называть конъюнкцией этих свойств и обозначать знаком л (читается «и»). Таким образом, сформулированное выше высказывание можно записать так: (3 ААВС) ((ZC = 90°) л (АС = ВС)).

Еще одним примером использования конъюнкции служит определение пересечения множеств. В самом деле, элемент принадлежит пересечению множеств M и Р, если он, во-первых, принадлежит множеству M и, во-вторых, принадлежит множеству Р:

(24)

Здесь фигурные скобки означают слово «множество», а двоеточие можно заменить словосочетанием «для которых» (т. е. двоеточие поясняет, какие X следует взять). Словами запись (24) можно прочитать так: пересечение МГ\Р есть множество тех элементов х, которые принадлежат множеству M и множеству Р (рис. 349). Союз «и» в записи (24) выражен знаком конъюнкции л.

Из сказанного ясно, что операция конъюнкции определяется таблицей истинности

т. е. высказывание А л В истинно только в том случае, если истинны оба высказывания А, В.

Кроме знака конъюнкции л в математике часто используется знак дизъюнкции V (читается «или»). Знак v не совсем точно передается союзом «или», которым мы пользуемся в обычной речи. Возьмем, например, фразу «Я уезжаю, но за книгой зайдет моя сестра или брат». Здесь, скорее всего, союз «или» понимается в смысле «либо-либо», т. е. зайдет либо сестра, либо брат; возможность, что они зайдут вместе, не предусматривается. Иначе говоря, в обычной речи союз «или» чаще всего имеет разделительный оттенок. В математике знак дизъюнкции v не имеет разделительного смысла, т. е. если два свойства соединены знаком v, то это значит, что выполняется хотя бы одно из этих свойств, т. е. либо имеет место первое свойство (но не второе), либо имеет место второе свойство (но не первое), либо же (и в этом отличие) имеют место оба свойства одновременно.

Рассмотрим в качестве примера объединение множеств M и Р. Имеет место один из трех случаев (см. рис. 350):

1) либо X g M, но X <£ Р (точка jCj);

2) либо X g Р, но X <£ M (точка х2);

3) либо X g M и X g Р (точка х,).

Рис. 348 Рис. 349 Рис. 350

Запись (х g M) v (х g /*) как раз и означает, что имеет место какой-либо из этих трех случаев.

Из сказанного ясно, что операция дизъюнкции определяется таблицей истинности

т. е. высказывание Aw В ложно только в случае, если ложны оба высказывания А, В. Поэтому M U Р = {х\ (х g M) v(ig Р)}.

Нередко конъюнкция и дизъюнкция применяются при формулировке теорем. Вспомним, например, теорему о том, что катет, лежащий против угла 30°, равен половине гипотенузы (рис. 351). Более детально, если треугольник является прямоугольным и один из его углов содержит 30°, то длина катета, лежащего против этого угла, равна половине длины гипотенузы:

Здесь в формулировке теоремы использована конъюнкция. Вот еще пример: если произведение двух чисел равно нулю, то хотя бы один из сомножителей равен нулю, т. е.

Здесь в заключении теоремы используется дизъюнкция. В тех случаях, когда нужно образовать отрицание утверждения, содержащего конъюнкцию или дизъюнкцию, можно воспользоваться следующими эквивалентностями:

(25) (26)

которые справедливы для любых высказываний (или предикатов) Р, Q. Соотношение (25) можно пояснить следующим образом: если неверно, что справедливы оба утверждения Р и то это означает, что неверно Р или неверно Q.

Например, четырехугольник ABCD называется параллелограммом, если каждые две его противоположные стороны параллельны (рис. 352), т. е. (АВ \\ CD) л (AD \\ ВС). Если же ABCD не является параллелограммом, т. е. -> ((АВ || CD) л (AD || ВС)), то это означает, согласно (25), что (-> (АВ || CD)) v (-> (AD \\ ВС)), т. е. хотя бы одно из условий АВ У CD, AD \\ ВС не выполняется. Иными словами, если ABCD — не параллелограмм, то либо не выполняется условие АВ У CD (рис. 353), либо не выполняется условие AD \\ ВС (рис. 354), либо же оба эти условия не выполнены (рис. 355).

Рис. 351 Рис. 352 Рис. 353

Рис. 354 Рис. 355

Рассмотрим еще один иллюстрирующий пример. Будем считать, что вылет самолета состоится в том и только в том случае, если, во-первых, есть горючее и, во-вторых, погода летная. Иначе говоря, необходимое и достаточное условие вылета имеет вид

(есть горючее) л (погода летная).

Вылет не состоится, если это условие не выполнено, т. е.

-1 ((есть горючее) л (погода летная)).

Но, согласно (25), это эквивалентно тому, что

(-> (есть горючее)) v (-> (погода летная)).

Иными словами, вылет не состоится, если нет горючего или погода нелетная.

Разумеется, рассмотрение примеров, подтверждающих разумность соотношений (25), (26), не является их доказательством. Установить правильность этих соотношений нетрудно с помощью таблиц истинности. Следующая таблица показывает истинность высказываний -I (Р л Q) и (-1 Р) v (-1 Q) в зависимости от истинности высказываний Р, Q:

Мы видим, что соответствующие столбцы в этих таблицах истинности одинаковы, и это показывает, что оба высказывания -> (Р aQ) и (-1 Р) v (-1 Q) эквивалентны, т. е. означают одно и то же. Тем самым

справедливость соотношения (25) подтверждена. Аналогично проверяется справедливость соотношения (26).

Выше мы рассматривали в качестве примера определение параллелограмма. Знаками его можно записать следующим образом:

Здесь запись (V ABCD) (похожая на разъяснительную часть теоремы) показывает, что рассматривается произвольный четырехугольник ABCD. В связи с этим говорят, что «четырехугольник» является родовым понятием (при определении параллелограмма), т. е. рассматривается множество всех четырехугольников и среди них будут выделяться те, которые образуют новое понятие (параллелограмм). Далее, запись (ABCD — параллелограмм) представляет собой введение нового термина, т. е. мы указываем, как будут называться те четырехугольники, которые мы выделяем. Запись = означает, что мы имеем дело с определением нового понятия (от английского слова definition). Наконец, запись ((AB \\ CD) л (AD \\ ВС)) указывает видовые отличия, т. е. те отличительные свойства, которыми должен обладать четырехугольник, чтобы мы считали его параллелограммом.

Словесное определение содержит фактически все эти же части, но не выделенные явно:

Для сравнения приведем определение трапеции: оно отличается от определения параллелограмма тем, что при формулировке видовых отличий конъюнкция заменяется дизъюнкцией:

(27)

Иными словами, четырехугольник является трапецией, если хотя бы одна пара его противоположных сторон является двумя параллельными отрезками. Заметим, что если обе пары противоположных сторон параллельны, то четырехугольник также является трапецией (в силу определения дизъюнкции), т. е. параллелограмм — частный случай трапеции. Отметим еще, что многие авторы заменяют это «дизъюнктивное» определение другим: четырехугольник называется трапецией, если одна пара его противоположных сторон — параллельные отрезки, а другая — нет. Но мы придерживаемся определения (27).

Как мы видим, структура определения очень похожа на структуру теоремы, но части, имеющиеся в записи определения, соединены дру-

гим символом (и называются по-другому). При этом теорему надлежит доказывать, тогда как определение в этом не нуждается.

Заметим еще, что при записи определений рекомендуется использовать «ближайшее» родовое понятие. Например, определение прямоугольника можно записать в следующих двух формах:

Первое из этих определений говорит, что произвольный четырехугольник называется прямоугольником, если у него есть три прямых угла (четвертый угол тогда тоже прямой, так как сумма углов четырехугольника равна 360°). Второе определение выделяет прямоугольники из параллелограммов, а не из всех четырехугольников: параллелограмм называется прямоугольником, если у него есть один прямой угол (тогда и все углы прямые — в силу свойств параллелограммов). Второе определение использует более близкое к прямоугольнику родовое понятие «параллелограмм», чем первое определение.

Рассмотрим следующий пример. Учащемуся предъявляются несколько различных фигур: круг, шестиугольник, треугольник, многоугольники, указанные на рис. 352 - 355. Затем предлагается вопрос: какие из этих фигур являются трапециями? Тот, кто уже овладел понятием трапеции, считает, что он «сразу» видит, какие из представленных ему фигур являются трапециями. Однако в действительности в его сознании идет работа, нередко скрытая от него самого (психологи называют такую работу «свернутой», или «автоматизированной»). Если осуществить рефлексию, т. е. «развернуть» эту деятельность с помощью психологического самоанализа, то эта деятельность в ее полном виде будет выглядеть следующим образом. Вначале проверяется принадлежность к родовому понятию, т. е. отбрасывается круг (это — не многоугольник), а также шестиугольник и треугольник (это — не четырехугольники). Остаются фигуры, изображенные на рис. 352 - 355. Теперь надо проверить наличие видовых отличий. У фигуры на рис. 355 ни одна пара противоположных сторон не обладает свойством параллельности, значит, это — не трапеция. Остаются фигуры на рис. 352 - 354. Они обладают видовыми отличиями, т. е. являются трапециями.

Некоторое затруднение может вызвать рис. 352, на котором не одна, а обе пары противоположных сторон являются параллельными. Осознание того, что параллелограмм — частный случай трапеции, весьма важно и связано с пониманием смысла дизъюнкции.

Описанная деятельность вполне соответствует установлению принадлежности к понятию «трапеция» с помощью определения (27), адекватна этому определению. Аналогичная деятельность адекватна не только определению трапеции, но и многим другим математичес-

ким определениям, а именно тем, в которых видовое отличие содержит два условия, соединенные дизъюнкцией.

Организация адекватной деятельности предусматривает исследование многих, разнообразных объектов, для которых выполняется или не выполняется принадлежность к родовому понятию, выполняются или не выполняются отдельные видовые отличия (дизъюнктивно или конъюнктивно связанные) и т. д. Выполняя такую деятельность, учащийся охватит все части определения, т. е. усвоит изучаемое понятие. Именно после полного усвоения у него будет создано впечатление, что он «сразу» видит, принадлежит или не принадлежит предъявляемый объект к изучаемому понятию, хотя в действительности он проверяет все факторы, имеющиеся в определении, но делает это свернуто, незаметно для него самого.

Задачи и упражнения

231. Что можно сказать об истинности высказывания ^(AaBaC)vA, если А — истинно, а В и С — ложны?

232. Пусть А — ложное высказывание, а В и С — истинные. Будет ли истинным высказывание (А л В) v (В л С) v (С л А)! (В л A) v (С л А)?

233. В каких случаях высказывания А л (В v С) и (А л С) v (А л В) одновременно истинны или ложны?

234. Пусть А — высказывание: «число делится на 3», В — «число делится на 2», С— «число делится на 6». Какие из следующих высказываний истинны: a) C=>AvB\ б) А лЯ=> С; в) i СлЯ=> i Al

235. Покажите, что высказывания А и (А л В) v (А л -> В) всегда одновременно истинны или ложны.

Беседа 12. Понятие об аксиоматическом методе

57. Возникновение аксиоматического метода в математике

Начальные геометрические знания были получены опытным путем. Первые сведения о геометрических фактах дошли до нас из глубокой древности. Например, формулы вычисления площадей земельных участков, имеющих форму прямоугольников, треугольников, трапеций, приведены в древнеегипетских математических папирусах и в клинописных таблицах древнего Вавилона.

Опытное происхождение геометрических фактов подтверждается тем, что в древних источниках упоминаются как верные, так и неточные сведения. Например, древние египтяне вычисляли площадь произвольного четырехугольника с последовательными сторонами а, Ь, с, d (рис. 356) по формуле

что дает неверный результат даже для параллелограммов, отличных от прямоугольников. Повидимому, на практике встречались лишь четырехугольники, имеющие близкую к прямоугольнику форму, а для них вносимая этой формулой погрешность невелика.

Получение новых геометрических фактов при помощи рассуждений (доказательств) относится к VI веку до нашей эры и связано с именем древнегреческого математика Фалеса (его называют также

Фалесом Милетским, поскольку он был родом из Милета). Собственно говоря, Фалес был не профессиональным математиком, а купцом. Плавая по Великому (Средиземному) морю на своих кораблях и занимаясь торговлей, он посвящал свободное время математике. И вот, этот купец сделал гениальное открытие: он обнаружил, что геометрические истины можно добывать не только опытным путем, с помощью измерений, но также чисто умозрительно. Ему приписывают установление свойств равнобедренного треугольника, доказательство равенства величин вертикальных углов (рис. 357), доказательство того, что вписанный угол, опирающийся на диаметр, — прямой (рис. 358), и другие начальные факты геометрии. Фалес, повидимому, применял поворот части фигуры и перегибание чертежа, т. е. то, что в наши дни называют движениями.

Постепенно доказательства приобретают в геометрии все большее значение. К III веку до нашей эры геометрия становится дедуктивной наукой, т. е. наукой, в которой подавляющее большинство фактов устанавливается путем вывода, доказательства. К этому времени относится книга «Начала», написанная древнегреческим ученым Евклидом. В своей книге Евклид систематизировал известные к этому времени геометрические сведения. В ней доказываются многие теоремы, которые мы изучаем и сейчас, например: свойства параллелограммов и трапеций, теорема Пифагора, подобие многоугольников. Изложение материала в книге Евклида было настолько продуманным, что в течение двух тысячелетий она служила основным учебным пособием при изучении геометрии.

В IV веке до н. э. крупнейший мыслитель древности Аристотель создал основы логики. Аристотель учил, что изложение всякой теории должно начинаться с первоначальных предложений (аксиом), из которых путем рассуждений выводятся дальнейшие факты. Греческое слово «аксиома» означает «удостоенное, принятое положение». Весь набор (система) аксиом называется аксиоматикой. Таким образом, аксиомы — это первоначальные факты науки (геометрии), которые принимаются без доказательства и позволяют вывести из них все дальнейшие факты этой науки. Утверждения, выводимые из аксиом, называют теоремами.

При изложении геометрии Евклид полностью следует идеям Аристотеля. Точка зрения Евклида была примерно следующей. Взяв какую-либо теорему, можно проследить по ее доказательству, какие

Рис. 356 Рис. 357 Рис. 358

ранее доказанные теоремы были использованы при ее выводе. Для этих ранее доказанных теорем в свою очередь можно указать те более простые факты, из которых они выводятся, и т. д. В конце концов получается некоторый список простых фактов (аксиом), которые, во-первых, позволяют, идя обратным путем, доказать, исходя из них, все изучаемые теоремы геометрии, а, во-вторых, они настолько просты, что не возникает вопроса о необходимости их «вывода».

Евклид выделил полтора десятка аксиом геометрии, на которых основывалось все его изложение. Среди сформулированных им аксиом имеются, например, следующие.

«Через две точки можно провести прямую».

«Совмещающиеся между собой равны».

«Порознь равные третьему, равны между собой».

Формулировка первой из этих аксиом понятна. Вторая из указанных аксиом говорит о том, что две фигуры, совмещающиеся между собой (подразумевается, при помощи движения), конгруэнтны. (Евклид не пользовался термином «конгруэнтность», а говорил о «равных» фигурах.) Третья из указанных аксиом имеет общематематический характер, т. е. она относится не только к геометрическим фигурам, но также и числам, площадям и иным величинам. Например, в применении к числам она означает, что если числа а и b порознь равны третьему числу с, т. е. а = с и b = с, то эти числа равны между собой, т. е. а-Ь.

Эта аксиома вместе с «очевидными» условиями рефлексивности и симметричности равносильна транзитивности. Таким образом, этой аксиомой Евклид фактически вводил отношение эквивалентности.

С понятиями геометрии дело обстоит примерно так же, как с теоремами. Каждое новое понятие вводится (с помощью определения) на основе ранее введенных понятий. Эти ранее введенные понятия, в свою очередь, определяются через предыдущие и т. д. В конце концов мы приходим к небольшому числу первоначальных понятии, через которые, идя обратным путем, можно определить все встречающиеся в курсе геометрии понятия. Евклид попытался дать определение всех без исключения понятий геометрии, в том числе и первоначальных. Например, «точка», относящаяся к числу первоначальных понятий, определяется у Евклида следующим образом: «Точка есть то, что не имеет частей».

Нетрудно понять, однако, что эта фраза не может служить определением, так как сразу же возникают дальнейшие вопросы: какой смысл имеет слово «то»? Что такое «часть»? Что означает «иметь часть»? Неудивительно, что это туманное «определение» нигде дальше в изложении Евклида не используется. По существу, фраза Евклида представляет собой обращение к нашему жизненному опыту: Евклид убежден, что читатель имеет представление о чем-то предельно маленьком, неделимом далее, и предлагает это понятие именовать термином «точка». Таким образом, следует признать, что у Евклида

понятие «точка» является первоначальным, вводимым без определения, а фраза Евклида является лишь пояснением, показывающим опытное происхождение этого понятия.

Современная точка зрения на аксиоматическое построение курса геометрии заключается в следующем.

Во-первых, перечисляются первоначальные (не определяемые) понятия.

Во-вторых, указывается список аксиом. При формулировке аксиом используются первоначальные понятия. Смысл аксиом в том, что они устанавливают некоторые связи и взаимоотношения между первоначальными понятиями.

После этого дальнейшие геометрические факты (теоремы) выводятся дедуктивным путем (доказываются) с помощью правил вывода (в частности, правил использования знаков V, 3, =>, л, v, <=>).

Первоначальные понятия и аксиомы заимствованы из опыта и возникли в процессе долгого и сложного исторического развития науки. Первоначальные факты накапливаются в результате практической деятельности человека. Их проверяют, уточняют, систематизируют. Исключают из них те, которые могут быть выведены из других первоначальных фактов. Иногда обнаруживается, что оставшийся список первоначальных фактов (аксиом) — неполный, т. е. этих фактов недостаточно для вывода всех теорем, и тогда к этому списку добавляют недостающие аксиомы. В результате и получается полный набор аксиом (аксиоматика).

Это делает понятным, почему все последующие геометрические факты, хотя они и получаются на основе системы аксиом чисто умозрительным, дедуктивным путем, имеют тесную связь с жизнью, достаточно хорошо описывают свойства реального пространства, применяются в практической деятельности человека.

Евклид не сумел последовательно и до конца провести аксиоматическую точку зрения. Дело не только в том, что он не отделил первоначальные, неопределяемые понятия от последующих понятий. Основной недостаток изложения Евклида заключается в том, что приведенный им список аксиом был неполным.

После Евклида многие поколения математиков стремились улучшить данную им систему аксиом (аксиоматику) геометрии. Большую роль сыграли работы современника Евклида — древнегреческого ученого Архимеда, который сформулировал аксиомы, относящиеся к измерению геометрических величин. Из математиков более позднего времени большой вклад в усовершенствование аксиоматики геометрии внесли замечательный русский математик Н. И. Лобачевский, а также А. Лежандр, М. Паш и другие ученые.

Итог этих исследований был подведен выдающимся немецким математиком Д. Гильбертом, который на рубеже XIX и XX столетий завершил работу по аксиоматизации геометрии.

Полный список аксиом геометрии содержит около двух десятков аксиом и является достаточно сложным. Поэтому знакомство с

аксиоматическим методом проведем на более простых примерах:

метрического пространства и группы.

58. Метрические пространства

В этом пункте рассматривается аксиоматическое построение геометрии метрических пространств, широко используемых в современной математике (причем не только в геометрии).

Прежде всего мы должны перечислить первоначальные понятия. В теории метрических пространств имеется два первоначальных понятия: точка и расстояние. Расстояние между точками A и В обозначается через d(A,B).

Далее мы должны перечислить аксиомы. В теории метрических пространств имеется всего три аксиомы.

Аксиома 1. Расстояние между двумя любыми точками А и В есть число неотрицательное, причем d(A,B) = 0 в том и только в том случае, если А- В.

Аксиома 2. Для любых двух точек А и В справедливо равенство

Аксиома 3. Для любых трех точек А, В и С справедливо неравенство

Аксиому 2 иногда называют аксиомой симметричности расстояния, а аксиому 3 — аксиомой треугольника.

Таким образом, метрическим пространством называется множество М, элементы которого считаются точками и в котором задано расстояние, удовлетворяющее перечисленным трем аксиомам.

В качестве первого примера рассмотрим множество Р всех точек плоскости. Расстояние между точками будем понимать в обычном смысле (единица длины предполагается заданной).

Множество Р является метрическим пространством, т. е. расстояния между точками на плоскости удовлетворяют аксиомам 1, 2 и 3.

Рассмотрим другой пример метрического пространства. Будем теперь считать «точкой» произвольное действительное число, а за «расстояние» между a и b примем модуль разности этих чисел:

Докажем, что множество всех действительных чисел R есть метрическое пространство. Для этого надо проверить, что рассматриваемые «точки» и «расстояния» удовлетворяют аксиомам 1, 2 и 3.

Справедливость аксиом 1 и 2 легко проверяется. Например, справедливость аксиомы 2 проверяется так:

Рис. 359

Справедливость аксиомы 3 следует из неравенства \х + у\ < \х\ + \у\, доказываемого в курсе алгебры. Действительно, если в этом неравенстве положить х = а - b, у = b - с, то оно запишется в виде

А это и означает, что d(a, с) < d(a, b) + d(b, с).

В качестве третьего примера метрического пространства рассмотрим множество S всех многочленов от буквы х, т. е. «точкой» метрического пространства S будет произвольный многочлен f(x) = aQxn + oi\Xn~^ + ... + ап. Под «расстоянием» d(f, g) между «точками» будем понимать наибольшее значение функции \f(x) - g{x)\ на отрезке 0 <х < 1 (рис. 359). Проверка показывает, что и в этом случае введенное расстояние удовлетворяет аксиомам 1, 2 и 3, т. е. множество S представляет собой метрическое пространство.

Итак, мы рассмотрели три примера, или, как говорят математики, три модели метрического пространства, причем модель Р имеет геометрический характер, а модели R и S — алгебраический. В разных моделях «точки» выглядят по-разному. Например, в модели Р точки имеют привычный смысл, в модели R за «точки» принимаются числа, а в модели S — многочлены. В соответствии с этим в различных моделях по-разному определяются и расстояния.

В приложениях современной математики рассматриваются метрические пространства, «точками» которых являются линии, фигуры, траектории полета космических кораблей, плановые задания заводов и т. д. В чем же заключается выгода от введения общего термина «метрическое пространство» для всех этих столь различных между собой случаев? Дело в том, что, доказав (на основе аксиом 1, 2 и 3) некоторую теорему в геометрии метрических пространств, мы сможем утверждать, что эта теорема будет справедлива и в модели и в модели 5, и в модели R, и вообще в любой модели метрического пространства. Ведь в каждой модели аксиомы 1, 2 и 3 выполняются, а при доказательстве теорем в аксиоматической теории метрических пространств мы только этими аксиомами и пользуемся.

Таким образом, построение теории метрических пространств (или иной аксиоматической теории) дает выводы, применимые к различным областям: геометрии, алгебре, экономике, астронавтике и

вообще в любом случае, когда выполняются рассматриваемые аксиомы. Положение вещей здесь в какой-то мере аналогично тому, которое мы имели при выводе геометрических фактов с помощью рассуждений. Например, измерив транспортиром меры углов конкретного треугольника и убедившись, что сумма этих мер равна, насколько позволяет судить точность используемых инструментов, 180° (и даже проведя такие измерения для многих конкретных треугольников), мы еще не можем утверждать, что это справедливо для любого треугольника. А геометрическое рассуждение (доказательство) позволяет, не проводя повторных измерений углов треугольника, утверждать, что этот вывод имеет общий характер, т. е. что в каждом треугольнике сумма мер углов равна 180°.

Подобно этому, развив аксиоматическую теорию, мы можем, не проводя повторных рассуждений, утверждать, что выводы этой аксиоматической теории имеют место в каждой модели метрического пространства. Это позволит, один раз доказав теоремы о метрическом пространстве, применять их в геометрии, алгебре, экономике, астронавтике, т. е. во всех тех областях, где появляются метрические пространства.

Разница, однако, будет в том, что отдельное доказательство (например, в геометрии) позволяет получить теорему, приложимую хотя и к различным фигурам, но в рамках одной области — геометрии. Аксиоматический же метод позволяет целые аксиоматически развитые теории применять в различных областях знаний. В этом состоит сила аксиоматического метода, широко используемого сейчас в различных областях как мощное орудие познания.

Здесь мы рассмотрим лишь две самые простые теоремы и одно определение из теории метрических пространств для того, чтобы показать, как проводится доказательство в аксиоматической теории.

Теорема 1. Пусть а^, а2, а — произвольные точки метрического пространства M (где п>Ъ). Тогда

Доказательство. При п = 3 доказываемое неравенство имеет вид d(av «3) < d(av а2) + d(a2, я3); оно вытекает непосредственно из аксиомы треугольника.

Теперь, для проведения доказательства по индукции, достаточно осуществить переход от п к п + 1. Пусть для некоторого п > 3 утверждение теоремы справедливо. Возьмем произвольные п+ 1 точку а^9 а , а В силу предположения индукции справедливо неравенство

Кроме того, согласно аксиоме треугольника,

Складывая эти неравенства и производя упрощения, мы получаем соотношение

которое и

показывает, что утверждение теоремы справедливо для п + 1 точки. Этим и завершается индукция.

Определение, г-окрестностью точки а в метрическом пространстве M называется множество всех точек х g M, находящихся от а на расстоянии, меньшем г.

Обозначать эту окрестность будем через Ur(a)\

Теорема 2. Обозначим черезр расстояние между точками а и Ъ. Тогда если р<г, то (г - р)-окрестность точки b содержится в г-окрестности точки а.

Знаками эту теорему можно записать так:

Доказательство. Пусть х принадлежит (У-/?)-окрестности точки Ъ, т. е. d(b,x)<r-р. Это неравенство можно переписать в виде р + d(b, х) < г, т. е. d(a, b) + d(b, х) < г. По аксиоме треугольника d(a, х) < d(a, b) + d(b, х). Поэтому имеем d(a, х) < г, т. е. точка х принадлежит r-окрестности точки а.

Итак, для любой точки х е U (Ь) имеем х е U iß), т. е.

Ur_p(b) с иг(а).

Доказанные теоремы 1 и 2 справедливы в любом метрическом пространстве.

Рассмотрим, какой смысл имеют эти теоремы в метрическом пространстве Р (на плоскости) и в метрическом пространстве R (в множестве всех действительных чисел).

На плоскости Р расстояние d(A,B) между точками A и В равно длине соединяющего их отрезка АВ. Поэтому сумма

представляет собой сумму длин отрезков А^А2, ^2^3' ■"' ^п-\^п, т. е. длину ломаной А^А2...А. Далее, d(A^,A ) есть длина отрезка А^А, соединяющего концы этой ломаной. Таким образом, в применении к плоскости Р теорема 1 означает, что длина отрезка, соединяющего концы ломаной, не превосходит длины этой ломаной.

В метрическом пространстве R теорема 1 имеет следующий смысл: для любых действительных чисел а^ а2, ап справедливо неравенство

Обратимся теперь к теореме 2.

На плоскости Р множество U(A)= {X: d(A,X)<r) представляет собой открытый круг (круг без границы) с центром А и радиусом г. Теорема 2 утверждает, что если расстояние р между точками A и В

Рис. 360

Рис. 361 Рис. 362

меньше г, то круг радиуса г -р с центром В содержится в круге радиуса г с центром А (окружности этих кругов касаются внутренним образом, рис. 360).

В метрическом пространстве R множество Ur(A)={x: \х-а\<г} представляет собой интервал длины 2г, серединой которого служит точка а (рис. 361). Теорема 2 в этом случае означает, что если \a-b\=p<r, то интервал длины 2(г-р) с центром b содержится в интервале длины 2г с центром а (рис. 362).

Задачи и упражнения

236. Пусть точками пространства /"являются города России, а в качестве расстояния между любыми двумя городами возьмем минимальную стоимость проезда из одного города в другой. Будет ли г метрическим пространством?

237. Будет ли метрическим пространством множество точек сферы, если в качестве расстояния между точками взять:

а) расстояние по прямой;

б) расстояние по дуге большого круга, проходящего через эти точки?

238. Рассмотрим множество кругов на плоскости и введем расстояние между любыми двумя из них как число, равное сумме площадей этих кругов без удвоенной площади их пересечения. Будет ли полученное пространство метрическим?

239. Рассмотрим на плоскости п различных точек. Расстояние между любыми двумя различными точками будем считать равным единице. Образуют ли при любом п эти точки метрическое пространство?

240. Будут ли образовывать метрическое пространство точки координатной прямой, если в качестве расстояния между точками взять d(a, b) = \a- b\l

59. Коммутативные группы

В этом пункте приводится еще один пример аксиоматической теории.

Рассмотрим некоторое множество G, в котором каждым двум элементам a и b поставлен в соответствие третий элемент с, называемый суммой элементов a и b и обозначаемый через a + b. Таким образом, первоначальными понятиями являются элемент и сумма элементов. Операция нахождения суммы называется сложением. Перечислим теперь аксиомы. В рассматриваемой теории их четыре.

Аксиома 1. Сложение коммутативно, т. е. для любых двух элементов а и b справедливо соотношение a + b = b + a.

Аксиома 2. Сложение ассоциативно, т. е. для любых трех элементов a, b и с справедливо соотношение (а + Ь) + с = а + (Ь + с).

Рис. 363 Рис. 364

Аксиома 3. Существует элемент о, обладающий тем свойством, что для любого а справедливо равенство а + 0 = а.

Аксиома 4. Для любого элемента а существует элемент, который в сумме с элементом а дает 0. Этот элемент называется противоположным элементу а и обозначается через -а.

Множество G, для элементов которого указано, что понимается под их суммой, и в котором выполняются сформулированные выше аксиомы 1 - 4, называется коммутативной группой. Аксиомы группы символами записываются следующим образом:

Аксиома 1. Аксиома 2. Аксиома 3. Аксиома 4.

Рассмотрим множество Т всех параллельных переносов плоскости. Под суммой двух параллельных переносов / и g будем в данном случае понимать их композицию g ° f (сначала/, потом g), т. е. будем писать f+g = g°f.

Из свойств параллельных переносов, изученных в курсе геометрии, непосредственно вытекает, что аксиомы 1 - 4 в данном случае выполняются. Таким образом, множество Г всех параллельных переносов плоскости с указанной выше операцией сложения является коммутативной группой.

Рассмотрим теперь множество V всех векторов на плоскости. Напомним, что вектором называется класс всех направленных отрезков, имеющих одну и ту же длину и одно и то же направление (рис. 363). Сложение векторов определяется по представителям, т. е. выбирается направленный отрезок OA, являющийся представителем вектора а^ и направленный отрезок AB, являющийся представителем вектора b (тем самым конец первого направленного отрезка совпадает с началом второго, рис. 364), и тогда вектор, представителем которого служит направленный отрезок OB, обозначается через а+ b и называется суммой векторов а и Ь. Из школьного курса известно, что множество V всех векторов на плоскости удовлетворяет аксиомам 1 - 4 и потому представляет собой коммутативную группу. Кстати, именно тем, что не удается непосредственно определить

сумму двух направленных отрезков (например, OA и А'В' на рис. 364) и объясняется определение вектора не как одного направленного отрезка, а как класса направленных отрезков. Определение «вектором называется направленный отрезок» является математически некорректным.

Дальнейшими примерами коммутативных групп могут служить: множество всех поворотов плоскости вокруг заданной точки О (в качестве операции сложения рассматривается композиция поворотов); множество всех целых чисел Z (включая отрицательные числа) с обычной операцией сложения; множество всех многочленов степени не выше второй (при обычном сложении); множество всех многочленов вообще.

Приведем в качестве примера несколько теорем теории коммутативных групп.

Теорема 1. Элемент О коммутативной группы G определен однозначно: (3! О g G) (V ае G) (а + О = а).

Доказательство. Допустим, напротив, что существует, помимо 0, еще один элемент 0', обладающий тем же свойством (У ае G) (а + 0' = а). Тогда 0 + 0' = 0, поскольку 0' обладает указанным свойством. С другой стороны, 0 + 0' = 0' + 0 (аксиома 1), и потому 0 + 0' = 0' + 0 = 0' (аксиома 3). Таким образом, 0 и 0' совпадают с одним и тем же элементом 0 + 0', т. е. 0 = 0'.

Аналогично устанавливается единственность противоположного элемента.

Теорема 2. Пусть а., а2, а — элементы коммутативной группы G. Тогда в каком порядке мы бы их последовательно ни складывали друг с другом, результат будет одним и тем же.

Поясним формулировку этой теоремы на примере четырех элементов Яр а2, ou и а4. Теорема утверждает, что при вычислении суммы этих элементов мы можем располагать слагаемые и выполнять сложение в произвольном порядке. Например,

(1)

Здесь в левой части сначала находится сумма ах +а2, затем к ней прибавляется элемент а^ и, наконец, к результату прибавляется «4; в правой же части порядок расположения слагаемых и порядок выполнения действий другой.

В общем виде доказательство этой теоремы можно провести с помощью метода математической индукции.

Теорема 3. Для любых двух элементов а и b труппы G уравнение а + х = Ь всегда имеет в группе G решение и притом единственное.

Знаками формулировку этой теоремы можно записать так:

Доказательство. Для установления существования достаточно указать элемент, являющийся решением (корнем) этого уравнения. Проверим, что таким корнем является элемент х = Ь + (-а). В самом деле, применяя последовательно аксиомы 1, 2, 4, 1 и 3, получаем (для этого значения х):

a + x = a + (b+ (-а)) = а + ((-a) + b) = (a + (-à)) + b = 0 + b = b + 0 = b.

Этим существование корня доказано.

Докажем единственность. Пусть ipi2 — два корня рассматриваемого уравнения, т. е.

a + x^=b, а + х2 = Ь. (2)

Докажем, что х^ =х2. Действительно, из равенств (2) следует, что а + х^ =а + х2. Прибавим к элементу (-а) равные между собой элементы а + w а + х2'. (-а) + (а + х^) = (-а) + (а + х2). В силу аксиомы 2 это равенство можно переписать в виде ((-а) + а) + х^ = ((-а) + а) + х2, откуда, применяя аксиомы 1, 4 и 3, находим, что х^ =х2.

Замечание. Для краткости элемент Ь + (-а) принято записывать без скобок в виде b - а и называть разностью элементов b и а. Таким образом, по определению

b-a = b + (-а).

Доказанная теорема утверждает, что уравнение

а + х = Ь (3)

имеет в коммутативной группе G единственное решение

х = Ь-а. (4)

Иными словами, равенства (3) и (4) означают одно и то же, т. е. определяют один и тот же элемент х. Сравнивая форму записи равенств (3) и (4), мы получаем обоснование следующего хорошо известного правила.

Слагаемое из одной части равенства можно переносить в другую, меняя знак, стоящий перед этим слагаемым, на противоположный.

Доказанные теоремы 1, 2, 3 справедливы в любой коммутативной группе. Иначе говоря, какой бы пример (модель) коммутативной группы мы ни взяли, мы можем, не проводя заново доказательств, утверждать, что эти теоремы будут справедливы для этой модели коммутативной группы. В частности, они справедливы не только для рациональных чисел, но и для параллельных переносов, для векторов, для многочленов и т. д. Вообще, если нам в дальнейшем встретится пример коммутативной группы, мы можем применять теоремы 1, 2, 3, т. е. выполнять сложение в любом порядке, решать линейные урав-

нения, переносить слагаемые из одной части равенства в другую с изменением знака.

Коммутативные группы используются в разных областях приложений современной математики: в экономике, кристаллографии, ядерной физике, биологии и т. д.

В математике и в ее приложениях нередко встречаются также «некоммутативные группы», т. е. множества, в которых определена операция (сложение), удовлетворяющая только аксиомам 2, 3 и 4, но в которых соотношение коммутативности может выполняться не для всех элементов. При этом формулировки аксиом 3 и 4 видоизменяются: требуется существование не только правого нуля (как в аксиоме 3), но и левого нуля; не только правого, но и левого противоположного элемента. Единственность каждого из этих нулей (т. е. совпадение левого нуля и правого нуля) и единственность каждого из противоположных элементов имеют место и в этом случае, но доказываются чуть сложнее.

Примером группы может служить множество D всех движений плоскости, в котором в качестве операции сложения берется композиция: f+g = g°f- Элементом 0 служит тождественное преобразование е Е D'. для любого элемента / е D имеем е °f=f, т. е. /+ 0 =/. Это означает, что выполнена аксиома 3. Наконец, противоположным элементу / служит обратное преобразование /_1 °f=e, т. е. /+(-/) = 0.

Группа D не является коммутативной. Если, например,/ — поворот на 90° вокруг точки О, г. g — параллельный перенос на вектор а ^0, то точки f(g(M)) и g(f(M)) различны, т. е. g+f^f+g.

В качестве еще одного примера можно указать группу подстановок из п элементов, т. е. множество всех взаимно однозначных отображений множествам = {1,2,... п} на себя. Элементы этой группы обычно задаются в виде двухстрочной матрицы вида

где /j есть образ элемента 1, далее, /2 — образ элемента 2 и т. д. При этом все элементы iJ{ различны (поскольку отображение взаимно однозначно), т. е. вторая строка представляет собой некоторую перестановку элементов 1, 2, п. Суммой двух подстановок /, g, т. е. взаимно однозначных отображений M —> M, называется композиция этих отображений: f+g = g°f. Роль элемента 0 здесь играет тождественная подстановка е, а противоположным для элемента/ является обратное отображение. Эта группа подстановок обозначается через S и называется симметрической группой порядка п. Она содержит п\ элементов. Таким образом, симметрическая группа (любого порядка) представляет собой пример конечной группы.

Рис. 365 Рис. 366

Вообще, пусть M — произвольное множество. Преобразованием множества M называется всякое взаимно однозначное отображение множества M на себя. Для любых двух преобразований/, g множества M можно определить их композицию g ° /, которую условимся обозначать через f+g и называть суммой этих преобразований. Пусть теперь G — некоторое множество преобразований множества M (не обязательно совпадающее с множеством всех его преобразований). Говорят, что G представляет собой группу преобразований множества М, если выполняются следующие три условия:

1) 2) (V/e (?) (/-'€ G); 3) (V/,g е G) (g °/e G).

Нетрудно проверить, что если G1 — группа преобразований множества М, то (7 является группой.

По существу, мы имеем здесь дело с новой аксиоматической теорией — теорией групп преобразований, в которой указанные выше условия 1 - 3 служат аксиомами. В качестве примера рассмотрим группу всех преобразований множества М, состоящего из трех элементов: М- {1, 2, 3} (т. е. симметрическую группу порядка 3). В данном случае преобразований, т. е. взаимно однозначных отображений множества M на себя, существует шесть:

Здесь е — тождественное отображение, /, j — так называемые циклические перестановки (рис. 365), а каждое из преобразований /, g, h оставляет один элемент множества M неподвижным (т. е. переводит его в себя), а два другие переставляет между собой.

Заметим, что эта группа преобразований по существу совпадает с группой самосовмещений равностороннего треугольника. В самом деле, обозначим вершины равностороннего треугольника цифрами 1, 2, 3 (рис. 366). Группа самосовмещений этого треугольника состоит из поворотов на 0°, 120°, 240° вокруг центра треугольника (это дает преобразования е, /, у), а также трех осевых симметрий (например, g — симметрия относительно оси, проходящей через вершину 2).

Задачи и упражнения

241. Является ли коммутативной группой множество нечетных чисел с обычной операцией сложения а + №

242. Является ли коммутативной группой множество отображений (поворотов и симметрий) правильного шестиугольника на себя?

243. Образуют ли группу нечетные числа относительно операции умножения а о Ь = ab?

244. Образует ли группу множество целых чисел, если в качестве операции а о b берется остаток при делении числа а + b на 3?

245. Будет ли группой множество целых чисел, если для любых чисел а и b их сумма считается равной нулю?

Беседа 13. Непротиворечивость, независимость, полнота

60. Непротиворечивость и понятие модели

Имеются важные принципиальные категории, относящиеся к любым системам аксиом. К ним относится в первую очередь понятие непротиворечивости. Мы рассмотрим его на простом примере.

Несколько восьмиклассников решили организовать шахматный турнир. Однако при обычной схеме (когда каждый участник играет с каждым из остальных и притом по две партии: белыми и черными) требуется очень много времени для проведения турнира. Поэтому мальчики решили провести турнир по упрощенной схеме: каждый должен сыграть ровно три партии с кем-либо из остальных участников (а белыми или черными — по жребию). Так как составить расписание турнира никак не удавалось, двое из мальчиков, Петя и Сережа, решили обратиться к учителю.

Учитель прежде всего поинтересовался, четно или нечетно число участников предполагаемого турнира. Оказалось, что число участников нечетно. Тогда учитель предложил сформулировать требования, которые ученики предъявили к турниру, в виде аксиом. Для этого потребовалось ввести три первоначальных (неопределяемых) понятия: «игрок», «партия», «участие игрока в партии». Аксиом получилось четыре:

Аксиома 1. Число игроков нечетно.

Аксиома 2. Каждый игрок участвует в трех партиях.

Аксиома 3. В каждой партии участвуют два игрока.

Аксиома 4. Для каждых двух игроков имеется не более одной партии, в которой они оба участвуют.

Из этих аксиом можно вывести ряд теорем. Первую из них предложил для примера сам учитель.

Теорема 1. Число игроков не меньше пяти.

Доказательство. Так как нуль — четное число, то по аксиоме 1 число игроков не равно нулю, т. е. существует хотя бы один игрок А. Этот игрок в силу аксиомы 2 участвует в трех партиях, причем в каждой из этих партий, помимо А, участвует еще один игрок (аксиома 3). Пусть В, С, D — игроки, отличные от А, которые участвуют в этих партиях. По аксиоме 4 все игроки В, С, D различны (если бы, например, было В-С, то оказалось бы, что имеются две партии, в которых участвуют игрок А и игрок В-С). Итак, мы уже нашли

четырех игроков А, В, С, D. Но тогда, по аксиоме 1, число игроков не меньше пяти.

Следующую теорему доказал Петя. Для этого он определил новое понятие: если q — некоторая партия и А — один из участвующих в ней игроков, то пару {q\A) назовем выступлением игрока.

Теорема 2. Число всех выступлений игроков четно.

Доказательство. Если в партии q участвуют игроки А и В, то мы получаем два выступления игроков: {q\A) и {q\B), т. е. каждая партия дает ровно два выступления игроков (аксиома 3). Значит, число всех выступлений игроков четно, так как оно вдвое больше числа всех партий.

Однако Сережа доказал теорему, противоречащую предыдущей:

Теорема 3. Число всех выступлений игроков нечетно.

Доказательство. По аксиоме 2 игрок А участвует ровно в трех партиях, скажем, q^ q2, qy Это дает три выступления игрока А\ (q^A), (q2;A), (q^A). Отсюда следует, что число всех выступлений игроков равно 3/г, где п — число участников. Так как п нечетно (аксиома 1), то и Ъп нечетно.

Учитель подвел итоги проведенного исследования. Взятая аксиоматика позволяет доказать ряд теорем (три из них были рассмотрены). Однако среди этих теорем имеются две, противоречащие друг другу: теорема 2 утверждает, что некоторое число четно, а теорема 3 гласит, что то же самое число нечетно. Аксиоматика, из которой можно вывести две противоречащие друг другу теоремы, называется противоречивой. Таким образом, взятая аксиоматика противоречива, т. е. требования, выдвинутые организаторами турнира, несовместимы. Неудивительно, что мальчики не сумели составить расписание турнира: такого расписания просто не существует.

Противоречивая аксиоматика не может служить основой построения содержательной теории. «Теория» основанная на противоречивой аксиоматике, считается несостоятельной, бессодержательной. Математика такие «теории» отвергает.

Зачем учитель предложил Пете и Сереже другую систему организации турнира, при которой каждый из участников должен сыграть, не три, а четыре партии с кем-либо из остальных участников. Иначе говоря, он предложил рассмотреть теорию, в которой те же первоначальные понятия (игрок, партия и участие игрока в партии); далее, аксиомы 1, 3, 4 остаются без изменения, а аксиома 2 формулируется по-новому:

Аксиома 2. Каждый игрок участвует в четырех партиях.

Однако Петя и Сережа не спешили выводить теоремы из этих аксиом: вдруг опять, после доказательства нескольких теорем, обнаружится противоречие. Учитель же заверил мальчиков, что, сколько бы теорем они ни выводили из этих аксиом, никогда противоречий не будет. Вот как он убедил их в этом.

Рассмотрим девятиугольник (рис. 367), в котором, кроме сторон, проведены девять диагоналей, соединяющих вершины через одну.

Рис. 367

Вершины девятиугольника будем считать «игроками», проведенные отрезки (стороны и диагонали) будем считать «партиями», а «игроками», участвующими в некоторой «партии», будем считать концы соответствующего отрезка. Мы получаем модель (или схему) интересующего нас турнира. Легко проверяется, что все четыре аксиомы (в том числе аксиома 2 в новой редакции) здесь выполняются. Итак, удалось построить модель, в которой выполняются все рассматриваемые аксиомы, причем эта модель построена из «материала» геометрии, т. е. науки, в непротиворечивости которой мы не сомневаемся.

Предположим теперь, что из рассматриваемых четырех аксиом можно вывести две теоремы, противоречащие друг другу. Тогда доказательства этих теорем можно было бы повторить и в построенной модели (ведь в этой модели все четыре аксиомы имеют место). В результате получилось бы, что, рассуждая о правильном девятиугольнике, мы можем получить две противоречащие друг другу теоремы. Но это означало бы, что геометрия — наука противоречивая, чего мы не допускаем. Таким образом, мы должны признать, что две противоречащие друг другу теоремы вывести из рассматриваемых четырех аксиом невозможно.

Вообще, пусть рассматриваются две теории Р и Q, причем теория Q задается аксиоматически (и в ее непротиворечивости мы заранее не уверены), а Р — это хорошо известная нам теория, в непротиворечивости которой мы не сомневаемся. Если из «материала» теории Р удастся построить модель, в которой выполняются все аксиомы теории Q, то этим непротиворечивость теории Q считается установленной.

61. Математические примеры моделей

Приведем некоторые математические примеры построения моделей. Примем теорию целых чисел в качестве основной теории, в справедливости которой мы не сомневаемся (причем мы рассматриваем в этой теории не только натуральные числа, но также нуль и отрицательные целые числа). Множество всех целых чисел обозначается через Z. Теорию же поля рациональных чисел Q мы хотим построить аксиоматически. Именно, в множестве Q определены сложение, умножение и неравенства, удовлетворяющие следующим аксиомам.

Аксиома 1. Множество Q содержит Z в качестве подмножества, причем выполняется принцип перманентности Ганкеля — имеющиеся в Q сложение, умножение и порядок совпадают на множестве Zc Q с имеющимися в Z сложением, умножением и порядком.

Аксиома 2.

Аксиома 3.

Аксиома 4.

Аксиома 5.

Аксиомы 1 - 5 означают, что Q представляет собой коммутативную группу по сложению.

Аксиома 6. Аксиома 7. Аксиома 8. Аксиома 9.

Аксиомы 6-9 означают, что множество всех положительных рациональных чисел (см. далее аксиому 13) является группой относительно операции умножения. Она называется мультипликативной группой, ее «нулем» является число 1, а «противоположным» для г является обратный элемент г~К

Аксиома 10. Сложение и умножение связаны свойством дистрибутивности:

Вместе взятые, аксиомы 2-10 означают, что множество всех рациональных чисел представляет собой поле.

Аксиома 11. Множество Q линейно упорядочено, т. е. имеется отношение порядка (неравенства), которое обладает свойствами транзитивности и исключительности.

Аксиома 12. Сумма двух положительных чисел (т. е. чисел, которые больше нуля) является положительным числом:

Аксиома 13. Произведение двух положительных чисел является положительным числом: (V r^r^e Q) ((г^ > 0) л (г2> 0)) => (Г\Г2> 0).

Построим теперь (из материала теории целых чисел) модель для этой аксиоматики. С этой целью рассмотрим множество M всех упорядоченных пар (т\ ri), где т,пе Z, причем п > 0. Иными словами, вместо дроби — мы будем писать пару (т;п). Использование пар (вместо дробей) удобно тем, что мы будем лишены соблазна применять привычные (и кажущиеся «очевидными») свойства дробей. Доказательства формулируемых ниже теорем мы не приводим.

Определение 1. Пары (т;п) и (р; q) будем считать эквивалентными, если mq - пр.

Теорема 1. Введенное отношение эквивалентности рефлексивно, симметрично и транзитивно, т. е. оно определяет разбиение множества M на классы эквивалентности.

Класс эквивалентности, содержащий элемент (m; ri), будем обозначать [(m; я)], а множество всех классов эквивалентности мы и обозначим через Q. Элементы множества Q будем называть рациональными числами.

Определение 2. Сложение и умножение в Q определим (по представителям) формулами

Легко проверяется, что эти операции определены корректно, т. е. не зависят от выбора представителей.

Определение 3. Рациональное число [(/?; 1)] условимся отождествлять с целым числом р.

Теорема 2. В силу этих определений в модели Q выполнен принцип перманентности Ганкеля (аксиома 1).

Теорема 3. В силу определений 1, 2, 3 операция сложения в модели Q удовлетворяет аксиомам 2 - 5, т. е. Q является коммутативной группой.

Теорема 4. В силу определений 1, 2, 3 операция умножения в модели Q удовлетворяет аксиомам 6 - 10, т. е. Q является полем. Теорема 5. В силу определений 1, 2, 3 любое рациональное число имеет вид г = т-п~\ где т,пе Z, причем п>0. Иначе говоря, модель Q является полем частных над множеством Z.

Определение 4. Рациональное число г = [т;п] условимся считать положительным, если m > 0. (Напомним, что п > 0 по определению множества пар.) Далее, условимся для г^г2е Ô писать г^>г2 (или, иначе, г2<г^), если =r2 + d, где число d положительно.

Теорема 6. В силу определений 1, 2, 3 в модели Q выполнены аксиомы 11-13, т. е. Q является упорядоченным полем.

Этим и завершается построение модели. Тем самым непротиворечивость рассматриваемой аксиоматики поля рациональных чисел установлена (при условии, что мы считаем непротиворечивой теорию целых чисел).

Заметим, что таким же путем устанавливается непротиворечивость теории целых чисел — при условии, что мы считаем непротиворечивой теорию натуральных чисел. С этой целью также рассматривается множество всех упорядоченных пар (т\ п), где m, п — произвольные натуральные числа (имеется в виду, что эта пара изображает разность m - п). Пары (т; п) и (р; q) считаются эквивалентными, если т + q = n+p. Затем в множестве получающихся классов эквивалентности вводится сложение и неравенства по представителям: [(m; я)] + [(/?; q)] = [(m +р\п + q)\, [(т\ п)] > [(/?; q)] если т + q> п+ р.

Наконец, проверяется, что в этой модели выполняются все аксиомы теории целых чисел (которые получаются из рассмотренных выше аксиом 1 - 5 заменой Q на Z и вытекающими отсюда изменениями).

Итак, непротиворечивость теории рациональных чисел сводится (построением модели) к вопросу о непротиворечивости теории целых чисел. В свою очередь непротиворечивость этой последней сводится к непротиворечивости теории натуральные чисел. Что же дальше?

Поскольку натуральные числа возникают при пересчете предметов в конечных множествах, может быть, следует построить модель натуральных чисел, предполагая непротиворечивость теории множеств? А как тогда быть с самой теорией множеств?

Да и к тому же при рассмотрении моделей мы доказывали теоремы. Но что такое доказательство? Значит, надо обосновать и правила

вывода, лежащие в основе математической логики? Мы здесь отметим лишь, что, согласно теореме, доказанной в начале XX столетия австрийским логиком Куртом Геделем (1906 - 1978), в любой аксиоматической теории можно сформулировать теорему, которая не может быть ни доказана, ни опровергнута в пределах этой теории, без выхода за границы этой теории. Так что с чего-то все-таки надо начинать!

В связи с этим иногда произносят сакраментальную фразу: «В непротиворечивости теории натуральных чисел нас убеждает многовековая история науки». Пусть эта фраза служит читателю утешением!

62. Построение аксиоматики геометрии

В отличие от ранее рассматривавшихся аксиоматических теорий геометрия принадлежит к числу наиболее сложно аксиоматизируемых разделов математики. Система аксиом, впервые предложенная Евклидом, не давала окончательного решения вопроса. Мы отложим до следующего пункта проблему существования неевклидовых геометрий, связанную с V постулатом Евклида (или аксиомой о параллельных). Здесь же мы рассмотрим вопрос о пополнении евклидова списка евклидовых аксиом, оказавшегося явно недостаточным.

Дело в том, что Евклид, доказывая ту или иную теорему, нередко обращался к чертежу и аргументировал свои доводы словом «Смотри!». Например, вычисляя длины отрезков, на которые в прямоугольном треугольнике делится гипотенуза, к которой из вершины прямого угла проведен перпендикуляр (рис. 368), Евклид, нимало не сумнящеся, говорил, что основание перпендикуляра (точка Р) лежит «между» концами гипотенузы.

Но что значит «между»? Проще всего сказать, что это одно из первоначальных, неопределяемых понятий геометрии. Но тогда надо указать аксиомы, описывающие свойства этого понятия — иначе мы не сможем о нем рассуждать! Ведь «Смотри!» или «очевидно, что» для строгой, аксиоматической теории неуместны.

Такими аксиомами могут быть, например, следующие.

Из трех точек на прямой одна и только одна находится между двумя другими.

Если точка С находится между Л и В, а точка D находится между Л и С, то D находится между Л и В.

Легко дать иллюстрации этих аксиом: именно лишь иллюстрации, т. е. что-то вроде утешения для наших наглядных представлений (чтобы не было очень сухо и абстрактно), а вовсе не «подтверждения», «доказательства», «обоснования» и т. п. Ведь в аксиоматической теории все утверждения должны либо быть объявлены аксиомами, либо должны быть получены строгими логическими рас-

Рис. 368

суждениями (доказательствами) на основе аксиом и ранее доказанных теорем. Никакой апелляции к наглядности, очевидности, интуиции быть не должно.

Особенно активно работа по пополнению евклидова списка аксиом проводилась в XIX столетии.

Исследованию вопроса о взаимном расположении точек на прямой и прямых на плоскости посвятил ряд работ немецкий математик Мориц Паш (1843 - 1930). В частности, он заметил, что при аксиоматическом построении геометрии по схеме Евклида необходимо пользоваться следующей аксиомой:

если прямая, лежащая в плоскости треугольника и не проходящая ни через одну из его вершин, пересекает одну из сторон треугольника, то она обязательно пересечет одну из двух других его сторон.

Аксиома Паша означает, что если прямая / «входит» в треугольник Т (рис. 369а), то она не может остаться внутри этого треугольника (рис. 3696), а должна выйти из этого треугольника, пересекая какую-либо одну из двух других его сторон (рис. 369в, г). Евклид в подобных случаях ссылался на наглядность чертежа, а это при строго аксиоматическом построении геометрии недопустимо.

Работа по аксиоматизации евклидовой геометрии была завершена в самом конце XIX столетия известным немецким математиком Давидом Гильбертом (1862 - 1943). В своей книге «Основания геометрии» (1899) Д. Гильберт дает полный список аксиом евклидовой геометрии (21 аксиома) и доказывает непротиворечивость этой аксиоматики.

У Гильберта все аксиомы разбиты на пять групп. Первая группа аксиом (аксиомы соединения) содержит, в частности, аксиому о том, что через каждые две точки проходит прямая и что такая прямая — единственная; аксиому о том, что на каждой прямой имеются по крайней мере две точки; существуют по крайней мере три точки, не лежащие на одной прямой, и другие аксиомы.

Вторая группа аксиом (аксиомы порядка) говорит о взаимном расположении точек и прямых. Здесь содержится аксиома о том, что из трех точек на прямой одна и только одна лежит между двумя другими. К этой группе аксиом относится также аксиома М. Паша и ряд других аксиом.

Третья, четвертая и пятая группы аксиом носят соответственно названия: аксиомы конгруэнтности, аксиома параллельности и аксиомы непрерывности.

Но Гильберт не только подвел итог двухтысячелетнему исследованию аксиоматики в духе Евклида и дал полный список аксиом

Рис. 369

геометрии. Гильберт также доказал непротиворечивость этой аксиоматики. Точнее, он доказал, что из материала теории действительных чисел можно построить модель геометрии Евклида. Значит, если теория действительных чисел признается непротиворечивой, то, как показывает построенная Гильбертом модель, геометрия Евклида также лишена противоречий. Что же касается теории действительных чисел, то ее непротиворечивость (как показывают модели, построенные Кантором и Дедекиндом) сводится к непротиворечивости рациональных чисел, а это, как мы видели, сводится к непротиворечивости теории натуральных чисел. Этим проблема непротиворечивости геометрии Евклида была решена.

Однако с появлением книги Гильберта работа по аксиоматизации геометрии вовсе не завершилась. Дело в том, что одна и та же теория может быть построена на основе различных систем аксиом. Это легко понять на примере аксиоматики коммутативной группы.

Выше были указаны четыре аксиомы коммутативной группы. Однако можно было бы определить коммутативную группу при помощи другой системы аксиом, содержащей следующие три аксиомы.

Аксиома 1*. Аксиома 2*. Аксиома 3*.

Нетрудно понять, что эта аксиоматика эквивалентна той, которая была указана ранее. В самом деле, аксиома 1* и аксиома 2* просто совпадают с аксиомами 1 и 2. Аксиома 3* выводится как теорема из аксиом 1 - 4 (мы это видели в п. 59).

Таким образом, если выполняются аксиомы 1 - 4, то выполняются и аксиомы 1* - 3*. В свою очередь, из аксиом 1* - 3* можно вывести в качестве теорем утверждения аксиом 1 - 4.

Например, покажем, как выводится аксиома 4. Применяя аксиому 3* к случаю Ь = 0, получаем, что для любого элемента а существует и притом только один элемент ig G, для которого а + х = 0, а это и есть аксиома 4.

Из сказанного видно, что все выводы, которые можно получить из аксиом 1 - 4, можно также получить из аксиом 1* - 3*, и наоборот. Таким образом, понятие коммутативной группы может быть определено по-разному: либо с помощью аксиоматики 1 - 4, либо с помощью аксиоматики 1* - 3*.

Аналогично дело обстоит и с аксиоматикой геометрии: могут быть построены разные системы аксиом, задающие одну и ту же теорию — геометрию Евклида. Это выяснилось уже в конце XIX в. В это время, одновременно с гильбертовской аксиоматикой, были предложены и другие системы аксиом евклидовой геометрии. Одна из них была предложена в 1899 г. М. Пиери, другая, чуть позже, — нашим соотечественником В. Ф. Каганом.

Работа по усовершенствованию аксиоматики геометрии продолжалась и в XX столетии. В 1911 г. Ф. Шур предложил аксиоматику, отличавшуюся от гильбертовской тем, что вместо аксиом конгруэн-

тности (III группа аксиом Д. Гильберта) он ввел аксиомы движений. Таким образом, аксиоматика Ф. Шура оказывается ближе к идеям Ф. Клейна, чем гильбертовская аксиоматика, и в этом смысле более прогрессивной.

Наиболее интересная с современной точки зрения аксиоматика была предложена выдающимся немецким математиком Германом Вейлем (1885 - 1955) в его книге «Пространство, время, материя», вышедшей в 1918 г. Вместо точек и прямых в качестве первоначальных неопределяемых понятий Г. Вейль принимает точки и векторы, а среди его аксиом имеются, в частности, аксиомы, указывающие свойства суммы векторов, произведения вектора на число, скалярного произведения векторов. Таким образом, многие из свойств операций над векторами, которые при обычном изложении геометрии доказываются, в аксиоматике Г. Вейля принимаются в качестве аксиом. Это позволяет значительно легче и короче (чем при использовании других аксиоматик) осуществить построение курса геометрии.

Когда-то царь Птолемей потребовал, чтобы Евклид указал ему «царский путь» в геометрии, ибо царю негоже идти тем же путем, что и все, а ему надлежит быстро достичь вершин знания: он ведь царь! Евклид ответствовал, что такого пути нет. Чтобы постичь геометрию, царь должен, как и прочие смертные, решать задачи и доказывать одну теорему за другой. Но вейлевская аксиоматика поистине открывает царский путь в геометрию, короче и яснее вводит понятия и факты.

К тому же, в отличие от аксиоматики Гильберта, направленной всецело в прошлое (как завершить дело, начатое свыше двух тысячелетий назад Евклидом?), аксиоматика Г. Вейля направлена в будущее — она связывает геометрию с теорией векторных пространств и другими разделами современной математики, применяемыми в физике, химии, математической экономике, биологии и других науках.

63. Геометрия Лобачевского

Как уже отмечалось, система аксиом геометрии, впервые предложенная Евклидом, не давала окончательного решения вопроса. Уточнение аксиоматики Евклида шло не только по линии добавления недостающих аксиом. После того как было обнаружено, что аксиома «Все прямые углы равны между собой» является ненужной (т. е. может быть доказана как теорема с помощью остальных аксиом), были сделаны попытки определить, нет ли у Евклида и других «лишних» аксиом. Особое внимание математиков привлекал пятый постулат Евклида. Этот постулат, который у самого Евклида формулировался довольно сложно, в XIX в. был заменен следующей аксиомой параллельности.

Пусть в плоскости даны прямая и лежащая вне этой прямой точка, тогда через эту точку можно провести к данной прямой только одну параллельную прямую.

Рис. 370 Рис. 371

Иначе говоря, если точка А не принадлежит прямой /, то (в плоскости, содержащей I и А) существует не более одной прямой р, для которой истинно (A g р) л (/ П р = 0) (рис. 370).

По сравнению с другими аксиомами Евклида, аксиома параллельности формулируется наиболее сложно. Многие теоремы Евклида выражают гораздо более простые факты, например: «в равнобедренном треугольнике углы при основании конгруэнтны». Неудивительно, что многие математики, жившие после Евклида, пытались доказать, что эта аксиома является лишней, т. е. может быть доказана как теорема на основании остальных аксиом. Среди математиков, работавших над разрешением загадки пятого постулата, были Д. Саккери (XVIII в.), И. Ламберт (XVIII в.), Жан Бертран (XIX в.), А. Лежандр (XVIII - XIX вв.) и др. Особенно интересны работы французского математика Лежандра. Его перу принадлежит учебник геометрии, представляющий собой переработку евклидовых «Начал». Этот учебник неоднократно переиздавался. Почти в каждом издании своего учебника Лежандр помещал доказательство пятого постулата, однако после выхода книги выяснялось, что опубликованное доказательство ошибочно. В следующем издании Лежандр помещал новое доказательство. И хотя среди опубликованных Лежандром доказательств не оказалось ни одного верного, тем не менее его работы прояснили кое-что в проблеме пятого постулата.

Заслуга решения проблемы пятого постулата принадлежит нашему замечательному соотечественнику, профессору Казанского университета Николаю Ивановичу Лобачевскому. Первоначально он пытался, как и его предшественники, доказать пятый постулат Евклида, исходя из остальных аксиом. С этой целью он попробовал провести рассуждения методом доказательства «от противного».

Исходную идею Лобачевского можно изложить следующим образом. Рассмотрим в плоскости прямую / и не принадлежащую ей точку А. Проведем из точки А перпендикуляр АС к прямой / и луч AB, перпендикулярный АС (рис. 371). Рассмотрим некоторый луч AM, пересекающий прямую / в точке М. Меру угла САМ обозначим через а. Будем теперь неограниченно удалять точку M от точки С по прямой / (так что точка M будет пробегать положения М^, М2, •••)•

Угол а будет при этом возрастать, оставаясь все время меньше к/2. При неограниченном удалении точки M по прямой / луч будет все

Рис. 372 Рис. 373 Рис. 374

более приближаться к некоторому предельному положению AN, причем логически могут представиться две возможности:

1) луч AN совпадает с лучом АВ;

2) луч AN составляет с лучом АВ некоторый острый угол.

Первый случай соответствует аксиоме параллельности: АВ является единственной прямой, проходящей через точку А и не пересекающей /.

Посмотрим теперь, какое положение вещей мы имеем во втором случае. Обозначим меру острого угла CAN через у (рис. 372). Луч AN отделяет лучи, пересекающие прямую /, от лучей, не пересекающих ее. Иначе говоря, всякий луч р, исходящий из точки А и проходящий внутри угла CAN, пересекает прямую /, а всякий луч q, проходящий внутри угла BAN, не пересекает ее. Сам же луч AN также с прямой / не пересекается. Если теперь продолжить луч AN за точку А и построить прямую AN', симметричную AN относительно АС, то получим при точке А две пары вертикальных углов (рис. 373). Всякая прямая, проходящая через точку А и расположенная внутри пары вертикальных углов NAN' и КАК', пересекается с /. Прямые же, проходящие через точку А и расположенные внутри пары вертикальных углов NAK', N'AK, не пересекаются с /.

Для того, чтобы доказать справедливость пятого постулата Евклида, нужно было бы установить, что случай, изображенный на рис. 373, невоз