ЭНЦИКЛОПЕДИЯ ЭЛЕМЕНТАРНОЙ МАТЕМАТИКИ

III

Функции пределы

АКАДЕМИЯ ПЕДАГОГИЧЕСКИХ НАУК РСФСР

ЭНЦИКЛОПЕДИЯ ЭЛЕМЕНТАРНОЙ МАТЕМАТИКИ

ПОД РЕДАКЦИЕЙ

П. С. АЛЕКСАНДРОВА, А. И. МАРКУШЕВИЧА и А. Я. ХИНЧИНА

КНИГА ТРЕТЬЯ

ФУНКЦИИ И ПРЕДЕЛЫ

(ОСНОВЫ АНАЛИЗА)

ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО ТЕХНИКО-ТЕОРЕТИЧЕСКОЙ ЛИТЕРАТУРЫ

МОСКВА 1952 ЛЕНИНГРАД

П-5-2

Редактор А. 3. Рывкин. Техн. редактор И. Я. Мурашова»

Корректор А. С. Каган.

Подписано к печати 4/IV 1952 г. Бумага 60X92Vie- 17»5 бУм« л. 35 печ. л. 36,95 уч.-изд. л. 42 228 тип. знаков в печ. л. Т-02117. Тираж 50 000 экз. Цена книги Ир. 10 к. Переплёт 2 р.

Заказ № 38. Номинал — по прейскуранту 1952 г.

2-я типография «Печатный Двор» им. А. М. Горького Главполиграфиздата при Совете Министров СССР. Ленинград, Гатчинская, 26.

ОГЛАВЛЕНИЕ

Предисловие...................................... 7

ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО. ПРЕДЕЛЫ ПОСЛЕДОВАТЕЛЬНОСТЕЙ И ФУНКЦИЙ. ОБЩЕЕ ПОНЯТИЕ ФУНКЦИИ

(В. Л. Гончаров)

Глава I. Общие сведения об элементарных функциях и графиках уравнений ............................... 11

§ 1. Элементарные функции......................... 11

§ 2. Графические представления. Приёмы точечных построений. . 17

§ 3. Простейшие преобразования графиков............... 25

§ 4. Прямая и обратная функции...................... 32

§ 5. Элементарное исследование функций (постановка вопроса и некоторые общие приёмы)...................... 34

Глава II. Обзор элементарных функций и их графиков...... 41

§ 6. Классификация рациональных функций.............. 41

§ 7. Целые положительные степени................... 42

§ 8. Многочлены первой степени (линейные функции)....... 45

§ 9. Многочлены (трёхчлены) второй степени............. 46

§ 10. Многочлены третьей степени..................... 48

S 11. Биквадратные многочлены...................... 51

§ 12. Многочлены высших степеней.................... 52

§ 13. Целые отрицательные степени.................... 54

§ 14. Дробные линейные функции..................... 56

§ 15. Дробные функции второй степени.................. 58

§ 16. Дробные рациональные функции (общий случай)........ 64

§ 17. Алгебраические иррациональные функции ............ f г

§ 18. Примеры исследования алгебраических функций........ 68

§ 19. Элементарные трансцендентные функции............. 78

§ 20. Показательная функция........................ 78

§ 21. Функции, связанные с показательной............... 84

§ 22. Логарифмическая функция...................... 88

§ 23. Функции, связанные с логарифмической............. 90

§ 24. Произвольная степенная функция................. 93

§ 25. Основные (целые) тригонометрические функции: синус и косинус.................................. 95

§ 26. Простые гармонические колебания................. 101

§ 27. Тригонометрические многочлены.................. 105

§ 28. Многочлены Чебышева........................ 107

§ 29. Тангенс и другие дробные тригонометрические функции. . . 111

§ 30. Представление функций, рационально зависящих от тригонометрических, через одну или две из них............. 116

§ 31. Примеры исследования функций, рационально зависящих от тригонометрических. Тригонометрические уравнения..... 121

§ 32. Обратные тригонометрические функции.............. 128

§ 33. Исследование многочленов Чебышева. Их минимальное свойство.................................. 134

Глава III. Пределы числовых последовательностей и пределы функций................................ 140

§ 34. Конечные и бесконечные числовые последовательности ... 140

§ 35. Общее определение бесконечной числовой последовательности .................................... 149

§ 36. Теорема Больцано-Вейерштрасса о существовании предельной точки................................. 153

§ 37. Примеры. Предел как единственная предельная точка .... 159

§ 38. Предел последовательности: классическое определение и основные свойства........................... 165

§ 39. Обобщение понятия предела (пределы в «несобственном смысле») ................................. 173

§ 40. Предел функции на бесконечности................. 176

§ 41. Односторонний предел функции в конечной точке....... 180

§ 42. Двусторонний предел. Понятие непрерывности......... 187

§ 43. Примеры непрерывных функций................... 190

§ 44. Пределы при монотонном изменении. Число е......... 195

Глава IV. Пределы последовательностей функций. Свойства непрерывных функций....................... 202

§ 45. Простая сходимость.......................... 202

§ 46. Общее понятие функции одной действительной переменной 210

§ 47. Свойства непрерывных функций................... 215

§ 48. Равномерная сходимость последовательности непрерывных функций.................................. 222

§ 49. Теорема Вейерштрасса-Бернштейна о приближении непрерывной функции с помощью рациональных многочленов. . . 227

§ 50. Доказательство теоремы....................... 232

§ 51. Определение показательной функции. Продолжение непрерывной функции за пределы всюду плотного множества. . . 237

§ 52. Теорема Больцано и проблема существования однозначной обратной функции........................... 244

§ 53. Функциональные уравнения и элементарные функции..... 247

Глава V. Общее понятие функции..................... 254

§ 54. Соответствие между множествами................. 254

§ 55. Геометрические образы в многомерных пространствах .... 256

I 56. Пространственные отображения................... 260

§ 57. Метрические пространства...................... 264

§ 58. Понятие предела в метрическом пространстве......... 268

§ 59. Топологические пространства.................... 272

§ 60. Алгебра множеств. Производное множество. Замкнутость и связность............................... 274

§ 61. Непрерывные отображения и их свойства............ 279

§ 62. Гомеоморфные отображения..................... 282

§ 63. Верхняя и нижняя границы числовых множеств или последовательностей. Верхний и нижний пределы числовых множеств или последовательностей................... 287

ПРОИЗВОДНЫЕ, ИНТЕГРАЛЫ И РЯДЫ

(И. П. Натансон)

Введение........................................ 299

Глава I. Производные............................. 303

§ 1. Производная и дифференциал..................... 303

1. Задачи, приводящие к понятию производной........... 303

2. Определение производной....................... 307

3. Дифференцируемость и непрерывность. Односторонние производные ................................. 309

4. Производные простейших элементарных функций........ 312

5. Дифференцирование обратных функций.............. 318

6. Правила комбинирования формул дифференцирования .... 320

7. Дифференциал.............................. 327

8. Производные и дифференциалы высшего порядка....... 333

9. Частные производные и полный дифференциал......... 337

§ 2. Важнейшие теоремы о производных................ 339

10. Теоремы Ферма и Ролля....................... 339

11. Формулы Лагранжа и Коши. Правило Лопиталя........ 342

12. Формула Тейлора............................ 346

13. Исследования П. Л. Чебышева и С. Н. Бернштейна...... 353

§ 3. Применение дифференциального исчисления к исследованию функций .................................. 354

14. Признаки постоянства и монотонности функции........ 354

15. Экстремум функции.......................... 359

16. Нахождение наибольшего и наименьшего значений функции на замкнутом промежутке...................... 363

Глава II. Интегралы............................... 366

§ 4. Неопределённые интегралы...................... 366

17. Основные понятия........................... 366

18. Интегрирование с помощью подстановки............. 369

19. Интегрирование по частям...................... 371

20. Общие замечания по поводу интегрирования элементарных функций.................................. 373

§ 5. Определённые интегралы........................ 377

21. Задачи, приводящие к понятию определённого интеграла . . 377

22. Определённый интеграл........................ 380

23. Основные свойства интеграла .................... 385

24. Интеграл, как функция верхнего предела............. 391

25. Вычисление определённого интеграла с помощью неопределённого .................................. 393

26. Формула Валлиса............................ 398

27. Приближённое вычисление определённых интегралов..... 400

§ 6. Приложения интегрального исчисления............... 408

28. Вычисление площадей......................... 408

29. Вычисление объёмов.......................... 411

30. Длина дуги кривой........................... 417

31. Площадь поверхности вращения.................. 418

32. Общие указания по поводу приложений интегрального исчисления и его связей с дифференциальным исчислением 420

Глава III. Ряды.................................. 425

§ 7. Ряды с постоянными членами.................... 425

33. Основные понятия........................... 425

34. Простейшие свойства рядов..................... 429

35. Положительные ряды......................... 431

36. Знакочередующиеся ряды....................... 437

37. Абсолютная сходимость........................ 440

38. Вопрос о перестановке членов ряда. Умножение рядов ... 441

§ 8. Степенные ряды............................. 447

39. Промежуток сходимости........................ 447

40. Свойства суммы степенного ряда.................. 452

41. Разложение логарифма и составление таблиц логарифмов . . 457

42. Разложение арктангенса и вычисление тс............. 465

43. Общие замечания по поводу разложения функций в степенные ряды................................. 469

44. Биномиальный ряд........................... 472

45. Очерк аналитической теории тригонометрических функций . 481

ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

(В. Л. Гончаров)

§ 1. Рациональные функции........................ 493

§ 2. Пределы. Ряды............................. 496

§ 3. Показательная функция. Синус и косинус............. 500

§ 4. Выражение тригонометрических функций через показательную .................................. 504

§ 5. Гиперболические и тригонометрические функции........ 507

§ 6. Логарифм................................. 508

§ 7. Произвольная степень......................... 510

§ 8. Обратные тригонометрические и гиперболические функции . 511

§ 9. Производная............................... 513

§ 10. Интеграл................................. 517

§ 11. Приближение функций многочленами............... 523

§ 12. Первообразная функция........................ 526

§ 13. Интеграл Коши............................. 532

§ 14. Понятие аналитической функции.................. 536

§ 15. Свойства аналитических функций.................. 539

§ 16. Геометрический смысл аналитических функций......... 544

§ 17. Примеры конформных отображений................ 547

Алфавитный указатель......................... 553

ПРЕДИСЛОВИЕ

Предлагаемая читателю книга третья «Энциклопедии элементарной математики» завершает первый большой раздел этого издания, посвященный систематическому изложению тех элементов математической науки, на основе которых складываются школьные курсы арифметики, алгебры и отчасти тригонометрии. Если материал первых двух книг ограничивался преимущественно вопросами арифметики и алгебры в собственном смысле слова как учения о числах, их обобщениях, операциях над ними (имеются в виду алгебраические операции: сложение, вычитание, умножение и деление) и алгебраических уравнениях, то третья книга посвящена вопросам анализа, а именно, функциям и пределам. Наряду с учением об элементарных функциях и обстоятельно изложенной теорией пределов, сюда вошли также наиболее элементарные сведения из дифференциального и интегрального исчисления, теории рядов и сведения о функциях комплексного переменного.

Понятия производной и интеграла давно стучатся в двери общеобразовательной школы; как бы ни относиться к вопросу об их фактическом включении в школьные программы, сколько-нибудь удовлетворительное завершённое изложение элементарных основ математической науки без этих основных понятий следует признать немыслимым при современном состоянии науки.

Что касается функций комплексного переменного, то нет ни возможности, ни необходимости в том, чтобы вводить, хотя бы и не в близком будущем, систематические сведения о них в школьную программу. Однако тот основной факт, что элементарные функции являются аналитическими функциями, определёнными во всей комплексной плоскости (за исключением, быть может, определённых точек) и что, следовательно, полного понимания свойств этих функций и связей между ними можно достичь, только рассматривая их как функции комплексного переменного, оправдывает включение в нашу книгу небольшого очерка об аналитических функциях комплексного переменного.

Редакция

В. Л. ГОНЧАРОВ

ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО. ПРЕДЕЛЫ ПОСЛЕДОВАТЕЛЬНОСТЕЙ И ФУНКЦИЙ. ОБЩЕЕ ПОНЯТИЕ ФУНКЦИИ

ГЛАВА I

ОБЩИЕ СВЕДЕНИЯ ОБ ЭЛЕМЕНТАРНЫХ ФУНКЦИЯХ И ГРАФИКАХ УРАВНЕНИЙ

§ 1. Элементарные функции

Ближайшим предметом рассмотрения в математике являются числа и выполняемые над ними операции (действия). И понятие числа и понятие операции допускают неограниченные расширения и обобщения. В настоящей статье, если не сделано особой оговорки, речь будет итти лишь о действительных числах и (в трёх первых главах) преимущественно о тех операциях, которые изучаются в элементарной математике и потому сами носят название элементарных. Сюда относятся прежде всего алгебраические операции — сложение, вычитание, умножение и деление, затем возведение в произвольную степень и извлечение корня произвольной степени, логарифмирование по произвольному положительному основанию и, наконец, составление из данной величины шести тригонометрических функций (синус, косинус, тангенс, косеканс, секанс и котангенс), а также так называемых обратных функций (арксинус, арккосинус и т. д.).

Перечисленные операции могут выполняться, смотря по обстоятельствам, в том или ином заранее указанном порядке над данными числами или над буквами (переменными величинами), обозначающими числа. Мы будем предполагать, по крайней мере в пределах глав I и II, что число выполняемых операций конечно. Результат вычисления можно обозначить какой-нибудь новой буквой; при этом те буквы, которые участвовали в вычислении, ставятся в скобках, в определённом порядке, будучи разделены запятыми. Например:

(1)

или

(2)

или ещё

(3)

Получаемые таким образом математические выражения, или формулы, способные принимать то или иное числовое значение в зави-

симости от числовых значений входящих (т. е. участвующих в вычислении) величин, являются элементарными функциями этих величин.

Входящие в данную формулу «переменные» величины называются независимыми, сама же функция носит название зависимой переменной.

Функциональные символы вроде/(i) или F(x, у) особенно удобны в следующем отношении: что бы ни представляли собой величины с, а, Ъ — числа или же новые буквенные выражения, — через /(с) или F (а, Ь) обозначают то, что получится, если вместо t подставить с, или вместо х подставить а, а вместо .у подставить Ь. Так, из соотношений (2) и (3) вытекает:

и точно так же

Если независимые переменные не выписаны в скобках (что имеет своё преимущество краткости), то в случае подстановок запись приходится усложнять; например, соотношение (1) даёт:

или же пользуются описательными оборотами речи: «при к = тс величина V принимает значение 1».

Читателю, несомненно, знакомо определение функции (от одной переменной) как соответствия между числовыми значениями независимой переменной и числовыми значениями зависимой переменной.

Переменная величина у называется функцией переменной величины х (в некотором промежутке /), если каждому значению х (из /) соответствует некоторое определённое значение у.

В таком общем виде определение функции было дано Н. И. Лобачевским в 1834 г. в следующих словах1):

«Это общее понятие (функции. — Ред.) требует, чтобы функцией от х называть число, которое даётся для каждого х и вместе с х постепенно изменяется. Значение функции может быть дано или аналитическим выражением или условием, которое подаёт средство испытывать все числа и выбирать одно из них; или, наконец, зависимость может существовать и оставаться неизвестной».

Слово «соответствует» (или «сопоставляется» иногда также говорят «отвечает») оставляет открытым вопрос о том, какова должна быть природа

1) Н. И. Лобачевский, Полное собрание сочинений, т. V, Гостехиздат, 1951, стр. 43.

правила, посредством которого устанавливается соответствие: важно лишь, чтобы такого рода правило было указано.

В частности, правило соответствия может иметь «эмпирический» характер; так, если говорят о температуре как функции времени, то правило заключается в том, чтобы в назначенный момент времени зафиксировать показание термометра.

В преподавании элементарной математики имеют особенно важное, если не исключительное, значение такие функции, для которых правило соответствия носит «оперативный» или «аналитический» характер: оно указывает, в надлежащем порядке, те математические действия (операции), которые надо совершить над значением х, чтобы получить значение у.

Нет оснований противопоставлять понятие однозначного аналитического выражения понятию функции как соответствия: первое является частным случаем второго1).

Понятие функции как аналитического выражения сложилось в первой половине XVIII в. Именно так определяли функцию И. Бернулли (1718 г.) и Л. Эйлер (1748 г.). Последний предложил следующее определение:

«Функция переменного количества есть аналитическое выражение, составленное каким-либо образом из этого переменного количества и чисел или постоянных количеств».

Следует, однако, заметить, что у Эйлера

1) не вполне чётко отграничены «допустимые» операции,

2) не исключаются формулы, содержащие бесчисленное множество операций.

Точное определение элементарной функции (в современном смысле) опирается на понятие функции как соответствия и формулируется так:

Функция называется элементарной, если её значения могут быть получены из постоянных чисел и значений независимых переменных посредством конечного числа элементарных операций.

Конкретные примеры неэлементарных функций приведены в главе IV. Там же указан и наиболее естественный способ их получения (см. § 49).

К понятию функции как соответствия нам придётся обращаться в данной статье неоднократно. Покуда же просим читателя, если идёт речь о «функциях», иметь в виду те самые элементарные функции, с которыми приходится встречаться в процессе преподавания.

В дальнейшем (в главах I—IV) число рассматриваемых переменных величин ограничивается двумя: ради единообразия они будут обозначены буквами х и у.

Пусть дано уравнение вида

F(x,y) = 0, (4)

где F(x, у) — какая-нибудь элементарная функция величин х и у2). Предположим, что х0 и у0 — произвольные числа. Если эти числа

1) Два понятия функции (более узкое и более широкое) можно сблизить между собой, или даже отождествить, одним из следующих способов:

а) устанавливая, что весьма обширные классы функций-соответствий допускают аналитическое представление (см., например, теорему Вейерштрасса в § 49 гл. IV);

б) рассматривая как математическую операцию переход от числового значения независимой переменной к соответствующему (в силу функционального соотношения) значению зависимой переменной.

2) Если в правой части уравнения стоит не нуль, всегда можно перенести всё в левую часть.

таковы, что при подстановке х0 вместо х и у0 вместо у1) уравнение удовлетворяется, т. е. его левая часть становится равной нулю, то пара чисел (х0, у0) представляет собой решение (одно из решений) данного уравнения. Функция F(x, у) может оказаться такой, что уравнение F(x, у) = 0 не имеет вовсе решений например, при F(x, y) = —L^- или при F(xy у) = 2*"*j ; или она может быть такая, что существует только одно решение или, вообще, конечное число решений (например, при F (х, 3;) == je2 —(—-V2 имеется единственное решение: х=0, у = 0)\ не исключена и «противоположная крайность», когда функция F(x, у) обращается в нуль тождественно, так что любая пара значений х и у оказывается решением.

Более важным и часто встречающимся является иной случай, когда существует бесконечное множество решений уравнения F(x, у) = 0, и дело обстоит именно таким образом, что, задав «произвольно» значение какой-нибудь одной переменной, можно подыскать одно значение (или несколько) другой переменной так, чтобы уравнение удовлетворялось. Тогда говорят, что данное уравнение устанавливает функциональную зависимость между переменными х и у.

Предположим, например, что

F(x, у) = 2х — 5j> + 10. (5)

Уравнение

2х — 5у+10 = 0 (6)

таково, что, задав значение х совершенно произвольно, можно найти решение, если взять значение у согласно формуле

(7)

Таким образом, каждому значению х соответствует одно определённое значение у, удовлетворяющее нашему уравнению: оно даётся предыдущей формулой. Если положить

то можно сказать, что уравнение F(x, у) = 0 равносильно уравнению y=f(x).

1) Предполагается, что эта подстановка «имеет смысл», т. е. что совокупность операций, указываемых символом F, может быть выполнена при значениях х = х0, у =у0.

В качестве второго примера рассмотрим функцию F(x, у) = = х*-\-у2— 1. Свойства уравнения

(8)

иные: здесь можно произвольно взять значение х лишь из промежутка— и тогда получаются два различных значения у:

Положив

легко понять, что каждое из уравнений

(9)

влечёт за собой уравнение (8), тогда как из уравнения (8) при любом значении х из рассматриваемого промежутка следует или одно или другое из уравнений (9)1).

Роли переменных х и у в этом примере можно было бы поменять.

Возвращаясь от частных примеров к общему случаю, следует сказать, что имеется существенное преимущество в том, чтобы рассматривать функциональную зависимость между х и у в виде уравнения, связывающего между собой переменные х и у, тем самым оставляя за собой право, если угодно, считать х независимой переменной, а у — зависимой, или наоборот.

Предположим, например, что в качестве независимой переменной мы хотим взять величину х. Если случится, что, каково бы ни было выбранное значение х из некоторого промежутка (например, при а<х<Ь), уравнение F(х, у) = 0 имеет всегда один корень относительно у, и этот корень удастся выразить в виде элементарной формулы, зависящей, естественно, от х, тогда величина у, удовлетворяющая данному уравнению, в рассматриваемом промежутке является однозначной функцией величины х:

y=f{x).

Последнее уравнение в этом случае равносильно заданному уравнению F (х, у) = 0 (в рассматриваемом промежутке). Но может случиться и так, что каждому значению х из некоторого промежутка соответствует таким же образом несколько (например, k) корней (относительно у) данного уравнения; предполагая, что каждый из этих k корней определяется по особой элементарной формуле

мы будем иметь в этом случае k различных однозначных функций, или, как иногда говорят, одну многозначную (£-значную)

1) К уравнению (8) мы вернёмся в § 46, см. стр. 213.

функцию в рассматриваемом промежутке. В этом случае заданное уравнение F(x, у) = 0 «расщепляется» на k уравнений.

В первом из приведённых выше примеров уравнение (6) определяет у как однозначную функцию х для каких угодно значений х (—оо <jc<-j-со); во втором — уравнение (8) определяет у как двузначную функцию х в промежутке —1 ^лг^-}-*•

Чтобы убедиться в том, насколько разнообразны возникающие здесь возможности, рассмотрим ещё третий пример1), полагая

(10)

Уравнение

хк+ук = х*-\-у* (11)

(что равносильно х^ -\-yi — х* —у* = 0) — биквадратное относительно у, и решения его даются формулами

Легко убедиться, что при

т. е. в промежутках

выражение, стоящее под внутренним радикалом, положительно, и сам этот радикал меньше чем у, так что выражение, стоящее под внешним радикалом, независимо от выбора знака под радикалом, будет также положительным; таким образом, в указанных промежутках уравнение (11) приводит нас к рассмотрению четырёх однозначных элементарных функций

у=Мх) (/=1, 2, 3, 4),

причём положено

1) См. стр. 76.

В промежутке — I <х<-\- I выражение, стоящее под внутренним радикалом, положительно, но сам внутренний радикал больше чем ~, и потому в этом промежутке имеется лишь два значения:

У=А(х) и y=fk{x).

Наконец, при выполнении условия

т. е. в промежутках

уравнение (11) не имеет вовсе корней.

§ 2. Графические представления. Приёмы точечных построений

Мы убедились, что уравнение вида

F(x, у) = 0 (12)

может иметь сколько угодно решений.

Чтобы придать совокупности решений большую обозримость, прибегают к плоскости Оху, и с каждым решением (х, у) сопоставляют точку с абсциссой х и ординатой у. Все получаемые таким образом точки-решения, будучи рассматриваемы как целое, образуют график уравнения. Точнее и проще: графиком уравнения называется совокупность (множество) всех точек1) плоскости, координаты которых удовлетворяют уравнению.

Нахождение всех решений данного уравнения и построение его графика — в сущности равносильные задачи, но, говоря о графике уравнения, а не о совокупности его решений, мы не только придаём наглядность интересующему нас вопросу, но и значительно упрощаем речь.

В случае, если данное уравнение «решено» относительно зависимой переменной у, так что эта переменная у в некотором промежутке а<х<Ь представляется в виде однозначной функции переменной х

У = Пх),

то говорят без всякого различия о «графике уравнения y=f(x)», или о «графике функции f(x)».

1) Можно также сказать: «геометрическое место точек»...

Характерное свойство графика в этом случае то, что всякая прямая, параллельная оси Oy (в пределах промежутка), имеет с графиком ровно одну общую точку.

Указанный случай является особенно важным как практически, так и теоретически; к нему в дальнейшем преимущественно направлено внимание.

Чтобы построить график данного уравнения, нужно, вообще говоря, отметить в плоскости Оху все принадлежащие ему точки. Этого сделать на самом деле, конечно, нельзя (если не говорить о частных случаях) по той простой причине, что точек графика — бесконечное множество. Обыкновенно делают приближённое построение и именно следующим образом: отмечают в плоскости достаточное количество точек, стараясь вместе с тем, чтобы последовательно отмечаемые точки находились одна от другой на достаточно близких расстояниях; соединяя затем последовательно отмеченные точки «плавной линией», получают график уравнения. Такая процедура носит название построения по точкам. При этом, конечно, в зависимости от характера производимых вычислений и геометрических операций, отмечаемые на чертеже точки бывают определены более или менее точно; но насколько точно воспроизведён бывает график в промежутках «между» отмеченными точками, это зависит, с одной стороны, от свойств данного уравнения, с другой — от знаний и опытности производящего построение.

Общеизвестный вычислительный приём построения графиков функций заключается в том, что для ряда значений независимой переменной х1) вычисляют значения функции y=f(x), записывают результаты в легко обозримой табличной форме, вслед за тем (или параллельно с вычислениями) отмечают соответствующие точки на чертеже и соединяют их плавной кривой.

Рис. 1.

X

У

X

У

0,5

0,71

0,9

0,95

0,6

0,77

1,0

1,00

0,7

0,84

1,1

1,05

0,8

0,89

1,2

1,10

1) Часто эти значения берут «равноотстоящими», т. е. образующими арифметическую прогрессию. Если, например, берутся значения, выражающиеся десятичными дробями с одним знаком после запятой, то говорят для краткости, что берутся значения «через одну десятую».

В качестве примера приведём таблицу и рис. 1, составленные для функции

(13)

в промежутке 0,5 5^лг=^; 1,2, причём значения х взяты через одну десятую.

В следующем примере (рис. 2) в таблице, составленной для функции

(14)

значения х взяты через одну пятую, в промежутке

Рис. 2.

В таблице иногда бывает удобно вставлять промежуточные столбцы, заполняя их последовательно. Это видно на примере таблицы, составленной для функции:

(15)

Наряду с вычислительным приёмом построения заслуживает внимания и геометрический. Предположим, что правая часть уравнения

y = f(x)

не содержит иных операций, кроме четырёх арифметических и извле-

чения квадратного корня; тогда, считая значение х данным в виде отрезка, можно построить отрезок у с помощью циркуля и линейки. Если требуется сделать несколько подстановок

то целесообразно, конечно, систематизировать работу и производить п построений совместно, последовательно выполняя один и тот же этап во всех п построениях.

Предположим, например, что дана та же функция (15). Чтобы произвести отдельное построение, возьмём точку Р с абсциссой х на горизонтальной1) оси и точку Q с ординатой 1 на вертикальной оси (рис. 3); через точку Р проведём вертикальную прямую и на ней отложим вверх отрезок PR, равный PQ; если разделим затем отрезок PR пополам, то точка деления M будет иметь как раз абсциссу х и ординату у.

Пусть требуется построить те точки графика (15), которые соответствуют абсциссам хг, jc2, ..., хп. Тогда: 1) на горизонтальной оси мы отметим точки Рц ..Рп с абсциссами xv х2,..., хп, а на вертикальной оси — точку Q с ординатой 1; 2) через точки Ри Р2,Рп проведём вертикальные прямые; 3) посредством циркуля на прямой, проходящей через Ри отложим отрезок PtRt9 равный PXQ\ затем на прямой, проходящей через Р2, отложим отрезок P2R2, равный P2Q, и т. д.; 4) найдём середину Мх отрезка PXRX, середину М2 отрезка P2R2 и т. д.

Точки Mt9 Af9, ..., очевидно, и будут искомыми. В другом примере

(16)

построение можно выполнить следующим образом.

Отметим в плоскости Оху точку 5 с координатами (—2, 0) и проведём прямую у = х-\-1, отсекающую на осях Ох и Oy соответственно отрезки — 1 и 1 (рис. 4). Возьмём на горизонтальной оси точку Р с абсциссой х, проведём

Рис. 3.

Рис. 4.

1) В дальнейшем мы для удобства речи называем ось Ох горизонтальной, ось Oy — вертикальной, а прямые, параллельные той или иной оси, — горизонтальными и вертикальными.

через неё вертикальную прямую и отметим точку пересечения Q с прямой у = х-\-1.

В треугольнике PQS катеты PQ и PS (при х>—1) соответственно равны х-\-1 и х-\-2. Поэтому достаточно из начала координат О провести прямую, параллельную SQ до пересечения с PQ в точке М, чтобы получить треугольник РМО, подобный PQS; из подобия же следует, что

т. е.

так что точка M как раз принадлежит графику.

Чтобы получить несколько точек графика Ми ..., Мп с абсциссами xv лг2,хп> достаточно: 1) отметить на горизонтальной оси точки Plt Я2, ..., Рп, с такими же абсциссами, 2) провести через них вертикали до пересечения с прямой у = х-\- 1 в точках Qj, Q2, Qn, 3) через точку 5 провести прямые SQU SQ2, ..., SQni 4) через начало координат О провести прямые, параллельные SQV SQ2, ..., SQ„, до пересечения с прямыми PtQl9 P<iQv PnQn- Точки пересечения Ml9 М2, Мп будут искомыми.

Рассмотрим, наконец, пример

(17)

Руководствуясь тем, что величину у можно понимать как среднюю геометрическую из величин х и 1, отметим на горизонтальной оси точки 5 с абсциссой — 1 и Я с абсциссой х. На отрезке SP как на диаметре построим окружность и из точки N её пересечения с вертикальной осью опустим перпендикуляр на вертикальную прямую, проведённую через А Обозначая основание перпендикуляра буквой М, видим, что точка M имеет абсциссу X и ординату

и, следовательно, принадлежит графику (рис. 5).

Таким образом, точечное построение сводится к проведению через точку 5 ряда окружностей с центрами на горизонтальной оси и к проектированию точек пересечения окружностей с вертикальной осью на касательную, проведённую через противоположный конец диаметра.

Рис. 5.

Примеры такого рода можно разнообразить, изощряя изобретательность в геометрических построениях.

Рассмотрим следующее вполне естественное обобщение. Допустим, что заданы, в качестве вспомогательного средства построения, графики функций

у = и(х), y = v(x),...

В таком случае можно построить по точкам график функции

y=f(x, и(х), и(*),...), (18)

если только допустить, что правая часть уравнения составляется из своих аргументов х, к, v9. •. посредством пяти упомянутых выше операций. Действительно, для каждого заданного отрезка х известными являются, по предположению, отрезки и (х), v (х),..., и из них с помощью циркуля и линейки может быть построен отрезок f{xy и(х), v(x),...).

Нас в особенности интересуют следующие частные случаи графических построений:

1. Если заданы графики функций у = и(х) и y = v(x), то можно построить по точкам график функции

y = u(x) + v(x) (19)

(рис. 6, а).

2. Если заданы графики функций у = и(х) и y = v(x), то можно построить по точкам график функции

у = и(х) — v(x). (20)

3. Если заданы графики функций у = и(х) и y = v(x), то можно построить по точкам график функции

у = и(х) v(x) (21)

(рис. 6, б).

4. Если заданы графики функций у = и(х) и y = v(x), то можно построить по точкам график функции

(22)

Легко понять, что дело сводится к сложению, вычитанию, умножению и делению отрезков. «Отрезки» понимаются, конечно, в алгебраическом смысле, так как и{х) и v(x) представляют собой действительные числа, которые могут быть больше нуля, меньше нуля или равны нулю. «Умножение» понимается в том смысле, что перемножены должны быть числа и взят затем отрезок

(ордината точки), равный по длине и по знаку полученному произведению; аналогично — для деления1).

Рис. 6.

Обыкновенно бывает целесообразно избегать вычитания и деления, сводя вычитание к сложению, а деление к умножению:

и опираясь при этом на следующие положения:

5. Если задан график функции y = v(x), то не представляет труда получить и график функции у =— v(x) (рис. 6, в).

6. Если задан график функции y = v(x), то можно легко построить по точкам и график функции у = —j-r (рис. 6, г).

1) Геометрическое построение в случаях 3 и 4 сводится, очевидно, к нахождению четвёртой пропорциональной, так как равенству y=^uv можно придать вид — = -=-, а равенству у =--вид ~г — —.

В самом деле, из графика y = v(x) график у = — v(x) получается посредством замены всех ординат им противоположными по знаку, т. е. посредством симметрического отражения относительно оси Ох; что же касается графика у = —\-г, то он получается из графика y = v(x) посредством замены всех ординат им обратными.

Приемы построений, вытекающие из пунктов 1—4, можно назвать кратко «сложением», «вычитанием», «умножением» и «делением» графиков. Выполнять каждую из этих операций можно путём вычисления или путём геометрических построений.

В данной связи не излишне указать ещё и на следующее положение, не являющееся частным случаем раньше сформулированного общего принципа:

7. Если заданы графики функций у = и(х) и у = v (х), то можно построить по точкам график «сложной функции» («функции от функции»):

(23)

Рассмотрим этот вопрос подробнее. Пусть Р—точка с абсциссой X на горизонтальной оси (рис. 7). Проводя через точку Р вертикальную прямую, в пересечении её с графиком y = v(x) поставим точку Q; отрезок PQ равен v(x). Пусть Т—точка на горизонтальной оси с абсциссой v (х) (так что ОТ= PQ); тогда, проводя через точку Т вертикаль до пересечения с графиком у = и(х) в точке S, получим отрезок TS, равный u(v(x)). Нам останется спроектировать точку 5 на вертикаль, проведённую через Р, чтобы получить точку M с абсциссой X и ординатой и (v (х)).

Вместо того, чтобы откладывать на горизонтальной оси отрезок ОТ, равный PQ, можно воспользоваться биссектрисой OB координатного угла Оху (уравнение которой есть х=у): достаточно из точки Q провести горизонтальный отрезок до пересечения с OB в точке R, затем из точки R провести вертикальный отрезок RS до пересечения с графиком у = и(х) в точке S; далее, как указано выше.

Разобравшись в этом построении, можно очень быстро выполнить его для целого ряда точек Р, проводя сначала ряд отрезков PQ, затем ряд отрезков QR, затем ряд отрезков RS и, наконец, ряд отрезков SM (см. рис. 7).

Рис. 7.

§ 3. Простейшие преобразования графиков

Идея, лежащая в основе излагаемых ниже соображений, заключается в следующем. Предположим, что тем или иным путём уже построен график G уравнения

F(x, у) = 0. (24)

Тогда в ряде случаев, если только уравнение F* (х, у) = 0 отличается от уравнения F(x, у) = 0 определённым, легко устанавливаемым признаком, график G* уравнения F% = О получается из графика О уравнения F = 0 посредством некоторого легко выполнимого геометрического преобразования.

Мы ограничимся рассмотрением следующих элементарных преобразований:

I. а) Осевая симметрия относительно оси Ох.

б) Осевая симметрия относительно оси Oy.

в) Центральная симметрия относительно начала О. (Симметрии относительно произвольной прямой и относительно произвольного центра рассматривать не будем.)

II. а) Перенесение (сдвиг, трансляция) на данный отрезок параллельно оси Ох.

б) То же параллельно оси Oy. (Перенесения, параллельного произвольной прямой, рассматривать не будем.)

III. а) Растяжение (или сжатие) в данном отношении по направлению оси Ох1).

б) То же по направлению оси Oy. (Растяжения по произвольному направлению рассматривать не будем.)

Иных преобразований, кроме перечисленных элементарных, мы рассматривать не будем; однако нам придётся встречаться с преобразованиями, возникающими как результат последовательного выполнения нескольких элементарных. Останутся в стороне также преобразования вращения (если не считать одного частного случая, см. ниже теорему IV).

Свойства перечисленных преобразований, которые могут служить их определениями, заключаются в следующем:

I. а) При осевой симметрии относительно оси Ох точка (х, у) переходит в точку (х, —у).

I. б) При осевой симметрии относительно оси Oy точка (х, у) переходит в точку (—х, у).

I. в) При центральной симметрии относительно начала координат О точка (х, у) переходит в точку (—х, —у).

1) «Сжатие в m раз» — то же, что «растяжение в — раз».

II. а) При перенесении на отрезок а(а^О) параллельно оси Ох точка (х, у) переходит в точку (х-\-а, у).

II. б) При перенесении на отрезок Ь ф ^ 0) параллельно оси Oy точка (х, у) переходит в точку (х, у-\-Ь).

III. а) При растяжении в р раз (р>0, по направлению оси Ох точка (х, у) переходит в точку (рх, у).

III. б) При растяжении в q раз (у>0, по направлению оси Oy точка (х9 у) переходит в точку (л:, ду).

Рис. 8.

Теперь можно сказать, что справедливы следующие утверждения (рис. 8):

I. а) График (jj уравнения

F(x, —у) = 0

симметричен графику О уравнения F(x, у) = 0 относительно оси Ох.I. б)

График G2 уравнения

F(—x, у) = 0

симметричен графику G уравнения F(x, у) = 0 относительно оси Oy.

I. в) График G3 уравнения

F{—xt —у) = 0

симметричен графику О уравнения F(x, у) — 0 относительно начала координат О.

II. а) График G4 уравнения

F(x — а, у) = 0

получается из графика G уравнения F (х, у) = 0 посредством перенесения параллельно оси Ох на отрезок, равный а.

II. б) График GB уравнения

F(x, y — b) = 0

получается из графика G уравнения F (лг, у) = 0 посредством перенесения параллельно оси Oy на отрезок, равный Ъ.

III. а) График G6 уравнения

получается из графика G уравнения F(x, у) = 0 посредством растяжения в р раз по направлению оси Ох.

III. б) График G7 уравнения

получается из графика G уравнения F(x> у) = 0 посредством растяжения в q раз по направлению оси Oy.

На рис. 8 /// изображены график G6 при р = 3 и график G7 при д = 2.

Доказательство I. а) Пусть точка M (x0i у0) принадлежит графику G, так что

F(x0i Уо) = 0.

В таком случае точка М' (*<>, —з^о) принадлежит графику Glf так как её координаты удовлетворяют уравнению г(х, —у) = 0. Но точка М' симметрична точке M относительно оси Ох. Итак, график Gx содержит все точки, симметричные какой-нибудь точке графика G относительно Ох. Если бы график G содержал ещё какую-нибудь лишнюю точку N'(хи yt)t то имело бы место равенство

F(xit -У0 = 0,

и тогда вышло бы, что симметричная точка N(xu — принадлежит графику G, что противоречит допущению.

Доказательство II. а) Пусть точка M(х0, у0) принадлежит графику G, так что

F(x0l 3>о) = 0.

В таком случае точка М'(х0-\-а, у0) принадлежит графику G4, так как её координаты удовлетворяют уравнению г(х — а, у) = 0. Но точка М\ очевидно, получается из точки M посредством перенесения параллельно оси Ох. И т. д.

Доказательство III. а) Пусть точка M (x0iyQ) принадлежит графику G, так что

В таком случае точка М! (рх0, у0) принадлежит графику Ge, так как её координаты удовлетворяют уравнению F , y*J = 0. Но точка М' получается из точки M посредством растяжения в р раз по направлению оси Ох. И т. д. Доказательства остальных теорем аналогичны.

Формулируем установленные выше теоремы применительно к графикам функций.

Предположим, что данное уравнение имеет вид

У=/(Х). (25)

В этом случае можно положить

F(x, у) = у—fix).

Но тогда

Ft*, —у) = —у-/(х), и уравнение F(x, —у) = 0 может быть записано в виде

y = -f(x).

Отсюда вытекает теорема

Г. а) График функции—f(x) симметричен графику функции f{x) относительно оси Ох (см. § 2, п° 5).

Подобным же образом получаются и следующие теоремы:

Г. б) График функции /(—х) симметричен графику функции f{x) относительно оси Oy.

Г. в) График функции—/(—х) симметричен графику функции fix) относительно начала координат О.

II'. а) График функции fix — а) получается из графика функции fix) посредством перенесения параллельно оси Ох на отрезок а.

II'. б) График функции fix)-\-b получается из графика функции fix) посредством перенесения параллельно оси Oy на отрезок Ь.

ИГ. а) График функции / j получается из графика функции fix) посредством растяжения в р раз по направлению оси Ох.

ИГ. б) График функции qfix) получается из графика функции fix) посредством растяжения в q раз по направлению оси Oy.

Рассмотренные нами преобразования, как уже было замечено, могут комбинироваться между собой. Так, заменяя в общем уравнении F(jc, у) = 0 сначала х через х — а, затем у через у — b (или в обратном порядке), получим уравнение

Fix —а, у — Ь) = 0,

график которого получается из графика данного уравнения посредством перенесения на отрезок а параллельно оси Ох и на отрезок b параллельно оси Oy (что, конечно, равносильно одному перенесению параллельно некоторой наклонной прямой).

Или ещё: график уравнения

получается из графика уравнения F(x, у) = 0 посредством растяжения в р раз по направлению оси Ох и растяжения в q раз по направлению оси Oy.

Подобным же образом график уравнения

F(—x, —у) = 0

получается из графика F (х, у) = 0 посредством двух последовательных преобразований симметрии — сначала относительно оси Ох, затем относительно оси Oy (или наоборот). Но он же (согласно 1в) получается из того же графика посредством преобразования центральной симметрии относительно начала координат. Это не удивительно: легко показать и непосредственно геометрически, что последовательные симметричные отражения данной точки относительно двух взаимно перпендикулярных прямых дают в итоге точку, симметричную заданной относительно точки пересечения этих прямых.

Следует обратить особое внимание на тот случай, когда функция F не изменяется при замене у на —у:

F(x, —y) = F(xt у).

В этом случае графики двух уравнений

F(x, —у) = 0 и F(x, у) = 0

совпадают и так как (вследствие 1а) они взаимно симметричны относительно оси Ох, то выписанное выше тождество свидетельствует о том, что график G уравнения F(x, у) = 0 имеет ось Ох своей осью симметрии. Проведя аналогичные рассуждения с использованием 16 и 1в, мы можем составить следующую таблицу признаков наличия элементов симметрии:

если

то

F(x, -y) = F(x, у),
F(—x,y) = F(x, у),
F(-xt -y) = F(x, у),

G имеет ось симметрии Ох
G имеет ось симметрии Oy
G имеет центр симметрии О

Обратимся к случаю уравнения вида y=f(x). Если функция f (х) не изменяется при замене х на —х:

/(_*)=/(*),

то её называют чётной; если при замене х на —х абсолютная величина f{x) не изменяется, но изменяется знак:

f(—x)=—f(x), то функцию называют нечётной.

Ив теорем Гб и Гв следует:

если

то

функция / (л:) — чётная,
функция f(x) — нечётная,

её график G имеет ось симметрии Oy
её график имеет центр симметрии О

Если функция F(x, у) не изменяется при одновременной замене X на X—а и у ту — Ь:

F(x — a, y — b) = F(x, у),

то её называют периодической с периодом (а, Ь); то же в этом случае говорят и о графике уравнения F (Ху у) = 0. Если функция f(x) не изменяется при замене х на X — а, то её (а также и её график) называют периодической с периодом а. На рис. 9, а и 9, б изображены соответственно графики функций F(x, у) —0 с периодом (1, 2) и y=f(x) с периодом, равным 1.

Если функция f(x) имеет период а, то очевидно, что числа 2а, За, ..., па, ..., a также — а, —2а, ... в равной степени являются периодами. По большей части, говоря о периоде, имеют в виду наименьший из положительных периодов.

Подобные же соображения относятся и к функциям F(xt у) и их графикам.

Можно было бы рассмотреть свойство функций не изменяться при замене х на рх и у на qy

F(pxt qy) = F(x9 у), /(рлг) ==/(*),

чему соответствовало бы то обстоятельство, что график не изменяется при определённого рода растяжениях. Но это не представляет особенного интереса.

Рис. 9.

Установить сразу для данного графика наличие элементов симметрии или периодичности выгодно в том отношении, что позволяет

сократить последующую работу построения. Если установлено, что график имеет симметрию относительно вертикальной оси, то достаточно исследовать его лишь в одной (например, правой) полуплоскости; если установлено, что имеется симметрия относительно обеих осей, то можно ограничиться одним (например, первым) квадрантом; если известно, что график имеет период а, то достаточно рассмотреть его расположение в пределах одной «полосы периодов» (например, в полосе 0^х<а или —у <x^y); и т. п.

Рассмотрим, ради разъяснения предшествующего, несколько конкретных примеров.

Пример 1. График уравнения у = 4х2 имеет вертикальную ось симметрии. Переписав уравнение в виде -^==х*, видим, что из графика у = х* он получается посредством растяжения в 4 раза по направлению оси Oy. Написав то же уравнение в виде у = Uj^j , видим, что тот же график можно получить из графика у = х* посредством сжатия в 2 раза по направлению оси Ох.

Пример 2. График у = 2х — 1 получается из графика у = 2х посредством перенесения параллельно оси Oy на отрезок — 1. Написав уравнение в виде у = 2^х —~j, видим, что он может быть получен из того же графика посредством перенесения параллельно оси Ох на отрезок ~.

Пример 3. Уравнение Xs +.Уа = 2(3* + 4у) можно написать в виде

(*-3)2 + (у-4)2 = 25

(«выделение квадратов») и тогда видно, что его график получается из графика X* -{-у* = 25 посредством перенесения по направлению оси Ох на отрезок 3 и по направлению оси Oy на отрезок 4.

Пример 4. График уравнения у = 2*~3 получается из графика у = 2х посредством перенесения параллельно оси Ох на отрезок 3. Придав уравнению вид у = • 2х, убеждаемся, что он получается из того же графика посредством сжатия в 8 раз по направлению оси Oy.

Пример 5. Функции j> = cosat, 3j = shi2a;, у = cosх -f- sin2х имеют соответственно период 2%, % и 2тс. Первая из них — чётная, так что график симметричен относительно оси Oy, вторая — нечётная, так что график имеет центр симметрии в начале О. Третья не является ни чётной, ни нечётной.

Пример 6. Обе функции у = tg %х (нечётная) и у = tg2 пх (чётная) имеют один и тот же период 1.

Пример 7. График уравнения sin2 х + sin3 у = симметричен относительно обеих осей Ох и Oy и (следовательно) относительно центра О. Он имеет периоды {%, 0) и (0, тс) (и вообще — периоды вида (/ятс, лтс), где m и п — целые числа).

В заключение отметим одну теорему, касающуюся вращения.

IV. Графики G8 и G9 уравнений

получаются из графика G уравнения F (х, у) = 0 посредством вращения на 45° около начала О в прямом направлении (т. е. от оси Ох к Oy) или обратном (от оси Oy к оси Ох), как показано на рис. 10.

Это следует из общих формул поворота координатной системы на угол 91):

если положить

Рис. 10.

§ 4. Прямая и обратная функции

В связи с теоремами I—IV предыдущего параграфа поставим ещё вопрос: что делается с графиком уравнения F(x, у) = 0, если поменять местами буквы х и у?

Оказывается, что имеет место следующая теорема.

V. График G10 уравнения

F(y, х)=0

симметричен графику G уравнения F(x, у) = 0 относительно биссектрисы у = х первого координатного угла (рис. 11).

В самом деле, если точка М(х0, у0) принадлежит графику G, то точка M (yQ, х0) принадлежит графику G10; но точка M, очевидно, симметрична точке M относительно упомянутой биссектрисы.

В частности, если функция F(х, у) симметрична относительно переменных х и у, т. е. не изменяется при их перестановке

то график уравнения F (х, у) = 0 имеет прямую х=у осью симметрии.

Примерами могут служить уравнения

Рис. 11.

1) См. Э. э. м., кн. 4 «Геометрия, часть I», статья «Элементы аналитической геометрии».

Уравнение F(x, у) = 0 позволяет рассматривать у как некоторую (однозначную или многозначную, см. § 1) функцию переменной дг. Допустим точно так же, что оно позволяет рассматривать х как некоторую, однозначную или многозначную, функцию переменной у. Этим, вообще говоря, различным (с точки зрения выполняемых операций), функциям нередко дают наименования прямой и обратной.

Ограничиваясь простейшим случаем, предположим, что в пределах некоторой части плоскости (или, может быть, во всей плоскости) каждая прямая, параллельная оси Oy, имеет с графиком уравнения

F(x, у) = 0 (26)

только одну общую точку, и вместе с тем каждая прямая, параллельная оси Ох, также имеет с графиком только одну общую точку. Это значит, что в пределах названной части плоскости уравнение (26) может быть «решено относительно у>

У=/(х) (27)

и вместе с тем может быть «решено относительно х»

* = g{y). (28)

При этом мы ограничиваемся здесь предположением, что для определения значения х по данному значению у, или обратно, достаточно элементарных операций, так что функции, обозначенные буквами / и g, — элементарные. Тогда функцию / можно считать прямой, функцию g- — обратной (или, если угодно, наоборот). Так как согласно предположению три уравнения (26), (27) и (28) равносильны, то у них один и тот же график — скажем, G.

В уравнении (28) вопреки принятым нами обозначениям роль независимого переменного играет буква у, роль зависимого — буква л:. Поменяв местами эти буквы, мы получим такое же уравнение, с точки зрения выполняемых операций:

y=g(x), (29)

но график его будет уже другой: он согласно изложенному выше симметричен графику О относительно прямой х=у.

Мы приходим, таким образом, к важному выводу: если обозначать независимую переменную одной и той же буквой х, то график прямой функции y=f(x) и график обратной функции y = g(x) взаимно симметричны относительно прямой х=у.

Пример 1. Уравнение 2х — 5у + 10 = 0 (см. § 1) равносильно каждому из уравнений

Если в качестве прямой функции взять

то обратной функцией будет

Пример 2. Уравнению я3 — у = 0 можно придать вид

у = х2.

Решая его относительно лг, получаем:

Итак, если прямая функция есть f(x) = xs, то обратной является g(x) = \f х (радикал — в алгебраическом смысле). Или более точно: обратной функцией является g(x) = -\- ]/~х в верхней полуплоскости (у>0), g(x) = — \f X—в нижней (у<0) (здесь радикалы — в арифметическом смысле).

Пример 3. Если / W = Jqq (*3 + О» то

Пример 4. По отношению к функции

обратной функцией будет

Пример 5. Если в качестве прямой функции взять

то обратной функцией будет

§ 5. Элементарное исследование функций (постановка вопроса и некоторые общие приёмы)

Пусть дано уравнение вида

y=f(x). (30)

Под словом «исследование» функции f(x) (или её графика G) можно понимать выяснение самых разнообразных свойств этой функции. Однако чаще всего, говоря об «исследовании», имеют в виду найти ответы на следующие вопросы:

А. Обращается ли функция в нуль и в каких именно точках? В каких промежутках она положительна и в каких — отрицательна?

Б. Какова «изменяемость» функции? В каких промежутках функция возрастает и в каких — убывает? В каких точках она имеет наибольшее значение (максимум) и в каких — наименьшее (минимум)?

Термины «возрастает», «убывает», «максимум», «минимум» требуют объяснений.

Говорят, что функция f(x) в данном промежутке возрастает, если, каковы бы ни были два значения х из этого промежутка, например, х! и лг", как только

я'О", (31)

то непременно

/0*0 </(*"). (32)

(Тогда уже и обратно: из неравенства (32) следует неравенство (31)» так как, если бы было х"<хг, то из этого следовало бы, что fW)<Cf W)> а из равенства х" = х* следовало бы, что /(je") = /(^).)

Иначе можно сказать: свойство «возрастания» означает, что с увеличением независимой переменной увеличивается также и функция (зависимая переменная), и обратно; напротив, с уменьшением независимой переменной уменьшается и функция, и обратно. Таким образом, переменные х и у изменяются «в одном направлении»1).

Говорят, что функция f(x) в данном промежутке убывает, если, каковы бы ни были два числа х* и х" из этого промежутка, из неравенства

У<*" (33)

непременно следует неравенство

/(*')>/(*") (34)

(и тогда, конечно, обратно). Таким образом, в этом случае с увеличением независимой переменной х функция y=f(x) уменьшается, а с уменьшением х — увеличивается; переменные х и у изменяются «в разных направлениях»2).

1) С точки зрения теории неравенств вопрос целесообразно поставить в следующей форме: можно ли утверждать, что из неравенства вида А < В непременно вытекает неравенство / (А) </ (В)1 Ответ — утвердительный, если только в рассматриваемом промежутке функция / (л:) — возрастающая.

Примеры возрастающих функций: f(x)z=mx (/л>0), /(х) = х* для любого промежутка; f(x) = x2, /(л:)= Ух для промежутка О^жоо.

2) Если функция f (х) — убывающая (в рассматриваемом промежутке), то из неравенства А < В следует неравенство / (А) > / (В).

Примеры убывающих функций: f(x) = mx (т<0)в любом промежутке; при положительных значениях х.

Если a<c<b и если в промежутке от а до с функция f(x) возрастает, а в промежутке от с до Ь убывает, то в точке х = с функция f(x) имеет максимум; если, напротив, в промежутке от а до с функция убывает, а в промежутке от с до Ь возрастает, то в точке х = с она имеет минимум. Сказанное не является определением максимума и минимума: согласно точному, принятому в науке определению функция имеет максимум в точке х = с, если можно указать два таких числа а и Ь, что

1) а<с<£,

2) неравенство

№>/(х) (35)

имеет место для любого х, удовлетворяющего условиям а<х<Ь9 X ф с. Аналогично для минимума. В дальнейшем (см. § 46, пример 4) на примере будет обнаружено, что вторая формулировка несколько шире первой.

Геометрический смысл понятий возрастания и убывания, максимума и минимума достаточно очевиден и не требует пояснений.

Примечание 1. Понятия «возрастающая функция» и «убывающая функция» могут быть несколько расширены. Именно, можно предположить, что взамен неравенства (32), как следствие неравенства х'<х", должно выполняться менее стеснительное соотношение

f(x')^f(x"). (32')

Таким образом, предполагается, что с увеличением независимой переменной функция или возрастает или не изменяет значения (но не убывает): такую функцию называют неубывающей.

Всякая возрастающая функция есть вместе с тем неубывающая; обратное неверно.

Вот «житейский» пример неубывающей функции: х — время, /(^ — показание электросчётчика. С течением времени при затрате электроэнергии показание счётчика увеличивается; но если в течение какого-нибудь промежутка времени энергия не расходуется, то не изменяется и показание счётчика.

Можно доказать, что всякая элементарная неубывающая функция непременно должна быть возрастающей (если она не сводится к постоянной).

Точно так же функция, удовлетворяющая требованию

/(*')^/(*"), (34')

менее стеснительному, чем требование (34), называется невозрастаю щей.

Примечание 2. Понятия максимума и минимума также допускают некоторое расширение. Говорят, что в точке с функция f (х) имеет максимум в расширенном смысле, если взамен точного неравенства (35) в окрестности этой точки выполняется соотношение

/(«)S*/W- (35')

Аналогично для минимума.

Примечание 3. Изменение величины в одном и том же направлении (в сторону возрастания или в сторону убывания) или состояние неизменности в математике называется монотонным изменением. Монотонными называются также неубывающие и невозрастающие функции.

Эти термины сообщаются читателю для сведения: мы далеки от мысли о том, что было бы целесообразно вводить их в практику преподавания.

Примечание 4. Ради сокращения речи в математике термины «максимум» (maximum — наибольшее) и «минимум» (minimum — наименьшее) принято объединять в один термин «экстремум» (extremum — крайнее); в преподавание в средней школе этот термин также нет надобности вводить.

По поводу вопросов типа А (см. стр. 34) мы ограничимся здесь общим замечанием о том, что, желая выяснить знак функции fix), обыкновенно стараются данную формулу представить (подвергая тождественным преобразованиям) в виде произведения таких множителей, чтобы знак каждого из них мог быть легко установлен. Затем остаётся сослаться на элементарные свойства произведений:

1) произведение равно нулю в том и только в том случае, если хотя бы один из множителей равен нулю,

2) если все множители отличны от нуля, то произведение положительно или отрицательно, смотря по тому, будет ли число отрицательных множителей чётным или нечётным.

В иных случаях, когда такого рода разложение на множители не удаётся, пытаются свести вопросы типа А к вопросам типа Б.

Например, установив, что в рассматриваемом промежутке функция возрастает и что в начальной точке промежутка она принимает положительное значение, можно сейчас же заключить, что функция положительна во всём промежутке. Или более общо: к тому же самому заключению можно придти, если удастся установить, что положительным является наименьшее значение функции во всём рассматриваемом промежутке.

Заметим, что точки, в которых рассматриваемая функция принимает значение нуль, очень часто ради краткости и удобства речи называют нулями этой функции.

По поводу вопросов типа Б нужно сказать, что они принципиально сложнее: общий метод для их разрешения даётся в дифференциальном исчислении; исследование возрастания и убывания функции составляет одну из основных задач математического анализа. Метод дифференциального исчисления по существу заключается в том, что о возрастании и убывании функции судят по знаку некоторой другой функции1), называемой «производной» от функции (см. стр. 307).

Однако существуют и разнообразные, хотя отнюдь не исчерпывающие, элементарные методы исследования изменяемости функции, представляющие к тому же особый интерес с точки зрения школь-

1) То-есть вопрос типа Б сводится к вопросу типа А.

ной практики; на некоторых из них здесь уместно остановиться. Следует заметить, что в одних случаях вообще совершенно излишне обращаться к методам анализа, так как вопрос решают наиболее простым и естественным путём элементарными методами; в других же случаях, хотя элементарное решение и возможно, оно оказывается гораздо более сложным, чем решение методами анализа, а подчас носит и вовсе искусственный характер (см., например, конец § 10).

Элементарные методы основываются на том, что «изменяемость» простейших функций исследуется, исходя непосредственно из определения возрастания или убывания. Вместе с тем ряд теорем, почти очевидных, позволяет судить по «изменяемости» одних функций, более простых, об изменяемости других, более сложных.

Условимся ради краткости говорить, что в рассматриваемом промежутке функции и (х) и V (х) изменяются в одном и том же направлении, если обе они — возрастающие или обе — убывающие; напротив, будем говорить, что функции и(х) и v(x) изменяются в противоположных направлениях, если одна из функций — возрастающая, а другая — убывающая.

В таком случае:

1. Функции и(х) и и(х)-\-С (где С — постоянное число) изменяются в одном и том же направлении.

2 и 2'. Функции и (х) и С и (х) изменяются в одном и том же или в противоположных направлениях, смотря по тому, является ли С положительной или отрицательной постоянной.

3. Если функции и(х) и v(x) изменяются в одном и том же направлении, то сумма и (х) -}- v (х) изменяется в том же направлении.

4. Если положительные функции и(х) и v(х) изменяются в одном и том же направлении, то произведение и (х) v (х) изменяется в том же направлении.

4'. Напротив, если отрицательные функции и (х) и v (х) изменяются в одном и том же направлении, то произведение и (х) v (х) изменяется в противоположном направлении.

5 и 5'. В частности, если и (х) — положительная функция, то и2 (х) изменяется в том же направлении, что и и (х)\ если и (х) — отрицательная функция, то и2 (х) изменяется в направлении противоположном.

6. Функции и (х) и — и (х) изменяются в противоположных направлениях.

7. Если функция а(х) положительна в некотором промежутке, то функции и(х) и в этом промежутке изменяются в противоположных направлениях.

7\ Если функция и (х) отрицательна в некотором промежутке, то 11 (х) и тг/^л точно так же изменяются в противоположных направлениях,

Таким образом, относительно всякого промежутка, в котором функция к (х)9 не обращаясь в нуль, сохраняет один и тот же знак, можно сказать, что функции и (х) и —Ц изменяются в противоположных направлениях.

8. Если функция и(х)— положительная, то функции и(х) и *\[и (лг) изменяются в одном и том же направлении (здесь j/ü — арифметическое значение корня).

9. «Сложная функция» u(v(x)) возрастает, если обе функции и(х) и v (х) изменяются в одном и том же направлении; убывает — если и (х) и v (лг) изменяются в разных направлениях1).

Доказательства всех этих теорем однотипны и крайне элементарны; дело сводится к использованию определения убывания или возрастания функции, с привлечением простейших свойств неравенств. В качестве примера приведём одно из них, именно, относящееся к теореме 3, с допущением возрастания.

Сумма двух возрастающих функций есть функция возрастающая.

Доказательство. Пусть f (х) = и (х)-\-v(x), причём функции и(х) и v (х) — возрастающие в некотором промежутке Предположим, далее, чт о х и х" — какие угодно числа из этого промежутка, причём х1 < х".

По предположению имеем:

и(х')<и(х"), v(x')<v(x").

Складывая эти неравенства, получаем

и (х') + v (X?) < и (хи) + v (х"),

/(*')</(*").

Теоремами 1—8 в дальнейшем мы будем пользоваться большей частью без соответствующих ссылок.

В порядке примечания не мешает отметить, что «исследование» функций не всегда ограничивается вопросами, сформулированными в пунктах А и Б; однако оно очень часто может быть сведено к ответу на эти вопросы.

Приведём пример. Пусть, кроме исследуемого графика G функции у=/(х), имеется уже хорошо известный нам график G0 функции y=fQ(x) (рис. 12). Нас могли бы интересовать такие вопросы:

Рис. 12.

1) Точнее: нужно рассматривать изменяемость функции и(х) в том промежутке, какому принадлежат значения функции v(x) в процессе изменения переменной х.

А'. Пересекается ли график G с графиком G0 и в каких именно точках? В каких промежутках график G лежит выше графика G0 и в каких — ниже?

Б'. Как изменяется (с увеличением х) направленный вертикальный отрезок М0М между точкой пересечения с графиком GQ и точкой пересечения с графиком G? В каких промежутках он возрастает? В каких убывает? В каких точках принимает наибольшее и в каких — наименьшее значение?

Легко понять, что вопросы А' и Бг сводятся к вопросам А и Б, если только вместо самой функции f{x) ввести разность f(x) —

При исследовании различных свойств данной функции формулу, с помощью которой она задана, часто приходится подвергать тем или иным тождественным преобразованиям. Выбор преобразования в каждом данном случае зависит от того свойства функции, которое имеется в виду установить.

ГЛАВА II

ОБЗОР ЭЛЕМЕНТАРНЫХ ФУНКЦИЙ И ИХ ГРАФИКОВ

§ 6. Классификация рациональных функций

Рациональными называются такие функции, значения которых можно найти, не совершая над заданным значением независимой переменной х и числами, которые предполагаются постоянными, никаких операций, кроме четырёх действий арифметики (сложение, вычитание, умножение, деление). Из числа рациональных функций целыми1) называются такие, значения которых можно получить из переменной х и постоянных чисел посредством не более чем трёх операций: сложения, вычитания и умножения. Упоминание о вычитании не обязательно, так как вычесть число или буквенное выражение— значит прибавить его, предварительно умножив на—1. Те рациональные функции, которые не являются целыми, носят название дробных. Примеры целых рациональных функций:

Примеры дробных рациональных функций:

Методом полной математической индукции легко установить: 1) Всякая целая рациональная функция Р (х) может быть представлена в виде многочлена, расположенного по убывающим степеням х:

Число п называется степенью многочлена Р (х).

1) Вместо «целая рациональная функция» принято говорить короче «рациональный многочлен», или «полином».

2) Имеется в виду арифметическое значение корня.

3) Ограничение \х\ ^ 1 (которое кажется необходимым) будет снято в статье «Элементарные функции комплексного переменного», см. стр. 511.

2) Всякая дробная рациональная функция R(x) может быть представлена в виде отношения двух многочленов, расположенных по убывающим степеням х (без общих множителей):

Под степенью дробной рациональной функции понимают наибольшую из степеней числителя Р(х) и знаменателя Q(x)1).

При доказательстве предложения 1) индукция производится по числу операций. Обозначим это число через N. Заметим предварительно, что а) сумма, б) разность, в) произведение двух многочленов, расположенных по убывающим степеням л:, могут быть также представлены в виде многочлена, расположенного по убывающим степеням х. Допустим теперь, что предложение 1) справедливо для всякой целой рациональной функции, «составленное из переменной х и постоянных посредством N операций, и докажем, что оно будет справедливо также для иелой рациональной функции, «составленной» таким же образом посредством N-\- 1 операций. Последняя (ЛГ-)-1)-я операция, указываемая выражением, с помощью которого задана наша функция, не может быть ничем иным, как только сложением, вычитанием или умножением; но так как каждая из двух целых рациональных функций, над которыми нужно произвести названную операцию, «составлена» не более как из N операций, то каждая из них может быть представлена в виде многочлена, расположенного по убывающим степеням х. Значит, на основании предварительного замечания данная функция также может быть представлена в виде многочлена, расположенного по степеням х.

Остаётся заметить, что для случая N= \ утверждение, очевидно, справедливо.

Предложение 2) доказывается также посредством индукции, но уже по числу делений. Предварительно нужно заметить, что а) сумма, б) разность, в) произведение, г) отношение двух дробей, у которых числитель и знаменатель— многочлены, также могут быть представлены в виде дроби того же вида.

§ 7. Целые положительные степени

Рассмотрим графики функций

X, Х^у Х^у ... , X*1, . . . (1)

График Gi функции

у = х (2)

— совокупность точек, у которых абсцисса равна ординате, представляет собой биссектрису первого и третьего координатных углов,

1) Следует не упускать из виду различие между степенью рациональной функции и порядком алгебраической кривой — графика этой функции (см. ниже § 17). С геометрической точки зрения порядок кривой есть максимальное число точек её пересечения с произвольной прямой, а степень функции — максимальное число точек пересечения её графика с произвольной горизонтальной прямой (включая и «мнимые» точки пересечения). Для целых функций степень и порядок графика совпадают, для дробных они могут различаться. Например, дробная функция у == ^ — первой степени, а её график—гипербола — кривая второго порядка.

т. е. прямую линию, проходящую через начало О и образующую угол в 45° с осью Ох (рис. 13, а). График G2 функции

у=х* (3)

(рис. 13, б) носит название параболы. (В расширенном смысле параболами называют иногда графики произвольных рациональных многочленов.) Он симметричен относительно оси Oy, так как функция л:2 — чётная. Он весь лежит в верхней полуплоскости (так как х1 ^ 0), кроме одной точки — начала О, вершины параболы, в которой кривая пересекается со своей осью симметрии. Функция х,— очевидно, возрастающая; значит, при х>0 функция х* — также возрастающая. Напротив, при х < 0 она — убывающая по свойству симметрии (или вследствие предложения 4' на стр. 38). Чтобы выяснить взаимное расположение графиков (2) и (3), рассмотрим разность лг2— X. Разлагая её на множители

л;2 — х = х (х — 1),

видим, что графики G2 и Gx имеют две общие точки: начало О (0, 0) и точку Р (1, 1). При этом, если х> 1, то л:2 — дг>0, так что G2 лежит выше Ог; если 0<х<1, то л:2 — х<0 и G2 ниже G,; если X < 0, то ясно, что G2 выше Qv При очень малых значениях \х\ отношение

очень мало по абсолютной величине, и потому около вершины кривая тесно примыкает к горизонтальной оси («касается» её, см. стр. 309). При очень больших значениях \х\ это отношение, напротив, очень велико, что говорит о быстром возрастании х2. График G3 функции

у = хг (4)

Рис. 13.

(«кубическая парабола») имеет центр симметрии О (рис. 13, в), так как функция хъ— нечётная. Подобно Ov он расположен в первом и третьем квадрантах. С графиком Gg он имеет общие точки О и Р, причём лежит ещё ниже его в промежутке 0<лг<1 и ещё выше его в промежутке 1 <Сх<ъо. Около начала О он примыкает к оси Ох ещё теснее, чем G3 (в точке О имеется «касание второго порядка», причём касательная пересекает кривую); при неограниченном возрастании X функция хъ растёт еще быстрее, чем je2. Обозначая вообще через Оп график функции

у =хп

(при любом целом положительном п), можно установить, что он проходит через точки О и Р; при п чётном он имеет ось. симметрии Oy

Рис. 14.

и располагается в первом и втором квадрантах, а при п нечётном имеет центр симметрии О и располагается в первом и третьем квадрантах. В промежутке 0<х<1 значения функций (1) при данном значении х образуют убывающую геометрическую прогрессию: из последовательности графиков

Оц G2, Gz, . .. , Gn, . . . (5)

каждый следующий лежит ниже предыдущего, всё теснее примыкая к горизонтальной оси; в промежутке 1 <х<оо эти же значения образуют возрастающую геометрическую прогрессию, и из графиков (1) каждый следующий лежит выше предыдущего.

На рис. 14 изображены графики функций лг, х2, х*, л:4, xö, х6 из совокупности (1).

§ 8. Многочлены первой степени (линейные функции)

Линейная функция имеет общий вид

у = ах -\- Ъ (а ф 0). (6)

Из уравнения видно, что её график может быть получен из графика прямой у = X посредством растяжения в | а | раз по направлению оси Oy, с последующим (в случае а < 0) симметричным отражением относительно оси Oy и затем — перенесением параллельно оси Oy на отрезок, равный Ь.

В самом деле, рассмотрим последовательно графики уравнений

1) У = х,

2) у = \а\х$

3) у = ах,

4) у = ах -j- b.

График 1) нам известен: это — биссектриса 1-го и 3-го координатных углов. Уравнению 2) можно придать вид у^у =ху откуда ясно (см. § 3, III. б), что его график получается из графика 1) посредством растяжения в | а \ раз по направлению оси Oy. График 3) в случае а > 0 ничем не отличается от графика 2); в случае а <С 0 уравнению 3) можно придать вид у = — ) а \ х или ( —у) = | а \ х, откуда ясно, что график 3) получается в этом случае из графика 2) посредством симметричного отражения относительно оси Ох. Наконец, легко понять (§ 3, II. б), что график 4) получается из графика 3) посредством перенесения параллельно оси Oy на отрезок, равный Ь1).

1) В дальнейшем рассуждения, подобные предыдущему, будут опускаться, и вместо них будут приведены лишь ссылки на пункты § 3,

Запись

показывает, что график уравнения (6) может быть также получен посредством перенесения графика у = х параллельно оси Ох на отрезок, равный ^--jj-j , и последующего растяжения в \а\ раз по направлению оси Oy, с симметричным отражением (в случае а<0) относительно оси Ох.

Так или иначе, ясно, что график линейной функции (6) — наклонная (т. е. не параллельная ни одной из координатных осей) прямая линия.

Коэффициент а в уравнении (6) называется наклоном (или подъёмом) прямой: его называют также угловым коэффициентом. Он представляет собой тангенс угла, который прямая образует с положительным направлением оси Ох: действительно, если а = 1, это очевидно, так как в этом случае упомянутый угол составляет 45°; с другой стороны, при растяжении в | а | раз по направлению оси Oy тангенс увеличивается во столько же раз, а при отражении относительно оси Ох меняется знак как угла, так и его тангенса.

Свободный член Ъ представляет собой значение функции при х=0, т. е. «отрезок, который прямая отсекает на оси Oy», или, точнее, ординату точки пересечения прямой с этой осью.

Что касается точки пересечения с осью Ох, то её абсцисса равна (— A J .

Рассматриваемая функция, как легко понять, — возрастающая, если а > 0, и убывающая, если а < 0.

В случае а = 0 линейная функция сводится к постоянной («многочлен нулевой степени»); её график — прямая, параллельная оси Ох.

§ 9. Многочлены (трёхчлены) второй степени

Трёхчлен второй степени имеет общий вид:

у = ах* -f Ьх + с (аф 0). (7)

Выполним в правой части следующие преобразования: вынесем а за скобки, затем «выделим точный квадрат». Запись

(8)

показывает, что график уравнения (7) получается из параболы у = х* посредством последовательного выполнения следующих преобразований:

1) перенесения параллельно оси Ох на отрезок

2) перенесения параллельно оси С?у на отрезок —^— ;

3) растяжения в \а\ раз по направлению оси Oy с отражением (в случае а < 0) относительно оси Ох.

Уравнению (7) можно также придать вид

(9)

и отсюда следует, что возможен иной план преобразований:

1) перенесение параллельно оси Ох на отрезок

2) растяжение в | а | раз по направлению оси Oy с отражением (в случае а <С 0) относительно оси Ох,

3) перенесение параллельно оси Oy на отрезок

Таким образом, график трёхчлена второй степени, заданного общим уравнением (7), есть парабола, конгруэнтная параболе

получающейся из основной параболы у = х* посредством растяжения в I а I раз по направлению оси Oy.

Независимо от описанных геометрических преобразований, из записи (8) или (9) видно (см. § 5), что в случае а > 0 функция ах* -j- bx -|- с при лг<—убывает, при х>—~ возрастает, в точке х = —имеет минимум, значение которого равно—-ц—; в случае а<0, напротив, при х< — ^ она возрастает, при х> — ^ убывает, в точке х = — -g— имеет максимум, значение которого равно - .

При условии, что b отлично от нуля, перенесение параболы совершается влево, если знаки b и а одинаковы; вправо — если эти знаки различны. При Ь, равном нулю, горизонтальное перенесение отсутствует.

Вертикальное перенесение отсутствует в том случае, если выражение

D — 4ас — Ь*

(дискриминант трёхчлена) оказывается равным нулю; тогда, как показывает формула (8) или (9), функция ах* -\- Ьх -4- с сохраняет при всех значениях х, кроме х = — , один и тот же знак, именно — тот же, что и коэффициент а, и лишь при х = — обращается в нуль. Парабола касается оси Ох.

Если D положительно, то сумма в квадратных скобках в формуле (8) при всех значениях х положительна, и значит, наша функция сохраняет тот же знак, что имеет а, при всех значениях х без исключения. Парабола не пересекается с осью Ох.

Если D отрицательно, то выражение в квадратных скобках можно рассматривать как «разность квадратов», и тогда, полагая

можно представить трёхчлен в виде произведения

ах* -j- bx с = а (х — хх) (х — х2) (xt < х%).

Отсюда видно, что трёхчлен обращается в нуль в точках x = xt и X = х%. Значит, парабола в этих двух точках пересекает ось Ох. Что касается знака трёхчлена, то он не при всех значениях х один и тот же: в случае а>0 знак положителен при х>х^ и x<xv и отрицателен при хх<х <x%, при а<0 — наоборот. Всё это легко истолковывается геометрически.

§ 10. Многочлены третьей степени

Общий вид многочлена третьей степени:

у = ах*-{-Ьх*схd (а ^ 0). (10)

Вынесем а за скобки и «выделим точный куб»

(11)

где ради краткости положено

Далее, в случае D ф 0 можно преобразовать данное выражение ещё следующим образом:

(12)

причём следует перед вторым членом взять знак -}- или —, смотря по тому, будет ли D "> 0 или D <Г 0.

Если же D = 0, то формула (11) принимает вид

(13)

Глядя на формулы (12) и (13), можно сделать заключение, что посредством элементарных преобразований (см. § 3, I—III) график данного многочлена третьей степени общего вида может быть получен из графиков следующих простейших многочленов:

(а) у=хг-{-х, (?) у=х*-х, (Т) У = х\

Именно, в случае D -ф О данный график получается из графиков (а) или (ß) (смотря по тому, будет ли D>0 или ö<0) посредством следующих преобразований:

1) растяжения в \/\D \ раз по направлению оси Ох,

2) перенесения параллельно оси Ох на отрезок

3) перенесения параллельно оси Oy на отрезок

4) растяжения в | а \ • \ D |3/* раз по направлению оси Oy, с отражением (в случае а<0) относительно оси Ох.

В случае же D = 0 рассматриваемый график получается из графика (у) посредством

1) перенесения параллельно оси Ох на отрезок

2) перенесения параллельно оси Oy на отрезок D',

3) растяжения в | а \ раз по направлению оси Oy, с отражением (в случае а<0) относительно оси Ох.

Итак, чтобы отдать себе отчёт в расположении графиков функций вида (10) и в случае надобности провести их элементарное исследование, достаточно рассмотреть кривые (а) и (ß); что касается кривой (у), то о ней уже было сказано раньше (см. § 7).

Обе функции (а) и (ß)— нечётные, так что графики их (рис. 15) симметричны относительно центра О. При х>0 функция (а) — возрастающая (см. § 5), и её график, очевидно, лежит выше прямой у = х, тесно к ней примыкая около начала О (касаясь её в этой точке). Поведение графика (ß) сложнее: разложение на множители

X* — X = X (х — 1 ) (х -j- 1 )

показывает, что имеются пересечения с осью Ох в точках х=0, х—1 и х = —1. Ограничимся рассмотрением положительных значений X. Мы видим, что X* — лг>0 при х>1, но хъ—x<d0 при 0<*<1.

Вместе с тем непосредственно ясно, что график лежит выше прямой у = — X и касается её в начале координат. Из преобразования

(14)

можно заключить, что при

функция имеет минимум, равный

отсюда же видно, что она возрастает при

(см. § 5).

Рис. 15.

Доказать элементарно, что функция f(x) = x* — х убывает в промежутке 0<л:<-^г==, можно проще всего, основываясь непосредственно на определении. Считая, что величины

удовлетворяют неравенствам

так что

мы получаем

и так как

то выражение в фигурных скобках положительно и, следовательно, разность f(x")—f(x') имеет знак, противоположный знаку А = л:"— х!1).

§ 11. Биквадратные многочлены

Из многочленов четвёртой степени мы остановимся только на биквадратных, т. е. на многочленах вида

у = ах*-\-Ьх*-\-с (а^О). (15)

Такие многочлены — чётные функции: их графики симметричны относительно оси Oy.

Как показывает преобразование

(16)

в случае Ьф§ график многочлена (15) получается из кривых

(а) у=я*-\-х\ (ß) у = хь — х*

посредством одних лишь растяжений по направлению обеих осей и перенесения параллельно оси Oy (с отражением относительно оси Ох или без отражения); в случае Ь = 0 то же получается, очевидно, из кривой

(Т) У=х".

Так как функции х* и xL положительные и возрастающие при х>0, причём графики их в начале О касаются оси Ох, то и функция (а) — их сумма — обладает теми же свойствами (рис. 16).

Что касается функции (ß), то она, как видно из разложения

*4 — х* = х* {х- 1) (х+ 1),

обращается в нуль в точке х = 0 (график касается оси Ох) и в точках x = ztl (см. рис. 16).

Далее, функцию (а) можно представить в виде у — у(х2), где положено ф(н) = к2 — к. При возрастании и от 0 до i функция

1) В предыдущем изложении не указано, откуда взялось преобразование (14). Это свидетельствует об искусственном характере употребляемого нами элементарного метода. Полезно обратить внимание на то обстоятельство, что дифференциальное исчисление даёт единый и вполне естественный метод для нахождения максимумов и минимумов, а также чрезвычайно облегчает исследование изменяемости функций.

9 (к) убывает от 0 до —~t а при возрастании а от у до бесконечности она возрастает от - до бесконечности1); значит (см. § 5) при возрастании х(= у[и ) от 0 до —^ функция 3/ = 9 (х2) убывает от 0 до—у, а при возрастании от до бесконечности — возрастает от--т д0 бесконечности.

Рис. 16.

§ 12. Многочлены высших степеней

Главная трудность при исследовании знака многочленов вида y = axn-{-bxn-l-\-...-}-kx-{-l (а^О; я^4) (17) заключается в их разложении на множители, что в свою очередь связано с нахождением всех (по крайней мере действительных) корней алгебраического уравнения

ахп-{-Ьхп-1 + + +1 = 0. (18)

Допустим (не ограничивая существенно общности), что старший коэффициент а равен 1.

Из алгебры известно, что после объединения попарно-сопряжённых множителей рассматриваемый многочлен может быть представлен в виде произведения

у = (х—а)х(х — №(х — 1У.~№+Р*+9У — (19)

где а, ß,... — действительные, различные между собой, корни уравнения, X, р,... — их кратности (целые положительные числа), и трёхчлены второй степени вида х1 -\-px-\-q... имеют сопряжённые мнимые корни.

1) В самом деле (см. § 9),

Так как трёхчлены вида х2 -(-рх -\- q постоянно сохраняют положительный знак, то знак многочлена у зависит исключительно от знаков множителей вида (х — а)\

Предположим для определённости, что корни а, ß,... расположены в порядке убывания: а> ß> у}> ... ; представим себе теперь, что независимая переменная х, постепенно убывая, проходит через значения х = а, je=ß, ... Пока х больше, чем а, все множители нашего произведения положительны; значит, положительным остаётся и сам многочлен. Но когда х прошло через значение а, разность X — а становится отрицательной; сохраняет ли при этом множитель (х — а)х прежний знак или меняет его — зависит от того, является ли кратность X чётным или нечётным числом. Так продолжается и дальше, при прохождении х через значение ß и т. д.

Из этих соображений вытекает такой результат, касающийся графика нашего многочлена: график располагается выше оси Ох при х>а; он расположен выше или ниже оси Ох при ß<<Ca» смотря по тому, является ли кратность X чётной или нечётной. При Y<<Cß это уже зависит от чётности X-j-ji, и т. д. Сумма степеней всех множителей в формуле ( 19) X —|— |х —|— v —... —f- 2р —|— ... равна степени п данного многочлена. Если п — чётное, то левее наименьшего из корней (как и правее наибольшего) график лежит выше оси Ох; если п — нечётное, то левее наименьшего из корней он лежит ниже оси Ох. Это справедливо при любом положительном коэффициенте а; при отрицательных а всё происходит наоборот.

Отметим, что в точках, являющихся простыми (т. е. первой кратности) корнями данного многочлена, график пересекает ось Ох без касания; в точках, являющихся корнями чётной кратности, имеет место касание без пересечения с осью; а в точках, являющихся корнями нечётной кратности, начиная с третьей, имеет место касание с пересечением (как и для функции у = хп). Строгое доказательство читатель легко мог бы провести, пользуясь методами дифференциального исчисления.

Возрастание и убывание многочлена общего вида поддаётся элементарному исследованию лишь в частных случаях. Преобразование

(20)

показывает, что при неограниченном возрастании \х\ абсолютная величина функции у также возрастает неограниченно, и тем быстрее, чем больше степень п.

При исследовании многочленов возможны упрощения в том случае, если данный многочлен представляет собой чётную или нечётную функцию. Легко понять, что многочлен есть чётная функция переменной х в том (и только в том) случае, если он содержит лишь чётные степени х, и нечётная функция переменной х в том (и только в том) случае, если содержит лишь нечётные степени х,

§ 13. Целые отрицательные степени

Рассмотрим теперь графики 0lt G2, G3, ... , Оп, ... простейших дробных функций

Начнём с функции

(21)

возникающей при решении уравнения второго порядка

ху=1. (22)

Её график (рис. 17, а) можно построить, исходя из графика прямой у = х, в соответствии с указаниями 6, § 2. Имеется центральная симметрия относительно начала координат О; имеется также симметрия относительно прямой у = х (см. § 4); точка х = 0 — особенная в том смысле, что ей не соответствует никакое значение у: на оси Oy нет ни одной точки графика. Эта точка называется «точкой разрыва» (см. гл. III, § 42); в ней функция у = «теряет смысл». Пусть х>0. Так как функция у — х — возрастающая, то функция у = —, являющаяся величиной, ей обратной, — убывающая. График проходит через точку (1,1); с неограниченным увеличением X обратная величина — становится неограниченно малой — график приближается к оси Ох (как говорят, «асимптотически»); с неограниченным уменьшением х обратная величина -~ неограниченно увеличивается — график, приближаясь к оси Oy, поднимается вверх, «уходит в бесконечность». Можно сказать иначе: уходя в бес-

Рис. 17.

конечность, график приближается к оси «асимптотически». Вследствие симметрии кривая в целом состоит из двух «ветвей»: одна из них лежит в первом, другая в третьем квадранте (см. рис. 17, а). Название кривой — гипербола. Оси Ох и Oy — её асимптоты1).

Перейдём к функции

(23)

которая может быть рассматриваема как обратная величина по отношению к функции у = х*. Симметрии относительно биссектрисы у = х в данном случае уже нет; при х> 1 мы имеем х*>х и , так что график G2 лежит ниже графика Ot (теснее примыкает к оси Ох); при 0<лг<1 мы имеем, напротив, х*<х и Af> —, так что G2 лежит выше Ох (поднимается кверху быстрее).

Вместо центральной симметрии имеется осевая симметрия относительно оси Oy: таким образом, график G2 состоит из двух «ветвей», расположенных соответственно в первом и втором квадрантах (рис. 17,(в).

Рассматривая следующие функции у = ^- и их графики Оп ^/г = 3, 4, ... ; график функции у=-^. изображён на рис. 17,ej, мы видим, что все эти функции, как и две уже рассмотренные, «теряют смысл» при х = О, являются чётными или нечётными, смотря по чётности п, и при х>0 обладают общим свойством — убывать неограниченно при неограниченном возрастании х и возрастать неограниченно при его неограниченном убывании. Так как

то отсюда следует, что

Геометрически всё это означает: каково бы ни было #, в первом квадранте кривая G„+1 при х> 1 лежит ниже кривой Gn, а при

1) См. Э.э. м., кн. 4, Геометрия, ч. I, статья «Элементы аналитической геометрии».

0<<О — выше Gn. Все они «асимптотически» приближаются к осям Ох и Oy (рис. 18).

Рис. 18.

Каждая из кривых Gn имеет ещё вторую ветвь, симметричную первой (относительно Oy или О) и лежащую, смотря по чётности п, во втором или третьем квадрантах (см. рис. 18).

Кривые Gn (я = 3, 4, ...) иногда называются гиперболами высших порядков.

§ 14. Дробные линейные функции

Предположим, что данная дробь

(24)

несократима (ad — ЪсфЩ и не сводится к целой линейной функции (с -ф 0). Тогда, выделяя целую часть и вынося затем за

скобки коэффициент при х в знаменателе, ей можно придать вид

(25)

Эта запись свидетельствует о том, что график функции можно получить из графика -i- посредством следующих элементарных преобразований:

1) растяжения в раз в направлении оси Oy, с отражением (в случае ad— bc>0) относительно оси Ох,

2) перенесения параллельно оси Ох на отрезок, равный у—-^j,

3) перенесения параллельно оси Oy на отрезок, равный ~.

Таким образом, уравнение (24) также представляет гиперболу (обыкновенную, второго порядка).

Функция «теряет смысл» (не имеет никакого значения, перестаёт «существовать») в точке В промежутках она сплошь возрастает (если ad — bc>0) или сплошь убывает (если ad — 6с<О)1). При неограниченном увеличении \х\ значения функции неограниченно приближаются к это видно из преобразования (25) или, проще, из преобразования

Точка (не принадлежащая кривой!) представляет собой её центр (центр симметрии); прямые -её асимптоты. Итак, для нахождения асимптот кривой (24) достаточно выполнить преобразование (25).

1) Мы будем пользоваться сокращённым оборотом речи «функция возрастает (или убывает) всюду, кроме точки разрыва».

§ 15. Дробные функции второй степени

Исследование изменяемости несократимых дробей вида

(26)

удаётся провести элементарными методами, хотя выполняемое при этом тождественное преобразование частично носит более или менее искусственный характер. Если d Ф О, то следует сначала исключить целую часть из дроби, затем вместо остающейся дроби ввести величину, ей обратную:

(27)

(оба выражения bd — ае и cd — af не обращаются одновременно в 0, иначе данная дробь не была бы несократимой). Дело сводится, таким образом, к исследованию дроби, у которой числитель — многочлен второй степени, а знаменатель — первой степени. То же самое мы имели бы, допустив сразу, что ^ = 0. Итак, рассмотрим дробь вида

(28)

причём допустим, что тфО и г ф 0. Мы исключаем, таким образом, случаи, уже рассмотренные раньше (§§ 14 и 9). Вынося за скобки г и положив

мы можем расположить числитель по степеням х — а2):

Затем выделим целую часть, вынося

за скобки:

(29)

1) Запись а*-\-а*ф0 нужно понимать в её точном смысле: она означает, что хотя бы один из коэффициентов and отличен от нуля.

2) Для этого проще всего, введя новую переменную хи связанную с х равенствами х1 = х — а, х = хх-\-а, расположить числитель по степеням Х\»

Величина А = а34- — а-4-— отлична от нуля1), но возможны два разных случая:

I А<0

и

II Л>0.

В случае I мы придадим формуле (29) вид

откуда ясно, что график уравнения (28) в этом случае получается из графика уравнения

(I)

посредством последовательного выполнения следующих преобразований:

1) растяжения в раз по направлению оси Одг,

2) растяжения в раз по направлению оси Oy,

3) перенесения параллельно оси Ох на отрезок

4) перенесения параллельно оси Oy на отрезок

В случае же II, имея в виду, что | А \ = А, мы напишем:

откуда ясно, что график (28) в этом случае посредством тех же преобразований, что и раньше, получается из графика

(II)

Рассмотрим подробнее графики (I) и (И). Уравнению (I) можно придать вид

или

(30)

Функция (I) обращается в нуль в точках х=\ и х = —1 и теряет смысл (имеет «разрыв») в точке х=0 (рис. 19, а). Иссле-

1) Действительно, а есть корень знаменателя дроби (28); если бы было ша24-ш+р = 0, то а было бы также корнем числителя, и тогда дробь была бы сократима на х — а.

дование её знака не представляет затруднений. Так как функция X — всюду возрастающая, а функция ^—— возрастающая всюду, кроме точки разрыва х = 0, то из формулы (I) следует (§ 5, п. 3), что и о функции х--- также можно утверждать, что она — возрастающая всюду, кроме точки разрыва х=0.

Рис. 19.

Что касается функции, заданной уравнением (II), то она также имеет разрыв в точке х = 0, но в нуль нигде не обращается (рис. 19, tf). Чтобы исследовать её изменяемость при х>0, придадим уравнению (II) вид

(31)

Эта запись показывает, что данная функция в точке х=1 принимает значение 2, при всех же прочих положительных значениях х принимает значения, большие чем 2; следовательно, она имеет минимум в точке х=1. Вместе с тем, так как в промежутке К^х^оо функции Ух и I--1=]—возрастающие (§ 5, п.п. 8, 7, 6, 3), то и сумма их Ух--7= — также возрастающая; так как, кроме того, Ух--— > 0, то возрастающей является (§ 5, п. 5) и функция [Ух--— ) , следовательно, и функция, заданная уравнением (31), т. е. х-\--. Аналогично устанавливается, что функ-

ция je —{—убывает в промежутке 0 <х <1: нужно только уравнению (II) придать вид

(32)

Необходимость подробного исследования отрицательных значений X устраняется для функций (I) и (II) тем, что обе они — нечётные, откуда следует симметрия графика относительно центра О. Нужно отметить ещё присутствие в обоих случаях наклонной асимптоты у = х (см. рис. 19, а и б)\ это значит, что при неограниченном возрастании х разность ординат [x±^j—х неограниченно убывает.

Мы полностью выяснили поведение функций вида (28), т. е. функций вида (26) с ограничением d = 0. Чтобы исследовать общий случай, достаточно констатировать, ссылаясь на формулу (27), что график функции общего вида (26) получается из графика функции вида (28) (в случае bd — ас ф 0) или функции вида

у = ах* -f- bx -|- с (афЩ

(в случае bd — ас = 0, cd — а/^0) посредством следующих преобразований:

1) нужно от графика данной функции перейти к графику функции, представляющей величину, ей обратную (см. § 2),

2) затем выполнить перенесение параллельно оси Oy на отрезок -г. а

Тем самым с помощью (§ 5, 1—9) определяется характер изменяемости рассматриваемой функции.

Исследование знака этой функции, а также определение тех точек, где она обращается в нуль или терпит разрыв, — всё это не представляет затруднений, если только степень числителя и знаменателя не выше чем 2.

Пример 1.

(33)

Запись

позволяет установить, что график пересекает ось Ох в точках х = — 2 и л: = + 2 и имеет разрывы в точках х = —1 и х = 3; она же даёт возможность исследовать знак у. Кроме того, из записи

видно, что при неограниченном увеличении |л'| величина у приближается к 1: прямая у = \ является асимптотой. Сделав дополнительно к этому 2—3 точечные подстановки, мы намечаем график, изображённый на рис. 20.

Рис. 20.

Однако для того, чтобы убедиться в том, что функция (33) всюду, кроме двух точек разрыва, убывает, нужно прибегнуть к изложенной выше теории. Следуя ей, мы приходим к записи

и тогда для получения нужного заключения остаётся непосредственно сослаться на теоремы § 5. Пример 2.

Рис. 21.

Числитель и знаменатель всегда положительны; следовательно, всегда у > 0. Прямая у = 1 — асимптота, как и в примере 1. Изложенная теория

приводит к записи

Функция X + — убывает при | х | < 1 (кроме точки разрыва) и возрастает при |л:|>1; отсюда следует, что функция^ возрастает при |л:|<1 и убывает при |л:|> 1, но никаких разрывов у неё уже нет (рис. 21).

Пример 3.

Рис. 22.

Знак функции всегда положителен; характер изменяемости следует непосредственно из теорем § 5 (рис. 22).

Пример 4.

Рис. 23.

Знак функции меняется при х = ± 1 (рис. 23); для исследования изменяемости достаточно согласно теории выделить целую часть:

§ 16. Дробные рациональные функции (общий случай)

Всякая дробная рациональная функция y — R(x) может быть представлена в виде отношения двух многочленов, не имеющих общих корней,

где

Возникающие при разложении на множители трёхчлены второй степени с мнимыми корнями х* -\- рх -\- q, х* -}- р'х -{-q\ ... всегда сохраняют положительный знак. Все корни числителя и знаменателя предполагаются различными. Старшие коэффициенты а и а! (несущественно ограничивая общность) можно для простоты принять равными единице. Итак,

(34)

Представим себе, что числа а, ß, ..., а', ßr, ..., являющиеся действительными корнями числителя и знаменателя, будучи расположены в порядке возрастания, разбивают ось Ох на некоторое число промежутков. Взяв какое-нибудь значение х в одном из промежутков, легко сосчитаем, с учётом кратности, число множителей в числителе и знаменателе дроби, имеющих отрицательный знак при этом значении х: знак функции будет тот или иной в зависимости от чётности этого числа. Названное число множителей равно числу действительных корней числителя и знаменателя нечётной кратности, превышающих рассматриваемое значение х: оно, очевидно, не зависит от выбора значения х в данном промежутке и зависит, таким образом, только от промежутка. Исходя из этого соображения, можно сразу разметить знаки, соответствующие промежуткам, представляя себе, что х убывает от -|- оо до — оо, и учитывая, что знак функции меняется при прохождении х через всякий действительный корень нечётной кратности в числителе и знаменателе.

Если а и а' не равны между собой, то перед дробью в формуле (34) появляется числовой коэффициент: будучи положительным, он не влияет на знак функции (вызывая растяжение графика функции в направлении оси Oy); будучи отрицательным, даёт противоположное распределение знаков (к растяжению присоединяется отражение относительно оси Ох).

Выясним подробнее расположение графика в окрестности такой точки, в которой функция меняет знак. Объединяя вместе случаи, когда такая точка оказывается корнем числителя или корнем знаменателя дроби в формуле (34), придадим этой формуле вид

y=R(x)=(x—и,

где £ — рассматриваемый корень одного из многочленов, |о| — его кратность, Ri(x) — произведение всех прочих множителей (с положительными и отрицательными степенями).

Если £— корень числителя, т. е. о]>0, то функция R(x) при х = £ принимает значение нуль, и получается точка графика на оси Ох; график в этой точке касается оси или пересекает1) ось в зависимости от того, будет ли о чётным или нечётным. Если ещё обратить внимание на то, что возможен тот или иной знак Rt (£), то становится ясным, что имеет место одно из четырёх расположений, схематически указанных на рис. 24, а.

В случае, если о<0, т. е. Е есть корень знаменателя (и, следовательно, «точка разрыва» функции R(x)), соответствующие четыре расположения показаны на рис. 24, б.

Чтобы выяснить вопрос о «поведении кривой на бесконечности», достаточно разделить числитель и знаменатель данной дроби на xN, где N—наибольшее из чисел п и ri (степеней числителя и знаменателя). Оказывается, что при неограниченном возрастании \х\.

1) если п<п\ кривая асимптотически приближается к оси Ох,

Рис. 24.

1) Пересекает без касания, если а=1; пересекает с касанием, если о = 3, 5, ...

2) если п = п\ то она имеет горизонтальную асимптоту

3) если п>п\ то \у\ неограниченно возрастает при увеличении \х\; при этом в случае n^nf-\~2 прямолинейных асимптот нет, а в случае п = п' имеется наклонная асимптота, уравнение которой легко составляется посредством исключения целой части из дроби. Например, кривая

как видно из записи

имеет асимптоту у = 2х-\-1.

§ 17. Алгебраические иррациональные функции

Целой рациональной функцией (многочленом) от двух переменных X и у называется такая функция, значения которой могут быть получены из значений этих переменных и из постоянных чисел посредством не более чем трёх операций — сложения, вычитания и умножения.

Если Р(х, у) — такая функция, то уравнение

Я 30 = 0 (35)

(называемое алгебраическим) определяет алгебраическую функциональную зависимость между х и у.

Предположим, что некоторая функция, однозначная или многозначная,

y=f{x) (36)

в некотором промежутке удовлетворяет уравнению вида (35) тождественно относительно х:

Р(х9 /(*))=о.

Тогда функция (36) называется алгебраической. Например, функция у = 1 —X* — алгебраическая, так как в промежутке — 1 ^j/^ 1 удовлетворяет уравнению je2-j-j/2 = 11).

Всякая рациональная функция (в том числе и целая) является алгебраической.

Действительно, из соотношения

1) См., впрочем, стр. 214.

где Р(х) и Q(x) — многочлены (целые рациональные функции) относительно Ху следует соотношение

Q{x)y—Р(*) = 0,

причём его левая часть есть целая рациональная функция относительно переменных х и у.

Многочлены от двух переменных х и у, как и многочлены от одной переменной, классифицируются по степеням. Необходимо только указывать, имеются ли в виду степени многочлена относительно переменной х или относительно у, или относительно совокупности переменных х и у; в последнем случае

1) степенью отдельного члена называется сумма степеней X и у, в него входящих,

2) степенью многочлена называется наибольшая из степеней отдельных членов.

Например, многочлен

/>(лг, у)=х* + 3х*у*—у1

— степени 5 относительно л:, степени 4 относительно у и степени 8 относительно совокупности х m у.

Если левая часть уравнения (35) — степени п относительно совокупности переменных х и у, то говорят, что само уравнение, а также его график — порядка п.

Из предыдущего ясно, что всякая рациональная функция у=- удовлетворяет алгебраическому уравнению первой степени относительно у. Но это не означает, что всякое уравнение, которому удовлетворяет рациональная функция, непременно должно быть первой степени относительно у. Например, рациональная функция у=х удовлетворяет уравнению второй степени относительно у

У* = х\ (37)

а также уравнению третьей степени относительно у

У = лг3; (38)

при этом уравнению (37) удовлетворяет также другая рациональная функция у = — х; но уравнению (38) не удовлетворяет никакая функция, кроме у = х.

Те алгебраические функции, которые не являются рациональными, называются иррациональными.

В качестве простейших примеров иррациональных алгебраических функций можно указать

или

1) В этом параграфе и дальше, если не сделано оговорки, радикалы понимаются в алгебраическом смысле: это значит, что в случае чётного показателя при радикале подразумевается двойной знак.

Если мы хотим доказать иррациональность данной функции, то нам нужно установить, что её нельзя представить в виде отношения двух многочленов. Как всякое доказательство невозможности, оно связано с известными трудностями. Читателю можно порекомендовать попытаться найти доказательство иррациональности двух приведённых выше функций, строя его по образцу известного доказательства иррациональности числа j/2 и опираясь при этом на лемму: если квадрат многочлена делится на х (или на лг2-|-1), то и сам многочлен делится на х (или на лг2-)-1).

§ 18. Примеры исследования алгебраических функций

Рассмотрим несколько характерных примеров.

Пример 1. Функция

(39)

является обратной по отношению к функции у =х*. В самом деле, она удовлетворяет уравнению

У —Jt = 0. (40)

Поменяв местами хну (см. § 4), получаем уравнение

у — х2 = 0, (41)

которое нами уже было исследовано (§ 7). График уравнения (41) — парабола с осью Oy и вершиной О, расположенная в верхней полуплоскости (см. рис. 13, б). График уравнения (40) получается из графика (41) посредством преобразования симметрии относительно биссектрисы у = х: это — парабола с осью Ох, расположенная о правой полуплоскости (рис. 25, а).

Рис. 25.

График (41) в вершине О имеет горизонтальную касательную (ось Ох); график (40) в той же вершине имеет вертикальную касательную (ось Oy).

Уравнение (40) определяет двузначную функцию у, поэтому в формуле (39) естественно понимать радикал в алгебраическом смысле — с двойным знаком. Если взять только знак «-(--» (арифметическое значение радикала), то в качестве графика получим «половину» параболы, лежащую в верхней полуплоскости; аналогично для знака « — ».

Пример 2. Подобным же образом функция

(42)

— обратная по отношению к функции

у = х\ (43)

График (43) — кубическая парабола с вершиной О, проходящая в первом и третьем квадрантах и в точке О касающаяся оси Ох (см. § 7; рис. 13, в). График (42) — симметричная ей (относительно биссектрисы у = х) парабола; у неё та же вершина, и она проходит через те же квадранты, но в вершине О имеет вертикальную касательную Oy (рис. 25, б).

Обе функции (43) и (42) однозначны и определены для всех значений лг.

Пример 3. Вообще при любом целом положительном п функция

(44)

является обратной по отношению к функции

у = хп. (45)

Графики функций (44), получающиеся по симметрии из графиков функций (45), имеют в точке О вертикальную касательную и примыкают к ней тем теснее, чем больше п.

Расположение кривой при любом чётном п — такое же, как при п = 2; при любом нечётном п — как при п = 3.

Пример 4. Рассмотрим произвольную рациональную степень

(46)

или

(47)

где р и q — целые положительные числа, не имеющие общих множителей. Эта функция удовлетворяет уравнению

Xp—y^ — 0t (48)

Ограничиваясь рассмотрением положительных значений х и у, заметим, что отношение

при неограниченном приближении х к нулю само либо неограниченно убывает, либо, напротив, неограниченно возрастает, —смотря по тому, будет ли или l^^*' геометрически это означает, что, приближаясь к началу координат в пределах первого квадранта, график либо примыкает к оси Ох (рис. 26, а), либо — к оси Oy (рис. 26, б) («касается» той или другой), смотря по тому, будет ли показатель — больше или меньше единицы. При дг>0 функция X q возрастает и тем быстрее, чем больше степень ^.

Что касается поведения графика в остальных квадрантах, то, глядя на уравнение (48), легко понять, что

1) если р и q— оба нечётные, то имеется симметрия относительно центра О, так что график лежит в 1-м и 3-м квадрантах,

2) если р чётное, a q нечётное, то имеется симметрия относительно оси Oy у так что график лежит в 1-м и 2-м квадрантах,

Рис. 26.

3) если р — нечётное, a q — чётное, то имеется симметрия относительно оси Ох, так что график лежит в 1-м и 4-м квадрантах.

Возможные случаи схематически изображены на рис. 26.

Следует обратить внимание на наличие так называемой «точки возврата» в начале координат О в том случае, когда числа р и q — различной чётности, причём нечётное больше чётного.

Пример 5. Функции

или

(при целых положительных р и q) представляют собой величины, обратные по отношению к функциям, рассмотренным в предыдущем примере. Ограничимся (ссылаясь на § 2, п. 6 и § 5, п. 7) приведением рис. 27, показывающего схематически возможные расположения графиков в окрестности точки л: = 0. Пример 6. Функция

(49)

имеет график, симметричный графику функции (40) (см. рис. 25, а) относительно оси Oy. Пример 7. Функция

(50)

удовлетворяет алгебраическому уравнению второго порядка

х*+у*=1. (51)

Рис. 27.

График этого уравнения — окружность радиуса 1 с центром в начале координат О (рис. 28); действительно, из уравнения видно, что расстояние точки M (дг, у) от начала О равно 1.

При растяжении в г раз по направлениям осей Ох и Oy мы получим уравнение

х*+у*=г\ (52)

график которого — окружность радиуса г с центром О. Производя теперь перенесения параллельно оси Ох на отрезок а и параллельно оси Oy на отрезок Ь, приходим к уравнению

(53)

представляющему геометрически окружность радиуса г с центром (а, Ь).

Рис. 28.

Пример 8. При растяжении в р раз по направлению оси Ох и в q раз по направлению оси Oy уравнение (51) примет вид

(54)

или

графиком этого уравнения является эллипс с полуосями р и q (рис. 29). Уравнение (54) называется каноническим уравнением эллипса.Птри p=q=r получается окружность (52)радиуса г с центром О.

Рис. 29.

Пример 9. Преобразования IV а и IV б, рассмотренные в § 3, будучи применены соответственно к уравнениям

(55) (56)

в обоих случаях дают уравнение

2ху=1,

и остаётся ещё сделать растяжение в j/2 раз по направлениям обеих осей, чтобы убедиться в том, что графики данных алгебраи-

ческих иррациональных функций — гиперболы (см. § 13, рис. 17). Расположение их указано на рис. 30, а и б.

Рис. 30.

Пример 10. Растяжение в р раз по направлению оси Ох и в g раз по направлению оси Oy от уравнений а) и б) примера 9 приводит к уравнениям

(57)

(58)

(графики — сопряжённые между собой гиперболы с полуосями рид (рис. 31, а и б)).

Рис. 31.

Пример 11. Функции

(59)

удовлетворяющие соответственно уравнениям четвёртого порядка

представляют собой величины, обратные функциям (50), (55) и (56). Этим определяется характер их изменения. На рис. 32, а, б, в изображены соответственно графики (59) а), б), в) (сплошные линии) и для сравнения графики (50), (55) и (56) (пунктирные линии).

Рис. 32.

Пример 12.

(50)

Освободившись от радикалов, приходим к уравнению второго порядка

(х-у)* + 1=2(х+у). (60')

Оно определяет двузначную алгебраическую функцию

(61)

График имеет осью симметрии биссектрису у = х, так как уравнение (60) или (60') не изменяется при взаимной перестановке х и у. Он целиком лежит в первом квадранте и на самих осях имеет только точки (0, 1) и (1, 0). Поворот осей на —45° (см. § 3) приводит уравнение (60г) к виду

(62)

отсюда ясно, что график данного уравнения — парабола, в точках (О, 1) и (1, 0) касающаяся координатных осей1) (рис. 33).

Пример 13. Четырёхзначная функция

(63)

удовлетворяет уравнению четвёртого порядка

(у*— 1)* = 4*у*, (64)

которое легко получить, положив

и затем исключая ни v. В расположении графика легко отдать себе отчёт, или принимая у за независимое переменное

или путём «сложения» (см. § 2) параболических графиков и

«Расщепим» одну четырёхзначную функцию (63) на четыре однозначные, причём введём радикалы в арифметическом смысле:

Графики уг и j/2 оба лежат в первом квадранте, причём ух возрастает (§ 5, п. 3), а у2 убывает (§ 5, п. 7); они смыкаются в точке (0, 1), где имеется вертикальная касательная (рис. 34). При

Рис. 33.

Рис. 34.

1) В самом деле, уравнение (62) имеет графиком параболу, получающуюся из параболы у = jc2 посредством растяжения в у 2 раз по направлению оси Ох и перемещения параллельно оси Oy на отрезок

неограниченном возрастании х функция^ неограниченно возрастает, хотя и довольно медленно1); напротив, функция у2 неограниченно стремится к нулю2).

Графики уъ и j/4 симметричны графикам у^ и yi относительно оси Ох.

Пример 14. По уравнению четвёртого порядка

аг4+У = аг2+У (65)

(см. § 1, стр. 16) можно судить о наличии нескольких симметрии (§ 3): относительно оси Ох, относительно оси Oy (значит, и относительно центра О), а также относительно биссектрисы у = х. Поэтому при исследовании графика уравнения (65) достаточно ограничиться рассмотрением «восьмушки» плоскости, определяемой неравенствами

При таких условиях в решении уравнения относительно у

(66)

(предполагая, что оба радикала взяты в арифметическом смысле) достаточно ограничиться рассмотрением значений х, не превосходящих 1 (при X ]> 1 мы получили бы у<1, что противоречит условию лг^.у); знак минус перед внутренним радикалом при л;>0 брать и подавно излишне. При возрастании X от 0 до 1 изменение функции у зависит, очевидно, от изменения выражения

(см. § 9). Величина z не превышает и равна только при значит, у не превышает и принимает это наибольшее возможное значение только при При возра-

1) Точнее говорит об этом соотношение

2) Именно,

стании X от 0 до величина убывает от _ до 0; значит, z возрастает от ^- до -^» а-У возрастает от 1 до при возрастании, далее, х от до 1 величина возрастает от значит, z убывает от у до ~, а у убывает от до 1.

Следует обратить внимание на то, что при л:=0 (но только при этом значении) в формуле (66) можно взять знак минус перед внутренним радикалом. Это даст «изолированную точку» в начале О. Весь график изображён на рис. 35.

Примечание. Если уравнение y=f(x) таково, что правая часть его «составлена» из х и постоянных чисел с помощью лишь рациональных операций и извлечения радикалов целых степеней (в конечном числе), то у есть элементарная, и притом алгебраическая, функция переменной х. Действительно, «избавляясь» от радикалов, уравнению указанного вида всегда можно придать вид (35)1).

Напротив, если мы исходим из уравнения вида (35), то, допуская, что существует функция y=f{x), ему удовлетворяющая2), мы можем утверждать, что эта функция — алгебраическая, но не всегда верно, что она — элементарная. В самом деле, например, уравнение

У5+У = х

невозможно решить в радикалах относительно у (при произвольном буквенном параметре х); тем не менее легко доказывается, что это уравнение определяет у однозначно как функцию х: при возрастании х от — оо до -f- оо левая часть уравнения также возрастает от — оо до -|- оо (рис. 36) и, следовательно, при одном и только одном значении у примет любое наперёд заданное значение х (см. ниже § 52, теорема Больцано). Вполне понятно, что здесь идёт речь о функции как о «соответствии».

Рис. 35.

Рис. 36.

1) Чтобы «избавиться» от радикалов, нужно принять их за новые переменные и затем исключить (см. Э. э. м., кн. 1, А. И. Узков, Векторные пространства и линейные преобразования, § 17).

2) Заметим, что в примере *2-f-.y2-f-1 = 0 не существует никакой функции действительной переменной, которая удовлетворяла бы уравнению.

§ 19. Элементарные трансцендентные функции

Термин «трансцендентная» функция имеет вполне точный смысл: функция y=f(x) называется трансцендентной, если она не удовлетворяет никакому алгебраическому уравнению

P(Xi у) = 0,

где Р(х, у) обозначает алгебраический многочлен (целую рациональную функцию) относительно переменных х и у. В курсе математики средней школы из числа трансцендентных функций систематически изучаются: показательные, тригонометрические (круговые), а также им обратные; но учащемуся приходится встречаться и с различными их комбинациями.

В высшей математике рассматриваются и изучаются трансцендентные функции самых разнообразных типов.

«Трансцендентный» обозначает буквально — «превосходящий» (подразумевается, по Эйлеру, превосходящий силу алгебраических методов, что соответствует в точности приведённому выше определению). Доказательства трансцендентности функций относятся к числу «доказательств невозможности», они строятся по схеме «от противного» и требуют привлечения разного рода искусственных приёмов.

§ 20. Показательная функция

Показательной, или экспоненциальной1), функцией называют всякую функцию вида

у=а* (а>0). (67)

Символу ах даётся «расчленённое» определение. 1°. Если X равно целому положительному числу п, то а* следует понимать как результат повторного умножения:

ап=аа...а. (68)

2°. Если X есть положительное дробное рациональное число ~, то, возводя основание а в степень х согласно формуле

(69)

берут арифметическое значение радикала.

1) «Экспонент» (по-латыни) означает показатель.

3°. Если X—отрицательное число!— — ), то полагают

(70)

наконец,

(71)

4°. Для иррациональных значений х показательная функция ах определяется «по непрерывности» (см. ниже § 51).

Примечание. В этом параграфе сформулированы важнейшие свойства показательной функции, но доказательства приведены ниже лишь для случая рациональных показателей. По поводу иррациональных показателей см. § 51.

Из определения следует, что при всех значениях независимой переменной х показательная функция принимает положительные значения. В частности, она ни при каких значениях х не обращается в нуль. Её график весь располагается выше оси Ох.

Рассматривать показательную функцию при отрицательном основании а не приходится по той причине,что раз а отрицательно, переменной X нельзя давать дробных значений вида * (где m и п целые), не говоря уже о значениях иррациональных (см. стр. 510).

Случаи, когда а = 0 или а = 1, не представляют никакого интереса.

Показательная функция при основании а, большем единицы, — возрастающая; при основании а, меньшем единицы,—убывающая.

Пусть даны два рациональных числа х' и х", причём х'<х". Допустим, что они приведены к общему знаменателю:

Тогда из неравенства а>1 следует неравенство ар'<ар" и, далее, после извлечения арифметических корней степени q1),

Таким же образом из неравенства 0<а<О мы получили бы

Чтобы выяснить взаимное расположение графиков двух показательных функций а* и Ьх (0 <Са<С^)> обратим прежде всего вни-

1) Функция xq — возрастающая (при х > 0), см. § 18, пример 3.

мание на то, что они пересекаются в точке (0, 1), (так как а°=1 и £°=1), и затем установим следующее: если 0<а<Ь, то при лг]>0 имеет место неравенство ах<Ъх> а при х<0— неравенство ах>Ьх1).

Заметим, что график функции симметричен графику относительно оси Oy.

Действительно, мы имеем

и остаётся сослаться на I б, § 3.

На рис. 37 даны графики нескольких показательных функций при различных основаниях.

Рис. 37.

При неограниченном возрастании х показательная функция у = ах (если а>1) также неограниченно возрастает и притом очень быстро — быстрее чем любая степень х.

Принимая во внимание, что функция ах — возрастающая, достаточно ограничиться рассмотрением целых значений переменной х; в самом деле, если эта функция при х = п (целое) принимает некоторое значение N, то при всех значениях х, больших чем п (в том числе и дробных), она принимает значение, большее чем N.

1) В самом деле, достаточно обозначить х через с и сослаться на то, что функция хс—возрастающая при с>0 и убывающая при с <0 (для случая с рационального — см. § 18, пример 4, для случая с иррационального — см. § 51).

Положив

а—1=8, а=1+8 (8>0),

мы получаем по формуле бинома

art = (l+8)rt=l+/z8+ ... -f 8л>/г8

(сумма положительных слагаемых больше одного второго слагаемого), и так как пЬ при неограниченном возрастании п тоже неограниченно возрастает, то тем более такое заключение справедливо относительно ап.

Пусть теперь р — какое-нибудь целое положительное число. Если мы хотим доказать, что при достаточно больших значениях п справедливо неравенство

ап>пр,

то достаточно применить прежнее рассуждение, выделяя, однако, вместо второго (р 2)-й член суммы:

(72)

Но при достаточно больших значениях п

(73)

Действительно, это неравенство равносильно следующему:

а последнее очевидно, так как при неограниченном возрастании п

\-2...(р + 1)

правая часть приближается к числу-—-, а левая неограниченно возрастает. Остаётся сопоставить неравенства (72) и (73). Например, полагая 8 = 0,01, /7 = 100, можно сказать, что при достаточно больших X

Мы доказали, что при неограниченном возрастании х показательная функция у = ах (при а>1) тоже неограниченно возрастает, и притом быстрее, чем любая положительная степень х.

Из тождества

вытекает, что, если х, оставаясь отрицательным, неограниченно возрастает по абсолютной величине, то показательная функция

у = ах (при а<1) неограниченно убывает, и притом быстрее, чем любая отрицательная степень х.

Свойством показательной функции быстро возрастать или убывать при возрастании независимой переменной можно воспользоваться для доказательства её трансцендентности.

Доказательство. Предполагая для определённости, что а>1, допустим, что функция у = ах—алгебраическая. Это значит, что она тождественно удовлетворяет уравнению вида Р(х, у) = 0. Разложив многочлен Р(х, у) по убывающим степеням у, мы получим:

Р(X, у) = Ро (х)уп + Рх (х)у«-1 + ... +РЯ_, (X) у + Рп (X),

причём степень п— целая положительная и Р0 (х), Рх (лг), ..., Рп-\(х),Рп (х)—? многочлены относительно х; положим, в частности,

Р0(х) = Ахт +

где m — целое положительное число или нуль, но А отлично от нуля, и, не ограничивая общности, можно считать, что Л>0. Тождество

Р(х, ах) = 0

можно переписать в виде

Р0(х)сГ* + Р1(х)а<"-»*+ ... + P„-i(*)** + P„(*) = 0,

или

Ро(X) = -Р1(^)л^~ ... -Рл_1 (X)а-"-»Х-Рп(X)а-™.

Предположим, что х неограниченно возрастает. Тогда многочлен Р0(х) в левой части тождества также неограниченно возрастает (при m > 0) или сводится к постоянной положительной величине Л (при m = 0). Что же касается правой части, то она распадается на сумму конечного числа членов, из которых каждый имеет вид Cxsa~kx (k > 0) и, следовательно, по доказанному свойству показательной функции, стремится к нулю (следует обратить внимание на то, что д-й = — < I); поэтому и вся правая часть стремится к нулю. Получается противоречие, которое и доказывает утверждение о трансцендентности функции ах.

Говоря о свойствах показательной функции, следует в особенности указать на её основное функциональное свойство, выражающееся в тождестве

ах'+х" = ах'ах"> (74)

справедливое при всех значениях х' и х" («теорема сложения»).

Это соотношение очевидно для случая целых значений х' и х". Оно доказывается для случая рациональных значений х' и х", по приведении к общему знаменателю,

посредством использования свойств арифметических корней: из равенства

следует равенство

Применяя теорему сложения для показательной функции в том случае, когда в показателе стоит сумма п слагаемых, из которых каждое равно х (с привлечением полной индукции), мы получаем тождество

апх=(ах)п. (75)

Его легко обобщить: при любом (действительном) X справедливо тождество

аХх = (ах)\ (76)

Для случая целого X (= п) это равенство уже доказано; если Х = у, то положим в соотношении (75) п=р и извлечём арифметические корни степени q.

Равенство (75) говорит, между прочим, о следующем: если независимое переменное х принимает ояд значений, образующих арифметическую прогрессию

g, g+h, £ + 2Л, g + nh,

то показательная функция ах принимает ряд значений, образующих геометрическую прогрессию

g, Qq% Qf9...9Qf9 .1)

Именно, мы получаем:

G = a8, q — ah.

Этому соответствует такое свойство графика функции ах: ординаты, восставленные в равноотстоящих точках оси Ох, образуют геометрическую прогрессию.

Полагая в соотношении (74) х' = х, х" = — с, мы получаем тождество

ах-с=Сах,

(где С=а~с). Это означает (см. § 3): перемещение графика функции ах параллельно оси Ох на отрезок с равносильно его растяжению по направлению оси Oy в а~с раз (сжатию в а° раз).

В соотношении (76) как X, так и х представляют собой совершенно произвольные числа: это даёт право поменять местами буквы X и х:

Положив затем Х = -~- (р>0), получим следующее свойство

графика показательной функции ах: растяжение в р раз по направлению оси Ох равносильно переходу от графика показательной функции с основанием а к графику показательной функции с основанием аР 9

1) Следует отметить, что, помимо показательных функций ах, этим же свойством обладают и функции несколько более обширного класса сах (где с — постоянная).

Основному соотношению (74) можно также дать геометрическое истолкование. Именно, положив в нём х' = \х, x" = \ix, мы получаем:

a\x+\ix — a^xa\ix

и, далее, используя (76):

(а*)* (а*)* = (а*+*)*, или а,ха"х = (а'а")х,

где

а' = а\ а" = а*.

Таким образом, в результате «умножения» графиков показательных функций с основаниями а' и а" (см. § 3) возникает график показательной же функции с основанием, равным а'а".

§ 21. Функции, связанные с показательной

Рассмотрим функции

Чтобы построить график функции fix), достаточно «сложить» (см. § 2, п. 1) взаимно симметричные относительно оси Oy графики показательных функций с основаниями а и —, затем произвести сжатие вдвое по направлению оси Oy. Получаемый график можно назвать «полусуммой» данных графиков. Особенно легко произвести построение по точкам, деля пополам точкой M отрезок MtM^, образованный на каждой вертикальной прямой графиками ах и а~х.

Чтобы построить график функции g(x), нужно проделать то же самое, предварительно заменив график а~х графиком (—а~*), т. е. отразив его по симметрии относительно оси Ох.

Легко проверить, что:

1) функция f(x) — чётная, функция g(x) — нечётная; отсюда следуют свойства симметрии их графиков (см. § 3),

2)/(0)=1, g(0) = 0,

3) /(•*)> 0 при всех значениях х,

В самом деле, из а]>1 следует а>а-1, и тогда ах>аГх (см. § 20) при ^)>0 и т.д.

4) При всех значениях х

(77)

Докажем, что

5) функция / (х) — возрастающая при х>0 и (по симметрии) убывающая при х<0; функция g(x) — всегда возрастающая. Для доказательства достаточно заметить, что

где положено

При х>0 мы имеем а при условии н]>1 функции и-|-— и —-^-являются возрастающими (см. § 15, (I) и (II)). Так как показательная функция и = а* при а>1—также возрастающая, то отсюда следует (§ 5, п. 9) требуемое заключение.

Опираясь на основное функциональное свойство показательной функции, можно вывести соответствующие свойства функций f(x) и g(x).

Именно,

и с другой стороны —

значит,

(78)

Аналогично доказывается, что

(79)

Рассмотрим ещё функцию

(80)

Так как функция f(x) — чётная, а функция g(x) — нечётная, то функция h(x) — нечётная, причём h(0) = 0. Очевидно, h(x)>0 при х>0 и h(x)<0 при х<0.

Функция h(x) при х>0 — возрастающая. В самом деле, если х возрастает, начиная от значения нуль, неограниченно, то и = а~*х убывает от 1, неограниченно приближаясь к нулю, и потому (опи-

раясь на § 5, п. 6, 1, 7 и 4), из записи

мы видим, что при неограниченном возрастании х функция h(x) возрастает и притом приближается к 1* Из свойства симметрии видно, что h(x) возрастает на всей оси и что, если х неограниченно возрастает по абсолютной величине, оставаясь отрицательным, то h(x) приближается к —1.

Для функций f(x), g(x) и h(x) приняты (обычно — только при а = е=2,718... , см. § 44) обозначения и наименования:

(«косинус гиперболический»)1), («синус гиперболический»), («тангенс гиперболический»).

В этих обозначениях тождества (77) — (80) принимают вид

(81) (82) (83) (84)

Здесь ясно видна формальная аналогия с обыкновенными («круговыми») функциями cos Ху sin л: и tgx; отсюда происходят наименования «косинус», «синус», «тангенс»3).

Что касается термина «гиперболические» функции, то он объясняется следующим образом. Как известно из тригонометрии (см. также § 25), функции

X=cosx, У = sin л; удовлетворяют тождественно уравнению

X2_j_r2=l.

Последнее уравнение (в плоскости OXY) представляет окружность, и потому эти функции называются «круговыми». Совершенно

1) Для краткости будем в этом параграфе функции / (х), g(x) и h(x) называть «гиперболическим косинусом», «гиперболическим синусом» и «гиперболическим тангенсом» при любом а (а > 0).

2) Тождества (82) и (83) называются «теоремой сложения» (для гиперболических функций chx и shx).

3) Причина возникновения формальных аналогий между круговыми и гиперболическими функциями объяснена на стр. 507—508.

таким же образом функции

X=chx и Y=shx удовлетворяют уравнению

X2 —Г2=1

(см. формулу (81)). Так как это уравнение в плоскости ОХУ представляет гиперболу (§ 18, пример 9), то отсюда происходит термин «гиперболические» функции.

Рис. 38.

Рис. 39.

Графики функций shx и ch лг изображены на рис. 38; график функции thx — на рис. 39.

§ 22. Логарифмическая функция

Логарифмическая функция (короче, логарифм) по основанию а(а>0) определяется как функция, обратная показательной, с тем же основанием.

Допустим, что а>1. Если показательная функция задаётся уравнением

у = ах (а>1), (85)

то уравнение, определяющее логарифмическую функцию, получается из него посредством перестановки букв х и у, что соответствует изменению роли переменных (см. § 4). Логарифмическая функция по основанию а

y = \ogax (86)

определяется из уравнения х = ау.

График уравнения (86) симметричен графику уравнения (85) относительно биссектрисы у = х (см. § 4). На рис. 40 изображены: график функции y = \gx (сплошная линия) и симметричный ему относительно биссектрисы у = х график функции j/ = 10* (пунктирная линия).

Принципиальный вопрос о том, соответствует ли в силу уравнения (85) заданному значению х одно определённое значение у, кажется допускающим очевидный ответ, именно утвердительный, в случае, если X положительно; ответ отрицательный в случае, если х отрицательно или равно нулю. В самом деле, речь идёт о том,

Рис. 40.

пересекается ли в единственной точке с графиком (85) данная вертикальная прямая, и чертёж подсказывает решение. Логическое обоснование существования логарифма положительного числа по данному положительному основанию приведено ниже (см. § 52).

Все свойства обратной функции — логарифма непосредственно вытекают из свойств прямой функции — показательной, и иллюстрируются рис. 40.

Прежде всего, как уже было только что отмечено, существуют логарифмы \ogax только тех чисел х, которые положительны (аг>0) (так как показательная функция принимает лишь положительные значения).

Функция \ogaX при лг]>0 оказывается, далее, возрастающей (см. § 52). Она возрастает, с увеличением х, неограниченно, однако медленнее, чем любая положительная степень х. Действительно, пусть 8 — постоянное положительное, сколь угодно малое число. Тогда, полагая

мы получим:

По свойству показательной функции, при достаточно больших значениях у величина ау становится больше, чем любая степень у, например у0 • Значит, выражение в скобках становится меньше единицы, откуда следует (при достаточно больших значениях л:), что

Когда же х приближается к нулю, то функция \ogax, делаясь (при х<1) отрицательной, по абсолютному значению неограниченно возрастает, однако медленнее, чем любая отрицательная степень х.

Нам нет необходимости задерживаться на замечательном функциональном свойстве функции логарифм

loga С***") = loga X' + loga х\ (87)

вытекающем из функционального свойства («теорема сложения») показательной функции (74) и лежащем в основе вычислительных применений логарифмов. Излишне также перечислять достаточно известные следствия, вытекающие из формулы (87).

Отметим ещё некоторые свойства графиков логарифмических функций. Из формулы

(88)

следует: растяжение графика функции \ogax в р раз по направлению оси Ох равносильно перенесению его параллельно оси Oy на отрезок (—\ogap).

Формула

(89)

говорит о том, что растяжение графика логарифма по основанию а в q раз по направлению оси Oy равносильно переходу от этого графика к графику логарифма по основанию а?* Логарифмируя тождества

соответственно по основаниям b и а, мы получаем

(90)

Эти формулы показывают, как логарифм числа по некоторому основанию выражается через логарифм того же числа по другому основанию; из них, между прочим, следует (если положим х = Ь в первой из формул или х = а во второй), что logab и \ogba — величины, взаимно обратные:

\ogab • logöa=l.

Таким образом, чтобы перейти от системы логарифмов по одному основанию к системе по другому основанию, достаточно умножить логарифмы на некоторый постоянный множитель («модуль перехода»). Этому как раз соответствует геометрически растяжение графика логарифма по направлению оси Oy (нужно положить в формуле (89) а? =Ь).

Примечание. Мы предположили, что а > 1. Если 0 < а < 1, то вопрос о логарифме по основанию а исчерпывается тем, что имеет место тождество

самом деле, если х = аУ, то x=(^j * \ Случай же д = 1, очевидно, не заслуживает рассмотрения.

§ 23. Функции, связанные с логарифмической

1. Поскольку функции fix), g(x) и h(x), введённые в § 21, являются простыми комбинациями из показательной, неудивительно, что функции, им обратные, оказываются связанными с логарифмической.

Найдём явное выражение для функций, обратных гиперболическим.

Нам придётся (§ 4) в уравнениях

(91) (92)

поменять местами буквы х и у и затем решить полученные уравнения

(93) (94)

относительно у.

Станем решать уравнения (93) параллельно. После умножения на 2ау эти уравнения принимают вид

т. е. представляют собой квадратные уравнения относительно ау, так что дальше отсюда следует:

Во втором случае знак минус перед радикалом излишен, так как, решая уравнение относительно a-v, мы, естественно, разыскиваем только положительные его корни; выражение же х — -\[х*-\-\ заведомо отрицательно (относительно разности х — |/х1 — 1 этого сказать нельзя). Дальше остаётся прологарифмировать:

Замечая, что

получаем функции, обратные «гиперболическим косинусу и синусу» (91), в виде

(95)

Первая из них задана при ограничении х^1 и двузначна (два значения различаются знаками); вторая задана без ограничений и однозначна.

Что касается уравнения (94), то, решая его относительно ау, получаем:

(радикал — арифметический),

откуда видно, что функция, обратная «гиперболическому тангенсу» (92),

есть

(96)

Она задаётся с ограничением —1 <х<-\- I и однозначна.

В частности, при а = е формулы (95) и (96) дают нам функции, обратные гиперболическим косинусу, синусу и тангенсу (в собственном смысле):

(95') (96')

Графики функций (95) и (96) (для случая а = е) получаются из графиков функций (91) и (92) (см. рис. 38 и 39) посредством симметричного отражения относительно биссектрисы у = х.

2. Часто бывает нужно отдавать себе отчёт в поведении логарифма данной функции (по основанию а), зная поведение самой функции; другими словами, по графику данной функции наметить график её логарифма.

Это сделать нетрудно, если не упускать из виду следующих, достаточно очевидных, обстоятельств1):

1) функция \ogaf(x) существует при условии (и только при том условии), что функция /(л:) существует и положительна;

2) функция \ogaf(x) равна нулю, положительна или отрицательна, смотря по тому, будет ли функция f(x) равна единице, больше или меньше единицы; вообще же при а = = 10 (а также и при а = е)

lofc/C*) </(*);

3) функция \ogaf(x) возрастает (или убывает) в тех же промежутках, что и функция f(x) (см. § 5, п. 9); она имеет максимум (или минимум) в тех же точках, что и /(л:).

Последнее отмеченное обстоятельство особенно важно в том отношении, что нередко бывает гораздо легче найти максимум или минимум логарифма функции, чем самой функции. На рис. 41 изображены совместно графики:

а) функции f(x) = (x—1) (л: — 2) (х—3) (кривая Г),

б) функции log10/(Ar) = log10 [(л:—1) (х—2) (х — 3)] (кривая//).

Рис. 41.

1) Попрежнему предполагаем дальше, что я>1.

§ 24. Произвольная степенная функция

Степенная функция

у = х* (97)

была рассмотрена для случаев, когда а — целое положительное или отрицательное число (см. § 7 и § 13), затем — для случая, когда а = — —любое рациональное число (§ 18). Случай когда а — иррациональное число, подразумевает предельный переход «по непрерывности» в показателе. Заметим предварительно, что функция ха даже в случае а рационального (при чётном знаменателе) теряет смысл для отрицательных значений х\ если а — иррациональное, то при X отрицательном выражению ха нельзя приписать никакого смысла ни непосредственно, ни в результате предельного перехода. По этой причине, рассматривая иррациональную степень лга, переменной х не дают отрицательных значений и считают, что эта функция задана только для положительных значений л:. Можно доказать, что функция (97) при а иррациональном является трансцендентной функцией, т. е. степенная функция относится к числу алгебраических функций только при а рациональном.

Выбрав произвольное положительное основание а, формуле (97) часто придают вид

ха _ tf°zay — aaXosa*1). (98)

Такая запись имеет теоретическое и практическое оправдание. С одной стороны, предельный переход по непрерывности представляет собой довольно сложное построение, которое можно осуществить одинаково как по отношению к показательной функции, так и по отношению к степенной (в последнем случае, как было указано, с ограничением х>0); но целесообразно осуществить её лишь один раз, именно, по отношению к показательной функции, с дальнейшим автоматическим перенесением на обратную функцию— логарифмическую (см. § 52) и, далее, опять автоматически — с помощью формулы (98) — на степенную2).

1) Логически это — определение произвольной степени; формула логарифмирования произвольной степени отсюда вытекает как следствие.

2) Возможен и иной ход мыслей: сначала определяется для всех значений х>\ логарифм («натуральный», т. е. по основанию е, см. гл. Ill, § 44) согласно формуле

как площадь, ограниченная гиперболой у = — , осью Ох и вертикалями, проведёнными через точки 1 и л: на этой оси; затем показательная функция (с основанием е) определяется как обратная по отношению к логарифму; наконец, степенная функция ха определяется по формуле ха=еа1пх.

С другой стороны, практическое вычисление значений функции ха при ряде данных значений х удобнее всего произвести с помощью таблицы логарифмов, составленной по некоторому основанию а, а это и приводит по сути дела к формуле (98).

Основываясь на формуле (98), можно с помощью двух кривых — графиков функций ах и \ogax осуществить точечное построение любой степенной функции ха. Это построение ясно из рис. 42, на котором взято а = 2 и выбрано значение

По поводу графиков функций у = ха (при произвольных значениях показателя а) полезно сделать следующие замечания (рис. 43):

1) Все они проходят через точку А (1, 1).

2) Если а>0, то функция ха возрастающая; график её, выходя из начала О и уходя в бесконечность, целиком расположен в квадрате OMAN и квадранте SAT (см. рис. 43).

Рис. 42.

Рис. 43.

Если а<0, то функция ха — убывающая; график её целиком расположен в частях плоскости xMAS и у NAT, асимптотически приближаясь к осям Ох и Oy.

3) Если a' <Vf, то из двух кривых у = ха' и у=хл" первая лежит выше второй при 0<лг<1 и ниже второй при л;> 1. Это— следствие из свойств показательной функции.

4) Графики кривых у=ха и у = ха взаимно симметричны относительно биссектрисы х=у (например,

§ 25. Основные (целые) тригонометрические функции: синус и косинус

Рассмотрим в плоскости ОХУ «единичный круг»

X2 + Y*=l, (99)

с центром О и радиусом 1.

Точку А пересечения окружности с положительной полуосью ОХ будем считать «начальной»; вообразим точку М, движущуюся (вращающуюся) по окружности, причём положительным направлением вращения будем считать направление от оси ОХ к оси OY, т. е. против часовой стрелки (рис. 44).

Положение точки M определяется однозначно, если указать длину дуги AM

Kj АМ = х,

отсчитываемую в положительном направлении от начальной точки А до точки М. Когда х возрастает от О до 2тг, точка M делает полный оборот. Промежутки изменения 0<-v<Cy, Y<x^<СХ<С^'Х* w <#<2ic (которым соответствуют дуги AB, ВС, CD, DA; см. рис. 44) носят названия первой, второй, третьей, четвёртой четверти1).

Рис. 44.

1) Следующая, пятая, четверть (bz < х < -Ц- я j , которой снова, как и первой, соответствует дуга AB, «гомологична» первой; точно так же шестая четверть тс < х < Зтс j гомологична второй и т. д. «Минус первая» четверть ^— -у < X < oj гомологична четвёртой, «минус вторая» ^—я < х<. — -^-j третьей, и т. д. «Нулевой» четверти нет вовсе.

Абсцисса X и ордината Y точки Му расположенной на окружности таким образом, что длина дуги AM равна лг, являются функциями величины ху называемыми косинусом и синусом:

X=cosx = OMv К = sin лг = МгМ. (100)

Из соотношения (99) следует тождество

cos2 X -f- sin2 X = 1. (101)

Таким образом, определение основных тригонометрических функций, сообщаемое в школе, носит геометрический характер. Ввиду того, что оно связано с рассмотрением окружности (круга), тригонометрические функции иначе называются круговыми. Существуют и различные аналитические (формульные) определения синуса и косинуса: простейшие из формул, которые могут быть взяты в качестве определений, — степенные ряды (см. стр. 471 и 500) подразумевают выполнение лишь двух действий — сложения и умножения, но число этих действий бесконечно (что равносильно наличию предельного перехода, см. § 48); как известно, о подобного рода формулах школьные программы не упоминают.

Замечательное свойство синуса и косинуса, которое отличает их от всех ранее рассмотренных нами функций, — их периодичность. Геометрически ясно, что после полного оборота по окружности точка M снова оказывается на прежнем месте; отсюда следуют тождества

sin (х 2тг) = sin л:, cos (х -f- 2тс) = cos*, (102)

свидетельствующие о том (см. § 3), что 2ти есть период функций синуса и косинуса1).

Наличие периода позволяет сделать заключение о трансцендентности тригонометрических функций (см. § 19). В самом деле, раз функция имеет период, то она принимает одно и то же значение с в бесконечном ряде различных точек: например, cos* принимает значение 1 в точках вида 2/гк2). Но функция, обладающая этим свойством и не сводящаяся к постоянной с, никак не может быть алгебраической. Действительно, алгебраическая функция y=f(x) определяется уравнением вида

Р(х, з>) = о,

где Р(х, у) — многочлен относительно х и у; допустим, что у имеет значение с при бесчисленном множестве значений х, но не при всех значениях х; тогда алгебраическое уравнение

Р(х, с) = 0, (35')

1) Итак, в «гомологических» точках (различающихся на величину, кратную 2т:) каждая из функций cos* и sin* принимает одни и те же значения. При таких условиях во многих случаях можно, не различая гомологических четвертей, ограничиться рассмотрением первых четырёх, образующих один период.

2) Здесь и дальше k обозначает произвольное целое число.

не обращаясь в тождество относительно х, имеет бесчисленное множество корней. Это, однако, невозможно, так как уравнение (35') относительно х — алгебраическое и степень его, очевидно, не превышает степени уравнения (35) относительно пары переменных х и у.

Итак, функции синус и косинус — трансцендентные.

О знаке основных тригонометрических функций, а также об их возрастании или убывании следует судить, исходя из определения, т. е. основываясь на геометрических представлениях. Функция slnx обращается в нуль тогда и только тогда, когда равна нулю ордината точки Му т. е. сама точка оказывается лежащей на оси Ох; итак,

sin kr, = 0. (103)

Функция cos X обращается в нуль тогда и только тогда, когда равна нулю абсцисса точки My т. е. сама точка оказывается лежащей на оси Oy; итак,

(104)

Знаки sin л: и cos л; (по четвертям) определяются в зависимости от знаков ординаты и абсциссы точки M, а именно, согласно схемам:

Обе функции синус и косинус способны изменяться лишь в пределах от —1 до -|-1. При этом синус принимает наибольшее значение +1 на границе первой и второй четверти

(105)

а наименьшее значение —1—на границе третьей и четвёртой

(106)

Что же касается косинуса, то он принимает наибольшее значение -j— 1 на границе четвёртой и первой четверти

(107)

а наименьшее — на границе второй и третьей

(108)

Изменяемость синуса и косинуса по четвертям даётся схемами:

Наилучший способ для запоминания указанных свойств — непосредственно опираться на зрительные представления единичного круга с вращающейся точкой (см. рис. 44). Этот простой рисунок всегда легко воспроизвести на бумаге или мысленно.

Не излишне, впрочем, сопоставляя обе схемы, обратить внимание на то, что изменяемость синуса находится в «прямом соответствии» со знаком косинуса (т. е. синус возрастает там, где косинус положителен, и убывает там, где косинус отрицателен), а изменяемость косинуса — в «обратном соответствии» со знаком синуса1).

Отмерим на единичном круге (рис. 45) от точки А дуги х и—х и в концах их поставим точки M и Мг; эти точки имеют одну и ту же абсциссу, но их ординаты отличаются знаком. Отсюда следует (см. § 3), что косинус — чётная функция, а синус — нечётная:

(109)

Рассмотрим дальше точки M и Ми находящиеся в концах дуг х и лг-j-îc (рис. 46). Эти точки расположены на противоположных концах диаметра единичного круга и, значит, симметричны относи-

Рис. 45. Рис. 46. Рис. 47.

1) Это — лишь часть того, что содержится в «правилах дифференцированиям

(sin х)' = cos je, (cos ху = — sin х

(см. стр. 312, формулы 5) и 6)).

тельно центра О. Поэтому отличаются между собой лишь знаком их абсциссы, а также их ординаты. Следовательно,

cos (х -{- it) = — cos х, sin (х -f- тс) = — sin л:. (110)

Наконец, возьмём две точки M и М19 находящиеся в концах дуг X и y —X (рис. 47). Легко понять, что такие точки взаимно симметричны относительно биссектрисы х=у. Значит (см. § 4), абсцисса Мх равна ординате M, а ордината Мг — абсциссе М. Итак,

(111)

Из формул (111), (109), (110) легко получается следующая:

(112)

Переходя к построению и исследованию графиков функций sin х и cos л:, заметим, что достаточно получить график синуса в промежутке первой четверти (®<х<-%) для того» чтобы затем, пользуясь формулами (109—110), посредством элементарных преобразований продолжить его на всю ось (—оо <С*<С+ оо).

Действительно, по формуле (109) начало О есть центр симметрии этого графика, что позволяет продолжить его на промежуток ^—"5"<*<Cy)' вторая из формул (110), говорящая о том, что прямая X = у есть ось симметрии графика1), позволяет продолжить его на промежуток ^—у <х< —-тсj; дальнейшее продолжение становится возможным вследствие существования периода 2?г (формула (102)). Что касается графика косинуса, то, как видно из формулы (112), он получается из графика синуса посредством перенесения параллельно оси Ох на отрезок ^—

Чтобы выполнить точечное построение графика функции sin л: в пределах первой четверти (®<Х<С.~^)> прибегают обыкновенно к делению на m равных промежутков.

1) Это заключение следует не непосредственно: заменяя в формуле (110) X на X—2« и затем используя нечётность синуса (формула (109)), мы получаем:

и последнее уже показывает, что прямая х = т>- есть ось симметрии.

Разделим, с одной стороны, на m равных частей четверть дуги AB единичного круга (в плоскости ОКУ, рис.48, а); с другой, разделим на m же равных частей отрезок ( на оси Ох (в плоскости Оху, рис. 48, б) и проведём через точки деления вертикали. Откладывая затем ординаты точек деления на дуге AB на соответствующих вертикалях в плоскости Оху, получим ряд точек графика функции sin а:.

Если нужно наметить график синуса довольно быстро (и не особенно заботясь о точности), то очень полезно бывает построение «через четыре точки», соответствующее случаю /я = 4. При этом длины ординат (значения sin* при х = 0, ^, -j, —т:, -j-j оказываются приблизительно равными 0, 4, 7, 9, 10 десятых1). Эти числа заслуживают того, чтобы их запомнить (см. более жирные ординаты на рис. 48, б).

Рис. 48.

Рис. 49.

Существенно обратить внимание ещё на одно обстоятельство. Рассмотрим на единичном круге несколько положений М, М, Мг точки, движущейся к точке А, соответствующих весьма малым значениям независимой переменной х. Как видно на рис. 49, а, орди-

1) Точнее: 0; 0,383; 0,707; 0,924; 1.

ната NM точки M, конечно, несколько меньше, чем длина дуги AM. Но отношение при приближении M к А неограниченно приближается к единице. Этому соответствует (рис. 49, б) тот факт, что ордината РМ точки M на графике синуса, движущейся к началу О, хотя и несколько меньше, чем абсцисса ОР (или, что то же, ордината PQ точки Q на биссектрисе у=х), однако с приближением M к О отношение (или pQj BCé меньше отличается от 1.

Таким образом, график синуса лежит ниже биссектрисы, у = х:

$>\пх<х (х>0);

но по мере приближения к началу О всё теснее к ней примыкает («касается»).

Рис. 50.

На рис. 50 показаны графики функций

y = smx и _v = cosat. (113)

Эти кривые носят название синусоиды и косинусоиды. «Теоремы сложения» для функций sinх и cosх

sin (хг -(- х") = sin хТ cos х" -f- cos xr sin x", cos (x? -f~ x") = cos xT cos x" — sin xT sin x"

хорошо известны из курса тригонометрии; нам незачем на них останавливаться (см. также стр. 505).

§ 26. Простые гармонические колебания

График уравнения

(114)

получается из графика _y = sin.x; посредством следующих последовательно выполненных преобразований:

1) сжатия в X раз (растяжения в у раз) по направлению оси Ох,

2) растяжения в С раз по направлению оси Oy,

3) перенесения параллельно оси Ох на отрезок, равный с.

Всякую функцию вида (114), а также её график, называют простым гармоническим колебанием (или просто гармоническим колебанием). Соответствующую кривую иногда называют также синусоидальной.

Параметры С, X, с в уравнении (114) носят следующие названия:

С—амплитуда, X — частота, с — фаза. Вследствие произведённого сжатия в X раз период функции, заданной уравнением (114), равен уже не 2тг, а Положив

мы получаем

и уравнению (114) можно также придать вид

y=Csm — (x — с) (С>0, а>>0).

(115)

Частота и период гармонического колебания обратно пропорциональны, причём их произведение равно 2тг:

Хш = 2ти. (116)

Рис. 51.

На рис. 51 изображено гармоническое колебание

с амплитудой С =2, частотой Х = 3 ^периодом <о = ^ и фазой c = j<2> причём построение произведено «через четыре точки».

Имея в виду рассмотреть дальше гармонические колебания с одним и тем же периодом, допустим для простоты, что о> = 2т:, т. е. x = 1.

Легко понять, что гармонические колебания вида

и = A cosX и v = В s'mx (117)

(каковы бы ни были знаки А и В) имеют фазы, отличающиеся на четверть периода (^j -

Всякое гармоническое колебание вида у = С sin (х — с) может быть разложено на сумму двух таких колебаний:

Csin(AT—с) = А cosAr + i?8*11*- (118)

Чтобы в этом убедиться, достаточно выполнить тригонометрическое преобразование по формуле:

С sin (х — с) = С (sin a: cos с — cos х sin с),

и затем положить

А = — Csinc, B = Ccosc. (119)

Обратно, сумма двух гармонических колебаний с одним и тем же периодом представляет собой гармоническое колебание с тем же периодом.

Доказывая это, сначала допустим, что данные колебания отличаются на четверть периода и имеют вид

и = A cos Ху v = B sin X.

Нужно подобрать постоянные С(>0) и с таким образом, чтобы удовлетворялось тождество (118). Но тогда дело сводится к решению уравнений (119) относительно неизвестных С и с.

Возводя в квадрат почленно каждое из этих уравнений, складывая и извлекая арифметический корень, мы получаем:

(120)

Далее из уравнений

можно в пределах промежутка 0 ^ с < 2тс найти единственное значение с.

Обращаясь к общему случаю, разложим каждое из данных колебаний

ух = d sin (x — cj), y2 = C2 sin (x — c2)

на сумму колебаний вида (118):

Ух = (— Ci sin ct) cos x -f- (Ci cos cj) sin л:, _у2 = (— Co sin c2) cos x -f (C2 cos c2) sin x;

тогда получим сумму

у =ух -\-у2 = — (Ci sin ci + С2 sin с2) cos л: + (Сх cos сх -f С2 cos с2) sin л:,

очевидно, вида (118), причём

А = — (Ci sin ci + С2 sin с2), В = d cos ct -f C2 cos c2.

Сумма простых гармонических колебаний с различными периодами уже не является простым гармоническим колебанием. Если частоты слагаемых колебаний соизмеримы

\1 = т1к, Х2 = /гс2Х,

(где тх и /я2— целые положительные числа), то сумма колебаний

ух = Сх sin X, (х — сх) и _у2 = С2 sin Х2 (л;—с2),

равная

у = С, sin Xj (лг — cj) -|- С2 sin Х2 (х — с2),

представляет собой так называемое сложное гармоническое колебание1) с периодом

(В случае же несоизмеримости частот сумма не является периодической функцией.)

Рис. 52.

На рис. 52 сплошной линией изображена сумма (по точкам) (см. § 3) колебаний с частотами 2 и 3 (изображённых пунктирными линиями):

1) Определение см. ниже, § 27.

§ 27. Тригонометрические многочлены

Подобно тому как всякая функция вида

f(x) = c0 + cix + c9x* + ... + cjcn

(где п — целое положительное число; с0,с19сп — постоянные коэффициенты) носит название рационального многочлена (относительно переменной лг), введено также особое наименование для функций вида

f(x) = aQ -|- (ßi cos*-}- bt sin дг) -|- (a2 cos 2x -\-b2 sin 2лг) -}-...

.. .-[-(ûnC0S/zx4"*nsin/îar)> (121) где л — целое положительное число; а0, at,..., ап, Ьи ô2,... tbn — постоянные коэффициенты. Такие функции называются тригонометрическими многочленами (относительно переменной х). Число п (при условии а%-\-ЬпФ0) называется порядком тригонометрического многочлена. Коэффициент а0 есть свободный член, выражение a, cosa:-|- Ьх sin*—первый член, выражение я2 cos 2х-\-Ь^ sin 2х— второй член тригонометрического многочлена и т. д. График т-то члена многочлена (при т^1) представляет собой простое гармоническое колебание частоты m (т. е. периода —). График всякого тригонометрического многочлена порядка п(^2) носит название сложного гармонического колебания. Пример такого колебания был указан в предыдущем параграфе.

Так как всякая функция периода со имеет также периодами все числа, кратные со, то каждый член многочлена (121) имеет периодом число 2тг. Так как, с другой стороны, сумма функций некоторого периода также есть функция с этим самым периодом, то сам многочлен (121) имеет период 27т1).

Совершенно очевидно, что

1) сумма двух (или большего числа) тригонометрических многочленов порядка^п есть также тригонометрический многочлен порядка ^ п;

2) при умножении тригонометрического многочлена на постоянное число он остаётся тригонометрическим многочленом, без повышения порядка.

1) Термины «тригонометрический многочлен» и «сложное гармоническое колебание» относятся также к выражениям более общего вида

возникающим при «растяжении» в раз по направлению оси Ох. Такие многочлены, конечно, имеют период ш.

В дальнейшем, однако, ради простоты рассматриваются лишь многочлены вида (121) с периодом 2тс.

Докажем следующую теорему.

Всякий рациональный многочлен Р (и, v) относительно двух переменных

u = cosx, v = $\nx

есть тригонометрический многочлен относительно переменной х. Порядок этого многочлена не превышает степени многочлена Р (и, v) относительно пары переменных и, v.

Доказательство разобьём на несколько ступеней.

1) Каждое из выражений вида

cos рх cos qx, sin рх cos qx, cos px sin qx, sin px sin qx (122)

(где p и q — целые положительные числа) есть тригонометрический многочлен порядка р -J- q. Это следует из элементарных тождеств:

2) Произведение двух тригонометрических многочленов порядков г и 5 есть тригонометрический многочлен порядка r-j-s. Предположим, что перемножаются многочлены

f(x) = aQ -f- (0i cos x bx sin x) -f- ... -\- (ar cos rx -|- br sin rx)

и

g (x) — a'0-\- (a[ cos x -\- b\ sin x) -(- ... -f~ (a^ cos sx -\- b's sin sx).

Их произведение есть сумма конечного числа членов вида (122) с постоянными коэффициентами, и следовательно, в силу предварительных замечаний (1) и (2), также есть тригонометрический многочлен. Порядок его, очевидно, не превышает г -\-s, но не может и быть меньше, так как члены порядка г -{-s получаются только при перемножении выражений аГ cos rx -(- ôrsin rx и as cos sx -\-b's sin sx, именно, они таковы:

Коэффициенты при cos(r-j-5)Ar и sm(r-\-s)x не могут обратиться в нуль одновременно, так как если a2r-{- Ь2Г> О, то из уравнений

сейчас же следует:

3) В частности, выражения вида

cos* л; sin** (123)

(где каждое из чисел h и k есть целое положительное число или нуль) являются тригонометрическими многочленами порядка h-\-k.

В самом деле, каждый из /г-[-& множителей в выражении (123) есть или cos х или sin je — тригонометрические многочлены порядка 1.

4) Произвольный рациональный многочлен P(u, v), где u = cosx, v = sin X, есть сумма конечного числа членов вида (123) с постоянными коэффициентами и потому на основании замечаний (1) — (2) есть тригонометрический многочлен. Порядок этого многочлена, очевидно, не превышает наибольшей из сумм k-\-k, т. е. степени многочлена Р(и, v). Но этот порядок может быть и меньше (простейший пример: P(u, v) = u*-\-v2).

§ 28. Многочлены Чебышева

Мы докажем теперь обратную теорему:

Всякий тригонометрический многочлен порядка п

f(x) = а0 -\- (ах cos х -|- bx sin*) -(- (а2 cos 2х-\- b2 sin 2лг) + • • •

... + (ап cos пх -f Ьп sin пх) (al + Ь1ф 0) (124)

представляет собой рациональный многочлен Р(и, v) степени п (точно) относительно пары переменных

и = cos Ху v = sin X.

Достаточно установить это по отношению к простейшим тригонометрическим многочленам вида cosnx и sin яд: (где п — произвольное целое положительное число); в самом деле, при сложении рациональных многочленов и умножении их на постоянные числа, очевидно, снова получаются рациональные многочлены. Останется ещё проверить утверждение, касающееся степени.

Докажем сначала, что существуют такие рациональные многочлены 1) Тп (и) степени п относительно и = соъх и 2) Un(u) степени п—1 относительно к, которые удовлетворяют тождествам относительно х:

cos пх=Тп (cos л:), (125)

sin nx=Un (cos х) sin х. (126)

Чтобы уяснить существо вопроса, посмотрим, что получается при значениях л=1, 2, 3.

Если л=1, то нужно положить

Тх(и) = и, их(и)=1. (127)

Если л = 2, то

так что

(128)

Если л=3, то аналогично получаем:

так что

(129)

Таким образом можно продолжать и дальше.

Дальнейшее рассуждение основывается на методе полной индукции. Допустим, что существование многочленов Тп (и) и Un (и) установлено, и сами они уже вычислены; посмотрим, как установить существование многочленов Тп + 1(и) и Un + 1(u) и каких вычислить.

Мы имеем, пользуясь тождествами (125) и (126), которые предположены доказанными:

и, с другой стороны,

Так как Тп (и) и Un (к), по предположению, — многочлены соответственно степеней nun—1, то, очевидно, выражения

— также многочлены степеней соответственно п -f-1 и п. Обозначая их через Гл + 1(и) и С/я + 1(и):

(130)

мы получаем те тождества, которые нам нужно было доказать:

Существование многочленов Тх (и) и Ut (и)> определяемых формулами (127) и удовлетворяющих тождествам (125) и (126) при п= 1 было проверено непосредственно. Многочлены Тп (и) и Un (и) при /г ^2 вычисляются по рекуррентным зависимостям (130). Так получаются формулы (127), (128), (129) и следующие:

и т. д. Легко проверить с помощью формул (125) и (126), что 1) все многочлены Т2п (и) и U.ln +1 (и) — чётные функции переменной к, а ^2n + i(u) и ^чп(и) — нечётные, 2) старшие коэффициенты многочленов Тп(и) и Un(u) равны 2п~1:

(131)

Многочлены Тп(и) называются многочленами Чебышева первого рода, a Un(u)—многочленами Чебышева второго рода.

Используя многочлены Чебышева, мы можем тригонометрическому многочлену, заданному формулой (124), придать вид

Выражения, стоящие в первой и во второй фигурных скобках, — рациональные многочлены от переменной и:

так что

(133)

Если ап ф 0, то многочлен L (и) — степени п; если Ьп ф 0, то многочлен M (и) — степени п—1. Но так как, по предположению, хотя бы один из коэффициентов ап и Ьп отличен от нуля, то непременно или L(u) — степени п или M (и) — степени п—1.В обоих случаях многочлен L (и) -J- vM (и) — степени п относительно пары переменных и, v.

Многочлен L (и) -f- vM (и) удовлетворяет всем требованиям, которые были предъявлены теоремой к многочлену Р(и, v). Но он — не единственный, удовлетворяющий этим требованиям1).

Мы укажем ещё одну возможную форму многочлена Р(к, v).

Заменяя в тождествах (125) и (126) х через ~ — х, мы получим новые тождества:

(134)

которым, расчленяя случаи п чётного и п нечётного, можно также придать следующий вид:

Отсюда получается:

и, полагая

(135)

мы находим новую форму для многочлена Р(и, v):

f(x) = Ll{v) + i,M1(v). (136)

Полезно обратить внимание на несколько следующих частных случаев. Условимся буквой Р обозначать рациональный многочлен. Тогда

1) Если b1 = b2 = bs = bi = ... =0, т. е. если f(x) есть тригонометрический многочлен вида

f(x) = а0-\-а1 cos х -\- а2 cos 2х-\- ... -|- ап cos пх -f- ...,

то он представляет собой рациональный многочлен от cos.*;:

f(x) = P(cosx).

2) Если aQ = а1=а2 = аг= ... = 0, т. е. если f(x) есть тригонометрический многочлен вида

1) Это следует из того, что если m=cosat, v = sin at, to выражение и2, встретившееся где-нибудь в формуле, можно заменить через 1 — v2.

то он может быть представлен в виде

f(x) = sin x • Я (cos л:).

3) Если ах = аг = а5 = ... =0, &2 = ô4 = ôe = ... =0, т. е. если тригонометрический многочлен f(x) имеет вид

f(x) = a0-\-b1 sin л: -f- а2 cos 2* -j- Ьъ sin Зл: -f- ...,

то он представляет собой рациональный многочлен от sin.*;:

f(x)=P(smx).

4) Если aQ = а2 = а4 = ... = 0 и ЬХ = ЬЪ = ЬЪ = ... — 0, т. е. тригонометрический многочлен f(x) имеет вид

f(x) = öj cos х-\-Ьъ sin 2х -f- а3 cos Зл: -f- bk sin \x-\- ...,

то он может быть представлен в виде

/ (x) = cos x • Р (sin х).

Нетрудно также проверить, что все эти утверждения обратимы.

§ 29. Тангенс и другие дробные тригонометрические функции

Перейдем к рассмотрению дробных тригонометрических функций, понимая под таковыми рациональные функции от основных тригонометрических sinx и cosx, содержащие по крайней мере одну операцию деления.

Простейшими элементарными дробными тригонометрическими функциями являются такие, которые содержат только одно действие и именно — деление. Pix — четыре: тангенс, котангенс, секанс и косеканс; они определяются формулами

(137)

Тангенс заслуживает особого внимания. С помощью соотношений (110) мы получаем:

(138)

откуда ясно, что тангенс имеет период тг, вдвое меньший, чем синус и косинус. С другой стороны, тангенс — нечётная функция

(139)

Таким образом, достаточно изучить поведение тангенса в пределах первой четверти (^<Cx<Cmj) ' ^мея гРаФик тангенса в этих пределах, можно его продолжить, пользуясь симметрией относи-

тельно центра О, для —-£<СХ<С®> а Дальше — продолжать вправо и влево по свойству периодичности. При * = 0 получаем:

так как в пределах первой четверти числитель sin* возрастает (от 0 до 1) и знаменатель cos* убывает (от 1 до 0), то дробь, определяющая тангенс, возрастает, и именно, от нуля до бесконечности. При * = ~ тангенс «не существует», «теряет смысл», «терпит разрыв», так как знаменатель cos* обращается в нуль, тогда как числитель sin* равен единице. Таким образом, график тангенса не имеет ни одной точки на прямой * = .

Тангенс положителен в первой четверти и (по свойству нечётности) отрицателен в четвёртой; по свойству периодичности снова положителен в третьей и отрицателен во второй. Это иллюстрируется схемой:

На рис. 53 показано точечное построение графика тангенса в пределах первой четверти — посредством деления первой четверти на восемь равных частей. Возвращаясь к единичному кругу (рис. 54), мы видим, что если точка M поставлена в конце дуги AM длины *, то точка Я, взятая на пересечении радиус-вектора ОМ с касательной к кругу в начальной точке А, как раз имеет ординату, равную tg*; в самом деле, из подобия треугольников О АР и ОМхМ следует

Рис. 53.

Имея в виду это геометрическое истолкование тангенса, при точечном построении достаточно проектировать точки пересечения радиус-векторов с вертикальной касательной в начальной точке единичного круга (см. рис. 53, а) на соответствующие вертикали в плоскости Оху (см. рис. 53, б).

Существенно отметить одну особенность графика тангенса. На рис. 54 дуга AM меньше отрезка АР1), и потому отношение-^ больше единицы; но когда M приближается к А, это отношение приближается к единице. На рис. 53, этому соответствует следующее: абсцисса каждой точки графика меньше ординаты, и потому отношение ординаты к абсциссе больше единицы; но с приближением точки к началу координат О это отношение приближается к единице. Кривая около начала координат О, будучи расположена выше биссектрисы у = х,

x<tgx (0O<f),

тесно к ней примыкает (касается ее в начале координат О).

Не останавливаясь на более подробном рассмотрении свойств функций котангенс, секанс и косеканс, отметим лишь, что их графики получаются из графиков соответственно тангенса, косинуса и синуса посредством построения графика величины, обратной по отношению к данной функции (см. § 4), в согласии с определениями (137). Но график котангенса из графика тангенса может быть получен ещё другим, более простым, способом: так как

или

то достаточно над графиком тангенса произвести следующие преобразования:

1) отразить его симметрично относительно оси Ох,

Рис. 54.

1) Обосновать это логически можно следующим образом. Обозначим через А' точку на единичном круге, расположенную симметрично точке А относительно прямой ОМ. Дуга АМА' меньше ломаной АРА (из двух выпуклых линий объемлемая меньше объемлющей); значит, AM меньше АР.

2) перенести параллельно оси Ох на отрезок у. Нетрудно понять, что совокупность этих преобразований равносильна симметричному отражению относительно оси х= -j1).

Подобным же образом график косинуса получается из графика синуса и график косеканса из графика секанса2).

Рис. 55.

На рис. 55 изображены совместно графики шести тригонометрических функций

Желая отдать себе отчёт во взаимных связях между шестью тригонометрическими функциями, положим ради краткости

(140)

Основным соотношениям (101) и (137) можно тогда придать вид

(141)

1) При этом учитывается центральная симметрия графика тангенса относительно центра О.

2) Отсюда термин «кофункции».

Совокупность этих пяти равенств обладает тем свойством, что если задано числовое значение какой-нибудь одной из шести переменных, то, не прибегая ни к каким действиям, кроме четырёх арифметических и извлечения квадратного корня, можно определить значения остальных пяти переменных (решить систему уравнений (141) относительно назначенных пяти букв). Но по смыслу вопроса извлекать квадратный корень приходится алгебраически, т. е. в тех случаях, когда он встречается, остаётся неопределённость в знаке, двузначность. Таким образом, если система соотношений (141) и позволяет рассматривать из шести величин (и, v, Wy И|, vl9 w^) каждую как функцию каждой, то, как показывает более детальное рассмотрение, из 5X6 = 30 возникающих при этом функций лишь б оказываются однозначными (рациональными), остальные же содержат квадратные корни и потому двузначны.

Например, если задано значение синуса v = -^t то для косинуса получается два значения tt = dt^ç^, и выбор знака может быть сделан не иначе, как исходя из каких-либо дополнительных данных, позволяющих судить о том, в какой четверти заключено значение независимой переменной *.

Из шести тригонометрических функций нет ни одной, значение которой однозначно определяло бы значение всех остальных. Всё же функция тангенс с этой точки зрения представляет особенный интерес. Если tgx = wy то значение синуса и косинуса вычисляются по формулам

(142)

причём знаки перед двумя радикалами могут быть какие угодно, но одинаковые. Замечательно то, что при таких условиях квадраты sin2.*;, cos2*, произведение sin*cos*, а значит, и такие функции, как sin 2* и cos 2* через w выражаются уже рационально:

(143)

Теперь легко понять, что, вводя новую функцию с периодом 2гс, а именно, тангенс половинного угла

мы получим, заменяя в формулах (143) х через у, w через tt или в результате непосредственного вычисления:

(144)

Таким образом, синус, косинус, а следовательно, и остальные четыре тригонометрические функции выражаются через тангенс половинного угла рационально. По значению tg у можно вычислить однозначно значения всех тригонометрических функций.

График функции / = tgy (он изображён на рис. 55 пунктиром) получается из графика w = ïgx посредством растяжения в 2 раза по направлению оси Ох. Из рис. 55 ясно, что каждому значению t соответствует (в пределах периода длиной 2тс) одно и только одно значение х, а следовательно, —одно значение каждой из функций и, v, w, и„ vv wt.

Конечно, функция /1=-j = ctgy способна играть такую же роль.

§ 30. Представление функций, рационально зависящих от тригонометрических, через одну или две из них

Всякая рациональная функция от элементарных тригонометрических функций одной и той же переменной х может быть представлена как рациональная функция от двух элементарных функций: и = cos X и v = sinx.

Это следует из того обстоятельства, что по формулам (141) функция w = tgx, а также функции u1=secx> v1 = cosecx и w1 = ctgx выражаются рационально через и и v. При этом нужно принять во внимание, что рациональная функция от одной или нескольких переменных, из которых каждая зависит рационально от одной или большего числа других переменных, сама есть, очевидно, рациональная же функция от этих других переменных.

Пример.

I. Всякая рациональная функция от элементарных тригонометрических функции одной и той же переменной х может быть представлена как рациональная функция от одной лишь функции — тангенса половинного угла:

Это следует из формул (144) предыдущего параграфа.

Пример.

Теорема I носит общий характер. Следующие теоремы II, III и IV содержат в условии дополнительные предположения и выделяют таким образом важные частные случаи.

II. Если рациональная функция от элементарных тригонометрических функций является а) чётной, б) нечётной относительно независимой переменной х, то она может быть представлена а) как рациональная функция от переменной u = qosx, б) как произведение рациональной функции от переменной и = cos* на v = sin x.

а) Обозначим рассматриваемую функцию через f(x). По теореме I имеем тождество

(145)

С другой стороны, по условию,

/(-*)=/(*). (146)

Отсюда следует тождество:

(147)

или

(148)

так что рациональная функция Rt — чётная.

1) Буквами R со значками обозначаются дальше различные рациональные функции.

2) Тождество (148) следует из тождества (147), так как при любом t можно подобрать х так, чтобы удовлетворялось равенство

В таком случае она может быть представлена как рациональная функция от fi *)

Но

Поэтому

б) Если вместо тождества (146) согласно условию теоремы имеется тождество

/(_*)=-/(*),

то вместо (148) мы получаем:

так что функция /?, (t) — нечётная. Но тогда функция «— чётная, и потому, как раньше,

1) Если R(x) есть чётная рациональная функция от х, то она есть рациональная функция от х2.

Эта теорема может показаться очевидной. Вот её доказательство.

Пусть

где Р (х) и С? (х) — многочлены.

Разделяя в них члены чётной и нечетной степени, напишем

где Ри Ра, Qt и Q2 —новые многочлены. Из тождества jR (— х) = R (х) следует тождество

или

В этой пропорции и правая и левая часть есть одна и та же рациональная функция от x2. Обозначая её через S (лг2), мы получаем:

и отсюда следует тождество

В таком случае

Но

(149)

и поэтому

III. Если рациональная функция от элементарных тригонометрических функций а) не меняется при замене независимой переменной х через я — х, б) меняет лишь знак при этой замене, то она может быть представлена а) как рациональная функция переменной v = s\nx, б) как произведение рациональной функции v = s\nx на и = соъх.

а) Тождеству

/(*)=/(*-X), (150)

заменяя х через лг-|-у, можно придать вид

или

f1(—x)=f1(x),

где положено

(151)

Итак, функция ft (х) — чётная. По теореме На в таком случае она может быть представлена как рациональная функция от и = cos х:

Другими словами, имеет место тождество

Заменяя в нём х через х — ~, получаем:

б) Если вместо тождества (150) имеет место по условию тождество

/(*-*)=_/(*),

то тогда функция fx(x)y определяемая тождеством (151), — нечётная, и потому на основании теоремы Нб можно написать

fx (лг) = vRt (и) = sin X • /?, (cos x)t

или

Заменяя х через х—у, получаем:

f(x) = — cos X • Ri (sin x) = cos x • R2 (sin л:) = w/?2 (v).

IV. рациональная функция от элементарных тригонометрических функций а) не изменяется при замене х на д;-|-тс (т. е. имеет период тс), б) меняет лишь знак при этой замене, то она может быть представлена а) как рациональная функция от w = tgt, б) как произведение рациональной функции w на и = cos x или г; = sin л;.

а) Раз функция f(x) обладает периодом тс

/(*+*)=/(*),

то функция

обладает периодом 2тс; в самом деле,

В таком случае, по теореме I, существует тождество

заменяя в нём х через 2лт, получаем:

f(x)=f1(2x) = R1(tgx).

б) Если функция f(x) удовлетворяет тождеству

/(*+*)=-/(*),

то каждая из функций

имеет период тс. Значит, по теореме IVa имеем: fi(x) = R1(w)i Л = (да),

откуда

Примечание. Легко проверить, что теоремы I, II, III и IV обратимы. Для теорем II, III и IV это устанавливается непосредственно; что касается теоремы I, то достаточно указать на тождество (149).

Таким образом, теоремы I—IV дают условия, необходимые и достаточные для того, чтобы функция могла быть представлена в той или иной из рассмотренных форм.

§ 31. Примеры исследования функций, рационально зависящих от тригонометрических. Тригонометрические уравнения

Теоремы I, II, III и IV, изложенные в предыдущем параграфе, и родственные им теоремы в § 28 (см. 1 и 3) открывают возможности для элементарного исследования функций, рационально зависящих от основных тригонометрических. Если с помощью введения новой независимой переменной — одной из основных тригонометрических функций или тангенса половинной дуги — удаётся свести данную функцию к рациональной функции от новой переменной, то тем самым, поскольку поведение основных тригонометрических функций можно считать известным, имеются основания судить и о поведении данной сложной функции (см. § 5, п. 9).

Те же теоремы полезны и при решении тригонометрических уравнений. Главная трудность при решении уравнений заключается в том, чтобы, «алгебраизируя» их, удачно выбрать новую переменную. Теоремы позволяют сделать выбор по простым формальным признакам, чем обусловливается направление дальнейших тождественных преобразований.

Следует отметить, что если переход к новой переменной t = tg-^- позволяет всегда произвести рационализацию (это, так сказать, «универсальная» подстановка), тем не менее в случае, если возможна одна из подстановок к = cos je, v = sinx или w = tgx, то вновь получаемая рациональная функция, как правило, оказывается проще; поэтому можно рекомендовать к «универсальной» подстановке прибегать лишь «в крайнем случае». Обратимся к примерам на исследование функций.

Пример 1.

Эта функция — рациональная относительно u = cosx. При неограниченном изменении х переменная и меняется в пределах от — 1 до +1, и функция 2ц в этом промежутке (как и всюду, кроме точки разрыва и = — g*j — убывающая (см. § 5, п. п. 1, 2, 7). Поэтому функция у =/(л:) убывает в тех промежутках, где cos л: возрастает, и возрастает в тех промежутках, где он убывает (§ 5, п. 9). Так как функция f(x) чётная, то достаточно рассмотреть

половину периода О^лг^тс: на другую половину —тс^Глг^О график продолжается по симметрии. В пределах первых двух четвертей cosjtr убывает от 1 до — 1; значит, функция f(x) возрастает и именно, от до 1.

Рис 56.

При x=y (положение «равновесия» для u = cosa:) значение f(x) равно ~ (рис. 56).

Пример 2.

Так как эта функция, очевидно, не меняется при замене х на лт + те (имеет период тс), то естественно ввести переменную w = tg х. Преобразование даёт:

у = tg x (tg x — 2) = w (w — 2).

Функция

w(w — 2) = (w~lf—l

убывает в промежутке — оо < w < 1 и возрастает в промежутке 1 < w < оо.

Рис 57.

Функция tg x—возрастающая; значение а/ = 1 она принимает (в промежутке периода 0 < х < тс) при х = -^-; при х = она терпит разрыв. Когда х возрастает от 0 до то w возрастает от нуля до 1, а. у убывает от 0 до — 1;

когда x возрастает от ~ до ~, то w возрастает от 1 до бесконечности, г у— от —1 до бесконечности ^значение у = 0 получается при до = 2, т. е. при x 63 у ° ); когда x возрастает, далее, от у до тс, то w (после разрыва) возрастает от — оо до 0, и тогда у убывает от + оо до 0. Заметим ещё, что при х = -£% мы имеем w = —1,^ = 3 (рис. 57).

Пример 3.

Так как функция f(x) — чётная, то достаточно исследовать полупериод О^лг^тс, взяв в качестве вспомогательной переменной u = cosx. Так как

cos Зл: = 4 cos3 х — 3 cos х = 4ц3 — Su

(многочлен Чебышева Тг(и))у то

Получившийся многочлен третьей степени сведем к «стандартной форме» (см. § 10, (ß)) заменой

и тогда будем иметь

Поведение функции z* — z меняется в точках z = ± |/ у (см. § 10), которым соответствуют точки и — ± у и, далее, *=-г и х = ~г п-

Рассматривая образованные этими точками промежутки, мы убеждаемся, пользуясь общими положениями об изменении сложных функций (см. § 5), в справедливости следующей таблицы (см. рис. 58):

Рис. 58.

Сразу видно, что при х = -^- мы получаем у = 0.

Полезно в этом примере сопоставить результаты проведённого исследования с точечным построением, заключающимся в составлении «полусуммы» графиков

у1 = cos Зл: и у2 = — 3 cos х.

Пример 4.

Эта функция — нечётная, так что достаточно рассмотреть полупериод О^лг^тг; график можно затем продолжить, пользуясь симметрией относительно центра О. Функция f(x) не изменяется при замене х на тг — х; отсюда видно, что естественно взять в качестве вспомогательной переменной v = sinx. Вместе с тем отмеченное обстоятельство показывает, что прямая х=-~- является осью симметрии графика; таким образом, достаточно рассмотреть даже четверть периода О^лг^-^-'- на вторую четверть график продолжается по симметрии. Мы получаем:

(152)

или же

(153)

С увеличением v выражение — — 2v убывает (всюду, кроме точки разрыва v = 0), так как — убывает, a 2v возрастает.

Когда X возрастает от 0 до ~, то v = sinx возрастает от 0 до 1, и тогда у = —2v убывает от -f- оо до — 1. Из формулы (153) ясно, что значение нуль у принимает (в первой четверти) при 1/ = !/^-, т. е. при

Рис. 59.

Пример 5.

В этом примере не удаётся обнаружить элементов симметрии или периодичности (помимо периода 2тг). Исследуем функцию посредством замены

Выражая cos х и sin х через t по формулам (144), мы получаем:

(154)

и, далее (см. § 9),

(155)

Поведение выражения t--3) +"9 (в зависимости от /) меняется при / = у) чему соответствует значение лг, равное корню Ç уравнения

а именно,

Когда x возрастает от — т. до то * возрастает от — оо до у, выражение t--g-j + у убывает от оо до у и, значит, .у возрастает от 0 до у. Когда же х возрастает от ? До тг, то £ возрастает от у до оо, выражежение t <— у j -f- у возрастает от у до оо и у убывает от у до 0.

Заметим, кроме того, что при лг = 0, лг = уил: = —у получается соответственно:,у =у, .у = у и.у = у (рис. 60).

Рис. 60.

Переходя к примерам на решение тригонометрических уравнений, уместно заметить, что при решении уравнения нас непосредственно интересует только один вопрос из общего плана исследования (см. § 5), именно: при каких значениях переменной х данная функция принимает значение нуль? Так как при решении этого вопроса существенно лишь разложение на множители данного выражения, то одинаково удобно прибегать к теоремам II — IVa и к теоремам II — IV6 предыдущего параграфа (или к 1—4, § 28). Характер использования этих теорем таков, что, установив, какую тригонометрическую функцию удобно взять в качестве вспомогательной переменной, нетрудно дать надлежащее направление выполняемым тождественным преобразованиям.

Пример 6.

9 — 11 cos x + 13 cos 2х — 3 cos Зл: = 0.

Так как левая часть — чётная функция лг, то (на основании теоремы IIa) можно ввести переменную u = cosx. Принимая во внимание, что

cos 2х = 2и2— 1, cos Sx = 4н3 — Зи

(многочлены Чебышева 1-го рода, см. стр. 108), находим:

9—11 cos x-j- 13 cos 2лг — 3 cos Злг = — 2(6и8 — 13и2 + и + 2).

Выделив множитель и — 2 многочлена третьей степени, мы легко разложим затем на множители получившийся трёхчлен второй степени

6и8 - 13иа + и + 2 = (и — 2) (6ц2 — и - 1) = (и — 2) (2ц — 1)(3ц + 1).

Итак, уравнению можно придать вид

(cos x — 2) (2 cos x — 1) (3 cos x + 1) = 0.

Множитель cos x — 2 никогда не обращается в нуль; значит, уравнение удовлетворяется лишь при условии, что

откуда получаются два корня

и нетрудно найти два остальных (в пределах периода).

Пример 7.

3 sin 2х -f- 4 cos3x — 3 sin 4х = 0.

При замене х на г, — х левая часть уравнения меняет знак. Поэтому на основании теоремы III б, вводим переменную v = sin х. Тогда с использованием многочленов Чебышева обоих родов получаем:

Многочлен третьей степени удаётся разложить на множители:

или

и мы легко находим восемь корней уравнения (в пределах периода):

два последних корня определяются из уравнения

Пример 8. Требуется найти корни уравнения

1 -f sin x cos* = 35 cos4 x

в пределах первой четверти.

Так как обе части уравнения содержат лишь члены чётных степеней относительно cos х и sin х и, следовательно, левая и правая его части не меняются при замене х на х-{-п, то имеет смысл ввести переменную w = tgx. Пользуясь формулами (142), приводим уравнение к виду

(156)

В первой четверти w = tgx>0, и потому нам нужны лишь положительные корни уравнения (156). Его левая часть — возрастающая функция до и, значит, уравнение (156) имеет не более одного положительного корня. Легко проверить, что один корень есть: это w = 2.

Остаётся найти значение х в первой четверти из уравнения

Xgx = 2.

§ 32. Обратные1) тригонометрические функции

В уравнении

y = sinx (157)

поменяем местами х и у; получим

x = smy. (158)

Записывают также равенство (158) в виде

у = Aresin х; (159)

равенства (159) и (158) следует рассматривать, таким образом, как равносильные.

Обратная тригонометрическая функция Aresin л; (арксинус х буквально — «дуга, синус которой равен лг») не является однозначной. Вернемся к единичному кругу, с помощью которого была определена функция синус (см. рис. 44).

Каждой данной дуге AM соответствует одно определённое значение синуса—ордината точки Му вертикальный отрезок MtM. Пусть, обратно, в качестве независимой переменной взят некоторый вертикальный отрезок МХМ (он может быть направлен вверх или вниз, но по длине не должен превосходить единицы). Обозначим его через х:

МхМ=х.

Тогда на вопрос, какая дуга имеет этот отрезок своим синусом,— однозначного ответа дать нельзя. Таких дуг существует бесконечное множество: требуемым свойством обладает не только дуга АМУ но и дуга ABN, а также ABCDAM и ABCDABN и т. д. и ещё «отрицательные» дуги ADCN, ADCBM и т. д. Итак, если функция AresinA: имеет значение уу то она имеет значение тс—уу а также (вообще) y-\-2kn и (тс—y)-\-2ki:.

Свойство неоднозначности функции ArcsinA: ясно видно и из её графика. Мы знаем (см. § 4), что график уравнения (159) получается из графика уравнения (157) посредством симметричного отражения относительно биссектрисы у = х (рис. 61). Из графика функции Aresin X видно, что при условии | х I ^ 1 существует бесконеч-

1) См. § 4.

ное множество точек, имеющих данную абсциссу *: если ординату одной из них (всё равно которой) обозначить через у, то ординаты всех охватываются формулами

у + 2къ, (тг— y)-\-2k*.

Подобно тому как в случае квадратного корня (функция, обратная функции «квадрат») из числа x при условии *^0 необходимо различать двузначный «алгебраический» корень от однозначного «арифметического», так же точно и в случае арксинуса (функция, обратная функции «синус») от независимой переменной x при условии |*|=^1—всякий раз, когда могут возникнуть сомнения, — приходится указывать, имеется ли в виду какое-нибудь (любое, безразлично какое) значение рассматриваемой функции или же некоторое определённое, и какое именно. Но различие — в том, что функция |/х двузначна, тогда как функция Aresin* бесконечно многозначна.

Те значения у = Aresin*, которые удовлетворяют неравенству — -у =^3> нередко называют главными и обозначают через aresin*. Таким образом, можно написать

(160)

На рис. 61 главные значения арксинуса отмечены жирной линией. Функция у = aresin* определена в пределах —1=^*=^ + 1, притом она — однозначная, нечётная и возрастающая (см. § 52).

Рис. 61.

В данной статье, выяснив суть дела на одном примере арксинуса, нет необходимости входить в подробности, касающиеся функций, обратных прочим элементарным тригонометрическим функциям. Ограничимся поэтому краткими указаниями и графическими иллюстрациями.

Функция арккосинус

y = kiccosx, (161)

обратная функции косинус

y = cosx, (162)

определена и притом бесконечно многозначна (как и функция Aresin л:) в промежутке (—1^лг^-[-1). Её «главное значение» y = axccosx удовлетворяет неравенству О^у^ъ; общая формула имеет вид

Arccos X = ± arecos х -f- 2Ы. (163)

Функция у — arccos х — однозначная и убывающая — определена в промежутке —1^а:^-|-1 (рис. 62).

Рис. 62.

Функция арктангенс

у = Arctg х, (164)

обратная функции тангенс

y = tgx9 (165)

определена и притом бесконечно многозначна для всех значений независимой переменной (—оо <С*<СН~ °°)- «Главное значение» arctg x удовлетворяет неравенству — у <у < у ; общая формула имеет вид

Arctg у = arctg x -f- arc.

Функция у = arctg x — однозначная, нечётная и возрастающая в пределах —оо <С*<СЧ~ 00• Функция арктангенс никогда не принимает значений вида у-|-&тс. График её состоит из бесчисленного множества отдельных «ветвей», переходящих одна в другую при перенесениях параллельно оси Oy на отрезки вида (рис. 63).

Аналогично определяются функции арккосеканс, арксеканс и арккотангенс

у = ArccosecAT, ] y = kicsecx, >(166) y = Arcctgxt j

обратные функциям косеканс, секанс и котангенс

у = cosec x, ] y = secx, 1(167) .У = ctg л:. j

Их употребления всегда можно избежать, принимая во внимание, что

(168)

Рис. 63.

1) «Дуги, имеющие косеканс, равный х, те же самые, что и дуги, имеющие синус, равный —» и т. п.

Задачи элементарной математики редко приводят к необходимости пользоваться обратными тригонометрическими функциями в явной форме. Например, задача «вычислить значение Arcsinх при х = ^» равносильна задаче: «найти все дуги (или углы), синус которых равен В разного рода задачах геометрического содержания удачный выбор неизвестной или переменной, как правило, позволяет обойтись без обратных функций. Напротив, в высшей математике (в интегральном исчислении) обратные круговые функции появляются вполне естественным прямым путём (см. стр. 367) и избегать их было бы крайне неудобно.

Тригонометрические функции связаны между собой большим количеством различных соотношений, значительная часть которых приводится в учебниках тригонометрии; некоторые из формул подобного рода настолько важны в теоретическом и практическом отношениях, что занимающийся математикой запоминает их прочно и навсегда1). Обратные функции чрезвычайно обогащают формульный аппарат тригонометрии. Но пользоваться соотношениями, содержащими обратные функции, приходится на самом деле не очень часто и не очень много; и именно математическая практика указывает, какие из подобного рода формул заслуживают преимущественного внимания. С этой точки зрения представляют интерес формулы лишь некоторых типов.

I. Тригонометрическая функция от обратной тригонометрической (не обязательно — соответствующего наименования) есть алгебраическая функция, именно, выражающаяся через арифметические операции и квадратные радикалы.

Если прямая и обратная функции соответствуют в смысле наименования, то, как явствует из определения, они «погашают» друг друга:

sin (Arcsin л;) = х, cos (Arccos x) = x, tg (Arctg x) = x2).

Рассмотрим теперь случай, когда такого соответствия нет; возьмём, например, выражение sin Arccos х. Можно написать сразу

(169)

ссылаясь на то, что «синус дуги, косинус которой равен х, есть j/l—л:2, так как сумма квадратов синуса и косинуса есть 1». Или

1) Сюда относятся, например, «теоремы сложения» (синус и косинус суммы двух дуг).

2) Спросим себя: «Кто отец сына, у которого отец Иван?» Сомнения нет; отец —Иван.

станем рассуждать подробнее: обозначим через у какую-нибудь дугу, косинус которой равен х,

kiccosx=y,

тогда, по определению,

x = cosy

и, следовательно,

Такого же характера соображения приводят в итоге к следующей табличке формул2):

II. Обратная тригонометрическая функция от прямой (с соответствием наименований или без соответствия) есть бесконечно многозначное выражение, которое при несоответствии наименований может быть упрощено лишь в случае «кофункции».

Мы получаем, во-первых3):

Мы получаем, во-вторых:

1) Конечно, радикалы здесь и ниже следует понимать в алгебраическом смысле: выбор знака может быть сделан лишь в том случае, если известно, в какой четверти находится дуга, определяемая обратной круговой функцией.

2) Если дуга, определяемая обратной функцией в левой части формул, расположенных одна над другой, одна и та же, то радикалы в правой части, конечно, должны иметь одинаковые знаки.

3) Спросим: «Какой сын у отца, у которого сын Иван?» Не известно: может быть, Иван, а может быть —один из его братьев.

В самом деле, например Aresin (cos х) обозначает всякую дугу, синус которой равен cosa:. Так как

то —x есть одна из таких дуг; всякая иная из этих дуг или в сумме с нею составляет тс, или отличается от той или другой на величину, кратную 2тс.

III. Нередко приходится одну из обратных, тригонометрических функций заменять другой, с надлежащим изменением аргумента. Пусть, например, одно из значений Arcsin.*; требуется представить как арккосинус от некоторой величины; обозначим последнюю буквой у:

Arcsin x = Arccos у. Из написанного равенства следует:

у —cos (Arcsin x),

или по формуле п. I

Итак,

(170)

причём эту формулу нужно понимать в том смысле, что каждое значение Arcsinх (при условии |лг|=^1) равно некоторому значению Arccos -yf 1—х\ какому именно — подлежит уточнению в зависимости от конкретных обстоятельств. Подобным же образом

§ 33. Исследование многочленов Чебышева. Их минимальное свойство

Идея элементарного исследования тригонометрических многочленов (или вообще функций, рационально зависящих от тригонометрических) заключается в том, чтобы посредством тригонометрической подстановки свести вопрос к более простому исследованию рациональной функции.

В немногих случаях возможно осуществить обратный ход мысли: исследование рационального многочлена (или рациональной функции) свести к более простому исследованию тригонометрического многочлена или функции, рационально зависящей от тригонометрических. Дело, конечно, в том, что немногие тригонометрические многочлены успешно поддаются непосредственному исследованию. К числу таких многочленов можно, однако, отнести cos/гл: и sin ял;.

В качестве примера рассмотрим поведение многочлена Чебышева первого рода Тп(х) в промежутке значений независимой переменной от —1 до -J- 1. Формуле, его определяющей,

cos пх=Тп (cos л:),

заменив cosx через к, можно придать вид

Тп (и) = cos п Arccos и. (171)

Здесь всё равно, какое значение Arccos и иметь в виду: функция cos/глг не меняется при замене х на —х или на x-\-2kтс. Для простоты допустим, что речь идёт о главных значениях Arccos и,

Предположим сначала, что п—число чётное: п = 2пг.

Когда и возрастает от —1 до -f-1, то х = arccos и убывает от тс до 0, и значит, величина пх = п arccos и убывает от /гтс до 0. Но раз эта величина, являющаяся аргументом под знаком косинуса, убывает от лтс = 2/ятс до 0, то легко понять (представим себе график косинуса), что сам косинус, т. е. многочлен Tn(ii)t при этом y=m Раз совершит полное колебание от -J-1 к —1 и обратно.

Нетрудно понять, что при этом:

1) Значение -f-1 многочлен Тп(и) принимает в тех точках,

где п arccos и = 2ятс, т. е. h = cos-:

(172)

2) Значение — 1 он принимает в тех точках, где

(173)

3) Значение 0 он принимает в точках, где

(174)

Предполагая, что п — нечётное: n = 2m-\- 1, мы получим такие же результаты, с той разницей, что при увеличении к от — 1 до -|- 1 выражение п arccos и убывает от лтс = (2т -\- 1) тс до 0 и поэтому Тп(и) сначала возрастает от —1 до +1, затем делает ещё m полных колебаний от -\- 1 до —1 и обратно. Формулы же (172—174) сохраняются без изменений.

На рис. 64 воспроизведён график многочлена Чебышева

у = Т12(х)1),

при л=12 в пределах, указанных неравенством —l^jc^-f-^-Самым замечательным свойством многочлена Чебышева

У=Тп(х)

является то, что в промежутке —1 ^лг^-^ 1 при убывании х от 1 до —1 он принимает, начиная с правого конца (х=1), естественно, поочерёдно, наибольшие значения -f-1 и наименьшие —1, все равные между собой по абсолютному значению, причём совершается п переходов от -|-1 к — 1 или обратно; таким образом, на левом конце (х = —1) принимается значение -f-1 или — 1 в зависимости от чётности п. За пределами промежутка I Тп (x) I быстро возрастает.

Сделаем теперь «сжатие» в 2п~1 раз по направлению оси Oy и рассмотрим новый многочлен

Свойства его графика — такие же, что и графика Тп(х)у с той разницей, что абсолютные величины максимумов и минимумов на этот раз равны -^zr • Вместе с тем, так как старший коэффициент Тп{х) равен 2я"1 (см. § 28, (131)), то старший коэффициент нового многочлена равен 1. Итак, среди многочленов степени /г, со старшим коэффициентом, равным единице,

(176)

Рис. 64.

1) Для удобства независимое переменное — аргумент многочлена Тп — здесь и дальше обозначено, как обычно, буквой х*

существует такой ^именно, Тп(х)^, который в промежутке — 1 =^лг^ 1 удовлетворяет неравенству

Мы покажем сейчас, что ещё уменьшить указанную границу нельзя: многочлен Рп(х) степени п вида (176) не может при всех значениях л;([д;[^1) удовлетворять неравенству

(177)

Рис. 65.

На рис. 65 сплошной линией показана схематически часть графика (175), заключённая в прямоугольнике с вершинами

Вертикалями, проведёнными через точки максимума и минимума, этот прямоугольник разбит на п частей — также прямоугольников с одной и той же высотой и различными основаниями. Если бы существовал многочлен Рп(х) вида (176), удовлетворяющий неравенству (177), то часть графика

У = Рп(*)> (178)

ограниченная пределами — 1 1, была бы заключена внутри полосы, ограниченной прямыми AB и DC (пунктирная кривая на рис. 65); так как она соединяла бы отрезки ВС и AD, то этот график имел бы по меньшей мере п общих точек с графиком (175). В самом деле, на пути от ВС к AD график (178) должен был бы пересечь все промежуточные вертикали, и внутри каждого частного прямоугольника было бы по меньшей мере по одной общей точке графиков (178) и (175), так как, очевидно, не могут не пересечься лежащие внутри прямоугольника две кривые, из которых одна соединяет противоположные вершины, а другая — внутренние точки противоположных сторон этого прямоугольника.

Но абсциссы п точек пересечения графиков (178) и (175) (несомненно все — различные) должны быть корнями уравнения

(179)

А это невозможно, так как вследствие равенства старших коэффициентов рассматриваемых многочленов уравнение (179) — степени ниже чем п.

Мы пришли к противоречию; следовательно, сделанное нами допущение о существовании многочлена Рп(х) было неверно.

Доказанное свойство многочленов Чебышева формулируют обыкновенно так: из всех многочленов Рп(х) степени п вида (176) наименее всех «отклоняется от нуля» в промежутке многочлен Чебышева -^iTn(x). При этом под «отклонением от нуля» некоторого многочлена Р(х) в данном промежутке а^х^Ь следует понимать наибольшее значение |Я(л:)| в этом промежутке, иначе говоря, — наибольшую (по абсолютной величине) из ординат соответствующего графика.

Это свойство оказалось отправным пунктом созданной П. Л. Чебышевым (в середине прошлого столетия) теории наилучшего приближения функций.

Не останавливаясь подробнее на многочленах Чебышева второго рода (см. § 28, (131)

исследование которых также может быть проведено элементарным методом1), рассмотрим ещё подобный же пример дробной рациональной функции, исследование которой сводится к исследованию дробной тригонометрической функции.

Функция, о которой идёт речь, имеет вид

(180)

Что эта функция — рациональная, устанавливается методом полной математической индукции. Пусть Rn (х) — рациональная. Тогда

откуда видно, что функция Rn+1 (лг) — также рациональная. Но R1(x) = = ig(arctgл:) = X — функция рациональная; значит, и все функции Rn(x)— рациональные. Например:

1) Максимумы и минимумы многочлена Un(x) лежат уже не на горизонтальных прямых y = ±i\, а на кривых

2) Выбор значения арктангенса безразличен, так как функция Xgnx не изменяется при замене х на х-{-к. Поэтому можно считать, что выбираются «главные значения» арктангенса.

Так как arctg л:—функция возрастающая и Xgx также (кроме точек разрыва), то Rn (х) — тоже функция, возрастающая всюду, кроме точек разрыва. При возрастании л: от — оо до -f- 00 функция arctg х возрастает от — до -f-, а пarctgх — от —у до -{-у. Точки разрыва возникают при п arctg x = ~ + to, т. е. при

причём целые числа k должны удовлетворять неравенству

(181)

Функция Rn (х) обращается в нуль при условии п arctg х = kn, т. е. при x=tg —, причем k удовлетворяют неравенству

или

(182)

По поводу значений k, в точности равных границам, указываемым соотношениями (181) и (182), следует заметить, что 1) «разрыв при дг = ±:оо» даёт наклонную асимптоту, 2) «обращение в нуль при лг = ±оо» соответствует случаю, когда ось Ох становится асимптотой.

На рис. 66, о и б показаны соответственно графики Rz(x) и Ri(x).

Рис 66.

ГЛАВА III

ПРЕДЕЛЫ ЧИСЛОВЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ И ПРЕДЕЛЫ ФУНКЦИЙ

§ 34. Конечные и бесконечные числовые последовательности

Из всякого данного множества (совокупности) Е каких угодно объектов можно образовывать последовательности.

Последовательность строится следующим образом. Указывается некоторый объект Ах из È, называемый первым членом последовательности; затем указывается объект А2, который непосредственно следует за и называется вторым членом; далее, указывается объект А3, который непосредственно следует за А2 и называется третьим членом, и т. д. Объекты Av А2, Аг и т. д. — не обязательно различные: среди них могут быть и одинаковые. Процесс построения последовательности заключается в том, что если уже указан некоторый «л-й член», получивший «порядковый номер», или индекс /г, то указывается «непосредственно следующий» за ним «(/г —j— 1 )-й член» с индексом /г —|— 1.

Такой процесс может закончиться на некотором объекте получившем индекс, равный натуральному числу N: это произойдёт в том случае, если не будет указано никакого объекта, непосредственно следующего за объектом Ац. Тогда N-ft член последовательности А^ называется её последним членом; индекс N в этом случае обозначает число членов последовательности. Сама последовательность тогда называется конечной.

Перечисляя члены конечной последовательности в порядке следования, обычно их разделяют запятыми:

Ali -^2» ^3> • • • > Äff, (1)

Многоточие здесь обозначает пропуск членов с индексами, большими чем 3, но меньшими чем N.

Но процесс построения последовательности можно представлять себе и неограниченно продолжающимся, не имеющим конца. В таком случае не будет существовать последнего элемента последовательности: каково бы ни было натуральное число /г, за членом последовательности Ап, имеющим индекс п, будет непосредственно еле-

довать член Ап+1, имеющий индекс, на единицу больший. Если мы говорим, что в результате построения получается бесконечная последовательность, то это означает, что, каково бы ни было натуральное число Nf всегда найдётся член последовательности, имеющий индекс N; вместе с тем придётся сделать допущение, что всякий член последовательности имеет в качестве индекса некоторое натуральное число1).

Члены числовых последовательностей в дальнейшем будут обозначаться маленькими буквами. Самый простой способ задать конечную числовую последовательность заключается в том, чтобы написать все её члены один за другим, в порядке следования:

Яц Ö2> аЪ> • • • i aN- (2)

Вот несколько примеров конечных числовых последовательностей:

1) 1, 2, 3, 4, 5 (ЛГ=5),

2) 7, 2, 10 (ЛГ=3),

3) 1, 2, 3, 1, 2, 3, 1, 2 (Л/=8).

В случае, если число членов N велико, непосредственное выписывание всех членов становится затруднительным. Иногда, чтобы задать последовательность, прибегают к аналитическому методу.

1) Нужно объяснить, в чём смысл последней оговорки. Рассмотрим, например, совокупность различных между собой чисел вида

где п может принимать все натуральные значения, кроме 1 и 2. Если все эти числа расположены в порядке возрастания, то возникает следующая «упорядоченная» система чисел:

В этой системе имеется первый член -g-, которому не предшествует непосредственно никакой другой; помимо того, каждому числу непосредственно предшествует и за каждым членом непосредственно следует один и только один член; таким образом, последнего члена в системе не существует. Система, однако, не образует бесконечной последовательности: действи тельно, приписывая члену -g индекс 1, члену индекс 2 и т. д., вообще члену вида 1--— индекс п — 2, мы «израсходовали» бы все натуральные индексы на члены вида 1--, и на члены вида 1 -\--или 2--индексов бы «нехватило».

Располагая все числа данной совокупности в ином порядке (не в порядке возрастания), мы могли бы получить последовательность чисел, например:

Предположим, что существует элементарная функция f(x)f не теряющая смысла при целых положительных значениях х в пределах от х=1 до x = N и обладающая тем свойством, что при подстановке х=1 получается как раз первый член последовательности <Z|, при подстановке х=2 — второй член и т. д. до x=N. Тогда достаточно указать функцию f(x) и число членов последовательности N; воспроизведение всей последовательности

/0), /(2), /(3), ... ,/(Л0

в этом случае не представит труда. Например:

1) если /(х) = х2у N—5, то получим последовательность

1, 4, 9, 16, 25;

2) если /(х) = хъ — 6jc2 ~f-11лг—6, N=4, то получим последовательность

О, 0, 0, 6;

3) если f(x) = (—1)*+1, N=8, то получим последовательность

1, —1, 1, —1, 1, —1, 1, —1.

В случае какой угодно конечной последовательности, содержащей N членов, существует функция f(x), удовлетворяющая поставленным требованиям1).

Бесконечную последовательность объектов записывают следующим образом:

А-х* А3, ... , (3)

или

Ai, А2> Л3, ... , Ап, ... (4)

Первое многоточие в последней строчке означает, как и раньше, пропуск конечного числа членов; но многоточия, стоящие в конце строки, согласно общепринятому условию, всегда обозначают пропуск бесконечного числа членов или, лучше сказать, возможность неограниченного продолжения.

Ради сокращения письма пользуются также весьма часто записью

{Лп\. (5)

1) Такова, например, для последовательности (2) функция, представляющаяся в виде рационального многочлена степени N—1

(интерполяционная формула Лагранжа).

Член последовательности Ап, индекс которого обозначен буквой (в данном случае п), называется общим членом последовательности.

В настоящей главе будут рассматриваться только числовые последовательности, т. е. последовательности чисел (исключительно — действительных), в следующей главе — последовательности функций (функциональные последовательности). Позднее придётся встречаться с последовательностями, составленными и из иных объектов.

Как задать (определить) бесконечную числовую последовательность? Наиболее естественным является аналитический способ, указывающий в явной форме, какие действия нужно выполнить над значком п, чтобы получить общий член последовательности:

я* =/(/*) (л=1, 2, 3, ...).

В каждом данном случае подбор функции f(x) к заданной числовой последовательности может представлять большие или меньшие трудности. Этот вопрос стоит в стороне от целей, преследуемых настоящей статьёй, и ему здесь не будет уделено места. Заметим здесь лишь следующее. Для каждой числовой последовательности функцию f(x) можно видоизменить различными способами. Так, в примере 3 вместо f(x) = (— l)x+1 можно взять f(x) = costta:; в любом примере вместо f(x) можно взять/(х) + sin тгх и т. п.

Отметим ещё один способ задать последовательность: это способ рекуррентных зависимостей1). Он указывает, какие действия нужно произвести над членами последовательности, уже вычисленными

чтобы получить следующий член ап+1; помимо того, должны быть заданы, в том или ином числе (смотря по характеру зависимости), несколько первых членов («начальные данные»).

Рассмотрим ряд примеров последовательностей, которые будем предполагать (ради простоты записи) бесконечными.

1. Арифметическая прогрессия определяется рекуррентной зависимостью (разностным уравнением)

an+i — an = d (л=1, 2, 3, ...) (6)

с начальным данным

a Y = а.

Прогрессия имеет вид

a, a-\-d, а-{-2d, ... , а-\-(п—l)d, ...

Формула для общего члена

ап = а-\~(п— l)d (л=1, 2, 3, ...)

задаёт ту же прогрессию аналитически. Правая часть этой формулы зависит от индекса п линейно.

1) Вместо «рекуррентная зависимость» говорят также «разностное уравнение».

2. Если общий член последовательности ап задаётся формулой вида

ап = Р(п),

где через Р(х) обозначен некоторый многочлен (целая рациональная функция) степени m относительно х, то последовательность {ап} носит название арифметической прогрессии порядка т. Обыкновенной арифметической прогрессии соответствует, таким образом, порядок 1.

Приведём примеры арифметических прогрессий высших порядков:

Легко понять, что если Р(х) есть многочлен степени /л, то Р(х+1)-Р(х) есть многочлен степени m — 1. В самом деле, из формулы

следует, что

и здесь та^£0. Отсюда ясно, что «последовательность разностей»

{<*n+i — ап}>

составленная из арифметической прогрессии порядка т, есть прогрессия порядка m — 1.

Можно было бы также доказать, что «последовательность сумм

{я1 + Яз + --. + ял},

составленная из арифметической прогрессии порядка т, есть прогрессия порядка //1+1 (но мы не будем приводить здесь доказательства).

Эти свойства легко проверяются на приведённых выше примерах. Они могут также быть использованы при «продолжении» прогрессии вправо. Например, написав под пятью ранее выписанными членами прогрессии второго порядка |—^—2—~| соответствующие разности, мы обнаруживаем, что эти разности образуют обыкновенную прогрессию (первого порядка); продолжая её и затем суммируя, получаем продолжение данной прогрессии:

О, 1, 3, б, 10, 15, 21, 28, ...

1, 2, 3, 4 5, б, 7, ...

Таким образом, члены арифметической прогрессии любого порядка можно вычислять последовательно с помощью одних сложений.

3. Геометрическая прогрессия определяется рекуррентной зависимостью

(7)

с начальным данным

Прогрессия имеет вид

я, aq, aq*% ... , aqn~l, ... 9

Формула для общего члена

an = aqn-1 (л=1, 2, 3, ...)

задаёт ту же прогрессию аналитически.

4. Последовательность «факториалов» определяется рекуррентной зависимостью

вя+1 = (л+1)яя (я=1, 2, 3, ...)

с начальным данным

а1 = 1.

Последовательность имеет вид

1, 2, б, 24, 120, ... , л!, ... ,

причём общий член даётся формулой

an = nl= 1 • 2 . З...Л.

5. Последовательность Фибоначчи1) определяется тем условием, что каждый член (начиная с третьего) равен сумме двух предыдущих:

ап+г = ап + an+i (я = 8, 4, ...). (8)

В качестве начальных данных указываются значения двух первых членов, например,

а, = 0, а2= 1. (9)

Тогда без всякого труда по рекуррентной формуле (8) мы находим:

а8 = 0 + 1 = 1, 04=1-1-1 = 2, а8=1+2 = 3, аб = 2+3 = 5, а7 = 3 + 5 = 8, а8 = 5 + 8 = 13, а9 = 8+ 13 = 21, а10= 13 + 21 =34

и т. д. Написав некоторое число членов последовательности Фибоначчи

0, 1, 1, 2, 3, 5, 8, 13, 21, 34, ... , (10)

естественно поинтересоваться, нельзя ли задать эту же последовательность аналитически, представляя общий её член ап в явной форме как функцию значка п (в «замкнутой форме»2)).

1) Леонард Пизанский (XIII век).

2) Смысл последнего иногда употребляемого оборота речи заключается в том, что в формуле, выражающей ап через п и содержащей лишь элементарные операции, число этих операций не должно зависеть от п. Например, относительно последовательности факториалов (п. 4) неправильно было бы сказать, что её общий член ап = п\ записан «в замкнутой форме» (хотя и весьма кратко).

Мы приведём здесь такого рода решение «разностного» уравнения (8), предварительно заметив, что существует только одна последовательность, удовлетворяющая требованиям (8) и (9): в самом деле, раз первые два члена заданы, третий определяется однозначно по первым двум, четвёртый — по второму и третьему и т. д. Общий член ряда Фибоначчи, как легко проверить, имеет вид

Читателю, которого поразит эта формула, мы сделаем всё же намёк по поводу того, каким путём можно к ней придти. Попытаемся, сначала оставляя в стороне начальные условия (9), найти геометрическую прогрессию, которая обладала бы рекуррентным свойством (8). Полагая в уравнении (8) an = aqn~l, мы получим

aqn+i = aqn-i aqnf

что при допущении афО, q^O приводит нас дальше к квадратному уравнению

<?а=1+?. (11)

Решая его, мы убеждаемся, что знаменатель прогрессии должен равняться одному из чисел

обратно, каковы бы ни были числа а и а', прогрессии

(12)

удовлетворяют соотношению (8).

Далее, обратим внимание на то обстоятельство, что если каждая из последовательностей (12) удовлетворяет соотношению (8), то «последовательность-сумма»

а + а'у aq + a'q', aq* + a'q'*, aq* +a'q'\ ... , aqN~l + o'q,N-1

также ему удовлетворяет1). Затем останется подобрать постоянные а и а' так, чтобы выполнялись начальные условия (9): для этого достаточно решить систему уравнений

1) В самом деле, складывая равенства

получим равенство

6. Рассмотрим последовательность, отличающуюся от последовательности Фибоначчи тем, что каждый член её равен не сумме, а полусумме двух предыдущих

(13)

при прежних начальных условиях

а1 = 0, а3=1.

Мы получаем:

Общий член ап возникающей последовательности

(14)

может быть найден тем же методом, что и в предыдущем примере; но вместо квадратного уравнения (11) придётся решать уравнение

корни которого суть 1 и

Подбирая постоянные а и а' в выражении

так, чтобы удовлетворить начальным условиям (14), мы получаем:

7. Если задать последовательность требованием, чтобы каждый её член равнялся среднему арифметическому трёх предыдущих

то необходимо в качестве начальных условий задать значения трёх первых членов аи а2 и д3. Вычисление одного за другим всех членов не представляет труда; правда, на пути к построению формулы для общего члена ап встречаются некоторые затруднения1).

Можно указать два различных геометрических представления конечной последовательности чисел

01» а2> а3> •» ап> ••• » UN- (15)

1) Рассуждение, подобное предыдущему, приводит к уравнению третьей степени, имеющему мнимые корни; впрочем, в окончательной формуле мнимости можно избежать.

Первое связано с координатной плоскостью Оху\ в плоскости отмечаются точки с координатами

(л, ап) (л=1, 2, ... , Л/)

и затем проводятся вертикальные отрезки, вершины которых находятся в этих точках, а основания — на оси Ох. Члены последовательности изображаются этими вертикальными отрезками («столбиками»). Если член положителен, то отрезок направлен вверх; если отрицателен, то—вниз. Если члены возрастают при возрастании п в некоторых пределах (/*i <С л <я2), то при движении слева направо «столбики» растут (алгебраически); если члены убывают, то «столбики» уменьшаются. При аналитическом задании последовательности

достаточно наметить график функции y=f(x) и затем прочертить вертикальные отрезки, соответствующие целым абсциссам.

Другое геометрическое представление последовательности чисел связано с одной лишь числовой осью. На числовой оси последовательно отмечаются точки аи а2, ... ; чтобы точки не смешались, необходимо ставить при них соответствующие пометки. Если в некоторых пределах nt < п < Щ члены последовательности возрастают, то соответствующие точки располагаются слева направо; если убывают, то — справа налево.

Чтобы перейти от первого геометрического представления ко второму, достаточно спроектировать все вертикальные «столбики» на вертикальную же ось и затем (если угодно, придав этой оси горизонтальное положение) поставить пометки при проекциях.

Обоими указанными представлениями пользуются в одинаковой степени и преимущественно с целью дать толчок воображению, не придавая значения собственно-графической стороне дела.

На рис. 67, а и дано графическое представление последовательности, определённой рекуррентным соотношением (13), причём значения п взяты только от п=\ до п = 8.

Бесконечные последовательности допускают такие же геометрические представления, что и конечные. Разница лишь в том, что практически выполнить построение, конечно, невозможно и приходится всегда останавливаться на каком-то члене аЛ, предоставляя дальнейшее усилиям воображения.

Рис. 67.

§ 35. Общее определение бесконечной числовой последовательности

В дальнейшем, как это общепринято в математике, говоря о последовательностях, мы будем всегда иметь в виду бесконечные последовательности.

Существенное отличие бесконечной последовательности от конечной заключается в том, что конечная последовательность может быть задана непосредственным перечислением её членов (как бы велико ни было их число), тогда как для бесконечной последовательности такое перечисление принципиально невозможно.

С этим положением легко согласится неискушённый читатель и на вопрос: «чем же в случае бесконечной последовательности можно заменить непосредственное перечисление?» — не замедлит высказаться в том смысле, что бесконечной последовательности должна быть присуща «закономерность», или что должен быть указан некоторый «закон», по которому составляются следующие один за другим члены последовательности; такую же мысль нетрудно найти и во многих литературных источниках.

Оспаривать по существу справедливость такого суждения не приходится; необходимо только подвергнуть более глубокому анализу содержания понятия «закон», или «закономерность», принимая во внимание, что подобного рода термины (способные оказывать сильное, так сказать, гипнотизирующее воздействие) не всегда находят для себя место в лексиконе математика.

Тот, кто спешит произнести слово «закон», по большей части имеет в виду прежде всего математическую формулу, которая выражала бы общий член последовательности в виде функции индекса, или номера, п. Если надлежащим образом уточнить понимание термина «формула», или «элементарная функция» (в том смысле, как это было сделано в § 1), то «указать закон» значит то же самое, что согласно сказанному в § 34 «задать последовательность аналитически», в «замкнутой форме». Этот способ задавать последовательности, конечно, вполне пригоден для бесконечного случая, как и для конечного.

Но подобное толкование «закономерности» слишком ограничено, недостаточно чётко и неустойчиво. Оно, повидимому, не охватывает многих простых «рекуррентных» последовательностей; при этом остаётся открытым вопрос о том, существует или не существует аналитическое представление последовательности в «замкнутой форме».

Во многих случаях подобрать функцию f(x) нетрудно. Так, для последовательности

(-1), 1, (-1), 1, (-1), 1, ... (16)

оказывается возможным положить / (л:) = cos ъх. Более сложным в этом смысле мог бы показаться пример последовательности

1, 0, 0, 1, О, О, I, 0, 0, ... (17)

(с чередованием одной единицы и двух нулей); но и в этом случае вопрос, касающийся функции / (л:), решается утвердительно: можно положить, например,

Такой же положительный результат можно получить и для произвольной периодической последовательности, с «периодом» р,

а1У а2, ... , ар, аи а«, ... , ар, аи а2, ... , ар, ... , (18)

которую можно определить рекуррентным соотношением

Ял+р = ап (п= 1, 2, 3, ...)

с начальными данными — произвольными значениями аи а2, ай, ... , ар. С другой стороны, например, рекуррентная зависимость

с начальным условием 01 = 1, очевидно, определяет единственную последовательность

(19)

которую, казалось бы, нет оснований отнести к числу «незакономерных», хотя вовсе не ясно, существует ли элементарная функция f(x), удовлетворяющая бесконечному числу условий

Вместе с тем нужно обратить внимание и на то обстоятельство, что, опираясь на определение последовательностей «аналитическим» методом, мы ставим понятие последовательности в зависимость от допускаемого класса функций f(x). Ограничиваться только классом «элементарных» функций неестественно. При дальнейшем же расширении понятие «функция» становится столь эластическим аппаратом, что приобретает способность изображать любую эмпирическую закономерность1), в связи с чем сама идея «закономерности» поднимается, если можно так выразиться, на более высокую ступень.

В свете высказанных соображений и приведённых примеров не должен показаться удивительным следующий способ определения бесконечной последовательности, который в настоящее время принят в математике.

Числовая последовательность {ап\ считается заданной, если указано правило, позволяющее по заданному индексу — произвольному целому положительному числу п — однозначно определить член последовательности ап, стоящий на п-м месте. Другими словами, последовательность \ап) задана, если с каждым целым положительным числом п сопоставлено {приведено в соответствие) некоторое число ап.

Характер правила, устанавливающего соответствие между п и ап> безразличен. В простейшем случае «аналитического» определения an=f{n) «правило» указывает совокупность элементарных математических операций, которые нужно выполнить над числом я, чтобы получить число ап. Но «правила» могут быть и совсем иные.

1) Яркая иллюстрация этой мысли приведена в § 49.

Приведём примеры, в которых «правило» угадывается без труда:

1) 0, 1, 0, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, О, 1, 1, 1, 1, 1,

2) 1, 1, 2, 1, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 6, ... ;

3) 3, 1, 4, 1, 5, 9, 2, б, 5, 3, 5, ... ;

4)

В каждом из этих примеров «закономерность» (в более широком смысле) имеется налицо: последовательности «заданы», хотя вопрос о существовании функции f (х) крайне неясен, и нельзя также усмотреть наличия простых рекуррентных зависимостей.

В примере 3 правило, определяющее соответствие между п и ап, таково: ап есть /г-й десятичный знак в разложении отношения длины окружности к длине диаметра.

В примере 4 выписываются в виде последовательности все несократимые правильные рациональные дроби. Порядок определяется тем условием, что из двух дробей у и ~- дробь следует за дробью ~, если q' > q; а в случае q' — q, если р'>/7. Чтобы узнать, какая дробь стоит на п-м месте, нужно продолжить последовательность до я-ro места и посмотреть, какая дробь станет на этом месте.

Остановимся на некоторых свойствах бесконечных числовых последовательностей.

Среди конечного числа данных различных чисел всегда можно выбрать наибольшее и наименьшее. Понятие наибольшего и наименьшего числа требует небольшого уточнения в тех случаях, когда данные числа не обязательно различны между собой. Рассмотрим сначала конечную последовательность

ûi, а21 аш, ... , aN. (20)

Наибольшим из чисел (20) называется такое, которое не меньше всех остальных: оно обозначается через шах [аи а2у ... , ап]. Таким образом,

max{öi, û2, aN}^an (л=1, 2, N), (21)

но вместе с тем равенство имеет место хотя бы для одного значения п.

Точно так же наименьшим из чисел(20)называется такое,которое не больше всех остальных: оно обозначается через min {аи а«, ... , ап}; мы получаем

min {аи о» ,.. , aN} ^ ап (я = 1, 2, ... t N) (22)

при наличии равенства хотя бы для одного значения п.

Существование наибольшего и наименьшего членов конечной числовой последовательности не вызывает никаких сомнений1).

Совсем иначе обстоит дело в случае бесконечной числозой последовательности: такая последовательность может не иметь наибольшего члена и может не иметь наименьшего.

Так, последовательность натуральных чисел \п) не имеет наибольшего члена; последовательность целых отрицательных чисел

1) Не исключается такой случай, что наибольший и наименьший члены совпадают.

{—п) не имеет наименьшего; последовательность, составленная из целых чисел, {(— 1)п+1п\ не имеет ни наибольшего, ни наименьшего.

Другое яркое отличие бесконечных числовых последовательностей от конечных связано с понятием ограниченности.

Последовательность (всё равно какая — конечная или бесконечная) называется

a) ограниченной сверху (говорят также — справа), если все члены её меньше одного и того же числа М:

ап<М 2, 3, ...), (23)

b) ограниченной снизу (слева), если все члены её больше одного и того же числа т:

ап>т (n = h 2, 3, ...), (24)

c) ограниченной (просто), если она ограничена и сверху и снизу:

т<ап<М (Л=1, 2, 3, ...). (25)

Всякая конечная последовательность, очевидно, ограничена. В качестве M можно взять любое число, большее чем наибольший из членов последовательности; в качестве m — любое число, меньшее чем наименьший из членов последовательности.

Аналогичное утверждение неверно для бесконечных последовательностей. Примером бесконечной последовательности, не ограниченной сверху, может служить последовательность натуральных чисел {п\; но она ограничена снизу. Напротив, последовательность {—п) не ограничена снизу. Последовательность {(—1)п+1п\ не ограничена ни сверху, ни снизу.

Бесконечные арифметические прогрессии первого порядка ограничены снизу, но не сверху, или наоборот, смотря по тому, будет ли их разность положительной или отрицательной. Бесконечные геометрические прогрессии ограничены снизу, но не сверху, если их знаменатель больше единицы; ограничены и сверху и снизу, если знаменатель заключён между —1 и -J-1; не ограничены ни сверху, ни снизу, если знаменатель меньше чем — 1. Бесконечная последовательность Фибоначчи (10) не ограничена сверху, но последовательность (14) ограничена. Ограничены сверху и снизу все периодические последовательности, а также последовательности 1, 3 и 4 на стр. 151; но последовательность 2 (там же) ограничена снизу, но не сверху.

Последовательность

(19)

не ограничена сверху. Чтобы в этом убедиться, нужно установить, что, как бы велико ни было число М, всегда можно указать такой

член последовательности ап, что будет иметь место неравенство ап^М; нужно, другими словами, указать такое п, что

От нас зависит взять п вида п = 2р. Обратим внимание на то, что

Поэтому, взяв р>2Му будем иметь:

Если бесконечная последовательность ограничена сверху, то отсюда не следует, что в ней имеется наибольший член. Так, для последовательности

общий член J меньше чем 1 (=М)\ но в ней нет наибольшего члена.

Обратное, напротив, верно: совершенно очевидно, что если в последовательности {ап} имеется наибольший член, то, взяв M хоть немногим больше этого члена, мы получим для всех членов последовательности неравенство

ап<М.

§ 36. Теорема Больцано-Вейерштрасса о существовании предельной точки

Многие из терминов, которыми мы будем пользоваться дальше, встречались неоднократно как в этой статье, так и в предшествующих. Уточним, однако, какой смысл мы будем в них вкладывать в настоящем параграфе.

1) В самом деле, сумма в каждой строчке а всего строчек р +

Каждое действительное число х мы представляем себе написанным в виде бесконечной десятичной дроби

X —Х^Х^Х^Х^ • • • j

где х0 обозначает число единиц, хх — число десятых, х.2 — число сотых,..., вообще хп — число единиц разряда 10"л, заключающихся в разложении числа х.

Числа, представимые в виде конечной десятичной дроби, мы условимся записывать также в виде бесконечной десятичной дроби — с «нулём в периоде», например

4,83 = 4,83000 ...

Такие числа допускают ещё другое представление, именно, с «девяткой в периоде», например

4,83 = 4,82999 ...

Итак, каждое число может быть представлено в виде бесконечной десятичной дроби одним или — самое большее — двумя различными способами.

Но, с другой стороны, всякая бесконечная десятичная дробь представляет лишь одно число.

Под «десятичными дробями нулевого ранга» мы будем понимать все целые числа и обозначать их совокупность через (D0); под «десятичными дробями первого ранга» будем понимать все конечные десятичные дроби, имеющие не более одной значащей цифры после запятой, и обозначать их совокупность через (D.); вообще под десятичными дробями «я-го ранга» будем понимать все конечные десятичные дроби, имеющие не более п значащих цифр после запятой, и будем обозначать их совокупность через (Dn) и т. д. Каждая из числовых совокупностей (Dn), будучи расположена в порядке возрастания, представляет собой арифметическую прогрессию (простирающуюся в обе стороны — вправо и влево), с разностью, равной 10"".

Под промежутком [а> Ь], где а<Ь, условимся понимать совокупность всех действительных чисел х> заключённых между а и bt включая эти две точки (начальную и конечную):

а^х^Ь.

Точки промежутка, отличные от начальной и конечной, называются внутренними; начальная и конечная точки называются также концевыми. Длиной промежутка [а, Ь] называется разность Ь — а; длина промежутка — всегда положительное число. Центром промежутка [а, Ь] называется число (точка) —5—.

Если а и b — две произвольные точки (ajîô), то они образуют или не образуют промежуток, смотря по тому, будет ли афЬ, или а = Ь. В первом случае начальной точкой промежутка, образован-

ного числами а и b, является меньшее из этих чисел, конечной — большее. Длина промежутка, образованного точками а и Ь, равна \а — b \. Выражение | а — b | называется также отклонением, или расстоянием, точки а от точки b (или точки b от точки а); очевидно, при любых а и b

\a — b\^0. (26)

По определению абсолютной величины неравенство

\х — с\<т (т>0) (27)

означает совместное выполнение двух неравенств

( X — с<т, 1 — (х- с) О,

что равносильно выполнению одного двойного неравенства

с — m <х<с-{-т. (28)

Таким образом, из неравенства вида (27) следует неравенство (28), и обратно, из неравенства вида (28) следует неравенство (27). Так как точка с есть центр промежутка [с — т, с-\-т], а число 2т — его длина, то сказанное можно выразить ещё так: если отклонение точки х от точки с меньше чем т, то точка х расположена внутри промежутка длины 2т с центром с, и обратно.

Окрестностью точки с называется совокупность внутренних точек любого промежутка, для которого с является внутренней точкой. Чаще всего приходится иметь дело с окрестностями, для которых данная точка является центром. Под т-окрестностью точки с (т> 0) понимают совокупность точек, расстояние которых от точки с меньше чем т; чтобы точка х принадлежала /«-окрестности точки с, необходимо и достаточно выполнение любого из соотношений (27) или (28). Если 0<т1<т2 и точка х принадлежит ^^окрестности точки с, то она принадлежит также и её /я2-окрестности; обратное неверно.

Читателю рекомендуется ясно представлять себе геометрический смысл всего предыдущего (на числовой оси).

Отметим ещё в качестве леммы следующее положение: Если имеется «двусторонняя»1) арифметическая прогрессия с разностью d (>0), то при условии m>d т-окрестность любой точки с, не принадлежащей прогрессии, содержит обе точки прогрессии, между которыми лежит с, а следовательно, и весь образованный ими промежуток. Если же сама точка с входит в состав прогрессии, то её. т-окрестность содержит обе ближайшие точки прогрессии, а также оба прилежащих промежутка длины d.

1) То-есть продолжающаяся неограниченно не только вправо, но и влево.

Это совершенно ясно геометрически. Аналитическое доказательство также несложно. Пусть точки прогрессии имеют вид

а-\-(р— (— оо<Х+оо)

и пусть

а-\-{р— l)d^c^a-\-pd; тогда с помощью условия m>d получаем

так что

Теперь мы сформулируем основную теорему этого параграфа. Какова бы ни была ограниченная бесконечная последовательность

{an) = av а2, а3, ... , ап, ... , (29)

всегда существует по меньшей мере одна точка с, обладающая тем свойством, что в любой её сколь угодно малой (по длине) окрестности имеется бесконечное множество точек последовательности (29).

Доказательство этой теоремы базируется на следующем очевидном принципе, который мы формулируем для большей наглядности следующим образом: если в конечном числе ящиков разложено бесконечное множество предметов, то хотя бы в одном ящике окажется бесконечное множество этих предметов.

Обращаясь к доказательству теоремы, условимся прежде всего, что если среди чисел ап будут встречаться отрицательные, то мы будем записывать их в виде десятичных дробей с отрицательными характеристиками, но положительными мантиссами, например

— 4,52038 ... =5,47961 ...

Все члены последовательности разбиваются на классы («распределяются по ящикам»), смотря по характеристике, т. е. по тому, какое число целых единиц стоит в соответствующей записи слева от запятой. Число таких классов — конечное, так как последовательность {ап\ — ограниченная, и потому все числа ап заключены между двумя какими-то числами m и М:

т<ап<М (я=1, 2, 3, ...).

Не ограничивая общности, можно считать числа m и M целыми. Наших классов, или «ящиков», — столько же, сколько различных характеристик

т, /и+1, /и+ 2, ... , M— 1, (30)

именно, N=M — т. Так как членов последовательности \ап) бесконечное множество, то хотя бы в одном из «ящиков» их окажется

бесконечное множество. Другими словами, среди целых чисел (30) найдется одно такое (обозначим его через с0), что бесконечное множество членов последовательности \ап\ имеют характеристику с0, т. е. удовлетворяют неравенству

Предположим, далее, что «ящик» с характеристикой с0 разбивается на 10 «подразделений» — смотря по тому, какова первая цифра после запятой в рассматриваемой десятичной дроби. Так как в этот «ящик» попадает бесконечное множество членов последовательности, то хотя бы в одно из 10 «подразделений» их также попадает бесконечное множество. Пусть, например, бесконечное множество членов последовательности попадает в «подразделение», характеризуемое цифрой си на первом месте справа от запятой; другими словами, допустим, что имеется бесконечное множество чисел ап, удовлетворяющих неравенству

Вообразим ещё дальше, что «подразделение», характеризуемое цифрами c0,cv разбивается ещё на 10 «под-подразделений» — в зависимости от второй цифры справа от запятой. Хотя бы одно из таких под-подразделений, например характеризуемое цифрой с2 на втором месте справа от запятой, содержит бесконечное множество членов последовательности, так что существует бесконечное множество членов, удовлетворяющих неравенству

Можно представить себе, что подобного рода процесс продолжается до бесконечности. Мы получим таким образом бесконечную последовательность цифр1)

соответственно стоящих слева от запятой, на первом, на втором, ... , на л-м месте справа от запятой, ... , и обладающих тем свойством, что в каждом из промежутков

(31)

содержится бесконечное множество членов последовательности {ап}.

1) Впрочем, с0 может быть каким угодно, положительным или отрицательным, целым числом или нулём.

Рассмотрим теперь число с, выражающееся бесконечной дробью

с = с0,с1с2...сп... , (32)

и докажем, что в любой его окрестности содержится бесконечное множество точек последовательности {ап}. Это число принадлежит одновременно каждому из промежутков (31). Возьмём какую угодно окрестность точки с, т. е. сколь угодно малый промежуток, содержащий внутри точку с. Не ограничивая общности, можно допустить, что точка с есть центр этого промежутка1). Обозначая длину промежутка через 2s, мы будем иметь дело с е-окрестностью точки с:

\х— с \ <s,

или

с — е<х<с-\-е.

Десятичные дроби ранга п образуют арифметическую прогрессию с разностью 10~п. Если только

е>10-Л, (33)

то по лемме е-окрестность точки с содержит обе ближайшие к с дроби

а следовательно, содержит и образованный ими промежуток

(We- • хт co>cic*-. -сп + 10~п) (34)

(это верно также и в том случае, если с совпадает с одной из названных дробей). Но так как в промежутке (34) содержится бесконечное множество членов последовательности \ап}, то справедливо то же самое и относительно рассматриваемой е-окрестности точки с.

Остаётся заметить, что неравенство (33) равносильно следующему:

/z>lgl (35)

Итак, для того чтобы предыдущее рассуждение имело силу, достаточно, пользуясь десятичными дробями ранга /г, взять в качестве п любое целое число, удовлетворяющее неравенству (35).

Теорема доказана.

Всякая точка, обладающая тем свойством, что в любой её окрестности содержится бесконечное множество точек последовательности \ап), называется предельной точкой этой последовательности.

Пользуясь этим термином, можно сформулировать теорему Больцано-Вейерштрасса следующим образом:

1) Если доказано, что в промежутке АА' (с центром с) содержится бесконечное множество точек последовательности {аП}, то тем самым аналогичное утверждение будет доказано и для промежутка AB, охватывающего АА'.

Всякая ограниченная бесконечная последовательность {ап} имеет по крайней мере одну предельную точку.

Примечание 1. При доказательстве теоремы Больцано-Вейерштрасса то обстоятельство, что множество рассматриваемых чисел ап (л=1, 2, 3, ...) может быть расположено в порядке последовательности, т. е. что оно — счётное (см. Э. э. м., т. I, стр. 92), не играет никакой роли. Поэтому теорема справедлива не только для последовательности чисел, но и для любого бесконечного множества чисел Е> заключённого в данном конечном промежутке.

Примечание 2. Определение предельной точки множества Е можно видоизменить следующим образом: точка с называется предельной точкой данного множества Е, если в любой её сколь угодно малой окрестности имеется хоть одна точка этого множества, отличная от точки с.

В самом деле, если верно, что в любой окрестности точки с содержится хоть одна точка данного множества Е, то верно и то, что в любой окрестности их содержится сколько угодно. Пусть, например, (с — е, с -f- е) есть данная е-окрестность точки с. Выберем в ней точку с1 данного множества Е, отличную от с, затем возьмём е-окрестность точки с, подчиняя условию ci < I Ci — с I, и в этой Ei-окрестности (с — ъи с + ei) выберем новую точку с2 множества Е, отличную от с; затем возьмём е2-окрестность той же точки с, подчиняя еа условию е2 < I с2 — с I, и в этой е2-окрестности (с — s2, с 4- ег) выберем третью точку с3 данного множества Е, отличную от с, и т. д.

§ 37. Примеры. Предел как единственная предельная точка

Различные последовательности могут иметь то или иное число предельных точек; существуют также последовательности, обладающие бесконечным множеством предельных точек. Заметим ещё, что предельная точка может «принадлежать» последовательности, т. е. входить в состав её членов (может быть, даже неоднократно), или

не принадлежать ей. Разнообразие мыслимых возможностей видно лз приведённых ниже примеров. Читателю рекомендуется при рассмотрении примеров пользоваться геометрическим представлением, изображая члены последовательности в виде точек на числовой оси.

Рис. 68.

1. Последовательность

имеет одну предельную точку 0 (рис. 68, а).

2. То же можно сказать о последовательности

которая от предыдущей отличается тем, что на первое место поставлен нуль и все члены сдвинуты на одно место; также о последовательности

которая отличается от предыдущей тем, что нуль вставлен между всякими двумя членами (начиная со второго).

3. То же можно сказать о последовательностях вида

при условии <х>0.

4. То же можно сказать о последовательности с чередующимися знаками (рис. 68,6)

и о любой последовательности, возникающей из последовательности j-i-j посредством расстановки знаков совершенно произвольным образом.

5. Любая бесконечная геометрическая прогрессия имеет единственную предельную точку 0, если только её знаменатель q удовлетворяет условию |у|<1.

6. Последовательности

имеют единственную предельную точку а.

7. Последовательность

имеет две предельные точки: 1 и —1 (рис. 68,в). 8. То же можно сказать о последовательности

9. Если последовательность {ап\ имеет единственную предельную точку a, a последовательность {Ьп\ — единственную предельную точку Ь, причём b ф а, то последовательность

aiy bl9 а2, Ь2, а3, Ьг, ... (36)

имеет две предельные точки: а и Ь. Если же Ь = а, то предыдущая последовательность имеет лишь одну предельную точку, именно, а = Ь, например

Ничто существенно не изменилось бы в этом примере, если бы в рассматриваемой последовательности (36), «составленной» из последовательностей {ап\ и {Ьп}у члены этих последовательностей не чередовались между собой, а следовали бы в каком угодно порядке.

10. Последовательность

имеет три предельные точки: 1, —1 и 0. Любая периодическая последовательность имеет в качестве точек все те числа, которые встречаются в пределах периода.

11. Если последовательность {ап} имеет единственную предельную точку а, последовательность {Ьп} — единственную предельную точку Ь, ... , последовательность {1п} — единственную предельную точку /, то при условии, что числа а, Ь, ... , / различны между собой, все они являются предельными точками последовательности

В случае совпадений число предельных точек соответствующим образом уменьшается.

12. Если рассмотреть последовательности, стоящие в первой, второй, третьей и т. д. строчках следующей таблицы:

то легко убедиться, что каждая из них имеет единственную предельную точку, а именно, 1, |, | и т. д. Но составляя последовательность из всех элементов таблицы по диагоналям (как показывают стрелочки), получаем последовательность

для которой предельными точками являются все числа

и ещё число 0 (см. по этому поводу теорему на стр. 163).

13. Последовательность 1 на стр. 151 имеет две предельные точки: 0 и 1.

14. Последовательность 3 (там же) не может иметь иных предельных точек, кроме десяти следующих:

О, 1, 2, 3, 4, 5, 6, 7, 8, 9.

Все ли они являются предельными точками этой последовательности,— в настоящее время нельзя считать установленным.

15. Последовательность 4 (там же) имеет в качестве предельных точек все числа х без исключения из промежутка [0, 1]:

0^*^ 1.

Действительно, в любом промежутке содержится бесконечное множество рациональных чисел (рациональные числа расположены всюду плотно1).

16. Последовательность {зш/гтгб}, где 6 — иррациональное число, имеет предельными точками все точки промежутка [—1, -j-1]:

Доказательство теоремы проведём «от противного».

Вообразим, что на единичной окружности отмечены, как принято в тригонометра, все точки Рп, соответствующие центральным углам вида лтгб, а также на вертикальном диаметре —их проекции Р'п(п=\, 2, 3, ...). Если бы на эгом диаметре существовал хоть один промежуток, на котором бы не было точек Р'п, то на окружности, очевидно, нашёлся бы «дуговой» промежуток, на котором бы не было точек Рп. Таких промежутков на окружности может быть больше чем один, но так как сумма их длин не превышает длины окружности 2тт, то среди них можно выделить наибольший (или один из наибольших, если их несколько). Обозначим через L дугу окружности, соответствующую этому промежутку, и через X — её длину (0 < X < 2тг). Вращая дугу L около центра на угол 2mr, кратный 2к, мы получаем новую дугу Ln, однако соответствующую тому же самому дуговому промежутку.

Условимся теперь называть гомологическими между собой такие дуги, которые получаются одна из другой посредством вращения на угол, кратный тсб.

Если дуга U — гомологическая по отношению к L, то ясно, что на ней также нет точек Рп.

Рассмотрим совокупность дуг Ln (л=1, 2, 3, ...), гомологических дуге L = LQ. Так как длина каждой из них равна X > 0, а число их — бесконечное, то наверное какие-нибудь две из них, например Lp и Lq (p<q), окажутся покрывающими на окружности один и тот же дуговой промежуток M длины |*(>0).

1) См. Э. э. м„ кн. 1, А. Я. Хинчин, Элементы теории чисел, гл. IV и V.

Возможны два случая: 1) jx= X и 2) ji < X.

Первый случай приходится отвергнуть. В самом деле, если [а = X, то у дуг Lp и Lq совпадают как начальные, так и конечные точки; значит, дуга Lq получается из дуги Lp в результате вращения на угол, который равен (Я — Р)ъ$ с другой же стороны, этот угол является кратным 2тг. В таком случае

т. е.

что противоречит предположению относительно иррациональности б.

Но приходится отвергнуть и второй случай. Действительно, в дуговом промежутке, покрываемом объединением дуг Lp и Lq, не содержится точек Рп, так как их нет ни на дуге Lp, ни на дуге Lq; длина же его равна

2Х-[х>Х,

что противоречит определению дуги L.

Теорема. Если некоторое множество точек Е имеет в данном (конечном) промежутке бесконечное множество предельных точек, то всякая предельная точка множества, составленного из этих предельных точек, есть вместе с тем предельная точка данного множества.

Доказательство. Пусть Е' есть множество предельных точек данного множества Е и пусть с" есть предельная точка множества Е.

По предположению, в любой окрестности точки с" имеется сколько угодно точек множества Е1, и вместе с тем в любой окрестности каждой из точек с' множества Е имеется сколько угодно точек множества Е; требуется доказать, что в любой окрестности точки с" имеется хоть одна1) точка данного множества Е, отличная от с".

Пусть (с" — е, с" + е) — заданная окрестность точки с". В окрестности (с"—~9 с" ~b"5"j этой точки мы найдем точку с' множества Е и будем иметь:

В окрестности (^с'—^-, + точки с' существует сколько угодно точек данного множества Е; выберем одну из них, например с, отличную от с", так что будет:

Тогда по известному свойству абсолютных величин2) получим:

что и требовалось доказать.

Примечание. Теорема остаётся справедливой, и сохраняется в силе доказательство, если «множество Еу> заменить «последовательностью {а,,}».

1) См. примечание 2 на стр. 159.

2) См. сноску 2) на стр. 170.

Если ограниченная последовательность имеет только одну предельную точку, то эта точка называется пределом последовательности.

Если же ограниченная последовательность имеет более одной предельной точки, то говорят, что последовательность не имеет предела.

Таким образом, каждая из последовательностей, приведённых в примерах 1—6, имеет предел, а последовательности в примерах 7—16 предела не имеют1).

Если точка с есть не только предельная точка, но и предел ограниченной последовательности {ап\, то верно не только то, что в любой окрестности с лежит бесконечное множество точек последовательности, но и то, что в любой окрестности с лежат почти все точки последовательности. При этом «почти все» означает—«все, кроме, может быть, конечного числа».

Желая это установить, достаточно, как и раньше, ограничиться рассмотрением промежутков, по отношению к которым с является центром. Итак, пусть дана некоторая е-окрестность точки с (рис. 69,я); считая, что все точки последовательности {ап\ заключены между m и М, можно допустить, что е<М — с и е<с — /я, так что промежуток [с — е, с -\- е] лежит внутри промежутка (//z, М). Будем рассуждать «от противного»: все точки последовательности {ап\ лежат в промежутке [т9 М], и если бы было неверно, что «почти все» они лежат в промежутке [с — е, с-)-s], то это означало бы, что бесконечное множество их заключается в паре промежутков [т, с — s] и [с + е, М], и следовательно, заключается хотя бы в одном из них, например в промежутке [т, с — е]. Но по теореме Больцано-Вейерштрасса отсюда следовало бы, что последовательность \ап) имеет предельную точку в промежутке (т, с — е). Последнее невозможно, так как, по предположению, с — единственная предельная точка последовательности. Мы приходим, таким образом, к заключению, что «почти все» точки последовательности лежат в промежутке [с — е, с-)-е].

Обратно, если верно, что в любой окрестности точки с лежат «почти все» точки бесконечной последовательности {ап}, то отсюда

Рис. 69,

1) Это относится и к примеру 14. Можно утверждать, что последовательность, приведённая в этом примере, имеет по крайней мере две предельные точки. Иначе число тс представлялось бы периодической десятичной дробью и в таком случае было бы рациональным (см. Э. э. м., кн. 1, стр.312, теорема 4), тогда как доказано, что я — число иррациональное.

следует, что с есть единственная предельная точка этой последовательности. Докажем и это «от противного». Пусть, кроме точки с, есть ещё предельная точка с' (=£ с); предположим, например, что с'>с (рис. 69,ö). Так как с1— предельная точка, то в любой её е-окрестности содержится бесконечное множество точек последовательности. Что касается точки с, то в её е-окрестности содержатся «почти все» точки последовательности. Выбрав е удовлетворяющим неравенству е<С~~2—, получим c-{-e<V— е.

Две е-окрестности оказались не имеющими ни одной общей точки; мы пришли к противоречию.

Подвергнем, наконец, перефразировке выражение «почти все» точки последовательности. Если «почти все» точки последовательности заключены в некоторой е-окрестности точки с, то это значит, что лишь конечное их число находится вне этого промежутка. Каждый из этих членов последовательности имеет свой индекс, и раз число их конечно, то среди этих индексов есть наибольший. Обозначим этот наибольший индекс через N. Он зависит, конечно, от выбранной окрестности точки с, т. е. зависит от числа е; чтобы подчеркнуть это обстоятельство, иногда при N ставят значок е и вместо N пишут Ne. Итак, среди членов последовательности {ап\, у которых индекс п не превышает N, одни, может быть, попадают в е-окрестность точки с, другие оказываются вне её; но если только n>N, то можно уже наверное сказать, что соответствующий член ап находится в е-окрестности.

Высказанные соображения позволяют иначе сформулировать понятие предела числовой последовательности. Это иное определение, к которому мы сейчас обратимся (исторически раньше сложившееся1), логически строго равносильно приведённому выше.

§ 38. Предел последовательности: классическое определение и основные свойства

Число а2) называется пределом (конечным пределом, пределом «в собственном смысле» — см. § 39) числовой последовательности

{an}=av а2> аз» • • • » ап> • • • »

если, как бы мало ни было наперёд заданное положительное число е, можно указать такое число N~=N^, что неравенство

n>N (37)

влечёт за собой неравенство

\ап — а|<е. (3е)

1) О. Коши впервые дал то определение предела, которое в настоящее время является общеизвестным и повседневно употребляемым.

2) Для удобства дальнейшего изложения буква с предыдущего параграфа заменена здесь буквой а.

Или словами (что гораздо менее отчётливо): число а есть предел последовательности {ап\, если отклонение общего члена последовательности от а делается сколь угодно малым при условии, что индекс члена достаточно велик.

Для обозначения того факта, что а есть предел последовательности {ап\, применяется любая из записей:

1) \iman = a (более старая),

2) ап->а (более новая).

В наше время обе они одинаково употребительны.

Вместо «а есть предел ая» пользуются постоянно синонимическим оборотом: «ап стремится к а». Если хотят указать, что последовательность имеет предел, не указывая, — какой именно, то говорят, что последовательность — сходящаяся. Иногда говорят также «последовательность сходится к а» или «к пределу а».

Если последовательность не имеет предела, её называют расходящейся.

Рассмотрим теперь внимательнее примеры 1—5 § 37 с точки зрения этого определения. Во всех этих примерах предел а равен нулю, и потому неравенство (38), наличие которого требуется установить, принимает более простой вид

(39)

В примере 1 ап = ^-, и неравенство (39) выполняется при я>~, так что в качестве N может быть взято любое число, не меньшее чем —.

В первой последовательности примера 2 ап = ^_ j (при п ^2) и неравенство (39) выполняется, если только —|— 1; следовательно, в качестве N может быть взято любое число, хотя бы на единицу большее чему.

Во второй последовательности примера 2 аш = ^, а2от_1 = 0, и неравенство (39) выполняется автоматически для всех нечётных щ что касается четных, то оно выполнено, если у = /я> — , т. е. при #}> —. Итак, в качестве N может быть взято любое число, не меньшее чем —.

В примере 3 ая = ~, и роль N может играть любое число, не меньшее чем е а.

В примере 4 всё обстоит так же, как в примере 1, поскольку

В примере 5, полагая an = aqn *, мы должны иметь \а \ • \ q \п~х <е, что равносильно

Таким образом, TV должно быть не меньше, чем правая часть этого неравенства.

Из приведенных примеров видно, как следует понимать зависимость числа N, упоминаемого в определении предела, от числа е. Нужно, впрочем, заметить, что на практике, если требуется найти предел данной последовательности, то прибегать к «эпсилонным» рассуждениям не приходится, так как, основываясь на теоремах, излагаемых ниже, почти всегда удаётся сводить более сложные случаи к более простым. Лишь редко подобного рода сведение оказывается невозможным, и тогда «эпсилонные» рассуждения служат средством доказательства.

Следующей теоремой придётся не раз пользоваться в дальнейшем:

Из всякой ограниченной последовательности можно «выделить» сходящуюся последовательность.

Это значит: если последовательность {ап} — ограниченная, то можно указать такую возрастающую последовательность целых положительных чисел {рп}у что последовательность {аРп\ будет иметь предел.

Доказательство. По теореме Больцано-Вейерштрасса (§ 36) последовательность {ап} имеет хоть одну предельную точку, например а. По определению предельной точки, во всякой s-окрестности точки а имеется точка последовательности {ап\. Пусть {ел} — последовательность положительных убывающих чисел, сходящаяся к нулю. Для каждого еп(п=1, 2, 3, ...) подберём член данной последовательности аРп, находящийся в ел-окрестности точки а:

\аРп — а|<еа (я=1, 2, 3, ...); (40)

при этом, подбирая члены последовательности ар^ один за другим, можно позаботиться, чтобы каждый следующий индекс рп+1 был больше предыдущего рп. Из соотношений (40) сейчас же следует, что

аРп-+а.

Примечание. Мы рассматриваем в этом параграфе лишь ограниченные последовательности; заметим, однако, теперь же, что неограниченная последовательность не может иметь конечного предела, т. е. если последовательность {ап} имеет конечный предел at то она непременно — ограниченная.

В самом деле, задав себе какую-нибудь е-окрестность точки а, мы видим из соотношения (38), что все члены последовательности ап, начиная с индекса ЛГ-f-l/ удовлетворяют неравенству

ап < а + е.

Вместе с тем среди конечного числа членов av а%, ... , aN можно выбрать наибольший; обозначая затем через M любое число, превышающее как этот наибольший член, так и число û + e, мы будем иметь при всех значениях п неравенство

ап<М,

откуда следует ограниченность сверху. Подобным же образом устанавливается и ограниченность снизу.

На «переход к пределу» («предельный переход») можно смотреть, как на некоторую операцию. С арифметическими операциями предельный переход имеет общее, но кое в чём от них заметно отличается. Как и в арифметических операциях, здесь по данным числам

составляется новое число а = \\тап\ как и в арифметических операциях, данными числами вновь составляемое число определяется однозначно. Но операция перехода к пределу далеко не всегда «возможна» (данная последовательность чисел может не иметь предела).

Далее, «данных» чисел должно быть не два (или конечное число, как в случае сложения или умножения), а бесконечное множество; притом весьма замечательно, что в результате отбрасывания или добавления или замены конечного числа членов последовательности не изменяется сходимость последовательности1) и не изменяется её предел (если он существует). В самом деле, если точка а есть единственная предельная точка последовательности {ап}у то она, несомненно, будет единственной и для видоизменённой (указанным способом) последовательности.

Весьма важно, что отбрасывать можно и бесконечное множество членов последовательности — лишь бы оставлено было также бесконечное множество. Именно, справедливо следующее утверждение:

Пусть

{Pn\ = Pi> Pv у Pv-

есть некоторая возрастающая последовательность целых положительных чисел. Тогда, если предел последовательности {ап} су ществует

1) То есть сходящаяся последовательность остаётся сходящейся, расходящаяся — расходящейся.

то существует и равен ему предел «частной» последовательности1)

аРп-+а.

В самом деле, раз последовательность {ап} имеет предел а (и следовательно, ограничена), то это значит, что а есть единственная предельная точка этой последовательности. Так как все члены последовательности {аРп\ содержатся в последовательности {аП}, то последовательность {аРп} также ограничена и вместе с тем не может иметь иных предельных точек, кроме я. Но по теореме Больцано-Вейерштрасса (§ 36) она имеет непременно хоть одну предельную точку. Итак, а есть единственная предельная точка последовательности {ярл}* т. е. есть её предел.

Следующие основные теоремы характеризуют свойства предельного перехода как операции и вместе с тем лежат в основе фактического вычисления пределов2).

Теорема I. Если последовательности {ап\ и {bn\ имеют пределы, именно,

ап ->а, bn ->- by

то «последовательность-сумма» {ал —}— ол} также имеет предел, именно,

Теорема II. При тех же предположениях «последовательность-разность» {ап — bn) имеет предел, а именно,

an — bn-+a — b.

Теорема III. При тех же предположениях «последовательность-произведение» {anbn} имеет предел, а именно,

<*nbn*+ab-

Теорема IV. При тех же предположениях и при дополнительном предположении b ф О «последовательность-частное» имеет предел, а именно,

Очень часто теорему I читают кратко: «предел суммы равен сумме пределов» и записывают:

lim (ап + Ьп) = lim ап + lim bm

причём условия теоремы подразумеваются. Если пределы ап и Ьп не существуют, то, конечно, в общем случае («раз навсегда») нельзя ничего сказать

1) Вместо «частная последовательность» говорят также «подпоследовательность».

2) Доказательства этих теорем были приведены на стр. 194—195 кн. 1 «Энциклопедии элементарной математики». Мы приводим, однако, несколько иные приёмы доказательств.

о пределе ап-\-Ьп. Следует, впрочем, заметить, что возможны случаи, когда оба предела ап и Ьп не существуют, а предел ап -f- Ьп существует1). Аналогичные замечания справедливы и по поводу теорем II —IV.

Докажем сначала теорему I. Нам дано, что при достаточно больших значениях п отклонение | ап — а | делается сколь угодно малым, и то же относительно \Ьп — Ь\\ требуется доказать то же самое по поводу отклонения ] (ап -j- bn) — (a'-j- b) |.

Мы имеем по свойству абсолютной величины2)

\(.ап + Ьп)-{а±Ь)\ = \{ап-а) + фп-Ь)\^\ап-а\ + \Ьп-Ь\.

Пусть задано наперёд число s (>0). Тогда можно подобрать такое Л^, что при п>№6

\ап — fll<f и такое ЛГ6\ что при я>ЛЛ3'

1*»-*1<у.

В таком случае, обозначая через Ns наибольшее из чисел N1 и А£, будем иметь при n>N6:

\(an + bn)-(a + b)\^\an-a\-\r\bn-b\<:±-\-^ = e,

что и требовалось доказать.

Докажем теперь теорему III. При тех же данных, что и в теореме I, требуется доказать, что при достаточно больших значениях п отклонение | апЬп — ab \ станет меньше любого наперёд заданного е(>0). Мы имеем:

я A-ab = (an-a)b-\-a (bn -b) + (ап - a) (bn - b),

и по свойствам абсолютной величины

\anbn — ab\^

^\ая-а\-\Ь\+\а\.\Ья-Ь\ + \ап-а\-\Ья-Ь\. (41)

1) Например, последовательности

1,-1, 1, -1, 1, -1, ..

-1, 1,-1, 1, -1, 1, ...

расходящиеся, тогда как «последовательность-сумма»

О, 0, 0, 0, 0, 0,...

сходящаяся.

2) Мы имеем в виду свойство

\х+у\^\х\ + \у\.

Далее используется ещё свойство

1*у|-1*1 -м-

См. Э.э.М., кн. 1, формулы (1) и (2) на стр. 128—129.

Пусть К—наибольшее из чисел |а], \Ь\ и 11); достаточно, конечно, допустить по поводу s, что

s < 3/Г2.

Тогда, подобрав и Л/У таким образом, что \ап — <*\<щ при я>ЛГ8

и

\Ьп-Ь\<щ при п>К,

мы будем иметь при n>Nzt где Ar« = max{jtys, Л/?}:

(42)

Сопоставляя (41) и (42), получаем то, что требовалось доказать.

Отметим частный случай теоремы III (при {ал} = {а}): если Ьп-^Ьу то abn-^ab («постоянный множитель можно выносить за знак предела»). В частности, при а = —1 получается: если bn-*b, то (— Ьп) —► (— Ь). Отсюда сейчас же вытекает теорема II

ап — Ьп = ап + (— £„)->я + (— b) = a — b.

Переходя к теореме IV2), докажем сначала её частный случай, когда {ая} = {1}: если Ьп-+Ь^0, то т-~*Т«

Составим отклонение от ^:

(43)

Отклонение \Ъп — Ъ\ при достаточно больших значениях п становится меньше любого положительного числа; например, оно станет

меньше, чем :

Но

так что

1) Последнее нужно на случай, если а = Ь = 0.

2) Заметим, между прочим, что текст теоремы IV нуждается в дополнительном разъяснении: из неравенства ЬфО вытекает, что при достаточно больших п величины Ъп отличны от нуля; таким образом, последовательность jg-J может содержать лишь конечное число членов, не имеющих смысла; их следует отбросить или заменить какими угодно числами.

Отсюда следует:

(44)

Подберём Л^г так, чтобы из неравенства /z>jV/ следовало:

(45)

Тогда из сопоставления (43), (44) и (45) вытекает при n>N6, где М = тах{ЛГ, N'l\:

что и требовалось доказать.

Теперь общий случай теоремы IV сводится к теореме III: если ап->а, Ьп-+Ь, то

Докажем, наконец, теорему о предельном переходе в неравенстве:

Если последовательности {ап} и {Ьп} имеют пределы

и, кроме того, при всех значениях п справедливо неравенство

ап^Ьп, (46)

то непременно имеет место неравенство

а^Ь. (47)

Начнём с частного случая, когда {аЛ} = {0}, и значит, а = 0. Нужно доказать, что из соотношений Ьп^6 (п=1, 2, 3,...) и ЬЛ-+Ь следует Ь^О. Будем доказывать от противного. Пусть Ь<0. Полагая е = |й|, видим, что по определению предела при достаточно больших п должно иметь место неравенство

-\ь\<\ьл-ь\<\ь\,

или

ь-\ь\<ьп<ь + \ь\.

Но так как Ь<0, то ô-j-[ô[ = 0, и вторая половина последнего неравенства принимает вид Ьп<0. Это противоречит допущению Ьп^0 (л=1, 2, ...).

1) Не представит труда истолковать предыдущее рассуждение геометрически, с помощью числовой оси.

Перейдем к общему случаю. По предположению Ьп^ап (л=1, 2, ...); значит, Ьп — ап^0 (я=1, 2, ...). На основании теоремы II Ьп — ап-+Ь — а. По уже доказанному (частный случай) b — а^О, т. е. Ь^а.

В частности, заключение теоремы сохраняется и в том, особенно часто встречающемся случае, когда условие (46) заменяется следующим:

Иными словами, из неравенства ап<Ьп вытекает, что а^Ь (но не а<Ь).

Этими соображениями оправдывается следующее правило: «при переходе к пределу в неравенстве нужно добавлять знак равенства».

§ 39. Обобщение понятия предела (пределы в «несобственном смысле»)

Мы познакомимся теперь с некоторыми условными оборотами речи, широко употребляемыми в математической практике.

Условимся называть «окрестностью точки -J- оо» всякий промежуток, не ограниченный сверху (без начальной точки), и будем такой промежуток

х>М (или Ж<лг<-|- оо)

называть Л4-окрестностью точки -(- оо.

Говорят, что последовательность имеет «предельную точку -{- оо», если во всякой «окрестности точки -\- оо» содержится бесконечное множество точек последовательности. Это как раз означает, что последовательность неограничена сверху.

Аналогично определяется «окрестность точки —оо» — как всякий промежуток, не ограниченный снизу (без конечной точки); такой промежуток

х<— M (или —оо<х<— М)

называется «(—УИ)-окрестностью точки —оо». Если говорят, что последовательность «имеет предельную точку —оо», то это равносильно констатации того, что последовательность неограничена снизу.

Формулировка теоремы Больцано-Вейерштрасса теперь упрощается:

Всякая бесконечная последовательность {ап\ имеет хотя бы одну предельную точку (в «собственном» или в «несобственном» смысле).

В самом деле, если последовательность не ограничена сверху, то она имеет предельную точку -}- оо; если не ограничена снизу, то имеет предельную точку — оо; если ограничена сверху и снизу, то

по основной теореме имеет хоть одну «конечную» предельную точку.

Далее, остаётся в силе (расширяя свой смысл) определение: пределом последовательности называется предельная точка, если она — единственная. Допустим, что единственная предельная точка есть -f- оо, и перефразируем это утверждение. Так как — оо не есть предельная точка, то последовательность ограничена снизу, так что в некотором промежутке (— оо, т) нет ни одной точки последовательности; так как никакая «конечная» точка не есть предельная точка, то во всяком «конечном» промежутке [m, М], где М>т, имеется лишь конечное число точек последовательности. Среди индексов этих точек возьмём наибольший и обозначим его через N = Nm'> тогда окажется, что при условии n>N точка ап непременно находится в УИ-окрестности точки -{- оо, т. е. удовлетворяет неравенству ап>М. Ясно и обратное: если, как бы велико ни было Ai, все точки ап при достаточно больших значениях п находятся в ЛГ-окрестности точки -\- оо, то последовательность {ап} не имеет иных предельных точек, кроме -J- оо. Мы приходим, таким образом, к следующему определению:

Считается, что последовательность \ап\ имеет предел -}-оо («ап стремится к бесконечности»), если, как бы велико ни было наперёд заданное число М, можно указать такое число N = Nm> что неравенство

n>N (48)

влечёт за собой неравенство

ап>М. (49)

Иначе: последовательность {ап\ имеет предел -{-оо, если её общий член становится сколь угодно большим, раз только достаточно велик его индекс.

Пишут:

1) lim ап = оо,

2) ап~>оо.

Иногда вместо того, чтобы говорить «стремится к бесконечности», говорят «расходится к бесконечности».

Воздерживаясь от повторений, скажем, что последовательность {ап\ имеет предел — оо, если, как бы велико ни было наперёд заданное число М, можно указать такое число N=Nm> что неравенство

л>ЛГ (50)

влечёт за собой неравенство

ап<-М. (51)

Запись: lim ап = — оо, или а„->- — оо.

Приведём несколько примеров.

1. Последовательность натуральных чисел {п} имеет единственную предельную точку, т. е. предел, -|- оо.

То же справедливо относительно последовательностей {па\ при а>0.

2. Последовательность

{(_1)*+1Л}=1, —2, 3, —4, 5, -6, ...

имеет две предельные точки -|- оо и — оо, и следовательно, не имеет предела даже и в «несобственном» смысле.

3. Если последовательность {ап} не имеет конечных предельных точек, то lim | ап\ = -f- оо.

4. Арифметическая прогрессия \а-\-(п— 1)^} имеет предел -\- оо или —оо, смотря по тому, будет ли d>Ot или d<0.

5. Геометрическая прогрессия {qn\ имеет предел -|- оо при q^l1), и не имеет предела при q<—1. Но в этом последнем случае, конечно, lim | q |я = + оо.

6. lim(l-fl + y-J-.= оо (см. конец § 35).

7. Последовательность 2 на стр. 151 имеет в качестве предельных точек все натуральные числа и ещё -f- оо. Предела нет.

8. Последовательность {tg/z^6},nie 6—иррациональное число, имеет предельными точками все числа без исключения и ещё -|- оо и — оо.

В самом деле, если бы в некотором промежутке (а, ß) не было ни одной точки последовательности {tg/zrc6}, то в промежутке

\ ra —F===\

не было бы ни одной точки последовательности

{sin/jrcö},

а это противоречит примеру 16 § 37.

По поводу основных теорем I—IV § 38 необходимо сделать предостережение: на случай бесконечных пределов они переносятся лишь частично. Справедливы такие теоремы (доказательство их предоставляем читателю):

Г. Если аЛ-* + оо, Ьп>т, то ап -f- Ьп-> + оо. I". Если ап-> — оо, Ьп<М, то ап-\-Ьп^ — оо.

(Теоремы типа II заменой знака сводятся к теоремам типа I).

ИГ. Если III". Если

IV. Если IV". Если

IV". Если K!<Af, |*я|->оо, то

IV"". Если |ая|>/и>0, |ôn|->0, то

1) Доказательство см. на стр. 81.

Но нельзя ответить в общей форме («раз навсегда»), например, на такие вопросы:

1) Что будет с разностью ап — Ьп, если ая->оо, £я-*оо?

2) Что будет с произведением апЬп, если аЛ->оо, Ьп-+0?

3) Что будет с отношением ^, если ал->оо, 6п->оо?

4) Что будет с отношением -jp-, если ал-*0, 6л-*0?

Каждый из вопросов подобного рода получает разрешение только в том случае, если указано, каковы именно данные последовательности \ап\ и {Ьп}. Очень часто простое тождественное преобразование приводит к положениям, когда одна из теорем типов I—IV уже оказывается применимой1); но иногда всё же приходится прибегать к особому исследованию (примеры см. ниже, §§ 43—45).

§ 40. Предел функции на бесконечности

К понятию предела последовательности сводится понятие предела функции. Рассмотрим сначала случай предела функции «на бесконечности» (-(- оо).

Предположим, что некоторая функция f(x) действительной переменной x задана (не теряет смысла) в некоторой окрестности точки (-j-oo), например в промежутке (а, оо). Мы уже имели дело с последовательностями, общий член которых ап имеет вид f(xn), где хп = п:

{/(л)}=/(1), /(2), ...,/(/z), ...

Пусть теперь {хп}—какая угодно последовательность значений х из промежутка (а, оо), имеющая предел -\- оо:

(52)

Если последовательность соответствующих значений функции

{/(■*«)} =/c*i)» /с**)» /(**)> ...

также стремится к некоторому пределу L, конечному или бесконечному2),

f{*à-+L$ (53)

и притом независимо от того, как выбрана последовательность {хп}, обладающая свойством (52), то тогда говорят, что при не-

1) Распространённый термин «раскрытие неопределённостей» (случаи: оо — оо, оо-О, 22., -g-j способен вносить некоторую дезориентацию, так как «неопределённость» заключается лишь в невозможности непосредственного применения какой-либо из основных теорем.

2) Условимся пользоваться большой буквой L для того, чтобы охватить сразу оба эти случая.

ограниченном возрастании х функция стремится к пределу L, и записывают это одним из следующих способов:

(54)

Напротив, если две различные последовательности вида \f(xn)} имеют различные пределы или существует хотя бы одна такая последовательность \хп\, что последовательность \f(xn)} не имеет предела1), то говорят, что функция f(x) не стремится к пределу при неограниченном возрастании х, или что предел lim f{x) не существует.

Подобные же определения даются понятию предела f(x) при Х-+--00.

Рассмотрим примеры.

1. Функция /(jc)=-Î- при х->оо имеет предел 0:

В самом деле, раз хп^оо, то-->0 (IV"'). Точно так же

2. Пусть f(x) = xn (п — целое положительное). Тогда

(III')

3. Пусть f(x) = ax(a>\). Тогда

Для целых значений х это показано на стр. 81; для произвольных — следует из того, что функция а* — возрастающая.

4. limlogaa;=oo (при а>1).

Х-юо

5. Функция / (х) = sin x (рис. 70, а) не имеет предела при ху стремящемся к оо. Действительно, положив хп = ъп, мы получаем / (тс/z) = sin -> 0; положив хп = у -(" получаем

1) Случай, когда всевозможные последовательности вида {/(хП)} имеют предел, но не всегда один и тот же, является невозможным. Именно, если последовательность {f(x'n)} имеет предел L\ а последовательность {/(Хп)} —-предел причём L'^bL", то последовательность

/(*!), /(*?), /(*;), /М'), .. -, //Wn)....

предела иметь не может (см. § 37, пример 9).

Аналогично не существует предел lim sinx.

Рис. 70.

6. Функция f(x) = xsmx (рис. 70,6) также не имеет предела ни при х-+оо, ни при Х-+ — оо. На этот раз, как в предыдущем

примере,

7. Функция

(рис. 70, в) имеет предел 0 при лг->о© и при х-* — оо:

Это ясно из неравенства

с использованием примера 1.

8. Функция f (х) = 2х sin 2пх не имеет предела при лг-^-f-oo и имеет предел 0 при х->—оо:

lim 2A'sin 2пх = 0.

Функция f(x) = 2~xsin2nx (рис. 71), напротив, имеет предел О при х->-\- оо:

lim 2~*sin 2тгд; = 0,

и не имеет предела при

Х->-00.

Определению «предела функции на бесконечности» можно дать иную («эпсилонную») формулировку. Остановимся на случае точки + оо. Соотношение (54) означает:

1) При L конечном: как бы мало ни было

е ( > 0), можно указать такое число X~XSi что из неравенства х>Х следует неравенство

|/(*)-£|<е; (55)

2) при L = -\- оо: как бы велико ни было М, можно указать такое число Х=Хм%

что из неравенства

х>Х

следует неравенство

f(x)>M; (56)

3) при L = —оо :

такая же формулировка, с заменой неравенства (56) неравенством

/(*)<— М. (57)

Покажем, что новые и прежние формулировки равносильны, останавливаясь хотя бы на случае L конечного.

Допустим, что из лгЛ-*оо следует и докажем, что ко всякому е(>0) можно подобрать число X=Xit обладающее

Рис. 71.

указанным свойством. Пусть это неверно, и такое число X можно подобрать не ко всякому s; предположим, что к некоторому е*(>0) нельзя подобрать числа X, обладающего требуемым свойством. Это значит, что, как бы велико ни было X, можно к нему подобрать такое значение х, что х>Х, но \/(х)— L|^e*. Пусть дана последовательность

\Хп} = Xi, Х%, ... i Хп, ...

такая, что Хп—*оо. К каждому Хп подберём такое х=хп> что

*ш>Ха> (58)

но вместе с тем

\f(xn)-L)^e*. (59)

Рассмотрим теперь последовательность значений х

{хп\ ==. Xi, х%, ..., хп, .. .

Из неравенства (58) следует, что хп->оо. Но из неравенства (59) следует, что соотношение f(xn)-^L не осуществляется, так как отклонение \/(хп) — L\ остаётся большим, чем положительное число е*. Получается противоречие, откуда ясно, что сделанное допущение было неверно.

Обратно, допустим, что ко всякому е(>0) можно подобрать число X=Xti обладающее тем свойством, что из неравенства х>Х следует неравенство (55), и покажем, что из хп->оо следует f(x„)->L. Так как лгл~^оо, то, как бы велико ни было Mt при n>N, где N=Nm> мы должны иметь: хп>М. Положим М = Х; тогда при n>N будем иметь хп>Х, и в таком случае согласно сделанному допущению отсюда вытекает \f(xn)— L\<e.

§ 41. Односторонний предел функции в конечной точке

Перейдём к рассмотрению вопроса о пределе значений функции /(л:) в некоторой конечной точке х = с, т. е. о пределе, к которому, возможно, стремится значение fix) при неограниченном приближении переменной х к конечному значению с.

Начнём с примеров, демонстрирующих разнообразие возникающих в данном случае возможностей.

Пример 1. Исследуем поведение функции

(60)

в особенности сосредоточивая внимание на окрестности точки х = 0. Функция /(лг) задаётся предыдущей формулой для всех значений х, кроме лг = 0; очевидно, при всех значениях х(ф0) она положительна. Легко понять, что

Если х убывает от -f- оо> неограниченно приближаясь к нулю, то — возрастает от 0 до бесконечности, и тогда 2х возрастает от 1 до бесконечности. С другой стороны, если х возрастает от —оо, приближаясь к 0, то — убывает от 0 до —оо, и значит, 2х убывает от 1 до 0 (причём значение 0 не принимается ни при каком значении х).

График функции (60) показан на рис. 72.

Рис. 72.

Замечательное свойство функции (60), которое нас интересует, заключается в наличии разрыва («скачка») её графика около точки х = 0; чуть правее этой точки значения функции чрезвычайно велики, чуть левее — близки к нулю, в самой же точке х = 0 функция не имеет никакого значения: на вертикальной оси нет ни одной точки графика.

Пример 2.

(61)

Этот более сложный пример исследуется с точки зрения возрастания и убывания подобно предыдущему и приводит к графику, изображённому на рис. 73. Здесь также имеется разрыв в точке х = 0; но тогда как чуть левее этой точки значения f(x) близки к 1, чуть правее этой точки они близки

Рис. 73.

к нулю («конечный скачок»), и опять на вертикальной оси нет ни одной точки графика, так как функция не определена при л: = 0. Функция, между прочим, обладает свойством

/(*) + /(-*)=!.

откуда можно заключить, что точка

есть центр симметрии графика.

Пример 3. Достаточно в данной связи лишь напомнить читателю о функциях

графики которых обнаруживают разрывы при приближении к точке лт = 0: с обеих сторон имеется неограниченное возрастание по абсолютной величине, но в первом случае — при различных знаках, во втором — при одном и том же знаке.

Пример 4.

(62)

Значения функции, очевидно, колеблются между +1 и — 1. Ясно, что lim/(д:) = 0.

Когда X убывает от -|- оо до — , то — возрастает от 0 до -^-и f(x) возрастает от 0 до 1; когда же х убывает от — до п-, то — возрастает от -тг- до y* и /(*) убывает от 1 до — 1, обращаясь в нуль при х = — , и т. д.

Рис. 74.

Так как функция f(x) — нечётная, то её график, изображённый на рис. 74, имеет начало О центром симметрии. При приближении х к нулю колебания функции «учащаются». В точке л; = 0 функция не определена.

Пример 5.

(63)

Функция «совершает колебания», которые «учащаются» и «растут» (в смысле размаха) при приближении х к точке О. Так как при *>0

т. е.

то график заключён между ветвями гипербол У=~£ и У = — ~* (Рис. 75). Общие точки графика с верхней гиперболой получаются из уравнения

что даёт

общие точки с нижней гиперболой соответствуют значениям

корни уравнения sin -^- = — 1^ . Функция —- чётная, график симметричен относительно оси Oy. С осью Ôy график не пересекается; функция не имеет смысла при л: = 0.

Рис. 75.

Пример 6.

(64)

В этом примере функция также совершает колебания, которые на этот раз отличаются тем, что их «размах» уменьшается при приближении к началу О. При x > О, очевидно,

\f(x)\^xt

так что

— x^f(x)^ + x. (65)

Равенство справа достигается при

равенство слева — при

. Максимумы и минимумы находятся чуть правее этих точек1).

Функция — чётная, график имеет ось симметрии Oy (рис. 76). Несмотря на неравенство (65), разрыв не устранён окончательно; в точке л: = 0 функция не имеет смысла, и на оси Oy нет точек графика2).

Рис. 76.

1) Легче всего это установить с помощью дифференциального исчисления. Мы получим:

Отсюда следует:

Решить же уравнение /'(*) = 0 можно, приведя его к виду tg—= —,или

tgÇ = ç, где Ç = ~, а затем действуя графически.

2) Положим ~ = и- Так как sinu<u при и>0, то a:sin-i<l при х">0. Далее, из соотношения

Графики примеров 5 и б удобно строить систематическими приёмами, указанными в § 2.

Пример 7.

(66)

Функция не определена при х = 0; однако при приближении к значению * = 0 справа или слева без «колебаний» и очень быстро приближается к нулю (рис. 77).

Рис. 77.

Примеры, подобные рассмотренным, дают повод ввести следующие уточняющие определения.

Пусть функция f(x) задана в некотором промежутке с конечной точкой с, кроме самой точки с, в которой она может быть задана или не задана. Если для всякой последовательности точек {хп)у обладающих свойствами

^;$сс,}(я=1'2'->' (67)

последовательность \f(xn)\ стремится к одному и тому же конечному или бесконечному пределу Z/,

f(xn)-+Vy (68)

то говорят, что при неограниченном приближении х к точке с слева функция f(x) стремится к пределу 1!\ для записи этого пользуются иногда условным обозначением1)

/(с — 0) = L'.

(см. формулу (89) на стр. 192) следует:

Таким образом, прямая у=\ есть асимптота графика рассматриваемой функции (см. пунктирную прямую на рис. 76); сам график приближается к ней снизу.

1) Принимается во внимание громоздкость записей вроде

Точно так же, если для всякой последовательности точек \хп}, взятых в некотором промежутке с начальной точкой с и обладающих свойствами

(69)

последовательность {/(хп)} стремится к одному и тому же пределу L",

(70)

то говорят, что при неограниченном приближении х к с справа функция f(x) стремится к пределу и записывают:

/(с + 0) = 1".

Рассмотренные нами примеры подобраны таким образом, что с всё время равно нулю. Мы получаем:

в примере 1: Z/ = 0, //' = -{-оо, » » 2: Z/=l, L" = 0,

» » 3: a) V = — oo, I"=-j-oo; 6) Z/ = L" = +oo, »

примерах 4 и 5: пределы V и L" не существуют, » » 6 и 7: Lr = L" = 0.

Следует обратить особое внимание на то, что при нахождении пределов U и Z/' число /(с) — значение функции в самой рассматриваемой точке х = с — не играет никакой роли: функция может и «не иметь смысла» в этой точке.

Определение предела V допускает следующую «эпсилонную» перефразировку. Соотношение (68) означает

1) при V конечном:

как бы мало ни было з(>0), можно указать такое число 8 = 8е(>0), что из неравенств

х<с, х>с — 8 (71)

следует неравенство

!/(*)-/;] О (72)

2) при Г = -|-оо:

как бы велико ни было М, можно указать такое число 8 = 8м(>0), что из неравенств (71) следует неравенство

f(x)>M, (73)

3) при L" = —OQ

— такая же формулировка, с заменой последнего неравенства следующим:

/(Х)<-М. (74)

Аналогичные определения могут быть сформулированы для предела L".

Мы не будем останавливаться на доказательстве равносильности этих определений с прежним определением. Оно строится по образцу доказательства, приведённого в предыдущем параграфе.

§ 42. Двусторонний предел. Понятие непрерывности

Величины V и определённые в предыдущем параграфе, называются левым и правым пределами функции f(x) в точке х = с. Это — односторонние пределы.

Если оказывается, что левый и правый пределы между собой равны

L' = LV = U1)

то их общее значение L является уже двусторонним пределом, или просто пределом функции f(x) в точке х — с, чему соответствуют записи:

1) lim f(x) = L, (75)

или

2) f(x)->L при Х-+С. (76)

Независимо от односторонних пределов двусторонний предел может быть определён следующим образом. Пусть функция f(x) задана в некоторой окрестности точки с (исключая, может быть, самую точку с). Если для всякой последовательности точек {хп}, взятых в этой окрестности и обладающих свойствами

(77)

последовательность {f(xn)\ стремится к одному и тому же, конечному или бесконечному, пределу L,

f(*J->L, (78)

то говорят, что при неограниченном приближении х к с функция /(с) стремится к пределу L.

«Эпсилонная» формулировка, строго эквивалентная предыдущей, такова: соотношение (75) или (76) обозначает:

1) в случае L конечного:

как бы мало ни было s ( > 0), можно указать такое 8 = 8£ ( > 0), что из неравенства

хфс, \х — с|<8 (79)

следует неравенство

[/(*)-1|<е; (80)

2) при L = -f- оо:

как бы велико ни было М, можно указать такое 8 = 8^ ( > 0), что из неравенства (79) следует неравенство

_ f(x)>M; (81)

1) Напомним, что при этом не исключаются случаи

3) при L =— оо

— такая же формулировка, с заменой последнего неравенства следующим:

/(*)<—М. (82)

Действительно, если соотношение (78) осуществляется для всякой последовательности {хп}, удовлетворяющей требованию (77), то оно осуществляется и для всякой последовательности, удовлетворяющей требованию (67), или требованию (69), так что если существует предел L, то обязательно существуют пределы L и и притом U = L" = L. Обратно, пусть существуют равные между собой пределы V и L", и L есть их общее значение: U = L" = L. В таком случае, последовательность {хп }, удовлетворяющую требованию (77), можно считать «составленной»1) из двух последовательностей, соответственно удовлетворяющих требованиям (67) и (69); тогда последовательность {/(хп)} будет «составлена» из двух последовательностей, имеющих один и тот же предел L; значит, f(xn)->L.

В примерах 1, 2, За, 4 и 5 предшествующего параграфа предел рассматриваемых функций в точке х = 0 не существует; в примерах 6 и 7 L = \im f(x) = 0; в примере 36 L = -j-oo.

Чрезвычайно важно понять, что числовое значение предела, даже «двустороннего»,

1=Нт/(дг),

как и самый факт его существования, не зависит от того, чему равно значение /(с) функции f(x) в точке х = с, и даже от того, определена ли сама функция в этой точке.

С понятием предела функции в данной точке тесно связано понятие непрерывности функции в этой точке.

Предположим, что функция /(лг), заданная в окрестности некоторой точки x = cf имеет конечные левый и правый пределы в этой точке, V и L", и что три величины V, L" и /(с) равны между собой:

Lr = L" = f(c). (83)

Заметим, что по доказанному достаточно предположить, что существует конечный предел L функции f(x) в точке х — с и что две величины L и /(с) равны между собой:

L=f(c). (84)

В таком случае говорят, что функция f{x) непрерывна в точке х = с.

1) См. § 37, пример 9.

Ни в одном из примеров 1—7 § 41 функция f (х) не является непрерывной в точке х = 0, и именно по следующим причинам: в примерах 1, 2, За il фС\ значит, L не существует, в примере 36 L существует, но не конечно, в примерах 4 и 5 il и L" не существуют, в примерах б и 7 L существует и конечно, но функция не задана в точке д: = 0.

Впрочем, все приведённые примеры имеют то общее, что ни в одном из них функция не задана в рассматриваемой точке: этого обстоятельства достаточно, чтобы функция в ней не могла быть признана непрерывной.

В приведённом выше определении непрерывности функции f(x) в данной точке с используется понятие предела: предел функции в рассматриваемой точке равен ее значению в этой точке. Можно, однако, избегнуть упоминания о пределе, раскрывая содержание этого понятия в самой формулировке определения непрерывности.

Так мы приходим к определениям, которые строго эквивалентны сформулированным выше:

1. Функция/(л:), заданная в некоторой окрестности точки х = с, непрерывна в этой точке, если, какова бы ни была последовательность {хп }, обладающая свойством

хп->с,1) (85)

непременно последовательность {f(xn)\ сходится к пределу

f(*n)-+f(c) (8б)

(определение Гейне).

2. Функция f(x), заданная в некоторой окрестности точки х = с, непрерывна в этой точке, если, как бы мало ни было число е(>0), можно указать такое 8 = 8е, что из неравенства

|*-с|<82) (87)

следует неравенство

|/(*)-/(с)|<е (88)

(«эпсилонное» определение Коши).

С понятием непрерывности функции в данной точке связывается понятие непрерывности функции в данном промежутке.

Говорят, что функция непрерывна в некотором промежутке3), если она непрерывна в каждой точке этого промежутка.

Например, функция/(лг) = -^ непрерывна в промежутке 0<лг^ 1

(если не включать начальной точки л: = 0), но она не является непрерывной в промежутке 0^л:^1 (если включена точка л: = 0), так как не задана в точке х = 0.

1) Необходимость ограничения хпфс здесь уже отпадает.

2) Ограничение хфс излишне.

3) Промежуток может здесь включать или не включать начальную и конечную точки, или включать одну из них.

Понятие «разрыва в точке х = с» уточняется теперь следующим образом: если функция определена (задана) в некотором промежутке, внутри которого находится данная точка х = с, но не определена или не непрерывна в самой этой точке, то говорят, что в этой точке функция «имеет разрыв».

§ 43. Примеры непрерывных функций

Установить непрерывность данной функции f(x) в данной точке с, по большей части, можно, не прибегая к исследованию всевозможных последовательностей вида \/(хп)\, где хп-*с (что практически и неосуществимо), и не пользуясь также «эпсилонными» построениями.

Заметим предварительно, что функции, сводящиеся к постоянным

f(x) = C,

а также функция, тождественно равная независимой переменной,

f(x)=x,

очевидно, являются непрерывными в любой точке. Действительно, в первом случае мы видим (обращаясь хотя бы к «эпсилонному» определению), что отклонение \f(x)—f(c)\ при всяком х равно нулю, во втором — оно всегда равно отклонению \х — с [, и потому 8 можно всегда взять равным s.

В дальнейшем же открываются обширные возможности, опираясь на основные теоремы о пределах, из свойства непрерывности одних функций заключать о непрерывности других.

Справедливы прежде всего такие теоремы: если каждая из функций и (х) и v (х) непрерывна в точке с, то непрерывны в этой точке также их а) сумма u(x)-\-v (л:), Ь) разность и (х) — v (х), с) произведение и (x) v (x), d) отношение (при дополнительном условии

Докажем в качестве примера пункт а). По предположению из хп->с следует и (хп) -> и (с) и v (xn)->v (с). Тогда по теореме 1 § 38 мы получаем: и (хп) -j- v (хп) и (с) -j- v (с), что и требовалось доказать.

Установим, наконец, следующую общую теорему е) о непрерывности «сложной» функции: если функция и (х) непрерывна в точке х = с, и функция /(к) непрерывна в точке и = и(с), то функция F (x)=f(u(x)) непрерывна в точке х = с.

В самом деле, если лгя->с, то по свойству непрерывности функции и(х) и(хп)->и (с), и тогда по свойству непрерывности /(«)

Из теоремы е) следует: если функция v(x) непрерывна в промежутке а<х<Ь, если все значения, которые она принимает в этом промежутке, принадлежат промежутку c<x<d, и если, наконец, функция и(х) определена и непрерывна в промежутке c<x<d, то сложная функция u(v(x)) непрерывна в промежутке а<х<Ь.

В частности, если функции и (х) и v (х) определены и непрерывны при всех действительных значениях х, то можно сказать то же самое о сложной функции u(v(x)).

Принимая во внимание определение целой и дробной рациональной функции (см. § 6), мы выводим, опираясь на пункты а) — d), в частности, такие заключения:

Всякий рациональный многочлен (целая рациональная функция) Р(х) непрерывен всюду, т. е. в любой точке (другими словами, в промежутке — оо <х <C~f- оо)-

Всякая дробная рациональная функция

(где Р(х) и Q{x) — многочлены без общих множителей) непрерывна всюду, кроме точек, в которых знаменатель Q(x) обращается в нуль. Пользуясь обозначениями предыдущего параграфа, можно сказать, что в таких точках пределы U и V бесконечны, притом — одного или различных знаков в зависимости от кратности нуля Q(x) (см. § 16).

Всякая рациональная функция может иметь лишь конечное число «разрывов», и все они —указанного здесь типа.

Корни целых степеней

являются непрерывными функциями всюду, где они существуют.

Докажем это хотя бы для случая арифметического квадратного корня (п = 2). Пусть с>0. Тогда

Если хп-+с, то правая часть стремится к нулю; значит, и левая. В случае с = О речь может итти лишь об «односторонней» непрерывности функции / (х) = у'х (т. е. при ограничении х^О).

Нужно лишь доказать, что ]/хп-+0, если хп>0 и хп-±0. Чтобы из неравенства

К1<а

следовало неравенство

достаточно положить 8<8е = е2.

По поводу общего случая (я^З) см. стр. 246, пример 2.

Тригонометрические функции sin* и cos* всюду непрерывны.

В самом деле, возьмём на единичном круге ^» АС=с, ^ АМ = х (хф с) и обозначим через Сх и Мг проекции точек С и Ж на горизонтальную ось, а через Я—проекцию точки С на МгМ; тогда получим:

sin X — sin с = МХМ — CtC = РМ, cos X — cos с = ОМх — ОСг = — PC; далее мы видим, что

отсюда понятно, что если хп->с, то sin *я-^ sin с и cosхпcos с.

Тригонометрические многочлены (целые рациональные функции от аргументов cos* и sin*) всюду непрерывны (см. §27). Мы убеждаемся в этом, ссылаясь на непрерывность «сложной функции».

О дробных тригонометрических функциях можно сказать то же, что и о дробных рациональных — с тем отличием, что если имеются разрывы функции (нули знаменателя), то число их не может быть конечным; но в пределах периода число разрывов конечно. Так, элементарные тригонометрические функции tg*, sec* и cosec* имеют по два разрыва в периоде.

Как произведение непрерывных функций всюду непрерывна функция л: sin л: и непрерывны вообще функции вида P(*)sin* или P(*)cos*, где Р(х) — рациональный многочлен.

Функция f(x) = ^~ как отношение непрерывных функций, непрерывна всюду, кроме точки х = 0. Что касается точки * = 0, то в ней функция f(x) не определена, и потому о непрерывности в ней не может быть речи1). Тем не менее, существует двусторонний предел функции f(x) в точке * = 0, именно:

(89)

Пусть сначала *>0. Тогда при условии х < у справедливы неравенства (§§ 25 и 29)

sin*<*<4g*. (90)

Разделив все члены неравенства (90) на sin* и перейдя к обратным величинам, получим:

(91)

Вследствие непрерывности cos* в точке * = 0, как бы мало ни было s, можно указать такое 8, что при |*|<С^

1) См., впрочем, стр. 504, упражнение 5.

так что

Но тогда, как следует из (91), и значит,

Таким образом, в данном случае существует правый предел U = 1; существование левого предела V и равенство L' = L"=l следуют из чётности функции 5!Н_в

Особого внимания заслуживает вопрос о непрерывности показательной функции.

Показательная функция f(x) = ax непрерывна всюду. Убедимся в этом, ограничиваясь случаем a^l1): если а<1, то достаточно будет указать, что ах = ^=îp и аГ1>\. Мы установим сначала, что существует правый предел L" функции ах в точке х = с и притом

L"=zac. (92)

Пусть хп>с, хп-+с\ тогда

ах" = а<.ах»-е. (93)

Положим xn = c-{-kn>0. Нам достаточно показать, что из соотношения

й„-*0 (94)

(какова бы ни была последовательность положительных чисел {hn }) следует соотношение

aÄ/I-> 1.

В таком случае правая часть, а значит, и левая, в равенстве (93) имеют предел ас.

Рассмотрим последовательно несколько случаев:

1) Допустим, что /гл = ~-, и докажем, что

(95)

На стр. 81 мы имели неравенство (при а>1)

ап>1+(а— \)п.

Придадим ему вид

1) Следующее ниже доказательство одинаково применимо к случаю, когда рассматриваются лишь рациональные значения х, и к более общему случаю, когда рассматриваются какие угодно действительные значения х. Что касается определения показательной функции а* при иррациональных значениях л:, а также соответствующего распространения её свойств, то по этому поводу см. § 51.

Так как здесь а — произвольное число, с одним лишь ограничением а>1, то можно заменить а через

Левая часть последнего неравенства положительна, и так как правая, очевидно, стремится к нулю, то следовательно, то же справедливо и относительно левой части. Отсюда вытекает (95).

2) Пусть hn = -y-1 где члены последовательности {рп \ — целые положительные числа, причём рп->оо. Тогда соотношение

является прямым следствием из соотношения (95) (см. стр. 168—169).

3) Пусть члены последовательности { hn ) — какие угодно положительные числа, hn -> 0. Подберём целые числа рп по условию

очевидно, рп оо . Тогда

и так как функция а* — возрастающая, то

Левая часть в последнем неравенстве больше 1, правая, согласно предыдущему пункту, имеет предел 1; значит, алл->1.

Существование левого предела V функции а* в точке с и равенство

L' = ac (96)

можно доказать, исходя из тождества

и полагая

с—xn = hn>0.

Из соотношений (92) и (96), принимая во внимание, что а° есть значение функции ах в точке с, следует непрерывность функции а* в этой точке.

Функция \ogax(a>\) непрерывна во всех точках, где она существует, т. е. при х^О.

Это вытекает из свойства возрастания показательной функции а*. Рассмотрим точку х = с>0; покажем, что правый предел \ogax в этой точке, L", существует и равен \ogac. Пусть хп ]> с, хп -> с. Из хп>с следует, что \ogaxn>\ogac. Нужно доказать, что logaxn-> — logac. Допустим, что это неверно. В таком случае существует такое число е*(>0), что для сколь угодно больших зна-

чений п имеет место неравенство

Но тогда для тех же значений п (по свойству возрастания ах)

А это противоречит допущению хп-+с.

Итак, доказано существование правого предела L" в точке с и равенство L" = \ogac. Подобным же образом доказывается существование в этой точке левого предела V и равенство V = \ogac. Отсюда же следует равенство L' = L" = \ogac и, следовательно, непрерывность функции \ogax в точке с1).

Непрерывность общей степенной функции ха при любом постоянном а, в любой точке х(х>0) получается как следствие теоремы о непрерывности сложной функции. Действительно (§ 24),

и, полагая v (x) — a\ogax, и(х) = ах, мы видим, что функция v(x) непрерывна при х>0, функция же и(х) непрерывна при любом значении х, откуда следует заключение.

Таким же образом устанавливается непрерывность функций вроде Xх при л:>0 (xx = axXogax).

Подводя некоторые итоги сказанному, позволительно констатировать что для элементарных функций точки непрерывности являются, так сказать правилом, а точки разрыва — исключением. Многие элементарные функции непрерывны во всех точках, где они заданы; другие непрерывны всюду, кроме «отдельных» точек (так часто говорили раньше, не видя необходимости в разъяснении того, что такое «отдельные точки»).

Приведём в качестве заключительного примера функцию

(97)

имеющую разрывы во всех точках вида х = -г—$ где k — целые числа (k ф 0), и, кроме того, ещё разрыв в точке х =0.

§ 44. Пределы при монотонном изменении. Число е

Теорема Вейерштрасса. Всякая возрастающая, или хотя бы неубывающая, ограниченная сверху последовательность { ап \ имеет конечный предел.

При этом под возрастающей последовательностью, разумеется, нужно понимать такую, у которой каждый следующий член больше

1) Более общая теорема по поводу непрерывности обратных функций приведена в § 52.

предыдущего; если же говорят о неубывающей последовательности, то предполагают, что каждый следующий член может быть больше или равен предыдущему:

ах ^ а2 ^ ... ^ ап ^ ... (98)

Раз последовательность — возрастающая или неубывающая, то она непременно ограничена снизу, так как все её члены больше некоторого числа т, меньшего, чем первый член. Так как по условию она, кроме того, ограничена и сверху, то её можно назвать просто ограниченной. Но в таком случае по теореме Больцано-Вейерштрасса (§ 36) она имеет хотя бы одну предельную точку: нужно доказать, что такая точка — только одна. Допущение, что имеется более одной предельной точки, приведёт к противоречию. В самом деле, пусть последовательность {ап} в числе своих предельных точек имеет две точки а и а', и пусть, например, а<а\ Выберем число е по условию

тогда

(99)

В е-окрестности точки а! должна находиться хоть одна точка последовательности { ап }, например а#:

аг — s < а к <С а' "Ь е#

В таком случае все члены последовательности ап, следующие за a>N> будут не меньше чем а! — е:

a>n^aN>a' — е (n = N-\-l, ;V-|-2, ...)

и значит, меньшими чем а! — е смогут оказаться лишь члены, имеющие индекс п, меньший чем N: таких членов — конечное число. Итак, в е-окрестности точки а вследствие (99) сможет заключаться лишь конечное число членов. А это противоречит тому, что а есть предельная точка.

Таким образом, последовательность {ап \ имеет лишь одну предельную точку, и она есть её предел: последовательность — сходящаяся.

Заметим, что в условии теоремы Вейерштрасса нет необходимости предполагать, что последовательность — неубывающая с первого же члена: она может быть неубывающей, начиная с некоторого члена.

То, что справедливо относительно неубывающей, ограниченной сверху, последовательности, переносится, конечно, и на невозрастающую, ограниченную снизу последовательность.

Условившись (как иногда делают) называть монотонной1) неубывающую или невозрастающую последовательность, можно даже охватить оба случая общей формулировкой:

Всякая монотонная ограниченная последовательность имеет конечный предел.

Или, короче:

Всякая монотонная последовательность имеет предел. Если последовательность ограничена, предел — конечный, если не ограничена, — бесконечный.

Пример 1. Возрастающая последовательность

ограничена сверху.

Действительно, по поводу члена а2Р _ 1 можно утверждать:

Раз неравенство

V-i<2 (101)

доказано при любом р, то справедливо также при любом п неравенство

ап<2. (102)

В самом деле, к заданному п всегда можно подобрать р так, чтобы было

тогда будем иметь:

и, значит, с помощью (101) получится неравенство (102). Итак, существует предел

1) См. § 5, стр. 37.

2) Произведено суммирование по строкам.

С помощью разного рода приёмов не особенно трудно вычислить этот предел с наперёд назначенным числом десятичных знаков:

а = 1,644 ...

Но лишь математический анализ позволяет установить, что этот предел замечательным образом связан с числом тг:

(последний результат принадлежит Эйлеру).

Пример 2. Последовательность {ап}, где

(103)

имеет особенно большое значение в анализе.

Можно порекомендовать читателю вычислить (непосредственно) значения ап при п—\, 2, 3, 4, 5, округляя их до 0,001; затем с помощью логарифмов при /г= 10, 50, 100 и даже п= 1000.

Последовательность (103) — возрастающая. В самом деле, раскрывая по формуле бинома Ньютона, мы получаем:

(104)

и, таким же образом,

Каждый член во второй сумме, начиная с третьего, больше, чем соответствующий член первой суммы, и имеется ещё лишний, последний, член; значит,

ап<ап+1-

С другой стороны, последовательность {ап } ограничена сверху. Действительно, из формулы (104) следует, что, каково бы ни было л,

Отсюда следует, что последовательность {ап} имеет конечный предел, ^3. Этот предел обозначается буквой е:

(105)

Его числовое значение даётся равенством

е= 2,71828 ...

Число е играет большую роль в математическом анализе: его принимают в качестве основания системы «натуральных» логарифмов1) (см. стр. 316).

Сказанное относительно последовательностей оказывается справедливым и для функций.

Если функция f(x), заданная в некоторой окрестности точки (-|-оо), является возрастающей (или хотя бы неубывающей) и обладает свойством ограниченности сверху, то существует конечный предел

L — lim f{x).

Нужно доказать, что, какова бы ни была последовательность {хп\ в заданной окрестности точки (-}-оо), из условия лгя->оо следует, что последовательность \f(xn)\ стремится к некоторому одному и тому же пределу.

Последовательность \f(n)} — возрастающая и ограниченная; положим

L = \imf(n). (106)

Пусть рп — такие целые числа, что

Pn*Z*n<Pn + l (»=1, 2, ...). (107)

Из неравенства (107) следует:

/(/>„) ^Я*п)</0>„+1). (108)

и так как, очевидно, рп-*- оо и рп-\- 1 оо, а из соотношения (106) вытекает f(pn)-+ L и f(pn-\- 1)-> L, то отсюда на основании неравенства (108) заключаем:

/(*„)-*!.

Подобная же теорема справедлива, конечно, и в случае функции f(x), убывающей (невозрастающей) и ограниченной снизу в окрестности точки (-f- оо).

Аналогичные формулировки существуют и для точки (—оо). Наконец, не исключается и случай одностороннего приближения неизвестной переменной к конечному пределу:

Если функция /(х), заданная в некотором промежутке с<х<с-\-Ъ или с — 8<л;<с, где 8>0, изменяется монотонно (т. е. не убывая или не возрастая),/яо существует предел /(с 4-0) (или f(c — 0)).

Этот предел конечен в том случае, если функция в данном промежутке ограничена.

1) Логарифмы, взятые по основанию е, часто обозначаются следующим образом:

logß х = \пх.

Нет необходимости приводить доказательство этого утверждения. Пример 3. Если бы было легко доказать элементарными средствами, что функция

— возрастающая, то она могла бы хорошо иллюстрировать предыдущую теорему. Не имея, однако, возможности опираться на это свойство, мы, чтобы доказать равенство

(109)

станем рассуждать несколько иначе. Нам уже известно (см. пример 2), что f(ri)-*e\ предположим теперь, что хп-+ оо, и докажем, что f(xn)-*e. Пусть (как раньше)

Рп^^п<Рп+^

где рп — целое. Тогда

(110)

и, с другой стороны,

(111)

Нетрудно сообразить, что правые части в обоих неравенствах (110) и (111) имеют предел е\ отсюда следует соотношение

и, наконец, (109).

Рис. 78.

Рассмотрим также, чему равняется lim /(лг). Пусть {хп} — такая последовательность значений х, что хп-+— оо. Положим \хп\ = — хп = 1п. Тогда

и так как ?л-^оо и также Ьп—1 -> оо, то первый множитель справа стремится к 1, второй, по доказанному, — к числу е. Итак, наряду с соотношением (109) мы имеем:

(112)

На рис. 78 дан график функции

1) В заштрихованной полосе могут встретиться отдельные точки данного графика. Так, при х = — у не получается никакого (действительного) значения функции f(x); при х = —^ получается одно отрицательное значение; при лг = —5—одно положительное значение. Осмыслить эти явления можно с помощью теории функций комплексного переменного.

ГЛАВА IV

ПРЕДЕЛЫ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ФУНКЦИЙ. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ

§ 45. Простая сходимость

Говоря о последовательностях чисел {ап\, мы установили (§ 38) взгляд на переход к пределу (ап->а) как на операцию, позволяющую иногда по данным числам ап (#=1, 2, 3,...) построить новое число а, называемое пределом последовательности:

а = lim ап.

Переходя теперь к рассмотрению последовательностей функций

{/„(*)} =/,(*), /,(*)..... /л (•*). • • •. (О

заданных в некотором (конечном или бесконечном) промежутке, определим и в этом случае операцию перехода к пределу

позволяющую иногда по данным функциям fn(x) (п=1, 2, 3,...) построить новую функцию — предел последовательности данных функций

/(*) = lim/„(*). (2)

К вопросу о сходимости последовательности функций можно подходить с различных точек зрения. Мы установим сначала более общее понятие простои сходимости и лишь позже (см. § 48) обратимся к более специальному (и практически более важному) понятию равномерной сходимости.

Можно рассуждать так. Задавая в некотором промежутке / последовательность функций (1), мы задаём бесконечное множество числовых последовательностей: именно, если х0 есть какое-нибудь значение х из промежутка /, то с каждым таким значением сопоставляется числовая последовательность

(3)

Может случиться, что некоторые из таких числовых последовательностей {fn(x0)\ имеют предел, и притом конечный; этот предел, вообще говоря, зависит от выбора точки дг0; обозначим его через /(аг0).

Сказать, что в промежутке I последовательность \fn(x)\ стремится к пределу f(x)

(4)

означает, по определению, то же самое, что констатировать наличие предельного отношения (в собственном смысле — см. § 38)

Л(*о)-*/(*о)

для каждой точки х0 из промежутка I.

Нужно сразу же заметить, что символ f(x) вовсе не обязательно обозначает элементарную функцию (см. § 1). В самом деле, на основании предыдущего с каждым значением х из промежутка / сопоставляется по особому правилу некоторое число y=f (х); но упомянутое правило подразумевает выполнение, кроме элементарных операций, ещё операции перехода к пределу (для случая числовой последовательности), и вовсе ни откуда не следует, чтобы тот же результат мог быть получен без этой операции. Таким образом, если предел последовательности (1) мы станем трактовать как функцию числового значения переменной х, то следует заранее считать не исключённым, что функция эта уже не является элементарной, а есть функция в более общем, расширенном смысле слова. Дальнейшие примеры покажут характер получающихся этим способом функций.

Если не делать предположения, что при любом числовом значении х = х0 из рассматриваемого промежутка / последовательность (1) стремится к конечному пределу, то в зависимости от выбранного значения х0 возможны три различных случая:

1) или эта последовательность имеет конечный предел,

2) или её предел бесконечен (-)- оо или — оо),

3) или она не имеет предела.

Обозначим соответствующие совокупности (множества) точек х = х0 через Еи Е2 и Ег; каждая точка из / принадлежит одной и только одной из этих совокупностей. Символ f(x0) имеет смысл в том случае, если точка х0 принадлежит совокупности Et; эта совокупность носит название области сходимости последовательности (1) (в пределах промежутка /). Если х0 принадлежит Ег, то символ /(Xq) не имеет никакого смысла; если же х0 принадлежит Е2, то возможна была бы запись

/(*<>) = +00 или /(*о) = — °°>

но она не принята1). Итак, в общем случае функция f(x) оказывается заданной лишь в точках совокупности Ev

1) Тем не менее случаи, когда х0 принадлежит Е2 или принадлежит £"3, конечно, существенно различны.

В дальнейшем запись

будет использована только для случая Е1=1, т. е. при допущении, что сходимость к конечному пределу имеет место во всех точках рассматриваемого промежутка.

Рассмотрим несколько примеров, в которых роль промежутка / будет играть вся действительная ось —оо <лг<-{- оо.

Пример 1. Пусть дана последовательность функций {/л (х)\, где

Рассмотрим три случая:

1° х = 0. В этом случае, очевидно, fn(x)-+l. 2° х>0. Считая х постоянным, положим

так как шл->оо, то на основании § 44 (пример 3) и в силу непрерывности степенной функции

3° л:<0. При этом предположении мы получаем, сделав ту же подстановку, шл—►—оо, и потому снова (см. конец § 44)

Итак, во всех случаях мы имеем:

(5)

В этом примере сходимость имеется при всех значениях х, и функция, получающаяся при переходе к пределу, — элементарная.

Пример 2. Положим fn(x) = xn (л=1, 2, 3,...). Последовательность

\хп}=х, х\ *3,...,

(см. § 37, п. 5 и § 39, п. 5) сходится к пределу 0 при условии — 1<л:<1, сходится к пределу 1 прил:=1, расходится к -|- оо при х>1 и вовсе не имеет предела при л:^—1. Таким образом, можно сказать, что в данном случае совокупность точек Et (область сходимости) есть промежуток от —1 до -f- 1, со включением правого конца, но без включения левого; совокупность Е% — промежуток от 1 до оо, без включения левого конца; совокупность Ег — промежуток от —оо до —1, со включением правого конца. Предельная функция f(x)— lim хп «определена», «задана», «суще-

ствует» при условии —1<лг=^1, и именно определяется равенствами

(6)

Её график, с разрывом на правом конце, изображён на рис. 79 жирной линией, причём следует добавить, что точки (1, 0) и (— 1, 0) ему не принадлежат.

Рис. 79.

Пример 3. Пусть

Последовательность

— сходящаяся при всех значениях х. Предельная функция, как легко понять, определяется равенствами

(7)

Она имеет разрыв в точке х = 0 (рис. 80). В этой точке (см. § 41) L' =/(0 — 0) = 0, L" = /(0 + 0) = 0,

но

/(0) = 1.

В этом примере график /л (л:) получается из графика fx (х) посредством сжатия в п раз по направлению Ох.

Рис. 80.

Подобные же результаты получаются, если положить

Пример 4.

И в этом примере имеется сходимость на всей оси; предельная функция f(x) задаётся равенствами

(8)

Она имеет бесконечное множество разрывов в точках, соответствующих целым значениям х (рис. 81).

Рис. 81.

Пример 5.

В этом примере точки вида x = k> где k — целое нечётное, принадлежат множеству Ег: в них нет сходимости. Все остальные точки принадлежат множеству Ех.

Рис. 82.

Предельная функция f(x) определяется равенствами (рис. 82)

(9)

Пример 6.

Графики функций fn (х) — ~ arctg ял; изображены на рис. 83. График /п (х) получается из графика ft (х) посредством сжатия в п раз по направлению оси Ох.

Рис. 83.

Предельная функция f{x) задана для всех значений х и определяется равенствами

(10)

В точке х = 0 функция f{x) имеет разрыв,

£'=/(0 — 0)=—1, /(0) = 0, 1"=/(0 + 0) = +1.

Функцию f(x)t определённую равенствами (10), иногда обозначают sgn*1).

Пример 7.

(11)

Переход к пределу нам даёт:

1) sgn — сокращение латинского слова Signum (знак).

График функции fn (х) из графика fx (x) = arctg л:, изображённого на рис. 84, получается посредством одновременного сжатия в п раз по направлениям Ох и Oy (т. е. уменьшения в п раз). В пределе получается фигура, составленная из двух лучей — биссектрис 1-го и 2-го координатных углов. Предельная функция, таким образом, есть \х\.

Пример 8. Последовательность {f(x)}> где

имеет предельную функцию

(12)

Рис. 84.

Пример 9. Пусть и(х) и v(x)—две какие угодно функции, заданные для всех значений х. Тогда последовательность \fn(x)}9 где

имеет предельную функцию f(x)y определяемую равенствами

Такой же результат получился бы, если бы мы взяли

Пример 10. Пусть F (х) какая угодно функция (— оо <х < оо). Тогда последовательность {/„(*)}, где

имеет предельную функцию /(л:), равную 1 в тех точках, где F(x) = 0, и равную 0 во всех остальных точках. Положив подобным же образом

arctgл/Ч*),

мы получим предельную функцию /(x) = sgn F (х), равную —1, О или —J— 1, смотря по тому, будет ли F(x) отрицательным, равным нулю или положительным числом.

Пример 11. Функция

от предельной функции примера 4 отличается лишь тем, что график сжат в 10^ раз по направлению оси Ох. Она имеет значение 1, если х выражается десятичной дробью «ранга р» (см. § 36); во всех остальных точках она равна нулю.

Рассмотрим теперь функцию

— предел последовательности

Л(4 /(*). Л(*),...

Эта последовательность состоит из одних нулей, если х не представляется в виде конечной десятичной дроби, и из одних единиц, — если х есть десятичная дробь ранга 1; если же, вообще говоря, х представляется в виде конечной дроби ранга £(>1) (но не низшего), то первые k—1 членов последовательности — нули, все же остальные, начиная с £-го, — единицы. Таким образом, функция f(x), т. е. предел последовательности {fn(x)} равна единице, если х представляется в виде конечной десятичной дроби, и равна нулю, если x таким образом не представляется.

Нарисовать график функции y=f(x), конечно, невозможно, но всё же его можно «мыслить», как множество точек, «всюду плотно» расположенных на каждой из прямых у = 0 и у= \ (в плоскости Оху).

Следует обратить внимание на то, что при определении функции f(x) в этом примере операция перехода к пределу выполнялась дважды:

(13)

§ 46. Общее понятие функции одной действительной

переменной

Как можно было догадываться заранее, мы заключаем, основываясь на рассмотрении предыдущих примеров, что допущение операции перехода к пределу на равных правах с прочими «элементарными» операциями открывает неограниченные возможности для расширения классов рассматриваемых функций. Так возникают функции, имеющие разрывы разнообразных типов1)

1) В частности, такие, что все три числа il =f(c — 0), f{c) и L" =f{c + 0) оказываются различными между собой (см. § 41).

(см. примеры 2—6, §45); функции, «склеенные» из нескольких данных функций (примеры 7 и 9, там же); функции, определяемые одним или другим способом в зависимости от того, какому «множеству» принадлежит значение независимой переменной (примеры 10—11, там же). Как мы видим, ограничивать себя рассмотрением лишь класса «элементарных» функций становится искусственным, плохо оправданным, запретом. К тому же легко придти к мысли, что проще и удобнее определять функцию непосредственно системой равенств вроде (7), (8) или (9), чем посредством предельных переходов, подобных указанным выше. Естественно сделать ещё один решительный шаг вперёд и сказать, что существенным в самой идее функции является то, какие значения она принимает при различных значениях переменной, а не то, какие операции нужны для вычисления её значений.

Высказанные соображения достаточны для того, чтобы не только декларировать, но и внутренне оправдать то определение понятия функции действительной переменной, которое единственно принято в настоящее время в науке.

Говорят, что на некотором числовом множестве Е задана функция

У=/(х),

если с каждым значением «независимой» переменной х из множества Е каким бы то ни было способом сопоставлено некоторое, только одно, значение «зависимой» переменной у.

Другими словами: указано правило, на основании которого каждому значению х из Е единственным образом приводится в соответствие некоторое значение у.

Это определение необычайно расширяет понятие функции, так как характер указываемого «правила» ничем не ограничивается: в частности, роль «правила» может играть формула, содержащая элементарные операции, но это не обязательно.

Вместе с тем новое определение несколько сужает понятие функции: раз каждому значению х соответствует только одно значение у =/(лг), значит, тем самым устраняются из рассмотрения «многозначные функции», и остаются лишь «однозначные».

Введение понятия однозначной функции имеет для изложения теории функций действительного переменного первостепенное методическое значение: ограничиваясь лишь рассмотрением однозначных функций (или «расщепляя» многозначные функции на ряд однозначных), мы упрощаем формулировки многих утверждений.

Мы уже упоминали об определении функции как соответствия в § 1,— правда, лишь в предположении, что функция «задана» в некотором промежутке, а не в «произвольном множестве» точек.

Приведём ещё несколько примеров функций, задаваемых «независимо от формулы».

Пример 1. Функция, называемая «целая часть л:» и обозначаемая

(14)

определяется для любого значения, как наибольшее целое число, не превышающее данного значения х. Например,

График изображён на рис. 85. Если п — целое число, то /(л-0) = л-1, f(n)=f(n + 0) = n.

Пример 2. Определим функцию f(x) в промежутке 0^х^ 1 — сначала для множества Е дробных значений х со знаменателем вида 2я — следующим образом. Пусть

затем

и т. д. Вообще пусть при m нечётном

(определение f(x) в точках х = а промежутка 0 ^ х ^ 1, не принадлежащих Е, может быть дано, далее, «по непрерывности» — см. §51).

На рис. 86, а построены все точки графика, соответствующие значениям x из Е, для которых п ^ 4.

Рис. 85.

Рис. 86.

Пример 3. Приведём аналогичный пример для того же промежутка: пусть

/(0) = 0, /(1)=1;

затем, если вообще

то полагаем

^допускаем,что

несократимые дроби.

Таким образом,

и т. д. (рис. 86, б) (здесь также возможно «продолжение на весь промежуток o^jc^i по непрерывности»).

Пример 4. Функция f (х) определена в промежутке — 1 ^ х ^ + 1 следующими условиями:

1)/(0) = 0;

2) f(x) = x, если x имеет вид (п — целое) и f(x) = 2x, если х имеет вид

3) функция f(x) в каждом из промежутков линейная;

4) функция / (лг) — чётная.

Читатель построит график функции f (х) и убедится, что эта функция имеет минимум в точке х = 0, хотя и нельзя указать такое число е (> 0), чтобы в промежутке — е < х < 0 функция убывала, а в промежутке 0<;с<е она возрастала1).

Пример 5. Функции /х (х) и /2 (лг) при х ф 0 определены равенствами

и дополнительными условиями

л(0) = 0, л(0) = 1.

И та и другая непрерывны при всех значениях х (см. § 41, пример 7 и § 43).

Пример 6. На стр. 15 мы рассматривали уравнение

лга+у»=1

и установили, что в промежутке — 1^лг=^-|-1 имеются две функции у =/ (лг), ему тождественно удовлетворяющие, именно,

1) Другие примеры, обладающие тем же свойством:

при дополнительном условии /(0) = 0.

Вернёмся ещё раз к этому вопросу и постараемся выяснить: сколько существует в названном промежутке функций, удовлетворяющих нашему уравнению? только ли две?

С новой точки зрения, установленной в настоящем параграфе, следует признать, что таких функций — бесконечное множество. Вот ещё одна функция, удовлетворяющая выставленному требованию:

Эта функция — не элементарная; притом она имеет разрыв в точке х = 0.

Представим себе, что все точки промежутка [—1, разбиты на два каких-либо множества А и В, и пусть функция / (х) определяется условиями:

Такая функция тоже удовлетворяет нашему уравнению. Но непрерывных функций интересующего нас класса — только две: fx (х) и /а (х).

Изложенный ход мыслей находится в соответствии с историческим процессом. В историческом плане предельный переход вошёл в математический обиход не в общем (явном) виде, а в форме суммирования рядов функций. Работы Фурье (в первой четверти прошлого столетия) создали предпосылки для расширения понятия функции: в них был указан приём представления в аналитической форме (в виде формул, содержащих предельный переход) таких функций, которые раньше считались аналитически непредставимыми и потому не подлежащими математическому исследованию. После этого введение нового определения, ныне общепринятого, стало неизбежным: оно было впервые сформулировано Лобачевским (см. стр. 12) и Леженом-Дирихле и использовано Риманом.

Числовое множество Е — совокупность тех значений х, которым по определению ставятся в соответствие числовые значения у, обыкновенно называют множеством определения функции. Чаще всего в качестве множества определения функции приходится встречаться с промежутками: следует различать промежутки замкнутые, вида а^х^.Ь (сегменты), и промежутки открытые, вида а<х<Ь (интервалы). В замкнутом промежутке a^x^b имеется наибольшее число Ъ и наименьшее а; в открытом — нет ни того, ни другого. Иногда случается иметь дело с промежутками, которые замкнуты с одного конца и открыты с другого (например, промежуток — 1 <х^ 1).

Бесконечные промежутки с той стороны, на которой стоит знак бесконечности, считаются открытыми.

В настоящее время становятся общеупотребительными обозначения, которыми мы отчасти уже пользовались: [а, Ь]— для замкнутого промежутка а^х^Ь, (а, Ь)— для открытого промежутка а<х<Ь, [а, Ь) — для полузамкнутого промежутка а^х<Ь и т. п.

Примечание. Читатель, вероятно, обратил внимание на аналогию между определением числовой последовательности в § 35 и определением функции в настоящем параграфе. Однако здесь — не только аналогия, но и обобщение: задать последовательность чисел { ап } значит с каждым целым положительным числом п сопоставить некоторое число ап\ таким образом, последовательность, с точки зрения настоящего определения, можно рассматривать как функцию, заданную на множестве всех целых положительных чисел.

Как видно из приведённых примеров, «множества определения» функций могут быть весьма разнообразных типов; всё же в дальнейшем нам придётся иметь дело преимущественно с промежутками — замкнутыми или незамкнутыми.

§ 47. Свойства непрерывных функций

Чтобы отдать себе отчёт в степени общности понятия функции как «соответствия», постараемся представить себе, какова геометрическая сторона дела. С каждым значением х (хотя бы из некоторого промежутка) сопоставляется некоторое значение у: геометрически это означает, что на каждой вертикальной прямой отмечается согласно заданному правилу одна какая-то точка. (На самом деле нельзя, конечно, отметить всех точек, которые таким образом могут быть получены; но можно «представить себе», что это сделано.) Из наличия упомянутого правила логически не вытекает, что все отмеченные точки в своей совокупности образуют «плавную кривую» (см. хотя бы пример 11 в § 45); график будет плавной, или непрерывной кривой только в случае, если функция y=f(x) обладает свойством непрерывности1) (в рассматриваемом промежутке). Хотя в математике изучение функций, имеющих «разрывы», оказывается полезным не только в теоретическом отношении, но и с точки зрения многих приложений, тем не менее непрерывные функции (и их графики — непрерывные кривые) представляют особенно важный класс функций, обладающих замечательными свойствами. С некоторыми из этих свойств мы познакомимся теперь же; наиболее же существенное из них будет установлено в §§ 49—50.

Теорема I. Если функция, непрерывная в некотором промежутке, в двух точках этого промежутка принимает значения разных знаков, то в какой-то точке (хотя бы одной) между двумя упомянутыми она принимает значение нуль.

Эта теорема лежит в основе приближённого метода решения уравнений, посредством «проб», и доказательство следует за этим методом.

Доказательство. Пусть /(л:) непрерывна в промежутке /; aw b (a<b) — точки этого промежутка, причём /(а)<0,/(о)>0.

1) См. § 42. Понятие непрерывности, очевидно, не связано с тем, задана ли функция «аналитически» или «посредством правила».

Среди всех десятичных дробей «ранга 1» (см. § 36), заключённых в промежутке а^х^Ь, можно выбрать (не обязательно—единственным способом) две рядом стоящие х\ и х" (x[<x")f удовлетворяющие условиям f(x[)<Of /ОО^О1). Затем среди всех дробей «ранга 2», заключённых в промежутке х[ ^х^ x"v выберем две рядом стоящие х\ и х[ (х\ <х"), удовлетворяющие условиям /(*з)<С°>/(•*£) >° *и т. д. Последовательности {х?п\ и {х"п\ — монотонные и ограниченные; значит (§ 44), каждая из них имеет предел. Этот предел — один и тот же для обеих последовательностей, так как

xl — xn=iar*-»0.

Обозначим его через £. По свойству непрерывности (§ 42) из соотношений

х'п-*Ь и

следуют соотношения

a*;w(S) и /«)—/а).

Так как /(^)<0 при любом п, то /(S)=s£0 (§ 38, стр. 172); точно так же из f(x'â)>0 следует /(£)^0. Итак,

/(0 = 0.

Следствие (обобщение). Функция, непрерывная в некотором промежутке, не может «перейти» от одного значения к другому, не приняв любого промежуточного значения.

Другими словами, если f(a) = A, f(b) = B, причём a<b и АфВ, то, каково бы ни было число X, заключённое между А и В, существует (по крайней мере одно) такое значение х = \, что 1) а<е<&, 2) f{ï) = X.

Для доказательства достаточно применить доказанную теорему 1 к новой, также непрерывной, функции

/,(*)=/(*)-*.

Это свойство непрерывной функции, казалось бы, выразительнее характеризует «плавность» графика, чем само определение непрерывности. Однако оно не равносильно свойству, обычно принимаемому в качестве определения непрерывности; например, функция, заданная равенствами

1) Если бы нашлась такая дробь хи что /(лг1) = 0, то теорема была бы уже доказана: поэтому мы предполагаем, что таких дробей нет.

обладает рассматриваемым свойством и, однако, имеет точку разрыва х=0 (см. § 41, пример 4).

Доказанный выше результат принадлежит чешскому математику Больцано (1817 г.).

Опираясь на теорему Больцано, можно доказать существование единственного положительного действительного числа (бесконечной десятичной дроби), квадрат которого равен 2. Функция f (х)—х2 непрерывна (§ 43) и возрастает в промежутке 0<лг^2 от 0 до 4; значит, она в некоторой точке принимает значение 2:

/©=^ = 2.

Такое число £ — только одно; если бы существовало два таких числа р и !" (S'^é"), то одно из них было бы меньше другого, например, f <Ç", и отсюда следовало бы £'2<ê"2, а это противоречило бы равенствам \'* = 2 и £"2 = 2. Итак, существует одно и только одно положительное число S такое, что £2 = 2: оно обозначается через У~2 (арифметический корень).

Точно так же доказывается существование других «не извлекающихся нацело» радикалов, затем логарифмов (исходя из непрерывности показательной функции на всей оси), обратных круговых функций, корней уравнений вроде хь -f- х — а = 0 (a 0) и т. п. Таким же точно образом устанавливается, вообще говоря, существование (в смысле «соответствия») обратной функции x = g(y) по отношению к любой непрерывной и монотонной функции у =/(лг) (см. ниже § 52).

Теорема II. Функция, непрерывная во всех точках замкнутого промежутка, ограничена в этом промежутке.

Доказательство. Пусть f (х) непрерывна в промежутке а^х^Ь. Требуется установить, например, что существует такое число М, что при всех значениях х из этого промежутка

Допустим, что такого числа нет; тогда, каково бы ни было М, можно указать такое значение х = Хм в промежутке, что

/(*)>м.

Возьмём последовательность таких чисел {Мп }, что Мп->оо, и к каждому числу Мп подберём такое число хп из промежутка, что

f(xn)>Mn.

Тогда

/(*„)-* оо. (15)

Из ограниченной последовательности {хп} выделим сходящуюся последовательность {хРп } (см. § 38, стр. 167):

1) В самом деле, из ^ b следует а ^ Ç ^ b (§ 38).

По свойству непрерывности функции f(x) из последнего соотношения вытекает, что последовательность \f(xPn)} стремится к конечному пределу:

/(*„„)

С другой стороны, из соотношения (15) следует, что

/(*,„)-*«>•

Получается противоречие. Значит, число Ж, обладающее требуемым свойством, существует.

Заметим, чго теорема неверна, если отбросить требование замкнутости промежутка. Это демонстрируется примером функции

рассматриваемой в открытом (слева) промежутке 0<л;=^1: во всех точках этого незамкнутого промежутка функция непрерывна и, однако, как легко понять, не ограничена сверху.

Теорема III (Вейерштрасса). Среди значений, принимаемых функцией, непрерывной в замкнутом промежутке, можно указать наибольшее и наименьшее1).

Другими словами: если функция f(x) непрерывна в промежутке а^х^Ьу то можно указать такое число ^ (не обязательно единственное), что 1) а^^^Ь и 2) для всех значений х из промежутка справедливо неравенство /C*0^/Oi); и можно указать такое число 52 (тоже не обязательно единственное), что 1) a^l^^b и 2) для всех значений х из промежутка / (*) (£2)-

Доказательство. Установим, например, как найти число lv

По теореме II функция ограничена в рассматриваемом промежутке:

т<:/(х)<М.

Среди десятичных дробей «ранга 1», очевидно, можно указать две такие, рядом стоящие у[ и у" (у[ <У[), что неравенство

f(.x)<y'l

выполняется для всех значений х из промежутка, а неравенство

/(*)<Х

— не для всех. Значит, можно указать такое значение х = хх в промежутке, что

1) Наибольшее из значений функции в промежутке определяется, как такое значение, которое не меньше всех прочих; наименьшее — как такое, которое не больше всех прочих. Здесь имеется аналогия с символами max { аи ..., ап } и min { в1> ..., ап } (см. § 35).

Таким же образом среди десятичных дробей ранга 2 можно найти две такие, рядом стоящие у'г и У3Г СУз<О0» что неравенство

f(x)</l

выполняется для всех х из промежутка, а неравенство

/(*)<Х.

— не для всех. Значит, существует такое лг2 в промежутке, что

л *£/(**)</;

и т. д.

Очевидно, последовательности {у'п } и {у„ } — монотонные и ограниченные; следовательно, каждая из них имеет предел. Этот предел — один и тот же для обеих последовательностей, так как

Уп—Уп=10-п-+0. (16)

Обозначим его через tq, так что

Уп^Ч (17)

У'п ~*~ 1' (18)

По нашему построению, каково бы ни было х из промежутка, и при любом целом положительном п, мы имеем

/(*)</«. Переход к пределу при я->-оо даёт

/(*)*£*).

Нам остаётся доказать, что существует такое число ^ = 5 в промежутке, что

По построению при любом /г целом положительном существует такое хп в промежутке, что

или, принимая во внимание равенство (16),

</*'*£/(*«)+иг».

Из ограниченной последовательности {хп} «выделим» сходящуюся последовательность {хРп}:

Очевидно, имеет место неравенство

Перейдём в нём к пределу (при /г->оо). Принимая во внимание, что по свойству непрерывности функции f(x) в точке х = Ь

/(*р„) -►/(*)

и притом вследствие (18) мы получим:

/(*) *£ч</(5),

откуда следует:

/©=4.

что и требовалось доказать.

Заметим, что теорема о наибольшем значении неверна, если отбросить требование замкнутости промежутка. Примером может служить та же функция f(x) = ~ в промежутке 0<х^1, или, ещё проще, функция f(x)=x в промежутке 0^л:<[1.

Она неверна также, если отбросить требование непрерывности функции f(x). Примером может служить функция, определённая равенствами

Эта функция, имеющая разрыв в точке х=1, не имеет наибольшего значения в замкнутом промежутке, в котором она определена.

Теорема IV (о «равномерной» непрерывности). Если функция f(x) непрерывна в замкнутом промежутке I, то при всяком ê(>0) можно указать такое число 8 = 8е(>0), что, каковы бы ни были числа х' и х" из I, неравенство

— х"\<* (19)

влечёт за собой неравенство

|/(л0-/(*"; |<е. (20)

Предоставляем читателю обдумать геометрический смысл этой теоремы.

Доказательство. Пусть теорема неверна: пусть не со всяким положительным числом е можно сопоставить число 8, обладающее указанным свойством. В таком случае существует некоторое положительное число е*, обладающее тем свойством, что, как бы мало ни было 8 ( > 0), можно указать такие числа хТ и х" из /, что неравенство

*"1<8

выполняется, а неравенство

— не выполняется, и следовательно, имеет место противоположное неравенство

!/(*•)—/со 1>Л

Возьмём тогда последовательность положительных чисел { 8П }, обладающую свойством

8„-0,

и к каждому п подберём в промежутке / пару чисел х'п и х"п, удовлетворяющих неравенствам

\х'п—<\<К (21)

I/GO—/(*Э|>Л (22)

Из ограниченной последовательности {хп} выделим сходящуюся последовательность \хр }:

х'Рп-+%, (23)

причём £, разумеется, принадлежит /. Из соотношений (21) и (23) следует, что также

х"Рп^1 (24)

По свойству непрерывности соотношения (23) и (24) влекут за собой соотношения

Вследствие (22) имеет место неравенство

|/с*;я)-/(*;п)|^«*;

переходя в нём к пределу при я->оо, получаем противоречие, так как левая часть стремится к нулю, тогда как правая есть постоянное положительное число.

Примечание 1. Существенное различие понятий «равномерной» непрерывности от «обыкновенной» заключается в том, что в случае «обыкновенной непрерывности в точке x = xQ> число о в неравенстве \х — дг0|<о зависит не только от числа е в неравенстве | / (х) — f (х0) | < е, но также ещё и от значения х0:

о = о(е, х0);

в случае же «равномерной непрерывности в данном промежутке» число о в неравенстве (19) зависит только от числа s в неравенстве (20) и, конечно, ещё от самого промежутка.

Примечание 2. Из равномерной непрерывности функции в каком угодно (замкнутом или незамкнутом) промежутке /, очевидно, вытекает её непрерывность (в обычном смысле) в любой точке х0 промежутка /.

Действительно, если неравенство (20) справедливо при каких угодно х' и х", удовлетворяющих соотношению (19), то, в частности, можно положить х" = х0 и заменить х' через х; тогда получится, что из неравенства

I x — х01 < о

следует неравенство

|/(лг)-/(лг0)|<е,

как полагается по обычному определению.

Примечание 3. Теорема IV неверна в случае незамкнутого промежутка. Об этом свидетельствует всё тот же пример: / (лг) = -^-(0 ^1).

Полагая здесь е=1, х' = Ъ, х" =~^~, мы получаем при о< 1 и, однако,

Таким образом, в случае замкнутого промежутка свойства обыкновенной непрерывности в промежутке и равномерной непрерывности в промежутке строго эквивалентны; в случае незамкнутого промежутка это не так.

§ 48. Равномерная сходимость последовательности непрерывных функций

В § 45 понятие предела последовательности функции было сведено к понятию последовательности чисел: требовалась сходимость последовательности {fn (х)} в отдельности для каждого значения x из рассматриваемого промежутка /.

Можно подойти к тому же вопросу иначе, рассматривая функцию в промежутке / как целое. Ниже будет изложен один из таких возможных подходов. При этом мы условимся, что на первых порах будем иметь дело лишь с непрерывными функциями, рассматриваемыми в одном и том же замкнутом промежутке1).

Рассмотрим две какие-нибудь непрерывные функции f(x) и g(x) в замкнутом (и следовательно, конечном) промежутке I(a^x^b). Мы укажем способ измерять «отклонение» одной функции от другой, или одного графика от другого, посредством некоторой числовой характеристики. Когда идёт речь об «отклонении» одного числа а от другого by то под таковым мы понимаем (см. § 36) абсолютную величину их разности \а — Ь\. В качестве же «меры отклонения» (или просто «отклонения») функции f(x) от функции ^(л:) в про-

1) Такое ограничение лишь отчасти связано с существом дела; главным же образом оно оправдывается нашим намерением сосредоточить внимание на простом и особенно важном случае.

межутке / мы примем максимум (наибольшее значение) абсолютной величины их разности в этом промежутке:

(25)

Геометрически, как легко понять, отклонение р (/, g) представляет собой наибольшую из длин вертикальных отрезков, соединяющих точки графиков / и g с одинаковыми абсциссами (рис. 87). Так как функции f(x) и g(x) непрерывны, то непрерывна также их разность /(л:) — g(x), а также и её абсолютная величина \f(x)— gipc)]1); следовательно (по теореме III предыдущего параграфа), среди упомянутых отрезков есть наибольший.

Итак, отклонение р (/, g) обладает следующим свойством: каково бы ни было значение x из промежутка /, справедливо соотношение

!/(*)-£(*) К р(/. g), (26)

причём равенство имеет место хотя бы для одного из этих значений.

Отклонение р(/, g) всегда неотрицательно:

р(/> g)^0 (27)

и равно нулю в том и только в том случае, если f(x)=g(x) в промежутке / (графики совпадают).

Обратимся теперь к определению равномерной сходимости последовательности функции.

Говорят, что последовательность функций

л(4 ..../.(4-м

непрерывных в одном и том же замкнутом промежутке I, в этом промежутке сходится (стремится) равномерно к непрерывной же функции f(x), если предел числовой последовательности

равен нулю:

(28)

Рис. 87.

1) Мы предоставляем читателю в данной связи доказать теорему: Если непрерывна в точке х = с функция F(x), то непрерывна также и её абсолютная величина | F (х) |.

Для обозначения равномерной сходимости мы будем иногда пользоваться записью: ^ Q

Теорема. Из равномерной сходимости [fn /) следует сходимость в обычном (см. §45) смысле (/n-v/).

В самом деле, соотношение (29), равносильное (28), означает, что, как бы мало ни было s(>0)y при достаточно больших значениях п справедливо неравенство

р(/„. /)<«• (3°)

Пусть X—какое-нибудь число из промежутка /. По свойству (26)

1Л(*)-/(*)1*£р(/л.Л; (31)

значит,

|/„ (*)-/(*)!<«•

Итак, при любом х из /

/»(■*)-/(*)•

(Доказательство можно резюмировать следующим образом: раз наибольший из «отрезков» \fn(x)—f(x)\ стремится к нулю при /г_>со, то и каждый из них в отдельности также стремится к нулю.)

Приведём примеры, показывающие, что, обратно, из обыкновенной сходимости не следует равномерная сходимость.

Пример 1.

(32)

Значения х здесь произвольны; ограничимся хотя бы промежутком

o^jc^ 1.

Мы получаем: 1) при лг = 0

2) при x^ézO

Таким образом, при всех значениях х

/л (*)-<>,

так что предельная функция /(лг) тождественно равна нулю. И тем не менее равномерной сходимости нет, так как

1) Непосредственно из формулы видно, что /л (л:) принимает наибольшее значение при x = —j=.

Полезно отдать себе отчёт в геометрическом смысле этого примера: график функции fn (дг) тот же, что и в примере 3, § 45 (см. рис. 80), но сдвинут вправо на расстояние *.

В следующем примере функции последовательности не принадлежат к числу элементарных, но геометрическая сторона дела более проста.

Пример 2. В промежутке 0^лг^1 непрерывные функции fn(x) заданы условиями:

(33)

(на рис. 88 изображён график /10). Мы получаем:

1) при лг = 0

Л(0) = о-о,

2) при 0<лг^ 1:

fn (х) = 0, если только п ^ — ; значит, и в этом случае

Итак, в нашем промежутке /я(х)-/(х)=0. Тем не менее,

р (/„, f) = max/„ (x) =fn (~) = L

Поэтому сходимость — не равномерная.

Геометрический смысл равномерной сходимости чрезвычайно прост. Соотношение (29) означает, что, как бы мало ни было е, при достаточно больших значениях п имеет место неравенство

Р(/я. f)<*

это же неравенство по отмеченному выше свойству отклонения равносильно одновременному выполнению бесконечного множества неравенств

!/»(•*)-/(*) К « (34)

(где x может принимать любое значение из промежутка /). Придавая соотношению (34) вид

/(*)-е</я (*)</(*) +в,

мы можем следующим образом истолковать равномерную сходимость

Рис. 88.

Вообразим графики функций f(x)— s и f(x) -f-е, получающиеся из графика f(x) посредством перенесения графика вверх и вниз на отрезок е. Тогда при достаточно больших значениях п(п>пе) график функции fn(x) весь заключён в «полосе» между этими двумя графиками (рис. 89).

Если бы мы условились эту полосу называть «е-окрестностью» графика f(x), то можно было бы сказать иначе, что графики «почти всех» функций fn (х) попадают целиком в эту«е-окрестность», т. е. лишь конечное число их не попадает в неё (см. определение предела числовой последовательности, приведённое на стр. 164).

Выше равномерная сходимость fn(x)^£f(x) была определена в предположении, что все функции последовательности {/я }, а также и предельная функция f(x) в рассматриваемом промежутке / непрерывны. В таком ограничении нет логической необходимости. В самом деле, из приведённого определения равномерной сходимости вытекает: как бы мало ни было е(>0), существует такое п (зависящее только от е, но не от х), что при всяком значении х из промежутка I справедливо неравенство (34). Эту словесную формулу обыкновенно и принимают в качестве определения равномерной сходимости, не требуя в самом определении непрерывности функций

fn(x) и /С*)-

При таком понимании равномерной сходимости сформулируем теорему:

Если последовательность функций {fn (х)}, заданных и непрерывных в промежутке I, сходится в нём равномерно к некоторой функции f(x), то эта функция также непрерывна в I.

Доказательство. Пусть с — какое угодно значение переменной из промежутка /, е — заданное сколь угодно малое положительное число. Из тождества

следует неравенство

(35)

Рис. 89.

Выберем в нём: 1) п настолько большим, чтобы при каких угодно x из / (и, в частности, при х = с) имело место неравенство

!/(*)—/.(*) к-}.

и затем 2) 8(>0) настолько малым, чтобы при выбранном значении п и при условии \х — с|<8 осуществлялось неравенство

I/. (*)-/« <«)!<£;

тогда каждое из трёх слагаемых в правой части неравенства (35) будет меньше чем -g- и, следовательно, при условии \х—с|<Г8 мы будем иметь

|/(*)-/(<)|<«-Отсюда видно (см. § 42, стр. 189), что

Нт/(*)=/(с),

т. е. что функция f(x) непрерывна в точке с промежутка /, а следовательно, и во всём промежутке /.

§ 49. Теорема Вейерштрасса-Бернштейна о приближении непрерывной функции с помощью рациональных многочленов

Основная задача, которой посвящены главы I—II настоящей статьи и к разрешению которой в одинаковой степени привлекается внимание школьника, студента и преподавателя, заключается в следующем: дано уравнение, выражающее одну переменную величину у через другую х\ требуется построить соответствующий график. В этой задаче не г никаких принципиальных трудностей, дело осложнено лишь разнообразием возможных случаев и необходимостью выработать надлежащие технические приёмы.

Но и практика и исследователя часто интересует обратная задача, представляющая трудности принципиального порядка. Вкратце её можно сформулировать так: дан график, требуется построить соответствующее уравнение. Наблюдатель или экспериментатор, регистрирующий ход некоторого процесса, в котором каждое «состояние» характеризуется значениями двух функционально-связанных величин (переменных, или параметров), получает на координатной («изобразительной») плоскости запись процесса в виде некоторой эмпирической — или (как говорили ещё во время Эйлера) «произвольной»— кривой; чтобы приступить к математическому исследова-

нию изучаемого явления, нужно — точно или хотя бы в каком-то смысле приближённо — написать уравнение этой кривой. Как подобрать такое уравнение?

Постановка вопроса требует уточнения, и это можно сделать различными способами.

Допустим, что заданная кривая в пределах рассматриваемого промежутка I(a^x^.b) имеет одну общую точку со всякой вертикальной прямой, что позволяет рассматривать ординату у каждой точки кривой, как функцию абсциссы х

(функция здесь понимается, конечно, как «соответствие»); предположим дальше, что функция f(x) непрерывна в точном математическом смысле1) (см. § 42).

Иногда выбирают на данной кривой конечное число точек

Mt(Xi> Уд (г = 1, 2, ... , tri)

и затем так подбирают элементарную непрерывную функцию, чаще всего — рациональный многочлен Я(лг), чтобы график в точности проходил через выбранные точки (не заботясь при этом о точном совпадении графиков в промежуточных точках). Задача нахождения этого рода функции носит название интерполяционной.

Другая постановка вопроса — и именно она нас в данном случае интересует — заключается в том, чтобы отклонение подбираемой элементарной функции (могочлена Р(х)) от данной функции во всех точках промежутка было меньше заранее назначенного числа е. Иными словами, требуют, чтобы во всём промежутке выполнялось неравенство

I/>(*)-/(*) к в,

или (ещё иначе), в обозначениях § 48,

?(Р, /)<*.

Такая задача носит название аппроксимационной (задача приближения функции).

Естественно интересоваться, можно ли подобрать многочлен Я (л:) к заданной функции f(x) и заданному наперёд сколь угодно малому числу s.

Утвердительный ответ даётся теоремой Вейерштрасса (1885 г.), которая является обратной по отношению к теореме, приведённой в конце § 48. Вот её точная формулировка:

1) В последнем требовании есть элементы идеализации: по отношению к эмпирическим кривым можно лишь условно говорить о его выполнении. Но оно выполняется в точном смысле, например, в случае «склеенных» непрерывных графиков: см. хотя бы § 45, примеры 7 или 9. при условии, что функции и (х) и v (х) — непрерывные, и притом и (0) = v (0).

Какова бы ни была функция f(x), непрерывная в замкнутом1) промежутке I(a^x^b), можно указать такую последовательность многочленов { Рп (лг)}, которая в промежутке I равномерно сходится к f(x).

Итак, проблема представления данного «графика» посредством «уравнения» имеет точное решение

и приближённое решение

причём возможная погрешность \Рп(х)—f(x)\ не превышает числа р (Рп9 /) = max ) Рп (л:)—f(x)\, не зависящего от х и стремящегося к нулю при /г->оо.

Остриё всякого пишущего инструмента (карандаша, пера, куска мела) — не точка, и «реальный» график — след, остающийся на бумаге, при движении пишущего инструмента»—не «идеальная математическая кривая», а «полоса», имеющая некоторую «ширину». Поэтому, несколько упрощая, можно сформулировать теорему Вейерштрасса и таким образом:

Как бы «извилист» ни был данный «реальный» график, проведённый «одним движением» пишущего инструмента (см. рис. 89), всегда можно найти рациональный многочлен, график которого «совпадает» с данным графиком.

Возвращаясь к точной формулировке, нужно заметить, что последовательность многочленов {Рп (x)\ определяется не однозначно. Различные доказательства теоремы, предложенные различными авторами, приводят к тому или иному приёму построения приближающей последовательности.

Первоначально данные доказательства не были общедоступными. Мы приведём ниже, в свободном изложении, доказательство советского учёного, академика С. Н. Бернштейна, предложенное им в 1912 году. Будучи вполне элементарным, оно потребует, впрочем, некоторой предварительной подготовки.

Предположим, для простоты, что речь идёт о промежутке

О^лг^с 1.

Многочлены Бернштейна последовательно возрастающих степеней обозначаются через Вп (лг). Они имеют вид:

(36)

где через С™ обозначены биномиальные коэффициенты

с условием полагать 0!=1.

1) Существенное предположение.

Теорема Бернштейна. Пусть f(x) — функция, непрерывная в замкнутом промежутке 0^л:^1. Тогда последовательность многочленов { Вп(х) \ в этом промежутке равномерно стремится к f(x):

Я. (*)=*/(*)• (37)

Лемма. Если р -\- q = 1, то сумма

равна npq.

Доказательство. Вычислим предварительно суммы

Что касается первой из них, то она представляет собой не что иное, как разложение по формуле бинома

и потому

S{$ = \ (л = 0, 1, 2, ...). Чтобы вычислить сумму .S'f, заметим предварительно, что

отсюда следует при п^1:

Чтобы вычислить сумму заметим, что

и потому (при п ^2)

Итак, мы получаем:

Si»)=l, &»> = пр, SW=n(n—\)p* (11 = 0, 1, 2, ...)').

Переходя к вычислению суммы SM, обратим внимание на тождество

(т — npf = п?р2 — (2пр — 1) m -f- m (m — 1);

из него вытекает (при я^О) с помощью уже полученных формул:

1) Справедливость этих формул для сумм Sf\ Sf^ и проверяется непосредственно.

§ 50. Доказательство теоремы

Условимся в сокращённом обозначении:

в таком случае

(38)

Полагая в формуле

р равным x, q равным 1—х (так что p-\-q=l)t мы получаем тождество (относительно х):

(39)

откуда следует, что

(40)

Вычитая (40) из (38), мы будем иметь:

так что (по свойствам абсолютной величины)

(41)

Нам нужно убедиться, что сумма в правой части при достаточно больших п становится меньше любого наперёд заданного числа е(>0). Для этого придётся воспользоваться свойством непрерывности функции fix).

Так как функция f{x) предполагается непрерывной в замкнутом промежутке O^je^l, то она в этом промежутке 1) ограничена (см. § 47, теорема II) и 2) равномерно непрерывна (см. § 47, теорема IV). Это значит:

1° можно указать такое число М, что

(42)

1) Очевидно,

2° к заданному числу s можно подобрать такое число 8(>0), что, каковы бы ни были числа х' их" из промежутка 0^лг^1, из неравенства

непременно следует неравенство

(43)

Перейдём теперь к «оценке» суммы, стоящей в правой части (41). Эту сумму разобьём на две суммы, и именно таким образом. При суммировании индекс m пробегает все значения от 0 до п:

m = 0, 1, 2, ... , п\ из этих значений одни удовлетворяют неравенству

(44)

другие — не удовлетворяют. Разобьём сумму на две суммы: к первой отнесём те члены, для которых неравенство (44) выполняется, ко второй — те, для которых это неравенство не выполняется, и получающиеся таким образом частные суммы снабдим значками 1 и II1). Итак,

(45)

Рассмотрим теперь каждую из двух сумм в отдельности.

В первой сумме значок m принимает лишь такие значения, которые удовлетворяют неравенству (44) и потому согласно пункту 2° для всех членов этой суммы справедливо неравенство

Итак, мы получаем:

(46)

1) Нам нисколько не мешает то обстоятельство, что разбивка членов суммы на две суммы зависит от числового значения лг.

Обратимся на минуту к сумме ^ (лг): её можно было бы разбить на две, точно так же, как и предыдущую, принимая во внимание, что среди выражений иЩ (х) нет отрицательных и что сумма слева согласно (39) равна единице, мы заключаем, что

(47)

Возвращаясь к неравенству (46), мы теперь можем утверждать, что

(48)

Перейдём теперь к рассмотрению второй суммы в правой части (45):

Так как по свойствам абсолютной величины и с помощью (42)

то

(49)

Согласно нашему условию во всех членах суммы, отмеченной значком II, неравенство (44) не выполняется, и следовательно, выполняется противоположное неравенство

которому можно придать также вид

или

или, наконец,

Умножим обе части последнего неравенства на неотрицательную величину и{т(х) и просуммируем (разумеется, со значком II):

Обращаясь к сумме

мы можем её разбить по

тому же правилу, что и прежние суммы:

откуда сейчас же следует неравенство

(51)

Сопоставляя неравенства (50) и (51), мы получаем дальше:

(52)

Сумму, стоящую справа, нам очень легко вычислить: для этого достаточно в формуле леммы положить р=х, q=l—х; тогда оказывается, что

Поэтому неравенство (52) принимает вид

По поводу выражения лг(1—х) можно заметить (см. § 9), что

значит,

Сопоставляя с этим неравенством раньше полученное неравенство (49), можно написать:

(53)

Наконец, собирая вместе соотношения (41), (45) и (48), (53), мы заключаем:

Число s задано наперёд. Число 8 подобрано нами в зависимости от заданного е, принимая во внимание непрерывность функции f(x). Но ничего не сказано пока о степени п многочлена Вп(х). Мы допустим теперь, что степень п настолько велика, что удовлетворяет неравенству

т. е. допустим, что

(54)

В таком случае

Это неравенство имеет место при любом значении х из промежутка o^at^I. Придавая х значение, при котором непрерывная функция \Вп(х)—/0*01 в этом промежутке достигает максимума (см. теорему III, § 47), мы приходим к неравенству

Таким образом, ко всякому s можно подобрать такое пг (например, /ге = -р-1, что при п>пе имеет место неравенство

р (£„,/)<е.

Но это как раз означает, что

или, в промежутке o^at^I,

Bn(x)ztf(x).

Теорема доказана.

Пример 1. Полагая f(x) = ах, мы получаем:

Пример 2. Полагая /(дг) = sintcjc, мы получаем1):

1) Следует принять во внимание, что

(см. стр. 504). Все коэффициенты многочлена Вп (х), конечно,—действительные.

Примечание. Неравенство (54) позволяет судить о том, какую степень п достаточно выбрать, чтобы сделать отклонение р (Bn,f) меньшим, чем заданное число е.

Например, если /(Ar) = sin7ujc, то можно положить М=1, притом1)

так что достаточно положить

чтобы при \х' — х"\<Ъ иметь |/(лг') — f(x") | < е. В таком случае неравенство (54) принимает вид

Итак, если, например, s = 0,1, то достаточно взять многочлен Вп(х) степени большей, чем 3141, чтобы отклонение р(Вп, /) стало меньше 0,1.

Не следует особенно огорчаться этим результатом: взять столь высокую степень достаточно для того, чтобы отклонение стало меньше 0,1, но необходимости в том нет, и требуемое приближение на самом деле достигается при гораздо меньших значениях п.

Если бы мы поставили своей задачей не выяснение принципиальной стороны дела, а оценку фактической погрешности, то рассуждение пришлось бы строить иначе (оно было бы значительно сложнее).

§ 51. Определение показательной функции. Продолжение непрерывной функции за пределы всюду плотного множества

Вопрос, который мы здесь перед собой поставим, заключается в следующем: можно ли установить значение функции y=f(x) в некоторой точке x = с, если известны её значения в каких-то других точках, отличных от от точки с?

Ответ, конечно, должен быть категорически отрицательным, если функция f (х) не подчинена никаким дальнейшим условиям: это вытекает из самого определения функции как «произвольного соответствия» (см. § 46).

Иначе обстоит дело, если заранее наложить на функцию f(x) те или иные ограничения — выделить некоторый более узкий класс функций и рассматривать лишь функции, ему принадлежащие. Так, например, если говорить только об элементарных функциях (см. § 1), то можно было бы доказать, что, зная значения такой функции во всех точках некоторого промежутка сколь угодно малой длины, можно вычислить её значения в любой точке за пределами промежутка, лишь бы в этой точке функция не теряла смысла. Но вот другой пример: читатель согласится, как с фактом очевидным, что для определения линейной функции достаточно задать её значения всего лишь в двух точках; вообще для определения многочлена степени п достаточно указать его значения в п + 1 различных точках.

В дальнейшем нас интересует, в какой степени значения функции в некотором множестве точек определяют её значения в точках, не принадлежащих этому множеству, если заранее известно, что функция f (х) непрерывна.

1) См. стр. 192.

Легко понять, что из самого определения непрерывности вытекает следующее утверждение: если функция f(x), заданная в некоторой окрестности точки х = с, непрерывна в самой этой точке, то значение её в этой точке может быть вычислено, раз известны её значения в точках некоторой последовательности \хп\, имеющих пределом точку с.

В самом Деле, в этом случае (см. § 42) должно быть:

f(c) = \\mf(xn).

Вместо того чтобы задавать значения функции в точках последовательности {хп\, имеющей пределом точку с, конечно, можно было бы также задать её значения во всех точках некоторого множества Е— при единственном условии, чтобы из этого множества можно было выделить последовательность {хп\, имеющую пределом точку с.

Особенно интересны с рассматриваемой точки зрения всюду плотные множества. Точечное множество Е называется всюду плотным, если, каков бы ни был данный промежуток (а, ß), a<ß, в этом промежутке содержится хоть одна точка Е. Говорят также о множествах Е, всюду плотных в данном промежутке /, если на* званному требованию удовлетворяет всякий промежуток (а, ß), принадлежащий промежутку /.

Нам уже знакомы примеры всюду плотных множеств: таковы множества 1) рациональных чисел, 2) конечных десятичных дробей, 3) конечных бинарных дробей (чисел вида ^, где m и п — целые).

Если множество Е всюду плотно (в даннном промежутке /), то, какова бы ни была точка с (из этого промежутка), всегда можно выделить такую последовательность точек {хп\ из Е, что точка с является её пределом:

хп-+с. (55)

Действительно, пусть {е^} — убывающая последовательность положительных чисел и еп-^0; из каждого промежутка (с — еп, с —|— ея) (я=1, 2, 3, ...) выберем точку хп, принадлежащую Е, и тогда будем иметь соотношение (55).

Заметим, между прочим, что последовательность \хп) может быть выбрана, если угодно, возрастающей или убывающей. Так, чтобы последовательность \хп\ была возрастающей, достаточно взять xt из промежутка (с — el9 с) и затем каждую следующую точку хп+1 выбирать внутри промежутка (хп, с) (п=2, 3, ...).

Сравнивая со сказанным выше, мы приходим к заключению: если функция f(x) непрерывна в некотором промежутке I, то по заданным её значениям в точках некоторого множества Е, всюду плотного в промежутке I, можно вычислить её значения во всех точках /.

Этот результат имеет ближайшее отношение к вопросу об определении показательной функции f(x) = ax (а>1). Согласно формуле (69) из § 20:

(56)

показательная функция а* определена (задана) во всех точках всюду плотного множества рациональных точек. Задача заключается в том, чтобы посредством операции перехода к пределу определить функцию а* также и для иррациональных значений х. Пусть с — какое-нибудь иррациональное значение х. Действуя по предыдущей схеме, достаточно выделить такую последовательность рациональных чисел {гл}, что гл->с, и тогда значение ас должно определиться по формуле

(57)

Однако таким рассуждением нельзя удовлетвориться, так как нам заранее неизвестно, существует ли такая непрерывная функция f(x), которая в рациональных точках г=у принимает значения, указываемые равенством (56). При таких условиях: 1) подлежит доказательству существование предела в правой части (57), 2) необходимо убедиться, что этот предел не зависит от выбора последовательности рациональных чисел \гп\.

Нисколько не облегчает положения то обстоятельство, что функция ах является непрерывной по отношению ко множеству рациональных чисел Е.

Рассмотрим следующие примеры. Пусть с — иррациональное число; функция Л (лг), определённая при хфс условиями

/ 0 при x < с,

1 при х>с,

или функция /а (д;) = sin-, определённая также при х ф с, являются обе непрерывными по отношению ко множеству рациональных чисел; и тем не менее не представляется возможным приписать функции /i (л:) или /2 (лг) такое значение в точке дг = с, чтобы в этой точке они стали непрерывными.

Для того чтобы определить показательную функцию f(x) = ax (û> 1) в иррациональных точках, проще всего воспользоваться свойством её монотонности на множестве рациональных точек, т. е. свойством быть возрастающей, и, кроме того, — теоремой сложения (см. § 20).

Выберем возрастающую последовательность { r'n \ и убывающую последовательность { гл \ рациональных чисел таким образом, чтобы было г'п-+с, гТп-+с; тогда из неравенств

г|<Г2<. ..<г;<...<с<. ..<С<. ..</?</ï (58)

следуют неравенства

/(ri) </(/•£) < <Ж) <... </(/*) <... </Ю </(//). (59)

Последовательность { (f(r'n)} — возрастающая и ограниченная сверху; последовательность {/(/л')} — убывающая и ограниченная снизу; значит, каждая из них имеет предел:

f(r'„W. / (60)

Вместе с тем, переходя к пределу в неравенстве

f(r'n)<f№)>

получаем

С^С".

Для доказательства того, что С' = С", воспользуемся теоремой сложения:

Так как, очевидно, гя — Гд~>0, то аГп Гп1), и переход к пределу в равенстве (61) даёт:

С" = С. (62)

Общее значение С и С" станем обозначать теперь через С (так что /(/•„)-> с и /(/л)—и покажем, что если {рп} — какая угодно последовательность рациональных чисел, обладающая свойством рд-^с, то непременно /(рп) стремится к С. Нужно убедиться, что, как бы мало ни было s, при достаточно больших значениях п

1/(р„)-С|<е. (63)

Возьмём N настолько большим, чтобы выполнялись неравенства

С-е </(/>) и /(rfrXC-H; (64)

тогда, так как с принадлежит промежутку (/>, г#), то при достаточно больших п мы получим

и следовательно, по свойству возрастания /(г),

/ы</(?п)</т- (65)

Из сопоставления неравенств (64) и (65) затем следует неравенство (63).

Теперь значение функции f{x) = ax определено во всякой иррациональной точке х = с по формуле (57). После этого непрерывность функции в этой точке уже не составляет проблемы: она следует из того обстоятельства, что при единственном условии лгл —*с предел последовательности {f(xn)\ существует и равен С=/(с). Для какой угодно последовательности {хп ) это доказывается так же, как только что было доказано для рациональной последова-

1) См. стр. 193.

тельности {рд}, если принять во внимание, что добавление иррациональных точек не нарушает свойства показательной функции быть возрастающей.

Таким образом, показательная функция f(x)=ax, определённая теперь при всех действительных значениях х, обладает свойствами непрерывности и монотонности во всём промежутке —оо <х<<х>.

Наконец, остаётся в силе и «теорема сложения»

ах' + х" = ах> . ах». (66)

первоначально установленное (§ 20) для случая рациональных значений хг к х", это соотношение со ссылкой на непрерывность обобщается на случай иррациональных значений. Пусть последовательности рациональных чисел {х'п} и {х"п} обладают свойствами х,п-^хг и х'п-+х"; тогда достаточно перейти к пределу при /z-voo в равенстве

ff Х^ х^

ахп + хп = а п • а п.

Укажем иной, более общий ход мыслей, позволяющий «по непрерывности» определять функцию / (лг) для всех значений х из некоторого промежутка /, если известны её значения в точках всюду плотного множества Е.

Докажем теорему:

Если заданы, значения функции y=f(x) во всех точках множества Е, всюду плотного в промежутке I {а^х ^.Ь), причём

1° на множестве Е совокупность этих значений удовлетворяет требованию монотонности: с увеличением значения х увеличивается и значение /(лг),

2° заданное множество значений /(лг) в точках множества Е принадлежит некоторому промежутку К(А^у^В) и также всюду плотно в нём,

то значения функции / (лг) в точках I, не принадлежащих Е, могут быть определены таким образом, чтобы функция /(лг) была непрерывной во всём промежутке I.

Доказательство строится совершенно таким же образом, как в случае распространения понятия степени на случай иррационального показателя, только «множество рациональных точек» заменяется «множеством Ет>, а роль произвольной иррациональной точки лг = с играет произвольная точка, принадлежащая промежутку /, но не множеству Е. Заслуживает особого внимания лишь то, как доказать равенство (62), не прибегая к специальным свойствам показательной функции и используя зато условие 2°.

Допустим, что С < С"; тогда вследствие 2° существует такое значение лг = г из множества Е, что

С'</(г)<С". (67)

Так как с не принадлежит Е, то равенство г = с невозможно. Пусть г < с; тогда при достаточно большом п получим г < гп < с и, следовательно, /(г)</(гл); переходя к пределу, будем иметь/(г) ^ С, что противоречит левому неравенству (67). Так же приходится отвергнуть и допущение г > с. Итак, заключаем, что

С'=С".

Пример 1. Чтобы доказанную теорему можно было, в частности, применить к функции ах(а>\), нужно только проверить, что множество

значений, принимаемых этой функцией в рациональных точках, всюду плотно. Пусть дан промежуток (a, ß), причём 0<a<ß. Так как

то можно подобрать целое число п таким образом, что

откуда следует

Легко понять, что хоть один из членов прогрессии

попадает в промежуток (а, ß). Предположим, что таким членом будет qm, так что

или

что и требовалось доказать.

Пример 2. В примере 2 § 46 множество К заданных значений функции f(x) всюду плотно в промежутке (0, 1). В самом деле, обозначая через Кп множество значений, принимаемых функцией f(x) в рациональных точках со знаменателем ^2Л, мы видим, что самый большой из промежутков, образованных на отрезке (0, 1) точками Кп имеет длину (—1 . Пусть (а, ß)— заданный промежуток (0^a<ß^l); возьмём п удовлетворяющим условию (^jn < ß — а> тогда на промежутке (а, ß) непременно найдётся хоть одна точка множества Кп и» значит, множества АГ.

Пример 3. В примере 3 § 46 множество К заданных значений функции f(x) также всюду плотно в промежутке (0, 1).

Предлагаем читателю доказать это в качестве упражнения.

Укажем, наконец, ещё третий способ построения показательной функции— посредством равномерного приближения многочленами. Возвращаясь к многочленам

рассмотренным в § 45, убедимся, что во всяком промежутке вида (О, R) (/?>0) последовательность { Рп (х) } равномерно стремится к некоторому пределу.

В самом деле, как в § 44, мы из сравнения коэффициентов в разложениях Рп(х) и Рл+1 (лг) по степеням лг заключаем, что

0<Р1(х)^Рй(х)^ ... ==СРл(лг)<С (68)

и вместе с тем при любом п

Пусть N — целое положительное число, N>R; тогда, далее, прия>М

(69)

Из соотношений (68) и (69) следует, что последовательность {Рп (лг)} стремится к некоторому конечному пределу /(лг)

Ря <*)-►/«. (70)

Следующие соображения показывают, что это стремление — равномерное. Так как разность Рт+1 (лг) — Рт (лг), будучи разложена по степеням лг, имеет все коэффициенты положительные, то она лишь увеличится при замене лг на R:

Рт+1 (*) - Рт (лг) <С Рт+1 (/?) - Рт (/?).

Просуммируем эти неравенства по букве m от п до п-\-р — 1:

или

затем предельный переход р оо нам дает:

(71)

Остаётся заметить, что при заданном е и произвольном лг из промежутка [О, R] правая (не зависящая от х) часть неравенства (71), а значит, и левая может быть сделана меньше е при достаточно большом п; итак, в этом промежутке

Р„(лг) =£/(*).

Так как многочлены Рп (лг) — непрерывные функции, и сходимость {РЛ(лг)} к /(лг) — равномерная, то на основании последней теоремы в§ 48 функция/(лг) непрерывна в промежутке [0, /?]. Число R здесь, однако, сколь угодно велико, поэтому функция f(x) непрерывна в промежутке [0, оо).

С другой стороны, рассуждение, проведённое в § 45 (пример 1) при допущении, что значения лг — рациональны (по нашему ходу мыслей показателю

степени х мы не имеем права давать иррациональных значений), показывает, что при всевозможных рациональных значениях х независимо от их знака имеет место равенство

Таким образом, функция /(л*), определяемая в промежутке (— оо, -f- 00 ) соотношениями

при рациональных значениях х равна е* и вместе с тем при всех значениях x непрерывна.

Тем самым закончено построение показательной функции еР.

Примечание. Нетрудно понять, что, желая дать определение показательной функции ах при произвольном положительном основании а, достаточно было бы в предыдущей формуле заменить х через x In а:

(72)

§ 52. Теорема Больцано и проблема существования однозначной обратной функции

Предположим, что функция y=f(x) задана и непрерывна в замкнутом промежутке / [а, Ь]. Тогда по теореме Вейерштрасса (§ 47, IÏI) она достигает в каких-то точках этого промежутка своего наименьшего значения А и своего наибольшего значения В. Исключая случай А = В (когда функция сводится к постоянной), мы можем утверждать также на основании теоремы Больцано (§ 47, I), что в промежутке / функция f(x) принимает — и, возможно, неоднократно— любое значение jx, заключённое между А и В. Итак, каково бы ни было значение у (А^у^В), уравнение (относительно х)

f(x)=y (73)

имеет по крайней мере один корень в промежутке а^х^Ь. Сопоставляя с каждым значением у из промежутка (Л, В) все те значения Ху которые являются корнями уравнения (73), мы получаем — вообще говоря, многозначную — обратную функцию

x = g{y)y (74)

которая задана в промежутке А^у^В и в каждой его точке имеет по меньшей мере одно значение.

Весьма существенно уметь выделять те случаи, когда обратная функция x = g(y) оказывается однозначной. Достаточные условия для этого даёт теорема:

Если функция y=f(x)— непрерывная и возрастающая (убывающая) в промежутке [а, Ь], то обратная функция x = g(y) однозначна, возрастает (убывает) и, более того, непрерывна в промежутке [А, В]1).

При этом A=f(a), B=f(b), если функция f(x) — возрастающая, и A=f(b), B=f(a), если она — убывающая.

Обращаясь к доказательству, остановимся только на первом из этих двух предположений.

Существование решения уравнения (73) при у = А или у = В очевидно; при А<у<В оно вытекает, как мы видели, из теоремы Больцано. Что решение — только одно, ясно почти сразу: если бы их было два, например х' и х"(х*<х"), то из равенств

/(*')= У и f(x")=y

следовало бы

/(*')=/(*").

тогда как по свойству возрастания f(x) из неравенства х'<х" должно вытекать, что

/(*')</(*")•

Обозначим единственный корень уравнения (73) через g (у), так

что

f(g(y))=y (А<У<В).

Легко понять, что g(y) является возрастающей функцией аргумента у. В самом деле, пусть

А 5. (75)

Полагая g(y') = x\ g(y") = x,T, мы имеем:

/(^)=У, /(*")=/'.

Отсюда понятно, что х* <х"\ действительно, из противоположного допущения x'^zx", по свойству возрастания функции f(x) следовало бы f(x')^f(x"), т. е. У^УГ, а это противоречит предположению (75).

Остаётся обнаружить непрерывность функции g (у). Рассмотрим хотя бы точку y = d, причём A<d<B. Так как функция g (у) по доказанному—возрастающая, то существуют левый и правый пределы (см. § 42)

L' = g(d-0) и L" = g(d + Q).

Притом из y<Cd следует g(y)<Cg(d); значит, переходя к пределу при y-+d, получаем: Lf^g(d). Аналогично, g(d)^ L". Итак,

1) Обратное предложение см. в конце § 62.

Нам нужно доказать, что

U=g(d) = L".

Допуская, напротив, например, что U<g(d)i мы приходим к противоречию. В самом деле, выберем число £, удовлетворяющее неравенству

L'<l<g(d). (76)

Очевидно, а<Ъ<Ь, так как g(d)<dg(B) = b и L'>g(A) = a\ следовательно, значению аргумента х — \ должно соответствовать некоторое значение функции y=f(x). По свойству возрастания f(x) из неравенства (76) следует:

№)<f®<f(g(fQ)- (77)

Но f(g(d)) = d; с другой стороны, по свойству непрерывности f(x) из соотношения lim g(y) = L' следует:

и так как то

Итак, придавая неравенству (77) вид

убеждаемся в том, что оно противоречиво.

Заметим, что если рассматриваемый промежуток не замкнут с одного из концов (например, а^х <Ь, не исключая и случая b = оо), то предыдущую теорему можно применить к замкнутому промежутку а^х^Ь1 (где ЬХ<Ь), с последующим предельным переходом bx->b. Тогда оказывается, что заключение теоремы справедливо для незамкнутого промежутка Az^y<В, причём B = \imf(x).

Пример 1. Функция у = ах(а> 1) — непрерывная и возрастающая в промежутке — оо <<С~Ь 00• Отсюда следует, что обратная функция x = \ogay — однозначная, возрастающая и непрерывная в промежутке 0<jc<oo.

Пример 2. Функция у = х" (п — целое положительное) — непрерывная и возрастающая в промежутке 0^-*г<[оо. Отсюда следует, что обратная функция х=уу (радикал — в арифметическом смысле) — возрастающая и непрерывная в промежутке 0^.у<оо.

Пример 3. Функция y = tgx-—непрерывная и возрастающая в промежутке — y^.xr^;-j~y- Значит, функция у = arctg х («главное значение» арктангенса) — возрастающая и непрерывная в промежутке — оо <у < -\- 00.

Пример 4. Функция у = хь -f- х — непрерывная и возрастающая в промежутке 0^д:<оо. Отсюда следует, что х есть однозначная, возрастающая и непрерывная функция аргумента у в промежутке О^у <оо. Эта функция, кстати сказать, не является элементарной в смысле § 1 (см. § 18, примечание).

§ 53. Функциональные уравнения и элементарные функции

Пусть f(t) — функция, заданная в некотором промежутке /, и пусть x и у — какие-то произвольные значения аргумента t в этом промежутке; допустим также, что значение t, равное сумме х-\-у, также принадлежит тому же промежутку.

Положим ради краткости

X=f(x), Y=f(y), Z=f(x+y). (78)

Допустим еще, что из написанных трёх уравнений можно исключить две переменные х и у; другими словами, можно написать новое уравнение, скажем,

F(X, Y у Z) = 0, (79)

являющееся следствием уравнений (78) и вместе с тем не содержащее ни Ху ни у. Подставляя сюда вместо X, Yt Z их значения, мы получим соотношение

F (fix), f(j), /(х+у)) = 0, (80)

справедливое при всех значениях х и у} подчинённых названным выше ограничениям.

Соотношение (80), принадлежащее к категории функциональных уравнений, носит название теоремы сложения функции /(*) о.

Если бы вместо суммы х-\-у мы взяли произведение ху у то, действуя как раньше, пришли бы к другому функциональному уравнению

ф </(*), /Су). /С*у))=о, (81)

которое носит название теоремы умножения функции f(f).

Аналогичным образом, вводя вместо суммы х-\-у или произведения ху некоторую произвольную функцию <*> (xf у) переменных х и yt мы могли бы придти к функциональному уравнению вида

^(/W,/(^),/(^(^^))) = 0. (82)

1) Необходимо объяснить, что соотношение (80) есть тождество относительно x и у; «уравнением» же его называют постольку, поскольку, неизвестной считается функция /.

Но нам нет надобности итти по пути такого рода обобщений, и мы ограничимся рассмотрением теоремы сложения и теоремы умножения некоторых функций.

Рассмотрим примеры (в которых роль промежутка / будет играть вся числовая ось).

Пример 1. Функция f(t) — линейная однородная:

f(t) = mt.

В таком случае уравнения (78) принимают вид Х = тх, Y = my, Z = m(xAry)\ из них немедленно следует:

Z=X-\-Y

или

/(*+J0 =/(•*)+/G0- (I)

Это и есть теорема сложения функции f(t) = mt. Подобным же образом из уравнений

Х=тх, Y = my, Z = mxy

получаем теорему умножения для тех же функций

mf(xy)=f(x)f(y). (83)

Как видно, каждая из функций mt имеет свою теорему умножения, тогда как теорема сложения у них всех одна и та же. Пример 2.

№ = а* (й>0).

Из уравнений

Х=ах, У = аУ, Z = ax+y

следует уравнение

Z=XY,

f(x+y)=f(x)f(y). (II)

Это — теорема сложения для всех показательных функций вида аь. Теорема умножения для функции а* имела бы вид

logaf(xy) = logaf(x)logaf(y), (84)

и следовательно, зависела бы от основания а.

Пример 3.

/(') = loge*.

Теорема сложения оказывается зависящей от параметра а: а/1*+У) = aflà -f- af <У\ тогда как теорема умножения от него не зависит:

/(*у) =/(*)+Ау). (,п)

Пример 4.

И здесь теорема сложения зависит от параметра а:

тогда как теорема умножения от него не зависит:

(IV)

Четыре уравнения (I), (II), (III) и (IV) в особенности привлекают наше внимание.

Посмотрим, исчерпывается ли уже известными нам формами совокупность их решений и в какой степени.

С некоторыми существенными оговорками ответ на этот вопрос оказывается утвердительным. Именно, справедливы следующие теоремы:

Теорема 1. Если функция f(t), заданная и непрерывная для всех значений t ( — oo<<-f~ оо), удовлетворяет уравнению (I) тождественно относительно х и у, то она имеет вид f(t) = mt, где m — постоянное число.

Теорема 2. Если функция f(t), заданная и непрерывная для всех значений t (—оо <С^<С+ оо)» удовлетворяет уравнению (II) тождественно относительно х и у, то она имеет вид f(f) = at, где а — неотрицательная постоянная.

Теорема 3. Если функция f(t), заданная и непрерывная для всех положительных значений t, притом не сводящаяся к нулю, удовлетворяет уравнению (III) тождественно относительно всех положительных значений х и у, то она имеет вид f (t) = loga t, где a — положительная постоянная.

Теорема 4. Если функция f(t), заданная и непрерывная для всех положительных значений t, притом не сводящаяся к нулю, удовлетворяет уравнению (IV) тождественно относительно всех положительных значений х и у, то она имеет вид f(t)=ta, где а — постоянное число.

Доказательство теоремы 1. Посредством индукции по п из (I) легко выводится тождество

(85)

Полагая

получим

(86)

Далее, вводя обозначение

при х=1 будем иметь (для всех целых положительных значений п):

f (ri) = тп.

С другой стороны, заменяя в (86) п через q и полагая х равным (где р и q — целые положительные), приходим к соотношению

откуда, если принять во внимание, что f(p) = mpy следует:

(87)

Полагая затем в данном уравнении (I) х=1, у = 0, получаем: /(!)=/(!)+/(0),

так что

/(0) = 0; (88)

и наконец, подставляя в (I)—х вместо .у, будем иметь (при любом х)

о =/(*) +/(-*),

откуда

f(-x) = -f(x). (89)

Сопоставляя (87), (88) и (89), мы можем сказать, что равенство

f(x) = mx (90)

установлено для всюду плотного множества всех рациональных значений x. Отсюда, вследствие допущенной непрерывности f(t), на основании теоремы, доказанной в § 51, и со ссылкой на непрерывность функции f(t) = mt мы имеем возможность утверждать, что равенство (90) справедливо для всех действительных значений х. Доказательство теоремы 2. Заменяя в уравнении (II) t x и у через , мы получаем:

Если бы функция f(t) обращалась в нуль при некотором значении t = x, то вследствие (II) она бьрла бы равна нулю также при t = x-\-y, где у совершенно произвольно, т. е. равнялась бы нулю тождественно.

Оставляя в стороне это предположение, соответствующее случаю а = 0, мы должны считать, что при всех значениях t

Пусть /(1) = а>0. Полагая в таком случае

мы видим, что уравнению (II) можно придать вид

т. е.

фС*+-У)=чрС*)+ф(у)-

Это — уравнение типа (I); и из доказательства теоремы 1 следует, что

9 (f) = mt

или

Подставив значение t= 1, убеждаемся, что т=1, так что f(t) = а\ Доказательство теоремы 4. Поскольку х и у предполагаются произвольными положительными числами, можно положить

*=10*, l = lgxt у=№, r\ = lgy,

и тогда уравнение (IV) примет вид

/ ( 10е-+ч) =/ ( 1 о*) / ( 1 оч). (IV)

Вводя ещё новую неизвестную функцию

F(t)=/(104, (91)

мы придадим (IV) вид

F(l + rl) = F(i)F(rl).

Так как ê и rj — произвольные действительные числа, и функция F(z) непрерывна на всей оси (по теореме о непрерывности сложной функции, вследствие непрерывности функций f(f) и 10х), то на основании теоремы 2 получим:

F (т) = а" (а^О).

В таком случае, заменяя в последнем тождестве % через Igt, мы получаем окончательно:

Доказательство теоремы 3. Уравнение (III) можно переписать в виде

10/(*у)= 1Q/C*) 10/Cv).

Вводя функцию

О(0 = 10/«>, (92)

придадим ему вид

0{рсу) = 0{х)0{у). (ИГ)

По теореме 4 из (IIP) следует, что или G(t) = 0 или G (/)=£". Так как показательная функция в нуль не обращается, то приходится рассматривать лишь вторую возможность. Но если G(t) = ta, то при допущении а=0 мы получаем G(/)^l, f{t) = 0\ оставляя эту возможность в стороне, приходим к заключению, что

f(t)=*lgt = \ogat (где а=10а).

Всё изложенное выше показывает, что функциональные уравнения (I—IV) являются характеристическими соответственно для функций mt, a', loga t и ta\ другими словами, эти уравнения могут служить в качестве определения этих функций — при дополнительном требовании непрерывности.

Примечание 1. Если вместо непрерывности наложить на функции /(/) требование дифференцируемости (см. стр. 309), то тем более заключения теорем 1—4 остаются в силе. Доказательства теорем при таких условиях значительно упрощаются. Например, теорема 1 может быть доказана следующим образом. Дифференцируя тождество (I) по переменной лг, мы получаем:

и так как у здесь — произвольное, то отсюда вытекает, что f\x) сводится к постоянной:

/'(*) = **.

Но тогда интегрирование даёт:

f(x) = тх + С,

где С — новая постоянная. Подставляя найденное выражение для f(x) снова в уравнение (I), видим, что при всех значениях х и у

>п(х+у) + С = (тх + С) + (ту+С)у

откуда следует, что С — 0 и что / (х) = тх.

Среди функций, которые мы смогли определить с помощью уравнений (I—IV), не фигурируют тригонометрические, а также им обратные.

Читатель, который пожелал бы составить теорему сложения, например, для функции /(£) = sin/, пришёл бы к известной из тригонометрии формуле для «синуса суммы»; но в ней косинусы были бы выражены через синусы, так что формула имела бы следующий, сравнительно сложный вид:

(можно было бы «избавиться от иррациональности»).

Уместно, впрочем, высказать следующие соображения. В теории функций комплексного переменного устанавливается, что тригонометрические функции выражаются, с привлечением мнимой единицы, через показательные, например,

(93)

теряя при этом, так сказать, право на самостоятельное существование; точно так же обратные тригонометрические функции выражаются через логарифмы и радикалы (см. стр. 511). Таким образом, при перечислении

основных операций, служащих для получения элементарных функций, к четырём арифметическим действиям (сложение, вычитание, умножение, деление) достаточно прибавить всего лишь потенцирование, логарифмирование и возведение в произвольную степень1).

Принимая это во внимание, мы приходим к мысли о справедливости следующего утверждения:

Все элементарные функции составляются из независимой переменной в результате повторного применения конечного числа арифметических действий и тех операций, которые, будучи обозначены символом f, являются решениями функциональных уравнений (I—IV).

Отсюда выясняется то значение (конечно, теоретическое), которое имеют уравнения (I—IV) для элементарной математики.

Примечание 2. Из теорем 1—4 предыдущее утверждение, строго говоря, не вытекает по той причине, что при составлении тригонометрических функций из показательной согласно формулам (93) приходится прибегать к операции f(t) = it, тогда как в решении f(f) = mt уравнения (I) постоянная m предполагается действительной. Чтобы обосновать наше утверждение, надо перенести теоремы 1—4 в комплексную область. Естественно, что при таком перенесении требование непрерывности заменится требованием регулярности искомой функции f(f). Так, формулируя теорему Г, аналогичную теореме 1, нужно предполагать функцию / регулярной во всей плоскости и допускать, что соотношение (I) выполняется при всех комплексных значениях х и у. Так как из регулярности следует дифференцируемость, то доказательство было бы построено далее так, как указано в примечании 1, но при этом постоянная m могла бы оказаться произвольной комплексной.

Рекомендуем читателю, по прочтении статьи, «Элементарные функции комплексного переменного» (стр. 493—552), попытаться сформулировать, как эгу, так и остальные три теоремы, касающиеся решения уравнений (I—IV) в комплексной плоскости, а также восстановить детали доказательств.

1) Напомним, кстати, что возведение в произвольную степень конструируется из логарифмирования, умножения на постоянное число и потенцирования (см. стр. 93).

ГЛАВА V

ОБЩЕЕ ПОНЯТИЕ ФУНКЦИИ

§ 54. Соответствие между множествами

В § 1 было упомянуто, а в § 46 подробно рассмотрено определение функции как соответствия между двумя числовыми множествами, установленного на основе совершенно произвольного правила; как ни общо это определение, всё же в другом отношении оно является очень узким и допускает значительное расширение. В силу этого определения функция

y=f(x)

сопоставляет с каждым числом (с числовым значением переменной х из некоторого промежутка) некоторое число (соответствующее значение у).

В более общем случае можно говорить о множествах, составленных из элементов какой угодно природы. Именно, общее определение функции, имеющее громадное значение в современной математике, формулируется следующим образом.

Дано некоторое множество объектов, которое обозначим через SC\ сами объекты, как элементы этого множества, условимся обозначать буквой X («переменное» во множестве SC), снабжая её различными значками, если речь идёт об отдельных элементах множества SC\ Пусть также задано некоторое множество объектов, которое назовём У\ оно может содержать полностью или частично элементы множества SC, но может также состоять сплошь из элементов, не принадлежащих множеству SC\ элементы этого множества У мы будем обозначать буквой Y («переменное» во множестве У), также снабжая её различными значками, если хотим выделить отдельные элементы.

Говорят, что при этих условиях «переменное Y есть функция переменного X» и пишут

У=/(Х)1), (1)

1) Лишь ради простоты письма приходится пользоваться знаком обыкновенного равенства там, где обязателен был бы знак тождества ( = ): ведь элементы Y и f(X) могут не быть числами.

если указано некоторое правило, сопоставляющее с каждым элементом X из множества S£ некоторый элемент Y из множества У. При этом, вообще говоря, не требуется, чтобы каждый элемент множества У непременно был поставлен в соответствие некоторому элементу множества SC, и не требуется также, чтобы с различными элементами из SC были сопоставлены различные же элементы из У. Напротив, может случиться, что во множестве У останутся «свободные», или «лишние» элементы, не сопоставленные ни с какими элементами из SC, или что с различными элементами X и X" из SC будет сопоставлен один и тот же элемент из ЗЛ

При указанных обстоятельствах говорят также об отображении каждого элемента X множества SU на сопоставляемый с ним элемент Y множества У и об отображении совокупности всех элементов множества SC на совокупность всех сопоставляемых с ними элементов множества У.

Описанное отображение общего типа называется однозначным — в противоположность многозначному отображению, при котором с каждым элементом из SC сопоставляется один или несколько элементов из У.

В дальнейшем речь будет итти лишь об однозначных отображениях.

Отображение множества SC на множество У называется взаимно однозначным, если выполнено требование, чтобы каждый элемент из У был сопоставлен с некоторым элементом из SC и чтобы с различными элементами из SC сопоставлялись различные же элементы из У; другими словами, если из соотношения

f(X')=f(X")

следует соотношение

Х' = Х".

В этом случае, обратно, отображение (1) с каждым элементом Y из У сопоставляет некоторый элемент X из SC; именно, единственный тот, с которым сопоставлен элемент Y; другими словами, существует обратное отображение Y на SC:

X = g(Y). (2)

В частности, если SC и У — некоторые множества действительных чисел, мы получаем определение функции одного переменного на множестве Е, рассмотренное в § 46. Чаще всего Е — промежуток, замкнутый или открытый.

В следующих параграфах мы рассмотрим ряд примеров отображений, причем роль элементов множеств SC и У будут играть не только числа, но и пары чисел, тройки чисел и т. д., вообще системы чисел, а также функции определённого класса, заранее заданные в некоторой фиксированной области.

При этом будут указываться и некоторые геометрические или механические (кинематические) интерпретации, служащие, с одной стороны (как и «графики» функций в простейшем случае), целям наглядности, но вместе с тем указывающие и конкретные «реализации» общей схемы.

Однако обзор будет довольно беглым — не только по ограниченности места, предоставленного настоящей статье, но и по той причине, что нельзя рассчитывать, чтобы возникающие концепции могли найти постоянное употребление в средней школе.

В заключение настоящего параграфа приведём несколько примеров «функциональных соответствий» или «отображений», где каждое из множеств SC и У содержит конечное число элементов.

В таком случае число возможных отображений — тоже конечное: оно равно пт, если S£ содержит m, а У — п элементов1).

1. ^Г —множество пальцев левой руки, У— множество пальцев правой руки.

Всего возможно 55 = 3125 соответствий, из них взаимно однозначных Рб = 51 = 120.

2. SC — множество учеников в классе (30), У — множество различных баллов (1—5). В результате письменной работы устанавливается одно из соответствий. Всего возможно 5ао соответствий.

3. SC— множество баллов (1—5), У— множество учеников в классе (30). Из района требуют прислать образчики работ — по одной на каждый из баллов. Всего возможно 305 соответствий.

4. Каждый из трёх товарищей может по желанию пойти или не пойти на экскурсию. SC— множество товарищей, У— множество, состоящее из двух значков: -)- («пойдёт») и — («не пойдёт»). Возможно 23 = 8 соответствий.

5. m различных предметов нужно разложить в п ящиках. SC— множество предметов, У — множество ящиков. Разложить можно пт способами.

§ 55. Геометрические образы в многомерных пространствах

Предположим, что SC — множество всех чисел z (или чисел z> содержащихся в некотором промежутке /), У — множество всевозможных пар чисел (дг, у). Каждому значению z соответствует некоторая пара (х, у) и, значит, некоторое значение х и некоторое значение у; итак, х и у являются функциями (в обычном смысле) независимой переменной z:

(3)

Уясним себе геометрический смысл такого соответствия, воспользовавшись координатной системой Oxyz в пространстве. Соот-

1) С каждым из элементов множества J2T может быть сопоставлен любой из элементов множества ЗЛ Если т= 1, то, очевидно, имеется п возможных отображений; если m = 2, то получается я2 возможных отображений, так как каждое из п возможных отображений первого элемента может «скомбинироваться» с каждым из п возможных отображений для второго элемента; и т. д. — по индукции.

ношения (3) говорят о том, что в каждой плоскости, параллельной плоскости Оху, выделяется одна точка: совокупность этих точек образует1) некоторую кривую в пространстве.

Пусть читатель рассмотрит более внимательно, например, винтовую линию

(4)

(рис. 90) и разберётся в том, как при изменении z от 0 до 2тг точка с координатами (х, у, z) совершает один «обход» вокруг оси Oz.

Предположим теперь, что £С — множество (D) всевозможных пар чисел (х, у) или, другими словами, Ж — множество всех точек координатной плоскости Оху; можно также предположить, что это множество (D) составлено из всех точек плоскости Оху, лежащих внутри некоторой замкнутой кривой или по одну сторону некоторой разомкнутой кривой, идущей из бесконечности в бесконечность. Что касается У, то допустим, что это — множество всех чисел z.

Таким образом, с каждой парой чисел (х, у) из (D) сопоставлено некоторое число z, которое является функцией двух переменных x и у:

z=f(x, у). (5)

Написанное соотношение говорит о том, что в пространстве Oxyz на всякой прямой, параллельной оси Oz и проходящей через какую-нибудь точку множества (D) на плоскости Оху, выделяется единственная точка; совокупность этих точек (при соблюдении условий непрерывности) образует некоторую поверхность в пространстве. Рассмотрим, например, уравнение

(6)

Рис. 90.

1) При соблюдении условия непрерывности функций f(z) и g(z).

Принимая во внимание, что выражение ]/л;2-|-з/2 представляет расстояние точки (лг, у) в плоскости Оху от начала О, можно заключить в данном примере, что уравнение выделяет на прямой, проходящей через точку (лг, у) и параллельной оси Oz, точку с координатой z, равной синусу от упомянутого расстояния; нетрудно отдать себе отчёт в том, что совокупность точек (лг, у, z) в пространстве образует «гофрированную» поверхность, которая получается при вращении «полусинусоиды» z = smx (0 ^ л; < оо), взятой в плоскости OxZy относительно оси Oz (рис. 91).

Рис. 91.

Другой пример поверхности, которую можно рекомендовать вниманию читателя, — «винтовая поверхность» с осью Oz

(7)

Перейдём от случаев, когда общее число рассматриваемых переменных равнялось трём, к случаю, когда оно больше трёх. Если число переменных равно четырём, то, обозначая их, скажем, через X, у, Z и и, можно выделить три существенно различных случая.

1) Каждая из трёх переменных является функцией четвёртой, например

(8)

здесь состоит из множества чисел а, У—из множества троек чисел (лг, у, z).

2) Каждая из двух переменных является функцией остальных двух, например

(9)

здесь SC состоит из множества пар чисел (х, у), У— также из множества пар {z, и).

3) Одна из переменных является функцией трёх остальных, например

u=f(x,y,z); (10)

здесь SC состоит из множества троек чисел (лг, у, z), У — из множества чисел к.

При этом во всех случаях множество SC может быть подчинено тем или иным ограничениям.

Упомянем, наконец, гораздо более общий типический случай, когда множество SC состоит из систем р чисел, «независимых» переменных (xv x2t ... , хр), а множество У — из систем q чисел, «зависимых» переменных

(11)

Что касается геометрического представления, то, если следовать общему принципу, в этом случае нужно было бы обратиться к /z-мерному пространству Oxtx2 ... хру1у2 ... уд, где n = p-{-qt и тогда система функциональных соотношений (11) могла бы быть истолкована как определяющая некоторый /?-мерный геометрический образ, понимая под таковым совокупность «точек»

(xi9 лг2, ... , Xpt yîf у2, . . . , Уд),

удовлетворяющих одновременно всем соотношениям (11).

Уравнения, определяющие в своей совокупности некоторую протяжённость1), могут и не быть «решены» относительно зависимых переменных, и тогда в случае, если протяжённость задана «неявно», не обязательно каждой системе (xv х2, ... , хр) соответствует именно одна система (yv у2, ... , уд): может возникнуть «многозначность».

В качестве примера укажем уравнение «сферы» в я-мерном пространстве

*î+*î+ =

Решая его, например, относительно xn(=yl)t получаем при условии -xrj —J— jc^ —J— ... -{-x2n — i^:R* «двузначную» функцию

Здесь р = п—1, q=l.

1) Термин «протяжённость» охватывает всевозможные типы геометрических образов в /z-мерном пространстве (п^4). Счёт «измерений» ведётся по числу независимых переменных. Название «кривой» обычно сохраняется за одномерными протяжённостями,название «поверхности» — за (п— 1)-мерными.

Заметим ещё (ограничиваясь хотя бы случаем трёхмерного пространства), что одна и та же протяжённость может быть задана различными эквивалентными между собой комбинациями уравнений. Например, винтовая линия задана парой уравнений (4) как пересечение двух «синусоидальных цилиндрических поверхностей» с образующими, соответственно параллельными осям Oy и Ох; но её же можно задать парой эквивалентных уравнений

(12)

как пересечение кругового цилиндра с осью Oz и «винтозой поверхности»— с той же осью.

§ 56. Пространственные отображения

Пытаясь побудить работать не только мысль, но и воображение, мы постоянно прибегаем к «геометрическим представлениям», или «интерпретациям» аналитических объектов или взаимоотношений. Однако мы свободны в выборе этих интерпретаций: с одними и теми же аналитическими фактами могут быть связываемы различные геометрические представления.

Исходя из этой общей идеи, можно функциональной зависимости между двумя переменными величинами (числами или системами чисел) дать иную, пожалуй более простую и естественную, интерпретацию.

В случае функциональной зависимости

У=/(х) (13)

мы прибегали к координатной плоскости Оху и, толкуя х как абсциссу, у — как ординату точки этой плоскости, сопоставляли с уравнением (13) некоторый график — кривую линию, лежащую в упомянутой плоскости.

Но ничто не помешало бы вместо плоскости Оху рассматривать две независимые между собой, как угодно расположенные координатные оси Ох и Oy1)] при этом зависимость (13) толкуется в том смысле, что с каждой точкой на оси Ох сопоставляется некоторая точка на оси Oy.

На рис. 92 намечен пример функции у = ~х*, причём соответствия между точками обозначены стрелочками.

Точно так же можно считать, что зависимость вида (3) сопоставляет с каждой точкой оси Oz (или некоторого промежутка

1) Совпадение букв О не означает совмещения начал на двух осях.

на этой оси) некоторую точку независимой (произвольно расположенной) плоскости Оху.

Рис. 92.

Рис. 93.

Рисунок 93 соответствует примеру (4); в данном случае промежуток 0^2г<2т:, и вообще 2kn ^z< 2 (k -|- 1) tu, отображается на окружность х*-\-у*=\.

Зависимости же вида (5), напротив, интерпретируются как соответствие между точками плоскости Оху (или некоторой области (D) в этой плоскости) и точками независимой оси Oz. Рисунок 94 иллюстрирует пример, заданный уравнением (6). Здесь с любой точкой одной и той же окружности в плоскости Оху сопоставляется некоторая одна и та же точка оси Oz, и именно, например, часть плоскости Оху, находящаяся в окружности x2 -\-y2 = j-, отображается таким образом на промежуток 0^z<l.

Подобным же образом в случае четырёх переменных зависимости типа (8), (9) и (10) интерпретируются соответственно как отображение прямой на пространство, плоскости на плоскость и пространства на прямую.

Вообще зависимость типа (11) интерпретируется как отображение «р -мерного пространства» Ох{х2... хр на «q-мерное пространство»

Приведём несколько примеров такого рода отображений, не обязательно при этом воспроизводя формулы — потому ли, что

Рис. 94.

воспроизвести их не стоит труда или потому, напротив, что воспроизведение их, точное или приближённое, связано с более или менее значительными принципиальными или практическими затруднениями.

1. Симметрические отображения, параллельные перенесения, вращения, растяжения или сжатия (см. многочисленные примеры в главе I) представляют собой частные случаи отображения плоскости на плоскость; они взаимно однозначны; все они переносятся и на трёхмерное пространство.

2. Рассмотрим следующее специальное отображение плоскости на плоскость (в данном случае отображение плоскости самой на себя). Дана окружность с центром О и радиусом R (рис. 95). С точкой M сопоставляется точка М', лежащая на луче ОМ и обладающая свойством^

Это отображение, как легко понять, — также взаимно однозначное и также переносится на случай пространства. Оно носит название инверсии и обладает замечательными свойствами.

Если положим /?=1 и поместим центр окружности в начало координат, то уравнение окружности примет вид

Обозначая координаты точки M через лг, у, а координаты точки М' — через х\ у, получим уравнения инверсии в аналитической форме:

3. Вообразим идеальный сосуд (V), наполненный жидкостью в состоянии покоя; взболтаем жидкость и дождёмся момента, когда она снова вернётся в состояние покоя. Тогда, сопоставляя с положением каждой частицы жидкости до взбалтывания положение той же частицы после взбалтывания, получим отображение части пространства (V) на ту же самую часть пространства.

4. Пусть независимое переменное t истолковывается как время с ограничением tt^t^t2; роль же зависимого переменного играет положение точки, движущейся а) по прямой Ох, б) на плоскости Оху, в) в пространстве Oxyz. Тогда движение точки определяется уравнениями или системами уравнений вида

(14)

Рис. 95.

Тем самым «отрезок времени» t1^t^tq отображается на прямую, на плоскость или на пространство. Взаимной однозначности здесь может не быть, так как в различные моменты времени точка может занимать одно и то же положение.

Частные примеры:

1)

(равномерное вращение точки по кругу х2 -\-y2=z 1);

2)

(см. § 21: движение точки по гиперболе х2—j/2=1)1);

3)

(движение точки по винтовой линии в пространстве).

5. Пусть и — какая угодно величина, значения которой изображаются точками оси Он. Величина и пусть будет произвольной «функцией точки»; например, и может быть температурой, давлением и т. п. Тогда уравнения вида

a) u=f(x), б) u=f(x, у), в) u=f(x, у, z),

указывающие распределение величины и а) на прямой Ох, б) на плоскости Оху, в) в пространстве Охуг (или в какой-нибудь их части), вместе с тем определяют отображение прямой Ох, плоскости Оху или пространства Oxyz на прямую Он. Совокупность точек, в которых и имеет заданное значение (т. е. отображаемых на одну и ту же точку оси Ou), носит название кривой (в случае б)) или поверхности (в случае в)) уровня. Если и—температура, это — изотерма; если и — давление, то изобара и т. п.

Следующие примеры — несколько иного характера: они связаны с отображением кривой на кривую или поверхности на поверхность.

6. Одна окружность (с) находится внутри другой (С) и дана ещё точка О внутри с. С точкой m на окружности (с) сопоставляется та точка M окружности (С), которая лежит на луче От..

То же можно сделать с поверхностями сфер в пространстве.

7. Обвернём без перекрытий цилиндр листом бумаги и поставим во взаимное соответствие ту точку поверхности цилиндра и ту точку листа бумаги, которые при обворачивании совмещаются. Затем, развернув лист бумаги на плоскость, получим отображение цилиндра на плоскость, при котором длины взаимно соответствующих кривых одни и те же. То же можно сделать с конусом.

Говорят в таких случаях о «развёртывании» цилиндра или конуса на плоскость.

1) Отсюда наименование «гиперболические функции».

8. Но того же нельзя сделать с шаром. Тем не менее необходимо (например, в картографии) каким-то образом отображать поверхность земного шара на плоскость; это делается обычно по особым правилам, выражающимся аналитическими формулами.

Самое простое правило заключается в том, что долгота v и широта и точки земной поверхности интерпретируются как прямоугольные координаты — абсцисса и ордината. Читатель может, руководствуясь- этим принципом, попытаться наметить на клетчатой бумаге карту Европы.

§ 57. Метрические пространства

В § 38 было дано определение предела последовательности чисел, связанное теснейшим образом с понятием окрестности точки (на числовой оси); при этом под окрестностью понимается обыкновенно совокупность точек, расстояние (отклонение) которых от рассматриваемой точки меньше данного числа.

Аналогичным образом можно определить предел последовательности элементов любого множества, лишь бы предварительно было установлено понятие «расстояния» между всякими двумя элементами этого множества. Другими словами, должно быть «введено мероопределение», или «установлена метрика».

Если речь идёт о числах, например х' и х*\ то под расстоянием между двумя числами естественно понимать (см. § 36) абсолютную величину их разности \хТ — лг" I, что как раз соответствует расстоянию в обычном геометрическом смысле между соответствующими точками M и М" числовой прямой:

ММ" = \хг — хГ\. (15)

Если речь идёт о парах чисел, скажем (х\ У) и (х", Уг), то, прибегая к обычному их представлению в виде точек координатной (декартовой) плоскости Оху, можно под «расстоянием» понимать обычное геометрическое расстояние между соответствующими точками M (х?> у1) и М" (х'\ у"): оно даётся формулой

(16)

Таким же образом, говоря о тройках чисел (х\ у\ z') и (У, У, z"), мы можем прибегнуть к пространственной координатной системе и получим расстояние между соответствующими точками M и М" в виде формулы

(17)

По аналогии, говоря о системах из п чисел (х[, х[у ... , х'п) и (*", х?% ... , х?п), можно обратиться к воображаемому /г-мерному

пространству и использовать расстояние между соответствующими точками M и М":

(18)

или в более краткой записи

(19)

Как мы видели в § 36, е-окрестность точки х0 на числовой оси Ох определяется неравенством

что даёт .нам открытый промежуток

На плоскости Оху е-окрестность точки М0 (х0, у0) определяется неравенством

что даёт внутренность круга с центром М0 и радиусом е:

В трёхмерном пространстве Oxyz мы встречаемся со сферой

в «-мерном пространстве Oxtx% ... хп — с «гиперсферой»

Однако нужно заметить, что метрика, определяемая формулами вида (15) — (19), обусловливается используемыми геометрическими представлениями и не является логически необходимой. Эта метрика носит название евклидовой. В иных случаях целесообразным является введение иной метрики.

Поясним это на следующем примере. Пусть речь идёт о «расстояниях» между двумя точками сферы, например, земного шара. В геометрическом смысле расстояние между двумя точками сферы равно длине соединяющего их отрезка, т. е. хорды сферы; но расстояние между точками на земной поверхности измеряют по этой поверхности, именно — по дуге большого круга, проведённого через две точки (это — «кратчайшее» расстояние на сфере). Предположим, что две точки М' и М" заданы их географическими координатами— широтой и и долготой v. Допустим, что мы имеем дело с картой, на которой точка M (и, v) изображается точкой с декартовыми координа-

1) Следует обратить внимание на то, что при п=\ формула (18) принимает вид (15).

тами и (абсцисса) и v (ордината) — см. пример 8 предыдущего параграфа. В этом случае формула У (и' — и")3 + (V — v")* определяет расстояние между точками на карте, но не на земной поверхности; это последнее расстояние есть более сложная функция четырёх координат и\ v', и", v", которой мы приводить не будем.

Представим себе теперь вместо шара с нанесённой на нём «географической» координатной сеткой произвольную кривую поверхность в пространстве с нанесённой на ней произвольной «криволинейной» координатной сеткой.

Расстояние между двумя точками М' и Ai" на поверхности обыкновенно определяется как длина кратчайшей из всех линий, которые могут быть проведены на поверхности от точки М' к точке M"1); это расстояние есть некоторая более или менее сложная функция от четырёх координат точек М' и М". Оно вовсе не обязательно совпадает с расстоянием между «изображениями» соответствующих точек на плоскости, если бы мы решили криволинейные координаты на поверхности трактовать как декартовы на плоскости.

Обратимся теперь к общей теории. Говорят, что в некотором множестве («пространстве») ^ введена метрика (мероопределение), если с каждой парой элементов X, X* сопоставлено в качестве расстояния между ними некоторое число р (X, X"). Это число по определению должно обладать следующими свойствами:

1° р(Г, Х') = 9(Х', ХУ (20)

Это значит, что расстояние, «измеряемое от X до Хт»у равно расстоянию, «измеряемому от X" до X»; такого рода симметрией оправдывается оборот речи «расстояние между элементами X и X"».

2° р(Хт, Х")>0, если элементы X и X" различны; |

р(Х, Х") = 0, если элементы Хт и Хг совпадают. j ^21^

Это значит, что расстояние между двумя элементами не может быть отрицательным и обращается в нуль только в том случае, если X и Хт — один и тот же элемент.

3° Каковы бы ни были три элемента Х\ X" и Х"т из Ж, имеет место неравенство

р (X, X') ^ р (X, X") + р {ХГ% X'). (22)

Это неравенство, называемое «неравенством треугольника», означает, что расстояние, «измеряемое непосредственно от X до X'», не должно превышать суммы двух расстояний, именно, «измеряемого от X до некоторого третьего элемента Хгп» и «измеряемого от X" до X'».

Пример. В случае, если «пространство» Ж — множество всех точек на плоскости Оху, элементы его — точки или пары чисел

1) Число таких линий бесконечно; существование кратчайшей из них требует, конечно, особого доказательства.

М(х, у), то расстояние р(М\ М") между точками М(хг) у') и Ad"(xTT, у") можно определить по формуле

(23)

по законно было бы также взять за расстояние

р (Ж', M') = \х' — х» ] + I у —у J (24)

или

р(ЛГ, Ж") = тах{|л;г — х"\, |/_/'|}. (25)

Читатель легко проверит, что в случаях (24) и (25), как и в случае (23), оправдываются свойства 1° и 2°; формальное доказательство свойства 3° несколько сложнее, но тоже вполне элементарно1). Читатель отдаст себе также отчёт в геометрическом смысле «расстояния» согласно толкованиям (24) и (25).

Раз в пространстве SC введена метрика (мероопределение), тем самым определяется и окрестность каждого элемента: под е-окрестностью элемента Х0 из SC подразумевают множество всех тех элементов X из SC, для которых выполняется неравенство

р(Х, Х0)<е.

Пример. Смотря по тому, принята ли на плоскости метрика, определяемая формулой (23) или формулой (24), или формулой (25), е-окрестность точки М0 (х0, у0) определяется неравенством (х — #о)*-ЬСУ—Уо)2<Се<2 (внутренность круга с центром М0 и радиусом е) или неравенством

тахЦлг — лгД \у— у0\}<*>

(внутренность квадрата с центром М0 и стороной 2е, причём стороны параллельны осям координат), или неравенством

I* — *о| + 1.У — Уо\<£ (внутренность квадрата с центром М0 и вершинами (л;0-|-г, у0),

(*о> Уо + *)> (хо — *> У о) и (*о. У о —е)).

Мы рассматривали до сих пор преимущественно такие пространства, элементами которых являются точки (числа или системы чисел). Но можно также рассматривать пространства, элементами которых являются прямые, окружности, плоскости, какие угодно кривые или поверхности и т. п. В таких «пространствах» также можно вводить метрику.

Мы остановимся лишь на нескольких отдельных примерах «функциональных» пространств, т. е. пространств, элементами которых

1) Неравенство Минковского:

являются функции, а введение метрики в таких пространствах объясним на примерах.

Станем рассматривать в качестве элементов некоторого функционального пространства функции f(x) одной независимой переменной заданные в одном и том же промежутке I(a^x^b); при этом для простоты будем допускать, что речь идёт лишь о непрерывных функциях. Итак, пусть SC обозначает множество всех функций f(x), заданных и непрерывных в промежутке /.

Как ввести метрику в пространстве SC1 Нам уже пришлось встретиться (см. § 48) с «расстоянием между функциями f{x) и g(x)», определяемым по формуле

р(/, *) = шах {|/(*)-*(*)|}5 (26)

геометрически, как мы видели, это означает, что в качестве «расстояния» берётся наибольшая длина отрезка PQ (см. рис. 87) при изменении x в пределах промежутка /.

В данной связи важно указать, что можно было бы также в качестве «расстояния» р (/, g) взять один из интегралов

I \f(x)-g(x)\dx (27)

(площадь заштрихованной фигуры на рис. 87) или

[[f(x)-g(x)Ydx (28)

(выбор такого «расстояния» особенно выгоден с точки зрения простоты вычислений).

Проверка свойств «расстояния» Г—3° вполне элементарна в случае метрики (26); в случае же метрик (27) и (28) свойства 1° и 2° очевидны, а доказательство свойства 3° связано с использованием свойств определённых интегралов1).

§ 58. Понятие предела в метрическом пространстве

Пусть задано некоторое метрическое пространство SC и пусть

{Aa} = Alt А% ,..., Ая,... (29)

— некоторая последовательность его элементов. Если, кроме того, в пространстве SC существует такой элемент Ау что, как бы мало ни было положительное число е, неравенству

_ р(Х Л)<6 (30)

1) Существует принципиально очень важная формальная аналогия между метриками (26), (27) и (28) в функциональном пространстве и метриками (25), (24) и (23) в точечном (двумерном) пространстве.

удовлетворяет бесконечное множество элементов последовательности {Ап\, то элемент А называется предельным элементом (или точкой) этой последовательности; если, больше того, этому неравенству удовлетворяют «почти все» элементы последовательности, т. е. все, начиная с некоторого номера (n>Ne), или все, кроме конечного их числа, то говорят, что элемент А есть предел последовательности {Ап\. В последнем случае пишут: Ап^А или lim Ап = А.

Последовательность элементов пространства не может иметь более одного предела.

В самом деле, из соотношений Ап-+А и Ап-+А следует, что при любом е(>0) и при достаточно больших значениях п справедливы одновременно неравенства

р(Л„, Л)<е и р(Л„, Л')<е,

и отсюда (по свойствам «расстояний» 3° и 1°) вытекает:

р(Л, Л')^р(Л, ЛП) + Р(Л„, Л') = р(Л„, Л) + р(Л„, Л')<е + е = 2е.

Но е сколь угодно мало; следовательно,

р(Л, А') = 0,

и потому (по свойству 2°) А совпадает с А.

Последовательность {Ап}, имеющая предел, называется сходящейся (к соответствующему пределу).

Последовательность {Ап\ называется ограниченной, если ограничена числовая последовательность {р(Ап, А)\, где А— некоторый элемент £С. Понятие «ограниченная последовательность» не зависит от выбора элемента А, так как, если ограничена последовательность {р(Лл, А)}, то ограничена и последовательность {р(Ап, А")} (и обратно).

Действительно, пусть

р(Ай, А^<М (л=1, 2, 3,,..).

Полагая

р(Л', А") = т, будем иметь (по свойству 3°):

р(Л„, Л")^р(Л„, Л') + р(Л', А")<М + т.

Возникает вопрос: верно ли, что всякая ограниченная последовательность {Ап} непременно должна иметь предельный элемент? Всегда ли возможно, другими словами, обобщение теоремы Больцано-Вейерштрасса (§ 36) на произвольные метрические пространства?

Ответ на этот вопрос — отрицательный. Теорема Больцано-Вейерштрасса не распространяется, например, на пространство непрерывных функций, с «равномерной» метрикой, определяемой по формуле (26). В самом деле, рассмотрим хотя бы последовательность функций

{sin пх}. (31)

Эта последовательность — ограниченная; взяв в качестве «начального элемента» А' хотя бы функцию /= 0, мы получаем:

р (sin пх, 0) = шах | sin пх | ^ 1.

Но в основном промежутке а ^ х ^ b эта последовательность, как легко понять, не имеет ни одного предельного элемента.

Говорят, что некоторое множество А элементов метрического пространства 3? называется компактным, если всякая последовательность {Ап}, составленная из элементов А, имеет предельный элемент.

Если множество элементов метрического пространства компактно, то оно непременно ограничено.

В самом деле, в противном случае можно из o/g извлечь такую последовательность элементов {Ап}} что

Р(Ап, Л')-><х> (32)

(где А' — некоторый элемент q^). С другой стороны, по свойству компактности о/£ последовательность {Ап} имеет предельный элемент, например А; следовательно, как бы мало ни было е, бесконечное множество элементов последовательности {Ап} удовлетворяют неравенству

р(Л„, А)<г.

Для этих элементов мы получили бы, пользуясь неравенством треугольника,

р(Лт А')^9(Ап, Л) + р(А Л')<е + р(Д А') = М,

а это противоречит соотношению (32).

Из вышеприведённого примера видно, что в пространстве непрерывных функций с «равномерной» метрикой совокупность элементов ограниченной последовательности может не обладать свойством компактности.

Но мы видели (§ 36), что таким свойством обладает совокупность элементов всякой ограниченной последовательности в точечном одномерном пространстве. Легко убедиться, что это справедливо и для всякого конечномерного точечного пространства.

Проведём доказательство последнего утверждения хотя бы для случая плоскости: обобщение на /г-мерное пространство совершенно очевидно. Пусть дана ограниченная последовательность точек

Принимая в качестве «начального элемента» Ä начало координат О, мы видим, что по свойству ограниченности

но тогда одновременно

\хЛ\<М (33)

и (я=1. 2, 3, ...)•

\Уп\<М (34)

Так как числовая последовательность \хп\ согласно (33) ограничена, то она имеет предельную точку, например £. Это значит, что в промежутке

(35)

имеется бесконечное множество чисел хпУ например

Рассмотрим теперь числовую последовательность

Ур1> Ур2> • • • >Урп> • • •

Согласно (34) она — ограниченная и, следовательно, имеет предельную точку, скажем т). Это значит, что в промежутке

(36)

имеется бесконечное множество чисел ур . Отсюда ясно, что в области, определяемой совокупностью неравенств (35) и (36), имеется бесконечное множество точек Рп. Но эта область заключена целиком в круговой области

являющейся е-окрестностью точки (£, y)). Так как е произвольно мало, то эта точка есть предельный элемент нашей последовательности точек.

В компактном метрическом пространстве SC предел последовательности элементов может быть определён как единственная предельная точка.

В самом деле, пусть А есть единственная предельная точка последовательности {Ап}\ убедимся, что она есть предел этой последовательности, т. е. что при некотором е>0 лишь конечное число элементов Ап удовлетворяют неравенству

(37)

Если бы число таких элементов было бесконечным, то по свойству компактности SC всякая образованная из них последовательность имела бы хоть одну предельную точку В. В таком случае бесконечное множество элементов нашей последовательности удовлетворяло бы одновременно неравенству

р(Лп, ДХ-g-

и вместе с тем неравенству (37); и так как по свойству 3°

р(Лп> Л)<р(А, 5) + p(S, Ап),

то отсюда следовало бы заключение

Но тогда ясно, что элементы А и В различны, так что последовательность {Ап\ вопреки предположению имела бы по крайней мере две предельные точки.

Обратно, если последовательность {Ап\ имеет предел А, то она не может иметь предельной точки В, отличной от А. Действительно, в противном случае, взяв е по условию

0<е<ур(А, В), (38)

мы имели бы неравенства р(Ал, А)<е (для достаточно больших п) и р(Ал, £)<Се (для сколь угодно больших /г), откуда следовало бы

р(А, Я)^р(А, Ап) + р(Ап, В)<2е,

что противоречит неравенству (38).

Напротив, если пространство SC не обладает свойством компактности, единственная предельная точка последовательности может не быть пределом. Примером может служить последовательность в пространстве непрерывных функций с равномерной сходимостью

sin лг, 0, sin 2лг, 0, sin Злг, 0, ... , sin /глг, 0,...; (39)

она имеет единственный предельный элемент /=0, который, однако, не является пределом последовательности.

Заметим, что по поводу неограниченных последовательностей нужно сказать, что предела в собственном смысле они иметь не могут, однако в этом случае возможны различные обобщения понятия предела («предел в несобственном смысле», см. § 39).

§ 59. Топологические пространства1)

Если в пространстве введена метрика с соблюдением условий 1°—3° § 57, то тем самым устанавливается, как мы только что убедились, понятие предела последовательности элементов этого пространства.

Однако понятие предела последовательности может быть введено и независимо от метрики. Так, например, понятие простого (т. е. без требования равномерности) предела последовательности функций {fn(x)}} заданных в данном промежутке I(a^x^b)f не связано с предварительным введением метрики (см. § 45).

Говорят, что некоторое пространство SC — топологическое, если тем или иным способом в нём введено понятие предела последовательности элементов. При этом точный смысл слов «введено

1) Читатель должен быть предупреждён, что термин «топологическое пространство» в данной статье употребляется в несколько более широком смысле, чем в современной топологии.

понятие предела» заключается в следующем: устанавливается правило, согласно которому с каждой данной последовательностью {Ап\ элементов SC или не сопоставляется никакого элемента из SC или сопоставляется некоторый, только один, элемент А из SC, называемый «пределом» последовательности {Ап\. Упомянутое правило должно удовлетворять единственному требованию: если А есть предел последовательности элементов {Ап\, то А есть вместе с тем предел любой подпоследовательности («частной последовательности») элементов {АРп\- Короче: если Ап-+А, то и АРп->А. Легко понять, что множество всех функций f(x), заданных в промежутке / (или некоторая часть этого множества), представляет собой топологическое пространство, если в качестве правила, устанавливающего понятие предела, ввести простую сходимость. Вместе с тем топологическим является также любое метрическое пространство.

После того, как пространство SC «топологизировано» (т. е. в нём введено понятие предела), может быть введено и понятие предельного элемента последовательности. Именно, говорят, что элемент A m SC есть предельный элемент последовательности {Ап\ элементов из SC, если существует подпоследовательность {Лр }, Для которой А есть предел: АРп->А. Очевидно, предел последовательности {Ап} (если он существует) есть вместе с тем её предельный элемент, ипритом — единственный.

В самом деле, если бы существовал ещё иной предельный элемент, например Ä, то для некоторой подпоследовательности {АРп\ мы имели бы АРп-+Аг\ и так как по определению предела для всякой подпоследовательности Ап то отсюда следовало бы, что вопреки предположению А' и А совпадают.

Введённое выше определение предельного элемента точно соответствует свойствам предельного элемента в метрическом пространстве.

Действительно, если А есть предельный элемент последовательности {Ап} в метрическом пространстве SC, то, как бы мало ни было е, в окрестности р (X, А)<е существует бесконечное множество элементов Ап. Выберем такую последовательность положительных чисел {еп}, что ел-й); возьмём какой-нибудь элемент APl из окрестности р(Х, Ä)<ev затем какой-нибудь элемент АР2 из окрестности р(Х, А)<е2 (с ограничением /?2>pi); затем, элемент АРз из окрестности р(Х, Л)<[е3 (с ограничением р^>р^) и т. д. Тогда последовательность {ApJ обладает свойством

так что т. е.

Обратно, если существует такая подпоследовательность МР/1Ь чт0 АРп~+А, то А есть предельный элемент последовательности {Ап\. В самом деле, соотношение ЛРл->А означает, что при достаточно больших п

так что в е-окрестности точки А содержится бесконечное множество элементов последовательности \Ап\.

Понятие компактного множества переносится на общий случай топологического пространства без изменений.

Следует отметить, что в общем топологическом пространстве единственный предельный элемент последовательности не обязательно является её пределом — даже в том случае, если все элементы последовательности принадлежат некоторому компактному множеству е^1).

§ 60. Алгебра множеств. Производное множество. Замкнутость и связность

Предполагая рассматривать одновременно различные множества, составленные из элементов некоторого пространства SC, мы должны условиться в некоторых обозначениях, которыми придётся пользоваться ради краткости речи и ясности понимания. Приведём их в табличной форме.

Если orf, ef и т. д. — множества элементов из SU, то запись

Означает:

Всякий элемент множества od есть вместе с тем элемент множества ef (читается: входит в ef » или <lq/£ есть часть ef »).

То же самое, но при этом существует хоть один элемент множества ef, не являющийся элементом множества (читается: <ю/£ есть истинная часть ef»).

orf czef и вместе с тем от€ ef, т. е. множества qs£ и ef состоят из одних и тех же элементов.

1) В самом деле, пусть правило, определяющее предел, таково: последовательность {Ап} имеет предел А, если все элементы последовательности совпадают с Л. Множество, состоящее из двух различных элементов, например Р и Q, очевидно, компактно; и тем не менее последовательность, у которой первый элемент есть P, а все остальные — Q, имеет единственный предельный элемент Q, но не имеет предела.

Если <2^, <2%f и т. д. — множества элементов из SC, то запись

Означает:

Множество, составленное из всех элементов, принадлежащих или множеству о?£ или множеству о% («сумма» или «объединение» множеств orf и е^).

Множество, составленное из всех элементов, принадлежащих и множеству od и множеству («произведение» или «пересечение» множеств o/g и <з^).

«Пустое» множество (не содержащее ни одного элемента).

Скобки, как в обыкновенной алгебре, указывают порядок действий.

Справедливы утверждения:

Предполагая далее, что пространство SC— топологическое, введём понятие предельного элемента множества и понятие производного множества от множества Элемент А пространства SC (принадлежащий или не принадлежащий множеству е^) называется предельным элементом множества orf, если можно указать

последовательность \Ап\ различных между собой элементов erf, имеющую предел А:

erfn-+erf

Множество всех предельных элементов данного множества erf называется производным множеством множества erf и обознаг чается через erf'.

Приведём несколько примеров.

1. При обычной метрике, если erf есть открытый промежуток а<х<Ь, то erf'— замкнутый промежуток а^х^Ь.

2. Тот же результат, если erf — множество конечных десятичных дробей в промежутке а <х<Ь.

3. Если erf — множество точек (л:, у), удовлетворяющих условию J Q ^ J (внутренность квадрата), то erf' — множество точек, удовлетворяющих условию < o<jKl (квадрат вместе с контуром).

4. Если erf — множество точек кривой y = sm -~ (0<л;^1) (см. §41, пример 4), то erf' — множество тех же точек, с добавлением отрезка.

5. Если erf — множество дробей вида—(я — целое положительное), то erf' состоит из одного числа 0.

6. Если erf — множество дробей вида у"Ьу (Р и Я— целые положительные), то erf' — множество, составленное из дробей вида — и из числа 0.

7. Если erf — множество точек окружностей х* -\-у* =( 1 —— J (п = 2, 3, 4, .. . ), то erf' — то же множество, с добавлением точек окружности х2-{-у2= 1.

8. Если в метрике равномерной сходимости erf — множество всех многочленов (рассматриваемых в данном промежутке а^х^Ь), то erf' — множество всех непрерывных функций, заданных в том же промежутке (теорема Вейерштрасса, см. § 49).

1) Таким образом, не одно и то же — «предельный элемент последовательности» и «предельный элемент множества элементов последовательности». Например, последовательность чисел 0, 1, 0, 1, 0, 1, ... имеет предельные элементы 0 и 1, но множество, составленное из элементов этой последовательности, содержит лишь два элемента и потому (как и всякое конечное множество) не имеет предельных элементов.

Для последовательности «без повторяющихся элементов» понятие предельного элемента последовательности и предельного элемента множества элементов последовательности совпадают.

9. Если в метрике простой сходимости об — множество функций вида Л (*) = ! jÇTrfTtf (п = 1> 2> 3' •••)• 10 состоит из единственной функции

f(y\—i 1 при * = 0,

J W — \ о при д: ^ 0.

В метрике равномерной сходимости множество об* пусто.

Множество об в топологическом пространстве называется замкнутым, если

об' С=-аб.

Множество

об = об -\-об*

иногда называют замыканием множества об. Замыкание замкнутого множества, очевидно, совпадает с самим множеством; и обратно, если замыкание множества совпадает с самим множеством, то это множество — замкнутое.

Примерами замкнутых множеств могут служить:

а) Множество точек, принадлежащих замкнутому отрезку а^х^Ь.

б) Множество непрерывных функций f (х), заданных на отрезке а^х^Ь при равномерной метрике (см. § 48).

Заметим, что из об с= of следует об1 ç= (очевидно).

Теорема. В метрическом пространстве всякое производное множество замкнуто.

В виде формулы это утверждение записывается так:

об" ÇZ об\

Доказательство. Пусть А" есть некоторый элемент множества об"* Нужно показать, что, как бы мало ни было е, существует такой элемент А из об% что

Р(Л, Л")<е.

Так как А" есть предельный элемент множества об*, то существует такой элемент А' из об'> что

р(а; а»)<-~.

С другой стороны, так как А' есть предельный элемент множества об* то существует такой элемент А из об, что

Р(Л A'X-j.

В таком случае, по свойству треугольника,

р (А, А") ^ р (Л Л') + р (Л', Л") < -J + у =е,

что и требовалось доказать.

Эта теорема, как легко понять, обобщает на произвольные метрические пространства теорему, сформулированную на стр. 163.

В произвольном топологическом пространстве теорема неверна.

Множество osé в топологическом пространстве 37 называется связным, если нельзя указать двух таких множеств <Jû и &V* в том же пространстве, чтобы выполнялись условия:

(40)

Примеры (относящиеся к случаю обыкновенной евклидовой метрики).

10. Множество, состоящее из двух чисел а и b (а ф Ь), не является связным: множество <М можно взять состоящим из одного элемента а, множество ®/Г — состоящим из одного элемента Ь.

11. Аналогично в случае множества, составленного из точек двух кругов

(x + c)*-\-y*<R* и (*_с)2+У</г2,

при условии c>R>0 и даже при с = /?>0.

12. Если числовое множество содержит элементы а и с, но не содержит Ьу причём а<Ь<с, то оно — не связное. В качестве <JÛ можно взять совокупность точек множества х, для которых х<Ъ\ в качестве (&V — совокупность тех точек х, для которых x > Ъ.

13. Числовое множество (замкнутый промежуток) а^х^Ь связно.

Это утверждение могло бы показаться очевидным, однако формальное доказательство его не так просто. Наметим ход доказательства «от противного», предоставляя читателю воспроизвести его во всех деталях.

Принимая промежуток а ^ x ^ b за qt^, из условий 1° и 3° (40) заключаем о существовании точки mv принадлежащей множеству &/£о/%>> и точки пи принадлежащей множеству о^®4^. Из условия 2Ô следует: g^W3 = о. Поэтому

Шуфпь пусть, например, т1<л1. Точка mi ~^ П1 принадлежит значит,принадлежит или o/fù или В первом случае положим т2 = —^— » п* = п^ во втором ma = mu na = ——- ; затем будем так же рассуждать по поводу т2 и п2. Продолжая эту процедуру, убедимся, что общий предел £ монотонных последовательностей чисел m и чисел п будет принадлежать множеству g#W". Принимая во внимание, что само £ принадлежит или o/fù или ©^°, получим противоречие с равенствами

<Л®4^% = <JV&T = 0.

14. Сказанное о замкнутом промежутке переносится на любой промежуток.

Обратно, всякое связное множество точек на числовой оси является промежутком (конечным или бесконечным, замкнутым или незамкнутым, или «полузамкнутым», т. е. замкнутым лишь с одного конца; см. выше пример 12).

Множество в пространстве SC, связное и замкнутое в этом пространстве, называется континуумом.

Итак, если под пространством SC понимать «одномерное евклидово пространство», т. е. числовую прямую с обычной метрикой, то в этом пространстве континуумы исчерпываются замкнутыми промежутками.

В «двумерном евклидовом пространстве», т. е. на плоскости с обычной метрикой, имеются более разнообразные типы континуумов: сюда относится, например, всякий квадрат со включением сторон и вершин или ещё всякий круг со включением контура (окружности).

§ 61. Непрерывные отображения и их свойства

Пусть топологическое пространство SC отображено на топологическое пространство У. Условимся через Y=f(X) обозначать тот элемент У, который соответствует элементу X пространства SC.

Если есть некоторое множество элементов SC, то через / (&£) условимся обозначать совокупность элементов множества У, соответствующих элементам множества е^.

Отображение

Y = f{X)

называется непрерывным относительно элемента X, если из соотношения

вытекает соотношение

/(*„)-*/(*);

оно называется непрерывным на множестве osé, если непрерывно относительно любого элемента множества orf.

Установим несколько свойств непрерывных отображений.

Теорема I. Если множество о/£ (erSC) связно и отображение Y=f (X) непрерывно на множестве о/£, то множество =f (osé) (ci У) также связно.

Будем доказывать от противного. Пусть не связно. Тогда существуют такие множества <JC и <&V*, что

Так как <JC<&V* — О, то ни один элемент Л множества об не отображается на некоторый элемент множества 4 и на некоторый элемент множества одновременно. Обозначим через <ût множество тех элементов Л, которые отображаются на <Ж\ через <3? — множество тех элементов А, которые отображаются на ®^\

Очевидно, е/Г ф 0 и <S? ф 0 (так как о^^Ои @/Г ф 0), и притом <Ж*3> ф 0. Докажем, что оЯСЗ" = 0. Если бы было ф 0, то существовал бы элемент А множества еЗГ, который был бы предельным элементом множества и тогда из множества *S? можно было бы выделить такую последовательность элементов {Ап}, которая имела бы пределом элемент А множества еЗГ:

Ап-+А.

В таком случае вследствие непрерывности отображения мы получили бы

/(Л„) - /(А).

Это значит, что существовала бы последовательность {/ (Ап)} элементов множества ®/Г, которая имела бы пределом элемент множества qS\ но тогда мы имели бы <Jl&V" ф 0, что противоречит условию 2°. Итак, сУС*3" = 0; и точно так же e^T'J? = 0. В итоге мы получаем:

т. е. выходит, что множество об не связно, вопреки сделанному предположению. Теорема I доказана.

Теорема II. Если множество об (<= SU) компактно и замкнуто и отображение Y=f (X) непрерывно на об, то множество of = f (об) (<= У) компактно.

Теорема III. При тех же предположениях множество е% =f (об) (<=30 замкнуто.

Пусть { Вп } — некоторая последовательность элементов ef. Обозначим через Ап какой-нибудь элемент об из числа отображаемых на Вп; таким образом,

Bn = f(An) (n=h 2, 3, ...).

Рассмотрим последовательность { Ап } элементов об. Так как множество об компактно, то можно выделить подпоследовательность {АРп }, имеющую предел в SC\ обозначим его через Л. Так как об замкнуто, то А принадлежит множеству об. Вследствие того, что отображение непрерывно на множестве об, из соотношения

АРп -> Л

следует соотношение

f(APn)^f(A). (41)

Мы видим, что последовательность {/ (АРп )}, т. е. { Bph }, — сходящаяся: всякая последовательность {Вп ) элементов е%? имеет предельный элемент. Значит, множество е%1— компактное, и теорема II доказана.

Чтобы доказать теорему III, возобновим то же рассуждение при дополнительном предположении

Вп В, (42)

где В — некоторый элемент пространства У. Соотношению (41) можно придать вид

ВРя-+/(А)9 (43)

и так как предел последовательности {ВРп} по определению предела не может быть отличен от предела последовательности {Вп}, то мы получаем из (42) и (43):

В=/(А).

Но А есть элемент ', и раз он отображается на В, то, следовательно, В принадлежит множеству ef, что и требовалось доказать.

Как весьма частный случай, можно допустить, что топологические пространства SC и У— числовые множества, составленные из всех действительных чисел, с обычной метрикой; множество erf — промежуток, какой угодно (применительно к теореме I) или замкнутый (применительно к теоремам II и III).

Тогда, понимая под f (х) обыкновенную функцию одного действительного переменного, заданную и непрерывную в рассматриваемом промежутке, и применяя теоремы I, II и III, мы приходим к заключению (соответственно), что множество значений, принимаемых функцией f (х) в этом промежутке:

1) связно, т. е. представляет собой некоторый промежуток (см. § 60, пример 14);

кроме того, при дополнительном допущении замкнутости рассматриваемого промежутка, оно:

2) компактно, т. е. ограничено (см. § 36 и § 57);

3) замкнуто, и потому существует наибольшее и наименьшее среди принимаемых значений.

Это как раз теоремы I, II и III § 47. Но теперь им придана чрезвычайная общность.

Теорему IV § 47 — о равномерной непрерывности также можно обобщить; но она по существу — метрического содержания, и потому обобщение производится на метрические, а не на произвольные топологические пространства.

Теорема IV. Пусть компактное и замкнутое множество erf в метрическом пространстве SC посредством соотношения Y=f(X) непрерывно отображено на некоторое множество effl = f(erf) в метрическом же пространстве У. Тогда, как бы мало ни

было е ( > 0), можно указать такое число 8, что из неравенства

9(Х, Х")<Ъ (44)

(где X и X" — произвольные элементы qà?) следует неравенство

Р (/(*'), /(*")) О (45)

Доказательство аналогично приведённому на стр. 220—221. Пусть не со всяким е можно сопоставить число 8, обладающее требуемым свойством. Значит, существует такое е* ( > 0), что к каждому числу из последовательности {8П} (где 8П > 0, 8П 0) можно подобрать такие пары элементов х'пу Хп из что

и, однако,

Р(/(Х), f(X:))^e*. (46)

Так как &>£ компактно, то из последовательности {хп} можно выделить такую сходящуюся подпоследовательность {^рлЬ что

Х'Рп -у Е, (47)

причём вследствие замкнутости orf элемент S принадлежит множеству od. Тогда и

Х"Рп -> Е; (48)

в самом деле,

р (*;„> в) ^ р (Кп> ка)+р (*v s).

и так как оба слагаемых справа стремятся к нулю, то стремится к нулю и левая часть.

Из соотношений (47) и (48), далее, следует по непрерывности:

/(^n)-v/(S), f(X;n)-+f(S). (49)

Неравенство (46), в частности, нам даёт:

р (/(*;„>> г(К„))^**>

и теперь противоречие налицо, так как из соотношений (49) легко следует:

р (/(*;> /(Кп))^о.

§ 62. Гомеоморфные отображения

Предположим, что два множества SC и У отображены одно на другое взаимно однозначно и взаимно непрерывно. Это значит:

1° С каждым элементом X из J сопоставлен один и только один элемент Y=f (X) из У и, обратно, с каждым элементом Y

из У сопоставлен один и только один элемент X=g(Y) из SC\ именно тот, который отображается на Y (см. § 54).

2° Если последовательность {Хп\ элементов из SC связана с элементом Ху также из SC у соотношением

Хп X, (50)

то последовательность элементов { Yn}, где Yn=f (Хп)> связана с элементом f, где Y = f(X) (очевидно, также принадлежащим У), соотношением

Уп -* Y, (51)

т. е.

f(Xn)-+f(X),

и обратно: из соотношения вида (51) следует соотношение вида (50), где Xn = g{Yn), X=g(Y).

Такого рода отображение множества SC на множество У (и также множества У на множество SC) называется гомеоморфным отображением. Будем говорить кратко, что множества SC и У гомеоморфны между собой, если между ними можно установить гомеоморфное отображение.

В гомеоморфном отображении элементы X (из SC) и Y (из У), взаимно друг с другом сопоставляемые, называются соответственными (гомологическими).

Простейший пример гомеоморфного отображения даётся подобием двух фигур F и Р; именно, гомеоморфное отображение в этом случае таково, что, каковы бы ни были точки M и N фигуры F, между ними и им соответственными точками ЛГ и N' фигуры F существует зависимость

где X (> 0) — постоянный коэффициент подобия. Допуская для простоты, что фигуры F и F не только подобны, но и подобно расположены относительно начала координат О, мы получаем зависимости между координатами точек M (Ху у) и М' (х'у у'):

(52)

Совершенно очевидно, что если обозначим через {Мп (хт уп)} последовательность точек фигуры F, имеющую пределом точку М(х, у) той же фигуры, и через {M' (xni у'п)} и M' (jc, у) — гомологические точки фигуры F', то взаимная непрерывность отображения выразится в том, что если

хп-+х и уп-+У>

то

х'п-^х' и у'п-*У,

и обратно.

Другой, менее тривиальный, пример гомеоморфного отображения — инверсия фигуры F на фигуру F (см. § 56, стр. 262); формулы (52) заменяются теперь следующими:

(53)

Если фигура (множество точек) F не содержит начала координат, то взаимная непрерывность, как легко видеть из формул (53), обеспечена.

Прежде чем перейти к дальнейшим примерам гомеоморфных отображений (причём мы ограничимся примерами на плоскости с обычной метрикой), установим одно вспомогательное предложение общего характера.

Если множество 37 гомеоморфно отображено на множество У, то тем самым всякая часть 37 х множества 37 также гомеоморфно отображается на ту часть Ух множества У, которая ей соответствует в силу установленного отображения.

В самом деле, если {Хп}— последовательность элементов из 37v сходящаяся к элементу Ху тоже из 37v то

где все элементы Yn=f(Xn) (л=1, 2, 3, ...) и элемент Y=f(X) принадлежат множеству У. Но так как каждый из них по построению множества У х принадлежит также и этому последнему множеству и так как всё это рассуждение в целом обратимо, то соотношение, установленное между 37х и Ух, является гомеоморфным отображением.

Таким образом, если

37 = 37j —J— 37g и 37х37^== О

и если 37 гомеоморфно отображено на У, причём 37г отображено на У1у а 37\ — на У^ то оба отображения 37х на Ух и 37\ на У%— тоже гомеоморфные.

В частности, допуская, что 37\ состоит из одного элемента, приходим к заключению: если множество 37 гомеоморфно отображено на множество У, то отображение между множествами, полученными после удаления из 37 одного элемента и соответственного ему элемента из У, также продолжает оставаться гомеоморфным.

Этот результат совместно с теоремами предыдущего параграфа позволит нам в ряде случаев убедиться в невозможности установить между двумя множествами гомеоморфное отображение.

Всякие два замкнутых отрезка гомеоморфны между собой (так как они подобны). Также и всякие два открытых отрезка (без конечных точек). Но замкнутый и открытый (или полузамкнутый) отрезки

не гомеоморфны, так как при непрерывном отображении замкнутого множества получается также замкнутое множество (§ 61, теорема II). Полузамкнутый отрезок и открытый отрезок также не гомеоморфны: действительно, допуская противное, удалим из полузамкнутого отрезка его единственную концевую точку и из открытого— ту точку, которая гомологична этой точке; оставшиеся множества по предыдущему должны быть гомеоморфны; но это невозможно, так как одно из них связно, другое же — наверное не связно (§ 61, теорема I).

Один отрезок не гомеоморфен паре (объединению) отрезков без общих точек (по той же теореме). Один отрезок не гомеоморфен также системе (объединению) трёх отрезков без общих точек; пара отрезков без общих точек не гомеоморфна системе трёх отрезков без общих точек и т. п. Но один замкнутый отрезок гомеоморфен паре замкнутых отрезков, имеющих общую концевую точку. Например, отрезок [0, 1] гомеоморфен ломаной линии ABC. Для доказательства достаточно установить хотя бы одно гомеоморфное отображение; можно отобразить отрезок £о, yj на AB посредством подобия и отрезок lj на ВС таким же образом. Вообще любая ломаная линия, себя не пересекающая и не образующая замкнутого многоугольника, гомеоморфна отрезку. Таковы, например, буквы1)

г, м, п.

Однако буква X не гомеоморфна отрезку. В самом деле, допуская противное, удалим из этой буквы среднюю точку горизонтального отрезка, являющуюся вместе с тем концевой для вертикального, а из отрезка, гомеоморфного рассматриваемой букве, — точку, гомологичную удалённой: останется в одном случае система из трёх отрезков без общих точек, в другом — один отрезок или пара отрезков.

Буквы

е, Ш, Ч, ц

также не гомеоморфны отрезку, но гомеоморфны букве Т и, следовательно, гомеоморфны между собой.

Буква Щ гомеоморфна букве Н, но не гомеоморфна ни отрезку, ни какой-либо из ранее названных букв.

Буква О (окружность) не гомеоморфна ни отрезку, ни ранее названным буквам. Действительно, при противоположном допущении, удаляя из отрезка какую-нибудь точку, отличную от концевых (если

1) Разумеется, «буквы» понимаются здесь в идеализированном смысле — как бы проведённые «бесконечно тонким» пером.

таковые имеются) и гомологичную ей точку окружности, мы получили бы в одном случае несвязное, в другом — связное множество.

Эллипс гомеоморфен окружности: растяжение, как и его частный случай — преобразование подобия, представляет собой гомеоморфное отображение.

Читатель легко продлит перечень примеров этого рода. Может быть, занимаясь «буквами», он исчерпает весь русский алфавит, разбив буквы на ряд групп таких, что буквы из одной группы будут гомеоморфны между собой, а из различных групп — не гомеоморфны.

Дальнейшие и более разнообразные примеры содержатся в статьях, посвященных топологии (см. Э. э. м., кн. IV).

Здесь же мы имеем в виду остановиться ещё на одной стороне вопроса. Ограничиваясь простейшим примером гомеоморфного отображения замкнутого отрезка на замкнутый отрезок, постараемся выяснить, в какой степени неопределённой является задача реализовать (установить) такого рода отображение.

Мы уже видели раньше (§ 52), что всякая монотонная (возрастающая или убывающая) непрерывная функция у =/(лг) устанавливает гомеоморфное отображение отрезка [а, Ь] на оси Ох на отрезок [А, В] на оси Oy.

Убедимся в справедливости обратного утверждения: если между отрезками [а, Ь] на оси Ох и [А, В] на оси Oy установлено гомеоморфное отображение, то оно реализуется посредством функции y=f (х), обладающей свойствами монотонности и непрерывности.

Поскольку гомеоморфное отображение есть частный случай однозначного, можно заключить о существовании функции у =/(х), реализующей данное отображение; поскольку данное гомеоморфное отображение устанавливает непрерывную зависимость между точками отрезка [а, Ь] и точками отрезка [А, В], можно судить о непрерывности функции / (лг). Остаётся убедиться в её монотонности.

Концевой точке одного отрезка должна непременно соответствовать концевая же точка другого отрезка: иначе, если бы, например, точке а первого отрезка соответствовала внутренняя точка у\ второго отрезка, то, удаляя эти обе точки, мы получили бы в одном случае связное, в другом — несвязное множество. Возможны два случая: 1) f (а) = A, f(b) = B, 2) f(a) = B, f(b) = A; остановимся на первом.

Так как предполагается, что а < b, А < В, то функция f(x) не может быть убывающей; докажем, что она — возрастающая. При противоположном допущении существовали бы такие две точки х' и х", что

а ^ x' < x" ^ b

и вместе с тем было бы

/(*')>/(*")•

Допустим сначала, что а<х'. Возможность равенства f(à) =/(jc') исключена вследствие взаимной однозначности отображения.

Предположим, что f(a)<f(x'). Пусть С — какое-нибудь число, заключённое между наибольшим из чисел f(a) и f {х") и числом f (х'). По свойству I непрерывных функций (§ 47) функция f (х) должна принимать хоть раз значение С в промежутке (д, х') и в промежутке (jc', x"); a это несовместно со взаимной однозначностью отображения.

Если бы было f (a)>f (х'), то аналогичным образом пришлось бы рассуждать относительно промежутков (л:', х") и (лг", Ь)1), взяв в качестве С

1) Равенство х" = Ь не было бы возможно, так как мы имели бы/(л;")< < f(x')<f(a) и вместе с тем f (a) </(£).

число, заключённое между f (х") и наименьшим из чисел f(x') и f(b). Это же самое рассуждение было бы пригодно и при допущении а = х'.

Так как случай 2) вполне аналогичен случаю 1), то теорему следует считать доказанной.

§ 63. Верхняя и нижняя границы числовых множеств или последовательностей. Верхний и нижний пределы числовых множеств или последовательностей

Среди прочих множеств числовые множества (т. е. множества действительных чисел) резко выделяются свойством быть «упорядоченными» естественным образом — по величине: относительно каждых двух различных элементов числового множества х и у всегда можно сказать, которое из двух соотношений порядка

х<у или х>у

будет справедливым.

Мы пользуемся в дальнейшем обыкновенной метрикой, в которой

р(лг, у) = \х—у\.

Пусть множество Е ограничено сверху: это значит, что существует такое число М, что всякое число х из Е меньше, чем М:

лг<ЛГ. (54)

Если множество Е ограничено сверху и число MQ обладает свойствами:

1° х^М0 для всякого элемента х из Е, 2° х = М0 хотя бы для одного элемента х0 из Е, то число М0 есть наибольший элемент из Е (иначе, максимум).

Не всякое ограниченное множество содержит наибольший элемент. Об этом свидетельствуют примеры, отчасти нам уже знакомые: открытый справа промежуток (0, 1) или [0, 1), множество правильных рациональных дробей, множество чисел вида 1--- или множество чисел вида 1---— (где m и п — натуральные числа)

и т. п.

Число G, связанное с данным ограниченным сверху множеством Е, называется верхней границей (или верхней гранью) множества Еу если оно обладает двумя свойствами:

1° x ^ G для всякого элемента х из Е,

2° как бы мало ни было е(]>0), x>G — е хотя бы для одного элемента х из Е.

Очевидно, множество Е не может иметь двух различных верхних границ. В самом деле, если бы Е имело верхние границы Gt и G2, причём было бы, например, Gl<G2f то для некоторого элемента мы должны были бы иметь неравенства

которые, однако, при выборе е согласно условию e<G2 — Gx содержали бы противоречие.

Если множество Е имеет наибольший элемент М0, то этот наибольший элемент М0 и есть верхняя граница Е:

G = M„.

Действительно, условие 1° одно и то же для верхней границы и для наибольшего элемента; что же касается условия 2°, то как бы мало ни было е(>0), из равенства х = М0, конечно, следует неравенство х>М0 — е.

Теорема. Всякое непустое ограниченное сверху числовое множество Е имеет верхнюю границу.

Пусть M — такое число, что для всех х из Е справедливо неравенство х<Му и L — число, меньшее чем какой-нибудь элемент множества Е.

Тогда промежуток [I, М] длины А = М — L обладает следующими свойствами:

(а) в нём содержится хоть один элемент множества Е;

(ß) нет ни одного элемента множества Е, который был бы больше любого числа из промежутка (который, другими словами, был бы больше, чем его правый конец).

Рассмотрим теперь промежутки ^L, и р — , Mj. Один из них (по меньшей мере) обладает свойствами (а) и (ß); обозначим этот промежуток через [Lit Мг].

Рассмотрим далее промежутки

Один из них (по меньшей мере) обладает свойствами (а) и (ß); обозначим его через [12, М%].

Продолжая таким образом до бесконечности, мы получим последовательность промежутков {[Ln, Мп]\, обладающих каждый свойствами (а) и (ß), и таких, что

1) каждый промежуток [Ln, Мп] содержит следующий за ним

2) длины промежутков образуют сходящуюся геометрическую прогрессию Мп+1 — Ln+l = у (Мп — Ln), так что Mn — Ln = ^.

Отсюда следует существование общего предела, который мы обозначим через G: lim Ln = lim Мп = G.

Очевидно, при любом п справедливы неравенства Ln^G^Mn.

Покажем, что число G обладает свойствами 1° и 2°.

Пусть существует такой элемент х0 из Е, что х0 > G. Тогда, выбрав п по условию ^<х0 — G, мы убедимся, что at0>G-|-^^2 ^zLn-\--~ = Mn, а это противоречит свойству (ß) промежутка [Ln, Мп]. Итак, число G обладает свойством 1°.

Пусть теперь s — некоторое положительное число и пусть все элементы х из Е удовлетворяют неравенству x^G— е. В таком случае, выбрав п по условию ^<е, мы получим опять для всех элементов множества Е:

а это противоречит свойствам (а) промежутка [Ln, Мп]. Итак, число G обладает свойством 2°.

Но раз число G обладает свойствами 1° и 2° верхней границы, значит, оно и есть верхняя граница нашего множества Е.

Определение верхней границы G множества Е, ограниченного сверху, можно перефразировать следующим образом.

Верхняя граница G множества Е есть одно из двух:

если существует наибольший элемент множества, то G с ним совпадает;

если не существует наибольшего элемента множества Е, то G есть наименьшее из чисел М, удовлетворяющих неравенству (54), где х — произвольный элемент из Е.

В первом случае само число G, очевидно, есть элемент множества Е; во множестве же чисел М, удовлетворяющих неравенству (54), не существует наименьшего1).

Во втором случае G не есть элемент множества Еу иначе неравенство x<M(=G) должно было бы удовлетворяться при x = G.

Можно утверждать также и следующее:

Верхняя граница G множества Е, ограниченного сверху, есть одно из двух:

или изолированный наибольший элемент множества Е,

или предельная точка (см. § 36) множества Е.

(Изолированным элементом множества мы называем такой элемент, что в некоторой его окрестности нет других элементов множества.)

В самом деле, пусть G есть наибольший элемент Е, но не изолированный. Возьмём последовательность положительных чисел {еп\, удовлетворяющую требованию ея->0, и, пользуясь свойством 2° верхней границы, к каждому еп подберём элемент хп множества Е по условиям xn>G — еп и хп ф G2). Вместе с тем по свойству 1° хп^G, и потому, как легко понять, xn-*G. Среди точек последовательности {хп\ имеется бесконечное множество различных; действительно, имея уже точку xnv мы получим точку хП2, наверное отличную от x„v если п2 будет настолько велико, что en2<G — xnt9

1) Любое число, большее чем G, может быть взято в качестве М; среди этих чисел, однако, нет наименьшего.

2) Такой выбор возможен, так как G — не изолированный элемент fi.

и т. д. Отсюда ясно, что в любой окрестности точки G имеется бесконечное множество различных точек Е, т. е. G есть предельная точка множества.

Отнюдь не исключено, конечно, что верхняя граница G множества есть одновременно и наибольший его элемент (не изолированный) и его предельная точка. Примерами могут служить: точка 1 в случае промежутка [0, 1] или та же точка в случае множества, составленного из точек вида 1 —— (п — натуральное) и ещё точки 1.

Всякое замкнутое множество Е содержит наибольший элемент.

Именно наибольшим элементом замкнутого множества Е является его верхняя граница G.

В самом деле, мы только что доказали, что G есть или изолированный наибольший элемент множества Е или его предельная точка. Но если G есть предельная точка Е} то G есть элемент производного множества Е' и раз множество Е' замкнуто (т. е. Е' Ç^E, см. § 60), то G должно быть также элементом Е.

Мы можем теперь обратиться к понятию верхнего предела множества, ограниченного сверху.

Число L, связанное с данным множеством Еу ограниченным сверху, называется верхним пределом этого множества, если оно обладает свойствами:

1° Как бы мало ни было еО>0), неравенству x<L-\-e удовлетворяют «почти все» элементы Е (т. е. все, кроме, может быть, конечного их числа).

2° Как бы мало ни было е.ОО), неравенству x>L — е удовлетворяет бесконечное множество элементов Е.

Конечные множества, очевидно, верхнего предела не имеют.

В случае же, если ограниченное сверху множество Е бесконечно, свойства 1° и 2° верхнего предела L множества Е можно охватить следующей строго эквивалентной формулировкой:

Верхний предел L множества Е есть наибольшая из предельных точек этого множества (т. е. наибольший элемент производного множества Ег).

Действительно, из условий 1° и 2° вытекает немедленно, что в любой окрестности точки L содержится бесконечное множество элементов множества Et так что L есть предельная точка Е. Вместе с тем L — наибольшая из предельных точек Е, так как существование ещё одной предельной точки L\ большей чем L, противоречило бы условию 1° (если бы е было выбрано меньшим, чем V — L).

Обратно, если L есть наибольшая из предельных точек Е, то условие x<L-\-e может не быть выполнено лишь для конечного множества точек из Е: иначе по теореме Больцано-Вейерштрасса (см. § 36, примечание 2) множество Е имело бы хоть одну предельную точку U такую, что Lr^L-j-e. Таким образом мы приходим к свой-

ству 1°. Свойство же 2° следует из того, что L есть предельная точка Е.

Теорема. Всякое ограниченное сверху бесконечное числовое множество Е имеет верхний предел.

В самом деле, производное множество ЕТ непременно замкнуто (см. § 37, стр. 163); следовательно по предыдущему оно имеет наибольший элемент.

Верхний предел бесконечного множества не превышает его верхней границы:

L^G. (55)

В противном случае, т. е. при допущении L > G, свойство 2° верхнего предела и свойство 1° верхней границы оказались бы в противоречии.

Легко понять, что в соотношении (55) должен стоять знак неравенства или знак равенства, смотря по тому, является ли верхняя граница изолированным элементом множества Е или его предельной точкой.

Следующие понятия, отношения и теоремы вполне аналогичны изложенным выше. Условие

х>т, (56)

предполагаемое выполненным для всех элементов множества Е, означает, что это множество ограничено снизу. Если число т0 таково, что 1° х^т0 для всякого элемента х из Еу 2° х = т0 хотя бы для одного элемента х0 из Е, то оно называется наименьшим элементом Е (иначе, минимумом).

Число g называется нижней границей (или нижней гранью) множества Е, если справедливо следующее: 1° x^g для всякого элемента х из Е,

2° как бы мало ни было s (>0), x<g-\-z хотя бы для одного элемента х0 из Е.

Если множество Е имеет наименьший элемент т0, то т0 есть вместе с тем нижняя граница g:

g = m0. (57)

Теорема. Всякое непустое ограниченное снизу числовое множество имеет нижнюю границу.

Нижняя граница есть одно из двух: или наименьший элемент множества Е>

или наибольшее из чисел т, удовлетворяющих неравенству (56) для всех x из Е.

Вместе с тем g есть одно из двух:

или изолированный наименьший элемент множества Е,

или предельная точка этого множества.

Всякое замкнутое множество содержит наименьший элемент.

Число / называется нижним пределом множества Е, если справедливо следующее:

1° При сколь угодно малом е О 0) неравенству х>1 — е удовлетворяют «почти все» элементы Е.

2° При сколь угодно малом е (>0) неравенству л;</-|-е удовлетворяет бесконечное множество элементов Е.

Иначе говоря (для случая бесконечных множеств): / есть наименьшая из предельных точек множества Е.

Теорема. Всякое ограниченное снизу бесконечное множество имеет нижний предел.

Нижний предел бесконечного множества больше или равен его ниэюней границе:

l^g. (58)

Так как вполне очевидно для бесконечных множеств, что никогда нижний предел не превышает верхнего, то мы получаем цепь неравенств:

g^l^L^G. (59)

Случай l = L возможен тогда и только тогда, когда множество имеет только одну предельную точку. Такая точка является просто пределом множества.

Случай g=G возможен тогда и только тогда, когда множество состоит из одной точки.

Мы рассматривали до сих пор только множества, ограниченные сверху или снизу. Если множество не ограничено сверху, иногда уславливаются полагать, что

L = G = -f оо.

Если множество не ограничено снизу, полагают таким же образом:

/ = £• = —оо.

Понятия верхней и нижней границ множества и верхнего и нижнего пределов множества переносятся также на случай последовательности.

Имея некоторую последовательность чисел {ап}, мы всегда можем связать с нею множество Е чисел, являющихся членами этой последовательности.

Под верхней и нижней границей последовательности понимают (соответственно) не что иное, как верхнюю и нижнюю границу связанного с нею множества — невзирая на то, что это множество может оказаться и конечным. Таким образом, определение верхней, например, границы последовательности почти буквально совпадает с определением верхней границы множества:

Число О называется верхней границей (гранью) последовательности {ап}, если оно обладает свойствами:

1° ап^О при всех значениях п (п= 1, 2, 3, ... ),

2° как бы мало ни было е(>0), an>Q — е хотя бы при одном значении п.

Легко понять, что верхняя граница последовательности совпадает с верхней границей множества элементов этой последовательности.

Что касается определения верхнего (и соответственно нижнего) предела последовательности, то, хотя оно формулируется почти буквально так же, как для множества, в содержании этого понятия есть некоторая особенность.

Число L называется верхним пределом последовательности {ап\, ограниченной сверху, если оно обладает свойствами:

1° как бы мало ни было s ОО), неравенство ап<Ь-\-г выполняется при «почти всех» значениях п (т. е. для достаточно больших значений /г),

2° как бы мало ни было е(>0), неравенство an>L — е выполняется для бесконечного множества различных значений п (т. е. для сколь угодно больших значений п).

При таких условиях оказывается, что любая последовательность, ограниченная сверху, имеет верхний предел даже в том случае, если множество, составленное из членов последовательности, содержит лишь конечное число элементов.

Аналогично, конечно, для нижнего предела.

Так, верхний и нижний пределы последовательности {(—1)я} соответственно равны -\-\ и —1, хотя множество членов последовательности конечно: состоит всего из двух элементов — этих же самых чисел -\-I и —11).

Считаем нужным познакомить читателя с обозначениями для верхней и нижней границы множества Е или последовательности {ап\:

G = sup£, g-=inf£2)

и

G = sup{an\, g = inl{an\.

Что касается верхнего и нижнего предела, то для них приняты • обозначения:

L = \ïmE, 1 = \'т_Е

и

L — Um ап, / = Ит Дя.

1) Сопоставляя понятия множества чисел и последовательности чисел, не следует упускать из виду и то обстоятельство (в данной связи нас не интересующее), что не всякое множество чисел может быть расположено в форме последовательности] это невозможно для случая множеств несчётных (см. Э. э. м., кн. I, стр. 93).

2) «sup» и «inb— сокращения латинских слов «superior» и «inferior» — «верхний» и «нижний».

Так, в случае множества или1) последовательности чисел (п— натуральное) мы получаем:

Запись \\тап = Ь, как легко понять, может быть истолкована в том смысле, что для некоторой последовательности натуральных чисел [rip] имеет место предельное отношение (в обычном смысле) \\тап=Ь, тогда как при любом е(>0) выбрать последовательность {пр\, удовлетворяющую требованию lim аПр = L -f- е, уже невозможно.

В соответствии с этим запись

(60)

понимается в том смысле, что существует последовательность \хп\, хп-+с, для которой \imf(xn) = L, тогда как при сколь угодно малых е выбрать последовательность {хп\, хп-+с, удовлетворяющую требованию Ит/(хп) = Ь-\-е, уже невозможно.

Аналогично — относительно нижнего предела.

Числа lim f(x) и lim f(x) носят названия верхнего и нижнего предела значений функции f(x) в точке х = с. Очевидно, что

причём знак равенства достигается в том и только в том случае, если функция f(x) непрерывна в точке х = с.

Примером может служить функция /(*) = sin-^ (см. § 41, стр. 182);

для неё мы получаем:

Вводя дополнительные ограничения х>с или х<с, можно также определить понятия правого верхнего и правого

1) В данном случае выбор термина безразличен, так как среди членов последовательности нет одинаковых.

нижнего, а также левого верхнего и левого нижнего предела значений функции в данной точке.

В заключение следует обратить внимание читателя на то, что все введённые выше понятия, в первую очередь — понятия верхней и нижней границы множества, нередко служат целям сокращения и упрощения («унификации») доказательств.

Приведём несколько примеров, причём ограничимся теоремами, нам уже известными. Намечаем лишь схему доказательств, предлагая читателю в качестве упражнения воспроизвести их детали.

1. Любое ограниченное сверху бесконечное множество имеет верхний предел (см. стр. 291).

Пусть Е — данное множество. Рассмотрим множество $ точек лг, из которых каждая меньше лишь конечного числа точек множества Е. Нижняя граница множества $ и есть верхний предел множества Е.

2. Если функция f (х) непрерывна в промежутке [а, Ь], причём f (а) < О, /(£)>0, то в некоторой внутренней точке промежутка f(x) обращается в нуль (теорема Больцано, § 47, стр. 215).

Рассмотрим множество S точек je, в которых /(а*)>0. Нижняя граница множества $ представляет собой точку, в которой функция / (лг) обращается в нуль.

3. Если функция f(x) непрерывна в промежутке [а, Ъ\ то множество её значений в этом промежутке имеет наибольший элемент (теорема Вейерштрасса, § 47, стр. 218).

Пусть (^ — множество значений функции f(x) в рассматриваемом промежутке, G — его верхняя граница. Допустим (доказывая от противного), что не существует такой точки л: = £, в которой /(Ç) = G.

Рассмотрим новую функцию

Она непрерывна в промежутке [я, Ь] и потому (теорема II на стр. 217) ограничена сверху:

<?(х)<М.

В таком случае при всех значениях х из промежутка

и следовательно, G не есть верхняя граница множества значений f(x).

4. Замкнутый промежуток = [а, Ь] — связное множество (§60, стр. 278). Пусть qt€ не связно; тогда существуют такие множества o/fù и ®^", что

Предположим, например, что точка а принадлежит множеству <JÙ\ обозначим через g нижнюю границу множества о^. Точка g или принадлежит или не принадлежит: но в последнем случае она принадлежит множеству o/fù.

Если g принадлежит то все точки х, удовлетворяющие неравенству a^lx<.g, принадлежат o/fù\ тогда само g есть предельный элемент o/ft, так что оМг'оЛ^фО, что противоречит условию 2°.

Если g принадлежат <Ji, то во множестве существуют точки, сколь угодно близкие к g, и значит, g есть предельный элемент ®^*, так что <М®/ГХ фО, а это противоречит условию 2\

Теорема доказана1).

Предоставляем читателю судить о том, насколько выигрывают доказательства предшествующих теорем в отношении чёткости и сжатости благодаря использованию понятия границ.

1) См. Э. э. м., кн. IV, П. С. Александров и В. А. Ефремович, Основные топологические понятия, гл. 3, п. 3.

И. П. НАТАНСОН

ПРОИЗВОДНЫЕ, ИНТЕГРАЛЫ И РЯДЫ

ВВЕДЕНИЕ

Величины, с которыми людям постоянно приходится иметь дело при изучении природы, являются в большинстве случаев величинами изменяющимися или, как часто говорят, переменными. Температура воздуха, давление пара в котле, напряжение тока в электрической сети, скорость самолёта, — все эти величины с течением времени изменяются и, следовательно, являются величинами переменными. Однако лишь в эпоху XVI — XVII вв. под влиянием практических потребностей бурно развивающегося естествознания и техники математика овладела общим понятием переменной величины, и с этих пор переменные величины стали основным объектом математических исследований. Большую роль при этом сыграли математические работы Декарта.

«Поворотным пунктом, — говорит Ф. Энгельс, — в математике была декартова переменная величина. Благодаря этому в математику вошли движение и диалектика и благодаря этому же стало немедленно необходимым дифференциальное и интегральное исчисление, которое тотчас и возникает и которое было в общем и целом завершено, а не изобретено, Ньютоном и Лейбницем»1).

Можно сказать кратко, что математический анализ — это математика величин переменных.

Для более полной характеристики предмета математического анализа следует указать, что он занимается изучением переменных величин, рассматривая их не изолированно, а в их взаимной связи. Точным математическим понятием, выражающим идею взаимосвязи переменных величин, является понятие функции. Это есть основное и важнейшее понятие математического анализа.

Идеи математического анализа, а именно, идеи переменной величины и функции имеют чрезвычайно важное значение для элементарной математики. Вся теория тригонометрических функций представляет, по сути дела, элементарную главу математического анализа. В школьном курсе алгебры изучаются рациональные, простейшие алгебраические, иррациональные функции, а также и некоторые неалгебраические (трансцендентные) функции: таковы степенная

1) Ф. Энгельс, Диалектика природы, Госполитиздат, 1948, стр. 208.

функция с иррациональным показателем, показательная, логарифмическая; здесь же изучаются основы теории пределов и простейший ряд — бесконечная геометрическая прогрессия. В геометрии размеры криволинейных фигур и тел, ограниченных кривыми поверхностями, определяются как пределы размеров некоторых других фигур и тел, изменяющихся и приближающихся к данным.

К числу важнейших разделов математического анализа, имеющих разнообразные приложения во всех областях математики, физики и техники, относятся дифференциальное и интегральное исчисление, а так же теория рядов. Разделы эти не представлены в настоящее время в программе общеобразовательной школы. Однако понятия производной и интеграла давно уже относятся к основным понятиям науки, имеют огромную образовательную ценность и со временем могут оказаться включёнными (разумеется, в очень скромном объёме) в курс математики средней школы.

Настоящая статья содержит в систематическом виде основные сведения о производных, интегралах и рядах. Сведения эти представлены, разумеется, в объёме, во много раз превышающем тот, в котором они могут войти в школьный курс. Выбор этих сведений здесь, как и в других разделах «Энциклопедии элементарной математики», определяется потребностями изучения и исследования элементарных функций, их вычисления и решения ряда задач геометрии и физики (проведение касательной к кривой, определение скорости по пути, или пути по скорости, определение площади плоских фигур, длин кривых, объёмов и площадей поверхностей простейших тел).

Не ставя своей целью дать хоть сколько-нибудь полный очерк истории развития математического анализа, отметим лишь некоторые моменты этой истории. Наличие некоторых важных идей анализа можно усмотреть уже в античной науке. Классический «метод исчерпывания» представляет собой прообраз теории рядов. В некоторых работах Архимеда применяется в зачаточной форме ход мыслей, характерный для позднейшего интегрального исчисления.

Примерно с середины XVII в. достижения древнегреческой науки в области математики были уже превзойдены и, как уже упоминалось, в конце XVII в. трудами Ньютона (1642—1727) и Лейбница (1646—1716) было завершено построение дифференциального и интегрального исчисления.

Говоря о «завершении» процесса создания математического анализа, мы имеем в виду установление основных руководящих принципов анализа и, в первую очередь, установление взаимной обратности задач дифференциального исчисления и интегрального исчисления. Было бы неправильно понять термин «завершение» в том смысле, что после работ Ньютона и Лейбница развитие анализа остановилось. Наоборот, научное творчество в этой области интен-

сивно продолжалось и в XVIII и в XIX вв. и весьма успешно протекает и поныне. В настоящее время по различным отделам математического анализа публикуется каждый год более 1000 работ.

Начало разработки проблем анализа у нас в России связано с именем знаменитого Л. Эйлера (1707—1783). Эйлер, швейцарец по происхождению, почти всю свою жизнь провёл в Петербурге, был членом Петербургской Академии наук. Он занимался самыми разнообразными вопросами математики и механики. В частности, ему принадлежат важные заслуги в области дифференциального и интегрального исчисления.

Ряд важных открытий в интегральном исчислении (техника интегрирования, теория кратных интегралов, дифференциальные уравнения, вариационное исчисление) был сделан академиком Михаилом Васильевичем Остроградским (1801—1861). Его знаменитая формула для преобразования кратных интегралов и принадлежащий ему способ интегрирования рациональных дробей вошли во все учебные руководства.

Кроме Остроградского, вопросами анализа занимался и другой современный ему петербургский академик — Виктор Яковлевич Буняковский (1804—1889), опубликовавший в этой области ряд работ. Интересные исследования по математическому анализу выполнил и наш великий геометр Николай Иванович Лобачевский (1792—1856).

Создателем большой научной школы математического анализа был гениальный русский математик Пафнутий Львович Чебышев (1821—1894). Он — автор ряда важных работ по интегральному исчислению (как по вопросам интегрирования в элементарных функциях, так и по приближённому вычислению определённых интегралов), но главной заслугой Чебышева в области анализа явились его выдающиеся исследования по теории приближения функций. Дальнейшее развитие этих исследований привело к созданию новой важной ветви анализа — конструктивной теории функций, имеющей большое прикладное значение.

Будучи в течение ряда лет профессором Петербургского университета, Чебышев создал мощную школу, наиболее яркими представителями которой были академики А. А. Марков (1856—1922) и А. М. Ляпунов (1857—1918). Традиции этой школы и по сие время живы в Ленинградском университете.

В XX в. главным образом под влиянием Н. Н. Лузина (1883— 1950) и Д. Ф. Егорова (1869—1931) складывается московская математическая школа. Полного расцвета её деятельность достигает уже в советский период и в настоящее время по широте своих интересов и важности результатов московская школа бесспорно занимает первое место в мире. Выдающимися её представителями в области анализа являются А. Н. Колмогоров, И. Г. Петровский, И. И. Привалов, Д. Е. Меньшов и др.

Одним из крупнейших современных математиков является академик С. Н. Бернштейн (р. 1880), продолжатель исследований П. Л. Чебышева по теории приближения функций (а также и по теории вероятностей). Под влиянием С. Н. Бернштейна воспитался целый ряд молодых советских исследователей.

Колоссальный общий подъём культуры и науки, характерный для страны победившего социализма, ярко проявляется и в области математики. Выше уже было отмечено выдающееся значение деятельности московской математической школы. Весьма значительные и обширные математические исследования ведутся и в других культурных центрах нашей страны — Ленинграде, Киеве, Харькове, Одессе, Тбилиси, Казани, Ереване и др.

Обстоятельное изложение успехов математических наук в СССР (до 1947 г.) можно найти в коллективном обзоре «Математика в СССР за 30 лет» (Гостехиздат, 1948).

ГЛАВА I

ПРОИЗВОДНЫЕ

§ 1. Производная и дифференциал

1. Задачи, приводящие к понятию производной. Самым важным понятием дифференциального исчисления является понятие производной. Рассмотрим несколько задач конкретного характера, приводящих к этому понятию.

А. ЗАДАЧА О СКОРОСТИ. Пусть точка M движется по некоторой прямой1). Как известно, средней скоростью этой точки за какой-нибудь промежуток времени называется отношение расстояния, пройденного точкой за этот промежуток времени, к его продолжительности.

Легко видеть, что знание средней скорости точки за тот или иной промежуток времени не даёт нам представления о характере движения в отдельные моменты этого промежутка. В связи с этим в механике приходится рассматривать также понятие скорости точки в данный момент времени. Под этим понимается предел средней скорости точки за бесконечно малый2) промежуток времени, начинающийся в данный момент (или оканчивающийся в этот момент).

Иногда, чтобы подчеркнуть отличие этого понятия от ранее определённой средней скорости, говорят об «истинной» скорости точки в данный момент.

Пусть на прямой, по которой движется точка, выбрана некоторая начальная точка О, выбрана определённая единица длины и прямой приписано определённое направление. Тогда положение движущейся точки M в каждый момент времени может быть определено указанием её расстояния ОМ от начальной точки О (рис 1). Это расстояние будет некоторым (положительным, отрицательным или равным

Рис. 1.

1) В случае не прямолинейного движения скорость имеет векторный характер и её определение более сложно.

2) То-есть такой, продолжительность которого стремится к нулю.

нулю) числом s, очевидно зависящим от того, о каком моменте времени идёт речь. С другой стороны, сам этот момент времени определяется указанием числа t единиц времени, отделяющих его от некоторого определённого начального момента.

Таким образом, OM = s будет функцией аргумента t

s=f{t), (1)

и знание этой функции полностью определяет движение точки. Равенство (1) называется уравнением движения. Вот примеры таких уравнений:

Посмотрим, как найти «истинную» скорость точки M в момент t (т. е. в момент, отделённый от начального момента промежутком времени продолжительностью в / единиц), если известно уравнение движения (1).

Рассмотрим наряду с моментом t другой момент времени t-\-At. В этот момент движущаяся точка M находится на расстоянии

от начальной точки О. Поэтому расстояние As, пройденное точкой за промежуток времени, начинающийся в момент t и кончающийся в момент t-\-At, равно

Д*=/(/+ДО-/(*)•

Поскольку продолжительность этого промежутка равна At, ясно, что средняя скорость за этот промежуток времени есть отношение

а тогда истинная скорость v точки M в момент t будет равна пределу этого отношения при стремящемся к нулю At:

(I)

Таким образом, физическая задача нахождения скорости приводит к чисто аналитической задаче нахождения предела (I).

Рассмотрим другую задачу, также приводящую к подобному пределу.

Б. ЗАДАЧА О КАСАТЕЛЬНОЙ. В элементарной геометрии, где изучается одна лишь кривая линия—окружность, касательная к окружности определяется как прямая, которая имеет с этой окружностью всего лишь одну общую точку. Если рассматривать произвольные кривые, то такое определение касательной уже не будет удовлетво-

рительным. Вряд ли естественно считать, что ось Oy является касательной к параболе у = х* (рис. 2), хотя они и имеют всего лишь одну общую точку.

В связи с этим в науке принято другое, более общее, определение касательной.

Именно, касательной к кривой К в данной её точке M (которая называется точкой касания) называется прямая МТ, являющаяся предельным положением1) секущей MS, проведённой через M и другую точку TV кривой К, когда эта другая точка, оставаясь на К, стремится к совпадению с M (рис. 3).

Легко убедиться, что в случае, когда К является окружностью, новое определение касательной равносильно даваемому в средней школе.

Поставим теперь задачу проведения касательной к кривой

У=/(х), (2)

где /(лг) — некоторая непрерывная функция, если задана точка касания М(х, у).

Поскольку нам известна точка М, то для определения касательной МТ достаточно знать её угловой коэффициент т. е. тангенс угла а, под которым МТ наклонена к оси Ох (рис. 4).

Рис. 2.

Рис. 3.

Рис. 4.

Чтобы определить этот угловой коэффициент, возьмём на нашей кривой ещё одну точку N(x-\-Ax, у -f- Ay) и проведём через M и TV секущую MN. Из аналитической геометрии известно, что угловой коэффициент секущей будет

1) Это означает, что угол между прямыми МТ и MS стремится к нулю.

Ввиду того, что касательная есть предельное положение секущей, ясно1), что

k = lim k*. (3)

Так как обе точки M и N лежат на кривой (2), то y=f(x)> y + Ay=f(x-\-Ax),

откуда

Ay=f(x + Ax)-f(x).

С другой стороны, из факта стремления точки N к точке M вытекает, что Ал: стремится к нулю2). Поэтому равенство (3) можно переписать и в такой форме

(II)

Таким образом, дело свелось к нахождению предела (II), который ничем, кроме обозначений, не отличается от предела (I).

Рассмотрим еще один конкретный вопрос, который снова приведёт нас к тому же пределу.

В. ЗАДАЧА О ПЛОТНОСТИ. Средней плотностью прямолинейного стержня называется отношение его массы к его длине (мы имеем здесь в виду линейную плотность стержня; к этому понятию приходят, когда пренебрегают толщиной и шириной стержня). Чтобы получить более точное представление о характере распределения массы вдоль стержня, вводят понятие «истинной» плотности стержня в данной его точке. Под этим понимают предел средней плотности бесконечно малого участка стержня, стягивающегося в эту точку.

Будем характеризовать положение точки M на стержне её расстоянием ОМ = / от одного из концов О стержня (рис. 5). Тогда, обозначив через m массу участка ОМ, мы, очевидно, получим, что m окажется функцией /

m=f{l), (4)

причём знание зависимости (4) полностью определит нам, как распределяется масса стержня.

Поставим вопрос, как, зная уравнение (4), найти плотность стержня в данной его точке М, где СШ = /.

Рис. 5.

1) Строгое доказательство равенства (3) без труда вытекает из непрерывности функции tg а.

2) В силу непрерывности f (х) справедливо и обратное: при Ajc — 0 будет N-» М.

С этой целью рассмотрим1), кроме Ж, другую точку TV стержня, для которой ON=l-\- Al. Тогда масса участка ON будет

/и + Д/н =/(/-{-Д/),

откуда следует, что масса участка MN равна

Am =f(l + А/) —/(/).

Поэтому средняя плотность этого участка равна

Истинная плотность р стержня в точке M есть предел этого отношения, когда N стремится к М, т. е. когда А1-+0. Таким образом,

(III)

Мы снова приходим к необходимости рассмотрения того же предела, что и выше.

2. Определение производной. Рассмотрим теперь тот предел, к которому мы были приведены разобранными в п°1 конкретными задачами, не интересуясь уже его происхождением, а обращая внимание лишь на чисто математическую сторону дела.

Пусть на некотором открытом промежутке (а, Ь) задана непрерывная функция

Проделаем следующие 5 операций:

1) Закрепим точку лг£(а, Ь) и найдём соответствующее значение функции у = f(x).

2) Придадим аргументу х отличное от нуля приращение Ал:, не выводящее из промежутка (а, Ь), и найдём значение функции у -\- Ау = =f(x-\- Ах), соответствующее новому значению аргумента.

3) Вычислим приращение функции

Ay=f(x + Ax)— /(лг).

4) Составим отношение

5) Устремим Дд: к нулю и займёмся отысканием предела

(5)

1) Читателю рекомендуется сделать чертёж,

Этот предел (если он существует1)) и называется производной функции f(x) в точке х.

Таким образом, производная есть предел отношения приращения функции к вызвавшему его бесконечно малому приращению аргумента.

Обозначается производная функции y=f(x) через fix), или через у. Первое обозначение полнее, ибо в нём явно указана та точка x, в которой находится производная.

Действие нахождения производной какой-нибудь функции называется дифференцированием этой функции. Соответственно этому ту точку, в которой находится производная (т. е. то значение х аргумента, которое закрепляется в первой из вышеуказанных 5 операций), мы будем называть точкой дифференцирования.

Иллюстрируем данное определение несколькими примерами.

Пример 1. Найти производную функции у =х* в точке лг = 5.

Здесь у = 25, у + Ау = (5 -f- Ах)2 = 25 + 10Ад: -f (Ал:)2. Значит,

Устремляя Ал: к нулю и находя соответствующий предел, получаем:

У =10.

Пример 2. Найти производную функции у = лг2 в точках х = 4, х= 1, х = 0, х= 12.

Чтобы не повторять рассуждения для каждой из этих точек наново, проведём выкладку в общем виде, обозначив точку дифференцирования буквой x. Тогда при само собой понятных обозначениях мы получим:

(в)

Подчеркнём ещё раз, что то значение х, которое фигурирует в правой части равенства (6), есть не что иное, как точка дифференцирования. Полагая, в частности, дг = 4, лг = 1, х = 0, х=12, находим У = 8, У = 2, У = 0; у' = 24.

Из рассмотренного примера видно преимущество дифференцирования функции в общем виде, т. е. при буквенном обозначении точки дифференцирования.

1) Мы имеем в виду конечный предел. Иногда вводятся «несобственные числа> + 00 и — оо и тогда становится возможным говорить о бесконечных значениях производной, но мы этого делать не будем.

Пример 3. Найти производную функции_у = |/лг в точке х (х> 0), Не вдаваясь в пояснения, получаем:

Всякую функцию у =f(x) можно изобразить графически. Сделав это, поставим вопрос о проведении касательной к полученной кривой (т. е. к графику функции). Этот вопрос мы рассматривали в п° 1. Сопоставляя полученное там выражение (II) с определением производной, получаем важное предложение:

Теорема. Производная ут = f (х) геометрически представляет собой угловой коэффициент касательной к графику дифференцируемой функции, проведённой в точке, абсцисса которой есть точка дифференцирования.

Общенаучное значение производной довольно отчётливо выступает в первой из рассмотренных выше задач. Действительно, в этой задаче выясняется, что в том случае, когда дифференцируемая функция представляет собой путь, пройденный движущейся точкой, а независимая переменная есть время, то производная представляет собой скорость движения.

Но в любом процессе, в котором приходится рассматривать две связанные между собой и изменяющиеся величины х и у, можно говорить о скорости изменения одной из них по отношению к другой. Нетрудно видеть, что точной характеристикой скорости изменения у по отношению к х как раз и будет производная у\

Нет надобности говорить о том, насколько часто в науке приходится иметь дело с подобной скоростью изменения одной величины по отношению к другой. Например, если х есть время, а у — количество электричества, протекшего через сечение проводника за время х, то у' будет не что иное, как сила тока.

Легко увеличить число примеров такого рода.

3. Дифференцируемость и непрерывность. Односторонние производные. Производная выше была определена как предел некоторой переменной величины. Однако ведь не всякая переменная величина стремится к определённому пределу. В связи с этим и не всякая функция имеет производную. Легко показать, что для наличия производной у какой-либо функции необходима непрерывность этой функции. В самом деле, справедлива

Теорема. Если у функции у = f(x) в точке х существует производная1), то в этой точке функция непрерывна.

1) В этом случае говорят, что функция y=f(x) дифференцируема в точке x. (Выше мы употребляли выражение «дифференцируемая функция» в несколько ином смысле, понимая под ним функцию, которая подвергается процессу дифференцирования,)

Для доказательства заметим, что, давая аргументу (исходя из значения л:) приращение Длг ф О и обозначая через Ау соответствующее приращение функции, мы можем это последнее приращение записать так:

Если Длг->0, то отношение стремится к конечному1) пределу у' = f (лг). Поэтому

lim Ay = О,

что и означает непрерывность функции f(x) в точке х (т. е. при том значении аргумента, к которому прибавлялось Длг).

В связи с последней теоремой возникает вопрос, не будет ли условие непрерывности функции в какой-либо точке и достаточно для наличия производной в этой точке.

На этот вопрос приходится дать отрицательный ответ. Например, всюду непрерывная функция j; = |a;| в точке лг = 0 производной не имеет. В самом деле, здесь в зависимости от того, будет ли Длг>0 или Длг<0, окажется

Поэтому в нашем случае предела

не существует. Это видно и геометрически, ибо график функции у=\x I

имеет вид ломаной, изображённой на рис. 6. Ясно, что в начале координат у этой ломаной нет касательной.

Рис. 6.

Рассмотренный пример очень прост, так как у функции _у = | а: [ в точке лг = 0 существуют так называемые «правосторонняя» и «левосторонняя» производные. Правосторонней производной функции /(лг) в точке x называется предел выражения

в котором Ах стремится к нулю, принимая лишь положительные значения. Обозначается правосторонняя производная через /+(лг). Таким образом

1) См. сноску на стр. 308,

Аналогично левосторонняя производная fL(x) определяется формулой

Для того чтобы f(x) в точке л;1) имела производную /' (х)> необходимо и достаточно, чтобы она имела в этой точке как правостороннюю, так и левостороннюю производные и чтобы эти последние производные были равны между собой.

Так как у функции f(x) = \х| будет /_[.(0) = -{- 1, /1(0) = —1, то этим и объясняется отсутствие у неё обыкновенной производной /'(0).

Более интересен пример всюду непрерывной функции

у которой не существуют ни /+(0), ни /1(0). В самом деле, если Ал;>0, то

а эта величина не стремится ни к какому пределу при Длг->0, а колеблется между j-1 и — 1 бесконечное множество раз, принимая как эти, так и все промежуточные значения. Указанное явление отчётливо видно на рис. 7, где изображена часть графика

Рис. 7.

1) Здесь, как и выше, речь идёт о функции, заданной в открытом промежутке (а, Ь\ содержащем точку х. Для функции f(x)> заданной в замкнутом отрезке [я, Ь], также часто приходится рассматривать /Г (а) и /_1 (Ь). Иногда для краткости не подчёркивают односторонности этих производных и говорят просто об /' (а) и /' (Ь).

функции /(лг). Ясно, что секущая, проведённая через начало координат и какую-либо точку Л^лг, у) графика, будет по мере приближения N к началу совершать бесконечное множество колебаний между прямыми у = -\-х и у = — лг и не будет стремиться ни к какому предельному положению.

В обоих рассмотренных примерах мы обнаружили отсутствие производной в отдельной точке. Такие примеры были известны и в XVIII в. Однако в ту эпоху существовало (явно не сформулированное) ошибочное убеждение, что непрерывная функция (это понятие, кстати сказать, тоже точно не определялось) имеет производную всюду, кроме разве лишь отдельных точек.

Ещё в 1834 г. великий русский математик Н. И. Лобачевский отчётливо различал свойства непрерывности и дифференцируемости функции. Тем не менее и в XIX в. были попытки доказать, что непрерывная функция, кроме как в отдельных точках, имеет производную. Этим попыткам положил конец К. Вейерштрасс, в 1871 г. построивший пример непрерывной функции, которая нигде не имеет производной. Но первый пример такого рода функции был построен гораздо раньше (не позднее 1830 г.) знаменитым чешским математиком Б. Больцано. Пример этот долгое время оставался неизвестным и был опубликован лишь в 20-х годах текущего века.

4. Производные простейших элементарных функций. В настоящем и ближайших двух пп° мы докажем, что все элементарные функции имеют производные во всех точках своих областей задания, за исключением лишь отдельных особых точек, причём эти производные сами являются элементарными функциями точки дифференцирования.

Целью настоящего п° является доказательство следующих формул1)

Буква x, фигурирующая в правых частях этих формул, обозначает точку дифференцирования. В формуле 3) показатель п озна-

1) На функциях sec л: и cosecAT мы не останавливаемся, так как они вообще применяются редко. Обратные тригонометрические функции рассматриваются в а° 5.

чает натуральное число. Показатель же а, входящий в формулу 4), обозначает любое действительное число. Соответственно этому функция лг* рассматривается как заданная на всей оси, функция же ха определена не везде. Именно, если а — иррациональное число, то эта функция определена только для х>0 (если а>0, то и для х = 0); если же а рационально и не равно 0, то, записывая его в виде несократимой дроби ~(q^l)t найдём, что при q нечётном функция ха определена как для х>0, так и для лг<0 (если/7 О, то и для л; = 0), а при q чётном — только для лг>0 (если /?>0, то и для л: = 0). Точно так же и некоторые другие из функций, приведённых в нашей таблице, теряют смысл при тех или иных значениях аргумента. Например, функция tgx теряет смысл при x=y> функция \пх—при лг^О и т. п. Однако, как это будет ясно из ниже приводимых доказательств, каждая из формул 1)— 12) справедлива при любом х, при котором имеют смысл обе части этой формулы.

При доказательстве нам придётся использовать следующие формулы теории пределов:

(А)

(Б) (В) (Г)

Формула (Г) выведена в предыдущей статье (см. стр. 192). Дадим краткие выводы формул (А), (Б), (В).

Как известно (см. стр. 200), число е может быть определено как предел выражения

при х-+±оо. Если положить

то мы приходим к равенству

Отсюда на основании непрерывности логарифмической функции получается

чем и доказана формула (А).

Переходя к выводу формулы (Б), положим

(1-f z)a— 1=и.

Ясно, что при г-*0 будет и м->0. При этом

(1+*)в=1+и

aln(l-f *) = ln(l-f и).

Таким образом,

Отсюда и из (А) вытекает (Б). Полагая, наконец,

а2 — 1 = и,

мы видим, что и->0 при С другой стороны,

и потому

откуда вытекает (В).

Переходя к доказательствам самих формул 1) —12), заметим, что формулы 1) и 2) очевидны. В самом деле, если у = С9 т. е. у есть постоянная величина, то приращение Ау этой функции, вызванное приращением Ах аргумента, равно нулю, откуда и следует, что (Су = 0. Точно так же, если у=х, то и Ау = Ах, откуда сразу вытекает формула 2).

Установим формулу 3). Если у = хп, то

и, следовательно,

Отсюда при Дл:, стремящемся к нулю, получаем:

Формула 3) установлена.

Переходя к формуле 4), допустим, что нами рассматривается такое отличное от нуля значение аргумента х, при котором функция X*2 определена. Тогда она определена и для близких значений x-\-àx и

Значит,

Положив — = z и применив формулу (Б), мы и получаем 4).

Приведённое доказательство не годится для лг = 0. Проведём рассуждение для этого случая отдельно. Согласно сделанной выше оговорке, мы должны предполагать, что при лг = 0 имеют смысл обе части формулы 4), т. е. что1) а>1. Но тогда при л; = 0 будет у=ха = 0, а у + Ау — (Ах)а.

Значит,

и, стало быть, у = 0, что согласуется с формулой 4) при а>1 и л; = 0. (Полезно отметить, что при а = —^—'» гДе т и п — натуральные числа, функция ха определена лишь для лг^О. Соответственно этому, формула 4) доставляет нам при таком а и при х = О правостороннюю производную.)

Формулы 5) и 6) устанавливаются совершенно аналогично. Остановимся для примера на выводе формулы 5).

Имеем:

Стало быть,

и

Первый из сомножителей правой части согласно (Г) равен 1, а второй (в силу непрерывности функции cosx) равен cosx. Значит, у = cos Ху и формула 5) доказана.

1) Напомним, что символ 0° лишён смысла,

Формулы 7) и 8) также доказываются аналогично, и мы остановимся лишь на первой из них. Предполагая, что имеем:

Отсюда1)

и остальное ясно.

Формула 9) устанавливается так:

и остаётся сослаться на формулу (В). Формула 10) есть частный случай 9). Переходя к формуле 11), допустим, что лг>0. Тогда

Значит, на основании (А) получаем:

Наконец, для y = \ogax имеем ау = х, откуда j;=|5^. Повторив для рассуждение, которое мы только что провели для 1плг, мы придём к 12).

В заключение остановимся на вопросе, почему в формулах математического анализа постоянно применяются не десятичные, а натуральные логарифмы.

На первый взгляд этот факт представляется весьма странным, ибо десятичные логарифмы обладают важными преимуществами, делающими их незаменимым пособием при вычислениях. Напомним эти преимущества. Из самого определения логарифма вытекает, что

Если требуется найти логарифм числа, не являющегося целой степенью 10, например числа 637, то рассуждают так. Число 637

1) Как известно,

лежит между 100 и 1000. Отсюда на основании монотонности логарифма вытекает, что

lg 100 < lg 637 < lg 1000,

или

2<lg637<3.

Значит,

lg 637 = 2,...,

т. е. целая часть логарифма (его «характеристика») определяется с одного взгляда на число, и дело сводится к нахождению его дробной части («мантиссы»).

Далее, числа 637 и 63,7 связаны формулой:

637 = 63,7 - 10.

Значит,

lg 637 = lg 63,7 + lg 10 = lg 63,7 -f 1.

Поэтому мантиссы логарифмов чисел 637 и 63,7 одинаковы. Таким образом, упомянутые преимущества десятичных логарифмов состоят в простоте нахождения характеристики и неизменности мантиссы при умножении числа на 10, или на целую степень 10.

Нетрудно понять, что источником этих преимуществ является то, что мы пользуемся десятичной системой счисления. Если бы мы пользовались двенадцатиричной системой счисления, то упомянутые преимущества принадлежали бы уже не десятичным логарифмам, а логарифмам с основанием 12. Применение в качестве основания системы счисления числа 10 объясняется вовсе не какими-либо особыми арифметическими достоинствами этого числа, а тем чисто физиологическим обстоятельством, что на руках у человека 10 пальцев. Считая предметы и загибая при этом пальцы, человеку на ранних ступенях культуры приходилось, дойдя до 10, делать какую-либо пометку: зарубку на дереве, или что-либо подобное. Эта пометка и являлась «счётной единицей второго разряда». Мы видим, что она оказывалась равной 10.

Таким образом, выбор десятичной системы логарифмов никакими теоретическими соображениями не обусловлен и потому никаких теоретических выгод и не доставляет. Это, конечно, ни в какой степени не понижает чисто вычислительных удобств этой системы и потому во всех численных расчётах всегда пользуются именно ею.

Однако в математике значительно большую роль играют не численные, а буквенные расчёты. При таких расчётах отмеченные выше преимущества десятичной системы логарифмов исчезают. В то же время возникает вопрос о выборе такого основания системы логарифмов, чтобы применяемые буквенные формулы имели по возможности более простой вид. И вот с этой-то новой

точки зрения натуральные логарифмы и оказываются наилучшими, ибо производная натурального логарифма

выражается более простой формулой, чем производная всякого другого логарифма

В частности, так как In 10 = 2,30259..., то производная десятичного логарифма

выражается сложнее, чем логарифма натурального.

6. Дифференцирование обратных функций. Пусть функция y=f(x) задана, непрерывна и строго монотонна в замкнутом промежутке [а, Ь]. Как известно (см. стр. 245), в этом случае существует функция, обратная для функции f(x), т. е. такая однозначная функция x = g(y), которая задана в замкнутом промежутке, содержащемся между /(а) и /(£), и сопоставляющая с каждым у из этого промежутка то (единственное) значение х из [а, Ь], для которого f(x) =у. Эта обратная функция также непрерывна и строго монотонна1).

В этих условиях (и в этих обозначениях) справедлива

Теорема. Если у функции f(x) в точке х0 существует отличная от нуля производная f (лг0), то у обратной функции g (у) в соответствующей точке y0=f(xQ) существует производная £г(Уо)> причём

Доказательство. Пусть Ау ф 0 и точка yQ -\- Ау содержится между /(а) и f(b). Тогда, полагая

g(y0 + by) = xo + bx>

мы будем иметь, что Длг^О и xQ-{- Ах£[а, Ь], причём

1) Если прямая функция yz=f(x) задана в открытом промежутке (о, Ь\ то и обратная функция будет определена в открытом же промежутке, лежащем между f(a) и f(b). Один (или оба) из упомянутых в этой формулировке промежутков может быть и бесконечен [например, если у = tg х, — y < x < y , то обратная функция х = arctg у определена в (— оо, + °°)]'

Очевидно,

Устремляя Ay к нулю, мы получим, что и (ибо функция x = g(y) непрерывна). Стало быть, правая часть предыдущего равенства стремится (при Ay -v 0) к >, ] . Теорема доказана.

Краткая, но выразительная запись этой теоремы такова:

Применим теорему к доказательству формулы

Для этого рассмотрим функцию

причём будем изменять х только в замкнутом промежутке

Здесь наша функция строго возрастает от —1 до -}-1. Кроме того, она непрерывна. Значит, она имеет обратную функцию

лг = aresin 3/,

определённую в [— 1, -f-1] и сопоставляющую с каждым у £ [— 1, то единственное значение —yj, для которого s'mx=y.

Замечая, что производная y = cosAr отлична от нуля всюду, кроме точек zt-s-, мы заключаем, что обратная функция лг = aresin j; имеет производную при всех у, кроме у = ±1, причём

где л; = aresin .у.

Так как cos2 х -f- sin2 х — 1, то

Из двух знаков, стоящих перед радикалом, мы обязаны остановиться на знаке -[-, ибо—у<лг <Су (веДь х = гхсъту, а это значение лежит между —| и у , а для таких х будет cosх> 0. Итак, '

что лишь обозначением отличается от доказываемой формулы.

Совершенно аналогично устанавливаются еще 3 формулы:

6. Правила комбинирования формул дифференцирования. Формулы, выведенные в пп° 4 и 5, доказывают дифференцируемость ряда простейших элементарных функций и дают выражения для их производных. Однако на практике приходится иметь дело обычно не с самими рассмотренными простейшими функциями, а с теми или иными их комбинациями, например с результатами арифметических действий над этими функциями. Обратимся к вопросу дифференцирования подобных комбинаций простейших функций и прежде всего остановимся на задаче дифференцирования суммы, разности, произведения и частного таких функций.

Ясно, что здесь мы имеем дело с частным случаем следующей более общей задачи: пусть и = и(х) и v = v(x) — две (не обязательно элементарные) функции, заданные в одном и том же промежутке (а, Ь) и имеющие в некоторой точке х этого промежутка производные и' и г/. Требуется установить дифференцируемость в точке x каждой из функций1)

(7)

и выразить их производные через и' и v\

Решается эта задача однотипным рассуждением, которое в качестве примера проведём для случая произведения uv.

Итак, пусть значения функций и(х) и v(x), отвечающие точке дифференцирования х, суть и и г/. Придавая х приращение Ах [отличное от нуля и не выводящее из промежутка (а, Ь)], мы изменим значения и(х) и v(x). Пусть их новые значения суть и-\-Аи и V -f- Av. Тогда новое значение произведения у = и (x) v (х) будет равно

у -j- Ду = (а -|- Дм) (у -|- Дг>).

Вычитая отсюда старое значение y = uv этого произведения и деля результат на Ах, находим

1) При рассмотрении частного предполагается, что в точке х знаменатель v отличен от нуля.

Устремив Ал: к нулю, мы будем иметь по самому определению производной

Кроме того, и это весьма важно,

В самом деле, раз функция v(x) в точке х имеет производную, то она в этой точке непрерывна и потому стремление к нулю приращения аргумента влечёт за собой и стремление к нулю приращения функции.

Сопоставляя всё сказанное, мы видим, что

или, что то же самое,

Аналогичные рассуждения приводят к соотношениям

причём попутно устанавливается и самое существование производных у всех функций (7).

Заслуживает быть отмеченным тот частный случай дифференцирования произведения, когда один из сомножителей постоянен. В этом случае вышеприведённая формула принимает вид

(си)т = си\

т. е. постоянный множитель можно выносить из-под знака производной.

Теперь мы в состоянии находить производные довольно разнообразных комбинаций простейших элементарных функций, как, например1),

или

и т. п.

1) Обе эти функции дифференцируются в конце п° (примеры 2 и 3).

Однако мы не можем ещё найти производную функции

ибо она не есть результат арифметических операций над простейшими элементарными функциями.

Чтобы иметь возможность дифференцировать функции подобного вида, нам понадобится ещё одно — и, пожалуй, важнейшее из всех — правило дифференцирования. Это — правило дифференцирования сложных функций.

Постановка вопроса здесь такова. Пусть

y=f(z)

есть функция, заданная в промежутке (А, В) и имеющая в точке zQ этого промежутка производную

Пусть, далее,

есть функция, заданная в промежутке (а, Ъ) и обладающая тем свойством, что её значения удовлетворяют неравенству

a<<p(*)<ä

Тогда можно образовать функцию

которая и называется сложной функцией аргумента х. Предположим, что точка xQ £ (а, Ь) переводится функцией 9 (х) в вышеупомянутую точку z0y т. е. что cp(xQ) = z0, и допустим, что существует производная срт (х0) = zx. Поставим вопрос о дифференцировании функции f[y(x)] в точке xQ.

Для решения этого вопроса нам понадобится одна вспомогательная формула, имеющая, впрочем, и самостоятельный интерес. Пусть y=f(x) есть функция, имеющая в некоторой точке х производную y'x=f(x). Придадим x приращение Ах, отличное от нуля, но не выводящее из промежутка задания функции, и обозначим через Ау соответствующее приращение функции. Так как отношение ^ при стремлении Ах к нулю стремится к производной у'х, а разность между переменной, имеющей предел, и этим пределом есть величина бесконечно малая, то величина

(8)

стремится к нулю вместе с Ах. Перепишем равенство (8) в другой форме:

Ау = ухАх -|- а Ах. (9)

Эта новая формула, так же как и формула (8), имеет смысл только при Ax=jtO, ибо величина а, являющаяся по существу функцией от Ах, а = а(Ах), для Ах=0 не определена. С другой стороны, непосредственно ясно, что при Дд; = 0 будет и Ду = =f(x-\-Ax)—f(x) = 0. Значит, достаточно произвольным образом доопределить функцию а(Алг) для Ах = 0, чтобы формула (9) стала верной и для этого Дат.

Положим

(10)

Тогда, как уже сказано, формула (9) будет верна, независимо от того, обращается Ах в нуль или нет, и сверх того, что здесь является основным, при любой последовательности {hn}, стремящейся к нулю, будет

1ипа(/гл) = 0,

опять-таки независимо от того, имеются в этой последовательности члены, равные нулю, или нет.

Заметив это, вернёмся к вопросу о дифференцировании функции

у=я?т

Сохраняя введённые выше обозначения, придадим аргументу х сначала значение xQ, а затем значение х0 -f- Ах, где Ах ф 0 и х0-\-Ах€ (а, Ь). Соответственно этому аргумент z = y(x) будет иметь значения z0 = y(x0) и z0 -[- Az = у (лг0 -[- Дл;), причём, однако, не исключено, что Az = 0. Полагая y0=f(z0) иyQ-{- Ay=f(z0 -f- Д^), мы будем иметь по сказанному выше:

Ay=y'zAz-\-aAz, где а стремится к нулю, когда Az пробегает последовательность значений, стремящихся к нулю. Это справедливо, независимо от того, имеются ли среди членов упомянутой последовательности нули. Разделив предыдущее равенство на Ах и переходя к пределу при Ах->0, получим:

Таким образом, мы и получаем то правило дифференцирования, о котором говорили выше:

Ух=Уг-г'х' (11)

Можно записать это правило и так:

однако первая запись выразительнее. Если назвать z промежуточным аргументом, то формула (11) будет означать, что производная

сложной функции равна её производной по промежуточному аргументу, умноженной на производную промежуточного аргумента.

Дадим краткую сводку всех доказанных нами формул и правил дифференцирования:

(*)

Пользуясь этими формулами, мы можем найти производную любой элементарной функции, причем и сама эта производная оказывается элементарной функцией точки дифференцирования.

Иллюстрируем выведенные формулы рядом примеров.

Пример 1. Найти у\ если

у = 7хг -f- 8а:2 — 9* + 11.

Пользуясь правилами 17), 18) и 20) таблицы (*), находим:

Аналогичным образом, для любого многочлена

находим:

Пример 2. Найти У, если

Пользуясь правилами 19) и 21) таблицы (*) и формулами 5), 4) и 10) той же таблицы, находим:

Пример 3. Найти У, если

Имеем:

Пример 4. Найти У, если

Здесь, в отличие от предыдущих примеров, где мы имели дело с результатами арифметических действий над простейшими элементарными функциями, мы встретились со сложной функцией. Полагая

получаем:

Пример 5. Найти у, если

Полагая

находим:

Пример 6. Найти у, если

Здесь надо дважды применить правило дифференцирования сложной функции. Именно, полагая

получим:

Чтобы найти ^, полагаем

откуда

и окончательно:

Обычно промежуточных аргументов не выписывают, производя их введение в уме. Это позволяет избежать употребления большого числа различных букв, обозначая каждый раз функцию, подлежащую дифференцированию, одной и той же буквой (которая, таким образом, в процессе решения одной задачи обозначает последовательно разные вещи). При этом полезно руководствоваться следующим правилом: если подлежащая дифференцированию функция является результатом целого ряда действий над аргументом х, то за промежуточный аргумент z следует принять результат всех этих действий, кроме последнего.

Например, если подлежащая дифференцированию функция есть

то следует положить

Тогда y = zz и

Полагая теперь

получим:

Теперь надо обозначить через z функцию

и это даёт:

Полагая, наконец,

находим окончательно:

На практике производят все указанные замены в уме и сразу пишут результат дифференцирования.

Например, если

7. Дифференциал. С понятием производной тесно связано понятие дифференциала, от которого и происходит название дифференциального исчисления.

Чтобы выяснить сущность понятия дифференциала, рассмотрим функцию y=f{x)y заданную в открытом промежутке (а, Ь) и имеющую в некоторой точке лг этого промежутка производную у1 =f(x). Придадим аргументу приращение Длг, отличное от нуля и такое, что х-\-Ах$ (а, Ь). Пусть соответствующее приращение функции будет Ау. Как мы видели в предыдущем п°, справедлива формула

Ау=у'Ах-\- осДлг,

где а стремится к нулю вместе с Длг. Полагая

аДлг = р,

мы видим, что при бесконечно малом Длг переменная р также есть бесконечно малая величина и притом стремящаяся к нулю быстрее, чем Длг в следующем точном смысле слова

lim /-=0.

Вообще, если мы имеем две бесконечно малые величины X и ft, связанные между собой так, что

lim—= 0,

то говорят, что X есть бесконечно малая более высокого порядка, чем ]х. Таким образом, величина р есть бесконечно малая более высокого порядка, чем Длг. Грубо говоря, это означает, что при весьма малых Длг величина р будет ещё во много раз меньше, чем Длг. Поэтому при малых Длг величиной р = аДлг часто бывает возможно пренебречь, что приводит к приближённой формуле

Ayp&yfAx.

Эта формула показывает, что с точностью до малой высшего (сравнительно с Длг) порядка приращение функции Ау оказывается прямо пропорциональным приращению аргумента Длг. При этом коэффициентом пропорциональности здесь служит производная / (вычисленная при том значении аргумента лг, к которому прибавляется приращение Длг).

Произведение УДлг (которое лишь приближённо равно приращению Ау) и называется дифференциалом функции у в точке лг, соответствующим приращению аргумента Длг. Таким образом, точное определение дифференциала таково: дифференциалом функции y=.f(x) в точке x, соответствующим приращению Ах, называется

произведение производной y'=f(x), вычисленной в упомянутой точке, на Ах. Обозначается дифференциал функции y=f(x) через dy или df(x):

dy=y'Ax, df(x)=f(x)Ax. (12)

Дифференциал dy является, таким образом, функцией двух не зависящих друг от друга1) аргументов — точки дифференцирования x и приращения Ал;. В обозначении df(x) указана только точка х, в обозначении же dy не указаны ни х, ни Да:. Поэтому оба обозначения недостаточно полны.

Дифференциал важен для науки потому, что (при закреплённой точке дифференцирования) он обладает двумя свойствами: 1) он прямо пропорционален приращению аргумента и 2) разность между ним и приращением функции (вызванным упомянутым приращением аргумента) есть бесконечно малая высшего порядка (сравнительно с Длг).

Первое из этих свойств обеспечивает простоту вычисления дифференциала, а второе позволяет при малых Ал: приближённо заменять Ау на dy.

Иллюстрируем всё сказанное следующим простым примером. Пусть

3/ = 2л;3 + Злг2 + 4лг+2.

Найти Ау и dy, если лг = 2, Дл; = 0,001.

Здесь .у = 38, у-{-Ау = 38,040015002. Стало быть,

Ду = 0,040015002.

С другой стороны, _yf = 6л:2 -)- блг 4, а при л; = 2 будет у = 40 и потому

dy= 0,04.

Таким образом, сохраняя предшествующие обозначения, находим р = 0,000015002.

Значит, относительная ошибка, которую мы делаем, заменяя Ау через dy, будет

Ясно, что точность приближения при такой замене очень хороша.

1) В начале этого п° мы подчинили Ал: условию лг + Дл: £ (а, Ь). Тем самым мы ограничили выбор значения äx в зависимости от значения х. Так как это представляет известные неудобства, то впредь мы отказываемся от указанного ограничения и определяем dy формулой dy =у'Ьх для совершенно произвольных значений ах.

Вычислим ещё Ay и dy для той же функции у = 2хъ -\- Sx2 -f-—|- 4лг —[— 2 в той же исходной точке х = 2, но для Длг = 3. Здесь оказывается у = 38, у-\-Ау = 347 и потому

Ду = 309.

С другой же стороны, как и выше, у = 40, так что

dy =120.

Мы видим, что, в отличие от предыдущего примера, Ау и с?у вовсе не близки друг к другу. Столь разительное различие двух приведённых примеров объясняется тем, что в первом из них величина Длг была весьма мала, а во втором нет. Вообще говоря, употребление приближённых формул без оценки совершаемой ошибки есть вещь довольно безответственная. Можно, например, говорить о том, что «7 приближённо равно 32», и хотя практическая бесполезность такого утверждения совершенно очевидна, но всё же формально оно правильно. Поэтому, говоря, что «при малых Длг величины Ау и dy приближённо равны», мы по существу не говорим ещё ничего определённого. Ниже будет показано, что для широкого класса функций совершаемая при замене Ау на dy ошибка не превосходит величины

М(Ах)\

где M есть верхняя граница абсолютной величины второй1) производной fix) в рассматриваемом промежутке. Пока же мы будем довольствоваться указанными несколько расплывчатыми формулировками.

Для более полного уяснения понятия дифференциала установим его геометрический смысл. С этой целью построим график функции y=f(x) и проведём к нему касательную МТ в точке M (х,у).

Пусть N(x-\-Ax, у-\-Ау), где у-\- Ay=f(x-\- Ах), есть другая точка этого графика (рис. 8). Из чертежа видно, что приращение функции Ау равно отрезку A7V. В то же время отрезок KL равен

KL = MK-tg*=y'Ax.

Иначе говоря, этот отрезок и есть дифференциал dy. Таким образом, дифференциал геометрически представляет собой приращение ординаты точки, движущейся по касательной к графику функции. Поскольку вблизи точки касания

Рис. 8.

1) См. стр. 334.

касательная весьма тесно примыкает к кривой, ясно, что для малых Ах замена Ау на dy не приводит к заметной погрешности. Приведём несколько примеров нахождения дифференциалов.

1) Найти дифференциал функции у=хъ, если х = 2, Дл; = 0,1. Здесь уг = 3х*, а так как точка дифференцирования есть дг = 2, то У = 12, откуда dy= 1,2.

Мы видим, что согласно определению дифференциала его величину можно найти, только задав (кроме функции) точку дифференцирования x и приращение Длг. Однако в дальнейшем мы обе последние величины задавать численно не будем и сохраним для них буквенные обозначения.

2) Найти dy, если у = ех. Здесь у1 = ех и dy = exAx. Ещё короче этот результат можно записать так:

Аналогично этому

Точно так же

В последнем примере очень наглядно выступает, что нахождение дифференциала по существу сводится к нахождению производной (а значит, и наоборот). Именно поэтому действие нахождения производной и называется «дифференцированием».

Очень поучителен пример нахождения дифференциала функции у=х. Именно, здесь У=1 и поэтому dy = Ax, или

dx = Ax.

Таким образом, дифференциал независимой переменной совпадает с её приращением1).

Отсюда следует, что формулу (12)

dy =уДлг,

дающую самое определение дифференциала, можно переписать и так:

dy=yrdx. (13)

1) Легко видеть, что это верно для всякой линейной функции у = = ах -f b.

В свою очередь последняя формула приводит к возможности обозначать производную у' символом

В книгах технического характера последнее обозначение применяется чаще, чем у\

Формула (13) обладает весьма важным свойством. Именно, она остаётся справедливой и в том случае, когда х уже не служит независимой переменной, а является функцией другого аргумента t. В самом деле, в этом случае у будет также (сложной) функцией t, и дифференциал dy, отвечающий приращению At, надо вычислять по формуле

dy =y'tAt.

Согласно правилу дифференцирования сложной функции

yi =y'x*t,

откуда

dy = y'xX'tAt.

Замечая, что x\At = dx, мы возвращаемся к формуле (13). Чтобы оценить это свойство формулы (13), следует сопоставить его с тем фактом, что формула (12) подобным свойством заведомо не обладает.

Действительно, в том случае, когда х есть функция от t, символы Ах и dx означают разные понятия и потому справедливость одной из формул (12) или (13) исключает справедливость другой. В отмеченном свойстве состоит существенное преимущество записи дифференциала dy в инвариантной форме (13). Например, если у = хг, то равенство

dy = 3x2dx

справедливо, независимо от того, является ли х независимой переменной или функцией.

Приведём несколько примеров применения дифференциала.

Пример 1. Вычислить (\-{-h)a, если h весьма мало. Чтобы решить поставленную задачу, введём функцию у=ха. Если х=1, то у=1ш Нам же надо найти значение функции для л: = 1 -f- А, т. е. мы должны дать аргументу приращение Ax = h и найти Ау. Ввиду малости h можно вместо Ау вычислить dy. Так как у=ха, то dy = axa~1dx. У нас х=1 (заменяя Ау на dy =yrdx, мы должны вычислять у при том значении аргумента, к которому придаётся приращение Ал;). Значит, dy = ah, и мы приходим к приближённой формуле

{l-\-h)a^\+ah.

Из этой формулы можно получить быстрый приближённый способ извлечения корней. Именно, пусть п — число натуральное и В мало сравнительно с Ап. Тогда

Например,

В действительности,

Пример 2. Вычислить tg31°. Здесь надо рассмотреть функцию y = tgx. Она известна для лг=30° = -^-. Нас интересует её приращение, вызываемое приращением Длг=1° = щ. Вместо этого приращения вычислим дифференциал

Так как

то

В действительности, tg 31° = 0,60076...

Пример 3. Пусть у = iiv, где и и v — функции аргумента х. Допустим, что x получил малое приращение dx. Тогда

dy =yrdx = (uvr -f - u'v) dx = u dv-\-v du,

откуда

Если u и v суть величины, измеряемые каким-либо прибором, a du и dv — ошибки измерения, то полученное равенство означает, что относительная ошибка произведения равна сумме относительных ошибок сомножителей.

В заключение установим, что дифференциал dy функции у полностью определяется двумя свойствами: пропорциональностью Ах и стремлением к нулю отношения

при стремлении к нулю Длг. В самом деле, пусть z есть величина, обладающая этими свойствами, т. е. z = kAx и

(14)

Так как

то из (14) следует, что

т. е. k=yf и z = dy.

Таким образом, всякое «округление» Ау, при котором Ау заменяется (с точностью до малых порядка высшего относительно Алг) величиной, пропорциональной Ад:, означает замену Ау дифференциалом dy.

Например, в курсе физики объемный коэффициент расширения ß какого-либо материала подсчитывается так: пусть куб из этого материала имеет сторону, равную 1, и нагревается на 1°. Тогда сторона куба становится равной 1-\-а, где а — линейный коэффициент расширения материала. Поэтому объём нагретого куба равен

(1 -|-а)3=1 + 3(х-|- За2 + а3,

a увеличение объёма равно

За За2 -f- а3.

Отбрасывая члены За2 и а3, что возможно в силу малости а, мы приходим к формуле

ß= За.

Читателю ясно, что суть этого рассуждения и состоит в замене приращения объёма дифференциалом этого объёма.

С идеей считать малые приращения функции пропорциональными приращениям аргумента читатель должен быть хорошо знаком также из практики работы с таблицами логарифмов. Таким образом, не говоря этого явно, в курсе средней школы неоднократно пользуются дифференциалами.

8. Производные и дифференциалы высшего порядка. Пусть функция y=f(x) задана в каком-либо промежутке [а, Ь] и в каждой точке1) этого промежутка имеет производную у' =/' (х). Тогда эта производная сама является некоторой функцией от х (где х — точка дифференцирования). Поэтому можно говорить о производной

1) Говоря о производной в точках а и Ъ, мы имеем в виду односторонние производные.

от yr=f(x). Эта последняя производная называется второй производной (или производной второго порядка) от функции y=f(x) и обозначается через у" или f" (х).

Более общим образом производной порядка п-\-\ от функции y=f(x) называется производная от производной порядка п. Для производной 3-го порядка применяется обозначение у'" или/"'(лг), дальнейшие же производные обозначаются черезУ1у), yv), ... , УЛ), ..., или через /(4) (х), (х), ... , (х), .... Разумеется, не всякая функция обязательно имеет производную высшего порядка; кроме того, в одних точках такая производная может существовать, а в других— нет. Важно подчеркнуть, однако, что, предполагая существование производной f(n+1) (х) в какой-либо точке х0, мы тем самым уже предполагаем существование предыдущей производной /(л) (х) не только в точке х0, но и в некотором открытом1) промежутке, содержащем эту точку.

Хотя по самому определению производной порядка /г-|-1 для её нахождения надо знать производную порядка л, но в некоторых простых случаях можно написать выражение производной высшего порядка, минуя все предыдущие. Например, совершенно ясно, что для у = ех будет у(п) = е*. Точно так же, замечая, что для у = 8тл; будет У = cos х = sin(х мы видим, что здесь

Важным фактом является также то, что для многочлена степени m

y = a0xm-\-alxm-1+ ... -fa^AT-f ат

будет у(т) = aQm\, а все производные порядка более высокого, чем m тождественно равны нулю.

Дадим здесь применение производных к выводу бинома Ньютона. Заметим, что если п — натуральное число, то (а-\-х)п есть многочлен степени п\ это вытекает непосредственно из того, что степени многочленов (в данном случае двучленов) при перемножении складываются. Поэтому

(а + х)п = А0 + А{х + А2лг2 + ... + Aj*. (15)

Задача заключается в определении коэффициентов А0, Av Л2, ... , Ап. Полагая х = 0, получаем:

ап = Л0.

1) Впрочем, этот промежуток может быть замкнутым и иметь точку х0 одним из своих концов, но тогда /<Л+1) (лг0) будет обозначать одностороннюю производную.

Если же тождество (15) продифференцировать, то получится новое тождество:

п (а + лг)"-1 = Аг + 2Л2лг + ... + лА^"1. (16)

Полагая здесь х = 0у найдем:

па"'1 = Ах.

Дифференцируя тождество (16) ещё раз, получим:

я (л— 1)(а+лг)л-2=2. 1Л2+3 - 2Л3лг-|~ ... + л (л— 1) Апхп~\ (17)

откуда при д: = 0:

л (л— 1)ал"2 = 2 . 1Л2.

Заметим, что равенство (16) получилось путём однократного, а равенство (17) путём двукратного дифференцирования равенства (15). Так как при каждом дифференцировании степени появляется новый коэффициент, равный исходному показателю степени, а сам показатель степени понижается на единицу, то после /л-кратного дифференцирования равенства (15) получим (/л^я):

Здесь первое слагаемое правой части является производной порядка m от Атхт, второе слагаемое — производной порядка m от Am+1jcm+1 и т. д. Полагая в найденном тождестве х = 0, будем иметь:

л (л— 1) ... (л —/л+1)ал-т = /л(/л—1) ... 1 - Ат.

Так шаг за шагом, посредством всё новых и новых дифференцирований и затем подстановки частного значения лг = 0, определяются все числа А0, Аи А2, ... , Ат, ... Мы получим, очевидно:

Поэтому тождество (15) приобретает вид

Это и есть бином Ньютона.

Таким образом, не прибегая к комбинаторике, бином Ньютона можно получить в качестве одного из применений производных.

Вообще дифференцирование является мощным средством для вывода тождеств. Так, например, из тождества

посредством однократного дифференцирования получаем новое тождество:

С понятием производной высшего порядка связано понятие дифференциала высшего порядка. Мы видели, что дифференциал dy = =yTdx зависит от двух величин — точки дифференцирования х и приращения dx=àx (в настоящий момент мы считаем х независимой переменной). Закрепив dx, мы превращаем dy в функцию одного аргумента х. Дифференциал этой новой функции и называется вторым дифференциалом (или дифференциалом второго порядка) функции у. Он обозначается через d~y [или, если j/=/(at), — через d*f(x)]. Согласно определению для нахождения этого дифференциала надо найти производную функции dy и результат умножить на dx. Этот последний множитель dx, строго говоря, мог бы быть и отличен от того множителя dx, который участвовал в составлении дифференциала dy=yrdx. Однако (это новое соглашение!) эти множители выбираются равными. Поэтому

d*y = d (dy) = d (yrdx) = (yTdx)Tdx =y" (dx)\

Квадрат (dx)* принято обозначать коротко через dx* (хотя это обозначение иной раз может и привести к недоразумениям, ибо dx* можно принять за d(x2), т. е. за дифференциал функции д;2). Поэтому окончательно:

d2y=y"dx2.

Дифференциал этой функции (где снова dx закрепляется и вновь вводимый множитель dx принимается равным закреплённому) называется третьим дифференциалом функции у и обозначается через dby. Ясно, что

dzy=yr"dx*.

Аналогично этому, дифференциалом порядка /г-|-1 называется дифференциал от дифференциала порядка п, причём попрежнему dx закреплён и взят одним и тем же для всех дифференциалов от 1-го до (я-|-1)-го порядков.

Легко понять, что

dny=y(n)dxn, (18)

откуда вытекает возможность обозначать п-ю производную yln) через

Когда мы говорили о дифференциале dy, то подчеркнули инвариантный характер формулы

dy—ydx,

состоящий в том, что она верна и тогда, когда х есть функция другого аргумента t. Нетрудно видеть, что для дифференциалов высшего порядка такой инвариантности быть не может, т. е. что формула (18) не будет верна, когда х является функцией от t. В самом деле, говоря уже о втором дифференциале к*у, мы определяли его, как дифференциал выражения dy=yrdx, которое рассматривалось как функция от х при закреплённом dx. Но если х есть функция от t, то dx = x\dt и закрепление dx (при изменении f) невозможно.

Высказанные соображения легко подтвердить и прямым вычислением. Действительно, если y=f(x) и x = q{t), то у есть сложная функция от t. Значит,

d*y=y't'dt*.

По правилу дифференцирования сложной функции

Далее,

Замечая, что

приходим к формуле

отличной от формулы (18).

9. Частные производные и полный дифференциал. Основное содержание настоящей статьи посвящено функциям одной переменной. Однако целесообразно сообщить некоторые сведения о дифференцировании функций нескольких переменных. Этот вопрос почти непосредственно приводится к дифференцированию функций одной переменной, ибо, если у функции нескольких аргументов закрепить все эти аргументы, кроме одного, то она превратится в функцию этого одного, незакреплённого, аргумента.

Пусть, например, z=f(x, у) есть функция аргументов х и у. Закрепим точку (х0, у о) и найдём f(x0, у0). Затем придадим аргументу х приращение

Длгг^О, оставляя другой аргумент у закреплённым, у — yQ. Новое значение функции будет равно f(x0-±-kx, у0). Предел

(19)

называется частной производной функции f(x, у) по переменной х в точке (*о> Уо)- Ясно, что это — обычная производная функции (одного аргумента!) /(*> .Уо)- Обозначается предел (19) одним из символов

Аналогично определяется частная производная

Полезно подчеркнуть, что символ ^ не есть частное, как это было в случае производной функции одной переменной. Сами по себе выражения dz и дх лишены смысла. Покажем на примере, что пренебрежение этим указанием может привести к недоразумениям.

Пусть переменные л:, у и z связаны соотношением

xyz = L (20)

Тогда

Аналогично

в то время, как, если бы написанные выражения были настоящими дробями, их произведение равнялось бы +1.

Читатель легко сообразит, каков геометрический смысл частных производных функции z = f(x, у). Это —угловые коэффициенты касательных к сечениям поверхности z=f(x, у) плоскостями у=у0 и х = х0.

Интересно, что, в отличие от функций одной переменной, существование обеих частных производных и ^ в какой-нибудь точке (дг0, у0) ещё не обеспечивает непрерывности функции f(x, у) в этой точке. Пусть, например, fix, у) задана так:

Эта функция разрывна в точке (0, 0), но обе частные производные в этой точке существуют.

Если частная производная ^ существует всюду, то она сама является функцией от x и j/ и можно искать её частные производные. Это будут частные производные второго порядка, которые обозначаются так:

Следует различать символы

Однако в том случае, когда эти производные непрерывны, они равны

К этим кратким замечаниям следует добавить ещё несколько соображений. Именно, как мы видели выше, приращение Ду дифференцируемой функции y=f(x), вызванное приращением Да; аргумента х, можно представить в форме

by = f'(x)bx + 9, (21)

где р стремится к нулю быстрее, чем ах. Нечто подобное имеет место и для функций нескольких переменных. Пусть, например, z—f(x, у) есть функция аргументов х и у, имеющая частные производные fx(xt у) ufy(x,y) во всех точках некоторого квадрата а<х<.Ь, с<.у < d,u эти частные производные сами являются непрерывными функциями точки дифференцирования (л:, у). В этом случае приращение Дг функции z, вызванное приращениями ах и Ду аргументов х и у, можно записать в форме

Д* = fx (л:, у) Их + /у (л:, у) ау + р, (22)

где X и у суть исходные значения аргументов, а р стремится к нулю быстрее, чем I Длг| + I Ду |. Доказательство этого утверждения будет приведено в п° 11. Выражение

dz =fx (X, у) bx+f'y (Ху у) Ду

называется полним дифференциалом функции f(x, у). Оно является линейной функцией Дл: и Ду и воспроизводит соответствующее им приращение Дг с точностью до бесконечно малой р порядка высшего, чем | Да: \ -± \ Ду |. Таким образом, здесь имеется полная аналогия со случаем функции одного аргумента. Единственное отличие, которое здесь имеет место, состоит в том, что для справедливости формулы (21) достаточно было, чтобы производная /' (х) существовала только при том значении аргумента х, к которому прибавляется приращение Да:, в случае же двух переменных существования частных производных /£(аг, у) и fy(x, у) в одной лишь точке (а:, у) недостаточно1) для справедливости формулы (22), а приходится требовать их существования и непрерывности в целом квадрате, содержащем эту точку внутри себя.

§ 2. Важнейшие теоремы о производных

10. Теоремы Ферма и Ролля. В п° 2 мы уже старались выяснить большое принципиальное значение понятия производной. В дальнейшем мы увидим, что с помощью этого понятия удаётся разрешать разнообразные и важные задачи конкретного характера. Однако для этой цели придётся изучить понятие производной более обстоятельно. Выяснению важнейших свойств производной и будет посвящен настоящий параграф.

Начнём с важной теоремы, обычно связываемой с именем П. Ферма2).

1) Как мы видели, функция f(x, у) может в точке (х, у) иметь обе производные fx(х, у) и fy(х, у) и в то же время быть разрывной. Ясно, что в этом случае формула (22) не справедлива.

2) В действительности, Ферма не вводил понятия производной. Настоящая теорема представляет собой уточнение не вполне отчётливых соображений Ферма.

Теорема Ферма. Пусть функция f(x) задана в замкнутом промежутке [а, Ь] и в некоторой внутренней1) точке х0 принимает своё наибольшее {или наименьшее) значение. Если в этой точке существует производная f (х0), то она обязательно равна нулю

f(x0) = 0.

Доказательство. Пусть для определённости f(xQ) есть наибольшее из значений функции на [а, Ь]. Так как точка х0 есть внутренняя точка промежутка [а, Ь], то производная f (лг0) одновременно является и правосторонней и левосторонней. Вычисляя её как правостороннюю, будем иметь

где Ах>0 и Дл; —>0. Но из того, что f(x0) есть наибольшее значение f(x)y вытекает, что

f(x0 + àx)—f(xQ)*£0.

Стало быть, при Длг>0 будет

Но тогда предел этого выражения не может быть положительным,

и потому

/'(лГоХО.

Аналогично, вычисляя /' (х0) как левостороннюю производную, мы установим, что

/'(*o)S*0.

Теорема доказана. Геометрически эта теорема означает, что, если в

самой высокой и в самой низкой точках графика функции существуют касательные и если абсциссы этих точек лежат внутри промежутка задания функции, то упомянутые касательные параллельны оси Ох (рис. 9).

Читатель должен обратить внимание на то, что условие а < х0 < b весьма существенно, ибо важно, чтобы f (лгп) можно было рассмат-

Рис. 9.

1) То-есть такой, что а < х0 < д.

ривать и как правостороннюю и как левостороннюю производные. Если же точка х0, в которой /(лг) принимает наибольшее значение, совпадает с а или Ь, то при наличи f (х0) нельзя гарантировать, что / (д:0) = 0. Иллюстрацией этого является рис. 10, на котором касательные в точках А и В не параллельны оси Ох.

При помощи теоремы Ферма доказывается следующее предложение, являющееся одной из основных теорем математического анализа.

Теорема Ролля. Пусть функция fix) задана в замкнутом промежутке [а, Ь] и во всех его точках имеет производную f (х). Если на концах промежутка [а, Ь] значения функции равны между собой, т. е.

/(а) =/(*),

то внутри [а, Ь] обязательно существует хотя бы одна такая точка с (а<с<Ь), что значение производной fix) в этой точке равно нулю

f(c) = 0.

Рис. 10.

Если, в частности, предположить, что значения функции в точках а и Ъ равны нулю, то теорему Ролля можно будет коротко формулировать так: между двумя нулями функции содержится нуль её производной.

Переходя к доказательству теоремы, заметим прежде всего, что функция f(x) необходимо будет непрерывной, поскольку она имеет производную f(x). Но тогда среди её значений обязательно имеются и наибольшее и наименьшее (см. стр. 218).

Обозначим их через M и т. Если М = т, то это означает, что функция f{x) постоянна. Но тогда во всех точках [а, Ъ\ будет f(x) = 0 и любая из точек открытого промежутка (а, Ь) может быть принята за требуемую точку с. Если же М>т, то эти значения не могут оба достигаться на концах [а, &], ибо по условию f(a)=f(b). Стало быть, хоть одно из них принимается функцией fix) в точке х0, лежащей внутри [а, Ь], т. е. такой, что а<х0<Ь. Но тогда по теореме Ферма будет /(л;0) = 0, т. е. лг0 и является требуемой точкой с.

Доказанная теорема является типичной «теоремой существования». В ней утверждается существование точки с с определёнными свойствами, но нет речи о каких бы то ни было способах нахождения этой точки.

11. Формулы Лагранжа и Коши. Правило Лопиталя. Следующие две теоремы представляют собой последовательные обобщения теоремы Ролля.

Теорема Лагранжа. Пусть f(x)— функция, заданная в замкнутом промежутке [а, Ь] и имеющая во всех точках этого промежутка производную f (х). Тогда внутри [а, Ь] обязательно существует хотя бы одна такая точка с, а<с<Ь, что

(1)

Равенство (1) называется формулой Лагранжа, или формулой конечных приращений. Ясно, что эта формула превращается в равенство f(c) = 0 в случае, когда /(а) =/(£), так что теорема Лагранжа действительно является обобщением теоремы Ролля. В свою очередь обобщением теоремы Лагранжа является следующая

Теорема Коши. Пусть в промежутке [а, Ь] заданы две функции /(лг) и g(x), имеющие всюду на [а, Ь] производные f (х) и g (х), причём g' (х) не обращается в нуль ни в одной точке открытого промежутка (а, Ь). В таком случае между а и b обязательно существует такая точка с, а<с<Ь, что

(2)

Формула (2) называется формулой Коши, или обобщённой формулой конечных приращений. Теорема Лагранжа получается из теоремы Коши в том случае, когда g(x) = x.

Очевидно, достаточно доказать формулу Коши. С этой целью введем вспомогательную функцию

9 (*) = [fib) -f(a)] [g(x)-g(a)) - [/(*) — /(<:)] [g (P) — g (a)].

Легко видеть, что всюду на [a, b] у у(х) существует производная уг (х), причём

?' (x) = [f{b)-f(a)] g* (x)-f (x) [g(b)-g(a)].

Кроме того, непосредственно из выражения 9 (лг) ясно, что 9 (а) = О и 9(£) = 0. Таким образом, 9(лг) удовлетворяет всем условиям теоремы Ролля. Значит, в (а, Ь) существует такая точка с, что 9г (с) = 0, или, что то же самое,

[/(*) —/(<*)] g* (с) =/' (с) [g (b) - g (а)]. (3)

Чтобы перейти отсюда к формуле (2), достаточно разделить (3) на gr(c)[g(b)—g (а)]. Последняя операция законна, если это произведение отлично от нуля. Но это и в самом деле так, ибо g (х) не обращается в нуль нигде в (а, Ь) и, в частности, gT (с) ф 0. С другой стороны, если бы было g(b)—g (а) —О, то по теореме Ролля между а и b существовал бы корень производной gf (х),

а так как такового корня нет, то и второй множитель g(b)—g (а) отличен от нуля. Теорема доказана. Если заметить, что отношение

представляет собой угловой коэффициент хорды графика функции /(лг), соединяющей точки A [a, /(а)] и В [b, /(#)] этого графика, то легко увидеть, что геометрический смысл теоремы Лагранжа таков1): если кривая y=f(x) всюду имеет касательную, то на любой дуге AB этой кривой существует точка С, в которой касательная параллельна хорде AB (рис. 11).

Формула Лагранжа весьма полезна для вывода неравенств и для приближённых вычислений. Приведём два примера.

Рис. 11.

Пример 1. Применим формулу (1) к функции дга; получим:

Если а> 1, то

откуда

Если 0<а<[1, то

откуда

Пример 2. Применим формулу (1) к функции 1плг, полагая b=l-^x (х>0), а=1; получим:

где с лежит между 1 и l-j-*- Поэтому

1) В этом же состоит и геометрический смысл теоремы Коши, но, чтобы увидеть это, надо ввести кривую, заданную параметрическими уравнениями x=f(t),y=g(t).

Замечая, что lg(1 +*) = 0,43429.. Лп(1 +*) (0,43429. ..= Ige), умножим все члены найденных неравенств на 0,43429...; получим:

Правая и левая части неравенств дают приближённые значения lg (1-{-•£) по избытку и по недостатку; разность между ними 0 43429 дг2 есть ' il"-—<С0,5х*. Поэтому при 0<х <0,1 получаем приближённое равенство с ошибкой, меньшей 0,005:

а при 0 <d-^<C 0,01—приближённое равенство с ошибкой, меньшей 0,00005:

Ниже мы приведём несколько важных теоретических примеров приложений теорем Лагранжа и Коши. Здесь же рассмотрим ещё три вопроса сравнительно частного характера.

I. Пусть функция y=f(x) всюду на [а, Ь] имеет вторую производную ff (х). Рассмотрим какое-нибудь значение х ( [а, Ь]9 дадим ему приращение Ах и выясним, какую ошибку мы делаем, заменяя соответствующее приращение функции Ау дифференциалом dy =у'Ах.

По теореме Лагранжа

Ay =f(x + Ах) — f (x) =f (xt) Ах,

где х<х1<х-\-Ах (для определённости мы считаем Длг>0). С другой стороны, dy = f (х) Ах. Значит,

Ay-dy = [f(x1)-f(x)]Ax.

Вторичное применение теоремы Лагранжа даёт

/' C*i) -/' (*) =f (*«) (•*! - ■*) (x О, <*,).

Допуская, что всюду в [а, Ь] вторая производная f" (х) по абсолютной величине не превосходит числа М, и замечая, что \ хх—х\<Ах, получаем оценку

\Ay — dy\^M(Axf,

о которой мы уже упоминали в п° 7.

II. Допустим, что непрерывные функции f(x) и g(x) в одной и той же точке х = а обращаются в нуль, /(a) = g (а) = 0, но в точках, близких к а, функция g(x) отлична от нуля. Отношение

представляет собой отношение двух величин, каждая из которых при приближении х к а стремится к нулю. Подобные выражения носят название «неопределённостей вида ~», а отыскание предела такого выражения (или доказательство отсутствия этого предела) называется «раскрытием неопределённости». Теорема Коши даёт возможность решать задачу раскрытия неопределённости вида -g- при помощи некоторого общего правила, обычно называемого правилом Лопиталя. В основе этого правила лежит

Теорема. Пусть функции f(x) и g(x) удовлетворяют всем условиям теоремы Коши, и, кроме того, f(a)=g(a) = 0. Если существует (конечный или бесконечный) предел отношения производных

то к тому же пределу стремится и отношение функций, т. е,

(4)

В самом деле, закрепляя точку х, для которой а <х^ Ь, и применяя теорему Коши к промежутку [а, х], находим:

где а<хх<х. Если х-^а, то и подавно хх^а и потому

откуда и следует (4).

Приведём два примера применения правила Лопиталя:

1)

2)

Выражение —^— само есть неопределённость вида -q-. Вторично применяя правило Лопиталя, находим:

III. Вернёмся к вопросу о полном дифференциале, затронутому в конце п° 9, и докажем формулу (22), приведённую там без доказательства.

Пусть функция z=f(x, у) задана в квадрате (?, определённом неравенствами а<х<.Ь, c<.y<.d, имеет во всех точках этого квадрата частные

производные fx (x, y) и fy (x, y), причём эти производные сами суть непрерывные функции. Закрепим точку (х, у) из квадрата Q и пусть (лг-р-Алт, у + Ду) есть другая точка этого квадрата. Рассмотрим разность

bz=f{x + bx, y + ày)—f(x, у).

Эту разность можно переписать так:

Hz = lf(x+àx, у + Ду)-/(л:, y + by)] + [f(xt y + Ly)-f(x, у)].

Разность / (лг, у + Ау)—fix, у), стоящая во вторых квадратных скобках, есть приращение функции f(x, у), рассматриваемой как функция одного аргумента у (х закреплено). Значит, мы можем применить к этой разности формулу Лагранжа

f(x, у + by)—f(x, y)=fy (x, y)) Ay,

причём y) есть величина, содержащаяся между у и у-\- ау. Аналогично

f(x + Ах, у + Ay) -fix,y + by) =fx у + by) Ал:,

причём £ лежит между х и лг + Ал:.

Заметим теперь, что в силу предположенной непрерывности обеих частных производных fx и fy каждая из разностей

«=/*(É, у + Ьу)— fxix, у\ P=fyix, y\)—fyixyy)

стремится к нулю при Ал: и Ау, стремящихся к нулю1), Поэтому, положив

мы получим: причём

Ясно, что при Ал: и Ау, стремящихся к нулю, окажется

Этим и оправданы все утверждения2), сделанные нами в п° 9.

12. Формула Тейлора. Общее определение функции гласит: «величина у является функцией аргумента х, если каждому значению x отвечает определённое значение у». В этом определении нет речи о том, при помощи каких средств можно найти значение у, соответствующее заданному значению х. Во многих случаях функция задаётся той или иной вычислительной формулой, например формулой

у = х\

1) Читатель обратит внимание на то, что при Ал: —*0, ау — 0 будет

2) Из доказательства видно, что хотя существование производных fx и fy приходится предполагать имеющим место во всех точках Q, но непрерывность их нужна только в исходной точке (л:, у).

В этих случаях сама формула и доставляет нам способ находить у по х. Но часто дело обстоит не так. Например, задавая функцию равенством

мы не получаем в руки никакого вычислительного (или, как чаще говорят, аналитического) способа находить у. Возникает важная и общая задача создания аналитических средств, позволяющих находить значения функции по заданным значениям аргумента. В широком классе случаев указанная задача решается при помощи замечательной формулы, называемой формулой Тейлора.

Займёмся сначала установлением этой формулы для того случая, когда рассматриваемая функция является многочленом

fix) = c0-\-c1x-\-CzX*-\- ... -f спхп. (5)

В основе вывода формулы для этого случая лежит то простое замечание, что при любом действительном числе а функцию f (х) можно записать в форме

f(x) = A0 + Al(x-a) + A2(x-a)*+ ... + АЛ(х — а)\ (6)

где Л0, А19 ..., Ап не зависят от х. Иначе говоря, мы утверждаем, что многочлен (5) можно расположить по степеням разности х — а. Чтобы установить этот факт, достаточно доказать его для функции хк, ибо f(x) есть сумма таких функций, умноженных на постоянные коэффициенты Ck. Для функции же xk наше утверждение вытекает из того, что

Постараемся теперь фактически найти коэффициенты А0, А1У ...у Апу входящие в формулу (6). Коэффициент А0 находится сразу, если положить в этой формуле x = af что даёт

Л0 =/(а).

Чтобы найти следующий коэффициент А„ возьмём от обеих частей равенства (6) производные, что даёт

f(x) = Al-\-2A2(x — а) + ЗА3(х-а)*+ ... +пАл{х — а)™. (7) Полагая здесь х = ау получаем:

л =/'(*)•

Дифференцируя равенство (7), находим:

Полагая х = а, получим:

Аналогично мы установим и общую формулу

Таким образом, равенство (6) принимает вид

(8)

Это и есть формула Тейлора для многочлена.

Допустим теперь, что f(x) есть произвольная функция, имеющая однако, в точке а все производные до л-й включительно. Тогда мы сможем для неё составить многочлен

(9)

стоящий в правой части формулы (8). Однако мы не можем уже утверждать, что этот многочлен совпадает с функцией f(x).

Тем не менее в очень большом числе случаев имеет место замечательный факт, что разность между функцией f(x) и многочленом Т(х) весьма мала. Всякий раз, когда это так, мы получаем в многочлене Т(х) хорошее приближённое выражение для функции f(x). Более того, оказывается, что в том случае, когда f(x) имеет производные всех порядков и мы можем число п брать сколь угодно большим, то весьма часто с увеличением этого числа упомянутая разность f(x) — Т(х) стремится к нулю, так что мы получаем возможность вычислять f{x) с любой степенью точности.

Переходя к точному изложению вопроса, предположим, что f(x) задана в некотором промежутке [А, В], содержащем точку а, и имеет во всех точках этого промежутка производные всех порядков до (я-|-1)-го включительно1). Введём многочлен Т(х), определив его формулой (9). Тогда

1) Если а совпадает с А или В, то под выражениями /' (я), /" (а), ... ... , /(Л) (а), появляющимися ниже, разумеются односторонние производные.

Отсюда и из (9) следует, что

Введём функцию ср(х), положив

9(х)=/(х)- 74*).

Из (10) следует, что

Введём, наконец, ещё одну вспомогательную функцию ф(лг), положив

Нетрудно видеть, что

ф (а) = <|/(а) = <]/' (а) = ... = фW (а) = 0, ф<»+« (х) = 1.

Отметим также, что ни ф (я)» ни одна из её производных (до (/z —|— 1)-й включительно) не обращаются в нуль в точках, отличных от а.

Заметив это, закрепим x £ [А, В], считая хфа. Так как 9(а) = ф(а) = 0, то

К последнему выражению можно применить формулу Коши, что даёт

где хх лежит между точками а и х. Но <р'(а) = <|/(а) = 0 и потому

Вторичное применение формулы Коши даёт

где х2 лежит между а и xi9 и тем более между а и х. Продолжая это рассуждение, мы приходим к равенству

где хп+1 лежит между aux.

(10)

Вспоминая, что

т(л+1)(лг)=/(л+1)(лг), ф(я+1)(*) = 1,

и обозначая хп+1 через х, находим:

или, что то же самое,

Подставляя сюда выражение (9) для Т{х), мы и приходим к формуле Тейлора с остаточным членом:

(11)

причём (неизвестная нам) точка х лежит между а и х.

Таким образом, принимая многочлен Т (х) за функцию f(x), мы совершим ошибку, равную

Остановимся на том, как меняется эта ошибка с изменением п.

Теорема. Если функция f(x) в промежутке [А, В] имеет производные всех порядков и если существует такое постоянное число К, что при всех х £ [А, В] и при всех натуральных п будет

|/(л)(лг)|^#,

то при любом x из [А, В]

lim Rn(x) = 0.

В самом деле, в условиях теоремы

где положено для краткости \х — а\ = М. Возьмём столь большое натуральное т, чтобы оказалось

/я-f 1>2Л1

Тогда при п>т будет

Каждая из п — m -f-1 дробей

меньше у. Значит,

или, что то же самое,

Обозначая постоянное (ведь х закреплён!) число

через С, получаем неравенство

из которого и следует теорема.

Таким образом, в условиях теоремы

чем и оправданы те общие соображения, которые были высказаны в начале п°.

Приведём несколько примеров.

Пример 1. Так как функция f(x) = sinx удовлетворяет условиям теоремы и для неё

то, приняв а = 0, получаем приближённое равенство

точность которого неограниченно улучшается с увеличением р. Ошибка этого равенства не превосходит числа

Например, ошибка равенства

(12)

не больше, чем

Значит, при 0 < x ^ вычисление функции sin х по формуле (12) приводит к ошибке, меньшей чем1) 0,000004.

Пример 2. Аналогичным образом

Мы видим, что формула Тейлора даёт нам средство фактически вычислять тригонометрические функции. В главе, посвященной теории рядов, мы ещё вернёмся к затронутым здесь соображениям.

Пример 3. Рассмотрим функцию хс, где с>1; при х>1, а=1 и п=\ формула (11) даёт:

(мы пользуемся тем, что

Отсюда, в частности, вытекает менее сильное, но зато более простое неравенство:

Заметим, что оно выведено нами для любого с>1 (вообще говоря, не целого).

Пример 4. На стр. 198 было строго показано, что 0<е^3 и приводилось численное значение постоянной е. Покажем, как находится это значение.

Применим формулу Тейлора к функции f(x) = ex, взяв а = 0. Так как здесь /(*) (л:) = ех, то (0) = 1 и

где x лежит между 0 и х. В частности, при х = 1 имеем:

(13)

1) Этот подсчёт произведён так:

Значит

Возьмём здесь п = 8. Так как

то с ошибкой, меньшей чем 0,00001, будет

Значит,

В действительности,

Формула (13) позволяет также очень просто установить, что е есть число иррациональное1). В самом деле, допустим, что е равно рациональной дроби —. Возьмём в формуле (13) число п большим чем q и большим чем 2. Умножая эту формулу на п !, получим:

Отсюда следует, что дробь -j^çj есть число целое. С другой стороны, 0<х<1. Значит, 1<ех<е<3, и потому эта дробь лежит между числами -^зру и -^зру и тем более между числами 0 и 1, откуда ясно, что она не может быть числом целым.

13. Исследования П. Л. Чебышева и С. Н. Бернштейна. Рассматривая вопрос о близости тейлорова многочлена

к функции f(x), мы предполагали х закреплённым и увеличивали п. Если, напротив, закрепить число п, то, вообще говоря, многочлен Т(х) уже не будет близок к /(лг) при всех х из [А, В]. Лишь при Ху близких к а, можно говорить о близости Т (лг) к f(x), ибо обе эти функции, будучи непрерывными, совпадают при х = а. Таким образом, при закреплённом п многочлен Т(х) будет доставлять нам лишь локальное приближение к /(лг). Улучшение же свойств этого приближения за счёт увеличения п может оказаться практически не очень удобным, ибо обращение с многочленами высоких степеней обычно связано с довольно громоздкими вычислениями.

Эти соображения привели великого русского математика П. Л. Чебышева к задаче построения таких многочленов, степень

1) С помощью более сильных средств можно доказать, что число е трансцендентно, т. е. что оно не является корнем никакого алгебраического уравнения с целыми коэффициентами.

которых заранее ограничена и которые всё же, в отличие от тейлорова многочлена Т (лг), доставляют хорошее приближение функции / (лг) во всём промежутке [А, В]. Точно проблема Чебышева формулируется так: на промежутке [А, В] задана непрерывная функция /(лг); требуется выбрать из всех многочленов Р(х) степени не выше п тот, для которого величина

max \f(x) — P(x)\ (14)

имеет наименьшее значение. Оказывается, что такой многочлен всегда существует и единственен. Он называется многочленом, наименее отклоняющимся от функции /(лг). Само же наименьшее значение величины (14) называется наименьшим отклонением многочленов степени не выше п от функции /(лг) и обозначается обычно через Еп (/). Чебышев обстоятельно изучил свойства многочленов, наименее отклоняющихся от данных функций, и дал целый ряд практических приложений своей теории — в теории машин и механизмов, в картографии и др. Замечательные исследования Чебышева послужили исходным пунктом для обширного ряда работ его учеников — К. А. Поссе, А. Н. Коркина, Е. И. Золотарёва, А. А. Маркова, В. А. Маркова и других.

Существенное развитие идеи П. Л. Чебышева получили в исследованиях С. Н. Бернштейна. Исходная мысль здесь заключается в том, что с увеличением п величина наименьшего отклонения Еп (/) уменьшается, стремясь к нулю. Естественно, что быстрота убывания Еп (/) связана со свойствами функции fix): чем проще строение этой функции, тем с большей точностью её можно заменить многочленом. Эти общие соображения привели С. Н. Бернштейна к созданию стройной классификации непрерывных функций на основании быстроты убывания их наименьших отклонений En(f). В настоящее время вся совокупность связанных с этими идеями вопросов разработана весьма обстоятельно и составляет предмет важной современной области анализа — конструктивной теории функций, имеющей большое прикладное значение. В развитии этой дисциплины ведущая роль принадлежит советским исследователям. Помимо С. Н. Бернштейна, крупные заслуги в этой области имеют А. Н. Колмогоров, В. Л. Гончаров, М. Г. Крейн, Н. И. Ахиезер, Е. Я. Ремез, С. М. Лозинский, С. М. Никольский и другие.

§ 3. Применение дифференциального исчисления к исследованию функций

14. Признаки постоянства и монотонности функции. В настоящем п° мы установим, как по свойствам производной какой-нибудь функции судить о свойствах самой этой функции.

Теорема 1. Пусть на замкнутом промежутке [а, Ь] задана функция f(x). Для того, чтобы эта функция была постоянной,

необходимо и достаточно, чтобы во всех точках [а, Ь] существовала производная f (х) и чтобы она всюду на [а, Ь] была равна нулю.

Необходимость условий теоремы очевидна, ибо постоянная величина имеет производную и эта производная равна нулю. Чтобы доказать достаточность условий, предположим, что всюду на [а, Ь] существует f (х) и fr(x) = 0. Возьмём на [а, Ь] произвольную точку x и применим теорему Лагранжа к промежутку [а, х]:

f (x) -f (а) =f (x) (х-а) (а < х <*).

Так как /Т(х) = 0, то f(x)=f(a), откуда и следует, что f(x) есть величина постоянная.

Напомним, что функция f(x) называется неубывающей [невозрастающей], если из неравенства х<у следует, что f(x)^f(y) [f(x)^f(y)]. Если же из того, что х<у следует f(x)<f(y) [/ с*) >/ (У)]> то говорят, что /(л:) — функция возрастающая [убывающая]. Функции невозрастающие и неубывающие называются монотонными.

Если функция f (х) возрастает, то —f(x) убывает, и наоборот. Это простое замечание позволит нам при доказательствах нижеследующих теорем ограничиться рассмотрением только возрастающих функций.

Теорема 2. Пусть на замкнутом промежутке [а, Ь] задана функция f(x), имеющая во всех точках [а, Ь] производную f (х). Для того чтобы функция f(x) была неубывающей (невозрастающей), необходимо и достаточно, чтобы всюду в открытом промежутке (а, Ъ) было

/4*)SsO [/Ч*)*£0].

Допустим, что функция f(x) не убывает. Закрепим х £ (а, Ъ) и выберем столь малое Дл;>0, чтобы было x-J- Ал: £ [а, Ь]. Тогда f(x-\-Ax)^f(x), стало быть,

Переходя в этом неравенстве к пределу при &х->0, мы и получаем, что /г(дг)^:0.

Допустим теперь, что при всех x d (а, Ь) будет f(x) ^ 0. Возьмём на [а, Ь] точки х и у, где х<у и применим теорему Лагранжа к промежутку [лг, у]:

f(y)-f{x)=f{z) су-*).

Здесь x<z<y и потому z i(a, b). Значит, f(z)^0 и так что f{x) — функция неубывающая.

Теорема 3. Пусть на замкнутом промежутке [а, Ъ\ задана функция f(x), имеющая во всех точках [а, Ь] производную f'(x). Для того чтобы f(x) была возрастающей (убывающей) функцией, необходимо и достаточно выполнение двух условий:

1) Всюду в открытом промежутке (а, Ь) оказывается

2) Не существует промежутка [р, q], содержащегося в [а, Ь], во всех точках которого было бы f(x) = 0.

Пусть f(x) — функция возрастающая. Тогда по предыдущей теореме выполнено условие 1). Чтобы доказать необходимость условия 2), допустим, что оно нарушается. Тогда существует такой промежуток [р, q], содержащийся в [а, Ь], во всех точках которого f'(x) = 0. Согласно теореме 1 функция f(x) будет постоянной на [р, q] и не будет возрастающей. Таким образом установлена необходимость обоих условий 1) и 2).

Допустим теперь, что выполнены условия 1) и 2). По предыдущей теореме функция f(x) оказывается неубывающей. Убедимся, что она возрастает. Для этого возьмём точки х и у из [а, Ь]9 причём х<у. Для любого z из [л:, у] будет f (x) ^f(z) ^f(y). Если бы оказалось, что f(x)=f(y), то предыдущее неравенство привело бы нас к тому, что наша функция постоянна на

промежутке [х, у]. Но тогда её производная во всех точках этого промежутка обращалась бы в нуль, что противоречит условию 2). Стало быть, f(x)^bf(y) и f(x)<f(y). Теорема доказана полностью.

Если вспомнить, что производная равна угловому коэффициенту касательной к графику функции, то доказанные результаты становятся геометрически почти очевидными. Действительно, график возрастающей функции при движении слева направо подымается (рис. 12, а), а график убывающей функции — опускается (рис. 12, б). Ясно, что в первом случае касательная к графику образует с осью

Рис. 12.

Ох острый угол, а во втором случае — тупой. Однако могут быть отдельные точки графика, в которых касательная параллельна оси Ох (рис. 12, я). Аналитически это означает, что даже и у возрастающей (убывающей) функции производная может в отдельных точках обращаться з нуль1).

Пример 1. Пусть

Так как эта формула теряет смысл при х = 09 то мы будем рассматривать ср(х) на промежутке |Ч ~J, где 0<8<у. Она имеет здесь производную

Но при 0<лг<у будет x<tgx. Значит, в ^8, ~j будет9'О и, стало быть, ср(х) убывает на |\ -^J. Отсюда 9 (лг) ^9 (^j Иначе говоря,

Это неравенство доказано для 8^Глг^у, но так как 8 можно взять сколь угодно близким к нулю, то наше неравенство верно при 0<л;^~-. Поскольку же оно превращается при л; = 0 в очевидное тождество 0=0, то оно доказано для всех х из £о, ^-J.

Пример 2. Докажем, что при р > 1 и любых положительных а и b справедливо неравенство

Предположим для определённости, что а^Ь, тогда 0<-|-^1.

Разделим обе части предполагаемого неравенства на Ър и заменим а< через X] неравенство примет вид

(1+х)р^2р-1(\+хр),

или

1) Например, у функции у = хъ производная у = 3х2 равна нулю при дг=з0, хотя сама функция возрастает.

Положим

2>-i(i+*")-О+*)'=/(*);

очевидно, что

f (х) = 2р~1 pxp-l — p (1 -f лг)'-1 =р [фху-1 — (1 +ХУ-1] <0

при 0<лг<1 и />>1 (так как2лг<1+лги (2лг)р-1<(14-лг)^1). Поэтому f(x) убывает при возрастании х и, следовательно,

/Ч*)>/(1) при оо<1.

Замечая, что /(1) = 2Р"1 - 2 — 2Р = 0, получим:

/(*)>0 при 0<лг<1;

если х=1, то это неравенство обращается в равенство. Заменяя f(x) её выражением, а затем полагая х = ~у получаем последовательно:

2Р"% (1 -(-дгр) — (1 -\-х)р^0 и (а + о)"^ 2р-* (ар +

Так как это неравенство симметрично относительно а и о, то к тому же результату мы придём и тогда, когда Ь^а.

Предоставляем читателю доказать, что при р ^ 1 и любых положительных а и b справедливо неравенство:

(a + b)p^ap + bp

(например, Уa-\-b^ i/a-\- ^b при любом натуральном я и а)>0, &>0).

Пример 3. Докажем следующую теорему Гюйгенса: если рп и Рп — периметры правильных ^-угольников, вписанного в окружность радиуса R и описанного около неё, то

Заметим сначала, что

поэтому

и неравенство принимает вид

Установим более общее неравенство

(1)

откуда и будет следовать теорема Гюйгенса.

Рассмотрим функцию

f(x) = 2 sin X + tg X — Зл:;

её производная имеет вид

/(лг) возрастает, когда х возрастает от 0 до у и, следовательно,

Это и есть требуемое неравенство.

Из неравенства (1), в частности, вытекает:

т. е.

Приём, разъяснённый в рассмотренных трёх примерах, имеет общий характер; с его помощью можно получить многие другие неравенства.

16. Экстремум функции. Вообще говоря, те функции, с которыми приходится иметь дело на практике, не являются монотонными во всей области своего существования. Обычно графики их имеют вид вроде изображённого на рис. 13.

Рассматривая график рис. 13, мы видим на нём ряд характерных точек В, С, Д Е, F, О. Значение функции, изображаемое каждой из этих точек, не будучи наибольшим или наименьшим среди всех значений её на промежутке [а, А], является всё же таковым по сравнению со всеми значениями её для достаточно близких значений аргумента. Так, например, значение функции для х = Ь, изображаемое точкой В (или ординатой ЬВ), является наибольшим на промежутке [а, с]. В связи с этими наблюдениями дадим

Рис. 13.

Определение. Говорят, что функция f(x) имеет при х=х0 максимум (минимум), если существует промежуток [p, q], содержащий точку х0 внутри себя (т. е. р <х0<д) и сам содержащийся в области задания функции, такой, что для всех х из [p, q] оказывается f(x)^f(x0) [f(x) ^f(x0)].

Объединяющим термином для максимума и минимума служит термин экстремум1).

Полезно подчеркнуть, что по самому определению та точка, в которой функция имеет экстремум, должна лежать внутри промежутка задания функции, а не на его конце. Поэтому про функцию, изображённую на рис. 13, нельзя сказать, что она имеет максимум при x = h. Такое ограничение включено в определение экстремума для того, чтобы к точкам, где есть экстремум, можно было применить теорему Ферма (п° 10). Нетрудно видеть, что эта теорема допускает такую формулировку:

Теорема Ферма. Пусть функция f(x) в точке х=х0 имеет экстремум. Если в этой точке существует производная f(xQ), то необходимо будет f(x0) = 0.

Само собой разумеется, что обратное заключение было бы неверно: из факта обращения производной в какой-либо точке в нуль совершенно не следует, что в этой точке есть экстремум. Например, производная функции у = хг, равная уг = 3х2, обращается в нуль при х = 0, но функция у = хг монотонна на всей числовой оси.

Те точки, в которых производная какой-либо функции обращается в нуль, называются стационарными точками. Геометрически это суть абсциссы тех точек графика функции, в которых касательная параллельна оси Ох.

Вышеприведённая форма теоремы Ферма означает, что точки, где есть экстремум, обязательно должны быть стационарными. Однако при этом заранее надо предположить существование производной в исследуемой точке. Например, функция _у = |аг[ (см. рис. 6) имеет минимум при х = 0, но это — не стационарная точка, ибо в ней не существует производной.

Для изучения функций весьма важно уметь находить точки экстремума. В своей общей постановке задача эта весьма трудна, и мы рассмотрим её лишь для одного частного класса функций.

Будем говорить, что функция f(x) входит в класс К([а, Ь])9 если она обладает следующими свойствами:

1) Функция f(x) задана на [а, Ь] и во всех точках этого промежутка имеет производную2) f (х).

2) Производная fix) непрерывна на [а, Ь].

1) Слова <максимум>, «минимум» и «экстремум» по-латыни означают соответственно «большее», «меньшее» и «крайнее» (подразумевается «значение функции»),

2) Отсюда уже вытекает непрерывность функции f(x).

3) Ha (a, b) имеется разве лишь конечное число стационарных точек.

Для функций этого класса вопрос об отыскании экстремумов сравнительно прост. В самом деле, если стационарных точек на (а, Ь) вовсе нет, то f(x) монотонна на [а, Ь]. Действительно, если бы в двух точках хг и х" промежутка (а, Ь) производная f (х) имела разные знаки, то, будучи непрерывной, она должна была бы между этими точками обратиться в нуль, что, однако, невозможно ввиду отсутствия стационарных точек. Стало быть, во всех точках (а, Ь) производная f (х) имеет один и тот же знак, а тогда f(x) монотонна.

Если же у f{x) имеются на (а, Ь) стационарные точки ^î^-*^4^ ••• <Схт (причём это все без исключения её стационарные точки), то такое же рассуждение показывает, что на открытых промежутках (а, хх), (хи лг2), (хт, Ь) производная f (х) сохраняет знак и f(x) монотонна на замкнутых промежутках [a, xt], [x^j Xq\, ..., [хт, й].

Сказанное здесь приводит к следующему правилу: Правило. Для нахождения экстремумов функции f(x) класса К ([а, Ь]) нужно

1) найти производную fr(x),

2) положить f (х) = 0 и решить полученное уравнение,

3) корни хи Хц •. •, хт предыдущего уравнения, лежащие в открытом промежутке (а, Ь), надо подвергнуть исследованию, определив знаки производной f (х) в каждом из промежутков (а, Ху), (xt, х2), (хт, Ь).

Заключение о характере точки хг делается по следующей схеме1):

В случаях 1 и 3 говорят, что точка x = xt есть точка перегиба.

Исследование функции на экстремум рекомендуется сопровождать построением её графика. На этом графике, помимо стационарных точек, следует отметить также и точки пересечения с осями. Если изучаемая функция задана на всей оси, то следует на графике показать, каково её поведение при безграничном возрастании и убывании аргумента.

1) Мы полагаем х0 = а, хт+1 = Ь.

В тех случаях, когда в стационарной точке xt существует вторая производная f" (xt), бывает удобно пользоваться следующим предложением:

Теорема. Если хг — стационарная точка, лежащая внутри промежутка [а, Ь], где задана функция, и /" (х{) ф 0, то в точке xt есть экстремум. Это — максимум при /"(**)<[ О и минимум npuf"(xt)>0. "

В самом деле, полагая xt -|- ах = х, получим:

Но /,(лт£) = 0, ибо xt — точка стационарная. Значит,

Пусть для определённости /"(х^^О. Тогда для достаточно малых \х — xl I дробь

также будет положительна. Иначе говоря, для х, достаточно близких к xit знак числителя f (х) будет совпадать со знаком знаменателя x — Xj. Но тогда производная f(x) при переходе х из промежутка х^ в промежуток (лг£, хм) будет менять знак с — на -\-1 а это, как мы уже знаем, обеспечивает при x = xt наличие минимума.

Пример 1. Исследовать функцию

Здесь

Приравняв У нулю, находим стационарные точки хх=—1 и лг2 = —|- 1. Определяя знаки У в промежутках (— оо , — 1), (— 1, -[- 1) и (-J-1, -j-оо), видим, что знаки эти таковы: —, —|—, —. Значит, при х = —1 будет минимум, а при х = -\-1—максимум. Замечая,

что /(—1) = — у, /(-|- 1) = 4*4">что гРаФик Функции проходит через начало координат и что как при лг->--[-оо, так и при х-*—оо будет lim /(лг) = 0, вычерчиваем график функции (рис. 14).

Пример 2. Исследовать функцию

у=хъ(х — 5)2.

Здесь ут = Ьх*(х — 5) (л: — 3). Значит, стационарные точки л;1 = 0, х2 = 3, хг = 5. Знаки у' в промежутках (— оо , 0), (О, 3), (3, 5) и (5, -(- оо) таковы: » 4~ » — » . Значит, xt = 0 есть точка перегиба, л:2 = 3 — точка максимума и лг3 = 5— точка минимума. Кроме того, /(0) = О, /(3) = 108, /(5) = 0. Ясно также, что график функции пересекает ось Ох при х = 0 и касается её при х = Ъ и что

График функции изображён на рис. 151).

Предлагаем читателю, пользуясь изложенными соображениями, разобрать те примеры (y = xz — х и др.), которые в предыдущей статье (см. стр. 49, 51 и др.) были рассмотрены без привлечения методов дифференциального исчисления.

16. Нахождение наибольшего и наименьшего значений функции на замкнутом промежутке. Пусть функция f(x) принадлежит классу К([а, Ь]). Тогда она непрерывна и, как известно (см. стр. 218), имеет на [а, Ь] наибольшее значение M и наименьшее значение т. Займёмся вопросом отыскания этих значений, остановившись для определённости на М. Пусть своё наибольшее значение M функция f(x) принимает в точке х0, f(x0) = M.

Если а<х0<Ь, то в точке xQ у функции /(лг), очевидно, будет максимум. Однако не исключено, что хл = а или хп = Ь

Рис. 15.

Рис. 16.

1) При вычерчивании графика функции у — хг (х — 5)2 мы выбрали различные единицы масштаба по оси Ох и по оси Oy. Иначе точка А, ордината которой равна 108, не поместилась бы на рис. 15.

(рис. 16), и тогда х0 может даже и не быть стационарной точкой. Из сказанного вытекает следующее

Правило. Чтобы найти наибольшее значение функции f(x) на замкнутом промежутке [а, Ь], нужно найти все её точки максимума, лежащие на открытом промежутке (а, Ь). Если это суть точки xlt х2, ..., хп, то искомым наибольшим значением будет наибольшее из конечного множества чисел

ffri), /С**), /С*я), /(а), /(*).

Отметим один важный частный случай: если в открытом промежутке (а, Ь) имеется только одна точка экстремума л;* и это — точка максимума, то f(x*) и будет наибольшим значением f(x) на Га, Ь].

Справедливость этого утверждения ясна из рис. 17.

Рис. 17.

приведем две задачи конкретного характера, решающиеся при помощи изложенной теории.

Задача 1. Имеется прямоугольный лист жести размером 8 дм X У^Ъдм (рис. 18). Требуется вырезать по углам листа такие одинаковые квадратики, чтобы после загибания оставшихся кромок получилась открытая сверху коробка наибольшего объёма.

Обозначим через х сторону вырезаемого квадрата. Тогда О ^ X ^ 2,5. Очевидно, объём коробки, упоминаемой в условии задачи, таков:

V = x(S — 2x)(5 — 2лг) = 4 хг — 26л:2 + 40лг.

Дело свелось к нахождению наибольшего значения этой функции на промежутке

Дифференцируя дважды, находим

Уг=12лг2 — 52ЛГ+40, 1^ = 24*—52.

Корни уравнения У7=0 суть лг1 = 1, лг2 = з4-. Из них в открытом промежутке ^0,2 лежит только хх = 1. Так как V" (1) = — 28 <0, то при лг=1 имеется максимум, и, как указано выше, здесь достигается и искомое наибольшее значение. Итак, сторона искомого квадрата должна равняться 1 дм.

Рис. 18.

Задача 2. В данный конус вписать цилиндр наибольшего объёма (рис. 19).

Обозначая радиус и высоту цилиндра через г и h, имеем:

V = 7zr*h.

С другой стороны, из подобия треугольников ABC и МЫС находим:

h _ R — r H R '

где R и H — радиус и высота конуса. Отсюда

V=*-!L(Rr* — r*).

Дело сводится к нахождению наибольшего значения этой функции (аргумента г) в промежутке [0, /?].

Дифференцируя дважды, находим:

V = *£(2Rr— Зг2), у> = ъ!1(2К — бг).

Корни уравнения V' = 0 суть г = 0 и г=т/?. Из них в открытом промежутке (0, /?) лежит лишь -g-/?. Это — точка максимума, ибо V"(^~R^J= — 2тс#<0. Значит, радиус искомого цилиндра есть г = у R. Отсюда легко найти и остальные его элементы.

Мы ограничимся двумя приведёнными примерами, ибо на них с достаточной ясностью видна чрезвычайная сила методов дифференциального исчисления1).

Заметим ещё, что существуют разнообразные частные приёмы, позволяющие упростить процесс нахождения наибольшего и наименьшего значений функции. Аналогичная теория разработана также и для функций многих переменных, но обо всём этом мы здесь уже говорить не будем, отсылая за подробностями к специальным руководствам.

Рис. 19.

1) Во многих случаях, используя индивидуальные особенности задачи на нахождение наибольшего значения функции, подобную задачу удаётся решить и элементарными приёмами. Сила методов дифференциального исчисления состоит именно в возможности игнорировать индивидуальные особенности задачи — это методы общие. Положение вещей таково же, как при решении арифметических задач с помощью уравнений: подчас можно обойтись и без них, но уравнения доставляют общий метод решения арифметических задач.

ГЛАВА II

ИНТЕГРАЛЫ

§ 4. Неопределённые интегралы

17. Основные понятия. В дифференциальном исчислении основной операцией является нахождение производной заданной функции. Мы уже знаем, что существо дела здесь заключается в установлении скорости изменения этой функции по сравнению с аргументом. Весьма часто, однако, приходится решать обратную задачу, когда по заданной скорости течения какого-либо процесса требуется восстановить сам этот процесс. В этом случае с математической точки зрения вопрос приводится к отысканию функции по её производной. Эта операция, называемая интегрированием, является основной во второй половине математического анализа—интегральном исчислении.

Перейдём к точным определениям.

Определение. Пусть функция f(x), заданная в некотором промежутке1) [а, Ь], во всех его точках является производной функции F(x), также заданной в [а, Ь]. Тогда эта последняя функция F(x) называется первообразной функцией для функции f(x) (в промежутке [а, Ь]).

Имеет место замечательная

Теорема 1. У всякой непрерывной на промежутке [а, Ь] функции имеется первообразная.

Доказательство этой теоремы будет дано ниже в п° 24.

Нетрудно видеть, что, если функция F(x) есть первообразная для f(x), то функция F(x)-\-C при любом постоянном С также является первообразной для f{x). В то же время никаких других первообразных, кроме функций вида F(x)-{-C, у f(x) уже быть не может. Действительно, если Ft (х) есть какая-то первообразная для f{x), то производная разности Ft(x) — F(x) будет всюду на [а, Ь] равняться нулю, а тогда, как было доказано в п° 14, сама разность есть величина постоянная, т. е.

F1(x) — F(x) = C и Fi(x) = F(x) + C.

1) Этот промежуток может быть замкнутым, открытым или полуоткрытым. В тексте мы употребили обозначение замкнутого промежутка лишь для определённости.

Определение. Если F(х) есть первообразная функция для f(x), то функция двух аргументов х и С, равная F(x)-\-C, называется неопределённым интегралом функции f(x) и обозначается символом

Таким образом, неопределённый интеграл какой-нибудь функции представляет собой общий вид первообразных функций для этой функции. Величина С, входящая в определение неопределённого интеграла, называется «произвольной постоянной». Придавая ей то или иное закреплённое значение, мы можем получить из неопределённого интеграла любую первообразную.

Легко понять, что из самого определения понятия интеграла вытекает следующее утверждение:

Теорема 2. Производная неопределённого интеграла равна подинтегральной функции, т. е.

Для успешного применения интегрального исчисления нужна разработанная техника нахождения неопределённых интегралов от элементарных функций. Читатель, желающий приобрести таковую, должен обратиться к специальным руководствам. Мы же здесь дадим лишь общее представление об этом вопросе.

В основе упомянутой техники лежит некоторое количество простых формул. Мы ограничимся следующими формулами:

Проверка справедливости каждой из этих формул проводится при помощи дифференцирования её правой части, ибо из самого определения интеграла вытекает

Правило. Чтобы установить справедливость равенства

(*)

надо продифференцировать его правую часть. Если при этом получится подинтегральная функция части левой, то равенство (*) верно.

Мы не будем проводить проверки формул вышеприведённой таблицы, а лишь отметим те промежутки изменения лг, в которых справедлива та или иная из этих формул.

Формулы 1, 4, 5, 6, 7, 11 справедливы на всей оси.

Формула 2 справедлива в тех промежутках, в которых имеют смысл обе её части. Например формула

верна в (0, -\- оо), формула

верна в (— оо, оо) и т. п.

Формула 3 верна в (0, -}- оо). Если же х ( (— оо, 0), то вместо формулы 3 надо написать

Формула 8 верна в любом промежутке, не содержащем точек вида (2п-\-1)~ , а формула 9 — в любом промежутке, не содержащем точек пъ.

Формула 10 верна в (—а, -\-а). Наконец, формула 12 верна в каждом из промежутков (— оо, — \а\) и ( | а |, -\- оо).

Интегралы от более сложных элементарных функций стараются свести к вышеприведённым «табличным интегралам». Для этого существует целый ряд разнообразных приёмов. Простейшие из этих приёмов состоят в применении двух следующих предложений:

Теорема 3. Интеграл от алгебраической суммы нескольких функций равен алгебраической сумме интегралов слагаемых, т. е.

Теорема 4. Постоянный множитель можно выносить за знак интеграла, т. е.

Проверим хотя бы формулу (# *). Согласно правилу, высказанному выше, для этого надо продифференцировать правую часть этой формулы. Так как производная суммы равна сумме производных слагаемых, то надо дифференцировать по отдельности слагаемые правой части формулы (# *). Применяя теорему 2, легко убеждаемся, что искомая производная есть f(x)-{-g(х)— h(x), т. е. совпадает с подинтегральной функцией левой части. Аналогично доказывается и теорема 4.

18. Интегрирование с помощью подстановки. Чрезвычайно сильным методом приведения интеграла к табличной форме является метод подстановки или замены переменной. Он применяется в двух различных формах, каждая из которых основана на следующей теореме:

Теорема. Пусть F (z) есть на каком-нибудь промежутке [/?, q] первообразная функция для функции f(z). Если 9(лг) есть дифференцируемая функция, заданная на промежутке [а, Ь] и удовлетворяющая неравенствам p^icp(x)^q, то сложная функция F [9 (л:)] будет первообразной для функции f[y(x)] 9' (х).

В самом деле, дифференцируя сложную функцию y = F[cp(x)], мы должны ввести промежуточный аргумент z = y(x). Тогда y = F(z), z = 9(x)Kyx=y'z-zx = Fr (z) 9'(X). Так как F (z) =/(*), то y'x = f(z)cpr(x)=f[cp(x)]yT(x), чем и доказана теорема.

Доказанную теорему, очевидно, можно формулировать и так: если

то

Отсюда следует

Первое правило подстановки. Чтобы вычислить интеграл

записываем его в форме

заменяем здесь 9(аг) на z, вычисляем полученный интеграл и в найденном ответе производим обратную замену z на 9 (яг).

Приведём несколько примеров:

Мы видим, что одна и та же табличная формула

позволяет находить бесчисленное множество разнообразных интегралов.

Точно так же из формулы

следует, что

Остановимся теперь на другой форме замены переменной. Пусть f(x)— непрерывная функция, заданная на каком-нибудь промежутке [а, Ь]. Допустим, что x = cp(t) есть функция, заданная на другом промежутке [а, ß], имеющая там производную <р' (t) и удовлетворяющая неравенствам a^cp(t)^b. Пусть, кроме того, существует обратная функция / = d» (лг), заданная на [а, Ь]. Рассмотрим интеграл

Согласно сказанному выше для нахождения этого интеграла нужно переписать его в форме

и заменить о(Л через х. что приведёт нас к интегралу

Этот последний интеграл заведомо существует (ибо f(x), будучи непрерывной, имеет первообразную). Пусть

Тогда, применяя 1-е правило подстановки к интегралу Iv мы получим:

It = A[?(f)] + C.

Пусть A [<p(t)] =F(t). Заменяя здесь t через <!/(х) и замечая, что cp[ty(x)] = x, находим:

A(x)=FW(x)].

Отсюда вытекает, что

Если ещё заметить, что F(f) есть не что иное, как A[cp(t)], т. е. первообразная для /[9 (t)] 9Г(0» то мы сможем формулировать

Второе правило подстановки. Чтобы вычислить интеграл

Значит,

полагаем x = cp(t), где y(f) — дифференцируемая функция, имеющая обратную функцию ty(x). Вычислив полученный интеграл, заменим в нём t через ty(x), что и приводит к значению искомого интеграла /.

Приведём два примера.

Пример 1. Пусть

Пример 2.

19. Интегрирование по частям. Другим довольно общим приёмом преобразования интеграла является так называемое «интегрирование по частям*.

Пусть и = и(х) и v = v(x) суть две дифференцируемые функции, заданные на одном и том же промежутке [а, Ь\. Тогда на этом промежутке будет

Последнее равенство можно переписать в равносильной форме

Отсюда, замечая, что urdx = dii, vTdx = dv, получаем:

(1)

причём произвольная постоянная, находившаяся в правой части, включена в интеграл J г/ du. Формула (1) называется формулой интегрирования по частям. Она представляет собой некое тождественное преобразование одного интеграла в другой. Если новый интеграл проще исходного, то формулу применять целесообразно.

Всматриваясь в строение формулы (1), мы замечаем, что для её применения к какому-либо интегралу надо подинтегральное выражение представить в форме произведения и dv некоторой функции и на дифференциал другой функции dv. В результате же применения формулы (1) у нас появится интеграл от функции v, умноженной на дифференциал du. Иначе говоря, преобразование по формуле (1) состоит в интегрировании одного множителя dv и одновременном дифференцировании другого и. Вообще говоря, каждая из этих операций может привести к упрощению рассматриваемого интеграла, но чаще всё же это упрощение достигается за счёт дифференцирования множителя и. Поэтому некоторым указанием на целесообразность интегрирования по частям может служить наличие в составе подинтегральной функции такого множителя, который упрощается от дифференцирования. Этот множитель и следует принять за и, обозначив произведение остальных сомножителей подинтегрального выражения (включая dx\) через dv.

Обратимся к примерам.

Так как функция 1плг упрощается от дифференцирования, то полагаем

Функция v = -£ найдена нами с помощью интегрирования1) её дифференциала xzdx. Имея в виду применить тождественное преобразование (1), мы не вводим при нахождении v произвольной постоянной, ибо при написании тождества (1) под v мы можем разуметь какую угодно определённую первообразную для dv. Это следует иметь в виду и в дальнейшем.

1) Этот дифференциал есть «часть» подинтегрального выражения. Отсюда и термин «интегрирование по частям».

Таким образом,

2) 3)

20. Общие замечания по поводу интегрирования элементарных функций. Мы уже говорили выше, что у всякой непрерывной функции f(x) имеется первообразная функция. Это обстоятельство следует сопоставить с тем, что существуют непрерывные функции, не имеющие производной.

Таким образом, если заниматься лишь вопросами существования у данной непрерывной функции первообразной и производной, то первый из этих вопросов решается всегда положительно, а второй — нет.

Иным окажется положение вещей, если мы будем рассматривать одни только элементарные функции и поставим вопрос о выражении их первообразных и производных снова через такие же функции. Именно, как мы уже знаем, всякая функция, являющаяся конечной комбинацией элементарных функций, не только обязательно имеет производную, но эта производная сама также есть конечная комбинация элементарных функций. По отношению к проблеме интегрирования дело обстоит совсем не так. Существуют очень простые элементарные функции, первообразные которых уже не выражаются никакой конечной комбинацией элементарных функций.

Так, например, можно доказать, что ни один из интегралов

(2)

не выражается конечным числом элементарных функций.

Чтобы разобраться в этом вопросе, следует прежде всего указать на то, что причисление какой-либо функции к классу «элементарных» функций есть вещь довольно условная. В конечном счёте ассортимент функций, которые в настоящее время принято называть элементарными, сложился в значительной степени под влиянием исторического хода развития математики не только как науки, но и (пожалуй, даже в большей степени) как учебного предмета.

Попробуем представить себе, как обстояло бы дело, если бы историческое развитие шло по-иному, и функция In лг не считалась

бы элементарной. Ясно, что и при этом воображаемом положении рациональную функцию — всё же относили бы к разряду функций элементарных. И тогда интеграл

(3)

оказался бы интегралом от элементарной функции, не выражающимся через элементарные.

Таким образом, мы видим, что проблема представления того или иного интеграла через элементарные функции получает точный смысл лишь при указании того, какие именно функции приняты за таковые. Расширяя запас элементарных функций, мы можем интеграл, не выражающийся через (старые) элементарные функции, превратить в выражающийся через (новые) элементарные функции. В приведённом только что примере достаточно ввести элементарную функцию 1плг, чтобы интеграл (3) выразился через неё.

Однако, в