МАТЕМАТИКА, ЕЕ СОДЕРЖАНИЕ, МЕТОДЫ И ЗНАЧЕНИЕ

ТОМ

II

АКАДЕМИЯ НАУК СССР

МАТЕМАТИЧЕСКИЙ ИНСТИТУТ им. В. А. СТЕКЛОВА

МАТЕМАТИКА, ЕЕ СОДЕРЖАНИЕ, МЕТОДЫ И ЗНАЧЕНИЕ

ТОМ ВТОРОЙ

ИЗДАТЕЛЬСТВО АКАДЕМИИ НАУК СССР

МОСКВА 1956

РЕДАКЦИОННАЯ КОЛЛЕГИЯ:

член-корр. АН СССР А. Д. АЛЕКСАНДРОВ,

академик А. Н. КОЛМОГОРОВ,

академик М. А. ЛАВРЕНТЬЕВ

Глава V

ОБЫКНОВЕННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

§ 1. ВВЕДЕНИЕ

Примеры дифференциальных уравнений. Уравнения, с которыми мы встречались до настоящего времени, служили преимущественно для отыскания численных значений тех или иных величин. Так, при разыскании максимума и минимума функции мы, решая уравнение, находили те точки, в которых скорость изменения функции обращается в нуль; в главе IV (том 1) рассматривалась задача нахождения корней многочленов и т. п. При этом всякий раз отыскивались из уравнения отдельные числа. Однако в приложениях математики часто возникают качественно новые задачи, в которых неизвестной является сама функция, сам закон зависимости одних переменных от других. Например, изучая процесс охлаждения тела, мы должны определить, как будет изменяться с течением времени его температура; при определении движения планеты или звезды нам необходимо определить зависимость их координат от времени и т. д.

Довольно часто мы можем построить уравнение для нахождения нужных нам неизвестных функций — такие уравнения называют функциональными. Природа их может быть, вообще говоря, весьма разнообразной (можно сказать, что с простейшими, самыми примитивными функциональными уравнениями мы уже встречались, рассматривая неявное задание функций).

Задачам разыскания неизвестных функций будут посвящены главы V, VI и VIII. В этой и следующей главе будут рассмотрены, пожалуй, наиболее важные из уравнений, служащих для разыскания функций — так называемые дифференциальные уравнения. Под этим названием понимают уравнения, в которые входит не только сама неизвестная функция, но и ее производные некоторых порядков.

Нижеследующие равенства могут служить примерами дифференциальных уравнений:

(1)

В первых трех из них неизвестная функция обозначена буквой х, а буквой t — независимое переменное; в последних же трех неизвестная функция обозначена буквой u, и она зависит от двух аргументов х и t или x и у.

Большое значение, которое имеют дифференциальные уравнения для математики и особенно для ее приложений, объясняется главным образом тем, что к решению таких уравнений может быть приведено исследование многих физических проблем и технических задач.

Расчеты электрических машин и радиотехнических установок, вычисление траекторий снарядов, исследование устойчивости самолета в полете или течения химической реакции — все это производится путем решения дифференциальных уравнений.

Весьма часто бывает, что физические законы, которым подчиняется то или иное явление, записываются в форме дифференциальных уравнений и сами дифференциальные уравнения являются средством для точного количественного (числового) выражения этих законов. Читатель в следующей главе увидит, например, как в форме дифференциального уравнения записываются законы сохранения масс и тепловой энергии. Законы механики, открытые Ньютоном, позволяют исследовать движение всякой механической системы при помощи дифференциальных уравнений.

Мы поясним это простым примером. Пусть рассматривается материальная частица массы m, движущаяся по оси Ох. Координату ее в момент времени t обозначим х. При движении частицы ее координата X с течением времени будет изменяться, и знание всего движения частицы равносильно знанию функциональной зависимости х от времени t. Допустим, что движение происходит под действием силы F, величина которой зависит от положения частицы, определяемого координатой х, от скорости движения v = dx/dt и от времени т. е. F = F (x, dx/dt, t). Согласно законам механики действие силы F на частицу должно вызвать такое ускорение движения w = , чтобы произведение его на массу m частицы было точно равно величине действующей силы, и, стало быть, в любой момент движения должно выполняться равенство

Это — дифференциальное уравнение, которому должна удовлетворять функция х(t), описывающая историю движения частицы. Оно является просто записью указанного выше закона механики. Значение же его состоит в том, что оно позволяет свести механическую задачу определения движения частицы к математической задаче решения дифференциального уравнения.

(2)

Ниже читатель найдет другие примеры, показывающие, как изучение различных физических процессов может быть сведено к исследованию дифференциальных уравнений.

Теория дифференциальных уравнений начала развиваться в конце XVII в. почти одновременно с возникновением дифференциального и интегрального исчислений. В настоящее время дифференциальные уравнения стали могучим орудием исследования явлений природы. В механике, астрономии, физике, технике с их помощью были достигнуты огромные успехи. Ньютон, исследуя дифференциальные уравнения движения небесных тел, получил законы движения планет, установленные Кеплером эмпирически. Леверье в 1846 г. предсказал существование планеты Нептун и определил ее положение на небе на основе численного анализа тех же уравнений.

Чтобы описать в общих чертах задачи теории дифференциальных уравнений, отметим сначала, что каждое дифференциальное уравнение имеет, вообще говоря, не одно, а бесконечно много решений, — существует бесконечное множество функций, ему удовлетворяющих. Так, например, указанное выше уравнение движения материальной частицы должно выполняться для всякого движения, происходящего под действием силы, характеризуемой функцией F (х, dx/dt, t), независимо от того, с какого места оси оно началось и какова была начальная скорость. Каждому отдельному движению частицы будет соответствовать своя зависимость х от времени t. Так как движений под действием силы F может быть бесконечно много, дифференциальное уравнение (2) будет иметь бесконечное множество решений.

Каждое дифференциальное уравнение определяет, вообще говоря, целый класс функций, ему удовлетворяющих. Основной задачей теории является изучение функций, удовлетворяющих дифференциальному уравнению. Теория уравнений должна дать возможность получить достаточно полное представление о свойствах всех функций, удовлетворяющих уравнению, что особенно важно в приложениях уравнений к естествознанию. Кроме того, она должна обеспечить средства для нахождения численных значений функций, если это потребуется для расчетов. О том, как это осуществляется, мы будем говорить позже.

Если неизвестная функция зависит от одного аргумента, то дифференциальное уравнение называется обыкновенным дифференциальным уравнением. В том же случае, когда неизвестная функция зависит от нескольких аргументов и в уравнение входят производные от нее по нескольким аргументам, дифференциальное уравнение называют уравнением с частными производными. Первые три из уравнений (1) являются обыкновенными, а последние три — уравнениями с частными производными.

Теория уравнений с частными производными обладает многими своеобразными чертами, существенно отличающими ее от теории обыкновенных уравнений. Основные идеи, связанные с такими уравнениями, будут изложены в следующей главе; здесь же мы будем иметь в виду только обыкновенные дифференциальные уравнения.

Рассмотрим несколько примеров.

Пример 1. Закон распада радия состоит в том, что скорость распада пропорциональна наличному количеству радия. Пусть известно, что в некоторый момент времени t — t0 имелось R0 граммов радия. Требуется определить количество радия в любой момент времени

Пусть R (t) — количество нераспавшегося радия в момент времени t.

Скорость распада измеряется величиной — dR/dt. Так как она пропорциональна R, то мы имеем

(3)

где k — величина постоянная.

Чтобы решить нашу задачу, нужно определить функцию из дифференциального уравнения (3). Для этого заметим, что функция, обратная к R(t), удовлетворяет уравнению

(4)

Из интегрального исчисления известно, что уравнению (4) удовлетворяет любая функция вида

где С — произвольная постоянная величина. Из этого соотношения мы определяем R как функцию t. Имеем

(5)

Из всего множества решений (5) уравнения (3) мы должны выделить такое, которое при t = t0 принимает значение R0. Такое решение мы получим, если положим C1 = R0ekt0.

С математической точки зрения уравнение (3) является записью весьма простого закона изменения функции R и rоворит о том, что скорость убывания функции —dR/dt пропорциональна значению самой функции R. Такой закон изменения функции выполняется не только в явлениях радиоактивного распада, но и во многих других физических явлениях.

С тем же законом изменения функции мы встречаемся, например, при изучении охлаждения тел, когда убыль количества тепла в теле

пропорциональна разности между температурой тела и температурой окружающей среды, и при рассмотрении многих других физических процессов. Поэтому область применения уравнения (3) несравненно шире той частной задачи распада радия, для которой мы это уравнение получили.

Пример 2. Пусть материальная точка с массой m движется вдоль горизонтальной оси Ох в сопротивляющейся среде, например в жидкости или газе, под влиянием упругой силы двух пружин, действующих по закону Гука (рис. 1). Этот закон состоит в том, что упругая сила действует в сторону положения равновесия и пропорциональна отклонению от положения равновесия. Пусть положению равновесия соответствует точка х = 0. Тогда сила упругости равна —bx (b>0).

Силу сопротивления среды будем считать пропорциональной скорости движения, т. е. равной —adx/dt, где а>0 и знак минус указывает на то, что сопротивление среды направлено против скорости движения. Такое предположение о силе сопротивления среды хорошо оправдывается опытом при малых скоростях.

На основании закона Ньютона произведение массы материальной точки на ее ускорение равно сумме действующих на нее сил, т. е.

(6)

Таким образом, функция x(t) выражающая положение движущейся точки в любой момент времени t, удовлетворяет дифференциальному уравнению (6). Исследованием решений этого уравнения мы займемся в одном из следующих параграфов.

Если к материальной точке, кроме перечисленных сил, приложена еще сила F, внешняя относительно системы, уравнение движения (6) изменится и примет форму

(6')

Пример 3. Математическим маятником называется материальная точка массы m, подвешенная на нити, длину которой мы обозначим через l (рис. 2). Мы будем предполагать, что маятник все время остается в одной и той же плоскости — в плоскости чертежа. Силой, которая стремится вернуть маятник в положение равновесия OA, является сила тяжести mg, действующая на материальную точку. Положение

Рис. 1.

маятника в любой момент времени t определится углом φ, на который он отклоняется от вертикали OА. За положительное направление отсчета φ примем направление против движения часовой стрелки. Дуга АА' = lφ есть путь, пройденный материальной точкой от положения равновесия А. Скорость движения v будет направлена вдоль касательной к окружности и будет иметь следующее численное значение:

Чтобы составить уравнение движения, разложим силу тяжести mg на две составляющие Q и P, первая из которых направлена вдоль радиуса ОА', а вторая—по касательной к окружности. Составляющая Q не может изменять численного значения скорости v, так как действие ее будет уничтожено сопротивлением подвеса OA'. Изменять значение скорости v может только составляющая Р. Она действует всегда в сторону положения равновесия А, т. е. в сторону убыли φ, если угол φ положительный, и в сторону роста φ, когда φ отрицательный. Численное значение Р равно —mg sin φ, и поэтому уравнение движения маятника будет

или

(7)

Интересно отметить, что решения этого уравнения не выражаются через элементарные функции в конечном виде. Запас элементарных функций оказывается слишком бедным для того, чтобы при помощи них можно было дать точное описание даже такого простого физического процесса, как колебания математического маятника. Позже мы увидим, что дифференциальные уравнения, решаемые в элементарных функциях, немногочисленны, и весьма часто случается, что исследование того или иного дифференциального уравнения, встречающегося в физике или механике, побуждает нас вводить новые классы функций, подвергать их исследованию и расширять арсенал тех функций, которые применяются при решении прикладных задач.

Ограничимся сейчас рассмотрением малых колебаний маятника, когда с малой ошибкой можно считать дугу АА' равной ее проекции х

Рис. 2.

на горизонтальную ось Ох и sinφ равным φ. Тогда уравнение движения маятника примет более простую форму

(8)

Ниже мы выясним, что это уравнение решается в тригонометрических функциях и при помощи их оказывается возможным достаточно точно описать «малые колебания» маятника.

Пример 4. Акустический резонатор Гельмгольца (рис. 3) состоит из наполненного воздухом сосуда V, объем которого равен v, с цилиндрическим горлышком F. Приближенно можно рассматривать воздух в горлышке сосуда как пробку с массой

(9)

где ρ — плотность воздуха, s — площадь сечения горлышка, l — его длина.

Если представить себе эту массу воздуха смещенной из положения равновесия на величину х, то давление воздуха в сосуде с объемом v изменится от начального давления р на некоторую величину, которую мы обозначим Δр.

Будем считать, что давление р и объем v связаны адиабатическим законом pvk = С. Тогда, если пренебречь величинами высших порядков малости, получим

(10)

(В нашем случае Δv = sx). Уравнение движения массы воздуха в горлышке можно записать так:

(11)

Здесь Δр-s— сила давления газа, находящегося внутри сосуда, на воздушную пробку, находящуюся в горлышке. На основании (10) и (11) получаем

(12)

где ρ, р, v, l, k, s — постоянные.

Пример 5. К уравнению вида (6) приводит также изучение электрических колебаний в простейшем колебательном контуре. Схема этого контура изображена на рис. 4. Здесь слева изображен конденсатор

Рис. 3.

емкости С, обкладки которого замкнуты через самоиндукцию L и сопротивление R. Пусть в некоторый момент обкладкам конденсатора сообщена разность потенциалов, после чего ее источник отключен. При отсутствии самоиндукции по проводу, соединяющему обкладки конденсатора, потек бы ток, который продолжался бы до тех пор, пока потенциалы обкладок не выравнялись бы. При наличии же самоиндукции процесс пойдет иначе. В контуре возникнут электрические колебания. Чтобы вывести закон этих колебаний, обозначим через v(t) или просто через v разность потенциалов на обкладках конденсатора в момент t, через I (t) — силу тока в момент t, через R — сопротивление. По известным законам физики I(t)R в каждый момент времени равняется полной электродвижущей силе, а эта последняя складывается из электродвижущей силы —v(t), происходящей от разности потенциалов на обкладках конденсатора и электродвижущей силы самоиндукции Поэтому

(13)

Обозначим через Q (t) заряд конденсатора в момент t. Тогда сила тока в цепи будет равна в каждый момент dQ/dt. Разность потенциалов v(t) на обкладках конденсатора равна Q(t)/C . Поэтому I = dQ/dt = Сdv/dt и равенство (13) можно переписать в виде

(14)

Пример 6. Схема лампового генератора электромагнитных колебаний показана на рис. 5. Колебательный контур, состоящий из емкости С, сопротивления R и самоиндукции L, представляет основную колебательную систему. Катушка L' и электронная лампа, схематически изображенная в центре рис. 5, составляет так называемую обратную связь. Они связывают источник энергии — батарею Б — с контуром L, R, С; К — означает катод лампы, А — анод, S — сетку. При такой схеме в контуре L, R, С возникают «автоколебания». Во всякой реальной системе при колебательном процессе энергия переходит в тепло или передается в какой-либо другой форме окружающим телам. Поэтому для поддержания стационарного режима колебаний, для сохранения амплитуды колебаний каждая реальная колебательная система должна получать энергию извне. Автоколебания отличаются от других колеба-

тельных процессов тем, что для поддержания стационарного колебательного режима в таких системах воздействие извне не обязано быть периодическим. Устройство автоколебательных систем таково, что в них постоянный источник энергии, в нашем примере батарея Б, поддерживает стационарный колебательный режим. Автоколебательными системами являются часы, электрический звонок, струна и смычок, который ведет рука музыканта, голос человека и др.

Сила тока I(t) в колебательном контуре L, R, С удовлетворяет уравнению

(15)

Здесь V = V (t) — разность потенциалов на обкладках конденсатора в момент t, Ia(t) — сила анодного тока через катушку L'; M — коэффициент взаимной связи между катушками L и L'. По сравнению с уравнением (13) уравнение (15) содержит лишний член M-.

Будем считать, что анодный ток Iа(t) зависит только от разности потенциалов на сетке S и катоде лампы, т. е. будем пренебрегать реакцией анода; при таком предположении эта разность потенциалов равна разности потенциалов v(t) на обкладках конденсатора С. Характер функциональной зависимости Iа от v изображен на рис. 6. Изображенную кривую обычно принимают за кубическую параболу и ее приближенное уравнение пишут так:

Подставляя это в правую часть уравнения (15) и пользуясь тем, что

мы получим для v уравнение

(16)

В рассмотренных примерах разыскание тех или иных физических величин, характеризующих заданный физический процесс, свелось к разысканию решений обыкновенных дифференциальных уравнений.

Задачи теории дифференциальных уравнений. Дадим теперь точные определения. Обыкновенным дифференциальным уравнением n-го порядка с одной неизвестной функцией у называется соотношение вида

(17)

между независимым переменным х и значениями

Порядком дифференциального уравнения называется порядок наивысшей производной от неизвестной функции, которая входит в дифференциальное уравнение. Так, дифференциальные уравнения, полученные нами в примере 1, — первого порядка, в примерах 2, 3, 4, 5, 6 — второго порядка.

Функция φ (х) называется решением дифференциального уравнения (17), если после замены у на φ(х), y' на φ'(x), . . . , у(n) на φ(n)(х) оно обращается в тождество.

Часто вопросы физики и техники приводят к системам обыкновенных дифференциальных уравнений, в которые входит несколько неизвестных функций, зависящих от одного и того же аргумента, и их производные по этому аргументу.

Для большей конкретности изложения в дальнейшем будем говорить главным образом об одном обыкновенном дифференциальном уравнении не выше 2-го порядка с одной только неизвестной функцией. На этом примере выясняются существенные свойства всех обыкновенных дифференциальных уравнений и систем таких уравнений, у которых число неизвестных функций равно числу уравнений.

Выше мы говорили о том, что каждое дифференциальное уравнение имеет, как правило, не одно, а бесконечное множество решений. Возвратимся сейчас к этому вопросу и прежде всего поясним его наглядными соображениями, основанными на разобранных выше примерах 2—6. В каждом из них дифференциальное уравнение, соответствующее рассматриваемой физической системе, вполне определялось только устройством этой системы. Но в каждой из этих систем могли происходить различные процессы. Например, совершенно ясно, что маятник, движение которого подчиняется уравнению (8), может совершать весьма разнообразные колебания. Каждому определенному колебанию маятника отвечает свое решение уравнения (8), и таких реше-

ний оно должно иметь бесконечно много. Можно показать, что уравнению (8) удовлетворяет любая функция вида

(18)

где C1 и C2 — произвольные постоянные.

Физически ясно также, что движение маятника будет вполне определено только в том случае, когда мы в некоторый момент t0 зададим (начальное) значение х, равное x0 (начальное отклонение материальной точки от положения равновесия), и начальную скорость движения

По этим начальным условиям определяют постоянные C1 и C2 в формуле (18).

Точно так же дифференциальные уравнения, полученные нами в других примерах, будут иметь бесконечно много решений.

Вообще при очень широких предположениях относительно заданного дифференциального уравнения (17) n-го порядка с одной неизвестной функцией можно показать, что оно имеет бесконечно много решений. Более точно: если для некоторого «начального значения» аргумента мы зададим «начальные значения» неизвестной функции и всех ее производных до порядка n—1 включительно, то для уравнения (17) найдется решение, обладающее предписанными ему заранее «начальными данными». Можно также показать, что такими начальными условиями решение определяется вполне, существует только одно решение, удовлетворяющее поставленным выше начальным условиям. Позже мы будем говорить об этом более подробно. Для наших же целей сейчас существенно отметить, что начальные значения функции и n — 1 первых производных от нее могут быть заданы произвольно. Мы имеем право распорядиться выбором n величин, определяющих «начальное состояние» разыскиваемого решения.

Если мы захотим построить формулу, которая объединяла бы в себе, если это возможно, все решения дифференциального уравнения порядка n, то такая формула должна будет содержать ровно n независимых произвольных постоянных, выбором значений которых мы могли бы удовлетворить n начальным условиям. Такие решения дифференциального уравнения порядка n, которые содержат n независимых произвольных постоянных, обычно называют общими решениями уравнения. Так, например, общее решение уравнения (8) дается формулой (18), содержащей две произвольные постоянные; общее решение уравнения (3) дается формулой (5).

Теперь мы постараемся в самых общих чертах описать те задачи, которые стоят перед теорией дифференциальных уравнений. Они разнообразны и многочисленны. Мы укажем главнейшие из них.

Если к дифференциальному уравнению присоединить начальные данные, то решение дифференциального уравнения будет определено вполне. Построение формул, дающих явные представления решений, является одной из первых задач теории. Такие формулы могут быть построены только в простых случаях, но если они найдены, то это оказывает большую помощь и в вычислениях и в исследовании решения.

Теория должна дать возможность получить представление о характере поведения решения: будет ли оно монотонным или колеблющимся, является ли оно периодическим или стремится к периодическому и т. п.

Представим себе, что мы изменяем начальные значения для неизвестной функции и производных от нее (изменяем начальное состояние изучаемой системы), тогда будет изменяться и само решение (будет иначе протекать процесс). Теория должна обеспечить нам возможность судить о том, каким будет это изменение. В частности, будет ли при малых изменениях начальных данных мало изменяться и само решение и будет ли оно, следовательно, устойчивым в этом отношении, или же малые изменения начальных данных могут вызвать сильные изменения в самом решении, и оно будет неустойчивым.

Мы должны также уметь составить качественную и, там, где можно, количественную картину поведения не только отдельных решений уравнения, но и всех его решений, взятых вместе.

При конструировании часто возникает вопрос о таком выборе параметров, характеризующих прибор или машину, который обеспечивал бы хорошую их работу. Параметры прибора входят в виде некоторых величин в дифференциальное уравнение, служащее для описания его работы. Теория должна помочь нам выяснить, что будет происходить с решениями уравнения (с работой прибора), если мы будем изменять само дифференциальное уравнение (менять входящие в него параметры прибора).

Наконец, когда потребуется произвести расчет, нужно будет находить решение уравнения численно, здесь теория обязана будет доставить в руки инженера и физика методы возможно более экономного и быстрого вычисления решений.

§ 2. ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ С ПОСТОЯННЫМИ КОЭФФИЦИЕНТАМИ

Существуют важные классы обыкновенных дифференциальных уравнений, общее решение которых можно выразить через простые хорошо изученные функции. Один из таких классов образуют линейные относительно неизвестной функции и ее производных (короче, линейные) дифференциальные уравнения с постоянными коэффициентами. Такими являются, например, дифференциальные уравнения (3), (6), (8), (14). Линейное уравнение называется однородным, если в нем нет члена,

свободного от неизвестной функции, и неоднородным, если такой член есть.

Однородное линейное уравнение 2-го порядка с постоянными коэффициентами. Такое уравнение имеет вид

(6)

где m, а, b — постоянны. Будем считать m положительным; это нисколько не ограничивает общности, так как, переменив знак у всех коэффициентов в случае надобности, мы всегда можем придти к этому случаю, если m≠0, что мы будем предполагать.

Будем искать решение этого уравнения в виде показательной функции еλt и попытаемся постоянную λ подобрать так, чтобы функция x = eλt удовлетворяла уравнению. Подставляя x = eλt, dx/dt = λλte в левую часть уравнения (6), получим

Следовательно, чтобы x(t) = eλt было решением уравнения (6), необходимо и достаточно, чтобы

mλ2 + aλ + b = 0. (19)

Если λ1 и λ2 — два действительных корня уравнения (19), то решением уравнения (6), как легко проверить, будет также всякая функция вида

(20)

где C1 и C2 — любые постоянные величины.

Ниже мы покажем, что формула (20) дает все решения уравнения (6) в случае, если уравнение (19) имеет различные действительные корни.

Отметим следующие важные свойства решений уравнения (6):

1. Сумма двух решений уравнения (6) является также решением этого уравнения.

2. Решение уравнения (6), умноженное на постоянную величину, также является решением этого уравнения.

В случае, если λ1 — кратный корень уравнения (19), т. е. mλ2+aλ1+b = 0 и 2mλ1+a = 01, то решением уравнения (6) будет также функция teλ1t, так как, подставляя эту функцию и ее производные в левую часть уравнения (6), получим

что тождественно равно нулю в силу указанных равенств.

1 Сумма корней λ1 и λ2 квадратного уравнения (19) равна λ1 + λ2 = — a/m, и если корни одинаковы, т. е. λ2 = λ1, то отсюда вытекает второе из написанных равенств.

Общее решение уравнения (6) в этом случае имеет вид

(21)

Пусть теперь уравнение (19) имеет комплексные корни. Эти корни будут комплексно сопряженными, так как m, а, b — действительные числа. Пусть λ = а ± iß. Уравнение

эквивалентно двум равенствам

(22)

Легко проверить, что в этом случае функции х = еαcosßt и x = eαtsinßt являются решениями уравнения (6). Действительно, подставляя, например, функцию x (t) = еαtcosβt и ее производные в левую часть уравнения (6), получим

Это выражение равно тождественно нулю в силу равенств (22).

Общее решение уравнения (6), если уравнение (19) имеет комплексные корни, получим в виде

(23)

где C1 и C2 — любые постоянные.

Таким образом, зная корни уравнения (19), которое называется характеристическим уравнением, мы можем написать общее решение уравнения (6).

Отметим, что общее решение линейного однородного уравнения n-го порядка с постоянными коэффициентами

можно записать аналогичным образом через многочлены, показательные и тригонометрические функции, если известны корни алгебраического уравнения

которое называется характеристическим. Таким образом, задача интегрирования линейного однородного уравнения с постоянными коэффициентами сводится к алгебраической задаче.

Докажем теперь, что формулы (20), (21), (23) действительно дают все решения уравнения (6). Заметим, что C1 и C2 в этих формулах всегда можно выбрать так, чтобы функция x(t) удовлетворяла любым

начальным условиям: x(t0) = x0, x'(t0) = x'0. Для этого C1 и C2 нужно определить из системы уравнений

в случае формулы (20), или из других аналогичных уравнений в случае формул (21) и (23). Следовательно, если бы существовало решение уравнения (6), не содержащееся среди указанных нами решений, то существовало бы два различных решения уравнения (6), удовлетворяющих одним и тем же начальным условиям. Их разность x1 (t) была бы отлична от тождественного нуля и удовлетворяла бы нулевым начальным условиям x1(t0) = 0, x'1(t0) = 0. Покажем, что решением уравнения (6), удовлетворяющим нулевым начальным условиям, будет только x1(t) = 0. Докажем это сначала в предположении, что m>0, а>0, b > 0. Умножим правую и левую части равенства

(24)

Так как —, то равенство (24) можно представить в виде

Интегрируя это тождество в пределах от t0 до t, получим

Это равенство возможно только если x1(t) ≡ 0. Действительно, в противном случае мы имели бы слева, если t>t0, положительную величину, а справа— нуль. Так же можно рассмотреть случай, когда t<t0.

Чтобы доказать наше утверждение для любых постоянных коэффициентов m, а, b, рассмотрим функцию y1 (t) = x1 (t)е-αt, которая, как легко проверить, также удовлетворяет нулевым начальным условиям. Если величину а > 0 выбрать достаточно большой, то функция y1 (t) будет удовлетворять некоторому уравнению вида (6) при а > 0, b > 0, m>0. Это уравнение легко получить, подставляя функцию x1(t) = y1(t)eαt и ее производные в уравнение (6). Следовательно, по доказанному выше имеем, что y1(t) ≡ 0 и, значит, x1(t) = y1(t)eαt ≡ 0.

Таким образом, мы доказали, что формулы (20), (21), (23) дают все решения уравнения (6).

Посмотрим, что говорят эти формулы о характере решений уравнения (6). Выпишем для этого формулу

(25)

для корней уравнения (19). В соответствии с теми физическими примерами, которые привели нас к уравнению (6), будем считать m>0, а⩾0, b>0.

Случай 1. a2>4bm. Оба корня характеристического уравнения (19) действительны, отрицательны и различны. В этом случае функция х(t), даваемая формулой (20), представляет общее решение уравнения (6). Все даваемые этой формулой функции и их первые производные стремятся к нулю при t→+∞ и не больше, чем при одном значении t, обращаются в нуль. Следовательно, функция x(t) имеет не больше одного максимума или минимума. Физически это означает, что сопротивление среды настолько велико, что колебаний не происходит. Движущаяся точка может не больше одного раза перейти через положение равновесия х = 0. После этого, достигнув некоторого экстремального удаления от точки х = 0, она начнет медленно приближаться к этой точке, никогда не проходя через нее.

Случай 2. a2 = 4bm. Оба корня уравнения (19) равны между собой, и общее решение уравнения (6) дается формулой (21). В этом случае опять все решения x(t) и их первые производные стремятся к нулю при t→+∞. При этом x(t) и х' (t) не могут обратиться в нуль больше одного раза. Характер движения материальной точки с абсциссой х(t) остается таким же, как и в первом случае.

Случай 3. a2<4bm. Корни характеристического уравнения (19) имеют отличную от нуля мнимую часть. Общее решение уравнения (6) дается формулой (23). Точка х совершает колебания по оси х-ов с неизменным периодом 2π/β, одинаковым для всех решений уравнения (6), и амплитудой

Колебания физических систем, происходящие без действия внешней силы, называются собственными колебаниями этих систем. Из предыдущего следует, что период таких колебаний для систем, о которых говорилось в разобранных выше примерах 2, 3, 4, 5, зависит только от устройства этих систем. Он одинаков для всех колебаний, могущих возникнуть в этих системах. В примере 2 он равен 2- :

в примере 4 он равен

в примере 5 он равен

Если а = 0, т. е. если среда не оказывает сопротивления движению, то амплитуда колебаний постоянна: точка совершает гармонические колебания. Если же а>0, т. е. если среда все же оказывает сопро-

тивление движению, хотя это сопротивление и мало (a2 < 4bm), то амплитуда колебаний стремится к нулю, и колебания затухают.

Наконец, решение х (t) = 0 уравнения (6) во всех случаях описывает состояние покоя точки х, находящейся все время в положении х = 0, которое мы называем точкой равновесия.

Если действительные части обоих корней уравнения (19) отрицательны, то все решения уравнения (6), как видно из формул (20), (21), (23), дающих все решения этого уравнения, при t → + ∞ стремятся к нулю вместе с их производными, т. е. колебания затухают с течением времени.

Если же действительная часть хотя бы одного из корней уравнения (19) была положительной, то у уравнения (6) были бы решения, не стремящиеся к нулю при t→+∞, и тогда некоторые решения уравнения (6) не оставались бы даже ограниченными при t→+∞. Такой случай может быть только при отрицательном b или отрицательном а, если m>0. Физически это соответствовало бы случаям, когда упругая сила не притягивает точку х к положению равновесия, а отталкивает ее от положения равновесия или когда сопротивление среды отрицательно. Такие случаи неосуществимы в тех физических примерах, которые мы рассматривали в начале этой главы, но они вполне осуществимы на других физических моделях.

Если действительная часть корней λ1 и λ2 уравнения (19) равна нулю, что возможно только тогда, когда коэффициент а в уравнении (19) равен нулю, то точка x(t), как показывает формула (23), при α = 0 совершает гармонические колебания с ограниченной амплитудой и ограниченной скоростью.

Неоднородное линейное уравнение с постоянными коэффициентами. Рассмотрим подробно уравнение

(26)

Это — уравнение линейных колебаний материальной точки под действием силы упругости, силы сопротивления среды и внешней периодической силы Acosωt [см. уравнение (6') в § 1],

Уравнение (26) является неоднородным линейным уравнением. Уравнение (6) будет соответствующим ему однородным уравнением.

Будем искать теперь общее решение уравнения (26).

Заметим, что сумма решений неоднородного уравнения и соответствующего ему однородного уравнения есть также решение неоднородного линейного уравнения. Поэтому, чтобы найти общее решение уравнения (26), достаточно знать одно какое-либо частное решение этого уравнения. Общее решение уравнения (26) представится в виде суммы этого частного решения и общего решения соответствующего однородного уравнения.

Естественно ожидать, что движение следует за периодической внешней силой в том же ритме, и искать частное решение уравнения (26) в виде х = В cos (ωt + δ), где В и δ — некоторые числа. Попытаемся определить B и δ так, чтобы функция х = В cos (ωt + δ) удовлетворяла уравнению (26). Вычисляя производные

и подставляя результаты в уравнение (26), получим

Используя хорошо известные формулы, имеем

Очевидно, если мы положим

то функция

будет удовлетворять уравнению (26).

Решение вида Bcos(ωt + δ) существует всегда, если (b — mω2)2+a2ω2≠0. В случае, когда (b — mω2)2 + a2ω2 = 0, т. е. когда а= 0 и b = mω2, уравнение (26) имеет вид

Частным решением в этом случае, как легко проверить, будет функция

Решения неоднородного уравнения (26) будем называть вынужденными колебаниями. Множитель

характеризует амплитуду В найденного нами вынужденного колебания по отношению к амплитуде А возмущающей силы. Кривая, изображающая функцию φ(ω), называется кривой резонанса. Частота ω, при которой φ(ω) достигает наибольшего значения, называется частотой резонанса. Найдем ее. Если наибольшее значение функция φ(ω) принимает при ω1≠0, то при этом значении ω производная φ'(ω) обращается в нуль, т. е.

и, следовательно,

При этом значении ω1

Отсюда видно, что амплитуда вынужденного колебания при ω = ω1 тем больше, чем меньше а. При малых а частота ω1 близка к значению √b/m т. е. к частоте свободных колебаний. При а = 0 и b = mω2, как мы видели, вынужденное колебание имеет вид

т. е. амплитуда этого колебания неограниченно растет при t→∞. Это явление называется в математике резонансом. Резонанс наступает, если период внешней силы совпадает с периодом собственных колебаний системы. В действительности в случаях близости периода внешней силы и периода собственных колебаний размах колебаний системы может стать весьма большим.

Возможностью возникновения больших колебаний в системе часто пользуются для создания различного рода усилителей, например в радиотехнике. Но большие колебания могут также приводить к разрушению конструкций, например мостов и перекрытий сооружений. Поэтому так важно предусмотреть возможность наступления резонанса или близких к нему колебаний.

Согласно сделанному ранее замечанию, любое решение уравнений (26) представится в виде суммы найденного нами вынужденного колебания и одного из решений однородного уравнения, представленного формулами (20), (21), (23). При а>0 и b>0 решения однородного уравнения стремятся к нулю при t →∞, т. е. любое движение с течением времени приближается к найденным нами вынужденным колебаниям. Если а = 0 и b>0, то вынужденное колебание накладывается на незатухающие собственные колебания системы. При b = mω2 и а = 0 наступает резонанс.

Если на систему действует некоторая внешняя периодическая сила f(t), то вынужденные колебания системы можно найти следующим образом. Представляем f(t) с достаточной точностью в виде отрезка тригонометрического ряда1

(27)

Находим вынужденные колебания, соответствующие каждому слагаемому этой суммы. Вынужденное колебание, соответствующее силе f(t), получается наложением колебаний, соответствующих отдельным слагаемым суммы (27). Если какая-нибудь из частот ωk совпадает с частотой собственных колебаний системы, то наступает резонанс.

1 См. главу XII, § 7.

§ 3. НЕСКОЛЬКО ОБЩИХ ЗАМЕЧАНИЙ О РЕШЕНИИ И СОСТАВЛЕНИИ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ

Дифференциальных уравнений, все решения которых явно выражаются через простейшие функции, как это имеет место для линейных уравнений с постоянными коэффициентами, немного. Можно привести простые примеры дифференциальных уравнений, общее решение которых не может быть выражено с помощью конечного числа интегралов от известных функций или, как говорят, не может быть выражено в квадратурах.

Так, еще в 1841 г. Лиувилль показал, что решение уравнения Риккати вида dy/dx + ay2 = x2 при а>0 не может быть выражено с помощью конечного числа интегралов от элементарных функций. Поэтому большое значение имеют приемы приближенного решения дифференциальных уравнений, применимые к широким классам дифференциальных уравнений.

То обстоятельство, что таким образом находятся не точные решения этих уравнений, а только приближенные, не должно нас беспокоить. Во-первых, эти приближенные решения, по крайней мере в принципе, могут быть найдены со сколь угодно большой точностью. Во-вторых, следует особо подчеркнуть, что в большинстве случаев сами дифференциальные уравнения, описывающие тот или другой физический процесс, не вполне точны. Это можно видеть на всех примерах, о которых говорилось в § 1.

Особенно показательно в этом отношении уравнение (12) акустического резонатора. При выводе этого уравнения мы пренебрегли сжимаемостью воздуха в горле сосуда и движением воздуха в сосуде. На самом деле при движении воздуха в горле движутся также и массы воздуха в сосуде, но скорости и смещения этих движений различны. В горле происходит значительно большее смещение частиц воздуха, чем в сосуде. Поэтому мы пренебрегли движением воздуха в сосуде, а учли только его сжатие. Для воздуха в горле, наоборот, пренебрегли энергией сжатия, а учли только кинетическую энергию его движения.

При выводе дифференциального уравнения физического маятника мы пренебрегли массой нити, на которую он подвешен. При выводе уравнения (14) электрических колебаний в контуре пренебрегли самоиндукцией провода, сопротивлением катушек. Вообще при выводе дифференциального уравнения любого физического процесса мы всегда чем-то пренебрегаем, что-то идеализируем. Поэтому А. А. Андронов обратил особенное внимание на то, что для физических исследований представляют особый интерес такие дифференциальные уравнения, решения которых мало изменяются при всех в каком-то смысле малых изменениях этих уравнений. Такие дифференциальные уравнения он

назвал «грубыми». Эти уравнения заслуживают особенно полного изучения.

Надо сказать, что в физических исследованиях неточно определяются не только самые дифференциальные уравнения, которые описывают законы изменения физических величин, определяющих течение изучаемого процесса, но даже самое число этих величин определяется весьма приближенно. Строго говоря, нет, например, абсолютно твердых тел. Поэтому при изучении колебаний маятника мы должны были бы учесть деформацию нити, на которой он подвешен, деформацию самого твердого тела, которое мы приближенно приняли за материальную точку. Точно так же при изучении колебаний груза, прикрепленного к пружинам, надо было бы принять во внимание массу отдельных витков пружины. Но в этих примерах легко показать, что характер движения отдельных частиц, из которых составлен маятник или груз вместе с пружиной, мало влияет на характер колебаний. Если бы мы захотели учесть это влияние, задача настолько усложнилась бы, что мы не смогли бы ее решить с хорошим приближением. Полученное решение практически не лучше соответствовало бы физической реальности, чем полученное прежде в § 1 без учета этих влияний. Известная идеализация задачи всегда неизбежна. При описании процесса нужно учесть основные черты процесса, а отнюдь не стремиться учесть все черты его без исключения. Это не только сильно усложнило бы задачу, но в большинстве случаев сделало бы ее решение невозможным. Задача физики и механики при изучении какого-нибудь процесса состоит в том, чтобы найти по возможности меньшее число величин, достаточно точно определяющих состояние изучаемого процесса в каждый момент; найти по возможности более простые дифференциальные уравнения, хорошо описывающие законы изменения этих величин. Задача эта часто бывает весьма нелегкой. Что же является существенным при рассмотрении некоторой физической задачи, чем нельзя и чем следует пренебречь, это в конечном счете решает длительный опыт. Только сопоставляя те ответы, которые дает нам идеализированное рассмотрение, с результатами опыта, мы можем судить, законна ли была идеализация.

Математическая задача о возможности уменьшения числа определяющих величин в одной из ее простейших и характерных постановок формулируется так.

Допустим, что мы характеризуем сначала состояние рассматриваемой физической системы в момент t двумя величинами x1(t) и x2(t). Пусть дифференциальные уравнения, определяющие закон их изменения, имеют вид

(28)

У второго уравнения коэффициентом при производной служит малый постоянный параметр s. Если мы положим ε = 0, то второе из уравнений (28) перестанет быть дифференциальным уравнением. Оно примет тогда вид

Определим отсюда x2 как функцию от t и x1 и подставим эту функцию в первое из уравнений (28). Получим уже для одной только величины x1 дифференциальное уравнение вида

Таким образом, число параметров, подлежащих изучению, уменьшилось до одного. Спрашивается, при каких условиях ошибка, происходящая от того, что мы положили ε = 0, будет мала? Ведь может случиться, что при е→0 величина dx2/dt будет бесконечно возрастать и правая часть второго из уравнений (28) не будет стремиться к нулю при ε→0. На целый ряд вопросов, аналогичных только что поставленному, исчерпывающий ответ дали советские математики.

§ 4. ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ ЗАДАЧИ ИНТЕГРИРОВАНИЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ. ОБОБЩЕНИЕ ЗАДАЧИ

Для простоты будем сначала рассматривать только одно дифференциальное уравнение 1-го порядка с одной неизвестной функцией

(29)

где функция f(x, у) определена в некоторой области G на плоскостu (x, у). Это уравнение задает в каждой точке области значение углового коэффициента касательной к проходящему через эту точку графику решения уравнения (29). Если в каждой точке (х, у) области G представить с помощью некоторого отрезка (оба направления по этому отрезку для нас равноправны) направление касательной, определяемое значением f(x, у) в этой точке, то получим поле направлений. Тогда задачу разыскания решения дифференциального уравнения (29) по начальному условию у(x0) = y0 можно сформулировать так: в области G требуется найти проходящую через точку M0(x0, y0) кривую у = φ(х), которая в каждой своей точке имеет касательную с задаваемым уравнением (29) угловым коэффициентом в этой точке или, как говорят короче, которая имеет в каждой своей точке заданное направление.

С геометрической точки зрения в такой постановке задачи представляются неестественными следующие обстоятельства:

1. Требуя, чтобы угловой коэффициент заданного в любой точке (х, у) области G направления равнялся f(x, y), мы тем самым исключаем направления, параллельные Oy, так как мы вообще всюду рассматриваем только конечные величины; в частности, предполагается, что функция f(x, у) в правой части уравнения (29) принимает всюду только конечные значения.

2. Рассматривая только кривые, служащие графиками функций от х, мы тем самым исключаем из рассмотрения те линии, которые с некоторыми перпендикулярами к оси Ох пересекаются больше одного раза, так как мы всюду рассматриваем только однозначные функции; в частности, всякое решение дифференциального уравнения предполагается однозначной функцией от х.

Поэтому мы несколько обобщим предыдущую постановку задачи разыскания решения дифференциального уравнения (29). Именно, будем допускать, что поле направлений в некоторых точках параллельно оси Oy. В тех точках, где угловой коэффициент по отношению к оси Ох не имеет смысла, будем пользоваться угловым коэффициентом по отношению к оси Oy. Соответственно этому, наряду с дифференциальным уравнением (29), будем рассматривать уравнение

(29')

если f(x, у) ≠ 0, используя второе уравнение

там, где первое не имеет смысла, а второе имеет смысл. Задачу же интегрирования дифференциальных уравнений (29) и (29') поставим так: в области G найти все линии, имеющие в каждой точке направление, заданное этими уравнениями. Эти линии будем называть интегральными линиями (интегральными кривыми) уравнений (29) и (29') или поля направлений, задаваемого этими уравнениями. Вместо множественного числа «уравнения (29), (29')» часто будем употреблять единственное число: «уравнение (29), (29')». Ясно, что график всякого решения уравнения (29) будет интегральной кривой уравнения (29), (29'). Но не всякая интегральная кривая уравнения (29), (29') будет графиком решения уравнения (29). Этого не будет, например, если некоторый перпендикуляр к оси Ох пересечет эту линию больше, чем в одной точке В дальнейшем, если будет явно указано, что

то мы, наряду с уравнением

не будем выписывать уравнение

Иногда вместо этих уравнений, вводя параметр t, пишут систему уравнений

где x и у рассматриваются как функции t.

Пример 1. Уравнение

(30)

задает поле направлений всюду, за исключением начала координат. Схематически это поле изображено на рис. 7. Все определяемые уравнением (30) направления проходят через начало координат. Ясно, что при любом к функция

(31)

является решением уравнения (30). Совокупность же всех интегральных линий этого уравнения задается соотношением

(32)

где а и b — любые постоянные, не равные нулю одновременно. Ось Oy является интегральной линией уравнения (30), но не служит графиком его решения.

Так как уравнение (30) не определяет поля направлений в начале координат, то линии (31) и (32) являются, строго говоря, интегральными линиями всюду, за исключением начала координат. Поэтому правильнее говорить, что интегральными линиями уравнения (30) являются не прямые, проходящие через начало координат, а полупрямые, выходящие из начала координат.

Рис. 7. Рис. 8.

Пример 2. Уравнение

(33)

задает поле направлений всюду, за исключением начала координат. Схематически оно изображено на рис. 8. Направления, задаваемые в точке (х, у) уравнениями (30) и (33), взаимно перпендикулярны. Ясно, что все окружности, имеющие центр в начале координат, будут интегральными кривыми уравнения (33). Решениями же этого уравнения будут функции

Для краткости в дальнейшем будем говорить иногда «решение проходит через точку (х, у)» вместо того, чтобы говорить точнее: «график решения проходит через точку (x, у)».

§ 5. СУЩЕСТВОВАНИЕ И ЕДИНСТВЕННОСТЬ РЕШЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО УРАВНЕНИЯ. ПРИБЛИЖЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ

Вопрос о существовании и единственности решения дифференциального уравнения. Возвратимся к дифференциальному уравнению (17) произвольного порядка n. Оно имеет, вообще говоря, бесконечное множество решений, и чтобы из всевозможных его решений выделить какое-либо одно определенное, необходимо к уравнению присоединить дополнительные условия, число которых должно быть равно порядку n уравнения. Такие условия могут иметь весьма разнообразный характер, и вид их тесно связан с физическим, механическим или иным значением задачи, которую мы привели к решению уравнения. Например, если нам нужно исследовать движение механической системы, начинающееся с определенного начального состояния, дополнительные условия будут относиться к определенному (начальному) значению независимой переменной и будут носить тогда название начальных условий задачи. Если же мы хотим определить линию провисания каната при конструировании подвесного моста или хотим найти прогиб балки, положенной на опоры и несущей какие-либо нагрузки, мы встретимся с дополнительными условиями, относящимися к различным значениям независимой переменной (к концам каната или точкам опоры балки в наших примерах). Можно было бы привести много других примеров, показывающих, насколько разнообразными могут быть дополнительные условия, присоединяемые к дифференциальному уравнению.

Будем считать, что дополнительные условия поставлены и нам нужно найти решение уравнения (17), удовлетворяющее таким условиям. Первый вопрос, который мы должны поставить,—это вопрос о существовании искомого решения. Нередко бывает, что мы заранее не можем

быть уверены в его существовании. Пусть, скажем, уравнение (17) является записью закона работы какого-либо физического прибора, и пусть мы хотим определить, может ли в этом приборе осуществиться периодический процесс. Дополнительные условия будут тогда условиями периодической повторяемости начального состояния процесса в приборе, и мы не можем сказать заранее, будет или не будет существовать решение, им удовлетворяющее.

Во всяком случае исследование проблемы существования и единственности решения дает нам возможность выяснить, какие дополнительные условия могут быть выполнены для рассматриваемого уравнения и какие из них определят решение единственным образом. Выявление таких условий и доказательство существования и единственности решения уравнения, описывающего некоторое физическое явление, имеют большое значение и для самой физической теории. Они показывают взаимную согласованность допущений, принятых в математическом описании явления, и известную полноту этого описания.

Методы исследования проблемы существования многообразны, но среди них особенно важную роль играют так называемые прямые методы. Существование нужного решения в них доказывается путем построения приближенных решений, сходящихся в пределе к точному решению задачи. Эти методы дают возможность не только установить существование точного решения, но доставляют также возможность, хотя бы принципиальную, сколь угодно точно к нему приблизиться.

Ниже в этом параграфе для определенности изложения будем иметь в виду задачу с начальными данными и на ее примере постараемся выяснить идеи метода Эйлера и метода последовательных приближений.

Метод ломаных линий Эйлера. Пусть в некоторой области G плоскости (x, у) задано дифференциальное уравнение

(34)

Как мы уже отмечали, уравнение (34) определяет в области G поле направлений. Возьмем какую-нибудь точку (x0, y0) из G. Ей будет соответствовать проходящая через эту точку прямая L0 с угловым коэффициентом f(x0, y0), касательная к проходящей через эту точку интегральной линии. На прямой L0 возьмем точку (x1, y1), достаточно близкую к (x0, y0) (на рис. 9 эта точка обозначена цифрой 1). Через точку (x1, y1) проведем прямую L1 с угловым коэффициентом f(x1, y1), на которой мы отметим точку (x2, y2) (на рисунке эта точка обозначена цифрой 2). Затем на прямой L2, соответствующей точке (x2, y2), отметим таким же способом точку (x3, y3) и т. д. Пусть при этом x0<х1< <х2 <х3<... Предполагается, конечно, что все точки (x0, y0), (x1, y1), (x2, y2), ... принадлежат области G. Ломаная линия, соединяющая эти точки, называется ломаной Эйлера. Можно было бы провести ломаную

Рис. 9.

Эйлера и в сторону убывающих х (соответствующие угловые точки на нашем рисунке обозначены —1, —2, —3).

Естественно ожидать, что каждая из проходящих через точку (x0, y0) ломаных Эйлера с достаточно короткими звеньями дает некоторое представление об интегральной кривой l, проходящей через точку (x0, y0), и что при уменьшении длин звеньев, когда длина наибольшего звена стремится к нулю, ломаные Эйлера будут приближаться к этой интегральной кривой.

При этом предполагается, конечно, что такая интегральная линия существует. В самом деле, не трудно показать, что если в области G функция f(x, у) непрерывна, то можно выбрать бесконечную последовательность ломаных Эйлера, у которых длина наибольшего звена стремится к нулю, причем эта последовательность сходится к некоторой интегральной кривой l. Однако при этом, вообще говоря, может не оказаться единственности: могут существовать различные последовательности ломаных Эйлера, которые будут сходиться к различным интегральным кривым, проходящим через одну и ту же точку (x0, y0). М. А. Лаврентьев построил пример такого дифференциального уравнения вида (29) с непрерывной функцией f (х, у), у которого в любой окрестности любой точки Р области G через точку Р проходит не одна, а по крайней мере две интегральные линии. Для того чтобы через каждую точку области G проходила только одна интегральная линия, необходимо предъявить к функции f(x, у) дополнительные требования сверх требования быть непрерывной. Достаточно, например, предположить, что функция f(x, у) непрерывна и имеет ограниченную производную по у во всей области G. В этом случае можно показать, что через каждую точку области G проходит одна и только одна интегральная линия и что всякая последовательность ломаных Эйлера, проходящих через точку (x0, y0), равномерно сходится к этой единственной интегральной линии, когда длина наибольшего звена ломаной стремится к нулю. Поэтому при достаточно малых звеньях ломаную Эйлера можно приближенно принять за интегральную линию уравнения (34).

Из предыдущего видно, что ломаные Эйлера строятся так, что малые куски интегральных линий заменяются отрезками прямых, касательных к этим интегральным линиям. На практике часто приближения для интегральных линий дифференциального уравнения (34) составляются не из отрезков прямых, касающихся интегральных линий, а из отрезков парабол, имеющих более высокий порядок касания с интеграль-

ными кривыми. Таким образом, удается получить приближенное решение с такой же точностью при меньшем числе шагов (меньшем числе звеньев, из которых составляется приближенная линия). Коэффициенты уравнения параболы

(35)

имеющей в точке (xk, yk) касание n-го порядка с проходящей через эту точку интегральной линией уравнения (34), даются следующими формулами:

(36)

(36')

(36'')

(36''')

и т. д. Многочлен (35) нам нужен только для того, чтобы вычислить его значение при х = хк+1. Значения же самих коэффициентов a0, a1, a2, ..., an нам не нужны. Существует много способов вычисления значения многочлена (35) при х = хк+1 с коэффициентами, определенными по формулам (36), минующих вычисление самих коэффициентов a0,

Существуют приближенные способы разыскания решений дифференциального уравнения (34), основанные и на других идеях. Один из удобных способов разработан академиком А. Н. Крыловым (1863—1945).

Метод последовательных приближений. Мы остановимся сейчас еще на методе последовательных приближений, имеющем столь же широкую область применения, как и метод ломаных линий Эйлера. Вновь будем считать, что нам нужно найти решение у(х) дифференциального уравнения (34), удовлетворяющее начальному условию

Примем за исходное приближение к решению у (х) произвольную функцию y0(х). Для простоты будем считать, что она также удовлетворяет начальному условию, хотя это и не обязательно. Подставим ее в правую

часть уравнения f(x, у) вместо неизвестной функции у и построим первое приближение y1 к решению у по следующим требованиям:

Так как в правой части первого из равенств стоит известная функция y1 (х) можно найти при помощи интегрирования

Можно ожидать, что y1 (х) будет меньше отличаться от решения у(х), чем y0(х), так как при построении y1(х) мы воспользовались дифференциальным уравнением и оно, вероятно, должно исправить погрешности исходного приближения. Можно думать также, что если мы тем же способом улучшим первое приближение y1(х), то второе приближение

будет еще ближе к разыскиваемому решению.

Допустим, что такой процесс улучшения мы будем продолжать неограниченно далеко, и построим последовательность приближений

Будет ли она сходиться к решению у(х)?

Более подробные исследования показывают, что в том случае, когда функция f(x, у) непрерывна и f ограничена в области G, функции уп(х) действительно будут стремиться к точному решению у(х), по крайней мере для х, мало отклоняющихся от x0. Если же мы прекратим вычисления на некотором достаточно далеком шаге, то сможем найти решение у(х) со сколь угодно высокой степенью точности.

Совершенно так же, как мы находили приближение интегральных линий уравнения (34), можно приближенно находить интегральные линии системы двух и большего числа дифференциальных уравнений 1-го порядка. Существенно необходимым условием для этого является условие возможности разрешения этих уравнений относительно производных от всех неизвестных функций. Пусть, например, дана система

(37)

Предполагается, что правые части этих уравнений непрерывны и имеют ограниченные производные по у и по z в некоторой пространственной области G. Можно доказать при этих условиях, что через

каждую точку (x0, y0, z0) области G, где заданы правые части уравнений (37), проходит одна и только одна интегральная линия

системы (37). Функции f1 (x, y, z) и f2 (х, y, z) суть угловые коэффициенты в точке (х, у, z) касательной к интегральной кривой, проходящей через эту точку. Для приближенного нахождения функций φ(x) и ψ (х) можно применять метод ломаных Эйлера и другие методы, аналогичные тем, какие применимы к уравнению (34).

Процесс приближенного вычисления решений обыкновенных дифференциальных уравнений по начальным условиям может проводиться на счетных машинах. Существуют электронные машины, работающие настолько быстро, что, например, если программа вычислений уже составлена и машина подготовлена к счету, траектория снаряда может быть вычислена в гораздо более короткий промежуток времени, чем тот, за который снаряд долетает до места назначения (см. главу XIV).

Связь между дифференциальными уравнениями разных порядков и системой большего числа уравнений 1-го порядка. Система обыкновенных дифференциальных уравнений, разрешенная относительно старших производных от всех неизвестных функций, вообще говоря, может быть при помощи введения новых неизвестных функций сведена к системе уравнений 1-го порядка, разрешенной относительно всех производных. Пусть, например, дано дифференциальное уравнение

(38)

Положим

(39)

Тогда уравнение (38) можно записать в виде

(40)

Таким образом, каждому решению уравнения (38) соответствует некоторое решение системы, состоящей из уравнений (39) и (40) Легко видеть также, что каждому решению системы уравнений (39) и (40) соответствует решение уравнения (38).

Уравнения, не содержащие независимой переменной явно. Задачи о маятнике, акустическом резонаторе Гельмгольца, простейшем электрическом контуре, ламповом генераторе, рассмотренные в § 1, приводят к дифференциальным уравнениям, в которые независимая переменная (время) не входит явно. Сейчас мы говорим об уравнениях такого вида потому, что изучение соответствующих им дифференциальных уравнений 2-го порядка можно свести к изучению дифференциальных уравнений 1-порядка, а не к системе уравнений, как это было

сделано в предыдущем пункте для общего уравнения 2-го порядка. Такое сведение сильно облегчает исследование.

Итак, пусть дано дифференциальное уравнение 2-го порядка, не содержащее аргумента t в явной форме

(41)

Обозначим

(42)

и будем рассматривать у как функцию х, тогда

Поэтому уравнение (41) можно переписать в виде

(43)

Таким образом, каждому решению уравнения (41) соответствует единственное решение уравнения (43). Каждому же решению у = φ (х) уравнения (43) соответствует бесконечное множество решений уравнения (41). Эти решения можно найти, интегрируя уравнение

(44)

где X рассматривается как функция от t.

Ясно, что если какая-нибудь функция х = х (t) удовлетворяет этому уравнению, то ему удовлетворяют также все функции х (t + t0), где t0 — произвольное постоянное.

Может случиться, что не вся интегральная линия уравнения (43) является графиком одной функции от х. Так будет, например, если эта линия замкнута. Тогда эту интегральную линию уравнения (43) надо разбить на несколько кусков, каждый из которых является графиком функции от Х. Для каждого из этих кусков надо интегрировать свое уравнение (44).

Величины x и dx/dt , характеризующие в каждый момент состояние физической системы, соответствующей уравнению (41), называются ее фазами. Соответственно этому плоскость (х, у) называется фазовой плоскостью для уравнения (41). Каждому решению x = x(t) этого уравнения соответствует линия

x = x(t), y = x'(t)

на плоскостu (x, у); t здесь рассматривается как параметр. Обратно: каждой интегральной для уравнения (43) линии у = φ(х) на плоскости

(х, у) соответствует бесконечное множество решений вида х = х (t + t0) для уравнения (41); здесь t0 — произвольное постоянное. Имея всю картину поведения интегральных линий уравнения (43) на плоскости, нетрудно представить себе также характер возможных решений уравнения (41). Каждой замкнутой интегральной линии уравнения (43) отвечают, например, периодические решения уравнения (41).

Подвергая уравнение (6) рассмотренному только что преобразованию посредством подстановки (42), мы получим уравнение

(45)

Полагая в уравнении (16) v = x и dv/dt = y, аналогично получим

(46)

Подобно тому, как в каждый момент состояние физической системы, соответствующей уравнению 2-го порядка (41), характеризуется двумя величинами1 (фазами) х и у = dx/dt, состояние физических систем, описываемых уравнениями более высокого порядка или системами дифференциальных уравнений, характеризуется большим числом величин (фаз). Вместо того, чтобы говорить о фазовой плоскости, тогда говорят о фазовом пространстве.

§ 6. ОСОБЫЕ ТОЧКИ

Пусть точка Р (х, у) лежит внутри области G, где мы рассматриваем дифференциальное уравнение

(47)

Если можно указать такую окрестность R точки Р, через каждую точку которой проходит одна и только одна интегральная линия уравнения (47), то точку Р называют обыкновенной точкой уравнения (47). Если же такой окрестности нельзя указать, то точку Р называют особой точкой этого уравнения. Рассмотрение особых точек имеет большое значение для качественной теории дифференциальных уравнений, о которой мы расскажем в следующем параграфе.

Особенно большое значение имеют так называемые изолированные особые точки, т. е. такие особые точки, в некоторой окрестности кото-

1 Значения в тот же момент — , . . . определяются по значению х и dx/dt из уравнения (41) и уравнений, полученных дифференцированием его [ср. формулы (36)].

рых нет других особых точек. В приложениях они часто встречаются при исследовании уравнений вида (47), где M (х, у) и N (х, у) — функции, имеющие непрерывные производные по х и у высоких порядков. Для таких уравнений все внутренние точки рассматриваемой области, где M (х, у) ≠ 0 или N (х, y)≠0, являются обыкновенными точками. Рассмотрим какую-нибудь внутреннюю точку (x0, y0), где M (х, у) = N (х, у) = 0. Для упрощения записи будем предполагать, что x0 = 0 и y0 = 0. Этого всегда можно достигнуть, перенося начало координат в точку (x0, y0). Разлагая тогда M (x, у) и N (х, у) по формуле Тейлора по степеням х и у и ограничиваясь при этом членами первого порядка, получим в окрестности точки (0, 0)

(48)

где φ1 (x, у) и φ2 (х, у) — некоторые функции от х и y, такие, что

Такой вид имеют уравнения (45) и (46). Уравнение (45) не определяет ни dy/dx, ни dx/dy при х = 0 и у = 0. Если определитель

то, как бы мы ни задали dy/dx в начале координат, начало координат будет точкой разрыва для значений dy/dx и dx/dy, так как они будут стремиться к различным пределам в зависимости от выбора пути, по которому мы будем приближаться к началу. Начало координат является особой точкой для нашего дифференциального уравнения.

Доказано, что на характер поведения интегральных кривых около изолированной особой точки (у нас начала координат) стоящие в числителе и знаменателе функции φ1 (х, у) и φ2(х, у) не оказывают никакого влияния, если только действительные части обоих корней уравнения

(49)

отличны от нуля. Поэтому, чтобы составить представление об этом поведении, изучим поведение около начала координат интегральных линий уравнения

(50)

для которого определитель

Заметим, что характер расположения интегральных кривых в окрестности особой точки дифференциального уравнения представляет большой интерес для многих задач механики, например для исследования траекторий движений вблизи положения равновесия.

Доказано, что на плоскости всегда можно выбрать координаты ξ и η, связанные с х и у равенствами

(51)

где kij — действительные числа, так что уравнение (50) преобразуется к одному из следующих трех типов:

(52) (53)

(54)

Здесь λ1 и λ2 — корни уравнения

(55)

Если эти корни действительны и различны, то уравнение (50) приводится к виду (52). Если эти корни одинаковы, то уравнение (50) приводится или к виду (52), или к виду (53) в зависимости от того, будет ли a2+d2 = 0 или a2 + d2 ≠ 0. Если корни уравнения (55) комплексны, λ = α + ßi, то уравнение (51) приводится к виду (54).

Рассмотрим каждое из уравнений (52), (53), (54). Предварительно заметим следующее.

Если оси Ох и Oy были взаимно перпендикулярны, то оси Oξ и Оη уже не будут, вообще говоря, взаимно перпендикулярны. Но мы для упрощения выполнения чертежей считаем их взаимно перпендикулярными. Кроме того, при преобразовании (51) масштабы по осям Oξ и Оη также могли исказиться; они могут быть не теми, какие были первоначально взяты на осях Ох и Oy. Мы же, опять для упрощения чертежей, считаем, что масштабы не искажаются. Поэтому, например, вместо концентрических окружностей, как на рис. 8 (стр. 26), вообще говоря, может получиться семейство подобных и подобно расположенных эллипсов с общим центром в начале координат.

Все интегральные линии уравнения (52) задаются соотношением вида

где а и b — произвольные постоянные.

Интегральные линии уравнения (52) схематически изображены на рис. 10; при этом мы считали, что k>1. В этом случае все интегральные линии, кроме одной — оси Оη — касаются в начале координат оси Oξ. Случай 0 < k < 1 сводится к случаю k > 1 заменой ξ на η, и η на ξ, т. е. нужно поменять роли осей ξ и η. При k = 1 уравнение (52) обращается в уравнение (30), схема поведения интегральных линий которого изображена на рис. 7.

Схема поведения интегральных линий уравнения (52) при k<0 изображена на рис. 11. В этом случае имеются только две интегральные линии, которые проходят через точку О: это ось Oξ и ось Oη. Всякая же другая интегральная линия, приблизившись к О до некоторого минимального расстояния, удаляется от этой точки. В этом случае говорят, что в точке О имеется седло, потому что интегральные линии похожи на изображение на карте линий уровня горного перевала (седла).

Все интегральные линии уравнения (53) даются уравнением

где а и b — произвольные постоянные. Схематически они изображены на рис. 12; все они касаются в начале координат оси Oη.

Если всякая интегральная линия, попавшая в некоторую окрестность особой точки О, приходит к этой точке и притом по определенному направлению, т. е. имеет в нуле определенную касательную, как это показано на рис. 10 и 12, то говорят, что в точке О имеется узел.

Рис. 10. Рис. 11.

Уравнение (54) легче всего проинтегрировать, если перейти к полярным координатам ρ и φ, положив

Гогда это уравнение перейдет в уравнение

откуда

(56)

Если k>0, то все интегральные линии приближаются к точке O бесконечно навиваясь на эту точку, когда φ→—∞ (рис. 13). Если k<0, то же происходит, когда φ→+∞. В этих случаях точку О называют фокусом. Если же k = 0, то семейство интегральных линий (56) состоит из кругов с центром в точке О. Вообще, если некоторая окрестность точки О заполнена замкнутыми интегральными линиями, содержащими внутри себя точку О, то такую точку называют центром.

Центр может легко перейти в фокус, если к числителю и знаменателю правой части уравнения (54) прибавить член как угодно высокого порядка; следовательно, в этом случае поведение интегральных линий вблизи особой точки не определяется членами 1-го порядка.

Уравнение (55), соответствующее уравнению (45), совпадает с характеристическим уравнением (19). Поэтому рис. 10 и 12 схематически представляют поведение на фазовой плоскости (x, у) линий

x = x(t), y = x'(t)t

соответствующих решениям уравнения (6) при действительных λ1 и λ2 одного знака; рис. 11 соответствует действительным λ1 и λ2 разных

Рис. 12. Рис. 13.

знаков, а рис. 13 и 8 (случай центра) — комплексным λ1 и λ2. Если действительные части λ1 и λ2 отрицательны, то точка (x(t), y(t)) приближается к 0 при t→∞ ; в этом случае точка х = 0, у = 0 соответствует устойчивому равновесию. Если же действительная часть одного из чисел λ1 и λ2 положительна, то в точке x = 0, у = 0 нет устойчивого равновесия.

§ 7. КАЧЕСТВЕННАЯ ТЕОРИЯ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ

Важное место в общей теории обыкновенных дифференциальных уравнений занимает качественная теория дифференциальных уравнений. Она возникла в конце прошлого века в связи с потребностями механики и астрономии.

Во многих прикладных задачах требуется установить характер решения дифференциального уравнения, описывающего некоторый физический процесс, определить свойства его решений для конечного или бесконечного промежутка изменения независимого переменного. Так, например, в небесной механике, изучающей движения небесных тел, важно иметь сведения о поведении решений дифференциальных уравнений, описывающих движение планет или других небесных тел, при неограниченном возрастании времени.

Как мы говорили выше, лишь для немногих особо простых уравнений общее решение может быть выражено при помощи интегралов от известных функций. В связи с этим возникла задача изучения свойств решений дифференциального уравнения по самому уравнению. Так как решение дифференциального уравнения представляется в виде кривой на плоскости или в пространстве, то возникла задача об исследовании свойств интегральных кривых, их расположения, их поведения в окрестности особых точек. Будут ли они, например, расположены в ограниченной части плоскости или иметь ветви, уходящие к бесконечности, будут ли среди них замкнутые кривые и т. д. Исследование таких вопросов и составляет задачу качественной теории дифференциальных уравнений.

Основоположниками качественной теории дифференциальных уравнений являются русский математик А. М. Ляпунов и французский математик А. Пуанкаре.

Роль советской науки в качественной теории дифференциальных уравнений заключается не только в том, что советскими учеными разрабатывались важные теоретические вопросы, но также и в том, что в СССР впервые широко использованы глубокие результаты качественной теории для решения вопросов физики и механики.

В предыдущем параграфе мы подробно рассмотрели один из важных вопросов качественной теории — вопрос о характере расположения

интегральных кривых в окрестности особой точки. Остановимся теперь на некоторых других основных вопросах качественной теории.

Устойчивость. В примерах, рассмотренных в начале главы, вопрос об устойчивости или неустойчивости равновесия системы решается просто, без исследований дифференциальных уравнений, на основании физических соображений. Так, в примере 3 очевидно, что если маятник, находящийся в состоянии равновесия OA, переведен при помощи какой-либо внешней силы в некоторое близкое положение OA', т. е. мало изменены начальные условия, то при дальнейшем движении маятник не может далеко отклониться от положения равновесия, и это отклонение будет тем меньше, чем меньше было первоначальное отклонение OA', т. е. в этом случае положение равновесия будет устойчивым.

В других более сложных случаях вопрос об устойчивости состояния равновесия решается гораздо сложнее, и притом только при помощи исследования соответствующих дифференциальных уравнений. С вопросом об устойчивости равновесия тесно связан вопрос об устойчивости движения. Основоположные результаты в этой области принадлежат А. М. Ляпунову.

Пусть некоторый физический процесс описывается системой уравнений

(57)

Мы будем для простоты рассматривать только систему двух дифференциальных уравнений, хотя наши дальнейшие выводы остаются справедливыми и для систем с большим числом уравнений. Каждое частное решение системы (57), которое составляется из двух функций x(t) и y(t), мы будем иногда в этом параграфе, следуя А. М. Ляпунову, называть движением. Будем предполагать, что f1(x, у, t) и f2(x, у, t) имеют непрерывные частные производные. Доказано, что в этом случае решение системы дифференциальных уравнений (57) определяется однозначно, если в какой-нибудь момент времени t = t0 задать значения функций x(t0) = x0 и y(t0) = y0.

Будем обозначать через x(t, x0, y0), y(t, x0, y0) решение системы уравнений (57), удовлетворяющее начальным условиям х = x0 и у = y0 при t = t0.

Решение x(t, x0, y0), y(t,x0, y0) называется устойчивым по Ляпунову, если для всех t>t0 функции x(t, x0, y0), y(t, x0, y0) изменятся как угодно мало, если достаточно мало изменить начальные значения x0 и y0.

Более точно: для решения, устойчивого по Ляпунову, разности

(58)

можно сделать меньше любого заранее заданного числа ε для всех моментов времени t > t0, если только числа δ1 и δ2 взять любыми, но достаточно малыми по абсолютной величине.

Всякое движение, не являющееся устойчивым по Ляпунову, называется неустойчивым.

Исследуемое движение x(t, x0, y0), y(t, x0, y0) Ляпунов называет невозмущенным, а движение x(t, x0+δ1, y0 + δ2), y(t, x0+δ1, y0 + δ2) с близкими начальными условиями называет возмущенным движением. Таким образом, устойчивость по Ляпунову невозмущенного движения означает, что при всех t > t0 возмущенное движение должно мало отличаться от невозмущенного.

Устойчивость равновесия есть частный случай устойчивости движения, соответствующий тому случаю, когда невозмущенное движение

x(t, x0, y0) ≡ 0 и y(t, x0, y0) ≡ 0.

Обратно: вопрос об устойчивости какого-либо движения x = φ1(t) и y = φ2(t) системы (57) можно свести к вопросу об устойчивости равновесия для некоторой системы дифференциальных уравнений. Для этого вместо прежних неизвестных функций x(t) и y(t) в системе (57) введем новые неизвестные функции

(59)

В преобразованной таким образом системе (57) движению x = φ1(t) и y=φ2(t) будет соответствовать движение ξ ≡ 0 и η ≡ 0, т. е. состояние равновесия. В дальнейшем мы всегда будем предполагать, что преобразование (59) уже совершено, и будем рассматривать устойчивость по Ляпунову только решения х = 0 и у = 0.

Условие устойчивости по Ляпунову означает теперь, что на плоскостu (x, у) траектория возмущенного движения не выходит ни при каком t>t0 из квадрата со сторонами 2ε, параллельными координатным осям, и с центром в точке x = 0, у = 0, если δ1 и δ2 достаточно малы.

Нас будут интересовать те случаи, когда мы, не умея интегрировать систему (57), можем тем не менее делать заключения об устойчивости или неустойчивости невозмущенного движения. Весьма важные для практики вопросы об устойчивости движения снаряда, самолета, важные для небесной механики вопросы устойчивости орбит, по которым движутся планеты и другие небесные тела, сводятся к такого рода исследованиям.

Предположим, что функции f1 (х, у, t) и f2 (х, y, t) можно представить в виде

(60)

где aij — постоянные, а R1 (х, у, t) и R2(x, у, t) — такие функции от x, y, и t, что

(61)

где M — некоторая положительная постоянная.

Если в системе (57), пользуясь представлением (60), отбросить R1(x, y, t) и R2(x, y, t), то получится система дифференциальных уравнений с постоянными коэффициентами

(62)

которая называется системой первого приближения для нелинейной системы (57).

До А. М. Ляпунова при исследовании вопроса об устойчивости в основном ограничивались изучением устойчивости в первом приближении, т. е. изучением устойчивости для системы (62), считая полученный результат разрешающим вопрос об устойчивости и для основной нелинейной системы (57). А. М. Ляпунов первый показал, что в общем случае такое заключение не верно. С другой стороны, он дал ряд весьма широких условий, при выполнении которых вопрос об устойчивости для нелинейных систем до конца решается по первому приближению. Одним из таких условий является следующее. Если действительные части всех корней λ уравнения

отрицательны и для функций R1 (х, у, t) и R2 (х, у, t) выполнены условия (61), то решение x(t)0, y(t) ≡ 0 устойчиво по Ляпунову. Если действительная часть хотя бы одного корня λ положительна, то при выполнении условия (61) решение x(t) ≡ 0, y(t) ≡ 0 будет неустойчивым. А, М. Ляпунов дал также ряд других достаточных условий устойчивости и неустойчивости движения1. Работы А. М. Ляпунова с большим успехом продолжали советские математики.

Если правые части уравнений (57) не зависят от t, то, разделив первое уравнение системы (57) на второе, получим

(63)

Для этого уравнения начало координат будет особой точкой. В случае устойчивого равновесия в этой точке может быть фокус, узел или центр, но не может быть седла.

1 А. М. Ляпунов. Общая задача об устойчивости движения.

Таким образом, по характеру особой точки можно судить об устойчивости или неустойчивости состояния равновесия.

Поведение интегральных кривых в целом. Иногда бывает важно построить схему поведения интегральных линий во всей области задания системы дифференциальных уравнений «в целом», не заботясь при этом о сохранении масштаба. Будем рассматривать пространство, в котором эта система определит поле направлений, как фазовое пространство для некоторого физического процесса. Тогда построение схемы интегральных кривых соответствующей системы дифференциальных уравнений даст нам представление о характере всех процессов (движений), которые могут происходить в этой системе. На рис. 10—13 мы строили подобные схемы для поведения интегральных линий в окрестности изолированной особой точки.

Одной из самых фундаментальных задач теории дифференциальных уравнений является задача найти по возможности более простой способ построения схемы поведения семейства интегральных линий заданной системы дифференциальных уравнений во всей области ее определения— изучение поведения интегральных кривых этой системы дифференциальных уравнений «в целом». Эта задача почти совсем не изучена для пространства, число измерений которого больше двух. Она еще очень далека от своего разрешения и для одного уравнения вида

(64)

даже в том случае, когда M(х, у) и N (х, у) являются многочленами.

В дальнейшем мы будем предполагать, что функции M (х, у) и N (х, у) имеют непрерывные частные производные 1-го порядка.

Если все точки односвязной области G, где задана правая часть дифференциального уравнения (64), обыкновенные, то семейство интегральных линий можно схематически изобразить семейством отрезков параллельных прямых, так как в этом случае через каждую точку области G проходит одна интегральная линия и никакие две интегральные линии не пересекаются. Для уравнения же (64) более общего вида, которое может иметь особые точки, структура интегральных линий может быть гораздо сложнее. Случай, когда уравнение (64) имеет бесконечное множество особых точек (т. е. таких точек, где числитель и знаменатель одновременно обращаются в 0), по крайней мере, когда М(х, у) и N (х, у) — многочлены, можно считать исключительным. Поэтому мы ограничимся рассмотрением только тех случаев, когда уравнение (64) имеет конечное число изолированных особых точек. Поведение интегральных линий около каждой из этих особых точек весьма существенно для составления схемы поведения всех интегральных линий этого уравнения.

Очень характерными для схемы поведения всех интегральных линий уравнения (64) являются также так называемые предельные циклы.

Рассмотрим уравнение

(65)

где ρ и φ — полярные координаты на плоскостu (x, у).

Совокупность всех интегральных линий уравнения (65) дается формулой

(66)

где С — произвольная постоянная, различная для различных интегральных линий. Чтобы о было неотрицательным, надо, чтобы φ принимало значение не больше, чем — ln | С | , если С < 0. Семейство интегральных линий будет состоять:

1) из окружности ρ = 1 (С =0);

2) из спиралей, выходящих из начала координат, которые изнутри приближаются к этой окружности при φ→—∞ (С<0);

3) из спиралей, которые приближаются извне к окружности ρ = 1, когда φ → —∞ (С > 0) (рис. 14).

Окружность р = 1 называется предельным циклом для уравнения (65). Вообще замкнутая интегральная линия l называется предельным циклом, если ее можно заключить в такое кольцо все точки которого — обыкновенные для уравнения (64) и которое целиком заполнено незамкнутыми интегральными линиями.

Из уравнения (65) видно, что все точки окружности являются для него обыкновенными. Значит, малый кусок предельного цикла ничем не отличается от куска всякой другой интегральной линии.

Каждой замкнутой интегральной линии на фазовой плоскостu (x, у) отвечает периодическое решение [x(t), y(t)] системы

(67)

описывающей закон изменения некоторой физической системы. Те интегральные линии на фазовой плоскости, которые при t →+ ∞ приближаются к предельному циклу, отвечают движениям, приближающимся при t→+∞ к периодическим.

Пусть для любой достаточно близкой к предельному циклу I точки x0, y0), взятой в качестве начальной точки при t = t0 для решения

Рис. 14.

системы (67), соответствующая интегральная линия, описываемая точкой (x(t), y(t)), при t→+∞ приближается к предельному циклу l на плоскости (x, у). (Это значит, что описываемые движения приближаются к периодическим). В этом случае соответствующий предельный цикл называется устойчивым. Колебания, которым отвечают такие предельные циклы, соответствуют в физике автоколебаниям. В некоторых автоколебательных системах может существовать несколько стационарных колебательных процессов с различными амплитудами. Тот или другой из них устанавливается в зависимости от начальных условий. На фазовой плоскости таким автоколебательным системам соответствует несколько предельных циклов, если процессы, происходящие в этих системах, описываются уравнениями вида (67).

Задача хотя бы приближенного нахождения предельных циклов заданного дифференциального уравнения до сих пор не имеет удовлетворительного решения. Наиболее распространенным методом для решения этой задачи является предложенный Пуанкаре метод построения «циклов без прикосновения». Он основан на следующей теореме. Допустим, что на плоскостu (x, у) удалось найти такие две замкнутые линии L1 и L2 (цикла), которые обладают следующими свойствами:

1) Линия L2 вложена в область, ограниченную L1.

2) В кольце Ω, заключенном между L1 и L2, нет ни одной особой точки уравнения (64).

3) L1 и L2 всюду имеют касательные, причем направления этих касательных нигде не совпадают с направлением поля направлений для заданного уравнения (64).

4) Для всех точек L1 и L2 косинус угла между внутренней нормалью к границе области Ω и вектором с компонентами [N (х, у), М(х, у)] имеет один и тот же знак.

Тогда между L1 и L2 имеется по крайней мере один предельный цикл уравнения (64).

Пуанкаре называет линии L1 и L2 циклами без прикосновения.

Доказательство этой теоремы основано на следующем, довольно очевидном, факте. Допустим, что при возрастании t (или при убывании t) все интегральные линии

x = x(t), y = y(t)

уравнения (64) (или, что все равно, уравнений (67), где t — параметр), пересекающие L1 или L2, входят в кольцо Ω между L1 и L2. Тогда они обязательно должны навиваться на какую-то замкнутую линию l, лежащую между L1 и L2, так как никакая из интегральных линий, попавших в это кольцо, не может выйти из него и в кольце нет особых точек.

Само разыскание циклов без прикосновения представляет довольно сложную задачу. Никаких общих методов для этого не известно. Для

отдельных частных примеров удается найти циклы без прикосновения и тем доказать существование предельных циклов.

В радиотехнике имеет большое значение разыскание предельных циклов (автоколебательных процессов) для уравнения (16) лампового генератора. Для уравнения типа (16) около 20 лет тому назад Н. М. Крылов и Н. Н. Боголюбов предложили метод приближенного вычисления предельного цикла, который имеется у этого уравнения. Примерно в то же время советские физики Л. И. Мандельштам, Н. Д. Папалекси и А. А. Андронов доказали возможность применения для этой цели так называемого метода малого параметра, которым прежде хотя и пользовались на практике, но строгого обоснования законности применения этого метода не было. Для анализа уравнений автоколебательных систем А. А. Андронов впервые стал систематически применять методы, развитые прежде в теории дифференциальных уравнений А. М. Ляпуновым и А. Пуанкаре. Таким образом, он получил целый ряд важных результатов.

Как уже было сказано, в физике играют важную роль «грубые» системы (см. § 3). А. А. Андронов вместе с Л. С. Понтрягиным составил каталог кусков, из которых может состоять вся картина поведения интегральных линий на плоскостu (x, у) для грубого дифференциального уравнения вида (64). Давно было известно, например, что центр около особой точки легко разрушается при малых изменениях уравнений (64). Поэтому в состав картины поведения интегральных линий уравнений (64) не может входить центр, т. е. семейство замкнутых интегральных линий, окружающих особую точку, если уравнение грубое.

Вопрос о поведении интегральных кривых в целом остается еще далеким от своего окончательного решения. Заметим, что аналогичный, вероятно, более простой вопрос о том, какой вид на плоскости могут иметь действительные алгебраические кривые, т. е. кривые, определенные уравнением

Р(х, у) = 0,

где Р (х, у) — многочлен n-й степени, также далек от своего полного решения. Полностью известно, какой вид могут иметь эти кривые только при n < 6.

Решения системы (64) определяют движения на плоскости. Если мы каждой точке x0, y0 на плоскости поставим в соответствие точку [x(t, x0, y0), y(t, x0, y0)], где x(t, x0, y0), y(t, x0, y0) — решение системы (64) с начальными условиями х = x0 и у = y0 при t = t0, то получим преобразование точек плоскости, зависящее от параметра t. Аналогичные преобразования, зависящие от параметра, и движения, которые они порождают, можно рассматривать на сфере, торе и других многообразиях. Свойства этих движений изучаются в теории динамических систем. В окрестности каждой точки эти движения также будут являться решениями некоторой системы дифференциальных уравнений. В последние десятилетия теория динамических систем получила широ-

кое развитие в работах советских математиков В. В. Степанова, А. Я. Хинчина, Н. Н. Боголюбова, Н. М. Крылова, А. А. Маркова, В. В. Немыцкого и других, а также в работах Г. Биркгофа и других зарубежных ученых.

В настоящей главе мы дали краткий очерк современного состояния теории обыкновенных дифференциальных уравнений и постарались описать задачи, которые в этой теории рассматриваются. Наше изложение ни в какой мере не может претендовать на полноту. Мы были вынуждены отказаться от рассмотрения многих отделов теории уравнений, которые посвящены или изучению более специальных проблем, или требуют наличия более широких математических знаний, чем те, которые мы предполагали имеющимися у читателя книги. Например, мы совсем не затрагивали обширного и важного отдела, в котором рассматриваются вопросы теории дифференциальных уравнений с комплексным аргументом. Мы не имели возможности остановиться на так называемых краевых задачах, в частности на теории собственных функций, имеющей большое значение в приложениях.

Весьма мало внимания мы могли уделить методам приближенного численного и аналитического решения дифференциальных уравнений и т. д. Для ознакомления со всеми такими вопросами мы вынуждены рекомендовать читателю обратиться к специальным книгам.

ЛИТЕРАТУРА

Университетские учебники

Петровский И. Г. Лекции по теории обыкновенных дифференциальных уравнений. Изд. 4-е, Гостехиздат, 1952.

Степанов В. В. Курс дифференциальных уравнений. Изд. 6-е, Гостехиздат, 1953.

Эльсгольц Л. Э. Обыкновенные дифференциальные уравнения. Гостехиздат, 1954.

Книга содержит основные сведения по теории дифференциальных уравнений, а также изложение приближенных методов интегрирования дифференциальных уравнений. Предназначена для инженеров и студентов втузов.

Монографии

Андронов А. А. и Хайкин С. Э. Теория колебаний, ч. 1, ОНТИ, 1937.

В книге рассматриваются дифференциальные уравнения, к которым приводят вопросы теории колебаний. При исследовании этих задач применяются методы качественной теории дифференциальных уравнений.

Немыцкий В. В. и Степанов В. В. Качественная теория дифференциальных уравнений. Гостехиздат, 1947.

В книге излагаются основы этой теории. Рассчитана на студентов университетов и научных работников.

Глава VI

УРАВНЕНИЯ В ЧАСТНЫХ ПРОИЗВОДНЫХ

§ 1. ВВЕДЕНИЕ

Изучая какие-либо явления природы, исследователь встречается с уравнениями в частных производных не менее часто, чем с обыкновенными дифференциальными уравнениями. Как правило, это бывает в тех случаях, когда явление описывается функциями многих переменных. Из изучения природы возник тот класс уравнений в частных производных, который можно считать наиболее изученным в настоящее время и который, пожалуй, является и наиболее важным в системе человеческого знания, а именно уравнения математической физики.

Рассмотрим прежде всего колебания какой-либо среды. При таких колебаниях каждая точка этой среды, занимающая в равновесии положение x, y, z, будет в момент времени t смещена на вектор u (х, y, z, t), зависящий от начального положения точки х, у, z и времени t. В этом случае интересующее нас явление будет описываться векторным полем. Нетрудно, однако, видеть, что знание этого векторного поля — поля смещений точек среды — еще недостаточно для полного описания колебаний. Необходимо еще знать, например, плотность в каждой точке среды р (х, у, z, t), температуру Т (х, у, z, t) в каждой точке, а также внутренние напряжения, т. е. те силы, которые действуют на произвольно выделенный объем тела со стороны всей остальной части.

Физические явления, физические процессы, происходящие в пространстве и во времени, всегда заключаются в изменении каких-либо физических величин, относящихся к точкам некоторой области пространства, с течением времени. Как мы видели в главе II (том 1), величины эти могут быть описаны при помощи функций четырех независимых переменных x, y, z, t, где x, y, z — координаты какой-либо точки пространства, a t — время.

Физические величины, как мы знаем, могут быть различной природы. Одни из них полностью характеризуются своим численным значением, как температура, плотность и т. п., — эти величины называются скалярными. Другие имеют направление, — это векторные величины: скорость, ускорение, напряженность электрического поля и т. д. Векторную величину можно выразить не только длиной вектора и его направлением,

но также с помощью «составляющих» этого вектора, разложив его на сумму трех взаимно перпендикулярных векторов, например параллельных координатным осям.

В математической физике скалярная величина или скалярное поле представляется в виде одной функции от четырех независимых переменных, а векторная величина, определенная во всем пространстве, или, как говорят, векторное поле, описывается тремя функциями от этих переменных. Записывать такую величину можно либо в виде

u(х, у, z, t),

где жирный шрифт обозначает, что u — вектор, либо в виде трех функций

ux(х, у, z, t), uy(х, у, z, t), uz(x, у, z, t),

где ux, uy, uz обозначают проекции вектора на координатные оси.

Помимо векторных и скалярных величин, в физике встречаются еще более сложные образования, как, например, напряженное состояние тела в данной точке. Такие величины называются тензорными и при выбранном раз навсегда направлении координатных осей могут быть характеризованы каждая при помощи нескольких функций от тех же четырех независимых переменных.

Таким образом, описание всевозможных физических явлений совершается обычно при помощи нескольких функций многих переменных. Конечно, такое описание ни в какой мере не может претендовать на абсолютную точность.

Описывая, например, плотность среды при помощи одной функции четырех независимых переменных, мы отвлекаемся от того, что на самом деле никакой плотности «в данной точке» не существует. Тела, исследуемые нами, имеют молекулярную структуру, причем молекулы не плотно прилегают одна к другой, а находятся на конечном расстоянии друг от друга. Расстояния между молекулами обычно значительно больше, чем размеры самих молекул. Поэтому та плотность, о которой мы говорим, представляет собою отношение массы вещества, содержащегося в некотором малом, хотя и не чрезмерно малом, объеме к этому объему. Плотность в точке мы несколько условно мыслим себе как предел таких отношений при уменьшении объема. Еще большее отвлечение и идеализацию представляет собою понятие о температуре среды. Теплота тела обусловлена беспорядочным движением молекул этого тела. Энергия молекул различна, но если рассматривать объем, содержащий большое количество молекул, то средняя энергия их беспорядочного движения и будет определять ту характеристику, которую мы называем температурой.

Подобно этому, когда мы говорим о давлении газа или жидкости на стенку сосуда, мы не должны себе представлять давление так, как будто частица жидкости или газа действительно давит на стенки сосуда.

На самом деле эти частицы при своем беспорядочном движении ударяются о стенку сосуда и отталкиваются от нее. То, что мы описываем как давление на стенку, есть на самом деле величина, складывающаяся из очень большого числа импульсов, получаемых некоторым участком стенки, малым с нашей точки зрения и очень большим по сравнению с расстояниями между молекулами жидкости или газа. Можно было бы привести не один десяток примеров подобного рода. Большинство изучаемых в физике величин имеют точно такой же характер. Математическая физика рассматривает идеализированные величины, отвлекаясь от ряда конкретных свойств этих величин и рассматривая лишь средние значения этих величин.

Такая идеализация может показаться грубой, но, как мы увидим дальше, она приносит огромную пользу, позволяя хорошо разобраться в ряде сложных явлений, выделить из них существенную сторону и отбросить то, что является второстепенным с интересующей нас точки зрения. Предметом математической физики является изучение тех связей, которые существуют между такими идеализированными явлениями, описываемыми при помощи нескольких функций многих независимых переменных.

§ 2. ПРОСТЕЙШИЕ УРАВНЕНИЯ МАТЕМАТИЧЕСКОЙ ФИЗИКИ

Элементарные связи и отношения между физическими величинами выражаются законами механики и физики. Эти связи весьма многообразны, и из них вытекает еще более многообразное число связей, более сложных, являющихся их математическими следствиями. Законы механики и физики на математическом языке могут быть записаны в виде уравнений в частных производных, а иногда интегральных уравнений, связывающих между собою неизвестные функции. Чтобы понять суть дела, разберем несколько примеров уравнений математической физики.

Запишем в математической форме основные физические законы, управляющие движением точек среды.

Уравнения сохранения массы и тепловой энергии. 1. Выразим прежде всего закон сохранения вещества в каждом мысленно выделенном и жестко закрепленном объеме Ω нашего пространства. Для этого нужно подсчитать массу вещества, находящуюся в этом объеме. Масса МΩ(t) выразится интегралом

Эта масса не будет, разумеется, постоянной: в процессе колебаний плотность в каждой точке будет изменяться за счет того, что частицы вещества будут при своих колебаниях то входить в этот объем, то выхо-

дить из него. Скорость изменения массы мы получим, дифференцируя по времени написанный интеграл

Эту же скорость изменения массы, заключенной в мысленно выделенном нами объеме 12, можно подсчитать и другим способом. Можно выразить то количество вещества, которое проходит в каждую секунду через поверхность S, ограничивающую наш объем 12, причем количество вещества, выходящего из 12, нужно взять со знаком минус. Для этого рассмотрим небольшой участок ds поверхности S, столь малый, что его можно считать плоским и смещения точек на нем одинаковыми. Будем в течение промежутка времени от t до t + dt следить за материальными точками, находящимися на этом участке. Вычислим прежде всего вектор

представляющий собою скорость каждой частицы. За время dt частицы из ds переместятся на вектор v dt и займут положение ds1, а на место ds станут частицы, находившиеся ранее в положении ds2 (рис. 1). Таким образом, за это время из объема Ω выйдет целиком столбик вещества ds2 ds, находившийся ранее внутри Ω и к концу этого промежутка занявший положение ds ds1. Высота этого столбика равна v dt ⋅ cos (n, v), где n обозначает внешнюю нормаль к поверхности; объем столбика будет равен

а масса равна

Складывая все такие столбики, мы получим для количества вещества, вытекшего из объема Ω за время dt, выражение

При этом в тех местах, где скорость направлена внутрь Ω, знак косинуса будет отрицательным, и, значит, втекающее вещество в этом интеграле учитывается со знаком минус. Произведение скорости движения среды на ее плотность называется потоком. Вектор потока массы q = ρv.

Рис. 1.

Для того чтобы получить скорость вытекания, достаточно разделить полученное выражение на dt, и мы будем иметь для скорости вытекания

Нормальную составляющую от вектора v можно заменить выражением ее через составляющие векторов v и n вдоль координатных осей. Из аналитической геометрии известно, что

откуда мы можем переписать выражение для скорости вытекания в виде

В силу закона сохранения вещества оба наши способа подсчета изменения количества вещества должны дать один и тот же результат, ибо всё изменение массы, заключенной в Ω, может произойти лишь за счет втекания или вытекания через поверхность S.

Отсюда, приравнивая скорость изменения количества вещества, заключенного в объеме, к скорости его втекания, получим

Это интегральное соотношение, как мы уже говорили, верно для любого объема Ω. Оно носит название уравнения неразрывности.

Интеграл, стоящий в правой части последнего равенства, можно превратить в объемный с помощью формулы Остроградского. Эта формула, приводившаяся в главе II (том 1), дает

Отсюда следует

Мы получили следующий результат: интеграл от функции

по любому объему Ω равен нулю. Последнее возможно лишь в том случае, если эта функция — тождественный нуль. Мы получаем таким путем другую, дифференциальную, форму уравнения неразрывности

(1)

Уравнение (1) представляет собою типичный пример формулировки физического закона на языке дифференциальных уравнений в частных производных.

2. Остановимся еще на одной такой задаче, а именно на задаче о передаче тепла.

Во всякой среде, частицы которой совершают тепловые движения, происходит передача тепла от одних точек к другим. Эта передача тепла происходит через каждый мысленно выделенный участок какой-либо поверхности ds, лежащей внутри данной среды. Можно доказать, что рассматриваемое явление численно может быть описано при помощи особой векторной величины — «вектора потока тепла», который мы обозначим через m. При этом количество тепла, протекающего за каждую секунду через некоторую элементарную площадку ds, будет иметь выражение τnds, подобно тому, как при выводе уравнения неразрывности мы имели выражение для количества жидкости, протекающей через площадку ds каждую секунду, в виде qnds. Вместо потока жидкости q = ρv мы будем иметь здесь вектор потока тепла m.

Таким же способом, как мы получили уравнение неразрывности при движении жидкости, выражавшее закон сохранения вещества, мы можем получить новое уравнение в частных производных, выражающее закон сохранения энергии.

Объемную плотность Q тепловой энергии в данной точке можно выразить формулой

Q = CT,

где С — объемная теплоемкость, а Т — температура. При этом легко получить уравнение

(2)

Вывод этого уравнения дословно совпадает с выводом уравнения неразрывности, если в нем «плотность» заменить на «плотность энергии», а поток массы заменить на поток тепла. При этом мы считаем, что в среде, где рассматривается явление распространения тепла, тепловая энергия нигде не возникает. Когда же в среде имеется налицо тепло-

выделение, уравнение (2) баланса тепловой энергии должно быть изменено. Если q — «плотность тепловыделения», т. е. количество тепловой энергии, выделяемое за единицу времени в единице объема среды, то уравнение сохранения тепловой энергии примет следующую, более сложную, форму:

(3)

3. Еще одно уравнение типа уравнения неразрывности можно получить, дифференцируя уравнение (1) по времени. Мы сделаем это для уравнения малых колебаний газа около положения равновесия. Будем считать, что при таких колебаниях плотность меняется мало и величины — , — и — — малые величины, произведениями которых на vx, vy, vz можно пренебречь. Тогда

Дифференцируя это уравнение по времени и пренебрегая произведениями

получим

(4)

Уравнения движения. 1. Важный пример выражения физического закона дифференциальным уравнением доставляют уравнения равновесия или уравнения движения среды. Пусть среда состоит из материальных частиц, движущихся со своими скоростями. Выделим, как и в первом примере, мысленно в нашей среде некоторый объем Ω, ограниченный поверхностью S и заполненный частицами вещества среды, и напишем третий закон Ньютона для частиц, находящихся в этом объеме. Третий закон Ньютона гласит, что при всяком движении среды скорость изменения суммарного количества движения всех точек некоторой системы равно сумме импульсов всех сил, приложенных к этому объему. Количество движения, как известно из механики, представляет собою векторную величину

Частицы, заполнявшие с плотностью р малый объем dΩ, через время Δt будут заполнять с некоторой новой плотностью ρ' новый объем dΩ', но их общая масса будет прежней

Произошедшее за то же время изменение скорости v до некоторого значения v', т. е. на величину Δv = v' — v, влечет изменение количества движения на величину

или в единицу времени:

Суммируя по всем частицам, находившимся в объеме il, получим, что скорость изменения их количества движения равна

(Здесь производные -j-, обозначают скорость изменения той или иной составляющей v не в данной точке пространства, а для данной движущейся частицы. Это подчеркивается обозначением j- вместо — . Как известно,)

Силы, приложенные к объему, могут быть двух родов: силы объемные, действующие на каждую частицу, лежащую внутри объема, и силы поверхностные или напряжения, приложенные к поверхности S, ограничивающей этот объем. Первые силы суть силы дальнодействия, а вторые — силы близкодействия.

Для того чтобы пояснить сказанное, допустим, что рассматриваемая среда представляет собой жидкость. Поверхностные силы, действующие на элемент поверхности ds, будут в этом случае иметь величину pds, где р — давление жидкости, и будут направлены в сторону, обратную внешней нормали.

Если обозначить единичный вектор, направленный по нормали к поверхности S, через n, то силы, приложенные к участку ds, будут равны

Пусть, кроме того, F обозначает вектор внешних сил, приложенных к единице объема. Тогда наше уравнение запишется в виде

Это уравнение представляет собою уравнение движения в интегральной форме. Оно может быть преобразовано в уравнение в дифференциальной форме так же, как уравнение неразрывности было преобразовано в дифференциальное уравнение (1). В результате мы придем к системе:

(5)

Эта система и выражает в дифференциальной форме третий закон Ньютона.

2. Другим характерным примером применения законов механики в дифференциальной форме является уравнение колебаний струны. Струной называют очень тонкое длинное тело из упругого вещества, которое приобретает гибкость благодаря своей малой толщине. Струна обычно бывает сильно натянута. Если мы мысленно проведем в нашей струне сечение, разделив ее в какой-либо точке х на две части, то со стороны каждого из отрезков струны на другой будет действовать сила, равная натяжению и направленная по касательной к линии струны.

Представим себе некоторый участок струны. Будем обозначать отклонение точки струны от положения равновесия через u (x, t). Предполагается, что колебание струны происходит в одной плоскости и состоит в смещениях, перпендикулярных к оси Ох. Представим отклонение u (х, t) графически в некоторый момент времени (рис. 2). Выделим на чертеже участок струны между точками x1 и x2. В этих точках будут действовать две силы, равные натяжению Т и направленные каждая соответственно по касательной к u (х, t).

Если участок струны имеет некоторую кривизну, то равнодействующая этих двух сил не будет равна нулю. Эта равнодействующая на основании законов механики должна равняться скорости изменения количества движения нашего участка.

Пусть масса, приходящаяся на каждый сантиметр длины струны, равна р. Тогда скорость изменения количества движения будет

Если угол, составленный касательной к струне с осью Ох, обозначить через φ, то мы будем иметь

Это и есть основное уравнение, выражающее третий закон механики в интегральной форме. Легко выразить его в дифференциальной форме. Мы имеем очевидно

Рис. 2.

На основании известных теорем дифференциального исчисления легко связать Tsinφ с неизвестной функцией и. Мы получим

и, приближенно считая, что ( —) мало, имеем

Тогда

(6)

Последнее уравнение и представляет собою уравнение колебаний струны в дифференциальной форме.

Основные виды уравнений математической физики. Как мы уже говорили выше, различные уравнения в частных производных, описывающие физические явления, представляют собою обычно системы уравнений с несколькими неизвестными функциями. Однако в большом числе случаев удается заменить эту систему одним уравнением. Легко показать это на примере простейших задач.

Обратимся к уравнениям движения, рассмотренным в предыдущем пункте. Решать эти уравнения нужно совместно с уравнением неразрывности. О том, как это можно сделать, мы расскажем несколько позднее.

1. Начнем с уравнения для стационарного течения идеальной жидкости.

Всевозможные движения жидкости делят на движения вихревые и движения безвихревые или так называемые потенциальные. Хотя безвихревые движения представляют собою лишь частный случай движения, а вообще говоря, движение жидкости или газа всегда бывает в какой-то мере завихренным, тем не менее опыт показывает, что эти безвихревые движения во многих случаях осуществляются с большой точностью. Кроме того, из теоретических соображений можно показать, что в жидкости с вязкостью, равной нулю, при отсутствии вихря в начальный момент он не будет возникать и позднее.

Для потенциального движения жидкости существует такая скалярная функция U (х, у, z, t), называемая потенциалом скоростей, что вектор скорости v выражается через нее по формулам

Во всех случаях, изученных нами до сих пор, мы имели дело с системами четырех уравнений с четырьмя неизвестными функциями или

говоря иначе, с одним скалярным и одним векторным уравнениями, содержащими одну скалярную неизвестную функцую и одно неизвестное векторное поле. Обычно эти уравнения можно привести к одному уравнению с одной неизвестной функцией, но 2-го порядка. К этому мы сейчас и перейдем, начав с простейшего случая.

Для потенциального движения несжимаемой жидкости, в которой dρ/dt = 0, мы имеем две системы уравнений: уравнение неразрывности

и уравнения потенциального движения

Подставляя в первое уравнение значения скоростей, вычисленные из второго, будем иметь

(7)

2. Векторное поле «потока тепла» также может быть связано с одной скалярной величиной — температурой — при помощи дифференциальных соотношений. Известно, что тепло «течет» в направлении от нагретых частей тела к холодным. Поэтому вектор потока тепла следует считать направленным обратно вектору градиента температуры. Естественно также предположить, что величина этого вектора в первом приближении прямо пропорциональна так называемому градиенту температуры. Это предположение хорошо оправдывается на опыте.

Вектор градиента температуры имеет составляющие

Принимая коэффициент пропорциональности равным k, получим три уравнения

Их следует решать совместно с уравнением баланса тепловой энергии (3)

Подставляя вместо τx, τy, τz, их значения, получим

(8)

3. Наконец, для малых колебаний газовой среды, например звуковых колебаний, из уравнения

и уравнений динамики (5)

в предположении отсутствия внешних сил (Fx = F, = Fz = 0) получим уравнение

(9)

(для этого достаточно подставить выражение для ускорений в уравнение неразрывности и исключить из него плотность р при помощи закона Бойля—Мариотта: p = a2ρ).

Уравнения (7), (8) и (9) типичны для многих задач математической физики, а не только для рассмотренных выше. Их подробное изучение дает возможность разобраться в большом числе физических явлений.

§ 3. НАЧАЛЬНЫЕ И КРАЕВЫЕ УСЛОВИЯ. ЕДИНСТВЕННОСТЬ РЕШЕНИЯ

В уравнениях с частными производными так же, как это было в обыкновенных уравнениях, каждое уравнение, за редким исключением, имеет бесчисленное множество частных решений. Поэтому каждый раз для того, чтобы решить конкретную физическую задачу, т. е. найти неизвестную функцию, удовлетворяющую какому-либо уравнению, необходимо уметь выбирать нужные решения среди бесконечного множества различных решений. Для этого обычно необходимо бывает знать, помимо уравнения, еще некоторое число дополнительных условий. Как мы видели выше, уравнения в частных производных представляют собою выражение элементарных законов механики или физики, относящихся к малым частицам, расположенным внутри среды. Мало, однако, знать только законы механики для того, чтобы суметь предсказать какое-либо явление. Чтобы, например, предсказать движение небесных тел, как это делается в астрономии, считая, разумеется, известными массы этих тел, нужно, помимо общих формулировок законов Ньютона, знать еще начальное состояние изучаемой системы, т. е. расположение тел и их скорости в некоторый начальный момент времени. Подобного типа дополнительные условия возникают всегда и при решении задач математической физики.

Таким образом, задачи математической физики состоят в отыскании решений уравнений в частных производных, удовлетворяющих некоторым дополнительным условиям.

В соответствии с различием между уравнениями, выписанными нами выше — уравнениями (7), (8) и (9) — различаются и те задачи, которые можно ставить и решать для этих уравнений.

Уравнения Лапласа и Пуассона. Гармонические функции и единственность решения для них краевой задачи. Разберем указанные постановки задач несколько подробнее. Начнем с уравнений Лапласа и Пуассона. Уравнением Пуассона называется уравнение1

где р имеет обычно смысл плотности. В частном случае р может обратиться в нуль. При ρ0 мы получаем уравнение Лапласа

Нетрудно видеть, что два частных решения u1 и u2 какого-либо уравнения Пуассона всегда отличаются друг от друга на функцию, удовлетворяющую уравнению Лапласа, или, как иначе говорят, на гармоническую функцию. Все многообразие решений уравнения Пуассона сводится таким образом к многообразию гармонических функций.

Если бы мы сумели каким-либо способом построить хотя бы одно частное решение u0 уравнения Пуассона, то, заменив неизвестную функцию при помощи формулы

мы получили бы для новой неизвестной функции w уравнение Лапласа. Так же точно мы могли бы, сделав соответствующую замену в дополнительных условиях, получить дополнительные условия для новой функции w. Поэтому особую важность представляет исследование задач для уравнения Лапласа,

Как это чаще всего и бывает в математических задачах, правильная постановка вопроса об отыскании решения уравнения математической физики подсказывается непосредственно практикой. Дополнительные условия, возникающие при решении уравнения Лапласа, вытекают из самой физической постановки задачи.

Пусть мы рассматриваем, например, установившееся тепловое состояние в некоторой среде, т. е. распространение тепла в некоторой среде, где источники тепла постоянны и находятся либо вне, либо внутри среды. По прошествии некоторого времени при этих условиях в любой точке среды устанавливается не зависящая от времени темпе-

1 Знаком Δu принято для краткости обозначать выражение

называемое обычно оператором Лапласа функции u.

ратура. Для того чтобы узнать температуру Т в каждой точке, нам нужно найти то решение уравнения

где q — плотность тепловыделения, которое не зависит от t. Мы получим

Как видно, температура в нашей среде удовлетворяет уравнению Пуассона. Если плотность тепловыделения q равна нулю, то уравнение Пуассона переходит в уравнение Лапласа.

Чтобы найти температуру внутри среды, необходимо, как это следует из простых физических соображений, знать еще, что происходит на границе рассматриваемой среды.

Очевидно, все законы физики, рассмотренные нами ранее для внутренних точек тела, получат совсем другую формулировку в точках границы.

В задаче об установившемся тепловом состоянии мы можем задать на границе либо распределение температур, либо величину потока тепла, проходящего через единицу поверхности, либо, наконец, какой-либо закон, связывающий температуру с потоком тепла.

Рассматривая температуру в объеме Ω, ограниченном поверхностью S, мы можем эти условия записать так:

(10)

или

(10')

или, наконец, в более общем случае

(10")

где Q обозначает произвольную точку поверхности S. Условия типа (10) называются краевыми условиями. При отыскании нужного решения уравнения Лапласа или Пуассона краевые условия одного из рассмотренных типов определяют выбор именно того решения, которое нужно, причем определяют его, как правило, однозначно.

Таким образом, для отыскания решения уравнения Лапласа или Пуассона обычно бывает необходимо и достаточно задание одной произвольной функции на границе области1. Остановимся несколько

1 Слова «произвольная функция» здесь и в дальнейшем означают., что никаких специальных условий, помимо тех или иных требований регулярности, на функцию не налагается.

подробнее на уравнении Лапласа. Докажем, что гармоническая функция u, т. е. функция, удовлетворяющая уравнению Лапласа, вполне определяется, если известно, какие значения она принимает на границе этой области.

Прежде всего установим, что гармоническая функция внутри области Ω не может нигде принимать значений больших, чем наибольшее ее значение на границе. Точнее говоря, докажем, что как абсолютный максимум, так и абсолютный минимум любой гармонической функции достигаются на границе области.

Отсюда сразу будет следовать, что если гармоническая функция на границе области Ω принимает постоянное значение, то и внутри она будет равна той же постоянной. Действительно, если максимум и минимум функции — одна и та же постоянная, то функция везде будет равна этой постоянной.

Установим теперь, что абсолютные максимум и минимум гармонической функции не могут находиться внутри области. Прежде всего заметим, что если оператор Лапласа Δu от функции u (x, у, z) во всей области положителен, то эта функция не может иметь максимума внутри области, а если он отрицателен, то она не может иметь минимума внутри области. Действительно, в точке, где функция и достигает максимума, она должна иметь максимум как функция каждого переменного по отдельности при фиксированных значениях остальных переменных. Но отсюда следует, что каждая частная производная 2-го порядка по любой переменной должна быть неположительной. Значит, и сумма их будет неположительной и оператор Лапласа положительным быть не может. Совершенно так же можно доказать, что если у функции есть минимум в некоторой внутренней точке, то ее оператор Лапласа не может быть отрицательным в этой точке. Это значит, что если оператор Лапласа отрицателен везде в области, то в этой области функция минимумов иметь не может.

Если функция гармоническая, то ее можно всегда изменить на сколь угодно малую величину так, чтобы она приобрела положительный или отрицательный оператор Лапласа; для этого достаточно прибавить к ней величину

где η — сколь угодно малая постоянная.

Прибавление достаточно малой величины не может изменить свойства функции иметь абсолютный максимум или минимум внутри области. Если бы гармоническая функция имела максимум внутри области, то, прибавив к ней +ηr2, мы могли бы получить функцию с положительным оператором Лапласа, тоже имеющую максимум внутри, что по доказанному выше невозможно. Значит, гармоническая функция не может достигать абсолютного максимума внутри области.

Так же доказывается, что гармоническая функция не может иметь внутри области и абсолютного минимума.

Из доказанной теоремы вытекает важное следствие. Две гармонические функции, принимающие на границе области одинаковые значения совпадают всюду внутри области. В самом деле, разность этих функций (она снова будет функцией гармонической) обращается в нуль на границе области и, следовательно, везде равна нулю внутри области.

Как мы видим, значения гармонической функции на границе полностью определяют эту функцию. Можно доказать (но мы не имеем возможности останавливаться на этом подробнее), что эти значения могут быть заданы совершенно произвольными и что всегда найдется при этом гармоническая функция, принимающая эти значения.

Несколько более сложно выглядит доказательство того, что распределение установившихся температур в теле полностью определяется, если известен поток тепла через каждый элемент поверхности тела или закон, связывающий поток тепла с температурой. Мы вернемся несколько позднее к этому вопросу, когда будем разбирать методы решения задач математической физики.

Краевая задача для уравнения теплопроводности. Совершенно по-иному ставится задача об отыскании решения уравнения теплопроводности в неустановившемся случае. Физически ясно, что значения только температуры на границе или только потока тепла на границе недостаточно для того, чтобы определить решение задачи. Если, однако, кроме того известно распределение температуры в некоторый начальный момент времени, то задача становится определенной. Таким образом, для разыскания решения уравнения передачи тепла (8) обычно необходимо и достаточно задать одну произвольную функцию Т0 (х, у, z) — начальное распределение температур — и еще одну произвольную функцию на границе области. Это может быть, как и раньше, либо температура на поверхности тела, либо поток тепла через каждый элемент поверхности, либо закон, связывающий поток тепла с температурой.

Таким образом, задача должна ставиться так. Найти решение уравнения (8) при условии

(11)

и одном из трех следующих условии:

(12) (12')

где Q — любая точка поверхности S.

(12")

Условие (11) называется начальным условием, а условия (12) — краевыми или граничными условиями.

Подробно доказывать, что каждая такая задача всегда имеет определенное решение, мы не будем, а остановимся только на первой из этих задач, причем рассмотрим случай, когда внутри среды тепловыделение отсутствует. Мы докажем, что уравнение

при условиях

может допускать лишь одно решение.

Доказательство этого утверждения очень близко напоминает то доказательство, которое мы привели для единственности решения уравнения Лапласа. Покажем прежде всего, что если выражение

то функция T как функция четырех переменных х, у, z и t (0⩽t⩽t0), достигает минимума или на границе области Ω изменения х, у, z, или внутри Ω, но тогда обязательно в начальный момент времени, при t = 0.

В самом деле, в противном случае минимум Т достигался бы в какой-нибудь внутренней точке. В этой точке были бы равны нулю все первые производные, в том числе и — , а если бы этот минимум оказался при t = t0, то ^ была бы неположительной. В той же точке все производные 2-го порядка по переменным х, у, z были бы неотрицательными. Следовательно, — оказалось бы неотрицательным. Итак, в нашей области таких значений встретиться не может.

Точно так же можно установить, что если —, то внутри Ω при 0 < t ⩽ t0 не может существовать максимума функции Т.

Наконец, если — = 0. то внутри Ω при 0 < t ⩽ t0 функция Т не может достигать ни абсолютного максимума, ни абсолютного минимума, так как если бы функция Т имела, например, такой абсолютный минимум, то, добавив к ней слагаемое η (t — t0) и перейдя к рассмотрению функции Т1 = T + η (t — t0), мы при достаточно малом yj не устранили бы наличия абсолютного минимума, но при этом сделали бы — отрицательным, а это невозможно.

Таким же образом доказывается и отсутствие абсолютного максимума у Т в рассматриваемой области.

Итак, как абсолютный максимум, так и абсолютный минимум температуры могут быть достигнуты либо в начальный момент при t = 0, либо на границе S рассматриваемой среды. Если и в начальный момент и на границе Т = 0, то мы будем иметь тождественно Т = 0 везде внутри области при всех t⩽t0. Если для каких-либо двух распределений температуры Т1 и Т2 значения их при t = 0 и на границе совпадают, то разность Т1—Т2 = Т будет удовлетворять уравнению теплопроводности и будет обращаться в нуль при t = 0 и на границе. Значит, Т1 — Т2 будет везде равно нулю, и оба температурных распределения Т1 и Т2 совпадают всюду.

Исследуя позднее методы решения уравнений математической физики, мы убедимся, что значения Т при t = 0 и правые части одного из равенств (12) можно задать совершенно произвольно, т. е. что решение каждой из таких задач существует.

Энергия колебаний и краевая задача для уравнения колебаний. Рассмотрим теперь условия, при которых решается третье из основных уравнений математической физики, написанных нами, а именно уравнение (9).

Для простоты разберем уравнение колебаний струны

которое близко напоминает уравнение (9) и отличается от него лишь числом пространственных переменных. В правой части этого уравнения стоит величина -, выражающая ускорение произвольной точки струны.

Движение любой механической системы, в которой действующие силы, а следовательно, и ускорения выражаются через координаты участвующих в движении тел, вполне определяется, если заданы начальные положения и скорости всех точек системы. Поэтому для уравнения колебаний струны естественно задать в начальный момент положения и скорости всех точек

Кроме того, как мы уже говорили выше, на концах струны перестают действовать те формулы, которые выражали законы механики для внутренних точек. Поэтому на обоих концах нам придется задать дополнительные условия. Если, например, струна неподвижно закреплена в положении равновесия на обоих концах, то мы будем иметь

Эти условия иногда могут быть заменены другими, более общими, но такая замена не является уже принципиальной.

Аналогично этому ставится и задача о разыскании нужных решений уравнения (9). Для того чтобы такое решение стало определенным, обычно задают

(13)

а также одно из «краевых условий»

(14) (14')

(14")

Различие с предыдущим случаем состоит в том, что вместо одного начального условия в уравнении (11) мы будем иметь два условия (13).

Уравнения (14) выражают, очевидно, физические законы для частиц, находящихся на границе рассматриваемого объема.

Доказательство того, что в общем случае условия (13) в сочетании с любым из условий (14) определяют единственное решение задачи, мы проводить не будем. Мы докажем, что такое решение может быть единственным для одного из условий (14).

Пусть нам известно, что некоторая функция u удовлетворяет уравнению

начальным условиям

и граничному условию

(Так же легко можно было бы разобрать случай, когда u|s=0.)

Докажем, что функция и при этих условиях должна быть тождественным нулем.

Для доказательства этого свойства нам уже будет недостаточно соображений, которыми мы пользовались, устанавливая единственность

1 Если правые части в условиях (13) и (14) равны нулю, то такие условия мы будем называть «однородными».

решения двух первых задач. Однако здесь нам может помочь физическая интерпретация.

Привлечем на помощь еще один физический закон — «закон сохранения энергии». Представим себе для простоты опять колеблющуюся струну, смещение точек которой u(х, t) удовлетворяет уравнению

Кинетическая энергия каждой колеблющейся частички струны от х до х+ dx выражается в виде

Кроме кинетической энергии, струна в отклоненном положении обладает еще потенциальной энергией, обусловленной ее растяжением по сравнению с прямолинейным расположением. Подсчитаем эту потенциальную энергию. Представим себе элемент струны между точками х и x+dx. Этот элемент имеет наклонное положение по отношению к оси Ох, в связи с чем его длина равна приближенно а удлинение:

Умножая это удлинение на силу натяжения Т, получаем потенциальную энергию растянутого элемента струны в виде

Полная энергия струны длины l получится, если мы просуммируем кинетическую и потенциальную энергию по всем точкам струны. Мы получим

Если силы, приложенные к концам струны не производят работы, в частности если концы струны закреплены, то полная энергия струны должна оставаться постоянной.

Мы получим таким образом уравнение

Полученное нами выражение закона сохранения энергии есть математическое следствие основных уравнений механики и может быть выведено из них. Поскольку законы движения уже записаны нами

в виде дифференциального уравнения колебаний струны и условий на концах, мы можем и самому закону сохранения энергии дать в этом случае математическое доказательство. Действительно, дифференцируя Е по времени, на основании общих правил будем иметь

Пользуясь волновым уравнением (6) и заменяя приведем к виду

Если

обращаются в нуль и, кроме того,

или

обращаются в нуль, то

что и доказывает постоянство Е.

Для волнового уравнения (9) можно было бы совершенно таким же образом доказать существование закона сохранения энергии. Если р удовлетворяет уравнению (9) и условию

то величина

будет не зависящей от t.

Если в начальный момент времени полная энергия колебаний равна нулю, то она останется всегда равной нулю, а это возможно только в том случае, когда никакого движения не происходит. Если бы задача об интегрировании волнового уравнения с начальными и граничными условиями допускала два решения p1 и p2, то разность их v = p1—р2 была бы решением волнового уравнения, удовлетворяющим условиям с нулевыми правыми частями, т. е. однородным условиям.

Но тогда, составив «энергию» таких колебаний, описываемых функцией мы убедились бы, что эта энергия E(v) равна нулю в началь-

ный момент времени. Значит, она равна нулю всегда и, значит, функция v тождественно равна нулю, и оба решения p1 и p2 совпадают. Таким образом, решение задачи единственно.

Итак, мы убедились, что для всех трех рассмотренных нами уравнений постановки задач выбраны нами правильно.

Попутно мы сумели изучить и некоторые простейшие свойства решений этих уравнений. Решения уравнения Лапласа, рассмотренные нами, оказались обладающими свойством максимума: функции, удовлетворяющие этому уравнению, принимают наибольшее или наименьшее значения на границах области существования.

Функции, описывающие распространение тепла в среде, обладают свойством максимума в несколько другой форме. Всякий максимум или минимум температуры, имеющийся в какой-нибудь точке, рассасывается и уменьшается во времени. Температура в какой-либо точке может подниматься или опускаться лишь в том случае, если в ближайших точках она выше или ниже, чем в рассматриваемой. Тепловая картина сглаживается с течением времени. Все неровности в ней выравниваются за счет перетекания тепла от теплых мест к холодным.

Никакого выравнивания возмущения при распространении колебаний, в отличие от того, что мы имели при распространении тепла, не происходит. Наоборот, имеющиеся колебания сами по себе не прекращаются и не сглаживаются, при этом сумма кинетической и потенциальной энергии колебаний все время остается постоянной.

§ 4. РАСПРОСТРАНЕНИЕ ВОЛН

Особенно ясно можно показать свойства колебаний на простейших примерах. Мы рассмотрим два характерных примера.

Первым примером такого рода является уравнение колебаний струны

(15)

Это уравнение имеет, как можно проверить, два частных решения вида

где φ1 и φ2 — произвольные, дважды дифференцируемые функции.

При помощи непосредственного дифференцирования легко убедиться, что u1 и u2 удовлетворяют уравнению (15). Можно показать, что

представляет собой общее решение этого уравнения.

Картина колебаний, описываемая функциями u1 и u2 представляет значительный интерес. Для того чтобы удобнее всего рассмотреть эту картину, мы проделаем следующий мысленный опыт. Пусть наблюдатель,

изучающий колебания струны, не стоит неподвижно, а движется сам в направлении оси Ох со скоростью а. Для такого наблюдателя положение точки струны будет определяться уже не в неподвижной, а в подвижной координатной системе. Пусть ξ обозначает координату х в такой системе. Точка ξ = 0, очевидно, будет соответствовать в каждый момент времени значению x = at. Отсюда видно, что

Произвольную функцию u (x, t) мы можем представить в виде

Для решения u1 будем иметь

и, следовательно, в этой координатной системе решение u1(х, t) оказалось не зависящим от времени. Таким образом, для наблюдателя, движущегося со скоростью а, струна как бы неподвижно застыла в своем деформированном виде. Для неподвижного же наблюдателя по струне бежит волна со скоростью а в направлении оси Ох.

Совершенно также решение u2(х, t) можно рассматривать как волну, бегущую со скоростью а в обратном направлении.

По неограниченной струне обе волны будут распространяться неограниченно долго. Двигаясь в разные стороны, они могут при своем наложении давать причудливые картины. Иногда смещение от сложения двух волн может увеличиваться, иногда, наоборот, пропадать.

Рис. 3.

Если u1 и u2, пришедшие с разных сторон в некоторую точку, будут иметь одинаковые знаки, то отклонение усилится, если разные, то уменьшится. На рис. 3 изображено несколько последовательных положений струны для двух возмущений частного вида. Вначале волны движутся независимо навстречу друг другу, а затем начинают перекрываться. Во втором случае будет момент полного исчезновения колебаний, за которым волны вновь разойдутся. Все эти волны легко наблюдаются.

Другой пример, который легко поддается качественному исследованию, представляет распространение волн в пространстве. Уравнение

(16)

выведенное нами выше, имеет два частных решения вида

(17)

где через r обозначено расстояние от начала координат до данной точки r2 = x2 + y2 + z2, a φ1 и φ2 — произвольные дважды дифференцируемые функции.

Проверка того, что u1 и u2 есть решения, заняла бы много времени, и мы не будем ее делать.

Картина волн, описываемых этими решениями, в общем та же самая, что и для струны. Если не обращать внимания на множитель 1/r, стоящий в правой части, то первое решение образовало бы волну, бегущую в направлении возрастающих r. Эта волна обладает шаровой симметрией; в точках с одинаковым r процесс протекает совершенно одинаковым образом.

Множитель 1/r приводит к тому, что амплитуда волны убывает обратно пропорционально расстоянию от начала координат. Такое колебание называется расходящейся сферической волной. Хорошее представление о ней могут создать круги, распространяющиеся по поверхности воды, в которую брошен камень, только в последнем случае волны будут круговыми, а не шаровыми.

Второе из решений (17) также имеет большой интерес,—это так называемая сходящаяся волна, бегущая по направлению к началу координат. Ее амплитуда с течением времени возрастает до бесконечности по мере приближения к началу. Как мы видим, такая концентрация возмущения может привести к тому, что малые вначале колебания могут, собравшись в одной точке, дать большой всплеск.

§ 5. МЕТОДЫ ПОСТРОЕНИЯ РЕШЕНИЙ

О возможности разложения любого решения на более простые решения. Решения задач математической физики, сформулированных нами выше, могут быть получены при помощи различных приемов. Методы их решения являются совершенно специфическими. В основе всех этих методов лежит, однако, одна общая идея. Как мы видели, все уравнения математической физики для малых значений неизвестных функций являются линейными относительно функции и ее производных. Линейными будут также и граничные и начальные условия.

Если мы составим разность каких-либо двух решений одного и того же уравнения, то эта разность будет решением такого же уравнения, но со свободным членом, равным нулю. Такое уравнение называют соответствующим однородным уравнением. (Например, для уравнения Пуассона Δu = — 4πρ соответствующим однородным уравнением будет уравнение Лапласа Δu = 0.)

Если два решения одного и того же уравнения удовлетворяют еще и одинаковым граничным условиям, то их разность будет удовлетворять соответствующим однородным условиям: для нее значение соответствующего выражения на границе будет равно нулю.

Таким образом, всё разнообразие решений такого уравнения, при данных граничных условиях, может быть получено прибавлением к какому-либо частному решению, удовлетворяющему заданным неоднородным условиям всевозможных решений однородного уравнения, удовлетворяющих однородным граничным условиям (но не удовлетворяющих, вообще говоря, начальным условиям).

Решения однородных уравнений, удовлетворяющих однородным условиям, можно складывать и умножать на постоянные числа, и мы снова будем получать аналогичные решения.

Если решение однородного уравнения с однородными условиями является функцией некоторого параметра, то, интегрируя по этому параметру, мы снова будем получать такие же решения. На этом основан важнейший метод решения всевозможных линейных задач для уравнений математической физики — метод наложения.

Решение задачи ищут в виде

где u0 — частное решение уравнения, удовлетворяющее граничным условиям и не удовлетворяющее начальным условиям, а uk — некоторые решения соответствующего однородного уравнения, удовлетворяющие соответствующим однородным граничным условиям. Если уравнение с самого начала было однородным и граничные условия тоже, то решение задачи можно искать в виде

Для того чтобы иметь возможность удовлетворить произвольным начальным условиям с помощью выбора частных решений однородного уравнения uk, мы должны располагать достаточно большим набором таких решений.

Метод разделения переменных. Для построения необходимого набора упомянутых решений существует прием, называемый разделением переменных или методом Фурье.

Разберем этот прием подробно на примере решения задачи

(18).

Отыскивая частное решение уравнения, сделаем прежде всего предположение, что искомая функция и удовлетворяет граничному условию u|S=0 и представляет собой произведение двух функций, из которых одна зависит только от времени t, а другая — от пространственных переменных

Подставим это предполагаемое решение в наше уравнение. Мы будем иметь

Разделив обе части на TU, придем к равенству

В правой части этого равенства стоит функция только от пространственных переменных, слева — величина, от пространственных координат не зависящая. Отсюда видно, что написанное равенство может быть справедливым лишь в том случае, когда и справа и слева стоят постоянные величины. Мы приходим к системе двух уравнений

Стоящую справа постоянную величину мы обозначили через —λ2k, чтобы подчеркнуть, что она получится отрицательной (это может быть строго доказано). Значок к поставлен с той целью, чтобы отметить, что получается бесконечное множество возможных значений —λ2k, причем соответствующие им решения образуют в известном смысле полную систему функций.

Освобождаясь от знаменателя в обоих уравнениях, мы получим

Первое из написанных уравнений, как мы знаем, имеет простое решение

где Аk и Вk— произвольные постоянные. Это решение можно еще упростить с помощью введения вспомогательного угла φ. Положим

Тогда

Функция Т представляет собой гармоническое колебание с частотой λк, сдвинутое на фазу φk.

Наиболее трудной и интересной оказывается задача об отыскании решений уравнения

(19)

при заданных однородных граничных условиях, например при условии

U|s = 0

(где S — граница рассматриваемого объема Ω), или при каком-либо ином, также однородном условии. Решения этой задачи не всегда легко построить в конечном виде через известные функции, однако решения эти всегда существуют и их можно найти с любой заданной точностью.

Уравнение ΔU + λk2U = 0 при условии U|s = 0 имеет прежде всего очевидное решение U ≡ 0. Решение это — тривиальное и совершенно бесполезно для наших целей. Если λk — любое случайно взятое число, то других решений наша задача, вообще говоря, и не будет иметь. Однако существуют такие значения λk, для которых уравнение имеет нетривиальное решение.

Все возможные значения постоянной λk2 определяются как раз из того требования, чтобы при каждом из таких значений уравнение (19) имело нетривиальное, отличное от тождественного нуля решение, удовлетворяющее условию U|S =0. (Отсюда так же следует, что величины, обозначенные через —λk2 оказываются отрицательными.)

При каждом из возможных значений λk из уравнения (19) находится хотя бы одна функция Uk. Она позволяет построить частное решение волнового уравнения (18) в виде

Такое решение называют собственным колебанием рассматриваемого объема. Постоянная λk есть частота собственного колебания, а функция

Uk(x, у, z) дает нам его форму. Эту функцию принято называть собственной функцией. Для всех моментов времени функция uk, как функция переменных х, у, z, будет отличаться от функции Uk (х, уу z) только масштабом.

Мы не имеем сейчас возможности подробно доказывать все замечательные свойства собственных колебаний и собственных функций и ограничимся лишь их перечислением.

Первое свойство собственных колебаний состоит в том, что для всякого объема существует бесчисленное множество частот собственных колебаний или, как их еще называют, собственных частот. Эти частоты стремятся к бесконечности при возрастании номера k.

Второе свойство собственных колебаний называется ортогональностью. Оно состоит в том, что интегралы по области Ω от произведения собственных функций, отвечающих различным λk, равны нулю1

При j = k мы будем всегда считать

Этого всегда можно достичь, умножив функцию Uk(x, y, z) на соответственно подобранную постоянную, отчего она не перестанет удовлетворять уравнению (19) и условию U|S = 0.

Наконец, третье свойство собственных колебаний заключается в том, что если мы не пропустим ни одного значения λk, то с помощью собственных функций Uk(x, у, z) мы можем с любой точностью представить совершенно произвольную функцию f(x, у, z), лишь бы она удовлетворяла граничным условиям f|S, = 0 и не имела разрыва у первых и вторых производных. Любая такая функция f(x, y, z) может быть представлена сходящимся рядом

(20)

Третье свойство собственных функций дает нам принципиальную возможность представить любую функцию f(x, y, z) в виде ряда по собственным функциям нашей задачи, а при помощи второго свойства мы можем определить все коэффициенты этого ряда. Действительно, умно-

1 Если одному значению X соответствует несколько существенно различных (линейно независимых) функций U, то это значение а учитывается в наборе λк соответствующее число раз. Условие ортогональности функций, отвечающих раввым λk, может быть обеспечено соответствующим выбором этих функций.

жим обе части равенства (20) на Uj(x, у, z) и проинтегрируем по всему объему Ω. Мы получим

В сумме, стоящей справа, все члены при k≠j пропадут в силу свойства ортогональности, а коэффициент при Cj будет равен единице. Следовательно, мы получим

Перечисленные свойства собственных колебаний позволяют теперь решить общую задачу о колебаниях при любых начальных условиях. Для этого рассмотрим предполагаемое решение задачи

(21)

и постараемся подобрать постоянные Ак и Вк так, чтобы иметь

Подставляя в правую часть (21) t = 0, мы видим, что члены с синусами пропадут, a cosλkt обратится в единицу, и мы будем иметь

На основании третьего свойства собственных колебаний убеждаемся, что такое представление возможно, а по второму свойству имеем

Таким же образом, дифференцируя формулу (21) по t и полагая t=0, будем иметь

Отсюда, как и раньше, получаем значения Вк

Зная Ак и Вк, мы фактически знаем и амплитуду и фазу каждого собственного колебания.

Мы доказали таким образом, что, складывая собственные колебания, можно получить самое общее решение задачи с однородными граничными условиями.

Всякое решение состоит, таким образом, из собственных колебаний; зная начальные условия, можно найти амплитуду и фазу каждого из них.

Совершенно так же изучаются и колебания в тех случаях, когда независимых переменных меньше. Рассмотрим в качестве примера колебания струны, закрепленной с обоих концов. Уравнение колебаний струны имеет вид

Пусть мы ищем решение задачи для струны длины l, закрепленной на концах

Будем искать опять набор частных решений

Мы получим, очевидно, рассуждая как и прежде,

или Отсюда

Воспользуемся краевыми условиями для того, чтобы найти значения λk. Обоим условиям на краях можно удовлетворить не при всяком λk.

Из условия

получаем Мк = 0 и, значит,

Подставляя х = l, получим

Это возможно лишь в том случае, если

Значит

Условие

дает

Окончательно

Таким образом, собственные колебания струны, как мы видим, имеют форму синусоид с целым числом полуволн на всей струне. Каждое колебание имеет свою частоту, причем частоты эти можно расположить в возрастающем порядке

Хорошо известно, что именно такие частоты мы слышим при колебании звучащей струны. Частота aπ/l называется частотой основного тона, а все остальные суть частоты так называемых обертонов. Собственные функции на промежутке 0 ⩽ х ⩽ l меняют знак к — 1 раз. Действительно, при этом kπx/l пробегает значения от 0 по kπ, и, значит, синус успевает к — 1 раз переменить знак. Точки, где собственная функция Uk обращается в нуль, называются узлами колебаний.

Если мы каким-нибудь приемом заставим струну быть неподвижной в точке, соответствующей узлу, например первого обертона, то основной тон будет погашен, и мы услышим только звук первого обертона, который звучит октавой выше. Этот прием называется флажолетом и используется при игре на смычковых музыкальных инструментах: скрипке, альте и виолончели.

Мы разобрали метод разделения переменных на примере задачи о собственных колебаниях. Этот метод, однако, имеет значительно более широкую область применения: он применяется для решения задачи о передаче тепла и для решения целого ряда других задач.

Для уравнения передачи тепла

с условиям

мы будем иметь, так же как и ранее,

При этом

Решение получится в виде

Этот же прием можно использовать с большим успехом и для решения некоторых других уравнений. Рассмотрим, например, уравнение Лапласа

в круге

и пусть нам нужно построить его решение, удовлетворяющее условиям

где через r и $ обозначены полярные координаты некоторой точки на плоскости.

Уравнение Лапласа можно без труда перевести в полярные координаты. Оно примет при этом вид

Будем опять искать решение этого уравнения в виде

Требуя, чтобы каждый член ряда порознь удовлетворял уравнению, мы получим

Разделив уравнение на

получим

Положим опять

тогда

Нетрудно видеть, что функция θk(&) должна быть периодической функцией от $ с периодом 2π. Интегрируя уравнение θ''($) + λk2θk(&) = 0, получим

Эта функция будет периодической с нужным периодом только в случае, если λk— целое число. Полагая λk = k, будем иметь

Уравнение для Rk имеет общее решение в виде

Сохраняя лишь тот член, который является ограниченным при r→0, получим общее решение уравнения Лапласа в виде

Часто тот же прием можно применить и для отыскания нетривиальных решений уравнения ΔUk + λk2Uk = 0, удовлетворяющих однородным граничным условиям. В случае, когда таким путем удается свести задачу к задачам решения обыкновенных дифференциальных уравнений, говорят, что задача допускает полное разделение переменных. Полное разделение переменных по методу Фурье, как доказал советский математик В. В. Степанов, может получиться только в некоторых специальных случаях. Метод разделения переменных известен математикам очень давно. Его по существу применяли еще Эйлер, Бернулли и Даламбер. Фурье систематически использовал его для решения задач математической физики, в частности в задачах распространения тепла. Однако во многих случаях этот метод, как мы указали, неприменим; приходится пользоваться другими путями, о которых сейчас и пойдет речь.

Метод потенциалов. Сущность этого метода состоит попрежнему в наложении частных решений для разыскания решения общего вида. На этот раз в качестве элементарных частных решений используются решения, обращающиеся в какой-либо точке пространства в бесконечность. Каким образом это делается, мы поясним на примере уравнений Лапласа и Пуассона.

Пусть M0 — некоторая точка нашего пространства Обозначаем через r(М, M0) расстояние от точки M0 до некоторой другой переменной точки М. Функция

при фиксированном M0 является функцией переменной точки М. Легко убедиться в том, что эта функция является гармонической функцией

точки M во всем пространстве1, кроме, разумеется, самой точки M0, где она обращается в бесконечность вместе со своими производными. Сумма нескольких функций такого вида

где точки M1, M2, . . ., МN — какие-либо точки в пространстве, снова будет гармонической функцией точки М. Эта функция будет иметь особенности во всех точках Мi. Размещая точки M1, M2, .. ., MN как угодно плотно в некотором объеме Ω, с одновременным уменьшением коэффициентов Ai, мы можем перейти к пределу в этом выражении и получим новую функцию

где точка М' пробегает весь объем Ω. Интеграл рассматриваемого вида называется ньютоновым потенциалом. Можно доказать, хотя мы не будем этого делать, что полученная функция U удовлетворяет уравнению ΔU = —4πА.

Ньютонов потенциал имеет простой физический смысл. Для того чтобы понять этот смысл, мы начнем с исследования функции

Частные производные этой функции по координатам суть

Поместим в точку Mi массу Ai, которая будет притягивать к себе все тела с силой, направленной к точке Мi и обратно пропорциональной квадрату расстояния. Разложим эту силу на составляющие. Если величина самой силы, действующей на какую-либо материальную точку с массой, равной единице, есть , то косинусы углов, составленных направлением этой силы с направлениями координатных осей, будут: —. Следовательно, составляющие той силы, с которой действует на единичную массу в точке M притягивающий центр Mi, будут как раз равны X, Y, Z — частным производным от функции Ai/r по координатам. Если мы поместим в нескольких точках M1, M2, . . ., МN притягивающие массы, то каждая материальная точка с массой, равной единице, помещенная в точке М, будет испытывать силу, равную

1 То есть будет удовлетворять уравнению Лапласа.

равнодействующей всех сил, которые действуют на нее со стороны отдельных точек Mi. Иными словами,

Переходя к пределу и заменяя сумму интегралом, мы получим

Функцию U, частные производные от которой равны составляющим силы, действующей на некоторую точку, называют потенциалом этой силы. Поэтому функция представляет собою потенциал силы притяжения точки Mi, функция — потенциал тяготения группы точек M1, M2, . . ., MN, а функция потенциал тяготения масс, непрерывно распределенных в объеме Ω.

Вместо того чтобы распределить массы в некотором объеме, мы можем поместить точки M1, M2, . . ., Mn на некоторой поверхности S. Увеличивая опять число этих точек, получим в пределе интеграл

(22)

где Q — точка на поверхности S.

Нетрудно видеть, что эта функция будет гармонической всюду вне поверхности S и всюду внутри нее. На самой поверхности S эта функция, как можно доказать, непрерывна, но ее производные 1-го порядка претерпевают разрыв.

Функции

также представляют собою гармонические функции точки M при фиксированном Мi. Из этих функций в свою очередь можно составить суммы

которые будут гармоническими функциями всюду, кроме, быть может, точек M1, M2, . .., MN,

Мы можем опять построить пределы таких сумм при увеличении числа точек M1, M2, . . ., MN. Особое значение получает интеграл

(23)

в котором х', у', z' — координаты переменной точки Q поверхности S; n — направление нормали к поверхности S в точке Q; х, у, z — направления координатных осей; r — расстояние от Q до точки М, в которой определяется значение функции W.

Интеграл (22) называется потенциалом простого слоя, а интеграл (23) — потенциалом двойного слоя1. Потенциал двойного слоя, так же как и потенциал простого слоя, представляет собой гармоническую функцию вне и внутри поверхности S.

Много задач теории гармонических функций может быть решено при помощи потенциалов. При помощи потенциала двойного слоя можно решить задачу о построении в данной области Ω гармонической функции и, принимающей заданные значения 2πφ(Q) на границе S этой области. Для того чтобы построить такую функцию, нужно только выбрать соответствующим образом функцию μ(Q).

Эта задача несколько напоминает по своей природе задачу о разыскании коэффициентов ряда

так, чтобы он представлял левую часть.

Замечательное свойство интеграла W состоит в том, что его предельное значение при приближении точек M к точке Q0 с внутренней стороны поверхности имеет вид

Приравнивая это выражение заданной функции 2πφ(Q0), получим уравнение

Это уравнение называется интегральным уравнением второго рода. Существует развитая многими учеными теория таких уравнений. Решая это уравнение при помощи какого-либо метода, мы получим и решение интересующей нас задачи.

Таким же точно образом можно получить и решение других задач теории гармонических функций. Выбрав подходящим образом потен-

1 Названия потенциалов связаны со следующим физическим фактом. Представим себе, что на поверхность S мы нанесли электрические заряды. Они вызовут, в пространстве электрическое поле. Потенциал этого поля будет представляться интегралом (22), который поэтому и получил название потенциала простого слоя.

Допустим теперь, что поверхность S — тонкая непроводящая пленка. На одной стороне ее разместим по какому-либо закону электрические заряды одного знака (например, положительные). На другой же стороне S разместим по такому же закону электрические заряды противоположного знака. Действие этих двух электрических слоев также создает в пространстве электрическое поле. Как показывают расчеты, потенциал этого поля будет представляться интегралом (23).

циал, определяют плотность, т. е. величину произвольной функции, входящей в него, так, чтобы удовлетворить всем поставленным условиям.

С точки зрения физики это означает, что всякую гармоническую функцию можно представить как потенциал двойного электрического слоя, если распределить такой слой по поверхности S с надлежащим образом подобранной плотностью.

Приближенное построение решений. Метод Галеркина и метод сеток. 1. Мы указали выше два способа решения уравнений математической физики: метод полного разделения переменных и метод теории потенциалов. Эти методы разработаны еще в трудах ученых XVIII и XIX вв. (Фурье, Пуассона, Остроградского, Ляпунова и других). В XX в. эти методы были дополнены рядом других методов. Мы остановимся на двух из них — методе Галеркина и методе конечных разностей, или методе сеток.

Первый метод был предложен академиком Б. Г. Галеркиным для решения уравнений вида

содержащих неизвестный параметр X. (Здесь i, j, k, l независимо друг от друга пробегают значения 1, 2, 3). Эти уравнения получаются из уравнений, содержащих независимое переменное t, при помощи приема разделения переменных таким же образом, как из волнового уравнения

получается уравнение ΔU + λ2U = 0. Вопрос состоит в том, чтобы найти, при каких значениях λ однородная краевая задача будет иметь ненулевое решение, и найти эти решения.

Сущность метода Голеркина состоит в следующем. Неизвестную функцию ищут приближенно в виде

где ωm(x1, x2, x3) — какие угодно функции, удовлетворяющие граничным условиям.

Предполагаемое решение подставляют в левую часть уравнения для получения приближенного равенства

Обозначая для краткости выражение в фигурной скобке через Lωm, запишем это уравнение в виде

Умножим теперь обе части нашего приближенного равенства на ωn и проинтегрируем по области Ω, в которой ищется решение. Мы получим:

Если мы поставим себе целью в точности удовлетворить этим равенствам, то будем иметь систему алгебраических уравнений 1-й степени для неизвестных коэффициентов am. Число уравнений в ней равно числу неизвестных. Для того чтобы эта система имела решение, не равное нулю, должен равняться нулю ее определитель. Если развернуть этот определитель, то мы получим уравнение N-й степени для нахождения неизвестного числа λ.

Найдя значения λ и подставив их в систему, мы решим эту систему и получим приближенные значения для функций U.

Метод Галеркина пригоден не только для уравнений 4-го порядка; он может быть применен к уравнениям различных порядков и различных типов.

2. Последний из методов, на котором мы остановимся,—это так называемый метод конечных разностей или метод сеток.

Производная от функции и по переменной х представляет собою предел отношения

Это отношение в свою очередь может быть представлено в виде

и на основании известной теоремы о среднем значении (см. главу II, §8):

где ξ — точка из промежутка

Все вторые производные от и, как производные смешанные, так и производные, взятые по одному переменному, могут быть также приближенно представлены в виде разностных отношений. Действительно, разностное отношение

представляется в виде

На основании теоремы о среднем разностное отношение функции

можно заменить значением производной. Следовательно,

где ξ — некоторое среднее значение в промежутке

Таким образом,

С другой стороны, и значит

Пользуясь еще раз формулой конечных приращений, видим, что

где

Таким образом,

Если производная u" (х) непрерывна и величина Δх достаточно мала, то u"(η) будет сколь угодно мало отличаться от u"(х). Таким образом, наша вторая производная сколь угодно близка к рассматриваемому разностному отношению. Так же точно можно показать, что, например, вторая смешанная производная

приближенно представляется формулой

Вернемся теперь к нашему уравнению в частных производных.

Для того чтобы остановиться на чем-либо определенном, допустим, что это уравнение представляет собой уравнение Лапласа с двумя независимыми переменными

Пусть, кроме того, неизвестная функция и задана на границе S области Ω.

Приближенно принимаем, что

Положим Δх = Δy = h, тогда

Рис. 4.

Покроем область Ω квадратной сеткой с вершинами в точках x = kh, y = bh (рис. 4). Заменим нашу область Ω многоугольником, состоящим из попавших в Ω квадратов нашей сетки, причем границу области заменим на ломаную линию. Перенесем на эту ломаную линию значения неизвестной функции, заданные на границе S. Уравнение Лапласа мы приближенно заменим уравнением

для всех внутренних точек области. Это уравнение можно переписать в виде

Таким образом, значение и в какой-либо точке сетки, например в точке 1 на рис. 4, равно среднему арифметическому ее значений в четырех соседних точках.

Допустим, что внутри многоугольника оказалось N точек нашей сетки. В каждой такой точке мы получим свое уравнение. Таким образом, получится система N алгебраических уравнений с N неизвестными, решив которую мы получим приближенное значение функции и в области Ω.

Можно показать, что для уравнения Лапласа решение может быть найдено со сколь угодно большой точностью.

Метод конечных разностей сводит решение задачи к решению системы N уравнений с N неизвестными, причем за неизвестные берутся значения разыскиваемой функции в узлах некоторой сетки.

Тот же метод конечных разностей оказывается применимым и для других задач математической физики: для решения дифференциальных уравнений и для решения интегральных уравнений. Однако его применение во многих случаях наталкивается на ряд трудностей.

Может оказаться, что решение системы N алгебраических уравнений с N неизвестными, полученное по методу сеток, либо вообще не существует, либо дает ответ, весьма далекий от истинного. Это происходит тогда, когда решение системы уравнений приводит к накоплению ошибки, и чем меньше мы возьмем длину стороны квадратика сетки, тем больше мы получим уравнений и тем большую накопим ошибку при их решении.

В приведенном выше примере уравнения Лапласа это не так. Ошибка при решении этой системы не накапливается, а, наоборот, постепенно уменьшается, если решать эту систему, например, по методу последовательных приближений. Для уравнения передачи тепла и для волнового уравнения весьма существенным является выбор основной сетки. Можно получить для этих уравнений как хорошие, так и плохие результаты.

Если мы будем решать методом сеток какое-либо из этих уравнений, то, после того как сетка значений t выбрана, нужно выбирать для пространственных переменных не слишком мелкую сетку. Иначе мы получим очень плохую систему уравнений для значений неизвестной функции; решение ее даст результат, быстро колеблющийся и притом с большими амплитудами. Этот результат будет весьма далек от истинного.

Разнообразие получающихся возможностей лучше всего можно видеть на простом численном примере. Рассмотрим уравнение

в которое переходит уравнение передачи тепла в случае, когда температура не зависит от у и z. Положим шаг сетки вдоль значений t равным А, а вдоль значений х равным h

После этого наше уравнение может быть приближенно записано в виде:

Зная значения и в некоторый узловой момент t в точках х — h, х, x+h, нетрудно найти значения и в точке х в следующий узловой момент t+k. Пусть постоянная k, т. е. величина шага сетки по t, уже выбрана. Рассмотрим два случая выбора h. Положим в первом случае h2 = k, а во втором случае h2 = 2k и будем решать методом сеток следующую задачу.

В начальный момент u = 0 для всех отрицательных значений х и u = 1 для всех неотрицательных значений х. Мы будем иметь, выписывая в одну строку значения неизвестной функции и для определенного момента времени, две таблицы.

Таблица 1

Таблица 2

В табл. 2 мы получаем плавно меняющиеся значения от точки к точке для любого момента времени. Эта таблица дает хорошее приближение к решению уравнения теплопроводности. Наоборот, в табл. 1, в которой, казалось бы, точность должна была быть выше из-за более мелкого деления промежутка изменения х, значения и весьма быстро колеблются от положительных значений к отрицательным и достигают значительной величины, намного превышающей начальные данные. Ясно, что в этой таблице значения получаются чрезвычайно далекими от тех, которые соответствуют истинному решению.

Из примеров видно, что если мы хотим при помощи метода сеток получить достаточно близкие к истинным и надежные по точности результаты, мы должны проявить большую осторожность в выборе шагов сетки и предварительными исследованиями оправдать применение данного метода.

Полученные при помощи уравнений математической физики решения тех или иных задач естествознания дают нам математическое описание ожидаемого хода или вида физических явлений, описываемых этими уравнениями.

Поскольку при построении модели явления с помощью уравнений математической физики мы всегда вынуждены абстрагироваться от многих сторон этого явления, отбрасывать многое как несущественное, выделять то, что кажется главным, — результаты, полученные при этом, не являются абсолюно истинными. Они абсолютно верны лишь для той схемы или модели, которую мы рассматривали, но их всегда нужно еще сравнить с опытом для того, чтобы удостовериться, что модель явления, рассмотренная нами, близка к самому явлению и достаточно точно его воспроизводит.

Окончательным критерием истинности результатов будет, таким образом, лишь практический опыт. Являясь в конечном итоге един-

ственным критерием истинности полученных результатов, практический опыт, однако, сам может быть разумно поставлен и понят лишь в свете глубоко разработанной теории.

Наблюдая колеблющуюся струну музыкального инструмента, мы понимаем происхождение всех тонов, ею испускаемых, лишь осознав законы сложения собственных колебаний. Соотношения между частотами мы понимаем, исследуя, как эти частоты определяются материалом, натяжением струны и характером закрепления ее концов. Теория не только дает в этом случае способ подсчета каких-либо численных величин, но подсказывает и то какие именно величины являются характерными, как происходит физический процесс и что в нем надо наблюдать.

Таким образом, выросшая из потребностей практики область науки — математическая физика — сама на эту практику влияет и подсказывает ей пути дальнейшего хода вперед.

Математическая физика самым тесным образом связана с другими областями математического анализа, но мы не можем здесь касаться этих связей потому, что это завело бы нас слишком далеко.

§ 6. ОБОБЩЕННЫЕ РЕШЕНИЯ

Круг задач, в которых явление описывается непрерывно дифференцируемыми функциями, удовлетворяющими дифференциальным уравнениям, можно существенно расширить, вводя в рассмотрение разрывные решения этих уравнений.

В ряде случаев заранее ясно, что рассматриваемая задача не может иметь дважды непрерывно дифференцируемых решений, т. е. с точки зрения описанной в предыдущих параграфах классической постановки такая задача не имеет решения. Тем не менее соответствующий физический процесс происходит, хотя мы и не можем найти описывающие его функции в наперед заданном классе дважды дифференцируемых функций. Приведем этому простые примеры.

1) Если струна составлена из двух кусков разной плотности, то в уравнении

(24)

коэффициент а равен на соответствующих участках различным постоянным, и поэтому уравнение (24) вообще не будет иметь классических (дважды непрерывно дифференцируемых) решений.

2) Пусть коэффициент а постоянен, но в начальном положении струна имеет форму ломаной, задаваемой уравнением u|i=0 = φ (х). В вершине ломаной функция φ (x), очевидно, не имеет первой производной. Можно показать, что не существует классического решения уравнения (24), отвечающего начальным условиям

(здесь и далее ut обозначает du/dt)

3) Если резко ударить по какому-нибудь маленькому участку струны, то вызванные этим воздействием колебания описываются уравнением

где f (x, t) соответствует произведенному воздействию и является разрывной функцией, отличной от нуля лишь на маленьком участке струны и в короткий промежуток времени. Такое уравнение, как легко видеть, также не может иметь классических решений.

Уже приведенные примеры показывают, что требование непрерывности производных у искомого решения сильно сужает круг разрешимых задач. Поиски более широкого круга разрешимых задач пошли прежде всего по пути допущения разрыров первого рода у старших производных тех функций, которые служат решениями задачи, причем уравнению такие функции должны удовлетворять всюду, кроме точек разрыва. Оказалось, что решения уравнения типа Δu = 0 и du/dt — Δu = 0 внутри области определения не могут иметь таких (так называемых слабых) разрывов. Решения же волнового уравнения могут иметь слабые разрывы в пространстве переменных х, у, z, t лишь на поверхностях специального вида (так называемых характеристических поверхностях). Если решение u(x,y,z,t) волнового уравнения рассматривать как функцию, определяющую при t = t1 скалярное поле в пространстве x,y,z в момент времени t1, то поверхности разрыва вторых производных от u (x, у, z, t) будут перемещаться в пространстве х, у, z со скоростью, равной корню квадратному из коэффициента, стоящего при операторе Лапласа в волновом уравнении.

Однако второй пример со струной показывает, что необходимо также рассматривать решения, у которых могут быть разрывны первые производные, а в случае, например, звуковых и световых колебаний — и решения, которые сами имеют разрывы.

Первый вопрос, встающий перед исследователями при введении разрывных решений, заключается в том, чтобы выяснить, какие разрывные функции следует считать физически допустимыми решениями того или иного уравнения, той или иной поставленной для этого уравнения задачи. Можно ли, например, считать произвольную кусочно-постоянную функцию «единым решением» уравнения Лапласа или волнового уравнения, поскольку она вне линий разрыва удовлетворяет уравнениям.

Выясняя этот вопрос, следует прежде всего позаботиться о том, чтобы в том более широком классе функций, которому должны принадлежать все допустимые решения, имела место теорема единственности. Довольно ясно, что если допустить, например, произвольные кусочно-гладкие функции, то это требование не будет выполнено.

Первый по времени принцип выделения допустимых решений заключался в том, что эти функции должны быть пределами (в том или ином смысле) для классических решений того же уравнения. Так, в приведенном выше примере 2 решение уравнения (24), отвечающее функции φ(x), не имеющей производной в точке излома, может быть получено как равномерный предел классических решений un(x,t) того же уравнения, отвечающих начальным условиям un |i=0 = φn (х), unt |i=0 = 0, где φn (х)—дважды непрерывно дифференцируемые функции, равномерно сходящиеся к φ (x) при n → со.

В дальнейшем, вместо этого принципа, был выдвинут следующий: допустимое решение и должно удовлетворять вместо уравнения Lu = f некоторому интегральному тождеству, содержащему произвольную функцию Ф.

Это тождество получается так: умножим обе части уравнения Lu = f на произвольную функцию Ф, имеющую непрерывные производные по всем своим аргументам до порядка, равного порядку уравнения, и обращающуюся в нуль вне некоторой конечной области D, в которой определено уравнение. Полученное равенство проинтегрируем по D и затем преобразуем его при помощи интегриро-

вания по частям так, чтобы в него не входили производные от и. В результате этого получим желаемое тождество. Для уравнения (24), например, оно имеет вид

С. Л. Соболевым было доказано, что для уравнений с постоянными коэффициентами оба принципа выделения допустимых или, как теперь принято называть, — обобщенных решений, эквивалентны. Однако для уравнений с переменными коэффициентами первый принцип может вообще оказаться неприменимым. Такие уравнения могут вообще не иметь классических решений (см. пример 1). Второй же принцип дает возможность выделять обобщенные решения при весьма широких предположениях о дифференциальных свойствах коэффициентов уравнения. Правда, этот принцип имеет на первый взгляд излишне формальный, чисто математический характер и не дает прямого указания на то, как следует ставить задачи, аналогичные классическим задачам.

Мы приведем здесь его видоизменение, которое, как нам кажется, физически более оправдано, так как непосредственно связано с известным принципом Гамильтона.

Как известно, анализ выводов различных уравнений математической физики привел в первой половине XIX в. к открытию нового закона — так называемого принципа Гамильтона. Исходя из этого принципа оказалось возможным единообразным путем получать все известные уравнения математической физики. Проиллюстрируем это на примере уже рассмотренной в § 3 задачи о колебании ограниченной, закрепленной на концах струны.

Прежде всего составим так называемую функцию Лагранжа L (t) для нашей струны, т. е. разность кинетической и потенциальной энергий. Из сказанного в § 3 следует, что

Согласно принципу Гамильтона, интеграл

принимает наименьшее значение для функции u (x, t), соответствующей истинному движению струны, по сравнению со всеми другими функциями v(x,t), равными нулю при х = 0 и х = 1 и совпадающими при t=t1 и t = t2 с u(x,t1) и u(х, t2). При этом t1 и t2 фиксированы произвольно, а функции v должны иметь конечные интегралы S. Вследствие этого принципа так называемая первая вариация S (см. главу VIII) должна быть равна нулю, т. е.

(25)

где Ф (x, t) — произвольная дифференцируемая по х и t функция, равная нулю на сторонах прямоугольника 0 ⩽ х ⩽ l, t1 ⩽ t ⩽ t2.

Равенство (25) и есть то условие, которому должна подчиняться искомая функция u (x, t). Если дополнительно известно, что u (x, t) имеет производные второго порядка, то условию (25) можно придать иную форму. Интегрируя (25) по частям и применяя основную лемму вариационного исчисления, найдем,

что u (x, t) должно удовлетворять уравнению

(26)

которое совпадает с (24), если р и Г постоянны и T/p = a2.

Нетрудно видеть, что любое решение u (x, t) уравнения (26) удовлетворяет тождеству (25) для всех указанных Ф. Обратное оказывается неверным, ибо u (x, t) может вообще не иметь вторых производных. Таким образом, мы расширим круг разрешимых задач, если заменим уравнение (26) тождеством (25).

Для выделения какого-то определенного режима колебания струны следует, помимо граничных условий

u(0, t) = u(l, t) = 0, (27)

поставить еще и начальные

(28)

Если решение ищется в классе один раз непрерывно дифференцируемых функций, то условия (27) и (28) можно ставить отдельно от (25), как дополнительные требования. Если же предполагаемое решение «хуже», то эти условия в указанном виде теряют смысл и их следует частично или полностью включить в интегральное тождество (25).

Пусть, например, u (x, t) непрерывно для 0 ⩽ х ⩽ l, 0 ⩽ t ⩽ Т, а первые производные имеют разрывы. Тогда второе равенство (28) как предельное условие теряет смысл. В этом случае задачу можно поставить так. Найти удовлетворяющую условиям (27) и первому из условий (28), непрерывную функцию и, для которой тождественно выполнялось бы равенство

(29)

при всех непрерывных Ф(х, t), равных нулю при х = 0, х = l и t = Т. Обе функции и и Ф должны иметь при этом первые производные, вторая степень которых интегрируема в смысле Лебега по прямоугольнику 0 ⩽ х ⩽ l, 0 ⩽ t ⩽ Т. Последнее требование для и означает, что усредненное по времени значение полной энергии струны

должно быть конечным. Такое ограничение на функцию и, а потому и на ее возможные изменения Ф является естественным следствием принципа Гамильтона.

Тождество (29) есть не что иное, как условие равенства нулю первой вариации функционала

Поэтому задача о колебании закрепленной струны в рассматриваемом случае может быть поставлена как задача разыскания минимума функционала S среди всех функций V (х, t) непрерывных, удовлетворяющих условию (27) и равных u (x, Т) при t = Т. Кроме того, искомая функция должна удовлетворять первому из условий (28).

Приведенное здесь видоизменение принципа Гамильтона позволило не только расширить класс допустимых решений уравнения (24), но и поставить для них определенную краевую задачу.

То, что введенные обобщенные решения или какие-либо их производные могут быть определены не во всех точках пространства, не приводит к несоответствию с экспериментом. На это неоднократно указывал Н. М. Гюнтер, немало способствовавший своими исследованиями становлению новой точки зрения на понятие решения уравнений математической физики.

Если, например, мы решаем задачу на определение течения жидкости в каком-нибудь канале, то в классической постановке подлежат вычислению вектор скорости течения и давление в каждой точке потока. Но практически речь всякий раз идет не о давлении в точке, а о давлении потока на какую-нибудь площадку, не о векторе скорости в данной точке, а о количестве жидкости, протекающей за единицу времени через какую-нибудь площадку. Определение обобщенных решений и предполагает, по существу, вычисление именно этих величин, имеющих прямой физический смысл.

Для того чтобы большее число задач было разрешимо, следует искать решения среди функций, принадлежащих по возможности к наиболее широкому классу функций, но такому, в котором еще имели бы место теоремы единственности. Нередко такой класс диктуется физической сущностью задачи. Так, в квантовой механике реальный смысл имеет не функция состояния ψ(x), определяемая как решение дифференциального уравнения Шредингера, а интеграл av = ф

где ψν — некоторые функции, для которых

Поэтому решение ψ следует искать не среди дважды непрерывно дифференцируемых функций, а среди функций, интегрируемых со второй степенью. В задачах квантовой электродинамики вопрос о том, в каких классах следует искать решения рассматриваемых уравнений, до сих пор остается открытым.

Прогресс математической физики за последние тридцать лет во многом связан с переходом к этим новым постановкам задач и с созданием математического аппарата, необходимого для их решения. Одно из центральных мест в этом аппарате занимают так называемые теоремы вложения С. Л. Соболева.

Особенно удобными методами разыскания обобщенных решений в том или ином классе функций являются: метод конечных разностей, прямые методы вариационного исчисления (методы Ритца и Трефтца), метод Галеркина и функционально-операторные методы. В основе последних лежит изучение свойств преобразований, порожденных той или иной задачей, О методе конечных разностей и методе Галеркина уже говорилось в § 5. Здесь мы поясним идею, лежащую в основе прямых методов вариационного исчисления.

Рассмотрим задачу на определение положения равновесия упругой мембраны с жестко закрепленным краем. Согласно принципу о минимуме потенциальной энергии в положении устойчивого равновесия, функция и(х,у), определяющая положение мембраны, должна давать наименьшее значение интегралу

по сравнению со всеми другими непрерывно дифференцируемыми функциями v (х, y), удовлетворяющими тому же условию закрепления v |S = φ, что и функция и. При некоторых ограничениях на φ и границу S доказывается, что такой минимум существует и реализуется для гармонической функции, так что искомая функция и есть решение задачи Дирихле: Δu = 0, u|S = φ. Верно и обратное: решение задачи Дирихле дает минимум интегралу J по сравнению со всеми v, удовлетворяющими условию закрепления.

Доказательство существования функции и, реализующей минимум J, и ее вычисление с любой степенью точности можно вести, например, следующим образом (метод Ритца). Возьмем бесконечный набор дважды непрерывно дифференцируемых функций {vn (х, у)}, n = 0, 1, 2, . . . , равных нулю на контуре при n>0 и равных φ при n = 0. Рассмотрим J на функциях вида

где n закреплено, а Сk — произвольные числа. Тогда J (v) будет полиномом второй степени от n независимых переменных C1, C2, . . . , Сn. Определим Сk из условия, чтобы полином принимал наименьшее значение. Это приводит к системе n линейных алгебраических уравнений с n неизвестными, определитель которой отличен от нуля. Таким образом, числа Сk определяются однозначно. Обозначим соответствующее им v через vn(x,y). Оказывается, что если система {vn} удовлетворяет некоторому условию «полноты», то функции vn при n→∞ сходятся к некоторой функции, которая и будет искомым решением задачи.

В заключение заметим, что в этой главе дано описание лишь простейших линейных задач механики и оставлены в стороне многие еще далеко не до конца разработанные вопросы, связанные с более общими уравнениями в частных производных.

ЛИТЕРАТУРА

Курант Р. и Гильберт Д. Методы математической физики. Т. I—II. Перев. с нем. Гостехиздат, 1951.

Содержание этой книги охватывает широкий круг методов математической физики.

Смирнов В. И. Курс высшей математики. Т. 11, Изд. 14-е, Гостехиздат, 1956.

В одной из глав этого тома приводятся решения простейших задач математической физики.

Франк Ф. и Мизес Р. Дифференциальные и интегральные уравнения математической физики. Перев. с нем. ОНТИ, 1937.

Книга написана многими авторами на основе первоначальной редакции, служившей записью лекций Римана. В ней дана математическая постановка значительного числа задач из различных разделов физики и разбор связанных с этими задачами уравнений.

Современные университетские курсы

Петровский И. Г. Лекции об уравнениях с частными производными. Изд. 2-е, Гостехиздат, 1953.

Смирнов В.И. Курс высшей математики. Т. IV, Изд. 3-е, Гостехиздат, 1953.

Соболев С. Л. Уравнения математической физики. Изд. 3-е, Гостехиздат, 1954,

Специальные монографии

Ладыженская О. А. Смешанная задача для гиперболического уравнения, Гостехиздат, 1953.

Михлин С. Г. Проблема минимума квадратичного функционала. Гостехиздат, 1952.

Соболев С. Л. Некоторые применения функционального анализа в математической физике. Изд. ЛГУ, 1950.

Глава VII

КРИВЫЕ И ПОВЕРХНОСТИ

§ 1. ПОНЯТИЕ О ПРЕДМЕТЕ И МЕТОДЕ ТЕОРИИ КРИВЫХ И ПОВЕРХНОСТЕЙ

В школьном курсе геометрии изучают только простейшие линии: прямую, ломаные, окружность и ее дуги, а из поверхностей рассматривают, кроме плоскости, поверхности многогранников, шара, конуса и цилиндра. В более обширных курсах изучают еще некоторые кривые; прежде всего конические сечения: эллипс, параболу, гиперболу. Но исследование любой кривой или поверхности совершенно чуждо элементарной геометрии. На первый взгляд кажется даже неясным, какие общие свойства могут быть выделены и изучены, когда речь идет о любых кривых и поверхностях. Однако такое исследование представляется совершенно естественным и необходимым.

Во всех видах практической деятельности и познания природы мы постоянно сталкиваемся с кривыми и поверхностями самой различной формы. Путь планеты в пространстве, корабля в море, снаряда в воздухе, след резца на металле, колес на шоссе, пера на ленте прибора, контуры кулачка, управляющего клапанами мотора, и контуры художественного узора, форма провисшего троса, форма специально намотанной спиральной пружины и т. д. — таким примерам различных кривых нет конца. Поверхности тел, тонкие оболочки, цистерны, обшивка самолетов, чехлы, тонкие листовые материалы и т. д. дают бесконечное разнообразие поверхностей. Приемы обработки изделий, оптические свойства, обтекаемость тел, жесткость, прочность и деформируемость тонких оболочек и многие другие свойства зависят в большой мере от геометрической формы поверхности предметов.

Конечно, канавка, оставленная резцом на металле, не есть математическая кривая. Цистерна, даже с тонкими стенками, не есть математическая поверхность. Но в первом приближении, достаточном для исследования многих вопросов, реальные объекты удается изображать математически кривыми и поверхностями.

Вводя понятие математической кривой путем отвлечения от всех причин, ограничивающих возможность уменьшения толщины реальной нити, мы мыслим себе кривую как абсолютно тонкую нить, нить без толщины. В этом абстрактном понятии нам удается отразить совершенно реальные

общие свойства предметов, сохраняющиеся при уменьшении их толщины и ширины по сравнению с их длиной.

Аналогично, отвлекаясь от ограниченности возможного уменьшения толщины оболочек и ограниченности возможного уточнения положения границы тел, мы приходим к понятию математической поверхности. Мы не будем давать строгих определений этих хорошо известных понятий. Заметим только, что их математически точное определение не просто и принадлежит топологии.

Наконец, к изучению разных кривых линий и поверхностей нас толкает развитие математического анализа. Достаточно вспомнить, например, что линия служит геометрическим образом функции — важнейшего понятия анализа. Впрочем, с различными графиками каждый встречался, наверно, и независимо от изучения анализа.

Если в элементарной геометрии, созданной еще древними греками, не возникало речи о любой кривой или поверхности, то в аналитической геометрии уже говорят, что «всякая кривая изображается уравнением» и «любое уравнение с двумя переменными у изображает кривую на координатной плоскости». Аналогично поверхности задаются в координатах уравнениями z=f (х, у) или F (х, у, z)=0. Координатный метод, установивший тесную связь геометрии и анализа, дал способы задания разнообразных кривых и поверхностей уравнениями.

Но все же аналитическая геометрия ограничивается алгебраическими и элементарно геометрическими средствами и не идет дальше исследования отдельных типов фигур. Изучение же любых кривых и поверхностей представляет собой новый раздел — теорию кривых и поверхностей, которую называют также дифференциальной геометрией.

Следует сразу оговорить, что дифференциальная геометрия подчиняет исследуемые кривые и поверхности некоторым общим условиям, связанным с возможностью применения при их исследовании методов анализа. Однако при этом класс допустимых кривых и поверхностей остается практически неограниченно разнообразным, так что ими в огромном числе задач удается с необходимой точностью изображать изучаемые реальные объекты. Самое название «дифференциальная геометрия» указывает на метод этой теории: она пользуется в основном дифференциальным исчислением и исследует в первую очередь «дифференциальные» свойства кривых и поверхностей, т. е. свойства их «в точке»1. Так, направление линии в точке

1 Дифференциальная геометрия изучает в первую очередь свойства кривых и поверхностей «в точке» (т. е. свойства, зависящие от сколь угодно малой окрестности данной точки), причем эти свойства характеризуются величинами, выражаемыми через производные (в данной точке) от тех функций, которые входят в уравнения, задающие кривую или поверхность. Именно поэтому дифференциальная геометрия подчиняет исследуемые кривые и поверхности условиям, которые обеспечивают возможность применения дифференциального исчисления: требуется, чтобы кривая или поверхность могла быть задана уравнениями, в которые входят функции, имеющие достаточное число последовательных производных.

характеризуется касательной, искривление — кривизной (ее точное определение будет дано позже) и т. п. Дифференциальная геометрия исследует свойства малых кусков кривых и поверхностей и только в более далеких своих разделах переходит к исследованию разнообразных кривых и поверхностей «в целом», т. е. на всем их протяжении.

Развитие дифференциальной геометрии неразрывно связано с развитием анализа. Основные операции анализа — дифференцирование и интегрирование — имеют прямой геометрический смысл. Как уже выяснено в главе II (том 1), дифференцированию функции f (х) соответствует проведение касательной к кривой

y=f (х).

Угловой коэффициент касательной (т. е. тангенс угла ее наклона к оси Ох) и есть не что иное, как производная f'(x) функции f(x) в соответствующей точке (рис. 1), а площадь «под кривой»

y=f (x)

численно есть не что иное, как интеграл ∫f(x)dx этой функции, взятый в соответствующих пределах. Поскольку в анализе исследуются произвольные функции, то тем самым речь идет и о любых кривых или поверхностях. В анализе рассматривались прежде всего общие приемы изучения хода кривой на плоскости: ее подъема и спуска, большего и меньшего искривления, направления ее выпуклости, мест перегибов и пр. На тесную связь с теорией кривых указывает само название первого курса анализа, изданного французским математиком Лопиталем в 1695 г.: «Анализ бесконечно малых для понимания кривых линий».

Когда дифференциальное и интегральное исчисления после Ньютона, Лейбница и их ближайших последователей достигли к середине XVIII в. достаточного развития, открылась возможность более глубокого их применения в геометрии. С этого момента и начинается уже собственно развитие теории кривых и поверхностей. Для кривых в пространстве и для поверхностей вставали задачи, аналогичные, но несравненно более сложные и богатые содержанием, чем в случае плоских кривых. Эти задачи со временем выросли из рамок простого применения анализа к геометрии и привели к образованию самостоятельной теории кривых и поверхностей. В развитии начал этой теории во второй половине XVIII в. принимали участие многие математики: Клеро, Эйлер, Монж и др., причем из них именно Эйлера нужно считать основателем общей теории поверхностей. Первым сводным сочинением по теории кривых и поверхностей явилась

Рис. 1.

книга Монжа «Приложение анализа к геометрии», вышедшая в 1795 г.1 В исследованиях этих математиков и, в частности, в названной книге Монжа явно видны причины, побуждавшие развитие дифференциальной геометрии. Это были растущие потребности механики, физики, астрономии, т. е. в конечном счете потребности техники и промышленности, для которых данных элементарной геометрии было уже совершенно недостаточно.

Связь с запросами практики характерна также для классических работ Гаусса (1777—1855) по теории поверхностей. Работа Гаусса, вышедшая в 1827 г. под названием «Общие исследования о кривых поверхностях», заложила основы дифференциальной геометрии поверхностей, как самостоятельной области математики. В ней были развиты те общие методы и задачи теории поверхностей, о которых будет идти речь в § 4. Гаусс исходил, в частности, из потребностей картографии. Задача картографии состоит в возможно более точном изображении частей земной поверхности на плоскости. Совершенно точное изображение здесь невозможно: отношения масштабов необходимо должны искажаться вследствие искривленности земной поверхности. Поэтому встает задача о нахождении возможно более точных способов изображения. Черчение карт имеет начало в глубокой древности, но создание общей теории представляет достижение нового времени, и оно не было бы возможно без развития общей теории поверхностей и общих методов математического анализа. Отметим, что один из трудных математических вопросов картографии служил предметом исследования П. Л. Чебышева (1821—1894). Ему же принадлежат важные результаты, касающиеся сетей кривых линий на поверхностях. К этим исследованиям его также привели чисто практические задачи.

Общие вопросы отображения одной поверхности на другую и вопросы деформации поверхностей составляют и сейчас один из центральных разделов геометрии. Относящиеся сюда важные результаты были получены еще в 1838 г. Ф. Миндингом (1806—1885), профессором Дерптского (ныне Тартуского) университета.

Ко второй половине прошлого столетия теория кривых и поверхностей уже сложилась в своих основах (если говорить о так называемой «классической дифференциальной геометрии», в отличие от более новых направлений, о которых будет идти речь в § 5). Были получены основные уравнения теории кривых — так называемые формулы Френе. В 1853 г. ученик Миндинга по Тартускому университету К. М. Петерсон (1828—1881) нашел и использовал в своей диссертации основные уравнения теории поверхностей; 15 лет спустя они были получены и опубликованы итальян-

1 Гаспар Монж (1746—1828) был не только выдающимся ученым, но и деятелем французской революции (морским министром, а затем организатором производства пушек и пороха для революционной армии). Он прошел характерный для представителя французской буржуазии путь от якобинца до приверженца империи Наполеона.

ским математиком Кодацци, с именем которого эти уравнения обычно связывают. Петерсон, окончив университет в Тарту, жил и работал в Москве учителем гимназии. Не занимая никакого академического поста, соответствующего его выдающимся научным достижениям, он был тем не менее одним из основателей Московского математического общества и журнала «Математический сборник», выходящего в Москве с 1866 г. до настоящего времени. От Петерсона берет начало московская научная школа дифференциальной геометрии.

Известный итог развития «классической» дифференциальной геометрии был подведен в четырехтомных «Лекциях по общей теории поверхностей» французского геометра Дарбу, вышедших в 1887—1896 гг. В нашем столетии классическая дифференциальная геометрия продолжает разрабатываться, но центр исследований в теории кривых и поверхностей перешел в большой мере к новым направлениям, в которых круг изучаемых фигур и их свойств еще более расширился.

§ 2. ТЕОРИЯ КРИВЫХ

Способы задания кривых в дифференциальной геометрии. Из анализа и аналитической геометрии мы уже знакомы с заданием кривых уравнениями. В прямоугольных координатах на плоскости кривую можно задавать либо уравнением

y = f(x),

либо более общим уравнением

F(x, у) = 0.

Однако этот способ годится только для плоской кривой (т. е. линии на плоскости). Между тем необходимо также уметь задавать уравнениями пространственные кривые (не умещающиеся ни в какой плоскости). Примером такой кривой может служить винтовая линия (рис. 2).

Для целей дифференциальной геометрии и во многих других вопросах наиболее удобно представлять себе кривую как след непрерывного движения точки. Конечно, данная кривая может иметь совсем другое происхождение, но мы всегда можем мысленно заставить какую-либо точку пробегать данную кривую.

Предположим, что в пространстве фиксирована некоторая декартова система координат. Если заставить подвижную точку пробегать кривую за время от t=a до t = b, то координаты этой подвижной точки окажутся функциями времени x(t), y(t), z(t). Наглядными примерами могут

Рис. 2.

служить полет самолета или полет снаряда. Обратно, если заранее заданы функции х (t), у(t), z(t), то ими можно определять координаты подвижной точки Х. Точка, двигаясь с изменением t, начертит тем самым некоторую кривую. Таким образом, кривые в пространстве можно задавать тремя уравнениями вида:

x = x(t), y=y(t), z=z(t).

Точно так же на плоскости кривая определится двумя уравнениями

x = x(t), y = y(t).

Этот способ задания кривых является наиболее общим.

Рассмотрим для примера винтовую линию. Она получается при винтовом движении точки, которое складывается из равномерного вращения вокруг некоторой прямой — оси винта — и равномерного перемещения вдоль той же оси. Примем ось винта за ось Oz. Пусть в момент t=0 точка лежит на оси Ох. Найдем зависимость ее координат от времени. Если движение вдоль оси Oz происходит со скоростью с, то, очевидно, смещение в этом направлении за время t будет

z = ct.

Если φ — угол поворота вокруг оси Oz и а — расстояние от точки до оси, то, как видно из рис. 2,

Так как вращение равномерно, то угол φ пропорционален времени: φ = ωt (ω — угловая скорость вращения). Таким образом получаем

Это и будут уравнения винтовой линии; с изменением t точка с такими координатами зачерчивает винтовую линию.

Конечно, переменной t, или, как обычно говорят, параметру t, не обязательно придавать смысл времени. Кроме того, от данного параметра t можно переходить к другому: можно, например, ввести другую переменную и по формуле t=u3 или вообще t=f(u)1. В геометрии наиболее естественно выбирать за параметр длину s дуги кривой, отсчитываемую от какой-либо фиксированной точки А на кривой. Каждому возможному значению длины s отвечает своя дуга АХ. Поэтому положение X полностью определяется величиной s, и координаты точки X тем самым выразятся как функции длины дуги s

x = x(s), y = y(s), z = z(s).

1 При этом, строго говоря, надо, чтобы функция f была монотонной.

Все эти, так же как и возможные другие, способы задания кривых1 открывают путь к применению вычислений при исследовании. Только охарактеризовав кривую уравнениями, можно исследовать ее свойства средствами математического анализа.

В дифференциальной геометрии с плоскими кривыми связывают три основных понятия: длину, касательную и кривизну. С пространственными кривыми связывают еще так называемые соприкасающуюся плоскость и кручение. Сейчас мы последовательно выясним смысл и значение этих понятий.

Длина. Сложившееся у каждого человека наглядное представление о длине необходимо уточнить, превратить в точное определение длины математической кривой, которое вело бы к определенной численной характеристике и позволяло с любой степенью точности вычислять длину кривых и строго рассуждать, когда речь идет о длине. Это относится ко всем математическим понятиям. Переход от неоформленных представлений к измерениям и точным определениям как раз представляет собой переход от донаучного понимания предмета к научному. Уточнение понятий необходимо в конечном итоге для нужд техники и естествознания, развитие которых и потребовало изучения свойств длин, площадей и других геометрических величин.

Простое и наиболее употребительное определение длины следующее: длина кривой есть предел длин вписанных в эту кривую ломаных при условии, что вершины ломаных безгранично сгущаются на самой кривой.

Такое определение исходит из естественного способа измерения. На кривой последовательно отмечаются точки A0, A1, A2, . . . (рис. 4)

Рис. 3. Рис. 4.

1 Кривую в пространстве можно задавать еще как пересечение двух поверхностей, определяемых уравнениями: F (х, у, z) = 0, G(x, y,z) = 0, т. е. кривая задается совокупностью этих двух уравнений. В теоретических выводах чаще всего задают кривую векторно, т. е. положение точки X кривой определяют вектором r = OХ, идущим из начала координат в эту точку. С изменением вектора r его конец X зачерчивает данную кривую (рис. 3).

и измеряются расстояния между ними. Сумма этих расстояний (эта сумма и есть длина вписанной ломаной) выражает приближенно длину кривой. Чтобы определить длину точнее, естественно брать точки А гуще, тогда лучше будут учтены изгибы кривой. Наконец, точное значение длины определяется как предельное значение при безграничном сгущении точек A1. Таким образом, данное определение длины представляет обобщение вполне реального способа измерения длины, производимого все более мелкими шагами.

От определения длины легко перейти к формулам для ее вычисления, когда кривая задана аналитически. Заметим, однако, что математические формулы вовсе не служат для одного вычисления. Они представляют собой сокращенную запись теорем, устанавливающих связи между разными математическими величинами. Теоретическое значение таких связей может далеко превосходить вычислительное значение формулы. Например, теорема Пифагора, выражаемая формулой

вовсе не сводится к вычислению квадрата гипотенузы с, а указывает прежде всего на зависимость между сторонами прямоугольного треугольника.

Мы здесь выведем формулу для длины плоской кривой, заданной в декартовых координатах уравнением y = f(x). Предполагается при этом, что функция f(x) имеет непрерывную производную.

Впишем ломаную в кривую (рис. 5). Пусть Аn, Аn+1 — две ее соседние вершины, а xn, yn и xn+1, yn+1 — координаты этих вершин. Отрезок АnАn+1 является гипотенузой прямоугольного треугольника, катеты которого равны

Поэтому, согласно теореме Пифагора,

Рис. 5.

1 Существование указанного предела, т. е. длины, даже для кривой, расположенной в ограниченной области, заранее неясно. Если кривая очень извивается, то длина ее может быть очень большой. Математически можно задать столь «извилистую» кривую, что никакая ее дуга не будет иметь конечной длины (длины вписываемых в нее ломаных будут неограниченно возрастать).

Легко представить себе, что если проведенную через точки An и Аn+1 прямую поднимать или опускать параллельно самой себе, то в момент, когда прямая будет отрываться от кривой, она займет положение касательной в какой-то точке В этой кривой, т. е. на участке кривой АnАn+1 есть хотя бы одна точка, в которой касательная наклонена под тем же углом, что и хорда АnАn+1. (Это очевидное замечание легко превратить в строгое доказательство.)

Сказанное позволяет заменить отношение тангенсом угла наклона касательной в точке В, т. е. заменить производной у' (ξn),

где ξn — абсцисса точки В. Теперь длина одного звена имеет выражение

Вся же длина ломаной есть сумма длин ее звеньев. При сокращенном обозначении сложения знаком Σ имеем

Чтобы получить длину кривой, остается перейти к пределу при условии, что наибольшая из величин Δxn стремится к нулю,

Но такой предел сумм есть не что иное, как интеграл, согласно определению, которое было дано в главе II (том 1). Именно, это есть интеграл от функции √1+y'2. Таким образом, длина плоской кривой выражается формулой

(1)

где пределы интегрирования а и b — значения х на концах рассматриваемой дуги кривой.

Вывод соответствующей, но несколько иной формулы для длины пространственной кривой оказывается в основном таким же.

Фактическое вычисление длин по этим формулам, конечно, не всегда бывает простым. Так, длина окружности вычисляется посредством формулы (1) довольно сложно. Но, как мы уже сказали, формулы представляют интерес не только для вычисления; в частности, формула (1) важна также для исследования свойств длины, ее связи с другими величинами и т. п. Мы будем иметь случай использовать формулу (1) в главе VIII.

Касательная. Касательная к плоской кривой уже рассматривалась в главе II (том 1). Ее смысл для пространственной кривой совершенно аналогичен. Чтобы определить касательную в точке А, на кривой берут точку X, отличную от А, и проводят секущую АХ. Затем точку X приближают по кривой к А. Если при этом секущая АХ стремится к некоторому предельному положению, то имеющая это предельное положение прямая и называется касательной в точке А1.

Если различать начало и конец кривой, а тем самым и порядок ее прохождения, то можно говорить о том, какая из точек А и X является первой, какая второй. (Так, например, при движении поезда из Москвы во Владивосток, Омск, очевидно, предшествует Иркутску.) В соответствии с этим можно на секущей указать стрелкой направление от первой точки ко второй. Предел таких «направленных секущих» даст нам «направленную касательную» (рис. 6). Стрелка на ней указывает, в какую сторону происходит движение вдоль кривой в момент прохождения точки А. При движении точки по кривой скорость движения в каждый момент направлена по касательной к проходимой кривой.

Касательная обладает одним важным геометрическим свойством: вблизи точки касания кривая уклоняется от этой прямой в известном смысле меньше, чем от любой другой прямой. При этом расстояние точки кривой от касательной весьма мало в сравнении с ее расстоянием до точки касания. Точнее, отношение XX'/AX (рис. 7) стремится

Рис. 6. Рис. 7.

1 Предел положения секущих может и не существовать, как видно из примера на рис. 13 главы II. Изображенная там кривая у = xsin1/x колеблется вблизи нуля так, что секущая OA при приближении А к О все время колеблется от прямой ОМ к прямой OL и обратно.

к нулю, когда X стремится к A1. Поэтому на малом отрезке кривая может заменяться касательной с ошибкой, малой в сравнении с размерами взятого отрезка. Это свойство касательной часто используют, заменяя для упрощения выводов малые отрезки кривых отрезками касательных. В соединении с предельным переходом такой прием дает вполне точные результаты.

Интересно проследить, что для кривой, не являющейся прямой, т. е. не имевшей в прежнем смысле направления, мы, сопоставляя ее с прямой, определили ее направление в каждой точке. Тут понятие направления расширилось: оно приобрело смысл там, где раньше его не имело. Это новое понятие направления отражает реальную природу движения по кривой: оно в каждый момент имеет направление и вместе с тем непрерывно изменяет его.

Кривизна. Чтобы судить на глаз о большем или меньшем искривлении пути, тонкого стержня или линии на чертеже, не нужно быть математиком. Но уже для простейших задач механики этого общего взгляда недостаточно, нужна точная количественная характеристика искривленности. Ее получают, ясно выражая то содержание, которое имеется в наглядном представлении о кривизне как быстроте изменения направления кривой.

Пусть A—точка на кривой и M — точка, близкая к А (рис. 8). Угол между касательными в этих точках выражает поворот кривой на участке от А до М. Обозначим этот угол через φ. Средняя скорость поворота, точнее средний поворот на единицу длины пути на участке AM длины Δs, очевидно, будет φ/Δs.Кривизну же, как скорость поворота кривой в самой точке А, естественно, определить как предел отношения при М→А, иначе говоря, при Δs→0. Итак, кривизну определяют формулой

В качестве примера рассмотрим кривизну окружности (рис. 9). Очевидно, угол φ между радиусами OA, ОМ и угол φ между касательными в точках А и M, как составленные взаимно перпендикулярными

Рис. 8.

1 Это утверждение сразу вытекает из самого определения касательной. Дей ствительно, как видно из рис. 7, XX'/AX = sin а, где а — угол между касательной и секущей АХ. Поэтому вместе с а и XX'/AX стремится к нулю.

сторонами, равны. Дуга AM, стягивающая угол φ, имеет длину Δs = φr, откуда

Значит, отношение φ/Δs постоянно, поэтому кривизна окружности, как предельное значение этого отношения, одинакова во всех точках и равна обратной величине радиуса1.

Выведем формулу кривизны плоской кривой, заданной уравнением y = f(x). За начало отсчета длины дуги примем фиксированную точку N (рис. 10). Угол φ между касательными в точках А и М, очевидно, равен по величине изменению угла наклона касательной при переходе от А к M

Ввиду того что угол X мог и убывать, мы берем абсолютную величину |Δα|.

Рис. 9.

Рис. 10.

1 Заметим, что вообще к понятию кривизны любой кривой можно подойти, сравнивая кривую с окружностью, выполняющей при этом роль образца, эталона кривизны. Именно: кривизна оказывается величиной, обратной радиусу той окружности, которая наилучшим образом прилегает к кривой вблизи рассматриваемой точки.

Нас интересует величина

Длина дуги кривой NA выражается интегралом

откуда

Остается найти α'. Мы знаем, что tgα = y'; поэтому Продифференцировав последнее равенство по х, получаем

Итак, окончательно

Соответствующие формулы для других способов задания кривой и для пространственных кривых выводятся в обычных курсах анализа или дифференциальной геометрии.

Полученная формула позволяет дать другое геометрическое истолкование кривизны, которое полезно во многих вопросах. Именно, кривизна кривой в данной точке может быть выражена формулой

где h — расстояние от точки на кривой до касательной в данной точке, а l — длина отрезка касательной от точки касания до проекции на нее точки кривой (рис. 11).

Для доказательства выберем прямоугольную систему координат так, чтобы начало координат совпало с данной точкой кривой, а ось Ох касалась кривой в этой точке (рис. 11). (Для простоты считаем кривую плоской.) Тогда у' = 0 и потому k = |у"|. Разлагая по формуле Тейлора функцию y = f(х), задающую кривую, получим:

(здесь

Рис. 11.

учтено, что у' = 0). При этом ε→0, когда х→0. Отсюда вытекает, что

Эта формула показывает, что кривизна характеризует скорость отхода кривой от касательной.

Остановимся на некоторых важнейших связях понятия кривизны с задачами механики.

Первой рассмотрим следующую задачу. Пусть гибкая нить натянута на некоторую опору (рис. 12), причем нить остается в одной плоскости. Требуется найти давление нити на опору в каждой точке, точнее, определить предел

(2)

где Р — величина силы Р, действующей на опору со стороны участка длины Δs, содержащего данную точку. Предположим для простоты, что величина Т натяжения Т вдоль всей нити одинакова.

Рассмотрим точку А и прилегающий к ней участок AB1. На участок нити AB длиной Δs, кроме реакции опоры, действуют только две внешние силы — натяжения на концах, равные по величине и направленные в разные стороны по касательным в концах участка. Поэтому на опору со стороны нити давит сила Р, равная геометрической сумме натяжений на концах. Как видно из рис. 12, вектор Р служит основанием AD в равнобедренном треугольнике CAD. Боковые стороны этого треугольника равны T, а угол φ при вершине С равен повороту касательной при переходе от А к В.

Рис. 12.

1 Было бы естественнее взять участок, для которого точка А была бы серединой, но это, не изменив результата, повлекло бы за собой некоторое усложнение вычислений.

С уменьшением Δs угол φ уменьшается, а угол между Р и касательной в точке А приближается к прямому. Поэтому давление направлено перпендикулярно касательной.

Для разыскания величины давления воспользуемся тем, что малая дуга окружности близка по длине к стягивающей ее хорде, и заменим длину хорды AD, т. е. величину Р, длиной Тφ дуги AD. Тогда по формуле (2) получим

Итак, давление в каждой точке равно произведению кривизны на натяжение нити и направлено перпендикулярно касательной в этой точке.

Рассмотрим другую задачу. Пусть материальная точка (т. е. очень малое тело) движется по кривой на плоскости с постоянной по величине скоростью v. Каково ее ускорение в данной точке А? По самому определению ускорения оно равно пределу отношения приращения скорости (за время Δt) к приросту времени Δt. Скорость берется при этом не только по величине, но и по направлению, т. е. мы рассматриваем изменение вектора скорости. Стало быть, математически задача о величине ускорения сводится к нахождению предела

где v(t)—скорость в самой точке A, a |v(t+Δt)— v(t)| — длина вектора, выражающего разность скоростей. Предел, который нас интересует, можно еще переписать так:

где Δs — длина дуги AB, пройденной за время Δt.

Если обратиться к рис. 13 и учесть, что скорость в каждой точке направлена по касательной, а величина ее постоянна, то разыскание суммы — V (t) + V (t + Δt) по геометрической сути дела ничем не будет отличаться от разыскания вектора Р в предыдущей задаче. Поэтому можно воспользоваться готовым решением предшествующей задачи и, заменяя натяжение скоростью, написать

Кроме того,

Поэтому окончательно можно сказать, что ускорение, которое испытывает тело при равномерном движении по кривой, равно произведению кривизны на квадрат скорости

(3)

и направлено по нормали к кривой, т. е. по прямой, перпендикулярной к касательной.

Ссылка на геометрическую аналогию, позволившая нам использовать результат решения задачи о нити при решении задачи об ускорении, лишний раз показывает, как отвлечение математических понятий и выводов от конкретных особенностей явления обогащает эти выводы возможностью их разнообразного применения.

Заметим еще, что кривизна, отражающая с механической точки зрения изменение направления движения, оказывается тесно связанной с силами, вызывающими это изменение. Выражение этой связи легко получить, помножив равенство (3) на массу m движущейся точки. Получим

Здесь Fn — величина нормальной составляющей силы, действующей на точку.

Соприкасающаяся плоскость. Хотя пространственная кривая и не лежит в одной плоскости, но с каждой ее точкой А, как правило, можно связать плоскость Р, от которой вблизи этой точки кривая отклоняется меньше, чем от любой другой плоскости. Такая плоскость называется соприкасающейся плоскостью кривой в точке.

Естественно, что соприкасающаяся плоскость, как плоскость, возможно более плотно прилегающая к кривой, проходит через точку А и касательную Т к данной кривой. Но через точку А и прямую Г, содержащую А, проходит много плоскостей. Чтобы выделить из них плоскость, от которой кривая отклоняется менее всего, попробуем проследить за отклонением кривой от касательной. Для этого посмотрим на кривую вдоль касательной Т, иначе говоря, спроектируем нашу кривую на так называемую нормальную плоскость Q, проведенную через

Рис. 13.

точку А перпендикулярно к Т (рис. 14). Проекция содержащего А участка нашей кривой образует на плоскости Q некоторую новую кривую (на рис. 14 эта кривая отмечена пунктиром). Обычно она имеет острие в точке А. Если полученная кривая в точке А имеет касательную N, то естественно, что плоскость Р, проходящая через Т и N, и будет наиболее плотно прилегать вблизи А к исходной кривой, т. е. будет соприкасающейся плоскостью в точке А. Можно доказать, что в случае, когда функции, задающие кривую, имеют вторые производные и кривизна кривой в точке А отлична от нуля, соприкасающаяся плоскость заведомо существует, и ее уравнение весьма просто выражается через первые и вторые производные от функций, задающих кривую.

Если свойства касательной позволяют рассматривать кривую на малом участке как прямую и совершать при этом ошибку, малую по сравнению с длиной участка, то свойства соприкасающейся плоскости дают возможность пространственную кривую рассматривать на малых участках как плоскую, заменяя ее проекцией на соприкасающуюся плоскость, причем здесь ошибки будут малы даже по сравнению с квадратом длины участка дуги.

Прямых, перпендикулярных к касательной, в пространстве много; они заполняют нормальную плоскость в данной точке кривой. Среди этих прямых выделяется одна лежащая в соприкасающейся плоскости прямая N. Эта прямая называется главной нормалью к кривой. Обычно на ней еще фиксируют направление — в сторону вогнутости проекции кривой на соприкасающуюся плоскость. Главная нормаль играет для пространственной кривой такую же роль, как обычная единственная нормаль для плоской кривой. (В частности, если некоторая опора заставляет гибкую нить, имеющую натяжение Т, сохранять форму пространственной кривой, то давление нити на опору в каждой точке равно Тк и направлено по главной нормали. Если по кривой в пространстве движется с постоянной по величине скоростью v материальная точка, то ее ускорение равно kv2 и направлено по главной нормали.)

Кручение. Вдоль кривой от точки к точке положение соприкасающейся плоскости может, конечно, изменяться. Как скорость поворота касательной характеризовалась кривизной, так скорость поворота соприкасающейся плоскости характеризуется новой величиной — кручением кривой. При этом, как и в случае кривизны, скорость берется по отношению к пройденной длине дуги, т. е. если ψ — угол между соприкасающимися плоскостями в фиксированной точке А и в близкой к ней

Рис. 14.

точке X, a Δs — длина дуги АХ, то кручение m в точке A определяется как предел1

Кручение имеет знак, зависящий от того, в какую сторону вращается соприкасающаяся плоскость при движении вдоль кривой.

Таким образом, можно представлять себе, что при движении точки по кривой с ней вместе движется лопасть соприкасающейся плоскости с нарисованными на ней касательной и главной нормалью, причем касательная в каждый момент поворачивается в сторону нормали со скоростью, определяемой кривизной, а плоскость поворачивается вокруг касательной со скоростью и направлением, определяемыми кручением.

Простейшими средствами теории дифференциальных уравнений можно доказать основную теорему, которая, грубо говоря, сводится к тому, что кривые с одинаковыми кривизной и кручением равны. Поясним это утверждение. Если от начала кривой сдвигаться по ней на различную длину дуги s, то в зависимости от величины s мы будем попадать в разные точки кривой, в каждой из которых будет свое значение кривизны к и кручения m. Тем самым к (s) и z(s) будут для каждой кривой некоторыми функциями пройденного от начала кривой пути s.

Высказанная теорема утверждает, что если у двух кривых кривизна и кручение как функции длины дуги одинаковы, то кривые равны (т. е. одну из них можно совместить с другой движением). Таким образом, кривизна и кручение как функции длины вдоль кривой уже определяют кривую с точностью до ее положения в пространстве, и можно сказать, что все свойства кривой так или иначе содержатся в зависимостях между ее длиной, кривизной и кручением. Таким образом эти три понятия составляют некоторую законченную основу для разработки разных вопросов, относящихся к кривым. С их помощью вырабатываются также простейшие понятия теории поверхностей, к которым мы сейчас перейдем.

Конечно, теория кривых этим не исчерпывается. В ней вводится много других понятий, связанных с кривой; изучаются специальные типы кривых, семейства кривых, положение кривых на поверхностях, вопросы о форме кривой как целого и т. п. Эти вопросы и методы их решения связаны почти со всеми разделами математики. Круг задач, решение которых может быть получено силами этой теории, чрезвычайно богат и разнообразен.

1 Можно показать, что винтовые линии имеют одинаковое кручение во всех своих точках, и ввести понятие кручения любой кривой из ее сравнения с винтовой линией, наилучшим образом приближающей кривую в окрестности данной точки. Кручение характеризует также отличие кривой от плоской. В некотором сочетании с кривизной оно характеризует скорость отхода кривой от ее соприкасающейся плоскости.

§ 3. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ПОВЕРХНОСТЕЙ

Способы задания поверхности. Естественно, что для изучения поверхностей средствами анализа нужно уметь задавать поверхность аналитически. Проще всего задавать поверхность уравнением

в котором x, y, z — декартовы координаты точки, лежащей на поверхности. При этом функция f(x, у) не обязательно должна быть определена при всех x, y — область ее задания может иметь различное строение. Так, на рис. 15 изображена поверхность, для которой f(x, у) задана внутри кольца. Примеры задания поверхностей уравнением z=f(x, у) уже известны нам из аналитической геометрии. Мы знаем, например, что уравнение z = Ax + By + С задает плоскость; уравнение z = x2+y2 — параболоид вращения (рис. 16). Для применения дифференциального исчисления нужно, чтобы функция f(x, у) имела первые, вторые (иногда и некоторые следующие) производные. Поверхность, представимая таким уравнением, называется регулярной. Геометрически это означает (хотя и не совсем точно), что поверхность непрерывно изогнута, не имеет изломов и иных особенностей. Изучение же поверхностей, не подчиненных этим условиям, например, имеющих острия, ребра и другие особенности, требует новых приемов исследования (см. § 5).

Однако не всякую поверхность, даже лишенную особенностей, можно представить в целом уравнением вида z=f(х, у). Если каждой паре значений х, у из области задания f(x, у) отвечает вполне определенное z, то это значит, что всякая прямая, параллельная оси Oz, должна иметь с поверхностью не более одной общей точки (рис. 17). Поэтому даже столь простые поверхности, как сферу или цилиндр, нельзя задать в целом уравнением вида z=f(x, у). В этих случаях поверхности задают

Рис. 15. Рис. 16.

иначе, например неявным уравнением вида F (х, у, z)=0. Так, сфера радиуса R с центром в начале координат имеет уравнение

уравнение x2 +у2 = r2 задает цилиндр радиуса r.

Там, где речь идет об изучении лишь малых кусков поверхности, а в классической дифференциальной геометрии в основном ограничиваются задачами такого рода, способ задания поверхности уравнением z=f(x, у) является вполне общим, так как всякий достаточно малый кусок гладкой поверхности представим в таком виде. Мы примем этот способ за основу, а о других способах задания поверхности расскажем по ходу дела в § 4 и 5.

Касательная плоскость. Аналогично тому, как гладкая кривая в каждой точке имеет касательную прямую, к которой она близка в окрестности этой точки, так и многие поверхности в каждой своей точке имеют так называемую касательную плоскость.

Точное определение ее следующее. Плоскость Р, проходящая через точку M на поверхности F, называется касательной к поверхности F в этой точке, если угол а между плоскостью Р и лучом MX, идущим из M в любую точку X поверхности, стремится к нулю, когда точка X приближается к точке M (рис. 18). Все касательные к кривым, проходящим на поверхности через точку М, лежат, очевидно, в касательной плоскости.

Поверхность F называют гладкой, если она имеет в каждой точке касательную плоскость, положение которой с переходом от точки к точке изменяется непрерывно.

Вблизи точки касания поверхность мало отклоняется от своей касательной плоскости: если точка X приближается по поверхности к точке M, то отклонение точки X от касательной плоскости становится все меньше в сравнении с ее расстоянием от точки M (читатель легко проследит это, мысленно приближая на рис. 18 точку X к М). Таким образом, поверхность вблизи точки M как бы сливается с касательной плоскостью. Поэтому

Рис. 17.

в первом приближении малый кусок или, как говорят, «элемент» поверхности можно заменить куском касательной плоскости. Перпендикуляр к касательной плоскости, проведенный в точке касания, играет роль перпендикуляра к поверхности в этой точке и называется нормалью.

Эта возможность замены элемента поверхности куском касательной плоскости проявляется во многих случаях. Например, отражение света от кривой поверхности происходит так же, как отражение от плоскости, т. е. направление отраженного луча определяется обычным законом отражения: луч падающий и луч отраженный лежат в одной плоскости с нормалью к поверхности и образуют с ней равные углы (рис. 19), как если бы отражение происходило от касательной плоскости. Аналогично при преломлении света в кривой поверхности каждый луч преломляется на элементе поверхности по обычному закону преломления, как если бы элемент этот был плоским. На этих замечаниях основаны все расчеты отражения и преломления света в оптических приборах. Далее, например, твердые тела, соприкасаясь, имеют в точке прикосновения общую касательную плоскость. Тела соприкасаются элементами их поверхностей, и давление одного тела на другое при отсутствии трения направлено по нормали в точке прикосновения. Это верно также тогда, когда тела касаются не в одной точке, в этом случае в каждой из точек соприкосновения давление направлено по соответствующей нормали.

Рис. 18.

Рис. 19.

На замене элементов поверхности кусками плоскости может быть основано также определение площади разных поверхностей. Поверхность разбивают на малые куски F1, F2,..., Fn и каждый кусок проектируют на плоскость, касающуюся поверхности в какой-нибудь точке этого участка (рис. 20). Получаются некоторые плоские области P1P2,..., Pn. Сумма их площадей дает приближенное значение площади поверхности. Сама же площадь поверхности определяется как предел сумм площадей кусков P1, Р2, ..., Pn при условии, что разбиение поверхности берется все более мелким1. Отсюда можно вывести точное выражение площади в виде двойного интеграла.

Уже из этих замечаний ясно значение понятия касательной плоскости. Однако во многих вопросах приближенное представление элемента поверхности плоскостью недостаточно и необходимо учитывать искривленность поверхности.

Кривизна линий на поверхности. Искривленность поверхности в данной точке характеризуется тем, насколько быстро поверхность отходит от своей касательной плоскости. Но в разных направлениях поверхность может отклоняться от касательной плоскости с различной скоростью (так, поверхность, изображенная на рис. 21, в направлении OA отклоняется от плоскости Р заметно быстрее, чем в направлении OB). Поэтому естественно определять искривленность поверхности кривизнами линий, проходящих на ней в разных направлениях.

Это делается так. Проведем через точку M касательную плоскость Р и выберем определенное направление нормали к ней (рис. 22). Будем рассматривать кривые, которые являются сечениями поверхности плоскостями, проходящими через нормаль в точке М; эти кривые называются нормальными сечениями. Кривизне нормального сечения приписывается

Рис. 20.

1 Именно так выводится выражение для площади, которое используется в § 1 главы VIII.

знак. Кривизна сечения берется с плюсом, если его вогнутость направлена в сторону нормали, и с минусом, если она направлена в противоположную сторону. Так, у поверхности, имеющей седлообразную форму и изображенной на рис. 23, при указанном стрелкой направлении нормали к поверхности кривизна сечения MA считается положительной, a MB — отрицательной.

Нормальное сечение задается углом φ, который его плоскость образует с некоторым начальным лучом в касательной плоскости (рис. 22). Зная кривизну нормального сечения к (φ) в зависимости от угла φ, мы будем иметь довольно полное представление о строении поверхности в районе точки М.

Поверхность может быть искривлена самым различным образом и поэтому, казалось бы, зависимость кривизны к от угла φ может быть любой. На самом деле это не так. Для изучаемых в дифференциальной геометрии регулярных поверхностей существует простая закономерность, открытая Эйлером, которая устанавливает связь между кривизнами нормальных сечений, проходящих через данную точку в разных направлениях.

Оказывается, что в каждой точке поверхности существуют два таких направления, которые :

1) взаимно перпендикулярны;

2) кривизны k1, k2 нормальных сечений в этих направлениях представляют собой наибольшее и наименьшее значения из кривизн всех нормальных сечений1;

3) кривизна k (φ) нормального сечения, образующего с нормальным сечением кривизны k1 угол φ, выражается формулой

(4)

Такие направления называются главными направлениями, а кривизны k1, k2 — главными кривизнами поверхности в данной точке.

Рис. 21. Рис. 22.

1 В частном случае, когда k1 = k2, кривизны всех сечений одинаковы (как, например, у шара).

Эта теорема Эйлера показывает, что, несмотря на всё разнообразие поверхностей, их строение вблизи каждой точки, рассматриваемое с точностью до величин второго порядка малости по сравнению со сдвигом из данной точки, может быть всего лишь нескольких вполне определенных типов. В самом деле, если величины k1 и k2 имеют одинаковые знаки, то знак k (φ) постоянен, и поверхность вблизи исследуемой точки имеет вид, изображенный на рис. 22. Если k1 и k2 разных знаков, например k1>0, k2<0, то кривизна нормального сечения, очевидно, меняет знак. Это видно из того, что при φ=0 кривизна k=k1>0, а при φ=π/2 имеем к=k2<0.

Из формулы (4) для к (φ) нетрудно убедиться, что при изменении φ от 0 до π знак к (φ) меняется дважды1, и, следовательно, вблизи рассматриваемой точки поверхность имеет седлообразную форму (рис. 23).

Когда одно из чисел k1, k2 обращается в нуль, то кривизна все время сохраняет знак, но при одном значении φ обращается в нуль. Так будет, например, во всякой точке на цилиндре (рис. 24). В общем случае поверхность имеет вблизи такой точки форму, близкую к цилиндрической.

Наконец, при k1 = k2 = 0 все нормальные сечения имеют нулевую кривизну. Вблизи такой точки поверхность особенно «тесно» прилегает к касательной плоскости. Такие точки называются поэтому точками уплощения. Один из примеров такой точки дан на рис. 25 (точка М). Свойства поверхности вблизи точки уплощения могут быть весьма сложными.

Теперь рассмотрим сечение поверхности произвольной плоскостью Q (рис. 26), не проходящей через нормаль. Кривизна kL такой кривой L,

Рис. 23. Рис. 24.

1 Простой подсчет показывает, что

обращается в нуль при меняя знак в первый раз с плюса на минус, а во второй раз — с минуса на плюс.

как показал Менье1, связана простым соотношением с кривизной кн нормального сечения, идущего в том же направлении, т. е. пересекающего касательную плоскость по той же прямой, что и плоскость Q. Эта связь выражается формулой

где θ — угол между нормалью и плоскостью Q. (Особенно наглядно справедливость этой формулы можно проследить на примере шара.)

Наконец, кривизна любой кривой, идущей на поверхности и имеющей в качестве соприкасающейся плоскости плоскость Q, как это можно показать, совпадает с кривизной линии пересечения поверхности с плоскостью Q.

Итак, при известных k1 и k2 кривизна любой кривой на поверхности определяется направлением ее касательной и углом между ее соприкасающейся плоскостью и нормалью к поверхности. Таким образом, характер искривления поверхности в данной точке определяется двумя числами k1 и k2. По абсолютной величине они равны кривизнам двух взаимно перпендикулярных нормальных сечений, а их знак указывает направление вогнутости соответствующего нормального сечения по отношению к выбранному направлению нормали к поверхности. Докажем приведенные выше теоремы Эйлера и Менье.

1. При доказательстве теоремы Эйлера воспользуемся следующей леммой. Если функция f(x, у) имеет в данной точке непрерывные вторые производные, то оси координат можно повернуть на такой угол а, что в новых координатах смешанная производная fx'y' будет в этой точке равна нулю2. Напомним, что при повороте

Рис. 25. Рис. 26.

1 Менье (1754—1793) — французский математик, ученик Монжа, был генералом революционной армии и умер от ранения в бою.

2 Мы будем пользоваться сокращенным обозначением частных производных.

например, вместо будем писать fx, вместо будем писать fyy и т. п.

осей новые переменные х', у' связаны с х, у формулами

[см. главу III (том 1), § 7]. Для доказательства леммы заметим, что

Вычисляя теперь производную fx'y' по правилам дифференцирования сложных функций, после подсчета получим

откуда легко следует, что при

действительно будет

Рассмотрим теперь поверхность F, заданную уравнением z = f(x, у), причем начало координат поместим в исследуемой точке M, а оси Ох, Oy будем считать выбранными в касательной плоскости Р и повернутыми так, что fxy(0, 0) = 0. Возьмем в плоскости Р произвольную прямую, образующую с осью Ох угол φ, и рассмотрим нормальное сечение L, идущее в направлении этой прямой (рис. 27). Согласно формуле, выведенной в § 2, взятая со знаком кривизна L в точке M равна

Рис. 27.

Здесь f (х, у) — взятое со знаком расстояние точки на L до выбранной прямой. Разлагая f (х, у) по формуле Тейлора (глава II, § 9) и замечая, что fx (0, 0) = fy (0, 0) = 0 (так как оси Ох, Oy лежат в касательной плоскости), получим

где е→0 при x→0, у→0. Для точек на L имеем

поэтому получаем

Полагая φ = 0, φ =π/2, убеждаемся, что fxx, fyy — кривизны k1, k2 нормальных сечений в направлении осей Ох и Oy. Поэтому полученная формула и есть формула Эйлера: к = k1 cos2 φ + k2 sin2 φ. (То обстоятельство, что k1 и k2 играют роль максимальной и минимальной кривизны, уже следует из этой формулы.)

2. Для доказательства теоремы Менье рассмотрим нормальное сечение LH. и сечение L, плоскость которого повернута относительно плоскости сечения LH. на угол 6, как указано на рис. 28. Оси Ох, Oy расположим в касательной плоскости и притом так, чтобы ось Ох в начале координат касалась кривых LH. и L. Расстояние h (х, у) точки X на L с координатами х, у, f (х, у) до оси Ох, очевидно, равно h(x, у) = (рис. 28). Пользуясь формулой Тейлора, преобразуем выражение кривизны кь линии L следующим образом:

(5)

причем ε→0 когда х, y→0. Так как ось Ох касается кривой L, то, очевидно.

Поэтому, переходя в формуле (5) к пределу, получаем

Но при нашем выборе координатной системы линия LH. имеет уравнение

Поэтому

Теорема Менье доказана.

Рис. 28.

Средняя кривизна. Во многих вопросах теории поверхностей важную роль играют не сами главные кривизны, а зависящие от них величины: так называемая средняя кривизна и гауссова или полная кривизна поверхности в данной точке. Остановимся на них подробнее.

Средней кривизной поверхности в данной точке называется полусумма главных кривизн

Чтобы привести пример использования этого понятия, рассмотрим следующую механическую задачу. Представим себе, что вдоль поверхности некоторого тела F плотно натянута упругая, допустим резиновая, пленка. Спрашивается, как давит в каждой точке пленка на поверхность тела F.

Давление в точке M измеряется силой, действующей со стороны пленки на единицу площади малого участка поверхности, содержащего точку М; точнее, давление «в точке» M измеряется пределом отношения указанной силы к площади участка, когда последний стягивается к точке М. Окружим на поверхности точку M небольшим криволинейным прямоугольником, стороны которого имеют длины Δs1 и Δs2 и идут соответственно перпендикулярно первому и второму главному направлению в точке M (рис. 29)1. На каждую сторону прямоугольника действует сила, пропорциональная (ввиду предположенной равномерности натяжения пленки) длине стороны и величине Т натяжения пленки. Поэтому на стороны, перпендикулярные первому главному направлению, действуют силы, приближенно равные ТΔs1 и направленные по касательной к поверхности. Аналогичные силы, равные TΔs2, приложены к другой паре сторон прямоугольника. Чтобы найти давление в точке М, нужно равнодействующую этих четырех сил разделить на площадь прямоугольника, приближенно равную Δs1Δs2, и перейти к пределу при Δs1, Δs2→0. Сложим отдельно первые две силы и поделим их равнодействующую на Δs1Δs2.

Если посмотреть на прямоугольник сбоку (рис. 30), то можно увидеть, что эти силы направлены по касательным к линии первого нормального сечения и расстояние между точками их приложения как раз равно Δs2. Поэтому вычисление интересующего нас предела — это та самая задача, которая была решена в § 2 в связи с вопросом о давлении нити на опору. Используя прежний результат, получим, что интересующий нас

Рис. 29.

1 Наше рассуждение не будет строгим. Однако, проводя оценки допускаемых здесь погрешностей, можно более строго обосновать тот же результат.

предел равен k1Т, где k1 — кривизна первого нормального сечения. Учитывая аналогично другие две силы, приходим к формуле:

Полученный результат имеет многочисленные и важные следствия. Рассмотрим пример.

Известно, что поверхностная пленка жидкости имеет некоторое, одинаковое во всех направлениях поверхностное натяжение. При изогнутой форме границы жидкого тела это натяжение, согласно сказанному выше, вызывает давление поверхностной пленки на жидкость, пропорциональное средней кривизне граничной поверхности в данной точке.

По этой причине в каплях весьма малого размера должны развиваться колоссальные давления, что препятствует образованию весьма малых капель. При охлаждении пара капли, как правило, образуются сначала вокруг пылинок и заряженных частиц. В совершенно чистом несколько переохлажденном паре каплеобразование задерживается. Если же, например, через этот пар пролетает с большой скоростью частица, возбуждающая ионизацию молекул, то вокруг образовавшихся на её пути ионов мгновенно образуются капельки пара, составляющие видимый след частицы. (На этом основано устройство широко используемой в ядерной физике камеры Вильсона, позволяющей наблюдать движения отдельных заряженных частиц.)

Поскольку жидкость передает давление во все стороны равномерно, капля жидкости при отсутствии других источников давления должна принимать форму, при которой во всех точках ее поверхности средняя кривизна одинакова. В так называемом опыте Плато берутся две жидкости одинакового удельного веса, благодаря чему сгусток одной жидкости плавает внутри другой, находясь в равновесии. Можно считать, что плавающая жидкость находится только под давлением, вызванным поверхностным натяжением ее границы1. При этом оказывается, что «плавающая» жидкость всегда принимает форму шара. Результат опыта наводит на мысль,что всякая замкнутая поверхность с постоянной средней кривизной есть шар. Эта теорема действительно верна, но строгое математическое доказательство ее очень трудно.

Рис. 30.

1 Нарастанием давления с глубиной можно пренебречь, так как оно одинаково для обеих жидкостей (ввиду одинаковости их удельного веса). Поэтому на границе их раздела внешнее и внутреннее дополнительные давления от глубины уравновешивают друг друга.

Можно подойти к вопросу еще с другой стороны. Ввиду того, что поверхностная пленка жидкости стремится сократиться, а объем жидкости измениться не может, естественно ожидать, что плавающая масса жидкости должна обладать наименьшей поверхностью при данном объеме. Доказано, что тело, обладающее указанным свойством, тоже есть шар.

Полученная зависимость между боковым давлением пленки и ее средней кривизной находит также применение в задаче о форме мыльной пленки, натянутой на некоторый контур. Поскольку в этом случае боковое давление пленки, направленное по нормали к ее поверхности, не уравновешивается никакой реакцией опоры (опоры в этом случае просто нет), то оно должно быть равно нулю, и мы получаем для искомой поверхности условие

Kср=0. (6)

Используя аналитическое выражение средней кривизны, из этого условия получают дифференциальное уравнение, и задача сводится к решению этого уравнения с учетом того, что искомая поверхность проходит через заданный контур1. Этой трудной задаче посвящено много исследований.

К тому же уравнению (6) приводит задача о нахождении поверхности наименьшей площади, натянутой на заданный контур. С физической точки зрения это совпадение естественно, так как пленка стремится сократиться и приходит в устойчивое равновесие, когда достигает минимальной площади, возможной в данных условиях. Поверхности нулевой средней кривизны называют в связи с этой последней задачей минимальными.

Математическое исследование минимальных поверхностей представляет большой интерес, отчасти в связи с качественным их разнообразием, обнаруженным в опытах с мыльными пленками. На рис. 31 приведены изображения мыльных пленок, натянутых на различные контуры.

Гауссова кривизна. Гауссовой кривизной поверхности в данной точке называется произведение главных кривизн

Знак гауссовой кривизны определяет характер строения поверхности вблизи рассматриваемой точки. При K>0 поверхность имеет форму чаши (k1 и k2 — одинаковых знаков) при K<0, когда k1 и k2 разных знаков — форму седла. Остальные случаи строения поверхности, о которых говорилось раньше, соответствуют нулевой гауссовой кривизне. Абсолютная величина гауссовой кривизны дает представление о степени общей искривленности поверхности в некотором отвлечении от распределения кривизны по разным направлениям. Это станет особенно ясным, если

1 Для поверхности, задаваемой уравнением z = z(x, у), уравнение (6) приводится к виду

обратиться к другому определению гауссовой кривизны, не опирающемуся на исследование линий на поверхности.

Рассмотрим небольшой участок G поверхности F, содержащий внутри точку М, и в каждой точке этого участка проведем нормаль к поверхности.

Если откладывать эти нормали из одной точки, то они заполнят некоторый телесный угол (рис. 32). Величина этого телесного угла будет тем больше, чем обширнее участок G и чем сильнее искривлена поверхность на этом участке. Поэтому степень искривленности участка поверхности можно характеризовать отношением величины заполненного нормалями телесного угла к площади самого участка G; искривленность поверхности в данной точке естественно измерять пределом этого отношения при условии, что G стягивается в точку M1. Оказывается, что этот предел равен абсолютной величине гауссовой кривизны в точке М.

Самое замечательное свойство гауссовой кривизны, определяющее ее роль в теории поверхностей, заключается в следующем. Представим себе, что рассматриваемая поверхность сделана из гибкого, но практически нерастяжимого материала, скажем, выштампована из тонкой жести. Ее кусок можно затем гнуть, изменяя его форму, но не растягивая и не разрывая материала, из которого он сделан. При этом главные кривизны

Рис. 31.

1 Для измерения самого телесного угла нужно построить сферу единичного радиуса с центром в его вершине. Площадь области, по которой сфера пересекает телесный угол, и принимается за величину телесного угла (рис. 32).

будут меняться, но, как доказал Гаусс, их произведение k1k2 в каждой точке остается неизменным. Этот важнейший в теории поверхностей результат показывает, что поверхности с разной гауссовой кривизной обладают глубоким различием, состоящим в том, что, даже допуская всевозможные изгибания — деформации без растяжения и сжатия, нельзя две такие поверхности наложить друг на друга. Так, например, кусок поверхности шара никаким изгибанием нельзя «распрямить» на плоскость или наложить на поверхность шара другого радиуса.

Мы рассмотрели некоторые основные понятия теории поверхностей. Что касается методов, которыми оперирует эта теория, то, как говорилось вначале, они состоят прежде всего в применении анализа, особенно теории дифференциальных уравнений. С простейшими примерами использования анализа мы уже имели дело при доказательстве теорем Эйлера и Менье. Отметим, что для решения более сложных вопросов употребляется еще специальный способ сведения задач теории поверхностей к задачам анализа. Этот способ основан на введении так называемых криволинейных координат и был впервые широко развит в работах Гаусса, связанных с задачами, которым посвящен следующий параграф.

§ 4. ВНУТРЕННЯЯ ГЕОМЕТРИЯ И ИЗГИБАНИЕ ПОВЕРХНОСТЕЙ

Внутренняя геометрия. Как уже было упомянуто, изгибанием поверхности называется такая ее деформация, при которой сохраняются длины всех лежащих на поверхности кривых. Например, свертывание в трубочку листа бумаги с геометрической точки зрения есть не что иное, как изгибание куска плоскости. В самом деле, бумага при этом практически не растягивается и длины всех кривых, начерченных на листе, при его свертывании не меняются. Сохраняются и некоторые другие геометрические величины, связанные с поверхностью, например площади фигур на ней. Все свойства поверхности, не меняющиеся при изгибании, составляют предмет так называемой внутренней геометрии поверхности.

Рис. 32.

Что же это за свойства? Ясно, что при любом изгибании могут сохраняться лишь те свойства, которые в конечном счете зависят только от длин кривых, т. е. могут быть установлены путем измерений, производимых на самой поверхности. Изгибание — это любая деформация, сохраняющая длины кривых, и всякое свойство, которое нельзя изменить никаким изгибанием, так или иначе определяется через длины. Говорят, что внутренняя геометрия — это просто геометрия на поверхности. Самый смысл слов «внутренняя геометрия» в том и состоит, что изучаются лишь внутренние свойства самой поверхности, не зависящие от того, каким образом она изогнута в пространстве1. Так, например, если мы соединим на листе бумаги две точки прямолинейным отрезком, а потом изогнем этот лист (рис. 33), то отрезок превратится в кривую линию, однако его свойство быть кратчайшей из линий, соединяющих на поверхности данные точки, сохранится; оно, следовательно, принадлежит внутренней геометрии. Напротив, кривизна этой линии будет зависеть от того, в какой мере изогнута бумага, и, следовательно, уже не относится к внутренней геометрии.

Вообще, поскольку планиметрия в своих выводах не обращается к свойствам пространства, объемлющего плоскость, все ее теоремы относятся к внутренней геометрии любой поверхности, полученной изгибанием плоскости. Можно сказать, что планиметрия есть внутренняя геометрия плоскости.

Другой всем знакомый пример внутренней геометрии — это геометрия на поверхности сферы, с которой мы по существу имеем дело при измерениях на земной поверхности. Этот пример особенно хорошо выясняет сущность понятия внутренней геометрии. Дело в том, что ввиду большого

Рис. 33

1 Заметим, что идеи внутренней геометрии привели к широким обобщениям математического понятия о пространстве и тем сыграли весьма важную роль в современной физике, о чем более подробно сказано в главе XVII (том 3).

радиуса Земли непосредственно обозримые участки ее поверхности воспринимаются как плоские, и потому отклонения от планиметрии, наблюдаемые при измерении больших расстояний, предстают перед нами не как результат искривленности земной поверхности в пространстве, а как своеобразные законы «земной геометрии», выражающие геометрические свойства самой поверхности Земли.

Следует отметить, что сама идея изучения внутренней геометрии возникла у Гаусса именно в связи с задачами геодезии и картографии. Обе эти прикладные науки по существу связаны с внутренней геометрией земной поверхности. Картография имеет дело, в частности, с искажениями отношений размеров при изображении участков земной поверхности на плоскости и, следовательно, с отличием внутренней геометрии поверхности Земли от планиметрии. Аналогично можно представлять себе внутреннюю геометрию любой поверхности: вообразим, что на данной поверхности живут существа настолько маленькие, что в пределах их кругозора поверхность кажется плоской, (мы знаем, что достаточно малый кусок всякой гладкой поверхности мало отличается от касательной плоскости) ; тогда эти существа не будут замечать, что поверхность искривлена в пространстве, зато при измерении больших расстояний они убедятся, что в их геометрии господствуют другие законы, соответствующие внутренней геометрии той поверхности, на которой они живут. В том, что эти законы действительно различны для разных поверхностей, можно убедиться, например, следующим простым рассуждением. Возьмем на поверхности некоторую точку О и рассмотрим кривую L такую, что расстояние любой ее точки до О, измеренное на поверхности (т. е. длина кратчайшей линии, соединяющей эту точку с О), равно постоянному числу r (рис. 34). Кривая L с точки зрения внутренней геометрии есть не что иное, как окружность радиуса r. Формула, выражающая ее длину s (r) в зависимости от r, относится к внутренней геометрии данной поверхности. Между тем, эта зависимость может быть самой разнообразной: так, на плоскости s(r)=2πr; на сфере радиуса R, как нетрудно подсчитать, s (r)=2πRsinr/R; на поверхности, изображенной на рис. 35, начиная с некоторых значений r, длина окружности с выбранным центром О становится вовсе не зависящей от r,

Рис. 34.

а затем начинает убывать. Следовательно, все рассмотренные поверхности обладают различной внутренней геометрией.

Основные понятия внутренней геометрии. Чтобы выяснить, каков круг понятий и теорем внутренней геометрии, обратимся к планиметрии, которая, как уже говорилось, является внутренней геометрией плоскости. Ее предметом служат фигуры на плоскости и их свойства, выражающиеся обычно в виде соотношений между основными геометрическими величинами, такими, как длина, угол, площадь. Кстати, для строгого обоснования того, что угол и площадь относятся к внутренней геометрии плоскости, нужно показать, что они могут быть выражены через длины. Это действительно так: ведь угол можно вычислить, если известны длины сторон какого-либо треугольника, которому он принадлежит; площадь треугольника тоже вычисляется по его сторонам, а для вычисления площади любого многоугольника его достаточно разбить на треугольники.

Рассматривая планиметрию как внутреннюю геометрию плоскости, нет надобности ограничивать ее школьными рамками. Напротив, ее можно развивать сколь угодно далеко, ставя новые задачи, лишь бы вводимые понятия основывались в конечном счете на измерении длин. Так, в планиметрию последовательно вводятся понятие о длине кривой, понятие площади криволинейных фигур и пр. ; все они относятся к внутренней геометрии плоскости.

Те же понятия вводятся во внутренней геометрии произвольной поверхности. Длина кривой является при этом исходным понятием; с углом и площадью дело обстоит несколько сложнее. Если внутренняя геометрия данной поверхности отличается от планиметрии, то мы не можем определять угол и площадь через длины по обычным формулам. Однако, как уже упоминалось, поверхность вблизи данной точки мало отличается от своей касательной плоскости. Говоря точнее, верно следующее: если малый участок поверхности, содержащий данную точку М, спроектировать на касательную плоскость в этой точке, то расстояние между точками, измеренное на поверхности, отличается от расстояния между их проекциями на бесконечно малую величину выше 2-го порядка по сравнению с их расстояниями от точки М. Поэтому при определении геометрических величин, относя-

Рис. 35.

щихся к данной точке поверхности и получаемых предельным переходом, в котором играют роль бесконечно малые не выше 2-го порядка, можно заменять участок поверхности его проекцией на касательную плоскость. При этом величины, полученные измерением на касательной плоскости, окажутся для поверхности внутренне-геометрическими. Эта возможность рассматривать малый участок поверхности как плоский лежит в основе определения всех понятий внутренней геометрии.

Для примера рассмотрим определения угла и площади. Следуя общему принципу, угол между кривыми на поверхности определяем как угол между их проекциями на касательную плоскость (рис. 36). Очевидно, угол, определенный таким образом, совпадает с углом между касательными к кривым. Определение площади, данное в § 3, основано на том же принципе. Наконец, чтобы охарактеризовать искривленность кривой «внутри» самой поверхности, вводится понятие геодезической кривизны; название «геодезическая кривизна» напоминает об измерениях на земной поверхности. Геодезическая кривизна кривой в данной точке определяется как кривизна ее проекции на касательную плоскость (рис. 37).

Таким образом, мы убедились, что основные понятия планиметрии вводятся и во внутренней геометрии произвольной поверхности.

Легко также определить на любой поверхности фигуры, аналогичные основным фигурам на плоскости. Например, мы уже имели дело с окружностью, которая определялась дословно так же, как на плоскости. Можно определить аналог отрезка — «кратчайшую», как самую короткую из кривых, соединяющих на поверхности две данные точки, Далее, естественно определяется треугольник (как фигура,

Рис. 36.

Рис. 37.

ограниченная тремя кратчайшими), многоугольник и т. п. Однако свойства всех этих фигур и величин зависят от поверхности, и в этом смысле существует бесконечно много различных внутренних геометрий. Но внутренняя геометрия как специальный раздел теории поверхностей обращает главное внимание на общие закономерности, имеющие место во внутренней геометрии любой поверхности, и при этом выясняет, как эти закономерности выражаются через величины, характеризующие данную поверхность.

Как уже отмечалось, одна из важнейших характеристик поверхности — ее гауссова кривизна — не меняется при изгибании, т. е. зависит лишь от внутренней геометрии поверхности. Оказывается, что гауссова кривизна уже в значительной мере характеризует степень отклонения внутренней геометрии поверхности вблизи данной точки от планиметрии. Для примера рассмотрим на поверхности окружность L очень маленького радиуса r с центром в данной точке О. Длина такой окружности s (r) на плоскости выразилась бы формулой s(r)=2πr. На поверхности, отличной от плоскости, зависимость длины окружности от радиуса будет другой; при этом отклонение s (r) от 2πr, как можно доказать, зависит при малых r в основном от rауссовой кривизны К в центре окружности, а именно :

где ε→0 при r→0. Иными словами, при малых r длину окружности можно вычислять по обычной формуле, допуская ошибку 3-го порядка малости, причем сама эта ошибка (с точностью до малых уже выше 3-го порядка) пропорциональна гауссовой кривизне. В частности, если K>0, то длина окружности малого радиуса меньше длины окружности того же радиуса на плоскости, если К<0, то, наоборот, — больше. Впрочем, последнее нетрудно видеть и на rлаз: вблизи точки с положительной кривизной поверхность имеет форму «чаши» и окружность на ней сокращается; вблизи же точки с отрицательной кривизной окружность, располагаясь вокруг «седла», делает волну и тем самым несколько растягивается (рис. 38).

Из приведенной теоремы следует, что поверхность с переменной гауссовой кривизной геометрически неоднородна; ее внутренне-геометри-

Рис. 38.

ческие свойства меняются от точки к точке. Если характер задач внутренней геометрии сближает ее с планиметрией, то указанная неоднородность составляет ее глубокое принципиальное отличие от планиметрии. Так например, на плоскости сумма углов всякого треугольника равна двум прямым; на произвольной же поверхности вопрос о сумме углов треугольника, образованного кратчайшими, является неопределенным, даже если известна поверхность, на которой расположен треугольник и указаны его «размеры», например длины сторон. Однако, если известна гауссова кривизна К в каждой точке этого треугольника, то сумма его углов α, ß, γ вычисляется по формуле

где интегрирование происходит по площади треугольника. Эта формула содержит, как частный случай, известные теоремы о сумме углов треугольника на плоскости и на единичной сфере. В первом случае К = 0 и α+ß+γ = π, a во втором K = 1 и α+ß+γ=π + S, где S — площадь сферического треугольника.

Можно доказать, что всякий достаточно малый кусок поверхности с нулевой гауссовой кривизной можно изогнуть или, как еще принято говорить, развернуть на плоскость, так как он имеет такую же внутреннюю геометрию как и плоскость. Такие поверхности называются развертывающимися. Если же гауссова кривизна близка к нулю, то хотя поверхность и нельзя развернуть на плоскость, но все же ее внутренняя геометрия мало отличается от планиметрии. Это лишний раз показывает, что гауссова кривизна служит мерой отклонения внутренней геометрии поверхности от планиметрии.

Геодезические линии. Во внутренней геометрии поверхности роль прямых играют так называемые геодезические линии или, как принято говорить, просто «геодезические».

Прямую на плоскости можно определить как линию, составленную из отрезков, частично налегающих друг на друга. Точно так же определяется геодезическая, только роль отрезков играют кратчайшие. Иначе говоря, геодезическая — это такая кривая на поверхности, у которой всякая достаточно малая дуга является кратчайшей. В том, что не всякая геодезическая в целом является кратчайшей, можно убедиться на примере поверхности шара, где всякая дуга большого круга является геодезической, но кратчайшими будут лишь ее участки, не превосходящие полуокружности. Геодезическая может быть, как видим, даже замкнутой кривой.

Чтобы выяснить некоторые важные свойства геодезических, рассмотрим следующую механическую модель1. Пусть на поверхности F

1 Заранее отметим, что наши ближайшие рассуждения не претендуют на строгое доказательство свойств геодезических линий. Они имеют целью только пояснить важнейшие из этих свойств.

помещена растянутая резиновая нить с закрепленными концами (рис. 39)1. Когда нить имеет наименьшую длину, она будет в равновесии, так как всякое изменение ее положения связано с растяжением и потому может произойти лишь под воздействием внешних сил. Значит, нить, расположенная по кратчайшей, будет в равновесии. Для равновесия необходимо, чтобы упругие силы на каждом участке нити уравновешивались сопротивлением поверхности, которое направлено по нормали к ней. (Мы считаем, что поверхность гладкая и трение между нитью и поверхностью отсутствует.) Но в § 2 было установлено, что давление, производимое натянутой нитью на опору, направлено по главной нормали к кривой, вдоль которой идет нить. Поэтому мы приходим к такому результату: главная нормаль геодезической в каждой точке направлена по нормали к поверхности. Верна и обратная теорема: всякая кривая на регулярной поверхности, обладающая указанным свойством, является геодезической.

Указанное свойство геодезической позволяет обнаружить следующий замечательный факт: если материальная точка движется по поверхности так, что на нее не действуют никакие силы, кроме реакции поверхности, то ее траектория есть геодезическая. Действительно, как мы знаем из § 2, нормальное ускорение точки направлено по главной нормали к траектории, а поскольку единственная сила, действующая на точку, есть реакция поверхности, главная нормаль к траектории совпадает с нормалью к поверхности, и в силу последней теоремы траектория является геодезической. Последнее свойство геодезических еще больше углубляет их сходство с прямыми линиями. Подобно тому как движение свободной точки по инерции происходит по прямой, движение точки, вынужденной оставаться на поверхности, при отсутствии внешних сил происходит по геодезической2.

Из того же свойства геодезических вытекает следующая теорема: если две поверхности касаются друг друга вдоль кривой, которая на одной из них является геодезической, то на второй поверхности эта кривая также будет геодезической. В самом деле, так как в каждой точке этой кривой поверхности имеют общую касательную плоскость, они в этих точках имеют общую нормаль, а так как на одной из поверхностей кривая является геодезической, эта нормаль совпадает с главной нормалью к кривой. Следовательно, на второй поверхности кривая тоже будет геодезической.

Рис. 39.

1 Растянутая нить будет прилегать лишь к выпуклой поверхности, поэтому, чтобы не делать исключений, правильнее представлять себе поверхность как бы двухслойной, а нить — помещенной между двумя ее слоями.

2 Здесь мы под «внешними» силами понимаем все силы, кроме реакции поверхности.

Из этого результата вытекают еще два наглядных свойства геодезических линий. Во-первых, если упругая прямоугольная пластинка (например, стальная линейка) плотно прилегает к поверхности вдоль своей средней линии, то она касается этой поверхности вдоль геодезической. (Действительно, линия соприкосновения остается геодезической на линейке, а потому оказывается геодезической и на поверхности.) Во-вторых, если некоторая поверхность катится по плоскости так, что она касается при этом плоскости по некоторой прямой, то след этой прямой на поверхности есть геодезическая1. Оба эти свойства легко продемонстрировать на примере цилиндра и убедиться на опыте, что срединная линия плоской прямой полосы, наложенной на цилиндр (рис. 40), располагается либо по образующей, либо по окружности, либо по винтовой линии (нетрудно доказать, что геодезические линии на цилиндре могут быть лишь одного из этих типов). Те же линии отпечатываются на цилиндре, если катить его по плоскости, на которой мелом начерчена прямая.

Аналогия геодезических с прямыми на плоскости может быть дополнена еще одним важным свойством, которое часто берут за определение геодезических. Именно, прямые на плоскости можно определить как кривые нулевой кривизны, а геодезические на поверхности — как кривые, имеющие нулевую геодезическую кривизну. (Напомним, что геодезическая кривизна есть кривизна проекции кривой на касательную плоскость поверхности в исследуемой точке кривой; см. рис. 37.) Естественность совпадения этого определения геодезических с исходным можно пояснить следующими соображениями. Если в каждой точке некоторой линии кривизна проекции на касательную плоскость равна нулю, то кривая отходит от своей касательной в основном в направлении нормали

Рис. 40.

1 Это утверждение по существу равносильно предыдущему, потому что качение поверхности по плоскости в известном смысле эквивалентно наворачиванию плоской ленты на поверхность.

к поверхности, поэтому и главная нормаль кривой направлена всякий раз по нормали к поверхности, и кривая оказывается геодезической в первоначально указанном смысле. Наоборот, если кривая является геодезической, то ее главная нормаль, а потому и основная часть отклонения от касательной прямой направлены в сторону нормали к поверхности, поэтому при проектировании на касательную плоскость получается кривая, у которой отклонение от касательной существенно меньше, чем у исходной кривой, и кривизна полученной проекции оказывается равной нулю.

Ход геодезических на различных поверхностях может быть весьма разнообразным. Для примера на рис. 41 изображено несколько геодезических на гиперболоиде вращения.

Изгибание поверхностей. С внутренней геометрией, изучающей свойства поверхностей, не меняющиеся при изгибаниях, тесно связано исследование самих изгибаний. Теория изгибания поверхностей принадлежит к числу наиболее содержательных и трудных разделов геометрии и включает многочисленные проблемы, некоторые из которых, несмотря на простоту и естественность постановки, до сих пор не получили окончательного решения.

Вопросами изгибания поверхностей занимались еще Эйлер и Миндинг, но общие результаты, касающиеся изгибания любых поверхностей, были получены позже.

В общей теории изгибаний прежде всего встает вопрос о том, всегда ли можно изгибать поверхность, и если можно, то с какой степенью произвола. Для так называемых аналитических поверхностей, т. е. поверхностей, которые можно задать функциями координат, разлагающимися в ряд Тейлора, этот вопрос был решен в конце прошлого века французским геометром Дарбу. В частности, оказалось следующее: если на поверхности взять любую геодезическую и задать в пространстве произ-

Рис. 41.

вольную (аналитическую) кривую той же длины, нигде не имеющую нулевой кривизны, то достаточно узкая полоска поверхности, содержащая данную геодезическую, может быть изогнута так, что геодезическая превратится в данную кривую1. Эта теорема показывает, что полоску поверхности можно гнуть довольно произвольно. Однако доказано, что если кривая, в которую должна перейти геодезическая, задана, то поверхность можно изогнуть не более чем двумя способами. (Например, если эта линия плоская, то два положения поверхности будут зеркально симметричными относительно этой плоскости.) Если же геодезическая является прямой, то последнее утверждение неверно, как показывает любой пример изгибания цилиндрической поверхности.

Мы определяли изгибание как такую деформацию поверхности, в результате которой длины всех кривых на поверхности остаются неизменными. При этом речь шла об окончательном результате деформации; вопрос о том, как ведет себя поверхность в процессе деформации, не ставился. Между тем, рассматривая поверхность как сделанную из гибкого, но нерастяжимого материала, естественно рассматривать непрерывную деформацию, в каждый момент которой длины остаются неизменными (физически это и соответствует нерастяжимости материала). Такие деформации называются непрерывными изгибаниями.

На первый взгляд может показаться, что всякое изгибание можно осуществить непрерывным путем, однако это не так. Например, доказано, что поверхность, имеющая форму круглого жолоба (рис. 42), не допускает непрерывных изгибаний (этим, между прочим, объясняется тот общеизвестный факт, что ведро с загнутым краем значительно прочнее, нежели с ровным), хотя изгибание такой поверхности возможно: достаточно разрезать жолоб по окружности, вдоль которой он касается горизонтальной плоскости, и заменить одну из половинок ее зеркальным отражением в этой плоскости (на рис. 43, как и на рис. 42, для наглядности изображена только половина рассматриваемой поверхности). Интуитивно понятно, что

Рис. 42. Рис. 43.

1 Случай превращения геодезической в линию с нулевой кривизной исключается, так как нетрудно убедиться, что для поверхностей положительной гауссовой кривизны он заведомо невозможен.

непрерывному изгибанию жолоба препятствует его кольцеобразная форма (например, для прямого жолоба изгибание, аналогичное описанному, можно совершить непрерывно).

Если ограничиться достаточно малым участком поверхности, то никаких видимых препятствий для его непрерывного изгибания нет, и можно было бы ожидать, что всякое изгибание малого участка поверхности осуществимо непрерывным образом с добавлением, быть может, одного зеркального отражения. Это действительно верно, но только при условии, что на рассматриваемом малом участке поверхности гауссова кривизна не обращается в нуль (не считая случая, когда она везде равна нулю). Если же гауссова кривизна обращается в нуль в отдельных точках, то, как доказал в 1940 г. Н. В. Ефимов, даже сколь угодно малые куски поверхности могут не допускать непрерывных изгибаний с сохранением регулярности. Так, например, поверхность, задаваемая уравнением z=x9+λx6y3+y9, где λ — трансцендентное число, такова, что никакой, даже сколь угодно малый ее участок, содержащий начало координат, не допускает достаточно регулярных непрерывных изгибаний. Теорема Ефимова является новым и несколько неожиданным результатом в классической дифференциальной геометрии.

Наряду с общими вопросами теории изгибания большое место в геометрии занимают исследования специальных типов изгибания поверхностей.

Связь внутренней геометрии поверхности с ее пространственной формой. Мы уже знаем, что некоторые свойства поверхности и фигур на ней, непосредственно связанные с их пространственной формой, как говорят, «внешне-геометрические» свойства, определяются внутренней геометрией поверхности. Например, произведение главных кривизн поверхности (гауссова кривизна) определяется ее внутренней геометрией. Другой пример: для того чтобы у кривой, лежащей на поверхности, главная нормаль всюду совпадала с нормалью к поверхности, необходимо и достаточно, чтобы эта кривая обладала определенным внутренне-геометрическим свойством, а именно была бы геодезической.

Наряду с этим внутренняя геометрия поверхности определяет ее пространственную форму лишь с известным произволом.

Зависимость пространственной формы поверхности от ее внутренней геометрии может быть выражена аналитически в виде уравнений, в которые входят величины, характеризующие внутреннюю геометрию, и величины, характеризующие внешнюю искривленность поверхности. Одно из этих уравнений представляет собой формулу, выражающую гауссову кривизну через величины, относящиеся к внутренней геометрии, и принадлежит Гауссу. Два других уравнения это — уравнения Петерсона — Кодацци, о которых упоминалось в § 1.

Уравнения Гаусса—Петерсона — Кодацци полностью исчерпывают связь между внутренней геометрией поверхности и ее искривленностью

в пространстве, так что все возможные зависимости между внутренне-геометрическими и внешне-геометрическими величинами произвольной поверхности, по крайней мере в скрытом виде, уже заключены в этих уравнениях.

Поскольку форма поверхности в пространстве не определяется только ее внутренней геометрией, естественно встает вопрос: какие внешне-геометрические величины нужно еще задать, чтобы полностью определить поверхность? Оказывается, что если две поверхности имеют одинаковую внутреннюю геометрию и кривизны нормальных сечений этих поверхностей, взятые со знаком, в соответственных точках и направлениях равны, то и сами поверхности равны, т. е. могут быть совмещены движением. Отметим, что Петерсон открыл эту теорему за 15 лет до Боннэ, с именем которого ее часто связывают.

Аналитический аппарат теории поверхностей. Систематическое применение анализа в теории поверхностей привело к созданию аналитического аппарата, специально приспособленного для этой цели. Решающим шагом в этом направлении послужил введенный Гауссом способ аналитического задания поверхности посредством так называемых криволинейных координат. Этот способ представляет собой естественное обобщение идеи декартовых координат на плоскости и тесно связан с внутренней геометрией поверхности, в которой задание поверхности уравнением z=f (x, у) становится уже неудобным. Неудобство состоит в том, что координаты x, у точки на поверхности при изгибании меняются. Чтобы устранить это неудобство, координаты вводят на самой поверхности, определяя каждую точку двумя числами u, v, которые связаны с данной точкой (и остаются связанными с ней и после изгибания). Пространственные же координаты x, у, z каждой точки будут всякий раз теми или иными функциями от u, v. Числа u, v, задающие точку на поверхности, называются ее криволинейными координатами. Название это понятно: если фиксировать значение одной из координат, скажем v, а другую менять, то мы получим координатную линию на поверхности. Координатные линии образуют на поверхности криволинейную сеть, аналогичную координатной сети на плоскости. Заметим, что известное определение положения точки на земной поверхности с помощью широты и долготы есть не что иное, как введение криволинейных координат на поверхности шара; координатная сеть в данном случае состоит из окружностей — меридианов и параллелей1 (рис. 44). Чтобы задать пространственное положение поверхности с помощью криволинейных координат, нужно определить положение каждой ее точки в зависимости от и и v, например задавая вектор г, идущий из некоторого фиксированного начала в точку поверхности (так называемый радиус-вектор поверхности), как функцию u и v. r=r(u, v)

1 Характерно, что географические координаты в их практическом применении появились задолго до того, как Декарт ввел обычные координаты на плоскости.

(это равносильно заданию составляющих х, у, z вектора r как функций от u, v)1. Для задания кривой, лежащей на данной поверхности, нужно задать координаты u, v как функции одного параметра t, после чего радиус-вектор переменной точки на этой кривой выразится в виде сложной функции r [u (t), v(t)].

На векторные функции дословно обобщается понятие производной и дифференциала; при этом непосредственно из определения производной как предела

при Δt→0 (r есть функция параметра t) следует, что производная радиуса-вектора кривой есть вектор, направленный по касательной к этой кривой (рис. 45). На векторные функции переносятся основные свойства обычных производных, в частности правило дифференцирования сложных функций

(7)

где ru, rv — частные производные векторной функции r (u, v).

Длина кривой, как можно доказать, выражается интегралом

Следовательно, дифференциал длины кривой равен

Рис. 44. Рис. 45.

1 Гаусс, конечно, еще не пользовался векторными обозначениями. Как функции от и и v им непосредственно определялись порознь все три координаты точки поверхности. Векторы, появившиеся в результате работ Гамильтона и Грассмана, сначала получили широкое применение в физике и лишь значительно позднее (фактически в XX в.) стали традиционным аппаратом в изложении аналитической и дифференциальной геометрии.

Но так как х'(t), у'(t), z'(t) есть не что иное, как составляющие вектора dr/dt = r't, то можно написать: ds = | r't | dt, где | r't| означает длину вектора r't. Для кривой, лежащей на поверхности, согласно (7) получаем

Вычисляя квадрат длины вектора, стоящего в правой части, по правилам векторной алгебры1, получим

Переходя к дифференциалам и вводя обозначения

будем иметь

Мы видим, что квадрат дифференциала длины дуги на поверхности есть квадратичная форма от дифференциалов du, dv с коэффициентами, зависящими от точки поверхности. Эта квадратичная форма называется первой квадратичной формой поверхности. Задание в каждой точке поверхности коэффициентов Е, F, G первой квадратичной формы позволяет вычислять длины любых кривых на поверхности

по формуле

и, следовательно, полностью определяет ее внутреннюю геометрию.

Покажем для примера, как выражаются через Е, F, G угол и площадь. Пусть из точки исходят две кривые, одна из них задается уравнениями u = u1(t), v = v1(t), а другая — уравнениями u = u2 (t), v=v2 (t). Тогда касательными к этим кривым служат векторы

Косинус угла между этими векторами равен их скалярному произведению r1r2, деленному на произведение их длин r1r2,

Вспоминая, что , получаем

1 Квадрат длины вектора есть скалярное произведение вектора самого на себя, а для скалярного умножения, как мы знаем [см. главу III (том 1), § 9], верны обычные правила раскрытия скобок.

Чтобы получить формулу для площади, рассмотрим криволинейный четырехугольник, ограниченный координатными линиями u = u0, v = v0, и=и0+Δu, v = v0+Δv, и заменим его приближенно параллелограмом, лежащим в касательной плоскости и построенным на векторах ruΔu, rv Δv, касательных к координатным линиям (рис. 46). Площадь этого параллелограма

угол между ru и rv. Так как

Вспоминая, что

получим:

Суммируя площади параллелограмов и переходя к пределу при Δu, Δv→0, получаем для площади формулу

где интегрирование производится по области D изменения переменных u, v, соответствующей данному участку поверхности.

Криволинейные координаты, таким образом, весьма удобны при исследовании внутренней геометрии поверхности.

Оказывается, что искривленность поверхности в пространстве также можно характеризовать посредством некоторой квадратичной формы от дифференциалов du, dv. В самом деле, если n — единичный вектор нормали к поверхности в точке М, a Δr — приращение радиуса-вектора поверхности при смещении из этой точки, то отклонение h поверхности от касательной плоскости (рис. 47) равно nΔr. Разлагая приращение Δr по формуле Тейлора, получим

Так как вектор dr лежит в касательной плоскости, то ndr = 0; последний член мал по сравнению с квадратами дифференциалов du и dv. Остается основной член

Удвоенная главная часть h, величина n d2r, оказывается квадратичной формой относительно du и dv

Эта форма и описывает характер отклонения поверхности от касательной плоскости. Она называется второй квадратичной формой поверхности. Ее коэффициенты, зависящие от и и v, принято обозначать так:

Зная вторую квадратичную форму, мы можем вычислить кривизну любой линии

Рис. 46. Рис. 47.

на поверхности. В самом деле, применяя формулу

получим, что кривизна нормального сечения, проведенного в направлении, которому соответствует отношение дифференциалов du : dv, равна

Если рассматриваемая кривая не является нормальным сечением, то согласно теореме Менье достаточно разделить кривизну нормального сечения, идущего в том же направлении, на косинус угла между главной нормалью кривой и нормалью к поверхности.

Введение второй квадратичной формы дает аналитический подход к изучению искривленности поверхности. В частности, можно чисто аналитически получить теоремы Эйлера и Менье, выражения для гауссовой и средней кривизны и т. п.

Теорема Петерсона, о которой говорилось выше, показывает, что две квадратичные формы, вместе взятые, определяют поверхность с точностью до ее положения в пространстве, и, следовательно, изучение любых свойств поверхности аналитически сводится к изучению этих форм. В заключение отметим, что коэффициенты двух квадратичных форм не являются независимыми; та связь между внутренней геометрией поверхности и ее пространственной формой, о которой упоминалось, аналитически выражается в виде трех соотношений (уравнений Гаусса—Кодацци) между коэффициентами первой и второй квадратичных форм.

§ 5. НОВЫЕ НАПРАВЛЕНИЯ В ТЕОРИИ КРИВЫХ И ПОВЕРХНОСТЕЙ

Семейства кривых и поверхностей. Хотя основы теории кривых и поверхностей были в большой мере завершены еще в середине прошлого столетия, теория эта продолжала и продолжает развиваться. Вместе с тем к ней постепенно присоединился ряд новых направлений: расширился круг фигур и их свойств, исследуемых в современной дифференциальной геометрии. Впрочем, одно из этих направлений уходит своими истоками еще ко времени зарождения дифференциальной геометрии. Речь идет о теории «семейств», т. е. непрерывных совокупностей кривых и поверхностей. Эту теорию можно, однако, считать новой в том смысле, что ее глубокое развитие началось только тогда, когда основы теории кривых и поверхностей были уже вполне разработаны.

Вообще непрерывная совокупность фигур называется n-параметрическим семейством, если каждая фигура этой совокупности задается значениями n параметров, причем предполагается, что все величины, характеризующие фигуру (в отношении ее положения, формы и пр.), зависят от этих параметров по крайней мере непрерывно. С точки зрения этого общего определения кривую можно рассматривать как однопараметрическое, а поверхность — как двупараметрическое семейство точек. Совокупность всех окружностей на плоскости дает пример трехпараметрического семейства кривых, так как круг на плоскости задается тремя параметрами: двумя координатами центра и радиусом.

Простейший вопрос теории семейств кривых или поверхностей представляет нахождение так называемой огибающей семейства. Поверхность

называется огибающей данного семейства поверхностей, если она в каждой своей точке касается одной из поверхностей семейства и таким образом касается каждой из них. Например, огибающей семейства сфер равных радиусов, с центрами на данной прямой, будет цилиндр (рис. 48), а огибающая семейства таких же сфер с центрами во всех точках данной плоскости будет состоять из двух параллельных плоскостей. Аналогично определяется огибающая семейства кривых. На рис. 49 изображены струи воды, бьющие из фонтана под разными углами; в одной плоскости они образуют семейство кривых, которые можно приближенно считать параболами. На фотографии ясно обозначается их огибающая, которая служит как бы общим контуром водяного каскада. Конечно, не всякое семейство кривых или поверхностей имеет огибающую (например, семейство параллельных прямых не имеет ее). Существует простой общий метод нахождения огибающих любого семейства; для случая семейства кривых на плоскости он был дан еще Лейбницем.

Всякая кривая есть, очевидно, огибающая своих касательных. Точно так же всякая поверхность есть огибающая своих касательных плоскостей. (Кстати, это дает основание для нового способа задания кривой или поверхности путем задания семейства ее касательных прямых или касательных плоскостей. В ряде вопросов такое задание кривой или поверхности оказывается целесообразным.)

Вообще говоря, в разных точках поверхности касательные плоскости различны, и потому семейство касательных плоскостей поверхности обычно будет двупараметрическим. Однако в некоторых случаях, как, например, у цилиндра, оно однопараметрическое. Оказывается, имеет место следующая замечательная теорема. Однопараметрическое семейство касательных плоскостей имеют те и только те поверхности, которые разворачиваются на плоскость, т. е. такие, у которых любой достаточно малый кусок может быть изогнут в кусок плоскости. Это — развертывающиеся поверхности, о которых упоминалось в § 4. Каждая аналитическая поверхность такого рода состоит из отрезков прямых линий и есть либо цилиндрическая (прямые параллельны), либо коническая (прямые сходятся в одной точке), либо образуется касательными к некоторой пространственной кривой.

Рис. 48.

Теория огибающих часто используется в инженерных задачах, например в теории передач. Рассмотрим два зубчатых колеса А и Б. Относительное их движение можно представить себе, предполагая, что колесо А неподвижно, а колесо Б катится по нему (рис. 50). Тогда контур зуба колеса Б, принимая разные положения, образует в плоскости колеса А семейство кривых, а контур колеса А должен все время их касаться, т. е. служить огибающей этого семейства. Конечно, для передач этого недостаточно, зацепление должно еще переходить от одной пары зубьев к другой, но все-таки отмеченное условие является основным, которому должны удовлетворять допустимые формы зубчатых колес.

Как мы сказали, вопрос об огибающих является только простейшим и давно решенным вопросом теории семейств кривых и поверхностей. По возможным задачам эта теория не менее обширна, чем, скажем, просто теория поверхностей. Особенно усиленно разрабатывается теория «конгруэнций», т. е. двупараметрических семейств разных линий, в частности прямых (так называемые «прямолинейные» конгруэнции). В этой теории применяются по существу те же методы, что и в теории поверхностей.

Начала теории прямолинейных конгруэнций восходят еще к работе Монжа «О выемках и насыпях», само название которой указывает, что исследование Монжа возникло в связи с задачами практики; речь шла о наиболее выгодной транспортировке земли из выемки на насыпь.

Систематическое развитие теории конгруэнций, начавшееся в середине прошлого столетия, в большой степени обязано ее связи с геометрической оптикой; совокупность световых лучей в однородной среде всякий раз представляет собой конгруэнцию прямых.

Риг. 49а. Рис. 49б.

Нерегулярные поверхности и геометрия «в целом». Теория кривых и поверхностей (а также их семейств), как она сложилась в конце прошлого столетия, называется обычно классической дифференциальной геометрией; для нее характерны, в частности, следующие особенности.

Во-первых, она рассматривает только «достаточно гладкие», так называемые регулярные кривые и поверхности, т. е. такие, которые задаются функциями, имеющими достаточное число производных. Поэтому, например, поверхности с остриями и ребрами, такие, как многогранные поверхности или поверхность конуса, либо вовсе исключаются из рассмотрения, либо рассматриваются только на тех кусках, где они остаются гладкими.

Во-вторых, классическая дифференциальная геометрия исследует специально свойства достаточно малых участков кривых и поверхностей (геометрия в «малом»), вовсе не обращаясь к таким вопросам, как свойства целых замкнутых поверхностей (относящиеся уже к так называемой геометрии «в целом»).

Типичные примеры, обнаруживающие различие геометрии «в малом» и «в целом», дает изгибание поверхностей. Например, еще в 1838 г. Миндинг доказал, что достаточно малый кусок сферы изгибаем (теорема «в малом»). Вместе с тем он высказал предположение, что целая сфера уже неизгибаема. Эта теорема была доказана другими математиками лишь в 1899 г. Кстати, неизгибаемость сферы, сделанной из гибкого, но практически нерастяжимого материала, легко обнаруживается на опыте. Так например, мяч для игры в настольный теннис твердый, в то время как он сделан из довольно гибкого материала. Еще один пример, о котором уже говорилось в § 4, представляет простое жестяное ведро; оно в целом жестко благодаря наличию круглой закраины; отдельные же участки той же поверхности допускают изгибания. Как видим, между свойствами поверхностей «в малом» и «в целом» может обнаруживаться существенное различие.

Характерные примеры дает также теория геодезических линий, с элементами которой мы познакомились в § 4. Геодезическая «в малом», т. е. на малом участке, — кратчайшая, но «в целом» она может вовсе не быть кратчайшей, а может быть, например, замкнутой, как показывает пример больших кругов на сфере.

Читатель легко заметит, что формулированные в § 4 теоремы о геодезических являются в основном теоремами «в малом». Вопросы же о поведении геодезических на всем их протяжении будут относиться к геометрии «в целом». Известно, например, что на регулярной поверхности две достаточно близкие точки соединимы единственной геодезической, не выходящей из некоторой малой окрестности. Если же рассматривать и геодезические, значительно удаляющиеся на своем протяже-

Рис. 50.

нии от этих точек, то, согласно теореме Морса, любую пару точек на замкнутой поверхности можно соединить бесконечным числом геодезических. Так, две точки А, В на боковой поверхности круглого цилиндра можно соединять весьма различными, геодезическими: достаточно брать винтовые линии, которые на пути от А к В различное число раз обходят вокруг цилиндра. К геометрии «в целом» относится и доказанная Л. А. Люстерником и Л. Г. Шнирельманом теорема Пуанкаре о замкнутых геодезических, о которой идет речь в § 5 главы XVIII (том 3).

Доказательство этих теорем, как и многих других теорем геометрии «в целом», оказалось недоступным обычным приемам классической дифференциальной геометрии и потребовало изобретения новых методов.

Как задачи геометрии «в целом» неизбежно должны были привлечь внимание математиков, так и ограничение одними регулярными поверхностями не могло удержаться в науке хотя бы потому, что мы постоянно сталкиваемся с нерегулярными, не непрерывно изогнутыми поверхностями, такими, как поверхности куба, конуса, выпуклой линзы с острым краем и т. д. Кроме того, очень многие аналитические поверхности при естественном продолжении необходимо получают «особенности» — нарушения регулярности, как, например, ребра или острия. Так, кусок поверхности конуса при естественном продолжении приводит к вершине — острию, где нарушается гладкость поверхности.

Последний результат есть лишь частный случай следующей замечательной теоремы. Всякая развертывающаяся поверхность, не являющаяся цилиндрической, при естественном продолжении доходит до ребра (или острия в случае конуса), за которое она с сохранением регулярности уже не может быть продолжена.

Таким образом, между поведением поверхности «в целом» и ее особенностями есть глубокая связь. Такова одна из причин, по которым решение задач «в целом» и изучение поверхностей с «особенностями» (ребрами, остриями, разрывами кривизны и т. п.) должны развиваться вместе.

Аналогичные новые направления возникали в анализе. Так, например, качественная теория дифференциальных уравнений, о которой говорилось в § 7 главы V, как раз исследует свойства решений дифференциального уравнения во всей области его определения, т. е. «в целом», и она же обращает специальное внимание на «особенности», на нарушения регулярности, на особые точки уравнений. Кроме того, современный анализ включил в сферу исследования нерегулярные функции, которыми не занимался классический анализ (см. главу XV, том 3) ; это дало геометрии новые средства для изучения более общих поверхностей. Наконец, в вариационном исчислении, где обычно ищется кривая или поверхность, обладающая теми или иными экстремальными свойствами, иногда оказывалось, что предельная кривая, для которой достигается экстремум, не является регулярной. Необходимая в постановке таких задач замкнутость класса кривых или поверхностей также требовала расширения круга рассматриваемых ли-

нии и поверхностей — прежде всего за счет привлечения хотя бы простейших нерегулярных кривых и поверхностей. Словом, новые направления в геометрии рождались не изолированно, а в тесной связи со всем развитием математики.

Поворот к решению задач «в целом» и изучению не только регулярных поверхностей начался около 50 лет назад. В разработке этого нового направления приняли участие многие математики. Первый существенный вклад сделал Герман Минковский (1864—1909), положивший начало обширной главе геометрии — теории выпуклых тел. Кстати, одним из вопросов, побудивших Минковского к этим исследованиям, были задачи о правильных решетках, тесно связанные с теорией чисел и геометрической кристаллографией.

Тело называется выпуклым, если через каждую точку его поверхности можно провести плоскость, не рассекающую это тело, т. е. это тело можно любой точкой поверхности упереть в плоскость (рис. 51). Выпуклое тело определяется своей поверхностью, и в большой степени безразлично, говорим ли мы о теории выпуклых тел или о теории замкнутых выпуклых поверхностей. Общие теоремы о выпуклых телах справедливы, как правило, без каких бы то ни было дополнительных предположений гладкости или «регулярности» их поверхностей. К тому же эти теоремы относятся обычно именно к целому выпуклому телу или поверхности. Теория выпуклых тел и поверхностей, таким образом, в самой своей основе преодолевала ограничения классической дифференциальной геометрии. Однако она была с ней очень мало связана; объединение этих теорий произошло значительно позже.

Начиная с 1940 г., А. Д. Александров развил теорию общих кривых и поверхностей. Эта теория охватывает и регулярные поверхности классической дифференциальной геометрии и негладкие поверхности: многогранные, любые выпуклые и др. Несмотря на большую общность постановки вопросов и выводов этой теории, в ее основе лежат прежде всего наглядные геометрические понятия и методы, хотя она существенно использует также понятия и методы современного анализа. Одним из основных методов теории является приближение общих поверхностей многогранниками (многогранными поверхностями). Этот прием в простейшей форме

Рис. 51.

знаком каждому школьнику, например, из вычисления площади боковой поверхности цилиндра как предела площадей призм. В ряде случаев этот метод дает сильные результаты, которые либо не удается получить другим путем, либо они требуют при аналитическом подходе больших усилий и привлечения сложных соображений. Суть метода состоит в том, что задача сначала решается для многогранников, а потом результат переносится на общие поверхности путем предельного перехода.

Одной из основ теории общих выпуклых поверхностей явилась теорема об условиях, при которых из данной развертки можно склеить выпуклый многогранник. Эта теорема, вполне элементарная по формулировке, имеет, однако, неэлементарное доказательство и приводит к далеко идущим следствиям для общих выпуклых поверхностей. Читатель, конечно, знаком со склеиванием многогранников или поверхностей из кусков, например: склеивание куба из крестообразной выкройки (рис. 52) или цилиндра из прямоугольника и двух кругов. Этот простой прием склеивания поверхностей из кусков превращается в общий метод «разрезывания и склеивания», дающий в разнообразных вопросах теории поверхностей сильные результаты и нашедший практические применения.

Глубокие результаты в этой теории были получены А. В. Погореловым. В частности, он доказал, что любая замкнутая выпуклая поверхность неизгибаема как целое с сохранением ее выпуклости. Этот результат, полученный в 1949 г., завершает усилия многих известных математиков, которые на протяжении 50 лет пытались доказать эту теорему и получали ее доказательство лишь при тех или иных дополнительных предположениях. Выводы А. В. Погорелова в соединении с «методом склеивания» дали не только полное решение этой задачи, но почти до конца выяснили весь вопрос об изгибаемости или неизгибаемости замкнутых и незамкнутых выпуклых поверхностей. Им установлена также тесная связь новой теории с «классической».

Таким образом, построена теория поверхностей, охватывающая как классическую теорию, так и теорию многогранников, любых выпуклых и весьма общих невыпуклых поверхностей. Недостаток места не позволяет рассказать здесь о выводах и нерешенных еще задачах этой теории подробнее, хотя это и можно было бы сделать, так как они во многом

Рис. 52.

вполне наглядны и, несмотря на трудности точных доказательств, не требуют для понимания постановки задач особых знаний.

Выше в § 4, говоря об изгибаниях поверхностей, мы имели в виду изгибания регулярных (непрерывно искривленных) поверхностей, сохраняющие их регулярность. В упомянутой только-что теореме Погорелова, напротив, не требуется никакой регулярности исходной или изогнутой поверхности, однако налагается требование выпуклости обеих поверхностей.

Очевидно, что изгибание сферы, например, становится возможным, если допустить нарушение выпуклости и изломы получаемой поверхности. Достаточно отрезать от сферы некоторый сегмент и вставить его на прежнее место в перевернутом виде, т. е. как бы продавить участок сферы во внутрь, как мы получим пример такого рода изгибания. Значительно более неожиданным оказывается результат, полученный недавно американским математиком Пешем и голландским математиком Кейпером. Они показали, что если сохранять только гладкость поверхности и допустить появление сколь угодно резких переходов в кривизне поверхности (т. е. отказаться от каких бы то ни было требований непрерывности, ограниченности и даже существования вторых производных у задающих поверхность функций), то окажется возможным изгибать поверхность как целое с очень большой степенью произвола. В частности сфера может быть изогнута в сколь угодно маленький комочек, представляющий собой гладкую поверхность, состоящую из весьма мелких волнистых складок. Некоторое представление о такой деформации подсказывает ясно вообразимая возможность весьма произвольно мять сделанный из мягкого как тряпочка пластиката сферический чехол. Иначе обстоит дело с целлулоидовым мячиком. Его упругая поверхность не допускает не только растяжений, но и крутых перегибов, и такой мяч оказывается именно поэтому весьма жестким.

Дифференциальная геометрия разных групп преобразований. С начала нашего столетия из классической дифференциальной геометрии вырос ряд новых направлений, объединенных одной общей идеей. Речь идет о том, чтобы специально изучать свойства кривых, поверхностей и их семейств, не меняющиеся при преобразованиях того или иного вида. Классическая дифференциальная геометрия изучала свойства, не меняющиеся при движениях, но можно, конечно, рассматривать и другие геометрические преобразования. Например, проективным преобразованием называется любое преобразование области пространства, при котором прямые остаются прямыми. Уже давно возникла так называемая проективная геометрия, изучающая свойства фигур, сохраняющихся при любых проективных преобразованиях. По своим задачам она оставалась аналогичной обычной элементарной и аналитической геометрии, пока с начала нашего века в работах ряда математиков не стала разрабатываться «проективная дифференциальная геометрия», т. е. теория кривых, поверхностей и их семейств, подобная классической дифференциальной геометрии,

но изучающая специально те свойства их, которые сохраняются при любых проективных преобразованиях. Основополагающими для последнего направления явились работы американского математика Вильчинского, а также итальянского математика Фубини и чешского математика Чеха.

Таким же образом возникла и «аффинная дифференциальная геометрия», изучающая свойства кривых, поверхностей и их семейств, сохраняющиеся при аффинных преобразованиях, т. е. при таких, которые не только переводят прямые в прямые, но и не нарушают параллельности прямых. Работами немецкого математика Бляшке и его учеников этот раздел геометрии развит в обширную теорию. Можно упомянуть еще «конформную геометрию», в которой изучают свойства фигур, сохраняющиеся при таких преобразованиях, которые не изменяют углов между любыми кривыми.

В общем, возможные «геометрии» весьма разнообразны, так как в основу каждой из них можно положить в известном смысле любую группу преобразований и изучать именно те свойства фигур, которые сохраняются при преобразованиях этой группы. О таком принципе определения разных «геометрий» мы еще будем говорить в главе XVII (том 3).

Новые направления дифференциальной геометрии успешно разрабатывались и разрабатываются также советскими геометрами (С. П. Фиников, Г. Ф. Лаптев и др.). Но в нашем очерке нет возможности дать понятие о всем разнообразии современных исследований, которые ведутся с успехом в различных направлениях дифференциальной геометрии.

ЛИТЕРАТУРА

Гильберт Д. и Кон-Фоссен С. Наглядная геометрия. Гостехиздат, 1951.

Доступно написанный и богатый содержанием обзор большого числа геометрических результатов. Одна из глав специально посвящена дифференциальной геометрии.

Люстерник Л. А. Кратчайшие линии (вариационные задачи). Популярные лекции по математике, вып. 19. Гостехиздат, 1955.

Книга о геодезических, построенная на весьма наглядном материале.

Университетские курсы Рашевский И. К. Курс дифференциальной геометрии. Изд. 4-е, Гостехиздат. 1956.

Фиников С.П. Курс дифференциальной геометрии. Гостехиздат, 1952.

Специальные монографии

Александров А. Д. Внутренняя геометрия выпуклых поверхностей. Гостехиздат, 1948.

Специальная монография, посвященная новым результатам в теории выпуклых поверхностей.

Каган В. Ф. Основы теории поверхностей в тензорном изложении. Гостехиздат, ч. I, 1947; ч. II; 1948.

Обширный труд по теории поверхностей, в котором большое число классических и современных результатов объединено единым методом изложения.

Глава VIII

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

§ 1. ВВЕДЕНИЕ

Примеры вариационных задач. Чтобы отчетливее выяснить круг вопросов, которые изучаются в вариационном исчислении1, рассмотрим предварительно несколько отдельных задач.

1. Линия наискорейшего ската. Задача о брахистохроне, или линии наискорейшего ската, была исторически первой задачей, положившей начало развитию вариационного исчисления.

Среди всех линий, соединяющих точки M1 и M2, требуется найти ту, по которой материальная точка, двигаясь под влиянием силы тяжести из M1 без начальной скорости, достигнет пункта M2 в кратчайшее время.

Для решения этой задачи мы должны будем рассмотреть всевозможные линии, соединяющие M1 и M2. Если взять какую-либо одну определенную линию l, то ей будет отвечать какое-то определенное значение Т времени ската по ней материальной точки. Время Т будет зависеть от выбора l, и из всех линий, соединяющих M1 и M2, нужно выбрать ту, которой отвечает наименьшее значение Т.

Задаче о брахистохроне можно придать другую форму.

Проведем через точки M1 и M2 вертикальную плоскость. Линия наискорейшего ската должна, очевидно, лежать в ней, и для ее разыскания мы можем ограничиться только линиями, лежащими в этой плоскости. Примем точку M1 за начало координат, ось Ох направим горизонтально, ось Oy — вертикально вниз (рис. 1). Координаты точки M1 будут (0,0); координаты же точки M2 назовем (x2, y2). Возьмем любую линию, которая может быть задана уравнением

(1)

Рис. 1.

1 Происхождение названия «вариационное исчисление» выясняется ниже.

где f—непрерывно дифференцируемая функция. Так как линия проходит через M1 и M2, функция f на концах отрезка [0, x2] должна удовлетворять условиям

f(0) = 0, f(x2) = y2. (2)

Если взять на линии произвольную точку M (х, у), то скорость движения v материальной точки в этом месте линии будет связана с координатой у точки известным из физики соотношением

или

Время, необходимое для того, чтобы материальная точка прошла элемент ds дуги линии, имеет значение

и поэтому полное время ската точки вдоль линии от M1 до M2 равно

(3)

Разыскание брахистохроны равносильно решению следующей минимальной задачи: среди всевозможных функций (1), удовлетворяющих условиям (2), нужно найти ту, которой соответствует наименьшее значение интеграла (3).

2. Поверхность вращения наименьшей площади. Среди линий, соединяющих две точки плоскости, нужно найти ту, дуга которой при вращении около оси Ох образует поверхность с наименьшей площадью.

Обозначим заданные точки M1(x1, ух) и M2(x2, y2) и рассмотрим любую линию, которая может быть задана уравнением

y = f(x)⋅ (4)

Если линия проходит через M1 и M2, то функция f будет удовлетворять условиям

f(x1) = y1, f(x2) = y2. (5)

Вращаясь около оси Ох, эта линия опишет поверхность, площадь которой будет численно равна интегралу

(6)

Значение интеграла зависит от выбора линии, или, что равносильно, функции y = f(x). Среди всех функций (4), удовлетворяющих усло-

виям (5), мы должны найти такую функцию, которой отвечает наименьшее значение интеграла (6).

3. Равновесие деформированной мембраны. Под мембраной принято понимать упругую поверхность, плоскую в состоянии покоя, свободно изгибающуюся и работающую только на растяжение. Считается, что потенциальная энергия деформированной мембраны пропорциональна увеличению площади ее поверхности.

Пусть в состоянии покоя мембрана занимает область В плоскости Оху (рис. 2). Деформируем край l мембраны в направлении, перпендикулярном к Оху, и обозначим через φ(М) смещение точки M края. При этом деформируется и средняя часть мембраны. Требуется найти положение равновесия мембраны при заданной деформации ее края.

С большой степенью точности можно считать, что все точки мембраны при указанной деформации совершат перемещения, перпендикулярные к плоскости Оху. Обозначим через u(х, у) перемещение точкu (x, у). Площадь мембраны в деформированном состоянии будет1

Если деформации элементов мембраны считать настолько малыми, что мы вправе пренебрегать высшими степенями их и иу сравнительно с низшими степенями, указанное выражение площади можно заменить другим, более простым

Изменение площади мембраны равно

потенциальная же энергия деформации будет иметь значение

(7)

где μ — постоянная, зависящая от упругих свойств мембраны.

Рис. 2.

1 Здесь и всюду в этой главе в обозначениях частных производных мы будем ограничиваться только индексами, поставленными снизу у знака функции и показывающими, по какому аргументу вычисляется частная производная.

Так как смещения точек края мембраны мы считаем заданными, функция u (x, у) будет на границе области В удовлетворять условию

(8)

В положении равновесия потенциальная энергия деформации должна иметь наименьшее возможное значение, и поэтому функция u (x, у), определяющая отклонения точек мембраны, должна быть найдена из следующей минимальной задачи: среди всех функций u (x, у), непрерывно дифференцируемых в области В и удовлетворяющих на границе условию (8), найти ту, которая дает наименьшее значение интегралу (7).

Экстремумы функционалов и вариационное исчисление. Приведенные примеры дают возможность составить представление о круге задач, которые рассматриваются в вариационном исчислении. Но чтобы точно определить положение вариационного исчисления в математике, мы должны ознакомиться с несколькими новыми понятиями. Напомним, что одним из основных понятий математического анализа является понятие функции. В простейшем случае понятие о функциональной зависимости может быть высказано так. Пусть M какое-либо множество действительных чисел. Если каждому числу х из множества M соответствует некоторое число y, то говорят, что на множестве M определена функция y=f(x). Множество M часто называют областью определения функции.

Понятие функционала является прямым и естественным обобщением понятия функции и содержит его как частный случай.

Пусть M есть множество каких угодно объектов. Природа этих объектов для нас сейчас безразлична. Это могут быть числа, точки пространства, линии, функции, поверхности, состояния или даже движения механической системы и т. д. Для краткости мы будем их называть в дальнейшем элементами множества M и обозначать буквой х.

Если каждому элементу х из M соответствует некоторое число у, то говорят, что на множестве M определен функционал y = F(x).

Если множество M есть множество чисел х, то функционал y = F (х) будет функцией одного аргумента. Когда M есть множество пар чисел (x1, x2) или множество точек плоскости, функционал будет функцией y = F(x1, x2) двух аргументов и т. д.

Для функционала y = F(x) мы поставим следующую задачу:

Среди всех элементов х из M нужно найти тот элемент, для которого функционал y = F(x) имеет минимальное значение.

Аналогично формулируется задача о максимуме этого функционала.

Заметим, что если мы у функционала F(x) изменим знак и будем рассматривать функционал —F (х), то максимумы (минимумы) F (х) перейдут в минимумы (максимумы) —F(x). Поэтому отдельно изучать максимумы и минимумы не имеет смысла, так как теория их является

весьма сходной, и в последующем мы будем говорить преимущественно о минимумах функционалов.

В задаче о линии наискорейшего ската функционалом, минимум которого ищется, был интеграл (3) — время ската материальной точки вдоль линии. Этот функционал был определен на всевозможных функциях (1), удовлетворяющих условию (2).

В задаче о положении равновесия мембраны функционалом являлась потенциальная энергия (7) деформированной мембраны, и мы должны были найти ее минимум на множестве функций u (x, у), удовлетворяющих граничному условию (8).

Каждый функционал определяется двумя факторами: множеством M элементов х, на котором он задан, и тем законом, по которому каждому элементу х ставится в соответствие число (значение функционала). Методы разыскания наибольших и наименьших значений функционалов несомненно должны зависеть от свойств множества М.

Вариационное исчисление является частной главой теории функционалов. В нем рассматриваются функционалы, заданные на множествах функций, и задачей вариационного исчисления является построение теории экстремумов таких функционалов.

Особенно большое значение эта ветвь математики приобрела после того, как была установлена ее связь с многими отделами физики и механики. Причину этого можно видеть в следующем. Как будет выяснено ниже, для того чтобы функция давала экстремум функционалу, необходимо, чтобы она удовлетворяла некоторому дифференциальному уравнению. С другой стороны, как уже говорилось в главах, посвященных дифференциальным уравнениям, весьма часто количественные законы механики и физики также записываются в форме дифференциальных уравнений. Как оказалось, многие уравнения такого рода являются вместе с тем и дифференциальными уравнениями вариационного исчисления. Это дало возможность уравнения механики и физики рассматривать как условия экстремумов соответствующих функционалов и физические законы высказывать в форме требования экстремума, в частности минимума, некоторых величин. Последнее позволило ввести в механику и физику новые точки зрения путем замены тех или иных физических законов равносильными им «минимальными принципами». Вместе с тем это открыло также новые пути решения, точного или приближенного, физических задач при помощи разыскания минимумов соответствующих функционалов.

§ 2. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ

Дифференциальное уравнение Эйлера. Напомним читателю, что необходимым условием существования у дифференцируемой функции f экстремума в некоторой точке х является равенство нулю производной

f в этой точке: f'(x) = 0, или, что то же самое, равенство нулю дифференциала функции df = f'(x)dx = 0.

Нашей ближайшей целью будет найти аналог этого условия в вариационном исчислении и выяснить, какому необходимому требованию должна удовлетворять функция, дающая экстремум функционалу.

Мы покажем, что такая функция должна удовлетворять некоторому дифференциальному уравнению. Форма уравнения будет зависеть от вида рассматриваемого функционала. Изложение мы начнем с так называемого простейшего интеграла вариационного исчисления, под которым подразумевают функционал, имеющий следующее интегральное представление:

(9)

Функция F, стоящая под знаком интеграла, зависит от трех аргументов (х, у, у'). Будем считать ее определенной и дважды непрерывно дифференцируемой по аргументу у' для всех значений, по аргументам же X и у — в некоторой области В плоскости Оху. Ниже предполагается, что мы всегда будем находиться внутри этой области. Под у понимается некоторая функция от х

(10)

непрерывно дифференцируемая на отрезке x1⩽х⩽х2, и у' есть производная от нее.

Геометрически функцию у (х) можно изобразить в плоскости Оху некоторой линией l, лежащей над отрезком [х1, x2] (рис. 3).

Интеграл (9) является обобщением интегралов (3) и (6), с которыми мы встретились в задачах о линии наискорейшего ската и поверхности вращения наименьшей площади. Значение его зависит от выбора функции у(х) или от линии l, и задача о его минимуме имеет следующий смысл.

Дано некоторое множество M функций (10) (линий l). Среди них нужно найти ту функцию (линию l), для которой интеграл I (у) имеет наименьшее значение.

Мы должны прежде всего точно определить множество M функций, для которых мы будем рассматривать значение интеграла (9). Функции этого множества в вариационном исчислении обычно называют допустимыми к сравнению. Рассмотрим задачу с закрепленными граничными значениями. Множество допустимых функций определяется здесь двумя следующими требованиями:

1) у(х) непрерывно дифференцируема на отрезке [x1, x2];

Рис. 3.

2) на концах отрезка у(х) принимает заданные наперед значения

y(x1) = y1, y(x2) = y2 (11)

В остальном функция у (х) может быть совершенно произвольной. Если говорить языком геометрии, мы рассматриваем всевозможные гладкие линии, лежащие над промежутком [x1, x2], которые проходят через две точки A(x1, y1) и В(x2, y2) и могут быть заданы уравнением (10). Функцию, доставляющую минимум интегралу, будем считать существующей и назовем ее у(х).

Следующие простые и остроумные соображения, часто применяемые в вариационном исчислении, дают возможность весьма просто выяснить необходимое условие, которому должна удовлетворять у(х). По сути дела они позволяют задачу о минимуме интеграла (9) привести к задаче о минимуме функции.

Рассмотрим семейство функций, зависящее от численного параметра а,

(12)

Чтобы у(х) при любом а была допустимой функцией, мы должны считать η (х) непрерывно дифференцируемой и обращающейся в нуль на концах отрезка [х1, x2]

(13)

Интеграл (9), вычисленный для у, будет некоторой функцией параметра а

Так как у(х) дает минимальное значение интегралу, функция Ф(а) должна иметь минимум при а = 0, и производная от нее в этой точке обязана обращаться в нуль

(14)

Последнее равенство должно выполняться при всякой непрерывно дифференцируемой функции η (х), обращающейся в нуль на концах отрезка [x1, x2]. Для получения вытекающего отсюда следствия удобнее второй член в условии (14) преобразовать интегрированием по частям

1 Разность у — у = αη называют вариацией (изменением) функции у и обозначают δу, а разность I (у) — I (у) —полной вариацией интеграла (9). Отсюда и произошло название вариационного исчисления.

и придать условию (14) другую форму

(15)

Может быть доказана следующая простая лемма. Пусть выполняются условия:

1) функция f(x) непрерывна на отрезке [а, b];

2) функция η (х) непрерывно дифференцируема на отрезке [а, b] и на концах отрезка обращается в нуль.

Если при любой такой функции η(х) интеграл ∫f(x)η(х)dx равен нулю, то отсюда следует, что f(x) = 0.

Действительно, допустим, что в некоторой точке с функция f отлична от нуля, и покажем, что тогда заведомо существует такая функция η(х), для которой ∫f(x)η(х)dx ≠ 0 вопреки условию леммы.

Так как f(с)≠0 и f fепрерывна, наверное существует около с такой промежуток [α, ß], в котором f будет всюду отличной от нуля и, стало быть, сохранять знак.

Всегда можно построить функцию η(х), непрерывно дифференцируемую на [а, b], положительную на [а, ß] и равную нулю всюду вне [α, ß] (рис. 4).

Такой будет, например, η(x), определенная равенствами

Но для такой функции η(х)

Последний же интеграл не может быть равен нулю, так как произведение fη внутри промежутка интегрирования отлично от нуля и сохраняет знак.

Ввиду того, что равенство (15) должно выполняться для всякой η(х), непрерывно дифференцируемой и обращающейся в нуль на концах отрезка [x1, x2], мы можем, согласно лемме, утверждать, что это может быть только в том случае, когда

(16)

Рис. 4.

или после вычисления производной по х

(17)

Равенство это является дифференциальным уравнением 2-го порядка относительно функции у. Оно называется уравнением Эйлера. Мы можем высказать следующее заключение.

Если функция у (х) доставляет интегралу I (у) минимум, то она должна удовлетворять дифференциальному уравнению Эйлера (17). Последнее в вариационном исчислении имеет значение, вполне сходное со значением необходимого условия df = 0 в теории экстремумов функций. Оно позволяет сразу отбросить все допустимые функции, которые этому условию не удовлетворяют, так как на них интеграл заведомо не может достигать минимума. Этим очень сильно сужается круг допустимых функций, подлежащих изучению. Свое внимание мы можем сосредоточить только на решениях уравнения (17).

Сами решения уравнения (17) обладают тем свойством, что производная для них обращается в нуль при любых η(х), и они аналогичны по своему значению стационарным точкам функции. Поэтому часто говорят, что на решениях (17) интеграл I (у) имеет стационарное значение.

В нашей задаче с закрепленными граничными значениями нужно найти далеко не все решения эйлерова уравнения, а только те из них, которые принимают предписанные значения y1, y2 в точках x1, x2.

Обратим внимание на то, что уравнение Эйлера (17) имеет 2-й порядок. Общее его решение будет содержать две произвольные постоянные

Их нужно определить так, чтобы интегральная кривая проходила через точки А и В, что доставляет два уравнения для нахождения постоянных C1 и C2

Во многих случаях эта система имеет только одно решение, и тогда будет существовать только одна интегральная линия, проходящая через А и В.

Разыскание функций, подозрительных на минимум интеграла, мы привели к решению следующей граничной задачи дифференциальных уравнений: на отрезке [x1, x2] нужно найти те решения уравнения (17), которые на концах этого отрезка принимают заданные значения y1, y2.

Часто эту последнюю задачу удается решить при помощи методов, известных в теории дифференциальных уравнений.

Еще раз указываем на то, что каждое решение такой граничной задачи может только подозреваться на минимум и в дальнейшем еще

надлежит проверить, будет ли оно или не будет доставлять минимальное значение интегралу. Но в частных случаях, особенно часто встречающихся в приложениях, уравнение Эйлера вполне решает задачу о нахождении минимума интеграла. Пусть нам заранее будет известно, что функция, доставляющая минимум интегралу, существует, и мы допустим, кроме того, что уравнение Эйлера (17) имеет только одно решение, удовлетворяющее граничным условиям (11), и, стало быть, только одна допустимая линия может быть заподозрена на минимум. При этих условиях можно быть уверенным в том, что найденное решение уравнения (17) действительно дает минимум интегралу.

Пример. Ранее было установлено, что задача о линии наискорейшего ската может быть приведена к нахождению минимума интеграла

на множестве функций, удовлетворяющих граничным условиям

у(0) = 0, у(x2) = y2.

В этой задаче

Уравнение Эйлера имеет форму

После некоторых упрощений оно приводится к виду

Умножая обе части равенства на у' и интегрируя, получим

Полагая теперь

найдем после подстановки и упрощения

откуда, интегрируя, получаем:

Так как кривая

должна проходить через начало координат, следует положить С = 0. Мы видим, таким образом, что брахистохрона есть циклоида

Постоянная к должна быть найдена из того условия, чтобы эта кривая прошла через точку M2(x2, y2).

Функционалы, зависящие от нескольких функций. Рассмотренный нами простейший функционал вариационного исчисления (17) зависел лишь от одной функции. В приложениях с такого рода функционалами приходится встречаться в тех случаях, когда изучаемый объект (или его поведение) определяется лишь одной функциональной зависимостью. Например, линия на плоскости определяется зависимостью ординаты ее точки от абсциссы, движение материальной точки вдоль оси определяется зависимостью ее координаты от времени и т. п.

Не менее часто приходится встречаться с объектами, которые уже не могут быть определены столь просто. Чтобы задать линию в пространстве, необходимо указать две функциональные зависимости двух ее координат от третьей. Движение точки в пространстве определяется зависимостью трех ее координат от времени и т. д. Изучение таких более сложных объектов приводит к вариационным задачам с несколькими изменяющимися функциями.

Мы ограничимся случаем, когда функционал зависит от двух функций у (х) и z (х), так как случай большего числа функций ничем в принципе от него не отличается.

Поставим следующую задачу. Допустимые к сравнению пары функций у (х) и z(x) определим условиями:

1) функции

у = у(х), z=.z(x) (18)

— непрерывно дифференцируемы на отрезке [х1, x2];

2) на концах отрезка эти функции принимают заданные значения

(19)

Среди всевозможных пар функций у (х) и z(x) нужно найти ту, которой отвечает наименьшее значение интеграла

(20)

В трехмерном пространстве х, у, z каждой паре допустимых функций будет отвечать линия l, определяемая уравнениями (18) и проходящая через точки M1(x1, y1, z1), M2(x2, y2, z2).

Нам нужно найти минимум интеграла (20) на множестве всех таких линий.

Предположим, что пара функций, доставляющая минимум интегралу (20), существует, и назовем эти функции у(х) и z(x). Наряду с ними мы рассмотрим другую пару функций

где η (х) и ζ(х) — любые непрерывно дифференцируемые функции, обращающиеся в нуль на концах x1, x2 отрезка; у, z также будут допустимы, и при α = 0 они совпадут с функциями у, z. Подставим их в (20)

Полученный интеграл будет функцией от ос. Так как при α = 0 у и z совпадут с у и z, функция Ф(а) должна иметь минимум при α = 0. В точке же минимума производная Ф обращается в нуль

Ф'(0) = 0.

Вычисление производной дает

или, если члены с η' и ζ' проинтегрировать по частям,

Последнее равенство должно выполняться для любых двух непрерывно дифференцируемых функций η (х) и ζ (х), обращающихся в нуль на концах отрезка. Отсюда, на основании леммы, доказанной несколькими страницами раньше, легко можно заключить, что должны быть выполнены два условия

(21)

Итак, если функции у, z доставляют интегралу (20) минимум, они должны удовлетворять системе дифференциальных уравнений Эйлера (21).

Такое заключение вновь позволяет вариационную задачу о минимуме интеграла (20) заменить граничной проблемой теории дифферен-

циальных уравнений: на отрезке [x1, x2] нужно найти решение y, z системы дифференциальных уравнений (21), удовлетворяющее граничным условиям (19).

Как и в прежнем случае, это открывает один из возможных путей для решения поставленной минимальной задачи.

В качестве примера приложения эйлеровой системы (21) рассмотрим вариационный принцип Остроградского — Гамильтона в ньютоновой механике. Ограничимся простейшей формой этого принципа.

Возьмем материальное тело массы m и будем считать, что размерами и формой тела мы можем пренебрегать и принимать его за материальную точку.

Допустим, что из положения M1(x1, y1, z1), которое точка занимает в момент времени t1, она к моменту времени t2 переместилась в положение M2(x2, y2, z2). Предположим, что движение было подчинено законам механики Ньютона и происходило под действием силы F(x, у, zt t), зависящей от положения точки и времени t и имеющей потенциальную функцию U (х, у, z, t). Последнее означает следующее: составляющие Fx, Fy, Fz силы F по осям координат будут частными производными от некоторой функции U по соответствующим координатам

Движение считаем свободным, не подчиненным никаким ограничивающим связям1.

Уравнения движения Ньютона будут

Следуя законам механики Ньютона, точка совершит перемещение вполне определенным способом. Наряду с «ньютоновским движением» точки мы будем рассматривать другие ее движения, которые коротко будем называть «допустимыми». Их мы определим двумя требованиями: в момент времени t1 точка занимает положение M1 и в момент t2 — положение M2.

Как можно отличить «ньютоновское движение» точки от всякого другого «допустимого» ее движения? Такую возможность и дает принцип Остроградского — Гамильтона.

Введем кинетическую энергию точки

1 Для принципа Остроградского — Гамильтона это несущественно: на механическую систему могут быть наложены любые, даже нестационарные связи, лишь бы они были голономными, т. е. могли быть записаны в форме уравнений, не содержащих производных от координат по времени.

и составим так называемый интеграл действия

Содержание принципа таково: «ньютоновское движение» точки отличается от всякого ее «допустимого» движения тем, что оно доставляет интегралу действия стационарное значение.

Интеграл действия I зависит от трех функций: x(t), y(t), z(t).

Так как во всех сравниваемых движениях начальное и конечное положения точки одинаковы, граничные значения этих функций являются закрепленными. Мы имеем здесь вариационную задачу с тремя варьируемыми функциями, имеющими фиксированные значения на концах промежутка [t1, t2].

Выше мы условились говорить, что интеграл (17) имеет стационарное значение на некоторой линии, если она является интегральной линией уравнения Эйлера. В нашей задаче интегрируемая функция

зависит от трех функций и для стационарного значения интеграла должна выполняться система трех дифференциальных уравнений

Так как Fx = dU/dx, Fx' = mx',..., то система уравнений Эйлера будет совпадать с уравнениями движения в механике Ньютона. Этим справедливость высказанного принципа установлена.

Задача о минимуме кратного интеграла. Последняя задача вариационного исчисления, на которой мы задержим внимание читателя, — это задача о минимуме кратного интеграла. Так как факты, связанные с решением таких задач, сходны для интегралов любой кратности, мы остановимся на наиболее простом из кратных интегралов — двойном интеграле.

Пусть В есть область плоскости Оху, ограниченная контуром I. Множество допустимых к сравнению функций определим условиями:

1) u(х, у) непрерывно дифференцируема в области В,

2) u на I принимает заданные значения

(22)

Среди всех функций и нужно найти ту, которая дает минимальное значение интегралу

(23)

Задание граничных значений (22) для функции и в пространстве (х, у, и) означает задание пространственного контура Г, лежащего над I (см. рис. 2 на стр. 155).

Мы рассматриваем всевозможные поверхности S, проходящие через Г и лежащие над В. Среди них хотим найти ту, для которой интеграл (23) будет минимальным.

Попрежнему считаем функцию, дающую минимум интегралу, существующей; обозначим ее через и. Одновременно рассмотрим другую функцию

где η (х, у) — любая непрерывно дифференцируемая функция, обращающаяся в нуль на I. Тогда функция

должна иметь минимум при α = 0. В таком случае первая производная от нее должна обращаться в нуль при х = 0

Ф' (0) = 0,

или

(24)

Преобразуем два последние слагаемые при помощи формулы Остроградского.

Контурный интеграл по I должен исчезнуть, так как на контуре l функция η равна нулю, и условию (24) мы можем придать форму

Это равенство должно быть выполнено для всякой функции η, непрерывно дифференцируемой и обращающейся в нуль на границе L

Отсюда, подобно предыдущему, можно заключить, что во всех точках области В должно быть выполнено уравнение

(25)

Таким образом, если функция и дает минимум интегралу (23), то она должна удовлетворять уравнению (25) в частных производных.

Как и во всех предшествующих задачах, здесь устанавливается связь между вариационной проблемой о минимуме интеграла и граничной задачей дифференциального уравнения (в данном случае — уравнения в частных производных).

Пример. Отклонение u (х, у) точек мембраны с деформированным краем должно быть найдено из условия минимума потенциальной энергии

при заданных граничных значениях u|l=φ.

Опуская для простоты постоянный множитель μ, можно считать

и уравнение (25) будет иметь вид или

Следовательно, определение отклонений точек мембраны приводится к нахождению гармонической функции и, принимающей на контуре области заданные значения φ (см. главу VI, § 3).

§ 3. МЕТОДЫ ПРИБЛИЖЕННОГО РЕШЕНИЯ ЗАДАЧ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ

Мы закончим настоящую главу указанием на идеи некоторых приближенных методов вариационного исчисления.

Для определенности будем говорить о простейшем функционале

при закрепленных граничных значениях допустимых функций.

Пусть у (х) есть точное решение задачи о минимуме I, а m = I(у) — соответствующее минимальное значение интеграла. Ясно, что если мы

укажем допустимую функцию у, для которой значение интеграла I (у) весьма близко к m, то можно рассчитывать, что и у будет мало отличаться от точного решения у. Кроме того, если нам удастся построить последовательность допустимых функций y1, y2,.. ., для которых I(yn)→ m, то можно ожидать, что такая последовательность будет сходиться к решению у в том или ином смысле, и, стало быть, вычисляя yn достаточно большого индекса, мы сможем найти решение со сколь угодно высокой степенью точности.

В зависимости от того, какое правило мы избираем для построения «минимизирующей последовательности» yn (n = 1, 2,...), мы будем получать тот или иной приближенный метод вариационного исчисления.

Первым по времени приближенным методом является метод ломаных линий, или метод Эйлера. Разделим отрезок [x1, x2] на некоторое число частей. Например, выберем эти части одинаковыми, так что точки деления будут

Построим теперь ломаную линию рn-1 с вершинами, лежащими над точками деления. Ординаты вершин ее обозначим

и при этом потребуем, чтобы она имела те же конец и начало, что и все допустимые линии, так что b0 = y1 и bn = y2. Тогда ломаная линия будет определяться ординатами

Вопрос теперь заключается в том, как следует подобрать ломаную рn (т. е. ординаты bi ее вершин), чтобы по возможности хорошо приблизиться к точному решению задачи.

Для достижения этой цели естественно поступить так. Вычислим интеграл I для ломаной линии. Значение его будет зависеть от bi

и будет функцией этих ординат. Выберем теперь bi так, чтобы придать I (Pn—1) минимальное значение. Для определения всех bi мы будем иметь систему уравнений

Так как к любой допустимой линии, в частности, к точному решению задачи, можно приблизиться при помощи ломаных линий сколь угодно близко не только по положению на плоскости, но и по направлениям касательных, то совершенно ясно, что полученная в результате вычислений последовательность ломаных линий рn-1 будет, наверное, мини-

мизирующей. Взяв n достаточно большим, мы можем надеяться приблизиться к решению сколь угодно точно на всем отрезке [x1, x2]. Разумеется, факт сходимости должен быть исследован в каждом случае.

Весьма широкое распространение в физике и технике получил также следующий, очень удобный по вычислениям, метод.

Возьмем любую функцию φ0(х), удовлетворяющую граничным условиям φ0(x1) = y1 и φ(x2) = y2, и последовательность функций φ1(х), φ2 (x),..., обращающихся в нуль на концах отрезка [x1, x2].

Образуем затем линейную комбинацию

При любых значениях численных коэффициентов a1, a2,..., an функция sп(х) будет допустимой.

Подставив sn (х) вместо у в интеграл I и выполнив все необходимые вычисления, мы получим некоторую функцию коэффициентов ai.

Выберем теперь ai так, чтобы эта функция имела наименьшее значение. Коэффициенты должны быть найдены из системы

Решив эту систему, мы получим, вообще говоря, определенные значения коэффициентов a1, ..., an, дающие I(sn) минимум, и по ним построим приближение к решению

Построенная так последовательность приближений sn (n = l, 2,...) не при всяком выборе функций φi будет минимизирующей. Чтобы это было так, нужно, чтобы последовательность функций φi. удовлетворяла некоторым условиям «полноты», на выяснении которых мы останавливаться не будем.

ЛИТЕРАТУРА

Люстерник Л. А. Кратчайшие линии (вариационные задачи). Популярные лекции по математике, вып. 19. Гостехиздат, 1956.

Университетские учебники

Ахиезер Н. И. Лекции по вариационному исчислению. Гостехиздат, 1955.

Лаврентьев М. А. и Люстерник Л. А. Курс вариационного исчисления. Гостехиздат, 1950.

Смирнов В. И. Курс высшей математики, т. IV, изд. 3-е, Гостехиздат, 1953.

Глава IX

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

§ 1. КОМПЛЕКСНЫЕ ЧИСЛА И ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

Комплексные числа и их значение для алгебры. Комплексные числа были введены в математику в связи с решением алгебраических уравнений. Невозможность решить алгебраическое уравнение

(1)

в области действительных чисел привела к введению условного числа, мнимой единицы г, определяемой равенством

(2)

Числа вида a + bi, где а и b — действительные числа, получили название комплексных чисел. С этими числами стали оперировать как с действительными числами, складывая и умножая их как двучлены. Если при этом использовать равенство (2), то основные операции арифметики над комплексными числами снова приводят к комплексным числам1. Деление комплексных чисел, определяемое как действие, обратное умножению, оказалось также выполнимой всегда однозначным образом операцией, если только делитель не равен нулю. Таким образом, на первых порах введение комплексных чисел выявило интересное, но пока формальное, обстоятельство: наряду с действительными числами существуют другие числа, комплексные, с которыми также выполнимы все арифметические операции.

Дальнейшим шагом явилось геометрическое изображение комплексных чисел. Каждое комплексное число a + bi может быть изображено точкой на плоскости Оху с координатами (а, b) или вектором, идущим из начала координат в точку (а, b). Это привело к новой точке зрения на комплексные числа. Комплексные числа — это пары (а, b) действительных чисел, над которыми установлены определенные операции сложения и умножения, подчиняющиеся тем же законам, что и операции

1 Комплексные числа известны читателю еще из средней школы, о них см. также главу IV (том 1), § 3.

над действительными числами. При этом обнаружилось замечательное обстоятельство: сумма двух комплексных чисел

геометрически изображается диагональю параллелограма, построенного на векторах, изображающих слагаемые (рис. 1). Таким образом, комплексные числа складываются по тому же закону, как и векторные величины, встречающиеся в механике и физике: силы, скорости, ускорения. Это дало повод рассчитывать на то, что комплексные числа имеют не только значение чисто формальных обобщений, но могут быть применимы к изображению реальных физических величин.

Мы увидим дальше, к какому громадному успеху привела эта точка зрения в различных задачах математической физики.

Однако введение комплексных чисел прежде всего начало приносить успех в области раскрытия законов алгебры и анализа. Область действительных чисел, замкнутая относительно арифметических операций, оказалась недостаточно полной для алгебры. Уже такое простое уравнение, как (1), не имеет корней в области действительных чисел. Замечательным фактом явилась основная теорема высшей алгебры: всякое алгебраическое уравнение

с комплексными коэффициентами имеет n комплексных корней1.

Эта теорема показывает, что комплексные числа образуют систему чисел, в известном смысле полную, относительно операций алгебры. Совсем не тривиально, что добавление к области действительных чисел корня только одного уравнения (1) приводит к числам a + bi, в области которых решается любое алгебраическое уравнение. Основная теорема высшей алгебры показала, что теория многочленов, даже с действительными коэффициентами, может получить законченную форму только тогда, когда мы рассматриваем значения многочлена во всей комплексной плоскости. Дальнейшее развитие теории алгебраических многочленов все больше и больше утверждало эту точку зрения. Свойства многочленов раскрываются только при рассмотрении их как функций комплексного переменного.

Степенные ряды и функции комплексного переменного. Развитие анализа выявило ряд фактов, показывающих, что введение комплекс-

Рис. 1.

1 См. главу IV (том 1), § 3.

ных чисел имеет значение не только в теории многочленов, но и для другого важнейшего класса функций — класса функций, разлагающихся в степенной ряд

(3)

Как уже говорилось в главе II (том 1), развитие анализа бесконечно малых потребовало установления более четкой точки зрения на понятие функции и возможные способы задания функции в математике. Не останавливаясь здесь на этих интересных вопросах, напомним только, что на самых первых порах развития анализа выявилось, что наиболее часто встречающиеся функции разлагаются вблизи каждой точки области их определения в степенной ряд. Например, этим свойством обладают все так называемые элементарные функции.

Большинство конкретных задач анализа приводило к функциям, разлагающимся в степенные ряды. С другой стороны, было желание связать определение «математической» функции с «математической» формулой, а степенной ряд представлялся весьма всеобъемлющим видом «математической» формулы. Эти обстоятельства привели даже к серьезным попыткам ограничить анализ изучением функций, разлагающихся в степенной ряд и получивших название аналитических функций. Развитие науки показало, что такое ограничение нецелесообразно. Задачи математической физики стали выводить за класс аналитических функций, который не содержит уже, например, функций, изображаемых кривыми с угловой точкой. Однако класс аналитических функций, благодаря своим замечательным свойствам и многочисленным приложениям, стал важнейшим из классов функций, изучаемых математикой.

Так как вычисление каждого из членов степенного ряда требует только арифметических операций, значения функции, изображаемой степенным рядом, могут быть вычислены и для комплексных значений аргумента, для тех, при которых ряд продолжает сходиться. Определяя таким образом функцию действительного переменного и для комплексных значений, мы говорим об ее «продолжении» в комплексную область. Поэтому аналитическую функцию, как и многочлены, можно рассматривать не только для действительных, но и для комплексных значений аргумента. Более того, можно также рассматривать степенные ряды с комплексными коэффициентами. Свойства аналитических функций, как и свойства многочленов, раскрываются полно только тогда, когда их рассматривают в комплексной области. Для иллюстрации приведем теперь же один пример.

Рассмотрим две функции действительного переменного

Обе эти функции конечны, непрерывны и дифференцируемы произвольное число раз на всей оси Ох. Их можно разложить в ряд Тейлора, например, около начала х = 0

(4) (5)

Первый из полученных рядов сходится для всех значений х, между тем как второй ряд сходится только при —1 <х< +1. Рассмотрение функции (5) для действительных значений аргумента не позволяет раскрыть, какими ее свойствами вызвана расходимость ее ряда Тейлора при |x| ⩾ 1. Переход в комплексную область позволяет выяснить это

обстоятельство. Рассмотрим ряд (5) для комплексных значений аргумента

(6)

Сумма n членов этого ряда

вычисляется, как и для действительных значений z:

откуда

Это выражение показывает, что при

так как | z |2n → 0. Таким образом, при комплексных z, удовлетворяющих неравенству |z|<1, ряд (6) сходится и имеет сумму 1/1+z2. При |z| ⩾ 1 ряд (6) расходится, так как в этом случае разность sn — sn-1 = (—1)n-1z2n-2 не стремится к нулю.

Неравенство | z |< 1 показывает, что точка z отстоит от начала координат на расстоянии, не превосходящем единицу. Таким образом, точки, в которых сходится ряд (6), на комплексной плоскости образуют круг с центром в начале координат. На окружности этого круга лежат две точки i и — i, в которых функция 1/1+z2 обращается в бесконечность; наличие этих точек и обусловило ограниченность области сходимости ряда (6).

Область сходимости степенного ряда. Область сходимости степенного ряда

(7)

на комплексной плоскости всегда есть круг с центром в точке а..

Докажем это предложение, носящее название теоремы Абеля. Прежде всего заметим, что ряд, члены которого — комплексные числа wn,

(8)

можно рассматривать как два ряда, составленные из действительных частей и коэффициентов при мнимых частях чисел wn = un+ ivn

(9) (10)

Частичная сумма sn ряда (8) выражается через частичные суммы an и τn рядов (9) и (10)

поэтому сходимость ряда (8) равносильна сходимости обоих рядов (9) и (10), а сумма s ряда (8) выражается через суммы σ и τ рядов (9) и (10)

s = g + h.

После этих замечаний становится очевидной следующая лемма.

Если члены ряда (8) по абсолютной величине меньше членов сходящейся геометрической прогрессии

с положительными А и q, где q<1, то ряд (8) сходится.

В самом деле, если |wn|<Aqn, то

поэтому [см. главу II (том 1), § 14] сходятся ряды (9) и (10), а следовательно, и ряд (8).

Докажем теперь, что если степенной ряд (7) сходится в некоторой точке z0, то он сходится во всех точках, лежащих внутри круга с центром в точке а, на границе которого лежит z0 (рис. 2). Из этого утверждения легко следует, что область сходимости ряда (7)

есть или вся плоскость, или единственная точка z = a, или некоторый круг конечного радиуса.

Итак, пусть ряд (7) сходится в точке z0; тогда общий член ряда (7) для z = z0 стремится к нулю при n→ ∞, и, значит, все члены ряда (7) лежат внутри некоторого круга; пусть А — радиус такого круга, тогда при любом п

(11)

Рис. 2.

Возьмем теперь любую точку z, отстоящую от а на расстоянии меньшем, чем точка z0, и покажем, что в точке z ряд сходится. Очевидно

поэтому

(12)

Оценим общий член ряда (7) в точке z

в силу неравенств (11) и (12) отсюда вытекает

т. е. общий член ряда (7) в точке z меньше общего члена сходящейся геометрической прогрессии. На основании доказанной выше леммы ряд (7) сходится в точке z.

Круг, в котором степенной ряд сходится, а вне которого расходится, носит название круга сходимости; радиус этого круга называется радиусом сходимости степенного ряда. Граница круга сходимости, оказывается, всегда проходит через ближайшие к а точки комплексной плоскости, в которых происходит нарушение правильного поведения функции.

Степенной ряд (4) сходится во всей плоскости комплексного переменного; степенной ряд (5), как уже было сказано, имеет радиус сходимости, равный единице.

Показательная и тригонометрические функции комплексного переменного. Степенной ряд может служить для «продолжения» функций действительного переменного в комплексную область. Так, например, для комплексных значений z определяем функцию ez степенным рядом

(13)

Аналогично вводятся тригонометрические функции комплексного переменного

(14) (15)

Эти ряды сходятся во всей плоскости.

Интересно отметить связь, которая обнаруживается между показательной и тригонометрическими функциями при переходе в комплексную область.

Подставляя в равенство (13) iz вместо z, получим

Группируя вместе члены без множителя i и члены с множителем i, получаем

(16)

Аналогично выводится

(16')

Формулы (16) и (16') носят название формул Эйлера. Решая (16) и (16') относительно cos z и sin z, получаем

(17)

Весьма важно, что для комплексных значений аргумента остается верным простое правило, называемое теоремой сложения аргумента

(18)

Так как для комплексных значений аргумента мы определили функцию еz рядом (13), формулу (18) надо доказать, исходя из этого определения. Проведем это доказательство:

Будем производить умножение рядов почленно. Получаемые члены при перемножении рядов мы можем выписать в виде квадратной таблицы

Соберем теперь вместе члены с одинаковой суммой степеней z1 и z2. Легко заметить, что такие члены лежат на диагоналях нашей таблицы. Получаем

(19)

Общий член этого ряда будет

Применяя формулу бинома Ньютона, приведем общий член к виду

Таким образом, общий член ряда (19) совпадает с общим членом ряда для и это доказывает теорему о правиле умножения (18).

Теорема сложения и формулы Эйлера позволяют вывести выражение для функции еz через функции действительных переменных в конечном виде (без ряда). В самом деле, полагая

получим

и так как находим

(20)

Полученная формула очень удобна при исследовании свойств функции еz. Отметим два ее свойства: 1) функция еz нигде не обращается в нуль; в самом деле, ех≠0, и входящие в формулу (20) cosy и sin у одновременно не могут обратиться в нуль; 2) функция e8 имеет период 2πi, т. е.

Последнее следует из теоремы умножения и равенства

Формулы (17) позволяют исследовать функции cosz и sinz в комплексной области. Мы предоставляем читателю доказать, что в комплексной области cos z и sinz имеют период 2π и для них верны теоремы о синусе и косинусе суммы.

Общее понятие функции комплексного переменного и дифференцируемость функций. Степенные ряды позволяют определить аналитические функции комплексного переменного. Однако представляет интерес изучить для произвольных функций комплексного переменного основные операции анализа и в первую очередь операцию дифференцирования. Здесь обнаруживаются весьма глубокие факты, связанные с дифференцированием функций комплексного переменного. Как увидим дальше, с одной стороны, функция, имеющая первую производную во всех

точках окрестности некоторой точки z0, обязательно имеет в z0 производные всех порядков и, более того, разлагается в этой точке в степенной ряд, т. е. будет аналитической. Таким образом, рассматривая дифференцируемые функции комплексного переменного, мы опять приходим к классу аналитических функций. С другой стороны, изучение производной откроет нам геометрическую природу функций комплексного переменного и связи теории функций с задачами уравнений математической физики.

Ввиду изложенного мы будем дальше называть аналитической в точке z0 функцию, имеющую производную во всех точках некоторой окрестности z0.

Мы будем говорить, исходя из общего определения функции, что комплексное переменное w есть функция комплексного переменного z, если указан закон, позволяющий получить значение w по заданному значению z.

Каждое комплексное число z = х + iy изображается точкой (x, у) на плоскости Оху, а числа w = u + iv будем изображать точками на своей плоскости Ouv — плоскости функции. Тогда с геометрической точки зрения функция комплексного переменного

w = f(z)

определяет закон соответствия между точками плоскости Оху аргумента и точками плоскости Ouv функции. Другими словами, функция комплексного переменного дает отображение плоскости аргумента на плоскость функции. Задать функцию комплексного переменного это значит задать соответствие между парами чисел (х, у) и (u, v), поэтому задание функции комплексного переменного равносильно заданию двух функций

u = φ(х, у), v = ξ(x, y),

причем очевидно

Например, если то

Производная от функции комплексного переменного определяется формально так же, как и производная функции действительного переменного. Производная есть предел отношения приращения функции к приращению аргумента

(21)

если предел существует.

Если мы предположим, что две действительные функции u и v, составляющие w = f(z), имеют частные производные по х и у, то этого оказывается еще недостаточно для того, чтобы существовала производная от функции f(z). Предел отношения приращений, как правило, зависит от направления, по которому точка zr = z+kz приближается к точке z (рис. 3). Для существования производной f(z) надо, чтобы этот предел не зависел от способа приближения z' к z. Рассмотрим, например, случаи, когда z' приближается к z параллельно оси Ох или параллельно оси Oy.

В первом случае

и отношение приращений

при Δx → 0 будет стремиться к

(22)

Во втором случае

и отношение приращений

в пределе даст

(23)

Если функция w = f(z) имеет производную, то два полученных выражения должны быть равны и, следовательно,

(24)

Выполнение этих уравнений есть необходимое условие для существования производной функции w = u +- iv. Оказывается, что условия (24) не только необходимы, но и достаточны (если функции и и v имеют полный дифференциал). Мы не будем останавливаться на доказательстве достаточности условий (24). Условия (24) носят название уравнений Коши—Римана.

Рис. 3.

Легко убедиться, что ряд правил дифференцирования функций действительного переменного без изменения переносится на функции комплексного переменного. Так обстоит дело с дифференцированием функции zn, суммы, произведения и частного. Сам вывод этих формул остается таким же, как для функций действительного переменного, надо только, вместо действительных величин, подразумевать комплексные. Это показывает, что всякий многочлен от z

есть всюду дифференцируемая функция. Любая рациональная функция, равная отношению двух многочленов

дифференцируема во всех точках, где знаменатель не равен нулю.

Чтобы убедиться в дифференцируемости функции w = ez, можно использовать условия Коши—Римана. В нашем случае на основании формулы (20)

подстановка этих функций в (24) показывает, что уравнения Коши— Римана удовлетворяются. Производная может быть вычислена, например, по формуле (22). Это дает

На основании формул (17) легко убедиться в дифференцируемости тригонометрических функций и в применимости известных из анализа формул для значения их производных.

Функция Lnz. Мы не будем здесь проводить исследования всех элементарных функций комплексного переменного. Однако для нас важно будет познакомиться еще со свойствами функции Lnz. Так же как в действительной области, полагаем

если

Чтобы проанализировать функцию Lnz, запишем число z в тригонометрической форме

Применяя теорему сложения к ew получим

Сравнение двух полученных выражений для z дает

(α)

Имея в виду, что и и r — действительные числа, из формулы (α) выводим

где ln r — обычное значение натурального логарифма действительного числа. Равенство ((i) может выполняться только в случае, если

а для этого v и φ должны отличаться на число, кратное 2π, причем при любом целом n равенство (β) будет выполняться. На основании полученных выражений для и и v

(25)

Формула (25) определяет функцию Lnz для всех значений комплексного числа z, отличных от нуля. Она дает определение логарифма не только для положительных, но и для отрицательных и комплексных чисел.

Полученное выражение для функции Lu z содержит произвольное целое число n. Это значит, что Lnz есть многозначная функция. При любом значении n получаем одно из возможных значений функции Ln z. Если мы фиксируем значение n, то получим одно из возможных значений этой функции.

Однако различные значения Lnz, оказывается, органически связаны между собой. В самом деле, фиксируем, например, в точке z0 значение n = 0. Пусть теперь z непрерывно движется по замкнутой кривой С, окружающей начало координат и возвращающейся в точку z0 (рис. 4). При движении z полярный угол φ будет непрерывно возрастать и, после того как точка z пройдет весь замкнутый контур, φ увеличится на 2х. Таким образом, фиксировав в z0 значение логарифма

и изменяя это значение непрерывно при движении z вдоль замкнутой кривой, окружающей начало координат, мы вернемся в точку z0 с другим значением функции

Это убеждает нас в том, что можно непрерывным образом перейти от любого значения Lnz к другому. Для этого надо, чтобы точка непрерывным образом обошла начало координат нужное число раз. Точка z = 0 называется точкой ветвления для функции Lnz.

Рис. 4

Если мы хотим ограничиться рассмотрением лишь одного значения функции Lnz, мы должны запретить точке z описывать замкнутые кривые, окружающие точку z = 0. Это можно сделать, проведя из начала координат в бесконечность непрерывную линию и запретив точке z пересекать эту линию, называемую разрезом. Если z будет изменяться в плоскости с разрезом, то уже нельзя получить непрерывного перехода от одного значения Lnz к другому, и, исходя из определенного значения логарифма в какой-нибудь точке z0, мы в каждой точке получим лишь одно значение логарифма. Такое выделенное значение функции Lnz называется ее однозначной ветвью.

Например, если разрез проведен вдоль отрицательной части оси Ох, мы получим однозначные ветви Ln z, ограничивая изменение аргумента в пределах

где к— произвольное целое число.

Рассматривая однозначную ветвь логарифма, мы можем изучить его дифференцируемость. Полагая

легко проверить, что Lnz удовлетворяет условиям Коши — Римана, а производная, вычисленная, например, по формуле (22), будет равна

Подчеркнем, что производная Lnz уже есть однозначная функция.

§ 2. СВЯЗЬ ФУНКЦИЙ КОМПЛЕКСНОГО ПЕРЕМЕННОГО С ЗАДАЧАМИ МАТЕМАТИЧЕСКОЙ ФИЗИКИ

Связь с задачами гидродинамики. Условия Коши — Римана связывают между собой задачи математической физики и теорию функций комплексного переменного. Проиллюстрируем это на задачах гидродинамики.

Среди всех возможных движений жидкой среды важную роль играют установившиеся движения. Так называются движения жидкости, для которых не меняется со временем картина распределения скоростей в пространстве. Так, например, наблюдатель, стоящий на мосту и наблюдающий за обтеканием мостового быка рекой, видит установившуюся картину обтекания. Иногда течение становится установившимся для наблюдателя, движущегося вместе с некоторым телом. Если при движении парохода за возмущенным движением воды будет наблюдать человек, стоящий на берегу, то для него картина движения воды не будет установившейся, но для наблюдателя, находящегося на пароходе, течение воды уже будет установившимся. Для пассажира,

сидящего в самолете, который летит с постоянной скоростью, возмущенное самолетом движение воздуха тоже будет установившимся.

При установившемся движении вектор скорости V частицы жидкости, проходящей через заданную точку пространства, не меняется со временем. Если движение — установившееся для движущегося наблюдателя, то вектор скорости не будет меняться со временем в точках, имеющих постоянные координаты в системе координат, движущейся вместе с наблюдателем.

Среди движений жидкости большое значение получил класс плоскопараллельных движений. Это—течения, при которых скорости частиц всюду параллельны некоторой плоскости, а картина распределения скоростей одинакова во всех плоскостях, параллельных заданной плоскости.

Если мы представим себе беспредельную массу жидкости, обтекающую цилиндрическое тело перпендикулярно его образующей, то во всех плоскостях, перпендикулярных образующей, картина распределения скоростей будет одинакова и движение жидкости будет плоскопараллельным. Иногда движение жидкости можно приближенно рассчитывать как плоскопараллельное. Например, если мы хотим определить картину скоростей течения воздуха в плоскости, перпендикулярной крылу самолета, то в случае, когда эта плоскость расположена не очень близко к фюзеляжу или к концу крыла, движение воздуха можно приближенно считать плоскопараллельным.

Покажем, как может быть применена теория функций комплексного переменного к изучению установившихся плоскопараллельных течений жидкости. При этом мы будем считать, что жидкость несжимаема, т. е. что ее плотность не меняется с изменением давления. Таким свойством обладает, например, вода, но оказывается, что даже воздух можно при изучении его движений считать несжимаемым, если скорости движения не очень велики. Гипотеза о несжимаемости воздуха не вносит заметных искажений, если скорости движения не превосходят 0,6—0,8 от скорости звука (с = 330 м/сек).

Течение жидкости характеризуется распределением скоростей ее частиц. Если течение плоскопараллельное, то достаточно знать скорости частиц в одной из плоскостей, параллельно которым происходит движение.

Будем обозначать через V(x, у, t) вектор скорости частицы, проходящей через точку с координатами х, у в момент времени t. В рассматриваемом случае установившегося движения V не зависит от времени. Вектор V будем считать заданным его проекциями и и v по осям координат. Рассмотрим траектории частиц жидкости. В случае установившихся движений траектории частиц, исходящих из заданных точек пространства, не будут меняться со временем. Если известно поле скорости, т. е. известны компоненты скорости как функции х, у,

то траектории частиц можно определить, пользуясь тем, что скорость частицы всегда касательна к траектории. Это дает

Полученное уравнение есть дифференциальное уравнение для траекторий. Траектории частиц установившегося движения носят название линий тока. Через каждую точку плоскости движения проходит одна линия тока.

Важную роль играет понятие функции тока. Фиксируем какую-нибудь линию тока C0 и рассмотрим воображаемый канал, ограниченный цилиндрическими поверхностями (с образующей, перпендикулярной плоскости течения), проведенными через линию тока C0 и другую линию тока C1, и двумя плоскостями, параллельными плоскостям движения и отстоящими одна от другой на расстоянии, равном единице (рис. 5). Если мы рассмотрим два произвольных поперечных сечения нашего канала, определенных сечениями γ1 и γ2, то количество жидкости, протекающее через сечения γ1 и γ2 в единицу времени, будет одно и то же. В самом деле, внутри объема, определяемого стенками C1, C0 и γ1, γ2, количество жидкости, при постоянной плотности, не может изменяться. С другой стороны, боковые стенки канала C0 и C1 образованы линиями тока, поэтому сквозь них жидкость не протекает, и, следовательно, сколько втекает жидкости в единицу времени через γ1, столько же вытекает через γ2.

Функцией тока называется функция ψ (х, у), принимающая на линии тока C1 постоянное значение, равное количеству жидкости, протекающему в единицу времени через поперечное сечение канала, построенного на линиях C0 и C1.

Функция тока определена с точностью до произвольной постоянной, зависящей от выбора начальной линии тока C0. Если известна функция тока, то уравнения линий тока, очевидно, будут

Компоненты скорости течения выражаются через производные от функции тока. Чтобы получить эти выражения, рассмотрим канал, образованный линией тока С, проходящей через заданную точку M (х, у), линией тока С', проходящей через близкую точку М'(х, у+Δу).

Рис. 5.

и двумя параллельными плоскости движения плоскостями, отстоящими на расстоянии, равном единице. Вычислим количество жидкости q, протекающее за время dt через поперечное сечение ММ' канала. С одной стороны, в силу определения функции тока

С другой стороны, q равно (рис. 6) объему тела, полученного проведением в каждой точке сечения ММ' вектора Vdt. Если ММ' мало, то мы можем считать, что V на всем ММ' постоянен и равен значению V в точке М. Площадь основания полученного параллелепипеда равна Δyx1 (на рис. 6 единичная толщина слоя не указана), а высота — проекции вектора Vdt на ось Ох, т. е. и dt, поэтому

и, следовательно,

Разделив это равенство на Δу, после перехода к пределу получим

(26)

Аналогичное рассуждение дает для второй компоненты

(26')

Для определения поля скоростей, наряду с функцией тока, вводят еще вторую функцию. Ее введение связано с рассмотрением вращения малых частиц жидкости. Если мы вообразим, что отдельная малая частица жидкости затвердела, то она, вообще говоря, будет иметь вращательное движение. Однако если движение жидкости возникло из покоя и внутреннее трение между частицами жидкости отсутствует, то оказывается, что вращение частиц в жидкости не может возникнуть. Такие движения без вращения частиц носят название безвихревых и играют основную роль при изучении движения тел в жидкости. В гидромеханике устанавливается, что для безвихревых движений существует вторая функция φ(x, у), через которую компоненты скорости выражаются формулами

(27)

Рис. 6.

функция φ называется потенциалом скоростей течения. Будем рассматривать дальше движения с потенциалом скоростей.

Сравнение формул для компонент скорости по функции тока и по потенциалу скоростей приводит к следующему замечательному выводу.

Потенциал скоростей φ (х, у) и функция тока ψ (х, у) течения несжимаемой жидкости удовлетворяют уравнениям Коши — Римана

(28)

Другими словами, функция комплексного переменного

есть дифференцируемая функция комплексного переменного. Обратно: если мы будем исходить из произвольной дифференцируемой функции комплексного переменного, то ее действительная и мнимая части удовлетворяют условиям Коши—Римана и могут быть рассматриваемы как потенциал скоростей и функция тока течения несжимаемой жидкости. Функция V) называется характеристической функцией течения.

Рассмотрим еще смысл производной w. Пользуясь, например, формулой (22), имеем

В силу (27) и (26') находим

или, переходя к сопряженным комплексным величинам,

(29)

где черта над показывает, что надо взять величину, сопряженную с ней.

Таким образом, вектор скорости течения равен сопряженной величине производной характеристической функции течения.

Примеры плоскопараллельных течений жидкости. Рассмотрим несколько примеров. Пусть

w = Az, (30)

где А—комплексная величина. Из (29) следует

Таким образом, линейная функция (30) определяет течение жидкости с постоянным вектором скорости. Если положим

то, разделяя действительную и мнимую части w, будем иметь

таким образом, линиями тока будут прямые линии, параллельные вектору скорости (рис. 7).

В качестве второго примера рассмотрим функцию

считая постоянную А действительной. Чтобы представить картину течения, определим линии тока. В этом случае

а уравнение линий тока

ху = const.

Это — гиперболы, имеющие асимптотами оси координат (рис. 8). Стрелками показано направление движения частиц по линиям тока при А>0. Оси Ох и Oy также являются линиями тока.

Если трение в жидкости весьма мало, то, заменив какую-нибудь линию тока твердой стенкой, мы не нарушим остального течения.

Частицы жидкости будут скользить вдоль поставленной стенки. Пользуясь этим принципом и ставя стенки вдоль осей координат (на рис. 8 они изображены жирной чертой), получим в рассматриваемом примере картину безвихревого обтекания жидкостью угла. Важный случай течения дает функция

(31)

где а и R— действительные положительные величины. Функция тока будет

Рис. 7. Рис. 8.

и, следовательно, уравнение линии тока

В частности, беря постоянную равной нулю, получим или y = 0, или x2 +y2 = R2; следовательно, окружность радиуса R есть линия тока. Если мы заменим твердым телом внутренность этой линии тока, то получим течение около кругового цилиндра. Картина линий тока этого течения изображена на рис. 9. Скорости течения мы можем определить по формуле (29)

Вдали от цилиндра находим

т. е. вдали от цилиндра скорость стремится к постоянной величине и, следовательно, течение становится равномерным. Таким образом, формула (29) определяет течение при обтекании кругового цилиндра равномерным вдали потоком жидкости.

Основные идеи теории крыла самолета. Теорема Жуковского. Применение теории функций комплексного переменного к изучению плоскопараллельных течений жидкости привело Н. Е. Жуковского и С. А. Чаплыгина к замечательным открытиям в аэродинамике. Изучение обтекания тел привело их к открытию закона образования подъемной силы крыла самолета. Чтобы дать представление о ходе идей, приведших к этому открытию, нам надо будет рассмотреть еще один конкретный пример течения жидкости. Рассмотрим характеристическую функцию

где Г — действительная постоянная. Хотя функция w неоднозначная функция, ее производная

(32)

однозначна, и, следовательно, наша функция определяет однозначно поле скоростей некоторого течения жидкости. Полагая z = reiθ, потенциал скоростей и функцию тока можно вычислить при помощи формулы (25)

Рис. 9.

Вторая из этих формул показывает, что линии тока суть круги r = const (рис. 10).

Скорость течения определяется формулой (29)

В частности, отсюда следует, что величина вектора скорости будет

т. е. скорость постоянна на каждой линии тока. Более подробное исследование показывает, что течение идет против часовой стрелки при Г>0 и по часовой стрелке при Г<0. Если мы одну из линий тока заменим твердой границей, то получим круговое движение жидкости около цилиндра. Такое движение называется циркуляционным.

Потенциал нашего движения уже не будет однозначной функцией. При обходе по замкнутому контуру около цилиндра потенциал изменяется на величину Г. Это изменение потенциала носит название циркуляции течения.

Если мы к характеристической функции течения, обтекающего цилиндр (31), прибавим характеристическую функцию циркуляционного течения (с обходом по часовой стрелке), то получим новую характеристическую функцию

(33)

Эта характеристическая функция тоже представляет течение около цилиндра радиуса R. В самом деле, функция тока будет постоянна на окружности радиуса R, так как постоянны коэффициенты мнимых частей обоих слагаемых на этой окружности. Скорость течения, определяемого функцией (33), будет снова стремиться к а при z→∞. Это показывает, что характеристическая функция (33) при любом значении Г определяет обтекание цилиндра поступательным потоком. На рис. 11 изображен характер этого течения при Г > 0. Это течение уже не будет симметричным, и точки а и b натекания и схода струй с цилиндра сместятся вниз. Потенциал рассматриваемого течения будет неоднозначной функцией. Его изменение при обходе около цилиндра будет равно Г.

При обтекании цилиндра, вследствие симметрии, будет обычно реализоваться симметричное течение, определяемое функцией (32), но для других несимметричных тел, оказывается, как правило, реализуются течения с неоднозначным потенциалом. Ниже мы поясним физические основания этого факта. Методы теории функций комплексного переменного позволяют определить возможные течения около тел любой формы.

Рис. 10.

В следующем параграфе мы будем говорить об этих методах. Как около цилиндра, так и около любого тела можно построить течения с однозначным и неоднозначным потенциалом.

При изучении обтекания крыла самолета мы имеем дело с телами, имеющими сзади острую кромку. Профиль крыла самолета всегда заострен сзади. Если для такого профиля построить течение с однозначным потенциалом, то точка схода струи с профиля окажется не совпадающей с острием (рис. 12, а). Оказывается, что такое течение физически невозможно. (При таком обтекании на острие профиля образовались бы бесконечные скорости и бесконечные разрежения.) Течение, при котором точка b совпадает с острием крыла (рис. 12, б), единственно возможное течение, и это течение будет, как правило, с неоднозначным потенциалом, т. е. будет циркуляционным течением. Циркуляция Г такого течения опять определяется как изменение потенциала при обходе замкнутого контура около крыла.

Положение о реализуемости течения около профиля крыла со сходом струи с задней кромки носит название постулата Чаплыгина.

Замечательное открытие Н. Е. Жуковского состоит в том, что при наличии циркуляции в потоке возникает подъемная сила, действующая на крыло, направленная перпендикулярно к скорости а набегающего потока и равная по величине

где р — плотность среды, а Г — циркуляция (рис. 13).

Это положение составляет содержание теоремы Жуковского о подъемной силе крыла, являющейся основой всей современной аэродинамики. В нашу задачу не входит доказательство теоремы Жуковского, мы заметим только, что общепринятые теперь доказательства ее опираются на теорию интегралов от функций комплексного переменного.

Рис. 11

Рис. 12.

Рис. 13.

Основы аэродинамики, заложенные в работах Н. Е. Жуковского и С. А. Чаплыгина, получили широкое развитие в работах советских ученых.

Приложения к другим задачам математической физики. Приложения теории функций комплексного переменного получили широкое распространение не только в теории крыла, но и во многих других задачах гидродинамики.

Однако область приложения теории функций не ограничивается гидродинамикой: она гораздо шире. Ее методы находят широкое использование во многих задачах математической физики. Чтобы это пояснить, вернемся к условиям Коши — Римана

и выведем из них уравнение, которому удовлетворяет действительная часть аналитической функции комплексного переменного. Если первое из этих уравнений продифференцировать по х, а второе — по у и сложить, то получим

Это уравнение (мы с ним уже встречались в главе VI) носит название уравнения Лапласа. Большое число задач физики и механики связано с уравнением Лапласа. Например, если в некотором теле установилось тепловое равновесие, то температура удовлетворяет уравнению Лапласа. Изучение поля тяготения или электростатического поля связано с этим уравнением. При исследовании фильтрации жидкости через пористые среды получаем также уравнение Лапласа. Во всех этих задачах, связанных с решением уравнения Лапласа, методы теории функций нашли широкие приложения.

Не только исследование уравнения Лапласа, но также исследование более общих уравнений математической физики может быть связано с теорией функций комплексного переменного. Одним из наиболее замечательных примеров такого рода является плоская задача теории упругости. Основы применения функций комплексного переменного к этой области были заложены советскими учеными Г. В. Колосовым и Н. И. Мусхелишвили.

§ 3. СВЯЗЬ ФУНКЦИЙ КОМПЛЕКСНОГО ПЕРЕМЕННОГО С ГЕОМЕТРИЕЙ

Геометрические свойства дифференцируемых функций. Так же как при изучении функций действительного переменного, в теории аналитических функций большую роль играет геометрическая интерпретация

функций. Можно смело сказать, что геометрические свойства функций комплексного переменного не только служат для наглядного представления аналитических свойств функции, но и привели к специальной проблематике этой теории. Круг проблем, связанных с геометрическими свойствами функций, получил название геометрической теории функций. Как уже говорилось выше, с геометрической точки зрения функция комплексного переменного w=f(z) представляет собой отображение плоскости z на плоскость w. Это отображение может быть задано также двумя функциями действительного переменного

Если мы хотим изучить характер отображения в весьма малой окрестности некоторой точки, то мы можем разложить эти функции в ряд Тейлора и ограничиться главными членами разложения

где производные берутся в точке (x0, y0). Следовательно, вблизи некоторой точки всякое отображение можно приближенно рассматривать как аффинное1 отображение

где

Рассмотрим свойства отображения, реализуемого аналитической функцией вблизи некоторой точки z = x+ iy. Пусть С—линия, выходящая из точки z; на плоскости w соответствующие точки образуют линию Г, выходящую из точки w. Если z' — соседняя точка и w' — соответствующая ей точка, то при z'→z будет w'→w и

1 См. главу III, (том 1), § 11

В частности, отсюда следует, что

(35)

Это можно сформулировать следующим образом.

Предел отношения длин соответствующих хорд на плоскости w и на плоскости z в точке z для всех кривых, выходящих из заданной точки z, один и тот же, или, как говорят, отношение линейных элементов на плоскости w и на плоскости z в заданной точке не зависит от выходящей из точки z кривой.

Величина | f' (z) |, характеризующая увеличение линейных элементов в точке z, называется коэффициентом растяжения в точке z.

Допустим теперь, что в некоторой точке z производная f'(z)≠0, тогда величина f (z) имеет вполне определенный аргумент1. Вычислим его, пользуясь (34),

но arg(w' — w) есть угол ß' хорды ww' с действительной осью, a arg(z'— z) есть угол α' хорды zz' с действительной осью. Если мы обозначим через α и ß углы касательных в точке z и w к линиям С и Г (рис. 14), то при

и, следовательно, в пределе получим

(36)

Это равенство показывает, что argf'(z) равен углу φ, на который надо повернуть направление касательной в точке z к линии С для того, чтобы получить направление касательной к линии Г в точке w. В силу этого свойства argf'(z) называют вращением отображения в точке z.

Из равенства (36) читатель легко выведет следующие положения.

При переходе от плоскости z к плоскости w касательные ко всем кривым, выходящим из заданной точки, поворачиваются на один и тот же угол.

Рис. 14.

1 См. главу IV (том 1), § 3.

Если C1 и C2— две линии, выходящие из точки z, а Г1 и Г2 — соответствующие линии, выходящие из точки w, то угол, составляемый Г1 и Г2 в точке w, равен углу, составляемому C1 и C2 в точке z.

Таким образом, при отображении, реализуемом аналитической функцией в каждой точке, где f'(z)≠0, все линейные элементы растягиваются в одном и том же отношении, а углы между соответствующими направлениями не меняются.

Отображения, обладающие указанными свойствами, носят название конформных отображений.

Из доказанных геометрических свойств отображений вблизи точки, в которой f (z0)≠0, естественно ожидать, что в некоторой малой окрестности z0 отображение будет взаимно однозначным, т. е. не только каждой точке z будет соответствовать лишь одна точка w, но и обратно: каждая точка w будет образом только одной точки z. Это действительно может быть строго доказано.

Для того чтобы полнее представить себе, как выделяются конформные отображения среди различных других отображений, полезно рассмотреть любое отображение в малой окрестности некоторой точки. Если рассмотрим главные члены разложения функций и и v, реализующих отображение, в ряд Тейлора, то получим

Если в малой окрестности точки x0, y0 пренебречь членами высшего порядка, то наше отображение будет вести себя, как аффинное отображение. Это отображение будет обратимо, если его определитель отличен от нуля

Если Δ = 0, то для представления о поведении отображения вблизи точки (x0, y0) нужно рассматривать члены высших порядков1.

В случае, когда u+iv есть аналитическая функция, мы можем производные по у выразить, пользуясь условиями Коши—Римана, через производные по х, и тогда получим

1 В последнем случае, т. е. при Δ = 0, отображение уже не называют аффинным. Об аффинных отображениях см. также главу III (том 1), § 11.

т. е. отображение обратимо, когда f'(z0)≠0. Если положим

и отображение вблизи точки (x0, y0) имеет вид

Эти формулы показывают, что в случае аналитической функции w = u+iv отображение вблизи точки (x0, y0) сводится к повороту на угол φ и растяжению с коэффициентом г. В самом деле, выражения, стоящие в скобках, есть известные из аналитической геометрии формулы поворота плоскости на угол φ, а умножение на r дает растяжение в r раз.

Для того чтобы представить себе, что может произойти с отображением в точках, в которых f(z) = 0, полезно рассмотреть функцию

w = zn. (37)

Производная этой функции w' = nzn-1 обращается в нуль при z = 0. Отображение (37) удобнее всего рассмотреть, пользуясь полярными координатами или тригонометрической формой комплексного числа. Пусть

Имея в виду, что при умножении комплексных чисел модули перемножаются, а аргументы складываются, получим

и поэтому

Из последней формулы мы видим, что луч φ = const плоскости z перейдет на плоскости w в луч θ = nφ = const. Следовательно, угол между двумя лучами величины ос на плоскости z будет переходить в угол величины β = пα. Отображение плоскости z на плоскость w уже перестанет быть однозначным, В самом деле, если задана точка w с модулем р и аргументом 6, то она может быть получена как образ n точек с модулем r=n√ρ и аргументами

При возведении в степень n модули соответствующих точек будут равны р, а аргументы будут равны

и так как прибавление к аргументу величин, кратных 2π, не меняет геометрического положения точки, все образы на плоскости w совпадут.

Конформные отображения. Если аналитическая функция w = f(z) переводит взаимно однозначно область D плоскости z в область А плоскости то говорят, что она осуществляет конформное отображение области D на область А.

Роль конформных отображений в теории функций и ее приложениях определяется следующей почти тривиальной теоремой.

Если ζ = F (w) — аналитическая функция в области А, то сложная функция F[f(z)] есть аналитическая функция в области D. Теорема эта вытекает из равенства

Имея в виду, что функции ζ = F(w) и w = f(z) аналитические, заключаем, что оба множителя правой части имеют пределы, а следовательно, в каждой точке z области D отношение Δζ/Δz имеет однозначный предел dζ/dz. Это доказывает аналитичность функции ζ=F[f(z)].

Доказанная теорема показывает, что изучение аналитических функций в области Δ может быть сведено к изучению аналитических функций в области D. Если геометрическая структура области D проще, то этим упрощается изучение функции.

Наиболее важным классом областей, в которых приходится изучать аналитические функции, является класс односвязных областей. Так называются области, граница которых состоит из одного куска (рис. 15, а) в отличие от областей, граница которых распадается на несколько кусков (например, области, изображенные на рис. 15,б и 15, в).

Заметим, что иногда приходится также изучать функции в области, лежащей не внутри кривой, а вне ее. Если граница такой области состоит только из одного куска, то область также называется односвязной (рис. 15, г).

В основе теории конформных отображений лежит следующая замечательная теорема Римана.

Рис. 15.

Для произвольной односвязной области Δ можно построить аналитическую функцию, дающую конформное отображение круга радиуса 1 с центром в начале координат на область Δ, так, чтобы центр круга отображался в заданную точку w0 области Δ и произвольное направление в центре круга переходило в произвольное направление в точке w0. Эта теорема показывает, что изучение функций комплексного переменного в произвольных односвязных областях можно свести к изучению функций, заданных, например, в единичном круге.

Поясним в общих чертах, каким образом изложенные факты могут быть приложены к задаче теории крыла. Пусть мы хотим изучить течение около заданной формы крылового профиля.

Если мы умеем отобразить конформно область течения, внешнюю к профилю, на область, внешнюю относительно круга, то можно построенное выше выражение для характеристической функции течения около круга использовать для построения характеристической функции течения около профиля.

Пусть ζ — плоскость круга, z — плоскость профиля, ζ=f(z) — функция, реализующая отображение области, внешней к профилю, на внешность круга, причем

Обозначим через а точку круга, соответствующую острию профиля A, и построим циркуляционное течение, обтекающее круг и имеющее одну из точек схода струй в а (рис. 16). Эту функцию будем обозначать через W(ζ):

Линии тока этого течения определяются уравнениями

Рассмотрим теперь функцию

и пусть

Рис. 16.

Докажем, что w(z) есть характеристическая функция течения около профиля со сходом струй в точке А. Прежде всего течение, определяемое функцией w(z), обтекает профиль. Для того чтобы это доказать, надо установить, что контур профиля есть линия тока, т. е. что на контуре профиля:

Но это вытекает из того, что

и точкu (x, y), лежащие на профиле, соответствуют точкам (ξ, η), лежащим на окружности, а на окружности Ψ (ξ, η) = — const.

Так же просто доказывается, что А есть точка схода струй. Можно доказать, что соответствующим подбором скорости набегающего потока на круг можно получить около профиля течение с произвольной скоростью набегающего потока на профиль.

Важная роль конформных отображений в теории функций и ее приложениях выдвинула задачи нахождения конформных отображений одной области на другую при заданной геометрической форме областей. В ряде простейших, но полезных случаев эта задача может быть решена при помощи элементарных функций комплексного переменного. Однако в общем случае нельзя обойтись элементарными функциями. Как уже говорилось, Риман высказал общую теорему теории конформных отображений, однако он не дал строгого доказательства этой теоремы. Потребовались усилия многих крупных математиков в течение ряда десятилетий, чтобы найти полное доказательство теоремы Римана.

В тесной связи с различными путями доказательств теоремы Римана развивались методы общего построения приближенным путем конформных отображений областей. Фактическое построение конформного отображения одной области на другую представляет собой иногда весьма трудную задачу. Для изучения ряда общих свойств функции часто фактически не надо знать конформного отображения одной области на другую, а достаточно использовать лишь те или другие геометрические свойства его. Это привело к широкому изучению геометрических свойств конформных отображений. Для того чтобы дать представление о теоремах такого рода, приведем формулировку одной из них.

Пусть круг радиуса 1 на плоскости z с центром в начале координат отображается на некоторую область Δ, причем начало координат переходит в точку w0 области А (рис.. 17). Если мы рассматриваем произвольное отображение круга на область Δ, то нельзя высказать никаких утверждений о поведении отображения в точке z = 0. Для конформных отображений имеет место следующее замечательное предложение.

Рис. 17.

Растяжение в начале координат не превосходит четырех радиусов круга с центром в w0, вписанного в область Δ

Различным вопросам теории конформных отображений были посвящены многочисленные исследования советских математиков. В этих работах были получены точные формулы для многих интересных классов конформных отображений, исследовались методы приближенного расчета конформных отображений, а также установлен ряд общих геометрических теорем о конформном отображении.

Квазиконформные отображения. Конформные отображения тесно связаны с изучением аналитических функций или с изучением пары функций, удовлетворяющих условиям Коши—Римана

Во многих задачах математической физики встречаются более общие классы систем дифференциальных уравнений, с которыми также могут быть связаны отображения одной плоскости на другую, обладающие определенными геометрическими свойствами в окрестности каждой точки плоскости Оху. Чтобы пояснить это, рассмотрим следующий пример системы дифференциальных уравнений

(38)

Если р(х, у) = 1, то эта система вырождается в систему Коши— Римана. В общем случае произвольной функции р(х, у) мы можем также каждое решение системы (38) толковать как отображение плоскости Оху на плоскость Ouv. Рассмотрим геометрические свойства нашего отображения в окрестности точки (x0, y0). Для этого, считая малой окрестность точки (x0, y0), сохраним лишь первые члены в разложении функций и и V по x — х0 и у — y0 и будем рассматривать отображение как аффинное

(39)

Если функции и и v удовлетворяют системе уравнений (38), то для этого аффинного преобразования имеет место следующее свойство.

Эллипсы с центром в точке (x0, y0) с главными осями, параллельными осям координат, и отношением полуосей

на плоскости Ouv переходят в окружности с центром в точке (u0, v0).

Докажем это предложение. Уравнение окружности с центром (u0, v0) на плоскости Оuv будет

Подставляя сюда выражения для u — u0 и v— v0 через х и у, получим уравнение соответствующей кривой на плоскости Оху:

Воспользуемся теперь уравнениями (38), чтобы выразить производные от функции v через производные от функции и. Тогда получим

Если положим

то уравнение приведется к виду

Таким образом, кривая, которая переходит в круг, есть действительно эллипс с указанными выше свойствами.

Если рассматривать не аффинное преобразование, даваемое первыми членами разложения, а точное, то найденное свойство отображения будет выполняться тем точнее, чем меньше размеры полуосей эллипса.

Можно сказать, что это свойство будет выполняться для бесконечно малых эллипсов.

Таким образом, из уравнений (38) вытекает, что в каждой точке задано отношение полуосей и направление полуосей бесконечно малого

эллипса, переходящего в круг. Оказывается, что это геометрическое свойство вполне характеризует систему дифференциальных уравнений (38), т. е. если функции и и v реализуют отображение, обладающее указанным геометрическим свойством, то они удовлетворяют этой системе. Таким образом, задача исследования решения уравнений (38) равносильна задаче изучения отображений, обладающих указанным свойством.

Отметим, в частности, что для уравнений Коши — Римана это свойство формулируется следующим образом.

Бесконечно малый круг с центром в точке (x0, y0) переходит в бесконечно малый круг с центром в точке (u0, v0).

Весьма широкий класс уравнений математической физики может быть сведен к изучению отображений со следующими геометрическими свойствами.

Для каждой точкu (x, у) плоскости аргументов задано направление полуосей и отношение полуосей двух эллипсов. Требуется построить отображение плоскости Оху на плоскость Ouv так, чтобы бесконечно малые эллипсы первого семейства переходили в бесконечно малые эллипсы второго семейства с центрами в точках (u, v).

Рассмотрение отображений, связанных с такими общими системами уравнений, было введено советским математиком М. А. Лаврентьевым. Эти отображения получили название квазиконформных отображений. Идея изучения отображений, определяемых системами дифференциальных уравнений, дала возможность распространить методы теории аналитических функций на весьма обширные классы задач. М. А. Лаврентьевым и его учениками было проведено исследование квазиконформных отображений и были получены многочисленные приложения этих исследований к различным задачам математической физики, механики и геометрии. Интересно отметить, что рассмотрение квазиконформных отображений оказалось весьма плодотворным и в самой теории аналитических функций.

Конечно, здесь мы не можем остановиться на всех разнообразных направлениях применения геометрического метода в теории функций комплексного переменного.

§ 4. КРИВОЛИНЕЙНЫЙ ИНТЕГРАЛ. ФОРМУЛА КОШИ И ЕЕ СЛЕДСТВИЯ

Интегралы от функций комплексного переменного. Для изучения свойств аналитических функций важнейшую роль играет понятие интеграла функции комплексного переменного. Понятию определенного интеграла функции действительного переменного соответствует понятие интеграла вдоль кривой от функции комплексного переменного. Рассмотрим в плоскости дугу С с началом в точке z0 и концом в точке z

и функцию f(z), заданную в области, содержащей дугу С. Разобьем дугу С на малые части точками (рис. 18)

и рассмотрим сумму

Если функция f(z) непрерывна, а дуга С имеет конечную длину, то аналогично тому, как для действительных функций, устанавливается, что при увеличении числа точек деления n так, чтобы максимальное расстояние между соседними точками деления стремилось к нулю, сумма S имеет вполне определенный предел. Этот предел называется интегралом вдоль дуги С и обозначается через

Заметим, что при определении интеграла мы выбрали начало и конец линии С или, другими словами, выбрали определенное направление движения по линии С.

Легко доказать ряд простых свойств интеграла.

1° Интеграл суммы двух функций равен сумме интегралов слагаемых функций:

2° Постоянный множитель можно выносить за знак интеграла:

3° Если дуга С есть сумма дуг C1 и C2, то

4° Если С — дуга С, проходимая в обратном направлении, то

Все эти свойства очевидны для суммы S и получаются для интегралов предельным переходом.

5° Если длина дуги С равна L и на дуге С выполняется неравенство

Рис. 18.

то

Докажем это свойство. Неравенство достаточно доказать для интегральных сумм S, так как тогда оно останется верным в пределе и для интегралов. Для интегральной суммы

Но стоящая вторым множителем сумма равна сумме длин звеньев ломаной линии, вписанной в дугу С, с вершинами в точках zk. Длина ломаной, как известно, не больше длины кривой, поэтому

Рассмотрим интеграл от простейшей функции f(z)=1. Очевидно в этом случае

Это доказывает, что

Полученный результат показывает, что для функции f(z) = 1 значение интеграла для всех дуг, соединяющих точки z0 и z, одно и то же. Другими словами, значение интеграла зависит только от начальной и конечной точки пути интегрирования. Однако легко убедиться, что это свойство не имеет места для произвольных функций комплексного переменного. Например, если f(z) = x, то простые вычисления показывают, что

где C1 и C2 — пути интегрирования, изображенные на рис. 19.

Предоставим читателю установить эти равенства.

Замечательным фактом теории аналитических функций является следующая теорема Коши.

Если f(z) дифференцируема в каждой точке односвязной области D, то интегралы по всем дугам, соединяющим две произвольные точки области z0 и z, совпадают.

Мы не будем здесь приводить доказательства теоремы Коши, отсылая интересующихся к любому курсу теории функций комплексного переменного. Приведем здесь только важные следствия этой теоремы.

Прежде всего теорема Коши позволяет ввести неопределенный интеграл от аналитической функции. В самом деле, зафиксируем точку z0 и рассмотрим интеграл по линии, соединяющей z0 и z:

При этом можно вести интегрирование но любой линии, соединяющей z0 и z, так как от изменения линии величина интеграла не меняется и, следовательно, зависит только от z. Функция F (z) называется неопределенным интегралом от f(z).

Неопределенный интеграл от f(z) имеет производную, равную f(z).

Во многих приложениях удобно иметь несколько иную эквивалентную формулировку теоремы Коши.

Если f(z) всюду дифференцируема в односвязной области, то интеграл по любому замкнутому контуру, лежащему в этой области, обращается в нуль:

Это очевидно, так как замкнутый контур имеет совпадающие начало и конец, и, следовательно, z0 и z можно соединить нулевым путем.

В дальнейшем под замкнутым контуром будем понимать контур, проходимый в направлении против часовой стрелки. Если контур проходится по часовой стрелке, мы его будем обозначать Г.

Интеграл Коши. Сказанное выше позволяет вывести следующую фундаментальную формулу Коши, дающую выражение для дифференцируемой функции во внутренних точках замкнутого контура через значения функции на самом контуре

Дадим доказательство этой формулы. Пусть z фиксировано, а ζ — независимое переменное. Функция

будет непрерывна и дифференцируема в каждой точке ζ внутри области d, за исключением точки ζ = z, где знаменатель обращается в нуль. Это обстоятельство не позволяет применить теорему Коши к функции φ (ζ) и контуру с.

Рис. 19.

Рассмотрим окружность Кρ с центром в точке z и радиусом р и покажем, что

(40)

Для этого построим вспомогательный замкнутый контур Гр, состоящий из контура С, дуги γρ, соединяющий С и окружность, и окружности Кρ, проходимой в обратном направлении (рис. 20). Контур Гр показан стрелками. Так как из Гp точка ζ = z выключена, внутри Гр функция φ(ζ) уже всюду дифференцируема, и поэтому

(41)

Но контур Гр разбивается на четыре части: С, γρ, Kρ и γρ, поэтому на основании свойства 3° интеграла будем иметь

Заменяя интегралы по Кг и ур интегралами по Kр и уp и пользуясь свойством 4°, получим

что доказывает формулу (40).

Чтобы вычислить правую часть (40), положим

(42)

Вычислим прежде всего второе слагаемое. На окружности К

Имея в виду, что z и р постоянны, получим

и, кроме того,

Рис. 20.

поэтому

так как при обходе окружности полное изменение θ равно 2π. На основании (40) и (42)

В полученном равенстве мы перейдем к пределу при ρ→0. Левая часть и первое слагаемое правой части при этом будут оставаться неизменными. Мы докажем, что предел второго слагаемого равен нулю. Тогда при ρ→0 наше равенство приведет нас к формуле Коши. Чтобы доказать, что второе слагаемое стремится к нулю, когда ρ→0, заметим, что

т. е. подинтегральное выражение имеет конечный предел и, следовательно, ограничено

Применение свойства 5° интеграла дает

Это завершает доказательство формулы Коши. Формула Коши является одним из основных средств исследования в теории функций комплексного переменного.

Разложимость дифференцируемых функций в степенной ряд.

Применим теорему Коши для установления двух основных свойств дифференцируемых функций комплексного переменного.

Всякая функция комплексного переменного, имеющая первую производную в области D, имеет производные всех порядков.

В самом деле, внутри замкнутого контура наша функция выражается интегралом Коши

Под знаком интеграла стоит дифференцируемая функция z; поэтому, производя дифференцирование под знаком интеграла, получим

Под знаком интеграла снова стоит дифференцируемая функция, поэтому мы можем снова дифференцировать, тогда

Продолжая дифференцировать, мы получим общую формулу

Таким образом мы можем вычислить производную любого порядка. Чтобы сделать это доказательство вполне строгим, надо было бы еще доказать, что дифференцирование под знаком интеграла законно. Мы не будем останавливаться на этой части доказательства.

Второе основное свойство следующее:

Если f(z) везде дифференцируема в круге К с центром в точке а, то f(z) разлагается в степенной ряд Тейлора

сходящийся внутри К.

Мы определили в § 1 аналитические функции комплексного переменного как функции, разлагающиеся в степенной ряд. Последняя теорема говорит о том, что всякая дифференцируемая функция комплексного переменного есть аналитическая функция. Это есть специфическое свойство функций комплексного переменного, не имеющее себе аналога в действительной области. Функция действительного переменного, имеющая первую производную, может уже не иметь ни в одной точке производной 2-го порядка.

Докажем сформулированную выше теорему.

Пусть f(z) имеет производную внутри и на границе круга K с центром в точке а. Тогда внутри К функция f(z) выражается интегралом Коши

(43)

Напишем

тогда

(44)

Имея в виду, что точка z лежит внутри круга, а ζ — на окружности, получим

поэтому на основании формулы для геометрической прогрессии

(45)

причем стоящий справа ряд сходится. Используя (44) и (45), мы можем формулу (43) представить в виде

Мы применим теперь к ряду, стоящему в скобках, почленное интегрирование. Законность этого можно строго обосновать. Тогда получим, вынося в каждом члене не зависящие от ζ множители (z — а)n за знак интеграла

Используя теперь интегральные формулы для последовательных производных, можем написать

тогда получаем

Мы доказали, что дифференцируемые функции комплексного переменного разлагаются в степенной ряд. Обратно: функции, представляемые степенными рядами, дифференцируемы. Их производные могут быть получены почленным дифференцированием ряда (законность этой операции может быть строго обоснована).

Целые функции. Степенной ряд дает аналитическое представление функции лишь в некотором круге. Этот круг имеет радиус, равный расстоянию до ближайшей точки, в которой функция теряет аналитичность, — особой точки функции.

Среди аналитических функций естественно выделяется класс функций, аналитических при всех конечных значениях аргумента. Такие функции представимы степенным рядом, сходящимся при всех значениях аргумента z, и называются целыми функциями z. Если мы рассмотрим разложение около начала координат, то целая функция будет выражаться рядом вида

Если в этом ряде все коэффициенты, начиная с некоторого, обращаются в нуль, то функция есть просто многочлен или целая рациональная функция

Если в разложении бесконечно много членов, отличных от нуля, то целая функция называется трансцендентной. Приведем примеры таких функций:

При изучении свойств многочленов важную роль играет вопрос о расположении корней уравнения

P(z) = 0,

или, более обще, мы можем ставить вопрос о расположении точек, в которых многочлен принимает заданное значение A

Основная теорема высшей алгебры утверждает, что всякий многочлен принимает заданное значение А по крайней мере в одной точке. Это свойство уже не может быть перенесено на произвольную целую функцию. Например, функция w = ez ни в одной точке z плоскости не обращается в нуль. Однако имеет место следующая теорема Пикара: всякая целая функция принимает бесконечное число раз произвольное значение, кроме может быть одного.

Вопрос о расположении на плоскости точек, в которых целая функция принимает заданное значение А, является одним из центральных вопросов теории целых функций.

Число корней многочлена равно его степени. Степень многочлена тесно связана с быстротой возрастания |P(z)| при |z|→∞. В самом деле, мы можем написать

и так как при z→∞второй множитель стремится к | an | многочлен степени /г при больших значениях z возрастает, как |an||z|n. Таким образом, видно, что, чем больше n, тем быстрее растет |Ph(z)| при |z|→∞ и тем больше корней имеет многочлен. Оказывается, что для целых функций эта закономерность продолжает иметь место. Однако для целой функции f (z), вообще говоря, число корней бесконечно, и поэтому вопрос о числе корней не имеет смысла. Все же мы можем рассмотреть число n(r, а) корней уравнения

в круге радиуса r и изучить, как меняется это число при возрастании r. Скорость возрастания n(r, а) оказывается связанной со скоростью возрастания максимума модуля целой функции M (r) в круге радиуса r. Как уже говорилось, для целой функции может существовать одно исключительное значение а, для которого уравнение может не иметь даже ни одного корня. Для всех других значений а скорость возрастания числа n (r, а) сравнима со скоростью возрастания величины lnM(r). Мы здесь не имеем возможности дать более точные формулировки этих закономерностей.

Свойства распределения корней целых функций связаны с задачами теории чисел и позволили установить ряд важных свойств функции Римана ζ(s)1, на основе которых доказываются многие теоремы о простых числах.

Дробные или мероморфных функции. Класс целых функций может быть рассматриваем как расширение класса алгебраических многочленов. Исходя из многочленов, можно получить более широкий класс рациональных функций

являющихся отношением двух многочленов.

Подобным же образом естественно образуется новый класс функций из целых функций. Функция f(z), являющаяся отношением двух целых функций G1 (z) и G2 (z)

называется дробной или мероморфной функцией. Получаемый таким образом класс функций играет большую роль в математическом анализе. Среди элементарных функций комплексного переменного в класс мероморфных функций входят, например:

Мероморфная функция уже не будет аналитической на всей плоскости комплексного переменного. В тех точках, где знаменатель G2(z) обращается в нуль, функция f(z) обращается в бесконечность. Корни G2(z) образуют на плоскости множество изолированных точек. В окрестности этих точек функция f(z), естественно, не может быть разложена в ряд Тейлора, однако в окрестности такой точки а мероморфная функция может быть представлена степенным рядом, содержащим также некоторое число отрицательных степеней (z — а):

(46)

1 См. главу X, посвященную теории чисел.

При приближении z к точке а значения f(z) стремятся к бесконечности. Изолированная особая точка, в которой аналитическая функция обращается в бесконечность, называется полюсом. Потеря аналитичности функции в точке а обусловлена членами с отрицательными степенями z — а в разложении (46). Выражение

характеризует поведение мероморфной функции вблизи особой точки и называется главной частью разложения (46). Характер поведения мероморфной функции определяется ее главными частями в окрестности полюсов. Во многих случаях, зная главные части разложения мероморфной функции в окрестности всех ее полюсов, можно ее построить. Так, например, если функция f(z) рациональна и обращается в 0 на бесконечности, то она равна сумме главных частей ее разложения около всех ее полюсов, число которых для рациональной функции конечно:

В общем случае рациональная функция может быть представлена в виде суммы всех ее главных частей и некоторого многочлена

(47)

Формула (47) дает выражение рациональной функции, в котором ясно выступает роль особых точек функции в ее построении. Выражение (47) для рациональной функции представляет большие удобства при различных применениях рациональных функций и имеет также принципиальный интерес, выявляя, каким образом особые точки функции определяют всю ее структуру. Оказывается, что так же, как и рациональная функция, всякая мероморфная функция может быть сконструирована по главным частям ее полюсов. Приведем без доказательства подобное выражение, например для функции ctgz. Полюсы функции ctgz получаются как корни уравнения

и расположены в точках: . . ., ..., ... Можно доказать, что главная часть разложения функции ctgz в степенной ряд в полюсе z = kπ будет

а функция ctgz равна сумме главных частей относительно всех ее полюсов

(48)

Разложение мероморфной функции в ряд по главным частям замечательно тем, что в нем явно выражены особые точки функции и что такое аналитическое представление позволяет вычислять функцию во всей области, где она определена.

Теория мероморфных функций явилась фундаментом при изучении многих важнейших для анализа классов функций. Особенно следует подчеркнуть ее значение в теории уравнений математической физики. Создание теории интегральных уравнений, позволивших дать ответ на ряд важных вопросов теории уравнений математической физики, широко опиралось на основные предложения теории мероморфных функций.

С тех пор развитие главы функционального анализа, наиболее тесно связанной с математической физикой, — теории операторов — весьма часто опиралось на факты теории аналитических функций.

Об аналитическом представлении функций. Мы видели выше, что в окрестности всякой точки, где функция дифференцируема, она может быть определена с помощью степенного ряда. Для целой функции степенной ряд сходится во всей плоскости и дает аналитическое выражение функции всюду, где она определена. В случае, если функция не является целой, ряд Тейлора, как мы знаем, сходится лишь в круге, окружность которого проходит через ближайшую особую точку функции. Таким образом, степенной ряд не позволяет вычислить функцию всюду, где она определена, и, следовательно, аналитическая функция не может быть задана во всей области ее определения степенным рядом. Для мероморфной функции аналитическим выражением, дающим функцию во всей ее области определения, является разложение по главным частям.

Если функция не целая, но определена в некотором круге или если мы имеем функцию, определенную в некоторой области, но хотим ее изучать лишь в некотором круге, то для изображения ее может служить ряд Тейлора. В случае, когда мы изучаем функцию в областях, отличных от круга по форме, встает вопрос о возможности найти аналитическое выражение функции, пригодное для ее изображения во всей этой области. Степенной ряд, дающий выражение аналитической функции в круге, имеет своими членами простейшие многочлены anzn. Естественно возникает вопрос, нельзя ли в произвольной области аналитическую функцию разложить в ряд многочленов. Тогда каждый член ряда опять сможет быть вычислен арифметическими операциями, и мы получим аппарат для представления функции, снова исходящий из

простейших операций арифметики. Общий ответ на поставленную задачу дается следующей теоремой:

Аналитическая функция, заданная в произвольной области, граница которой состоит из одной линии, может быть разложена в ряд многочленов

Сформулированная теорема дает только общий ответ на вопрос о возможности разложения функции в произвольной области в ряд многочленов. Однако эта теорема еще не позволяет построить ряд по заданной функции, как это имеет место для ряда Тейлора. Эта теорема скорее лишь ставит вопрос о разложении функций в ряды многочленов, а не решает этот вопрос. Вопросы о построении ряда многочленов по заданной функции или некоторым ее свойствам, вопросы построения наиболее быстро сходящихся рядов и рядов, тесно связанных с характером поведения самой функции, вопросы изучения структуры функции по заданному ряду многочленов, представляющему функцию, составляют широко развитую теорию приближения функций рядами многочленов. В создании этой теории весьма большая роль принадлежит советским математикам, получившим в этом направлении ряд фундаментальных результатов.

§ 5. СВОЙСТВО ЕДИНСТВЕННОСТИ И АНАЛИТИЧЕСКОЕ ПРОДОЛЖЕНИЕ

Свойство единственности аналитических функций. Одним из наиболее замечательных свойств аналитических функций является их свойство единственности.

Если в области D заданы две аналитические функции, совпадающие на некоторой линии С, лежащей внутри области, то они совпадают во всей области.

Доказательство этой теоремы весьма несложно. Пусть f1 (z) и f2(z) — две аналитические в области D функции, совпадающие по линии С. Разность

φ(z) = f1 (z) — f2(z)

будет аналитической функцией в области D и обращается в нуль на линии С. Докажем, что φ(z) = 0 в любой точке области D. В самом деле, если в области D существует точка z0 (рис. 21), в которой φ (z0) ≠ 0, то мы продолжим линию С до точки z0 и будем идти по полученной линии Г к точке z0 до тех пор, пока функция остается равной нулю на Г. Пусть ζ — последняя получаемая таким образом точка Г. Если cp(z0)≠0, то ζ≠z0 и на некотором отрезке линии Г за точкой ζ функция φ (z), по определению точки ζ, была бы не равна нулю. Покажем, что это невозможно. В самом деле, на части Гζ линии Г, лежащей до точки ζ, мы имеем φ(z) = 0. Можно вычислить все производные функции φ(z) на Гζ,

пользуясь только значениями φ(z) на Гζ, поэтому на Гζ все производные φ(z) равны нулю. В частности, в точке ζ

Разложим функцию φ(ζ) в ряд Тейлора в точке Все коэффициенты разложения обратятся в пуль, поэтому мы получим

в некотором круге с центром в точке ζ, расположенном в области D. В частности, отсюда следует, что равенство φ(z) = 0 продолжает выполняться на некотором отрезке линии Г, лежащей за ζ. Предположение φ(z0)≠0 привело нас к противоречию.

Доказанная теорема показывает, что если известны значения аналитической функции на некотором отрезке кривой или в некоторой части области, то это определяет единственным образом значения функции всюду в области задания. Таким образом, значения функции в различных частях плоскости аргумента тесно связаны между собой.

Чтобы дать себе отчет в значении свойства единственности аналитической функции, следует вспомнить, что общее определение функции комплексного переменного допускает любой закон соответствия между значениями аргумента и значениями функции. При таком определении, естественно, не может быть и речи о том, что значения функции в одном месте однозначно определяют ее значения в других частях плоскости. Мы видим, что единственное требование дифференцируемости функции комплексного переменного оказывается столь сильным, что определяет связь между значениями функции в различных местах.

Подчеркнем еще, что в области функций действительного переменного дифференцируемость функции не влечет за собой подобных следствий. В самом деле, можно построить примеры функций, дифференцируемых сколько угодно раз, совпадающих в некотором промежутке оси Ох и не равных между собой в остальных точках. Так, например, функция, равная нулю при отрицательных значениях х, может быть определена так, что при положительных х она отлична от нуля и имеет непрерывные производные любого порядка. Достаточно для этого, например, положить при x>0

Аналитическое продолжение и полные аналитические функции.

Часто при задании функции комплексного переменного область ее определения ограничивается самим способом задания функции. Рассмотрим совсем элементарный пример. Пусть функция задана рядом

(49)

Рис. 21.

Этот ряд, как известно, сходится в единичном круге с центром в начале координат и расходится вне этого круга. Поэтому аналитическая функция, заданная формулой (49), определена лишь в этом круге. С другой стороны, мы знаем, что сумма ряда (49) в круге |z|<l выражается формулой

(50)

Формула (50) уже имеет смысл при всех значениях z≠1. На основании теоремы единственности выражение (50) дает единственную аналитическую функцию, совпадающую с суммой ряда (49) в круге | z |<1. Таким образом, функцию, заданную сначала только в единичном круге,

мы продолжили на всю плоскость.

Если мы имеем функцию f(z), определенную внутри некоторой области D, и существует другая функция F (z), определенная в области А, содержащей D, и совпадающая с f(z) в D, то в силу теоремы единственности значения F (z) в Δ определяются единственным образом.

Функция F (z) носит название аналитического продолжения f (z). Аналитическую функцию будем называть полной, если она не может быть продолжена с сохранением аналитичности за пределы той области, где она уже задана. Например, целая функция, определенная во всей плоскости, будет полной функцией. Мероморфная функция будет также полной функцией; она определена всюду, кроме своих полюсов. Однако существуют также аналитические функции, полная область определения которых есть ограниченная область. Мы не будем останавливаться на этих более сложных примерах.

Понятие полной аналитической функции приводит к необходимости рассмотрения неоднозначных функций комплексного переменного. Покажем это на примере функции

где r=|z| и φ = argz. Если в некоторой точке z0 = r0 (cos φ0 + i sin φ0) плоскости z рассмотреть некоторое исходное значение функции

то нашу аналитическую функцию можно непрерывно продолжать, двигаясь вдоль некоторой кривой С. Как уже упоминалось, легко усмотреть, что если точка z опишет замкнутый путь C0, выходящий из точки z0, охватывающий начало координат (рис. 22) и возвращающийся снова в точку z0, то мы вернемся в точку z0 с исходным значением lnr0, а угол φ увеличится на 2π. Это показывает, что, продолжая непрерыв-

Рис. 22.

ным образом вдоль пути С функцию Lnz, мы увеличим при обходе контура С значение функции на 2πi. Если точка z опишет этот замкнутый контур n раз, то вместо исходного значения

мы получим новое значение

Если точка z опишет m раз контур С в обратном направлении, мы получим

Проведенные рассуждения показывают, что на плоскости комплексного переменного мы неизбежно должны рассматривать связанные между собой различные значения Lnz. Функция Lnz бесконечнозначна. Для многозначности функции Ln z особую роль играет точка z = 0, обходя которую мы переходим от одного значения функции к другому. Легко убедиться, что если z описывает замкнутый контур, не окружающий начала координат, то при этом значение Lnz не изменится. Точка z = 0 называется точкой ветвления функции Lnz.

Вообще, если для некоторой функции f(z) при обходе точки а мы переходим от одного ее значения к другому, точка а называется точкой ветвления функции f(z).

Рассмотрим другой пример. Пусть

Как отмечалось выше, эта функция тоже многозначна и принимает n значений

Все различные значения нашей функции можно получить, исходя из одного

и описывая замкнутые линии вокруг начала координат, так как при каждом обходе вокруг начала угол φ будет увеличиваться на 2π.

Описав замкнутую кривую (n— 1) раз, получим, исходя из первого значения vz, остальные его (n— 1) значений. Обход контура в n-й раз приведет к значению корня

т. е. мы вернемся к исходному значению корня.

Поверхности Римана для многозначных функций. Существует весьма наглядный геометрический способ представления характера многозначности функции.

Рассмотрим опять функцию Ln z и проведем на плоскости z разрез вдоль положительной части оси Ох. Если точке z запретить пересекать разрез, то мы не сможем перейти от одного значения Lnz к другому непрерывным образом. Продолжая Lnz из точки z0, будем приходить лишь к одному значению Lnz.

Полученная таким образом в разрезанной z-плоскости однозначная функция называется однозначной ветвью функции Lnz. Все значения Lnz распадаются на бесконечное множество однозначных ветвей

Легко убедиться, что n-я ветвь на нижней части разреза принимает то же значение, что (n + 1)-я ветвь на верхней стороне разреза.

Чтобы различить разные ветви Ln z, заготовим бесконечно много экземпляров плоскости z, разрезанных вдоль положительной части оси Ох, и будем значения аргумента z, соответствующие n-й ветви, изображать на n-м листе. Точки, лежащие на разных экземплярах плоскости, но имеющие те же координаты, будут при этом соответствовать одному и тому же числу x+iy; только изображение числа на n-м листе означает, что мы рассматриваем n-ю ветвь логарифма.

Чтобы изобразить геометрически, что n-я ветвь логарифма на нижней части разреза n-й плоскости совпадает с (n+1)-й ветвью логарифма на верхней части разреза (n + 1)-й плоскости, склеим n-ю плоскость с n+1)-й, соединив нижнюю часть разреза на n-й плоскости с верхней частью разреза на (n + 1)-й плоскости. Это построение приведет нас к многолистной поверхности, имеющей структуру винтовой лестницы (рис. 23). Роль центральной колонны лестницы при этом будут играть точки z = 0.

Рис. 23.

Если точка переходит с одного листа на другой, то комплексное число возвращается к своему исходному значению, а функция Lnz переходит от одной ветви к другой.

Построенная поверхность носит название поверхности Римана функции Lnz. Риман впервые выдвинул идею построения поверхностей, отображающих характер многозначности аналитических функций, и показал плодотворность этой идеи.

Приведем еще построение поверхности Римана для функции w = j/z. Эта функция двузначна и имеет точку ветвления в начале координат.

Заготовим два экземпляра z-плоскости, расположенных один над другим и рассеченных вдоль положительной части оси Ох. Если z, исходя из z0, описывает замкнутый контур С, содержащий начало координат, то √z перейдет от одной ветви к другой, и, следовательно, точка поверхности Римана перейдет с одного листа на другой. Мы этого достигнем, если нижний борт разреза первого листа склеим с верхним бортом разреза второго листа. Если z описывает второй раз замкнутый контур С, то значение √z должно вернуться к исходному, и, следовательно, точка римановой поверхности должна вернуться к исходному положению на первом листе. Чтобы этого достигнуть, мы должны теперь нижний борт второго листа подклеить к верхнему борту первого листа. В результате мы получим двухлистную поверхность, пересекающую самое себя вдоль положительной части оси Ох. Представление об этой поверхности можно получить из рис. 24, на котором изображена окрестность точки z = 0 на этой поверхности.

Подобного рода многолистные поверхности, отражающие характер многозначности функции, можно строить для всякой многозначной функции. Различные листы этих поверхностей связываются друг с другом около точек ветвления функции. Оказывается, что свойства

Рис. 24.

аналитических функций тесно связываются с геометрическими свойствами римановых поверхностей. Введение этих поверхностей не только явилось вспомогательным средством для пояснения характера многозначности функции, но играет фундаментальную роль для изучения свойств аналитических функций и развития методов их исследования. Римановы поверхности как бы создали мост, связывающий анализ в области комплексного переменного с геометрией, и не только позволили связать самые глубокие аналитические свойства функции с геометрией, но дали толчок к развитию новой области геометрии — топологии, занимающейся геометрическими свойствами фигур, остающихся неизменными при непрерывных деформациях.

Один из ярких примеров значения геометрических свойств римановых поверхностей дает теория алгебраических функций,—функций, получаемых путем решения уравнения

левая часть которого есть многочлен от z и w. Поверхность Римана такой функции непрерывным изменением может быть всегда превращена или в сферу, или в сферу, снабженную несколькими ручками (рис. 25). Характерным свойством этих поверхностей является число ручек. Это число называется родом поверхности и родом алгебраической функции, исходя из которой получена эта поверхность. Оказывается, что род алгебраической функции определяет наиболее важные ее свойства.

§ 6. ЗАКЛЮЧЕНИЕ

Теория аналитических функций возникла в связи с задачей решения алгебраических уравнений. Однако в своем развитии она все время соприкасалась все с новыми и новыми вопросами. Она дала возможность пролить свет на основные классы функций, выдвинутые развитием анализа, механики, математической физики. Ряд центральных фактов ана-

Рис. 25.

лиза мог быть до конца понят только при выходе в комплексную область. Функции комплексного переменного получили непосредственную физическую интерпретацию как характеристики важнейших векторных полей гидродинамики и электродинамики и дали замечательный аппарат для решения задач, выдвигаемых этими разделами науки. Обнаружились связи теории функций с задачами теории теплопроводности, теории упругости и т. д.

Общие вопросы теории дифференциальных уравнений и специальные методы их решения широко опирались и опираются на теорию функций комплексного переменного. Аналитические функции естественно вошли в теорию интегральных уравнений и общую теорию линейных операторов. Обнаружились тесные связи теории аналитических функций с геометрией. Эти все время расширяющиеся связи теории функций с новыми областями математики и естествознания утвердили жизненность этой теории и непрерывно обогащают ее проблематику.

В нашем очерке мы не могли поставить своей целью дать представление о всех многообразных разветвлениях и связях теории функций. Мы пытались лишь показать разнообразие задач и направлений теории, указывая на элементарные факты, лежащие в основе некоторых из ее основных направлений. Ряд важнейших направлений — связь с теорией дифференциальных уравнений и специальными функциями, теория эллиптических и автоморфных функций, связи с теорией тригонометрических рядов — и многие другие направления совершенно не были затронуты. В других случаях нам приходилось ограничиваться лишь самыми краткими указаниями. Но мы надеемся, что этот очерк создаст у читателя общее представление о характере и значении теории функций комплексной переменной.

ЛИТЕРАТУРА

Популярная литература

Гончаров В. Л. Элементарные функции комплексного переменного. Энцикл. элемент, математики, т. III. Гостехиздат, 1952.

Маркушевич А. И. Комплексные числа и конформные отображения. Популярные лекции по математике, вып. 13. Гостехиздат, 1954.

Учебники

Лаврентьев М. А. и Шабат Б. В. Методы теории функций комплексного переменного. Гостехиздат, 1951.

Содержит изложение основных методов этой теории, которое сопровождается большим числом примеров их применения к различным задачам физики.

Маркушевич А. И. Теория аналитических функций. Гостехиздат, 1950.

Весьма полный и систематический курс теории функций комплексного переменного.

Привалов И. И. Введение в теорию функций комплексного переменного. Изд. 9-е, Гостехиздат, 1954.

Титчмарш Е. Теория функций. Перев. с англ. Гостехиздат, 1951.

Это не систематический курс, а лишь введение в различные отделы теории функций комплексного переменного. Основное направление книги — аналитическое, так что геометрическим вопросам в ней уделено сравнительно мало внимания.

Обзорная статья

Бермант А. Ф. и Маркушевич А.И. Теория функций комплексного переменного. Математика в СССР за тридцать лет (1917—1947). Гостехиздат, 1948.

Глава X

ПРОСТЫЕ ЧИСЛА

§ 1. ЧТО И КАК ИЗУЧАЕТ ТЕОРИЯ ЧИСЕЛ

Целые числа. Как уже читатель знает из вводной главы I (том 1), человечеству с древнейших времен приходилось иметь дело с целыми числами, но понадобился длинный ряд веков для того, чтобы дойти до понятия бесконечного натурального ряда чисел

(1)

И теперь в самых разнообразных вопросах практической деятельности людям приходится постоянно встречаться с целыми числами. Целые числа отражают множество количественных соотношений в природе; во всех вопросах, связанных с дискретным, целые числа являются необходимым математическим аппаратом.

Вместе с тем целые числа играют важную роль и при изучении непрерывного. Так, например, в математическом анализе рассматриваются разложения аналитических функций в степенные ряды по целым. степеням х

Все вычисления по существу производятся с целыми числами, что сразу очевидно даже при внешнем рассмотрении счетных автоматов или арифмометров, а также математических таблиц, например таблиц логарифмов. После операций над целыми числами в определенных местах ставятся запятые, что соответствует образованию десятичных дробей; такие дроби, как и любые рациональные дроби, представляют отношение двух целых чисел. Между тем при действиях с любым действительным числом (например, π) мы фактически заменяем его рациональной дробью (например, считаем, что

В то время как установлением правил действий над числами занимается арифметика, более глубокие свойства натурального ряда (1), дополненного числом нуль и целыми отрицательными числами, изучает теория чисел — наука о системе целых чисел, а в расширенном смысле и о системах чисел, определенным образом построенных при помощи

целых чисел (см., в частности, § 5 этой главы). Разумеется, теория чисел рассматривает целые числа не изолированно одно от другого, а в их взаимосвязи, изучая свойства чисел, как они определяются отношениями между ними.

Одним из основных вопросов теории чисел является исследование делимости одного числа на другое: если результатом деления целого а на целое b (не равное нулю) является целое число, т. е. если

а = b ⋅ с

(а, b, с — целые), то говорят, что а делится на b или что b делит а. Если же в результате деления целого а на целое b получается дробь, то говорят, что а не делится на 6. На практике с вопросами делимости чисел приходится сталкиваться постоянно. Свойства делимости чисел играют важную роль в некоторых вопросах математического анализа. Если, например, разложение функции по целым степеням х

(2)

таково, что все нечетные коэффициенты, т. е. коэффициенты с номерами, не делящимися на 2, равны нулю, т. е. если

то функция удовлетворяет условию

такая функция называется четной функцией, и график ее симметричен относительно оси ординат. Если же в разложении (2) равны нулю все четные коэффициенты, т. е. коэффициенты с номерами, делящимися на 2, иначе говоря, если

в этом случае функция называется нечетной, и график ее симметричен относительно начала координат. Так, например,

(функция нечетная); (функция четная).

Геометрический вопрос о возможности построения правильного n-угольника при помощи циркуля и линейки оказывается зависящим от арифметической природы числа n1.

1 См. главу IV (том 1), стр. 264.

Простым числом называется целое число (большее единицы), имеющее лишь два целых положительных делителя: единицу и самого себя. Единица не причисляется к простым числам, так как она не имеет двух разных положительных делителей.

Простыми числами являются, следовательно, числа

2, 3, 5, 7, 11, 13, 17, 19, 23, 29,... (3)

О фундаментальной роли простых чисел в теории чисел говорит ее основная теорема: всякое целое x>1 может быть представлено в виде произведения простых чисел (возможно, с повторяющимися сомножителями), т. е. в виде

(4)

где p1 < p2, < ... < pk — некоторые простые и a1, a2,. .., ak — целые числа, не меньшие единицы, причем представление n в форме (4) является единственным.

Свойства чисел, связанные с представлением чисел в виде суммы слагаемых, называются аддитивными; свойства же чисел, относящиеся к представлению их в виде сомножителей, называются мультипликативными. Связь между аддитивными и мультипликативными свойствами чисел является чрезвычайно сложной; она выдвинула ряд основных проблем теории чисел.

Наличие в теории чисел трудных задач в соединении с тем, что целое число является простейшим и ясным математическим понятием, самым тесным образом связанным с объективной реальностью, приводит к тому, что при изучении глубоких вопросов теории чисел появляются новые идеи и развиваются мощные методы, имеющие зачастую значение не только в теории чисел, но и в других разделах математики. Так, например, громадное влияние на все развитие математики оказала идея бесконечности натурального ряда чисел, отражающая бесконечность материального мира в пространстве и во времени. Большое значение имеет факт упорядоченности членов натурального ряда. Изучение действий над целыми числами приводит к понятию алгебраической операции, играющему основную роль в ряде разделов математики.

Большое значение в математике имеет сложившееся прежде всего на арифметическом материале понятие алгорифма — процесса решения задачи, основанного на повторном выполнении строго определенного предписания; в частности, в машинной математике роль алгорифма является фундаментальной. Особенности алгорифмического решения задачи можно четко проследить на примере алгорифма Эвклида для нахождения общего наибольшего делителя двух натуральных чисел а и b.

Пусть а>b. Делим а на b и находим неполное частное q1 и, если b не является делителем а, остаток r2

(51)

Далее, если r2≠0, делим b на r2

(52)

Затем делим r2 на r3 и поступаем так до тех пор, пока не дойдем до остатка, равного нулю, что обязательно должно произойти ввиду убывания целых неотрицательных чисел r2, r3, .. . Пусть

(5n)

тогда гп как раз и будет общим наибольшим делителем а и b. Действительно, если два целых числа l и m имеют общий делитель d, то при целых h и к число hl+km также будет делиться на d. Предположим, что общий наибольший делитель а и b равен 8. Из равенства (52) видно, что δ будет делителем r2; из (52) следует, что δ будет делителем r3,...; из (5n-1) — что S является делителем rn. Но само rn является общим делителем а и b, так как из (5n) видно, что rn есть делитель rn-1; из (5n-1) — что rn есть делитель rn-2, и т. д. Поэтому S совпадает с rn, и задача нахождения общего наибольшего делителя а и b решена. Мы имеем здесь определенный, однотипный для любых а и b процесс, заведомо ведущий нас к искомому результату, — это характерный пример алгорифма.

Теория чисел оказала влияние на развитие многих математических дисциплин: математического анализа, геометрии, классической и современной алгебры, теории суммируемости рядов, теории вероятностей и др.

Методы теории чисел. По своим методам теория чисел делится на четыре части: элементарную, аналитическую, алгебраическую и геометрическую.

Элементарная теория чисел изучает свойства целых чисел, не прибегая к помощи других математических дисциплин. Так, например, исходя из тождества Эйлера

(6)

можно довольно быстро показать, что всякое целое N > 0 разлагается на сумму четырех квадратов целых чисел, т. е. представляется в виде

где x, у z, и — целые1.

1 Мы имеем здесь пример изучения неопределенного уравнения с точки зрения разрешимости его в целых числах.

Аналитическая теория чисел использует для решения задач теории чисел средства математического анализа. Основы аналитической теории чисел были заложены Эйлером и развиты П. Л. Чебышевым, Дирихле, Риманом, Рамануджаном, Харди, Литтльвудом и другими учеными. Наиболее мощные методы аналитической теории чисел созданы академиком И. М. Виноградовым, о чем будет сказано ниже. Эта область теории чисел тесно связана с такой богатой практическими приложениями дисциплиной, как теория функций комплексного переменного, а также с теорией рядов, теорией вероятностей и другими разделами математики.

Основным понятием алгебраической теории чисел является понятие алгебраического числа, т. е. корня уравнения

где a0, a1, a2, an — обычные целые числа1.

Крупнейший вклад в этот раздел теории чисел внесен Лагранжем, Гауссом, Куммером, Е. И. Золотаревым, Дедекиндом, А. О. Гельфондом и другими.

Основным объектом изучения геометрической теории чисел являются «пространственные решетки»—системы всех «целых» точек, т. е. точек, все координаты которых в заданной прямолинейной системе координат (прямоугольной или косоугольной) выражаются целыми числами. Пространственные решетки имеют большое значение для геометрии и для кристаллографии, и вместе с тем их исследование тесно связано с важными вопросами теории чисел (в частности с арифметической теорией квадратичных форм, т. е. теорией квадратичных форм с целочисленными коэффициентами и целочисленными переменными). Основоположные работы в области геометрической теории чисел принадлежат Г. Минковскому и Г. Ф. Вороному.

Необходимо отметить, что методы аналитической теории чисел имеют важные применения как в алгебраической, так и в геометрической теории чисел. Особенно здесь следует отметить проблему подсчета числа целых точек в заданной области, важную для некоторых разделов физики. Подходы к решению этой проблемы были намечены Г. Ф. Вороным, а методы ее решения развиты И. М. Виноградовым.

Глубокая причина силы аналитических методов теории чисел лежит в том, что здесь связи между дискретными целыми числами обогащаются привлечением новых связей через непрерывное.

Необходимо подчеркнуть, что в настоящей главе рассматриваются лишь некоторые избранные вопросы теории чисел.

1 Если a0=1, то алгебраическое число называется целым. Число, не являющееся алгебраическим, называется трансцендентным.

§ 2. КАК ИССЛЕДОВАЛИ ВОПРОСЫ, ОТНОСЯЩИЕСЯ К ПРОСТЫМ ЧИСЛАМ

Бесконечность числа простых чисел. При рассмотрении последовательности (3) простых чисел

2, 3, 5, 7, 11, 13, 17, 19, ...

естественно возникает вопрос: является ли эта последовательность бесконечной? Тот факт, что любое целое число представимо в форме (4), еще не решает вопроса, так как показатели a1, ..., ak могут принимать бесчисленное множество значений. Положительный ответ на поставленный вопрос был дан еще Эвклидом, причем доказательство того, что не может быть лишь какого-либо конечного числа к простых чисел, таково.

Пусть p1, p2, рк — простые, тогда число

m = p1р2...рk+1,

как всякое целое, большее единицы, или будет простым, или будет иметь простой делитель. Но m не может делиться ни на одно из простых чисел p1, p2, ..., pk, так как в противном случае разность m — p1р2 ... рк тоже делилась бы на это число, чего не может быть, поскольку эта разность равна единице. Следовательно, m само просто или делится на какое-то простое рк+1, отличное от p1 ...,pk. Таким образом, множество простых чисел не может быть конечным.

Решето Эратосфена. Греческому математику III в. до н. э. Эратосфену приписывается следующий метод «решета» для нахождения всех простых чисел, не превышающих заданного натурального N. Выписываются все целые числа от 1 до N

1, 2, 3, 4, ..., N,

а затем вычеркиваются сперва все числа, кратные двум, но не 2, затем все кратные трем, кроме 3, далее все кратные пяти (кратные четырем уже вычеркнуты), кроме 5, и т. д., а также 1; оставшиеся числа будут простыми. Следует заметить, что процесс вычеркивания надо продолжать до тех пор, пока мы не просмотрим все простые, меньшие, чем √N, так как всякое составное (т. е. не простое) число, не превосходящее N, имеет обязательно простой делитель, не превосходящий √N.

Рассмотрение последовательности простых чисел в ряде всех целых положительных чисел приводит к заключению о весьма сложной закономерности образования простых чисел: то встречаются такие простые, как 8004119 и 8004121, разность между которыми равна двум (так называемые «близнецы»), а то такие, далекие друг от друга, как 86629 и 86677, между которыми не лежит тем не менее ни одного простого числа. Вместе с тем таблицы показывают, что «в среднем» простые числа встречаются с ростом чисел все реже.

Тождество Эйлера. Его доказательство бесконечности простых чисел. Великий математик XVIII в. Л. Эйлер, член Российской Академии наук, ввел в рассмотрение следующую функцию от аргумента которую в настоящее время обозначают через ζ(s):

(7)

Как мы знаем из гл. II (том 1), данный ряд действительно сходится при s>1 (и расходится при s⩽1). Эйлер указал замечательное тождество, играющее очень важную роль в теории простых чисел:

(8)

где знак Пj указывает, что берется произведение по всем простым числам р выражений

Для того чтобы наметить ход доказательства этого тождества, заметим, что

следовательно:

Перемножая при различных простых р эти ряды и вспоминая, что каждое n единственным образом разлагается на произведение простых, мы и находим, что

Для строгого доказательства необходимо, конечно, обосновать возможность произведенных нами предельных переходов, что не представляет, однако, существенных затруднений.

Из тождества (8) можно вывести как следствие, что ряд

составленный из обратных величин всех простых чисел, расходится (это дает новое доказательство известного уже нам факта, что простых чисел не может существовать лишь конечное число), а также, что отношение числа простых, не превышающих х, к самому х стремится к нулю при неограниченном возрастании х.

Исследования П. Л. Чебышева о распределении простых чисел в натуральном ряде. Обозначим, как это теперь принято, число простых чисел, не превышающих х, через П (х); например, П(10) = 4, так как 2, 3, 5, 7 — все простые, не превышающие десяти; П(π) = 2, так как 2 и 3 все простые, не превышающие π. Как мы упоминали,

Как же убывает отношение , или, иначе говоря, по какому закону возрастает П(х)? Нельзя ли указать такую, сравнительно простую, хорошо известную функцию, которая относительно мало отличалась бы от П (х)? Знаменитый французский математик Лежандр, исходя из рассмотрения таблиц простых чисел, утверждал, что такой функцией является

(9)

где А = 1,08... , но доказательства этого утверждения не дал. Гаусс, который также занимался вопросом о распределении простых чисел, высказал предположение, что П (х) сравнительно мало отличается от

(заметим, что выполняется соотношение

(10)

которое проверяется интегрированием по частям и последующей оценкой полученного интеграла).

Первым, кто добился со времен Эвклида существенного продвижения в труднейшем вопросе о распределении простых чисел, был П. Л. Чебышев. В 1848 г., исходя из рассмотрения функции Эйлера ζ(s) при действительных s, Чебышев показал, что если п>0 сколь угодно велико и а>0 сколь угодно мало, то будут существовать сколь угодно большие х, для которых

а также сколь угодно большие х, для которых

что хорошо согласуется с предположением Гаусса. В частности, взяв n = 1 и учитывая (10), Чебышев установил, что

(11)

если только предел

существует.

П. Л. Чебышев опроверг также предположение Лежандра о величине А, входящей в выражение (9) и дающей наилучшее приближение к П(x), и показал, что этим значением может быть лишь А = 1.

Известный французский математик Бертран в своих исследованиях по теории групп встретился с необходимостью доказать следующее предложение, справедливость которого вплоть до весьма больших n он проверил эмпирически по таблицам: если n>3, то между n и 2n — 2 есть по крайней мере одно простое число. Все попытки Бертрана, а также других математиков, доказать это предложение оставались безрезультатными до 1850 г., когда Чебышев опубликовал вторую работу, посвященную простым числам, в которой не только доказал указанное предложение («постулат Бертрана»), но и показал, что при достаточно больших X выполняются неравенства

(12)

где

В § 3 мы дадим упрощенное изложение метода Чебышева, приводящее, правда, к значительно более грубым результатам, чем результаты самого Чебышева.

Работы Чебышева нашли многочисленные отклики у ряда математиков, в частности у Сильвестра и Пуанкаре. В течение более чем сорокалетнего периода ряд ученых занимался улучшением неравенств (12) Чебышева (увеличением постоянной в левой части равенства и уменьшением постоянной в правой части). Но при этом не удавалось показать существования предела

(о котором, как мы уже упоминали, из работ Чебышева было известно, что если он существует, то он равен единице).

Лишь в 1896 г. Адамар, исходя из соображений теории функций комплексного переменного, доказал, что введенная в рассмотрение Чебышевым функция Θ(x), определенная равенством

удовлетворяет условию

(13)

откуда уже довольно легко было получить и соотношение (11) без каких-либо дополнительных предположений (так называемый асимптотический закон распределения простых чисел).

Результат (13) был получен Адамаром на основе исследований знаменитого немецкого математика XIX в. Римана, изучавшего функцию Эйлера (7) ζ(s) при комплексных значениях переменной s = δ+it [в то время как Чебышев рассматривал ζ(s) при действительных значениях аргумента]1.

Риман показал, что функция ζ(s), определенная в полуплоскости δ > 1 рядом (7)

такова, что

является целой трансцендентной функцией [при s⩽1 ряд (7) перестает быть сходящимся, но значения ζ(s) в полуплоскости δ⩽1 определяются при помощи аналитического продолжения] (см. главу IX). Риман высказал предположение («гипотезу Римана») о том, что все корни ζ(s) в полосе 0⩽δ⩽1 имеют действительную часть, равную 1/2, т. е. лежат на прямой δ = 1/2; вопрос о справедливости этого предположения остается открытым и до сих пор.

Важным этапом доказательства (13) было установление факта, что на прямой δ = 1 не лежит корней ζ(s).

Исследование поведения ζ(s) привело к развитию стройной теории целых и мероморфных функций, имеющей важные практические приложения.

Работы Виноградова и его учеников по теории простых чисел.

Вслед за получением равенства (13), которое ввиду (10) может быть записано

(14)

возник вопрос о том, с какой степенью точности функция ∫dt/lnt представляет П(х). Наилучшие результаты в этом направлении были получены Н. Г. Чудаковым на основе применения созданного И. М. Виноградовым метода тригонометрических сумм (об этом методе будет сказано в § 4), которые позволили также Н. Г. Чудакову значительно уменьшить те границы, где можно утверждать наличие хотя бы одного

1 В 1949 г. А. Сельбергу удалось найти элементарное доказательство асимптотического закона распределения простых чисел (не опирающееся на теорию функций комплексного переменного).

простого числа. Именно, ранее было установлено, что если рассмотреть последовательность

(15)

то, начиная с некоторого n = n0, между двумя ее соседними членами, т. е. между n250 и (n + 1)250, лежит хотя бы одно простое число. Отметим, что, как это следует из формулы бинома,

т. е. эта разность очень велика. Н. Г. Чудакову удалось заменить последовательность (15) последовательностью

(16)

заметно более тесной, чем последовательность (15), однако также содержащей по крайней мере одно простое число между ее двумя последовательными членами, т. е. между n4 и (n + 1)4, начиная с некоторого n = n0. Впоследствии этот результат удалось еще уточнить, заменив четвертые степени кубами.

Если к и l взаимно простые, т. е. не имеют общего делителя, большего единицы, то арифметическая прогрессия с общим членом kt+l содержит бесчисленное множество простых чисел. Этот факт, обобщающий результат Эвклида, был установлен в XIX в. Дирихле. Какова же та граница, которую заведомо не превосходит наименьшее простое число в прогрессии kt + l? Ленинградский математик Ю. В. Линник доказал существование абсолютной постоянной С, обладающей тем свойством, что в любой прогрессии kt (k и l — взаимно простые) обязательно найдется хоть одно простое, меньшее кс. Тем самым Ю. В. Линник дал с принципиальной точки зрения почти полное решение поставленной много лет назад проблемы о наименьшем простом числе в арифметической прогрессии; дальнейшие исследователи могут лишь заняться уменьшением значения постоянной С. Ю. В. Линнику принадлежат также весьма важные исследования, относящиеся к вопросу о нулях функции ζ(s) и более общих функций.

Как уже упоминалось, наилучшие результаты в вопросе о распределении простых чисел были получены при помощи применения метода И. М. Виноградова оценки тригонометрических сумм.

Тригонометрической суммой называется сумма вида

где f(x)— некоторая действительная функция от х, причем х пробегает все целые значения, лежащие между А и B, или же определенную часть этих значений, например простые, лежащие между А и В. Так

как модуль e2ки при действительном z равен единице, а модуль суммы нескольких слагаемых не превосходит суммы модулей этих слагаемых, то, заведомо

(17)

Эту «тривиальную» оценку удается в ряде случаев существенно улучшить; решающие шаги в этом направлении были сделаны И. М.Виноградовым. Пусть, для определенности, f (х) — многочлен

Если все а—целые, то при х целом e2πif(x) = 1, и в этом случае, конечно, оценку (17) улучшить нельзя. Если же α1, ..., αn — не все целые, то, как установил И. М. Виноградов, оценка (17) может быть уточнена в зависимости от приближения какого-либо из этих коэффициентов рациональной дробью с знаменателем, не превышающим некоторого предела (можно показать, что всякое а, лежащее между 0 и 1, представимо в виде а = -, где а и q — целые, взаимно простые, —, и τ — наперед заданное целое, большее единицы).

Созданный Виноградовым метод тригонометрических сумм позволил ему решить ряд труднейших проблем теории чисел. В частности, в 1937 г. И. М. Виноградов разрешил знаменитую проблему Гольдбаха, доказав, что всякое достаточно большое нечетное N представимо в виде суммы трех простых чисел

(18)

Эта проблема возникла в 1742 г. из переписки Эйлера с другим членом Российской Академии наук — Х. Гольдбахом и на протяжении почти двух столетий оставалась нерешенной, несмотря на усилия ряда выдающихся математиков, пытавшихся добиться решения этой проблемы.

Как мы видели, в соответствии с равенством (4) простые числа играют фундаментальную роль при мультипликативном представлении целых чисел, равенство же (18) дает аддитивное представление нечетного числа через простые. Нетрудно видеть, что из (18) вытекает представимость достаточно большого четного числа в виде суммы не более чем четырех простых слагаемых1. Таким образом, теорема Виноградова—Гольдбаха устанавливает глубочайшую связь между аддитивными и мультипликативными свойствами чисел.

1 Вопрос о справедливости предположения Эйлера, что всякое достаточно большое четное N представимо в виде суммы двух простых, до настоящего времени остается открытым.

Значение метода тригонометрических сумм, созданного И. М. Виноградовым, не ограничивается одной теорией чисел. В частности, этот метод играет важную роль в теории функций и в теории вероятностей. Некоторое представление о методе Виноградова можно получить в § 4 этой главы.

Читатели, желающие подробнее познакомиться с этим методом, могут обратиться к книге И. М. Виноградова «Метод тригонометрических сумм в теории чисел», предварительно прочитав книгу И. М. Виноградова «Основы теории чисел».

§ 3. О МЕТОДЕ ЧЕБЫШЕВА

Функция Чебышева 0 и ее оценка. Дадим сейчас упрощенное изложение метода Чебышева для подсчета числа простых чисел, лежащих в данных пределах. Для краткости записи условимся употреблять следующие обозначения: если В — некоторая положительная переменная величина, которая может неограниченно возрастать, и А—другая величина, такая, что |А| растет «не быстрее» СВ, где С — положительная постоянная (точнее говоря, если существует постоянная С > 0 такая, что, начиная с некоторого момента, всегда |A|/B ⩽ C), то мы будем писать

А = O (В),

что читают обычно так: «A есть величина порядка В». Так, например,

ибо всегда точно так же

Будем также обозначать через [х] целую часть х, т. е. наибольшее целое число, не превосходящее х; так, например,

Поставим теперь следующий вопрос: пусть р — простое, n — натуральное, а n!, как обычно, обозначает произведение 1 ⋅ 2 ⋅ 3 .. . n (заметим кстати, что с возрастанием n величина п! возрастает очень быстро). Какова наибольшая степень а простого р, на которую n! делится без остатка?

Среди чисел 1, 2, n будет ровно [n/p] чисел, делящихся на р; число тех из них, которые делятся также и на p2, будет [n/p2]; далее, из последних чисел будет [n/p3] чисел, делящихся на p3, и т. д. Отсюда нетрудно видеть, что

(где ряд обрывается сам собой, так как [n/ps] > 0 только при n⩾ps). Действительно, в последней сумме каждый сомножитель произведения 1 ⋅ 2 ⋅ 3 ... n такой, что высшая степень числа p, на которую он делится, равна рm, учитывается ровно m раз: как кратный р, как кратный p2, как кратный р3, . .., наконец, как кратный рm.

Из полученного результата и представимости любого натурального числа в виде (4) вытекает, что n! будет произведением степеней вида

взятых для всех простых р⩽п. Следовательно, ln (n!) будет суммою логарифмов таких степеней, что сокращенно можно записать в виде

(19)

Равенство (19) мы упростим. Так как функция у = lnx — возрастающая, то

(это особенно ясно из рис. 1). Следовательно,

с другой стороны,

Рис. 1.

Пользуясь формулой интегрирования по частям, находим

Итак,

откуда следует, что

(20)

Заметим, что lnn = O(n); более того, lnn при n→∞ возрастает медленнее любой положительной степени n, т. е. при любом постоянном а > 0

(21)

так как по правилу раскрытия неопределенностей [см. главу II (том 1), стр. 130].

Далее находим

(22)

где C0 — сумма сходящегося ряда

Абсолютная сходимость этого ряда устанавливается с учетом (21), например при α = 1/2 , при помощи признака сравнения и так называемого интегрального признака сходимости рядов [см. главу II (том 1), § 14]. Ввиду (20) и (22) равенство (19) может быть приведено к виду

(23)

Рассмотрим теперь введенную Чебышевым функцию

(24)

(логарифм произведения всех простых чисел, не превосходящих n).

Равенство (23) мы может переписать так:

(25)

Действительно, каждый заданный ln р войдет во все те суммы вида

Число же таких сумм равно

Равенство (25) верно и для нецелых n. Чтобы в этом убедиться, очевидно достаточно показать, что оно верно для всех х с условием n < x < n +1 ; Для этого достаточно показать, что от замены n на х левая часть (25) не изменится, а первый член правой части может увеличиться лишь на О(n). Но первое следует из того обстоятельства, что от такой замены ни один из членов левой части не увеличится (обратное могло бы быть лишь при увеличении n не менее чем на единицу) и, конечно, не уменьшится. Второе следует из того, что по формуле для приращений функции [см. гл. II (том 1), стр. 128]

имеем

причем правая часть последнего равенства меньше ln(n+1)+1=O(n), так как 0<х — n<1. Вычитая из равенства (25) умноженное почленно на 2 равенство, полученное из (25) заменою n на n/2 » найдем

где C1 есть некоторое положительное постоянное. Но

не больше всей левой части, так как разности

не могут быть отрицательными. Поэтому из последнего неравенства следует

Подставляя здесь вместо n числа

получим также

откуда, учитывая, что

при достаточно больших к (когда

почленным сложением получим

(26):

Обращаясь далее к равенству (23), находим

ввиду чего равенство (23) дает

(27)

где С — постоянное, большее нуля, и θ — зависящее от n число такое, что |θ|<1.

Оценка количества простых чисел в определенном интервале. Покажем сейчас, что можно выбрать некоторую положительную постоянную M так, что между n и Мп будет лежать сколь угодно много простых р, если n достаточно велико. Именно, установим простые неравенства для числа Т простых чисел интервала nφ⩽Мn. Очевидно,

(28)

Из равенства (27), заменяя n на Мп, получим

(29)

следовательно, ввиду равенств (28), (29) и (27),

т. е.

(30)

Но, с другой стороны, так как функция

будет убывающей (так как

то при n ⩾ 3

откуда, ввиду (30), следует, что

(31)

и что

(32)

Возьмем теперь постоянную M так, чтобы правая часть (31) была равна единице,

т. е.

и положим

Тогда для числа Т простых, лежащих между n и Мп, мы получим из (31) и (32) неравенства

(33)

которые мы и имели в виду установить. Так как n/lnn→∞ при неограниченном возрастании n, то при этом и T→∞.

§ 4. О МЕТОДЕ ВИНОГРАДОВА

Метод Виноградова в приложении к решению проблемы Гольдбаха.

Мы попытаемся дать в этом параграфе некоторое представление о методе Виноградова на частном примере решения им проблемы Гольдбаха о представимости нечетного числа в виде суммы трех простых чисел.

Выражение числа представлений N суммой трех простых в виде интеграла. Пусть N — достаточно большое нечетное число. Обозначим через I (N) число представлений N в виде суммы трех простых чисел, иначе говоря, число решений уравнения

(34)

в простых числах p1, p2, p3.

Проблема Гольдбаха будет решена, если будет установлено, что I(N)>0. Метод Виноградова позволяет не только установить этот факт (для достаточно больших N), но и найти приближенное выражение для I(N).

I (N) можно записать в следующем виде:

(35)

где суммирование ведется по простым числам, не превышающим N. Действительно, при целом n≠0

так как

если же n = 0, то

Таким образом, всякий раз, когда простые p1, p2, p3 в сумме дают N, интеграл под знаком суммы в (35) обращается в единицу, а когда сумма p1 + p2 + p3 ≠ N, этот интеграл равен нулю, что и показывает справедливость равенства (35).

Так как — и интеграл от суммы нескольких слагаемых равен сумме интегралов от этих слагаемых, то из равенства (35) следует, что

Введем обозначение

(36)

тогда

(37)

Разбиение промежутка интегрирования на основные и дополнительные отрезки. Пусть h — некоторая, выбранная надлежащим образом в зависимости от N величина, неограниченно возрастающая вместе с N, но малая по отношению к N и даже к

Ввиду

того, что подынтегральная функция в (37) имеет период, равный единице, отрезок интегрирования в (37) можно заменить отрезком от — 1/τ до 1 — 1/τ . Поэтому

(38)

Рассмотрим теперь все правильные несократимые дроби a/q с знаменателями, не превосходящими h, и выделим из отрезка соответствующие этим дробям «основные» отрезки

(39)

при достаточно большом N эти отрезки, как это можно доказать1, не будут иметь общих точек. Таким образом, отрезок — будет разбит на отрезки основные и «дополнительные». Представим I (N) в виде суммы двух слагаемых

(40)

где I1(N) обозначает сумму интегралов по основным отрезкам, а I2(N) — сумму интегралов по дополнительным отрезкам. Как будет видно из дальнейшего, при неограниченном возрастании нечетного N неограниченно возрастает также 11(N), причем

(41)

1 Если бы два таких отрезка около точек — и — пересекались, то в общей точке было бы справедливо равенство

или иначе:

Но по абсолютной величине левая часть последнего равенства, не меньше, чем 1/q1q2, т. е. больше 1/h2, а правая не больше, чем 2/τ , т. е. меньше 2h/N. Если бы последнее равенство имело место, из него следовало бы неравенство < -, что противоречит выбору h.

Таким образом, ввиду (40), число представлений нечетного N в виде суммы трех простых чисел неограниченно возрастает вместе с N, что, в частности, доказывает предположение Гольдбаха для всех достаточно больших нечетных N.

Выражение интеграла по основным отрезкам. Пусть а принадлежит одному из основных отрезков; согласно (39), a = — , причем 1⩽q⩽h. Разобьем сумму (36)

распространенную на все простые числа, не превосходящие N, на частичные суммы Тα,м вида

где М' выбрано с таким расчетом, чтобы e2тЛгр «мало» отличалось от e2тлгм (имея в виду дать лишь понятие о методе Виноградова, а не доказательство теоремы Гольдбаха—Виноградова, мы не уточняем здесь и в дальнейшем смысла выражения «мало отличается»; на самом деле в доказательстве И. М. Виноградова речь идет о строго определенных неравенствах, связанных с большими вычислениями). Таким образом,

(42)

где знак ≈ указывает на то, что левая часть последнего соотношения «мало» отличается от средней его части. Разобьем далее каждую из сумм

(43)

на суммы T а , распространенные на простые числа ph удовлетворяющие соотношению M⩽pi

и, следовательно,

(44)

где П (M, M', l), — число простых чисел, удовлетворяющих условиям M⩽р<М' и принадлежащих арифметической прогрессии qx+l. В развитие формулы (14) для числа П(х) простых чисел, не превосходящих х, установлено, что П (M, М', l) для значений q, «малых» по сравнению с разностью М' — M, мало отличается от

где φ(q) — функция Эйлера. Это — арифметическая функция (т. е. функция, определенная для натуральных q), представляющая число целых положительных чисел, не превосходящих q и взаимно простых с q. Ввиду (44), таким образом, можно получить, что

(45)

В выражении, стоящем в правой части (45), лишь первый множитель зависит от Z, т. е. от выбора арифметической прогрессии qx+l (q мы рассматриваем сейчас как фиксированное). После суммирования по l получается, что

и далее, ввиду (42):

(46)

причем

что позволяет заменить (46) соотношением

(47)

После суммирования по M устанавливается, что

(48)

Входящая в правую часть соотношения (48) сумма

где суммирование распространяется на натуральные l, не превосходя-

щие q и взаимно простые с ним, выражается через арифметическую функцию μ(q), определенную следующим образом: μ(q) = 0, если q делится на квадрат целого числа, большего единицы; μ (1) = 1 и μ(q) = (—1)n, если q = p1p2 . . . рп, где p1, p2, . . ., рп — различные простые. Именно, при взаимно простых а и q

(49)

Поэтому уравнение (48) можно записать в виде

Ввиду того, что

(50)

В соответствии с определением I1 (N) имеем

(51)

где при данном q суммирование ведется по всем неотрицательным а, меньшим q. Так как a = -+z, то, вследствие (50),

(52)

Введем обозначение

(53)

Из соотношения (52) следует, что

(54)

Необходимо обратить внимание на то обстоятельство, что R(N) представляет собой некоторое аналитическое выражение, которое удается

приближенно подсчитать; именно, оказывается, что

(55)

Выражение, стоящее в правой части соотношения (54) множителем при R(N), «мало» отличается от суммы бесконечного ряда

(56)

так что, благодаря (54) и (55), удается установить, что

(57)

или, точнее говоря,

(58)

где

(59)

Заметим, что арифметическое выражение S (N) может быть представлено в виде

(60)

где С — некоторая постоянная, и произведение распространено на все простые делители числа N, причем, как показывают вычисления,

(61)

Оценка интеграла по дополнительным отрезкам. Перейдем теперь к оценке суммы 12 интегралов по дополнительным отрезкам. Так как модуль интеграла не превосходит интеграла от модуля подинтегральной функции и |е-| = 1 при действительном αN, то

(62)

где max | Та | представляет наибольшее значение |Та| при а, принадлежащих дополнительным отрезкам (мы усилили неравенство, взяв множителем при max | Та | интеграл, распространенный на весь отрезок

Но квадрат модуля комплексного числа равен произведению этого числа на сопряженное с ним комплексное число, и, следовательно,

где ввиду (36)

так как . Поэтому неравенство (62) можно переписать в виде

или в виде

(63)

Но интеграл, входящий в неравенство (63), в соответствии со сказанным в начале настоящего параграфа, представляет число U решений в простых числах р, p1, не превосходящих N, уравнения р — p1 = 0, или попросту число простых чисел, не превосходящих N, т. е. П (N). Согласно результату (12) Чебышева

где В—постоянная. Таким образом,

(64)

где, повторяем, max |Та| представляет наибольшее значение |Та| на дополнительных отрезках. Ввиду (58) и (59) для доказательства теоремы Гольдбаха—Виноградова остается показать, что max | Та | имеет порядок меньший, чем — ; однако установление этого факта представляет наибольшую трудность и является центральным местом всего доказательства рассматриваемой теоремы.

Каждое а, принадлежащее одному из дополнительных интервалов, представимо в виде а = . Вопрос состоит, таким образом, в оценке модуля тригонометрической суммы

при указанных предположениях. Виноградов, в частности, установил, что

(65)

при этом он использовал одно указанное им весьма важное тождество, связанное с уже знакомой нам функцией μ(n).

К сожалению, здесь нет возможности дать доказательство равенства (65); читателям, желающим познакомиться с этим доказательством, следует обратиться к главе X книги И. М. Виноградова «Метод тригонометрических сумм в теории чисел».

Из (65) и (64), как уже отмечалось, вытекает, что

Таким образом, ввиду (40), (58) и (59)

(66)

где

и S (N) имеет значение (60), причем, ввиду (61), S (N)>0,6. Этим и завершается доказательство теоремы.

§ 5. РАЗЛОЖЕНИЕ ЦЕЛЫХ ЧИСЕЛ НА СУММУ ДВУХ КВАДРАТОВ. ЦЕЛЫЕ КОМПЛЕКСНЫЕ ЧИСЛА

Важность изучения простых чисел определяется в значительной степени тем, что они, повидимому, играют центральную роль в большинстве теоретико-числовых закономерностей: зачастую вопросы, на первый взгляд далекие от теории делимости, оказываются при более тщательном рассмотрении тесно связанными с теорией простых чисел. Поясним это следующим примером.

Одной из задач теории чисел является задача о том, какие натуральные числа разлагаются на сумму двух квадратов целых чисел (не обязательно отличных от нуля).

Непосредственно в ряде чисел, являющихся суммами двух квадратов, закономерности не видно. Например, в ряде чисел от 1 до 50 суммами двух квадратов являются числа 1, 2, 4, 5, 8, 9, 10, 13, 16, 18, 20, 25, 26, 29, 32, 34, 36, 37, 40, 41, 45, 49, 50 — последовательность довольно причудливая.

Французский математик XVII в. Ферма заметил, что все дело в том,, каким образом представляемое число разлагается на простые множители, т. е. вопрос относится собственно к теории простых чисел.

Простые числа, кроме р = 2, нечетные и поэтому при делении на 4 могут давать в остатке либо 1 (простые числа вида 4n +1), либо 3 (простые числа вида 4n+3).

1. Простое число р есть сумма двух квадратов тогда и только тогда, когда p = 4n+1.

Доказательство того, что числа вида 4n + 3 не могут являться суммами двух квадратов, почти очевидно; действительно, сумма квадратов двух четных чисел делится на 4, сумма квадратов двух нечетных чисел дает при делении на 4 в остатке 2, а сумма квадратов четного и нечетного чисел дает в остатке 1.

Сделаем несколько предварительных замечаний о простых числах, именно докажем, что если р просто, то (р — 1)! + 1 делится на p. Числа, не делящиеся на р, дают в остатках при делении на р числа 1, 2, 3, . . ., р—1. Возьмем целое r, 1⩽r⩽p—1, и будем умножать r на 1, 2, . . ., р—1; в остатках от деления построенных таким образом произведений на р получаются, как нетрудно доказать, все те же числа, но, вообще говоря, в другом порядке. В частности, среди остатков будет 1, т. е. для каждого г найдется такое r1, что r ⋅ r1 = 1 +кр. Заметим, что r = r1, только если r = 1 или r = р—1. Действительно, если r2 = 1 +кр, то (r+1) (r—1) делится на р; для чисел 1⩽r⩽p—1 это возможно лишь при r = 1 и r = р — 1. Найдем остаток от деления (р — 1)! = 1 ⋅ 2 ⋅ ⋅ ⋅ (р — 1) при делении на р. В этом произведении для каждого сомножителя r, кроме 1 и р—1, найдется свое отличное от него r1, такое, что r ⋅ r1 имеет остаток 1. Поэтому (р—1)! будет иметь тот же остаток от деления на p, как если бы в нем было всего два сомножителя 1 и р — 1, т. е. имеет остаток р—1. Таким образом, (р—1)! + 1 делится на р.

Пусть теперь р = 4n+ 1. Далее напишем

Выражение, стоящее во второй фигурной скобке, будет иметь при делении на р остаток

Поэтому

в рассматриваемом случае тоже делится на р. Обозначим через А остаток от деления на р. Очевидно, что и A2+1 делится на р.

Рассмотрим выражение х — Аy, в котором х и у независимо пробегают числа 0, 1, .., [\/р] ([х]—наибольшее целое число, не превосходящее х). Тогда получится ([^р] +1)2^р+1 числовых значений X — А у (различных или совпадающих иногда). Так как различных остатков от деления на р может быть лишь р (0, 1, 2, . . ., р—1), а числовых значений имеется р+1, то найдутся две различные пары (x1У у^ и (x2, y2), такие, что x1 — Ау^ и x2 — Ау2 будут иметь одинаковый остаток от деления на /?, т. е. (x1—х2) — А (уг — y2) делится на р. Положим: х0 = x1 — x2, Уо = √1 — √2- Очевидно, |xQ|≠Jp, |уO1<\/р- ?аз A2+1 делится на р, то y2(A2+ ц = (Ау0)2 +у1 будет делиться на р; но так как

х0— Ау0 делится на р, то будет делиться на р число х02 — (Ay0)2 = (x0 — Ау0)(x0+Ау0). Поэтому величина а^ + г/2, равная (х| — (Ay0f+ (Ayoy + yl), делится на р. Но |xQ|<|Jp, |y0j<vV. Отсюда заключаем, что x2+у2 либо 0, либо x2+у2 = р. Первое невозможно, так как пары (xv уг), (x2, y2) различны. Итак, простое число вида 4x +1 представляется в виде суммы двух квадратов.

2. Обратимся к разложению произвольных целых чисел на сумму двух квадратов. Легко проверяется тождество

Это тождество показывает, что произведение двух целых чисел, являющихся суммами квадратов, есть снова сумма квадратов. Отсюда следует, что произведение любых степеней простых чисел вида 4n +1 и 2 есть сумма двух квадратов. Так как, умножая сумму двух квадратов на квадрат, получаем сумму двух квадратов, то любое число, в котором простые множители вида 4n + 3 входят в четных степенях, является суммой двух квадратов.

3. Покажем, что если простое число вида 4n + 3 войдет в число в нечетной степени, то число не может быть разложено на сумму двух квадратов. Этим самым поставленный вопрос будет полностью исчерпан.

Будем рассматривать комплексные числа вида a + bi, где а и b — обыкновенные целые числа. Такие комплексные числа будем называть целыми комплексными числами. Если целое число N есть сумма двух квадратов N = a2+b2, то N = (a + bi) (а — bi) = α — а (через а обозначаем комплексно сопряженное к ос число), т. е. N разлагается в области целых комплексных чисел на комплексно сопряженные множители.

В области целых комплексных чисел можно построить теорию делимости, совершенно аналогичную теории делимости в области обычных целых чисел. Мы будем говорить, что целое комплексное число а делится на целое комплексное число ß, если α/ß есть снова целое комплексное число. Существует лишь четыре целых комплексных числа а, которые делят 1 — это 1, —1. i, —i. Мы будем говорить, что целое комплексное число а есть простое число, если оно не имеет других делителей, кроме 1, —1, i, —i, а, —а, αi, —αi. Теперь получила новый смысл задача, решенная в пункте 1: там выясняется, что простые числа вида 4n +1 и число 2 перестают быть простыми в области целых комплексных чисел. Легко установить, что простые числа вида 4n+3 остаются простыми. Действительно, если бы p = αβ, то p = αß, p2 = ααβß. Но αα и ßβ — обыкновенные целые положительные числа; p≠aa, ибо простые числа вида 4n+3 не являются суммами квадратов. Значит, aä = 1, т. е. a может быть либо +1, либо ±i, т. е. р не имеет делителей, отличных от очевидных.

Для целых комплексных чисел справедлива теорема об однозначном разложении на простые множители. Однозначность получается, конечно, если отвлечься от порядка сомножителей и от их комбинации с числами 1, —1, i, —i.

Пусть N есть сумма квадратов, N = αα. Пусть р — простое число вида 4n + 3. Подсчитаем, в какой степени р входит в число N. В силу того, что р остается простым и в области целых комплексных чисел, достаточно подсчитать, в какой степени р входит в а и в а. Но эти степени равны и поэтому р входит в N обязательно в четной степени, что и требовалось доказать.

Открытие того, что содержательная теория делимости возможна не только в области целых рациональных чисел (как мы видели, она имеет место в области целых комплексных чисел), сильно расширило кругозор математиков XIX в. Разработка этой идеи потребовала создания новых общих понятий в математике, как, например, понятия кольца, идеала. Значимость этих понятий в настоящее время далеко переросла рамки теории чисел.

ЛИТЕРАТУРА

Популярная литература

Постников А. Г. и Романов Н. П. Упрощение элементарного доказательства А. Сельберга асимптотического закона распределения простых чисел. «Успехи матем. наук», 10, № 4, 1955.

Статья содержит популярное изложение доказательства асимптотического закона и может служить дополнением к брошюре Шнирельмана.

Шнирельман Л. Г. Простые числа. Гостехиздат, 1940.

Учебники

Арнольд И. В. Теоретическая арифметика. Изд. 2-е, Учпедгиз, 1939.

Виноградов И. М. Основы теории чисел. Изд. 6-е, Гостехиздат, 1952.

Чебышев П. Л. Теория сравнений. Полное собрание сочинений, т. 1. Изд-во АН СССР, 1944.

Специальные монографии

Виноградов И.М. Метод тригонометрических сумм в теории чисел. Труды Математического института им. В. А. Стеклова, вып. XXIII, 1947.

Ингам М. Распределение простых чисел. ГОНТИ, 1936.

Хуа-Ло-Кен. Аддитивная теория простых чисел. Труды Математического института им. В. А. Стеклова, вып. XXII, 1947.

Глава XI

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

§ 1. ВЕРОЯТНОСТНЫЕ ЗАКОНОМЕРНОСТИ

Простейшие закономерности, устанавливаемые естествознанием, заключаются в указании условий, при которых какое-либо интересующее нас событие заведомо происходит или заведомо не происходит, т. е. эти условия могут быть выражены по одной из следующих двух схем:

1) если осуществляется комплекс (т. е. совокупность) условий S, то с достоверностью происходит событие А;

2) если осуществляется комплекс условий S, то событие А произойти не может.

В первом случае событие А по отношению к комплексу условий S называется «достоверным» или «необходимым» событием, а во втором — «невозможным» событием. Например, при атмосферном давлении и температуре t, лежащей в пределах 0°<t<100° (комплекс условий S), вода с достоверностью находится в жидком состоянии (достоверное событие A1), а в газообразном или в твердом состоянии находиться не может (невозможные события A2 и A3).

Событие А, которое при осуществлении комплекса условий S иногда происходит, а иногда не происходит, называется по отношению к этому комплексу условий случайным. Возникает вопрос: означает ли случайность события А отсутствие всякой закономерной связи между комплексом условий S и событием А? Пусть, например, установлено, что лампы определенного типа, производимые определенным заводом (условия S), иногда горят более 2000 час. (событие A), а иногда до истечения этого срока перегорают и приходят в негодность. Могут ли тем не менее опыты с проверкой способности ламп гореть 2000 час. служить для характеристики качества продукции завода? Или следует ограничиться указанием того срока (скажем, 500 час), в течение которого практически все лампы безотказно работают, и того срока, после которого практически все лампы перегорают (скажем, срока в 10 000 час?) Ясно, что характеристика срока работы ламп только неравенствами 500 ⩽ T ⩽ 10000 мало удовлетворит потребителя. Потребитель получит значительно более полную информацию, если ему будет сказано, что приблизительно в 80% случаев лампы служат не менее

2000 час. Еще более полная характеристика качества ламп будет содержаться в указании для любого Т процента v (Т) ламп, которые служат не менее Т часов, хотя бы в виде графика, изображенного на рис. 1.

Кривая ν(T) практически находится при помощи испытаний с пробной партией из достаточно большого числа (100—200) ламп. Естественно, что найденная таким образом кривая имеет действительную ценность лишь в том случае, если она правильно отражает реальную закономерность, действующую не только для данной пробной партии, но и вообще для ламп, производимых при заданном качестве материалов и при установленной на заводе технологии производства, т. е. если испытания, произведенные с другими пробными партиями, состоящими из ламп, изготовленных в тех же общих условиях, приводят к близким результатам (т. е. к кривым ν(T), мало отличающимся от кривой, полученной в результате испытаний первой пробной партии). Это значит, что статистическая закономерность, выражаемая кривыми ν (Т) в пробных партиях, является лишь отражением вероятностной закономерности, связывающей срок службы лампы с качеством материалов, из которых она изготовлена, и с технологией ее изготовления.

Эта вероятностная закономерность задается при помощи функции P(Т), где Р(T) есть вероятность того, что отдельная лампа (произведенная при заданных условиях) будет гореть не менее Т часов.

Утверждение о существовании у события А определенной вероятности

при условиях S заключается в том, что в различных достаточно длинных сериях испытаний (т. е. осуществлений комплекса условий S) получаемые частоты появления события А

(где nr — число испытаний r-ой серии, μr — число тех испытаний этой серии, при которых произошло событие А) будут приблизительно одинаковы и близки к p.

Гипотеза о существовании такой константы р = Р (A/S) (объективно обусловленной характером связи между комплексом условий S и событием A), к которой частоты v оказываются, «вообще говоря», тем ближе,

Рис. 1.

чем больше число испытаний n, хорошо оправдывается для широкого класса явлений. Такого рода явления естественно называть вероятностно-случайными1.

Рассмотренный выше пример относится к области вероятностных закономерностей массового производства. Реальность такого рода закономерностей не подлежит никакому сомнению. На них основаны весьма важные практические приемы статистического выборочного контроля массовой продукции. Близкой по способу образования вероятностных закономерностей является область вероятностных законов рассеивания снарядов, имеющих основное значение для теории стрельбы. Так как исторически это один из первых примеров реального применения методов теории вероятностей к техническим задачам, то к некоторым простейшим задачам теории стрельбы мы еще вернемся далее.

Сказанное выше о «близости» вероятности р и частоты v при большом числе испытаний n несколько расплывчато; мы ничего не сказали о том, насколько мала разность ν—р при том или ином n. Степень близости ν к р получит количественную оценку в § 3. Интересно отметить, что полностью исключить некоторую неопределенность в этом вопросе нельзя. Само утверждение о близости ν и р, как это обнаруживается при уточнении вопроса, имеет лишь вероятностный характер.

§ 2. АКСИОМЫ И ОСНОВНЫЕ ФОРМУЛЫ ЭЛЕМЕНТАРНОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ

Поскольку большая роль статистических закономерностей несомненна, возникает вопрос о методах их изучения. Прежде всего возникает мысль о возможности чисто эмпирического, экспериментального их исследования. Так как вероятностная закономерность проявляется в массовых процессах, то представляется естественным, что для ее обнаружения необходимо произвести массовый эксперимент.

Такое представление, однако, истинно лишь отчасти. Установив некоторые вероятностные закономерности экспериментально, можно выводить из них новые вероятностные закономерности логическим или вычислительным путем при помощи некоторых общих допущений. Прежде чем показать, как это делается, мы должны перечислить некоторые основные определения и формулы теории вероятностей.

Из представления о вероятности как о нормальном значении частоты ν = m/n, где 0 ⩽ m ⩽ n, и, следовательно, 0⩽ν⩽1, вытекает, что

вероятность Р(A) любого события А естественно считать лежащей между нулем и единицей2

0<Р(A)<1. (1)

1 Иногда их называют стохастическими.

2 Запись P (A/S) мы для краткости изменим теперь на Р (А).

Два события называются несовместимыми, если они не могут (при осуществлении комплекса условий S) произойти оба. Например, при бросании игральной кости выпадение четного числа очков и выпадение тройки являются событиями несовместимыми. Событие А называется соединением событий A1 и A2, если оно состоит в том, что происходит хотя бы одно из событий A1 или A2. Например, при бросании игральной кости событие А, состоящее в выпадении 1, 2 или 3, является соединением событий A1 и A2, где A1 состоит в выпадении 1 или 2, а A2 — в выпадении 2 или 3. Легко видеть, что для чисел появлений m1, m2 и m двух несовместимых событий A1 и A2 и их соединения А = A1и A2 имеет место равенство m = m1 + m2, что дает для соответствующих частот ν1+ν2.

Это приводит к естественности следующей аксиомы сложения вероятностей:

(2)

если события A1 и A2 несовместимы и A1 ∪ A2 обозначает их соединение.

Далее, для достоверного события U естественно принять

P(U) = 1. (3)

Вся математическая теория вероятностей строится на простых аксиомах такого типа, как (1), (2) и (3). С точки зрения чистой математики вероятность является числовой функцией от «события», обладающей рядом аксиоматически фиксированных свойств. Свойства вероятностей, выражаемые формулами (1), (2) и (3), служат достаточной основой для построения так называемой элементарной теории вероятностей, если не настаивать на том, что в аксиоматизации нуждаются и сами понятия события, соединения событий и определяемого ниже совмещения событий. Начинающему полезнее держаться наглядного понимания терминов «событие» и «вероятность», но полезно знать, что не поддающийся полной формализации реальный смысл этих понятий не влияет на полную формальную отчетливость аксиоматизированного чисто математического изложения теории вероятностей.

Будем называть соединением событий A1, A2, ..., As, данных в любом числе, событие А, заключающееся в том, что происходит хотя бы одно из этих событий. Тогда из аксиомы сложения легко получаем для любого числа попарно несовместимых событий A1, A2, ..., Аn и их соединения А

(так называемая теорема сложения вероятностей).

Если соединение этих событий есть достоверное событие (т. е. при каждом осуществлении комплекса условий S происходит какое-либо из событий Ак), то

В этом случае систему событий A1, . .., As называют полной системой событий.

Рассмотрим теперь два, вообще говоря, совместимых события А и В. Событие С назовем совмещением событий А и В (С = АВ), если событие С состоит в том, что происходят оба события А и B1.

Например, если событие А состоит в том, что число очков, выпадающее при бросании игральной кости, четно, a S — в том, что оно кратно трем, то событие С состоит в том, что число очков равно шести.

Пусть при большом числе n повторных испытаний событие А появилось m раз, а событие В появилось l раз, причем к раз вместе с событием А. Отношение к/т естественно назвать условной частотой события В при условии А. Связывающей частоты k/m , m/n и k/n формуле

естественно сопоставить следующее определение:

Условной вероятностью Р(В/А) события В при условии А называется отношение

Здесь предполагается, конечно, что Р(A)≠0.

Если события А и В по существу никак не связаны друг с другом, то естественно предполагать, что событие В не должно появляться при условии наступления события А ни существенно чаще, ни существенно реже, чем при рассмотрении всех вообще испытаний, т. е. что приближенно

В последнем приближенном равенстве m/n = νА есть частота события А, l/n = νB — частота события В, наконец, k/n = νAB — частота совмещения событий А и В.

Мы видим, что эти частоты связаны соотношением

Для вероятностей событий А, В и AB естественно поэтому принять соответствующее точное равенство

(4)

Равенство (4) служит определением независимости двух событий А и В.

1 Аналогично совмещение С любого числа событий A1, A2, ..., As состоит в наступлении всех указанных событий.

Аналогично можно определить независимость любого числа событий. Кроме того, можно дать определение независимости любого числа испытаний (последнее, грубо говоря, сводится к тому, что тот или иной исход части этих испытаний никак не влияет на исход остальных1).

Вычислим теперь вероятность Рk ровно к появлений некоторого события А в n независимых испытаниях, в каждом из которых вероятность р появления этого события одна и та же. Обозначим через A событие, заключающееся в непоявлении события А. Очевидно, что

Из определения независимости испытаний нетрудно усмотреть, что вероятность какой-либо определенной последовательности, составленной из к появлений А и n—к непоявлений А, равна

(5)

Так, например, при n = 5 и к = 2 вероятность получить последовательность исходов ААААА будет р(1—р)р(1—р)(1—Р) = Р2(1—Р)3.

По теореме сложения вероятность Рк равна сумме вероятностей всех последовательностей с к появлениями и n — к непоявлениями события А, т. е. в силу (5) равна произведению числа таких последовательностей на рк (1—р)n—k. Число таких последовательностей, очевидно, равно числу сочетаний из n по А, поскольку к положительных исходов могут занимать в ряду из n испытаний любые k мест.

Окончательно получаем

(6)

(так называемое биномиальное распределение).

Чтобы увидеть, как применяются приведенные выше определения и формулы, рассмотрим пример, относящийся к теории стрельбы.

Пусть для поражения цели достаточно пяти попаданий. Нас интересует вопрос, имеем ли мы право рассчитывать на то, что необходимые пять попаданий получатся в результате 40 выстрелов. Чисто эмпирический метод решения этой задачи заключался бы в следующем. При заданных размерах цели и заданной дистанции стрельбы производится много (скажем, 200) стрельб по 40 выстрелов в каждой и определяется, в каком числе стрельб получилось не менее пяти попаданий в цель.

1 Точнее независимость испытаний означает следующее. Разобьем n испытаний каким-либо образом на две группы; пусть событие А заключается в том, что все испытания первой группы заканчиваются какими-либо наперед заданными исходами, а событие В — в том, что все испытания второй группы заканчиваются какими-либо исходами, также наперед заданными. Испытания называются независимыми (в совокупности), если при любом разбиении и любом задании исходов определенные выше события А и В независимы в смысле (4).

К обсуждению реального смысла понятия независимости мы еще вернемся в § 4.

Если этот результат был достигнут, например, в 195 стрельбах из 200, то вероятность Р равна приблизительно

По рассмотренному чисто эмпирическому рецепту исследования мы потратили бы 8000 снарядов для решения крайне специальной задачи. Так на практике, конечно, не поступают. Вместо этого начинают с исследования рассеивания снарядов при данной дистанции стрельбы независимо от размеров цели. Оказывается, что отклонения по дальности и боковые отклонения от средней точки падения подчиняются в смысле частоты, с которой встречаются отклонения различных размеров, закону, изображенному на рис. 2. Буквой В здесь обозначено так называемое вероятное отклонение. Вероятное отклонение, вообще говоря, различно для отклонений по дальности и боковых отклонений и, кроме того, увеличивается с увеличением дистанции стрельбы. Вероятные отклонения для различных дистанций для каждого типа орудия и снаряда находятся эмпирически при помощи опытных стрельб на артиллерийском полигоне. После же этого решение всевозможных специальных задач такого типа, как поставленная выше, производится расчетным путем.

Предположим для простоты, что интересующая нас цель имеет вид прямоугольника, одна сторона которого направлена вдоль линии стрельбы и имеет размеры в два вероятных отклонения по дальности, а другая сторона, перпендикулярная линии стрельбы, равна двум вероятным боковым отклонениям. Предположим, далее, что цель хорошо пристреляна и средняя траектория полета снарядов проходит через ее центр (рис. 3).

Предположим еще, что боковое отклонение и отклонение по дальности независимы1. Тогда для попадания в цель данным снарядом необходимо и достаточно, чтобы его отклонения по дальности и боковое не превосходили соответствующих вероятных отклонений. В соответствии с рис. 2 каждое из этих событий будет наблюдаться примерно для 50% выпущенных снарядов, т. е. с вероятностью 1/2. Совмещение обоих этих событий будет происходить примерно для 25% выпущенных снарядов, т. е. вероятность попадания отдельного снаряда в цель будет равна

Рис. 2.

1 Эти предположения независимости подтверждаются опытом.

а вероятность промаха при отдельном выстреле будет равна

Предполагая, что попадания при отдельных выстрелах представляют собой независимые события и применяя биномиальную формулу (6), мы находим, что вероятность получить при 40 выстрелах ровно к попаданий будет равна

Интересующая нас вероятность получить не менее пяти попаданий выразится теперь формулой P = ΣPk. Но ее проще вычислить по формуле Р = 1 — Q, исходя из вероятности Q = ΣPk получить менее пяти попаданий.

Можно подсчитать, что

откуда

Полученная вероятность Р даже несколько ближе к единице, чем это обычно признается достаточным в теории стрельбы при назначении числа снарядов, способного обеспечить выполнение поставленной задачи. Чаще всего считают возможным указывать число снарядов, которое гарантирует выполнение поставленной задачи с вероятностью 0,95.

Рис. 3.

Рассмотренный пример несколько схематичен, но он достаточно убедительно показывает важность вероятностных расчетов. Установив из опыта зависимость вероятных отклонений от дистанции стрельбы, для чего достаточно совсем небольшого числа стрельб на полигоне, мы можем потом при помощи несложных расчетов получать ответы на самые разнообразные вопросы. Так же дело обстоит и во всех других областях, где совместное действие большого числа случайных факторов приводит к статистическим закономерностям. При непосредственной обработке массовых наблюдений выясняются лишь самые простые из этих статистических закономерностей, т. е. находятся лишь некоторые исходные вероятности. Затем, при помощи законов теории вероятностей, отправляясь от этих исходных вероятностей, вычисляют вероятности более сложных явлений и на основе этих вычислений делают выводы о статистических закономерностях, управляющих интересующими нас сложными явлениями.

Иногда удается и совсем обойтись без собирания массового статистического материала, так как исходные вероятности могут быть определены из достаточно убедительных соображений симметрии. Например, традиционный вывод о том, что игральная кость, т. е. куб, вырезанный из однородного материала, при бросании с достаточной высоты падает на каждую из своих граней с одинаковой вероятностью 1/6 был сделан несомненно раньше, чем вполне систематически был собран достаточный для оправдания этого вывода наблюдательный материал. Систематические опыты такого рода производились в XVIII—XX вв. преимущественно составителями учебников по теории вероятностей, когда теория вероятностей уже была разработанной наукой. Результат этой проверки был удовлетворителен, но распространение подобной деятельности на новые аналогичные случаи вряд ли представляет интерес. Например, насколько нам известно, никто не производил достаточно обширных опытов с бросанием вырезанного из однородного материала правильного двенадцатигранника. Но нет никаких сомнений, что если бы было произведено, скажем, 12000 таких бросаний, то двенадцатигранник упал бы на каждую из своих граней приблизительно в тысяче случаев.

Получение исходных вероятностей из соображений симметрии или однородности играет также большую роль во многих серьезных научных задачах, например во всех задачах на столкновения или сближения беспорядочно двигающихся молекул газа или — с таким же успехом — звезд галактики. Конечно, в таких более деликатных случаях предпочитают хотя бы косвенно проверять сделанные допущения путем сравнения вытекающих из них выводов с опытом.

§ 3. ЗАКОН БОЛЬШИХ ЧИСЕЛ И ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ

Вполне естественна потребность количественно уточнить утверждение о том, что в «больших» сериях испытаний частоты появления со»

бытия «близки» к его вероятности. Следует ясно представить себе известную деликатность этой задачи. В наиболее типичных для теории вероятностей случаях дело обстоит так, что в сколь угодно длинных сериях испытаний остаются теоретически возможными оба крайних значения частоты

Поэтому, каково бы ни было число испытаний n, нельзя утверждать с полной достоверностью, что будет выполнено, скажем, неравенство

Например, если событие А заключается в выпадении при бросания игральной кости шестерки, то при n бросаниях с вероятностью (1/6)n > 0 мы все время будем получать одни шестерки, т. е. с вероятностью (1/6)n получим частоту появления шестерок, равную единице, а с вероятностью (1 — 1/6)n > 0 шестерка не выпадает ни одного раза, т. е. частота появления шестерок окажется равной нулю.

Во всех подобных задачах любая нетривиальная оценка близости между частотой и вероятностью действует не с полной достоверностью, а лишь с некоторой меньшей единицы вероятностью. Можно, например, доказать, что в случае независимых испытаний1 с постоянной вероятностью р появления события неравенство

(7)

для частоты μ/n будет выполняться при n = 10 000 (и любом р) с вероятностью

Р > 0,9999. (8)

Здесь мы прежде всего хотим подчеркнуть, что в приведенной формулировке количественная оценка близости частоты μ/n к вероятности р связана с введением новой вероятности Р.

Реальный смысл оценки (8) таков: если произвести N серий по n испытаний и сосчитать число M серий, в которых выполняется неравенство (7), то при достаточно большом N приближенно будет

(9)

Но если мы захотим уточнить соотношение (9) как в отношении степени близости к Р, так и в отношении надежности, с которой

1 См. сноску на стр. 257. Доказательство оценки (8) пояснено на стр. 265.

можно утверждать, что такая близость будет иметь место, то придется обратиться к рассмотрениям, аналогичным тем, которые мы уже провели в применении к близости μ/n и р. При желании такое рассуждение можно повторять неограниченное число раз, но вполне понятно, что это не позволит нам совсем освободиться от необходимости на последнем этапе обратиться к вероятностям в примитивном грубом понимании этого термина.

Не следует думать, что подобного рода затруднения являются какой-то особенностью теории вероятностей. При математическом изучении реальных явлений мы всегда их схематизируем. Отклонения хода действительных явлений от теоретической схемы можно, в свою очередь, подвергнуть математическому изучению. Но для этого сами эти отклонения надо уложить в некоторую схему и этой последней пользоваться уже без формального математического анализа отклонений от нее.

Заметим, впрочем, что при реальном применении оценки1

(10)

к единичной серии из n испытаний мы опираемся и на некоторые соображения симметрии: неравенство (10) указывает, что при очень большом числе N серий соотношение (7) будет выполняться не менее чем в 99,99% случаев; естественно с большой уверенностью ожидать, что, в частности, неравенство (7) осуществится в интересующей нас определенной серии из n испытаний, если мы имеем основания считать, что эта серия в ряду других серий занимает рядовое, ничем особенным не отмеченное положение.

Вероятности, которыми принято пренебрегать в различных практических положениях, различны. Выше уже отмечалось, что при ориентировочных расчетах расхода снарядов, гарантирующего выполнение поставленной задачи, удовлетворяются нормой расхода снарядов, при которой поставленная задача решается с вероятностью 0,95, т. е. пренебрегают вероятностями, не превышающими 0,05. Это объясняется тем, что переход на расчеты, исходящие из пренебрежения, скажем, лишь вероятностями, меньшими 0,01, приводил бы к большому увеличению норм расхода снарядов, т. е. практически во многих случаях к выводу о невозможности выполнить поставленную задачу за тот короткий промежуток времени, который для этого имеется, или с фактически могущим быть использованным запасом снарядов.

Иногда и в научных исследованиях ограничиваются статистическими приемами, рассчитанными исходя из пренебрежения вероятностями в 0,05. Но это следует делать лишь в случаях, когда собирание более

1 Так записывают оценку (8) для вероятности неравенства (7).

обширного материала очень затруднительно. Рассмотрим в виде примера таких приемов следующую задачу. Допустим, что в определенных условиях употребительный препарат для лечения какого-либо заболевания дает положительный результат в 50%, т. е. с вероятностью 0,5. Предлагается новый препарат и для проверки его преимуществ над старым планируется применить его в десяти случаях, выбранных беспристрастно из числа больных, находящихся в том же положении, что и те, для которых установлена эффективность старого препарата в 50%. При этом устанавливается, что преимущество нового препарата будет считаться доказанным, если он даст положительный результат не менее чем в восьми случаях из десяти. Легко подсчитать, что такое решение связано с пренебрежением вероятностью получить ошибочный вывод (т. е. вывод о доказанности преимущества нового препарата, в то время как он равноценен или даже хуже старого) как раз порядка 0,05. В самом деле, если в каждом из десяти испытаний вероятность положительного исхода равна р, то вероятности получить при десяти испытаниях 10, 9 или 8 положительных исходов, равны соответственно

В сумме для случая р = 1/2 получаем

Таким образом, в предположении, что на самом деле новый препарат точно равноценен старому, мы рискуем сделать ошибочный вывод о том, что новый препарат превосходит старый, с вероятностью порядка 0,05. Чтобы свести эту вероятность приблизительно к 0,01, не увеличивая числа испытаний n =10, пришлось бы установить, что преимущество нового препарата будет считаться доказанным лишь тогда, когда его применение даст положительный результат не менее чем в девяти случаях из десяти. Если это требование покажется сторонникам нового препарата слишком суровым, то придется назначить число испытаний n значительно большим, чем 10. Если, например, при n = 100 установить, что преимущества нового препарата будут считаться доказанными при μ>65, то вероятность ошибки будет лишь 0,0015.

Если норма в 0,05 для серьезных научных исследований явно недостаточна, то вероятностью ошибки в 0,001 или в 0,003 по большей части принято пренебрегать даже в столь академических и обстоятельных исследованиях, как обработка астрономических наблюдений. Впрочем, иногда научные выводы, основанные на применении вероятностных закономерностей, обладают и значительно большей достоверностью (т. е. построены на пренебрежении значительно меньшими вероятностями). Об этом еще будет сказано далее.

В рассмотренных примерах мы уже неоднократно применяли частные случаи биномиальной формулы (6)

для вероятности Pm получить ровно m положительных исходов при n независимых испытаниях, в каждом из которых положительный исход имеет вероятность p. Рассмотрим при помощи этой формулы вопрос, поставленный в начале этого параграфа, о вероятности

(11)

где μ — фактическое число положительных исходов1. Очевидно, эта вероятность может быть записана в виде суммы тех Pm, для которых m удовлетворяет неравенству

(12)

т. е. в виде

(13)

где m1 — наименьшее из значений m, удовлетворяющих неравенству (12), а m2 — наибольшее из таких m.

Формула (13) при сколько-нибудь больших n мало пригодна для непосредственных вычислений. Поэтому имело очень большое значение открытие Муавром для случая p = 1/2 и Лапласом при любом р асимптотической формулы, которая позволяет очень просто находить и изучать поведение вероятностей Pm при больших n. Формула эта имеет вид

(14)

Если р не слишком близко к нулю или единице, то она достаточно точна уже при n порядка 100. Если положить

(15)

то формула (14) приобретет вид

(16)

1 μ принимает с вероятностями Pm, значения

Из (13) и (16) можно вывести приближенное представление вероятности (11)

(17)

где

(18)

Разность между левой и правой частями в (17) при постоянном и отличном от нуля и единицы р стремится при n → ∞ равномерно относительно ε к нулю. Для функции F(T) составлены подробные таблицы. Вот краткая выдержка из них

При Т→ ∞ значение функции F (Т) стремится к единице.

Произведем при помощи формулы (17) оценку вероятности

при n = 10 000. Так как Т

Так как функция F(Т) монотонно возрастает с возрастанием Т, то для не зависящей от р оценки Р снизу надо взять наименьшее возможное (при различных р) значение Т. Такое наименьшее значение получится при p=1/2, и оно будет равно 4. Поэтому приближенно

P⩾ F (4) = 0,99993. (19)

В неравенстве (19) не учтена ошибка, происходящая из-за приближенного характера формулы (17). Производя оценку связанной с этим обстоятельством погрешности, можно во всяком случае установить, что Р> 0,9999.

В связи с рассмотренным примером применения формулы (17) следует отметить, что оценки остаточного члена формулы (17), дававшиеся в теоретических сочинениях по теории вероятностей, долго оставались мало удовлетворительными. Поэтому применения формулы (17) и ей подобных к расчетам при не очень больших n или при вероятностях р, очень близких к 0 или к 1 (а такие вероятности во многих случаях и имеют особенно большое значение) часто основывались лишь на опыте проверок такого рода результатов для ограниченного числа примеров, а не на достоверно установленных оценках возможной

ошибки. Более подробное исследование, кроме того, показало, что во многих практически важных случаях приведенные выше асимптотические формулы нуждаются не только в оценке остаточного члена, но и в уточнении (так как без такого уточнения остаточный член слишком велик). В обоих направлениях наиболее полные результаты принадлежат С. Н. Бернштейну.

Соотношения (11), (17) и (18) можно переписать в виде

(20)

Для достаточно больших t правая часть формулы (20), не содержащая n, сколь угодно близка к единице, т. е. к значению вероятности, которое соответствует полной достоверности. Мы видим, таким образом, что, как правило, отклонения частоты μ/n от вероятности р имеют порядок —. Такая пропорциональность точности действия вероятностных закономерностей квадратному корню из числа наблюдений типична и для многих других вопросов. Иногда говорят даже в порядке несколько упрощенной популяризации о «законе квадратного корня из дг» как основном законе теории вероятностей. Полную отчетливость эта мысль получила благодаря введению великим русским математиком П. Л. Чебышевым в систематическое употребление метода сведения различных вероятностных задач к подсчетам «математических ожиданий» и «дисперсий» для сумм и средних арифметических «случайных величин».

Случайной величиной называется величина, которая в данных условиях S может принимать различные значения с определенными вероятностями. Для нас достаточно рассмотреть случайные величины, могущие принимать лишь конечное число различных значений. Чтобы указать, как говорят, распределение вероятностей такого рода случайной величины с, достаточно указать возможные ее значения x1, x2, . . ., хs и вероятности

В сумме эти вероятности по всем различным возможным значениям величины ξ всегда равны единице:

Примером случайной величины может служить изучавшееся выше число μ положительных исходов при n испытаниях.

Математическим ожиданием величины \ называется выражение

а дисперсией величины с называют математическое ожидание квадрата отклонения ξ — М(ξ), т. е. выражение

Корень квадратный из дисперсии

называется средним квадратическим отклонением (величины от ее математического ожидания М(ξ)).

В основе простейших применений дисперсий и средних квадратических отклонений лежит знаменитое неравенство Чебышева

(21)

Оно показывает, что отклонения ξ от M (ξ), значительно превышающие δξ, встречаются редко.

При образовании сумм случайных величин

для их математических ожиданий всегда имеет место равенство

(22)

Аналогичное равенство для дисперсий

(23)

верно только при некоторых ограничениях. Для справедливости равенства (23) достаточно, например, чтобы величины ξ(i) и ξ(j) с различными номерами не были, как говорят, «коррелированы» между собой, т. е. чтобы при i ≠ j выполнялось равенство1

(24)

1 Коэффициентом корреляции между величинами ξ(i) и ξ(j) называется выражение

Если σξ(i) > 0 и σξ(i) > 0, то условие (24) равносильно тому, что R = 0.

Коэффициент корреляции R характеризует степень зависимости между случайными величинами. Всегда |R|⩽1, причем R=±1 только при наличии линейной связи

Для независимых величин R = 0.

В частности, равенство (24) соблюдается, если величины и независимы между собой1. Таким образом, для взаимно независимых слагаемых всегда действует равенство (23). Для средних арифметических

из (23) вытекает

(25)

Предположим теперь, что для всех слагаемых дисперсии не превосходят некоторой постоянной

Тогда по (25)

и в силу неравенства Чебышева при любом t

(26)

Неравенство (26) содержит в себе так называемый закон больших чисел в форме, установленной Чебышевым: если величины взаимно независимы и имеют ограниченные дисперсии, то при возрастании n их средние арифметические ζ все реже заметно отклоняются от своих математических ожиданий М(ζ).

Более точно говорят, что последовательность величин

подчиняется закону больших чисел, если для соответствующих средних арифметических ζ и при любом постоянном ε > 0

(27)

при n → 00.

Чтобы получить из неравенства (26) предельное соотношение (27), достаточно положить

1 Независимость двух случайных величин ξ и η, способных принимать, соответственно, значения x1, x2, . . . ,хm и y1, y2, . . . , yn, по определению обозначает, что при любых i и j события Ai = {ξ = xi} и Bj = {η = yi} независимы в смысле определения, данного в § 2.

Большой ряд исследований А. А. Маркова, С. Н. Бернштейна, А, Я. Хинчина и других посвящен вопросу возможно большего расширения условий применимости предельного соотношения (27), т. е. условий применимости закона больших чисел. Эти исследования имеют принципиальное значение. Однако еще более важным является точное исследование распределения вероятностей отклонений ζ — М(ζ).

Великой заслугой русской классической школы в теории вероятностей является установление того факта, что при очень широких условиях асимптотически (т. е. со все большей точностью при неограниченно растущих n) справедливо равенство

(28)

Чебышев дал почти полное доказательство этой формулы для случая независимых и ограниченных слагаемых. Марков восполнил недостающее звено в рассуждениях Чебышева и расширил условия применимости формулы (28). Еще более общие условия были даны Ляпуновым. Вопрос о распространении формулы (28) на суммы зависимых слагаемых с особенной полнотой был изучен С. Н. Бернштейном.

Формула (28) охватила столь большое число частных задач, что долгое время ее называли центральной предельной теоремой теории вероятностей. Хотя при новейшем развитии теории вероятностей она оказалась включенной в ряд более общих закономерностей, ее значение трудно переоценить и в настоящее время.

Если слагаемые независимы и их дисперсии одинаковы и равны:

то формуле (28) удобно, учитывая соотношение (25), придать вид

(29)

Покажем, что соотношение (29) содержит в себе решение задачи об отклонениях частоты μ/n от вероятности p, которой мы занимались ранее.

Для этого введем случайные величины ξ(i), определяя их следующим условием:

Легко проверить, что тогда

и формула (29) дает

что при t1 = — t, t2 = t снова приводит к формуле (20).

§ 4. ДОПОЛНИТЕЛЬНЫЕ ЗАМЕЧАНИЯ ОБ ОСНОВНЫХ ПОНЯТИЯХ ТЕОРИИ ВЕРОЯТНОСТЕЙ

Говоря о случайных явлениях, которым свойственна устойчивость частот, т. е. тенденция при большом числе повторений известных условий происходить с частотами, группирующимися вокруг некоторого нормального уровня — вероятности V(A/S), мы допустили в § 1 некоторую неточность и расплывчатость формулировок в двух отношениях. Первая из допущенных неточностей заключается в том, что мы не указали, насколько велики должны быть по своей численности серии испытаний nr для того, чтобы устойчивость частот уже обязана была проявиться, и каковы именно допустимые отклонения частот μr/nr друг от друга и от нормального их уровня р при тех или иных численностях отдельных серий n1, n2, . . . , ns. Эта неточность на первом этапе формирования понятий новой науки неизбежна. Она нисколько не больше, чем известная расплывчатость, свойственная простейшим геометрическим понятиям точки или прямой в их физическом понимании. Эта сторона дела была затем уточнена в § 3.

Существеннее другая скрытая в наших формулировках неясность, относящаяся к способу формирования тех серий, в которых должна наблюдаться устойчивость частот появления события А.

Мы уже видели, что к статистическим и вероятностным методам исследования обращаются тогда, когда точное индивидуальное предсказание хода событий оказывается неосуществимым. Желая же искусственно создать по возможности чисто случайные явления, специально заботятся о том, чтобы никакими доступными средствами нельзя было заранее выделить те случаи, в которых явление А будет иметь тенденцию появляться чаще, чем с некоторой нормальной для него частотой.

Так организуются, например, тиражи государственных займов. Если в данном тираже из общего числа N облигаций на M из них выпадает выигрыш, то вероятность выигрыша для отдельной облигации равна р = M/N. Это значит, что каким бы образом мы ни выделили заранее до тиража совокупность облигаций достаточно большой численности n, мы можем быть практически уверены, что отношение μ/n числа μ выигравших облигаций в выделенной совокупности к общей численности n этой совокупности окажется близким к р. Например, лица, предпочитающие приобретать четные номера облигаций, не получат никакого систематического преимущества перед теми, которые предпочитают приобретать нечетные номера; точно так же не получат никакого преимущества лица, которые исхо-

дили бы из убеждения, что лучше всего приобретать облигации с номерами, разлагающимися ровно на три простых множителя, или облигации, номера которых являются соседними с теми, на которые упали выигрыши в предшествующем тираже, и т. п.

Точно так же при стрельбе из исправного орудия данного образца, с хорошо обученным обслуживающим персоналом и при нормальном способе получения снарядов, прошедших обычный для выпускаемой продукции контроль, мы будем получать отклонения от средней точки падения меньше определенного заранее вероятного отклонения В приблизительно в половине случаев. Эта пропорция сохранится в ряде последовательных стрельб, сохранится она и в том случае, если мы отдельно подсчитаем число отклонений, меньших В, для четных или нечетных (по порядку их во времени) выстрелов и т. п. Но вполне возможно, что, произведя отбор особенно однородных (в отношении их веса и т. п.) снарядов, мы могли бы рассеивание несколько уменьшить, т. е. получить серию снарядов, для которой доля отклонений, больших стандартного В, окажется существенно меньше половины.

Итак, говорить о том, что событие А является «вероятностно-случайным» и приписывать ему определенную вероятность

р=Р (A/S)

можно только тогда, когда указан класс допустимых способов формирования серий испытаний. Указание этого класса мы будем считать включенным в условия S.

При заданных условиях S свойство события А быть вероятностно-случайным и иметь вероятность р = Р (A/S) выражает объективный характер связи между условиями S и событием А. Иначе говоря, не существует событий абсолютно случайных, события являются случайными или необходимыми в зависимости от того, в какой связи они рассматриваются, но в определенных условиях событие может быть случайным совершенно объективно, и это его свойство не зависит от состояния знаний какого бы то ни было наблюдателя. Если вообразить наблюдателя который мог бы улавливать во всех деталях отличительные свойства и особые обстоятельства полета снарядов и, следовательно, предсказывать индивидуальные для каждого из них отклонения от средней траектории, то его присутствие не помешало бы снарядам рассеиваться по законам теории вероятностей (если, конечно, стрельба будет производиться обычным способом, а не по указаниям нашего воображаемого наблюдателя).

Заметим по этому поводу, что обсуждавшееся выше формирование серий, в которых проявляется тенденция к постоянству частот в смысле их группирования вокруг нормального значения — вероятности, тоже происходит в реальной обстановке совершенно независимо от нашего вмешательства. Например, именно в силу вероятностно-случайного характера движений молекул в газе число молекул, ударяющихся даже за очень малые промежутки времени о какую-либо площадку стенки сосуда или поверхности помещенных в газе тел, оказывается с большой точностью пропорциональным площади этой площадки и длине промежутка времени. Отклонения от этой пропорциональности в тех случаях, когда число ударов невелико, тоже следуют законам теории вероятностей и вызывают явления типа броуновского движения, о чем будет идти речь далее.

Обратимся к выяснению реального смысла понятия независимости. Напомним, что условная вероятность события А при условии В определялась формулой

(30)

Напомним также, что события А и В назывались независимыми, если, согласно (4),

Р(АВ) = Р (А)Р(В).

Из независимости событий А и В и Р (В) > 0 следует

Все теоремы математической теории вероятностей, говорящие о независимых событиях, применимы к любым событиям, удовлетворяющим условию (4), или его обобщениям на случай взаимной независимости многих событий. Эти теоремы имели бы, однако, мало интереса, если бы это определение не находилось в связи со свойствами реально независимых (в причинном смысле) явлений.

Известно, например, что вероятность новорожденному оказаться мальчиком имеет довольно устойчивое значение Р (А) = 22/43. Если В обозначает условие, что рождение происходит в день соединения Юпитера с Марсом, то в предположении, что расположение планет не определяет индивидуальных судеб людей, условная вероятность Р (A/B) имеет то же самое значение: Р (А/В) = 22/43, т. е. фактический подсчет частоты рождения мальчиков при таких специальных астрологических условиях привел бы именно к частоте 22/43. Хотя такой подсчет в достаточно обширных размерах, возможно, никем не производился, нет оснований сомневаться в его результате.

Мы привели этот несколько устарелый по содержанию пример для того, чтобы показать, что развитие человеческого познания состоит не только в установлении истинных связей между явлениями, но и в опровержении связей воображаемых, т. е. установлении в надлежащих случаях тезиса о независимости каких-либо двух кругов явлений. Разоблачение бессмысленности попыток астрологов связать между собою два круга явлений, друг с другом не связанных, является одним из классических тому примеров.

Естественно, что такого рода независимость не следует абсолютизировать. Например, в силу закона всемирного тяготения несомненно, что перемещение спутников Юпитера оказывает некоторое влияние, скажем, на полет артиллерийского снаряда. Но очевидно, что на практике с этими влияниями мы можем не считаться. С философской стороны, быть может, было бы правильнее вместо независимости говорить о несущественности в данной конкретной обстановке тех или иных зависимостей. Но как бы то ни было, независимость событий в объявленном сейчас конкретном и относительном понимании этого термина ни в какой мере не противоречит принципу всеобщей связи всех явлений, она лишь его необходимое дополнение.

Подсчеты вероятностей по формулам, выводимым из допущений о независимости тех или иных событий, имеют реальный интерес в том случае, когда события, бывшие сначала независимыми, ходом самих явлений приводятся затем в связь. Например, можно рассчитывать вероятности столкновения частиц космического излучения с частицами пронизываемой ими среды, исходя из допущения, что движение частиц среды до появления вблизи них быстро двигающейся частицы космического излучения происходит независимо от перемещения этой частицы. Можно рассчитывать вероятность попадания вражеской пули в лопасть вращающегося пропеллера, исходя из допущения, что его положение относительно оси не зависит от траектории пули (конечно, это допущение было бы ошибочно по отношению к собственной пуле, выпускаемой при стрельбе через пропеллер согласо-

ванно с его вращением) и т. п.; число таких примеров может быть неограниченно продолжено.

Можно даже сказать, что всюду, где достаточно ясно проявляются вероятностные закономерности, мы имеем дело с влиянием большого числа если не совсем независимых между собой, то в том или ином смысле слабо связанных друг с другом факторов.

Это совсем не означает, что следует всюду некритически вводить допущения о тех или иных независимостях. Наоборот, это заставляет, во-первых, особенно тщательно разрабатывать критерии для проверки гипотез о независимости, а во-вторых, особенно тщательно исследовать пограничные случаи, когда зависимости между факторами уже необходимо учитывать, но эти зависимости таковы, что вероятностные закономерности в измененном и осложненном виде еще могут проявиться. Выше отмечалось, что уже классическая русская школа теории вероятностей широко развернула исследования во втором из этих направлений.

Заканчивая рассмотрение вопроса о независимости, отметим, что как определение независимости двух событий формулой (4), так и формальное определение независимости нескольких случайных величин значительно шире понятия реальной независимости в смысле принадлежности к причинно не связанным кругам явлений.

Предположим, например, что точка ξ падает на отрезок [0,1] так, что при

вероятность ее попадания на отрезок [а, b] равна длине этого отрезка b — а. Легко доказать, что тогда в разложении

абсциссы точки ξ в десятичную дробь знаки будут взаимно независимы, хотя они и связаны по своему происхождению1. (Из этого обстоятельства вытекает много теоретически, а частью и практически интересных следствий.)

Такая гибкость формального определения независимости не должна рассматриваться как его недостаток. Наоборот, она лишь расширяет область применимости теорем, установленных при тех или иных допущениях о независимости. Эти теоремы применимы одинаково и в случаях, где независимость постулируется в силу реальных соображений, и в случаях, где независимость доказывается расчетом, исходя из ранее принятых допущений о распределениях вероятностей исследуемых событий и случайных величин.

Вообще исследование формальной структуры математического аппарата теории вероятностей привело к интересным результатам. Оказалось, что этот аппарат занимает вполне определенное и очень простое место в намечающейся постепенно классификации основных объектов изучения современной математики.

Мы уже говорили о понятии совмещения AB двух событий и о понятии соединения A∪В событий А и В. Напомним, что события называются несовместимыми, если их совмещение невозможно, т. е. если AB = N, где N — знак невозможного события.

Основной аксиомой элементарной теории вероятностей является требование (см. § 2), чтобы при условии AB = N соблюдалось равенство

1 То же имеет место при любом n для знаков разложения числа αk в дробь

Свойства основных понятий теории вероятностей — случайных событий и их вероятностей — вполне аналогичны, например, свойствам плоских фигур и их площадей. Достаточно понимать под AB пересечение (общую часть) двух фигур, под A∪В — их соединение, под N — условно вводимую «пустую» фигуру, а под Р (А) — площадь фигуры А и аналогия в намеченных пределах будет полной.

Такими же свойствами обладают объемы трехмерных фигур.

Наиболее общей теорией образований подобного типа, охватывающей как частные случаи теории объемов и площадей, является сейчас общая теория меры, некоторые сведения о которой можно найти в главе XV (том 3), посвященной теории функций действительного переменного.

Следует только отметить, что в теории вероятностей имеются по сравнению с общей теорией меры или специально с теорией площадей и объемов некоторые специфические черты: вероятность никогда не бывает больше единицы. Эту максимальную вероятность имеет необходимое событие U

Р(U) = 1.

Аналогия не является поверхностной. Оказалось, что вся математическая теория вероятностей с формальной стороны может быть построена как теория меры, специализированная допущением, что мера «всего пространства» U равна единице1.

Такой подход к делу не только внес полную ясность в формальное строение математической теории вероятностей, но и способствовал вполне конкретному прогрессу как самой теории вероятностей, так и смежных с ней по формальному строению математических теорий. В теории вероятностей с успехом были использованы тонкие методы, разработанные в метрической теории функций действительного переменного. Одновременно вероятностные методы оказались применимыми в вопросах смежных областей математики не «по аналогии», а путем формально строгого их перенесения в новые области. Всюду, где оказываются выполненными аксиомы: теории вероятностей, применимы и следствия из этих аксиом, хотя бы данная область не имела ничего общего с реальной случайностью.

Наличие аксиоматизированной теории вероятностей избавляет нас от соблазна «определять» вероятность способами, претендующими на соединение их непосредственной естественно-научной убедительности с приспособленностью к построению на их основе формально строгой математической теории. Такие определения приблизительно соответствовали бы в геометрии «определению» точки как того, что получится, если бесконечное число раз обрезать со всех сторон физическое тело, уменьшая каждый раз, скажем, вдвое его диаметр.

К такого рода определениям относится определение вероятности как предела частот при неограниченном увеличении числа испытаний. Допущение о вероятностном характере испытаний, т. е. о тенденции частот группироваться вокруг постоянного значения, само по себе бывает верно (как и допущение о «случайности» какого-либо явления) лишь при сохранении некоторых условий, которые не могут сохраняться неограниченно долго и с неограниченной точностью. Поэтому точный переход к пределу

не может иметь реального значения. Формулировка принципа устойчивости частот при обращении к такому предельному переходу требует определения

1 Тем не менее по существу решаемых задач теория вероятностей остается самостоятельной математической дисциплиной; основные для теории вероятностей результаты (подобные изложенным в § 3) кажутся искусственными и ненужными с точки зрения чистой теории меры.

допустимых способов отыскания бесконечных последовательностей испытаний, которое тоже может быть лишь математической фикцией. Все это нагромождение понятий могло бы еще подлежать серьезному рассмотрению, если бы в результате получилось построение теории столь своеобразной, что иными путями до ее строгого обоснования нельзя было бы дойти. Но, как указано выше, обоснование математической теории вероятностей при современном состоянии теории меры производится просто добавлением условия

Р(U) = 1.

Вообще, при реальном анализе понятия вероятности вовсе не обязательно стремиться к его формальному определению. Повидимому, с чисто формальной стороны о вероятности нельзя сказать ничего больше следующего: вероятность Р (A/S) есть число, вокруг которого, при условиях S и при предусмотренных этими условиями способах формирования серий, имеют тенденцию группироваться частоты, причем при возрастании численности этих серий в разумных пределах, не нарушающих однородности условий, эта тенденция проявляется со все большей отчетливостью и точностью, достигая достаточных в данной конкретной обстановке надежности и точности при достижимых численностях серий.

Действительно, важной задачей является не формальное уточнение этого определения, а возможно более широкое выяснение условий, при которых такого типа вероятностная случайность должна проявляться. Надо ясно понимать то, что в действительности гипотеза о вероятностном характере какого-либо явления лишь очень редко обосновывается непосредственной статистической проверкой. Только при первом проникновении вероятностных методов в какую-либо новую область дело часто начиналось с того, что чисто эмпирически отмечалось постоянство частот. В силу сказанного в § 3, для того чтобы статистически обнаружить постоянство частот с точностью до е, необходимо пользоваться сериями примерно по n = 1/ε2 испытаний. Например, для того чтобы установить, что в данном конкретном вопросе имеет смысл считать вероятность определенной с точностью до 0,0001, необходимо произвести ряд серий испытаний примерно по 100 000 000 испытаний в каждой.

Гораздо чаще гипотеза вероятностной случайности вводится на основании соображений симметрии или на основании соображений о практической независимости отдельных, приходящих в соприкосновение рядов явлений и т. д. Затем эта гипотеза проверяется косвенным путем. Например, благодаря тому, что число молекул в конечных объемах газа выражается числами порядка 1020 и более, число √п, соответствующее вероятным выводам кинетической теории газов, бывает очень велико и, действительно, многие из этих выводов оправдываются с большой точностью. Например, давление на противоположные стороны подвешенной в спокойном воздухе пластинки даже микроскопических для нашего глаза размеров оказывается строго одинаковым, хотя уже превышение давления на одну из сторон над давлением на другую в тысячные доли процента при надлежащей постановке опыта могло бы быть замечено.

§ 5. ДЕТЕРМИНИРОВАННЫЕ И СЛУЧАЙНЫЕ ПРОЦЕССЫ

Принцип причинной обусловленности всех явлений находит наиболее простое математическое выражение в методе изучения реальных процессов при помощи дифференциальных уравнений; этод метод продемонстрирован на ряде примеров в § 1 главы V.

Пусть состояние изучаемой системы в момент времени t определяется при помощи n параметров

Скорости изменения этих параметров, как известно, выражаются их производными по времени

Если допустить, что эти скорости являются функциями от значений параметров, то мы получим систему дифференциальных уравнений

Большая часть законов природы, открытых в эпоху зарождения математического естествознания, начиная с галилеевского закона падения тел, выражается именно таким образом. Галилей не мог облечь свое открытие в указанную стандартную форму из-за того, что в его время соответствующие математические понятия еще не были разработаны. Это было сделано Ньютоном.

Обычное в механике и многих других областях физики обращение к дифференциальным уравнениям второго порядка с принципиальной стороны не вносит ничего нового, так как, обозначая скорости хк новыми знаками

мы получаем для вторых производных величин хк выражение

и уравнения второго порядка для n величин x1, x2, ... , xn сводятся к уравнениям первого порядка для 2n величин x1, ... , xn, v1, v2, ..., vn.

В виде примера рассмотрим задачу падения тяжелого тела в земной атмосфере. Предполагая, что в рассмотрение входят лишь небольшие высоты над земной поверхностью, будем считать сопротивление среды зависящим только от скорости, а не от высоты. Состояние изучаемой системы характеризуется двумя параметрами: расстоянием тела от земной поверхности z и его скоростью v. Изменение этих двух величин во времени определяется двумя дифференциальными уравнениями

(31)

где g — ускорение силы тяжести, f(v)— некоторый «закон сопротивления» для рассматриваемого тела.

Если скорости невелики и тело достаточно массивно, например в случае падения камня средних размеров с высоты в несколько метров, то сопротивлением воздуха можно пренебречь, и уравнения (31) превращаются в уравнения

(32)

Если предположить, что в начальный момент времени t0 величины z и v имеют значения z0 и v0, то легко решить уравнения (32) и получить формулу

описывающую весь процесс падения. Например, в предположении t0 = 0, v0 = 0 получаем формулу

открытую Галилеем.

В общем случае интегрирование уравнений (31) несколько сложнее, но принципиальный результат (при весьма общих ограничениях, наложенных на функцию f (v)) остается тем же: по значениям z0 и v0 в начальный момент времени t0 однозначно вычисляются значения z и v для всех дальнейших моментов времени t вплоть до падения тела на поверхность земли. Можно мысленно снять и это последнее ограничение, предполагая, что падение продолжается и при отрицательных значениях z. Для схематизированной таким образом задачи можно установить следующее: если функция f(v) при возрастании v монотонно возрастает и стремится к бесконечности при v→∞, то при неограниченном продолжении падения, т. е. при неограниченном возрастании переменного t, скорость v стремится к постоянному предельному значению с, которое является корнем уравнения

С наглядной стороны этот результат математического анализа поставленной задачи понятен: скорость падения возрастает до тех пор, пока ускорение силы тяжести не уравновесится сопротивлением воздуха. При прыжке с открытым парашютом стационарная скорость v около пяти метров в секунду устанавливается1 довольно скоро. При затяжном прыжке с нераскрытым парашютом сопротивление воздуха меньше, и в соответствии с этим стационарная скорость оказывается

1 Имеется в виду, что с становится практически достаточно близким к с.

больше и устанавливается лишь после того, как парашютист пролетит очень большое расстояние.

При падении легких тел, подобных брошенному в воздух перу или пушинке, начальный период заметным образом ускоренного движения очень мал и иногда совсем незаметен. Стационарная скорость падения устанавливается очень быстро, и с известным приближением можно принять, что все время v — c. В этом случае остается одно дифференциальное уравнение

z = — с,

которое интегрируется очень просто:

z = z0 — c(t — t0).

Так будет падать пушинка в совершенно спокойном воздухе.

В совершенно общем виде подчеркнутая нами выше детерминистическая концепция трактуется в современной теории динамических систем, которой посвящен ряд важных работ советских математиков — Н. Н. Боголюбова, В. В. Степанова и многих других. Эта общая теория охватывает как частные случаи и такие математические схемы реальных явлений, в которых состояние системы определяется уже не конечным числом параметров, а заданием одной или нескольких функций, как это типично, например, для механики непрерывных сред. В таких случаях элементарные закономерности изменения состояния за «бесконечо малый» промежуток времени задаются уже не обыкновенными дифференциальными уравнениями, а уравнениями в частных производных или иными средствами. Но общим во всех детерминированных математических схемах реальных процессов является то, что, во-первых, состояние изучаемой системы считается исчерпывающим образом определенным посредством задания некоторого математического объекта ω (системы n действительных чисел, одной или нескольких функций и т. п.); во-вторых, последующие значения для моментов времени t> t0 однозначно определяются по значению ω0, соответствующему начальному моменту времени t0

ω = F(t0, ω0, t).

Как мы уже видели, в случае процессов, описываемых дифференциальными уравнениями, нахождение функции F требует интегрирования этих дифференциальных уравнений с начальными условиями ω = ω0 при t — t0.

Представители механистического материализма считали, что описанная схема является точным и прямым выражением детерминированности реальных явлений — физического принципа причинности. По идее Лапласа, состояние мира в данный момент времени определяется бесконечным числом параметров, подчиненных бесконечному числу диффе-

ренциальных уравнений. Если бы некий «всеобъемлющий ум» мог записать все эти уравнения и их проинтегрировать, то, по Лапласу, он мог бы с полной точностью предвидеть всю эволюцию мира на протяжении бесконечного времени.

Однако на самом деле количественная математическая бесконечность крайне груба по сравнению с качественной неисчерпаемостью действительного мира. Ни введение бесконечного числа параметров, ни описание состояния непрерывных сред при помощи функций от точки пространства не являются адэкватным отображением бесконечной сложности реальных явлений.

Как подчеркивалось в § 3 главы V, исследование реальных явлений не всегда идет в направлении увеличения числа вводимых в задачу параметров; вообще далеко не всегда целесообразно усложнять ту характеристику ω, которая определяет отдельное «состояние системы» в математической схеме, служащей для расчета данного явления. Искусство исследователя скорее состоит в том, чтобы найти очень простое фазовое пространство Ω (т. е. множество значений ω), или, иначе говоря, множество различных возможных состояний системы)1, которое позволяло бы тем не менее, заменяя реальный процесс процессом детерминированного перемещения точки ω в этом пространстве, ухватить все существенные стороны реального процесса.

Но, выделив из реального процесса его существенные черты, мы получаем некоторый остаток, который приходится считать случайным. Неучтенные случайные факторы всегда оказывают некоторое влияние на течение процесса. Существует очень мало явлений, подвергающихся математическому изучению, для которых при сопоставлении теории с наблюдениями нельзя было бы заметить влияния неучтенных случайных факторов. Таково или почти таково положение с теорией движения планет под действием силы тяготения: расстояния между планетами так велики по сравнению с их размерами, что идеализированное представление их материальными точками действует почти безотказно; пространство, в котором они двигаются, заполнено столь разреженной материей, что ее сопротивление исчезающе мало; массы планет так велики, что световое давление при их движении почти не играет роли. Эти исключительные обстоятельства и приводят к тому, что математическое решение задачи о движении системы из n материальных точек, «состояние» которой описывается 6n параметрами2, а изменение состояния рассчитывается с учетом только силы тяготения, так поразительно хорошо совпадает с наблюдениями над движением планет.

1 В приведенном выше примере с падением тел фазовое пространство Ω есть система пар чисел (z, v), т. е. плоскость. Вообще о фазовом пространстве см. главу XVII и главу XVIII (том 3), § 3.

2 Тремя координатами и тремя составляющими скорости каждой точки.

Несколько приближается к случаю движения планет случай полета артиллерийского снаряда в предположении, что сопротивление воздуха введено в уравнения движения. Это тоже одна из классических областей, в которых математический метод исследования сравнительно легко и быстро одержал большие победы. Но здесь роль возмущающих случайных факторов уже значительно больше и рассеивание снарядов, т. е. их отклонения от теоретической траектории, соответствующей нормальным, назначенным для данного выстрела начальным условиям и среднему состоянию атмосферы во время стрельбы, достигают десятков, а на больших дистанциях и сотен метров. Отклонения эти частично вызываются случайными отклонениями начального направления и начальной скорости от нормы, частично случайными отклонениями от нормы массы и коэффициента сопротивления снаряда, частично же неравномерностью и порывами ветра и прочими случайными обстоятельствами, связанными с чрезвычайно сложным и подвижным режимом, господствующим в реальной земной атмосфере.

Рассеивание снарядов подробно изучается методами теории вероятностей, и результаты этого исследования весьма существенны для практики стрельбы.

Но что означает, собственно говоря, исследование случайных явлений? Казалось бы, когда случайный «остаток» при данной схематизации явления оказался настолько велик, что им нельзя пренебречь, то единственная возможность состоит в том, чтобы осложнить описание явления введением новых параметров и в усложненной схеме исследовать явление более подробно по той же математической схеме детерминированных явлений.

Такой путь во многих случаях практически неосуществим. Например, при исследовании падения материального тела в атмосфере с учетом неравномерной, порывистой (или, как обычно говорят, турбулентной) структуры ветрового потока вместо двух параметров z и v пришлось бы ввести совершенно необозримый математический аппарат полного описания этой структуры.

Но этот сложный путь на самом деле необходим только в тех случаях, когда нам во что бы то ни стало нужно проследить влияние остаточных «случайных» факторов на течение нашего процесса во всех деталях и отдельно для каждого индивидуального случая. К счастью, в действительности очень часто наши реальные потребности заключаются совсем в другом: требуется лишь оценить суммарный эффект действия случайных факторов за большой промежуток времени или в большом числе повторений изучаемого процесса.

В качестве примера рассмотрим перенос песка водным потоком в реке или в том или ином искусственном гидротехническом сооружении. Обычно этот перенос происходит таким образом, что большинство песчинок спокойно лежит на дне и лишь изредка особенно сильные

завихрения вблизи дна выхватывают отдельные песчинки и переносят их сразу на довольно значительные расстояния вплоть до внезапной остановки в каком-либо новом месте. Чисто теоретически движение каждой такой песчинки могло бы быть рассчитано индивидуально по законам гидромеханики. Но для этого нам было бы необходимо знать начальное состояние дна и потока во всех деталях и рассчитывать его шаг за шагом, отмечая те моменты времени, когда давление на какую-либо покоящуюся песчинку окажется достаточным, чтобы привести ее в движение, и прослеживая перемещение сдвинутых с места песчинок вплоть до их остановки. Абсурдность постановки такой задачи для реального научного исследования очевидна. И несмотря на это, средние или, как принято говорить, статистические закономерности передвижения донных наносов водными потоками вполне поддаются изучению.

Примеры, в которых действие большого числа случайных факторов приводит к вполне отчетливым статистическим закономерностям, было бы легко умножить. Один из самых увлекательных по широте перспектив и в то же время самых известных такого рода примеров доставляет кинетическая теория газов, которая показывает, как из совместного действия множества случайных столкновений молекул возникают точные закономерности, которым подчинены давление газа, как целого, на стенки, диффузное распространение одного газа в другом и т. д.

§ 6. СЛУЧАЙНЫЕ ПРОЦЕССЫ МАРКОВСКОГО ТИПА

А. А. Маркову принадлежит заслуга построения вероятностной схемы, непосредственно обобщающей детерминистическую схему, записанную в § 5 при помощи уравнения

ω = F(t0, ω0, t).

Правда, Марков рассмотрел только случай, когда фазовое пространство изучаемой системы состоит лишь из конечного числа состояний Ω = {ω1, ω2, . . ., ωn}, и изучал изменение состояния системы лишь при разделении времени t на дискретные шаги. Но в этой крайне схематизированной модели он сумел уловить ряд фундаментальных закономерностей.

Вместо функции F, однозначно определяющей состояние со в момент времени t > t0 по состоянию ω0 в момент времени t0, Марков вводит вероятности

(t0, ωi, t, ωj)

получения состояния ωj в момент времени t при условии, что в момент времени t0 имело место состояние ωi. Эти вероятности Марков связывает для любых трех моментов времени

t0<t1<t2

соотношением, которое можно назвать основным уравнением марковских процессов

(33)

Когда фазовое пространство является непрерывным многообразием, наиболее типичен случай существования плотностей вероятности p(t0, ω0; t, ω) перехода из состояния ω0 в состояние ω за промежуток времени (t0, t). В этом случае вероятность перехода за промежуток времени между моментами t0 и t из состояния ω0 в какое-либо из состояний ω, принадлежащих области G фазового пространства Ω, записывается в виде

(34)

где dω — элемент объема в фазовом пространстве1. Для плотностей вероятности p(t0, ω0; t, ω) основное уравнение (33) приобретает вид

(35)

Уравнение (35) решить довольно трудно, но при известных ограничениях из него можно вывести дифференциальные уравнения в частных производных, которые легче поддаются изучению. Некоторые из этих уравнений были получены из нестрогих физических соображений физиками Фоккером и Планком. В полном виде теория так называемых стохастических дифференциальных уравнений была построена советскими авторами (С. Н. Бернштейн, А. Н. Колмогоров, И. Г. Петровский, А. Я. Хинчин и др.).

Выписывать здесь эти уравнения мы не будем.

Метод стохастических дифференциальных уравнений позволяет, например, легко решить задачу о движении в спокойной атмосфере очень малого тела, для которого средняя скорость его падения с значительно меньше скорости его «броуновского движения», вызываемого тем, что из-за малости его размеров толчки молекул воздуха на противоположные его стороны не вполне уравновешиваются.

Пусть с — средняя скорость падения, D — так называемый коэффициент диффузии. Если предположить, что на земной поверхности (z = 0) частица не задерживается, а «отражается», т. е. под действием броуновских сил вновь отправляется в путешествие по атмосфере, и допустить, что в момент времени t0 частица находится на высоте z0,

1 Собственно говоря, равенство (34) служит определением плотности вероятности. Величина р dω равна (с точностью до бесконечно малых высшего порядка) вероятности перейти за время от t0 до t из состояния ω0 в элемент объема dω.

то плотность вероятности p(t0, z0; t, z) ее нахождения в момент времени t на высоте z выразится формулой

На рис. 4 изображено, как могут меняться кривые p(t0, z0; t, z) в последовательные моменты времени t.

Мы видим, что в среднем высота частицы убывает, а положение ее становится все более неопределенным (все более «случайным»). Самое интересное заключается в том, что при любых t0 и z0 и при t→∞

(36)

т. е. существует предельное распределение для высот частицы, и математическое ожидание высоты расположения частицы с возрастанием t стремится к положительному пределу

(37)

Таким образом, несмотря на то, что наша частица, находясь над поверхностью земли, все время имеет тенденцию падать под действием силы тяжести, она при неограниченном продолжении этого процесса

Рис. 4. Рис. 5.

(блуждания в атмосфере) будет в среднем находиться на определенной положительной высоте. Если бы мы взяли начальное z0 меньшим, чем z*, то оказалось бы, что по истечении достаточно большого промежутка времени среднее положение частицы будет выше начального, как это изображено на рис. 5, где z0 = 0.

Для отдельной частицы средние значения z*, о которых идет речь, являются лишь математическими ожиданиями, но в силу закона больших чисел для большого числа частиц они будут осуществляться реально: плотность расположения такого рода частиц по высоте будет следовать указанным закономерностям и, в частности, по истечении достаточно большого промежутка времени стабилизируется в соответствии с формулой (36).

Все сказанное непосредственно применимо лишь к примешанным к воздуху в малой концентрации газам, дымам и т. п., так как величины с и D предполагались определенными заранее заданным состоянием атмосферы. Однако с некоторыми усложнениями теория применима к взаимной диффузии газов, составляющих атмосферу, и к возникающим на основе этой диффузии распределениям их плотностей по высоте.

С увеличением размеров частиц отношение возрастает, и благодаря этому процесс их перемещения вместо диффузионного характера приобретает характер закономерного падения по законам, рассмотренным в § 5. Теория позволяет проследить все переходы между чисто диффузным движением и таким закономерным падением.

Задача движения взвешенных в атмосфере частиц под действием турбулентного перемешивания более сложна, но в принципе тоже может быть подчинена аналогичным вероятностным методам.

ЛИТЕРАТУРА

Популярная литература

Гнеденко Б. В. и Хинчин А. Я. Элементарное введение в теорию вероятностей. Изд. 3-е, Гостехиздат, 1952.

Современные университетские курсы

Бернштейн С. Н. Теория вероятностей. Изд. 4-е, Гостехиздат, 1946.

Гнеденко Б. В. Курс теории вероятностей. Изд. 2-е, Гостехиздат, 1954.

Специальные монографии

Чандрасекар С. Перенос лучистой энергии. М., 1953.

Эйнштейн А. и Смолуховский М. Броуновское движение. Сборник статей, 1936.

Глава XII

ПРИБЛИЖЕНИЕ ФУНКЦИЙ

§ 1. ВВЕДЕНИЕ

В практической жизни нам постоянно приходится приближать одни числа другими. Достаточно сказать, что измерения тех или иных конкретных величин — длин, площадей, температуры и т. д. — приводят нас к числам, только приближенно выражающим эти величины. На практике мы пользуемся только рациональными числами, т. е. числами вида p/q, где р и q (q≠0) — целые числа. Но, кроме рациональных чисел, имеются еще иррациональные, и если мы не получаем их при измерениях, то наши теоретические рассуждения сплошь и рядом приводят к ним. Мы знаем, например, что длина окружности радиуса r = 1/2 равна иррациональному числу π, а длина гипотенузы прямоугольного треугольника с единичными катетами равна √2. В вычислениях при действиях с иррациональными числами прежде всего приближают их с нужной точностью соответствующими рациональными числами, обыкновенно конечными десятичными дробями.

То же обстоятельство имеет место и в случае функций. Количественные закономерности природы отражаются в математике при помощи функций не точно, а приближенно, с той или иной степенью точности. Более того, в громадном числе случаев появляется необходимость имеющиеся уже в нашем распоряжении функции, заданные по всем математическим правилам, приближать другими функциями с определенной точностью в целях их фактического вычисления.

Однако дело не только в вычислениях. Задача о приближенном представлении функции при помощи других функций имеет большое теоретическое значение. В нескольких словах это можно объяснить так. В процессе развития математического анализа удалось обнаружить и изучить весьма важные классы приближающих функций, т. е. функций, являющихся в известных условиях естественным средством приближения других более или менее произвольных функций. Этими классами оказались прежде всего алгебраические и тригонометрические полиномы, а также их различные обобщения. Оказывается, что

по свойствам заданной функции, которую мы приближаем, при определенных условиях можно судить о характере уклонения от нее приближающих ее функций. Наоборот, зная характер уклонения, например, зная величины уклонений заданной функции от определенного ряда приближающих ее функций, можно узнать свойства этой функции. На этом пути была построена теория функций, базирующаяся на приближенном их представлении при помощи тех или иных классов приближающих функций. Подобная теория имеется и в теории чисел. В ней свойства иррациональных чисел изучаются на основе приближения их с помощью рациональных.

В главе II (том 1) читатель уже познакомился с одним весьма важным методом приближения — формулой Тейлора. При ее помощи функция, если она удовлетворяет определенным условиям, приближается другой функцией вида Р (х) = a0+ a1х +...+ anxn, называемой алгебраическим многочленом. Здесь ak—постоянные числа, не зависящие от x.

Алгебраический многочлен есть весьма просто устроенная функция; для ее вычисления по данным коэффициентам ак и данному значению х требуется применение только трех арифметических действий (сложения, вычитания и умножения). Простота вычисления на практике чрезвычайно важна. Это обстоятельство послужило одной из причин того, что алгебраические многочлены служат наиболее распространенным средством приближения функций (о другой важной причине мы скажем позднее). Достаточно сказать, что нам, в особенности в последнее время, приходится в массовых масштабах делать технические вычисления на счетных машинах. Современные совершенные счетные машины работают весьма быстро и неутомимо. Однако машина в состоянии делать лишь сравнительно простые операции. Ее можно заставить производить арифметические действия с весьма большими числами, но нельзя, например, заставить осуществить до конца бесконечный процесс перехода переменной величины к пределу. Машина, например, не может вычислить точно lgx. Но у нас есть возможность приблизить lgх многочленом Р (х) с необходимой степенью точности, а затем при помощи машины вычислить многочлен.

Кроме формулы Тейлора, существуют и другие, имеющие очень большое значение в практике методы приближения функций алгебраическими многочленами. К ним относятся прежде всего различные интерполяционные методы, широко употребляющиеся, в частности, при приближенных вычислениях интегралов, а также в вопросах приближенного интегрирования дифференциальных уравнений. Большое распространение получил метод приближения в смысле среднего квадратического, широко применяемый не только к алгебраическим многочленам. Важное значение в определенных областях практики имеет метод наилучшего равномерного или чебышевского приближения, пред-

ложенный великим русским математиком П. Л. Чебышевым, да этот метод и возник, как мы увидим дальше, из решения задач, связанных с конструированием механизмов.

В нашу задачу входит дать представление об этих методах и по возможности указать те условия, при которых один из этих методов следует предпочесть другому. Ни один из них не является абсолютно лучшим. Каждый метод может оказаться лучше других при определенных условиях. Если, например, речь идет о решении физической задачи, то тот или иной метод приближения входящих в нее функций часто диктуется самим существом задачи или, как говорят, физическими соображениями.

Мы увидим также, что при известных обстоятельствах один метод приближения может оказаться применимым, а другой неприменимым.

Каждый из перечисленных методов возник в свое время, имеет свою собственную теорию и историю. Еще Ньютон знал формулу интерполирования и дал весьма удобное для практических вычислений ее выражение через так называемые разностные отношения. Метод приближения в смысле среднего квадратического имеет по крайней мере 150-летнюю давность. Однако долгое время эти методы не составляли сколько-нибудь связной теории. Они представляли собой лишь отдельные практические приемы приближения функций, причем, границы применимости этих методов были неясны.

Настоящая теория приближения функций возникла после работ П. Л. Чебышева, который ввел в науку важное понятие наилучшего приближения, в частности равномерного наилучшего приближения, систематически применял его в приложениях и разработал его теоретические основы. Наилучшее приближение есть основное понятие, с которым оперирует современная теория приближений. После П. Л. Чебышева его идеи получили дальнейшее развитие в трудах его учеников Е. И. Золотарева, А. Н. Коркина и братьев А. А. и В. А. Марковых.

В чебышевский период развития теории приближения функций, помимо введения фундаментальных понятий, были даны основные методы получения наилучших приближений произвольных индивидуальных функций, — методы, которыми мы широко пользуемся в настоящее время; кроме того, были заложены основы изучения свойств приближающих классов, прежде всего алгебраических и тригонометрических полиномов, с точки зрения тех нужд, которые возникают в связи с необходимостью приближения функций.

На дальнейшее развитие теории приближения функций оказало влияние важное в математике открытие, сделанное в конце прошлого столетия немецким математиком Вейерштрассом. Им со всей строгостью была показана принципиальная возможность приближения произвольной непрерывной функции с любой заданной степенью точности

алгебраическим многочленом. Это обстоятельство и есть вторая причина того, что алгебраические многочлены являются универсальным средством приближения функций. Одной простоты устройства алгебраических многочленов еще недостаточно для того, чтобы именно их употреблять в качестве такого средства; нужна еще принципиальная возможность приблизить непрерывную функцию многочленом с как угодно малой наперед заданной ошибкой. Эта возможность и была доказана Вейерштрассом.

Глубокие идеи наилучшего приближения Чебышева и теорема Вейерштрасса послужили базой для развития (с начала нашего столетия) нового современного направления теории приближения функций. Отметим в связи с этим имена С. Н. Бернштейна, Бореля, Джексона, Лебега и Валле Пуссена. Коротко это направление можно охарактеризовать следующими словами. В то время как в чебышевский период (до начала нашего столетия), как правило, ставились задачи о приближении индивидуальных функций, для современного периода характерна задача о приближении многочленами или другими приближающими функциями, где в качестве приближаемой функции фигурирует не отдельная заданная функция, а произвольная функция, принадлежащая к более или менее обширному классу функций (аналитических, дифференцируемых и т. д.).

Русская математическая школа, а теперь советская математическая школа теории приближений играет в этой теории ведущую роль. Большой вклад в эту теорию внесли наши соотечественники С. Н. Бернштейн, А. Н. Колмогоров, М. А. Лаврентьев и их ученики. По существу эта теория в наше время развилась в самостоятельную ветвь теории функций.

Кроме алгебраических многочленов, другим весьма важным средством приближения являются тригонометрические полиномы. Тригонометрическим полиномом порядка n называется функция вида

или короче

где αk, βk — некоторые постоянные.

Существуют различные частные методы приближения тригонометрическими полиномами; эти методы довольно простым образом связаны с соответствующими методами приближения при помощи алгебраических многочленов. Среди этих методов особо важное место занимает разложение функций в тригонометрический ряд Фурье (рядам Фурье посвящен § 7). Этот ряд назван по имени французского математика Фурье,

который в начале прошлого столетия получил относящиеся к этим рядам теоретические результаты, связанные с его работами по теории распространения тепла. Однако надо отметить, что тригонометрические ряды рассматривались еще в середине XVIII века великими математиками Леонардом Эйлером и Даниилом Бернулли. У Эйлера они появлялись в связи с его работами в области астрономии, а у Д. Бернулли — в связи с исследованиями колеблющейся струны. Кстати сказать, Эйлеру и Д. Бернулли принадлежит постановка вопроса принципиального значения о возможности изображения при помощи тригонометрического ряда более или менее произвольной функции, — вопроса, который был окончательно разрешен только в середине прошлого столетия. Положительное его разрешение, о котором мы еще будем говорить ниже, было предвосхищено Д. Бернулли.

Ряды Фурье имеют большое значение в физике, но этой стороне мы уделим мало внимания, так как этот вопрос уже рассматривался в главе VI. Там же читатель может познакомиться с физическими задачами, естественным образом приводящими к необходимости разложения данной функции в ряды, отличные от тригонометрических, но имеющие с ними большое сходство. Мы имеем в виду так называемые ряды по ортогональным функциям.

Ряды Фурье имеют большую историю, длящуюся два столетия. Неудивительно поэтому, что к нашему времени создалась весьма обширная, чрезвычайно тонкая и глубокая теория рядов Фурье, представляющая собой самостоятельную дисциплину в математике. В этой теории наша советская математика имеет ведущие, а в ряде принципиальных вопросов — непревзойденные достижения. Особенно значительную роль в этой теории сыграла московская школа теории функций действительного переменного (Н. Н. Лузин, А. Н. Колмогоров, Д. Е. Меньшов и др.).

Отметим еще, что значение тригонометрических полиномов в современной математике далеко не исчерпывается той ролью, которую они играют как средство приближения. Например, в главе X читатель имеет возможность познакомиться с фундаментальными результатами И. М. Виноградова в области теории чисел, полученными им на основе соответствующим образом разработанного аппарата тригонометрических сумм (полиномов).

§ 2. ИНТЕРПОЛЯЦИОННЫЕ МНОГОЧЛЕНЫ

Частный случай построения интерполяционного многочлена. В практических вычислениях большое распространение получили интерполяционные методы приближения функций. Чтобы ввести читателя в курс вопросов этого рода, рассмотрим следующую элементарную задачу.

Пусть задана на отрезке [х0, x2] функция у = f(х), график которой изображен на рис. 1. Вид этого графика напоминает кусок некоторой параболы. Поэтому если мы желаем приблизить нашу функцию при помощи простой функции, то в качестве такой простой приближающей функции естественно выбрать некоторый многочлен 2-й степени

Р (х) = a0 + а1х + a2х2 (1)

график которой представляет параболу.

Метод интерполирования заключается в следующем. Зададим внутри отрезка [х0, x2] еще одну внутреннюю точку x1. Точкам x0, x1, x2 соответствуют значения нашей функции

Построим такой многочлен (1), чтобы он в точках x0, x1, x2 совпал с рассматриваемой функцией (его график намечен на рис. 1 пунктиром). Другими словами, требуется подобрать коэффициенты a0, a1, a2 в многочлене (1), чтобы выполнялись равенства

(2)

Заметим, что наша функция f(x) могла с самого начала и не выражаться формулой, например могла представлять некоторую эмпирическую зависимость, описываемую графиком, изображенным на рис. 1. Решив задачу о ее интерполировании, мы получим приближающую функцию в виде аналитического выражения — многочлена Р(х). Если точность приближения нас удовлетворяет, то полученный многочлен будет иметь перед приближаемой функцией то преимущество, что его можно вычислять для промежуточных значений х.

Поставленную задачу можно решить так: составить три уравнения

найти из них a0, a1, а2 и подставить величины этих коэффициентов в равенство (1). Но мы решим ее несколько иначе. Построим сначала многочлен Q0(x) 2-й степени такой, чтобы он удовлетворял трем условиям: Q0(x0) = 1, Q0(x1) = 0, Q0(x2) = 0. Из последних двух условий следует, что этот многочлен должен иметь вид А (х — x1)(х — x2), а из

Рис. 1.

первого условия следует

Таким образом, искомый многочлен имеет вид

Аналогично многочлены

удовлетворяют условиям

Далее, очевидно, многочлен y0Q0(x) обращается в y0 при х = x0 и в нуль при х = x1 и х = x2, и соответствующими свойствами обладают многочлены y1Q1(x) и y2Q2(х).

Отсюда легко следует, что искомый интерполяционный многочлен 2-й степени, удовлетворяющий требованиям (2), выражается формулой

Заметим, что полученный многочлен является единственным многочленом 2-й степени, решающим поставленную интерполяционную задачу. Действительно, если допустить, что некоторый другой многочлен Р1 (х) 2-й степени тоже решает нашу задачу, то разность Р1 (х) — Р (х), представляющая собой тоже некоторый многочлен 2-й степени, обращалась бы в нуль в трех точках: х = x0, x1, x2. Но мы знаем из алгебры, что если многочлен 2-й степени обращается в нуль для трех значений X, то он тождественно равен нулю. Таким образом, многочлены Р (х) и Р1 (х) тождественно совпадают.

Ясно, что полученный многочлен, вообще говоря, совпадает с данной функцией только в точках x0, x1, x2, а для других значений х отличается от нее.

Если точку x1 взять посредине отрезка [х0, x2], полагая x2 — x1 = x1 — x0 = h, то формула (3) несколько упростится

В качестве примера проинтерполируем синусоиду y = sinx (рис. 2) при помощи многочлена 2-й степени, совпадающего с ней в точках x = 0, π/2, π. Очевидно, искомый многочлен имеет вид

Сравним sinx и Р (х) в двух промежуточных точках:

Таким образом, мы приблизили sin х на отрезке [0, π] примерно с точностью1 до 0,05. С другой стороны, разложение sinx в окрестности точки π/2 в ряд Тейлора дает

Если остановиться на втором члене разложения, то в точке x = 0 получим приближение sin 0 ≈ 1—π2/8 ≈ 0,234, т. е. с ошибкой более чем 0,2.

Мы видим, что методом интерполирования нам удалось приблизить sinx на всем отрезке [0, π] при помощи многочлена 2-й степени более удовлетворительно, чем это удается сделать при помощи многочлена той же степени, разлагая функцию sin х в окрестности точки х = π/2 по формуле Тейлора. Впрочем, не надо забывать, что формула Тейлора зато дает очень точное приближение в малой окрестности х = π/2, гораздо более точное, чем то, которое для такой окрестности имеет место при приближении по методу интерполяции.

Общее решение задачи. Ясно, что более сложную функцию y = f(x), изображенную на рис. 3, едва ли кто-нибудь решился бы интерполировать при помощи многочлена 2-й степени. Во всяком случае тот, кто на это все-таки решился бы, получил бы заведомо очень плохое

Рис. 2. Рис. 3.

1 Впрочем, для полного обоснования этого утверждения следует показать, что разность — не только для х = π/4 и х = π/6, но и для всех х из отрезка [0, π] не превышает величины порядка 0,05; мы этого делать не будем.

приближение, так как никакая парабола 2-й степени не может следовать всем изгибам кривой y = f(x). В этом случае естественно попытаться проинтерполировать эту функцию при помощи многочлена более высокой степени (не ниже 4-й).

Общая задача интерполирования заключается в том, что требуется построить многочлен Р (х) = a0 + a1х + a2х2 + ... + anxn степени n, который совпадал бы с заданной функцией в n +1 точках x0, x1, x2, . . ., xn, т. е. для которого выполнялось бы n +1 равенств: Р (x0) = f(x0), Р (x1) =f(x1), . . ., Р (xn)=f(xn). Точки, в которых требуется совпадение функции с приближающим ее многочленом, называются узлами интерполяции.

Рассуждая аналогично тому, как это мы делали в отношении многочлена 2-й степени, нетрудно показать, что искомый многочлен можно записать в виде

(4)

причем этот многочлен (степени n) единственный. Написанная формула носит название формулы Лагранжа. Эту формулу можно записать в различных других формах; например, в практике большое распространение получила формула разностных отношений Ньютона.

Отклонение интерполяционного многочлена от порождающей функции. Метод интерполирования является весьма универсальным средством приближения функций. Принципиально функция не обязана обладать особыми свойствами для возможности ее интерполирования, например не обязана иметь производные на всем протяжении отрезка приближения. В этом смысле метод интерполирования имеет преимущество перед формулой Тейлора. Интересно, что бывают случаи, когда функция будет даже аналитической на отрезке, а к ней формула Тейлора как средство приближения все же не применима. Представим себе, например, что потребовалось достаточно хорошо приблизить на отрезке [—2, 2] функцию 1/1 + х2 алгебраическим многочленом. На первый взгляд естественно попытаться для этой цели разложить ее в ряд Тейлора в окрестности точки х = 0

Однако нетрудно видеть, что получающийся ряд сходится лишь на интервале — 1<x<4. Вне отрезка [—1, 1] он расходится и приближать 1/1 + x2 на всем отрезке [—2, 2] не может. В то же время интерполяционный метод здесь вполне применим.

Конечно, всякий раз возникает задача об удачном выборе числа и расположения узлов так, чтобы ошибка приближения удовлетворяла желаемым требованиям. На вопрос о возможной ошибке приближения в случае, если функция имеет производную достаточно высокого порядка, отвечает следующий классический результат, который мы приведем без доказательства.

Если функция f(x) имеет на отрезке [х0, xn] непрерывную производную порядка n + 1, то для любого промежуточного значения х из этого отрезка отклонение ее от интерполяционного многочлена Лагранжа Р (х) с узлами интерполяции x0 < x1 < ... < xn выражается формулой

где с — некоторая промежуточная точка, находящаяся между x0 и xn. Эта формула напоминает соответствующую формулу остаточного члена тейлоровского разложения и в сущности представляет ее обобщение. Таким образом, если известно, что производная f(n+1)(x) порядка n + 1 на отрезке [х0, xn] всюду не превышает по абсолютной величине число М, то ошибка приближения для какого-либо значения х из этого отрезка определяется следующей оценкой

Современная теория приближений владеет многими другими способами нахождения оценок при интерполировании. Этот вопрос сейчас достаточно хорошо изучен. При этом обнаружены интересные, совершенно неожиданные факты.

Рассмотрим, например, гладкую функцию y = f(x), заданную на отрезке [—1, 1], т. е. такую, что ее график представляет собой непрерывную кривую с непрерывно изменяющейся касательной. То обстоятельство, что мы взяли отрезок с определенными концами —1 и 1, не играет особенной роли; факты, о которых мы будем говорить, имеют место и на произвольном отрезке [а, b] с несущественными изменениями.

Предположим теперь, что на отрезке [—1, 1] мы задали систему x + 1 точек

(5)

и затем построили многочлен Р (х) = a0 + a1х + ...+ anxn степени n, который совпадает с f(x) в этих точках. Будем пока предполагать, что соседние точки системы (5) находятся на равном расстоянии друг от друга. Если n неограниченно увеличивать, то соответствующий интерполирующий нашу функцию многочлен Pn(х) будет во все большем и большем числе точек совпадать с f(x), и можно было бы думать, что

в промежуточных точках х, не принадлежащих системе (5), разность f(x)—Рn(х) будет стремиться к нулю при n→ ∞. Такое мнение существовало еще в конце прошлого столетия, однако впоследствии обнаружилось, что это далеко не так. Оказывается, что для многих гладких (даже аналитических) функций f(x) в случае равноотстоящих узлов хк интерполяционные многочлены Pn(х) совсем не стремятся к f(x), когда псо. График интерполяционного полинома хотя и совпадает в заданных узлах с f(x), но ценой того, что он сильно отклоняется от графика f(x) при больших n для промежуточных между узлами значений х и притом тем более отклоняется, чем больше n. Как показали дальнейшие исследования, подобных явлений можно избежать по крайней мере для гладких функций, если узлы интерполяции расположить на отрезке так, что в середине его они будут распределены более редко, а ближе к концам—более густо. Именно, оказывается, что в известном смысле наилучшим распределением узлов интерполяции является такое распределение, когда узлы хк совпадают с нулями1 многочлена Чебышева cos [(n + 1) arccos х], которые определяются формулами

Соответствующий этим узлам интерполяционный многочлен, носящий имя Чебышева, обладает тем свойством, что он равномерно при неограниченном возрастании n сходится к порождающей его гладкой функции, т. е. функции, которая не только сама непрерывна, но, кроме того, имеет непрерывную первую производную. График такой функции есть непрерывная кривая с непрерывно изменяющейся касательной. На рис. 4 дано распределение нулей многочлена Чебышева в случае n =5.

Что касается произвольных негладких непрерывных функций, то тут дело обстоит хуже; оказывается, вообще не существует такой последовательности узлов интерполяции, чтобы соответствующий ей интерполяционный процесс сходился для любой непрерывной функции (теорема Фабера). Иначе говоря, каким бы способом мы ни делили отрезок [—1, 1] на части, получая при этом неограниченно увеличи-

Рис. 4.

1 Нулем функции f (х) называется всякое значение xk, для которого f(xk) = 0. Подробнее о многочленах Чебышева см. в § 5.

вающееся число узлов, всегда найдется такая непрерывная на отрезке функция f(x), что многочлены, последовательно интерполирующие ее в этих узлах, не будут к ней сходиться. Еще для математиков середины прошлого столетия этот факт, если бы он был тогда известен, мог звучать парадоксально. Конечно, тут дело заключается в том, что среди непрерывных негладких функций имеются чрезвычайно «плохие» функции, например не имеющие производной во всех точках отрезка, где они заданы. Вот среди этих функций и можно обнаружить такие, для которых заданный интерполяционный процесс расходится. Для них все же можно предложить эффективные способы приближения их многочленами, представляющие собой некоторые видоизменения изложенных выше интерполяционных процессов, но на этом мы останавливаться не будем.

В заключение заметим, что можно интерполировать функции не обязательно алгебраическими многочленами. Существуют, например, хорошо разработанные как с практической, так и с теоретической стороны методы интерполирования тригонометрическими полиномами.

§ 3. ПРИБЛИЖЕНИЕ ОПРЕДЕЛЕННЫХ ИНТЕГРАЛОВ

Интерполирование функций получило широкое применение в вопросах, связанных с приближенным вычислением интегралов. Для примера выведем одну формулу приближенного выражения определенного интеграла — формулу Симпсона, которая получила особенно большое распространение в прикладном анализе.

Пусть требуется вычислить приближенно определенный интеграл на отрезке [а, b] от функции f(х), изображенной графически на рис. 5. Величина его точно равна площади криволинейной трапеции аАВb. Пусть С есть точка нашего графика с абсциссой с = а+b/2. Проведем через точки А, В и С параболу 2-й степени. Как мы знаем из предыдущего параграфа, эта парабола есть график многочлена 2-й степени, определяемого равенством

где

Рис. 5.

Употребляя терминологию, которой мы пользовались в предыдущем параграфе, можно сказать, что многочлен 2-й степени Р (х) интерполирует f(x) в точках, имеющих абсциссы а, с, 6. Если график функции f(x) на отрезке [а, b] изменяется плавно и сам отрезок невелик, то многочлен Р (х) всюду будет мало отличаться от f (х); это в свою очередь приведет к тому, что мало будут отличаться и их интегралы, взятые на [а, b]. На этом основании мы можем считать эти интегралы приближенно равными

или, как говорят, второй интеграл считать приближением первого. Простые вычисления, которые предоставляем проделать читателю, показывают, что

Отсюда

Итак, наш определенный интеграл можно вычислить по следующей приближенной формуле:

Это и есть формула Симпсона.

Вычислим для примера по этой формуле интеграл от sinx на отрезке [0, n]. Тогда

и, следовательно,

С другой стороны, этот же интеграл мы можем найти точно

Ошибка не превышает 0,1.

Если интервал [0, π] разбить на две равные части и к каждой из них отдельно применить нашу формулу, то получится

Таким образом,

ошибка уже теперь гораздо меньше, примерно 0,002.

На практике, чтобы приближенно вычислить определенный интеграл от функции f(x) на отрезке [а, b], этот отрезок делят на четное число n частей точками а = x0 < x1 < ... < xn = b и последовательно применяют формулу Симпсона сначала к отрезку [х0, x2], затем к отрезку [х2, x4] и т. д. В результате получим следующую общую формулу Симпсона:

(6)

Приведем классическую оценку для нее. Если функция f (х) на отрезке [а, b] имеет четвертую производную, удовлетворяющую неравенству |fIV(x)|⩽M, то имеет место следующая оценка:

(7)

Здесь через L(f) мы обозначили правую часть формулы (6). В этом случае ошибка будет иметь порядок n-4.1

Мы могли бы разделить отрезок [а, b] на n равных частей и считать за приближение интеграла сумму площадей, заштрихованных на рис. 6 прямоугольников. Тогда мы получили бы приближенную формулу прямоугольников2

(8)

1 Если некоторая величина ая, зависящая от n = 1, 2, удовлетворяет неравенству |αk | < C/nk, где С — постоянная, не зависящая от n, то говорят, что она имеет порядок n-k.

2 В этом случае x0, x1, ..., xn-1 — середины равных частей интервала [а, b], а не точки деления, как в формулах (6) и (9).

Можно показать, что порядок ошибки при этом будет n-2, если только функция имеет ограниченную на отрезке [а, b] вторую производную. Можно также за приближение взять сумму площадей заштрихованных па рис. 7 трапеций, и получить формулу трапеций

с порядком ошибки n-2, если функция имеет ограниченную вторую производную.

Обычно говорят, что формула Симпсона точнее формул трапеций и прямоугольников. Эти слова требуют разъяснения, иначе они неверны. Если мы знаем только, что функция имеет первую производную, то гарантированный порядок приближения интеграла по трем формулам одинаково равен n-1; в этом случае формула Симпсона существенных преимуществ перед формулами прямоугольников и трапеций не имеет. Для функций, имеющих вторую производную, можно уже гарантировать приближение по формулам трапеций и Симпсона порядка n-2. Если же функция имеет третью и четвертую производную, то порядок ошибки продолжает быть равным n-2 для формул прямоугольников и трапеций, а для формулы Симпсона он соответственно равен n-3 и n-4. По степень n-4 для формулы Симпсона в свою очередь оказывается

Рис. 6.

Рис. 7.

пределом, именно: для функций, имеющих более высокую производную, чем четвертая, порядок продолжает оставаться равным n-4. Так что, если нам задана функция, имеющая производную 5-го порядка, и мы хотим использовать это обстоятельство, чтобы получить приближение порядка n-5, потребуется новый, отличный от формулы Симпсона метод приближения определенного интеграла. Чтобы понять, как он должен быть устроен, отметим следующее.

Формулы трапеций и прямоугольников, как легко проверить, точны для многочленов 1-й степени; это значит, что подстановка в (9) функции А+Вх, где А и В — постоянные, приводит к точному равенству. В этом же смысле формула Симпсона оказывается точной для многочленов 3-й степени А + Вх + Сх2 + Dx3. Дело именно в этих свойствах. Представим себе, что мы отрезок [а, b] разделим на n равных частей и к каждой части применим один и тот же приближенный метод интегрирования, точный для многочленов А + Вх + ... +Fxm-1 степени m— 1. Тогда ошибка приближения для всякой функции, имеющей m-ю ограниченную производную, будет иметь порядок n-m, и если эта функция не есть многочлен степени m — 1, то этот порядок не может быть повышен даже для функций, имеющих производные более высокого порядка.

Мы привели соображение, подчеркивающее важность задачи нахождения возможно простых приближенных методов интегрирования, точных для многочленов данной степени. Этому вопросу, которому в настоящее время посвящена большая литература, уделяли внимание математики с давних времен. Мы здесь остановимся только на нескольких классических результатах.

Зададим функцию р(х). Спрашивается, как надо расположить на отрезке [—1, 1] узлы x1, ..., xm и выбрать число К, чтобы выполнялось равенство

каков бы ни был произвольный многочлен f(x) степени m.

Оказывается, что при р(х) = (1—х2) 2 задача имеет положительное решение, если K = π/m, а x4— нули многочлена cos m arccos x, носящего имя Чебышева (см. § 5).

Для р(х) = 1 Чебышев дал решение задачи при m = 1, 2, 7. При m = 8 эта задача не имеет решения: узлы можно найти, но они комплексны. При m = 9 она снова имеет решение. Однако, как показал С. Н. Бернштейн, при всяком m>9 задача опять не имеет решения (узлы находятся вне отрезка [—1, +1]).

Квадратурную формулу, точную для многочленов n-ой степени, очень просто получить при помощи формулы Лагранжа (4). Если проинтегрировать ее левую и правую части на отрезке [а, b], то получим

(10)

Равенство (10), таким образом, имеет место для всех многочленов степени n и, следовательно, квадратурная формула

точна для всех многочленов степени n. В случае, когда

эта формула, как мы знаем, обращается в формулу Симпсона.

Расположение узлов xk (k = 0, 1, ..., n) в пределах отрезка [а, b] мы можем изменять. Каждому расположению узлов будет соответствовать своя квадратурная формула.

Гаусс (знаменитый немецкий математик прошлого столетия) показал, что узлы хк можно расположить так, что формула будет точной для всех многочленов не только степени n, но и степени 2n+1.

Многочлен

степени n+1, составленный при помощи узлов хк Гаусса, обладает замечательным свойством: каков бы ни был многочлен Р (х) степени меньшей, чем n + 1, имеет место равенство

Таким образом, многочлен Аn+1 (х) ортогонален на отрезке [а, b] ко всем многочленам степени не выше, чем n. Многочлены Аn+1 (х) носят название многочленов Лежандра (соответствующих отрезку [а, b]).

§ 4. ИДЕЯ ЧЕБЫШЕВА О НАИЛУЧШЕМ РАВНОМЕРНОМ ПРИБЛИЖЕНИИ

Постановка вопроса. К идее наилучшего равномерного приближения П. Л. Чебышев пришел, желая решить чисто практические задачи. П. Л. Чебышев был не только одним из крупнейших математиков

прошлого столетия, создавшим основы ряда широко развитых в настоящее время математических дисциплин, но и передовым инженером своего времени. В частности, Чебышева весьма интересовали вопросы, связанные с конструкциями механизмов, осуществляющих те или иные заданные траектории движения. Мы сейчас поясним, что выражают эти слова.

Пусть на отрезке а⩽х⩽b задана кривая y = f(x). Требуется построить подчиняющийся определенным техническим требованиям механизм, некоторая точка которого должна описывать насколько возможно точно эту кривую, когда механизм находится в действии. П. Л. Чебышев решает поставленную задачу следующим образом. Прежде всего, выступая при решении ее как инженер, он конструирует нужный механизм так, чтобы при помощи его осуществлялась сравнительно грубо приближенно требуемая траектория движения. Таким образом, некоторая точка А механизма, пока еще не рассчитанного окончательно, при его действии будет описывать кривую

y = φ(x). (11)

похожую на нужную кривую y = f(x) только в общих чертах. Построенный механизм состоит из отдельных частей — шестеренок, рычагов разного рода и т. д. Все они имеют определенные размеры

α0, α1, α2, ..., αm (12)

вполне определяющие механизм, а следовательно, и кривую (11). Это — параметры механизма и кривой (11).1 Таким образом, кривая (11) зависит не только от аргумента х, но и от параметров (12). Любой наперед заданной системе значений параметров будет соответствовать определенная кривая, уравнение которой удобно записать в виде

у = φ(х; α0, α1, ..., αm). (13)

Принято говорить в таких случаях, что мы получили семейство функций (12), заданных на отрезке а⩽х⩽b и зависящих от m+1 параметров (11).

При дальнейшем решении своей задачи Чебышев выступает уже как чистый математик. Он совершенно естественно предлагает считать в качестве меры уклонения функции f (х) от приближающей ее функции φ(х; α0, α1, ..., αm) на отрезке а⩽х⩽b величину

(14)

равную максимуму абсолютной величины разности

1 Желающих ознакомиться с подробностями расчета подобных механизмов мы отсылаем к сборнику «Научное наследие П. Л. Чебышева», т. II. Изд-во АН СССР, 1945.

на отрезке a⩽x⩽b (рис. 8). Эта величина есть, очевидно, некоторая функция

|f — φ| = F(х; α0, α1, ..., αm) (15)

от параметров α0, α1, ..., αm. Ставится теперь вопрос о разыскании таких значений параметров, при которых функция (15) принимает наименьшее значение. Эти значения определяют функцию о, про которую принято говорить, что она наилучшим образом равномерно приближает заданную функцию y = f(x) среди всевозможных функций рассматриваемого семейства (11). Величина F(α0, α1, ..., αm) для этих значений носит название наилучшего равномерного приближения функции f(x) на отрезке [а, b] при помощи функций φ семейства (13). Ее принято обозначать символом Em(f). Термин «равномерный» часто, в особенности в иностранной литературе, заменяют термином «чебышевский». Оба они подчеркивают определенный характер близости функций. Возможны и другие способы, например можно говорить о функции из некоторого семейства наилучшим образом в смысле среднего квадратического приближающей f(x). Но об этом будет речь в § 8.

П. Л. Чебышев впервые вскрыл те закономерности, которые имеют место в рассматриваемом здесь вопросе, и в ряде случаев обнаружил, что функция φ, наилучшим образом равномерно приближающая функцию f на отрезке [a, b], обладает тем замечательным свойством, что для нее максимум (15) абсолютной величины разности

достигается по меньшей мере в m + 2 точках отрезка [а, b] с последовательной переменой знака (рис. 9).

Мы не можем здесь останавливаться на точной формулировке тех условий, при которых это утверждение имеет место, отсылая более подготовленного читателя к статье В. Л. Гончарова «Теория наилучшего приближения функций» («Научное наследие П. Л. Чебышева», т. I).

Случай приближения функций многочленами. Особенно важное общетеоретическое значение имеет применение изложенных выше иссле-

Рис. 8.

Рис. 9.

дований П. Л. Чебышева к вопросу о приближении произвольной функции f(x) на заданном отрезке [а, b] при помощи многочленов Pn (х) = a0+ а1х + a2х2 +...+ anxn данной степени n. Многочлены Pn (х) степени n образуют семейство функций, зависящих от x + 1 их коэффициентов— параметров. К многочленам, как это можно доказать, полностью применима теория Чебышева, так что, если надо узнать, приближает ли равномерно наилучшим образом заданный многочлен Pn (х) функцию f(x) на отрезке [a, b] среди всевозможных многочленов данной степени га, нужно найти все те значения х на этом отрезке, для которых функция |f(x) — Pn(х)| достигает своего максимума L на [а, b].

Если при этом среди них можно указать n + 2 значения x1, x2, ..., xn+2, таких, что в них разность f(x) — Pn(х) последовательно меняет знак

то Рn(х) есть наилучший многочлен; в противном случае Pn(х) не есть наилучший многочлен. Например, решением задачи о наилучшем равномерном приближении при помощи многочленов Рг (х) = р + qx первой степени функции f(x), изображенной на рис. 10, является тот из этих многочленов p0+q0x, график которого есть прямая, параллельная хорде AB и делящая на равные части параллелограм, заключенный между этой хордой и параллельной ей касательной CD к кривой y = f(x), так как, очевидно, абсолютная величина разности f(x) — (p0+q0x) достигает своего максимума для значений x0 = а, x1 и x2 = b, где x1 — абсцисса точки касания F, а сама разность для этих значений последовательно меняет знак. Заметим, чтобы не было недоразумений, что речь здесь шла о выпуклой книзу кривой, имеющей во всех своих точках касательную. В этом примере E1(f) равно половине длины отрезка АС или равных ему отрезков BD или GF.

§ 5. МНОГОЧЛЕНЫ ЧЕБЫШЕВА, НАИМЕНЕЕ УКЛОНЯЮЩИЕСЯ ОТ НУЛЯ

Рассмотрим следующую задачу. Требуется найти многочлен Рn-1(х) степени n — 1, наилучшим образом равномерно приближающий на отрезке [—1, 1] функцию хn.

Оказывается, искомый многочлен таков, что для него выполняется равенство

(16)

Чисто формально этот факт вытекает из теоремы Чебышева, если предварительно убедиться в том, что правая часть (16), во-первых,

Рис. 10.

есть алгебраический многочлен n-й степени с коэффициентом при хи, равным единице; во-вторых, ее абсолютная величина на рассматриваемом отрезке [—1, +1] достигает максимума, равного L = в n + 1 точках хк = cos kπ/n (k = 0, 1, ..., n); и, в-третьих, сама она в этих точках последовательно меняет знак.

В том, что правая часть (16) есть многочлен степени n с коэффициентом при xn, равным единице, можно убедиться при помощи следующего рассуждения.

Допустим, что для данного натурального числа n уже доказана справедливость равенств

где Qn-1и Qn — алгебраические многочлены соответственно степеней n — 1 и n. Тогда подобные равенства имеют место и для n + 1, как в этом легко убедиться из рассмотрения следующих формул:

Но наши равенства при n = 1 справедливы, так как

В таком случае они справедливы и для любого n.

Правая часть (16) называется многочленом Чебышева степени n, наименее уклоняющимся от нуля, по имени П. Л. Чебышева, впервые поставившего и решившего эту задачу. Вот первые из этих многочленов:

Мы уже имели случай убедиться в важной роли многочленов Чебышева в вопросах интерполяций и приближенных методов интегрирования. По поводу интерполяций здесь будет уместно сделать дальнейшие пояснения.

Из того, что разность f(x) — Рn(х) между произвольной непрерывной функцией f(x) и наилучшим приближающим ее многочленом Pn(х) меняет знак в n+2 точках, следует в силу свойства непрерывной функции, что Pn(х) совпадает с f(x) в некоторых определенных n + 1 точках отрезка [а, b], т. е. Рn(х) есть интерполяционный многочлен n-й степени для f(x) при некотором выборе узлов.

Таким образом, задача о наилучшем равномерном приближении непрерывной функции f (х) сводится к умению подобрать на отрезке [—1, 1] систему x0, x1, . . ., xn узлов интерполяции, так чтобы соответствующий интерполяционный многочлен n-й степени имел уклонение || f — Q || = max|f(x) — Q(x)|, наименьшее среди возможных. К сожалению, практическое нахождение нужных узлов очень часто связано с большими трудностями. Обычно эту задачу приходится решать приближенно, и здесь выступает особая роль многочлена Чебышева. Оказывается, что если в качестве узлов интерполяции взять именно нули многочлена cos (n+1) arccosx (т. е. точки, где он сам равен нулю), то соответствующий интерполяционный многочлен, по крайней мере при больших n, будет давать равномерное уклонение от функции (достаточно гладкой), мало отличающееся от соответствующего уклонения наилучшего равномерно приближающего функцию многочлена. Это несколько неопределенное выражение «мало отличающийся» в ряде важных характерных случаев может быть подкреплено весьма точными количественными оценками, на которых мы здесь не будем останавливаться.

Вернемся к многочлену Чебышева. Возьмем его в виде Tn (х) = M cos n arccos х (—1 ⩽ х ⩽ 1), где M — некоторое положительное число. Очевидно, он всюду на отрезке [—1, 1] по абсолютной величине не превышает числа М. Производная от него равна

и, следовательно, она на отрезке [—1, 1] удовлетворяет неравенству

Оказывается, что полученное неравенство верно для всех многочленов Pn(х) степени n, не превышающих числа M по абсолютной величине на отрезке [—1, 1], т. е. для производной всякого такого многочлена на отрезке [—1, 1] выполняется неравенство

Неравенство это надо считать принадлежащим А. А. Маркову, так как оно прямо следует из его результатов, идущих даже

несколько дальше. Сам А. А. Марков получил их в связи с одним вопросом, заданным ему Д. И. Менделеевым.

В дальнейшем, в 1912 г., С. Н. Бернштейн получил носящий его имя аналог этого неравенства для тригонометрических полиномов и при помощи этих неравенств впервые обнаружил возможность установления дифференциальных свойств функции, если известен порядок убывания ее наилучших приближений. Результаты этого рода, касающиеся дифференцируемых функций, приведены в §§ 6 и 7.

§ 6. ТЕОРЕМА ВЕЙЕРШТРАССА. НАИЛУЧШЕЕ ПРИБЛИЖЕНИЕ ФУНКЦИИ И ЕЕ ДИФФЕРЕНЦИАЛЬНАЯ ПРИРОДА

Теорема Вейерштрасса. Если применить общее определение наилучшего приближения функции, данное в § 4, к случаю, когда она приближается алгебраическим многочленом степени n, то мы придем к следующему определению. Наилучшим равномерным приближением функции f(x) на отрезке [а, b] при помощи многочленов степени n называется (неотрицательное) число Еn (f), равное минимуму выражения

распространенному на всевозможные многочлены Pn(х) степени x.

Независимо от того, умеем мы или нет находить точное выражение многочлена, наилучшим образом приближающего данную функцию f(x), представляет большой практический и теоретический интерес возможно более точное знание величины En(f). В самом деле, если нам требуется приблизить функцию f многочленом с точностью до заданной величины о\ иначе говоря, так, чтобы было

(17)

для всех X из заданного отрезка, то нет никакого смысла подбирать его среди многочленов такой степени x, для которой En (f) > δ так как при этом n вообще не существует какого бы то ни было многочлена Pn, для которого имеет место (17). С другой стороны, если нам известно, что En (f) < δ то имеет смысл при таком n пытаться отыскать многочлен Pn(x), который приближал бы f(х) с точностью до δ так как такого рода многочлены заведомо существуют.

Свойства наилучших приближений функций различных классов подверглись весьма тщательному и глубокому изучению. Прежде всего отметим следующий важный факт.

Если функция f(x) непрерывна на отрезке [а, b], то ее наилучшее приближение En(f) стремится к нулю при неограниченном возрастании n.

Это — теорема, доказанная Вейерштрассом в конце прошлого столетия. Она имеет большое значение, так как утверждает принципиаль-

ную возможность приблизить произвольную непрерывную функцию некоторым многочленом с любой наперед заданной точностью. Благодаря этому обстоятельству, множество всех многочленов любой степени в известной мере относится к множеству всех непрерывных функций, заданных на отрезке, так же как совокупность R рациональных чисел относится к совокупности H всех действительных (рациональных и иррациональных) чисел. В самом деле, каково бы ни было иррациональное число а и как бы ни было мало положительное число г, всегда можно подобрать такое рациональное число r, что выполняется неравенство |α — r |<ε. С другой стороны, если f(x) есть непрерывная на [а, b] функция и s — произвольно малое положительное число, то из теоремы Вейерштрасса вытекает существование алгебраического многочлена Pn(х), такого, что для всех х из отрезка [а, b] имеет место |f(х) — Рn(х)|<ε. Ведь по этой теореме наилучшее приближение En(f) непрерывной функции стремится к нулю при n→∞.

Можно дать следующую иллюстрацию теореме Вейерштрасса. Пусть задан график произвольной непрерывной функции f (х) (см. рис. 9), определенной на отрезке [а, b]. Зададим произвольное малое положительное число е и окружим наш график полоской толщиной 2ε, так, чтобы график проходил по середине полоски. Тогда всегда можно подобрать алгебраический многочлен

достаточно высокой степени, такой, что его график окажется находящимся полностью внутри взятой полоски.

Сделаем следующее замечание. Пусть попрежнему f(x) есть произвольная непрерывная на [а, b] функция, a Pn(х) (n = 1, 2, . . .) — многочлены ее наилучшего равномерного приближения. Нетрудно увидеть, что функцию / (х) можно представить в виде ряда f (х) = Р1(х) + [P2 (х) — P1(x)] + [P3(x) — P2(x)] + ..., равномерно сходящегося к ней на [а, b]. Это следует от того, что сумма первых n членов ряда равна Рn(х), причем max |f(x) — Pn(x)| = En(f), a En(f)→0 при n→∞.

В р