Шафаревич И. Р. О решении уравнений высших степеней (метод Штурма). — М. : Гос. изд-во технико-теорет. лит., 1954. — 24 с. — (Популярные лекции по математике ; вып. 15).

Популярные лекции по математике

И. Р. ШАФАРЕВИЧ

О РЕШЕНИИ УРАВНЕНИЙ ВЫСШИХ СТЕПЕНЕЙ

(МЕТОД ШТУРМА)

ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО ТЕХНИКО-ТЕОРЕТИЧЕСКОЙ ЛИТЕРАТУРЫ

МОСКВА • 1954

ПОПУЛЯРНЫЕ ЛЕКЦИИ ПО МАТЕМАТИКЕ

ВЫПУСК 15

И. Р. ШАФАРЕВИЧ

О РЕШЕНИИ УРАВНЕНИЙ ВЫСШИХ СТЕПЕНЕЙ

(МЕТОД ШТУРМА)

ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО ТЕХНИКО-ТЕОРЕТИЧЕСКОЙ ЛИТЕРАТУРЫ

МОСКВА 1954

11-3-1

ОГЛАВЛЕНИЕ

Введение .................. 3

§ 1. Границы корней............4

§ 2. Общие корни многочленов и равные корни..................7

§ 3. Характеристика пары многочленов .... 9

§ 4. Число корней многочлена, лежащих между a и b.............17

И. Р. Шафаревич.

О решении уравнений высших степеней.

Редактор В. Б. Орлов. Техн. редактор С. С. Гаврилов. Корректор Ц. С. Варшавская

Сдано в набор 25/V 1954 г. Подписано к печати 22/VII 1954 г. Бумага 84хШ87я«» Физ. печ. л. 0,75. Условн. печ. л. 1,23. Уч.-изд. л. 1,24. Тираж 30 ООО экз. T-0488Ô. Цена книги 40 к. Заказ № 1465.

Государственное издательство технико-теоретической литературы. Москва, Б. Калужская, 16.

4-я типография им. Евг. Соколовой Союзполиграфпрома Главиздата Министерства культуры СССР. Ленинград, Измайловский пр., 29.

ВВЕДЕНИЕ

В курсе алгебры средней школы выводится формула для решения квадратного уравнения, а из курса физики видно, насколько необходима эта формула для решения многих физических вопросов (например, в задачах, связанных с равноускоренным движением, и т. д.).

Не меньшую роль, чем квадратные уравнения, играют в математике и ее приложениях уравнения третьей и более высоких степеней. Люди почти так же давно начали заниматься уравнениями высших степеней, как и квадратными уравнениями. Известны вавилонские клинописные таблички, в которых решаются некоторые кубические уравнения. Несмотря на то, что этим вопросом занимались так давно, основные факты об уравнениях высших степеней были открыты только в XIX веке. Эта лекция посвящена обзору некоторых основных свойств уравнений высших степеней.

Способ, которым мы будем выводить свойства уравнений высших степеней, резко отличается от того способа, при помощи которого в курсе алгебры средней школы выводят свойства квадратных уравнений. Почти все свойства квадратных уравнений выводятся из формулы для их решения, мы же не будем выводить формулу для решения уравнений высших степеней, а получим их свойства из некоторых общих алгебраических и геометрических соображений.

Дело в том, что для большинства уравнений высших степеней не существует такой формулы, как для уравнений второй степени. В тех же случаях, где такая формула есть, она настолько сложна, что из нее невозможно вывести никаких свойств уравнения. Но и независимо от этого, наш путь имеет еще одно преимущество: он делает более ясной истинную причину тех фактов, которые доказываются.

Все рассуждения, которые здесь будут приведены, годятся для уравнений любой степени. Часто они будут изложены в общем виде. В некоторых же случаях, когда рассуждение в общем случае принципиально то же, но удлиняет выкладку, мы будем приводить его лишь для уравнений третьей степени и только формулировать то, что получится в общем случае. Очень рекомендуется провести все рассуждения самостоятельно в общем случае.

Наконец, совсем выпущены доказательства фактов, подобных следующему: если график многочлена имеет точки по разные стороны оси х, то он эту ось пересекает. Вероятно, некоторые читатели не почувствуют потребности в доказательстве подобных предложений. Тот же, кто пожелает провести эти доказательства, легко сделает это при помощи простейших свойств непрерывных функций, которые можно узнать из первых глав любого курса анализа.

В этой книжке мы будем заниматься только свойствами действительных корней уравнений, так что от читателя не потребуется знания свойств комплексных чисел. Заметим, что свойства комплексных корней уравнений могут быть выведены с помощью таких же методов, но несколько усложненных.

§ 1. ГРАНИЦЫ КОРНЕЙ

Первая задача, которую мы себе поставим, заключается в следующем: для каждого уравнения указать границы, между которыми расположены его корни.

Предположим, что наше уравнение — третьей степени и имеет вид

ax* + bx* + cx + d = 0. (1)

Мы покажем сейчас, как найти такое положительное число Nt что если абсолютная величина х превосходит N, то левая часть уравнения отлична от нуля. Тогда корни будут наверняка расположены между —Ми N. Для этого постараемся выбрать N таким, что если абсолютная величина х больше N, то абсолютная величина первого члена превосходит абсолютную величину суммы трех остальных. Тогда первый член не сможет сократиться с суммой остальных и все выражение будет отлично от нуля.

Мы заведомо достигнем своей цели, если треть абсолютной величины первого члена будет больше абсолютной вели-

чины каждого из трех остальных, т. е.

Решая эти неравенства, получим:

Таким образом, мы получим число с нужным нам свойством, взяв за N большее из трех чисел

В самом деле, при |л;|, большем Л/", все три неравенства будут выполняться, а следовательно, левая часть уравнения (1) не будет обращаться в нуль. Для уравнения степени п,

ахп + Ьх"-1 + схп~ъ +..-+** + /= О, (2)

надо было бы принять за N наибольшее из ряда чисел:

Заметим, что мы доказали несколько больше, чем утверждали. Так как абсолютная величина первого члена в левой части уравнения (1) больше, чем абсолютная величина суммы остальных членов, то знак всего выражения определяется знаком первого члена. Таким образом, мы не только знаем, что левая часть уравнения (1) есть число, отличное от нуля, когда абсолютная величина х превосходит N, но можем указать и знак этого числа — он совпадает со знаком первого члена.

Уже из этих простых соображений мы можем вывести важные следствия о корнях уравнений. Для этого надо воспользоваться графиком функции

у = ахп + Ьхп~1-\- ... -|- kx -j- /. (3)

Пусть (черт. 1) на плоскости взяты оси координат и вычерчен график функции (3). Согласно общему правилу черчения гра-

фиков ордината а точки M графика равна тому числу, которое получится, если подставить ее абсциссу v в выражение (3) вместо x. В частности, ордината обратится в нуль, когда абсцисса будет корнем уравнения (2). Это значит, что корни уравнения геометрически изображаются точками пересечения графика с осью х.

Пусть наше уравнение — третьей степени. Мы разделим обе части его на коэффициент а при первом члене и запишем в виде

хъ _|_ рх2 + qx-\-r = 0. (4)

Посмотрим, что геометрически обозначает найденное число N с указанными выше свойствами. Все корни уравне-

ния (4) расположены между — N и N. Это значит, что график функции

у = х%-\- рх- + Ях + г (5)

может пересекать ось х только в точках, абсциссы которых лежат между —Nu N. Но обязан ли график пересекать ось x? Вспомним, что если х по абсолютной величине больше N, то знак функции (5) совпадает со знаком первого члена. Но знак первого члена нам известен — он совпадает со знаком x. Таким образом, если х больше N, то многочлен положителен, а это значит, что график в этой части лежит выше оси х. Если же х меньше —N, то многочлен отрицателен, т. е. график в этой части лежит ниже оси х. То, что мы таким образом узнаем о графике, нарисовано на черт. 2. Из этого чертежа ясно, что график должен пере-

Черт. 1. Черт. 2.

сечь хоть один раз ось х, а это значит, что уравнение третьей степени имеет хотя бы один корень. Аналогичный факт имеет место и для уравнений высших степеней: уравнение нечетной степени имеет хотя бы один корень. Ясно, что для уравнений четной степени эта теорема не имеет места, как показывают уже квадратные уравнения, которые могут вовсе не иметь корней*).

§ 2. ОБЩИЕ КОРНИ МНОГОЧЛЕНОВ И РАВНЫЕ КОРНИ

Основным алгебраическим приемом, которым мы будем дальше пользоваться, является деление многочлена на многочлен с остатком. Если имеется два многочлена / и g, то мы можем разделить (обычным способом, «уголком») тот из них, который имеет большую степень, на другой, и получим неполное частное q и остаток /г, который имеет уже меньшую степень, чем делитель. Это можно записать в виде формулы f=g.q + h. (б)

Деление с остатком — это общий прием, который сводит изучение пары многочленов / и g к изучению пары многочленов g и h, имеющих меньшие степени. Именно благодаря этому обстоятельству часто оказывается, что свойства пары многочленов могут быть легче изучены, чем свойства одного многочлена.

В качестве примера рассмотрим, как находятся общие корни двух многочленов fug. Если а есть корень как многочлена /, так и многочлена g, то, полагая в соотношении (6) х = а, мы получим, что и h должно обратиться в нуль, т. е. иметь корнем а. Таким образом, общий корень многочленов fug является общим корнем многочленов g и h. Наоборот, из того же соотношения (6) мы видим, что если ос есть общий корень многочленов g и h, то он является также корнем /, т. е. общим корнем многочленов / и g. Взятые вместе, эти два утверждения показывают, что общие корни многочленов / и g, с одной стороны, и многочленов g и h, с другой, совпадают. Достижение здесь заключается в том, что многочлены g к h имеют меньшие степени, чем / и g.

*) Напомним, что мы под корнем всегда подразумеваем вещественный корень, так что, например, уравнение х2 + 1 = 0, с нашей точки зрения, не имеет корней.

С g и h мы можем повторить те же рассуждения, разделив g с остатком на h. Таким образом, мы будем получать пары многочленов все меньших степеней, причем общие корни у всех этих пар многочленов будут одни и те же. Мы при нуждены будем остановиться, когда придем к паре многочленов а и v, один из которых, например v, есть нуль. Но в этом случае все корни многочлена и являются общими корнями и и так как v, будучи равно нулю, имеет все числа своими корнями.

Таким образом, нахождение общих корней многочленов / и g свелось к нахождению корней многочлена и, имеющего, как правило, гораздо меньшую степень.

Рассмотрим пример. Найти общие корни многочленов х* + х*-\-Ъх-\- 1 и x*4-х + 2.

Делим первый с остатком на второй:

Остаток есть jc —J— 1. Следовательно, общие корни у первоначальной пары многочленов те же, что и у многочленов + *+2 и дг+1.

Делим опять первый с остатком на второй:

Остаток есть 0. Следовательно, общие корни те же, что и у многочленов jc —[— 1 и 0, то-есть только один общий корень —1.

Мы можем применить то, что сейчас узнали, к другой задаче: узнать, имеет ли заданный многочлен среди своих корней равные, и найти эти равные корни. Мы опять будем предполагать, что имеем дело с многочленом третьей сте-

пени (5). Если этот многочлен имеет своим корнем а, то он делится без остатка на х—ос. Это вытекает из теоремы Безу, но мы проверим сейчас этот факт простым делением:

Остаток oß-\- pa2-\-qa -{-г равен нулю, так как нам дано, что а является корнем уравнения (4). Мы получим заодно, что частное от деления есть

x2 + (p + a)x + (Qfi + pCL + qy (7)

Если бы уравнение (4) имело еще один корень, равный а, то он должен был бы быть корнем многочлена (7). Подставляя а вместо x, получаем 3a2-f- 2ра -|- q = 0.

Итак, мы доказали, что равные корни многочлена (5) являются общими корнями этого многочлена и многочлена Zx2-\-2px-\-q. Этот последний называется производным многочленом от многочлена (5). Таким образом, задача привелась к разысканию общих корней многочлена и его производного многочлена, а эту задачу мы уже умеем решать.

Для многочленов л-й степени (2) имеет место вполне аналогичная теорема. Роль многочлена Зх2~\- 2рх ~\- q здесь играет многочлен пахп~1-\-{п— 1)Ьхп~2~\-(п— 2)схп-'6-\-... ...-{-£. Этот многочлен также называется производным от многочлена (2).

§ 3. ХАРАКТЕРИСТИКА ПАРЫ МНОГОЧЛЕНОВ

Мы переходим теперь к нашей главной задаче. Она формулируется так : задан многочлен / и два числа а и причем а < надо узнать, сколько у многочлена / есть корней, лежащих между а и Ьу

т. е. меньших но больших а. Мы увидим дальше, что из решения этой задачи будут следовать ответы на большинство вопросов, которые можно задать о корнях многочленов: об их числе, расположении и даже способе их вычисления.

В решении этой задачи мы будем поступать так же, как и в предшествующем параграфе, т. е. сначала исследуем свойства пары многочленов. При этом мы будем пользоваться двумя методами, которые нам уже встречались: алгебраическим— делением с остатком, и геометрическим — построением графика.

Пусть даны два многочлена, причем нам важен и порядок, в котором они заданы. Первый многочлен обозначим через Д, а второй — через /2. Мы будем предполагать, что f± и /2 не имеют общих корней, так как общие их корни мы можем найти по способу предыдущего параграфа. Начертим графики многочленов fx и /2. (График fx мы будем чертить жирной линией, а /2— пунктиром; черт. 3.) Они будут делить всю плоскость на три части — первую, которая лежит ниже обоих графиков, вторую, которая лежит выше обоих, и третью, которая лежит между двумя графиками. Третья часть и будет нас дальше интересовать. Мы будем ее заштриховывать на чертеже и называть заштрихованной областью. Нанесем на оси X точки с абсциссами а и b и обозначим их через А и В. Будем двигаться от точки А к точке В по оси х. При этом мы будем пересекать графики многочленов ft и /2 в точках, изображающих их корни. В некоторых из этих

Черт. 3.

точек пересечения мы будем выходить из заштрихованной области, в других — входить в нее. Первые мы будем называть точками выхода, вторые — точками входа. Заметим, что точка не может быть одновременно точкой входа и точкой выхода (как это имеет место на черт. 4 для точки С), так как тогда оно изображала бы общий корень многочленов Д и /2, а мы предположили, что таких нет.

Теперь мы введем одно новое понятие.

Характеристикой многочленов ft и /2 называется разность между числом точек выхода и числом точек входа, принадлежащих графику многочлена ft и расположенных между точками А и В.

Например, на чертеже 3 точки D и Е являются точками выхода, принадлежащими графику fv а С, F и О—точками входа на этом же графике. Характеристика в этом случае равна 2 — 3 = = — 1. Характеристика является целым числом и обозначается (fvf2)- Она, конечно, зависит, кроме многочленов Д и/2, еще и от точек А и В, между которыми мы рассматриваем графики многочленов.

Совершенно очевидно, что характеристика многочленов Д и /2 зависит от того, какой из них мы считаем первым, так как при ее подсчете мы обращаем внимание только на точки входа и выхода на графике этого многочлена. Поэтому интересно выяснить, как именно изменится характеристика, если мы будем считать первым многочленом не Д, а /2, или, иначе, как связаны между собой числа (Д, /2) и (/а, Л).

Удобно представить себе положение вещей на следующей модели. Имеется комната, в которую человек может входить и из которой может выходить. Обозначим число, показывающее, сколько раз он вышел из комнаты за заданный промежуток времени, через Р, а сколько раз вошел — через Q. Ясно, что так как за каждым входом, кроме последнего, следует выход, а за выходом — вход, то число входов может отличаться от числа выходов не более чем на 1 в ту или другую сторону. Мы можем это записать так:

(8)

Черт. 4.

Более точно значение е определяется следующей таблицей: / — если в начальный момент человек был внутри, а в конечный — снаружи; — 1 — если в начальный момент он был снаружи, а в конечный — внутри; О — если в начальный и конечный момент времени он был по одну и ту же сторону стен комнаты (черт. 5). Представим теперь себе, что задача усложнена тем, что в комнате есть две двери — / и //, и число выходов и входов через каждую дверь подсчитывается отдельно. Число выходов и входов через / дверь мы обозначим через Рг и Q±, через //—Р2 и Q2. Ясно, что общее число входов и выходов через обе двери подчиняется соотношению (8), т. е.

Pt + P2 = Qi + Q2 + e-Отсюда мы получаем:

^1 — Qi = -(P* — Q2) + e. Это показывает, что разности между числом выходов и числом входов в случае / и// двери просто связаны между собой.

Ясно, какое это имеет отношение к нашим многочленам. Комната — это заштрихованная область, / дверь — это график многочлена fv II дверь — это график /2. Выходы и входы — это точки входа и точки выхода, Р1 — Qx — не что иное, как характеристика (fv /2), Р2 — Q2 — характеристика (Л» Л)- Мы получаем соотношение

(fv /2) = -(/2. Л) + «.

и остается только выяснить, каков смысл е в нашем случае.

Внутри заштрихованной области (комнаты) мы начали или вне ее, зависит от того, принимают ли многочлены ft и /2 при X = а значения одинакового знака или разных знаков. Точно так же, внутри или вне заштрихованной области мы кончили, зависит от того, одинакового или разного знака

Черт. 5.

значения f1 и /2 при х = Ь. Условимся говорить, что в паре чисел есть одна перемена знака, если они разных знаков, и нет ни одной — если одного, и обозначим значения Д и /2 при x = а через а± и а.2, а при х = Ъ через Ьх и Ь2. Как легко проверить, е будет совпадать с разностью между числом перемен знака в паре ах и а2 и числом перемен знака в паре bt и Ь.2. Если первое число обозначить через mv а второе — через nv то е = тх — nv

До сих пор мы не имели способа найти характеристику двух многочленов, так как, для того чтобы воспользоваться определением характеристики, надо было знать их корни. Сейчас мы можем такой способ вывести. Именно здесь вступает в действие деление с остатком. Мы разделим /х с остатком на /2:

fi = Uq+h (Л —остаток), (9)

и поставим вопрос, как связаны характеристики (Д, /2) и (/2, /g). Такая постановка вопроса подсказывается нам результатом предыдущего параграфа, где мы видели, что общие корни у пары многочленов fv /2 те же, что и у пары многочленов /2, /3. Прежде всего мы имеем:

(Л. Л) = -(/2. (ю)

Нам остается сравнить (/2, /х) и (/2, /g). Мы докажем, что эти два числа равны. Для этого заметим, что если а является корнем многочлена /2, то при x = а значения многочленов Д и /g совпадают (черт. 6). Это получится, если в (9) заменить х на а и заметить, что член, содержащий /2, пропадает. Из этого следует, что около точки с абсциссой х = а графики многочленов Д и /3 расположены по одну и ту же сторону от графика многочлена /2 (черт. 6). Отсюда уже просто следует совпадение характеристик (/2, Д) и (/2, /3). В самом деле, при подсчете обеих характеристик нам надо перебирать корни многочлена /2, лежащие между А и Б, и смотреть, какие из них являются точками входа, а какие — точками выхода. Но из того, что было только что доказано относительно расположения графиков многочленов fv /2 и /3, следует, что если корень а является точкой

Черт. 6.

входа в заштрихованной области, образованной графиками многочленов /2 и fv то он будет изображаться также точкой входа и в области, образованной графиками /2 и /3. То же самое имеет место и для точек выхода.

Таким образом, совпадение характеристик (/2, /Д и (/2, /з) доказано. Вместе с (10) это дает нам соотношение

(Л. /2) = -(/о. /з) + *. оо

Так как многочлены /2 и /3 имеют меньшие степени, чем многочлены f1 и /2, то это дает нам общий способ вычисления характеристики пары многочленов.

Принципиально наша задача — научиться вычислять характеристику пары многочленов — решена, но можно придать результату более законченный вид. Для этого постараемся избавиться от знака минус в формуле (11). Проще всего взять для этого за /3 не остаток от деления ft на /2, а этот остаток с обратным знаком. Остаток будет тогда—/3 и (9) будет иметь вид:

к=ия— U

а формула (11) приобретает более простой вид

(Л. /») = (/«. /») + «• (12)

Для того чтобы это проверить, нам надо только доказать, что характеристика пары многочленов меняет знак, если второй многочлен меняет знак. Но это совершенно ясно из чертежа, поскольку график второго многочлена заменится тогда симметричной ему относительно оси х кривой, так что все корни первого многочлена, которые были точками выхода, сделаются точками входа и наоборот. Ясно, что характеристика изменит знак.

После того как мы разделим Д на /2 и остаток, взятый с обратным знаком, обозначим через /3, проделаем то же самое с /2 и /3 и будем продолжать, пока у нас не получится остаток, равный нулю. Полученный таким образом ряд многочленов Д, /2, /3, . . ., fk (не считая нуля) называется рядом Штурма пары многочленов f1 и /2. Последний многочлен fk ряда Штурма не может иметь корней, так как многочлены fv /2, . .., fk только знаками отличаются от тех, которые мы строили в предыдущем параграфе для определения общих корней fx и /2, и если бы fk имел корень, то он был бы общим корнем ft и /о, а мы предположили, что таких нет. Выписывая формулу (12) для каждой после-

довательной пары многочленов ряда Штурма, мы получим целый ряд формул:

Здесь числа ev . .., ек_1 имеют прежний смысл, то-есть каждое из них (например, ег) есть разность между числом перемен знака в паре чисел, являющихся значениями двух рядом стоящих многочленов fi и при х = а и при х = Ь.

Заметим теперь, что раз fk не имеет корней, то характеристика его с любым многочленом равна нулю, в частности (fk, 0) = 0, и мы можем последнюю формулу переписать так: (fk_v fk) = ek-v Из предпоследней формулы определим (Д-2» À-i)î оно окажется равным ek_2-\-ek_v

Поступая так и дальше, мы получим, наконец, что

(fv /*) = «! +«9 + ••• +«*-!• (13)

Эту формулу можно еще упростить. Обозначим через av а.2, . . ., ак значения многочленов fv /2, .. ., fk при л: = а, a при х — Ь — через bv b2, 6Ä. Если число перемен знаков в паре чисел ai и ai+1 есть mi9 а в паре чисел и — есть nit то

Формулу (13) можно поэтому переписать так:

или

/2) = 0*1 + w2 + • • • +mk-l) — 0*l + *2 + • • v + ^ft-l).

Число . •• показывает, сколько раз в ряду чисел av а2, ак стоят рядом числа противоположных знаков. Число п±-\- ... + показывает то же самое для ряда чисел о1э 52, Ьк. Эти числа называются числами перемен знаков в ряду ах, . . ., ак и ряду &х, . .., Ьк.

Теперь мы можем сформулировать окончательно полученный нами результат так: характеристика пары много-

членов равна разности между числом перемен знаков в значениях многочленов ряда Штурма при х = а и х — Ъ.

Закончим этот длинный параграф примером. Определим характеристику многочленов f1 = Xs — 8л:2 —J— 19л: — 12 и /2 = je3 — 9л;2-f-27л; — 26, причем положим а = 0, £ = 5. Найдем ряд Штурма. Делим f1 с остатком на /2:

Остаток есть л;2—8л;-|-14 и, следовательно, /3 = — л;2-|-+ 8л;—14. Делим /2 с остатком на /3:

Остаток есть Ъх — 12 и, следовательно, /4 = — 5х-\-\2. Делим /3 с остатком на /4:

Остаток есть —§5 и» следовательно, /б = 25«

Ясно, что следующий остаток уже будет нулем. Ряд Штурма состоит, таким образом, из многочленов х>6 — 8л;2 +

Значения многочленов ряда Штурма выпишем в виде таблицы

Таким образом, первый столбец содержит как раз числа av . . ., аку а второй — числа bv . .., bk. В первом столбце есть одна перемена знака, так как рядом стоят — 14 и 12, во

втором — две, так как рядом стоят 1 и —13и —13 и i|.

Характеристика равна 1 — 2 = — 1.

§ 4. ЧИСЛО КОРНЕЙ МНОГОЧЛЕНА, ЛЕЖАЩИХ МЕЖДУ a и b

Сейчас мы покажем, как от характеристики пары многочленов перейти к нахождению корней одного многочлена. Характеристика пары многочленов ft и /2 равна разности между числом тех корней многочлена ft между а и Ь, которые являются точками выхода, и тех, которые являются точками входа. Если бы мы сумели подобрать многочлен /2 так, чтобы все корни многочлена ft стали точками выхода и, значит, ни один не был бы точкой входа, то характеристика пары многочленов ft и /2 в точности совпала бы с числом корней многочлена fv лежащих между а и Ь.

Посмотрим, как подбирать такой многочлен /2. При этом нам нужно будет предполагать, что многочлен ft не имеет равных корней. Пусть а есть корень многочлена fv Как должен быть расположен график многочлена /2, чтобы точка, изображающая корень а, была точкой выхода? Тут возможны два случая в зависимости от того, поднимается ли график многочлена Д при х = а снизу вверх или спускается

сверху вниз. Как показывают черт. 7 и 8, в первом случае график многочлена /2 должен лежать при х = а выше, a во втором — ниже оси х. Иными словами, в первом случае значение многочлена /2 при х = а должно быть положительным, а во втором — отрицательным. Посмотрим теперь, как научиться узнавать, какой из двух случаев имеет место. Первый случай заключается в том, что при х, меньшем ос, многочлен ft отрицателен, а при х, большем а,— положителен. Во втором же случае — наоборот.

Предположим опять, что мы имеем дело с многочленом третьей степени ft = xà-\~px^-\- qx -}-/*, имеющим корень а, и вспомним, что еще в § 2 мы показали, что такой многочлен делится на х — ос и частное равно х--\-(р-\~ ос) х-\-

Воспользуемся этим разложением, чтобы определить, каковы знаки тех значений, которые принимает многочлен Д, когда X немного меньше или немного больше or. Относительно первого множителя все ясно: если х меньше а, то он отрицателен, а если больше — то положителен. Обратимся ко второму множителю. При х = ос он не обращается в нуль. В самом деле, мы видели в § 2, что это свидетельствовало бы о наличии у многочлена fx двух равных корней, а мы предположили, что их нет. Значение второго множителя при X = ос равно как раз значению производного многочлена ft при х = а. Если это — положительное число, то и при х> не слишком сильно отличающемся от а (именно, если х ближе

Черт. 7, Черт. 8.

к а, чем какой-либо из корней этого квадратного трехчлена), второй множитель положителен, а это значит, что все произведение ведет себя в смысле знаков принимаемых значений как первый множитель; иными словами, мы имеем здесь первый случай. Наоборот, если значение производного многочлена отрицательно, то все знаки меняются на обратные, и мы имеем второй случай.

Мы установили, что здесь решающую роль играет уже знакомый нам производный многочлен, а именно, первый случай имеет место, если значение производного многочлена при x = ос положительно, и второй — если отрицательно. То же самое имеет место и для многочленов любой степени.

Но из этого мы видим сразу, что производный многочлен как раз и является таким многочленом /2, какой нам надо найти. Иными словами, если за /2 взять производный многочлен многочлена fv то характеристика (fv /2) будет равна числу корней многочлена fv расположенных между а и Ь. Так как мы вывели в предыдущем параграфе способ вычисления характеристики, то мы имеем способ нахождения числа корней любого многочлена, расположенных между а и Ь.

Сформулируем полученное правило для отыскания числа корней многочлена.

Для того чтобы найти число корней многочлена, расположенных между а и b, надо найти ряд Штурма для многочлена и его производного многочлена и вычислить значения многочленов этого ряда сначала при х = а9 потом при х = Ь. Разность между числом перемен знаков в первом и втором рядах чисел и будет искомым числом корней.

Это правило является знаменитой теоремой французского математика Штурма. Она доказана им в 1829 г.

Интересно, что рассуждения, при помощи которых мы решили нашу задачу — найти число корней многочлена, лежащих между а и Ъ, — имеет много общего с теми рассуждениями, при помощи которых мы в § 2 решили другую задачу — найти равные корни многочлена. В обоих случаях оказалось, что проще сначала исследовать некоторое свойство пары многочленов — в первом случае это был вопрос об общих корнях, во втором — о нахождении характеристики. Причина того, что в свойствах пары многочленов легче разобраться, чем в свойствах одного многочлена, в обоих случаях была одна и та же — к двум многочленам можно

применять деление с остатком, благодаря чему решение интересующего нас вопроса о двух данных многочленах сводится к решению того же вопроса о двух многочленах меньшей степени. Затем мы в обоих случаях подбирали к заданному нам многочлену Д такой вспомогательный многочлен /2 (в обоих случаях за такой многочлен можно принять производный многочлен к что решенный нами вопрос о паре многочленов в применении к паре fv /2 дает решение интересующего нас вопроса о многочлене fv

Покажем теперь, как при помощи теоремы Штурма можно решить ряд задач о корнях многочленов любой степени.

Прежде всего мы обратимся к задаче об определении числа всех, а не только лежащих между а и Ь, корней заданного многочлена /. Решение этой задачи получается сразу же, если соединить теорему Штурма с результатами, полученными нами в § 1. Там мы показали, как найти такое число TV, что все корни многочлена лежат между — N и N. Из этого следует, что если мы при помощи теоремы Штурма определим число корней многочлена, расположенных между — N и N (взяв а = — N, b = Л/), то получим число всех его корней. Таким образом, задача решена.

Это решение можно, однако, представить в более изящной форме. Пусть ряд Штурма для многочлена /х и его производного многочлена /2 состоит из многочленов fv /2,

Для каждого многочлена fi из этого ряда существует согласно § 1 такое свое число Nit что корни fi лежат между — Ni и Ni. Выберем теперь за N любое число, большее всех чисел Л^. Тогда корни всех многочленов расположены между — N и N. Если мы теперь применим теорему Штурма, взяв а = — N и b = N, то мы получим, конечно, число всех корней нашего многочлена. Но оказывается, что теперь при вычислении числа перемен знаков в значениях многочленов рядов Штурма при х = а и при х = b нам нет надобности вычислять сами эти значения.

В самом деле, нас ведь интересуют только знаки, а мы показали в § 1, что знак того значения, которое принимает любой многочлен при х, меньшем —N или большем N, совпадает со знаком его первого члена. Мы же так выбрали Nt что оно больше всех Л^, а значит,—N меньше всех Л^. Таким образом, знаки значений многочленов ряда Штурма при x = N и при X =— TV определяются знаками их первых членов. Отметим тот любопытный факт, что, хотя мы

пользовались в рассуждениях существованием числа N, нам нет необходимости вычислять его в каждом конкретном случае, так как первый член каждого многочлена ряда Штурма имеет вид ахк и его знак при х = — N или x = N вовсе не зависит от величины N.

Пример. Найти число всех корней многочлена /г = = х*-\-Ъх—\.

Производный многочлен есть Зл:2 -|— 3 = /2. Находим ряд Штурма. Делим ft с остатком на /2:

Остаток есть 2х—1, следовательно, /3 = — 2лг —f-1 - Делим /2 с остатком на /3:

Остаток есть 33/4, следовательно, /4 = — 33/4. Ясно, что следующий многочлен уже равен нулю. Ряд Штурма состоит, таким образом, из многочленов х'6-\-Ъх—1, Ъх*-\-3, — 2jc+1 и — 33/4.

Если мы теперь выберем число N (конечно, положительное) так, как было указано, то знаки значений этих многочленов при х = — N и x = N будут совпадать со знаками их первых членов. Эти знаки даны в таблице

В первом столбце имеются две перемены знака, во втором— одна. Многочлен jc3 + 3jc—1 имеет, таким образом, 2 — 1 = 1 корень.

Теперь мы можем перейти к задаче о вычислении корней многочлена. Мы поставим себе целью вычислить все корни с какой угодно степенью точности. Собственно, ничего лучшего мы не имеем и в случае квадратных уравнений, хотя и кажется, что там формула дает точное, а не приближенное значение корня. Действительно, если мы говорим, что корень многочлена л:2 — а равен то этим мы только указываем, что если применить правило приближенного вычисления квадратных корней, то получится приближенное значение корня многочлена с любой степенью точности.

Для приближенного вычисления корней многочленов нам надо прежде всего (в отличие от того, что имело место при определении числа корней) действительно вычислить по правилу § 1 такое число N, что между —N и N лежат все корни нашего многочлена. После этого мы делим отрезок между —N и N m части, например пополам, и находим по теореме Штурма число корней в каждой из половин, то-есть между —N и 0 и между 0 и N. С каждым из этих отрезков, если оказалось, что в нем содержатся корни, поступаем так же. Так мы делаем до тех пор, пока не раздробим наш отрезок от —N до N на отрезки сколь угодно малой длины, причем нам известно, в каких из этих маленьких отрезков лежат корни, а в каких — нет. Но это и значит, что мы смогли вычислить корни с какой угодно степенью точности, так как если мы, например, узнали, что корень лежит между числами а и р, разность между которыми меньше 0,001, то а и является приближенным значением корня с недостатком с точностью до 0,001, a ß— значением с избытком. Для удобства вычислений часто делят отрезок не пополам, а на 10 частей. Когда мы дойдем до таких маленьких интервалов, что в каждом из них лежит или один корень многочлена, или ни одного, то при следующих вычислениях нам нет надобности пользоваться теоремой Штурма и вычислять значения многочленов ряда Штурма. В самом деле, пусть мы знаем, что между ос и ß лежит ровно один корень многочлена. Пусть мы разделили числом f отрезок между ос и ß на две части и хотим узнать, в какой из этих частей, между а и 7 или между у и ß, лежит корень. Тогда достаточно вычислить значения многочлена при х = ос и при х = *(. Если они разных знаков, то, как видно из черт. 9, при X = си и при X = 7 график многочлена лежит по разные стороны оси X, а следовательно, должен где-то между ос

и 7 эту ось пересечь. Но это и значит, что корень лежит между а и f • Наоборот, если значения многочлена при х = а и при X = 7 одного знака, то корень не может лежать между а и "у. Действительно, тогда график многочлена где-то между а и 7 переходил бы с одной стороны оси х на другую, а значит, где-то в другом месте, тоже между а и], должен был бы вернуться назад, раз при х = а и при л: = f он лежит по одну сторону оси л: (черт. 10). Но это означало бы, что многочлен имеет между а и f по крайней мере два корня, а этого не может быть, так как мы предположили, что между а и р есть всего один корень. Значит, корень не может лежать между ос и 7, а лежит между *у и ß.

Черт. 9. Черт. 10.

Пример. Вычислим с точностью до 0,1 корень многочлена хъ-\-Ъх—1. В прошлом примере мы видели, что этот многочлен имеет один единственный корень, значит, мы можем применить то упрощение в общем методе, о котором только что говорили. Вычислим прежде всего N. Согласно правилу § 1 нам надо за N взять наибольшее из чисел

0, узТз и fb.

Наибольшее из них, конечно, У~Ъ • 3 = 3 и, значит, 7V=3. Таким образом, искомый корень лежит между —3 и 3.

Узнаем теперь знак корня. Для этого найдем значения многочлена при х = 0 и при х = 3. Получим —1 и 36. Так как это числа разных знаков, то корень лежит между 0 и 3, а следовательно, положителен.

Найдем теперь значения многочлена при х = 1 и х = 2. Получим 3 и 13. Таким образом, значения при х=\, 2 и 3 — все одного знака, а значения при х = 0 и при х = 1 —

разных. Это значит, что корень лежит между 0 и 1, т. е. лг = 0, ... Чтобы найти первый знак после запятой, надо узнать, в каком из десяти промежутков (между 0 и Vio» между Vio и 2/10, ..., между 9/10 и 1) лежит корень. Для этого положим сначала х = б/10 = 1/2. Получим в качестве значения многочлена 5/8. Так как —1 и б/8 разных знаков, то корень лежит между 0 и 1/2. Положим теперь 3/10. Получим значение, равное jqqq — уб+1 = щоо — ТО ' отрицательное число, и, значит, корень лежит между 3/10 и б/10, так как значения многочлена при jt = 3/l0 и х = ь/10— разных знаков. Нам остается положить х = 4/io- Получим 64 , 12 - 64 , 2 _ значение ГодоН-у^—1=шб5"т~ш* как это положительное число, то корень лежит между 3/10 и 4/ю- Наша задача решена. Мы нашли, что с точностью до 0,1 значение корня многочлена л;3-|-Зл:—1 есть 0,3.

Цена 40 коп.

ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО ТЕХНИКО-ТЕОРЕТИЧЕСКОЙ ЛИТЕРАТУРЫ

ПОПУЛЯРНЫЕ ЛЕКЦИИ ПО МАТЕМАТИКЕ

Вып. 1. А. И. Маркушевич. Возвратные последовательности.

Вып. 2. И. П. Натансон. Простейшие задачи на максимум и минимум.

Вып. 3. И. С. Соминский. Метод математической индукции.

Вып. 4. А. И. Маркушевич. Замечательные кривые.

Вып. 5. П. П. Коровкин. Неравенства.

Вып. 6. H. Н. Воробьев. Числа Фибоначчи.

Вып. 7. А. Г. Курош. Алгебраические уравнения произвольных степеней.

Вып. 8. А. О. Гельфонд. Решение уравнений в целых числах.

Вып. 9. А. И. Маркушевич. Площади и логарифмы.

Вып. 10. А. С. Смогоржевский. Метод координат.

Вып. 11. Я. С. Дубнов. Ошибки в геометрических доказательствах.

Вып. 12. И. П. Натансон. Суммирование бесконечно малых величин.

Вып. 13. А. И. Маркушевич. Комплексные числа и конформные отображения.

Вып. 14. А. И. Фетисов. О доказательстве в геометрии.

Вып. 15. И. Р. Шафаревич. О решении уравнений высших степеней (метод Штурма).