Популярные лекции

ПО МАТЕМАТИКЕ

Б..Е. МАРГУЛИС

СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ

ФИЗМАТГИЗ »1960

ПОПУЛЯРНЫЕ ЛЕКЦИИ ПО МАТЕМАТИКЕ

ВЫПУСК 34

Б. Е. МАРГУЛИС

СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ

ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ

МОСКВА 1960

АННОТАЦИЯ

В книжке кратко и в популярной форме излагаются те вопросы, связанные с системами уравнений первой степени, которые недостаточно освещаются в школьном курсе алгебры.

Отдельные параграфы книги были предметом тематических занятий математического кружка для школьников при Смоленском педагогическом институте имени К. Маркса.

Книга рассчитана на учащихся старших классов средней школы; отдельные части ее могут быть использованы также учащимися техникумов, студентами младших курсов и учителями средних школ.

СОДЕРЖАНИЕ

Предисловие ........................ 4

§ 1. Почему нужно изучать системы линейных уравнений? . . 5

§ 2. Какие бывают системы?................. 14

§ 3. Метод последовательного исключения.......... 20

§ 4. Общие вопросы исследования систем. Определители ... 37

§ 5. Приближенное решение систем методом последовательных приближений................... 54

§ 6. Приближенное решение несовместных систем...... 69

§ 7. Графическое решение систем линейных уравнений .... 81

Ответы и указания к упражнениям для самостоятельного решения ......................... 92

ПРЕДИСЛОВИЕ

Решение и исследование систем линейных уравнений — одна из тех математических проблем, в которой имеется широкое поле деятельности для всех любителей математики, от семиклассника до академика.

Эта книжка ставит перед собой цель обратить внимание читателя на такие вопросы, касающиеся систем линейных уравнений:

а) Общие методы исследования и решения систем.

б) Практически удобные схемы для точного или приближенного решения систем.

в) Реальный смысл несовместных систем и их приближенное решение.

г) Графическое решение систем и приложения последних к решению некоторых задач науки и техники.

Недостаток места не позволил касаться бесконечных систем и вынудил ограничиться системами уравнений с небольшим числом неизвестных, но методы решения даны в таком виде, что их легко распространить на произвольные системы линейных уравнений.

Изложение отдельных параграфов в большинстве случаев независимо; лишь содержание § 2 следует знать при чтении всего дальнейшего. По этой причине можно параграфы читать в ином порядке и в разное время. По доступности можно параграфы расположить в таком порядке: 2, 3, 7, 1, 5, 4, 6.

Вопросы, требующие более внимательного изучения (хотя и доступные учащемуся средней школы), даны мелким шрифтом: эти вопросы могут быть выпущены при первом чтении.

Автор будет благодарен всем, кто поделится своими замечаниями по этой книжке, и просит направлять эти замечания в I редакцию математической литературы Физматгиза.

§ 1. ПОЧЕМУ НУЖНО ИЗУЧАТЬ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ?

При изучении систем линейных уравнений (уравнений первой степени) в школе учащиеся знакомятся с некоторыми практическими задачами, решение которых требует составления и решения систем; такими являются, например, задачи на составление смесей и сплавов. Мы рассмотрим несколько задач такого типа, взятых из различных отраслей науки и техники. Первой рассмотрим простую алгебраическую задачу.

Задача 1. Найти частное и остаток от деления многочлена 2хъ— Ъх4+2х3 +5х2—7 на трехчлен х2 — 2х+Ъ.

Читателю известно, что эту задачу можно решить делением многочленов; покажем, как это можно сделать, не прибегая к делению. Мы используем известные из элементарной алгебры соотношения между показателями степеней компонент действия деления многочленов: показатель степени частного равен разности между показателями степеней делимого и делителя, показатель степени остатка меньше (по крайней мере на единицу) показателя степени делителя. Для данной задачи получаем: степень частного равна 3 (5 — 2), степень остатка не выше 1 (2—1). Итак, нам здесь известен вид искомых функций, но неизвестны значения числовых коэффициентов (частное — многочлен третьей степени, четыре коэффициента его пока неизвестны; остаток может быть многочленом первой степени, два коэффициента неизвестны).

В тех случаях, когда известен вид функции, но неизвестны входящие в ее аналитическое выражение коэффициенты, очень часто прибегают к методу неопределенных коэффициентов. Этот метод состоит в том, что мы вводим буквенные обозначения для неизвестных коэффициентов; затем, пользуясь условием задачи и существующими между рассматриваемыми величинами тождественными соотношениями,

устанавливаем связи, которые имеются между неизвестными коэффициентами и заданными величинами. Эти связи обычно выражаются в виде уравнения или системы уравнений относительно неизвестных коэффициентов; решая уравнение (или систему), мы находим значения коэффициентов.

Для решения данной задачи запишем частное в виде Ах3 + Вх2+Сх + A а остаток — в виде Ex+F и воспользуемся известным соотношением, связывающим компоненты действия деления: делимое равно сумме произведения делителя на частное и остатка; мы придем к равенству

Это равенство должно выполняться тождественно относительно X, что возможно тогда и только тогда, когда в левой и правой частях его будут совпадать коэффициенты при каждой степени х. Выполняя действия в правой части и приравнивая последовательно коэффициенты при хъ, х4, х39 х2, л: и л:0 (свободные члены), мы придем к такой системе шести уравнений относительно шести неизвестных коэффициентов:

Учащийся легко решит эту систему. Ее решение:

А = 2, В= 1, С = — 2, D = —2t £ = 2, F = — 1.

Отсюда ответ: частное от деления: 2х3+х2 — 2х — 2, остаток: 2х— 1.

Следующая задача относится к механике.

Задача 2. Круглый стол опирается на три ножки, концы которых образуют правильный треугольник и находятся на расстоянии г от центра треугольника. На расстоянии от центра О доски стола в точке D на радиусе, направленном к одной из ножек, помещена гиря весом р кГ. Найти реак-

ции ut V, w опор1). вызываемые этой силой соответственно в ножках Л, В, С (рис. 1).

Для решения задачи используем правила, которые дает механика.

а) Известно, что сила выражается вектором, равным по длине величине силы, направленным по прямой, по которой действует сила, и в ту сторону, куда направлена сила.

Один из законов механики требует, чтобы сумма всех сил, приложенных к телу, находящемуся в равновесии, равнялась нулю (нуль-вектору).

В данном случае все силы направлены по параллельным прямым (вертикально); поэтому их можно характеризовать относительными числами: абсолютным значением числа задать величину силы, знаком — ее направление, а именно, силы, направленные вверх, будем считать положительными, направленные вниз — отрицательными. Исходя из этого условия, следует указанный закон механики записать в таком виде:

u+v+w— р = 0.

б) Моментом силы относительно направленной прямой2) называется относительное число, определяемое такими условиями:

1. Абсолютное значение его равно произведению величины силы на ее плечо, т. е. на расстояние прямой, по которой действует сила, от данной прямой.

2. Если представим себе, что сила, действуя на тело одна, приводит его во вращательное движение относительно данной прямой, то движение может наблюдаться с положительной стороны прямой происходящим либо в направлении часовой стрелки, либо в противоположном направлении; в первом случае принято момент силы считать положительным, во втором — отрицательным.

Рис. 1.

1) Согласно третьему закону Ньютона сила, с которой ножка стола давит на опору (пол), вызывает равное по величине и обратное по направлению противодействие опоры (реакцию опоры).

2) Прямая называется направленной, если на ней указано положительное направление.

Другой закон механики требует, чтобы сумма моментов всех сил, действующих на находящееся в покое тело, относительно любой прямой равнялась нулю.

Применим этот закон дважды: один раз будем вычислять моменты сил относительно прямой OA, проходящей через центр доски и точку D приложения силы р, второй раз — относительно прямой ВС (см. рис. 1). В первом случае моменты сил и и р равны нулю (так как плечо каждой из этих сил равно нулю), момент силы v равен

момент силы w равен

Указанный закон механики приводит в этом случае к уравнению

или

v — w = 0.

Во втором случае моменты сил v и w равны нулю; момент силы р равен

момент силы и равен

Это дает нам возможность составить еще одно уравнение:

Итак, величины сил и% v, w должны удовлетворять системе

(2)

Решая ее, приходим к такому ответу:

В электротехнике может быть поставлена следующая задача.

Задача 3. Дана электрическая цепь, показанная на рис. 2. Электродвижущая сила каждого из источников Ех и Е2 равна 120и, источника Е3 — 240 v. Сопротивления такие:

г1 = гз=19, г2 = 2 2, г4 = г5= 102, г6 = 202.

Найти силу тока на всех участках цепи.

Для решения задачи используем два известных правила Кирхгофа.

1. В любом узле (место соединения проводов) сумма всех токов равна нулю; при этом токам, направленным к узлу, приписывается положительный знак, а токам, направленным от узла, — отрицательный знак.

2. В любом замкнутом контуре алгебраическая сумма электродвижущих сил равна алгебраической сумме произведений сил тока на сопротивления соответствующих участков цепи.

Применим к заданной цепи последовательно оба правила Кирхгофа, учитывая показанные на рис. 2 направления токов и электродвижущих сил. Первое правило, примененное к каждому узлу, дает уравнения:

Узел А: 7t+/2 —/3 = 0,

Узел В: /а — 1Х — /4 = 0,

Узел С: /4 + /5 — /2 = 0,

Узел D: /3 — /5 — /б = 0.

Второе правило, примененное к каждому замкнутому контуру, приводит к уравнениям:

Контур АС BKA: Д — 2/2 — 10/4 = — 120,

Контур ALDCA: 2/2 + /3+10/5= 120,

Рис 2.

Контур BCDMNB: Контур ACDMNBKA: Контур ALDMNBCA: Контур ALDCBKA: Контур ALDMNBKA:

Рассматривая полученные уравнения совместно, приходим к следующей системе 11 уравнений, содержащей шесть неизвестных:

(3)

Хотя число уравнений здесь превышает число неизвестных, легко убедиться в том, что эта система имеет решение. Для этого выберем из числа 11 уравнений систему шести уравнений, например составленную из уравнений с порядковыми номерами 1, 2, 3, 5, 6, 7, и решим ее известными из элементарной алгебры способами. Тогда получим такое решение укороченной системы:

Л = 2, /2=16, /3=18, /4 = 9, /6 = 7. /б=11.

Непосредственной подстановкой этих значений в уравнения системы (3) убеждаемся в том, что они образуют решение этой системы. Итак, поставленная задача имеет такое решение: /1 = 2Л, /2=16Л, /3== 18Л, /4 = 9Л, /6 = 7Л, 1е=ПА.

В дальнейшем (§ 4, стр. 38) будет выяснена причина того, что система, у которой число уравнений превышает число

неизвестных, имеет в данном случае решение; там же будет указано на физическое истолкование этого обстоятельства.

Рассмотрим старинную китайскую задачу-фокус, относящуюся к арифметике.

Задача 4. Ведущий игру предлагает кому-либо задумать целое число, затем разделить его последовательно на 3, 5, 7 и сообщить остатки от деления. По этим остаткам ведущий должен отгадать задуманное число. Как он может это сделать?

Обозначим задуманное число через х, неизвестные частные от деления его на 3, 5, 7 соответственно через и, v9 w и известные остатки от деления соответственно через a, bt с. Так как в каждом случае деления делимое равно сумме произведения делителя на частное и остатка, то условия задачи приводят к системе

(4)

Система содержит 4 неизвестных и только 3 уравнения. Очевидно, что для получения ее решения достаточно одному из неизвестных приписать произвольное значение, после чего каждое из уравнений системы позволит найти еще по одному неизвестному. Система имеет, таким образом, бесконечно много решений. Однако не всякое решение системы будет также удовлетворять и условиям задачи: ведь по смыслу все 4 неизвестных должны иметь целые значения. Чтобы выделить те решения системы, которые удовлетворяют также этому требованию задачи, исключим х один раз из первых двух уравнений системы, второй раз из последних двух уравнений и в обоих случаях выразим неизвестные через v:

Числа и и v — целые; из первого уравнения можно заключить, что выражение

должно также быть целым.

Пусть

тогда t> = 3s— a+b и второе уравнение дает для w выражение

Так как w, s и b — числа целые, то и выражение

должно быть целым; пусть

Тогда, выражая последовательно через t числа s, v и х, находим:

Ответ получен: х = 7Qa+2\b+ 15с+105£ (t— произвольное целое число). Итак, задача имеет все же бесконечно много решений. Следует, однако, отметить, что если на задумываемое число наложить ограничение, чтобы оно было положительным и не имело более двух цифр, то в этом случае задача будет иметь единственное решение; так, при а = 2, é = 3, с = 5 находим:

В заключение рассмотрим еще одну задачу из теории теплоты, принадлежащую к очень распространенному в физике типу задач.

Задача 5. Известно, что удельная теплоемкость воды непостоянна и при постоянном давлении является функцией от температуры воды. Если принять удельную теплоемкость воды при 15° С за единицу, то для других температур при постоянном давлении опыты дают значения удельной теплоемкости, приведенные в следующей таблице:

Температура t (в градусах С)

35

50

65

80

90

100

Удельная теплоемкость с (в кал/г • град)

0,9982

0,9988

1,0002

1,0025

1,0046

1,0072

Требуется подобрать формулу возможно более простого вида, для которой перечисленные в таблице пары значений температуры t и удельной теплоемкости с были бы соответственными парами значений аргумента и функции.

Заметим, что формулы, устанавливаемые на основании данных опыта, называются эмпирическими.

Решение задачи начнем с того, что построим в прямоугольной системе координат точки, координаты которых равны соответственно значениям температуры / и удельной теплоемкости с. Соединяя эти точки плавной кривой (рис. 3), мы получим кривую, приближенно выражающую графически указанную функциональную зависимость. Но эта кривая по форме близка к параболе с вертикальной осью, уравнение которой имеет следующий общий вид:

с = pt2+qt+r.

Проверим, нельзя ли определить коэффициенты р, q% г (вспомните метод неопределенных коэффициентов, примененный к решению задачи 1) так, чтобы эта формула отображала искомую зависимость, т. е. при заданных в таблице значениях температуры принимала бы значения теплоемкости, совпадающие с полученными из опыта. Но для этого необходимо, чтобы приведенные в таблице пары значений / и с удовлетворяли предполагаемой формуле; подставляя их в формулу, мы получаем для трех неизвестных коэффициентов такую систему шести уравнений:

(5)

Рис. 3.

Если мы попытаемся решить эту систему так же, как была решена система (3), то нам это не удастся; так, например, решая систему, состоящую из последних трех уравнений (5), мы для неизвестных получим значения /? = 0,0000025, <7 = — 0,000215, г= 1,0037, не удовлетворяющие остальным уравнениям системы (5). Полученная система оказалась противоречивой, она не имеет решений.

В § 6 будет введено понятие приближенного решения системы и будет показано, как приближенно решаются противоречивые системы; на стр. 72 и 77 будут даны два приближенных решения системы (5). Здесь отметим лишь, что приближенное решение противоречивых систем сводится к точному решению некоторых специальным образом построенных систем.

Ограничиваясь приведенными выше задачами, отметим еще, что к решению систем линейных уравнений сводятся такие группы задач:

а) Задачи механики, связанные с расчетом фундаментов, колонн, арок, мостов и других сооружений.

б) Задачи из геодезии, связанные с построением карт на основании данных геодезической съемки; получающиеся здесь системы содержат большое число неизвестных, исчисляющееся часто сотнями.

в) Системы линейных уравнений — основной аппарат при нахождении значений коэффициентов в эмпирических формулах.

г) Задачи приближенного решения уравнений, имеющих большое распространение в высшей математике.

д) Системы линейных уравнений широко используются в новейших областях физики и смежных с ней наук: теории относительности, атомной физике, при составлении прогнозов погоды.

Перечисленные задачи не исчерпывают всех случаев использования систем линейных уравнений, но обнаруживают, насколько часто сталкиваются при решении задач математики и естествознания с необходимостью исследовать и точно или приближенно решить систему линейных уравнений. Вот почему будущим специалистам многих профессий следует ознакомиться с элементами теории систем линейных уравнений.

§ 2. КАКИЕ БЫВАЮТ СИСТЕМЫ?

Остановимся на основных определениях и обозначениях, которыми мы будем пользоваться в дальнейшем изложении.

Мы не станем приводить здесь определений уравнения, системы уравнений, системы линейных уравнений (уравнений

первой степени), считая, что читатель знает их из курса элементарной алгебры. Условимся лишь в дальнейшем системы линейных алгебраических уравнений именовать для краткости одним словом «системы».

1. Системы различаются по числу уравнений и числу неизвестных. Прежде всего, нужно отметить, что совсем не обязательно, чтобы число уравнений m совпадало с числом неизвестных п% как это иногда ошибочно заключают из курса элементарной алгебры. Наряду с системами, в которых выполняется равенство т = п, возможны системы, в которых может иметь место любое из неравенств m > п (например, в системах задач 3 и 5) или т<я (например, в системе задачи 4). В том частном случае, когда имеет место равенство m = п, мы это общее значение будем называть порядком системы. В средней школе основное внимание уделяется системам второго и третьего порядков; в этой книжке наряду с такими системами будут также встречаться системы более высоких порядков, произвольного порядка п% и системы, в которых тфп.

2. Условимся о записи систем в общем виде. Системы с небольшим конкретным числом неизвестных (2, 3, 4 и т. д.) будем записывать, как в элементарной алгебре: неизвестные будем обозначать последними буквами латинского алфавита (х, у, z% и, v, w); коэффициенты при неизвестных и свободные члены — первыми буквами того же алфавита (a, b% с9 d, е), причем каждую из них будем снабжать внизу цифрой (указателем или индексом), показывающей номер уравнения, в которое входит этот коэффициент или свободный член. Так, системы второго и третьего порядков согласно этому условию записываются в виде:

(6)

(7)

В случае систем с произвольным числом неизвестных п такая система обозначений становится неудобной, так как трудно с помощью букв выразить, что число неизвестных равно точно п, что такое-то неизвестное занимает в уравнении первое, второе и т. д. место. В этом случае удобнее

применить двухиндексную систему обозначений, принятую в высшей алгебре. Неизвестные обозначим одной и той же буквой (обычно х)% которую снабдим индексом, указывающим номер неизвестной в уравнениях системы. Свободные члены обозначим одной и той же буквой, снабженной индексом, который должен указать номер уравнения, в которое входит соответствующий свободный член. Наконец, коэффициенты при неизвестных также обозначим одной и той же буквой (а, Ь, с)% снабженной двумя индексами, из которых первый должен указать на номер уравнения, а второй — на номер неизвестного, при котором находится данный коэффициент. В соответствии с этими условиями система произвольного порядка п записывается в общем виде так:

(8)

а система m уравнений с п неизвестными:

(9)

3. Перейдем к понятию решения системы.

Решением системы называется такая совокупность значений неизвестных, входящих в данную систему, которая, будучи подставлена вместо неизвестных в уравнения системы, обращает каждое из них в числовое равенство (или тождество, если уравнения содержат буквенные выражения, которые считаются известными). Нужно при этом помнить, что хотя в совокупность значений неизвестных, дающую решение системы, входит столько чисел (выражений), сколько имеется неизвестных (п 2), но такая совокупность принимается за одно решение; так, например, система чисел х = 2, у = —1, z = 4 является решением (одним!) системы

Другим решением этой системы будет система чисел х = 3, у = Ъ, z = — 7.

Очень важна классификация систем по количеству имеющихся у них решений. Из элементарной алгебры уже известно, и задачи § 1 подтверждают это, что система может иметь единственное решение (например, системы задач 1, 2, 3), может иметь более одного решения (например, система задачи 4), но может также не иметь ни одного решения (например, система задачи 5). Так как других случаев вообще не может быть, то приходим к такой классификации систем по количеству решений:

а) системы, имеющие одно и только одно решение; такие системы будем дальше называть определенными;

б) системы, не имеющие ни одного решения; такие системы будем дальше называть противоречивыми или несовместными;

в) системы, имеющие более одного решения; такие системы будем называть неопределенными. Дальше мы увидим, что всякая неопределенная система имеет бесконечно много решений.

Системы определенные и неопределенные носят также общее название совместных систем. Всякая совместная система имеет по крайней мере одно решение.

Для практики наиболее важны определенные системы. Но если система не является определенной, то этому могут быть две причины: либо она вообще не имеет решений, либо она имеет более одного решения; нужно уметь установить, какая из этих причин имеет место.

Напомним еще важное определение равносильности систем. Две системы называются равносильными или эквивалентными, если любое решение первой системы является также решением второй системы и, обратно, всякое решение второй системы будет также решением первой системы. Если мы в ходе решения системы как-либо преобразуем ее, то только в том случае можно за решение исходной системы принять решение преобразованной системы, когда эти системы равносильны; в противном случае следует решения преобразованной системы подвергнуть проверке путем подстановки их в исходную систему.

4. В заключение обратим внимание на два специальных вида систем, с которыми дальше придется встречаться.

Если в системе все свободные члены равны нулю, то система называется однородной. Особенность такой системы

состоит в том, что она всегда совместна, так как ей безусловно удовлетворяет решение, состоящее из нулевых значений неизвестных; это очевидное решение кратко называют нулевым. Если однородная система — определенная, то нулевое решение является единственным ее решением; если же однородная система — неопределенная, то она наряду с нулевым содержит также по крайней мере еще одно ненулевое решение (т. е. такое решение, которое имеет в своем составе хотя бы одно число, отличное от нуля). На практике, как правило, представляют интерес именно ненулевые решения однородных систем.

б. Пусть мы в каждом уравнении системы выделили то неизвестное, номер которого совпадает с номером уравнения в системе (например, в системе (7) х в первом уравнении, у — во втором, z — в третьем). Выделенные неизвестные назовем диагональными неизвестными, а стоящие перед ними коэффициенты — диагональными коэффициентами. Так, например, в системе (1) все диагональные коэффициенты равны единице, в системе (8) диагональными будут коэффициенты, у которых оба индекса совпадают (аи, а22, .... апп). Ясно, что состав диагональных коэффициентов зависит от порядка следования неизвестных в уравнениях и от порядка следования уравнений в системе, причем первый предполагается одинаковым во всех уравнениях.

Если уравнения и неизвестные в системе можно расположить таким образом, чтобы в каждом уравнении все коэффициенты при неизвестных, находящиеся левее диагонального коэффициента этого уравнения, оказались равными нулю, то говорят, что система имеет треугольную форму. Так, треугольную форму имеет система (1), ибо ее можно записать так:

Здесь жирным шрифтом напечатаны те нули, которые определяют треугольную форму системы.

Примечание. Если число уравнений не превышает числа неизвестных, то система будет диагональной формы и в том случае, когда нулю равны все коэффициенты, находящиеся правее диагональных, так как за счет изменения порядка следования уравнений и неизвестных можно такую систему представить в виде, указанном в определении диагональной формы; такое видоизменение системы выше выполнено над системой (1).

В дальнейшем нам надо будет различать две разновидности треугольной формы: точную и вырожденную. Треугольная форма называется точной, если т = п (т — число уравнений, п — число неизвестных) и если все диагональные коэффициенты отличны от нуля; точную диагональную форму имеет, например, система (1). Треугольная форма называется вырожденной, если m Ф п или если т = п и хотя бы один из диагональных коэффициентов равен нулю. Ниже приведены примеры систем вырожденной треугольной формы:

Следует обратить внимание на то, что в системе вырожденной треугольной формы, у которой m > п, все коэффициенты при неизвестных в уравнениях, номер которых выше п, должны быть нулями (как находящиеся левее диагонального коэффициента, который можно считать существующим и равным нулю). Этот случай иллюстрирует последний из приведенных выше примеров.

Значение понятия системы треугольной формы будет выяснено в § 3.

§ 3. МЕТОД ПОСЛЕДОВАТЕЛЬНОГО ИСКЛЮЧЕНИЯ

1. В элементарной алгебре обычно излагают два способа решения систем линейных уравнений: способ подстановки и способ алгебраического сложения (или уравнивания коэффициентов). В применении к системам второго порядка эти способы состоят в следующем.

а) Пусть система задана в общем виде (6). Очевидно, что хотя бы один из коэффициентов при X не равен нулю (иначе система не содержала бы х); пусть для определенности ах Ф 0 (в случае ах = О и а2 Ф 0 мы могли бы поменять местами уравнения). Тогда можно выразить из первого уравнения х через у

и подставить это выражение во второе уравнение; в результате получим уравнение относительно у:

Подстановка позволила исключить одно неизвестное, уменьшить число неизвестных в одном уравнении на единицу. В исключении неизвестного и заключается смысл способа подстановки. В результате подстановки мы вместо системы (6) получаем другую систему:

(10)

где

Система (10) имеет треугольную форму (см. § 2, п. 5). Решить ее легко: при

Ь3ф0

находим из второго уравнения у, после чего из первого определяется х и система оказывается определенной; если

b3 = d3 = 0,

то значение у может быть взято произвольно, а значение х находим, как выше, и система оказывается неопределенной; в случае

£3 = 0 и аъфЪ

второму уравнению, а с ним и всей системе (10) не может удовлетворять никакое значение у, система оказывается несовместной. Так как системы (6) и (10) равносильны (это можно было бы проверить непосредственно; дальше, в п. 3, это будет доказано для систем произвольного вида), то сделанные только что выводы о решениях системы (10) относятся также к системе (6).

б) По способу алгебраического сложения мы добиваемся того, чтобы коэффициенты при одном из неизвестных оказались равными по абсолютной величине; тогда сложением или вычитанием уравнений исключают это неизвестное. Практически можно поступить так: считая, что агФ0 и а2Ф0 (в противном случае незачем было бы исключать неизвестное), мы в системе вида (6) первое уравнение умножаем на —а2, второе— на аи после чего уравнения почленно складываем; получим:

(значения Ь3 и dz определены выше). Решение системы (6) снова сводится к решению системы (10) треугольной формы.

Таким образом, смысл способа алгебраического сложения тоже заключается в исключении неизвестного и в приведении системы к треугольному виду. Отсюда можно заключить, что, по существу, мы имеем дело не с двумя различными способами решения систем, а с двумя разновидностями одного и того же способа исключения неизвестных. В элементарной алгебре этот способ обобщается на системы третьего и более высоких порядков; подробно мы на этом не будем останавливаться. Отметим лишь, что если порядок системы выше двух, то приходится исключать более одного неизвестного, что последовательно и выполняется. Мы дальше рассмотрим способ последовательного исключения в общем виде, для систем произвольного вида (9).

2. Произвольные системы, по аналогии со случаем системы второго порядка, мы будем также решать в два этапа:

а) данную систему заменяем системой треугольной формы, равносильной данной системе;

б) исследуем полученную систему треугольной формы и в случае совместности ее находим решение этой системы.

Рассмотрим последовательно каждый из этих этапов.

3. Покажем, как можно произвольную систему вида (9) заменить системой треугольной формы, равносильной данной. Очевидно, что среди коэффициентов ап, а21, ат1 при xt в уравнениях системы должен быть хотя бы один, не равный нулю, иначе система не содержала бы хх. Мы можем, не ограничивая общности рассуждений, предположить, что ап Ф О, так как этого можно всегда добиться за счет перестановки уравнений (первым поставить уравнение, у которого коэффициент при не равен нулю). Условие ап Ф О позволяет выразить из первого уравнения хх через остальные неизвестные:

Подставляя это выражение для х{ в остальные m—1 уравнений системы (9), мы преобразуем эти уравнения к такому виду:

(11)

Заметим, что формулы (11) сохраняют силу и в том случае, когда некоторое уравнение системы (9) не содержит xlt т. е. когда фактически в это уравнение xt не подставляется; так, если д21 = 0, то из (11) устанавливаем, что в этом случае коэффициенты второго уравнения системы (9) не меняются:

Итак, независимо от того, будут ли коэффициенты при х1 в остальных уравнениях нулями или отличными от нуля, мы можем оставить хх только в первом уравнении, а из остальных уравнений системы (9) исключить хг, после чего придем к системе вида

(12)

где новые значения коэффициентов и свободных членов даны в (11).

Докажем, что системы (9) и (12) равносильны. Пусть система чисел

Х\ = аь х2 = а2» • • •» хп = ап

является решением системы (9), т. е. пусть выполняются равенства

С помощью рассуждений, аналогичных тем, которые выше приведены для уравнений системы (9), мы легко устанавливаем, что указанные там тождественные преобразования приведут нас к равенствам

из которых следует, что совокупность чисел Х\ = аь х2 = «2» • .... хп = ап осуществляет также решение системы (12). Пусть, обратно, система чисел

дает решение системы (12), т. е. пусть выполняются равенства (значения новых коэффициентов заменяем по формулам (11))

Первое равенство показывает, что указанная система чисел удовлетворяет первому уравнению системы (9); покажем, что она удовлетворяет также каждому из остальных уравнений системы. Если какой-либо из коэффициентов а2\, Дяь .... ат\ равен нулю, то для содержащего этот коэффициент уравнения требуемое утверждение становится очевидным (вторые слагаемые в выражениях новых коэффициентов обращаются в нуль). Допустим, что некоторый из этих коэффициентов не равен нулю, например До. Ф 0. Учитывая, что h а\\ Ф 0, умножаем обе части первого равенства на ~L и почленно складываем его со вторым; в результате получаем равенство

подтверждающее, что система чисел ху = ßi, х2 = ?о» • • •» хт = ßm удовлетворяет второму уравнению системы (9). Аналогично устанавливается, что эта система чисел удовлетворяет остальным уравнениям (9).

Возвращаясь к задаче приведения системы (9) к треугольному виду, рассмотрим систему уравнений, которая получится, если из системы (12) удалить первое уравнение. Она отличается от системы (9) такими особенностями:

а) число уравнений и число неизвестных уменьшились на единицу;

б) нельзя быть уверенным в том, что в этой системе найдется хотя бы один коэффициент при каком-либо неизвестном, отличный от нуля. Что это так, можно убедиться на примере следующей системы:

в которой после исключения х все коэффициенты при неизвестных оказываются нулями (вместе с х исключаются все неизвестные).

Если среди коэффициентов при неизвестных найдется хотя бы один, отличный от нуля, то путем перестановки уравнений и неизвестных можно этот коэффициент поместить на место коэффициента Ь22 и, повторно применив приведенные выше рассуждения, добиться дальнейшего уменьшения числа уравнений. Если же в полученной системе все коэффициенты при неизвестных равны нулю, то система (12) уже будет иметь треугольную форму (вырожденную; см. § 2, п. 5).

Повторив этот процесс достаточное число раз (которое не больше меньшего из чисел m—1 или п) и собрав в систему первые уравнения рассматривавшихся на каждом этапе систем, а также уравнение (или уравнения), полученное на последнем этапе, мы получим систему треугольной формы, равносильную заданной системе (9). Здесь описан общий метод приведения системы к треугольной форме, который может быть применен к любой системе. Однако при приведении конкретных систем треугольная форма может быть получена иногда при меньшем числе этапов преобразования. Примеры приведения систем к треугольному виду будут даны в конце параграфа.

4. Перейдем ко второму этапу решения системы общего вида (9) — исследованию системы (т. е. установлению ее совместности и количества имеющихся у нее решений) и нахождению ее решений. Обе эти задачи решаются для системы треугольной формы, равносильной заданной системе. В зависимости от того, к какой системе треугольной формы сводится данная система, здесь могут быть такие случаи:

а) Система имеет точную треугольную форму (см. § 2, п. 5). Тогда мы из последнего уравнения, содержащего только одно неизвестное с отличным от нуля коэффициентом, находим это неизвестное; затем, подставив найденное значение в предпоследнее уравнение, находим еще одно неизвестное и т. д. Так, переходя каждый раз от решенного уравнения к соседнему и подставляя значения всех ранее найденных неизвестных, мы каждый раз будем получать уравнение с одним неизвестным, коэффициент при котором отличен от нуля; по этой причине все уравнения окажутся разрешимыми, причем имеющими единственное решение. Система в этом случае оказывается определенной. По такому принципу решается система (1), система задачи 10 (стр. 34).

Примечание. Если в системе равны нулю коэффициенты, расположенные правее диагональных (как, например, в системе (1)), то для ее решения незачем видоизменять ее; следует решать систему по указанному выше принципу, но начинать с первого уравнения и постепенно перемещаться к последнему уравнению.

б) Система, у которой число уравнений m совпадает с числом неизвестных я, имеет вырожденную треугольную форму. Это означает, что по крайней мере в последнем из уравнений системы диагональный коэффициент равен нулю, и следовательно, это

уравнение примет после упрощений либо вид

o.*„=i,

либо вид

о.*я = о.

Уравнению первого вида не может удовлетворить никакое значение хп% что говорит об отсутствии решения у этого уравнения, а следовательно, и у всей системы; система в этом случае противоречива (несовместна). Уравнению второго вида удовлетворяет любое значение хп. Если все те уравнения системы, которые имеют нулевые диагональные коэффициенты, приводятся к уравнениям вида 0 • хк = О, то система в этом случае совместна и неопределенна, причем она имеет бесконечно много решений (так как одному или нескольким неизвестным можно приписать какие угодно значения).

Задача 6. Исследовать систему (а — некоторое заданное число)

Согласно общей теории мы обязаны поступить так: после исключения х из последних двух уравнений получается следующая система:

Эта система уже имеет треугольную форму. Но для иллюстрации общей теории выполним дальнейшие преобразования. Так как у последних двух уравнений имеются отличные от нуля коэффициенты при неизвестных, то, меняя местами члены с у и «г, получим, систему

Исключая из последнего уравнения этой системы z, получим следующую систему треугольной формы:

Отсюда ясно, что при любом а Ф — 1 последнее уравнение не может быть удовлетворено ни при каком значении у, система при а Ф — 1

несовместна. Если же а = — 1, то это уравнение имеет вид 0-у = О, значение у может быть взято произвольно. Система при а = — 1 неопределенна; ее решение в этом случае можно записать так: X = — 3/?, у — р, z = — 1 (р — произвольно).

в) Система характеризуется условием m < я (m — число уравнений, п — число неизвестных). Этот случай отличается от рассмотренных только тем, что имеется п — m «избыточных» неизвестных. Если все диагональные коэффициенты отличны от нуля, то система решается, как в случае а), с той лишь разницей, что «избыточным» неизвестным приписываются произвольные значения. Если среди диагональных коэффициентов имеются нули, то система исследуется и решается, как в случае б), причем в случае совместности системы «избыточным» неизвестным опять приписываются произвольные значения. В рассматриваемом случае система может быть либо несовместной, либо неопределенной.

Примечание. Следует обратить внимание на то, что треугольная форма системы в случае m < п существенно зависит от порядка следования неизвестных. Наиболее удобно исследовать систему, если приведение ее к треугольному виду проводить в точном соответствии с методом, изложенным в общем виде в п. 3.

Задача 7. Исследовать систему (a, b— заданные числа)

Приводя систему к треугольному виду так, как предложено это делать в п. 3, приходим к такой системе треугольной формы:

Здесь в зависимости от значений a, b могут быть такие случаи:

1) а Ф 0, b — любое. Система совместна, неопределенна; ее решения:

где р — произвольно.

2) а = 0, 4 — 2b Ф 0(ô ==£ 2). Последнее уравнение не имеет решения. Система несовместна.

3) а 5= 0. 4 — 2£ = 0 (6 = 2). Последнее уравнение имеет вид 0«/ = 0, ему удовлетворяет любое значение t. Так как значение г («избыточного» неизвестного) можно также взять произвольно, то система неопределенна и имеет такие решения (р, q — произвольны):

г) Система характеризуется условием m>n. Такая система отличается от рассмотренных в а), б) только тем, что она содержите — п «избыточных» уравнений. После приведения системы к треугольному виду во всех «избыточных» уравнениях все коэффициенты при неизвестных должны равняться нулю (стр. 19). Если среди «избыточных» уравнений имеется хотя бы одно, левая часть которого есть нуль, а правая часть отлична от нуля, то система несовместна. Если же все они имеют вид тождеств 0-д:А = 0, то они могут быть отброшены, а оставшуюся систему п уравнений нужно исследовать так, как в случаях а) или б). Система может в этом случае принадлежать к любому из трех видов: быть определенной, неопределенной, несовместной.

Задача 8. Исследовать систему (a, b — заданные числа)

Исключая X из последних двух уравнений, получаем такую систему треугольной формы:

Здесь в зависимости от значений a, b могут быть такие случаи:

1) b — 4фО(Ьф4). Последнему уравнению нельзя удовлетворить, система несовместна.

2) b — 4 = 0, а + 9 Ф 0 или b = 4,. а Ф — 9. Последнее уравнение выполняется тождественно, его можно отбросить. Остальные два сравнения дают нам единственное решение системы: у = 0,

3) b — 4 = 0, fl+9 = 0 или b = 4, а = — 9. Последние два уравнения выполняются тождественно. Система совместна и неопределенна, значение у можно взять произвольно, например у = р. Тогда решение системы можно записать в виде х = 2 + 3/?, у = р (р—произвольно).

Рассмотрим еще одну задачу на исследование системы.

Задача 9. Исследовать систему (а — заданное число).

Систему треугольной формы, равносильную данной, здесь легко построить таким образом. Неизвестные дг, у, z одновременно исключаются, если из последнего уравнения, обе части которого умножены на а + 2, вычесть почленно сумму остальных трех уравнений. Неизвестные X и у одновременно исключаются, если из третьего уравнения почленно вычесть последнее; х удобно исключить, вычитая из второго уравнения последнее (исключается также z). Включая еще в систему треугольной формы последнее уравнение (первое нельзя включать, так как коэффициент при х может здесь оказаться нулем), мы получим систему треугольной формы в таком виде:

Здесь в зависимости от значения а возможны такие случаи: 1) а ф 1, аф—3. Все диагональные коэффициенты отличны от нуля, система — определенная. Решение ее можно записать в виде

2) д = — 3. В последнем уравнении коэффициент при t — нуль, свободный член отличен от нуля. Система противоречива.

3) а=»1. Все диагональные коэффициенты и свободные члены в последних трех уравнениях равны нулю. Система совместна, но неопределенна, так как неизвестным у, г и t можно приписать произвольные значения. Решения системы можно записать в виде

^ — 1 — р — q — г, У = р, z = q, t = г, где р, q, г —произвольны.

б. Изложенное выше исчерпывает вопрос о решении систем методом последовательного исключения. Однако при практическом решении систем, особенно при приведении систем к треугольному виду, важно уменьшить, насколько это возможно, число промежуточных действий (вычислений), а также количество записей промежуточных результатов. Практику-вычислителю незачем также при решении каждой системы вникать в смысл всех промежуточных действий и записей; на это требуются дополнительные усилия и время. Поэтому еще полтора века тому назад один из крупнейших немецких

Система треугольной формы:

математиков Карл-Фридрих Гаусс (1777—1855) предложил наиболее громоздкий этап решения системы — приведение ее к треугольному виду — осуществлять с помощью практически удобной схемы или таблицы, в определенные места которой записываются в определенном порядке данные величины, промежуточные результаты и окончательные результаты. С тех пор предложено много таких схем; их принято называть схемами Гаусса. Одна из таких схем приведения системы к треугольному виду дана на стр. 30—31. Существенным отличием ее от схем, используемых на практике, является отсутствие в этой схеме контроля правильности вычислений, очень важного в случае большого количества вычислений.

На стр. 30—31 приведена схема для решения систем пятого порядка. Если система имеет меньший порядок, то заполнение схемы следует начать не с первой таблицы, а со второй (в случае системы четвертого порядка) или с третьей (если система третьего порядка). Для решения систем более высокого порядка необходимо схему дополнить в начале соответствующими таблицами, которые имеют такое же строение, как и приведенные, но содержат больше строк и столбцов.

Подробно описывать схему нет надобности. Учиться пользоваться схемой можно по самой этой схеме. Рекомендуемый порядок заполнения клеток схемы указан при помощи порядковых номеров, которые помещены в начале каждой клетки и напечатаны жирным шрифтом. После порядкового номера в каждой из первых тридцати клеток указано, какую из заданных величин следует там поместить (например, в клетку № 28 нужно записать свободный член третьего уравнения). В последующих клетках схемы после порядкового номера указано то действие над ранее записанными величинами, результат которого следует записать в данную клетку (например, запись в клетке № 77: —64 : 56 означает, что в эту клетку нужно записать взятое с обратным знаком частное от деления числа, записанного в клетке № 64, на число, записанное в клетке № 56).

Сделаем еще некоторые замечания, касающиеся практического использования схемы.

Расстановка порядковых номеров в схеме предполагает, что порядок следования уравнений и неизвестных сохраняется постоянным. На самом же деле его необходимо менять, если число, которое нужно записать в левом верхнем углу каждой таблицы (в клетки №№ 1, 56, 92, 113), оказывается равным нулю. Его также целесообразно менять так, чтобы в указан-

ных клетках оказались числа наиболее простого вида (целые, небольшие по абсолютной величине; лучше всего, если это будет единица с любым знаком). Для заполнения схемы порядок следования уравнений не имеет никакого значения, а порядок следования неизвестных в случае его нарушения при переходе к новой таблице надо отмечать в верхней строке этой таблицы (не имеющей номеров). Следует еще заметить, что в случае изменения порядка следования уравнений клетки №№ 1—30 и соответствующие им клетки в других таблицах (куда записываются коэффициенты во вновь полученной системе) удобнее заполнять не столбцами (по неизвестным), как это предусмотрено в схеме, а строками (по уравнениям).

Для упрощения вычислений можно также все числа одной и той же строки умножить (или разделить) на одно и то же число, отличное от нуля, так как это соответствует умножению на это число всех членов некоторого уравнения.

Чтобы после заполнения схемы получить систему треугольной формы, следует из каждой таблицы схемы выписать по одному уравнению. Обычно выписывают первые уравнения, но это не обязательно. На стр. 30 выписана система треугольной формы, составленная из первых уравнений каждой таблицы; в этой системе перед неизвестными и в правых частях в скобках указаны номера клеток, из которых надо выписать соответствующие коэффициенты или свободные члены. Для завершения решения данной системы вида (8) и (9) остается решить получаемую из схемы систему треугольной формы или установить ее несовместность; об этом подробно было рассказано в п. 4.

Рассмотрим на двух задачах практические детали в решении систем методом последовательного исключения по схеме Гаусса.

Задача 10. Решить систему

Приведение системы к треугольному виду осуществляем по схеме, данной на стр. 30—31; заполненная схема решения этой задачи помещена на стр. 34. При составлении схемы нами допущены такие отступления от схемы стр. 30—31: в первой таблице поменяли местами

Система треугольной формы:

Ее решение:

первые два уравнения, во второй таблице на первое место поставили неизвестное jc5, в третьей таблице это место занимает неизвестное лг4 (коэффициент 13 — наименьший по абсолютной величине среди коэффициентов при неизвестных во вновь получаемой системе), верхние строки таблицы 4 умножены на 13, в последней таблице произведено сокращение на коэффициент при х.л.

На той же стр. 34 выписана получаемая из схемы система треугольной формы и дано ее решение; его можно найти, как указано в п. 4.

Рассмотренная задача иллюстрирует случай определенной системы.

Задача 11. Решить систему

Независимо от того, что здесь число уравнений не совпадает с числом неизвестных, мы приводим систему к треугольному виду по той же схеме стр. 30—31, сокращая лишь число столбцов в каждой таблице на единицу. Заполненная схема решения этой задачи дана на стр. 36. При заполнении схемы сделаны такие отступления от схемы стр. 30—31: в первой таблице на первое место поставлено неизвестное х3, во второй таблице последнее уравнение записано первым, остальные уравнения сдвинуты вниз, в третьей таблице произведено сокращение чисел каждой строки соответственно на 6, — 2" и "2" *

В последней таблице имеются две строки, сплошь заполненные нулями. Это говорит о том, что система совместна и что неизвестному х± можно приписать произвольное значение, например лг4 == т. Переходя затем к третьему, второму и первому уравнениям системы треугольной формы, мы последовательно выражаем через m остальные неизвестные. Решение системы приведено на стр. 36; там же даны три решения системы, получаемых при конкретных, указываемых там, значениях т\ разумеется, что таких решений можно построить сколько угодно.

Рассмотренная задача иллюстрирует случай неопределенной системы.

УПРАЖНЕНИЯ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ

1. Решить систему методом последовательного исключения:

Система треугольной формы:

Ее решение:

2. Решить систему методом последовательного исключения:

3. Методом последовательного исключения решить систему шестого порядка, полученную в задаче 3 (стр. 10, уравнения с номерами 1, 2, 3, 5, 6, 7).

4. Решить методом последовательного исключения систему, получаемую при решении задачи 5 (стр. 78).

5. Решить методом последовательного исключения систему:

6. Имеет ли решение система

7. Исследовать систему и найти ее решения:

§ 4. ОБЩИЕ ВОПРОСЫ ИССЛЕДОВАНИЯ СИСТЕМ, ОПРЕДЕЛИТЕЛИ

Выше уже отмечалось, что системы могут быть определенными, неопределенными и несовместными. Займемся выяснением причин, обусловливающих принадлежность системы к каждому из этих трех основных классов.

Сначала обратим внимание на следующий известный факт. При решении систем часто приходится либо умножать обе части уравнения на один и тот же множитель, либо почленно складывать уравнения, либо последовательно выполнять обе эти операции. Условимся всякое уравнение, которое можно получить из данных уравнений умножением обеих частей каждого из них на некоторый множитель и последующим почленным сложением их, называть линейной комбинацией

данных уравнений, линейную комбинацию уравнений будем обозначать в виде

МП+М2] + гз[31-г- ... +сп[п).

Эта запись выражает следующее: обе части первого уравнения умножены на сх% второго — на с2, третьего — на с3 и т. д., с номером п — на ctv после чего все п уравнений почленно сложены. Для задачи исследования и решения системы исключительно важно утверждение, которым мы уже в прошлом систематически пользовались и которое обосновывается известными свойствами равенств, а именно: если система чисел удовлетворяет каждому из данных уравнений, то она удовлетворит также любой линейной комбинации этих уравнений.

Имея в виду это замечание, рассмотрим внимательнее системы, полученные при решении некоторых задач §§ 1 и 3.

I. Начнем с системы (3). Нам удалось найти решение этой системы 11 уравнений с 6 неизвестными после того, как были отброшены 5 уравнений и решена оставшаяся система шестого порядка. Какую же особенность имели отброшенные уравнения, почему можно было решать систему, не принимая их во внимание?

Нетрудно проверить, что каждое из отброшенных уравнений является линейной комбинацией оставленных шести уравнений; так,

[4J = —Ш —[2] — [31 + 0 - [5] + 0 . [6] + 0 . [7]

или проще

[4] = -[1]-[2]-[3].

Здесь знак равенства указывает на то, что у уравнения, записанного слева своим порядковым номером в системе, и у линейной комбинации уравнений, указанной справа, совпадают как левые части (члены с неизвестными), так и правые части (свободные члены). Аналогично

[8] = [5J+10. [7], [91 = [61+10. [7].

[101 = 151 +|6Ь

[Щ = [51 + [61 + 10. [71.

Сделанное выше замечание объясняет причину того, что можно было при решении системы отбросить пять уравнений. Так как все отброшенные уравнения являются линейными

комбинациями шести оставленных уравнений, то им заведомо удовлетворит любое решение оставшейся системы. В нашем случае оставшаяся система шести уравнений оказалась определенной, поэтому и система (3) — определенная. Отсюда получаем такой практический вывод: если некоторое уравнение системы является линейной комбинацией других уравнений, то такое уравнение можно отбросить и при решении системы не учитывать.

Установленная выше зависимость между уравнениями системы (3) не случайна и находит простое физическое истолкование. Действительно, рассмотрение узлов Л, В, С (или вообще любых трех узлов из имеющихся четырех) уже устанавливает те условия, которым должны удовлетворять силы тока во всех проводниках в соответствии с первым правилом Кирхгофа, так что четвертый узел может только подтвердить уже найденные условия. Аналогично рассмотрение любых трех контуров, охватывающих все проводники цепи (например, первых трех контуров или других последовательных трех контуров), устанавливает зависимости между силами тока во всех проводниках цепи, диктуемые вторым правилом Кирхгофа, и, таким образом, исчерпывает вопрос о таких зависимостях, так что рассмотрение других контуров может только подтвердить уже найденные зависимости.

2. Введем некоторые определения. Если в данной системе хотя бы одно уравнение является линейной комбинацией других, то уравнения системы называются линейно зависимыми; так, уравнения системы (3) линейно зависимы. Если же ни одно из уравнений системы не может быть представлено в виде линейной комбинации других уравнений, то уравнения системы называются линейно независимыми.

Понятиям линейной зависимости и независимости уравнений удобнее дать другие определения, равносильные приведенным. Если, например,

[п] = с1[\] + с2[2}+ ... +ся_г1п— 1],

то, очевидно, имеет место и такое равенство

*iUl + *t[2]+ ... +сп_г[п— 11 — [n] = 0t (13)

означающее, что при почленном сложении уравнений получится нуль как слева, так и справа (слева нуль, тождественный относительно неизвестных). Отсюда следует, что в случае линейно зависимых уравнений можно указать такие множители, для которых имеет место равенство вида (13),

причем по крайней мере один из множителей заведомо не равен нулю (здесь последний). Очевидно и обратное: если

*ill]+M21+ ... +сп[п]=0 (14)

и сп Ф О, то будет иметь место равенство

т. е. уравнения системы оказываются линейно зависимыми.

Итак, уравнения системы линейно зависимы тогда и только тогда, когда можно указать такие множители сх% с2% сп% не все равные нулю, для которых имеет место тождество (14). Рассуждая от обратного, легко получить и второй вывод: уравнения системы линейно независимы тогда и только тогда, когда тождество (14) возможно лишь при одновременном равенстве нулю всех коэффициентов сх% с2, сп.

Выведем другие признаки линейной зависимости и независимости уравнений. Подставляя в (14) левые части уравнений и свободные члены системы, взятой в наиболее общем виде (9), получим:

Собирая здесь члены, содержащие х{, х2.....хп, а также свободные члены, и учитывая, что равенство это должно вполняться тождественно (независимо от значений хх, х2% ... .. ., хп), приходим к такой однородной (§ 2, п. 4) системе уравнений относительно с,, с2.....ст:

(15)

Если эта система имеет хотя бы одно ненулевое решение, то уравнения данной системы линейно зависимы. Так, например, уравнения системы задачи 6 (стр. 26) при а — — 1 будут

можно указать решение cl = 7t с2 = —5, с3 = 4. Для получения этого решения достаточно в первом и последнем уравнениях положить с3=1 и решить систему этих двух уравнений относительно сх и с2; найденные значения могут быть умножены на одно и то же число.

В том случае, когда система (15) имеет только нулевое решение, уравнения системы будут линейно независимы. Например, линейно независимы уравнения системы (1), так как после умножения обеих частей уравнений на cv сг% ..., ст и почленного сложения уравнений мы в левой части сможем получить тождественный нуль только тогда, когда последовательно св = О (коэффициент при F), съ = О (коэффициент при £), с4 = 0 (коэффициент при D), с1 = 0 (коэффициент при А). Полезно вспомнить, что у этой системы число неизвестных совпадает с числом линейно независимых уравнений и что система оказалась определенной.

3. Обратим, далее, внимание, на систему задачи 11 (стр. 35). Составляя и решая системы вида (15), можно установить, что между уравнениями системы имеется линейная зависимость, которую можно выразить такими равенствами:

[4] = 3[Ц —2[21—3[3], [5] = 2[Ц —3[21 — 4[3].

Эти равенства показывают, что последние два уравнения линейно зависят от остальных трех уравнений и могут поэтому быть отброшены. Можно было бы также убедиться в том, что первые три уравнения линейно независимы. Итак, в этой системе число линейно независимых уравнений меньше числа неизвестных (в системе 4 неизвестных). Решение системы показало, что она — неопределенная и имеет бесконечно много решений.

4. В заключение рассмотрим важный случай частичной линейной зависимости уравнений, наблюдающейся в системе (5). Нетрудно проверить, что если из последних трех уравнений системы составить линейную комбинацию 10 [4] — 15 [5]+ 6161. то левая часть полученного уравнения совпадает с левой

линейно зависимы, так как для однородной системы

частью второго уравнения системы, но правые части не совпадут. Сделанное в начале параграфа замечание показывает, что построенной линейной комбинации должно удовлетворять любое решение системы, составленной из последних трех уравнений (5); вместе с тем ясно, что никакая совокупность чисел р, q и г не может одновременно удовлетворить построенной линейной комбинации и второму уравнению (так как левые части уравнений совпадут, а свободные члены различны). Отсюда следует, что в системе (5) второе уравнение противоречит системе, составленной из последних трех уравнений (5), что и является причиной несовместности системы, отсутствия у нее решения.

Наряду с этим следует заметить, что свободные члены у линейной комбинации, указанной выше, и у второго уравнения отличаются незначительно (на 0,0004, или меньше чем на 0,1%, от значений свободных членов), что указывает на целесообразность постановки задачи приближенного решения этой системы, о чем подробнее будет рассказано в § 6.

б. Выше (п. 1) мы видели, что те уравнения системы, которые линейно зависят от других уравнений, не играют никакой роли при решении системы и могут быть отброшены. Отсюда видно, что для исследования системы важно знать, сколько в данной системе имеется линейно независимых уравнений. Число линейно независимых уравнений системы назовем рангом полной или расширенной системы и обозначим через /?„; здесь слова «полной или расширенной» подчеркивают то обстоятельство, что уравнения учитываются целиком: как члены с неизвестными, так и свободные члены.

В п. 4 было обнаружено, что несовместность системы связана с определенным видом частичной линейной зависимости, когда левые части уравнений (члены с неизвестными) линейно зависимы, но правые части (свободные члены) не удовлетворяют этой зависимости. Это показывает, что при исследовании системы важно также знать, сколько имеется в системе уравнений, левые части которых линейно независимы. Условимся число уравнений, левые части (члены с неизвестными) которых линейно независимы, называть рангом неполной системы, или просто рангом системы, и обозначать через /?н; слово «неполной» должно здесь подчеркнуть, что уравнения не берутся полностью, а только их левые части. Так как в случае независимости левых частей уравнений эти уравнения, взятые целиком, тем более будут линейно

независимы, то между двумя введенными рангами имеет место соотношение

На основании введенных здесь понятий можно формулировать общие выводы, касающиеся исследования систем; эти выводы подтверждаются рассмотренными примерами, но дать им строгие доказательства в этой краткой книжке затруднительно. Выводы следующие:

а) Для совместности системы необходимо и достаточно, чтобы выполнялось равенство RH — Rn. Это утверждение известно под названием теоремы Кронекера — Капелли. Так, в системе (1) выполняется равенство Rn = Rn = 6, в системе (3)— /?п = /?п = 6, в системе задачи 11— /?н = /?п = 3.

б) Из предыдущего вывода непосредственно следует, что система несовместна тогда и только тогда, когда для нее имеет место неравенство RH < Rn. Например, в системе (5) /?нг=^з, Rn=z4t /?н </?п; в системе задачи 6 при а Ф— 1 RH = 2, /?п = 3, RH < Rn\ в системе задачи 8 при а — — 9 и Ъф\ RH=l, Ä„ = 2, /?„</?„.

в) Если RH = Ru = п (п — число неизвестных в системе), то система — определенная. Эти условия выполняются, например, в системах задач 1, 2, 3, 10, причем общее значение указанных величин в этих системах соответственно равно б, 3, 6, 5.

г) Если Rn — /?п< п» т0 система — неопределенная. Эти условия имеют место в системах задачи 4 (/?„ = /?п = 3, п = 4) и задачи 11 (RH = Rn = 3, п — А).

6. Далее, в пп. 6—8, мы рассмотрим еще один способ решения систем, очень удобный тем, что позволяет в общем виде записать решение системы и исследовать систему, не решая ее фактически, а используя лишь ее коэффициенты. Начнем с системы второго порядка общего вида (6).

Составим из уравнений (6) линейные комбинации Ь2[\\ — — ^[21 и —Û2lU + fli[2]; мы придем к системе

(16)

где

Заметим, что системы (6) и (16), вообще говоря, не равносильны. Очевидно, что так как уравнения (16) являются

линейными комбинациями уравнений (6), то каждое решение системы (6) будет также решением (16), но обратное не всегда имеет место. Так, система

приводится к

Второй системе удовлетворяет, например, система значений X = 1, у = 1, не удовлетворяющая первой системе.

Если дополнительно предположить, что D Ф О, то система (16) будет иметь единственное решение:

Ввиду сделанного замечания система (6) не может иметь других решений, кроме указанного решения системы (16); непосредственной подстановкой значений x=Dx : D, y=D2 : D в уравнения системы (6) убеждаемся в том, что эти значения действительно составляют решение системы (6):

Обратим внимание на вид выражений D, Dx и D2. Пусть имеем квадратную таблицу, составленную из 22 = 4 чисел (или алгебраических выражений), которые назовем ее элементами:

А, В,

Л2 В2

О выражениях, находящихся в одном вертикальном ряду, мы будем говорить, что они составляют столбец (первый, второй), а о выражениях, находящихся в одном горизонтальном ряду, — что они составляют строку (первую, вторую). Минором данного элемента таблицы назовем тот элемент ее, который останется, если из таблицы вычеркнуть столбец и

строку, в которых расположен данный элемент; так, минором элемента А2 будет элемент Bv Составим произведения каждого из элементов первого столбца на его минор и алгебраическую сумму этих произведений, взяв первое произведение со своим знаком (т. е. поставив перед ним плюс), а второе произведение с противоположным знаком (т. е. поставив перед ним минус); такую сумму, у которой знаки перед слагаемыми попеременно меняются, причем это чередование начинается со знака плюс, называют чередующейся суммой. Для данной таблицы указанная чередующаяся сумма равна АХВ2— А2ВХ. Введем такое определение: чередующаяся сумма произведений элементов первого столбца на их миноры называется определителем второго порядка, составленным из элементов данной таблицы, и обозначается

(17)

Сравнив правую часть (17) с выражениями D, Dx и D2, замечаем, что все эти три выражения можно записать с помощью определителей второго порядка:

Очевидно, что определитель D составляется из коэффициентов при неизвестных, взятых в том же порядке, в котором эти коэффициенты записаны в системе (при условии, что порядок следования неизвестных во всех уравнениях системы совпадает). Этот определитель называют определителем системы. Для получения определителей Dx и D2 достаточно в определителе системы столбец коэффициентов при х (для Dx) или при у (для D2) заменить столбцом свободных членов. Полученное выше для случая ОфО решение системы (6) можно, таким образом, записать через определители

(18)

Формулы (18) выражают правило нахождения решения системы, носящее имя Крамера.

Если определитель системы отличен от нуля, то решение системы дается совокупностью дробей, в знаменателях которых находится определитель системы, а в числителях — определители, получаемые из определителя системы заменой столбца

коэффициентов при определяемом неизвестном столбцом свободных членов.

Итак, мы нашли, что если определитель D системы (6) не равен нулю, то система — определенная, и ее решение выражается формулами (18). Нетрудно проверить, что если D = alb2 — a2b1 = О, то левые части уравнений (6) связаны линейной зависимостью

МП — М2] = 0

или

— а2[\] + а1[2) = 0.

Если при этом хотя бы один из определителей, Di или D2, не равен нулю (этого достаточно, но на самом деле из D = D1 = 0 следует, что и D2 — 0, а из D = D2 = 0 следует, что и Dx = 0), то указанная линейная зависимость не распространяется на свободные члены (проверьте это!). В этом случае система (6) несовместна, ибо несовместна система (16); так как здесь (см. п. 5) /?„= 1, /?п = 2, то мы получаем еще одно подтверждение вывода б) п. 5. Если же D = Dx = D2 = 0, то одно из уравнений, как линейно зависящее от другого, можно отбросить; остается одно уравнение с двумя неизвестными, которое имеет бесконечно много решений (одному из неизвестных можно приписать произвольное значение). В последнем случае /?н = /?п=1, п = 2\ это подтверждает вывод г) п. 5.

Задача 12. Исследовать систему (я, b — заданные числа)

Пользуясь формулой (17), вычисляем определители D, Dj и D2:

В зависимости от значений a, b возможны такие случаи:

а) при \2+2аф0 (а Ф—6) система — определенная; ее решение:

система несовместна;

в) при 12 + 2а == О, 4Ь + 16 = О (а = — 6, b ** — 4) система — неопределенная. Имеется одно линейно независимое уравнение Зх —- 2у = — 4, решение которого можно записать в виде у = р,

7. Перейдем к системам третьего порядка вида (7). Составляя из уравнений системы (7) линейные комбинации

мы придем к такой системе:

(19)

Как и в случае систем второго порядка (стр. 44), можно показать, что системы (7) и (19) не равносильны; у системы (19) могут быть решения, не удовлетворяющие системе (7). Но если ограничиться случаем, когда D Ф 0, то единственное в этом случае решение системы (19)

x = D1:D, y = D2:Dt z = Db\D

удовлетворяет также (что можно проверить подстановкой этих значений в уравнения системы) системе (7).

Обратим снова внимание на вид выражений D, Dv D2, D3« Пусть имеем квадратную таблицу из З2 = 9 элементов (чисел или алгебраических выражений):

Как и на стр. 44, определим столбцы и строки этой таблицы. Минором какого-либо элемента таблицы здесь назовем определитель второго порядка, который можно образовать из элементов таблицы, если из нее вычеркнуть столбец и строку, в которых находится данный элемент; так, минором элемента А2 будет определитель „ п . Используя также понятие чередующейся суммы, данное на стр. 45, мы введем понятие определителя третьего порядка при помощи того же определения, которое на стр. 45 приведено для определителя второго порядка; итак, по определению

(20)

Если сравнить правую часть (20) с выражениями D, Dlt D2 и D3, то несложная проверка покажет, что все они могут быть записаны в виде определителей третьего порядка:

Нетрудно также убедиться в том, что эти определители образуются из коэффициентов заданной системы таким же способом, каким ранее (стр. 45) были образованы соответствующие определители второго порядка: определитель D составляется из коэффициентов при неизвестных, выписанных в том же порядке, в каком они записаны в системе; он и в данном случае называется определителем системы; определители Dlt D2 и D3 образуются из определителя системы заменой столбца коэффициентов при неизвестном (соответственно) X, у% z столбцом свободных членов.

Записав, наконец, ранее найденное для случая D Ф 0 решение системы (7) с помощью определителей

(21)

убеждаемся также в том, что для систем третьего порядка, имеющих отличный от нуля определитель, полностью сохраняет силу правило Крамера решения системы, которое было сформулировано на стр. 45.

Заметим еще, что если D = 0, но хотя бы один из определителей Dp D2 или D3 не равен нулю, то данная система (7) несовместна, так как несовместна система (19), а всякое решение системы (7), если оно вообще имеется, необходимо должно удовлетворить системе (19). Исследованием более трудного случая, когда D = D± = D2 = D3 = 0, мы в общем виде не станем здесь заниматься; ограничимся лишь подробным исследованием конкретной системы.

Задача 13. Исследовать систему (a, b — заданные числа) Пользуясь формулой (20), вычислим определители

В зависимости от значений a, b возможны такие случаи: a) D = (6 — ар(\2 + а)ф0 (а ф 6, а ф — 12). Система-определенная; решение ее находим по правилу Крамера:

Так, например, при а = 3, b = 24 решение будет таким: X = — 4, у = 2, г = — 1.

б) а = —12, b Ф—6. В этом случае D = 0, игфО. Система несовместна.

в) а = — 12, £ = — 6. В этом случае D = D2 = D3 = 0. Уравнения системы в этом случае связаны линейной зависимостью вида

3[1] + 2[2] + 6[3]=0.

Отбрасывая третье уравнение, как линейно зависящее от двух других, и заметив, что оставшуюся систему двух уравнений с тремя неизвестными можно решить относительно хну (определитель, составленный из коэффициентов при этих неизвестных не равен нулю), полагаем z = р, где р — произвольно, и решаем систему

решение ее таково;

Присоединяя сюда значение z = р, получаем решение заданной системы в рассматриваемом случае. В частности, при р = -g* имеем

г) а = 6, b Ф 3. Здесь опять D = Dx = D2 = D3 = 0. Подставляя a = 6 в заданную систему, легко убеждаемся в том, что при любом значении b имеет место линейная зависимость [1] = 2 [3], откуда следует, что первое уравнение можно отбросить. Между левыми частями последних двух уравнений также имеется линейная зависимость [2] = 3 [3], но при b Ф 3 эта зависимость не распространяется на правые части. Система в этом случае несовместна.

д) а = 6, b == 3. Этот случай отличается от предыдущего только тем, что второе уравнение тоже здесь линейно зависит от третьего и может поэтому быть отброшено. Остается одно уравнение с тремя неизвестными. Положив в нем у = 2р, z = где рид — произвольны, находим решение системы

Так, если принять р = -^, <7=1, то решение будет таким: х = 2,

В заключение отметим, что можно на этом примере снова убедиться в правильности выводов п. 5. Следует лишь заметить, что в случае а) Rn = Rn = п = 3; в случае б) /?,, = 2, Rn = 3; в случае в) Rn = Rn = 2, п = 3; в случае г) /?н=1, Rn = 2; в случае

Д) #„ = /?п = 1. л = 3-

8. Мы рассмотрели системы второго и третьего порядков и показали, как они исследуются и решаются (если решение возможно) с помощью определителей. Вкратце отметим, как эти методы обобщаются на системы более высоких порядков.

Мы ввели понятие определителя третьего порядка (стр. 48), основываясь на ранее введенном понятии определителя второго порядка. Точно так же можно, опираясь на определители третьего порядка, ввести определители четвертого порядка и т. д. Вообще, считая, что определители порядка k — 1 уже введены и что для таблицы из k2 элементов

установлены, как и ранее, понятия столбца, строки, минора данного элемента (минором в этом случае будет определитель порядка k — 1), а также используя понятие чередующейся суммы, мы определитель порядка k вводим таким определением: определителем порядка k называется чередующаяся сумма парных произведений элементов первого столбца (Ац) данной квадратной таблицы из № элементов на миноры этих элементов (Мц). Используя известное уже обозначение определителя, мы, таким образом, по определению имеем:

Определитель, составленный из коэффициентов при неизвестных, называется и в этом случае определителем системы.

Оказывается, что для систем любого порядка вида (8), имеющих отличный от нуля определитель системы, сохраняет свою силу правило Крамера, данное на стр. 451); оно может быть выражено формулами

Здесь D — определитель системы, Dh D2, Dn — определители, получаемые из определителя системы заменой столбца коэффициентов при определяемом неизвестном столбцом свободных членов.

9. В заключение этого параграфа обратим внимание на то, что приведенные в пп. 1—5 понятия линейной зависимости и независимости уравнений, рангов системы и расширенной системы, а также выводы, касающиеся исследования систем (п. 5), допускают также другие формулировки, использующие понятие определителя. Не вникая в подробности, отметим лишь такие факты:

а) Равенство Rn = г имеет место тогда и только тогда, когда в системе можно выбрать такие г уравнений и такие г неизвестных, что определитель, составленный из коэффициентов при этих неизвестных в этих уравнениях, отличен от нуля, но не существует ни одного определителя порядка r-j-1, составленного аналогичным образом, который был бы также отличен от нуля. Так, запись /?„ = 2 для системы задачи 13 в случае б) означает, что существует хотя бы один определитель второго порядка, например

который не равен нулю, но определитель третьего порядка, составленный из всех коэффициентов при неизвестных, равен нулю.

б) Расшифровка равенства Rn = г отличается от приведенной выше только тем, что наряду со столбцами коэффициентов при неизвестных может здесь участвовать в образовании определителей также столбец свободных членов. Так, в приведенном выше примере Rn = 3, так как имеется определитель третьего порядка, не равный нулю:

1) Для лиц, знакомых с элементами высшей алгебры, заметим, что для вывода формул Крамера для систем произвольных порядков не обязательно прибегать к теории подстановок, транспозиций и к полной теории определителей, как это обычно делается в курсах высшей алгебры. Для этой цели достаточно, опираясь на указанное выше рекуррентное определение определителя, доказать, что при перемене мест первого и еще одного столбца определитель меняет только свой знак и что определитель, у которого первый столбец совпадает с другим столбцом, равен нулю. Читатель, который заинтересуется этим вопросом, может найти такой вывод в заметке автора «Краткий вывод формул Крамера» (Уч. записки Смоленск, пед. ин-та, вып. 10 (I960)).

в) При новом, указанном выше, толковании понятий ранга системы и ранга расширенной системы полностью сохраняют силу все выводы п. 5, касающиеся исследования систем.

УПРАЖНЕНИЯ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ

8. Найти /?„ и Rn для системы упражнения 5 (стр. 37) и проверить вывод г) п. 5.

9. Найти RH и Rn для системы упражнения 6 (стр. 37) и проверить вывод 6) п. 5.

10. Найти RH и R„ для системы упражнения 7 (стр. 37) и проверить выводы п. 5 для случаев: а= 1,

11. Решить с помощью определителей систему:

12. Исследовать систему (a, b— заданные числа)

13. Исследовать систему при 0 < а <

14. Убедиться в правильности следующего правила вычисления определителя третьего порядка (правило Саррюса): определитель третьего порядка равен сумме произведений элементов главной диагонали (т. е. й\% Ь2, с3) и элементов, находящихся в вершинах двух равнобедренных треугольников, основания которых параллельны главной диагонали, без суммы произведений элементов второй диагонали (т. е. Ci, b2, а%) и элементов, находящихся в вершинах двух равнобедренных треугольников, основания которых параллельны второй диагонали (это правило схематически изображено на рис. 4)

Рис. 4.

15. Решить с помощью определителей систему

16. Исследовать систему (a, b — заданные числа)

17. Исследовать систему

18. Исследовать систему при abc Ф О

§ 6. ПРИБЛИЖЕННОЕ РЕШЕНИЕ СИСТЕМ МЕТОДОМ ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ

В §§ 3 и 4 были изложены так называемые прямые методы решения систем, имеющие очень важное значение для исследования систем, а также для практического решения систем (особенно метод последовательного исключения). Однако использование этих методов требует громоздких вычислений. Кроме того, часто приходится для системы, для которой уже найдено приближенное решение с небольшой степенью точности, искать более точное решение; при пользовании прямыми методами приходится задачу решать заново, имеющееся приближенное решение не может как-либо облегчить вторичное решение системы.

По указанным причинам на практике наряду с прямыми методами решения систем применяются еще косвенные методы приближенного решения систем; к этим методам обычно предъявляют такие требования:

а) возможно большая простота вычислений (использование наиболее простых действий, механическое их выполнение),

б) возможность получения результата с какой угодно степенью точности.

Мы рассмотрим здесь один из этих методов — метод последовательных приближений; этот метод в большой степени удовлетворяет отмеченным двум требованиям и широко исполь-

зуется на практике. Метод этот подробно разберем на системах третьего порядка вида (7).

1. Сначала относительно коэффициентов при неизвестных в системе (7) сделаем предположение, что в каждом уравнении диагональный коэффициент (см. § 2, п. 5) по абсолютному значению превосходит сумму абсолютных значений двух других коэффициентов, и притом не менее чем в q раз, где q — некоторое число, большее единицы:

Эти неравенства допускают и такую запись:

(22)

В пп. 2 и 3 будет выяснено значение этого условия, в п. 4 будет показано, как для системы, не удовлетворяющей условию (22), построить равносильную ей систему, удовлетворяющую этому условию.

Для приближенного решения системы (7) мы ее перепишем в ином виде, выразив из каждого уравнения его диагональное неизвестное через два других неизвестных; сделать это можно, так как из условия (22) следует, что

(23)

Система примет вид

(24)

Попытаемся приблизиться к неизвестному нам решению с помощью такого приема. Любую систему чисел xQ, yQt z0 примем за нулевое приближение (к решению системы); для упрощения вычислений положим х0 = у0 = z0 = 0. За первые приближения примем совокупность значений левых частей (24), которые получатся, если в правых частях неизвестные заменить их нулевыми приближениями; мы получим:

Аналогично за вторые приближения примем совокупность значений, которые получат левые части (24), когда в правых частях неизвестные будут заменены их первыми приближениями и т. д. Вообще, если уже найдены приближения с номером к—1, то за очередные приближения с номером k примем совокупность значений, которые получат левые части (24), когда в правых частях неизвестные будут заменены их приближениями с номером k—1, т. е. для любого k:

(25)

Чтобы получить более удобные формулы для нахождения последовательных приближений, мы будем вычислять не сами приближения, а последовательные поправки, которые в сумме с предыдущим приближением дают очередное приближение; обозначим эти поправки так:

Очевидно, что значения первых поправок совпадают с первыми приближениями. Вычислим вторые поправки:

откуда

Точно так же можно найти, что

Легко проверить, что аналогичные формулы имеют место для поправок с любым номером k\ действительно, используя (25), находим:

Точно так же можно найти поправки ßfe и тА. Заменяя в этих выражениях

получим:

(26)

Заметим, что по известным поправкам легко записать приближение с любым номером п\ для этого достаточно составить сумму поправок:

Аналогично записываются приближения уп и zn, так что имеем:

(27)

Общность и простота формул (26) и, особенно, отсутствие действия деления при нахождении каждой последующей поправки (делить приходится только один раз при нахождении первых поправок) определяют удобство этого метода для практического решения систем.

2. Перейдем к вопросу обоснования метода последовательных приближений. Нам нужно доказать, что последовательные приближения действительно приближают нас к искомому решению, т. е. что они стремятся к определенным пределам, причем эти пределы составляют решение системы. Как уже отмечалось, мы ограничимся системами, для которых выполнено условие (22).

В ходе доказательства нам придется пользоваться основными свойствами абсолютного значения чисел, а именно: при изменении знака числа его абсолютное значение не меняется ( | — а | = | а | ); абсолютное значение суммы не превышает суммы абсолютных значений слагаемых (\a+ b\^\a\+\b\> в более общем виде

абсолютное значение произведения (частного) равно произведению (частному) их абсолютных значений ( | ab | = | а \ \ Ь |, в более общем виде I ага2 ... Л/i I = I ai 11 л2 I • • • I ап II \ a'-b\ = \a\:\b\). Читатель, который не знаком с этими свойствами, легко проверит их сам.

Мы, далее, будем исходить из того, что система имеет решение; можно доказать, что совместность системы следует из условия (22), но это — вопрос менее существенный, и мы не будем на нем останавливаться. Из существования решения следует, что можно указать такое постоянное положительное число L, которое одновременно удовлетворяет трем условиям (л:, у, z— решение системы):

(28)

Нам нужно доказать, что при п -> со хп -> х% уп -> у, zn -> z. Для этого достаточно доказать, что разности х — хп, у — уп и z — zn имеют при п -> оо пределы, и притом равные нулю. Предварительно докажем, что для указанных разностей имеют место такие неравенства (оценки):

(29)

Для случая п = 1 мы из (24), (25), (28) и (22) на основании перечисленных свойств абсолютного значения находим (для у и z аналогично):

При п = 1 неравенства (29) доказаны. Чтобы доказать, что они верны при любом л, мы, следуя методу математической индукции1), должны еще показать, что если они справедливы при каком-то фиксированном (но произвольном) значении п = k — 1, то они верны и при п = k.

1) С методом математической индукции можно подробно ознакомиться по книге И. С. Соминского «Метод математической индукции» (серия «Популярные лекции по математике», выпуск 3).

Пусть уже доказано, что при п = k — 1 неравенства (29) верны:

Используя те же равенства и условия, что и в случае п = 1, а также последнее предположение, мы для п = k получаем (для у и z аналогично):

Неравенства (29) справедливы для п = откуда ввиду произвольности к следует их справедливость при любом л.

В правых частях неравенств (29) числитель — постоянное число, а знаменатель неограниченно возрастает при п -> оо (так как q > 1); поэтому дробь будет стремиться к нулю. Но тогда меньшие выражения, составляющие левые части неравенств, тем более будут стремиться к нулю, что и требовалось доказать.

Заметим еще, что согласно (27) можно предельное соотношение хп -> X записать в виде

или, как это принято условно записывать, в виде точного равенства:

(30)

3. Установленный выше факт, что последовательные приближения действительно стремятся к решению, не позволяет еще ответить на такие более конкретные вопросы:

а) Пусть мы остановились на приближении с номером п. Какую абсолютную погрешность мы допускаем, приняв за решение системы значения хп, уп, zn, иначе говоря, какое наибольшее значение могут иметь величины | х — хп |, \у — уп \ и | z — zn \ при данном л?

б) На каком номере п следует остановиться, чтобы приближенное решение хп, ут zn имело наперед заданную точность, иначе говоря, при каком п величины \х — хп\, \у — ул |, \z — zn\ одновременно станут меньше некоторого наперед заданного числа?

Задача дальнейшего изложения — получить ответы на эти вопросы.

Учитывая (23), можно утверждать, что должна существовать такая положительная постоянная М, для которой одновременно

Пользуясь этими неравенствами, равенствами (26), условиями (22) и свойствами абсолютного значения, можно таким же образом, как выше доказаны неравенства (29), доказать следующие неравенства (оценки) для последовательных поправок с любым номером п:

(31)

Образуем величину \х — хп\ и, используя (30) и (27), представим ее в ином виде:

Выделим из правой части сумму р слагаемых и оценим ее, используя свойства абсолютного значения и (31):

Здесь в скобках получена сумма членов геометрической прогрессии со знаменателем — ; применив соответствующую формулу, находим:

Если р будет неограниченно возрастать, то вычитаемое будет стремиться к нулю (числитель — постоянный, знаменатель неограниченно возрастает, так как q > 1). Поэтому в пределе, при р -> оо, получим:

Величины M и q — постоянные для данной системы; вводя для постоянной обозначение К

окончательно имеем:

(32)

Для величин \у — уп \ и \г — zn\ можно аналогично получить такие же неравенства. Ответ на первый вопрос получен: за абсолютную погрешность, допускаемую при замене решения системы приближением с номером п, можно принять правую часть неравенства (32).

Перейдем ко второму вопросу. Пусть требуется найти решение системы, имеющее m верных десятичных знаков, т. е. такое решение, для которого выполнялись бы одновременно неравенства

Очевидно, что любое из этих неравенств будет выполнено, если будет выполнено неравенство (см. (32) )

(33)

Здесь К > 0 (так как M > 0, q > 1), qn~l > 0, 10m > 0; следовательно, неравенство (33) выполняется одновременно с таким:

Так как из двух положительных чисел больше то, у которого логарифм больше, то интересующее нас неравенство будет удовлетворено, если будет выполнено неравенство (для удобства берем десятичные логарифмы от обеих частей неравенства)

или

окончательно:

(34)

Итак, мы безусловно достигнем требуемой точности, если число приближений превысит число, записанное в правой части (34).

Полученный результат показывает, что число необходимых приближений уменьшается, если увеличивать q; отсюда следует, что для того, чтобы ускорить решение системы, надо стремиться к тому, чтобы величина q была возможно больше.

4. Выше мы видели, что метод последовательных приближений, применим к системам, удовлетворяющим условиям (22) при 7>1. Во многих случаях решение практических задач приводит к системам, для которых эти условия выполнены; но это не всегда так. Дальше покажем, что систему (по крайней мере определенную), не удовлетворяющую условиям (22), можно привести к виду, в котором эти условия выполняются. Будут указаны два способа решения этой задачи.

а) Пусть задана система третьего порядка вида (7), не удовлетворяющая условиям (22). Последовательно выполним следующие преобразования.

1) Неизвестное х заменяем неизвестным х', исходя из равенства

После этой замены первое уравнение будет удовлетворять условию (22).

2) Второе и третье уравнения заменяем такими линейными комбинациями уравнений системы, полученной после замены 1):

Этими преобразованием мы делаем достаточно малыми коэффициенты при X1 в остальных двух уравнениях. Коэффициенты системы, которая получится после второго преобразования, мы обозначим теми же буквами и индексами, что и системы (7), но с штрихами сверху.

3) Неизвестное у заменяем неизвестным у', исходя из равенства

После этой замены первые два уравнения удовлетворяют условию (22).

4) Третье уравнение системы, полученной после замены 3), заменяем линейной комбинацией

Это позволит сделать достаточно малым коэффициент при у9 в третьем уравнении.

5) Если после этого третье уравнение еще не будет удовлетворять условию (22), то мы неизвестное z заменяем неизвестным z't исходя из равенства

где / можно взять произвольно; его выбирают так, чтобы после этой замены все уравнения удовлетворяли условию (22), и притом примерно с одним и тем же значением q.

В отношении чисел г, s, t, и, vt w следует иметь в виду, что чем ближе они будут к указанным отношениям, тем больше будет q и тем быстрее можно решить преобразованную систему; но вместе с тем они должны иметь возможно более простой вид (быть целыми или дробями с небольшими знаменателями), иначе сильно усложнятся вычисления, связанные с преобразованием системы.

б) Систему можно также привести к требуемому виду путем составления из данных уравнений линейных комбинаций с удачно выбранными коэффициентами. Во многих случаях такие коэффициенты удается подобрать без каких-либо вычислений, на основе лишь внимательного рассмотрения заданной системы. Но если сочетание коэффициентов и знаков неблагоприятно и простой подбор не помогает, то можно поступить так. Пусть из уравнений системы (7) нужно составить такую линейную комбинацию /ех 111 —Ч— k2 [2]+k3{3], в которой коэффициенты при у и z были бы достаточно малы по сравнению с коэффициентом при х (коэффициенты сравнивают по абсолютной величине). Собираем в этой линейной комбинации коэффициенты при у и z и составляем систему

Решая эту систему с грубым приближением (например, в целых числах), находим значения множителей линейной комбинации.

5. В пункте 1 были выведены формулы для вычисления поправок с любым номером и показано, как по поправкам найти приближенные значения неизвестных. Вычисление последовательных поправок производится однообразным процессом, по одним и тем же формулам. Практически его удобнее выполнять с помощью специальной вычислительной схемы типа схемы Гаусса, которой мы пользовались в § 3. На стр. 64 приведена такая вычислительная схема для систем третьего порядка; в схеме указан порядок вычисления поправок и приближений до четвертого номера включительно.

В каждой клетке (кроме верхних, заглавных) жирным шрифтом указан порядковый номер рекомендуемого порядка заполнения схемы; после этого номера либо указано, какую из заданных величин следует вписывать в данную клетку, либо указано, из каких клеток из числа ранее заполненных следует взять результаты и какое действие над ними нужно

выполнить, чтобы получить число, которое следует вписать в эту клетку; например, запись в клетке с номером 53: 23+32-)-+ 41 + 50 — означает, что в эту клетку записывается сумма результатов, ранее полученных в клетках с номерами 23, 32, 41, 50 (расположенных для удобства в одном столбце). Для запоминания порядка записи коэффициентов при неизвестных в клетках №№ 10—15 следует заметить, что буквы (соответствующие неизвестным) идут в обратном порядке (с, Ь, о), а цифры (соответствующие уравнениям) идут в обычном порядке, но каждая повторяется дважды.

Задача 14. Решить методом последовательных приближений с точностью до 0,001 такую систему:

Эта система не удовлетворяет условиям (22); нужно построить сначала систему, равносильную данной и удовлетворяющую условиям (22); мы это выполним обоими способами, указанными в и. 4, начав со способа, изложенного в а). Отметим еще, что при решении этой задачи, связанной с приближенными вычислениями, нужно иметь в виду следующее: из теории приближенных вычислений известно, что для того, чтобы обеспечить определенную точность окончательного результата, следует промежуточные вычисления производить с более высокой точностью. Мы поэтому будем промежуточные вычисления производить с точностью до 0,0001 (одного дополнительного десятичного знака обычно бывает достаточно).

1) Производим замену

2) Составляем линейные комбинации:

Это приведет к системе

3) Производим замену: у = у' — 2,4г (2,4^ 10,7516:4,526); система преобразуется в такую:

Система в последнем виде удовлетворяет уже условиям (22), так что нет надобности в выполнении преобразований типа 4) и 5). Эту систему можно решать по схеме стр. 64. Пользуясь оценкой (34), можно заранее установить, что для получения решения системы с точностью до 0,001 потребуется вычислить не более трех приближений; здесь q= 18 (0,5674 : (0,013 + 0,0185) > 18; другие отношения еще больше), m = 3 (0,001 = 1 : Ю*), М = 3 (12,9865:4,526<3, другие отношения еще меньше), К =» -ту < 0,2; отсюда согласно (34)

Решение последней системы по схеме стр. 64 помещено на стр. 67; там получен ответ:

Решение заданной системы находим, пользуясь формулами замены; ответ:

Решим еще заданную в задаче систему, приводя ее к виду, когда выполняются условия (22), по способу, указанному в б) (п. 4). Непосредственно по коэффициентам системы легко догадаться, что линейные комбинации

дадут уравнения, в которых коэффициенты соответственно при х и г будут превосходить по абсолютному значению сумму абсолютных значений остальных коэффициентов. Чтобы получить уравнение, удовлетворяющее второму из условий (22), составим линейную комбинацию заданных уравнений с неопределенными коэффициентами

*i[l] + *2 [2] + *з [3],

потребуем, чтобы коэффициенты при х и z обратились в нуль, и решим получаемую при этом систему

приближенно, с очень грубым приближением. Полагая k2 — 1 и перенося в правую сторону средний столбец, можно установить, что остающейся системе второго порядка удовлетворяет приближенно система значений /^=12, ^3=—20. Итак, вторым уравнением

преобразованной системы можно взять линейную комбинацию 12 [1] + [2] — 20 [3]. Мы приходим к такой системе, удовлетворяющей условиям (22):

Система эта решена по схеме стр. 64 на стр. 68. Ответы получились те же самые: je2,190, yœ—5,823, 1,243.

УПРАЖНЕНИЯ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ

19. Решить с точностью до 0,1 систему

20. Решить с точностью до 0,001 систему

21. а) Вывести рекуррентные формулы, аналогичные (25), для случая системы четвертого порядка.

б) Составить вычислительную схему для решения системы четвертого порядка, аналогичную схеме стр. 64.

22. Пользуясь результатами упражнения 21, решить с точностью до 0,01 систему четвертого порядка, удовлетворяющую условиям типа (22):

§ 6. ПРИБЛИЖЕННОЕ РЕШЕНИЕ НЕСОВМЕСТНЫХ СИСТЕМ

Из предыдущего изложения известно, что несовместная система по самому определению не имеет решений. Казалось бы, что постановка вопроса о решении такой системы лишена смысла. Но это не всегда так. С одной стороны, нужно помнить, что отсутствие решения у несовместной системы вида (9) означает, что нельзя указать такой системы значений хи лг3, хп, которые обращали бы уравнения системы

в точные равенства; но это не исключает возможности

существования такой системы значений xlt хъ . . ., хп, которые обращали бы уравнения системы в приближенные равенства с той или иной степенью приближения. С другой стороны, следует иметь в виду, что на практике системы уравнений часто возникают в результате измерений каких-либо величин, которые, как правило, не могут быть выполнены точно и дают приближенный результат; в таких случаях уравнения системы не могут мыслиться как точные равенства и лишь приближенно отражают зависимость между величинами. Если при этом число уравнений превышает число неизвестных, то система таких уравнений будет заведомо несовместной (ввиду приближенного характера равенств), но вместе с тем она должна заведомо иметь приближенное решение, смысл которого известен из условия задачи (например, длина отрезков, вес тел, температура газа).

Итак, в отношении несовместных систем можно, и часто необходимо, ставить вопрос об их приближенном решении. Чтобы ослабить влияние ошибок, допущенных при составлении отдельных уравнений системы, обычно увеличивают число уравнений; поэтому на практике приходится иметь дело с несовместными системами, у которых число уравнений значительно превышает число неизвестных (например, в задаче 5 § 1 несовместная система содержит уравнений вдвое больше, чем неизвестных).

Но что означает выражение «приближенно решить систему»? Если понятие точного решения имеет вполне определенный смысл, то понятие приближенного решения не имеет такого определенного смысла: приближенно решать можно с разной степенью точности, исходя из различных принципов понимания наилучшего приближения. Поэтому мы должны условиться о том, что мы будем понимать под приближенным решением несовместной системы.

1. Чтобы не усложнять вычислений, мы систему будем писать не в общем виде, для п неизвестных, а для частного случая трех неизвестных; существенного значения для принципов решения систем это не имеет. Число уравнений будем считать произвольным. Итак, рассматриваем систему

(35)

(свободные члены для удобства перенесены налево). Если бы эта система имела решение, то это означало бы, что существует такая система значений х% у и z% которая, будучи подставлена в левые части уравнений (35), обратила бы их в нули. Но система не имеет решения; это говорит о том, что, какие бы значения х, у и z ни подставили в левые части уравнений (35), мы не сможем их одновременно обратить в нули, а будем получать, как правило, значения, отличные от нуля:

(36)

Значения hi% h2, ..., hm называются погрешностями соответствующих уравнений. Уравнения системы, которые на практике получаются в равных условиях (например, в результате измерений с помощью одних и тех же приборов), мы должны считать равноправными; поэтому наша задача состоит в том, чтобы разыскать, такую систему значений х, у и z% при которых значения погрешностей всех уравнений системы были бы в каком-то смысле наименьшими. Но в последнее выражение можно вложить различный смысл, и в зависимости от этого мы будем получать различные способы приближенного решения систем.

Мы рассмотрим два способа приближенного решения систем: способ средних и способ наименьших квадратов. Следует, однако, предупредить читателя, что разъяснения, которыми будет сопровождено изложение этих способов, должны лишь разъяснить смысл того принципа, который лежит в основе изучаемого способа, но не доказать его.

2, Погрешности уравнений, как и другие виды погрешностей, бывают систематические и случайные. Систематические погрешности являются следствием неисправности прибора, неверности шкалы, недостатка зрения; эти погрешности имеют обычно один и тот же знак и примерно одно и то же значение. Такие погрешности в математике не изучаются, они должны быть устранены за счет внесения поправок в результаты измерений. Случайные погрешности являются неизбежным следствием несовершенства измерительных приборов и глаза, неточности установки приборов, наличия определенной ширины у стрелок и штрихов шкалы. Именно случайные

погрешности изучаются в математике и, в частности, имелись в виду, когда выше говорилось о погрешностях уравнений.

Случайные погрешности обычно невелики; естественно также предположить, что такие погрешности должны одинаково часто быть положительными и отрицательными. Если поэтому несколько уравнений почленно сложить, то следует ожидать, что полученное уравнение будет иметь меньшую погрешность, чем та, которую имели уравнения до сложения, так как погрешности разных знаков будут погашать одна другую. Основанный на таком предположении способ приближенного решения систем называется способом средних.

Способ средних состоит в том, что уравнения системы разбивают на три группы (по количеству неизвестных) и уравнения каждой группы почленно складывают; в результате получают систему третьего порядка, решение которой (если оно существует) принимается за приближенное решение данной несовместной системы. Слово «средних» в названии способа применяется потому, что почленное сложение уравнений равносильно замене как левых, так и правых частей уравнений их средними арифметическими значениями: ведь среднее арифметическое отличается от суммы только множителем, равным числу слагаемых, а такой множитель в случае уравнений не играет никакой роли, ибо всегда можно обе части уравнения умножить на любой множитель, не равный нулю.

Следует отметить, что способ средних не дает вполне определенного результата; разбивку системы на группы можно осуществить различными способами, и каждый из них приведет к своему ответу. Исходя из соображений равноценности всех уравнений системы, принято в каждую группу включать примерно равное число уравнений, не выбрасывая и не повторяя более одного раза ни одного из уравнений системы.

Задача 5 (решение системы способом средних, начало см. на стр. 12). Полученную на стр. 13 систему (5) разбиваем на три группы, собирая в группы уравнения, равноотстоящие от концов системы:

Почленное сложение уравнений каждой группы приводит к системе

Система эта легко решается исключением неизвестных (сначала г затем q)\ решение оказывается таким:

Искомая эмпирическая формула имеет вид

Интересно отметить, что если вычислить по этой формуле значения теплоемкости при температурах, заданных в условии задачи, то расхождения между вычисленными и полученными из опыта (данными в условии задачи) значениями достигнут наибольшей величины на концах таблицы, причем наибольшее расхождение

оказывается равным 0,0006 калорий > Учитывая, что cœl, можно утверждать, что полученная выше формула позволяет вычислить теплоемкость при температуре, удовлетворяющей неравенствам 35° .< / <; 100°, с относительной ошибкой, не превышающей 0,0006 = 0,06%.

3. Перейдем ко второму из упомянутых в п. 1 способов— способу наименьших квадратов. Рассмотренный выше способ средних имеет существенные недостатки: он не дает вполне определенного ответа и, кроме того, точность его невелика, так как погрешность почленной суммы уравнений может быть очень малой и даже равняться нулю, когда погрешности отдельных уравнений сравнительно велики.

Для достижения более точного результата желательно ввести некоторую меру для измерения погрешностей, причем так, чтобы она удовлетворяла таким естественным требованиям:

а) эта мера должна выражаться через абсолютные значения погрешностей заданных уравнений и при этом в равной мере учитывать каждое из этих значений;

б) она должна обращаться в нуль тогда и только тогда, когда все погрешности равны нулю;

в) она должна расти вместе с ростом абсолютного значения любой из погрешностей уравнений.

В качестве меры, удовлетворяющей указанным требованиям, проще всего было бы принять величину |ÄiI + |ä2I +1 /731 + . • • +1 hm |; но пользование такой мерой вызвало бы

большие вычислительные трудности из-за наличия знаков абсолютного значения. По этой причине предпочитают суммировать квадраты абсолютных значений, т. е. за меру погрешностей принять величину

(37)

также удовлетворяющую указанным требованиям и более удобную для вычислений. От искомого решения целесообразно потребовать, чтобы для этого решения мера (37) имела бы наименьшее значение. Требование, чтобы сумма квадратов погрешностей была бы наименьшей, и составляет принцип наименьших квадратов, а способ решения систем, основанный на этом принципе, называется способом наименьших квадратов.

Заметим, что к выражению (37) приводят и другие соображения, на которых мы не можем здесь подробно останавливаться. Так, если погрешности уравнений принять за координаты некоторого вектора, то условие (37) равносильно требованию, чтобы длина этого вектора была наименьшей. Можно показать также, что решение системы, удовлетворяющее условию (37), является наиболее вероятным среди всех других возможных приближенных решений1). Принцип наименьших квадратов впервые сформулировал К. Ф. Гаусс в возрасте 17—18 лет; впоследствии он дал несколько обоснований этого принципа.

Итак, по способу наименьших квадратов мы ищем такую систему значений х9 у и г% при которых выражение (37) приняло вы наименьшее возможное значение. Подставляя значения hx% h2, .... hn из (36), получаем для суммы S такое выражение:

или

(38)

1) Подробнее с последним вопросом можно ознакомиться по книге Б. В. Гнеденко и А. Я. Хинчина «Элементарное введение в теорию вероятностей», М. — Л., Гостехиздат, 1952.

где введены такие обозначения, также принадлежащие Гауссу:

(39)

Нам нужно найти систему трех чисел х, у и .г, при которых сумма 5 становится наименьшей. Временно предположим, что значения у и z уже найдены и осталось найти то значение х, при котором выполняется указанное условие. Расположим 5 (см. (38)) по степеням х:

К полученному квадратному (относительно х) трехчлену применим известный вывод о том, что квадратный трехчлен с действительными коэффициентами вида Au2+2Bu+C,

где А > 0, принимает наименьшее значение при и =--^1);

в данном случае найдем, что сумма 5 будет наименьшей при такой зависимости х от у и z:

1) Это можно доказать таким образом: так как А Ф О, то

Здесь второе слагаемое не зависит от и, а первое слагаемое, будучи неотрицательным, примет наименьшее значение 0 при

или, иначе говоря, когда х, у и z связаны условием

Предположим, далее, временно, что известны х и z и что нужно найти значение у, при котором значение 5 станет наименьшим. Располагая S (см. (38)) по степеням у:

и используя упомянутое условие для наименьшего значения квадратного трехчлена (здесь относительно у), мы аналогично предыдущему случаю найдем, что требуемое условие будет выполнено, если у выражается через х и z следующим образом:

или если X, у и z связаны условием

Полагая, наконец, известными х и у и ставя перед собой задачу найти такое значение 2, при котором сумма .S оказалась бы наименьшей, можно при помощи того же приема, дважды уже примененного, найти еще одно условие, которому также должны удовлетворять искомые значения х, у, z:

Итак, приближенное решение системы (35), для которого выполняется условие (37), должно одновременно удовлетворять полученным трем условиям, т. е. быть решением системы

(40)

если такое решение существует. Система (40) называется нормальной системой, соответствующей данной несовместной системе (35). Можно доказать, что для несовместных систем с вещественными коэффициентами нормальная система всегда определенна и что ее решение х, y, z, действительно, сообщает сумме 5 наименьшее значение. Отсюда следует, что

для такой несовместной системы существует единственное решение, удовлетворяющее принципу наименьших квадратов.

Обратим внимание на то, что нормальная система (40), коэффициенты которой даются формулами (39), может быть составлена по данной системе (35) по простому и легко запоминаемому правилу: чтобы получить первое (второе, третье) уравнение нормальной системы, соответствующей данной несовместной системе, следует левые части уравнений данной системы умножить на коэффициент при первом (втором, третьем) неизвестном в этом уравнении, после чего все уравнения системы почленно сложить.

Важно также заметить, что система (40) обладает интересным свойством, упрощающим ее составление и решение, а именно: коэффициенты, расположенные симметрично относительно прямой, соединяющей диагональные коэффициенты, попарно равны (в обозначениях (7) равны коэффициенты а2 и i„ а3 и cl% Ь3 и с2).

Система, коэффициенты которой связаны указанными равенствами, называется симметричной. Симметричную систему удобнее всего решать способом последовательного исключения неизвестных, так как не только заданная система, но и все промежуточные системы (с меньшим числом неизвестных) будут обладать свойством симметричности, что сокращает вычислительную работу: на каждом этапе достаточно вычислить коэффициенты, расположенные по одну сторону от упомянутой прямой, включая также коэффициенты, расположенные на самой прямой.

Задача 5 (решение системы методом наименьших квадратов; начало см. на стр. 12).

Для приближенного решения системы (5) составляем соответствующую ей нормальную систему; согласно (39) имеем:

Задача сводится к решению такой нормальной системы (см. (40)):

Для приближенного решения этой системы способом последовательного исключения неизвестных целесообразно в этой системе изменить порядок следования уравнений и неизвестных на обратный:

Решая эту систему, находим:

Искомая эмпирическая формула:

Если здесь, так же, как после решения способом средних (см. стр. 73), вычислить по найденной формуле значения теплоемкости при заданных в условии температурах, то наибольшее расхождение между вычисленными значениями и полученными из опыта будет равно 0,0006.

Решим еще одну задачу на нахождение эмпирической формулы более сложного вида.

Задача 15. Исследование зависимости продолжительности решения систем линейных уравнений одинаковой степени трудности от порядка системы дало следующую таблицу значений этих величин (п — порядок системы, t — средняя продолжительность решения системы в минутах):

Порядок системы п.....

2

3

4

5

6

7

8

9

10

Время t (в минутах) .....

12

35

75

130

210

315

445

600

800

Требуется найти эмпирическую формулу для зависимости t от п, выражаемой этими данными опыта.

Мы покажем, что данную зависимость удобно выразить с помощью показательной функции вида t = Anv, где коэффициент А и показатель х следует подобрать, исходя из условия, чтобы эта функция выражала указанную зависимость с достаточно хорошим приближением. Для более удобной проверки целесообразности выбора формулы указанного вида мы предполагаемую формулу прологарифмируем (хотя бы при основании 10); полагая Ig А = у, получим: lg t = х lg п + у. Это уравнение можно записать в виде у= *= kx + b (к = — lg nt b = lg t\ который показывает, что оно имеет своим графиком в прямоугольной системе координат прямую линию. Отсюда приходим к такому способу проверки целесообразности выбора формулы указанного вида: наряду с заданной таблицей строим вторую таблицу, в которой вместо величин п и t вписываем найденные из логарифмических таблиц значения lg п и lg t, затем строим в прямоугольной системе координат точки, координаты которых равны соответственным значениям lg л и lg t. Если точки, число которых значительно больше двух, окажутся расположенными примерно на одной прямой, то вид формулы выбран удачно. В данном случае вторая таблица имеет вид (использованы четырехзначные таблицы логарифмов)

Точки с соответствующими координатами действительно располагаются (рис. 5) близко к некоторой прямой; это подтверждает, что вид искомой формулы выбран удачно.

Для определения неизвестных нам величин х и у (а по у и величины А) подставим соответственные пары значений из второй таблицы в формулу х lg/i + у = Igt; мы приходим к такой системе 9 уравнений с 2 неизвестными:

Рис. 5.

Мы не будем здесь проверять, что система несовместна; в этом читатель легко убедится сам. Приближенно решим эту систему обоими вышеуказанными способами.

а) Чтобы приближенно решить систему способом средних, разобьем ее уравнения на две группы, включив в первую группу первые 5 уравнений системы, во вторую — остальные четыре уравнения. Почленное сложение уравнений каждой группы приводит к такой системе второго порядка:

Решая ее, находим х = 2,5981, у = lg А = 0,3022, А = 2,005. Искомая эмпирическая формула:

б) Для приближенного решения этой же несовместной системы способом наименьших квадратов составляем соответствующую ей нормальную систему, вид которой аналогичен (40), но без членов с z и без третьего уравнения; согласно (39) имеем:

Нормальная система (см. (40)):

Решение нормальной системы:

Искомая эмпирическая формула:

УПРАЖНЕНИЯ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ

23. Установить, как наиболее удобно проверить, подходит ли для данной таблицы значений х и у, полученной из опыта,

эмпирическая формула вида:

24. Проверить, что для таблицы значений

X

1

4

9

16

25

36

49

64

У

4,13

2,78

2,53

2,44

2,40

2,38

2,37

2,36

можно подобрать эмпирическую формулу вида а-\~. Найти коэффициенты формулы двумя способами.

25. Проверить, что для таблицы значений

X

6

9

12

15

18

21

31

35

39

48

У

161,1

152,6

138,2

127,3

116,9

108,8

83,8

74,8

66,5

53,7

можно подобрать эмпирическую формулу вида у = а • 10 и найти коэффициенты формулы двумя способами. 26. Для таблицы значений

X

0,05

0,15

0,30

0,50

0,80

1,50

У

600

60

15

5

3,3

2,9

подобрать эмпирическую формулу вида у = а + ^ + . Найти коэффициенты способом наименьших квадратов.

§ 7. ГРАФИЧЕСКОЕ РЕШЕНИЕ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ

Выше были рассмотрены наиболее распространенные способы решения систем с помощью вычислений. Интересно также остановиться хотя бы на одном способе графического решения систем, который можно было бы применить к системам любого порядка.

В школьном курсе алгебры изучается один способ графического исследования и решения систем второго порядка, который можно применить к системам с двумя неизвестными независимо от числа уравнений. По этому способу мы строим прямые, соответствующие уравнениям системы. Эти прямые могут:

а) пересекаться в единственной точке; система — определенная; решением служит совокупность координат точки пересечения;

б) не иметь ни одной общей точки для всех прямых (в случае двух прямых это имеет место при их параллельности); система несовместна;

в) иметь бесконечно много общих для всех прямых точек (если прямые сливаются); система — неопределенная; совокупность координат любой общей точки всех прямых даст решение системы.

К сожалению, этот удобный и наглядный способ исследования и решения систем не может быть применен к системам уравнений, содержащих более двух неизвестных, так как на плоскости нет геометрического образа, который соответствовал бы уравнению с числом неизвестных

Мы в этой книжке изложим способ графического решения систем, пригодный в принципе для решения систем любого порядка.

Идея его весьма проста: он графически осуществляет последовательное исключение неизвестных и решение системы треугольной формы (см. § 3). Рассмотрим каждую из этих двух задач в отдельности, ограничиваясь системами до третьего порядка включительно; дальнейшее обобщение метода не представляет принципиальных трудностей, но становится громоздким. Внимательный читатель справится с таким обобщением самостоятельно.

Предварительно сделаем такое замечание. Так как коэффициенты при неизвестных и свободные члены могут быть как положительными, так и отрицательными, то при их графическом построении мы условимся числа с противоположными знаками откладывать в противоположных направлениях; для определенности условимся положительные числа откладывать либо вправо (при горизонтальном положении прямой), либо вверх (при вертикальном положении прямой). Первый коэффициент в уравнении мы условимся считать положительным (этого можно всегда добиться путем умножения обеих частей уравнения на —1).

1. Начнем с задачи графического приведения системы к треугольной форме.

а) Пусть требуется исключить одно из неизвестных системы второго порядка вида (6). Коэффициенты при неизвестных мы вправе считать отличными от нуля, так как в противном случае система уже имела бы треугольную форму. Мы также будем считать, что ах > О и а2 > 0.

Выполним такое построение (рис. 6): проведем произвольно две параллельные прямые 1Х и /2, затем выберем на каждой из них начальные точки (соответственно Ох и 02) так, чтобы соединяющая их прямая была перпендикулярна к 1Х и /2. Приняв некоторый отрезок ОхЕ за единицу масштаба, отложим на прямой 1Х% начиная от точки Ох, последовательно отрезки ОхАх — ах, AxBx = bx, BxDx = dx, а на прямой /2, начиная от точки 02,—отрезки 02А2 = а2, А2В2 = Ь2, B2D2 = d2; при этом необходимо учитывать знаки коэффициентов и свободных членов, как выше условлено. На рис. 6 принято, что dx < 0 и Ъ2 < 0, а остальные значения положительны. Точки Ах и А2, Вх и В2, Dx и D2 соединим прямыми. Проведем еще параллельно 1Х (/2) прямую / и обозначим точки пересечения / с прямыми Ох02% АХА2, ВХВ2 и DXD2 соответственно через О, А, В и D, а числа, измеряющие отрезки OAt AB, BD, через a, b, d. Имеет место такая

Теорема. Где бы мы ни провели прямую I, значения a, b и d удовлетворят уравнению ax+by = dt где X, у—решение системы (6).

Прямая / может занимать относительно 1Х и /2 одно из трех положений: находиться между ними, быть выше 1Х и быть ниже /2. Мы подробно проведем доказательство только для первого случая, изображенного на рис. 6, а для двух других случаев отметим лишь особенности их доказательства.

Обозначим через р и q расстояния от / соответственно до 1Х (р—ООх) и до /2 (</ = 020). Проведем АхО\\Ох02,

Рис. 6.

ВхК^АхАг% BtNКDXD2 и обозначим точки пересечения этих прямых с / соответственно через F, H и M. Очевидно, что

Далее, используя подобие треугольников

и основываясь на теореме о пропорциональности соответственных сторон и высот подобных треугольников, устанавливаем, что

или, подставляя значения отрезков

Последний результат позволяет вычислить отрезки a, b и d:

Пусть л\ у — решение системы (6); вычислим сумму ах+Ьу, где a, b — только что найденные отрезки:

Последний отрезок совпадает, как выше установлено, с отрезком d. Доказательство теоремы для рассматриваемого случая закончено. Для двух других случаев доказательство, по существу, ничем не отличается от приведенного: следует лишь считать р < О, если / находится выше lv и q < О, если / находится ниже /2.

Доказанная теорема позволяет сделать такое заключение: если прямую /0 провести через точку пересечения А0 прямых АХА2 и ВХВ2% то в этом положении ее отрезок Ь = А0В0 обратится в нуль и соответствующее прямой /0 уравнение примет вид а0х = dQt где а0 = O0AQl d0 =-• A0D0 их — то же, что в решении системы; это уравнение вместе с одним из уравнений системы (6) образует систему треугольной формы, равносильную (6).

б) Пусть требуется привести к треугольной форме систему третьего порядка вида (7). Выполним построение, аналогичное предыдущему (рис. 7): проведем произвольно три параллельные прямые 1г, /2, /3 и на каждой из них выберем начальные точки (соответственно О,, 02, 03) так, чтобы они лежали на одной прямой, перпендикулярной к lv Выбрав еще единицу масштаба—отрезок 0,Е, отложим на 1Х последовательно отрезки 01Л1 = а1, A1Bl = bl, BlC1 = clt CxD{ = dl9 на прямой /2 — отрезки 02А2 = а2, А2В2 = Ь2% В2С2 = с2, C2D2 = d2, на прямой /3 — отрезки 03Л3 = а3, А3В3 = Ь3, ß3C3 = c3, C3D3 = ûf3. Точки, обозначенные одинаковыми буквами, соединим попарно прямыми (например, Вх с ß2, В2 с Вг% Вх с Б3; на рис. 7 показаны не все прямые). Имеет место теорема, аналогичная рассмотренной в предыдущем случае. Теорема. Если провести произвольную прямую I параллельно 1г и отметить точки пересечения ее О, А9 ß, С, D соответственно с прямыми О^, АхАг (ила

Рис. 7.

А2А3, ДЛз), ВХВ2 (или В2В3, ВХВЪ), СХС2 (или С2С3, СХСЪ), DXD2 (или D2D3, DXDZ), то величины а = ОА, Ь = АВ, с —ВС, d = CD удовлетворят уравнению ax+by+cz=d, где X, у, z — любое решение системы, составленной из первых двух уравнений (соответственно последних двух или первого и третьего уравнений) системы (7).

Доказательство этой теоремы аналогично доказательству теоремы п. а), и поэтому мы его опускаем.

Исходя из этой теоремы, мы для исключения z можем поступить следующим образом. Построим прямые ВХВ3 и С«С3, а также В2ВЪ и С2С3 (рис. 7). Через точки пересечения каждой пары прямых проводим прямые /4 и /б> параллельные lv Отмечаем точки 04, А4, В4, D4 пересечения /4 соответственно с О^з, АгА3, ВХВЪ (или С,С3) и DXD3 и точки Об, Аъ, £б, D6 пересечения /б соответственно с 0203, Л2Л3, £2#3 (или С2С3), D2D3. Из построения и указанной теоремы ясно, что уравнения, соответствующие /4 и /б, не содержат z\ поэтому совокупность этих двух прямых представляет графически систему двух уравнений с двумя неизвестными, полученную из системы (7) исключением z. Дальнейшее исключение одного неизвестного из полученной системы можно выполнить приемом, описанным в а). Для этого придется провести прямую le\\lt через точку пересечения А6 прямых А±АЬ и В4ВЪ и отметить на этой прямой точки Об, D6 пересечения ее соответственно с прямыми 040б, D4D6. Прямая /б представляет графически одно уравнение с одним неизвестным, полученное в результате исключения из системы (7) z и у. Совокупность прямых /6, /4 (или /б) и 1Х (или /2, или /3) представляет графически систему уравнений, равносильную системе (7), но имеющую треугольную форму.

В заключение заметим, что порядок исключения неизвестных в принципе безразличен: можно исключать любое неизвестное из любой пары уравнений; практически следует выбирать такой порядок исключения неизвестных, который удобнее для чертежа (как это сделано на рис. 7).

2. Перейдем к вопросу о графическом решении системы треугольной формы. Начнем с случая решения одного уравнения с одним неизвестным.

а) Пусть требуется графически решить уравнение

ахх — dv

Допустим, что задача уже решена и отрезок х уже известен. По сомножителям ах (ах > 0) и х можно построить

произведение алх таким образом (рис. 8): на прямой L отмечаем начальную точку О и точки Е и Ах так, чтобы ЕО = 1 и ОАх = ах. Перпендикулярно к L проводим прямые ОМ и АХМ; на ОМ откладываем отрезок OFx = x9 точку Fx соединяем с £ и проводим OOx\\EFv В результате этого построения мы получим отрезок AlOl = ахх. Действительно, из подобных треугольников EOFx и ОАхОх устанавливаем:

OFx : ЕО = AlOi : ОА19 X : 1 = AXGX : au AlG1 — axx.

Но заданное уравнение показывает, что axx = dx% где dx известно. Отсюда легко получаем способ построения решения уравнения axx = dx. Строим, как указано выше, прямую L9 точки О, Е9 АХ9 прямые ОМ, AXN и откладываем на AXN отрезок АхОх = dx\ затем соединяем точки Ох с О и проводим EFx\\OQx. По доказанному отрезок OFx будет выражать неизвестное х.

б) Пусть, далее, требуется решить систему второго порядка треугольной формы:

Пользуясь указанным в а) построением, мы найдем отрезок, равный xt являющийся решением первого уравнения системы. Предполагая временно, что известен также отрезок у% покажем, как строится отрезок, выражающий левую часть второго уравнения системы (рис. 9).

Построим произвольно прямую L, на ней отметим точки О (произвольно), Е (£0=1), А2 (ОА2 = а2), В2 (А2В2 = Ь2)\ затем перпендикулярно к L проведем прямые ОМ, A2N и В2Р\ на ОМ построим точки Fx (OFx = x) и F2 (OF2 = y) и соединим их с точкой Е\ после этого проведем 002\\EFx и ö2H2\\EF2. Убедимся в том, что отрезок В2Н2 выражает сумму а2х -J- Ь2у. Действительно, проведя

Рис. 9.

еще G2K2\\L и пользуясь подобием треугольников

мы найдем:

и окончательно

Но по условию а2х + Ь2у = d2, т.е. отрезок В2Н2 должен выражать число d2. Отсюда легко получить способ построения отрезка у, который мы ранее предполагали известным; после построения прямой точек О, Е, А2, В2, прямых ОМ, A2N, В2Р, точки Fx и прямых EF1$ OG2% как показано выше, мы откладываем на прямой В2Р отрезок B2H2 = d2, соединяем Н2 с 02 и проводим EF2\\G2H2. Отрезок OF2t как это следует из приведенного доказательства, будет выражать второе неизвестное у.

в) Пусть, наконец, требуется графически решить систему третьего порядка треугольной формы:

Пользуясь построением, указанным в б), мы можем решить систему, составленную из первых двух уравнений заданной системы, и найти отрезки, равные х и у. Предполагая временно известным и отрезок, равный z, покажем,

Рис. 10.

как построить отрезок, выражающий левую часть последнего уравнения заданной системы третьего порядка.

Построим произвольно прямую L (рис. 10), на ней выберем произвольно точку О и нанесем точки Е (ЕО — 1), А3 {OA3—a3)t В3 (A3B3=b3), С3 (В3С3=с3); затем проведем прямые ОМ, A3Nt B3Pt C3Q перпендикулярно к L. На прямой ОМ нанесем точки Fx (OFx = x), F2 (OF2 = у) и F3 (OF3 = z) и соединим их прямыми с точкой Е. После этого проведем прямые OG3\\EFx, G3H3\\EF2 и H3K3\\EF3.

Докажем, что отрезок С3К3 выражает сумму а3х + Ь3у + c3z. Действительно, проведя дополнительно G3R3\\L и #3S3||Z, и используя подобие треугольников

найдем:

откуда

и окончательно

Рис. 11.

Но так как по условаю агх + Ъъу + c3z — <*з» т0 отрезок С3/е3 должен выражать заданное число d3. Отсюда ясно, как следует строить отрезок z, который мы временно считали известным: строим прямую L, точки О, Е, А3, ß3t С3, прямые ОМ, A3Nt В3Р, C3Q, точки Flt F2, прямые EFU EF2, 003, 03Н3, как выше указано; затем на прямой C3Q откладываем отрезок, выражающий d3% после чего соединяем К3 с Н3 и проводим ^зЦЯд/Сз. Из приведенного доказательства следует, что отрезок OF3 будет выражать третье неизвестное z.

Следует отметить, что при практическом решении систем графическим способом нет необходимости для каждого неизвестного строить отдельный чертеж, как это было сделано выше, чтобы сделать изложение более понятным. Всю систему треугольной формы можно решить на одном чертеже (см. решение задачи 16, рис. 12).

Задача 16. Решить графически систему

Приведение системы к треугольному виду выполнено на рис. 11 в соответствии с изложенным в п. 1,6), с тем только отличием, что исключение z производится из первых двух уравнений, а в п. 1,6) на рис. 7 переменное z исключалось из первого и третьего уравнений. Систему треугольной формы считаем представленной прямыми /б, /4 и 1{.

На рис. 12 дано решение полученной системы треугольной формы, выполненное в соответствии с изложенным в п. 2, а), б), в), но все построение дано на одном чертеже.

Решение системы дается отрезками OFv OF2, OF3. Измерение их показывает, что х = Ъ, у==—1, z = 2.

Рис. 12.

УПРАЖНЕНИЯ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ

27. Решить графически систему

28. Решить графически систему

29. Обобщая изложенный метод на системы четвертого порядка, решить графически систему

ОТВЕТЫ И УКАЗАНИЯ К УПРАЖНЕНИЯМ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ

5. Один из возможных видов решений:

(р — произвольно).

6. Система решения не имеет.

при а = О решений нет; при

х = р, у = \ (р — произвольно),

б) При я = 20, Ъф 15 и при а = —20, M - 15 система несовместна.

в) При а =20, *= 15:

13. При а 45° решений нет.

14. Воспользоваться развернутым выражением определителя.

15. л: = 4, у = —3, z = 7.

16. а) При аф 5, а Ф —7 имеем

б) При а = —7, & 2 и при а = 5, b ф2 система несовместима.

в) При а = — 7, ^ = 2:

X = pt у — Ър— 1, z = —р (р — произвольно),

г) При а = 5, * = 2:

X = 7р, у = 33р— 1, z=\7p

(р— произвольно).

17. а) При а Ф 3, с Ф —6 имеем

б) При а = —6, b Ф—24 система несовместна.

в) При а = —6, 6 = —24:

X = 4 + 6/?, j/ = 3/7, z — —2/7 (/7 — произвольно).

г) При а = 3, ft =7^= 12 система несовместна.

д) При а = 3, £=12:

лг = 4 — 2/7+3<7, У = р, z = q

(/?, # — произвольны).

18. Система несовместна.

19. *= 114,5; .у = 31,6; *=1,6.

20. х = 2,005; 3/ = —1,017; * = —4,032.

21. Если уравнения писать в виде

аьх + fyj/ + dfi — et (I = 1, 2, 3, 4)

и поправки для неизвестных х, yt z, t обозначать соответственно через а, ß, if, 8, то поправки вычисляются по формулам:

Вычислительная схема получается аналогично приведенной на стр. 64; число столбцов увеличивается до 16, число строк для вычисления очередной поправки — 4.

22. х = 3,12; у = — 3,77; z = 0,95; * = —1,93.

23. Следует составить новую таблицу значений таких переменных:

Затем по новой таблице построить в прямоугольной системе координат приближенный график функции; если этим графиком окажется примерно прямая линия, то ответ утвердительный.

24. Способом наименьших квадратов:

ö = 2,33; Ь= 1,761.

25. Способом наименьших квадратов:

Борис Евсеевич Маргулис.

Системы линейных уравнений.

Редактор а. ф. Лапко. Техн. редактор Е. а. Ермакова. Корректор С. Н. Емельянова.

Сдано в набор 30/111 1960 г. Подписано к печати 27/VII 1960 г. Бумага 84x108/32. Физ. печ. л. 3.0. Условн. печ. л. 4,98. Уч.-изд. л. 4,92. Тираж 30 000. Т-10131. Цена книги 1 р. 50 к. С 1/1 1961 г. цена 15 к. Заказ № 1310.

Государственное издательство физико-математической литературы. Москва, В-71, Ленинский проспект, 15.

Типография № 2 им. Евг. Соколовой УПП Ленсовнархоза. Ленинград, Измайловский пр., 29.

Цена 1 p. 50 к.

С 1/1 1961 г. цена 15 к.

ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ

ПОПУЛЯРНЫЕ ЛЕКЦИИ ПО МАТЕМАТИКЕ

Вып. 1. А. И. Маркушевич. Возвратные последовательности.

Вып. 2. И. П. Натансон. Простейшие задачи на максимум и минимум

Вып. 3. И. С. Соминский. Метод математической индукции.

Вып. 4. А. И. Маркушевич. Замечателяные кривые.

Вып. 5. П. П. Коровкин. Неравенства.

Вып. 6. Н. Н. Воробьев. Числа Фибоначчи.

Вып. 7. А. Г. Курош. Алгебраические уравнения произвольных степеней.

Вып. 8. А. О. Гельфонд. Решение уравнений в целых числах.

Вып. 9. А. И. Маркушевич. Площади и логарифмы.

Вып. 10. А. С. Смогоржевский. Метод координат.

Вып. 11. Я. С. Дубнов. Ошибки в геометрических доказательствам

Вып. 12. И. П. Натансон. Суммирование бесконечно малых величин.

Вып. 13. А. И. Маркушевич. Комплексные числа и конформные отображения.

Вып. 14. А. И. Фетисов. О доказательствах в геометрии.

Вып. 15. И. Р. Шафаревич. О решении уравнений высших степеней.

Вып. 16. В. Г. Шерватов. Гиперболические функции.

Вып. 17. В. Г. Болтянский. Что такое дифференцирование?

Вып. 18. Г. М. Миракьян. Прямой круговой цилиндр.

Вып. 19. Л. А. Люстерник. Кратчайшие линии.

Вып. 20. А. М. Лопшиц. Вычисление площадей ориентированных фигур.

Вып. 21. Л. И. Головина И И. М. Яглом. Индукция в геометрии.

Вып. 22. В. Г. Болтянский. Равновеликие и равносоставленные фигуры.

Вып. 23. А. С. Смогоржевский. О геометрии Лобачевского.

Вып. 24. Б. И. Аргунов и Л. А. Скорняков. Конфигурационные теоремы.

Вып. 25. А. С. Смогоржевский. Линейка в геометрических построениях.

Вып. 26. Б. А. Трахтенброт. Алгоритмы и машинное решение задач.

Вып. 27. В. А. Успенский. Некоторые приложения механики к математике.

Вып. 28. Н. А. Архангельский и Б. И. Зайцев. Автоматические цифровые машины.

Вып. 29. А. Н. Костовский. Геометрические построения одним циркулем.

Вып. 30. Г. Е. Шилов. Как строить графики.

Вып. 31. А. Г. Дорфман. Оптика конических сечении.

Вып. 32. Е. С. Вентцель. Элементы теории игр.

Вып. 33. А. С. Барсов. Что такое линейное программирование.

Вып. 34. Б. Е. Маргулис. Системы линейных уравнений.