УНИВЕРСИТЕТСКИЕ УЧЕБНИКИ И УЧЕБНЫЕ ПОСОБИЯ

И. П. Костенко

ВЕРОЯТНОСТЬ и СТАТИСТИКА

Курс лекций и упражнений

И. П. Костенко

Вероятность и статистика

Курс лекций и упражнений

Издание 2-е, исправленное и дополненное

Допущено Научно-методическим советом по математике Министерства образования и науки Российской Федерации в качестве учебного пособия для высших технических учебных заведений

Москва ♦ Ижевск 2012

УДК 519.2(075) ББК 22.17я7 К72

Костенко И. П.

Вероятность и статистика. Курс лекций и упражнений. — 2-е изд., испр. и доп. — М.-Ижевск: НИЦ «Регулярная и хаотическая динамика», 2012. —380 с.

В книге даётся дидактически проработанное изложение основ теории вероятностей и математической статистики в органическом единстве с приложениями. Материал представлен в виде 14 лекций, к каждой из которых разработана система упражнений-задач, согласованных с содержанием лекции.

Изложение подробное и частично проблемное. Цель — стимуляция мышления и действий учащегося для достижения осмысленного понимания. Органически взаимодействуют теория и практика. Основные понятия и теоретические обобщения подготавливаются и мотивируются примерами. Лекции структурированы на небольшие разделы, имеющие учебную цель, достижение которой учащийся может проверить с помощью контрольных заданий.

Своеобразным итогом курса служит лабораторная работа, посвященная решению первых основных задач математической статистики средствами компьютерной программы Mathcad. Порядок её выполнения и смысл действий детально разъясняются.

Книга ориентирована на студентов технических специальностей вузов, для которых на курс математики отводится 300-360 учебных часов. Но её содержание, в основной части, доступно широкому кругу пользователей — от школьников и учителей до специалистов. Неформальность языка и подробность подачи материала позволяет понять его любому читателю, способному логично мыслить. Методика изложения может быть интересна преподавателям вузов и студентам педуниверситетов.

Рецензент первого издания: акад. РАО, д. ф.-м. н., проф. И. И. Баврин. Рецензент второго издания: зав. кафедрой высшей математики СПбГПУ, д.т.н., проф., чл.-корр. МАН ВШ В. И. Антонов.

ISBN 978-5-93972-913-0 ББК 22.17я7

©И. П. Костенко, 2012

© НИЦ «Регулярная и хаотическая динамика», 2012

http://shop.rcd.ru http://ics.org.ru

СОДЕРЖАНИЕ

Предисловие...................................................................... 8

ЛЕКЦИЯ 1. ПОНЯТИЕ ВЕРОЯТНОСТИ......................... 15

Введение. Что мы будем изучать?..................... 15

1. Терминология: опыт, событие, эксперимент.......................... 17

2. Закон устойчивости относительных частот. Эмпирическая вероятность............................................ 18

3. Элементарный расчёт вероятностей.................................... 22

4. Равновозможные события................................................. 24

5. Несовместимые и совместимые события.............................. 25

6. Полные и неполные группы событий.................................. 27

7. Классическая вероятность................................................ 28

8. Статистическая вероятность............................................. 30

9. Геометрическая вероятность............................................. 31

10. О понятии вероятности................................................... 33

11. Упражнения.................................................................. 34

ЛЕКЦИЯ 2. РАСЧЁТ ВЕРОЯТНОСТЕЙ, КОГДА ИСХОДОВ МНОГО........................ 38

1. "Дерево" исходов........................................................... 38

2. Обобщение: принцип умножения....................................... 40

3. Формула числа сочетаний................................................ 41

4. Типовые задачи с шарами................................................ 43

5. Вероятность хотя бы одного события................................. 45

6. Вероятностные модели................................................... 46

7. Вывод формулы числа сочетаний....................................... 49

8. Упражнения.................................................................. 52

ЛЕКЦИЯ 3. РАСЧЁТ ВЕРОЯТНОСТЕЙ С ПОМОЩЬЮ ТЕОРЕМ СЛОЖЕНИЯ И УМНОЖЕНИЯ... 55

1. Сумма и произведение событий........................................ 55

2. Совместимые и несовместимые события............................. 57

3. Наводящие соображения к теоремам сложения..................... 57

4. Теоремы сложения вероятностей....................................... 59

5. Наводящие соображения к теореме умножения..................... 61

6. Условная вероятность...................................................... 61

7. Зависимые и независимые события..................................... 63

8. Теорема умножения вероятностей...................................... 66

9. Обобщение теоремы сложения.......................................... 67

10. Обобщение теоремы умножения....................................... 69

11. Методика решения задач.................................................. 71

12. Упражнения.................................................................. 75

ЛЕКЦИЯ 4. РАСЧЁТ ВЕРОЯТНОСТЕЙ В СХЕМЕ С ПОВТОРЕНИЕМ ОПЫТОВ.... 81

1. Примеры..................................................................... 81

2. Обобщение: задача и формула Бернулли.............................. 83

3. Вывод формулы Бернулли................................................ 85

4. Приближённое решение при большом числе опытов............... 88

5. Приближённое решение при очень малых вероятностях........... 92

6. Вывод формулы Пуассона................................................ 94

7. Вторая задача................................................................ 96

8. Правило Муавра-Лапласа................................................ 98

9. Упражнения................................................................. 100

ЛЕКЦИЯ 5. ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ (основные понятия)..................................... 106

1. Пример, приводящий к случайной величине......................... 106

2. Понятие случайной величины (св.).................................... 108

3. Абстрактные с.в............................................................. 111

4. Дискретные (д.с.в.) и непрерывные с.в................................. 113

5. Математическое задание д.с.в........................................... 115

6. Среднее значение........................................................... 117

7. Степень разбросанности значений...................................... 120

8. Среднее квадратическое отклонение................................... 123

9. Класс геометрических распределений................................. 124

10. Упражнения................................................................ 128

ЛЕКЦИЯ 6. НАЧАЛА МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ......... 132

1. Статистический ряд........................................................ 133

2. Группированный статистический ряд................................. 136

3. Гистограмма. Полигон..................................................... 139

4. Статистическое среднее................................................... 141

5. Статистическая дисперсия................................................ 144

6. Другие оценки M и D..................................................... 146

7. Сравнение оценок. Точность и надёжность оценки................. 148

8. Упражнения.................................................................. 151

ЛЕКЦИЯ 7. БИНОМИАЛЬНЫЕ С.В.............................. 155

1. Пример полезности теории............................................... 156

2. Условия возникновения биномиальной св. (б.с.в.).................. 158

3. Как зависит распределение б.с.в. от её параметров?................ 160

4. Правило "трёх сигм" для б.с.в........................................... 162

5. Как доказать формулу Mä = k-р7......................................... 164

6. Сумма случайных величин. Биномиальная св. - сумма простейших............................... 166

7. Математические ожидания суммы св. и биномиальной с.в....... 168

8. Независимые случайные величины..................................... 170

9. Дисперсия суммы св. Дисперсия биномиальной с.в................. 174

10. Упражнения.................................................................. 176

ЛЕКЦИЯ 8. ПУАССОНОВСКИЕ С.В............................. 180

1. Математическое задание класса Пуассоновских с.в. (П.с.в.)...... 180

2. Как распределение П.с.в. зависит от параметра?.................... 182

3. Математическое ожидание и дисперсия П.с.в........................ 184

4. Статистический признак П.с.в........................................... 187

5. Когда биномиальная с.в. превращается в Пуассоновскую?....... 190

6. Поток событий.............................................................. 192

7. Стационарный поток...................................................... 194

8. Поток без последействия.................................................. 196

9. Ординарный поток......................................................... 198

10. Число событий простейшего потока подчиняется закону Пуассона..................................................................... 198

11. Упражнения.................................................................. 202

ЛЕКЦИЯ 9. НЕПРЕРЫВНЫЕ С.В. ЗАКОН РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ 204

1. Дискретные и непрерывные с.в. (различие)........................... 204

2. Два примера непрерывных с.в. (н.с.в.)................................. 207

3. Распределение появившихся значений с.в............................ 208

4. Распределение вероятностей с.в. тм.................................... 211

5. Распределение вероятностей с.в. Tô.................................... 213

6. Плотность распределения................................................ 216

7. Задача о попадании значений н.с.в. в заданный интервал......... 219

8. Парадоксы нулевых вероятностей....................................... 221

9. Упражнения.................................................................. 223

ЛЕКЦИЯ 10. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ Н.С.В.... 225

1. Математическое ожидание................................................ 226

2. Дисперсия.................................................................... 229

3. Среднее квадратическое отклонение................................... 232

4. Свойства M и D (линейные операции над св.)..................... 234

5. Медиана. Мода.............................................................. 238

6. Система числовых характеристик....................................... 240

7. Асимметрия. Эксцесс...................................................... 242

8. Упражнения................................................................. 244

ЛЕКЦИЯ 11. ТИПЫ СЛУЧАЙНЫХ ВЕЛИЧИН (равномерные, показательные, нормальные)....... 248

1. Примеры равномерных св. (типовое свойство)..................... 249

2. Исследование равномерного распределения (зависимость от параметров, числовые характеристики, попадание в интервал)...................................................... 251

3. Показательные св., их связь с потоком событий.................... 253

4. Исследование показательного распределения........................ 255

5. Приложение результатов исследования............................... 259

6. Нормальные св.............................................................. 263

7. Исследование нормального распределения........................... 266

8. Правило "трёх сигм". Оценка ошибки................................. 272

9. Упражнения.................................................................. 275

ЛЕКЦИЯ 12. ПРИЛОЖЕНИЯ ФОРМУЛЫ ГАУССА....... 278

1. Почему нормальные св. распространены в природе?............... 278

2. Центральная предельная теорема....................................... 280

3. Нормальное распределение - предел биномиальных............... 283

4. Обоснование формул Муавра-Лапласа................................. 286

5. Точность и надёжность оценки математического ожидания...... 290

6. Точность и надёжность оценки дисперсии............................ 294

7. Оценка вероятности по относительной частоте...................... 296

8. Упражнения................................................................. 302

ЛЕКЦИЯ 13. ВЫРАВНИВАНИЕ СТАТИСТИЧЕСКИХ РЯДОВ. ПРОВЕРКА ПРАВДОПОДОБИЯ ГИПОТЕЗ 306

1. Начальные задачи математической статистики....................... 306

2. Подбор функции-плотности.............................................. 310

3. Хи-квадрат распределение................................................ 312

4. Проверка правдоподобия гипотезы о согласованности теоретического и статистического распределений.

Критерий согласия Пирсона............................................. 316

5. Программа применения критерия Пирсона к дискретным св.... 320

6. Применение критерия Пирсона к непрерывным св................. 324

7. Упражнения.................................................................. 329

ЛЕКЦИЯ 14. ФОРМУЛА ПОЛНОЙ ВЕРОЯТНОСТИ. ФОРМУЛА БАЙЕСА. ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ. КОРРЕЛЯЦИЯ............... 335

1. Формула полной вероятности........................................... 335

2. Формула Байеса............................................................ 338

3. Функция распределения дискретной с.в............................... 339

4. Функция распределения непрерывной с.в............................ 341

5. Корреляционная зависимость между с.в.............................. 344

6. Оценка тесноты линейной корреляционной связи. Выборочный коэффициент корреляции............................... 349

7. Заключение.................................................................. 351

ЛАБОРАТОРНАЯ РАБОТА: "Построение эмпирических распределений и расчет числовых характеристик случайных выборок с помощью компьютерной программы Mathcad."............................... 353

ПРИЛОЖЕНИЯ (таблицы)...................................................... 373

ЛИТЕРАТУРА..................................................................... 377

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ................................................. 378

Предисловие

Современные учебные курсы математики составляются под сильным влиянием научной Системы, т. е. под влиянием абстрактной логической Формы, в которую пакуются Знания. Характерные особенности курсов: дедуктивная организация содержания ("от общего к частному"), формальная строгость определений и доказательств, "логическая завершённость". Эти качества сильно затрудняют понимание предмета и даже делают его невозможным, потому что вступают в неодолимое для новичка противоречие с психологическими закономерностями восприятия нового.

Нормальный, естественный процесс человеческого познания всегда идёт "от конкретного к абстрактному", от примеров к постепенным обобщениям, от менее точного понимания к более точному. Так идёт процесс научного познания. Так должен идти и нормальный, правильный процесс обучения. Если же процесс подменяется итогом, познание умерщвляется.

В этой книге я стремился организовать процесс познания ученика, максимально помочь и облегчить ему труд познания, сделать этот всегда не лёгкий труд посильным и, может быть, даже увлекательным. Такова педагогическая цель книги. Насколько удалось достичь этой цели, пусть судит уважаемый и любимый мною Читатель. Передо мной всегда стоял обобщённый образ Учащегося, сконцентрировавший взгляды, жесты, реплики, серьёзные или весёлые лица, разочарование или радость тысяч студентов, прошедших в течение более сорока лет преподавания.

Профессионал-педагог, надеюсь, будет снисходителен к замеченным недостаткам, понимая огромную сложность и длительность труда создания учебной книги, полезной Ученику, а не автору. Труд этот длиною в жизнь.

Поскольку сверхзадача книги - "ориентировка на понимание" (акад. Н. Н. Лузин), необходимо раскрыть её педагогические принципы.

Абстракции не могут быть поняты, если не наполнены конкретным и образным содержанием. Основная причина непонимания математики учащимися - отсутствие или недостаток в их опыте необходимой конкретики, примеров и образов (!), оживляющих математические абстракции (понятия, теоремы, формально-логические рассуждения). Отсюда первый принцип органического взаимодействия теории и практики: изложение должно начинаться с примеров и развиваться во взаимодействии конкретного и абстрактного - через анализ примеров и постепенные обобщения к точным формальным определениям и утверждениям. Именно так вводится понятие классической вероятности в первой лекции.

Второе необходимое условие понимания - активность учащегося. Он сам должен добиваться понимания. Обязанность учителя - постоянно стимулировать познавательную активность ученика и давать ему "пищу". Методические средства для решения этой задачи - насыщение изложения посильными элементами проблемности и контрольные упражнения в конце каждого раздела лекции. Цель - самопроверка понимания и его коррекция. Я старался так составлять эти упражнения, чтобы они чуть-чуть выходили за пределы изложенного. Чуть-чуть! Стимуляция самостоятельных действий учащегося — второй принцип.

Итак, путь выбран - через конкретику и самостоятельные действия учащегося. И перед учителем встаёт очередная педагогическая задача: как облегчить ученику этот путь? В психологии установлено, что главным фактором, определяющим способность человека выполнять любую умственную работу, является степень его психической перегрузки в этой работе. Следовательно, учитель, желающий действительно помочь ученику, должен структурировать материал на цельные и не перегруженные учебные порции, а внутри каждой такой порции очень подробно излагать материал. Структурирование материала - третий принцип, подробность изложения — четвёртый.

Отметим, что принцип подробности не так тривиален, как может казаться. Его нарушение - одна из основных причин непонимания. Степень подробности изложения определяется практикой, - длительными наблюдениями за ошибками и затруднениями учащихся.

Реализация отмеченных выше принципов затрагивает проблему отбора материала. Приходится довольно жёстко препарировать традиционное содержание, отбрасывая много привычного, что на поверку оказывается второстепенным, загромождает текст, мешает читателю сосредоточиться на главном. Это составная часть пятого принципа фундаментализации, - надо отобрать минимально необходимый материал, который бы составлял, тем не менее, целостную научно-педагогическую систему и был фундаментом для дальнейшего самостоятельного расширения знаний. В результате, вне этой системы оказались многомерные случайные величины, функции случайных величин, теория случайных процессов. Впрочем, первоначальное представление об этих разделах даётся (корреляционная зависимость, линейные функции случайных величин, Пуассоновские потоки).

Поясню особенности содержания. Книга посвящена одному из разделов общеинженерного курса высшей математики, который в министерских программах назывался: "Теория вероятностей. Математическая статистика". Эта дисциплина особенно актуальна для приложений в самых различных сферах - в технике, физике, биологии, генетике, лингвистике, экономике, экологии, социологии. И она особенно трудна для преподавания и усвоения, потому что требует нового мышления - не однозначно детерминированного, как в классической математике, а вероятностного.

Общая структура курса проста - три цельных взаимосвязанных части: 1. Расчёт вероятностей (лекции 1-4); 2. Дискретные случайные величины с элементами математической статистики (лекции 5-8); 3. Непрерывные случайные величины с элементами статистики (лекции 9-13). В оглавлении эти части явно не обозначены, чтобы не нарушать общей цельности курса. Последняя 14-я лекция дополнительная.

Каждая лекция состоит из небольших разделов, имеющих чёткую учебную цель, достижение которой проверяется контрольными заданиями. Структурирован и каждый раздел лекции, - его фрагменты выделены отступами и своеобразными подзаголовками, набранными разрядкой.

Опытный преподаватель, конечно, обратит внимание на то, что статистика не выделяется в отдельный раздел. Она органически вплетается в теорию случайных величин. Это новое и принципиальное методическое решение, - следствие первого руководящего принципа. Ведь только от практики, только статистически можно мотивировать введение числовых характеристик, сделать понятным их смысл и практическую ценность. Смысл фундаментального понятия плотности распределения непрерывной случайной величины также не может быть понят без обращения к статистике, к процессу предельного перехода от статистической плотности к теоретической. Принципиальную связь теории и практики подчёркивает название книги "Вероятность и статистика".

Особенностью книги, отличающей её от других, является методологической принцип - теоретические вероятностные расчёты доводить до реальных практических прогнозов, которые могут быть статистически проверены. Поэтому первое издание называлось "Введение в вероятностное прогнозирование". Новое название возникло под влиянием Бюро НМС, дававшего гриф и обратившего внимание на необходимость соответствия названия книги номенклатуре разделов программы курса математики.

Таким образом, приоритет конкретики и смыслов делает книгу не "теорией вероятностей", а "введением" и не только в теорию, а в практику использования теории. "Введение" ещё и потому, что содержание не охватывает весь материал абстрактных программ, - оно определяется реальным учебным временем и возможностью его усвоения (а не изложения) за это время реальными студентами. Учебное время, которое отводится современными учебными планами на весь курс математики для большинства технических специальностей втузов составляет 300-360 часов. Из них на теорию вероятностей и статистику выпадает около 50 часов (один семестр). На это учебное время и рассчитан курс. Дальнейшее изучение предмета может идти по книгам [2, 3, 9].

Закономерен вопрос: почему "курс лекций" а не обычная учебная книга с главами и параграфами? Этот вопрос требует развёрнутого ответа.

Данная книга создавалась в течение многих лет практического преподавания. Одна из постоянных и трудных педагогических задач была -

структурировать материал так, чтобы каждая лекция и связанное с ней практическое занятие составляли цельную, в некотором смысле завершённую часть курса, направлялись одной целью, идеей, задачей. Это важное педагогическое требование правильного обучения - экономного, сосредоточенного, эффективного. Надо было преодолеть обычную в нашей повседневной работе хаотичность "чтения лекций" и не связанных с ними практических занятий. Надо было уложить цельные куски в стандартное учебное время, не перегрузив восприятие студентов.

В конце 1980-х гг., когда появилась возможность размножать ротапринтом внутривузовские учебные пособия, был издан первый вариант лекций (две части). И возникла идея использовать печатные тексты на занятиях. Эта идея реализовалась в виде новой формы учебного процесса -индивидуальной самостоятельной работы студента с текстом под руководством преподавателя в течение четырёх учебных часов (лекция и практика совмещены) с одним перерывом. Плюс два часа домашней работы. Технология проведения таких занятий подробно описана в статье "Аудиторная самостоятельная работа студентов с учебным текстом" (журнал "Высшее образование в России", 1995, № 1, с. 101-105).

Несколько лет апробации выявили несоответствие структуры используемого текста учебному времени и возможностям студентов, а также много элементов текста, плохо или искажённо понимаемых, требующих изменения. Психологический анализ студенческих ошибок привёл к новым методическим решениям. В результате, тексты пришлось коренным образом переработать, - необходимая для учебной книги корректива практики.

Второй, усовершенствованный вариант "Лекций" и предлагается читателю. Язык изложения приближен к разговорному, к языку обычной лекции. Таков и диалог с аудиторией: "вы помните...", "у вас может возникнуть вопрос...", "обращаю ваше внимание...", и т. п.

Вместе с тем, не следует думать, что данный текст есть конспект лекций. Ведь, реальная лекция ориентируется на конкретную аудиторию, -её содержание, форма и методические приёмы зависят от возможностей аудитории и задач лектора. Я старался строить содержание каждой лекции так, чтобы его можно было варьировать, расширяя или сужая, оставляя неизменным смысловое ядро. И заботился дать дополнительную "пищу" способным и вдумчивым учащимся. Так что тексты лекций шире и глубже того материала, который можно заключить в "живую" лекцию. Это тексты для чтения и углублённого изучения содержания "живой" лекции.

Органическую (а не дополнительную) часть книги составляют задачи. Каждая лекция завершается не малым количеством упражнений-задач, тесно связанных с её содержанием. Подбор и расположение задач не случайны, цель - прояснение и углубление понимания всего, изложенного в лекции. Поэтому они названы упражнениями. Среди них есть тренировочные, несколько искусственные. Но, вообще, я старался искать задачи инте-

ресные, "жизненные" и с реальным прикладным содержанием. Часть их взята из литературы, часть - составлена независимо. Ответы даются не ко всем задачам - это полезно для воспитания уверенности в собственном мышлении.

В тексте использован мелкий шрифт для более глубокого или детального изложения и обоснования, которое при первом чтении можно пропустить. Можно и вообще не читать. Прочтут его читатели, стремящиеся к углублённому пониманию. Петитом набраны некоторые доказательства, выводы формул, пояснения, дополнения и обсуждения.

В интересах удобства ориентировки читателя нумерация определений, теорем, формул, примеров, таблиц и рисунков не сквозная, а своя в каждой лекции. Если возникает необходимость сослаться на материал из другой лекции, указывается номер лекции и номер её раздела (формулы).

В конце книги приведён список литературы, использованной при работе над данным курсом. Разумеется, он не исчерпывает всех книг, оказавших то или иное влияние. Здесь хочу с признательностью выделить трёх авторов: Е. С. Вентцель, Б. В. Гнеденко и американский педагог из далёкого прошлого Торнтон Фрай. Они поддержали, прояснили и укрепили мысли, к которым приводило меня преподавание теории вероятностей.

Е. С. Вентцель ещё в 1970-х гг. настойчиво утверждала дидактические идеи, которые я попытался реализовать: "учиться теории вероятностей непосредственно в ходе её практических приложений"; "Теория вероятностей и математическая статистика едины, их нельзя разобщать. Статистические идеи должны пронизывать курс с самого начала." (Сборник научно-методических статей по математике. 1978. Вып. 8). Более того, данную книгу можно рассматривать, как педагогическое развитие идей и материала книг Е. С. Вентцель [2, 3]. Понятия и терминология во многом соответствуют этим книгам.

Б. В. Гнеденко одобрил мои первые педагогические статьи и, смею думать, благословил мои педагогические усилия во время учёбы на ФПК МГУ в 1985 г. Т. Фрай показал огромную педагогическую ценность живого, неформального, ориентированного на реальность изложения математики. Оцените, к примеру, следующий его пассаж [8, с. 80]:

"Иногда содержание той или иной теоремы становится гораздо яснее, если мы, отбросив математическую щепетильность, сформулируем эту теорему на самом обывательском языке. Кажется, в данный момент мы имеем дело именно с таким случаем. Поэтому я приведу ещё следующую формулировку: Если вероятность некоторого события равна р, то при бесконечно большом числе испытаний относительная частота наверно будет равна р."

Думаю, такая формулировка вызовет признательность любого ученика и легкий шок у абстрактного преподавателя математики. Но, может быть, после этого он задаст себе вопрос: а почему, всё-таки, ученик лучше

воспринимает последнюю формулировку? Почему она ему понятна? И будет хорошо, если достанет серьёзности не торопиться с ответом. Заметьте, что эта формулировка не отрицает точной, которая тоже приводится Фраем. Она педагогически дополняет точную.

Книга Thornton С. Fry "Probability and its engineering uses" (обратите внимание, - не "Теория вероятностей", а просто "Вероятность") была издана в Нью-Йорке в 1928 г. и в 1934 г. переведена на русский язык А. Я. Хинчиным с очень лестным предисловием. Вообще, старые учебные книги полезно читать и изучать сегодня, - ведь, тогда, в 1920-30-х годах, ещё сохранялась педагогическая культура и не была утрачена связь преподавания математики с жизнью.

Итак, ещё один педагогический принцип понятного обучения (шестой) - неформальность языка, с помощью которого только и возможно насытить изложение смыслами. Однако, реализация этого принципа вступает в трудное противоречие с действующим сегодня в педагогической математике принципом строгого изложения. Надо бы разрешить это противоречие, обсудив и определив допустимые "нестрогости". В данной книге допускаются убедительные обоснования (например, лек. 12, п. 4) вместо строгих доказательств, неполные определения, - например, определения случайной величины (лек. 5, п. 3) и, следуя Е. С. Вентцель, - непрерывной случайной величины (лек. 9, п. 1). Можно найти и другие "нестрогости". Их оправданием всегда служит их педагогическая целесообразность.

Особо следует отметить, что данная книга базируется не на формальном, строго математическом определении вероятности, а на эмпирическом. Такой подход считал оправданным сам А. Н. Колмогоров: "Вероятность во втузе лучше всего определять как идеализированную частоту. При этом описывается, что существуют явления, в которых при большом количестве повторений имеется тяготение к определённой частоте и такая идеализированная частота называется вероятностью". [Проблемы преподавания высшей математики. М.: Высшая школа. 1961. С. 7]. Только такое, практически содержательное определение позволяет раскрыть учащимся смыслы теоретических понятий и довести их до реальных приложений-прогнозов.

Понятно, что на таком основании полное строго математическое изложение невозможно в принципе. Но оно и не нужно в учебном курсе, цель которого - понимание и практическая интерпретация научных фактов, а не приведение их в совершенную логически упорядоченную систему. В рамках частной вероятностной модели (классической) изложение ведётся вполне строго. При выходе за её пределы допускаются правдоподобные (Д. Пойа) рассуждения, в частности, аналогия.

Последний вопрос, на который должно ответить предисловие, - для какой категории читателей предназначается данный курс? Из вышеизложенного ясно, что курс создавался для использования в учебном процес-

се на самых разных специальностях технического вуза и ориентирован на реального студента. Однако, смею надеяться, что неформальное изложение и установка на понимание, делают его доступным более широкому кругу читателей, начинающих изучение вероятностей, - от школьника и учителя до специалиста в той или иной области.

Для понимания основного материала первых семи лекций не нужно никаких других математических знаний, кроме арифметики. Далее нужно знать функции, пределы, интеграл и ряды. И, конечно, нужна способность к последовательному, логичному, абстрактному мышлению.

Думается, что книга может быть полезна студенту педагогического вуза, как пример (удачный или нет, - покажет время) методической проработки математического материала, как пример перевода научной системы в педагогическую. В этом качестве она может заинтересовать и преподавателя, озабоченного той же проблемой, которая мучила меня долгие годы: почему учащиеся плохо понимают математику?

Если этот скромный труд поможет кому-то изменить отношение к математике или где-то повлияет на преподавание, буду счастлив. Сознаю многие несовершенства книги. Надеюсь, что практическое её использование выявит недоработки и подскажет пути улучшения. С благодарностью приму любую заинтересованную критику.

Первое издание книги показало, что она не бесполезна. Я получил много ценных замечаний, с учётом которых она доработана. Внесено также много стилистических и методических изменений, подсказанных студентами при её уже длительном использовании на учебных занятиях. Сравнительно с первым изданием, материал расширен, - добавлена лекция 13 (выравнивание статистических рядов, проверка гипотез), лекция 14 (формулы Байеса, корреляция) и лабораторная работа, решающая первые задачи математической статистики с помощью программы Mathcad.

Благодарю акад. РАО, проф. И. И. Баврина (МПГУ), давшего в 2003 г. первую "путёвку в жизнь" книге. Благодарю рецензента проф. В. И. Антонова (СПбГТУ), также положительно оценившего педагогические качества книги, - его советы позволили повысить её практическую ценность. Благодарю проф. Ю. Д. Максимова (СПбГТУ) и доц. Н. Н. Хромова-Борисова (СПбГУ) за строгую научную критику первого издания. Благодарю проф. В. Д. Селютина (Орловский госуниверситет), указавшего много неточностей в рукописи. Особая сердечная признательность моему другу Е. А. Данилову, доценту КубГУ, чутко помогавшему и морально поддерживавшему автора в многолетнем труде.

Автор.

Краснодар, 27 февраля 2011 г.

ЛЕКЦИЯ 1

ПОНЯТИЕ ВЕРОЯТНОСТИ

Введение. Что мы будем изучать?

Мы будем изучать теорию вероятностей. Это наука, которая умеет предсказывать будущее. Но не любое будущее и не абсолютно точно. Поясню.

Представьте, что вы подбросили монетку. Можно ли было заранее предугадать, какой стороной вверх она упадёт, - гербом или решкой? Вы ответите, что нельзя. Ну, а если бросить монетку с небольшой высоты и плашмя? Вы запротестуете, - не такой способ подбрасывания имелся в виду. А какой? Например, сложим ладони коробочкой, потрясём в ней монетку, чтобы она переворачивалась, и, разведя ладони, бросим её на широкий стол или в коробку. Конечно, при таких условиях результат можно угадать лишь случайно. Почему?

Вдумаемся, какие факторы влияют на результат? Их очень много: исходное положение монетки, величина и направление меняющихся сил, положение монетки в момент падения, неровность и упругость стола в точках соприкосновения его с монеткой, изменение движения воздуха и пр. и пр. Очевидно, что невозможно определить все эти факторы и однозначно рассчитать результат.

Другой пример - выстрел в мишень. Попробуйте сами перечислить несколько случайных факторов, которые влияют на траекторию полёта пули, а значит, и на результат (попадание - промах).

Подобные явления называют случайными явлениями. Точный прогноз здесь невозможен в принципе. Однако, если такое явление повторяется достаточно много раз (тогда оно называется массовым случайным явлением), кое-что предсказать становится возможно. Что же?

Представьте теперь, что монетка подбрасывается 100 раз подряд. Сколько раз появится герб, сколько - решка? Я знаю, что вы ответите: примерно по 50 раз. Вот вам и прогноз, который вы сами делаете. На каком основании? Очевидно, вы понимаете, что нет каких-то особых факторов, которые влияли бы больше (или меньше) на появление герба, нежели на появление решки. Оба эти результата "равноправны", равновозможны. И ваша интуиция делает вывод: если увеличивать число подбрасываний, то доли гербов и решек должны всё более и более уравновешиваться. Советую провести этот эксперимент и убедиться, что прогноз подтверждается практикой.

Обращаю внимание на качество прогноза -"примерно по 50 раз". Прогноз не абсолютно точный! Если, например, 20 студентов проделают этот эксперимент, то у каждого число гербов будет своё, но у большинства - близкое к 50. Заметьте, - могут быть и значительные отклонения от 50, но очень редко.

Теперь чуть усложним опыт: представьте, что сто раз подбрасываются две монетки. Сможете ли вы предсказать, сколько раз появится пара гербов? Думаю, что затруднитесь. Для ответа надо провести некое рассуждение. Как? Этому научит вас теория вероятностей. И очень скоро.

Мы начали с предельно простых примеров. Изучая теорию вероятностей, вы познакомитесь со многими сложными и практически ценными примерами. Приведу один. Как рассчитать надёжность сложного технического устройства? Другими словами, - как часто можно ожидать выхода из строя этого устройства за определённый период эксплуатации? Важность вопроса для конструктора и для эксплуатационника не нуждается в доказательствах. Без теории вероятностей им не обойтись!

Подведём итог. Что же изучает теория вероятностей? Она изучает реальные явления, которые обладают двумя свойствами: массовостью и случайностью. Массовость означает, что явление может повторяться достаточно много раз без существенного изменения условий его протекания. Случайность означает, что результаты зависят от множества "мелких" причин и каждый раз могут меняться, их нельзя точно предсказать. Прогноз, который позволяет делать знание теории вероятностей, выглядит так: при многократном повторении явления некоторый результат появится примерно в К% случаев.

Подчеркну ещё раз: теория вероятностей применима не ко всем случайным явлениям, а только к массовым. Она не станет отвечать на вопросы типа: какова вероятность, что одна футбольная команда выиграет матч у другой? Или: какова вероятность, что в ближайшие четверть века будет найдено эффективное средство, побеждающее рак? Футбольный матч и развитие науки можно рассматривать как случайные явления - команда может выиграть или проиграть, лекарство может быть найдено или нет. Но эти явления не обладают свойством массовости. Футбольные матчи, конечно, можно повторять, но при этом будут существенно меняться условия, влияющие на результат. Ситуация, отражённая во втором вопросе, вообще уникальна, неповторима. Тем не менее, людям хочется делать прогнозы и в подобных случаях. А раз хочется, они их делают. Следует понимать, что такие прогнозы субъективны, зачастую жизнь смеётся над ними.*) Ну, что? Поняли вы, что такое теория вероятностей? Думаю, не очень. Это естественно, - чтобы узнать, что такое грейпфрут, надо съесть

*) Современные научные разработки пытаются включить и субъективную вероятность (экспертные оценки) в методы объективного прогнозирования.

грейпфрут. Чтобы узнать, что такое теория вероятностей, надо её изучить. Изучение не быстрое и не лёгкое, но увлекательное и полезное. Желаю вам настойчивости.

А я постараюсь облегчить ваш труд подробными разъяснениями, конкретными примерами, предостережениями от ошибок и пр. Обратите особое внимание на контрольные упражнения в конце каждого раздела лекции, - их решение поможет вам проверить понимание и придаст уверенности. Учтите, - иногда, чтобы найти ответ, придётся перечитать раздел и глубже его понять.

Итак, за работу!

1. Терминология: опыт, событие, эксперимент

Объектом наших рассмотрений будет массовое случайное явление. Условимся называть его кратко опытом, а результаты - событиями. Уточним.

Определение 1. Опытом назовём процедуру, удовлетворяющую двум требованиям: 1) массовость - процедура может быть повторена достаточно большое число раз (в принципе, не ограниченное); 2) случайность - результаты процедуры (будем называть их событиями) при её повторении могут меняться и их нельзя точно предсказать.

Термин "опыт" несёт обобщённый смысл. В определении 1 не говорится, в чём состоит процедура, а указаны лишь два требования к ней. Поэтому термин можно применять к разнообразным конкретным ситуациям. Например, выстрел из орудия - опыт, попадание или промах - события. Изготовление детали на автоматическом станке - опыт, брак или не брак -события. Подбрасывание игральной кости - опыт, появление определённого числа очков - событие.

Условимся обозначать события большими латинскими буквами А,В,С,.... Когда их много, будем пользоваться индексами А]9 А2, Ак. Допустимы и другие обозначения, если они удобны в конкретной ситуации.

Определение 2. Экспериментом назовём процедуру, состоящую в многократном повторении одного и того же опыта.

Заметим, что эксперимент это тоже опыт, только более сложный. И следует чётко отличать "сложный" опыт-эксперимент от того "простого" опыта, из повторений которого состоит эксперимент.

Пример. Монета подбрасывается один раз. Это опыт, т. к. оба условия определения 1 выполняются. В этом опыте возможны два разных результата: событие Г - монета падает гербом вверх, событие Р -решкой вверх.

Если монетку подбрасывать, например, 10 раз, это будет опыт-эксперимент. В этом "сложном" опыте возможны иные события: А0 - герб не появился ни разу (все решки), Ах - герб появился ровно 1 раз, А2 - ровно 2 раза,..., А10 - ровно 10 раз. Возможны и другие события. •

Основные и случайные условия опыта. Обращаю ваше внимание на то, что конкретная монетка, с помощью которой производится опыт, может существенно влиять на результат. Вы скажете: а разве не всё равно, какой монеткой пользоваться? Но представьте неоднородную монетку, у которой одна сторона тяжелее другой, например, решка тяжелее герба. Если много раз повторять опыт с такой монеткой, то герб будет появляться чаще решки. А при подбрасывании однородной монетки герб и решка появятся с примерно одинаковой частотой. Значит, степень однородности монетки существенно влияет на результат и, следовательно, относится к основным условиям опыта. Опыт с подбрасыванием однородной монетки и опыт с неоднородной монеткой - два разных опыта. В дальнейшем, в примерах и задачах без специальных оговорок будем предполагать однородность монет.

Коробочка же, в которой мы трясём монетку (если только она не слишком плоская), относится к случайным условиям опыта, ибо она определяет множество факторов, которые не могут существенно повлиять на частоту появления Г или Р.

Добавление. В определении 1 мы назвали событиями результаты опыта, которые могут меняться от опыта к опыту. Такие результаты называют также случайными событиями. Но следует сказать ещё о двух видах событий (кроме случайных), которые фигурируют в теории вероятностей: достоверное событие происходит при любом выполнении данного опыта, невозможное событие - не происходит. В предыдущем примере достоверным будет событие Г + Р*) - появляется или герб, или решка, невозможным - ни герб, ни решка.

Контроль 1. Монетка подбрасывается два раза. Можно ли назвать эту процедуру опытом? Почему? Если "да", то в чём состоят основные условия опыта? Назовите несколько событий и обозначьте их. В чём состоит достоверное событие, в чём - невозможное? Как вы думаете, сколько всего событий в этом опыте?

Указание. Если вы затрудняетесь ответить сразу на эти вопросы, перечитайте текст ещё раз, останавливаясь на тех местах, которые помогут найти ответы. Ответ на предпоследний вопрос подскажет последний абзац текста: задумайтесь, - какое событие аналогично достоверному событию Г+Р?"

*) Знак суммы использован здесь преднамеренно: Г+Р - событие, которое получается в результате операции сложения событий. С этой операцией вы познакомитесь немного позже (лек. 3, п. 1).

2. Закон устойчивости относительных частот. Эмпирическая вероятность

Наша главная цель в этой лекции - научиться делать прогнозы в простых ситуациях. Для этого надо будет дать точное определение вероятности события и поупражняться в её вычислении. Но предварительно следует остановиться на законе природы, который позволяет делать вероятностные прогнозы. Если бы этому закону природа не подчинялась, теории вероятностей не было бы.

Задача. Выяснить, как часто можно ожидать появления двух гербов при многократном подбрасывании двух однородных монет.

Эксперимент. Возьмите две монетки, потрясите их в коробочке и бросьте на широкий стол или в открытую коробку (чтобы не закатывались). Запишите результат этого "простого" опыта, например, ГР - первая монетка упала гербом вверх, вторая - решкой. Повторите этот опыт & = 100 раз и полученные 100 результатов запишите в таблицу 1 (результаты первых десяти опытов запишите в первую колонку, вторых десяти - во вторую, и т. д.).

Таблица 1

1

2

3

4

5

6

7

8

9

10

1

ГР

РР

2

ГГ

РГ

3

ГР

ГГ

4

РГ

рр

5

РГ

ГР

6

ГГ

ГР

7

рр

РГ

8

ГР

ГГ

9

ГГ

рр

10

ГГ

ГР

Обработка результатов эксперимента. Таблица представляет результат эксперимента, так называемый первичный статистический материал, подлежащий обработке для выявления скрытой в нём закономерности. Проследим, как часто появляется ГГ с ростом числа опытов к.

Посчитайте, сколько раз у вас появилось два герба в первой серии из кх =10 опытов, получите число /,, его называют частотой (у меня вышло /, = 4). Запишите его во вторую строку таблицы 2.

Вычислите отношение р* =/,/10 (у меня р* = 0,4) - его называют относительной частотой, - и запишите в нижнюю строку таблицы 2.

Аналогично посчитайте /2 и р^0 = /2/20 и запишите их в соответствующие строки таблицы 2 (/2 — число двойных гербов после â:2 = 20 опытов, они подчёркнуты в первых двух колонках).

Так же посчитайте частоты /3,/4,...,/10 и относительные частоты р3*0, р4*,..., р10*, и запишите их в таблицу 2.

У меня после проведения эксперимента и обработки его результатов вышло вот что:

Таблица 2

к

10

20

30

40

50

60

70

80

90

100

1

4

6

11

14

16

20

23

25

27

29

р,о = 0,4

р* =0,3

0,37

0,35

0,32

0,33

0,33

0,31

0,31

0,29

Выводы. Проследим за изменением частот (третья строка). Во-первых, все частоты "близки" (расположены между 0,29 и 0,4), точнее, -отличаются друг от друга менее, чем на 0,12. Во-вторых, с ростом числа опытов они всё меньше отличаются друг от друга: к примеру, в первой половине опытов максимальная разность частот 0,1, во второй 0,04.

Продолжение эксперимента. А теперь наберитесь терпения и проведите опыт 500 раз (не пугайтесь! - попросите 5 своих друзей провести опыт по 100 раз, соберите результаты и вы будете иметь 500 опытов)*) Так же, как и выше, рассчитайте (используя калькулятор) частоты появления ГГ после 110, 120, 500 опытов и запишите их в таблицу 2, соответственно продолжив её. Получится новая таблица, состоящая из пяти экземпляров, подобных таблице 2, записанных друг под другом.

Итоговый вывод. Проследите, как и выше, за изменением относительных частот - вы заметите главную закономерность: относительные частоты приближаются**) к числу 0,25. Это закон природы, - кто бы ни проводил описанный эксперимент (разумеется, с однородными монетками), относительные частоты события ГГ будут приближаться к числу 0,25. Число это и является вероятностью события ГГ. Его смысл: с ростом числа опытов пара гербов появится примерно в 25% опытов. •

Совет. Знайте, что статистические закономерности проявляются отчётливо только на очень большом числе опытов. Полезно убедиться в этом лично. Настоятельно советую вам проделать-таки этот не очень сложный, хотя и требующий времени эксперимент. Сохраните ре-

*) Можно ускорить эксперимент, если трясти в коробочке не две, а сразу штук двадцать монет.

**) Приближение очень не равномерное: частоты приблизятся к 0,25, потом, вдруг, начинают отдаляться, потом вновь, как бы нехотя, приближаются к вероятности. При значительном росте числа опытов к эти колебания становятся всё меньше и меньше.

зультаты своего эксперимента - в дальнейшем на этом примере вы сможете конкретизировать новые понятия и, тем самым, лучше усвоить их.

Закон. Подмеченная в нашем эксперименте закономерность характерна для массовых случайных явлений. Сформулируем её в общем виде, предварительно определив необходимые термины.

Определение 3. Пусть в некотором опыте возможно случайное событие а. Пусть опыт повторен к раз (проведён эксперимент) и в результате событие а появилось / раз и не появилось к -1 раз. Частотой события а в данном эксперименте назовём число / появлений события а. Относительной частотой назовём отношение

(1)

Закон устойчивости относительных частот. С ростом числа повторений опыта относительные частоты события а неограниченно приближаются к некоторому числу р (а).

Надеюсь, вы понимаете, что мы не вывели закон устойчивости из одного примера. Примером мы лишь проиллюстрировали его. Выведен он из огромного множества примеров на протяжении долгой истории, в частности, - из практики азартных игр. Со времени начала изучения вероятности (XVII век) многие учёные проводили и анализировали разнообразные эксперименты, которые убеждали, что относительные частоты действительно обладают свойством устойчивости.

Число р(А), к которому приближаются относительные частоты события а, назовём эмпирической вероятностью события а.

Точное значение числа Р(а) во многих практических задачах найти невозможно. Да это и не нужно, ибо практика всегда удовлетворяется приближёнными значениями. Вместе с тем, есть ситуации, когда это число можно точно рассчитать теоретически без всякого опыта. Например, скоро (п. 4) мы простым рассуждением выведем, что р(ГГ) = 0,25. И это первая ваша задача - овладеть основными методами априорного расчёта вероятностей Р(а) (лек. 1-4).

Число р(а) можно назвать также вероятностным пределом относительных частот р*(/0, а процесс (реальный!) их приближения к числу р(а) - вероятностной сходимостью. Кратко будем записывать это так:

(2)

Примечание 1. Сходимость относительных частот р*к{л\ (к оо) к вероятности р(а) отличается от известной вам сходимости бесконечной числовой последовательности к пределу. Во-первых, нельзя задать всю последовательность относи-

тельных частот, - ведь, она получается в результате эксперимента и всегда конечна. Во-вторых, характер этой сходимости иной, - нельзя гарантировать, что, начиная с некоторого момента к > к(е), будут выполняться неравенства |р^(л)-р(л)| < е. Всегда возможны большие отклонения, как бы много опытов к ни проводилось. Однако, практика убеждает, что при значительном увеличении числа опытов такие отклонения будут встречаться очень и очень редко.

Примечание 2. Отметим также, что введённое выше понятие вероятностной сходимости не является определением в математическом смысле. Вы прочувствовали своеобразие этой сходимости на конкретном примере и, можно сказать, сформировали образ понятия, который поможет в дальнейшем (лек. 9, п.п. 7-8) без ошибок им оперировать, используя аналогию с известным вам из курса математического анализа понятием предела последовательности. Эта аналогия вполне оправдана, поскольку в строгой математической теории (аксиоматической) есть точное формальное определение вероятностной сходимости, из которого можно вывести свойства (почти-единственность предела и др.), аналогичные привычным свойствам пределов. Формальное определение, в сущности, является математической моделью реальных процессов, которые мы в книге назвали так же - вероятностной сходимостью. Вообще-то, следует различать реальность и её модель. Поэтому нашу сходимость следовало бы назвать эмпирической вероятностной сходимостью. Но это сделало бы термин излишне громоздким.

Контроль 2. Представьте ящик (его принято называть урной), в котором находятся 5 одинаковых по массе и размеру шаров - 3 белых и 2 чёрных. Опыт состоит в том, что после перемешивания вынимается наудачу (не глядя) один шар. Событие а произойдёт, если будет вынут белый шар. Как надлежит проверять закон устойчивости относительных частот? Опишите чётко последовательность своих действий.

3. Элементарный расчёт вероятностей

Итак, мы исходим из эмпирического представления о вероятности события а, как о числе р(А), к которому неограниченно приближаются (в вероятностном смысле) относительные частоты "Р*{а). Как было сказано выше, есть ситуации, когда это число можно точно рассчитать теоретически. Не хотите ли узнать, когда и как это можно сделать?

Начнём с примеров и будем постепенно уточнять формулировку правила. В итоге, придём к точному, так называемому классическому определению вероятности.

Пример 1. Рассмотрим простейший, знакомый вам опыт, - подбрасывание монетки. Как бы вы ответили на вопрос: чему равна вероятность появления герба (событие Г)? Другими словами, - каким числом разумно оценить степень ожидания герба?

Думаю, ход вашей мысли будет примерно таким. Есть два возможных результата опыта - появление герба и появление решки. Два равноправных шанса - Г и Р. За появление герба есть один шанс из двух.

Значит, имеет смысл сказать, что вероятность появления герба равна 1/2. Так же, как и вероятность появления решки. •

Будем обозначать вероятность буквой Р и писать Р(г)=Р(р) = 1/2.*) Полученное значение вероятности согласуется с экспериментальным фактом: если подбрасывать монетку много раз, то примерно в половине опытов будет появляться герб, в половине - решка. Эти результаты "равноправны" или, как теперь можем сказать, равновероятны.

Пример 2. Опыт состоит в том, что из урны, в которой находятся 5 одинаковых по размеру и весу шаров, занумерованных цифрами 1,2, 3, 4, 5, вынимается наудачу один шар (рис. 1). Какова вероятность, что появится шар с чётным номером (событие А)?

Очевидно, Р(А) = 2/5: всего возможно пять результатов опыта и только в двух появится событие А. Прогноз: если повторять опыт 100 раз, то примерно 40 раз появится чётный шар и 60 раз - нечётный. •

Кстати, правильно ли вы понимаете, что значит "повторить опыт много раз"? Можно ли повторить его 100 раз, если в урне всего 5 шаров? Но при повторении опыт не должен меняться, т. е. число шаров должно оставаться неизменным. Процедура повторения опыта должна быть следующей: вынули шар, записали его номер, бросили обратно в урну; вторично вынули случайным образом из пяти шаров один шар, записали номер, вернули его в урну и т. д.

Сформулируем правило, согласно которому мы действовали: 1) подсчитали количество всех результатов опыта - п; 2) выделили те результаты, при которых происходит событие А, — их число т; 3) поделили m на п. Полученное число т/п оценивает степень ожидания появления в опыте события А и называется вероятностью этого события.

Смысл вероятности: она указывает долю тех результатов повторяющегося опыта, при которых происходит событие А. Так, вероятность появления герба при подбрасывании монетки получилась у нас 1/2. Это значит, что если подбрасывать монетку к раз, то примерно в половине опытов должен появиться герб (если к = 100, то гербов около 50, если к = 150, то гербов примерно 75).

Контроль 3. Однородная игральная кость подбрасывается случайным образом. Какова вероятность появления А - чётного числа очков, В - числа очков, меньшего трёх? Сколько раз прогнозируете появление этих событий при повторении опыта 300 раз?

Рис. 1

*) Обозначение р исторически возникло от латинского слова "probabilitas" (вероятность).

4. Равновозможные события

Правило расчёта вероятностей, выведенное выше, необходимо уточнить. Формальное его применение нередко приводит к ошибкам. Проиллюстрируем примером характерную ошибку.

Пример 3. Опыт - однократное подбрасывание двух монет. Какие возможны результаты этого опыта? Каковы их вероятности?

Начинающие обычно рассуждают так. Возможны три результата: А - два герба; В - две решки; С - герб и решка. Значит, вероятности этих событий одинаковы и равны 1/3.

Однако, этот расчёт не согласуется с экспериментом: если проводить опыт много раз, то, как вы видели, относительные частоты события А будут приближаться не к 1/3, а к 1/4. Если, к тому же, подсчитать число опытов, в которых появляются "герб и решка" (событие С), то их окажется почти вдвое больше, чем опытов с результатом "два герба" (событие А). Значит, эти события не равновозможны.

Практика помогает нам понять ошибку в расчёте и углубить понимание вероятности. Правильный расчёт должен начинаться не просто с перебора всех результатов опыта, а с перебора равновозможных результатов. И теперь мы должны изменить группу результатов нашего опыта так, чтобы все они стали "равноправными", равновозможными.

Исправим ошибку. Результат С (герб и решка) надо разбить на два: ГР - первая монета падает гербом вверх, а вторая решкой; РГ - наоборот. Следует различать два этих результата, - они разные. Получаем не три, а четыре возможных результата: ГГ, РР, ГР, РГ.

Равновозможность этих результатов подтверждается экспериментом. Но если бы даже мы не знали, что скажет эксперимент, ответ нетрудно предугадать, - ведь нет факторов, отдающих предпочтение какому-то из четырёх результатов. "Четвёрка" эта обладает своеобразной симметрией.

Верное решение:

Согласование с экспериментом восстановлено. •

У вас, наверное, возник вопрос: какие события следует считать равновозможными? Как определять равновозможность?

Определение 4. Если с ростом числа опытов частоты событий А и В уравниваются, то их следует считать равновозможными (равновероятными).

Чтобы практически определить равновозможность событий, надо провести очень много опытов (вы это видели, если провели эксперимент с подбрасыванием двух монет).

При теоретическом расчёте нередко можно обойтись без эксперимента, - равновозможность событий некоторой группы бывает легко ус-

мотреть из соображений симметрии результатов опыта. Так было в примерах 1 и 2. В контроле 3 очевидны шесть "симметричных", равновозможных результатов: ах - появление одного очка, а2 - двух, аъ - трёх, а6 - шести очков. Конечно, предполагается, что игральная кость однородная.

Замечание. Между прочим, при подбрасывании игральной кости можно составить группу равновозможных результатов иначе, например, так: {л;л}где событие А состоит в появлении чётного числа очков, А - нечётного. С помощью такой группы можно рассчитать р(л) = 1/2, однако, нельзя найти, например, вероятность появления числа очков, меньшего трёх. Придётся воспользоваться первой группой {Лх ;А2;А3;АА;А5;А6},- получится р(в) = 216 = 1 /3.

Контроль 4. Опыт - случайное подбрасывание трёх монет один раз. Какова вероятность события а - все три монеты падают гербом вверх; события В - две монеты падают гербом вверх, одна решкой. Проведите два решения - неверное и верное, подобно тому, как сделано в примере 3. На основании вашего теоретического расчёта вероятности Р(а) сделайте прогноз: сколько раз появятся три герба, если повторить опыт 100 раз? Проверьте прогноз на досуге и сравните относительную частоту с вероятностью (какова разница?).

Указание. Для составления всех результатов опыта ("троек") удобно использовать результаты примера 3, добавляя к ним Г и Р.

5. Несовместимые и совместимые события

Мы установили важное требование, которому должна удовлетворять группа результатов опыта, построенная для расчёта вероятности, - равновозможность этих результатов. Есть ещё два требования, - они неосознанно учитывались в предыдущих примерах: несовместимость событий и полнота группы. Эти понятия тоже надо чётко определить и включить в точное определение вероятности.

Определение 5. Пусть в некотором опыте выделена группа событий {а]9а2,...,ак}. Будем говорить, что эти события несовместимые, если при каждом выполнении опыта они исключают друг друга. В противном случае события совместимые.

Другими словами, если в результате опыта не могут появиться сразу два каких-нибудь события этой группы, то события группы несовместимые. Если же возможен такой результат опыта, при котором появятся вместе два или более событий группы, то события совместимые - они не исключают друг друга.

В примере 1 два события Р и Г, очевидно, исключают друг друга: если при подбрасывании монетка упала гербом вверх, то не решкой же.

В примере 2 события А и А тоже несовместимы, - нельзя вынуть из урны одновременно чётный и нечётный шар. Если же в паре с событием А рассмотреть другое событие, например, В - вынут шар с номером, меньшим, чем 3, то А и В будут совместимыми. Действительно, если при выполнении опыта окажется вынутым шар с номером 2, то этот шар будет одновременно и чётным, и номер его меньше 3. Значит, в результате этого опыта появятся сразу два события - А и В.

В примере 3 (подбрасывание двух монет) группа {А,В,С} составлена из несовместимых событий, так же как и группа {ГГ,РР,ГР,РГ}. Рассмотрим два более сложных события: D - в результате подбрасывания двух монет хотя бы одна из них падает гербом вверх; Е - хотя бы одна падает решкой вверх. Событие D появится, если опыт даст один из трёх результатов, - запишем это так D = ГГ + ГР + РГ. Аналогично, Е = РР + ГР + РГ. Следовательно, есть два результата опыта, в которых появляются вместе события D и Е - они совместимые.

Предостережение. Совместимость событий не зависит от того или иного результата опыта. Не следует думать, что при одном выполнении опыта они могут быть совместимы, а при другом нет. От этой ошибки предостерегает фраза определения 5: "если при каждом выполнении опыта они исключают друг друга".

Следующий пример поможет вам представить наглядно свойства совместимости и несовместимости событий.

Пример 4. На биллиардном столе нарисованы три круга. Шар бросают на стол случайным образом. Если шар останавливается в первом круге, - происходит событие А, во втором, - В, в третьем, - С. События А, В и С несовместимые, при условии, что круги не пересекаются (рис. 2а). В случаях, когда некоторые круги пересекаются, события совместимые (рис. 26, 2в).

Рис. 2а Рис. 26 Рис.2в

Контроль 5. В урне десять одинаковых шаров, пронумерованных цифрами 1,2,3,...,10. Опыт состоит в вынимании одного шара наудачу. Событие А произойдёт, если появится шар с чётным номером, В - с номером, делящимся на 3, С - с номером, делящимся на 5. Какие пары этих событий совместимые, какие нет? Объясните. Равновероятны ли эти события? Почему? Придумайте свои три события так, чтобы они были равновозможными и несовместимыми.

6. Полные и неполные группы событий

Правило расчёта вероятностей (п. 3) начиналось с построения группы "всех результатов опыта". Затем мы уточнили эту фразу - результаты должны быть равновозможными и несовместимыми. Сейчас уточним, как понимать слово "всех"? Дело в том, что "все" результаты опыта не нужны для расчёта. Нужны те результаты, которые делают группу полной.*)

Определение 6. Пусть в некотором опыте выделена группа событий {а^а29...9ак}. Эта группа называется полной, если при любом выполнении опыта произойдёт хотя бы одно из событий группы. В противном случае, если при каком-то выполнении опыта может произойти событие, не входящее в группу, группа не полная.

В примере 1 группа {Г,Г} полная. Более того, она состоит из равновозможных и несовместимых событий.

В примере 2 группа {а9а} полная, события группы несовместимые, но не равновозможные. Группа [а,в], где В состоит в появлении шара с номером, меньшим, чем 3, не полная, потому что если результатом опыта будет шар с номером 3 или 5, то не произойдёт ни событие а, ни В. Эту группу можно дополнить, например, событием С - появление шара с номером 3 или 5. Группа {а,В,с} - полная, события группы не равновозможные и совместимые. По такой группе нельзя рассчитывать вероятности.

В примере 3 группа {д Е] - полная, события равновозможные, но совместимые - она не годится для расчёта вероятностей. Группа {ГГ,ГГ,ГГ} - не полная. Группа {ГГ,РР,ГР,РГ} - полная, состоит из равновозможных и несовместимых событий, - её мы и использовали для вычисления вероятностей.

Контроль 6. В условиях контрольного упражнения 5 определите, будет ли группа {а,В,с} полной? Объясните, почему? Если нет, дополните её. Можно ли по дополненной группе рассчитывать вероятности? Постройте две новые группы, удовлетворяющие всем трём требованиям для расчёта вероятностей. Можно ли с помощью ваших групп определить вероятность события F - вынут шар с номером, делящимся на 4?

Указание. Найдите результат опыта, при котором не произойдёт ни одно из событий а, В, с.

7. Классическая вероятность

Для точной формулировки определения вероятности осталось ввести один термин.

*) Надо иметь в виду, что для расчёта вероятностей разных событий опыта эти полные группы могут строиться по разному. Пример был в п. 4 (замечание).

Определение 7. Пусть в некотором опыте возможны события а и В. Будем говорить, что событие а благоприятствует событию В, если всякий раз, когда в результате выполнения опыта появится событие а, вместе с ним обязательно появится и В.

Заметьте, события а и В не обязательно одинаковы, - В может появиться в опыте и тогда, когда а не появилось. Так, в примере 3 событию D (хоть один герб) благоприятствуют три события группы {ГГ,РР,ГР,РГ}, а второе не благоприятствует.

И вот мы подошли к центральному пункту лекции. Определение вероятности, которое вы сейчас услышите, было осознано математиками в конце XVII века. В печати оно появилось в 1713 году в трактате знаменитого швейцарца Якоба Бернулли "Ars conjectandi" (Искусство предположений), изданном на латыни. Конечно, излагалось оно тогда иным языком.*) С тех пор данное определение стало фундаментом всего дальнейшего развития теории вероятностей. Его ценность проверена временем. Поэтому оно называется классическим.

Определение 8. Пусть в некотором опыте возможно событие а. Вероятностью (классической) этого события называется число В (а)**), которое рассчитывается так:

1) строится полная группа исходов***) (равновозможных и несовместимых событий) опыта и подсчитывается их число п ;

2) из построенной группы выбираются события, которые благоприятствуют искомому событию а, и подсчитывается их число m ;

3) производится деление

(3)

Примечание. Сравните определение 8 с правилом расчёта вероятностей, которое вывели в п. 3. Обратите внимание: вместо группы "всех результатов опыта" мы теперь употребили иное выражение - "полная группа исходов опыта". Понимаете ли вы необходимость этого различия? Поясняю.

В примере 3 (подбрасывание двух монет) полная группа исходов состоит из четырёх событий {гг,РР,ГР,Рг}. Но эти события не исчерпывают всех "результатов" опыта. Группа исходов не содержит, например, такого результата - D = ГГ+ ГР + РГ (хоть один герб) или Е = РР + РГ + ГР. Очевидно, можно составить подобным образом много других результатов - Г = ГГ + РР (монеты падают одинаково) и др. Вы видите -"все" результаты не нужны для расчёта вероятностей, нужны особые результаты - исходы опыта. Их также называют элементарными событиями, - из них с помощью операции сложения (с ней познакомитесь позже) строятся все другие события, которые называют составными.

*) Случаи, благоприятствующие событию а, назывались плодовитыми, другие - бесплодными.

**) Мы употребляем то же обозначение, что и для эмпирической вероятности, ибо они совпадают.

***) Вместо термина "исходы" употребляют также термины - "случаи", "шансы". В литературе термин "исходы" иногда применяется и к не равновозможным элементарным событиям.

Заметим также, что под фразой "все результаты опыта" мы с самого начала понимали, не осознавая этого, именно полную группу несовместимых событий. Однако, не предполагали их равновозможными. Согласитесь, что проведённый анализ сделал для нас понятие вероятности более ясным, точным и объективным.

Определение 8 имеет смысл не только для случайных событий, а и для достоверных и для невозможных. Вероятность достоверного события равна единице (оно происходит при любом исходе опыта, следовательно, т = п). Вероятность невозможного события равна нулю (ему не благоприятствует ни один исход и m = 0).

Из формулы (3) следует, что вероятность - это рациональное число, заключённое между нулём и единицей (ведь всегда m < я), т. е.

(4)

Между прочим, если в будущем при решении задач вы получите в ответе значение вероятности большее единицы, знайте, что вы сделали ошибку. Запомните это крепко!

Смысл вероятности р(А): это - то самое число, к которому неограниченно приближаются (в вероятностном смысле) относительные частоты P*{Ä) при многократном повторении опыта (см. п. 2).

Многочисленные доказательства этой закономерности даёт историческая практика.*) Выше вы убедились в её справедливости при подбрасывании двух монет: р*(ГГ)^^р(ГГ) = 1/4.

Замечание. При аксиоматическом построении теории вероятностей данная закономерность составляет содержание строго доказываемой теоремы Бернулли. Логический анализ позволяет развить эту теорему и открыть ряд других закономерностей. Все они объединены общим названием закона больших чисел. Содержательное представление об этом законе вы получите в конце курса.

Из закона устойчивости относительных частот и приближения их к вероятности (3), следует, что число "Р{а) обладает прогностической силой: зная р(А), можно предсказать, какой будет доля опытов, в которых появится событие а при многократном повторении этих опытов. Вероятность Р(а) есть правильная дробь, которая как раз и равна доле этих опытов. Предскажите, к примеру, сколько раз появятся два герба, если подбрасывать две монетки 130 раз?

Теперь обратим внимание на недостаток классического определения. Оно, в сущности, не определяет понятие вероятности, а даёт программу вычисления её значений в опытах, допускающих построение конечной группы равновозможных исходов. Программа расчёта очень проста - в этом её большая ценность. Но круг опытов, где эта программа работает, не широк, как увидите далее, - это, конечно, недостаток.

*) Бюффон подбросил монетку 24000 раз и получил относительную частоту появления герба 0,5005.

Контроль 7. В условиях примера 3 рассчитайте вероятность события D - хоть один герб. Проверьте выполнение всех условий определения 8 при расчёте. Обратитесь к вашей статистике (п. 2) и проверьте, приближается ли относительная частота события D к его вероятности?

8. Статистическая вероятность

Вот опыт, где классическая программа расчёта вероятности не работает.

Пример 5. Стрелок производит выстрел в мишень. Как рассчитать вероятность попадания?

Если идти классическим путём, надо начать с группы результатов опыта. Их всего два: выстрел попал в мишень (событие а) и не попал (событие а). Эти события, вообще говоря, не равновозможны и поэтому группа {а, а} не пригодна для вычисления Р{а). Конечную группу равновозможных исходов составить в данном опыте нельзя. Значит, определение 8 не применимо.

Вместе с тем, очевидно, что говорить о вероятности попадания имеет смысл - лучший стрелок имеет больше шансов поразить цель, нежели худший, он чаще попадает. Обратимся к экспериментальному методу.

Перед нами опыт, который может повторяться много раз без изменения основных условий. Следовательно, согласно закону устойчивости относительных частот, P*(À)—^Р(А) и за вероятность можно взять относительную частоту при достаточно большом числе опытов. Это обычно и делается на практике.

Определение 9. Статистической вероятностью*) события а в некотором опыте будем называть относительную частоту Р*{а) появления этого события в эксперименте, состоящем из достаточно большого числа повторений опыта:

p*U)~pU). (4)

Данное определение многозначно и не строго (что значит, - достаточно большое число повторений опыта?) Однако, эти недостатки не мешают его практическому приложению, - выручает закон стабилизации относительных частот.

Оценка ошибки. Статистическая вероятность - это приближённая вероятность. Возникает вопрос: а можно ли быть уверенным, что вычисленная таким образом вероятность окажется достаточно близка к истинной? Возникает задача оценки

*) В книге [2, с. 29] статистической вероятностью названа любая относительная частота. Но на практике используется относительная частота, близкая к вероятности (эмпирической), а значит, вычисленная при большом числе опытов. Число опытов ("достаточно большое"), требуемое для нужной степени точности, можно рассчитать (см. лек. 12, п. 7).

ошибки. Это задача математической статистики и в конце курса вы узнаете, как она решается. Здесь можно проиллюстрировать примером своеобразный характер ответа.

Вы знаете, что при подбрасывании монетки точная вероятность появления герба равна 1/2. Какую ошибку мы сделаем, если заменим её статистической вероятностью после 1000 опытов? Ответ: ошибка будет меньше, чем 0,05. Этот ответ получен теоретически (лек. 12, п. 7, пример 11) и является прогнозом: можно быть практически уверенным, что после 1000 подбрасываний число выпавших гербов не выйдет за пределы интервала (450; 550).

Однако, ответ этот сопровождается оговоркой: прогноз сделан с вероятностью 0,997. Что это значит? Вот что: если проводить подобные эксперименты 1000 раз, то лишь около трёх раз число гербов может выйти за пределы указанного интервала. И можно считать, что практически всегда число гербов окажется в пределах интервала (450; 550).

Вероятностная оценка ошибки, как видите, включает два числа: собственно ошибку (£- = 0,05) и вероятность этой ошибки (/? = 0,997). О необходимости оценивать ошибку вероятностных расчётов двумя числами разговор впереди (лек. 6, п. 6).

Статистический метод тоже имеет свои недостатки - он весьма трудоёмкий, а нередко и практически не реализуемый. Но этот метод лежит в основе многих теоретических расчётов. Так, если определена статистическая вероятность поражения цели одним выстрелом, то можно теоретически рассчитать, например, вероятность двух, трёх (или хотя бы одного) попаданий при трёх выстрелах и пр. Этому вы вскоре научитесь.

Контроль 8. Определите статистическую вероятность появления двух гербов при подбрасывании двух монет, используя свой статистический материал. Какая получилась ошибка от замены истинной вероятности статистической? Что означает фраза "вероятность ошибки не превосходит 0,9"?

9. Геометрическая вероятность

Существует ещё один метод определения вероятности - геометрический. Он прост и его полезно знать. Суть этого метода хорошо иллюстрируется примером 4.

Напомню. Опыт состоит в случайном бросании шара на биллиардный стол, где нарисован круг (рис. 3). Если шар останавливается в круге, то происходит событие А. Рассчитать вероятность р(А).

Попробуем применить классический метод. Из характера опыта (случайное бросание) следует, что шар может остановиться в любой точке стола и ни одна точка не имеет предпочтения. Значит, исходом опыта следует считать попадание шара в произвольную точку стола. Таких событий бесчисленно много. Следовательно, формула (3) не работает.

Рис. 3

Можно, конечно, рассчитать вероятность приближённо, применив экспериментальный метод. Однако в данной ситуации возможен простой расчёт. Вероятность (геометрическая) есть отношение площадей

(5)

Примечание 1. Заметьте, формула (5) может дать иррациональное значение вероятности, в то время, как классическая формула (3) - рациональное.

Примечание 2. Геометрический метод можно рассматривать как предел классического. Если разбить стол на большое число п мелких равных прямоугольников (квадратиков), то получим полную группу исходов {е19Е2,...,Еп}, где Ej - событие, состоящее в том, что шар останавливается в i -м прямоугольнике. За исходы, благоприятствующие событию А, можно считать те "прямоугольники", которые пересекаются с данным кругом, - их Очисло m. Получаем приближённое значение вероятности min. Увеличивая неограниченно п и переходя к пределу, получим точное значение, совпадающее со значением, которое даёт формула (5).

Обобщение. Если стол превращается в какую-то плоскую область площади S, а круг - в другую внутреннюю область площади а (рис. За) и "точка" случайно брошена в область S, то вероятность события А, состоящего в том, что "точка" попадёт в меньшую область а, определяется геометрическим методом по формуле:

(6)

Легко понять, что аналогичные формулы получаются в случаях областей, лежащих на линиях, или поверхностях, или в трёхмерном пространстве. Например, если "точка" случайно брошена на линию ab (рис. 36), то вероятность, что она попадёт на дугу aß (событие А) определяется формулой

(6')

Контроль 9. На отрезке [0; 4] числовой прямой случайным образом выбирается число. Какова вероятность, что число окажется ближе к середине отрезка, чем к его краю?

11. О понятии вероятности

Вы только что познакомились с несколькими определениями вероятности - классическим, геометрическим, статистическим. Каждое из них прилагается к своему кругу случайных явлений и, конечно, не является общим.

Рис. 3а

Рис. 36

Что касается общего понятия вероятности, то можно дать описательное его определение: вероятность — число, которое объективно оценивает степень ожидаемости появления того или иного события в некотором опыте. Это, скорее, философское (самое общее) определение, а не математическое. Оно применимо не только к массовым случайным явлениям, но и к уникальным. С этой точки зрения понятно, что означает вероятность найти средство против рака в ближайшие 25 лет. Не понятно только, как объективно оценить её численно.

Общим естественнонаучным определением вероятности события (реального!) можно считать вероятностный предел относительных частот. Это эмпирическое определение. Другие определения (классическое, геометрическое, да и статистическое) можно рассматривать, как методы расчёта этой не известной нам вероятности, к которой приближаются относительные частоты. Именно эмпирическое определение вероятности положено в основу данного курса.

На эмпирическом определении строится частотная теория вероятностей, основатель которой - выдающийся немецкий математик Р. Мизес (1883-1953). Теория эта изложена им в книге "Вероятность и статистика". Она органически связана с практикой, с проблемами реального мира и поэтому пользуется большой популярностью среди естествоиспытателей. Однако, строгое развитие этой теории приводит к логическим противоречиям, связанным со своеобразием реального предельного перехода (вероятностного), и поэтому не принимается многими современными математиками [5, с. 48].

В математике на сегодняшний день основным является аксиоматическое определение вероятности - числовая функция на множестве всех событий опыта, которая удовлетворяет некоторым аксиомам [5, с. 49-54]. Эту аксиоматику построил в 30-х годах XX в. великий советский математик А. Н. Колмогоров (1903-1987). Современная теория вероятностей развивается в рамках колмогоровской аксиоматики. Большой вклад в её развитие внесли советские математики, прежде всего, сам А. Н. Колмогоров, А. Я. Хинчин, Б. В. Гнеденко, и др.

Наша книга не является "Теорией вероятностей", а "Введением", ориентированным на понимание сути основных вероятностных фактов и на практику, на реальные приложения. Поэтому мы не будем касаться аксиоматической их интерпретации и иногда будем сознательно жертвовать пресловутой "строгостью" изложения ради его понятности.

11. Упражнения

1. В урне 20 одинаковых шаров, пронумерованных цифрами 1, 2, 3, 20. Опыт - вынимание одного шара наудачу. Что вероятнее, - вынуть шар с номером, делящимся на 3, или на 4 ?

2. Колода, содержащая 36 карт, тщательно тасуется и затем снимается одна карта. Какова вероятность, что будет вынута а) карта красной масти; б) бубновой масти; в) фигура; г) туз; д) дама пик?

3. Опыт - подбрасывание двух монет. Составьте полную группу исходов (равновозможных и несовместимых событий опыта). Проверьте полноту группы, равновозможность и несовместимость событий. Рассчитайте вероятности событий: С - монеты падают по-разному (одна - гербом вверх, другая - решкой); D - хотя бы одна монета падает гербом вверх; Е - ни одна монета не падает гербом вверх. Отв: 1/2 ; 3/4 ; 1/4.

4. Проведите статистический эксперимент, подбрасывая две монеты 100 раз, и зафиксируйте результат каждого подбрасывания. Рассчитайте относительные частоты появления события D (хотя бы один герб) после 10-ти подбрасываний, после 20-ти, после 100. Происходит ли стабилизация частот? (Сравните колебания частот в первой половине эксперимента и во второй). Какова статистическая вероятность события Dl Какова ошибка от замены теоретической вероятности статистической?

5. Опыт - подбрасывание трёх монет (или, что то же, одна монета подбрасывается три раза*)). Рассчитайте вероятности событий: а - появляются три герба; В - ровно два герба (т.е. два герба и решка в любом порядке); С - ровно один герб; D - ни одного герба. Отв: 1/8; 3/8 ; 3/8 ; 1/8.

6. Из букв слов "мама" и "дама" отбираются наудачу по одной букве. Назовите несколько разных результатов этого опыта. Будут ли они равновозможными? Составьте полную группу исходов. Какие исходы благоприятствуют событию а - выбраны одинаковые буквы? Найдите р(А).

Отв: 3/8.

Перейдём ко второму кругу задач, так называемым, "урновым" задачам. Они кажутся искусственными и практически бесполезными, однако, с их помощью можно моделировать многие реальные задач и единообразно их решать.

7. В урне 5 одинаковых шаров - 2 белых и 3 чёрных. Опыт состоит в случайном вынимании одного шара. Событие а произойдёт, если будет вынут белый шар, а - чёрный. Составьте полную группу исходов опыта (не забудьте проверить равновозможность). Чему равны р{а) и р(А)?

Указание. Занумеруйте мысленно все шары. Отв.: 2/5 ; 3/5.

8. В условиях предыдущей задачи изменим опыт и станем вынимать последовательно два шара. Событие а произойдёт, если будут вынуты два белых шара, В - два чёрных, С - белый и чёрный (в любом порядке). Составляют ли эти события полную группу? Несовместимы ли они? Равно-

*) Поймите правильно - это один опыт, а не три, его результатом будет "тройка", например, ГГГ, или РГР, как и при одновременном подбрасывании трёх монет.

возможны ли? Как правильно составить полную группу исходов? Рассчитайте вероятности данных событий. Отв: i/io ; з/io ; 6/1 о.

Указание. Исходом опыта будет любая упорядоченная пара шаров: (1;2), (1;3),...,(1;5); (2;l), (2;3),..., (2;5);... (5;l), (5; 2),... (5;4). Для пересчёта удобно расположить эти пары в виде таблицы, содержащей 4 строки и 5 колонок.

9. В урне четыре шара - два белых и два чёрных. Опыт состоит в одновременном вынимании двух шаров наудачу. Событие А произойдёт, если появятся шары одного цвета, В - разных цветов. Как вы думаете, какое из этих событий должно чаще происходить при повторении опыта? Или вам кажется, что они будут происходить одинаково часто? Что подсказывает интуиция? Запишите предположение, потом проведите точный расчёт. Подвела вас интуиция или нет? Отв.: р(А) = i/з.

Указание. Опыт с одновременным выниманием двух шаров равносилен опыту с последовательным выниманием (можно, например, считать первым шар, вынутый правой рукой, вторым - левой).

10. В урне три шара - два белых, один чёрный. Опыт состоит в случайном выборе двух шаров. Какова вероятность выбрать шары разных цветов (событие А)? Какова вероятность выбрать хотя бы один белый (событие В), два чёрных (событие С)? Отв.: 2/3 ; l ; о.

11. Имеются три урны, в каждой по три одинаковых шара, пронумерованных цифрами 1, 2, 3. Опыт состоит в том, что из каждой урны извлекаются наудачу по одному шару. Что будет исходом опыта? Сколько исходов? Какова вероятность, что появятся а) три одинаковых номера; б) ровно два одинаковых; в) все номера разные? Отв.: 1/9 ; 6/9; 2/9.

Совет. Следующие задачи переформулируйте в терминах урн с шарами.

12. Рабочий выточил за смену шесть деталей, из которых одна получилась неудачной. Отдел технического контроля (ОТК) берёт на проверку две детали и если не обнаруживает брака, то принимает всю партию. Каковы шансы рабочего за то, что его партия деталей будет принята? Отв.: 2/з.

13. Шесть человек, среди которых две женщины и четыре мужчины, разыгрывают случайным образом два приза. Какова вероятность, что а) оба приза достанутся женщинам; б) только одна из женщин получит приз; в) ни одна не получит? Отв.: 2/30; 16/30; 12/30.

14. Из пяти супружеских пар отбирают случайным образом двух человек. Какова вероятность, что будут выбраны а) не супруги; б) супруги; в) мужчина и женщина; г) две женщины? Какие из этих событий совместимые? Составляют ли эти четыре события полную группу? Если нет - дополните. Сделайте прогноз: сколько раз следует ожидать выбор супругов, если повторять опыт 100 раз? Отв.: 16/18; 12/18; 5/18; 4/18 ; около 11.

Указание. Задачу можно моделировать по-разному, например, так: в урне 10 шаров - 5 белых, 5 чёрных; белые шары пронумерованы цифрами от 1 до 5, чёрные тоже (рис. 4); после перемешивания вынимаются два шара. Число исходов (с учётом порядка вынимания шаров) равно « = 10-9 = 90.

15. Опыт - подбрасывание один раз неправильной (не однородной) игральной кости. Как определить вероятность появления "шестёрки"?

16. В прямоугольнике размера 3x4 расположен круг радиуса г = \. В прямоугольник вбрасывается случайным образом "точка". Какова вероятность, что "точка" попадёт в круг?

17. В круг вписан квадрат. Какова вероятность, что "точка", брошенная случайным образом в круг, не попадёт в квадрат? Оцените эту вероятность сначала "на глазок", потом проведите точный расчёт.

18. Однородная проволока растягивается за концы и рвётся. Какова вероятность, что она разорвётся в точке, а) лежащей ближе к краям, чем к центру; б) ближе к правому краю, чем к центру?

19. Опыт состоит в том, что игральная кость подбрасывается дважды. Событие А произойдёт, если появятся две "шестёрки", В - ровно одна, С - хотя бы одна. В чём состоят противоположные события: А (не произойдёт А), В, С ? Найдите вероятности всех событий.

Отв.: 2/36; 10/36; 25/36; р(1)=1-Р(л).

20. Куб, все грани которого окрашены, распилен на 1000 кубиков одинакового размера. Полученные кубики ссыпаны в урну и тщательно перемешаны. Опыт состоит в извлечении случайным образом кубика из урны. Какова вероятность вынуть кубик, у которого а) две окрашенные

грани; б) ровно две; в) три? Отв.: 0,ю4; 0,096; 0,008.

21. Спутник Земли движется по орбите, которая заключена между 60° северной и 60° южной широты. Он может упасть случайным образом в любую точку поверхности Земли между указанными параллелями. Найти вероятность того, что спутник упадёт выше 30° северной широты.

Отв.: (з-л/з)/б*0,2.

Указание. Используйте формулу площади шарового пояса, заключённого между двумя параллельными плоскостями, - S = 2кЮ\, где А - расстояние между плоскостями, R- радиус; выразите h через R, используя углы 30° и 60°.

22. Как вы думаете, каких букв (литер) больше в ячейках наборщика типографии - "а" или "о"? Во сколько раз больше? Или одинаково? Подумайте немного и запишите своё предположение. Потом проведите расчёт.

Рис. 4

Указание. Попробуйте сначала применить классический метод (в чём состоит опыт? группа исходов? что мешает?). Потом рассчитайте статистические вероятности p*(V) и p*(V). Отв.: 0,075; 0,110.

23. Задача о хитрой сестрёнке. Брат и сестра умеют и любят водить папину машину. Чтобы решить, кому вести машину, они обычно подбрасывают монету. Сестра хочет управлять машиной чаще и предлагает брату: "Давай, ты будешь подбрасывать одну монету, а я две; если у меня окажется больше гербов, то я и поведу машину". Обманула ли сестра брата?

Указание. Если число гербов одинаково, то, согласно договора, не сестра ведёт машину.

24. Задача о девичьем гадании. Когда-то в деревнях России бытовало гадание: девушка зажимала в руке шесть травинок так, чтобы концы травинок торчали сверху и снизу, а подруга связывала эти травинки парами - сверху, потом - снизу; если получалось одно кольцо, это означало, что девушка выйдет замуж в текущем году. Рассчитайте вероятность удачи. Попробуйте найти формулу вероятности появления кольца, если связываются 2п травинок.

25. Задача о разделе ставки (задача шевалье де Мере*)) Двое игроков играют серию партий, причём, в результате каждой партии один из них выигрывает и набирает одно очко, а другой проигрывает и набирает нуль очков. Шансы выигрыша для игроков каждый раз равны. Выигрывает ставку тот, кто первым наберёт три очка. Игра прервана, когда у первого игрока одно очко, у второго - два очка. Как надлежит справедливо распределить выигрыш? Отв.: 1:3.

Указание. Рассмотрите два следующих возможных тура игры и просчитайте все варианты к концу второго тура.

*) Шевалье де Мере (1607-1648) - придворный французского короля, был страстным игроком в кости, он поставил перед математиками XVII в. интересные задачи, стимулировавшие становление теории вероятностей.

ЛЕКЦИЯ 2

РАСЧЁТ ВЕРОЯТНОСТЕЙ, КОГДА ИСХОДОВ МНОГО

Продолжим решение задач классическим методом по формуле

На прошлой лекции мы рассматривали простые задачи, допускающие выписывание всех равновозможных результатов (исходов) опыта. Решение шло в следующем порядке: 1) выписывались все исходы и подсчитывалось их число п (знаменатель!); 2) выделялись исходы, благоприятствующие искомому событию А, и подсчитывалось их число m (числитель); 3) вероятность вычислялась делением ш на и.

В задачах, где число исходов велико (несколько десятков, сотен или больше), их непосредственный перебор затруднителен и почти невозможен. В этих случаях часто используются две формулы, с помощью которых вычисляют п и т без выписывания вариантов.

Ваша цель в данной лекции - понять смысл формул (1) и (2) (принцип умножения и число сочетаний) и научиться распознавать, когда какая формула применима.

1. "Дерево" исходов

Начнём со знакомой задачи, которая допускает перебор исходов. Сейчас вы узнаете интересный способ организации этого перебора. Его обобщение и приведёт нас к первой формуле.

Пример 1. В урне 5 шаров - 3 белых, 2 чёрных. Опыт состоит в последовательном случайном вынимании двух шаров (рис. 1). Рассчитать вероятность появления двух белых шаров (событие А).

Решение. 1) Пронумеруем мысленно шары и начнём выписывать исходы: (1;2), (1;3), (1;4),.... Вы, наверное, чувствуете, что есть опасность потерять какую-то пару. Чтобы избежать этого, проведём перебор иначе, - по схеме, изображённой на рис. 2.

Посмотрите внимательно на "дерево" (рис. 2), - у него 5 "веток" первого уровня, они соответствуют пяти вариантам выбора первого шара. Ка-

Рис. 1

ждая "ветка" первого уровня расщепляется на 4 "ветки" второго уровня, т. к. после выбора первого шара остается 4 варианта выбора второго шара. Получается, что каждый исход опыта представлен в виде "ветки": исход (1;2) это крайняя левая "ветка", (1;3) - следующая и т. д.

Чтобы посчитать число исходов, надо посчитать число "веток". Из рис. 2 видно, что они разбиваются на 5 групп, в каждой из которых по 4 "ветки", значит, общее их число я = 4 + 4 + 4 + 4 + 4 = 5-4 = 20. Заметьте, -число исходов п получается умножением числа "веток" первого уровня (их 5) на число одинаковых разветвлений второго уровня (их 4).

2) Исходы, благоприятствующие событию А, можно выбрать из рис. 2, но удобнее считать их с помощью другого "дерева" (рис. 3), - сообразите сами, как оно построено. Число "веток" второго "дерева" w = 2 + 2 + 2 = 3- 2 = 6.

3) Делим:

Пример 2. В условиях примера 1 чуть изменим опыт - станем вынимать три шара. Какова вероятность вынуть шары в следующем порядке: первые два белых, третий - чёрный (событие В)?

Решение. 1) "Дерево" исходов получается из рис. 2 добавлением "веток" третьего уровня. При этом каждая "ветка" второго уровня расщепляется на одинаковое число "веток" третьего уровня - три (достройте сами). Общее число исходов подсчитывается, как и выше, умножением и = 5-4-3.

2) Исходы, благоприятствующие событию 5, получаются добавлением к каждой ветке второго уровня (рис. 3) по две ветки третьего уровня (достройте сами). Их число m = 3 • 2 • 2.

Контроль 1. В урне 4 шара - 3 белых и 1 чёрный. Опыт - вынимание трёх шаров. Какова вероятность, что шары появятся в следующем порядке: первый чёрный, потом два белых (событие С)? Нарисуйте два "дерева" для подсчёта п и т.

Рис. 2

Рис. 3

2. Обобщение: принцип умножения

Итак, имеем метод пересчёта исходов опыта с помощью "дерева" исходов. Конечно, этот метод применим не всегда. Опишем общую структуру опытов, для которых пересчёт исходов может быть выполнен методом "дерева".

Выше была подчёркнута характерная особенность построенных "деревьев": все "ветки" одного уровня расщеплялись на одно и то же число "веток" следующего уровня. Именно это свойство позволило подсчитать число "веток" верхнего уровня (число исходов опыта) умножением числа "веток" первого уровня на число "расщеплений" второго уровня и т.д.

Принцип умножения. Пусть некоторый опыт состоит из к последовательных этапов. Пусть первый этап допускает щ исходов, второй этап, независимо от результата первого, допускает п2 исходов, &-тый этап допускает пк исходов. Тогда число п всех исходов опыта определяется формулой

(1)

Формула (1) доказывается построением "дерева" исходов, аналогичного изображенному на рис. 2. Первый уровень нового "обобщённого дерева" состоит не из пяти, а из щ "веток", каждая из которых расщепляется не на четыре, а на п2 "веток" второго уровня, и т. д.

Имея формулу (1) и зная условия её применимости, мы можем определять общее число п исходов опыта и число m исходов, благоприятствующих искомому событию, не строя "дерево".

Пример З.В урне 10 шаров - 5 белых, 3 чёрных, 2 красных. Опыт - вынимание шести шаров. Какова вероятность, что шары появятся в таком порядке: два белых -три чёрных - красный (событие £>)?

Решение. 1) Подсчитаем число п всех исходов опыта. Учтите -мы будем пересчитывать все исходы, все различные "шестёрки" шаров, а не те, когда появляются сначала два белых, потом три чёрных, потом красный.

Структура опыта соответствует принципу умножения, он состоит из шести этапов: первый допускает л, =10 вариантов выбора первого шара, второй - п2 =9 вариантов выбора второго шара (первый шар вынут!), третий этап допускает пъ = 8 вариантов (первые два шара вынуты, в урне осталось восемь шаров), четвёртый этап - пА = 7, пятый этап - п5 = 6, последний, шестой - пв=5. Применяя формулу (1), получаем л = 10-9-8-7-6-5. Умножение производить пока не будем, - дальше увидите, почему.

2) Подсчитаем число m исходов, благоприятствующих искомому событию D: первый белый шар можно выбрать щ - 5 различными способами (в урне 5 белых шаров), второй белый - п2 = 4 способами (один белый вынут), третий чёрный шар - пъ = 3 способами (в урне 3 чёрных шара), четвёртый чёрный - пА = 2 способами, пятый чёрный - п5 = 1 способом (остался один чёрный шар), последний красный - пв =2 способами. Значит, т = 5-4-3-21-2.

3) Искомая вероятность

После очевидных сокращений получаем

Принцип умножения применяется не только к задачам с шарами. Он применим, когда опыт повторяется несколько раз.

Пример 4. Игральная кость подбрасывается 4 раза. Какова вероятность, что при первом и при последнем подбрасываниях выпадет "шестёрка", а при втором и третьем - не "шестёрка" (событие Е)?

Решение. я = б-6-6-6 = 64 ; т = 1-5-5-1 = 52; р(£)-0,02.«

Контроль 2. Монета подбрасывается 5 раз. Какова вероятность того, что герб и решка будут чередоваться?

3. Формула числа сочетаний

В случаях, когда принцип умножения непосредственно не применим, может помочь другая формула (2). Чтобы понять её, начнём с простых примеров.

Вопрос 1. Сколькими способами можно расположить три одинаковых предмета на четырёх местах (одно место свободное)? Другими словами - сколько имеется способов выбора трёх мест из четырёх?

На вопрос нетрудно ответить, непосредственно перебрав все возможные группы мест: (1,2,3); (1,2,4); (1,3,4); (2,3,4). Ответ: 4 способа.

Вопрос 2. Сколько способов выбора трёх мест из пяти? Здесь перебор сложнее (можно сбиться) - проделайте его сами. Ответ: 10 способов.

Вопрос 3. Сколько способов выбора / мест ш к (/<к)! Ответ даёт формула (2) (примите её пока без доказательства):

(2)

Формулу (2) легко запомнить, если заметить две "симметрии": 1) в числителе и в знаменателе одинаковое число множителей / (посчитайте их в числителе сами); 2) в числителе они убывают, а в знаменателе - возрастают.

Формулу эту называют формулой числа сочетаний из к (элементов) по I. Обозначение С[ читается так: "Це из ка по эль" (С есть начальная буква французского слова "combinaison", что значит "сочетание").

Сочетания. Название формулы (2) требует пояснения. Выбор / мест из к мест аналогичен задаче, когда из группы, содержащей к каких-то предметов, выбираются подгруппы, содержащие / предметов (1<к). Например, из четырёх элементов a,b,c,d можно выбрать следующие подгруппы по три элемента: abc, abd, acd, bed. Значит, СЪА = 4. Такие подгруппы, которые разнятся одна от другой, по крайней мере, одним элементом, называются сочетаниями.

Применения формулы. Используем формулу (2) для ответа на вопрос 1: / = 3, к = 4, С] =-^—^ = 4. Применим к вопросу 2: / = 3, к = 5, 5-4-3 С] = ^ =10. Вы видите, как быстро формула отвечает на наши вопросы.

Вопрос 4. Сколькими способами можно рассадить в президиуме 7 мужчин и 3 женщины?

Ответ:

Можно считать иначе:

(здесь меньше множителей). Очевидно, С,70 = С,30 и вообще,

(2')

В дальнейшем мы будем часто применять формулу (2) для решения задач, сводящихся к стандартной урновой модели. Например, - в урне много белых и чёрных шаров, наудачу последовательно вынимаются четыре шара; сколько способов расположения ровно трёх белых шаров среди четырёх вынутых? Это иная форма вопроса 1, ответ на который даёт формула (2): С] = 4.

Контроль 3. Ответьте на следующие три вопроса, выбрав нужную формулу (1) или (2).

а) Телефонная станция обслуживает абонентов, номера которых содержат шесть цифр и начинаются с цифры 3. Сколько абонентов может обслужить станция?

б) Колода, содержащая 36 карт, сдаётся шести игрокам и каждый получает по 6 карт. Сколько существует разных вариантов сдачи карт одному игроку?

в) Сколькими способами можно рассадить на скамейке четырёх мальчиков и двух девочек (мальчики не различаются между собой, так же, как и девочки)? Не забудьте формулу (2').

4. Типовые задачи с шарами

Разберём образец решения с помощью формул (1) и (2) одного класса задач - они называются урновыми задачами. К ним нередко можно свести другие задачи.

Задача 1. В урне 10 шаров -3 белых, 7 чёрных. Опыт состоит в последовательном вынимании четырёх шаров. Событие а произойдёт, если первыми будут вынуты два белых шара, потом два чёрных. Событие В произойдёт, если появятся два белых и два чёрных шара в любом порядке. Рассчитать Р(а) иР(й).

Прежде чем решать задачу, советую сделать рисунок, подобный рисунку 1. Наглядность поможет вам правильно рассуждать. Советую всегда делать рисунки при решении урновых задач.

Решение. 1) Подсчитаем число п всех исходов опыта. Напомню, что исходами будут всевозможные "четвёрки" шаров, различающиеся как номерами шаров, так и их порядком, - например, (1,2,3,4), (1,2,3,5), (5,2,3,1), и т.д. Напомню также, что эти исходы равновозможны, - нет причин для того, чтобы какая-то "четвёрка" шаров появлялась чаще, чем другие.

Применяем принцип умножения. Опыт происходит в четыре этапа (вынимается первый шар, затем второй, третий, четвёртый), значит, к = 4. Первый этап допускает щ =10 результатов (может появиться любой из десяти шаров, лежащих в урне), второй этап - п2 = 9 результатов (один шар вынут, осталось девять), третий - п3 = 8, четвёртый - пА = 7 результатов.

Значит, п = 10 • 9 • 8 • 7. Обратите внимание - при подсчёте п мы совершенно "забыли" про события а и В. Это правильно, ведь мы считали все исходы, а не те, которые благоприятствуют событиям а или В. Ими займёмся далее.

2) Подсчитаем тх = т(а) - число исходов, благоприятствующих а. Это те "четвёрки", которые получаются, если первым вынимается один из трёх белых шаров ( щ = 3), вторым - один из оставшихся двух белых ( п2 = 2), третьим - чёрный шар, их семь ( пъ = 7) и последним - один из оставшихся шести чёрных (пА = 6). Согласно формуле (1), тх =3• 2• 7• 6.

3) Подсчитаем т2 =т(в). Здесь не удастся применить принцип умножения так же легко, как для а, ибо нет определённого порядка шаров. В самом деле, на первом месте может стоять любой из десяти шаров (л, =10), на втором - любой из девяти ( п2 = 9), на третьем месте выбор зависит от того, какие шары выбраны на первых двух местах: если два белых, то «з=7, если два чёрных, то пъ = 3, если белый и чёрный, то п3 = 8.

Поступим так, - разобьём событие В на несколько групп событий с определённым порядком появления шаров: В12 - первые два шара белые, третий и четвёртый - чёрные; Вх 3 - первый и третий белые; Вх 4 - первый и четвёртый белые и т. д. Очевидно, что т(в) = т(в12)+т(в13)+т(в14)+....

Число слагаемых равно числу способов расположения двух белых шаров на четырёх местах, т. е. числу сочетании

Вычислим каждое слагаемое с помощью принципа умножения. Число исходов, благоприятствующих событию В]2, равно т(в12)=3 • 2 • 7 • 6 (см. проведённое выше вычисление m(ä), - ведь В]2=а). Аналогично.

/и(яи) = 3-7-2-6, /и(ям) = 3-7-6-2 и т. д.

У всех слагаемых множители одинаковы, лишь порядок их разный, значит, т(в) = 3- 2- 7- 6 + 3- 2- 7- 6 +.... Поскольку число слагаемых равно числу сочетаний С], получаем т(в) = С] - 3- 2- 7- 6 = 6- 3- 2- 7- 6.

4) Окончательно считаем вероятности по классической формуле:

Задача 2. Рабочий сделал за смену 100 деталей, из которых 5 получились с браком. ОТК (отдел технического контроля) берёт на проверку 10 деталей и если не находит брака, то принимает всю партию (так называемый "выборочный контроль качества"). Каковы шансы рабочего на то, что его работа будет принята? Как вам кажется, - велики шансы или малы? Выскажите предположение и проверьте его точным расчётом.

Решение. Построим урновую модель задачи так: в урне 100 шаров - 95 белых и 5 чёрных; опыт - вынимание наудачу 10 шаров (без возвращения) (рис. 4); событие а произойдёт, если все шары окажутся белыми. Рассчитаем вероятность р (а):

Рис. 4

3)

Непосредственное вычисление, конечно, затруднительно, - надо пользоваться калькулятором. •

Как показал расчёт, шансы рабочего не велики и не малы, примерно "пятьдесят на пятьдесят". Вывод - надо работать лучше.

Контроль 4. В урне 15 шаров - 10 белых и 5 чёрных. Вынимаются последовательно 7 шаров. Событие А произойдёт, если появятся сначала четыре белых шара, а потом три чёрных. Событие В произойдёт, если появятся 4 белых и 3 чёрных шара в любом порядке. Как вам кажется, какое из этих событий будет появляться чаще при повторении опыта? Почему? Рассчитайте вероятности этих событий. Отв.: р(я) = о,32б.

5. Вероятность хотя бы одного события

Область применения формул (1) и (2) может быть расширена с помощью простой формулы (3). Для этого введём новое понятие.

Определение. Пусть в некотором опыте может произойти или не произойти случайное событие А. Всякий раз, когда в результате опыта событие А не происходит, будем говорить, что происходит дополнительное к А событие А. Короче, - событие А происходит тогда, когда А не происходит.

Как всегда, конкретизируем новое понятие примерами.

В урне 5 шаров - 3 белых. 2 чёрных. Вынимается наудачу один шар. Событие А произойдёт, если будет вынут белый шар. Дополнительное событие А произойдёт, если, согласно определения, н е будет вынут белый шар, т. е. если будет вынут чёрный шар (других шаров, кроме белых и чёрных в урне нет).

Обратите внимание, - событию А благоприятствуют два исхода из пяти, а событию А — остальные три исхода. Отсюда термин - дополнительное событие.

Будем теперь в тех же условиях вынимать два шара. Событие А произойдёт, если появятся два белых шара. Какое событие будет дополнительным к А ? Иногда я слышу - "два чёрных". Не торопитесь. Прочтите внимательно определение. Что значит, событие А не произошло? Это значит, что н е появились два белых шара, т. е. среди двух вынутых шаров или оба чёрные или один белый, а другой чёрный. Следовательно, дополнительное событие А состоит в том, что появится хотя бы один чёрный шар.

И в этом примере событию А благоприятствуют т(А) = 3 -2 = 6 исходов, а дополнительному событию А - все остальные п-т = 20-6 = \4 исходов. Вообще, если в опыте всего п исходов и из них m исходов благоприятствуют событию А, то, согласно определению дополнительного собы-

тия, остальные п-т исходов благоприятствуют событию А. Отсюда следует, что

Складывая, получаем

. Следовательно,

(3)

Формулу (3) иногда называют формулой вероятности хотя бы одного события, потому что она часто применяется для отыскания вероятностей именно таких событий.

Пример 5. В урне 10 шаров - 7 белых, 3 чёрных. Последовательно вынимаются 3 шара. Какова вероятность того, что хотя бы один из появившихся шаров белый (событие А)?

Решение. Согласно формуле (3), достаточно найти вероятность дополнительного события А.

Когда произойдёт А ? Часто отвечают: "когда появится хоть один чёрный". Опять торопливый, формальный ответ. Вдумайтесь: если А не произошло, значит не появился "хоть один белый", т. е. появились в с е не белые. Итак, А произойдёт, если появятся три чёрных шара.

Найдём вероятность v[À). Числитель и знаменатель легко считаются принципом умножения: « = 10 • 9 • 8 ; m = 3 • 2 • 1.

Применим формулу (3) и окончательно получим:

Контроль5. Игральная кость подбрасывается четыре раза. Какова вероятность, что хотя бы один раз появится "шестёрка"? Отв.: 0,52.

6. Вероятностные модели

Главное в этой лекции уже сказано. Вы познакомились с тремя формулами, облегчающими расчёт вероятностей, и с примерами их применения. Может быть, эти примеры (шары, урны) казались искусственными? Но они служат моделями реальных задач и, тем самым, облегчают их решение. Один пример реальной задачи мы рассмотрели выше (п. 4, задача 2). Сейчас разберём ещё два интересных примера, связанных с нашей обыденной жизнью. Ведь, истинная цель любой научной теории - её приложение к реальной жизни.

Предлагаю пари. Я предсказываю, что в данной студенческой аудитории, где находится 40 человек, есть два студента, у которых совпадают дни рождения (месяц и число). Согласны ли вы с таким прогнозом? Не кажется ли он вам маловероятным? Ведь дней в году много - 365, а людей в аудитории почти в 9 раз меньше.

Когда я впервые услышал этот прогноз, мне он тоже показался нереальным. Интуиция подсказывала, что вероятность совпадения дней рождения должна быть, по крайней мере, меньше половины. Но после проведения точного расчёта, я с удивлением убедился, что интуиция может сильно ошибаться. Давайте-ка вместе проведём этот расчёт.

Прежде всего, надо точно поставить задачу. Проследите внимательно за следующей формулировкой, и вы согласитесь, что она хорошо моделирует нашу ситуацию.

Задача о днях рождения. В урне 365 шаров, на каждом из которых написано число и месяц года (все надписи различные). Опыт состоит в том, что 40 раз вынимают случайным образом шар из урны, записывают число и месяц и возвращают его обратно в урну. Нас интересует событие а, которое произойдёт, если среди сорока вынутых шаров встретится хотя бы одна пара шаров с одинаковыми надписями. Рассчитать р{а).

Заметьте, - это не проведение опыта сорок раз, а один опыт, в результате которого появляются сорок шаров, или сорок дней рождения. Существенно, что один шар может появиться несколько раз.

Решение. Перейдём к дополнительному событию а и рассчитаем р(А), а затем применим формулу (3).

1) Исходами данного опыта будут всевозможные группы из сорока шаров, причём, шары в группах могут повторяться. Опыт удовлетворяет условиям применимости принципа умножения - он проводится в à: = 40 этапов и каждый этап допускает одно и то же число п} =365 результатов (не забывайте, - шары возвращаются в урну). Применяя формулу (1), получаем число всех исходов опыта: п = 365 • 365 • 365 •... • 365 = 36540.

2) Дополнительное событие а произойдёт, если все сорок появившихся шаров будут иметь разные надписи. Значит, число вариантов появления первого шара пх =365, второго - п2 =364, третьего - п3 =363,... последнего, сорокового - я40 =326. Число ш(а) исходов, благоприятствующих событию а, определяется формулой (1), т. е. ш(а) = 365 • 364• 363 •...• 326.

3) Применяем формулу (3) и вычисляем искомую вероятность

Прогноз. Какую практически ценную информацию несёт число 0,891? Вспомните закон устойчивости частот: если повторять опыт много раз, то относительные частоты события а будут неограниченно приближаться к вероятности Р{а). Это значит, что если я буду держать пари в десяти аудиториях, то примерно в девяти выиграю, а в одной проиграю.

Проверить этот прогноз затруднительно, но можно. Если каждый из вас (вас - 40 человек!) опросит сорок своих знакомых, мы будем иметь ре-

зультаты сорока опытов. Наш прогноз: примерно в 36 опытах встретятся одинаковые дни рождения.

Рассмотрим вторую задачу, где вероятностный прогноз сделать легче и проверить легче.

Задача о номерах автомашин. Выйдите на автотрассу и запишите номера ста проезжающих мимо автомашин. Сколько номеров будут иметь ровно две одинаковые цифры? Предполагается, что числовая часть номера трёхзначная.

Конечно, возникает сомнение - а можно ли это предсказать? Ведь, результат случаен. Но перед нами не просто случайное, а массовое случайное явление. Такие явления как раз и допускают вероятностное прогнозирование. Сделаем модель этого явления.

Вероятностная модель задачи. В урне 10 шаров, пронумерованных цифрами 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Опыт состоит в том, что случайным образом вынимаются последовательно три шара (с возвращением!) и записываются их номера. Результатом опыта будет, следовательно, тройка чисел, среди которых могут быть одинаковые. Событие а произойдёт, если появятся ровно две (не три!) одинаковых цифры, причём, в любом порядке.

Решение. « = 10-10-10 = 1000; m{À) = C^ • 10• 1 • 9 = 3• 10• 9 = 270; р(А) = 0,27.#

Прогноз. Из 100 проезжающих автомашин примерно 27 будут иметь на своих номерах ровно две одинаковые цифры.

Предлагаю вам проверить этот прогноз. Я проверял и у меня получилась 31 машина. Значит, относительная частота появления события а в моей серии опытов равна р* (а) = 0,31 и отличается от вероятности всего лишь на четыре сотых. Хороший прогноз, не правда ли?

Методологическое замечание. Обращаю внимание на один новый принципиальный момент: решая задачу, мы подменили реальную ситуацию её вероятностной моделью. Тем самым, мы исказили реальную задачу. Вопрос в том, насколько исказили, - существенно или нет?

В первой задаче, опираясь на здравый смысл, можно быть уверенным, что отличие нашей модели от реальности не существенно - дни рождения людей, находящихся в аудитории, совершенно случайны и не могут иметь никакой скрытой взаимосвязи.

Во второй задаче ситуация может оказаться сложнее. Насколько случайны номера автомашин? Большинство из них получили свои номера в городской службе. Из какого пакета и каким образом распределялись эти номера? Далее, - насколько случайны номера машин, проезжающих в данном месте? Ведь может быть, что они принадлежат одному предприятию и

их номера имеют какую-то закономерность, например, начинаются с одной цифры. Наконец, следует учитывать и наличие в номерах букв, ибо номера могут иметь одинаковые цифры, но разные буквы. Так что, не исключено, что адекватная модель должна строиться как-то иначе.

В конечном счёте, правильность составления модели и, следовательно, эффективность вероятностного прогноза проверяется практикой. Но надо помнить, что при построении моделей следует соблюдать осторожность и прежде всего, хорошо разобраться в реальной ситуации.

Контроль 6. Сделайте прогноз: сколько машин из ста будут иметь ровно три одинаковые цифры номера? Проверьте прогноз.

7. Вывод формулы числа сочетаний

В заключение лекции докажем формулу (2). Выше вы научились ею пользоваться для расчёта вероятностей. Это хорошо. Это главное. Но будет ещё лучше, если вы поймёте, как возникла формула, почему она имеет такой вид. Почему числитель формулы есть произведение убывающих чисел? Почему в числителе и знаменателе одинаковое число множителей?

Приучайтесь не к формальному восприятию, а к глубокому пониманию всего, что узнаёте. Если же у вас ещё не возникает такое желание, то пропустите этот раздел и переходите к самостоятельному решению задач.

Напомню смысл термина "сочетания". Пусть имеется 4 каких-то предмета (элемента) - обозначим их буквами а, Ь, с и d. Составим из них различные группы по 3 предмета: abc, abd, acd, bed. Эти группы и называются сочетаниями из четырёх элементов по три. Характерные особенности сочетаний: 1) все они содержат одинаковое число элементов -три; 2) разнятся друг от друга по крайней мере одним элементом. Ещё раз подчеркну: порядок не учитывается. Например, abc и Ъса -одно и то же сочетание, ибо одинаков состав элементов.

Определение. Пусть имеется к предметов ах, а2, а3,..., ак, назовём их элементами. Составим из них различные группы, содержащие по / элементов (/ < к) и отличающиеся одна от другой, по крайней мере, одним элементом. Эти группы называются сочетаниями из к элементов по I.

Например, сочетаниями будут следующие группы: {а^а^а^.л,}, {ака2а3...а1}, {акак_1а3...а,},... (предполагается, что I <к-2). Здесь первые два сочетания различаются одним элементом, а первое и третье - двумя (какими?). Если же в каком-то сочетании поменять порядок элементов, то получится то же самое сочетание. К примеру, группы а1а2а3а4...ак и а2а1а3а4...ак не различаются составом элементов, они представляют одно и то же сочетание.

Чтобы проверить, правильно ли вы поняли, что такое сочетание, добавьте к трём выше написанным группам одно-два новых сочетания.

Вывод формулы (2). 1) Предположим, что в одну строку выписаны все сочетания из к элементов по / (их число С[)\ \аха1аъ..л^\, {aka2a3...al}, {akak_la3...al}, {ака2ак_г..а1},.... Сделаем в каждом из этих сочетаний всевозможные перестановки и запишем их в колонках следующей таблицы:

Таблица 1

Советую вам внимательно проследить за каждой колонкой и добавить в неё по одной своей перестановке. Добавьте также в первую строку таблицы одно своё сочетание и сделайте в нём свои перестановки, записав их в таблицу.

Заметьте, - группы, записанные в получившейся таблице, различаются или элементами (в строках), или порядком (в колонках). Такие группы называются размещениями, их больше, чем сочетаний.

2) Подсчитаем с помощью принципа умножения число всех получившихся размещений. Число это принято обозначать так: А[ (здесь А есть начальная буква французского слова "arrangement", что значит "размещение").

Каждое размещение получается в результате последовательного выбора / элементов из данных к элементов: первый элемент можно выбрать к различными способами, второй - {к-\) способом (первый элемент выбран, осталось на единицу меньше элементов), третий - (к-2) способами и т. д., последний, /-тый элемент можно выбрать [&-(/-l)] способами. Формула (1) даёт

(4)

Заметьте, - в последней скобке из к вычитается не /, а (/-1)! Если бы последняя скобка была (£-/), то число всех множителей было бы / + 1. Но число множителей должно равняться числу "шагов", а их столько, сколько раз мы выбираем элементы, т. е. /.

3) Подсчитаем число строк в таблице размещений. Число строк равно числу Р{ перестановок, которые можно сделать в сочетании, содержащем / элементов (здесь Р - начальная буква французского слова "permutation", что значит "перестановка").

Применяем принцип умножения. Каждая перестановка получается в результате последовательного выбора / элементов из группы (сочетания), содержащей / элементов, значит,

(5)

И в этой формуле, как и в формуле (4), число множителей /.

4) Число всех элементов таблицы размещений получается умножением числа её строк на число колонок, т. е. А [ = Р1 • С[. Отсюда следует знакомая формула

(6)

Ценность доказательства. Теперь признайтесь, не лучше ли вы стали понимать формулу (2)? Доказательство раскрыло вам причину простой дробной структуры формулы, а также смысл числителя (число размещений) и знаменателя (число перестановок). Вместе с тем, стало понятно, почему число множителей числителя и знаменателя одинаковы.

Более того, вы увидели фундаментальность принципа умножения, который лежит в основе всех формул и, следовательно, в основе многих вероятностных расчётов.

Попутно вы узнали, что существуют ещё два вида соединений из к элементов - размещения и перестановки, и получили формулы для подсчёта их числа. Это новое знание является началом важного раздела математики - комбинаторики, которая, в свою очередь, является частью нового современного направления развития математических наук - дискретной математики, связанного с потребностями вычислительной техники.

Формулы (4) и (5) тоже используются в вероятностных расчётах. В частности, когда вы подсчитывали число всех исходов опыта при вынимании / шаров из урны, содержащей к шаров, вы, в сущности, применяли формулу (4). Если же / из к шаров белые (остальные - не белые), то число исходов, благоприятствующих появлению только белых шаров, подсчитывается по формуле (5).

Контроль 7. Постройте таблицу размещений из четырёх элементов по три. Выведите формулу С\ = — рассуждениями, аналогичными выводу формулы (6). Приведите пример применения этой формулы.

8. Упражнения

Поупражняйтесь сначала в различении размещений, сочетаний и перестановок. При решении первых десяти задач вы должны понять, какие выборки надо сделать в задаче, - размещения, перестановки, или сочетания? Или же следует применить более общий принцип умножения? После этого вычисление идёт по соответствующим фор-

мулам (4), (5), (6), или (1). Если вы не читали п. 7, то выбирайте принцип умножения (1) или формулу сочетаний (2).

1. На 4 должности имеется 7 кандидатов. Сколькими способами можно распределить эти должности между кандидатами? Отв.: А*.

2. Из 7 человек надо выбрать 4 делегата на конференцию. Сколькими способами это можно сделать? Отв.: с74.

3. На 4 должности имеется 4 кандидата. Сколькими способами можно распределить эти должности между кандидатами? Отв.: р4.

4. Сколькими способами можно надеть на кольцо 7 ключей?

Отв.: PJ2.

Указание. Каждый способ соответствует семи перестановкам (почему?). А почему в ответе деление на два?

5. Из колоды, содержащей 36 карт, вынимается 6 карт. Сколько существует а) различных выборок; б) выборок одной масти? Отв.: с366 ; 4-с96.

6. В спортивных соревнованиях участвуют 36 спортсменов. Различные награды получают 6 победителей. Сколько существует теоретически возможных вариантов награждения? Отв.: А\ь.

7. На плоскости отмечены 5 точек так, что никакие три точки не лежат на одной прямой. Через каждую пару точек проведена прямая. Сколько прямых получилось?

8. Сколько прямых линий можно провести через 5 точек, из которых ровно три лежат на одной прямой? Отв.: с] -2.

9. В урне 5 занумерованных шаров. Сколько существует вариантов выбора (без возвращения) 2 -х шаров а) с учётом их порядка; б) без учёта порядка? Составьте таблицу всех вариантов выбора. Отв.: л\ ; с].

10. В условиях предыдущей задачи изменим способ выбора шаров: вынимаем первый шар, записываем его номер, кладём его обратно в урну, перемешиваем шары, вынимаем второй шар и записываем его номер. Результатом этого опыта будет упорядоченная пара чисел, например, (1;l) или (1; 2), (3; 5), (3; 3) и т. д. Такой способ называют выбором с возвращ ением. Ответьте на те же вопросы: сколько существует вариантов выбора 2 -X шаров а) с учётом порядка, б) без учёта порядка номеров? Составьте таблицы. Отв.: 52; с52+5.

11. Монета подбрасывается 5 раз. Сколько исходов этого опыта? Сколько исходов благоприятствуют появлению ровно одного герба? ровно двух? трёх? четырёх? пяти гербов? Найдите вероятности всех этих событий.

12. Игральная кость подбрасывается 5 раз. Сколько исходов этого опыта? Сколько исходов благоприятствуют появлению ровно одной "шестёрки"? ровно двух? ровно трёх? ни одной? хотя бы одной "шестёрки"? Найдите вероятности всех этих событий.

13. В урне 20 шаров - 12 белых, 8 чёрных. Из неё случайным образом вынимаются последовательно 5 шаров. Событие А произойдёт, если все появившиеся шары окажутся белыми, В - первые два белые, остальные чёрные, С - два белых и три чёрных в любом порядке, D - хотя бы один белый. Как вам кажется, в каком порядке убывают вероятности этих событий? Рассчитайте их точно и сравните со своим предположением, - подвела Вас интуиция или нет? Отв.: 0,051; 0,023; 0,23; 0,996.

14. В урне 100 шаров - 60 белых, 35 чёрных, 5 красных. Опыт состоит в последовательном вынимании наудачу десяти шаров. Событие А произойдёт, если будут вынуты десять белых шаров, В - первые три белых, потом четыре чёрных, последние три красных, С - ровно один белый, D - ровно два белых, Е - хотя бы один белый. Расположите события в предположительном порядке убывания их вероятностей. Рассчитайте вероятности и сравните со своим предположением. Ошиблись или нет?

15. Рабочий выточил за смену 10 деталей, из которых одна получилась нестандартной. ОТК берёт на контроль три детали и если не обнаруживает брака, то принимает всю партию. Какова вероятность того, что партия будет принята? Сколько раз в месяц ОТК отклонит работу, содержащую 10% брака? Отв.: 0,7.

16. Бригада сделала за смену 100 изделий, из которых 10 получились с браком. ОТК подвергает проверке 5 изделий и если не обнаруживает брака, то принимает всю партию. Каковы шансы бригады на то, что их работа будет принята? Сколько раз в месяц работа будет отклоняться?

Отв.: 6:10; -13раз.

17. Партия из тысячи ламп содержит 5% брака. Если испытанию подвергается пять ламп, то какова вероятность, что среди них не найдётся ни одной испорченной? Какова вероятность, что пробная группа будет иметь 40% брака?

18. В лотерее 100 билетов, из них 10 выигрышных. Некто купил 5 билетов. Какова вероятность того, что а) ровно один билет окажется выигрышным; б) ровно два билета выиграют; в) хотя бы один билет выиграет?

19. Составьте формулу для решения предыдущей задачи в общем виде (число билетов п, выигрышных m, куплено к билетов).

20. В лотерее из сорока тысяч билетов ценные выигрышы падают на 3 билета, а всего выигрышных 500 билетов. Некто приобрёл 100 билетов. Какова вероятность а) ровно одного выигрыша; б) хотя бы одного; в) хотя бы одного ценного выигрыша? Сколько надо купить билетов, чтобы вероятность ценного выигрыша была не менее 0,5 ?

21. Какова вероятность, что при п бросаниях игральной кости хотя бы один раз выпадет "шестёрка"? Сколько раз нужно бросить игральную кость, чтобы с вероятностью не меньшей а) 0,5, б) 0,9 хотя бы один раз выпала "шестёрка"?

22. Найти вероятность того, что дни рождения 12 человек придутся на разные месяцы года.

23. Номер автомашины состоит из трёх букв и трёх цифр (сначала идёт буква, затем три цифры, затем две буквы). Какова вероятность того, что номер проезжающей машины будет иметь а) ровно две одинаковые буквы; б) ровно две одинаковые цифры; в) и то, и другое? Как проверить, правильно ли составлена вероятностная модель задачи? Проверьте.

24. На шахматную доску ставятся случайным образом две ладьи -одна белого, другая чёрного цвета. Как вам кажется, что более вероятно: ладьи "бьют" друг друга или не "бьют"? Проведите точный расчёт.

25. Вторая задача де Мере*). Что происходит чаще при четырёх бросаниях игральной кости, - появление хотя бы одной "шестёрки" или не появление "шестёрки" вообще?

*) Одна из задач, которую де Мере поставил перед Паскалем. Блез Паскаль (1623-1662) - выдающийся французский учёный, математик, физик, религиозный философ, пионер научного изучения случайности.

ЛЕКЦИЯ 3

РАСЧЁТ ВЕРОЯТНОСТЕЙ С ПОМОЩЬЮ ТЕОРЕМ СЛОЖЕНИЯ И УМНОЖЕНИЯ

В этой лекции вы познакомитесь с новым методом расчёта вероятностей. Суть метода можно пояснить бытовым примером. Представьте, что надо рассчитать стоимость покупки нескольких вещей (хватит ли денег?). Если вы знаете стоимость каждой вещи, то стоимость всей покупки найдёте сложением. Эта простая идея лежит в основе метода расчёта вероятностей сложных событий: мы будем разлагать их на более простые события, вероятности которых или известны, или легко вычисляются, а потом -складывать и перемножать эти вероятности.

Ваша цель в этой лекции - овладеть новым методом решения задач. Для этого надо сначала усвоить несколько новых понятий (сумма и произведение событий, зависимые и независимые события) и понять смысл и доказательство трёх теорем (две теоремы сложения, одна - умножения).

1. Сумма и произведение событий

Определение 1. Пусть в некотором опыте возможны случайные события А и В. Суммой событий А и В называется новое событие С = А + В, которое состоит в том, что в результате опыта произойдёт или i, или В (или А и В вместе).

Определение 2. Произведением событий А и В называется событие D = AB, которое состоит в том, что в результате опыта произойдут и А, и В вместе.

Вы прочли эти определения и, наверное, чувствуете, что ничего не поняли. Это нормально, - чтобы понять, надо конкретизировать абстрактные фразы на примерах.

Пример 1.В урне 10 пронумерованных*) шаров. Опыт состоит в случайном выборе одного шара (рис. 1). Событие А произойдёт, если появится шар с чётным номером, В - с номером, делящимся на 3.

Согласно определению 1, событие А + В произойдёт, если появится или шар с одним из номеров 2, 4, 6, 8, 10, или шар с номером 3, 6, 9. Мож-

*) Термин "пронумерованные" означает, что шары занумерованы последовательными натуральными числами 1, 2, 3,...

но сказать иначе: событие А + В произойдёт, если будет вынут любой шар, кроме первого, пятого и седьмого.

Рис. 1

Согласно определению 2, событие А • В произойдёт только в случае, если будет вынут шар с номером 6. При этом произойдёт и А + В (почему?).

Замечание 1. Поначалу вы можете путать сложение и умножение событий. Запомните вот что: сумма - это "и л и" (или А, или 5), а произведение - это "и" (и А, и В). Заметьте также, - сумма событий в некотором смысле "больше" каждого слагаемого, а произведение - "меньше". Так, в нашем примере сумме А + В благоприятствуют семь исходов опыта, а произведению А-В — один исход.

Пример 2. Орудие дважды стреляет в мишень. Событие Ах произойдёт, если цель будет поражена первым выстрелом (при этом результат второго выстрела может быть любым - попадание, промах). Событие А2 произойдёт, если цель окажется поражённой именно вторым выстрелом (результат первого выстрела игнорируется).

Согласно определению 1, событие Ах + А2 произойдёт, если или первый выстрел попадёт в цель, или второй, или оба вместе. При этом возможны три взаимоисключающих варианта: 1) первый выстрел попал, а второй промазал (событие Ах • А2)*); 2) первый промазал, а второй попал (событие Ах - А2)\ 3) первый попал, второй тоже попал (произошло событие Ах • А2). Если же оба выстрела промахнутся (Ах • А2), то событие Ах + А2 не произойдёт, ибо не произойдёт ни Ах,ниА2.

Согласно определению 2, событие Ах • А2 произойдёт только в случае двух попаданий. Заметьте, - при этом произойдёт и сумма Ах + А2. Но обратное не верно: если произошло событие Ах+А29 то событие Ах • А2 может произойти, а может и не произойти (почему?).

Контроль 1.В урне 5 шаров - 3 белых, 2 чёрных. Наудачу вынимаются последовательно два шара. Событие А - первым вынут белый шар, В - вторым вынут белый шар. Выпишете все двадцать исходов опыта и подчеркните исходы, благоприятствующие сумме А + В (сколько их?). Сколько исходов благоприятствуют произведению А • В ? В каких случаях произойдёт событие А • В ? В каких -AB?

*) Через ах обозначается событие, дополнительное к событию ах (лек. 2, п. 5), - оно состоит в том, что ах не происходит.

2. Совместимые и несовместимые события

В дальнейшем при расчёте вероятности суммы событий нам придётся различать совместимые и несовместимые события: если слагаемые несовместимые, то расчёт идёт по одной формуле, если совместимые - по другой. Напомню определение (лек. 1, п. 5), ограничив его пока только двумя событиями.

Определение 3. Пусть в некотором опыте возможны события а и в. Назовём их совместимыми, если существует такой результат (исход) этого опыта, когда оба события произойдут вместе. Если же при любом исходе опыта появление одного из них исключает появление другого, они несовместимые.

В примере 1 события а (появление шара с чётным номером) и в (появление шара с номером 3, 6 или 9) совместимые, ибо возможен такой результат опыта (появление шара с номером 6), когда происходят события а и в вместе. Если же добавить противоположное событие а (появление шара с нечётным номером), то события а и а будут несовместимыми, в и а - совместимыми.

В примере 2 события ах и а2 совместимые, ибо возможен такой результат опыта (два попадания), когда они происходят вместе. Постарайтесь понять, совместимы ли два более сложных события - С = ах • а2 и D = al 12?

Контроль 2. Подбрасываются один раз две игральные кости. Событие а - на первой кости чётное число очков, в - сумма очков 11. Совместимы ли они? Какие исходы благоприятствуют событию а и сколько их? Какие благоприятствуют в и сколько их? Совместимы ли события а + в и а • в ? Сколько исходов им благоприятствуют?

3. Наводящие соображения к теоремам сложения

Напомню: наша цель - научиться вычислять вероятности сложных событий через вероятности простых. Первая задача на этом пути: как найти вероятность суммы событий, зная вероятности слагаемых? Может быть, сложением? Может быть, справедлива формула р(а + в) = р(а) + р(в)? Давайте проверим эту гипотезу с помощью наглядного примера.

Пример 3. На биллиардном столе нарисованы два круга. Опыт - случайное бросание шара на стол. Событие а произойдёт, если шар остановится в первом круге, в - во втором. Какова вероятность суммы событий р(а + в)?

Решение. 1) Вероятности в данном случае определяются геометрическим методом, как отношения площадей (лек.1, п. 9). Обозначим

через 5, - площадь первого круга, s2 - площадь второго круга, s - площадь стола, тогда

2) Вероятность суммы "р(а + в) зависит от того, как расположены круги (пересекаются или нет). Рассмотрим два этих случая последовательно. Если круги не пересекаются (рис. 2а), то

Рис. 2а Рис. 26

3) Пусть круги пересекаются (рис. 26). Обозначим площадь их пересечения через s3 а площадь "восьмёрки", которую покрывают два круга, через s4. Если сложить площади кругов, то окажется, что 5, + s2 > s4, ибо в левой части площадь пересечения s3 учитывается дважды. Значит,

54 — s} + s2 - s 2.

Учтём также, что если шар останавливается в пересечении кругов, то происходят оба события а и 5, и значит, происходит событие-произведение а-В, вероятность которого есть отношение s3 к s.

Определяем вероятность суммы:

Вывод. Рассмотренный пример подкрепляет и уточняет нашу гипотезу: если круги не пересекаются (события а и в несовместимые), то вероятность суммы определяется по формуле р (а + в) = р (à) + р (в) ; если же круги пересекаются (события а и в совместимые), то

р(а + в)=р(а)+р(в)-р(А'В).

Примечание. Подобное рассуждение можно провести для любых геометрических вероятностей.

Контроль 3. "Игла" длины 1 бросается случайным образом на отрезок числовой прямой [0;6]. Событие а - "игла" накрывает середину отрезка, в - накрывает точку 5. Вычислите р(а + В). Что изменится в расчёте, если длина иглы 2 ?

Указание. Сделайте рисунок. Поймите, какова длина пути, по которому "игла" может перемещаться, находясь на отрезке [0; б] (не ошибитесь, - длина пути не равна 6). Используйте геометрическую вероятность (лек.1, п. 9, рис. 36).

4. Теоремы сложения вероятностей

Чтобы находить вероятности сумм событий с помощью формул, установленных выше, надо убедиться, что они справедливы в общем виде, а не только в отдельных примерах. Для этого следовало бы провести абстрактные рассуждения в условиях произвольного опыта и произвольных событий. Однако, в самом общем виде мы этого сделать не можем, поскольку у нас есть одно строгое определение вероятности - классическое, которое применимо к определённому кругу случайных явлений, допускающих построение конечной группы равновозможных исходов (классическая модель). Следовательно, придётся доказывать нижеследующие теоремы только для этого круга явлений.

Тем не менее, в дальнейшем мы будем применять эти теоремы и к явлениям, не сводящимся к классической схеме. Обоснование этому даёт не столько формальная логика, сколько живая многовековая практика, которая доказала, что ошибок на этом пути нет. Именно поэтому в строгой математической теории теорема 1 не доказывается, а принимается как аксиома.

Теперь внимательно проследите за доказательствами двух теорем. Они просты. Тем не менее, даже простые абстрактные рассуждения воспринимаются начинающими с трудом. Но вы должны привыкать к строгим научным рассуждениям, учиться доказательной логике. Если же, всё-таки, будет непонятно, то вслед за теоремами разберите пояснение, - оно придаст абстрактным рассуждениям наглядность и поможет вашему пониманию.

Теорема 1*). Пусть в некотором опыте возможны случайные события А и В. Если эти события несовместимые, то вероятность их суммы рассчитывается по формуле

(1)

Другими словами, - вероятность суммы двух несовместимых событий равна сумме их вероятностей.

*) Первая чёткая формулировка теоремы сложения вероятностей находится в работе Т. Байеса (1702-1761), носящей длинное название - "Опыт решения задач по теории вероятностей покойного достопочтенного мистера Байеса, члена Королевского общества. Сообщено мистером Прайсом в письме Джону Кентону, магистру искусств, члену Королевского общества". Работа Байеса была зачитана на заседании Лондонского Королевского общества 27 декабря 1763 г., спустя два года после смерти автора. В начале работы содержится определение несовместимых событий, для которых Байес употребляет иной термин -"неплотные события" (inconsistent) [5, с. 410].

Доказательство проведём в предположении что все вероятности, входящие в формулу (1), могут быть вычислены классическим методом (лек. 1, п. 7), т. е. существует полная группа п исходов данного опыта, из которых тх исходов благоприятствуют событию А и т2 исходов - событию В. Следовательно,

Вычислим v{A + B). По условию теоремы, события А и В несовместимые, значит, нет такого исхода, который благоприятствовал бы одновременно событию А и событию В. Поэтому, подсчитывая исходы, благоприятствующие событию А + В, мы должны к тх исходам, благоприятствующим А, добавить т2 других исходов, благоприятствующих В. Следовательно,

Теорема 2. Если события А и В совместимые, то вероятность их суммы рассчитывается по формуле

(2)

Доказательство. Повторяя дословно первую часть доказательства теоремы 1, получим то же самое:

Вычисление Р(А + В) изменится, ибо, в силу совместимости событий А и В, есть исходы, благоприятствующие одновременно А и В, — обозначим их число тъ (заметьте, - они благоприятствуют событию А-В). Подсчитывая исходы, благоприятствующие сумме А + В, придётся к тх исходам, благоприятствующим А, добавлять не т2 исходов, как в теореме 1, а т2-тъ других исходов, благоприятствующих В, но не благоприятствующих А. Следовательно,

Пояснение. Если изобразить группу исходов опыта в виде п точек, то несовместимость и совместимость событий А и В представится наглядно (рис. За, 36). Эти рисунки помогают лучше понять, как в том и другом случае считаются исходы, благоприятствующие сумме Ал-В.

Рис. 3а Рис. 36

Контроль 4. В урне 50 пронумерованных шаров. Опыт состоит в случайном выборе одного шара. Событие а произойдёт, если появится шар с чётным номером, С - с номером, делящимся на 5, D — на 11. Выберите необходимую формулу (1) или (2) и рассчитайте Р (а + С) и Р(С + D).

5. Наводящие соображения к теореме умножения

Возникает вопрос: не справедлива ли для произведения событий теорема, аналогичная теореме 1? Не верна ли для совместимых событий а и в формула Р {а • в) = Р (а) • Р (в) ? Давайте проверим её на примере 3.

Если круги пересекаются (рис. 26), то событие а • в произойдёт в случае, когда шар остановится в пересечении кругов. Геометрическая вероятность этого события есть отношение площади пересечения кругов к площади стола, т. е.

Преобразуем правую часть, умножив и поделив её на 5,:

Первый множитель правой части есть геометрическая вероятность события а, т. е. р{а). Второй множитель тоже напоминает вероятность (отношение площадей): это вероятность того, что шар остановится в пересечении кругов (площадь 53), при условии, что его бросают не на весь стол, а в первый круг (площадь 5,), - представьте, что круг огорожен так же, как стол. Такого рода вероятность называют условной вероятностью и обозначают РА{в). С учётом этого обозначения, последнее равенство принимает вид

Р(Л.Д) = Р(Л).РА(Д).

Далее постараемся доказать эту формулу в общем виде. Но предварительно надо ввести новые понятия. Этому посвящены два следующих раздела.

Контроль 5. В условиях примера 1 найдите Р{а), Р(А- в), после чего определите условную вероятность РА {в) и разъясните её смысл.

6. Условная вероятность

Определение 4. Пусть в некотором опыте возможны события а и в. Условной вероятностью события в относительно события а называется вероятность события 5, вычисленная в несколько изменённом опыте, а именно, при дополнительном условии,

что в данном опыте всегда происходит событие а. Обозначение: РА (В)*).

Пример. Вернёмся к примеру 3. Каков смысл и каково численное значение условной вероятности в этом примере?

Согласно определению 4, сначала нужно понять, в чём состоит изменённый опыт? Если при бросании шара на стол всегда происходит событие а, это значит, что шар всегда останавливается в первом круге. Следовательно, изменённый опыт состоит в том, что шар бросается не на весь стол, а в первый круг (представьте, что он огорожен). Далее, - в этом новом опыте событие В произойдёт в том случае, когда шар остановится в пересечении кругов. Значит, геометрическая вероятность события В в новом опыте есть отношение площади пересечения кругов к площади первого круга, т. е. PA(B)=s3/sl. •

Чтобы лучше понять, как вычисляется условная вероятность, рассмотрим ещё один пример.

Вспомните пример 1: опыт состоит в случайном выборе одного шара из урны, где находятся десять пронумерованных шаров. В чём состоит новый, изменённый опыт? Если событие а в этом новом опыте всегда происходит, это значит, что при вынимании шара всегда появляется шар с чётным номером. Следовательно, изменённый опыт состоит в том, что шар вынимается не из десяти, а из пяти шаров с чётными номерами (представьте, будто все шары с нечётными номерами исчезли из урны). Далее, - в этом новом опыте событие В произойдёт в том случае, когда появится шар с номером, делящимся на 3. Среди пяти "чётных" шаров только один шар имеет номер, делящийся на 3 - это шар с номером 6. Значит, рА(В)=1/5.

В дальнейшем нам придётся находить ещё одну условную вероятность - вероятность события В при условии, что а не происходит, а происходит, следовательно, дополнительное событие а. В нашем примере событие а происходит при вынимании "нечётного" шара. Среди пяти "нечётных" шаров два шара имеют номер, делящиеся на 3, - это шары с номерами 3 и 9. Значит, Рх {В)=2/5. •

Совет. При вычислении условной вероятности надо начинать с вопроса: в чём состоит новый, изменённый опыт? После того, как новый опыт будет отчётливо понят, идёт расчёт обычной вероятности именно в условиях нового опыта. В этом, конечно, следует поупражняться.

*) В литературе употребляется и другое обозначение р(в \ а). оно менее удачное, ибо провоцирует впечатление, будто в | а есть некое новое событие. В то время как изменилось не событие, а смысл вероятности. Поэтому надо изменить обозначение вероятности, - вместо обычного символа р будем использовать для условной вероятности символ ра. Впрочем, запись р(в \ а) бывает удобна, когда обозначения событий А и в громоздкие.

Контроль 6. В урне 20 пронумерованных шаров. Опыт - вынимание наудачу одного шара. Событие А произойдёт, если окажется вынутым "чётный" шар, В - шар с номером, делящимся на 3. Найти РА {в), Ра {в) и Р(в). В чём отличие полученных результатов от аналогичных результатов примера 1 ?

7. Зависимые и независимые события

Интересно сравнить условную вероятность с безусловной (обычной). В предыдущем примере безусловная вероятность Р (в) = 3/10 (из десяти шаров три шара имеют номер, делящийся на 3). Условные вероятности рА(д) = 1/5 и Ра с8) =2/5 изменились, сравнительно с безусловной. Но бывает, что они не изменяются, как например, в контроле 6, и это очень важный случай. В дальнейшем вы увидите, как упрощаются формулы в этом случае и как часто он встречается при решении задач.

Определение 5. Два события А и В называются независимыми, если условная вероятность одного из них не изменится в зависимости от того, произойдёт или не произойдёт другое, т. е. PA(i?)=PA (в). В противном случае, если РА(я) * РА события называются зависимыми.

Примечание 1. Строго говоря, равенство РА(5) = РдС#) означает, что событие В не зависит от события А. Нетрудно доказать (это будет сделано чуть ниже), что в этом случае справедливо симметричное равенство рв(А) = р^(А), т. е. и событие А не зависит от В. Поэтому в определении 5 события А и В названы независимыми (друг от друга).

В примере 1, как мы видели, события А и В оказались зависимыми. В контроле 6 - независимыми. Рассмотрим ещё один знакомый пример.

Пример 4. В урне 5 шаров - 3 белых, 2 чёрных. Опыт состоит в последовательном вынимании двух шаров случайным образом. Событие А} произойдёт, если первый шар окажется белым, А2 - если второй шар белый. Зависимые эти события или нет?

Решение. 1) Рассчитаем условную вероятность РА (А2). Ставим вопрос: в чём состоит новый опыт? Если всегда происходит событие Ах, это значит, что в урне остаётся не 5, а 4 шара - 2 белых и 2 чёрных (один белый вынут) и опыт состоит в вынимании одного шара из четырёх. Значит, PAl {А2) = 2/4.

2) Если при первом вынимании появляется чёрный шар, то в урне остаются 3 белых и 1 чёрный, - следовательно, Р А (А2) = 3/4. События зависимые. •

Между прочим, безусловная вероятность события А2 (второй шар белый, а первый любой) равна р(л2) = з/5 (советую вспомнить непосредственный расчёт вероятности, выписать все исходы - их 20, и посчитать благоприятствующие событию А2 исходы - их 12).

Как определять независимость событий? Ответ прост - надо вычислить условные вероятности РА(#), Рх (#) и сравнить их. Однако при решении задач это делают редко, потому что независимость легко усматривается непосредственно. Ну, скажите, - зависит ли вероятность появления герба на одной монетке от того, как упадёт другая (при подбрасывании двух монет)? Конечно, не зависит - во всех случаях эта вероятность равна 0,5. А зависит ли вероятность попадания в цель одного орудия от того, попало или нет другое? Тоже, очевидно, не зависит.

В основе независимости событий лежит их физическая независимость: множество случайных факторов, приводящих к появлению одного события, и множество факторов, влияющих на другое событие, - разные. Правда, эти факторы могут быть слабо связаны друг с другом, - ведь в природе нет абсолютно независимых явлений. Так, при подбрасывании двух монет на них влияет общий фактор - слабое движение воздуха. Подобными слабыми зависимостями мы вправе пренебречь и считать события практически независимыми. А вот, если бы монеты были жёстко связаны друг с другом, то этот фактор однозначно определял бы падение одной монеты в зависимости от того, как упала другая. В таком опыте события становятся зависимыми.

Предостережение. Не путайте независимые события с несовместимыми! Вдумайтесь в смысл терминов. Что означает слово "несовместимые"? Значит, события невозможно "совместить", они не могут появиться вместе в результате опыта. А что значит "незави симые"? Зависеть - это значит меняться. События не могут "меняться" - изменяться могут верятности событий после изменения условий опыта.

В заключение раздела сформулируем и докажем ценное свойство независимых событий, которое позволяет упростить многие формулы.

Свойство независимых событий. Если события А и В независимые, то их условные вероятности совпадают с безусловной, т. е.

рА(В) = р-(В) = р(В) и Рв(Л) = Рз(Л) = Р(Л). (3)

Доказательство, как всегда, проведём в рамках классической модели. Наша цель - из равенства ра(В) = р-(В) (независимость событий, - определение 5) получить оба двойных равенства (3). Для наглядности воспользуемся рис. 36, - на нём изображены в виде п точек все исходы опыта, тх из которых благоприятствуют событию А, т2 - событию В, т3 - событию AB.

Сначала выведем первое двойное равенство (3).

1) Вычислим (рис. 36) все три вероятности, входящие в это равенство:

2) Теперь из условия независимости событий А и В следует:

3) Преобразуем полученное равенство так:

4) Левая часть последнего равенства есть ра(#), а правая р(в) (эти вероятности вычислены в первом пункте нашего рассуждения), значит, доказано:

ра(я) = р(я).

5) Объединяя последнее с условием независимости Ра(в) = Ра (в), получаем первое двойное равенство (3):

ра(в) = рх(в) = р(в). Докажем теперь второе: рв (А) = р-(А) = р{А).

6) Вычислим с помощью рис. 36 все входящие в него вероятности:

7) Используем пропорцию, полученную в п. 3, и преобразуем её так:

Таким образом, часть нужного равенства установлена. 8) Преобразуем ту же пропорцию (п. 3) следующим образом:

9) Левая часть последнего равенства есть v-(A), а правая р(А) (эти вероятности вычислены в п. 6), значит, установлено:

р-(А) = р(А).

10) Объединяя результаты п. 7 и п. 9, получаем требуемое:

рВ(А) = р-(А) = р(А). •

Примечание 2. Второе из равенств (3) содержит условие независимости события А от события В (рв(А) = р-(А)), обещанное в примечании 1. Отметим, что аналогично можно установить независимость противоположных событий - А и В, А и В, А и в "

Контроль 7. Подбрасываются две игральные кости. Событие А произойдёт, если на первой кости появится чётное число очков, В - если сумма очков 11. Совместимые ли эти события? Зависимые ли? Добавьте событие С - сумма очков 12; зависимые ли события А и С?

Указание. Посчитайте принципом умножения число исходов нового, изменённого опыта, - их 18.

8. Теорема умножения вероятностей

Теорема 3*). Пусть в некотором опыте возможны случайные события А и В. Если эти события совместимые и зависимые, то вероятность их произведения рассчитывается по формуле

(4)

Другими словами, - вероятность произведения двух событий равна произведению вероятности первого на условную вероятность второго.

Доказательство. Вычислим вероятности, входящие в формулу.

1) Согласно определению вероятности, существует полная группа, содержащая п исходов опыта, из которых тх исходов благоприятствуют событию А, т2 — событию В, т3 - событию А • В. Следовательно,

2) Вычислим условную вероятность ра(#). Поскольку в новом опыте событие А всегда происходит, то число его исходов будет не п, а тх. Из них событию В благоприятствуют те исходы, которые благоприятствуют А • В, - их число тъ (см. рис. 26). Значит,

3) Преобразуем найденную ранее вероятность произведения AB, умножив и поделив её на тх, и окончательно получим:

Следствие. Если события А и В совместимые и независимые, то вероятность их произведения равна произведению их вероятностей, т. е.

(5)

Доказательство мгновенно вытекает из формул (4) и (3).

Замечание. Формулу (4) можно использовать для вычисления условной вероятности, переписав её так:

(6)

*) Чёткое выделение теоремы умножения, а также понятий условной вероятности и зависимых событий было сделано А. Муавром в 1718 г. в первом издании его "Доктрины шансов" [5, с. 410]. До него эта теорема неявно присутствовала у многих математиков при рассмотрении частных примеров.

**) Иногда формулу (6) принимают в качестве самого определения понятия условной вероятности (вместо нашего определения 4). При этом, конечно, становится не ясным смысл этого понятия.

Пример 5. В урне 5 шаров - 3 белых, 2 чёрных. Опыт - последовательное вынимание двух шаров (без возвращения). Событие а - появление двух белых шаров. Рассчитать р (а).

Заметим, что эту задачу мы уже решали непосредственным подсчётом числа исходов, а также с помощью принципа умножения. Сейчас решим с помощью теоремы умножения. Сравните, - какой метод проще?

Решение. 1) Введём два "простых" события: ах - первый вынутый шар белый; а2- второй шар белый.

2) Представим искомое событие а в виде произведения а = ах -а2.

3) Применим теорему умножения: р (а) = р (ах)• р а (а2).

4) Вычислим вероятности. Очевидно, р (/!,) = 3/5. Условная вероятность найдена в примере 4 - р а (а2) = 2/4.

5) Перемножаем:

Пример 6. В условиях предыдущего примера изменим опыт без возвращения шаров на опыт с возвращением. Это значит, что вынимается первый шар, фиксируется его цвет, потом он возвращается обратно в урну, шары перемешиваются, после чего наудачу вынимается второй шар. Вопрос тот же - какова вероятность вынуть два белых шара?

Решение идёт точно так же, как и выше, за одним исключением - вместо теоремы умножения применяется следствие, т. к. события ах и а2 независимые. В самом деле, - число шаров при втором вынимании остаётся то же, что и при первом, а значит, вероятность события а2 не зависит от результата первого вынимания и равна р (а2) = 3/5. Итак,

Обратите внимание, - вероятность чуть увеличилась, сравнительно с предыдущим примером.

Контроль 8. В урне 10 пронумерованных шаров. Опыт состоит в вынимании случайным образом одного шара. Событием произойдёт, если вынутым окажется шар с чётным номером, В - с номером, делящимся на 3. Выберите нужную формулу и рассчитайте р(а-В). Что изменится в расчёте, если в урне будет 20 шаров?

9. Обобщение теоремы сложения

Выше мы установили теоремы сложения и умножения вероятностей для двух событий. Они легко обобщаются на любое конечное число событий. В результате, резко расширяется сфера приложений этих теорем.

Чтобы сформулировать обобщённые теоремы, надо, разумеется, обобщить на несколько событий соответствующие понятия (сумма, произведение, несовместимость и независимость). Условимся обозначать обобщённые определения и теоремы теми же номерами, но со штрихом.

Определение 1'. Пусть в некотором опыте возможны к случайных событий АХ9 А29 Ак. Суммой этих событий называется новое событие С = Ах + А2 +... + Ак9 которое произойдёт, если в результате опыта произойдёт хотя бы одно из событий - или Ах, или А29..., или Ак, или некоторые из них вместе.

Определение 3'. Назовём события АХ9 А29 Ак несовместимыми*), если при каждом выполнении опыта появление одного из них исключает появление остальных. Если же хотя бы одна пара событий может произойти вместе, события группы называются совместимыми.

Замечание 2. Несовместимые события ль лъ лк (л > з) иногда называют попарно несовместимыми, подчёркивая, тем самым, несовместимость любой пары этих событий. В случае, когда все события имеют общее пересечение (могут появиться все вместе), их называют совместимыми в совокупности (рис. 4д).

Пример 7. На биллиардном столе нарисованы три круга. Шар бросают на стол случайным образом. Событие Ах произойдёт, если шар остановится в первом круге, А2 - во втором, А3 - в третьем.

Событие Ах + А2 + Аъ произойдёт, если шар остановится в одном из трёх кругов. Если ни одна пара кругов не пересекается (рис. 4а), то данные три события несовместимые. Если хотя бы одна пара или все три круга пересекаются (рис. 4б-д) - совместимые.

Пример 8. В урне 30 пронумерованных шаров. Опыт состоит в случайном выборе одного шара. Событие А5 произойдёт, если появится шар с номером, делящимся на 5, А1 - с номером, делящимся на 7, А% - с номером, делящимся на 8, и Ахо - с номером 10, 20 или 30.

Рис. 4а Рис. 46 Рис. 4в Рис. 4г Рис. 4д

*) Определение несовместимых событий было дано в лек. 1, п. 5, опр. 5.

Событие А5 +A7+AS + А]0 произойдёт, если будет вынут шар с одним из номеров - 5, 7, 8, 10, 14, 15, 16, 20, 21, 24, 25, 28, 30 (событию-сумме, следовательно, благоприятствуют 13 исходов опыта). Вместе с тем, эти четыре события совместимые, ибо пара событий А5 и Ахо может произойти вместе. Если же взять "тройку" событий А59 А79 AS9 они несовместимые.

Теорема 1'. Пусть в некотором опыте возможны случайные события А19 А29..., Ак. Если эти события несовместимые, то вероятность их суммы равна сумме их вероятностей, т. е.

(1')

Доказательство состоит в к -кратном применении теоремы 1. Для трёх событий, например, оно заключено в следующей цепочке равенств:

p(4+^2+4) = p((4+^)+4) = p(4+4)+p(4) = p(4)+p(^J+p(4).

При этом надо учесть ассоциативность сложения событий (Ах + А2+Аъ) = {[А1+А2)+А3)9 которая следует из определения Г, а также несовместимость двух событий (Ах + А2) с Аъ и Аг с А29 что следует из несовместимости трёх событий Ах, А2 и Аъ •

Замечание 3. Теорему 2 обобщать не будем, т. к. в случае совместимых событий формула (2) очень усложняется и в нашем курсе не применяется. Для интереса приведу вид формулы в случае трёх совместимых в совокупности событий (при желании вы можете сами обосновать её с помощью рис. 4д):

Контроль 9. В условиях примера 8 определите, совместимы или нет события А79 AS9 AlQ, и найдите вероятность их суммы.

10. Обобщение теоремы умножения

Предупреждаю вас, - этот раздел сложнее предыдущих. Можете его пропустить и перейти к решению задач. Но обязательно вернитесь к нему позже. Он нужен для обоснования решений.

Определение 2'. Произведением событий А19 А29..., Ак называется новое событие D = Al-A2-...-Ak9 которое произойдёт, если в результате опыта произойдут все события вместе - и Ах, и А29..., и А-

Замечание 4. Если несколько событий несовместимые (рис. 4а), то их произведение не существует (точнее, является невозможным событием), - ведь, нет такого результата опыта, при котором они происходят все вместе. Если они совместимые (т. е. некоторые пары совместимые), то

произведение тоже может не существовать (рис. 4б-г). Произведение существует только в случае совместимых в совокупности событий (рис. 4д).

Определение 5'. События Ах, А29..., Ак называются независимыми в совокупности, если каждое из них независимо не только с любым другим событием этой группы, но и с произведением любого числа других событий этой группы. В противном случае события группы зависимы в совокупности.

Как определять независимость? Если, к примеру, три события Ах, А2, Аъ независимые в совокупности, это означает, что а) каждые два из них независимы, т. е. VА (А2) =Pi {А2), Vа (A3) = 'Pä1 (д0> Р а2 (^3) = Р а2 и б) каждое независимо с произведением двух других, т. е.

Чтобы установить независимость в совокупности трёх событий, надо, согласно определению 5', вычислить 12 условных вероятностей, перечисленных выше.**) Если выполняются все 6 равенств, то события независимы в совокупности. Если хоть одно равенство не выполняется, события зависимы в совокупности.

Вы, наверное, смущены сложной проверкой независимости. Но знайте, что при решении задач зачастую определить эту независимость очень легко. Она бывает очевидна из условий опыта. Ну, например, три орудия стреляют в мишень, события Ап / = 1,2,3 (попадание /-го орудия) независимы в совокупности, ибо вероятность попадания или промаха каждого орудия не зависит от результатов других. Практическое определение зависимости событий тоже бывает не сложным, ибо уже первые условные вероятности оказываются не равными (например, РА {А2)ф'Ва {А2)) и других вычислять не надо.

У вас может возникнуть вопрос: зачем такое сложное определение 5'? Зачем второе требование б) независимости каждого события с произведением других? Необходимость этой "добавки" станет ясной чуть позже, когда вы увидите доказательство теоремы.

Пример 9. В урне 10 пронумерованных шаров. Опыт состоит в последовательном извлечении наудачу трёх шаров. Событие Ах произойдёт, если первый вынутый шар "чётный", А2 - второй "чётный", Аъ - третий "чётный". Определить, зависимые ли в совокупности эти три события?

*) Напоминаю, - через аха2 обозначается событие, дополнительное к произведению а{а2, и состоящее в том, что ах и а2 вместе не происходят.

**) На самом же деле, достаточно вычислить не 12, а 7 условных вероятностей из этих 12-ти.

Решение. По-видимому, события зависимые, потому что после извлечения первого шара (без возвращения!) изменяется состав шаров и вероятность вынуть следующий белый шар (событие а2) оказывается зависимой от того, какой шар был вынут ранее. Проверим наше предположение точным расчётом. Вычислим условные вероятности ра (а2) = 4/9 и р [а2) = 5/9 (объясните, почему они такие?). Равенство не выполняется, значит, наше предположение справедливо. •

Заметьте, - если вынимание шаров без возвращения изменить на вынимание с возвращением, то события ах9 а29 аъ станут независимыми в совокупности.

Теорема 3'. Если события ах, а29..ак совместимые в совокупности, то вероятность их произведения рассчитывается по формуле

(4')

Доказательство, как и прежде, легко идёт методом индукции. Для трёх событий оно состоит в двукратном применении теоремы 3:

Следствие. Если события а19 а29...9 ак совместимые в совокупности и независимые в совокупности, то вероятность их произведения равна произведению их вероятностей, т. е. справедлива формула

(5')

Доказательство следует из определения 5' и формулы (4'), с учётом того факта, что любая условная вероятность события данной группы совпадает с его безусловной вероятностью (обобщение формулы (3)). •

Контроль 10. В урне 10 шаров - 3 белых, 2 чёрных, 5 красных. Опыт состоит в последовательном вынимании наудачу трёх шаров (без возвращения). Событие ах произойдёт, если первым окажется вынут белый шар, а2 - вторым чёрный, а3 - третьим красный. Совместимые ли в совокупности эти события? Независимы ли в совокупности? Рассчитайте вероятность их произведения. Измените опыт на опыт с возвращением и ответьте на те же вопросы.

11. Методика решения задач

Мы уже применяли теоремы сложения и умножения (по отдельности) к решению задач. Но обычно они применяются вместе. При этом еле-

дует иметь в виду, что теоремы 1, 2, 3 и их обобщения распространяются на геометрическую и статистическую вероятности. Нижеследующие задачи 1-3 опираются на теоремы сложения и умножения для статистической вероятности.

Начнём с задачи, требующей применения только одной теоремы 3 -теоремы умножения для двух событий. Одновременно вспомним полезную формулу вероятности хотя бы одного события (лек. 2, п. 5, (3)).

Задача 1. Два орудия производят залп по цели. Вероятность поражения цели первым орудием 0,8, вторым - 0,3. Событие а произойдёт, если оба орудия поразят цель, В- оба промажут, С- первое орудие попадёт, а второе промажет, D - первое промажет, а второе попадёт, е - хотя бы одно орудие поразит цель. Рассчитать вероятности всех этих событий.

Решение. 1) Вводим "простые" события:

ах - первое орудие поразило цель; а2 - второе поразило цель; ах - первое орудие промахнулось; а2 - второе промахнулось.

2) Согласно определению 2, искомые события представляются в виде произведения "простых" событий:

3) Перемножаемые события, очевидно, независимы, т. к. вероятность попадания (промаха) одного орудия не зависит от результата выстрела другого. Поэтому применяем формулу (5) и получаем:

4) Вероятности попаданий даны - р (ах) = 0,8, р (а2) = 0,3, а вероятности дополнительных событий (промахов) легко определяются -р (ах) = 1 - 0,8 = 0,2, р [а2) = 1 - 0,3 = 0,7. Подставляем их в предыдущие равенства и вычисляем:

5) Вероятность события е определяется по стандартной формуле вероятности хотя бы одного события - Р(е)=\-'р(е) (лек. 2, п. 5, формула (3)). Здесь надо правильно понять, в чём состоит событие е. Вдумайтесь:

если е - хотя бы одно попадание, то дополнительное событие е - ни одного попадания. Согласны? Тогда е = ах • а2. Вычисляем:

Прогноз. Если провести опыт 100 раз, то два попадания будет, примерно (!) в 24 опытах, ни одного попадания - в 14 опытах. Примерно в половине опытов первое орудие попадёт, а второе промажет. Редко будет встречаться случай, когда первое орудие промажет, а второе попадёт, -примерно, 6 раз из 100. Хотя бы одно попадание очень часто, - примерно 86 раз из 100.

Общая схема решения задач с использованием теорем сложения и умножения следующая:

1) вводятся "простые" события;

2) искомое событие разлагается в сумму и произведение "простых";

3) применяются теоремы сложения и умножения;

4) вычисляются вероятности.

Первый этап обычно подсказывается структурой опыта. Второй труднее, - надо понять, как искомое событие строится из "простых". В третьем надо правильно определить, какие теоремы следует применять, т. е. решить, совместимы или несовместимы слагаемые события, зависимы или нет перемножаемые события. Четвёртый этап - вычисления.

Задача 2. В условиях предыдущей задачи не будем конкретизировать вероятности попаданий, а зададим их в общем виде так: Р(Аг) = р19 р [а2) = р2. Вычислить вероятность ровно одного попадания.

Решение. Прежде чем начинать решение, надо правильно понять, в чём состоит искомое событие, - обозначим его wx. Вдумайтесь -что значит "ровно одно попадание"? Это значит, что одно орудие (неважно какое!) попало в цель, а другое промахнулось.

1) Вводим те же "простые" события: а19 а29 а19 а2.

2) Ставим вопрос: как представить событие wx в виде суммы и произведения "простых"? Ещё раз сосредоточимся на искомом событии wx -что происходит, когда происходит wx ? В этом случае или первое орудие попадает в цель, а второе не попадает (происходит, следовательно, событие-произведение ах-а2)9 или первое орудие не попадает, а второе попадает (происходит событие ах • а2). "Или-или" - сумма событий. Следовательно,

3) Слагаемые события ах-а2 и ах-а29 очевидно, несовместимые, -ведь, не могут вместе произойти противоположные события ах (попада-

ние) и ах (промах). Поэтому применяем первую теорему сложения для несовместимых событий и получаем

К каждому слагаемому применяем следствие теоремы умножения (события ах и а2, очевидно, независимые, так же как ах и а2)и получаем:

4) Вычисляем вероятности:

р [а2) = 1 - р2. Подставляем их в последнее равенство и окончательно получаем:

Задача 3. Три орудия стреляют в цель. Вероятности попаданий - рх, р2, ръ. Рассчитать вероятность ровно двух попаданий (событие W2).

Решение проведём кратко:

1) ах— первое орудие попало в цель, а2- второе попало, аъ— третье попало;

Когда применяется новый метод? Обратите внимание на особенность рассмотренных задач - известны вероятности "простых" событий, а рассчитываются вероятности "сложных" событий, которые получаются из "простых" операциями сложения и умножения.

Другая особенность - вероятности "простых" событий не могут быть вычислены классическим методом, это - статистические вероятности и они получаются экспериментально. А вот вероятности "сложных" событий рассчитываются новым методом.

Самая существенная особенность заключена в структуре опыта: его можно разбить на этапы (стреляет первое орудие, второе, и т. д.) так, что вероятности результатов каждого этапа ("простые" события) или известны, или легко рассчитываются.

Разумеется, новым методом можно решать и задачи, которые мы решали непосредственным подсчётом числа исходов. Это возможно, если структура опыта допускает разбиение на этапы, позволяющие ввести "простые" события. Вот пример.

Задача 4. Имеются две урны, в каждой по 5 шаров: в первой 3 белых и 2 чёрных, во второй - 1 белый и 4 чёрных. Опыт состоит в том, что из каждой урны вынимается наудачу по одному шару. Событие а произойдёт, если оба вынутых шара окажутся белыми, событие В - если шары будут одного цвета. Рассчитать вероятности этих событий.

Решение. 1) Можно представить, что опыт производится в два этапа: сначала вынимается шар из первой урны, затем - из второй. Результаты первого этапа: Ах - из первой урны вынут белый шар, Ах - вынут чёрный шар. Результаты второго этапа: А2 - из второй урны вынут белый шар, А2 - вынут чёрный шар. Вероятности этих "простых" событий легко рассчитываются:

2) Искомые события А и В строятся из "простых" так:

3) Очевидно, перемножаемые события независимые, а слагаемые несовместимые, значит,

Контроль 11. Игральная кость подбрасывается два раза. Событие А произойдёт, если первый раз появится чётное число очков, а второй раз - число очков, делящееся на 3. Событие В произойдёт, если в любом порядке появится чётное число очков и число очков, делящееся на 3. Рассчитайте вероятности этих событий. Обоснуйте каждый шаг решения.

Отв.: Р(Л) = 1/б; Р(Я) = 1/з.

Указание. Для события В надо ввести не два, а четыре "простых" события.

12. Упражнения

Сначала поупражняйтесь в операциях с событиями (вероятности вычислять не надо).

1. В урне 6 пронумерованных шаров. Опыт состоит в случайном выборе одного шара. Событие А произойдёт, если появится шар с чётным номером, В - с номером, делящимся на 3. Когда произойдёт событие А + В и какие исходы ему благоприятствуют? Когда произойдёт ABl Определите события А, В и перечислите исходы, им благоприятствующие. Какое из них будет происходить чаще? Когда произойдёт событие A+Bl Когда -А • В ? Какое чаще? Определите события А + В и А + В. Какое будет происходить чаще?

2. Подбрасывается один раз игральная кость. Событие А произойдёт, если появится число очков, не меньшее трёх, В - не большее трёх. Когда произойдёт событие А + В, когда - А • В ? Какое из них достоверное? Чуть измените событие А или В так, чтобы событие AB стало невозможным. Можно ли подобным образом сделать невозможным событие А + В ?

3. По мишени производятся последовательно три выстрела. Событие Ai произойдёт, если /-ый выстрел поразит цель (/ = 1,2,3). С помощью операций сложения и умножения составьте из этих событий следующие:

а) А - три попадания, В - три промаха, С - хотя бы одно попадание;

б) D - ровно два попадания, Е - ровно одно, F - ни одного;

в) G - не менее двух попаданий, я - не более одного;

г) А -не три попадания; ö - не ровно два попадания.

Отв.: В = ЛХ-Л2-ЛЪ\ H = Ах • 12 • 13 + Аг • А2 • 13 + Ах • А2 • А3 + В\ D=H + AlA2A3.

4. Монета подбрасывается четыре раза. Событие 4 произойдёт, если при /-ом подбрасывании появится герб (/ = 1,2,3,4). Составьте из этих "простых" событий следующие "сложные" события: А— число гербов и решек одинаково; В - ровно три герба (и одна решка); С - гербов больше, чем решек. Отв.: с = в+лг • А2 • А3 • АА.

Теперь поработайте с понятиями совместимости и независимости.

5. В условиях упражнения 1 добавьте событие С - вынут шар с номером, большим четырёх. Рассмотрите все пары событий и определите, какие из них совместимые, какие - нет. Совместимы ли три события - А, В, С? Выберите из рисунков 4а-д тот, которому соответствует "тройка" {А,В,С}. Для каждого другого рисунка придумайте соответствующую "тройку" событий. Отв.: А, в, С - события, совместимые в совокупности.

6. В условиях упражнения 2 определите, совместимые ли события А и В, независимые ли? Отв.: рд#) = 1/4 ; р(я) = i.

7. Игральная кость подбрасывается два раза. Событие А произойдёт, если при первом подбрасывании появится число очков, меньшее трёх, событие В - если при втором подбрасывании появится число очков, большее трёх. Совместимые ли эти события? Перечислите все исходы, при которых они появятся вместе. Зависимые ли события А и В ? Почему?

8*). В урне 4 шара с номерами 110, 101, 011, ООО. Опыт состоит в случайном выборе одного шара. Событие А произойдёт, если будет вынут шар, у которого первая цифра номера 1, событие В - если вторая цифра 1, С - третья 1. Проверьте, что эти события попарно независимы, но зависимы в совокупности. Отв.: рАВ(с) = 0; р^(с) = 1/з.

9. Подбрасываются две монеты. Событие А произойдёт, если первая монета упадёт гербом вверх, В - вторая решкой вверх, С - хотя бы одна монета упадёт решкой вверх. Какие пары этих событий независимы, какие - зависимы? Отв.: рДс^о^ ; р^(с) = 1.

*) Этот простой пример придумал академик С.Н. Бернштейн (1880-1968) для того, чтобы показать, что попарная независимость и независимость в совокупности - разные понятия. Но во многих случаях они совпадают.

10. Опыт состоит в том, что одновременно подбрасываются один раз монета и игральная кость. Событие А произойдёт, если появится герб, В -чётное число очков, С - и герб, и чётное число очков. Будут ли эти события попарно независимыми?

В следующих задачах примените теорему умножения - выберите формулу (4), (5), (4') или (б'), предварительно определив, зависимы или независимы события.

11. В урне 10 шаров - 6 белых и 4 чёрных. Наудачу последовательно вынимаются два шара. Какова вероятность того, что а) будут вынуты оба белых шара; б) первым белый, потом чёрный; в) оба чёрных? Какими станут эти вероятности, если опыт без возвращения изменить на опыт с возвращением первого шара в урну и затем выниманием второго шара?

12. В условиях предыдущего упражнения измените опыт - наудачу вынимаются три шара (без возвращения). Рассчитайте вероятность появления трёх белых шаров. Какое событие будет дополнительным к последнему и какова его вероятность? Какова вероятность вынуть три чёрных шара? Какова вероятность вынуть первым белый шар, потом два чёрных?

13. В урне m белых и п чёрных шаров (т>2). Наудачу вынимаются два шара (без возвращения). Какова вероятность того, что появятся два белых шара?

Далее используйте формулу вероятности хотя бы одного события и комбинацию теорем сложения и умножения.

14. Партия из 100 изделий, среди которых 5% некачественных, подвергается выборочному контролю. Условием выбраковывания всей партии является наличие хотя бы одного бракованного изделия среди пяти проверяемых. Какова вероятность, что партия будет забракована? Отв.: 0,23.

15. Производится три выстрела по мишени. Вероятности попаданий равны соответственно /7, =0,4, /?2=0,5, /?3=0,7. Найдите вероятности: а) хотя бы одного попадания; б) ровно одного попадания. Сделайте прогноз.

Отв.: 0,86; 0,36.

16. В условиях предыдущего упражнения найдите вероятности: а) не более одного попадания; б) не менее одного попадания.

Указание. Для случая а) найдите вероятность трёх промахов ( 0 попаданий), затем вероятность ровно одного попадания и сложите их.

17. В условиях упражнения 15 добавляется четвёртый выстрел, вероятность попадания для которого р4 = 0,5. Как вы думаете, увеличатся, или уменьшатся те же вероятности? Найдите их.

18. Известна вероятность хотя бы одного попадания в мишень при трёх выстрелах - 0,875. Найдите вероятность попадания при одном выстреле (эта вероятность не меняется от выстрела к выстрелу). Отв.: 0,5.

19. Рабочий обслуживает три станка. Вероятность того, что за смену выйдет из строя первый станок, равна 0,2, второй - 0,4, третий - ОД. Какова вероятность того, что а) все станки выйдут из строя; б) ни один не выйдет из строя; в) ровно два выйдут из строя; г) не более двух. Сначала запишите своё предположение о порядке возрастания вероятностей, потом проведите расчёт и сравните с гипотезой. Отв.: 0,008 ; 0,432 ; 0,444 ; 0,992.

Следующие упражнения введут вас в круг задач, имеющих особую практическую ценность. Это задачи расчёта надёжности сложных технических систем, в частности, электрических цепей (см. [3], задачи 2.52-2.59). В этих задачах мы не будем учитывать редкие случаи одновременного отказа элементов за счет повышения напряжения, крупных аварий и др., т. е. будем предполагать независимость событий.

20. Электрическая цепь состоит из двух элементов (например, лампочек), соединённых а) последовательно (рис. 5а); б) параллельно (рис. 56). Надёжность каждого элемента (вероятность безотказной работы в течение определённого времени) равна 0,9. Рассчитайте надёжность всей цепи в случаях а) и б). Получите общие формулы надёжности цепи, когда надёжность элементов рх и р2.

Отв.:а)/у/?2; б) 1-(1-Р2)-

21. Прибор состоит из четырёх элементов, надёжность которых 0,9. Выход из строя любого элемента приводит к неработоспособности прибора. Какова надёжность прибора в целом? Какова должна быть надёжность элементов, чтобы надёжность прибора была больше, чем 0,9? Составьте формулу для расчёта надёжности прибора, если надёжность его элементов р{ (/ = 1,2,3,4). Отв.: 0,66 ; > 0,98.

Указание. Упражнение аналогично предыдущему (вариант а); надёжность элементов определяется из неравенства р4 > 0,9.

22. Надёжность прибора можно повысить дублированием каждого его элемента точно таким же элементом. Это значит, что при выходе из строя элемента начинает работать его дублёр и система в целом остаётся работоспособной. Рассчитайте надёжность системы из двух элементов, дублирующих друг друга, если надёжность каждого элемента 0,9. Насколько повысится надёжность прибора в условиях предыдущего упражнения, если к каждому элементу подсоединить такой же дублирующий элемент? Отв.: 0,99 ; [1 - (1 - Р)2]4 - 0,96.

Рис. 5 а Рис. 56

Указание. Система из двух взаимно дублирующих элементов аналогична электрической цепи из двух лампочек, соединённых параллельно (рис. 56).

23. Цепи, изображённые на рис. 5а-б, являются элементарными. Из них строятся сложные цепи, надёжность которых может быть рассчитана, исходя из надёжности элементарных, методом последовательного их укрупнения. Аналогично рассчитывается надёжность других технических систем (приборов). Попробуйте сделать это сами для схем, изображённых на рис. 6 и 7, взяв надёжность элементов 0,9 или pi.

Указание. Расчёт цепи, изображённой на рис. 6, сводится к расчёту трёх элементарных цепей. Последовательно применяя формулы, полученные в упражнении 20, придём к общей формуле Р = 1 - [l - (l - рх)• (l - р2)} (l - р3 р4).

В заключение - несколько, может быть, более сложных, но интересных задач.

24. Происходит воздушный бой между истребителем и бомбардировщиком. Начинает атаку истребитель и сбивает бомбардировщик с вероятностью 0,2. Если атака не успешна, бомбардировщик отвечает истребителю и сбивает его с вероятностью 0,3. Если истребитель не сбит, он подходит к бомбардировщику ближе и сбивает его с вероятностью 0,4. Найдите вероятности следующих исходов боя: А - сбит бомбардировщик, В - сбит истребитель, С - ни один из самолётов не сбит. Отв.: 0,424; 0,24; 0,336.

Указание. Введите следующие "простые" события: лх - бомбардировщик сбит первым выстрелом истребителя, а2 - вторым выстрелом. Для вычисления р{а2) введите ещё два события: £, - первым выстрелом истребителя бомбардировщик не сбит, в2 - ответным выстрелом бомбардировщика истребитель не сбит.

Данная задача даёт представление о важном классе прикладных задач, моделирующих "бой". Можно увеличивать число участников, усложнять схему боя и аналогично рассчитывать вероятности различных исходов (см. [3, задачи №2.75-2.77]). Решите ещё одну подобную задачу.

25. Происходит бой между бомбардировщиком и двумя атакующими его истребителями. Стрельбу начинает бомбардировщик: он делает два выстрела (один выстрел по каждому истребителю) и сбивает истребитель с вероятностью /?, = 0,6. Каждый истребитель, если он не сбит, стреляет по бомбардировщику и сбивает его с вероятностью р2 = 0,5. Рассчитайте вероятности следующих исходов боя: А - сбит бомбардировщик, В - сбиты

Рис. б Рис. 7

оба истребителя, С - сбит один истребитель, D - сбит хотя бы один истребитель. Отв.: р(л) = 0,36, р(я) = 0,36,р(с) = 0,48, p(d) = 0,84.

26. В урне 3 белых и 4 чёрных шара. Три игрока один за другим вынимают наудачу шары, не возвращая их в урну. Выигрывает тот, кто первым вынет белый шар. Каковы шансы игроков?

Указание.

27. Два игрока поочерёдно подбрасывают монету. Выигрывает тот, у кого первого выпадет герб. Как вы думаете, зависит ли частота выигрыша игрока от того, первым или вторым он подбрасывает монету, и намного ли? Рассчитайте вероятность выигрыша для каждого.

Указание

28. Студент, готовясь к экзамену, выучил половину экзаменационных вопросов. Экзамен считается сданным, если студент ответит хотя бы на один вопрос билета. Каждый билет содержит два вопроса, всего билетов 30. Сколько у студента шансов сдать экзамен? Предположите, что распределение вопросов по билетам случайное и вопросы не повторяются. Как зависят шансы студента от общего числа вопросов (пусть в пределах от 20 до 80)? Увеличатся или уменьшатся его шансы, если изменится тактика экзаменатора: билет содержит три вопроса и положительная оценка ставится в случае ответа на не менее, чем два вопроса? Отв.: а) примерно три к четырём.

29. По данным переписи населения (1891 г.) Англии и Уэльса установлено: темноглазые отцы и темноглазые сыновья (а-в) составили 5% обследованных лиц, темноглазые отцы и светлоглазые сыновья {а-в) -7,9%, светлоглазые отцы и темноглазые сыновья (а • в) - 8,9%, светлоглазые отцы и светлоглазые сыновья (а-в) - 78,2%. Найдите связь между цветом глаз отца и сына. В каком случае муж имеет основания подозревать жену в неверности? Какими доводами жена может опровергать его подозрения? Отв: 0,39 ; 0,61 ; 0,102 ; 0,898.

Указание. Вычислите условные вероятности, используя теорему умножения. Безусловные вероятности можно вычислить по теореме сложения.

30. Уходя с вечеринки, четверо гостей, имеющих одинаковые номера обуви, надевают калоши в темноте. Каждый из них может отличить правую калошу от левой, но не может отличить свою от чужой. Найдите вероятность того, что каждый гость а) наденет свои калоши, б) наденет калоши одной пары. Отв.: l/(4!)2 ; 1/4!

Указание. Гости надевают калоши последовательно, друг за другом и сначала выбирают одну правую калошу, потом левую. Примените теорему умножения.

ЛЕКЦИЯ 4

РАСЧЁТ ВЕРОЯТНОСТЕЙ В СХЕМЕ С ПОВТОРЕНИЕМ ОПЫТОВ

Вы, наверное, заметили, что во многих рассмотренных ранее задачах, опыты повторялись, - шары вынимались из урны несколько раз, игральная кость (или монета) подбрасывалась 2-3 раза, орудие стреляло к раз и т. п. Это не случайно. В научной и технической деятельности постоянно приходится проводить многократно повторяющиеся испытания в сходных условиях. Задачи, которые при этом возникают, тоже сходны. Для их решения выработаны общие методы (формулы).

В данной лекции мы рассмотрим простейшую и, вместе с тем, важнейшую схему испытаний, когда один и тот же опыт последовательно повторяется к раз и каждый раз может появиться (или нет) некоторое событие А ("успех") с неизменной вероятностью р.

Этот тип испытаний впервые был исследован в XVII в. знаменитым швейцарцем Я. Бернулли и получил наименование схемы Бернулли. Схема эта и результаты её исследования оказались в дальнейшем исключительно полезными как для развития теории вероятностей, так и для приложений. Вы сможете убедиться в этом, изучая данный курс.

Сейчас ваша цель - понять, как из разных конкретных задач возникает обобщённая задача, и как она решается (п. 1, 2). Решение концентрируется в виде формулы Бернулли. Вы должны понять структуру задачи, смысл формулы и научиться распознавать, в каких ситуациях её можно применять.

Расчёт по формуле Бернулли становится затруднительным в случаях, когда число опытов к очень велико, или когда вероятность р очень мала. В этих случаях используются другие, приближённые формулы (Муавра-Лапласа, Пуассона). Их вы тоже должны уметь применять и знать, когда.

1. Примеры

В конце предыдущей лекции мы решали задачу, где три орудия стреляли в мишень, причём, каждое орудие имело свою вероятность попадания pt. Схема Бернулли требует, чтобы вероятности не менялись от опыта к опыту. Поэтому немного изменим задачу.

Пример 1. Орудие три раза стреляет в мишень. Вероятность попадания не меняется от выстрела к выстрелу и равна р. Найти вероятность ровно двух попаданий.

Решение. 1) Обозначим искомое событие через W2*) и введём "простые" события 4 (/ = 1,2,3) - попадание при /-том выстреле. Вероятности этих событий известны и одинаковы: р(а}) = р(а2) = р(а3) = р.

2) Используя операции сложения и умножения, представим искомое событие так:

Поясняю: или первые два выстрела попадают в цель, а третий нет (событие ага2- аъ), или первый и третий выстрелы попадают, второй - нет, или второй и третий попадают, первый - нет.

3) Слагаемые события, очевидно, несовместимые, поэтому применяем первую теорему сложения:

p(w2) = p(a] • a2-ä3)+p(a] -I2 -Лз)+рЙ -а2-а3).

4) К каждому слагаемому применяем следствие теоремы умножения (перемножаемые события независимы в совокупности):

p{W2) = p{axyp{a2yp(^

5) Подставляем в последнее равенство данные вероятности р(д.) = /?, а также вероятности дополнительных событий (промахов) р (д:) = 1 - р и окончательно получаем:

?(}У2) = р-р\\-р)+р\\-рУр + {\-рУр-р = Ър2{\-р)* (1)

Формула (1) позволяет быстро вычислять вероятности при различных значениях р. Например, при p = 0J - p(W2) = 3 • 0,72 • 0,3 « 0,44.

Теперь чуть усложним задачу.

Пример 2. Орудие стреляет в цель 4 раза. Вероятность поражения цели каждый раз неизменна и равна р. Рассчитать вероятность ровно двух попаданий (и при этом, следовательно, двух промахов) - обозначим это событие так же, как в примере 1, - W2.

Решение. 1) Вводим четыре события af (/ = 1,2,3,4) - /-тый выстрел попадает в цель. Их вероятности известны и равны р (at) = р.

(2)

*) Обычно мы обозначаем события первыми буквами латинского алфавита, а здесь почему-то используем W. Это, конечно, не возбраняется. Цель - отличить "сложное" событие Wот "простых" А\, А2,...

Вы, конечно, почувствовали, что перебор вариантов расположения попаданий и промахов затруднителен. Чтобы не потерять какого-то варианта, мы расположили слагаемые так: сначала три слагаемых, в которых попадания идут рядом, потом - чередуются с промахами. Всего получилось 6 слагаемых.

3-5) Применяем к каждому слагаемому следствие теоремы умножения:

Рил1314) = р(1^2414) =... = /72(1-/7)2.

Вероятности всех слагаемых одинаковы, их число 6, поэтому

p{W2) = 6p2{l-p)2.* (3)

В частности, если /7 = 0,7, то p(W2) = 6-0J2 -0,32 « 0,26. Вероятность двух попаданий при четырёх выстрелах уменьшилась почти вдвое, сравнительно с тремя выстрелами.

Помощь формулы сочетаний. Число слагаемых в (2) можно было посчитать с помощью формулы сочетаний (лек. 2, п. 3, формула (2)). Каждое слагаемое в (2) соответствует выбору двух позиций (номера попаданий) из четырёх: первому слагаемому соответствует сочетание (1,2), второму - (2,3) и т. д. Число всех способов выбора определяется формулой

Используя формулу сочетаний, можно быстро решать задачи с большим числом выстрелов. Например, - орудие стреляет 5 раз, вероятность попадания каждый раз равна /7, рассчитать вероятность ровно трёх попаданий. Рассуждение, аналогичное примеру 2, приводит к формуле

(4)

Контроль 1. Орудие стреляет в цель 4 раза. Вероятность попадания каждый раз равна р. Какова вероятность того, что цель будет поражена ровно один раз? (Обязательно проведите подробные рассуждения и получите формулу для расчёта). Запишите формулу для случая, когда орудие стреляет 6 раз и нужно определить вероятность ровно четырёх попаданий (событие WA).

2. Обобщение, - задача и формула Бернулли

Точно таким же методом, как только что решались задачи со стрельбой, можно решать другие задачи, если только они имеют сходную структуру. Опишем эту структуру в абстрактных терминах, отвлекаясь от конкретики опытов и событий.

Задача Бернулли. Имеется эксперимент, который состоит в последовательном повторении некоторого опыта к раз. Каждый раз при повторении опыта может появиться или не появиться событие А ("успех" опыта). Вероятность этого события не изменяется от опыта к опыту (не зависит от результатов других опытов) и равна Р (А) = р. Рассчитать вероятность события W,, которое произойдёт, если в результате эксперимента событие А ("успех") появится / раз и не появится к-1 раз (1<к).

Решение даёт следующая формула Бернулли

(6)

(С)

Формула (6) обобщает формулы (1), (3), (4). Доказывается она теми же рассуждениями, но в общем виде они приобретают громоздкую форму из-за неопределённости числа опытов к и произвольности числа "успехов" /. Мы проведём доказательство формулы (6) позже. Сейчас ваша цель -хорошо понять приведённую выше абстрактную формулировку, научиться распознавать Бернуллиевскую структуру в конкретных задачах.

Пример 3. Рассчитать вероятность появления ровно восьми гербов при десятикратном подбрасывании монеты.

Решение. Давайте неторопливо перечитаем формулировку задачи Бернулли и конкретизируем все её элементы на данном примере.

Эксперимент состоит в подбрасывании монеты 10 раз, т. е. £ = 10. Опыт, из повторения которого состоит эксперимент, - это однократное подбрасывание монеты. Событие а ("успех") - появление герба при однократном подбрасывании монеты, т. е. а = Г. Вероятность "успеха" -р(а) = р = 0,5. Искомое событие Wl относится к эксперименту и состоит в появлении герба 8 раз, а решки 2 раза, т. е. / = 8, к-1 = 2. Следовательно, данная задача имеет Бернуллиевскую структуру и решается непосредственным применением формулы (6):

Прогноз: при выполнении эксперимента 100 раз (100 серий, каждая из которых состоит в десятикратном подбрасывании монеты) примерно в 4 сериях герб появится ровно 8 раз.

Предостережение. Я замечал, что правильному применению формулы Бернулли нередко мешает вот какое обстоятельство. Начинающему кажется, что задача состоит в том, чтобы ответить на вопрос: сколько раз появится герб? Поэтому он за-

трудняется определить, чему равно /. Но предсказать, сколько раз появится герб, конечно, нельзя - это явление случайное. В задаче спрашивается иное: какова вероятность того, что герб появится ровно 8 раз, т. е. число / = 8 задаётся самим условием задачи. Правомерны и другие вопросы: какова вероятность того, что герб появится, например, 7 раз (1 = 7), или 1 раз (/ = 1), или ни разу ( / = 0).

Дополнение. Вообще, в литературе [2, с. 59] задача Бернулли ставится в несколько более общем виде, - для последовательности опытов, которые могут как-то отличаться друг от друга (у нас они не отличаются). Но тогда надо дополнительно требовать независимости опытов, т. е. чтобы результаты какого-то опыта (или группы опытов) никак не влияли на результаты других опытов. Точнее, - чтобы исходы этих опытов были независимыми в совокупности (лек. 3, п. 10, опр. 5'). При этом условии к ним можно применять следствие из теоремы умножения (лек. 3, п. 10, теорема 3'), что необходимо при выводе формулы Бернулли (см. далее п. 3, 4-й раздел доказательства), решающей задачу. В нашей формулировке повторяющиеся опыты автоматически независимы, потому что повторяется один и тот же опыт без изменения основных условий. Пример последовательности зависимых опытов - стрельба очередью, когда прицеливание производится один раз перед всей стрельбой или непрерывно корректируется в процессе стрельбы. Отметим также, что можно поставить и решить более общую задачу, когда от опыта к опыту меняется р - вероятность "успеха" [2, с 61-66].

Контроль 2. В урне 6 шаров - 4 белых и 2 чёрных. Опыт состоит в последовательном вынимании трёх шаров а) без возвращения, б) с возвращением. В каком случае применима формула Бернулли, в каком не применима? Почему? Рассчитайте вероятность появления ровно двух белых шаров в том и другом случае.

3. Вывод формулы Бернулли

Выше мы установили формулу Бернулли с помощью аналогии - выписали в общем виде формулу (6), подобную формулам (1), (3), (4). Правда, мы оговорили, что в силу сходства структуры задач, обобщённая формула доказывается точно так же, как и конкретные формулы. Сейчас проведём это доказательство.

Учтите, что абстрактные рассуждения могут восприниматься с трудом и быть поначалу "непонятными". Это естественно. Но вы должны учиться таким рассуждениям - это язык науки, это метод установления истинности научных утверждений. Для облегчения понимания советую вам самостоятельно конкретизировать все последующие этапы. Возьмите, к примеру, задачу: какова вероятность появления ровно двух гербов при пятикратном подбрасывании монеты?

Предостережение. Прежде чем начать вывод формулы, обратим внимание вот на какое обстоятельство. В задаче Бернулли надо различать два опыта - "простой" и "сложный". "Сложный" опыт состоит в повторении "простого" опыта к раз. Чтобы оттенить это различие, мы и условились называть "сложный" опыт экспериментом. Соответственно, надо различать и события: А относится к "простому" опыту,

Wl - к эксперименту. Если конкретизировать, то появление герба (г) - это событие, относящееся к "простому" опыту, состоящему в однократном подбрасывании монеты. Появление двух гербов после пятикратного подбрасывания монеты - событие W2, относящееся к эксперименту.

Доказательство формулы (6).

1) Введём следующие события в эксперименте: 4 - при первом выполнении "простого" опыта появляется событие А ; А2 - при втором -- -- -- -- --А ;

А, - при / -том выполнении "простого" опыта появляется событие А ; А1+] - при (/ + 1) -о-- -- -- -- --А ;

Ак - при к -том -- -- -- -- --А.

Вероятности введённых событий одинаковы и равны р (д:) = р, i = 1,2,...,к. Это следует из условия задачи, где сказано, что вероятность события А не меняется от опыта к опыту.

Наряду с событиями 4, будем рассматривать в эксперименте и дополнительные к ним события 4, - их вероятности р (д:) = 1 - р. Напомню, что событие 4 произойдёт в эксперименте в том случае, если при /-том выполнении "простого" опыта событие А не появится.

Конкретизируя сказанное на примере пятикратного подбрасывания монеты, получим пять событий: Ах - при первом подбрасывании появляется герб (при остальных -неважно, что), А2 - при втором подбрасывании появляется герб (при первом, третьем и остальных - неважно, что), А5 - при последнем подбрасывании появляется герб. Очевидно, Р (Ai) = 0,5 и Р (Ät)= 0,5.

Заметьте, что события A-t совместимые: если, например, событие А появится в эксперименте ровно два раза на чётных местах, то в результате этого эксперимента появятся события А2 и АА вместе (остальные не появятся) и, следовательно, появится событие-произведение Ах-А2- А3 • АА- А5 - его можно записать и в таком обозначении РГРГР. Ещё раз подчёркиваю - это одно событие в эксперименте, а не пять!

2) Теперь мы должны представить искомое событие Wl в виде суммы и произведения введённых выше событий 4, подобно тому, как это делалось в примерах 1 и 2.

а) Событие Wl может происходить разными способами ( А может появляться в разных порядках). Например, результат эксперимента может быть таким: в первых / опытах событие А появилось, в последующих к-1 опытах - нет. Используя операцию умножения, представим этот результат так:

(5)

Вот другой результат, при котором появляется Wl:

В2 = Il-A2-...-Al+l-Il+2-...-Ik. (6)

Появление В2 означает, что в первом опыте событие А не появилось, в следующих появилось подряд / раз, потом не появилось к-1-Х раз.

Советую выписать для самопроверки ещё один-два способа появления события Wl и конкретизировать их на примере подбрасывания монеты.

б) Обозначим все возможные способы появления события Wl через В19 52, Bs. Событие W, может произойти в эксперименте только тогда, когда произойдёт или ВХ9 или 52, или Bs. Значит, согласно определению суммы событий, имеет место представление

Wx = ВХ+В2 +... + Bs. (7)

3) Для вычисления вероятности Р(А) применим к (7) первую теорему сложения. Но предварительно надо проверить несовместимость слагаемых 5..

Предположим обратное, т. е. что события ВХ9 В2, Bs совместимые.

Значит, согласно определению совместимости (лек. 3, п. 9), возможен такой результат эксперимента, при котором произойдут вместе какие-то два события, - например, В, и 52. Тогда из (5) и (6) следует, что произойдут вместе события Ах и дополнительное к нему событие Ах (т. е. при первом выполнении опыта появится и одновременно не появится событие А). Абсурд. Предположение совместимости ложно. Слагаемые в (7) несовместимые.

Согласно теореме сложения несовместимых событий, из (7) следует Р(^/) = Р(Д1)+Р(Д2) +... + Р(Дя). (8)

4) Вычислим правую часть. Для этого определим вероятности, стоящие в правой части (8), с помощью теоремы умножения.

Вычислим сначала первое слагаемое. Поскольку эксперимент состоит в повторении одного и того же опыта, то в (5) перемножаемые события независимы в совокупности (лек. 3, п. 7, 10), и к ним можно применить следствие теоремы умножения:

р(20=Р(4)-Р(4)-...-Р^

Точно так же вычисляются остальные вероятности Р(2?2), Р(#3), P{Bs). Все они оказываются одинаковыми (проведите сами вычисление Р(#2) и конкретизируйте его на примере с монетой). В итоге, равенство (8) принимает вид

(9)

5) Остаётся упростить последнее равенство, посчитав число слагаемых s. Их здесь столько же, сколько и в правой части равенства (7).

Каждому событию Bj в (7) сопоставим группу из / чисел - номеров опытов, в которых появляется событие А. Например, событию Вх соответствует группа {1,2,...,/}, событию В2 - другая группа {2,3,...,/,/ + l}. Каждая такая группа - это сочетание из к элементов по / (лек. 2, п. 3). Значит, число слагаемых в (9) равно числу С[ сочетаний из к по /. Равенство (9) принимает вид

Piw^ci-p'-d-pf-'.. (10)

Напоминание. Для лучшего понимания доказательства вам следует самостоятельно конкретизировать на примере каждый его этап и каждую формулу (5)-(ю)

Контроль 3. Добавьте в доказательство свои два события В3 и 54, запишите их в виде произведения событий Ап подобного (5) и (6). Докажите несовместимость этих событий. Найдите их вероятности и обоснуйте решение.

Указание. Составляя в3, учтите, чтобы "успех" повторялся ровно / раз.

4. Приближённое решение при большом числе опытов

При большом числе опытов к вычисление вероятностей по формуле (6) становится затруднительным, а при очень больших к почти невозможным. Попробуйте, например, найти вероятность двадцати попаданий при ста выстрелах, если вероятность одного попадания 0,15. Придётся вычислять следующее выражение

Возникает необходимость иметь приближённую формулу, заменяющую формулу Бернулли при больших значениях к и I. Эта задача встала перед математиками в начале XVIII века, когда они начали применять вероятностные расчёты к демографическим проблемам. Решил её Абрахам де Муавр (1667-1754) - француз, всю жизнь проживший в Англии, и потому считающийся английским математиком.

Сейчас вы увидите решение Муавра в виде правила, сформулированного в несколько неопределённых терминах. Уточнение и обоснование оставим для будущего, когда появится необходимый математический инструментарий (лек. 12, п. 4).

Правило Муавра*). Пусть в схеме Бернулли вероятность р появления события а в каждом опыте постоянна и не очень близка к О или 1, а число к повторений опыта достаточно велико (&•/?> 10, обычно к порядка нескольких сотен). Тогда вероятность события Wl, состоящего в том, что в к независимых опытах событие а наступит ровно / раз, можно вычислить приближённо по формуле

(м)

где функция <р(х) определяется так:

(г)

Функция (г) называется функцией Гаусса**). Значения функции ç(x) для различных значений аргумента х = хе [0;4] затабулированы - см. приложение 1 в конце курса. Формулу (м) будем называть формулой Муавра. Точность формулы повышается с ростом числа опытов k.

Пример 4. Орудие стреляет в цель 100 раз. Вероятность поражения цели каждый раз одна и та же и равна р = 0,15. Определить вероятность ровно двадцати попаданий.

Решение. В данной задаче число опытов к, составляющих эксперимент, достаточно большое, равное 100; требуемое число появлений события а (число попаданий) / = 20; вероятность Р (а) = /7 = 0,15 не очень близка к 1 (выполняется k • р = 15 > 10). Применяем правило Муавра.

1) Вычисляем величины, входящие в формулу (м):

2) Находим в таблице приложения 1 значение функции tp(x)~ ç{\A) -0,150.

3) Подставляем найденные выше значения в формулу (м) и вычислим искомую вероятность:

*) В современной литературе данное правило обычно формулируют в виде строгой теоремы [1, с. 63]. и называют локальной теоремой Муавра-Лапласа.

**) Гаусс Карл Фридрих (1777-1855) - величайший немецкий математик, "король математиков". Для его творчества характерна органическая связь теории и практики, широта проблематики, глубина решений, оказавших стимулирующее влияние на всё дальнейшее развитие математики.

Заметим, что вычисления по формуле Бернулли, проведённые с помощью ЭВМ, дают значение искомой вероятности, равное 0,0402. Погрешность, следовательно, меньше, чем 0,002. •

Видите, как легко прошли вычисления. Это удалось потому, что главную трудность взяла на себя функция <р(х), значения которой математикам пришлось вычислить и занести в таблицу. В дальнейшем вы увидите, что эта функция будет играть определяющую роль в развитии теории и в статистических расчётах. Сейчас она нужна нам для решения задачи Бернулли. Чтобы уверенно проводить эти расчёты и не допускать ошибок, полезно знать её свойства.

Свойства функции Гаусса видны из её графика (рис. 1): она положительная, чётная, имеет один экстремум <р(6) = \/т/2я « 0,4, две точки перегиба х]2 = ±1, горизонтальную асимптоту - ось ОХ, к которой очень быстро приближается. Свойства эти можно установить, применив известный метод исследования функций с помощью производных. Но сейчас на это отвлекаться не будем, потому что ваша цель - научиться сознательно пользоваться таблицей значений функции (р{х).

О таблице. Заметьте, - таблица (приложение 1) составлена для 410 значений аргумента, идущих через одну сотую: х0=0,00, х,=0,01, х2 = 0,02, х3 = 0,03,..., х409 = 4,09. Все эти значения находятся в пределах от 0 до 4,09. Если в расчётах получается х > 4,09, то полагайте <р(х) = 0, зная, что такие значения функции <р(х) чрезвычайно малы (график очень быстро приближается к оси ОХ: <р(3) - 0,0044, <р(4) - 0,0001, tp(5) - 0,0000015).

Если в расчётах получается х < 0, к примеру, х = -1,32, то ищите в таблице значение функции Гаусса от положительного аргумента ç?(l,32)« 0,1669 и, пользуясь свойством чётности, будете иметь <р{-1,32) = 0>(1,32)« 0,1669.

Дополнение. Таблица, помещённая в книге (приложение 1) даёт значения функции Гаусса с четырьмя десятичными знаками после запятой. Для решения инженерных задач, требующих очень высокой точности расчётов, существуют таблицы с большим числом десятичных знаков, например, Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. М.: Наука, 1983. Кроме таблиц, сегодня для сложных вы-

Рис. 1

числений широко используются инженерные калькуляторы и вычислительные программы (в частности, компьютерные). Мы в нашем курсе тоже нередко пользуемся такими расчётами (см., хотя бы, эту и предыдущую страницы).

О погрешности. Формула (м) даёт приближённое значение вероятности, - обозначим её р^). В таких случаях наука обязательно ставит вопрос об оценке ошибки, т. е. о величине разности р(А)-р(^/ < ?. Не слишком ли велика эта разность? Не приведёт ли использование в статистических расчётах приближённого значения р(^/) (вместо точного p{W,)) к недопустимому искажению истины, к неверным прогнозам? Вопросы эти всегда сложны и мы, конечно, не будем касаться их строгого решения. Но общее представление о поведении ошибки (абсолютной*)) полезно иметь. Скажем об этом несколько слов.

При разных k, / и р формула (М) будет давать разную ошибку. Ошибка может быть очень мала, а может быть и недопустимо большой. Наиболее простое условие, разрешающее применение правила Муавра, - число опытов k и вероятность р должны быть такими, чтобы выполнялось неравенство k • р > 10. Если, например, р = 0,1, то число опытов к > 100 ; если р = 0,01, то к > 1000. В примере 4 это условие выполнялось, -к • р = 100 • 0,15 = 15 > 10. С уменьшением вероятности р формула Муавра даёт всё более худшие приближения и для компенсации ошибки надо значительно увеличивать число опытов к.

Причину, по которой это происходит, и почему хорошее приближение достигается при условии к • р > 10, можно будет объяснить вам в конце курса (лек. 12, п. 4). Тогда же вы поймёте, почему функция Гаусса позволяет вычислять Бернуллиевские вероятности, поймёте смысл правила Муавра. А пока научитесь правильно его использовать.

Ориентир кр>\0 не абсолютный, - он годится, когда не нужна большая точность. Более точный ориентир: кр(\ - р) > 25. Обычно правило Муавра применяется, когда число опытов к - несколько сотен и более, а р не слишком близко к нулю. Например, пусть к = 200, р = 0,2, тогда кр = 40 > 10 и кр{\ - р) = 32 > 25.

Следует знать, что при очень малых р даже значения к, удовлетворяющие неравенству к • р > 10, могут не обеспечивать достаточной точности и придётся на порядок (если не больше) увеличивать число опытов. Такие задачи часто встречаются на практике. В следующем разделе лекции мы рассмотрим этот случай и выведем для него другую формулу.

Большая ошибка может возникать и в случаях, когда р близко к единице. Пусть, например, р = 0,9, к = 12 ( кр = 0,9 • 12 = 10,8 > 10). Тогда для / = 0 формула (М) даёт:

*) Для оценки степени точности расчётов кроме абсолютной ошибки надо учитывать и относительную, которая оценивает, какой процент от истинного значения величины составляет абсолютная ошибка. В нашем случае относительная ошибка с увеличением числа испытаний может бесконечно увеличиваться. Этой проблемы мы не касаемся.

Точное значение вычисляется по формуле Бернулли (с помощью калькулятора):

р(^0) = (о,9)12 =0,282...

Разница, как видите, огромная*). Причина неудачи в том, что аргумент функции ç вышел за пределы табличного его изменения от -4 до 4 (приложение 1), где значения функции Гаусса практически равны нулю. Пример, конечно, искусственный, ибо к и / очень малы и потому здесь легко работает точная формула Бернулли. Но он подсказывает, что дополнительным условием применимости формулы Муавра надо поставить выполнение неравенств -4 < [(/ -kp)/^kp(\ - р)]< 4. Видите, как всё усложняется. В нашем учебном курсе будем пользоваться наиболее простым условием кр > 10.

Добавлю, - наглядное представление о поведении ошибки при изменении значений к и / можно получить из книги [5, с. 80-84].

Контроль 4. Статистические наблюдения за некоторым производством установили, что на каждые 200 изделий приходится примерно одно бракованное. Заказчик приобретает оптом 10000 изделий. Какова вероятность, что среди них окажется ровно 40 бракованных? Можно ли применить формулу Муавра? Рассчитайте приближённую вероятность события W40 и сравните её с Бернуллиевской р (W40) « 0,00206. Велика ли ошибка?

Указание. Ситуация моделируется схемой Бернулли. "Простой" опыт -выпуск одного изделия, эксперимент - выпуск 10000 изделий, т. е. к = 10000. Событие А - выпуск бракованного изделия, - определите его статистическую вероятность. Искомое событие W40 происходит в том случае, если событие А появляется в эксперименте ровно / = 40 раз. Ориентир для вычислений - х = -1,42, ç(x) « 0,1456.

5. Приближённое решение при очень малых вероятностях

Формула Муавра даёт хорошее решение задачи Бернулли лишь тогда, когда вероятность р не очень далека от 0,5. Если же вероятность р очень мала, то для уменьшения ошибки требуется очень большое число опытов (это можно было бы увидеть из доказательства локальной теоремы Муавра-Лапласа, о которой упоминалось в сноске к правилу Муавра). Однако, многие практические задачи требуют вычисления вероятностей р (wl)) именно при очень малых значениях р и не очень больших к (ориентировочно, при к-р<10). Проблему эту решил француз Пуассон**).

Правило Пуассона. Пусть в схеме Бернулли вероятность р появления события А в каждом опыте постоянна и очень мала, а

*) На этот пример обратил моё внимание Ю. Д. Максимов.

**) Пуассон Симеон Дени (1781-1840) - французский математик, механик и физик, почётный член Петербургской Академии Наук (1826), внёс большой вклад в развитие теории вероятностей. Труды по математическому анализу, теории вероятностей, теоретической и небесной механике, теории упругости, математической физике.

число к повторений опыта не слишком велико (к-р<\0). Тогда вероятность того, что в к независимых опытах событие а наступит ровно / раз, можно вычислить приближённо по формуле

(п)

Формула (п) носит название формулы Пуассона. Правая её часть есть функция Пуассона, зависящая от двух переменных а и /. Значения этой функции затабулированы для практически возможных значений 0,1 < а < 10 и 0 < / < 25 (см. приложение 2).

Пример 5. По цели производится 5000 выстрелов. Вероятность поражения цели каждым выстрелом равна 0,001. Какова вероятность а) всех промахов; б) ровно одного попадания; в) двух и более попаданий?*) Прежде чем решать задачу, попробуйте оценить искомые вероятности интуитивно - какая больше и намного ли? Мне кажется, что вторая больше первой, но ненамного, а третья меньше второй, - ведь много попаданий мало вероятны. Интересно, что покажет точный расчёт?

Решение. Данная задача вписывается в схему Бернулли. Каждый выстрел - это опыт, попадание в цель - событие а. Опыт повторяется £ = 5000 раз, при этом вероятность р{а) = /7 = 0,001 не меняется от опыта к опыту. Требуется рассчитать вероятности событий w0 (ни одного попадания), wx (ровно одно), w^2 (не менее двух).

1) Первую вероятность можно получить, применяя теорему умножения:

Вычисления значительно упростятся, если использовать формулу Пуассона. Вычислим параметр а-к-р = 0,001 • 5000 = 5 < 10.

(Значение 0,0067 взято из таблицы значений функции (п) при 1 = 0 и а = 5, см. приложение 3).

2) Точное значение второй вероятности даёт формула Бернулли:

Вновь выручает Пуассон:

*) Реальное осуществление условий данного примера имело место в Великую Отечественную войну при попытках сбить самолёт выстрелами из винтовок. Вероятность попадания одним выстрелом в уязвимые места самолёта (лётчик, бензобак и др.) очень мала. Однако, если обстрел вело большое подразделение, то самолёт нередко оказывался сбитым.

3) Третья вероятность сводится к первым с помощью теоремы сложения: событие W = W0+Wl+Wl>2 достоверное, значит, p(w) = l; в силу несовместимости слагаемых, Р (w0) + Р {wl) + Р (w^2) = 1 ; отсюда

р (w^2) = 1 -Р (W0)- Р{Wx) « 1 - 0,0067 - 0,0335 = 0,9598.•

Прогноз. Если произвести 1000 серий обстрелов, то примерно 7 раз не будет ни одного попадания, 34 раза - ровно одно попадание, 960 раз - не менее двух попаданий.

Вот и сравните теперь этот прогноз с нашим предположением: первые две вероятности, конечно, очень малы, но вторая в 5 раз больше первой; третье же событие оказывается почти достоверным.

Контроль 5. Аппаратура состоит из 2000 элементов. Вероятность отказа любого элемента в течение гарантийного срока равна 0,001. Если гарантийный аппарат выходит из строя более двух раз, завод обязуется его заменить. Сделайте прогноз: сколько аппаратов из ста придётся заменить? Отв.: 32.

6. Вывод формулы Пуассона

Не любопытно ли вам узнать, почему формула (п), решающая задачу Бернулли, содержит замечательное число е ? Откуда возникает это число в вероятностной задаче? Почему некая закономерность природы опять описывается с помощью числа е ?

Вспомните, - число е появилось перед вами впервые, как странный, иррациональный предел некоторой функции (или последовательности):

Последнее равенство, согласно смысла предела, означает, что с ростом t значения 1 + - неограниченно приближаются к числу е и, следовательно, при достаточно больших значениях t справедливо приближённое равенство

Подобным образом получается и формула (п): при неограниченном росте числа опытов к значения Р(А), которые даёт формула Бернулли, приближаются сколь угодно близко к значению, которое определяется

правой частью формулы (п). Вы можете проследить за этим процессом, если заставите себя понять нижеследующие, довольно абстрактные рассуждения.

Теорема Пуассона. Пусть имеется бесконечная последовательность серий опытов, в каждом из которых может появиться или не появиться некоторое событие А, причём, его вероятность р(л) убывает от серии к серии следующим образом:

1 -я серия состоит из одного опыта и

2 -я серия состоит из двух опытов и

3 -я серия состоит из трёх опытов и

к -я серия состоит из к опытов и

Пусть / фиксировано, / < к и Wt - событие в к -й серии, состоящее в том, что событие А появляется в этой серии ровно / раз. Тогда справедливо предельное равенство:

Доказательство. 1) Вероятность р (wt) определяется точно формулой (6) Учтём, что в к -той серии р (а) = рк = —, и запишем

2) Поменяем местами знаменатели первых двух дробей, тогда у первой дроби в числителе и в знаменателе окажется одинаковое число множителей (по / штук) и можно будет разбить её в произведение / дробей так:

3) У первых / множителей произведём почленное деление, получим:

4) Устремим i^oo и перейдём к пределу, используя теорему о пределе произведения и учитывая, что множитель — есть константа:

5) Поскольку / не меняется, когда к оо 9 то очевидно, что в правой части все пределы, за исключением одного, равны единице, следовательно

Примечание 1 В приведённой выше формулировке теоремы Пуассона параметры к и р жёстко связаны: в каждой серии опытов произведение к • pk =а = const. Однако, доказательство проходит, если предположить лишь асимптотическое проявление этой связи, т. е. lim к • рк = а [3, с. 136-138].

Примечание 2. В доказательстве предполагается, что а < 1, ибо, по условию теоремы, первая вероятность равна рх=а. Однако, как это следует из примечания 1, теорема справедлива, если условие к • рк = а = const выполняется не для всех к, а начиная с некоторого момента к = к0. Поэтому в формуле (П) параметр а может быть и больше единицы. Но, ориентировочно, не больше десяти, ибо в противном случае формула может привести к значительной ошибке. В сложную проблему оценки ошибки мы не можем вдаваться.

Контроль 6. Измените формулировку теоремы Пуассона так, чтобы а = 8. Указание. Речь о теореме, а не о правиле Пуассона. В теореме первая вероятность /7, - а, что при д = 8 не имеет смысла. Вдумайтесь в примечание 2.

7. Вторая задача

При очень большом числе опытов к задача Бернулли зачастую становится практически не интересной и возникает другая задача.

Пример 6. Радиоаппаратура состоит из 2000 элементов. Вероятность отказа одного элемента в течение года равна 0,001. Элементы отказывают независимо друг от друга. Какова вероятность того, что в течение года выйдут из строя: а) ровно 3 элемента; б) не менее трёх; в) от трёх до десяти элементов?

Согласитесь, что производителю более интересны вторые два вопроса, нежели первый, тем более, если в гарантийном обязательстве стоит условие замены аппарата в случаях более двух поломок. Для покупателя тоже не существенно, сколько - ровно шесть или ровно семь поломок должно случиться с его покупкой. Его интересует другой вопрос - редко или часто они происходят? И покупателю, и производителю надо знать степень надёжности аппаратуры в целом. Это уже другая задача, она может быть решена на основе формулы Бернулли с использованием приближённых формул.

Решение. 1) Первый вопрос приводит к схеме Бернулли: работа каждого элемента аппарата в течение года - это опыт, выход элемента из строя - событие а, вероятность которого Р(а) = р = 0,001 одинакова для всех элементов; работу аппарата в течение года можно интерпретировать,

как повторение опыта к = 2000 раз; нас интересует вероятность события W39 которое произойдёт в серии из 2000 опытов, если за год выйдут из строя ровно три элемента. Запишем формулу (6):

Сложные вычисления придётся заменить приближёнными. Выясним, какую формулу следует применить, - Муавра или Пуассона. Вычисляем параметр а = к-р = 2000• 0,001 = 2, получаем а = 2 < 10. Применяем формулу (п), используя таблицу значений функции Пуассона при а = 2 и 1 = 3:

2) Вероятность не менее трёх отказов - событие w,>3 - можно найти так же, как мы нашли третью вероятность в примере 5:

Учтите, что 0!= 1. Заглянув опять в таблицу приложения 2, вычисляем:

р(^>з) « 1 - 0,1353 - 0,2707 - 0,2707 = 0,3233.

3) Вероятность события W3.]0 (число отказов попадает в промежуток [3;10]) можно вычислить многократным применением формулы Пуассона, используя теорему сложения:

Проводим вычисления, заглядывая в приложение 2:

Прогноз. Из партии в 1000 проданных аппаратов примерно 180 аппаратов выйдут из строя 3 раза за год, а около 320 аппаратов потребуют ремонта более двух раз. Многовато. Придётся повышать надёжность комплектующих.

Замечание. Заметьте, - в строке вычислений последнее слагаемое равно нулю, это значит, что практически ни один аппарат не сломается более девяти раз. Производитель может изменить свои гарантийные обязательства и заменять аппарат в случае десяти поломок, но тогда, очевидно, его продукцию никто не станет покупать. Придётся совершенствовать технологию. И перед руководителем производства возникает задача: какова должна быть надёжность элементов, чтобы в течение года пришлось заменять не более, скажем, 5% проданных аппаратов (50 из тысячи). И придётся вспоминать теорию вероятностей, которую он плохо изучал в вузе. Если, конечно, он

вообще поймёт связь производственных проблем с проблемами теории вероятностей и не будет слепо полагаться на рекламу.

Вторая задача Бернулли. Опыт повторяется к раз и каждый раз может появиться или нет событие А с неизменной вероятностью р. Определить вероятность события Wa.ß, которое произойдёт, если число / появлений события А попадёт в заданный промежуток [а; 0\.

Выше поставлена обобщённо задача, которую мы только что решали, когда вычисляли вероятности событий W^3 и W3.l0 {W^3 в новых обозначениях есть событие W3.2000 - число отказов попадает в промежуток [3;2000]).

Метод, которым мы решали эту задачу, состоял в многократном применении формулы Бернулли и затем в замене её приближённой формулой Пуассона. Если к-р>\0, придётся использовать формулу Муавра. В простых задачах, если р не очень мало и кр«10, можно ограничиться формулой Бернулли. Проверьте себя на следующем упражнении.

Контроль 7. Игральная кость подбрасывается 5 раз. Какова вероятность появления а) ровно двух шестёрок; б) не менее двух; в) от двух до четырёх шестёрок? Как вам кажется, увеличится или уменьшится вероятность последнего события W2.A9 если число подбрасываний довести до 60 ? Проверьте своё предположение точным расчётом (формула (м)).

Отв.: 0,16; 0,4; 0,19.

8. Правило Муавра-Лапласа

Решение второй задачи Бернулли многократным применения формулы (6) может приводить к очень длинным вычислениям, т. к. если промежуток [а; ß\ длинный, то складываются очень много слагаемых. Есть другой метод.

Правило Муавра-Лапласа*). Пусть в схеме Бернулли вероятность р появления случайного события А в каждом опыте постоянна, а число к повторений опыта достаточно велико (к>Ю/р9 или к-р>10). Тогда вероятность события Wa.ß, состоящего в том, что

после к независимых опытов число / появлений события А попадает в промежуток [а; ß], можно приближённо вычислить по формуле

*) Сам Муавр вывел данное правило для частного случая, когда интервал [а; ß] симметричен относительно кр, т. е. имеет вид [кр-8\ kp + ö], - в этом случае формула (М-Л) упрощается. В научной литературе это правило обычно называют интегральной теоремой Муавра-Лапласа.

(м-л)

(л)

Функцию Ф(х) называют функцией Лапласа, она не элементарная, её значения вычисляются приближённо (см. приложение 3).

О функции Лапласа**). Обратите внимание на связь функции Лапласа (л) с функцией Гаусса (г), - функция ç(x) стоит под знаком интеграла, задающего функцию Ф(х):

(л')

Интеграл этот - интеграл с переменным верхним пределом. Его геометрическое истолкование (при х > 0) - переменная площадь (рис. 2)

если меняется верхний предел x, то меняется площадь. С помощью геометрического истолкования функции Лапласа нетрудно установить её "хорошие" свойства:1) Ф(0) = 0 ; 2) нечётность; 3) возрастание. Первое свойство очевидно. Второе выводится следующей цепочкой равенств (считая х > 0):

Третье, - с ростом х площадь S0ABx = Ф(х) растёт.

Кроме этого, график функции Лапласа (рис. 3) имеет две горизонтальные асимптоты у = ±0,5, к которым очень быстро приближается.

Рис. 2

Рис. 3

*) Надо иметь в виду, что в других учебниках и задачниках может встретиться несколько иной вид этой формулы, использующей не функцию Лапласа, а близкую к ней и элементарно с ней связанную.

**) Лаплас Пьер Симон (1749-1827) - французский астроном, физик, математик, почётный член Петербургской Академии Наук (1802). В связи с занятиями астрономией, он пришёл к вопросам теории ошибок наблюдений и развил вероятностные методы их оценки. Автор классических трудов - "Аналитическая теория вероятностей" и "Трактат о небесной механике". Много трудов по дифференциальным уравнениям, математической физике, теории капиллярности, теплоте, акустике, геодезии и др.

Таблица значений функции Лапласа Ф(х) составлена для 410 значений аргумента хе[0;4,09] через одну сотую: х0=0,00; х, =0,01; х409 = 4,09. Из свойств функции Ф(х) следует, что при х > 4 следует принимать Ф(х) = 0,5, а при x < 0 использовать нечётность Ф(х) = -Ф(- х). Теперь вы не будете недоумевать, если придётся искать и не находить в таблице Ф(7) или Ф(-2).

Проиллюстрируем правило (М-л) в условиях примера 4.

Пример 7. Орудие стреляет в цель 100 раз, вероятность поражения цели каждый раз одна и та же /? = 0,15. Рассчитать вероятность не более 20 попаданий.

Решение. Перед нами вторая задача Бернулли - надо найти р(^о 20)• Применим второе правило Муавра, поскольку к • р = 15 > 10.

Вычислим последовательно величины, входящие в формулу (М - Л):

Находим в приложении 3 значения функции Лапласа: Ф(1,40)^ 0,4192 и Ф(-4,20) = -Ф(4,20)^ -0,5 (заметьте - этого значения в таблице нет, но мыто знаем, что оно такое!). Подставляем найденные значения в формулу (М-Л) и окончательно получаем:

p(W0.20) « Ф(1,40)- Ф(4,20) - 0,4192 - (- 0,5) = 0,9192.•

Прогноз. Если провести 10 серий, в каждой по 100 выстрелов, то лишь в одной серии можно ожидать более двадцати попаданий.

Итак, при повторении опыта очень редко будет встречаться более двадцати попаданий. В связи с этим, возникает важный для практики вопрос: каков промежуток [0; ß], который практически достоверно (с вероятностью 0,997 или более) будет покрывать число / попаданий? Это обратная задача. Её мы будем решать в разделе упражнений. Интересен также вопрос: каково наиболее вероятное число попаданий?

Примечание. В данном курсе под практически достоверным событием будем в дальнейшем понимать событие, вероятность которого 0,997 или более. Не следует думать, что такое событие не может произойти. Оно может произойти, но очень редко, - 2-3 раза на тысячу опытов. Во многих практических задачах такая вероятность достаточна для обеспечения надёжного прогноза. Однако, не надо забывать, что есть задачи, которые требуют более надёжных прогнозов. К примеру, согласитесь ли вы прыгнуть с парашютом, если будете знать, что вероятность его нераскрытия 0,997?

Контроль 8. В условиях контрольного упражнения 7, рассчитайте вероятность события W2.A с помощью формулы (М-Л). Оцените

ошибку, для чего рассчитайте ту же вероятность трёхкратным применением формулы (6) (вычисления проведите на калькуляторе).

9. Упражнения

1. Монета подбрасывается 3 раза. Рассчитайте вероятности появления: а) ровно одного герба; б) ровно двух гербов; в) не более двух гербов. Расчёт проведите двумя способами: а) используя теоремы сложения и умножения (обоснуйте их применимость); б) используя формулу Бернулли (обоснуйте применимость схемы Бернулли). Отв.: 3/8; 3/8; 7/8.

Указание. W(u2) = W0 + Wx + W2.

2. Монета подбрасывается 4 раза. Рассчитайте вероятности появления: а) ровно трёх гербов; б) не менее трёх гербов. Как и в предыдущем упражнении, расчёт проведите двумя способами.

3. Монета подбрасывается 30 раз. Рассчитайте вероятность появления ровно 10 гербов двумя способами: а) по формуле Бернулли (с помощью калькулятора); б) по правилу Муавра. Рассчитайте вероятность появления от 10 до 20 гербов. Обоснуйте применимость формул.

Отв.: а) 0,028; 6)0,027.

4. Монета подбрасывается 30 раз. Как вы думаете, какая вероятность больше, - вероятность появления одинакового числа гербов и решек или не одинакового? Проведите точный расчёт. Если ваше предположение окажется ошибочным, то поймите - в чём причина ошибки?

5. Игральная кость подбрасывается 3 раза. Какова вероятность появления: а) ровно двух шестёрок; б) не менее двух шестёрок? Отв.: о,07; 0,074.

6. Что более вероятно: получить ровно две шестёрки а) при трёх подбрасываниях или б) при шести подбрасываниях игральной кости? Выскажите предположение, оправдайте его и проведите точный расчёт. В чём причина вашей ошибки (если, конечно, расчёт обнаружит наличие ошибки)? Отв.: 0,07; 0,2.

7. Два равных по силе шахматиста играют несколько партий. Что вероятнее: выиграть одну партию из двух или две партии из четырёх? (Ничьи не принимаются во внимание). Отв.: 0,5; 0,375.

8. Что вероятнее в условиях предыдущего упражнения: выиграть не менее двух партий из четырёх или не менее трёх партий из пяти?

Указание.

9. Орудие стреляет в цель 10 раз. Вероятность поражения цели не меняется от выстрела к выстрелу и равна 0,3. Какова вероятность а) ровно двух попаданий; б) не более двух попаданий? (При расчёте используйте калькулятор). Отв.: 0,233; 0,482.

10. Сорок орудий производят залп по цели. Вероятность поражения цели каждым орудием одинакова и равна 0,3. Каковы вероятности: а) ровно двух попаданий: б) ровно десяти попаданий; в) от двух до десяти попаданий?

11. Статистические наблюдения выявили следующую закономерность: в каждой тысяче новорождённых примерно 520 мальчиков и 480 девочек. Семья хочет иметь троих детей. Какова вероятность, что у неё будут а) все мальчики; б) два мальчика и одна девочка; в) ровно один мальчик; г) все девочки? Отв.: 0,14; 0,39; 0,36; 0,11.

Указание. Определите статистическую вероятность рождения мальчика (девочки).

12. В условиях предыдущей задачи рассчитайте вероятность того, что среди тысячи новорождённых окажется: а) ровно 480 девочек; б) от 460 до 500 девочек. Предварительно выскажите и обоснуйте своё предположение: какая вероятность будет в первом случае - большая или маленькая? Если предположение не оправдается, объясните причину.

Отв.: а) 0,025; 6)0,796..

13. В 1990 г. в Москве родилось 94,5 тыс. детей, из них 48,8 тыс. мальчиков, а в 1997 г. - 67,5 тыс. детей и 34,6 тыс. мальчиков. Определите статистическую вероятность рождения мальчика в Москве 90-х годов. На этой основе сделайте прогноз: сколько семей из тысячи трёхдетных семей будут иметь а) трёх мальчиков; б) двух мальчиков и одну девочку? Фактором рождения близнецов пренебрегаем. Отв.: Р* = 0,515; о,13б; 0,386..

14. Вратарь парирует, в среднем, 30% "пенальти" (одиннадцатиметровых ударов). Какова вероятность, что в серии послематчевых "пенальти", состоящей из пяти ударов, вратарь возьмёт: а) два мяча; б) не менее двух; в) хотя бы один? Отв.: 0,309; 0,471; 0,832.

15. Вероятность того, что телевизор потребует ремонта в течение гарантийного срока, равна 0,2. Институт приобрёл партию из шести телевизоров. Какова вероятность того, что а) половина телевизоров потребует ремонта; б) не менее половины; в) хотя бы один; г) все?

Отв.: 0,08; 0,1; 0,74; 0,000064.

16. В партии очень большого объёма содержится 5% некачественных изделий. На контроль берутся 5 изделий (случайная выборка) и партия принимается, если в выборке будет обнаружено не более одного некачественного изделия. Какова вероятность, что партия будет принята?

Отв.: 0,972.

17. Вероятность выхода из строя мотора самолёта равна 0,05. Самолёт может продолжать полёт, если работает не менее половины его моторов. На каком самолёте безопаснее лететь, - на двухмоторном или на

трёхмоторном? Отв.: 0,997; 0,992.

18. В урне 5 шаров, из них 3 белых и 2 чёрных. Эксперимент состоит в том, что из урны вынимается один шар четыре раза подряд, причём, перед каждым следующим выниманием вынутый до этого шар возвращается обратно в урну (выборка с возвращением). Какова вероятность того, что в результате эксперимента появится а) равное количество белых и чёрных шаров (в любом порядке); б) не менее двух белых? Отв.: 0,34; о,81.

19. В условиях предыдущей задачи измените выборку с возвращением на выборку без возвращения и рассчитайте вероятности тех же событий. Можно ли в этой ситуации применять формулу Бернулли? Почему?

20. Центральная радиостанция поддерживает связь с пятью периферийными станциями. Связь время от времени прерывается из-за атмосферных помех. Можно считать, что разрыв связи с каждой станцией происходит независимо от остальных, в силу отдалённости станций друг от друга. В среднем, из десяти часов работы центральной станции перерыв связи с каждой периферийной станцией длится около двух часов. Рассчитайте вероятность того, что в некоторый момент времени будет возможно установить связь а) ровно с тремя станциями; б) не менее чем с тремя; в) со всеми; г) НИ С ОДНОЙ. Отв.: 0,2; 0,94; 0,33; 0,00032.

Указание. Задача реальная и вписывается в схему Бернулли. "Простой" опыт состоит в попытке установления связи с какой-нибудь одной станцией в некоторый момент времени. В этом опыте возможны события: а - связь установлена, а - связи нет, причём, р(а) = 0$. Попытку установления связи с другой станцией в этот же момент времени можно рассматривать, как повторение "простого" опыта, ибо условия опыта не меняются - вероятность установления связи с новой станцией та же.

21. Автоматический станок производит детали. Статистическая вероятность появления не стандартной детали равна 0,008. Рассчитайте вероятность того, что в партии, содержащей 1000 деталей, окажется нестандартных: а) ровно восемь; б) менее восьми. Отв.: о,139б; о,4530.

22. Цех предприятия выпускает свёрла. Статистика показывает, что вероятность выпуска сверла повышенной хрупкости (брак) равна 0,02. Свёрла укладываются в коробки по 100 штук. Рассчитайте вероятность того, что в коробке а) не окажется бракованных свёрл; б) окажется не более трёх бракованных. Можно ли применить правила Муавра и Лапласа?

Указание. Для вычислений по формуле Бернулли необходим инженерный калькулятор: Р(^<3) = 0,133 + 0,27 + 0,273 + 0,182. Расчёт по формуле Лапласа (проведите его) даёт 0,682. Почему большая разница?

23. Некоему покупателю необходимо приобрести 100 качественных свёрл. Из опыта он знает, что примерно 2% приобретаемых свёрл быстро ломаются. Сколько он должен купить свёрл, чтобы быть уверенным с ве-

роятностью не менее 0,9, что среди них будет не менее 100 качественных свёрл?

24. Завод имеет 2400 агрегатов, в каждый из которых входит деталь, часто выходящая из строя. Замечено, что вероятность выхода этой детали из строя на каждом агрегате одна и та же, - примерно 0,17. Отдел снабжения заготовил 400 запасных деталей. Рассчитайте вероятность того, что будет обеспечена бесперебойная работа всех агрегатов в течение месяца. Рассчитайте, сколько деталей нужно иметь в запасе, чтобы бесперебойная работа была гарантирована с вероятностью 0,9 ?

25. Вероятность поражения цели при одном выстреле равна 0,6. Найдите интервал, который практически достоверно (с вероятностью 0,997) покроет число попаданий после 600 выстрелов. Отв.: (збо-32; 360 + 32).

Указание. В подобных задачах обычно ищется симметричный интервал вида (кр-т; кр + т) и неизвестным является т.

26. Планируется эксперимент, состоящий из большого числа независимых опытов. В каждом опыте ожидается появление некоторого события А ("успех") с вероятностью р = 0,8. В результате эксперимента необходимо получить не менее 75 "успехов". Сколько повторений опыта к следует планировать, чтобы гарантировать требуемое число "успехов" с вероятностью 0,9?

Указание. Примените правило Муавра-Лапласа к промежутку [75; к], поставив в левую часть этой формулы известную вероятность 0,9; затем замените Ф\^к/2)= 0,5 (объясните, почему это можно сделать); по таблице приложения 3 найдите аргумент функции Ф, соответствующий значению 0,4 ; решите полученное уравнение относительно л[к, получите 4к = 10, откуда к = 100.

27. Игральную кость бросают 80 раз. Найдите интервал, в котором будет заключено число выпадений шестёрки с вероятностью 0,9973.

Отв.: (кр-\0; кр + ю), - от 4 до 23.

28. Монета подбрасывается 100 раз. Рассчитайте вероятность того, что число появлений "герба" попадёт в промежуток [45; 55]. Опишите эксперимент, которым можно подтвердить прогноз. Отв.: 20(1) = 0,6826.

29. Монета подбрасывается 100 раз. Найдите интервал (50-w; 50+w), в который с вероятностью 0,99 попадёт число "гербов".

30. На прядильной фабрике каждая работница обслуживает несколько сотен веретён. При вращении веретена пряжа иногда рвётся. Руководству необходимо знать, как часто могут происходить обрывы при тех или иных условиях работы (сорт пряжи, скорость веретён и пр.). Рассчитайте вероятность того, что за смену у одной работницы произойдёт не более 10

обрывов, если она обслуживает 800 веретён и вероятность обрыва на каждом равна 0,005. Отв.: 0,9972.

31. Замечено, что при социологических опросах из каждых 10 человек двое могут дать неискренний ответ. Проведено 22500 опросов. Найдите вероятность того, что неискренних ответов не более 10%. Какой процент неискренних ответов можно ожидать с вероятностью 0,9 ?

32. Театр вмещает 1000 зрителей и имеет два входа, каждый из которых ведёт к своему гардеробу. Сколько мест должно быть в каждом гардеробе, чтобы в 99 случаях из 100 все зрители могли раздеться в том гардеробе, в который они зашли? Рассмотрите два варианта: а) зрители приходят поодиночке; б) зрители приходят парами. Предположите, что каждый зритель может выбрать тот или иной вход с равными вероятностями.

Отв.: 541; 558.

33. В посёлке 2500 жителей. Каждый из них ездит на поезде в город примерно 6 раз в месяц. Какой наименьшей вместимостью должен обладать поезд, чтобы он переполнялся не чаще одного раза в 100 дней? Поезд ходит регулярно один раз в сутки. Предположите, что каждый житель выбирает дни поездки случайным образом, независимо от других. Отв.: 547.

34. Проблема Джона Смита. В 1693 г. некий Джон Смит поставил перед учёными вопрос: одинаковы ли шансы на успех у трёх человек, если первому надо получить хотя бы одну шестёрку при бросании игральной кости 6 раз, второму - не менее двух шестёрок при 12 бросаниях, третьему - не менее трёх шестёрок при 18 бросаниях. Задача эта была решена великим Ньютоном и малоизвестным Толлетом. Решите её и вы.

Отв.: 0,6651; 0,6187; 0,5973.

ЛЕКЦИЯ 5

ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ (ОСНОВНЫЕ ПОНЯТИЯ)

До сих пор мы занимались решением задачи - определить вероятность случайного события. Основными были понятия события и вероятности. Теперь перейдём на следующую ступень обобщения - будем рассматривать в опыте не отдельные события, а некоторый спектр возможных событий, как единое целое. Естественность и необходимость обобщения станут ясными из примеров.

Цели занятия: 1) освоиться с понятиями случайной величины и дискретной случайной величины, со способом её математического описания; 2) познакомиться с двумя её числовыми характеристиками, понять их смысл. Параллельно повторим все изученные ранее методы расчёта вероятностей.

1. Пример, приводящий к случайной величине

Теория вероятностей начиналась с вопросов, которые возникали в практике азартных игр.

Пример 1. Игра состоит в том, что один раз подбрасываются случайным образом две однородные игральные кости и подсчитывается сумма выпавших очков. Предварительно игроки делают денежные взносы - каждый ставит на определённую возможную сумму очков. Угадавший получает весь выигрыш. На какую сумму поставите вы?

Может быть, вы скажете - на любую, ведь, любая сумма от 2 до 12 возможна, и в процессе игры будете ставить на разные суммы. Но вскоре заметите, что одни суммы появляются чаще, другие - реже, и станете ставить на те суммы, которые появляются чаще. Но какая сумма появится чаще всех? Теперь вы вспомните, что частота р* появления события может быть предсказана по его вероятности р, а вероятность можно рассчитать до опыта. И если вы хорошо усвоили классический метод, вы без труда проделаете следующие расчёты.

Решение. Нас интересуют вероятности следующих событий: А2 - сумма выпавших очков равна 2 ;

Согласно классическому методу, надо проделать следующее: 1) выписать полную группу всех исходов опыта и посчитать их число п ; 2) посчитать число mi исходов, благоприятствующих событию Ап /= 2,..., 12; 3) поделить mi на п.

Элементарными событиями (исходами) данного опыта будут всевозможные комбинации пар очков. Группу всех исходов удобно записать в виде следующей таблицы.

Таблица 1

1+1

2 + 1

3 + 1

4 + 1

5 + 1

6 + 1

1 + 2

2 + 2

3 + 2

4 + 2

5 + 2

6 + 2

1 + 3

2 + 3

3 + 3

4 + 3

5 + 3

6 + 3

1 + 4

2 + 4

3 + 4

4 + 4

5 + 4

6 + 4

1 + 5

2 + 5

3 + 5

4 + 5

5 + 5

6 + 5

1 + 6

2 + 6

3 + 6

4 + 6

5 + 6

6 + 6

Таблица содержит 6 строк и 6 колонок, следовательно, число всех исходов я = 6 + 6 + 6 + 6 + 6 + 6 = 6-6 = 36. Число исходов, благоприятствующих событиям А3,А4,...,Аи, подсчитывается по диагоналям таблицы 1 (слева-вверх направо): т2 = 1, т3 = 2,..., т7 =6, ms = 5,..., т]2 = 1. После этого вычисляются вероятности:

р(Л) = 1/36, р(А) = 2/36, р(Л7) = 6/36, р(Л) = 5/36, PU2) = l/36.

Полученные результаты сведём в следующую таблицу:

Таблица 2

Суммы очков

2

3

4

5

6

7

8

9

10

11

12

Вероятности

1/36

2/36

3/36

4/36

5/36

6/36

5/36

4/36

3/36

2/36

1/36

Итак, на какую сумму вы теперь поставите? Ответ ясен - на 7, всегда только на 7.•

Прогнозы. Ставя на 7, вы будте выигрывать, примерно, шесть раз в тридцати шести партиях (каждую шестую партию). Если же кто-то решит ставить на 12, он будет выигрывать, примерно один раз в тридцати шести партиях, его тактика в шесть раз хуже.

Таблица 2 содержит полную информацию о всех возможных результатах игры. Поэтому с её помощью можно делать разнообразные прогнозы и решать многие другие задачи. Представьте, что в игре у вас есть двое сообщников. Если вы поставите на 6, 7 и 8, то вероятность выигрыша для вашей компании резко возрастёт. Дополнительный расчёт с помощью теоремы сложения даёт

Примерно в половине партий сумма очков попадает в промежуток [б;8], и значит, примерно каждый второй выигрыш будет у вас в кармане.

Ряд распределения. Посмотрите ещё раз на таблицу 2, -вероятности сначала возрастают, потом убывают. Таблица показывает, как вероятности распределяются среди всех возможных значений сумм очков. Поэтому её называют рядом распределения вероятностей.

Информацию, заключённую в таблице 2, можно представить в иной, наглядной форме (рис. 1). Вы, конечно, легко разберётесь в том, как построена ломаная на рис. 1. Эта ломаная называется многоугольником распределения (вероятностей). В данном примере ломаная состоит из двух отрезков и образует "уголок", но вообще, она может иметь разнообразный вид (см. далее рис. 2, 9).

Вывод. Для решения разнообразных задач полезно знать не только вероятности отдельных событий, а распределение вероятностей на полной группе событий данного опыта.

Контроль 1. В примере 1 измените условия игры, - подсчитывайте не сумму, а разность очков, причём, учтите порядок подбрасывания костей (число очков на первой кости минус число очков на второй). На какую разность сделаете ставку? Сможете ли правильно рассчитать вероятности, если от большего числа очков отнимается меньшее?

Указание. Введите полную группу событий (перечислите все значения, которые может принимать разность); вычислите вероятности этих значений; составьте ряд распределения и постройте многоугольник распределения. Изменилось ли распределение вероятностей по сравнению с таблицей 2?

Рис. 1

2. Понятие случайной величины (с.в.)

Предварительно следует остановиться на понятии "величина '. Что это такое? Под переменной величиной (или просто величиной) математики понимают "меняющеся количество", которое в каком-либо процессе (опыте) может принимать различные числовые значения. К примеру, если нагревать замкнутый объём газа, его давление будет расти. Здесь две переменные величины - температура Т ° и давление Р. Эти величины не случайные, ибо каждому значению температуры t = t0 соответствует одно определённое значение давления р = ро9 которое можно рассчитать и одно-

значно предсказать. При любом повторении опыта (тот же газ, тот же объём) значению t0 будет отвечать то же самое значение р0*). Такие величины называют детерминированными.

Если результат опыта не предопределён однозначно и может меняться от опыта к опыту, - это признак случайной величины. Так было в примере 1. Вернёмся к этому примеру и обратим внимание, прежде всего, на его отличие от задач, которые решали раньше.

Первое отличие очевидно: раньше мы рассчитывали вероятности отдельных событий, теперь - вероятности событий, образующих некую группу {А2,А3,..., Ап]. Свойства группы уточнять пока не будем.

Вторая особенность новой задачи менее заметна. Она состоит в том, что с каждым событием группы связывается, согласно условию задачи, определённое число: с событием А2 - число х, = 2, с А3 - число х2 = 3, и т. д.

Эта связь событий с числами позволяет изменить терминологию и говорить, например, что в результате опыта появилось не событие А2, а число (значение) х, = 2, не событие А3, а число х2 = 3, и т. д. Вспомните, - мы так и говорили: в результате подбрасывания двух игральных костей появилась сумма очков, равная двум (или трём, четырём и т. д.).

Значения х,, х2,... меняются от опыта к опыту и представляют собой, следовательно, переменную величину. Значения эти появляются в опыте случайным образом (предсказать заранее и однозначно, какое значение появится, невозможно). Значит, перед нами случайная величина.

Рассмотренный пример приводит нас к следующему определению.

Определение 1. Случайная величина (кратко - с.в.) - это переменная величина, связанная с конкретным опытом, значения которой определяются случайными исходами этого опыта.

Условимся обозначать с.в. преимущественно большими буквами из конца латинского алфавита - X, 7, Z, Г, S,... (буквами из начала алфавита мы обозначали раньше события - А, В, С,...). Значения с.в. будем обозначать соответствующими малыми буквами - х, у, z,... Изменим и обозначения событий: если в результате опыта появляется значение с.в. X, равное хо9 то это событие будем обозначать так: (х = х0). Разумеется, допустимы и иные обозначения случайных величин, - в дальнейшем вам встретятся с.в., Smm, Тм и т. п.

Случайную величину в примере 1 обозначим X,. Событие А2 (сумма очков 2) получит теперь иное обозначение А2=(Х1=2)9 событие

*) Это утверждение не абсолютно верное. Во-первых, значения t и p определяются в опыте с помощью измерений, которые всегда дают некоторую ошибку. Во-вторых, нельзя повторить опыт совершенно идентично. Однако, колебания значений t и p при повторении опыта будут весьма малы, этими колебаниями можно пренебречь и считать переменные величины детерминированными.

А2 = (хх =3), и т. д. Случайную величину, возникшую в контроле 1, обозначим У,.

Ещё раз обращаю ваше внимание на три характерных особенности св., отражённых в определении: 1) каждая с.в. связана с каким-то опытом ; 2) в результате опыта она может принимать разные значения; 3) значения эти случайны. Запомните это.

Как возникают с. в. ? Случайные величины возникают в процессе решения задач и определяются практическими целями этих задач. Так, в примере 1 с.в. X, возникла из условий опыта (сумма очков) и задачи отыскания той суммы, которая при повторении опыта появляется наиболее часто. При изменении условий игры (контроль 1) возникла другая с.в. У, - разность очков. Так что с одним и тем же опытом могут связываться разные с.в.

С.в. X, и У, различаются набором значений, а распределения вероятностей у них совпадают (вторые строки ряда распределения с.в. X, и У, одинаковы). Рассмотрим пример с другим распределением вероятностей.

Пример 2. Три орудия производят залп по цели. Вероятности поражения цели каждым орудием известны и равны, соответственно, рх = 0,8, р2 = 0,7, р3 = 0,6. Каково наиболее вероятное число попаданий?

Между прочим, может возникнуть предположение, что поскольку все вероятности больше половины, то наиболее вероятны три попадания. Проверим его точным расчётом.

Решение. Вопрос задачи определяет выбор с.в. Х2 - числа попаданий. У неё четыре возможных значения -0,1,2,3. Рассчитаем вероятности этих значений с помощью теорем сложения и умножения:

Прогноз. Наиболее вероятное число попаданий - два (а не три). Вероятность этого события 0,452. Ровно двух попаданий можно ожидать примерно в половине залпов, трёх попаданий - в трети залпов. •

Полную картину возможных результатов опыта даёт ряд распределения и многоугольник распределения вероятностей с.в. Х2 (таблица 3, рис.

Таблица 3

Число попаданий

0

1

2

3

Вероятности

0,024

0,188

0,452

0,336

Заметьте, - характер распределения вероятностей св. Х2 существенно отличен от распределения св. X, (сравните рис. 1 и 2).

Вероятность трёх попаданий немного меньше вероятности двух попаданий. Интересно, как должны измениться вероятности р., чтобы наибольшей стала р[х2 = 3)? Подумайте.

Контроль 2. Опыт состоит в однократном подбрасывании трёх монет. Как вам кажется, - каково наиболее вероятное число появлений герба? Одинаково ли часто будет появляться чётное число гербов и нечётное (нуль считаем чётным числом)? Выскажите свои предположения, а затем проведите точный расчёт (оправдались ли предположения)? Введите св., составьте её ряд распределения и постройте многоугольник распределения. Сделайте прогнозы. Сходно ли распределение вероятностей вашей св. с предыдущими распределениями (рис. 1 и 2)? В чем отличия?

Указание. Расчёт вероятностей можно провести с помощью теорем сложения и умножения, как это сделано выше (пример 2). Но он пройдёт быстрее, если использовать формулу Бернулли (см. лек. 4, п. 2, формула (6)). Применяя её, правильно ответьте на вопрос: что такое в нашем случае р и чему оно равно?

3. Абстрактные св.

Данное выше определение 1 базируется на понятии величины. С современной точки зрения это понятие не достаточно отчётливое. Современные математики используют в качестве базовых понятия "множества" и "соответствия". Сейчас нам предстоит более строго формализовать понятие случайной величины.

Чтобы прийти к новому определению, обратимся к примеру 1. Мы отмечали, что характерная его особенность - связь событий 4 с числами.

Связь эту в данном примере можно описать так: в опыте выделено множество событий {А29А3,...,А12} и определено множество чисел {2,3,...,12}, после чего установлено соответствие между этими множествами At <-> г. Но такое соответствие называется в математике функцией. И получается, что случайная величина — это функция.

Однако, в отличие от привычной вам числовой функции, эта функция (св.) определена не на числовом множестве, а на множестве событий. И это множество событий не совсем произвольное. Ведь, при каждом выполнении опыта должно появиться какое-то значение св., значит, группа

Рис. 2

событий должна быть полной.*) И ещё, - при выполнении опыта не могут появиться сразу два различных значения св., значит, события группы несовместимые.**)

Определение 1'. Случайная величина — это функция***) на полной группе несовместимых событий некоторого опыта.

Заметим, что в примере 1 функция оказалась взаимно-однозначной. Но это, разумеется, не обязательно.

Как задаётся соответствие между событиями и числами - произвольно или нет? Этот вопрос может возникнуть у вас после прочтения определения 1'. Ответ: произвольно, потому что определение не накладывает никаких ограничений на соответствие.

В предыдущем разделе ставился подобный вопрос: как возникают св.? Мы ответили, - из условий и целей задачи. Т. е. при решении конкретной задачи соответствие между событиями и числами определяется целями этой задачи. Именно поэтому в примере 1 мы ставили в соответствие событиям 4 суммы очков.

Определение 1' подчёркивает абстрактность понятия случайной величины, - оно отвлекается от условий задачи (но остаётся пока связанной с опытом). Значит, можно выбрать произвольную группу событий (лишь бы она была полной, а события несовместимыми); произвольно выбрать числовое множество; произвольно установить однозначное соответствие между событиями и числами. Любая такая математическая конструкция будет теперь называться нами случайной величиной.

Так, в опыте с подбрасыванием двух игральных костей (пример 1) я могу поставить в соответствие событиям А{ любые числа, например, квадраты сумм очков, или произведение появившихся очков. Такое соответствие может оказаться бесцельным, но тем не менее, оно будет задавать некую св. Отметим также, что можно произвольно изменять и группу событий (лишь не нарушая полноты и несовместимости).

Контроль 3. Опыт состоит в подбрасывании трёх монет. Постройте свою абстрактную св., - введите какую-то свою группу событий, задайте какое-то числовое множество и установите соответствие между ними.

*) Группа событий называется полной, если при каждом выполнении опыта обязательно появится одно из событий этой группы (в примере 1 - или появится сумма очков, равная двум, или трём, или двенадцати). И не может появиться событие, не входящее в группу и исключающее все события группы (такого события нет, ибо группа полна).

**) События группы называются несовместимыми, если появление одного из них исключает появление других (если появится сумма очков два, то не может одновременно появиться другая сумма - три, четыре,...).

***) Отметим, что в строгой математической теории появляется необходимость наложить на функцию-с.в. ограничение, - она должна быть измеримой. Что значит этот термин и почему он вводится, объяснить вам здесь невозможно, да и не нужно.

4. Дискретные (д.с.в.) и непрерывные с.в.

Сейчас вы должны научиться различать два важных класса случайных величин - дискретные и непрерывные. Различие между ними увидеть нетрудно - оно во множестве значений. Значения дискретной с.в. отделены друг от друга промежутками, а значения непрерывной с.в. заполняют некоторый промежуток "сплошь". Вы увидите это сейчас на примерах.

Все, до сих пор рассмотренные нами св., были дискретными. В примере 1 значения с.в. X, (сумма очков) образуют конечную возрастающую последовательность 2 < 3 <... < 12. Их можно отделить друг от друга интервалами, не содержащими других значений, как-то: (2;3), (3;4),..., (11;12), что показано на рис. 3. Термин "дискретный" происходит от латинского слова discretus - разделённый, прерывистый.

Познакомьтесь с непрерывными с.в.

Пример 3. Опыт состоит в том, что орудие стреляет в мишень (один выстрел). Случайная величина S - расстояние от точки разрыва снаряда до цели. Какие значения может принимать эта св.?

Почти очевидно, что все возможные значения с.в. S заполняют "сплошь" некоторый промежуток [0;?), где s - максимально возможное отклонение снаряда от цели (рис. 4).

Поясню. При попадании в цель появляется значение s = О. При повторении опыта будут появляться разные значения s и все они будут лежать в границах между 0 и s. Существенно, что любое значение s, взятое из промежутка [0;^), является одним из возможных значений с.в. S (снаряд может разорваться на любом расстоянии от цели, не превышающим s). Это мы и имеем в виду, когда говорим, что значения с.в. S заполняют промежуток [0;s) "сплошь", т. е. непрерывно.

Примечание. Обратите внимание, - правый конец промежутка [0; s) "размыт", его нельзя определить точно. Его можно определить приближённо, проведя большую серию опытов (например, сделав 100 выстрелов) и приняв за s наибольшее из появившихся значений. Условимся в таких случаях закрывать "размытый" конец промежутка круглой скобкой, что мы и сделали выше, - [o;s). Ясно, что правый конец промежутка можно выбирать по-разному, т. е. по-разному моделировать (!) множество возможных реальных значений с.в. Заметим также, что для решения вопроса - дискретная или непрерывная с.в. перед нами, не нужно знать точное значение s. Нам надо лишь знать, заполняют ли значения с.в. некоторый промежуток "сплошь".

Рис. 3

Рис. 4

Пример 4. Автоматический станок штампует детали заданного размера 10. Очевидно, размер реальной детали есть переменная величина L, значения которой колеблются около 10 случайным образом. Очевидно также, что значения эти заполняют "сплошь" некоторый малый интервал (l0 -е\ 10 +е), где можно считать, что s - максимальное возможное отклонение размера детали от номинала 10 (рис. 5).

Возражение. Проведённое обоснование непрерывности св. L (а также S) может вызвать сомнение. Вы можете возразить так. Результат измерения детали выражается в каких-то минимальных единицах, доступных измерительному прибору. Например, микрометром можно измерить длину детали с точностью до сотых долей миллиметра. Значит, в этом случае реально может существовать только конечное число значений св. L, отделённых друг от друга очень малыми промежутками в 0,01 мм. Следовательно, L - дискретная св.

Опровержение. Ваше рассуждение совершенно правильно. Но заключение из него вы делаете неверное. Не L - дискретная св., а построенная вами модель есть дискретная св. Построенная выше абстрактная модель, теоретически предполагающая абсолютно точное измерение, есть непрерывная св.

Дискретные и непрерывные модели. Ваше возражение углубляет понимание и заставляет уточнить постановку вопроса. Для реальной св. не корректно спрашивать - какая это величина, дискретная или непрерывная? Надо ставить вопрос иначе - какой св. следует моделировать данную реальную ситуацию, дискретной или непрерывной? В дальнейшем, в третьей части курса вы увидите, что непрерывные модели позволяют эффективнее решать многие практические задачи.

В свете сказанного, вопрос - дискретна или непрерывна данная св.? - будет подразумевать следующее: можно ли моделировать данную реальную ситуацию непрерывной св. или только дискретной?

В заключение раздела дадим общие определения.

Определение 2. Случайная величина называется дискретной {д.с.е.), если множество всех возможных её значений или конечно, или может быть расположено в виде бесконечно возрастающей (или убывающей) последовательности.*) Примечание 3. Если множество значений д.св. конечно, они, очевидно, отделимы друг от друга промежутками (пример 1). Если множество значений бесконечно, то отделимость не всегда возможна. Например, любые две точки интервала (а; b) нельзя отделить промежутками, не содержащими других точек этого интервала. В случае же возрастающей последовательности отделимость очевидна. Пример дискретной св. с бесконечным множеством возрастающих отделимых значений будет чуть позже (в п. 9 лекции).

Рис. 5

*) В литературе обычно даётся немного более общее определение дискретной св., а именно, добавляются св. со счётным множеством значений, которые могут быть расположены в бесконечную не монотонную последовательность и не отделяться интервалами (например, множество рациональных чисел из промежутка [0; 1]). Наше определение следует книге [2, с. 32], оно проще и учитывает все практически значимые д.св.

Определение 3. Случайную величину будем называть непрерывной, если множество её значений заполняет "сплошь" (непрерывно) некоторый промежуток (он может быть и неограниченным).*) Существуют ещё и смешанные с.в. (см. [3, с. 104-106]), но в нашем курсе они не будут встречаться.

Контроль 4. На автоматической телефонной станции (АТС) фиксируется число вызовов за определённый промежуток времени (например, с 12 до 13 часов), а также длительность каждого разговора. С.в. Y2 - число вызовов, Y3 - длительность произвольно взятого разговора. Какая из них дискретная, какая - непрерывная? Каковы множества их значений?

5. Математическое задание д.с.в.

В предыдущих двух разделах мы были заняты значениями с.в. и как-то забыли, что эти значения обладают вероятностями, и что распределение этих вероятностей содержит самую важную информацию для ответа на практические вопросы. Математическое описание д.с.в. должно, следовательно, включать, во-первых, все значения св., во-вторых, - вероятности этих значений.

Определение 4. Рядом распределения вероятностей дискретной с.в. X (или просто рядом распределения, кратко - p.p.) называется таблица, состоящая из двух строк: в верхней строке перечисляются в порядке возрастания (или убывания) все возможные значения данной д.с.в. - х, <х2 <...<х, <...; в нижней - вероятности появления каждого из этих значений - рх, р2,..., pt,....

В общем виде ряд распределения д.с.в. X выглядит так:

Таблица 4

Если число значений д.с.в. X конечно, таблица понятным образом укорачивается.

Напомню, что ряд распределения можно представить наглядно многоугольником распределения, построив в координатной системе точки мДх,,/?,) и соединив их ломаной линией (рис. 1 и 2).

*) Определение 3 тоже отличается от формальных определений непрерывной св., принятых в абстрактной математической теории ([5, с. 124], [9, с. 68]), и также следует книге [2, с. 32]. Оно проще, а значит, понятнее других опосредованных определений и позволяет легко опознавать непрерывные св., возникающие в практических приложениях. Т. е. это работающее определение, - оно постоянно используется в данном курсе и вообще в широкой практике. Представление о необходимых теоретических уточнениях этого определения можно будет получить дальше (лек. 9, п. 1, примечание и п. 6, дополнение 3).

Примечание. Распределение вероятностей непрерывных с.в. не может быть задано таблицей, ибо их значения заполняют "сплошь" некоторый промежуток и поэтому их нельзя записать в виде монотонной бесконечной последовательности. Их нельзя отделить малыми интервалами, не содержащими других значений (любой сколь-угодно малый "интервальчик", отделяющий два каких-то значения, содержит бесчисленно много других значений). Как вы узнаете в третьей части курса (лек. 9), распределение вероятностей непрерывных с.в. задаётся некоторой функцией, которую называют плотностью распределения.

Свойство ряда распределения. Взгляните-ка на ряд распределения с.в. X, (таблица 2) и просуммируйте вероятности, стоящие в нижней строке:

В сумме получилась единица. Проделайте то же самое для с.в. Х3 (таблица 3) - опять получите единицу. Так будет всегда. Почему? В силу полноты группы событий, на которых определена с.в. Это видно из доказательства следующей теоремы.

Теорема. Сумма вероятностей всех значений любой дискретной случайной величины равна единице:

рг+р2+...+ре+... = 1 (1)

Доказательство проведём для случая с.в. с конечным числом значений. При этом придётся опираться на определение случайной величины. Но у нас есть два таких определения. Второе вам казалось формальным и искусственным, но именно из-за своей формальности и точности оно и годится для строгих доказательных рассуждений.

Согласно определению Г, в опыте, в котором рассматривается данная св., задана полная группа событий ах9 а29 ак. Составим сумму этих событий а = ах +а2 +... + Д.. Из полноты следует, что при каждом выполнении опыта произойдёт одно из событий af, значит, согласно определению суммы событий, произойдёт и событие а. Итак, а - достоверное событие и р(а) = \.

Согласно тому же определению Г, события ах9 а29 ак несовместимые, значит, применима первая теорема сложения:

Р(А) = Р(4)+Р(^2)+...+Р(4) = 1.#

Замечание. В случае, когда д.с.в. имеет бесконечное множество значений, придётся пользоваться теоремой сложения для счётного множества слагаемых (мы её не доказывали, но она справедлива) и сумма вероятностей превратится в сумму ряда.

Математическая абстракция. Обратите внимание -ряд распределения содержит всю вероятностную информацию о д.с.в. и,

вместе с тем, он игнорирует конкретику опыта, с которым связана св. Получается, что с формально математической точки зрения задать д.с.в. -значит задать только её ряд распределения. Вы теперь можете начертить таблицу из двух строк, в первой строке поставить любые числа, во второй -любые положительные числа, сумма которых равна единице, и сказать, что задана случайная величина.*) Формальный взгляд на д.с.в., как на таблицу, позволит нам развить абстрактную математическую теорию. В дальнейшем мы будем классифицировать св. по сходству их распределений, изучать общие свойства и, в конечном счёте, применять теоретические выводы и формулы к решению практических задач. Такова программа последующих занятий. Первый пример подобного исследования будет в конце данной лекции.

Контроль 5. Д.с.в. Y задана следующим рядом распределения:

Таблица 5

Каким должно быть ръ1 Постройте опыт, который реализует данную св.

Y. Проверьте выполнение условий определений 1 и Г.

Указание. Положите в урну шары (сколько?) и напишите на них значения данной св. (они будут повторяться). Или используйте геометрические вероятности.

6. Среднее значение

Ряд распределения даёт полную вероятностную информацию о д.с.в., но нередко бывает трудно вычислимым. К примеру, попробуйте рассчитать вероятности различных сумм очков при подбрасывании шести игральных костей (именно столько костей бросали игроки в XVIII в.). Согласитесь, что до недавнего времени это была бы не лёгкая и не быстрая работа. Поэтому возникла потребность иметь числовые характеристики св. (числа), которые обобщённо отражали бы некоторые существенные особенности распределения вероятностей.

Наука выработала разнообразные такие характеристики (так называемые "моменты"). Из них наиболее важную для практики и часто используемую информацию несут две - математическое ожидание M и дисперсия D. Познакомьтесь с первой. Как всегда, начнём с примера.

Взгляните на таблицу 5, поставьте в последней колонке ръ = 2/6 и скажите, - какое число вы бы назвали средним значением св. 7? Может быть, вы ответите, что из трёх значений {-1; 0; 1} средним будет 0. Но учтите вероятности этих значений - что они говорят? Они говорят, что при повторении опыта правое значение хъ = 1 будет появляться чаще левого

*) Опыт, реализующий написанный "с потолка" ряд распределения, нетрудно построить, используя, например, урну с шарами или геометрические вероятности (контроль 5).

х, =-1. Поэтому среднее значение надо сдвинуть вправо от нуля. Это простое соображение приводит к следующему определению и к формуле для вычисления среднего значения д.с.в.

Определение 5. Математическим ожиданием (кратко -М.О.), или средним значением д.с.в. X, заданной рядом распределения (табл. 4), называется число M, которое вычисляется по формуле

(2)

Причём, сходимость ряда в этой формуле должна быть абсолютной. Если д.с.в. имеет конечное число значений, то в формуле (2) будет стоять конечная сумма.

Рассчитаем по формуле (2) среднее значение с.в. Y (контроль 5):

Как мы и предполагали, оно сдвинуто вправо от нуля из-за большего "веса" в сумме правого слагаемого, сравнительно с левым.

Замечание. Если значений д.с.в. бесконечно много, то для определения M по формуле (2) надо найти сумму ряда. Вы, может быть, помните, что это весьма не простая задача. Более того, бывают ряды, у которых суммы нет (расходящиеся). Следовательно, не всякая д.с.в. с бесконечным множеством значений обязана иметь среднее значение в смысле определения 5. Приведу пример.

Применим формулу (2) к такому распределению:

Таблица 6

Формула (2) даёт

Получившийся ряд расходится, в чём можно убедиться, применив признак Даламбера,

Следует добавить, что если д.с.в. имеет бесконечно много отрицательных значений и ряд (2) сходится, но не абсолютно, т. е. ^х,/?,] = +°°, надо считать, что он тоже не имеет математического ожидания.

Смысл среднего значения. Теперь постараемся понять, какую информацию о распределении вероятностей даёт нам число M. Рассмотрим три св., заданные следующими распределениями:

Таблица 7а Таблица 76 Таблица 7в

Эти св. различаются между собой небольшими изменениями вероятностей: р4 увеличивается от Z, к Z3.

Вычислим математическое ожидание первой св. Z,:

Вы видите, что М, совпало со средним арифметическим ("серединой") всех значений св. Z, (рис. 6), которое вычисляется так:

Это произошло из-за симметрии распределения вероятностей. Вычислим математическое ожидание второй св. Z2:

Из-за того, что крайняя правая вероятность у св. Z2 увеличилась, сравнительно с Z,, а левые остались неизменными, её математическое ожидание М2 сдвинулось вправо от "середины" С (рис. 6). Для третьей св. Z3:

М3 сдвинулось ещё правее (рис. 6). Причина та же - увеличение р4. В этом случае ръ + р4= 5/8 > рх+р2 = 3/8 и "правые" вероятности перевешивают "левые".

Эти простые примеры позволяют почувствовать, как изменяется математическое ожидание св., в зависимости от характера распределения "левых" и "правых" вероятностей.

Вывод. Если математическое ожидание M некоторой д.св., число значений которой конечно, лежит правее "середины" её значений С, то зачастую это означает, что значения, лежащие правее "середины в целом, более вероятны, нежели "левые". Разница тем больше, чем правее от "середины" лежит M. Заключение понятным образом изменяется, если M лежит левее С.

Предостережение. Сделанный вывод справедлив не всегда. Распределение, не подчиняющееся этому выводу, придумать не трудно (придумайте!). Однако, для распределений, возникающих в практических исследованиях, этот вывод себя оправдывает. Отметим также, что и сформулирован он не достаточно точно. Точная статистическая формулировка

Рис. 6

будет в следующей лекции (лек. 6, п. 4). Там вы узнаете, как приближённо находить M, минуя ряд распределения.

Почему "ожидание"? Для многих, практически важных классов с.в. (с некоторыми вы познакомитесь в дальнейшем), число M указывает ориентировочную область (около M), в которой будут часто появляться значения с.в. при многократном повторении опыта. Чем дальше от М, тем реже появляются значения с.в. (рис. 7). Значит, M - это обобщённое, условно ожидаемое в опыте значение с.в. Ожидание здесь не психологическое, а условно математическое, - "ожидается" не значение M, а значения, близкие к M. Помните, что эти "ожидания" могут и не оправдаться.

Контроль 6. С. в. YA и Y5 заданы распределениями:

Таблица 8а Таблица 86

Из распределения вероятностей данных с.в. сделайте предположение о расположении их м.о. (какое правее?). Вычислите M(Y4) и M(Y5) точно.

7. Степень разбросанности значений

Перейдём ко второй обобщённой характеристике ряда распределения. Начнём не с примера, как обычно, а с определения.

Определение 6. Дисперсией дискретной св., заданной рядом распределения (табл. 4), называется число D, которое вычисляется по формуле*)

D = D(X) = (х, - М)2 • рх + (х2 -М)2 • р2 +... + (х, -М)2 • р. +... (3)

Если д.с.в. имеет конечное число значений, формула укорачивается.

Выясним, какую информацию несёт число Dl Понять это помогут, как всегда, примеры.

Примеры. Рассмотрим три св., заданные распределениями:

Таблица 9а Таблица 9б Таблица 9в

Вы видите, что первые две с.в. различаются только значениями, вторые две - вероятностями. В силу симметрии распределения значений и ве-

*) В формулу (3) входят квадраты, поэтому дисперсия измеряется в квадратных единицах.

роятностей, математические ожидания у всех трёх с.в. одинаковы и равны нулю, - M = 0. Вычислим дисперсии:

Самая большая дисперсия у второй с.в. Почему? Из вычисления видно, что у неё велики первое и третье слагаемые из-за того, что она имеет далёкие от M значения -10 и 10, вероятности которых не малы. При многократном повторении опыта эти далёкие от M значения будут возникать часто. Можно сказать, что у с.в. Z5 велика разбросанность значений относительно её математического ожидания.

Третья с.в. Z6 имеет те же, далёкие от M значения -10 и 10, но появляются они с вероятностью 0,1, т. е. в три раза реже. Эта вероятность уменьшает первое и третье слагаемые, а значит, и дисперсию почти в три раза. Разбросанность значений у с.в. Z6 значительно меньше, чем у Z5.

Первая с.в. Z4 имеет самую маленькую дисперсию, потому что все её значения близки к M.

Вывод. Дисперсия с.в.Х зависит от двух факторов: 1) насколько далеки от М(х) значения X; 2) насколько велики или малы вероятности далёких значений.

Статистический смысл дисперсии. Величина D(x) характеризует степень разбросанности значений с.в. X, появляющихся в результате серии опытов: если значения появляются кучно (вероятности далёких от M значений малы), - разброс мал, дисперсия мала; если же часто появляются значения, далёкие от М, разброс велик, дисперсия большая.

Дисперсия позволяет сравнивать разные с.в. по степени разбросанности (рассеяния) их значений. Слово "диперсия" и означает "рассеяние". Сказанное можно проиллюстрироватьс помощью рис. 7. На этом рисунке условно изображены точками значения произвольной св., появившиеся в результате серии опытов. Видно, что эти значения располагаются, в основном, вблизи M, - значит, дисперсия не велика. Если же изменить рисунок так, чтобы все точки немного отодвинулись от M, то дисперсия увеличится.

Другая формула. В заключение выведем другую, более простую формулу дисперсии, облегчающую вычисления. Как всегда, ограничимся с.в. с конечным числом значений.

Преобразуем формулу (3) так: раскроем скобки, сделаем группировку и учтём формулы (1) и (2):

В результате, формула (3) примет вид:

D(x) = (x2P] +х22р2 +... + х2кРк)-М2. (4)

Сумма в скобках напоминает формулу (2) - это математическое ожидание другой св., значениями которой являются квадраты значений данной св., а вероятности те же. Такая св. называется квадратом св. x и обозначается x2, её ряд распределения:

Таблица 10

С учётом введённого обозначения св. x2, запишем формулу (4) короче:

d(x) = m(x2)-m2 (4')

Совершенно аналогично выводится формула для д.с.в. с бесконечным множеством значений. Группировка ряда допустима, т. к. он знакоположительный и, значит, сходится абсолютно. Проведите этот вывод самостоятельно.

Контроль 7. Вернитесь к св. Y4 и Y5, заданным в контроле 6.

Как вы считаете, у какой из них дисперсия больше и намного ли? Вычислите точно D(Y4) и Ufa), используя обе формулы (3) и (4). Подтвердилось ли ваше предположение? Какая формула удобнее для вычислений?

8. Среднее квадратическое отклонение

Формула дисперсии (3) содержит квадраты, которые могут сильно увеличивать число D (сравните D(Z4) и D(Z5) из п. 7). Будет удобнее, если мы "усредним" все дисперсии с помощью операции извлечения квадратного корня, при этом большие дисперсии значительно уменьшатся, а маленькие (меньшие единицы) увеличатся.

Определение 7. Средним квадратическим отклонением (кратко - с.к.о.) случайной величины x называется число <т(х), которое вычисляется как корень квадратный из дисперсии:

(5)

Поскольку квадратный корень - функция возрастающая, то большей дисперсии D отвечает большее значение с.к.в. а. Значит, с.к.в. а тоже характеризует степень разбросанности значений св.

Статистический смысл числа а: чем больше а(х), тем больше разбросаны значения св. X, и тем чаще возникают в опытах далёкие от M значения св.

Сравним дисперсии и с.к.в. трёх св. -Z4,Z5,Z6 (таблицы 9а-в):

Вы видите, что большей дисперсии (большему разбросу) отвечает большее среднее квадратичское отклонение. Вместе с тем, значения а отличаются друг от друга гораздо меньше, нежели значения дисперсий D (это и имелось в виду, когда было сказано "усредним"). Более того, они сравнимы с максимальными отклонениями значений св. от математического ожидания М. Обсудим эту особенность а подробнее.

Сравним среднее и максимальное отклонения:

Все средние отклонения меньше максимальных. Но не намного. Не более, чем в три раза. Убедимся в этом.

Построим "двухсигмовый" интервал вида (М - 2а; M + 2а) (на рисунках 8 изображены правые половины интервалов). Вы видите, что для св. Z4 этот интервал покрывает в с е её значения: 0,1,-1 (рис. 8а). То же -для св. Z5 (рис. 86). Для св. Z6 "двухсигмовый" интервал недостаточен, но "трёхсигмовый" (М-За; М + За) покрывает все значения: 0, 10, -10 (рис. 8в).

Рис. 8а Рис. 86 Рис. 8в

Вывод. Мы подметили ценную закономерность, которую в дальнейшем уточним и обоснуем: для многих, возникающих на практике св. (как дискретных, так и непрерывных) "трёхсигмовый' интервал (М - За; M + За) покрывает почти все практически возможные значения св.

Фраза "покрывает почти все" означает, что при повторении опыта значения св. будут очень редко выходить за пределы интервала (М-За; M + За). Следовательно, зная только две числовые характеристики M и а случайной величины X, можно сделать прогноз о диапазоне её

практически возможных значений: достаточно отложить влево и вправо от точки M по отрезку, равному За (так называемое "правило трёх сигм") [3, с. 120]. Вот какова практическая ценность числовых характеристик!

Вместе с тем, следует подчеркнуть, что надо соблюдать определённую осторожность, сознавая приближённость и ограниченность такого рода вероятностных прогнозов. Надо знать, в каких условиях и насколько можно им доверять. О некоторых условиях применимости правила трёх сигм и об оценке возможной ошибки мы поговорим в дальнейшем (лек. 7, п. 4, лек. 11, п. 8). А сейчас (после выполнения вами контрольного упражнения) проиллюстрируем прогностическую силу правила трёх сигм.

Контроль 8. В условиях контрольного упражнения 5 вычислите средние квадратические отклонения с.в. Y4 и Y5. Постройте двух и трёхсигмовые интервалы. Покрывают ли они значения св.? Если покрывают, постарайтесь изменить вероятности так, чтобы трёхсигмовый интервал не покрывал всех значений с.в. Сделайте рисунки.

9. Класс геометрических распределений

В заключение применим то, что узнали, к исследованию одного класса д.с.в. с бесконечным множеством значений.

Задача. Производится ряд независимых опытов с целью получения какого-то результата ("успеха"). При каждой попытке (опыте) "успех" достигается с вероятностью р. Спрашивается, - сколько попыток можно ожидать до первого "успеха"?

Пояснение. Задача поставлена обобщённо - опыт не конкретизируется. Это может быть, например, подбрасывание монетки до первого появления герба ("успех"). Другой пример - стрельба по цели до первого попадания. Вероятность "успеха" (событие А) тоже может быть любой: Р (Â) = р. Таким образом, перед нами не одна задача, а целый класс однотипных задач.

Мы должны найти ответ на практический вопрос: сколько безуспешных попыток может пройти до первого "успеха". Очевидно, это зависит от вероятности р - чем она больше, тем быстрее будет достигнут "успех". Но какова количественная оценка числа попыток? Мы понимаем, конечно, что эта оценка не может быть точной - она вероятностная.

Решение. Вопрос задачи подсказывает нам, что для её решения надо ввести случайную величину К„ - число попыток до первого "успеха". Среднее значение этой с.в. и будет вероятностной оценкой ожидаемого числа попыток.

Отступление. Прежде чем составлять ряд распределения с.в. и вычислять её математическое ожидание, полезно поставить скептический вопрос: а дейст-

вительно ли - случайная величина? Вспомните определение 1 - всякая с.в. характеризуется тремя особенностями: она связана с опытом, её значения меняются и они случайны. С каким опытом связана с.в. ? С опытом, в котором появляется "успех" или "неуспех"? Нет! С более сложным опытом - с серией данных опытов, повторяющихся до первого "успеха". В результате каждой такой серии появится то или иное значение с.в.: или "успех" будет достигнут сразу, с первой попытки, и с.в. (число попыток "до") примет значение k = О ; или первое выполнение данного опыта не будет успешным, а второе даст нужный результат, - с.в. примет значение k = 1 (одна попытка до "успеха"); и т. д. Ясно, что невозможно точно и с абсолютной уверенностью предсказать, сколько попыток будет сделано до первого "успеха". Значит, действительно, переменная величина - случайная.

Итак, будем составлять ряд распределения с.в..

Сколько у неё значений? На первый взгляд, может показаться, что число значений конечное, ибо нельзя, ведь, произвести бесконечное число опытов. Но вдумайтесь, - суть не в том, что число опытов всегда конечно, а в том, что число опытов до первого "успеха" теоретически не ограничено. Следовательно, с.в. К„ может принять любое значение из бесконечного их множества { 0; 1; 2; 3;т;...}.

Найдём вероятности значений с.в. К^, используя теорему умножения для независимых событий (Ах — "успех" в первой попытке, А2 - во второй, и т. д.):

Обратите внимание, - вероятности образуют геометрическую прогрессию со знаменателем q=\-p. Становится понятно, почему с.в. К„ называют геометрическим распределением.

Ряд распределения с.в. выглядит так:

Таблица 11

Математическое ожидание с.в. А^, вычисляемое по формуле (2), приводит нас к сумме ряда:

Можете поверить, что сумма этого ряда определяется формулой:

Если хотите понять, откуда взялась эта формула, читайте мелкий шрифт. Вывод формулы (6). Вынесем общие множители за скобки:

Теперь надо просуммировать ряд, стоящий в квадратных скобках. Обратите внимание -если обозначить 1 - р = q, то этот ряд можно рассматривать, как результат почленного дифференцирования ряда-прогрессии:

Значит, сумма ряда, стоящего в квадратных скобках, может быть получена дифференцированием суммы ряда-прогрессии, которая определяется известной формулой

Продифференцируем этот ряд и получим искомую сумму:

Вернёмся к математическому ожиданию и заменим ряд, стоящий в квадратных скобках, его суммой, найденной только что (учтите q = 1 - р):

Интерпретация и прогнозы. Итак, "ожидаемое" число попыток до первого успеха, определяется формулой (6). Для p = 0J эта формула даёт М07 = 0,43 ; для р = 0,4 будет М0А =1,5; для /? = 0,01 получим М0 01 = 99. Какую информацию несут эти числа?

Когда мы обсуждали смысл среднего, "ожидаемого" значения M, мы сделали вывод, что это число указывает ориентировочно область ("около" M), в которой будут часто возникать значения св. при повторении опыта. Значит, можно предсказать, что при р = 0,7 "успех" будет достигнут или сразу, или через одну попытку; при р = 0,4 - через одну-две попытки; при p = 0ß\ потребуется "около" ста попыток. А теперь давайте уточним, - что значит "около"?

То, насколько близко к M будут появляться значения св., определяется величиной дисперсии D. Подобно тому, как мы вывели формулу (6), можно вывести и формулу дисперсии, - она имеет вид:

(6)

(7)

Посчитаем соответствующие дисперсии:

D07 =0,61, D0A =3,75, D00] =9900.

Первые две дисперсии не велики, значит, наше предположение, что "успех" будет достигаться за одну-две попытки, подтверждается. Последняя дисперсия очень велика, значит, разбросанность значений около M0 01 = 99 велика и для достижения "успеха" может потребоваться значительно больше ста попыток. Попробуем уточнить и это.

Вычислим соответствующие средние квадратические отклонения:

Составим трёхсигмовые интервалы:

Делаем выводы-прогнозы: если р = 0,7, то "успех" практически гарантирован за одну-три попытки; если р = 0,4, - число попыток не более семи; при очень малых вероятностях "успеха" число попыток резко возрастает и для р = 0,01 оно доходит до четырёхсот.

Вывод этот иллюстрирует рис. 9, на котором изображены многоугольники геометрических распределений при /? = 0,7 и р = 0,4, а крестиками на оси ОХ отмечены соответствующие средние значения М07 и М04. Вы видите, как быстро убывают вероятности, -они практически исчезают для значений, больших трёх (для первой св.) и для значений, больших семи (для второй).

Вот и оцените полезность числовых характеристик для реального вероятностного прогнозирования.

Оценка надёжности прогноза.

Поставим вопрос: какова вероятность выхода значений св. Кж за пределы интервала (М-За; M + 3а)1 Т. е. посчитаем вероятность р8 ошибки наших прогнозов. Для этого, используя ряд распределения (таблица 11), найдём сначала вероятность того, что св. примет значение, не меньшее, чем т0:

Рис. 9

При р = 0,7 выход за пределы трёхсигмового интервала начинается с т0 = 3, значит, вероятность ошибки прогноза ps(0J) = 0,33 = 0,027. При Р = 0А PsiQA) = 0,68 -0,017; при р = 0,01 /^(0,01) = 0,99400 - 0,018.

Итак, наш прогноз может не оправдаться только 2-3 раза на 100 случаев. Следовательно, его надёжность (вероятность исполнения прогноза, - обозначим её pß) равна pß=\-pô = 0,97, или 97%.

Если вспомнить, что практически достоверным мы условились считать (лек. 4, п. 8, примечание) такой прогноз, вероятность исполнения которого pß > 0,997, и который, следовательно, может не оправдаться лишь 2-3 раза на 1000 случаев, то следует признать, что 97% это не слишком хорошая надёжность. Хорошей была бы 99,7%.

Контроль 9. Игральная кость подбрасывается до тех пор, пока не появится "шестёрка". Каково математическое ожидание M числа подбрасываний? Какую верхнюю границу ( M + За) числа возможных подбрасываний вы можете гарантировать и с какой надёжностью?

10. Упражнения

1. Монета подбрасывается два раза. Каково наиболее вероятное число решек? Введите св., составьте ряд распределения и постройте многоугольник распределения. Сделайте прогноз: как часто следует ожидать появления 0, 1, 2 решек при 200 подбрасываниях?

2. Два орудия делают залп в цель. Вероятности поражения цели: рх = 0,6 и р2 = 0,3. Как вам кажется, что более вероятно - два промаха или два попадания? Введите св., составьте ряд распределения и сделайте прогноз для пятидесяти залпов.

3. Четыре орудия делают залп в цель. Вероятности поражения: рх = 0,6, р2 = 0,3, р3 = 0,4, р4 = 0,7. Как вы думаете, каково наиболее вероятное число промахов? Введите св., определите её возможные значения, рассчитайте их вероятности, составьте ряд распределения и постройте многоугольник распределения.

4. Одно орудие стреляет в цель 4 раза. Вероятность попадания каждый раз одинакова и равна р = 0,9. Каково наиболее вероятное число попаданий? Сделайте прогноз распределения числа попаданий при ста повторениях опыта (сто серий по четыре выстрела). Как часто будет не менее двух попаданий?

5. Игральная кость подбрасывается 3 раза. Как вам кажется, какова наиболее вероятная сумма очков? Рассчитайте это точно. Подберите интервал, в который примерно раз в трёх партиях попадает сумма очков. Постройте многоугольник распределения суммы очков и сравните его с рис. 1. В чём существенное отличие?

Указание. Число всех исходов найдите принципом умножения - п = 216. Число исходов, благоприятствующих определённой сумме очков пересчитайте перебором соответствующих "троек". Например, сумме 9 благоприятствуют следующие "тройки": (з + 3 + з), (з + 2 + 4), (з +1 + 5),...., всего т9 = 25. Не потеряйте каких-то "троек"! После расчёта всех вероятностей проверьте суммированием, нет ли ошибок.

6. В урне 4 шара, пронумерованных числами 1, 2, 3, 4. Опыт состоит в последовательном вынимании, не глядя, двух шаров. Случайная величина Х- число шаров с чётными номерами. Каковы возможные значения с.в. XI Проверьте выполнение условий определений 1 и Г. Составьте ряд распределения и проверьте выполнение его свойства (1). Отв.: p(x = i)=4/6.

Указание. Для вычисления вероятностей используйте следствие теоремы умножения для зависимых событий и теорему сложения.

7. В условиях предыдущей задачи придумайте свою с.в. и проверьте, выполняются ли условия определений 1 и Г. Рассчитайте её ряд распределения, постройте многоугольник распределения. Сравните распределение вероятностей вашей с.в. с распределением с.в. X из задачи 6. В чём сходство? В чём различие?

8. Имеются две урны и в каждой лежат по три шара, пронумерованных числами 1, 2, 3. Опыт состоит в вынимании из каждой урны по одному шару случайным образом (результат опыта, следовательно, - тройка шаров, номера которых могут повторяться). С этим опытом связываются две св.: X, - сумма номеров вынутых шаров, Х2 - произведение номеров. Составьте ряд распределения с.в. X, и ряд распределения с.в. Х2. Определите вероятности попадания значений каждой из этих величин в сегмент [2; 5], т.е. Р(Х,е[2;5]) и Р(Х2е[2;5]). Попытайтесь найти вероятность одновременного попадания значений той и другой с.в. в сегмент [2; 5].

Отв.: Вероятности с.в. Х}: 1/9, 2/9, 3/9, 2/9, 1/9 ; с.в. Х2: 1/9, 2/9, 2/9, 1/9, 2/9, 1/9. Р(Х, g [2; 5]) = 8/9, v(x2 е [2; 5]) = 5/9, Р(х,, Х2 е [2; 5]) = 5/9.

9. Три стрелка производят залп по цели. Вероятности поражения цели каждым стрелком равны: рх = 0,5, р2 = 0,7, р3 = 0,9. Случайная величина X - число попаданий. Рассчитайте вероятности всех её значений и определите вероятность не менее двух попаданий - Р(Хе[2;3]). Оцените и обоснуйте расположение среднего значения. Вычислите м(х).

Отв.: p(Ig [2;3]) = 0,8.

10. В магазин поступила партия из 10 телевизоров, в которой 4 дефектных. Институт решил приобрести 3 телевизора. Как вы думаете, сколько будет дефектных телевизоров в планируемой покупке? Предполагая, что выбор телевизоров при покупке случаен, найдите ожидаемое (математически) число дефектных телевизоров, которые могут оказаться в покупке. Отв.: м = 1,2.

11. При испытаниях качества стрельбы обычно делают три выстрела в мишень. Качество можно оценивать двумя способами: а) средним расстоянием от точек разрыва снаряда до цели; б) числом попаданий. Введите две соответствующих с.в. и определите, - какая из них дискретная, какая непрерывная? Обоснуйте. Какой эксперимент надо провести, чтобы построить ряд распределения введённой вами д.с.в.?

Указание. Подумайте, как экспериментально найти вероятность попадания и далее рассчитать вероятности значений д.с.в.

12. Дан ряд распределения вероятностей абстрактной д.с.в. X:

Таблица 12

Найдите запишите ряд распределения с числовыми вероятностями и оцените расположение математического ожидания, величину дисперсии и среднего квадратического отклонения. Вычислите точно M, D и а. Оправдались ли ваши оценки? Если нет, то в чём причина ошибки? Составьте двух и трёхсигмовые интервалы: (М -2<т; М + 2<т), (М -3<т; М + 3<т). Покрывают ли они множество всех значений с.в. XI

13. Для определения качества стрельбы проведено 100 выстрелов в мишень, при этом 38 выстрелов поразили цель. Составьте распределение вероятностей числа попаданий в серии из трёх выстрелов. Как часто можно ожидать не менее одного попадания? Рассчитайте M и <т. Постройте трёхсигмовый интервал (М-Зсг; М + Зсг). Покрывает ли он значения св.?

14. Для сравнения качества стрельбы двух стрелков проведён эксперимент, - каждый сделал 100 серий по 3 выстрела. Распределение числа попаданий сведено в таблицы:

Таблица 13а Таблица 136

Какой стрелок лучше стреляет?

Указание. Найдите статистические вероятности, запишите ряды распределения и рассчитайте M и D.

15. Прибор состоит из пяти независимо работающих элементов. Вероятность выхода из строя каждого элемента в течение гарантийного срока одинакова и равна 0,1. Каково ожидаемое (математически) число отказов?

16. Опыт состоит в том, что две игральные кости подбрасываются дважды. Каждый раз обращают внимание, появилось ли чётное число очков на обеих костях. После этого фиксируют, сколько раз появилось чётное число очков на обеих костях, - это число и является значением с.в. x в данном опыте. Какие значения может принимать данная св.? Вычислите вероятности этих значений. Напишите ряд распределения. До вычисления m оцените его приближённое значение. Вычислите m, D и а.

Отв.: р0 =9/16; м =1/2.

17. Вероятность попадания в мишень неким стрелком равна 0,8. Стрелку выдают патроны до тех пор, пока он не промахнётся. Каково наиболее вероятное число выданных патронов? Каково ожидаемое (среднее) число выданных патронов? Какую верхнюю границу числа выстрелов можно гарантировать и с какой надёжностью? К какому классу с.в. принадлежит введённая вами св.? Отв.: м = 5.

Указание. рк = 0,8*-1 • 0,2, к = 1,2,3,.... Чтобы при вычислении M просуммировать ряд, просмотрите вывод формулы (6) в п. 9. Если не сможете просуммировать ряд, замените его достаточно "длинной" частичной суммой и найдите M приближённо.

18. Два игрока играют в игру, поочерёдно подбрасывая монету. Выигрывает тот, у кого первого выпадет решка. Как вы думаете, у кого из них больше шансов выиграть и почему? Рассчитайте шансы игроков точно. Сделайте прогноз: сколько игр из 100 выиграет первый игрок, сколько второй?

Указание. р(л) = 0,5 + 0,53 + 0,55 +.... Объясните этот расчёт и просуммируйте прогрессию с помощью формулы, указанной в п. 9 данной лекции. Аналогично рассчитайте р(#).

ЛЕКЦИЯ 6

НАЧАЛА МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

В предыдущей лекции вы познакомились с фундаментальным понятием случайной величины (св.). Напомню, - это переменная величина, которая в результате опыта может принимать различные значения случайным образом. Лекция была посвящена дискретным св., - они имеют конечное или счётное множество значений. Пример - сумма выпавших очков при подбрасывании двух игральных костей. Эта величина связана с опытом - подбрасыванием двух костей. Она может принимать различные значения от 2 до 12. Предсказать точно, какое значение появится, нельзя, -они появляются случайно.

С понятием дискретной св. связано другое основное понятие ряда распределения вероятностей. Это таблица, состоящая из двух строк: в первой строке записываются все возможные значения св. (в порядке их возрастания), а во второй - вероятности значений. Ряд распределения св. X с конечным числом значений имеет следующий вид:

Таблица 1

Ряд распределения содержит полную вероятностную информацию о св. Числовые характеристики {математическое ожидание M = Y,xiPi и дисперсия D = Y;(xi - M)2 Pi) "сжимают" эту информацию до одного числа M или D, утрачивая при этом какую-то её часть. Однако, этого оказывается достаточно для решения практических задач, для надёжных прогнозов.

В примерах, которые мы до сих пор рассматривали, ряд распределения рассчитывался теоретически и точно. В реальных задачах точный расчёт обычно невозможен, вероятности pi приходится определять статистически из серии опытов над св. Так же приближённо приходится отыскивать M и £>. Замечательно вот что: для получения хороших приближений вероятностей, требуется очень большое количество опытов (несколько сотен и более), а хорошие приближения числовых характеристик зачастую (но не всегда*)) получаются из значительно меньшего числа опытов (несколько десятков). Этим обстоятельством ещё больше повышается практическая ценность числовых характеристик.

*) Если в лотерее очень много билетов (несколько сот тысяч), то надёжно оценить средний выигрыш по небольшой выборке (купив несколько десятков или даже сотен билетов), конечно, нельзя.

Итак, практика требует ответа на следующие вопросы. Как строить приближённый ряд распределения св.? Как отыскивать приближённые значения числовых характеристик св.? Как оценивать степень их точности? Это первые, базовые задачи математической статистики.

Вообще, предмет научной дисциплины, которую называют математической статистикой, составляют методы обработки экспериментального (статистического) материала с целью извлечения информации, позволяющей делать обоснованные и надёжные прогнозы. Дисциплина эта органически связана с теорией вероятностей, с её понятиями и фактами, и является, в сущности, её прикладным продолжением.

Цели занятия. Освоиться с методом первичной обработки статистического материала (группировка). Познакомиться со статистическими аналогами понятий, введённых в предыдущей лекции (статистический ряд, статистические среднее, дисперсия). Понять своеобразие оценки степени точности статистических формул (доверительный интервал, доверительная вероятность).

1. Статистический ряд

Пример 1. При 25 проверках октанового числа одного и того же сорта бензина были получены результаты, которые сведены в таблицу 2 (в первой и других нечётных колонках записан номер проверки, в чётных -результат).

Таблица 2

1

38

6

38

11

44

16

42

21

43

2

41

7

41

12

42

17

45

22

37

3

41

8

44

13

41

18

41

23

40

4

42

9

45

14

40

19

44

24

39

5

39

10

41

15

40

20

43

25

41

Условимся обозначать появившиеся результаты верхними индексами так: =38, х(2) = 41, х(25) = 41. Требуется составить приближённый ряд распределения св. X - октанового числа.

Прежде чем решать задачу, нелишне осознать, что мы действительно имеем случайную величину. Проверим три условия определения 1 (лек. 5, п. 2). Каждую проверку можно рассматривать, как опыт. В результате опыта появляется то или иное значение св. Значения случайны. Условия определения выполняются.

Св. X - дискретная (лек. 5, п. 4, определение 2), её возможные значения целые числа, отделимые интервалами, их количество конечное. В таблице 2 зафиксированы 25 значений св. X, появившихся в результате эксперимента: х(1) =38, х(2) =41, х(25) =41. Среди них есть повторяющиеся. Надо понимать, что таблица может не содержать некоторых

возможных значений с.в., - при увеличении числа проверок могут появиться и другие значения.

Приближённый ряд распределения св. X, который надо составить, должен иметь такой же вид, как и точный (таблица 1), только во второй строке будут стоять приближённые значения вероятностей.

Решение. Найдём в таблице 2 минимальное и максимальное значения св., это будут х(22) = 37 и х(9) = 45. Запишем во 2 -й строке таблицы 3 различные появившиеся значения св. X в порядке возрастания: Xj =37, х2 =38, х9 =45 (в 1-й строке записываются индексы / = 1,2,...,9 - номера значений х,).

Подсчитаем, сколько раз появилось каждое значение х, в серии из к = 25 опытов, - получим частоты /,. Запишем их в 3-ю строку. Относительные частоты Ijk запишем в последнюю строку таблицы. Последняя колонка служит для контроля правильности подсчётов. •

Таблица 3

i

1

2

3

4

5

6

7

8

9

37

38

39

40

41

42

43

44

45

h

1

2

2

3

7

3

2

3

2

25

h Ik

1/25

2/25

2/25

3/25

7/25

3/25

2/25

3/25

2/25

1

Обсуждение и выводы. Как вы думаете, можно ли считать полученную таблицу 3 приближённым рядом распределения вероятностей данной св.? Во-первых, нельзя быть уверенным, что она содержит все возможные значения св. X. Во-вторых, относительные частоты Ijk могут сильно отличаться от истинных вероятностей p.=v{X = xj), ведь, число опытов мало (к = 25). Вспомните, как медленно приближались относительные частоты к вероятностям при подбрасывании монеток, - нужно было провести 100 или даже 500 опытов, чтобы они приблизились достаточно близко.

Так что таблицу 3 можно считать лишь очень грубым приближением к ряду распределения. Поэтому её называют статистическим рядом, а не статистическим рядом распределения.

Тем не менее, эта таблица содержит существенную информацию о св.: из неё видно, что значение х5 = 41 появляется гораздо чаще остальных, и значения, близкие к 41, появляются чаще, чем далёкие. Значения, лежащие правее 41, в целом появляются немного чаще, чем "левые". Значит, можно предположить, что математическое ожидание св. X должно быть чуть больше 41, - может быть, M ~ 41,3.

Определение 1. Простой статистической совокупностью (выборкой) называется множество значений св., появивши-

хся в результате эксперимента (серии из к опытов над св.), записанных в порядке их появления:

Обычно простая статистическая совокупность записывается в виде таблицы 2. Это своеобразный протокол эксперимента, в котором зарегистрированы номера опытов / = 1,2,...Д и значения х(/), которые появились в этих опытах. Иногда её называют первичной статистической совокупностью.

Обратите внимание, - появившиеся значения обозначаются индексом сверху х(/), г = 1,2,к, а возможные значения с.в. X, упорядоченные по возрастанию (таблица 1), - индексом снизу х,, / = 1,2,...,л.

Число появившихся значений равно числу опытов к, а число возможных значений обычно меньше числа опытов ( п < к), ибо появляющиеся в эксперименте значения могут повторяться.

Определение 2. Статистическим рядом с.в. X называют таблицу, в которой указаны различные значения св., появившиеся в эксперименте и расположенные в порядке возрастания, а также указаны частоты или относительные частоты этих значений.

Согласно определению 2, статистический ряд может состоять из 2 -х строк (таблицы 4а и 46), так же, как и ряд распределения с.в. X (таблица 1). Обратите внимание, - число значений х, в таблицах 4 и 1 может быть разное ( m < п), т. к. в эксперименте могут появиться не все возможные значения св.. Обозначать их будем одинаково х, (индекс снизу).

Таблица 4а Таблица 4б

При решении примера 1 вы могли заметить, что удобнее строить статистический ряд в виде таблицы 3, состоящей не из 2-х, а из 4-х строк. Добавляется строка (первая), в которой фиксируются индексы различных появившихся в эксперименте значений с.в. Учитываются строки и частот, и частостей.

Дополнение. В некоторых руководствах по математической статистике (или её специальным приложениям - экономической статистике и др.) используется иная терминология. Простая статистическая совокупность называется выборкой или выборочной совокупностью, статистический ряд - вариационным рядом, появившиеся в эксперименте значения - вариантами, относительные частоты - частостями.

Это связано с тем, что на практике методы математической статистики обычно используются при изучении св., возникающих в результате обследования какой-то группы предметов, выбранных из другой, большей группы. Эта большая группа, дополненная всеми мыслимо возможными предметами такого же рода, называется генеральной совокупностью, а выбранная из неё для обследования часть - выборочной совокупностью (выборкой).

К примеру, на склад поступает месячная продукция какого-то завода и из неё отбирается часть (выборка) для проверки изделий на стандартность. Генеральная совокупность в этом случае это некая абстрактная совокупность, в которую мысленно включаются все возможные однотипные изделия завода. Вы скажете, - зачем мыслить то, чего нет? Я отвечу, - мы мыслим то, что может быть. То, что надо учитывать, как возможность. Ведь проверка изделий на стандартность (пусть она состоит в измерении изделий) даст нам ряд значений с.в. L (размер изделия), появившихся в этом эксперименте, среди которых будут не все возможные значения этой с.в. Все мыслимо возможные значения с.в. дало бы обследование этой самой генеральной совокупности. Так что абстракция генеральной совокупности правомерна так же, как и абстракция всех возможных значений с.в.

Наконец, почему значения с.в, появляющиеся в эксперименте, называют вариантами! Эти значения появляются хаотично и образуют беспорядочно изменяющийся ряд чисел. Русское слово "изменение" звучит по иностранному, как "варьирование". Отсюда - "варианты" и "вариационный ряд".

Контроль 1. Имеется простая статистическая совокупность (выборка): 17, 18, 16, 16, 17, 18, 19, 17, 15, 17, 19, 18, 16, 16, 18, 18. Представьте её в виде статистического ряда и сделайте выводы об особенностях распределения с.в. и о расположении математического ожидания.

Указание. Повторите смысл математического ожидания (лек. 5, п. 6).

2. Группированный статистический ряд

В примере 1 случайная величина X имела небольшое число различных значений - 9, поэтому статистический ряд (таблица 3) получился легко обозримым. Но взгляните на статистический материал, представленный в таблице 8 (п. 8, упражнение 5), - он содержит 34 различных значений, от 117 до 150. В таких случаях статистический ряд становится длинным и его трудно анализировать. Возникает потребность "ужать" его, сделать обозримым. Процедура, с помощью которой это делается, называется группировкой, а результат - группированным статистическим рядом.

Группировку обычно осуществляют сразу над первичной статистической совокупностью, не строя статистического ряда. Она состоит в следующем: 1) определяется основной промежуток [a;b], содержащий все появившиеся значения св., и он разбивается на меньшие Ах,, Ах2,...; 2) подсчитывания частоты /, попадания значений с.в. в каждый "интервальчик" Ах,: 3) вычисляются относительные частоты Ijk. Проделаем всё это на простом примере.

Пример 2. В результате эксперимента, состоящего из k = 25 опытов над с.в. X, получена простая статистическая совокупность (таблица 2). Произвести группировку.*)

*) По существу, в данном примере группировка не требуется.

Решение. 1) Просмотрим результаты наблюдений (таблица 2) и выделим наименьшее и наибольшее значения: xmin = 37; х1Т1ах =45. Промежуток [37;45] содержит все другие значения. Можно было бы принять его за основной [a; b] и разбить на 4 мелких, длины Ах, = 2 (о выборе длины Ах, поговорим чуть ниже). Но лучше немного расширить его, - за начало рекомендуется брать а = хтт -Дх,/2. В нашем случае xmin =37, Ах//2 = 1 и, значит, а = 36. Получаем основной промежуток [36;4б] и разбиваем его на 5 мелких: [36;38), [38;40), [40;42), [42;44), [44;4б] (правые концы промежутков, кроме последнего, исключаются).

Выбор длин àxj. При большом количестве значений с.в. возникает проблема: какой выбрать длину мелких промежутков Лх, ? Сколько их надо взять, чтобы получился не перегруженный и содержательный ряд? Опыт показывает, что число промежутков Ас,- должно быть 10-20 (ни много, ни мало, обозримо). Существует формула для расчёта длины Лх,, так называемая формула Стерджеса:

(St)

где w = jcmax -xmin -размах выборки, k - число опытов. В данном примере w = 45 - 37 = 8. k = 25, lg k = lg 25 « 1,398, и формула (1) даёт:

Округляя, получаем Лх, = 1. Выходит, что в нашем случае Стерджес не рекомендует проводить группировку (число различных значений с.в. невелико - 9). Однако, мы продолжим её, взяв минимальные длины Лх, = 2, ведь, у нас учебная цель - проиллюстрировать процесс группировки.

2) Подсчитаем частоты /.: сколько значений с.в. X попадает в первый "интервальчик" Ах, =[36;38), сколько - во второй Ах2 =[38;40), и т. д. Процедуру подсчёта удобно организовать с помощью рабочей таблицы 5. Алгоритм действий следующий.

Из таблицы 2 берём первое появившееся значение х(1)=38 и смотрим, в какой промежуток Ах, оно попадает, - видим, что на границу 1 -го и 2 -го промежутка. Условимся относить его в таких случаях к правому промежутку, т. е. х(1) е Ах2 = [38;40). Фиксируем этот факт жирненькой "точкой" на рабочем поле таблицы 5 в строке, соответствующей второму промежутку.

Берём второе значение х(2) =41, определяем, что оно попадает в третий промежуток Ах3= [40; 42), ставим "точку" в соответствующей строке.

Продолжаем так и далее. Причём, по мере накопления "точек" их надо располагать в вершинах "квадратика" и далее связывать "чёрточками", образуя "конверт". Каждый такой "конверт" отсчитывает 10 значений св.,

попадающих в соответствующий промежуток. После того, как будет учтено последнее значение х{к) и рабочее поле будет заполнено, легко подсчитать частоты /,, записав их в 4-ю колонку таблицы 5.

3) Вычисляем относительные частоты Ijk (частости) и записываем их в 5-ю колонку таблицы 5. Контроль правильности подсчёта осуществляется суммированием частот (должно получиться число опытов к) и частостей (должна получиться единица).

Таблица 5

4) Результат группировки представляется в виде итоговой таблицы 6.

Таблица 6

Вы, наверное, обратили внимание на иную запись промежутков Ах, в таблице 6. Такая запись нередко используется статистиками.

Если промежутков Ах, много и они не умещаются в одной строке, таблица продолжается добавлением ниже ещё двух строк (это вам придётся делать в разделе упражнений). •

Определение 3. Группированным статистическим рядом св. X (интервальным) называется таблица (пример - таблица 6), состоящая из двух строк: в верхней строке указываются промежутки Ах,, разбивающие основной промежуток [a; b], включающий все появившиеся в эксперименте значения св. X ; во второй строке - относительные частоты (частости) попадания значений св. X в соответствующий промежуток.

Итог группировки можно представить несколько иначе, - в виде дискретного группированного статистического ряда, записывая в первой строке не границы промежутков, а их средние значения. Так, если в табли-

це 6 заменить промежуток Ах, = [36; 38) его средним значением х, =37, промежуток Дх2 - значением х2 = 39, и т. д., в результате получим таблицу 7:

Таблица 7

37

39

41

43

45

0,04

0,16

0,40

0,20

0,20

Контроль 2. Сделайте группировку в выборке, заданной в контрольном упражнении 1, взяв Ах, = 2. Представьте результат в двух формах: в виде интервального группированного статистического ряда и в виде дискретного.

3. Гистограмма. Полигон

Информацию, заключённую в группированном статистическом ряде (интервальном), можно представить графически в виде диаграммы (рис. 1), которую называют гистограммой.

Вы видите, что она состоит из "столбиков", построенных на промежутках Ах,, как на основаниях. Площадь Si каждого "столбика" равна относительной частоте попадания св. в соответствующий промежуток Ах,:

S. =ljk. Значит, его высота рассчитывается так:

(Смею надеяться, что вы знаете формулу площади прямоугольника St = Ах, • hi и умеете выразить из неё hi = 5,/Ах,).

Процедуру построения гистограммы разберём подробно на примере ряда, представленного таблицей 6.

Строим две взаимно перпендикулярные оси и на горизонтальной откладываем промежутки Ах,, взятые из первой строки таблицы 6 (рис. 1).

Понятно, что за начало первого промежутка Ах, можно взять любую точку оси.

Берём первый промежуток Ах, =[36;38), его длина Ах, =2. На этом промежутке нам надо построить "столбик" площади 5, =ljk = 1/25. Его высота должна быть /г, =5',/Ах, = (1/25):2 = 1/50. Откладываем на вертикальной оси значение \ = 1/50 и строим первый "столбик". Поскольку высота /г, очень мала, то единица не поместится на вертикальной оси, да она нам и не

Рис. 1

нужна, - за единицу измерения высот "столбиков" можно взять высоту первого, отложив её на вертикальной оси произвольно.

Берём второй промежуток Ах2 = [38;40), вычисляем вторую высоту h2 = S2/Ax2 = (4/25): 2 = 4/50 и строим второй "столбик", - его высота получается в 4 раза больше высоты первого.

Аналогично рассчитываем высоты остальных трёх "столбиков" (они, соответственно, в 10 и в 5 раз больше первого) и строим их. В результате получаем гистограмму (рис. 1). •

Определение 4. Гистограммой называется графическое представление группированного статистического ряда (интервального) в виде системы прямоугольников, построенных на промежутках Ах,, как на основаниях. Площадь каждого прямоугольника Si равна относительной частоте появления значений св. в промежутке Ах, т. е. Si = /, /к, а его высота равна hi = /, /(к • Ах,).

Свойство гистограммы, простое и важное: сумма площадей всех " столбиков " равна единице. Доказательство почти очевидно, ведь, сумма всех относительных частот должна быть равна единице:

Графическое, наглядное представление информации очень удобно. Взгляните ещё раз на рис. 1,-вы видите распределение относительных частот (площадей) и сразу оцениваете, что правые площади больше левых, а значит, правые значения св. возникают в эксперименте чаще левых. Следовательно, математическое ожидание данной св. должно лежать немного правее середины основного промежутка, правее точки х0 =41. "Немного", - т. к. правые площади немного больше левых, и можно предположить, что М{х) « 41,4; 41,5.

Полигон - другая форма графического представления статистических рядов, - не интервальных, а дискретных. Это - ломаная, соединяющая точки с координатами (х,, /?*), где х, - значения св., взятые из первой строки статистического ряда, а р* - относительные частоты появления этих значений, взятые из второй строки.

На рис. 2 построен полигон для ряда, заданного таблицей 7. Распределение частот показывается здесь ординатами р* вершин ломаной, а не площадями, как у гистограммы. Поэтому в данном примере полигон в 2 раза

Рис. 2

"выше" гистограммы. О характере изменения относительных частот можно судить по наклону отрезков ломаной.

Если полигон построен не для группированного (дискретного) статистического ряда, а для статистического ряда некоторой дискретной св., то его называют также многоугольником распределения относительных частот (частостей). Он является статистическим аналогом многоугольника распределения вероятностей с.в. (лек. 5, п. 1,5). В качестве примера можете сами построить такой многоугольник для ряда, заданного таблицей 3.

Контроль 3. Постройте гистограмму и полигон для статистических рядов (интервального и дискретного), рассчитанных в контроле 2.

4. Статистическое среднее

Итак, вы познакомились с методами первичной обработки статистического материала. Результат обработки - статистический ряд (таблица 3) и группированный статистический ряд (таблица 7).

Следующая задача математической статистики: с помощью статистического ряда найти приближённые значения М* и В* математического ожидания M и дисперсии D данной с.в. X. Сделав это, мы получим сжатую, обобщённую информацию о существенных особенностях изучаемой с.в. А именно, число М* укажет нам область (около М*), в которой будут часто*) появляться значения св., а число £>* оценит степень разбросанности появляющихся значений. С помощью этих чисел удобно сравнивать различные св., например, сравнивать качество работы (п. 8, упр. 7).

Пример. Попробуем найти приближённое значение M* ~ M для с.в. X примера 1.

Имеем статистический ряд (таблица 3), который можно рассматривать, как приближение ряда распределения (таблица 1). Точное значение M получается из ряда распределения по формуле M = Y.xiPi • Приближённое значение М* естественно получается из статистического ряда по аналогичной формуле M* =Y,xiPÎ =zx/(//a)- При достаточно большом числе опытов k относительные частоты будут близки к соответствующим вероятностям, т. е. р* = (/, /к) « р,:, и следует ожидать, что M* ~ M.

Проведём вычисления с помощью таблицы 3:

Итак, M ~ М* =41,28. Это согласуется с нашим предположением (М должно быть чуть больше 41, - см. п. 1 и п. 3), сделанным при взгляде на статистический ряд (таблица 3) и гистограмму (рис. 1). •

*) Не забудьте, что данное истолкование числа m относительно и не всегда оправдано (лек. 5, п. 6).

Замечание. Заметьте, - мы, в сущности, вычисляли среднее арифметическое появившихся в эксперименте значений св. по формуле

Здесь m - число различных появившихся значений х,, х2,...,хт, а к -число всех появившихся значений х(1),х(2),...,х(/г), равное числу опытов (эти значения мы условились в п. 1 обозначать с верхними индексами).

А теперь сформулируем теорему, на которую мы опирались выше, решая задачу приближённого отыскания математического ожидания.

Теорема. Пусть с некоторым опытом связана дискретная св. X. Пусть опыт повторен к раз и в результате этого эксперимента появились значения x(1),x(2),...,xw. Вычислено среднее арифметическое всех появившихся значений:

(1)

Если число опытов к достаточно велико, то среднее арифметическое близко к математическому ожиданию св. X, т. е.

Обоснование проведём для дискретной св. X с конечным числом возможных значений х,,х2,...,х/?. Ряд распределения такой св. задаётся следующей таблицей (эта таблица уже появлялась в начале лекции и была обозначена номером 1):

Таблица 1

Статистический ряд имеет вид таблицы 4, в которой число m различных появившихся в эксперименте значений св. X может не совпадать с числом п всех возможных значений. Но если число опытов к достаточно велико, то можно считать, что т = п и статистический ряд принимает вид:

Таблица 8

Здесь, как и раньше, через /, обозначено число повторений в эксперименте первого возможного значения х,, через /2 - число повторений второго значения х2, и т. д.

Среднее арифметическое, вычисленное по формуле (1), можно преобразовать так:

Множители /. /к - суть относительные частоты появления в эксперименте соответствующих значений xt. Согласно закону устойчивости частот (лек. 1, п. 2), они близки к вероятностям, т. е. р* = (/,./&) « pj = р[х = xj (ведь, число опытов к достаточно велико). Но тогда и их конечные суммы близки

(если число опытов к много больше числа слагаемых п). •

Статистический смысл математического ожидания.

В предыдущей лекции (лек. 5, п. 6) было сказано, что смысл м.о. м(х) состоит в том, что оно часто (но не всегда!) указывает ориентировочную область, где находятся более вероятные значения св. X. Там же было сказано, что более точно это утверждение будет сформулировано в следующей, т. е. в данной лекции. Эту формулировку и содержит установленная выше теорема.

Статистический смысл математического ожидания: приблизительно среднее арифметическое (формула (1)) значений св., появившихся при многократном повторении опыта.

В отличие от предыдущего, можно сказать, "частного" утверждения, последнее относится ко всем случайным величинам без исключения.

Дополнение. Вы, наверное, обратили внимание на то, что и в формулировке теоремы и в её обосновании используется обыденный термин "близка" (что это значит?) и часто звучит фраза "число опытов к достаточно велико". Фраза эта хотя и понятная, но, надо признать, "достаточно" неопределённая. Ведь, можно представить, что для справедливости теоремы число опытов оказывается настолько громадным, что теорема теряет практический смысл. Сразу скажем, что такой ситуации на практике не наблюдается. Более того, приближённое равенство (2) практически хорошо выполняется уже при нескольких десятках опытов. Однако, математическая теорема должна формулироваться точно и доказываться строго. Такая формулировка и такое доказательство есть. Это - знаменитая теорема Чебышева [3, 10.1, с 405-407], которую называют "законом больших чисел". Теорема эта справедлива не только для дискретных, а и для непрерывных св. Её строгая формулировка использует понятие сходимости по вероятности (лек. 1, п. 2): с ростом числа опытов к последовательность статистических средних м\ сходится по вероятности к математическому ожиданию M, т. е.

Определение 5. Статистическим, или выборочным средним случайной величины X называется число М*, которое определяется по результатам эксперимента (к опытов) над св. X, как сред-

нее арифметическое появившихся в этом эксперименте значений х(1),х(2),...,х(/г), т. е. по формуле (1).

Примечание. Формула (1) используется в случае, когда статистический материал не обработан и представлен в виде простой статистической совокупности. Если он представлен в виде статистического ряда частот (таблица 4а), то удобнее применять формулу (Г):

(1')

Если имеется статистический ряд относительных частот (таблица 46), то действует формула (1"):

(1'')

Контроль 4. В условиях контрольного упражнения 1 найдите статистическое среднее. Согласуется ли оно с его оценкой (41,4 - 41,5), которую вы сделали раньше (п. 3) по гистограмме? Каково расхождение?

5. Статистическая дисперсия

Пример. Имеем статистический ряд с.в. X (таблица 3) и приближённое значение математического ожидания M ~ M* ~ 41,28, найденное выше. Точное значение дисперсии определяется из ряда распределения (таблица 1) формулой D = -M)2 • ptПриближённое значение определится из статистического ряда аналогичной формулой D* = 5дх, - М) • р*.

Проведём по этой формуле вычисления, используя таблицу 3. Вычисления кажутся громоздкими, однако, советую вам проследить за каждым шагом, оценивая его правильность. Вы увидите, что это вполне по силам и требует только внимания и помощи калькулятора.

Формулы. Формула, по которой мы только что считали D*, может быть преобразована так:

Напомню, что здесь хп /' = 1,2,..., л - возможные значения с.в. X, взятые из её ряда распределения, х(/), / = 1,2,...Д - значения, появившиеся в эксперименте (они записаны в статистическом ряде), //5 / = 1,2,...Д - число появлений каждого возможного значения х, в этом эксперименте.

Получается, что £>* вычисляется тоже, как среднее арифметическое, только не значений х(/) (как М*, а квадратов разностей (х(/)-М*. Разности эти называются отклонениями х(/) от М*.

Определение 5. Статистической (выборочной) дисперсией случайной величины X называется число £>*, которое определяется по результатам серии из k опытов над с.в. X, как среднее арифметическое квадратов отклонений появившихся значений х(/) от статистического среднего М*, т. е. по формуле

(2)

Эта формула может быть кратко записана так:

(2')

Другой вид той же формулы, более удобный для вычислений в случае, когда статистический материал представлен в виде статистического ряда:

(2'')

Сходимость. Статистическая дисперсия D*, вычисленная по формулам (2') или (2"), даёт практически хорошее приближение к истинной дисперсии D уже при нескольких десятках опытов и позволяет делать достаточно верные прогнозы. С ростом числа опытов k она неограниченно приближается к £>, точнее, - сходится по вероятности к D. Этот факт можно доказать, но не здесь.

Определение 6. Статистическим или выборочным средним квадратическим отклонением называется число сг*, которое вычисляется как квадратный корень из выборочной дисперсии:

(3)

Ясно, что бг* является оценкой среднего квадратического отклонения а с.в. X и сг* « о.

Контроль 5. В условиях контроля 1 найдите статистическую дисперсию D* двумя путями, - используя формулы (2) и (2").

6. Другие оценки M и D

Приближённые значения числовых характеристик с.в. называют их оценками. Число M* 9 определяемое формулами (1) - (Г), есть оценка математического ожидания M. Число d*, определяемое формулами (2) и (2"), есть оценка дисперсии d. Эти оценки не единственные.

Другая оценка M. Оценка М* получается применением формулы M* =Y,xiPÎ =Z*/('/a) к статистическому ряду (таблицы 4а, 46). Если применить ту же формулу к группированному статистическому ряду (дискретному), то получим другое приближённое значение M* ~ M. Условимся называть М* группированным статистическим средним.

Вычислим М* для ряда, представленного таблицей 7:

Сравним М* =41,28 и М* =41,72, - расхождение значительное, почти 0,5. Оно вызвано искажением св., которое мы допустили при группировке, заменяя истинные значения серединами промежутков. Можно сказать, что оценка М* "хуже", чем оценка М*. Однако, её легче считать, т. к. группировка уменьшает число слагаемых.

Если с.в. имеет много различных значений, то при увеличении числа опытов k разница между М* и М* должна сглаживаться (это вы заметите, выполняя упражнения). Следовательно, в этих случаях выгоднее пользоваться оценкой М*, как легче вычисляемой. Возникает проблема сравнения оценок, её мы коснёмся в следующем разделе лекции.

Другая оценка d. Оценка d*, вычисленная по формуле (2), обладает небольшим дефектом, - она часто занижает дисперсию. Как было отмечено выше, с ростом числа опытов k она всё же неограниченно приближается к истинной дисперсии d. Но, пользуясь этой оценкой, вы будете совершать систематическую ошибку в меньшую сторону.

Несложный теоретический анализ (у нас нет средств его провести) позволяет легко исправить дело. Оказывается, достаточно ввести поправку, умножив £>* на множитель, чуть больший единицы, а именно, на (k/k-i), и, тем самым, чуть увеличить D*. Таким образом, получается вторая оценка дисперсии:

(3)

будем называть её исправленной статистической дисперсией. С учётом формулы (2), формула (3) принимает вид:

(3')

Применим формулу (3) к примеру предыдущего раздела. Статистическая дисперсия в этом примере была D* =4,5216. Число опытов £ = 25, значит, множитель (к/к -1) = (25/24). Исправленная дисперсия: £>** = (25/24)-4,5216 = 4,71. Исправление существенное, - почти на две десятых.

При большом числе опытов к поправочный множитель (k/k-l) становится мало отличимым от единицы и его применение теряет смысл (в этом вы убедитесь, выполняя упражнение 9 из п. 8).

Добавление. Группированная статистическая дисперсия D* вычисляется из группированного ряда по формулам (2), где за берутся середины интервалов группировки Зс(/), а за к - число интервалов.

Общее понятие "оценки". Кроме M и D есть другие числовые характеристики, обобщённо отражающие иные особенности распределения вероятностей св. (например, степень асимметрии ряда распределения). Их называют моментами. Подробнее о них мы будем говорить в связи с изучением непрерывных св. (лек. 10). Для них строятся свои оценки, свои приближённые формулы, сходные по структуре с (1) и (2).

Определение 6. Оценкой некоторой числовой характеристики ju случайной величины X (дискретной или непрерывной) называется приближённое значение //* этой характеристики, вычисляемое по определённому правилу или формуле, исходя из значений х{]\х{2\...,х{к\ появившихся в результате эксперимента над св. X. Оценкой называют также саму формулу, по которой она считается.

Добавление. Термин "оценка" применяется не только к числовым характеристикам св. Его можно применить к любому параметру а, связанному с классом св., если параметр этот вычисляется приближённо по результатам эксперимента над св. В дальнейшем мы будем подробно изучать некоторые классы св. и вы узнаете, что такое параметры св. Впрочем, в предыдущей лекции (лек. 5, п. 9) уже рассматривался класс геометрических распределений (число опытов до первого "успеха"), параметром которого было число р - вероятность "успеха". Оценка этого параметра есть относительная частота /?* появления "успеха" в к опытах, она рассчитывается по формуле p*=l/k9 где / - число "успехов".

Контроль 6. В условиях контрольного упражнения 3 найдите оценки М* и £>**. Сравните их с оценками М* и D*, которые вы нашли, выполняя контрольные упражнения 4 и 5. Большие ли расхождения? Чем вызваны расхождения?

7. Сравнение оценок. Точность и надёжность оценки

Как сравнивать оценки? Каков точный смысл фразы: "оценка М* "хуже", чем оценка М*"? Как проверить справедливость этого утверждения?

Для ответа на эти вопросы нужно отчётливо представлять вероятностный характер любой оценки. Возьмём, к примеру, оценку М*, определяемую формулой (1). Эта формула применяется после проведения эксперимента (серии опытов) над св. и даёт некоторое значение М*. После проведения другой серии опытов она даст другое значение М*. Если провести много (к) экспериментов, то получим множество оценок М*, М*,..., M *. В каждом из этих экспериментов можно посчитать и вторую оценку М*, получим другое множество M*, М*, М*. В каждой из этих двух групп будут оценки, как близкие к истинному значению M, так и далёкие. И теперь смысл фразы "оценка М* хуже, чем М*" можно разъяснить так: в первой группе будет больше близких к M оценок, чем во второй. Но что значит "близких"? Это мы сейчас и уточним.

Задача. Имеется св. X и известно точное значение некоторой её числовой характеристики // (можете представить, что /л = М). Имеется формула (или правило), по которой можно вычислять приближённые значения //*. Задана необходимая степень точности оценки малым числом £>0: если \ju*-ju\<e, значение оценки считается "хорошим", в противном случае - "плохим". Спрашивается: с какой вероятностью (надёжностью) формула будет давать "хорошие" оценки?

Решение. Проведём серию из нескольких десятков опытов над св. и вычислим оценку ju*. Проведём другую серию опытов и вычислим вторую оценку //2* (для определённости будем предполагать, что число опытов в каждой серии одно и то же). Продолжая так и далее, получим последовательность оценок //*, //2*, ju* (число экспериментов обозначено через к).

Отберём из полученной последовательности "хорошие" оценки, пусть их число /. Значит, относительная частота появления "хорошей" оценки в серии из к экспериментов над св. будет р* - Цк. Если число экспериментов к достаточно велико, то статистическая вероятность р* решает задачу.•

Замечание 1. Решение задачи предполагало знание истинного значения //. На практике это бывает редко. Вообще, за // можно принять среднее арифметическое найденных оценок, т. е. ju~{l/k)-\ju* +ju* +...+//*). Так определённое // есть результат очень большого числа опытов (к экспериментов, в каждом по нескольку десятков опытов), поэтому оно будет очень близко к истинному значению (в вероятностном смысле, конечно).

Замечание 2. Проведённое решение требует очень большого числа опытов, и в этом его практическое неудобство. Существуют другие, универсальные методы решения данной задачи, они основаны на теории непрерывных с.в. В лекции 12 (п. 5, 6) вы познакомитесь с формулами, которые позволяют рассчитывать вероятности "хороших" оценок математического ожидания M и дисперсии D по результатам только одного эксперимента из 20-30 опытов.

Итак, наше решение не имеет большой практической ценности. Но оно имеет психологическую ценность. Вы, наверное, почувствовали вероятностную специфику ответа на вопрос о точности оценки. После этого легче будет усвоить два новых, не простых и фундаментальных понятия математической статистики - доверительный интервал и доверительную вероятность.

Прежде, чем формулировать определение, полезно вспомнить геометрический смысл неравенства //*-//<£. Модуль разности двух чисел - это расстояние между точками числовой прямой, изображающими эти числа. Следовательно, наше неравенство означает, что точки ju* и // отстоят друг от друга на расстоянии, меньшем, чем е. Но тогда ясно, что /je (ju* - s; ju* +€) (рис. 3). В этом случае говорят, что ju покрывается интервалом (//*-£; JU*+£).

Не геометрическое, формальное рассуждение таково:

Определение 6. Пусть X - случайная величина и //* -оценка некоторой её числовой характеристики или параметра // (точное значение//, как правило, не известно). Пусть задано число s > 0, определяющее требуемую степень точности оценки //*. Интервал (ju*-е; /J* +е) называется доверительным интервалом для ju, ес-

Рис. 3

ли можно установить, что истинное значение // покрывается этим интервалом с вероятностью р€, т. е.

Вероятность р€ называется доверительной вероятностью, или надёжностью оценки.

Замечание 2. Термин "надёжность оценки" хорошо отражает её вероятностный смысл (чем чаще она даёт хорошие результаты, тем она надёжнее). Однако, надо знать, что в науке термин "надёжность" используется и в другом смысле, - как "надёжность системы", или устройства. Это - сложное свойство системы, которое, в зависимости от её назначения и условий применения, состоит в сочетании свойств безотказности, долговечности, ремонтопригодности и сохраняемости. Выработка характеристик надёжности сложных систем составляет одну из основных задач специальной вероятностной дисциплины - теории надёжности. Итак, "надёжность системы" - это одно, "надёжность оценки" - совсем другое.

В данном определении тесно связаны два понятия - доверительный интервал и доверительная вероятность, одно без другого не имеет смысла. Они зависят друг от друга: если увеличивать доверительный интервал (увеличивать s), то есть ослаблять степень точности оценки, то доверительная вероятность ре будет или возрастать, или оставаться прежней (объясните, почему?).

Вернёмся к вопросу, с которого начали: каков точный смысл фразы: "оценка М* "хуже", чем оценка М*? Теперь мы понимаем, что сравнивать оценки можно, лишь предварительно уточнив требуемую степень точности s. И наш вопрос, следовательно, должен звучать чуть иначе: как понимать фразу - "при заданной точности s оценка М* "хуже", чем оценка М*"?

Ответ: если задать доверительный интервал (м* - s; M* +е), а также интервал (м* -е\ М* +е\ то доверительная вероятность для первого интервала будет больше, чем для второго. Это и означает, что оценка М* чаще даёт близкие к M результаты, чем М*.

Добавление. Проведённое выше сравнение оценок М* и м* было сделано по критерию их "близости" к истинному значению м. Существуют другие критерии. Так, выше мы сравнивали оценки D* и D** по критерию "несмещённости" (первая - смещённая, вторая несмещённая). В науке есть теория сравнения оценок по критериям "состоятельности", "эффективности" и "несмещённости", с началом которой можно познакомиться в книге [3, гл. 11.7]. Оценка, лучшая по одному критерию, может оказаться худшей по другому. Так что понятия "лучше-худше" относительные, поэтому эти термины взяты в кавычки. На практике следует выбирать вид оценки с учётом удобства вычислительной процедуры её получения. С этой точки зрения бывает выгоднее пользоваться "худшей" оценкой, как вы видели на примере оценки М**.

Контроль 7. С.в. X - число гербов при троекратном подбрасывании монеты. Что надо делать, чтобы найти оценку М*? Что надо де-

лать, чтобы найти приближённо доверительную вероятность для доверительного интервала ^М* -0,6; M* + 0,6^? Что произойдёт с доверительной вероятностью (и почему), если интервал изменится так (м* -0,4; М* +0,4)?

8. Упражнения

1. Изучается св. Y - число изделий, изготовленных за смену в цехе небольшого предприятия, работающего по заказам. В таблице 9 приведён статистический материал, собранный за 80 рабочих дней.

Таблица 9

1

2

3

4

5

6

7

8

1

136

122

132

128

123

133

130

131

2

134

149

138

127

119

137

133

130

3

143

134

128

131

118

133

131

132

4

118

128

122

130

139

145

122

130

5

128

136

132

136

124

117

139

132

6

141

144

138

127

150

144

133

133

7

134

125

140

135

129

138

138

147

8

150

126

135

136

150

135

138

140

9

122

142

127

127

132

145

140

133

10

127

142

144

125

132

145

137

132

Обработайте данный статистический материал и составьте: а) группированный статистический ряд (интервальный); б) группированный статистический ряд (дискретный). Постройте гистограмму и полигон. Найдите статистическое среднее М* и группированное среднее М*. Найдите статистическую дисперсию D* и исправленную дисперсию £>**.

Отв.: М* =133,6; М* =134; D* =57,6.

Указание.

2. Двое рабочих изготовили по 70 деталей, для которых поле допуска размеров 50,04 + 50,28мм. Распределения деталей по их размерам даны в таблице 10. Качество работы тем выше, чем меньше разброс размеров относительно середины поля допуска. Кто работает лучше?

Таблица 10

Размер в мм

50,02

50,06

50,10

50,14

50,16

50,18

50,22

50,26

50,28

50,30

Кол-во деталей данного размера

у 1-го рабочего

1

7

9

26

0

14

7

5

1

0

у 2-го рабочего

0

2

5

13

2

14

19

8

6

1

3. Опыт состоит в том, что монета подбрасывается трижды. Св. X -число появившихся гербов. Рассчитайте вероятности возможных значений

св. и составьте её ряд распределения. С помощью полученного ряда найдите точные значения математического ожидания M и дисперсии D. Каково максимальное отклонение значений св. X от M и каково среднее квадратическое отклонение? Покрывается ли M двухсигмовым интервалом? (Это упражнение является подготовительным к следующему, а также имеет цель повторить основные понятия предыдущей лекции).

4. Св. X - число гербов при троекратном подбрасывании монеты. Проведите эксперимент, состоящий из 20 -ти опытов (каждый опыт - это три подбрасывания монеты; всего, следовательно, у вас будет 60 подбрасываний), и зафиксируйте появившиеся значения св. в виде простой статистической совокупности. Проведите первичную обработку вашего статистического материала и составьте статистический ряд. Сравните его с рядом распределения св. X, который вы получили в предыдущем упражнении, - можно ли его считать приближённым рядом распределения? Вычислите статистическое среднее М*, статистическую дисперсию D* и исправленную дисперсию £>**, - близки ли они к точным значениям M и Dl За степень близости возьмите, например, s = 0,2.

5. Св. X та же, - число гербов при троекратном подбрасывании монеты. М* - оценка математического ожидания М, найденная в предыдущем упражнении по результатам 20 -ти опытов. Задана требуемая точность оценки числом е = 0,2. Найдите доверительную вероятность р£.

Указание. Действуйте, как при решении задачи из п. 7. Проведите 10 экспериментов над св. X (в каждом по 20 опытов) и подсчитайте частоту / попадания M в доверительный интервал (м* -0,2; М* +0,2) или, что тоже, частоту попадания М* в интервал (м - 0,2; M + 0,2), т. е. в интервал (1,3; 1,7). Затем вычислите относительную частоту р* =1\/\0, - это будет первое приближение к доверительной вероятности р£. Далее, добавьте к первой серии экспериментов ещё 10 экспериментов (в каждом по-прежнему по 20 опытов), тем самым, вы проделаете вторую серию из 20 -ти экспериментов. Рассчитайте так же второе приближение р\ = /2/20. Аналогично постройте третью серию из 30 -ти экспериментов и рассчитайте р* =/3/30. Так же найдите р\ и р*5. (В конце курса, в лекции 12 мы сможем решить эту задачу проще и точнее. Тогда и сравним ответы. Не забудьте!).

6. Следующее распределение частот было получено в результате эксперимента с разведением мышей:

Таблица 11

Число мышей в одном помёте

1

2

3

4

5

6

7

8

9

Частота

7

11

16

17

26

31

11

1

1

Найдите выборочное среднее, выборочную дисперсию и выборочное среднее квадратическое отклонение.

7. Из урожая молодой кукурузы, снятого с одного поля, произведена выборка, содержащая 800 початков. Длины початков измерены в дюймах с

точностью до половины дюйма (1 дюйм равен 2,54 см). Подсчитаны частоты длин и результат представлен в виде следующего статистического ряда частот (таблица 12):

Таблица 12

Длина початка

4,0

4,5

5,0

5,5

6,0

6,5

7,0

7,5

8,0

8,5

9,0

9,5

10,0

Частота

1

1

8

33

70

110

176

172

124

61

32

10

2

Найдите выборочное среднее М* и выборочное среднее квадратическое отклонение <т*. Какой процент початков попадает а) в односигмовый интервал (М* -<т*; М* +<т*); б) в двухсигмовый; в) в трёхсигмовый?

8. Из студентов факультета выбраны случайным образом 100 человек и измерен рост каждого. Полученный статистический материал обработан и представлен в виде следующего группированного ряда частот:

Таблица 13

Рост

154-158

158-162

162-166

166-170

170-174

174-178

178-182

Число студентов

10

14

26

28

12

8

2

Найдите оценки математического ожидания, дисперсии и среднего квадратического отклонения случайной величины R - роста молодого человека. Оцените процент студентов, рост которых попадает а) в двухсигмовый интервал; б) В ТрёхСИГМОВЫЙ. Отв.: А/* =166; D*= 33,44; <т*=5,78.

9. Автоматический станок шлифует валики. Из совокупности всех валиков, выпущенных за смену, выбраны случайным образом 200 валиков и измерены их диаметры (выборочный контроль качества). Результаты измерений в см. (выборка) приведены в таблице 11

Таблица 11

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

1

6,75

6,77

6,73

6,70

6,80

6,74

6,74

6,74

6,83

6,78

6,72

6,75

6,75

6,72

6,81

2

6,73

6,76

6,81

6,81

6,78

6,72

6,76

6,77

6,80

6,76

6,76

6,77

6,76

6,77

6,75

3

6,77

6,77

6,77

6,76

6,81

6,80

6,76

6,74

6,73

6,75

6,76

6,81

6,79

6,72

6,74

4

6,77

6,70

6,77

6,76

6,74

6,73

6,70

6,78

6,72

6,74

6,80

6,82

6,69

6,71

6,78

5

6,78

6,68

6,77

6,75

6,76

6,74

6,76

6,70

6,68

6,80

6,77

6,72

6,77

6,80

6,78

6

6,76

6,75

6,73

6,75

6,76

6,74

6,73

6,80

6,82

6,75

6,76

6,74

6,78

6,71

6,80

7

6,76

6,78

6,74

6,73

6,76

6,76

6,77

6,77

6,76

6,72

6,73

6,78

6,75

6,70

6,74

8

6,71

6,74

6,74

6,77

6,78

6,76

6,77

6,75

6,74

6,72

6,69

6,82

6,73

6,74

6,75

9

6,72

6,77

6,76

6,70

6,76

6,74

6,80

6,76

6,80

6,78

6,76

6,73

6,73

6,70

6,76

10

6,77

6,82

6,74

6,75

6,75

6,74

6,82

6,74

6,80

6,74

6,69

6,76

6,76

6,80

6,76

11

6,77

6,76

6,75

6,77

6,70

6,74

6,70

6,76

6,80

6,77

6,76

6,74

6,70

6,74

6,81

12

6,78

6,77

6,77

6,74

6,77

6,74

6,71

6,75

6,73

6,74

6,74

6,77

6,71

6,73

6,77

13

6,77

6,70

6,78

6,78

6,74

6,72

6,77

6,70

6,71

6,74

6,73

6,77

6,77

6,76

6,75

14

6,76

6,75

6,76

6,76

6,72

С помощью калькулятора вычислите по формуле (1) выборочное среднее М*. Проведите группировку (см. п. 2) и постройте группированный статистический ряд (интервальный). Перейдите к дискретному ряду и вычислите группированное среднее М* (п. 6). Какое получилось различие между двумя оценками М* и М*? Сравните с аналогичным различием в упражнении 1 и вы убедитесь, что, в отличие от упражнения 1 (к = 80), при большом числе опытов (Л = 200) различие становится пренебрежимо малым.

Используя дискретный группированный ряд, вычислите группированную дисперсию £>* и исправленную группированную дисперсию £>** (формула (3)). Сравните их с выборочной дисперсией £>*, вычисленной по формуле (2), - какова разница с соответствующим результатом упражнения 1? Постройте гистограмму и полигон. Отв.: М* = 6,754; М* -6,7578; D* -0,001.

Указание. В процессе группировки округляйте вычисления до второго десятичного знака, - например, Ах = 0,02 (формула (St), где lg2«0,301), (дх/2) = 0,01. В результате группировки у вас должны получиться 9 промежутков (первый -Ах] = [б,67; 6,69), последний - Дх9 = [б,83; 6,85]) и следующие частоты: 2, 15, 17, 44, 52, 44, 14, 11, 1 (их сумма 200). Обратите внимание, - правые концы промежутков открыты (круглая скобка), значит, эти концы входят в следующий промежуток. Например, значение 6,79, лежащее на границе 6-го и 7-го промежутков, следует считать принадлежащим Ах7.

ЛЕКЦИЯ 7

БИНОМИАЛЬНЫЕ С. В.

Наша следующая теоретическая задача: выделить несколько обобщённых типов св., часто встречающихся на практике, и изучить их свойства. После этого, при встрече с любой конкретной св. изученного типа, мы сможем пользоваться готовыми результатами абстрактного анализа (формулами, выводами). Таков общенаучный путь познания реальности.

Цели занятия: понять, как возникают св. биномиального типа; установить общие закономерности в распределении их вероятностей; получить формулы для вычисления математического ожидания и дисперсии, минуя ряд распределения. Последняя задача потребует некоторого развития теории (сложение св., их независимость).

1. Пример полезности теории

Пример 1. Автоматический станок штампует детали, при этом на каждые 100 деталей приходится, в среднем, 6 бракованных. Из большой партии деталей (скажем, несколько сотен), выпущенных станком за смену, выбираются случайным образом 30 деталей для проверки (так называемый выборочный контроль качества). Сколько бракованных деталей можно ожидать в этой выборке?

Анализ. Вопрос задачи приводит нас к случайной величине X -числу бракованных деталей в данной выборке. Её возможные значения: 0, 1, 2, 3, 30. Ответ, очевидно, должен иметь вероятностный характер: надо указать не одно значение, а некоторый промежуток наиболее вероятных значений св. Желательно, также, оценить вероятность появления значений из этого промежутка..

Мы могли бы решить нашу задачу, если бы знали ряд распределения св. X, т. е. знали вероятности р/ каждого значения / = 0,1,2,...,30. Но эти вероятности можно рассчитать с помощью формулы Бернулли Pl = v(wt) = С[ • р1 • (1 -p)k~l (лек. 4, п. 2, {б)). Убедимся в этом.

Действительно, вспомните: формула (6) применима тогда, когда имеется "сложный" опыт (эксперимент), состоящий в повторении "простого" опыта к раз. Наша св. X связана с подобным экспериментом -повторением "простого" опыта (выбор одной детали) £ = 30 раз. Второе

условие применимости формулы (6) - независимость опытов. Это значит, что вероятность выбора бракованной детали не должна меняться от опыта к опыту. В нашем примере эта вероятность, строго говоря, меняется, ибо каждый следующий выбор происходит из меньшего на единицу числа деталей. Однако, изменение незначительное, поскольку выбор делается из большой, сравнительно с выборкой, партии деталей*) (подчёркнуто в условии примера 1). Пожалуй, можно пренебречь малой ошибкой и считать, что при выборе каждой из 30-ти деталей вероятность появления бракованной детали одна и та же р = 0,06.Таким образом, мы моделируем с.в. X чуть иной, "близкой" к ней св., вероятности значений которой определяются формулой (6).

Первое решение. Вводим с.в. X - число бракованных деталей в данной выборке, и рассчитываем вероятности р, её значений / = 0,1,2,..., 30 приближённо по формуле Бернулли (для вычислений придётся использовать калькулятор):

Далее вычислять не будем, ибо ясно, что вероятности становятся очень маленькими. Запишем получившийся ряд распределения с.в. X:

Таблица 1

X

0

1

2

3

4

5

6

30

р

0,1563

0,2992

0,2769

0,1650

0,0710

0,0236

0,0056

0,0000

Прогнозы. Из таблицы 1 видно, что наиболее вероятное число бракованных деталей в выборке - одна. Чуть реже будут появляться две бракованных детали. Одна или две детали появятся с вероятностью Р(Хе [l; 2]) = 0,2992 + 0,2769 = 0,5761, т. е. примерно в шести случаях из десяти.

Из таблицы также видно, что начиная с 6-го значения, вероятности резко убывают. Поскольку Р(Хе [4;5]) = 0,0710 + 0,0236 = 0,0946, то примерно в одном случае из десяти число бракованных деталей будет или 4, или 5.

*) Надо иметь в виду, что большое количество "незначительных" изменений может дать значительное изменение. В нашем случае общее число таких малых изменений вероятностей 29. Но число деталей, из которых производится выборка, много больше - несколько сотен. Поэтому 30-я вероятность р30, вычисленная по формуле Бернулли, будет так же мало отличаться от истинной, как и вторая р2.

Ответом на вопрос задачи можно считать промежуток [0; 3], ибо вероятность появления значений св. X из этого промежутка близка к единице: Р(Х е [о, З]) = ОД563 + 0,2992 + 0,2769 + 0,1650 = 0,8964. Следовательно, примерно в девяти выборках из десяти число брака не превысит 3.

Поставим вопрос задачи более определённо: сколько бракованных деталей можно ожидать в этой выборке с вероятностью 0,99? Вычисляем:

Ответ: число бракованных деталей практически всегда будет не более пяти. Лишь в одном случае из ста число таких деталей может выйти за пределы промежутка [0; 5]. •

Проведённое выше решение оказалось осуществимым только благодаря современной мощной вычислительной технике. Каких-нибудь три десятка лет назад оно было бы для нас практически невозможным.

Существует другое решение, гораздо более краткое, но менее определённое относительно вероятностей. Решение это основано на использовании не ряда распределения св., а его числовых характеристик M, D и а. Эти характеристики определяются, вообще говоря, рядом распределения по соответствующим формулам (лек. 5, п. 6, (2), п. 7, (3), п. 8, (5)). Однако, для того типа св, к которому относится наша св. (точнее, та св., которой мы моделируем св. X), в теории найдены формулы, позволяющие быстро вычислять M и £>, минуя ряд распределения. Вот эти спасительные формулы (далее в лекции мы их выведем):

М = к-р, D = kp{l-p). (1)

Второе решение. Вычисляем математическое ожидание, дисперсию и среднее квадратическое отклонение:

Вспомним смысл числа M (лек. 6, п. 6): оно условно указывает область (около M), в которой следует часто ожидать появления значений св.. Дисперсия оценивает степень разброса значений около M (лек. 5, п. 7). В нашем случае дисперсия мала, значит с большой вероятностью можно предполагать, что часто будут появляться значения 1, 2, 3.

Используя правило трёх сигм (лек. 5, п. 8), легко оценить промежуток практически возможных значений св.- это значения, попадающие в интервал (М-За; М + За). В нашем случае За « 3-1,3 = 3,9 и трёхсигмовый интервал получается таким: (1,8-3,9; 1,8 + 3,9) = (-2,1; 5,7). В этот интервал попадают 6 значений св.: 0,1, 2, 3, 4, 5.

Итак, второе решение даёт следующий ответ на вопрос задачи. В данной выборке следует ожидать 1, 2 или 3 бракованных изделия. И можно практически гарантировать, что их число не превысит 5. •

Замечание 1. Поскольку б.с.в. не имеет отрицательных значений, трёхсигмовый интервал разумно сузить до [0; 5,7). Это замечание относится ко всем неотрицательным св. - биномиальным, Пуассоновским (лек. 8), показательным (лек. 11, п. 8) и др.

Сравнение решений. Первое решение даёт более информативный ответ, нежели второе. Оно позволяет узнать любые вероятности. Но второе проще и короче. И по сути даёт тот же ответ, что и первое. Чуть дальше (п. 4) вы узнаете, что по результатам второго решения тоже можно оценить вероятности. Второе решение иллюстрирует практическую ценность числовых характеристик св., о чём говорилось раньше (лек. 5, п. 6).

Контроль 1. Какое количество бракованных деталей можно ожидать в выборке из 10 деталей? Каков промежуток, за пределы которого не выйдет число бракованных деталей с вероятностью 0,99?

Отв.: р0 = 0,53; = 0,34; р2 =0,098; p3=0fi\7.

2. Условия возникновения биномиальных с.в. (б.с.в.)

В условиях примера 1 можно было бы изменять выборку (увеличивать или уменьшать число выбранных деталей к) или менять вероятность брака р, - мы имели бы другие св. Таким образом получаются разнообразные однотипные св. Вероятности их значений достаточно точно рассчитываются формулой (6) - формулой Бернулли. В практических задачах часто возникают подобные св.. Все они объединяются в класс биномиальных св.

Определение 1. Имеется эксперимент, который состоит в повторении некоторого опыта к раз. Каждый раз при повторении опыта может появиться или не появиться событие а ("успех"). Вероятность "успеха" Р(а) - р не меняется от опыта к опыту. Случайная величина хб - число "успехов" в эксперименте - называется биномиальной (сокращённо - б.с.в.), или Бернуллиевской. Числа к и р называются параметрами б.с.в.

Абстрактный ряд распределения б.с.в. хб. выглядит так (для краткости обозначено 1 - р = q):

Таблица 2

При к = 30 и р = 0,06 ( q = 1 - 0,06 = 0,94) из таблицы 2 после вычислений получается таблица 1 - ряд распределения с.в. X примера 1.

Примечание. Термин "биномиальная" происходит от формулы бинома Ньютона:

Если в этой формуле положить a = q и Ъ = 1 - q = р, то слагаемые превратятся в вероятности из нижней строки таблицы 2. Сумма этих вероятностей равна единице, ибо (a + b)k =(p + q)k =\. Следовательно, основное свойство ряда распределения (лек. 5, п. 5, (1)) выполняется.

Пример 2. Орудие попадает в мишень, в среднем, 3 раза из 10. Каково будет распределение числа попаданий при 5-ти выстрелах? Какие прогнозы можно сделать, исходя из этого распределения?

Решение. Перед нами с.в. Y - число попаданий. Проверим выполнение трёх условий определения 1.

Читаем определение и сопоставляем его с нашим примером. С.в. Y связана с экспериментом, состоящим в повторении опыта (одного выстрела) 5 раз, - значит, £ = 5. Каждый раз может появиться или нет событие А (попадание в мишень). Вероятность попадания постоянна и равна р = 0,3. С.в. Y - число попаданий, т. е. число "успехов". Условия выполнены, с.в. Y - биномиальная.

Наша с.в. имеет 6 значений: 0, 1, 2, 5. Рассчитаем их вероятности по формуле (5), или, что то же, по формулам из нижней строки таблицы 2, полагая в них к = 5, q = 0,7, р = 0,3. Расчёт не трудный, ибо число опытов к невелико:

Составляем ряд распределения:

Таблица 3

Y

0

1

2

3

4

5

I

Р

0,16807

0,36015

0,3087

0,1323

0,02835

0,00243

1,00000

Представим этот ряд наглядно в виде многоугольника распределения (рис. 1).

Прогнозы. Из рис. 1 сразу видно, что следует ожидать 1-2 попадания из пяти. Ожидать более 3-х попаданий маловероятно.

Таблица 3 содержит более определённую информацию:

Следовательно, если провести много серий из пяти выстрелов, то примерно в 70% серий будет одно-два попадания. Поскольку рА +р5 =0,02835 + 0,00243 = 0,03078, то более трёх попаданий в 100 сериях может быть раза три. Ни одного попадания - раз 17! Многовато. •

Замечание 2. К тем же выводам мы могли прийти быстрее, используя формулы (1): M = hp = 5 • 0,3 = 1,5 и D = hpq = 1,5 • 0,7 = 1,05. Сделайте это сами.

Контроль 2. Опыт состоит в том, что подбрасываются три однородные игральные кости. С.в. Х] - сумма выпавших очков, с.в. Х2 -число костей с чётными очками. Какая из этих с.в. биномиальная? Обоснуйте. Составьте её ряд распределения, постройте многоугольник распределения и сделайте прогнозы.

3. Как распределение б.с.в. зависит от её параметров?

Посмотрите на рис. 1: он наглядно показывает распределение вероятностей с.в. Y - числа попаданий при пяти выстрелах. С.в. Y биномиальная с параметрами к = 5 и р = 0,3. Распределение имеет вид несимметричной "горки", вершина которой находится почти над математическим ожиданием M = 1,5. Интересно, характерна ли подобная "горка" для любой б.с.в.?

Давайте проследим, как изменяется распределение б.с.в. при изменении параметров к и р. Вначале станем изменять один параметр р, оставляя неизменным к. Потом - наоборот.

Зависимость от р. На рис. 2 показаны многоугольники распределения при фиксированном £ = 5 и меняющемся р = ОД; 0,3; 0,5. Вы видите, что при малом р "горка" превращается в "обрыв". При возрастании р "горка" сдвигается вправо и уменьшает высоту, при р = 0,5 становится симметричной.

Если продолжить увеличение р от 0,5 до 1, то картинка симметрично отразится относительно прямой, проходящей через

Рис. 1

Рис. 2

"середину" значений св., т. е. через точку с = 2,5. Вершина "горки" продолжит движение вправо и станет набирать высоту, превращаясь в "обрыв" при значениях р, близких к 1.

Симметричное отражение рис. 2 происходит в силу своеобразной "симметричности" формулы Бернулли. К примеру, при р = 0,3 наибольшее значение вероятности рх (вершина "горки") находится в точке хх =1: рх =5 0,3 0,74 ^0,36 (рис. 2). Если же р = 0,7, то наибольшее значение остаётся тем же - р4 = 5 • 0,74 • 0,3, но сдвигается в точку хА = 4. Так же меняются местами и остальные значения - р0 с р5 и р2 с /?3 (объясните это сами).

Нетрудно согласиться, что если зафиксировать любое другое значение к и менять /? от малых значений к р = 0,5 и далее к значениям, близким единице, то характер изменения "горки" будет тот же: она сдвигается вправо, уменьшая высоту, при р = 0,5 становится симметричной, потом набирает высоту, превращаясь в "обрыв".

Зависимость от к. Зафиксируем теперь вероятность р и станем увеличивать число опытов к. При этом будет расти математическое ожидание M = к - р и, следовательно, вершина "горки" двинется вправо. Станет расти и дисперсия D = k-p-q, т. е. значения св. будут широко "разбрасываться" около M. Вероятности распределятся среди большего числа значений и, значит, вершина "горки" понизится, а сама "горка" станет более пологой, плосковершинной. На рис. 3 показана эта динамика при фиксированном р = 0,3 и меняющемся к = 5; 10; 15; 30.

Заметьте, - "горка" никогда не станет симметричной, левая её "половина" всегда будет чуть-чуть-чуть выше правой. В этом можно убедиться, если посчитать (разумеется, с помощью хорошего калькулятора) вероятности значений св., близких к M. К примеру, при к = 30 ближайшие к M = к • р = 30 • 0,3 = 9 значения св. - это х8 = 8 и х10 = 10 ; их вероятности: Ps = С380 • 0,38 • 0,722 - 0,1501 и р10 = С\°0 • 0,310 • 0,720 - 0,1416 ; высота же "горки" - р9 « 0,1573 (рис. 3). Аналогично р7 « 0,1219 > ри ^0,1103, р6 - 0,0829 > ри - 0,0,0749, и т. д.

Рис. 3

Вывод. Многоугольник распределения биномиальной св. всегда имеет вид" горки", симметричной в случае р = 0,5. Вершина "горки" находится, примерно, над математическим ожиданием М. С ростом

параметра к вершина сдвигается вправо, "горка" уменьшает высоту и становится более "широкой" и пологой, оставаясь не строго симметричной.

Контроль 3. Используя рис. 2, постройте "горку" при р = 0,7 и к = 5. Может ли "горка" превратиться в "обрыв" при больших значениях к ? Обоснуйте.

4. Правило "трёх сигм" для б.с.в.

Вы, наверное, заметили, что при изучении конкретных с.в. часто возникает вопрос: какова вероятность появления значений с.в. в некотором промежутке? Существует удобное правило, позволяющее быстро и достаточно точно отвечать на подобный вопрос. Правило это применимо к различным типам с.в. и, в частности, к биномиальным. Звучит оно так:

Правило "3<т". Если биномиальная с.в. X связана с экспериментом, состоящим из достаточно большого числа опытов к, в которых вероятность "успеха" р не слишком мала, (Äp>10), то при любом выполнении этого эксперимента появившееся значение б.с.в. практически достоверно*) попадёт в интервал (М-За; М + За)**). Вероятность этого события оценивается так:

Р(Х е(М-За; М + За)) - 0,9972. (2)

Добавление. Вероятности попадания б.с.в. в двухсигмовый и в односигмовый интервалы тоже можно оценить подобным образом:

Р(Х е{М-2а; М + 2а)) - 0,954. (3)

Р{Хе{М-а; М + а))~ 0,683. (4)

Последнее равенство оценивает вероятность появления значений 1, 2, 3 в примере 1 так: примерно 7 раз из десяти. В сущности, так же, как и вероятность, найденная из ряда распределения: рх + р2 + ръ = 0,7411.

Приближённые равенства (2), (3), (4), как и правило "3<т", будут обоснованы при изучении непрерывных с.в. (лек. 11, п. 8, лек. 12, п. 4).

Практическая достоверность. Равенство (2) устанавливает, что значения б.с.в. могут выйти за пределы трёхсигмового интервала лишь, примерно, 2-3 раза на тысячу экспериментов. Вероятность 0,997 и принято считать обеспечивающей практическую достоверность вероятностных прогнозов. В дальнейшем, когда встретится фраза

*) Напомним, - практически достоверным мы условились называть (лек. 4, п. 8, примечание) такой прогноз, вероятность исполнения которого Pß > 0,997.

**) Здесь можно поставить суженный полуинтервал [0; m +3а).

"практически достоверный прогноз" (или событие), вы будете помнить, что доверительная вероятность этого прогноза (события) 0,997 или больше.

Замечание 3. В формулировке сказано, что правило хорошо оценивает вероятность попадания значений св. в трёхсигмовый интервал при условии "достаточно большого числа опытов". В дальнейшем (лек. 11, п. 8 и лек. 12, п. 4) вы узнаете, что эту фразу можно уточнить так: число опытов должно удовлетворять неравенству к>(\0/р). Из данного неравенства следует, что требуемое число опытов зависит от вероятности р, - чем меньше р, тем больше должно быть число опытов к. Тогда же вы узнаете и смысл этого неравенства, - оно определяет достаточную для выполнения правила "Зсг" степень симметричности распределения б.с.в. Нижеследующие примеры проиллюстрируют сказанное.

Примеры. Проверим, как выполняется правило "3 <т" в условиях примера 2, где рассматривалась б.с.в. Y с параметрами к = 5 и р = 0,3 (многоугольник распределения показан на рис. 1). Для этого надо определить трёхсигмовый интервал и вычислить вероятность попадания св. Y в этот интервал, а затем сравнить эту вероятность с той, которая указана правилом "3 а". Сделаем это.

Вычислим числовые характеристики:

Трёхсигмовый интервал получается таким:

{М-За\ М + Зсг)-(1,5-3-1,0247; 1,5 + 3-1,0247) = (-1,5741; 4,5247).

Поскольку св. Y принимает только целые неотрицательные значения, то её попадание в найденный трёхсигмовый интервал равносильно попаданию в промежуток [0;4]. Вероятность этого попадания легко найти с помощью ряда распределения (таблица 3):

Правило "3<т" указывает вероятность 0,9972. Разница крохотная -0,00037! •

Замечание 4. Не обратили ли вы внимание на малое количество опытов к = 5, в то время как правило требует, чтобы число опытов было "достаточно большое"? Оказывается, что 5 опытов для нашего случая это и есть достаточно большое их число. Это число опытов достаточно потому, что другой параметр /7=0,3 не слишком мал. Не малость вероятности "успеха" р оговаривается в приведённой формулировке (обратите на это внимание!).

Замечание 5. Если вы читали замечание 3, то можете проверить неравенство к>(\0/р) и обнаружите, что оно не выполняется. А правило, тем не менее, действует очень хорошо. Следовательно, уточнение правила данным неравенством сузит его возможности. Неравенство к>(\0/р) определяет лишь достаточные условия применимости правила.

Проверим теперь, насколько хорошо правило "За" оценивает вероятность в условиях примера 1. Имеем б.с.в. X с параметрами £ = 30 и р = 0,06. Число опытов к здесь значительно больше, чем в предыдущем примере, и можно думать, что правило даст более точную оценку. Но вероятность р мала!

В первом разделе лекции (второе решение) для с.в. X были найдены математическое ожидание M = 1,8, дисперсия D = 1,692 и а = 1,3. Трёхсигмовый интервал получился таким: (-2,1; 5,7), в него попадают 6 значений с.в. X: 0, 1, 2, 3, 4, 5. Там же с помощью ряда распределения (таблица 1), было установлено, что точная вероятность попадания с.в. X в трёхсигмовый интервал равна 0,9910. Отличие от правила "3 а" - 0,0062!

Отличие как будто небольшое, но оно провоцирует существенную ошибку в прогнозе. Если руководствоваться оценкой 0,9972, то попадание с.в. X в трёхсигмовый интервал практически достоверно и выход за его пределы возможен лишь 2-3 раза на тысячу экспериментов. Точная же вероятность 0,9910 указывает нам, что выход значений с.в. X за пределы трёхсигмового интервала будет около 9 раз на тысячу, или 1 раз на сто экспериментов. Согласитесь, что это существенная разница.

Итак, для данного примера 30 опытов не являются достаточно большим количеством для успешного применения правила "За". Причина - очень малое значение р = 0,06. Вот здесь-то и помогает неравенство к>(\0/р). С его помощью можно рассчитать достаточное число опытов: к > (10/0,06) <^> к > (1000/6), откуда следует, что к > 167. Многовато!

Контроль 4. Монетку подбрасывают 100 раз. Какое число гербов можно практически гарантировать? Как часто можно ожидать, что число гербов окажется близко к пятидесяти, точнее - в пределах [45; 55]?

5. Как доказать формулу Мб = k ∙ p?

Главная часть лекции нами пройдена. Вы узнали всё существенное о биномиальных св.: какие с.в. собираются в класс биномиальных, каковы особенности распределения их вероятностей. Вы поработали с конкретными примерами б.с.в. и научились делать обоснованные прогнозы. Решающую помощь в этом оказывали две простые формулы (1): M = к • р и D = к • р • (1 - р). Не любопытно ли вам теперь узнать, как получены эти замечательные формулы?

Если бы мы не знали этих формул, а надо было найти математическое ожидание M б.с.в. Хб, пришлось бы использовать ряд распределения (таблица 2). И, согласно определению математического ожидания (лек. 5, п. 6, (2): M = ^х, • pi), пришлось бы вычислять длинную сумму:

Теперь же мы знаем, что эта "страшная" сумма равна просто-напросто произведению параметров: Мб = кр\ Неожиданно и приятно!

Идея вывода. Как же получилась эта красивая и полезная формула? Сейчас я раскрою вам идею вывода формулы. В следующих двух разделах лекции мы реализуем эту идею. Понять идею, организующую рассуждения, очень важно, ибо после этого станет виден весь предстоящий путь и понятны причины тех или иных действий на этом пути.

Идея, как всякая идея, проста. Представим с.в Хб в виде суммы к штук некоторых простейших св.: Хб = 1г +12 +...+1к, математические ожидания которых легко вычислимы*) (все они окажутся равными р). После этого вычислим математическое ожидание св. Хб9 как сумму математических ожиданий простейших слагаемых, т. е. M(xà) = р + Р +... + р = к-р. Поясню эту идею примером.

Пример 3. Опыт состоит в подбрасывании трёх монет. Св. Z -число появившихся гербов. Очевидно, эта св. биномиальная, её значения -0,1, 2, 3. Найдём математическое ожидание св. Z.

Введём три простейших св.: 7, - число гербов при подбрасывании первой монеты, 12 - второй, 13 - третьей. Очевидно, все эти три св. могут принимать только два значения - 0 и 1. Действительно, первая монетка может упасть или гербом вверх, и тогда св. 7, примет значение 1, или решкой, и тогда появляется значение 0. Вероятности этих значений: р = 0,5 и q = 0,5.

Нетрудно понять, что значения св. Z получаются сложением значений, которые приняли в опыте простейшие св. 7,, т. е. Z = Ix +12 + /3.

Например, если в результате опыта появилось два герба (св. Z приняла значение 2), то две монетки упали гербом вверх, одна - решкой. Следовательно, две простейшие св. приняли значения 1 и 1, а одна - 0. Значение 2, которое приняла св. Z, получается сложением значений, принятых простейшими св.: 2=1+1+0.

Математические ожидания всех трёх простейших св. одинаковы: M{lt) = 0 • 0,5 +1 • 0,5 = 0,5, / = 1,2,3. Складываем их: M (z) = 0,5 + 0,5 + 0,5 = 1,5.

Всё! •

*) Данная идея следует общенаучному методу исследования сложных явлений, - сведению их к простым., более понятным и доступным для анализа или решения. Этот метод носит название редукции (от латинского reductio - возвращение, приведение обратно). Мы неоднократно использовали этот метод ранее, например, рассчитывая вероятности сложных событий с помощью теорем сложения и умножения (лек. 3). Широко применялся он и в курсе анализа (вычисление производных, интегралов, решение дифференциальных уравнений с помощью подстановок и др.).

Программа. Теперь предстоит обосновать действия, которые мы делали в примере 3. Мы должны дать абстрактное определение суммы случайных величин. Для биномиальных с.в. надо ввести понятие простейших с.в. Далее, - установить, что любая биномиальная с.в. представима в виде суммы простейших. Затем, - доказать теорему о том, что математическое ожидание суммы с.в. равно сумме математических ожиданий слагаемых. В качестве следствия этой теоремы и получится красивая формула Мб = к- р. Таким же путём будет получена и вторая красивая формула для дисперсии б.с.в. - D6 = k-p-q.

Контроль 5. Орудие стреляет в мишень два раза. Вероятность попадания каждый раз одинакова и равна р = 0,7. Случайная величина Y -число попаданий. Проверьте, что с.в. Y - биномиальная. Введите простейшие с.в. и представьте 7, как сумму простейших (обоснуйте). Вычислите математические ожидания простейших с.в. Вычислите математическое ожидание M(y). После этого вычислите M(y) с помощью ряда распределения.

6. Сумма случайных величин. Биномиальная с.в. - сумма простейших

В этом разделе мы выполним первую часть программы: определим понятия суммы с.в. и простейших с.в. и установим теорему о разложении б.с.в. в сумму простейших.

Прежде, чем определять сумму с.в., вспомним точное определение случайной величины. Это - функция на полной группе несовместимых событий некоторого опыта (лек 5, п. 3).

К примеру, выше мы рассматривали с.в. Z - число гербов в опыте с трёхкратным подбрасыванием монеты. Полная группа несовместимых событий этого опыта состоит из 4-х событий: А0 - ни одного герба, Ах - ровно один герб, А2 - ровно два герба, Аъ - три герба. Случайная величина Z ставит в соответствие каждому событию этой группы число 0, или 1, или 2, или 3, соответственно. Это и есть задание числовой функции на группе событий.

Если случайная величина это функция, то сумму с.в. естественно определить, как сумму функций (соответствующие значения складываются).

Определение 2. Пусть с некоторым опытом связаны несколько случайных величин - ХХ9 Х29 Хк. Суммой этих с.в. называется новая с.в. X, которая в результате опыта принимает

значение, равное сумме появившихся значений всех данных св.

Обозначение:

Свойства суммы с.в. те же, что и свойства сложения чисел, поскольку значения суммы св. получаются сложением чисел -значений слагаемых св. Значит, значения суммы св. не зависят от того, в каком порядке будут складываться случайные величины.

1°. Х] + Х2 = Х2 + Х] (коммутативность);

2°. Хх + Х2 + Хъ = Хх + (Х2 + Хъ) = (Х, + Х2) + Х3 (ассоциативность).

Примеры суммы св. были выше. Вот ещё один: св. X - сумма очков, выпавших при подбрасывании двух игральных костей. Очевидно, что, согласно определению 2, X = Х] + Х29 где св. Х] - число очков, выпавших на первой кости, Х2 - на второй. Здесь сумма X не является биномиальной св., как это было в предыдущих примерах.

Введём теперь понятие простейшей с.е. Обратите внимание: эти св. определяются нами именно в тех опытах (экспериментах), в которых появляются биномиальные св.

Определение 3. Пусть имеется эксперимент, который состоит в повторении некоторого опыта к раз. Пусть каждый раз может появиться или нет некоторое событие А ("успех" опыта).

Определим к простейших*) св. 119 129 1к9 каждая из которых принимает только два значения - 0 и 1 - следующим образом:

если в первом опыте появляется "успех", то первая св. 1} принимает значение 1, если "неуспех", то 0 (независимо от того, каковы будут результаты остальных опытов эксперимента!);

если во втором опыте появляется "успех", то вторая св. 12 принимает значение 1, если "неуспех", то 0; и т. д.

Теорема 1. Любая биномиальная св. Хб разлагается в сумму простейших св.:

(5)

Доказательство почти тривиально. Согласно определению биномиальной св. (определение 1), Хб связана с экспериментом, состоящим в повторении некоторого опыта к раз, причём, каждый раз может появиться или нет событие А ("успех" опыта). В этих условиях определение 3 вводит к простейших св. 119 /2, 1к. Составим новую св. / = 1Х +12 +... + 1к. Очевидно, что Хб = I, ибо при любом выполнении

*) В научной литературе св. I/, / = 1,2,...,а; называют /-м индикатором "успеха". Мы используем это понятие применительно к Бернуллиевскому эксперименту. Но оно применимо к любому событию любого опыта.

эксперимента обе с.в. Хб и I принимают одинаковые значения (Хб принимает значение, равное числу "успехов" эксперимента, а / -значение, равное сумме единиц, число которых равно числу "успехов" в том же эксперименте). •

Контроль 6. Эксперимент состоит в подбрасывании трёх игральных костей. С.в. X - число появившихся "шестёрок". Покажите, что с.в. X биномиальная. Сколько простейших с.в. связано с данным экспериментом? Определите их. Докажите, что с.в. X есть сумма простейших.

7. Математические ожидания суммы с.в. и биномиальной с.в.

Здесь установим общую теорему о сложении математических ожиданий дискретных св., из которой, как следствие, получим нужную нам формулу M = к-р.

Теорема 2. Пусть с некоторым опытом связаны две дискретные с.в X и 7, а также третья с.в. - их сумма X + Y. Математическое ожидание суммы с.в. равно сумме их математических ожиданий:

(6)

Доказательство проведём для самого простого случая, когда слагаемые с.в. имеют всего два разных значения: X может принимать в опыте значение хх с вероятностью рх и другое значение х2 с вероятностью р2; Y - значения ух и у2 с вероятностями qx и q29 соответственно. Для св., имеющих большее число значений, доказательство идёт аналогично, только с большим формальным усложнением. Вы сможете в этом убедиться, выполнив контрольное упражнение в конце данного раздела.

1. Запишем ряды распределения слагаемых и вычислим их математические ожидания:

Таблица 4 Таблица 5

2. Составим ряд распределения суммы с.в. и вычислим её математическое ожидание.

Значения суммы Х + согласно определению 2, получаются сложением любого значения с.в. X с любым значением с.в. Y: хг+уг. хх +у2, х2+у19 х2 +у2. Обозначим вероятности этих значений через рхх, р129

р21, р22, соответственно. Ряд распределения св. X + Y и математическое ожидание получаются такими:

Таблица 6

3. Наша цель - доказать справедливость равенства (6), которое для двузначных св. X и Y принимает вид:

Чтобы понять, когда это равенство может быть справедливым, преобразуем левую часть, раскрыв скобки и сделав группировку так:

Теперь видно, что суммы вероятностей, стоящие в скобках в левой части, должны равняться соответствующим вероятностям, стоящим в правой части. Убедимся, что в наших условиях это так и есть.

4. Покажем, что ри + р12 = Рх. Рассмотрим три события:

(Х = хг) - в результате опыта св. X принимает значение хх ;

(X + Y = хх + ух) - X принимает значение хх и, в то же время, Y принимает значение ух ;

(X + Y = хх + у2) - X принимает значение хх, Y - значение у2.

Ясно, что первое событие происходит тогда, когда происходит или второе, или третье. Значит, первое событие есть сумма второго и третьего, согласно определению суммы событий (лек. 3, п. 1):

(X = xl) = {X + Y = xl+yl)+ {X + Y = xx+y2).

Поскольку значения ух и у2 - разные, то слагаемые события, стоящие в правой части, несовместимы и, следовательно, применима первая теорема сложения вероятностей (лек. 3, п. 4):

P(X = xl) = 'P{X + Y = xx +y])+P{X + Y = x] +у2).

Вероятности этих событий указаны в таблицах распределений. Последнее равенство, следовательно, и означает, что Рх = Рхх + Рх2.

5. Совершенно аналогично доказывается, что р2] + р22 = р2 (постарайтесь сделать это сами), а также Рхх + р2] = qx, Рх2 + p22=q2. •

Замечание 6. Вы, может быть, не заметили одно скрытое предположение, при котором проведено наше доказательство. А именно, - значения св. X + Y предполагались различными. В то время как, вообще говоря, некоторые из них могут совпадать. Учёт этого обстоятельства заставил бы нас объединить равные значения и

сложить соответствующие вероятности, что формально усложнило бы обозначения и рассуждения, не отменив их справедливости.

Следствие 1. Математическое ожидание суммы любого конечного числа дискретных случайных величин Х}, i = 1, 2,к равно сумме их математических ожиданий:

(7)

Доказательство для трёх с.в. заключено в следующей цепочке равенств (применяется ассоциативное свойство сложения с.в. и дважды - только что доказанная теорема 2):

Для 4-х и более с.в. цепочка составляется совершенно аналогично, лишь удлиняется. •

Следствие 2. Математическое ожидание биномиальной с.в. Хб с параметрами к и р равно произведению параметров:

(8)

Доказательство. Согласно теореме 1, Хб = 1Х +12 +...+1к.

Согласно следствию 1 теоремы 2, м(хб) = М(/,)+М(/2)+... + M(lk).

Согласно определению простейших с.в. (определение 3), M{ll) = M{l2) =... = M{lk) = 0{l-p)+hp = p.

Следовательно, м(хб) = р + р +... + р = к • р. •

Контроль 7. Игральная кость подбрасывается 6 раз. С.в. X -сумма появившихся очков, с.в. Y - число "шестёрок". Найдите математические ожидания этих с.в.

Контроль 7*. Проведите доказательство теоремы 2 для случая, когда с.в. X имеет три различных значения х15 х2, х3 с вероятностями рх, р2, /?3. В чём отличия?

8. Независимость случайных величин

Осталось доказать вторую из формул (1). Схема рассуждений та же. Небольшое осложнение возникнет с теоремой о сумме дисперсий - она справедлива не для всех св., а для независимых. Обсудим это новое важное понятие.

Воспоминания. Вспомним сначала понятие независимости событий (лек. 3, п. 7). Оно использует другое, подзабытое, наверное, вами понятие условной вероятности (лек. 3, п. 6).

Условной вероятностью события В относительно события А называется вероятность события В, вычисленная при условии, что

событие В произошло. Обозначение - РА (В). События А и В называются независимыми, если условная вероятность одного из них не меняется в зависимости от того, произошло или нет другое, т. е. Р4 (в) = РА(в).

В урне 5 шаров - 3 белых, 2 чёрных. Вынимаются последовательно 2 шара. Событие А - первым вынут белый шар, В - вторым вынут белый шар. РА(в) = 1/2, Ра (в) = 1/4. События А и В зависимые.

Орудие 2 раза стреляет в мишень. Вероятность поражения цели каждым выстрелом равна р. Событие Ах - цель поражена 1-м выстрелом, А2 - вторым. РА(А2) = р9 Pj(A2) = р. События Ах и А2 независимые. В данном примере независимость событий очевидна без вычислений, - они физически независимы.

Напомню также, что теорема умножения вероятностей (лек. 3, п. 8) упрощается для независимых событий А и В так:

(9)

Определение 4. Две св. X и Y, связанные с одним опытом, называются независимыми*), если независимы все, связанные с ними события.

Данное определение охватывает как дискретные, так и непрерывные св. Уточним его для дискретных св.

Определение 4'. Пусть с некоторым опытом связаны две дискретные св. - X и Y. Пусть возможные значения св. X -{x,,z = 1,2,...,m], а значения св. Y - \yj9j = 1,2,...,л}. Случайные величины X и Y называются независимыми, если любое событие Ai =(X = xt), состоящее в том, что св. X приняла в опыте значение x,, независимо с любым событием b/=(Y = yJ) - св. Y приняла значение у i.

Независимость св. X и Y позволяет легко находить по формуле (9) вероятности произведений Arbj\ р(4 • bj) = Р(4) • v[bj)**). Этот факт понадобится нам чуть далее.

Примеры. Опыт - вынимание двух шаров из урны, где лежат 3 белых и 2 чёрных шара. Св. X - число появившихся белых шаров, св. Y -число чёрных. Очевидно, возможные значения данных св. одинаковы - О,

*) В литературе можно встретить различные определения независимости св. (см. [1, с. 79], [2, с. 172], [3, с. 195]). Например, можно уточнить события, о которых говорится в определении 4, так: событие {х < х) должно быть независимо с событием (к < v) для любых х9 у ([9, с. 134]).

**) Это свойство независимых св. иногда включают в само определение [1, с. 79-80]. Подобные опосредованные (через характеристические свойства) определения бывают удобны в науке, но в учебном курсе затрудняют понимание сути.

1, 2, а распределения вероятностей разные, из-за разного числа белых и чёрных шаров в урне. Почти очевидно также, что св. X и Y зависимые. Проверим это с помощью определения 4'.

С св. X связаны три основных события: (х = 0), (X = l), (Х = 2). С св. Y - тоже три: (J = 0), (r = l), (7 = 2). Выберем, например, пару А = (Х = 2) и В = (Y = О) и проверим, зависимы ли эти события. Без труда определяем условные вероятности: рА(в) = 19 (в) = О. События зависимые.

Значит, согласно определению 4', св. X и 7 тоже зависимые.

Другой пример. Орудие дважды стреляет в мишень. Св. Хх - число попаданий при первом выстреле (значения 0 и 1), св. Х2 - число попаданий при втором (значения те же). Очевидно, эти св. независимые, т. к. вероятность попадания при втором выстреле не меняется от того, каков результат первого.

Обобщим предыдущее определение, данное для двух св., на случай нескольких св.

Определение 5. Пусть с некоторым опытом связаны п случайных величин X,, Х29..., Хп. Эти с. е. называются независимыми в совокупности, если каждая из них независима с любой другой и, более того, независима с суммой любого числа других св.

Примером назависимых в совокупности св. может быть система простейших св., связанных с любой биномиальной св. Взять, хотя бы, опыт, когда орудие три раза стреляет в мишень, и три простейшие св. - Хх - число попаданий при первом выстреле, Х2 - при втором. Х3 - при третьем. Их независимость мы сейчас установим в общем виде.

Лемма*) 1. Пусть эксперимент состоит в повторении некоторого опыта к раз и каждый раз может появиться или нет некоторое событие Ас неизменной вероятностью р. Простейшие св. = 1,2,...Д, которые принимают значение 1, если в /-м опыте появилось событие А, и 0, если не появилось, образуют систему независимых в совокупности св.

Доказательство тривиально следует из независимости опытов, т. е. из неизменности вероятности р. Действительно, если св. Ii приняла значение 1, т. е. произошло событие (/,. =1), то вероятность этого события равна р, независимо от того, что произошло в других опытах и какие значения приняли другие св. ф /, а значит и любые их суммы. •

*) Леммой называют вспомогательное утверждение, используемое для доказательства последующей теоремы.

Ценность. Понятие независимости с.в. очень важно в теории случайных величин. Ценность его состоит в том, что многие основополагающие факты теории можно установить только для независимых с.в. Сейчас вы увидите один такой пример: зная законы распределения слагаемых св., мы найдём распределение их суммы. Для зависимых с.в. сделать это в общем виде невозможно.

Лемма 2. Пусть с некоторым опытом связаны две с.в.х и 7, законы распределения которых известны:

Таблица 7 Таблица 8

Если с.в. x и y независимые, то закон распределения их суммы x + y имеет вид (значения складываются, а вероятности перемножаются!):

Таблица 9

Доказательство. Согласно определению 2, значения суммы x + y определяются всевозможными суммами значений {х,^^}, которые могут появиться в результате опыта. Найдём вероятность появления произвольного значения xt+yJ9 т. е. вероятность события С = (х + Y = xt +yj), состоящего в том, что с.в. x приняла значение xi (появилось событие а = (х = х,)), и одновременно с.в. y приняла значение у. (появилось событие b = (y = у

Согласно определению произведения событий (лек. 3, п. 1), с = ав,

т. е.

(х + ¥ = х;+у^={х=х;).(¥ = у;).

В этом равенстве справа стоят независимые события, согласно условию леммы. Поэтому применима теорема о произведении независимых событий (лек. 3, п. 8), т. е. применима формула (9):

p(x + Y = xi+yj) = T>{X = xi).'P(Y = yj).

Вероятности, стоящие в правой части последнего равенства, известны и равны pi и qn соответственно. В итоге, следовательно, получаем то, что нужно доказать:

Контроль 8. В условиях контроля 7, обоснуйте зависимость с.в. x и y. Введите систему независимых в совокупности с.в. и обоснуйте это.

9. Дисперсия суммы с.в. Дисперсия биномиальной с.в.

Теорема 3. Пусть с некоторым опытом связаны две дискретные с.в. - x и y, а также их сумма - x + y. Если с.в. X и 7 независимые, то дисперсия суммы равна сумме дисперсий слагаемых:

(9)

Доказательство проведём для простейшего случая, когда слагаемые с.в. имеют два значения (так же мы поступали и с теоремой 2).

Минимальное число значений с.в. позволит обозримо провести необходимые преобразования длинной суммы (4-й пункт доказательства). Эти преобразования можно провести и в общем случае, но они станут трудно понимаемыми. Если же вы сильно захотите сами преодолеть технические трудности, попробуйте вести нижеследующие рассуждения и выкладки, считая, что с.в. X имеет m значений *,, х2, хт, а с.в. Y -п значений У], у2,...,>>„.

1. Нам нужно вычислить три дисперсии и установить равенство (9). Для этого будем пользоваться следующей формулой (лек. 5, п. 7, (4')):

d(x) = м(х2)- М2 (x). (10)

В этой формуле участвует с.в x2 ; напомню, - x2 получается из с.в. x возведением в квадрат её значений при неизменных вероятностях.

2. Вычислим дисперсии слагаемых x и y. Закон распределения этих с.в. задаётся таблицами 4 и 5. Математические ожидания обозначим так:

м(х) = х1р] + х2р2 = а, m (y) = yïq] + y2q2 - ъ. (11)

Дисперсии, согласно формуле (ю), получаются такими:

D(x) = х2рх + х\р2 - а2, D(y) = y]qx + y\q2 -b2.

Значит, правая часть формулы (9) принимает вид:

D(x)+D(y) = X2P] +х;р2 -a2 +y2q} +y]q2 -b2. (12)

3. Вычислим дисперсию суммы x + y. Закон распределения суммы, согласно лемме 2, выглядит так:

Таблица 7

Математическое ожидание квадрата суммы (х + У)2 получается таким:

Квадрат математического ожидания суммы, с учётом теоремы 2:

Формула (10) для суммы X + Y принимает вид

С учётом всех предыдущих равенств вычисляем дисперсию суммы:

4. Преобразуем последнюю формулу так, чтобы прийти к сумме дисперсий (12). Для этого сначала возведём в квадрат выражения, стоящие в скобках, и сделаем перестановку слагаемых (соберём удвоенные произведения):

Группируем 1-е и 3-е слагаемые, 2-е и 4-е, и т. д., 9-е и 10-е, 11-е и 12-е:

Используем свойство ряда распределения - qx + q2 = 1, рг + р2 = 1, а также 2-ю формулу (l 1):

Делаем очевидную перестановку слагаемых, используем 1-ю формулу (11) и приходим к сумме дисперсий (12):

Следствие 1. Дисперсия суммы любого конечного числа независимых в совокупности дискретных с.в. Xni = 1,2,,...,л равна сумме их дисперсий:

(13)

Доказательство заключено в следующей цепочке равенств:

Надеюсь, вы понимаете, что в этой цепочке т-1 раз использованы свойство ассоциативности сложения св. и теорема 3. •

Следствие 2. Дисперсия биномиальной св. Хб9 параметры которой к и р, определяется формулой

(14)

Доказательство. Согласно теореме 1, наша биномиальная св. Хб представима в виде суммы простейших св. Ini = 1,2,к:

Хб=1г+12+... + 1к.

Согласно лемме 1, простейшие св. /,.,/ = 1,2,...Д образуют систему независимых в совокупности св., и значит, к ним применимо следствие 1:

D{X6) = D{ll)+D{l2)+... + D{lk).

Все простейшие св. Ii принимают одинаковые значения 0 и 1 с одинаковыми вероятностями 1 - р и р, соответственно. Их математические ожидания м(А) = р. Значит, их дисперсии одинаковы и равны

Из последних двух равенств и следует

Следствие 3. Среднее квадратическое отклонение биномиальной св. Хб, параметры которой к и р, определяется формулой

(15)

Доказательство следует из определения среднего квадратического отклонения <j = y[D (лек. 5, п. 8, (5)) и формулы (14). •

Контроль 9. В условиях контроля 7, найдите дисперсии и средние квадратические отклонения св. X и св. Y.

10. Упражнения

1. Один раз подбрасываются две однородные игральные кости. Св. X - число выпавших "шестёрок", Y - число выпавших костей с чётными очками. Какая из этих св. биномиальная и каковы её параметры? Постройте эскизы многоугольников распределения этих св. Рассчитайте ряды распределения вероятностей данных св. и постройте многоугольники распределения точно. Согласуются ли они с эскизами?

Вычислите математические ожидания и дисперсии данных св. двумя способами - с помощью ряда распределения и по формулам для св. Хб.

Отв.: м(х) = 1/3, d(x) = 5/1&, M(y)=1, d(y) = \/2.

2. Один раз подбрасываются 5 игральных костей. Св. X и Y - те же, что и в предыдущем упражнении. Вопросы - те же.

Отв.: м{х) = 5/ъ, d(x)= 25/36, m(y)= 5/2, d(y) = 5/4.

3. Один раз подбрасываются 10 игральных костей. Св. X и Y - те же. Найдите быстро M, D и а для этих св. Постройте эскизы многоугольников распределения. Какие значения той и другой св. (укажите диапазон) появятся в опыте с практически достоверной вероятностью?

4. Монета подбрасывается 7 раз. Определите быстро: каково наиболее вероятное число гербов? Рассчитайте эту вероятность точно. Какое число гербов можно гарантировать с вероятностью большей, чем 0.9? Как проверить этот прогноз? Отв.: 0,27, [1; 6].

5. В урне 10 шаров - 7 белых, 3 чёрных. Опыт - последовательное вынимание 5-ти шаров с возвращением (каждый вынутый шар кладётся обратно, после чего вынимается следующий шар). Св. X - число белых шаров. Запишите без вычислений ряд распределения св. X (найдите нужный для этого пример в тексте лекции). Определите вероятность того, что св. X примет значение, не большее двух. Как часто следует ожидать появления малого числа белых шаров (не больше двух)? Останется ли св. X биномиальной, если вынимать шары без возвращения? Почему? Рассчитайте вероятность появления малого числа белых шаров в этом случае. Прогноз? Как его проверить?

6. Три стрелка производят залп по цели. Вероятности попаданий: рх = 0,5, р2 = 0,7, р3 = 0,9. Св. X - число попаданий. Является ли св. X биномиальной? Обоснуйте. Можно ли ввести простейшие св.? Обоснуйте. Запишите ряды распределения простейших св. Будут ли простейшие св. независимыми в совокупности? Можно ли разложить св. X в сумму простейших? Обоснуйте. Найдите М(х) и D(x), не строя ряд распределения.

Указание. Опыт можно рассматривать, как повторение выстрела 3 раза.

7. Стрелок стреляет в мишень 20 раз. Вероятность попадания при каждом выстреле неизменна и равна 0,7. Какое число попаданий можно практически гарантировать? Отв.: не менее восьми.

8. По каналу связи могут передаваться одновременно до пяти сообщений. Вероятность искажения сообщения не зависит от других сообщений и равна 0,3. Найти вероятность не более двух искажений (ряд распределения числа искажений отыщите в тексте лекции). Отв.: 0,837.

Указание. Опыт - передача одного сообщения, "успех" - искажение сообщения.

9. По каналу связи могут передаваться одновременно до 50 сообщений. Вероятность искажения каждого сообщения не зависит от других и равна 0,3. Каково среднее число искажений? Какой диапазон числа искажений можно гарантированно ожидать? Отв.: [6; 24].

10. Прибор состоит из трёх элементов. Вероятность безотказной работы в течение определённого периода эксплуатации (надёжность) для каждого элемента равна 0,9. Элементы выходят из строя независимо друг от друга. Прибор может выполнять свои функции, если работает не менее двух его элементов. Какова надёжность прибора в целом? Какое число элементов практически достоверно выйдет из строя за период эксплуатации? Отв.: 0,972; не более одного.

11. Прибор состоит из 100 элементов. Вероятность выхода из строя каждого элемента за определённое время работы равна 0,02, независимо от состояния других элементов. Какое число элементов будет в рабочем состоянии к концу срока работы? Отв.: не менее 96.

12. Человек, принадлежащий к определённой группе населения, с вероятностью рх = 0,2 оказывается брюнетом, с р2 = 0,3 шатеном, с р3 = 0,4 блондином, с р4 = ОД рыжим. Выбирается наугад группа из 6 человек. Рассмотрите 4 случайные величины: Хх - число брюнетов в группе, Х2 -число шатенов, Х3 - число блондинов, Х4 - число рыжих. Будут ли эти с.в. независимыми в совокупности? Обоснуйте. Будут ли они биномиальными? Почему? Какие значения могут принимать с.в Хх +Х2 и Хх + Х2 +Х3 +Х4? Найдите среднее значение и дисперсию той и другой с.в.

Указание. Выясните, зависимы ли, например, такие события (хх = б) и {х2=\).

13. Стрельба по цели ведётся до трёх попаданий. Вероятность попадания при каждом выстреле равна 0,4. Найдите среднее число расхода снарядов и диапазон возможного расхода снарядов?

Указание. Введите с.в. Kt - число снарядов, потраченных от (/-l)-го до /-го попадания. Все эти с.в. имеют геометрическое распределение, их математическое ожидание м(кх) найдите, заглянув в лек. 5, п. 9.

14. В партии, содержащей большое количество деталей, имеется 10% нестандартных. Для проверки отбираются случайным образом 4 детали. Сделайте прогнозы о числе нестандартных деталей в выборке: а) на основе числовых характеристик; б) на основе ряда распределения.

Отв.: р0 =0,6561; рх =0,2916; р2 =0,0486; ръ =0,0036; р4 =0,0001.

15. Известно, что 5% всех мужчин и 0,25% всех женщин дальтоники. Наугад выбранное лицо оказалось дальтоником. Какова вероятность, что это мужчина? Предположите, что мужчин и женщин поровну. Отв.: 20/21.

Указание. Перейдите к урновой модели.

16. Известна статистическая вероятность того, что два близнеца окажутся одного пола, - 0,64. Статистическая вероятность рождения мальчика 0,51. Найдите вероятность того, что второй из близнецов окажется мальчиком, если первый вышел мальчик. Отв.: 11/1*7.

ЛЕКЦИЯ 8

ПУАССОНОВСКИЕ С. В.

Лекция посвящена исследованию второго практически ценного класса дискретных с.в. - Пуассоновских (П.с.в.). Они похожи на биномиальные, но возникают в других ситуациях, не только при повторении опытов. Более того, в отличие от биномиальных, для П.с.в. не удаётся чётко охарактеризовать все условия их возникновения. Один важный класс опытов, порождающих П.с.в., - так называемые потоки событий, мы рассмотрим во второй части лекции.

Основные вопросы, которые ставятся при изучении св.: характер распределения вероятностей, его зависимость от параметров, числовые характеристики, условия возникновения. Эти вопросы направляли наше исследование биномиальных с.в. Эти же вопросы будут определять в будущем исследование основных типов непрерывных с.в. (лек. 11).

Начнём лекцию не с примеров, как обычно, а с абстрактного определения и его следствий - динамики изменения распределения в зависимости от параметра. Затем выведем формулы математического ожидания и дисперсии. В отличие от биномиальных св., здесь эти вопросы решаются легко. А вопрос об условиях возникновения Пуассоновских с.в. решается гораздо труднее. Вот по этой причине и начинаем с отвлечённых рассуждений и вычислений. Примеры будут позднее.

1. Математическое задание класса Пуассоновских с.в. (П.с.в.)

Случайной величиной (с.в.) мы назвали переменную величину, связанную с определённым опытом (лек. 5, п. 2). Значения этой величины появляются в результате опыта случайным образом. Следовательно, чтобы задать конкретную св., надо описать условия опыта и определить, как возникают значения св., какие они. Чтобы задать класс св., надо сделать то же самое, только в общем виде. Именно так определялись биномиальные с.в. в предыдущей лекции.

Однако, подобный способ задания класса с.в. не всегда возможен. Не всегда удаётся описать единую структуру опытов, в которых появляются с.в. определённого типа. В таких случаях можно применить абстрактно-математический способ задания св., а именно, указать типичный ряд распределения всех с.в. данного класса. Так и поступим.

Определение 1. Дискретная св. хп называется Пуассоновской (П.с.в.), если она может принимать только целые неотрицательные значения х1 = /; / = 0,1,2,3,..., а вероятности р1 этих значений определяются так:

(1)

где а > 0 имеет определённое положительное значение (своё для каждой конкретной П.с.в.) и называется параметром П.с.в.

Данным определением задаётся типичный ряд распределения П.с.в.:

Таблица 1

Проверка свойства р. р. Не забыли ли вы основное свойство ряда распределения (лек. 5, п. 5, (1)): р0 + рх + р2 +... + рг +... = 1? Проверим, выполняется ли оно в нашем случае. Только после этого можно будет считать определение 1 корректным (правильным).

1. Нам надо найти сумму ряда

Этот ряд можно немного видоизменить, вынеся константу е а за скобки*):

(2)

2. Найдём сумму ряда, стоящего в скобках. Для этого придётся вспомнить формулу разложения функции ех в степенной ряд Маклорена:

(3)

Полагая в этой формуле х = а, получаем:

3. Подставляем в (2) вместо ряда, стоящего в скобках, его сумму еа:

*) Строго говоря, чтобы эта операция имела смысл, надо быть уверенным, что ряд, стоящий в скобках, сходится. Но это так и есть, как видно из следующего, 2-го "шага" рассуждения.

Итак, определение 1 действительно корректно задаёт класс случайных величин, названных Пуассоновскими.

Примечание. У вас, наверное, возникло недоумение: откуда взялась формула (1)? Пока могу сказать, что её открыл француз Пуассон и её называют формулой Пуассона. Она хорошо отражает многие реальные распределения вероятностей в природе. В конце лекции (п. 10) вы увидите, как она возникает из анализа некоторого класса опытов - потоков событий.

Вы, конечно, вспомнили, что формула Пуассона встречалась раньше (лек. 4, п. 5, 6). Она помогала решать задачу Бернулли при очень малых вероятностях р "успеха" опыта. Это значит, что Пуассоновское распределение Xп порождается биномиальным Хб при очень малых значениях параметра р. Подробнее об этом поговорим позже.

Контроль 1. Запишите ряд распределения П.с.в. с параметром а = \. Вычислите вероятности / = 0,1,2,3,..., считая е~х ^0,3679. Постройте многоугольник распределения. Оцените расположение математического ожидания. Определите промежуток значений П.с.в., в который будут попадать значения П.с.в. с практически достоверной вероятностью 0,997.

2. Как распределение П.с.в. зависит от параметра

Глядя на таблицу 1, трудно представить характер изменения вероятностей pj. Можно предположить, что они быстро убывают из-за быстрого роста факториалов, стоящих в знаменателе. Так ли это?

Давайте придадим параметру а различные числовые значения, например, я = 0,2, а = 0,6, а = 1, я = 2, я = 5, я = 9, вычислим для каждого значения а несколько вероятностей р( и конкретизируем таблицу 1. После этого изобразим многоугольники распределения и проанализируем характер изменения вероятностей, в зависимости от значения параметра а.

Распределение при я = 0,2. Подставляем во вторую строку таблицы 1 значение параметра а = 0,2 и получаем вероятности:

Искать последующие вероятности р4, р5,... не имеет смысла, ибо очевидно, что они очень малы.

Вычисления сводятся к вычислению <Г0,2. Это число, приближённо равное \/^/2,7183. Его можно найти в таблице значений функции Пуассона (приложение 2): <Г0,2 -0,8187. После этого искомые вероятности вычисляются так:

Ряд распределения П.с.в. Хп {а = 0,2) получается таким:

Таблица 2

Наше предположение оправдывается, - вероятности резко убывают.

Замечание. Таблицу 2 можно было получить сразу из приложения 2. Но я хотел заставить вас произвести сам процесс вычислений. Значение е-0,2, взятое нами из приложения, тоже рассчитывается несложно. Просмотрите, как это делается с помощью рядов, и вы с удовольствием почувствуете полезность ваших давних знаний.

Подставьте значение х = -0,2 в ряд Маклорена (2), получится знакочередующийся числовой ряд, сумма которого известна:

Теперь отбросьте все члены ряда, начиная с 4-го, и получите приближённое значение

Почему отброшен именно 4-й член ряда? Потому, что он очень мал, и он оценивает ошибку - |еГ0,2 -0,82| < 0,0013, т. е. найденное значение 0,82 отличается от истинного значения е-0,2 менее, чем на 0,02 (сравните с более точным значением 0,8187, взятым из таблицы). Надеюсь, вы вспомнили, что такой метод оценки ошибки от замены суммы ряда частичной суммой был установлен в теории знакочередующихся рядов.

Распределения при я = 0,6, а = \ не будем подробно рассчитывать, а возьмём из приложения 2:

Таблица 3

Таблица 4

Вероятности тоже быстро убывают, но скорость убывания замедляется с ростом параметра а. Это наглядно видно на рис. 1, где представлены многоугольники только что полученных распределений.

Вывод 1. Если 0 < а < 1, то многоугольник распределения П.с.в. Хп(а) имеет вид "обрыва". С ростом параметра а от 0 до 1 высота "обрыва" уменьшается и он становится более пологим.

Распределения для а = 29 а = 59 а = 9 показаны на рис. 2.

Вывод 2. Если а > 1, то многоугольник распределения П.с.в. Хп(а) имеет вид несимметричной "горки". С ростом а "горка" сдвигается вправо, расширяется и понижает высоту.

Сходство с биномиальными распре делениями вы, наверное, уже заметили. Сравните рис. 2, лек. 7 и рис. 1 данной лекции: видно, что при очень малых р биномиальный "обрыв" похож на Пуассоновский. Сравните теперь рис. 3, лек 7 и рис. 2 данной лекции: видно, что при больших значениях другого параметра к биномиальная "горка" тоже становится похожа на Пуассоновскую. Чуть позже (в разделе 5) мы уточним условия этого сходства.

Контроль 2. Нарисуйте эскиз многоугольника распределения П.с.в. для значения параметра а = 3. Пользуясь таблицей приложения 2, составьте ряд распределения для а = 3 и постройте многоугольник распределения. Согласуется ли он с вашим эскизом?

Рис. 1

Рис. 2

3. Математическое ожидание и дисперсия П.с.в.

Не обратили ли вы внимание на то, что вершина "горки" (рис. 2) находится над значением параметра а? Т. е. наиболее вероятные значения П.с.в. Хп располагаются около а. Это признак того, что математическое ожидание М(ХП) должно быть близко к а.

С помощью рис. 2 можно сделать предположение и относительно дисперсии. Поскольку с ростом параметра а "горка" растягивается, то дисперсия D(xn) должна увеличиваться. Проверим эти предположения, вычислив M и D точно.

Вывод формулы для вычисления М(ХП).

Общая формула математического ожидания д.с.в. имеет вид:

где xi - значения с.в., p.t - их вероятности.

Пуассоновская св. Хп имеет бесконечное (счётное) множество значений / = 0,1,2,3,..., их вероятности задаются определением 1 (формула (1)), значит, математическое ожидание св. Хп есть сумма ряда:

Первое слагаемое ряда получается при / = 0, значит, оно равно нулю и суммирование можно начинать с / = 1:

Согласно определению факториала (/!=1-2-3-...-(/-1)-/), в каждом 1-м слагаемом ряда можно произвести сокращение на /. После этого сокращения и вынесения общего множителя ае~а за знак суммы, получаем:

Развернем сумму, стоящую справа, придавая / значения / = 1,2,3,... (учтите, что 0!= 1):

Ряд, стоящий в скобках, получается из ряда (3) при х = а, значит, его сумма равна еа и, следовательно,

Поскольку

окончательно получаем:

(4)

Мы предполагали м{Хп)~а, а оказалось, что математическое ожидание Пуассоновской св. в точности равно её параметру а !

Вывод формулы D(Xn). Как и при вычислении дисперсии биномиальной св. (лек. 7, п. 9), используем упрощённую общую формулу дисперсии (лек. 5, п. 7, (4')), которая, с учётом (4), приобретает вид:

(5)

Вычислим М\Х2П). Согласно определению квадрата св. Х2П (лек. 5, п. 7), её значения равны квадратам значений св. ХП9 т. е. равны /2, / = 0,1,2,..., а их вероятности р, остаются теми же, что и у св. Хп (см. (1)). Значит, из общей формулы математического ожидания получаем:

Преобразуем ряд, стоящий справа, следующим образом. Сделаем в каждом слагаемом сокращение на / (как и раньше, при вычислении М(ХП)). Вынесем за знак суммы общий множитель а (а не ае~\ как раньше). Разобьём каждое слагаемое на два, представив множитель / в виде суммы / = (/-l) + l. В результате, наш ряд распадётся на сумму двух других рядов*):

(6)

Первый ряд, стоящий в правой части равенства (6), есть ни что иное, как ряд, представляющий математическое ожидание с.в. Хп, и его сумма равна а. Действительно,

Второй ряд, стоящий в правой части равенства (6), легко суммируется после вынесения за знак суммы множителя е~а:

Подставим в правую часть равенства (6) суммы слагаемых рядов, найденные только что, и получим значение математического ожидания квадрата П.с.в. Х2П:

Остаётся подставить м(х2п)=а2 +а в равенство (5) и мы найдём дисперсию П.с.в. Хп:

(7)

Не удивительно ли, что дисперсия совпала с математическим ожиданием? Такого раньше не было. Это характерное свойство именно Пуассоновских с.в.

Вывод. Математическое ожидание Пуассоновской случайной величины Xп численно совпадает с её дисперсией и совпадает со значением её параметра а:

*) Эти два знакоположительных ряда сходятся, как будет видно чуть дальше, значит, дистрибутивный закон справедлив.

(8)

Контроль 3. Найдите среднее квадратическое отклонение о{Хп) П.с.в. Хп, параметр которой а = 3. Составьте для неё трёхсигмовый интервал (М-Ъа\ M + Ъа). Пользуясь рядом распределения, построенным в контроле 2, найдите вероятность попадания П.с.в. Xп в этот интервал. Сделайте прогноз. Сравните эту вероятность с вероятностью, которую указывает правило трёх сигм (лек. 7, п. 4, (2)), - существенно ли различие? Можно ли практически гарантировать попадание П.с.в. в трёхсигмовый интервал?

4. Статистический признак П.с.в.

Итак, мы рассмотрели первые три вопроса, поставленные во введении к лекции. Как распределяются вероятности значений П.с.в. Хп ? Краткий ответ: "обрыв" и несимметричная "горка". Как это распределение зависит от параметра а ? Ответ: с ростом а "горка" расширяется и её высота уменьшается. Каковы числовые характеристики М(ХП) и D(Xn)l Ответ: M{Xn) = D{Xn) = a.

Оставшаяся большая часть лекции посвящена последнему вопросу: каковы условия появления Пуассоновских св.? В каких опытах следует ожидать возникновение П.с.в.? Как сказано во введении, одного простого ответа на эти вопросы нет. В данном разделе вы познакомитесь с ответом в терминах статистики, а также с удивительным примером, иллюстрирующим этот ответ.

Соображения, которые приводят к нижеследующему статистическому правилу, очень просты. Они основаны на характеристическом свойстве П.с.в., обнаруженном в предыдущем разделе, - М(ХП) = D(Xn) = а.

Признак П.с.в. Пусть изучается некоторая конкретная д.с.в. X, распределение вероятностей которой неизвестно. Проведена серия опытов над этой с.в. и по их результатам вычислены оценки её математического ожидания и дисперсии: М* и D*. Если эти оценки оказались близки М*^ £>*, то весьма вероятно, что рассматриваемая с.в. X Пуассоновская*), параметром которой можно считать а = М*.

Данный признак, как и любое статистическое утверждение, не даёт абсолютной гарантии. Но его хорошо подтверждает практика. Вот удивительный пример.

Пример 1 (удары лошади). В отчётах старых армий приводились между прочими данными данные о числе солдат, убитых

*) Правильнее будет сказать, что с.в. X можно моделировать Пуассоновской.

ударом лошадиного копыта. В нашем распоряжении имеется достоверная сводка 200 годовых отчётов кавалерийских корпусов немецкой армии конца XIX века (таблица 4). Эта таблица взята из книги ([8] с. 170).

Таблица 4

Число смертей

0

1

2

3

4

5

6

I

Частота /,

109

65

22

3

1

0

0

200

В вероятностно-статистической терминологии ситуацию можно моделировать так. Имеется опыт - жизнь кавалерийского корпуса в течение года. После проведения опыта появляется значение случайной величины -число солдат, убитых лошадью в течение года. Жизнь другого корпуса в течение года можно рассматривать, как повторение опыта. Каждый отчёт, в котором указано число убитых солдат, можно рассматривать, как результат опыта.

Таблица 4 представляет распределение частот появившихся 200 значений случайной величины X. В верхней строке указаны различные значения х, с.в. X, в нижней - частоты /, появления этих значений.

Проверим выполнение признака П.с.в., сформулированного выше. Для этого надо вычислить статистическое среднее М* и статистическую дисперсию D*. Поскольку статистический материал представлен в виде ряда частот, удобно воспользоваться формулами (Г) и (2") (лек. 6, п. 4, 5). Считаем:

Оценки М* и D* оказываются чрезвычайно близки, разница между ними \м* -D*\ = 0,0021. Значит, согласно сформулированному выше признаку П.с.в., весьма вероятно, что наша с.в. X Пуассоновская с параметром а = 0,6.

Проверим эту гипотезу. Для этого составим статистический ряд распределения данной с.в. X и сравним его с теоретическим рядом распределения Пуассоновской с.в. Хп {а = 0,6), который у нас уже есть (таблица 3).

Таблица 4 представляет статистический ряд частот /,, а нам нужен ряд относительных частот /,/£, /=0,1,2,3,4,5. Считаем их:

Статистический ряд распределения св. x получается таким:

Таблица 5

0

1

2

3

4

5

i

1,/к

0,545

0,325

0,110

0,015

0,001

0,000

1

Сравнивая нижние строки таблиц 5 и 3, убеждаемся в из близости. Значит, действительно, данную св. x можно моделировать Пуассоновской.

Примечание. Близость распределений св. X и св. Хп нам приходится констатировать визуально, а значит, субъективно. В математической статистике есть методы объективной оценки этой близости, методы оценки степени правдоподобия гипотез. Это так называемые критерии согласия [2, с. 149-158; 3, с. 445-450]. Понять эти методы можно будет после изучения непрерывных св. (лек. 13).

Близость фактического и теоретического распределений св. x ещё более разительно проявляется, если сравнить таблицы фактических и теоретических частот. Как вы знаете, при большом числе опытов k относительные частоты близки к вероятностям, - (/,/&)- рп значит, теоретические частоты можно посчитать так: /. ~ к • pi. Сделаем это (теоретические вероятности pi берём из таблицы 3):

Округляем полученные частоты и записываем следующую сравнительную таблицу 6:

Таблица 6

Число смертей

0

1

2

3

4

5

Фактическая частота

109

65

22

3

1

0

Пуассоновская частота

110

66

20

4

1

0

Не поражает ли вас высокая точность совпадения частот? Получается, что такое чрезвычайно редкое и непредсказуемое явление, как гибель солдата от удара лошади, будучи рассмотрено в рамках очень большой массовости, обнаруживает таинственную закономерность, выражаемую точной формулой!! Почему так происходит? В каких других ситуациях можно ожидать проявление закона Пуассона? Как ни странно, математика может объяснить и это. Читайте следующий раздел.

Контроль 4. Св. Z - число рождений трёх и более близнецов в некотором родильном доме в течение года. Какое статистическое исследование надо провести, чтобы получить распределение вероятностей этой св.? Составьте чёткую программу исследования.

5. Когда биномиальная с.в. превращается в Пуассоновскую?

В начале лекции (п. 2) была подмечена связь между Пуассоновскими с.в. и биномиальными: при большом числе повторений опыта к многоугольник распределения б.с.в. становится очень похожим на Пуассоновский с параметром а-к- р (рис. 2). Теперь, зная статистические условия возникновения П.с.в., мы сможем более точно сформулировать и обосновать эту связь.

Теорема 1 (о связи между П. с. в. и б. с. в.). Имеется эксперимент, с которым связана биномиальная с.в. Хб, её параметры - к и р. Если число опытов к в эксперименте достаточно велико, а вероятность "успеха" р достаточно мала и их произведение к-р = а небольшое (Äp<10), то данная с.в. Хб близка к Пуассоновской Хп с параметром а = к-р.

Близость случайных величин понимается естественным образом, как близость вероятностей pi, соответствующих одинаковым значениям х, той и другой св..

Обоснование. Вероятность р мала =^ 1 - р ~ 1. Произведение к• р невелико => &• р~к-р-{1-р). Для биномиальной с.в. Хб последнее равенство означает, что M^D, а значит, будут близки и оценки M*^D*. Применяя статистический признак П.с.в., заключаем, что Хб « Хп(а = кр). •

Добавление. Формулировка теоремы и её обоснование, конечно, не строги, ибо остаются неопределёнными термины "мало" и "близко". Хотя естественный смысл этих терминов вам понятен. Теорема утверждает, что pt (хб) « р{ (хп), / = 0, 1, 2,..., или, учитывая, что левые вероятности определяются формулой Бернулли, а правые -формулой Пуассона, справедливо приближённое равенство:

Данное равенство следует из теоремы Пуассона (лек. 4, п. 6), где было строго доказано, что при к^>оо, р _> о, кр = а = const левая часть имеет пределом правую, а это, в сущности, и значит, что при достаточно больших к и малых р левая часть "близка" к правой (согласно смыслу понятия предела). Там же упоминалось ограничение к • р = а < 10.

Причина. Сейчас постарайтесь понять причину Пуассоновского распределения с.в. X - числа солдат из состава кавалерийского корпуса, убитых лошадью в течение года (пример 1). Дело в том, что эта с.в. имеет Бернуллиевскую структуру, она биномиальная. Убедимся в этом.

Истолкуем каждую встречу солдата с лошадью, как "простой" опыт. В этом опыте может произойти или не произойти событие А - смертельный удар лошади. Вероятность р события А чрезвычайно мала, но не нулевая. Данный "простой" опыт повторяется в году очень много раз - к раз,

в результате получается "сложный" опыт - эксперимент. С этим экспериментом и можно связать св. X - число / появлений события А при повторении "простого" опыта к раз.

Проверим теперь выполнение для св. X условий теоремы 1. Велико im kl Да. Мало ли pi Да, очень. Достаточно ли мало их произведение к • р ? Для биномиальной св. X это произведение есть математическое ожидание M и в примере 1 мы оценили его статистически -к• р = м ~М* = 0,61. Условие к-р<10 выполняется. Итак, все условия теоремы 1 соблюдены, следовательно, наша биномиальная св. X превращается в Пуассоновскую.

Подобным образом можно вскрыть Бернуллиевскую структуру во многих других массовых случайных явлениях.*) Главное, - чтобы вероятность р была очень мала. Такова, к примеру, св. Z - число рождений трёх и более близнецов, с которой вы имели дело в контроле 4. Поэтому закон Пуассона называют законом редких событий.

А если к не велико? В этом случае теорема 1 остаётся справедливой, - её обоснование не использует величину к, а использует только величину произведения к • р, которое должно быть небольшим (оно и будет таковым при малых р). Следовательно, второй случай, когда биномиальная св. превращается в Пуассоновскую, - небольшое к и очень малое р.

Между прочим, этот факт тоже был подмечен нами ранее (п. 2): многоугольник распределения св. Хп(а = 0,2) (рис. 1) похож на распределения св. Хб при малых р (лек. 7, п. 3, рис. 2).

Теперь мы можем сравнить конкретные распределения. Сравним ряд распределения Пуассоновской св. Хп(а = 0,2) (таблица 2) и биномиальной св. Хб(к = 2,р = ОД). Именно эти св. и надо сравнивать, согласно теореме 1, ибо связь между П.с.в. и б.с.в. устанавливается соотношением кр = а. Вероятности второй св. вычислим по формуле Бернулли:

Ряд распределения св. Хб(к = 2,р = 0,1) получается таким:

*) Когда-то (начало лекции 4) я говорил вам о практической и теоретической ценности схемы Бернулли? Теперь вы видите, к какому широкому классу массовых случайных явлений приложима эта схема. Вы убеждаетесь также, что эта схема стимулирует развитие теории, - вслед за формулой Бернулли появляется формула Пуассона и класс Пуассоновских св., предельных для биномиальных. В дальнейшем, при изучении непрерывных св., вы увидите связь между биномиальными и Гауссовскими распределениями и познакомитесь с новыми ценными теоретическими следствиями.

Таблица 7

Хб(к = 2,р = 0,1)

0

1

2

Р

0,81

0,18

0,01

Сравнивая таблицы 7 и 2, видим, что вероятности во второй строке очень мало различаются, - на одну-две сотых! Так что при малых к и р биномиальную с.в. Хб действительно можно моделировать Пуассоновской Хп. Остаётся заметить, что в отличие от случая больших к, моделирование при малых к не имеет практической ценности, ибо вероятности с.в. Хб легко найти по формуле Бернулли.

Контроль 5. Вскройте Бернуллиевскую структуру с.в. Z -числа рождений трёх и более близнецов в некотором родильном доме в течение года.

6. Поток событий

Нам осталось проанализировать один класс опытов, порождающих Пуассоновские с.в.

Пример 2 (поток вызовов на АТС). Чтобы исследовать пропускную способность автоматической телефонной станции (АТС), надо изучить динамику поступления вызовов в разные промежутки времени (в разное время суток) и за много дней. В сущности, надо провести много раз следующий опыт: выбрать какой-то отрезок времени [то;Т] (например, от 9 до 10 часов утра) и провести регистрацию последовательных моментов времени поступления вызовов - tl9t2,...,tm. Если делать это много дней, то число вызовов m будет непредсказуемо меняться и, следовательно, является случайной величиной. Оказывается, эта с.в. распределена по закону Пуассона, что будет доказано в конце лекции (п. 10).

Практически проверить этот факт можно так же, как в примере 1. Надо зафиксировать число вызовов за много дней (несколько месяцев) -ml9m2,...,rnk, вычислить их среднее арифметическое m*, ввести П.с.в. с параметром а = гп*, рассчитать её ряд распределения и сравнить его со статистическим рядом, - они окажутся очень близки.

Другие примеры. Подобные случайные величины возникают при исследовании ситуаций, связанных с появлением очередей, когда нужно выяснить эффективность обслуживания (телефонные станции, билетные кассы, ремонтные мастерские, справочные бюро, парикмахерские и пр., и пр.). И все они тоже оказываются Пуассоновскими.

Формула Пуассона является, таким образом, основой для решения задач, в которых надо определить число служащих или количество аппаратуры, необходимые для обслуживания данного вида запросов. Это может

быть число телефонисток на телефонной станции или число турникетов на станции "Метро" или еще что-то подобное. Такими задачами занимается современная ветвь теории вероятностей - теория массового обслуживания [3, гл. 19].*) Обобщение. Отвлекаясь от конкретного содержания примера 2, выделим его обобщённую структуру.

Определение 2. Потоком событий назовём опыт, который состоит в том, что в некотором временном интервале [го ; т] появляются какие-то события, следующие друг за другом в какие-то (вообще, случайные) моменты времени tX9 t2, t39....

Результатом данного опыта можно считать возрастающую последовательность чисел {tl9t29t39...} - моментов времени, когда появляются события потока. Эта последовательность, практически конечная, но теоретически может быть и бесконечной. Результат опыта тоже называют потоком событий. Сами события потока могут быть любой природы, но мы будем считать их в некотором смысле однородными, т. е. различающимися только моментами появления.

Моменты появления событий потока, как сказано в определении, вообще говоря, случайны. Но не исключается, что события могут следовать друг за другом через строго определённые промежутки времени. Такой поток называют регулярным. Понятно, что он редко встречается в реальности. К примеру, поезда в Метро иногда идут через равные временные интервалы в 2 минуты. Но, строго говоря, и здесь будут малые случайные колебания промежуточных интервалов между поездами.

Случайные величины, связанные с потоком. Введём св. КТ - число событий потока. Если поток не регулярный и события потока появляются случайно, то их число будет меняться при повторении опыта. Значит, КТ действительно, является случайной величиной. Её значения - неотрицательные целые числа х, =/, / = 0,1,2,3,.... Число значений может быть любым. Нам предстоит доказать, что вероятности этих значений определяются формулой Пуассона. Доказательство (п. 10) будет проведено не для любых потоков событий, а для потоков, удовлетворяющих трём условиям (стационарность, отсутствие последействия и ординарность). Поэтому следующие три раздела лекции посвятим этим трём новым понятиям.

*) В основе этой теории лежит формула и распределение Пуассона, которые, в свою очередь, возникли из схемы и формулы Бернулли. Видите, какие далёкие и ценные следствия выводятся по сей день из удачно выделенного научного объекта (схемы Бернулли). Подобные научные результаты называют фундаментальными и классическими. Очень интересные реальные задачи и их решение с помощью формулы Пуассона можно найти в старой книге [8, с. 179-188].

Добавление. С нерегулярным потоком событий можно связать и другие св., например, с.в. Тф - длительность интервала времени между двумя произвольными соседними событиями потока. Эта с.в. не дискретная, ибо длительность / может принимать любые значения из некоторого "сплошного" временного промежутка (о,-1). Эта с.в. появится у нас в дальнейшем, при изучении непрерывных с.в. (лек. 9, п. 2, 3, 5, лек. 11, п. 3, 5). Она принадлежит к классу показательных распределений, тоже связанных с формулой Пуассона. С конкретным потоком событий примера 2 можно связать ещё одну непрерывную с.в. 7}- длительность произвольного разговора. Она тоже встретится вам в дальнейшем.

Контроль 6. Изучается пропускная способность эскалатора станции Метро от 8 до 10 часов утра. Электрический глаз фиксирует время появления на ленте эскалатора каждого пассажира. Что будет результатом этого опыта? Можно ли считать этот результат потоком событий? Что значит - "повторить опыт"? Каковы, по вашему предположению, возможные значения с.в. КТ в этом случае? Сможете ли смоделировать эту с.в. Пуассоновской? Каков параметр а ?

7. Стационарный поток

Свойство стационарности потока это, другими словами, свойство его почти равномерности. Взгляните на рисунки За и 36, - какой из изображённых потоков вы назовёте более равномерным? Очевидно, первый, ибо у второго потока события идут вначале густо, потом реже.

Рис. 3а Рис. 36

Можно сказать точнее: если передвигать небольшой "интервальчик" длины т вдоль основного интервала [т0;Т] первого потока, то независимо от того, где он будет находиться, в него будет попадать примерно одно и то же число точек ti - событий потока (рис. За). Для второго потока это свойство не выполняется, - если "интервальчик" т находится в начале потока, в него попадёт гораздо больше точек, нежели, если он находится в конце (рис. 36).

Определение 3. Поток событий называется стационарным, если на любой интервал времени длины г, г а [го,г], в каком бы месте основного интервала [г0 ; Т] он ни находился, попадает при повторении опыта, в среднем, одно и то же число событий потока.

Пример. Представьте, что проведён эксперимент по исследованию пропускной способности АТС в интервале между 21 часом и 21 часом 15 минутами. Это значит, что в течение многих дней (опыт повторялся k раз) фиксировался поток вызовов во временном промежутке

[го,;Г] = [21; 21.15] и подсчитывалось их число т{. Результат: в первый день поступило тх вызовов, во второй - т2 вызовов, в третий - т3 вызовов, в последний к-тът день поступило тк вызовов. Среднее число вызовов в день на данном временном промежутке определится, как среднее арифметическое: т* = (l/k)-(mx +т2+... + тк).

Для наглядности давайте конкретизируем результат, считая, например, что среднее число вызовов т*=\50: m, =160, m2=157, m3=143, тк =151 (вы понимаете, конечно, что числа т1 выбирались произвольно, но около 150). В этих условиях стационарность потока означает вот что. Если разбить основной интервал на три пятиминутных - [21; 21.05], [21.05; 21.10], [21.10; 21.15] и посчитать среднее число вызовов на каждом из них, получится примерно по 50. Если разбить на 15 одноминутных "интервальчиков", то среднее число вызовов на каждом будет тоже примерно одинаково - по 10. И т. д.

Если увеличить длину основного промежутка, например, до [21; 24], поток потеряет свойство стационарности (почему?). •

Пропорциональность. Обратите внимание, - если мы уменьшаем (или увеличиваем) в несколько раз "интервальчики", разбивающие [т0 ; т], то среднее число событий потока в них тоже уменьшается (увеличивается) во столько же раз. В частности, на интервал длины 2т будет попадать, в среднем, в два раза больше событий, чем на интервал длины т. На интервал длины 0,2г будет попадать в 5 раз меньше событий, чем на интервал длины т.

Другими словами, в стационарном потоке среднее число событий, попадающих на интервал т, не зависит от его положения на основном интервале [т0 ; т], а зависит только от его длины т, причём, зависит пропорционально.

В частности, среднее число событий потока, рассчитанное для интервала т единичной длины, не зависит от его положения и, следовательно, постоянно для данного потока, - его называют интенсивностью, или плотностью потока, - обозначим её А. В нашем примере интенсивность потока вызовов Я = 10 (при условии, что за единицу времени выбрана 1 минута).

Зная интенсивность потока Я, легко рассчитать среднее число событий, попадающих на любой интервал длины г, - оно равно Я-г. Здесь проявляет себя свойство пропорциональности, отмеченное выше: если на единичный временной интервал попадает А событий потока, то на г-интервал, длины, например, г = 2 попадёт в два раза больше, т. е. Я • 2 событий.

В литературе понятие стационарности обычно даётся в несколько иной форме, использующей не статистическую, а более точную вероятностную терминологию:

Определение 3'. Поток событий называется стационарным, если вероятность попадания того или иного числа событий на временной интервал длины г не зависит от его положения на промежутке [т0, т], а зависит только от его длины г.

Контроль 7. Является ли поток событий контроля 6 стационарным (эскалатор идёт вниз)? Если да, то почему? Если нет, то как следует изменить основной промежуток, чтобы поток стал таковым? Как экспериментально проверить стационарность нового потока? Как определить его интенсивность?

8. Поток без последействия

"Физическая" независимость. Второе условие, которому удовлетворяет поток вызовов на АТС (пример 2), это независим ость вызовов друг от друга. Каждый вызов поступает, как правило, по своей собственной причине, не связанной с причинами, заставляющими других абонентов звонить по телефону в данный промежуток времени [г0 ; т]. Если же представить, что в какой-то момент происходит нечто чрезвычайное, что заставляет многих людей звонить по телефону в этот момент, то поток теряет свойство независимости (так же, как и свойство стационарности).

Итак, свойство независимости событий потока имеет в своей основе их "физическую" независимость. Каждое событие потока появляется в каком-то месте промежутка [го, т] в силу индивидуальных случайных причин, его причина не связана с другими событиями.

Из "физической" независимости вызовов на АТС следует, что если мы знаем, когда и сколько вызовов появилось до момента t09 то эта информация не позволяет нам предсказать, когда появится следующий вызов, много или мало вызовов поступят в ближайшее время. Всё это - дело случая. Можно сказать, что "будущее" потока не зависит от его "прошлого". Отсюда и термин - "поток без последействия".

Определение 4. Поток событий называется потоком без последействия, если для любых непересекающихся временных интервалов т и т" число событий, попадающих на один из них, не зависит от того, сколько событий попало на другой.

Пример 3 (поток пассажиров Метро). Рассмотрим поток пассажиров, входящих на эскалатор станции Метро с 8 до 10 часов утра. Думаю, вы не затруднились ответить в контроле 6, что этот поток не стационарный, ибо в начале потока события идут очень густо (многие люди спешат на работу), а к концу - реже. По этой же причине он - с последействием, ибо в начале потока многие события связаны друг с другом одной причиной.

Если руководствоваться определением 4, то при выборе соседних интервалов т и т" можно предсказать, что если в первый интервал попадает много событий, то и во второй тоже (в среднем!). Это значит, что интервалы выбраны в начале потока. Если же в первый интервал попало мало событий, то и во второй тоже. Эти интервалы выбраны в конце потока. Получается, что число событий, попадающих на один интервал, зависит от того, сколько событий попадает на другой. "Прошлое" определяет "будущее". Поток с последействием.

Ситуацию можно "исправить", если изменить основной временной промежуток с [8; 10] на [9;10]. Тем самым, мы исключим действие общей причины, заставляющей события идти густо в начале потока. Новый поток станет потоком без последействия (и стационарным, - события будут идти реже и равномернее). Если "исправить" ситуацию "в другую сторону", изменить основной промежуток на [8;8.30], то мы не исключим общую причину, поток останется "с последействием", но стационарность восстановится (события будут идти густо и достаточно равномерно). •

Другое определение. В дальнейшем, при доказательстве теоремы о Пуассоновском распределении св. Кт нам придётся использовать чуть иное, более точное определение потока без последействия. Вот оно:

Определение 4'. Поток событий называется потоком без последействия, если вероятность попадания m событий потока (т - любое) на произвольный временной интервал т не зависит от того, сколько событий попало на любой другой интервал г"\ не пересекающийся с первым.

Пояснение. Связь определений 4и4'- это связь между частотой и статистической вероятностью. Если провести много - к опытов (реализаций потока), то в интервал т будет попадать разное число событий потока. Подсчитаем частоту попадания на интервал г m событий и обозначим её 1т. Вычислим относительную частоту -1т /к, она будет близка к вероятности попадания m событий на интервал т, которая определяется, как вероятностный предел этой частоты: (/?)- lim (lm/k) = "р{кт =m). Поскольку, согласно определению 4, частота lm не зависит от того, сколько событий потока попало на другой интервал т", то и вероятность v(kt = m) не зависит от этого.

Контроль 8. Обладает ли поток пассажиров, выходящих из Метро между 8 и 10 часами (эскалатор идёт вверх) свойствами а) отсутствия последействия, б) стационарности? Можно ли изменить основной промежуток [8; ю] так, чтобы изменились данные свойства потока?

9. Ординариный поток

Третье свойство (ординарность) потока вызовов на АТС (пример 2) заключается в том, что вызовы идут поодиночке, а не парами или тройками. Вызовы отделены друг от друга временными интервалами, которые могут быть очень малыми. Альтернатива, - когда события потока оказываются жёстко сцепленными, например, в случае потока клиентов Загса. Поток клиентов парикмахерской можно считать ординарным.

Следствие ординарности. Поскольку максимально возможное число вызовов на промежутке [Т0;Т] практически ограничено, то, разбив его на достаточно большое количество мелких "промежуточков" Atl9At29...,Atk, можно считать, что при любой реализации потока в каждый промежуток Atf попадёт или ровно одно событие, или ни одного.

Два и более событий могут, конечно, попадать на промежуток Atj, но это будет происходить очень редко. Каждое из этих двух событий ( А - на промежуток А/, попадает ровно одно событие потока, В - более одного) имеет свою вероятность, но при достаточно малом Att вторая вероятность, очевидно, пренебрежимо мала, сравнительно с первой.*) Данное следствие описательного определения ординарности (события потока идут поодиночке) позволяет дать более точное определение:

Определение 5. Поток событий называется ординарным, если для любого достаточно малого временного промежутка At вероятность появления в нём двух и более событий потока пренебрежимо мала, сравнительно с вероятностью появления одного события.

Контроль 9. Рассмотрите два потока: поток покупателей, подходящих к кассе магазина, и поток отходящих от этой кассы. Выполняются ли для этих потоков свойства стационарности, отсутствия последействия и ординарности? При каких дополнительных предположениях?

10. Число событий простейшего потока подчиняется закону Пуассона

Настал момент, когда мы сможем теоретически доказать, что в примере 2 случайная величина Кт (число вызовов на АТС) обязана быть Пуассоновской. И так будет всегда, когда поток простейший, т. е. когда он обладает тремя вышеопределёнными свойствами. Такой поток и называют простейшим, или Пуассоновским.

*) При Atj —» 0 вероятности р(а) и р(в) становятся бесконечно малыми и вторая вероятность - бесконечно малая более высокого порядка, нежели первая. Такова точная замена фразы: "вторая вероятность пренебрежимо мала, сравнительно с первой".

Теорема 2 (о Пуассоновском распределении с. в. Кт). Пусть на временном интервале [то;Т] возникает поток событий и рассматривается случайная величина Кт - число событий этого потока. Если поток обладает свойствами стационарности, отсутствия последействия и ординарности, то св. Кт - Пуассоновская с параметром я, равным среднему числу событий этого потока, появляющихся на интервале [г0 ; т].

Доказательство состоит: 1-2) в приближённой замене св. Кт биномиальными св. Х%\ вероятности значений которых считаются по формуле Бернулли; 3) в последующем переходе в этой формуле к пределу (при к -> оо)5 в результате чего появится формула Пуассона. Кратко, -

ПтХ(бк)=Кт.

к—>оо

1) Разобьём интервал [то ; т] на большое число к равных мелких частей А/,, At2, Atk так, чтобы при любой реализации потока на каждом At, могло появится или нет только одно событие потока. Такое разбиение возможно, согласно свойству ординарности.

Возьмём произвольный "интервальчик" Atn обозначим через а событие, состоящее в появлении на нём ровно одного события потока, и рассчитаем вероятность этого события - Р(а) = рк (она зависит от числа к, - чем больше к, тем меньше вероятность).

Для этого введём новую св. Kt - число событий потока, возникающих в Att. Её математическое ожидание Mf приближённо равно среднему числу событий потока в Att (лек. 6, п. 4). Поскольку длина Att в к раз меньше длины [го;Г], в котором, по условию теоремы, возникает, в среднем, а событий потока, то в силу стационарности (свойство пропорциональности), на "интервальчик" Att попадает, в среднем, а/к событий потока и, следовательно,

М, - а/к. (9)

С другой стороны, математическое ожидание св. Кп которая теоретически принимает любые значения / = 0,1,2,..., определяется по общей формуле так:

Но "интервальчики" Att выбраны нами столь малыми, что вероятности Р(Х =2), Р(Х =3),... пренебрежимо малы, сравнительно с p(Ki =1) (определение ординарности). Поэтому

(10)

Обозначение (X=l) - иное обозначение события А. Из (9) и (10) следует

(11)

Остаётся заметить, что, поскольку в вышепроведённом рассуждении "интервальчик" А/, был произвольным, взятым из данного разбиения [то ; т] на к частей, то вероятность появления ровно одного события потока на каждом Att одна и та же, и она определяется равенством (11). Т. е. вероятность рк не меняется при переходе от одного àtt к другому (при фиксированном к).

2) Введём с.в. xik) - число / "интервальчиков" Atn на которых появилось ровно одно событие потока. Очевидно, что с.в. Х{бк) и с.в. Кт связаны с одним опытом (потоком на [г0;Г]) и принимают при каждой его реализации одинаковые значения.*) Напомню, что, в силу ординарности, на каждом Att может появиться не более одного события потока.

Убедимся в биномиальности с.в. Х^.

Разбиение промежутка [т0;Т] на k частей A/,, At2, Atk разбивает данный поток на k элементарных стационарных потоков с одинаковыми временными интервалами А/,, / = 1,2,3,...Д. Поэтому данный опыт (поток) можно рассматривать, как повторение элементарного опыта k раз.

В каждом элементарном потоке Atf может появиться или нет событие А (ровно одно событие потока) с вероятностью рк = а/к, приближённо вычисленной выше (формула (11)). Эта вероятность не меняется от опыта к опыту, она одинакова для всех А/,.

С.в. Х{бк) мы определили как число / появлений события А при повторении опыта (элементарного потока) к раз. Все условия биномиальной с.в. (лек. 7, п. 2) выполняются.

3) Итак, имеем биномиальную с.в. Х{бк\ "близкую" к данной с.в. Кт.

Что значит "близкую"? Выше мы отмечали, что при любой реализации опыта обе с.в. принимают одинаковые значения. Однако, вероятность события А найдена приближённо, - рк ~а/к, поэтому вероятность р(х{гк) =/), вычисленная по формуле Бернулли, будет чуть отличаться от р{КТ =/).**) Отличие тем меньше, чем меньшими взяты "интервальчики" Ati9 т. е. чем

*) Строго говоря, это утверждение не совсем верное, - на Atf могут появляться и более одного события потока, но чрезвычайно редко. Такими событиями мы условились пренебрегать, в силу их очень малой вероятности.

**) Эти отличия будут чуть усиливаться также и за счёт проигнорированной нами возможности появления двух событий на Atf. С ростом k те и другие будут исчезать.

больше их число к. Следовательно, точное значение этой вероятности можно получить в пределе:

Займёмся этим пределом.

Возможные значения св. Х{бк): 1 = 0,1,2,3,....Д. Вероятности этих значений определяются формулой Бернулли (учтите, - рк ~а/к):

(12)

Прежде чем искать предел, сделаем в (12) несложные преобразования:

Теперь устремим к <*>. При этом / остаётся неизменным, значит, первый множитель есть константа. Следующие множители, за исключением последнего, имеют пределом единицу (именно потому, что / фиксировано). Число этих множителей тоже не меняется и равно /. Следовательно,

Вот как из формулы Бернулли появляется формула Пуассона с замечательным числом е. Между прочим, этот предельный переход мы уже делали, когда доказывали теорему Пуассона мелким шрифтом (лек. 4, п. 6).

Следствие. Если интенсивность Пуассоновского потока на [г0;т] равна Лит- меньший интервал гс[го;т] (через т обозначен и интервал, и его длина), то среднее число событий на т есть Ят и вероятность pT(1) того, что на т появится / событий потока, можно рассчитывать по формуле Пуассона

(14)

Данное следствие и формула (14) часто используется при решении задач. Значения правой части при различных Хт можно найти в таблице функции Пуассона (приложение 2).

Добавление. Не следует думать, что Пуассоновские с.в. появляются только в случае простейшего временного потока событий. Есть и другие ситуации, аналогичные по своим свойствам простейшему потоку, в которых наблюдаются Пуассоновские распределения. К примеру, представьте, что к длинному причалу последовательно причаливают лодки и закрепляются в различных точках причала. Получается поток случайных точек, располагающихся не на временной оси, а на линейном промежутке [0; b]. Можно представить аналогичное "поле точек" на плоскости или в пространстве. Такое поле создают космические частицы, попадающие на поверхность спутника. Попытайтесь сами обобщить на эти ситуации свойства стационарности, ординарности и отсутствия последействия, а также понятие интенсивности потока, - это не трудно. Между прочим, теорему 2 можно доказать и без требования стационарности.

Интересно, что поток моментов клёва рыбы на удочку в водоёме, в котором мало рыбы, Пуассоновский. Постарайтесь доказать это.

Контроль 10. Докажите следствие теоремы 2.

11. Упражнения

1. Нарисуйте эскиз многоугольника распределения П.с.в. для значения параметра а = 0,8. Пользуясь таблицей приложения 2, составьте ряд распределения и постройте многоугольник распределения. Согласуется ли он с вашим эскизом? Найдите <т, постройте трёхсигмовый интервал (М-Ъо\ M + Ъо) и с помощью ряда распределения определите вероятность попадания данной П.с.в. в этот интервал. Сравните найденную вами вероятность с той, которую указывает правило трёх сигм. Какова разница?

2. Ответьте на все вопросы предыдущего упражнения при а = 4.

3. На телефонную станцию поступает, в среднем, 30 вызовов в течение часового промежутка времени. Найти вероятность того, что в течение минуты поступит а) ровно 2 вызова; б) не более двух; в) хотя бы один.

Отв.: 0,0758; 0,9856; 0,3935.

4. Будет ли поток заказов, поступающих на диспетчерский пункт такси простейшим? Обоснуйте. Как определить среднее число вызовов в минуту? Считая, что интенсивность потока (в минуту) равна 3, найдите вероятность того, что за 2 минуты поступит а) 4 вызова; б) менее четырёх; в) не менее 4-х. Отв.: 0,1339; 0,1512; 0,8488.

5. При работе ЭВМ время от времени возникают неисправности (сбои). Можно ли считать поток сбоев за сутки простейшим? Обоснуйте. Считая, что среднее число сбоев за сутки равно 1,5, найдите вероятности

следующих событий: А - за двое суток не будет ни одного сбоя; б) В - за сутки произойдёт хотя бы один сбой; в) С - за неделю (6 дней) произойдёт не менее шести сбоев. Отв.: о,050; 0,777; 0,884.

6. Поток грузовых железнодорожных составов, прибывающих на сортировочную горку, имеет интенсивность Л = 4 состава в час. Найдите вероятность того, что а) за 0,5 часа прибудет один состав; б) хотя бы один; в) не менее трёх. Отв.: 0,2707; 0,8647; 0,3213.

7. На ткацком станке нить обрывается, в среднем, 0,375 раза за час работы станка. Найдите вероятность того, что за смену (8 часов) число обрывов нити не выйдет за пределы промежутка [2; 4]. Отв.: 0,6160.

8. Вероятность попадания в самолёт выстрелом из ружья равна 0,001. По самолёту ведёт огонь подразделение, общее число выстрелов 5000. Какова вероятность а) ровно одного попадания; б) двух попаданий; в) хотя бы одного попадания; г) не менее двух? Отв.: 0,0337; 0,0842; 0,9933; 0,9596.

9. В тесто, приготовленное для выпечки 1000 булочек, засыпают 10000 изюминок и тщательно перемешивают. Какова вероятность того, что в случайно выбранной булочке окажется 5 изюминок; б) не больше пяти; в) меньше десяти; г) не меньше 10-ти? Отв.: 0,038; o,067i; о,46; 0,54.

10. Искусственный спутник Земли может случайным образом сталкиваться с метеоритами. Метеориты, сталкивающиеся со спутником, образуют Пуассоновский поток с плотностью у = 0,1 (метеоритов в сутки). Метеорит, попадающий в спутник, пробивает его оболочку с вероятностью рх = 0,02. Метеорит, пробивший оболочку, выводит из строя аппаратуру с вероятностью р2 =0,07. Найдите вероятности следующих событий: А - за месяц (к = 30 суток) полёта спутника его оболочка будет пробита; В - будет выведена из строя аппаратура; С - будет пробита оболочка спутника, но аппаратура не пострадает. Отв.: \-е~у'к'Рх ; \-e~rk'PvPl ; e~rk'PvPl -e~r'k'Pî.

11. Розничная лавка с ограниченными возможностями хранения продуктов продаёт, в среднем, 10 пакетов галет в неделю. Запас обычно возобновляется каждый понедельник утром. Требуется установить такой стандарт еженедельного пополнения запаса, чтобы не более 1% заявляемых требований встречали отказ.*) Отв.: 16 пакетов.

*) Формулировка задачи взята из старой книги [8, с. 181]. Там же проведено интересное решение с изумительным комментарием. В книге много других реальных задач, требующих применения закона Пуассона и связанных с переменной нагрузкой телефонной сети и с радиоактивным распадом вещества [8, с. 183-191].

ЛЕКЦИЯ 9

НЕПРЕРЫВНЫЕ С.В. ЗАКОН РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ

Тот факт, что случайные величины делятся на дискретные и непрерывные, вам известен (лек. 5, п. 4). До сих пор мы имели дело только с дискретными св. Этой лекцией начинаем изучение непрерывных св.

Непрерывные св. чаще возникают в прикладных исследованиях. Они более сложные и для своего описания и исследования требуют более сложного математического аппарата (функции, интегралы).

Центральное понятие этой и последующих лекций - закон распределения вероятностей св. Вы знакомы с этим понятием для дискретных св. -ряд распределения (таблица) и был законом распределения дискретной св. Таблица содержит всю вероятностную информацию о св. и позволяет решать разнообразные практические задачи.

Распределение вероятностей непрерывной св. нельзя задать таблицей, оно задаётся функцией. Ваша цель- хорошо понять, как возникает эта функция, которую называют законом распределения.

1. Дискретные и непрерывные св. (различие)

В вашем опыте есть много примеров дискретных св. Но почти нет непрерывных. Поэтому начнём с набора примеров непрерывных св.

Но помните ли вы, что такое случайная величина (св.)? Это переменная величина, связанная с некоторым опытом, различные значения которой появляются случайным образом в результате проведения опыта. И дискретная, и непрерывная св. подчиняются этому определению.

Напомню, что различие между ними - во множестве значений. Если значения св. можно отделить друг от друга интервалами, это дискретная величина. Если значения св. заполняют "сплошь" (непрерывно) некоторый промежуток, - непрерывная величина.

Пример 1. Опыт состоит в том, что производятся 3 выстрела из орудия в цель. Предполагается, как обычно, что опыт можно повторять много раз без изменения основных условий (одно и то же орудие, расстояние до цели, наводчик, его состояние и пр.).

В зависимости от задач, которые решаются посредством этого опыта, можно рассматривать разные случайные величины. Если необходимо оценить качество стрельбы опытного наводчика, то имеет смысл ввести св. К

- число попаданий. С.в. К относится к классу биномиальных. Ряд распределения этой с.в. позволит прогнозировать, как часто следует ожидать то или иное число попаданий.

Но чтобы построить ряд распределения, придётся сначала определить статистическую вероятность поражения цели одним выстрелом. Для этого нужно будет сделать много выстрелов и посчитать относительную частоту попадания, которую и принять за приближённую вероятность. После этого по формуле Бернулли рассчитываются вероятности значений с.в. К и строится ряд распределения, на основе которого и делаются прогнозы. Подобные задачи вы решали.

Если орудие попадает редко, качество стрельбы придётся оценивать иначе. Можно, например, ввести с.в. Smin - наименьшее расстояние от точек трёх разрывов до цели. На практике предпочитают другую с.в S -среднее расстояние (среднее арифметическое трёх расстояний).

Очевидно, все с.в. - К, Smm, S - случайные, ибо нельзя однозначно предсказать результат опыта. Нетрудно понять, что первая с.в. К - дискретная, другие две - непрерывные. Поясню.

Множество всех возможных значений с.в. К состоит из четырёх чисел - {0;1;2;3}. Это множество дискретное, его элементы можно отделить интервалами (0;l), (1;2), (2;3), не содержащими значений с.в. К (рис. 1).

Множество значений с.в. S (так же, как и Smm) есть промежуток [0; s)*), где s - максимально возможное отклонение разрыва снаряда от цели. Значения с.в. S заполняют этот промежуток "сплошь", - любое значение из этого промежутка может быть значением с.в. (рис. 2). Следовательно, с.в. S и с.в. Smm - непрерывные с.в. •

Замечание 1. Данный пример показывает, что в одном и том же опыте, в зависимости от его целей, можно по-разному вводить случайные величины. Если надо отработать корректировку стрельбы, то удобнее ввести пару св.: Sx - поперечное отклонение снаряда от цели (вправо-влево) и Sy - продольное (перелёт-недолёт).

Замечание 2. Не следует думать, что дискретные множества обязательно конечны. Если, к примеру, изменить опыт и стрелять до первого попадания, то возникает новая с.в. кж — число выстрелов до первого попадания (лек. 5, п. 9). Множество её значений тоже дискретно {l;2;3;..l;...}**) и бесконечно.

Рис. 1 Рис. 2

*) Правый край промежутка [0; s) нельзя определить точно и можно сказать, что он "размыт". Поэтому употребляется круглая скобка. Раньше мы уже обращали на это внимание (лек. 5, п. 4, примечание 1).

**) Подобные множества, элементы которых можно расположить в последовательность (не обязательно монотонную) называются в математике счётными. Они не всегда дискретны, - например, множество всех рациональных чисел сегмента [0; 1] счётно, но не дискретно.

Замечание 3. Выше мы почти как очевидное приняли, что все рассмотренные нами величины случайные. Вы считали само собой разумеющимся, что орудие стреляет с промахами. А если стрельба ведётся самонаводящимися ракетами? Тогда все наши "с.в." перестают быть случайными, а станут детерминированными и постоянными, будут принимать в любом опыте одно значение - нуль. Вот как существенны условия опыта, - их надо осознавать.

В заключение сформулируем ещё раз основные определения*).

Определение 1. Случайная величина (кратко - с.в.) - это переменная величина, связанная с конкретным опытом, значения которой определяются случайными исходами этого опыта.

Определение 2. Случайная величина называется дискретной (д.с.в.), если множество всех возможных её значений или конечно, или может быть расположено в виде бесконечно возрастающей (или убывающей) последовательности.

Определение 3. Случайная величина называется непрерывной (н.с.в.), если множество всех её значений непрерывно заполняет некоторый промежуток (он может быть и неограниченным).

Примечание 1. Строгое теоретическое определение непрерывной с.в. отличается от приведённого - оно требует не только непрерывности множества значений св., но и непрерывности распределения их вероятностей. Что значит "распределение вероятностей с.в." - вы узнаете в этой лекции. Причины, по которым требуется непрерывность этого распределения, я вам сейчас объяснить не могу. Да это и не нужно. Но о существовании иного определения надо знать, - оно может встретиться вам при чтении литературы. И надо понимать, что новое определение уточняет данное выше.

Напомним, что существует и другое, более строгое определение случайной величины (лек. 5, п. 3). Этим формальным точным определением мы будем пользоваться для доказательств.

Определение 1'. Случайной величиной называется □ функция на полной группе несовместимых событий опыта.

Контроль 1. Опыт состоит в том, что орудие стреляет в мишень один раз. Введём некую "упрощённую" величину S0 так: если снаряд разрывается за целью (перелёт), то S0 принимает значение 5, = 1 ; если недолёт, то s2 = -1 ; если попадание, то s3 = 0. Покажите, что эта величина является случайной в смысле обеих определений с.в. Каково множество её значений, - дискретное или непрерывное? В чём отличие с.в. S0 от с.в. S ?

*) Эти определения были даны в лек. 5, п. 2-4. Мы повторяем их здесь для удобства читателя, как итог рассмотренных выше примеров.

2. Два примера непрерывных случайных величин (н.с.в.)

Как уже было сказано, цель лекции - ввести функцию, характеризующую распределение вероятностей св. К этому не простому понятию мы подойдём через два характерных примера.

Пример 2. Рассмотрим св. Тм - время ожидания поезда в метро. Задумаемся - что это значит? Где здесь опыт? Какие возможны значения св.? Дискретно множество значений или непрерывно?

Опыт состоит в том, что в случайный момент времени вы спускаетесь в метро, выходите на платформу и засекаете время ожидания ближайшего поезда. Поймите правильно - фиксируется не время прибытия поезда, а отрезок времени, в течение которого вы его ждёте, отрезок времени, протекший от момента вашего выхода на платформу (пусть, для определённости, к первому вагону) до момента прибытия (остановки) поезда.

Длина t отмеченного вами промежутка времени и будет значением св. Тм, появившимся при выполнении опыта. При повторении опыта, наверное, появится другое значение t'. Ясно, что эти значения нельзя предсказать заранее. Т. е., налицо все три условия определения 1: опыт, различные числовые значения, которые появляются в опыте, и случайность значений.

Вы знаете, что, говоря об опыте, надо осознавать основные условия опыта, которые могут существенно влиять на результат. Поезда метрополитена ходят с разной частотой в разное время суток - в часы "пик" часто, ночью реже. Нормальным считается режим, когда поезда идут друг за другом регулярно через две минуты. Добавим это условие. Тогда значения св. Тм будут попадать в сегмент [0;120], при условии, что время измеряется в секундах.

Вопрос - "каково множество всех значений св. Тм ?" - следует обсудить. Если вы измеряете время секундомером с делениями в одну секунду, то возможных значений будет 121: {0;1;2;...;120} - это множество дискретное. Если секундомер имеет десятые доли, то число значений резко увеличивается - их будет 1201. Ясно, что строить дискретную модель с таким огромным множеством значений не разумно. Поэтому будем считать, что св. Тм имеет бесконечно много "точных", идеализированных значений, которые непрерывно заполняют весь сегмент [0;120]*). Следовательно св. Тм - непрерывная.**)

*) Множество всех точек сегмента [я;6], а также интервала (а\Ь) нельзя расположить в последовательность. Такие множества называют континуумом (от лат. continuum - сплошной, непрерывный). Напомним, - сегмент [а;Ь] включает концевые точки, интервал (а\Ь) не включает. Иногда сегмент называют отрезком.

**) Вопрос о дискретном и непрерывном моделировании реальности обсуждался в лекции 5, п. 4.

Пример 3. Работа АТС состоит в том, что она принимает вызовы и соединяет абонентов. Для рациональной организации работы надо знать, как часто будут поступать вызовы в то или иное время суток. Возникает св. Тф - интервал времени между двумя соседними телефонными вызовами на АТС. Уточню.

Опыт состоит в том, что в определённый период суток, например, с 8 до 9 часов утра, оператор АТС выбирает случайно какой-то телефонный разговор и фиксирует промежуток времени от момента его начала (точнее, с момента, когда поступил вызов) до момента следующего за ним вызова. Результатом опыта будет некоторое число t - время, протекшее между двумя вызовами.

При повторении опыта (выбор другого разговора в этот же день или на следующий день) может появиться другое значение t'. Предсказать, какое значение появится, конечно, нельзя.

Понятно, что чаще будут появляться небольшие и очень малые значения t. Но не исключено, что могут появиться и очень большие промежутки между вызовами. Теоретически допустимо появление даже часового промежутка (первый вызов в 8 часов, а следующий в 9). Поэтому множеством всех возможных значений св. Тф будем считать интервал (0;60), при условии, что единица измерения времени - минута. Следовательно, Тф - непрерывная св.

Контроль 2. Автоматический станок производит детали заданного размера /0. Понятно, что реальные размеры деталей / будут немного отличаться от /0 и друг от друга из-за многочисленных случайных колебаний технологического процесса. Рассмотрите две св.: L - размер / детали, сделанной станком, и AI - отклонение размера детали от номинала, т. е. разность /-/0. Каковы множества значений той и другой св.? Размыты их границы, или нет? Как определить границы приближённо? Дискретны или непрерывны св. L и AL ?

3. Распределение появившихся значений с.в.

Случайные величины, рассмотренные выше, отличались друг от друга промежутками значений: [0; 120] - для Тм ; (0;60) - для Тф ; (/0 - е\ /0 + е) — для L. Эти различия не существенны. Главное различие обнаруживается при многократном повторении опыта - появляющиеся значения по разному распределяются на промежутках.

Значения св. Тм будут почти равномерно возникать в разных местах сегмента [0;120]. Значения св. Тф густо заполнят начало интервала (0;60) и значительно реже его правую половину. Значения св. L окажутся плот-

ными в средней части интервала (/0 - е\ /0 + е) и весьма редкими по краям (почему?). Чтобы увидеть это, надо провести статистическое исследование. Проследим порядок действий на примерах.

Пример 2 (продолжение). Допустим, вы живёте в столичном городе и пользуетесь транспортом "метро" 5 раз в день, когда интервалы движения поездов 2 минуты. За месяц вы регистрируете & = 150 значений с.в. Тм и получаете простую статистическую совокупность: t{]\ t{2\ /(150) (напомню, верхние индексы используются для обозначения значений св., появившихся в серии опытов).

Чтобы увидеть, как значения t(j) распределяются на разных участках промежутка [0;120], надо провести группировку (см. лек. 5, п. 4). Разбейте сегмент [0;120], например, на 8 равных участков: Д/,=[0;15), А/2 = [15;30), Д/8 =[105;120]. Посчитайте, сколько значений t[j) попадает в каждый из участков àtn - получите частоты kl9 k29 ks (чему равна их сумма?). Вычислите относительные частоты kjk, / = 1,2,...,8. Занесите всё это в таблицу 1 - она называется группированным статистическим рядом. Четвёртая строка оставлена для высот столбиков гистограммы А. (о том, как вычисляются эти высоты, скажем позже).

Таблица 1

Выше мы наметили схему первичного статистического исследования. Реально провести его вы, наверное, не сможете. Но попробуйте ответить на вопрос: как должны распределиться значения t(l) по участкам Attl

На каких участках время ожидания поезда будет появляться чаще? Какие значения t(j) появятся чаще - маленькие или большие? Как вам кажется?

Может быть, подумав, вы решите, что до опыта (априори) ответить на такой вопрос невозможно. Тогда поставлю его иначе: видите ли вы причины, которые заставили бы значения tu) появляться в каком-то из участков Ati значительно чаще (или реже), нежели в других? И вы, наверное, согласитесь, что таких причин, по-видимому, нет.*) Следовательно, логично предположить, что в каждый из участков At, значения t(j) должны попадать примерно одинаковое число раз. По-

*) Если допустить, что вы знаете расписание движения "М"-поездов и можете скрупулёзно руководствоваться им, то в вашем эксперименте будут чаще возникать малые значения. Такая ситуация, конечно, не реальна.

скольку число участков 8, а число опытов к = 150, то kÈ, ~ 150:8 = 18,75. Значит, почти все частоты к1 должны принимать значения 17,18,19,20.

Это прогноз, но прогноз вероятностный. Если провести реальный эксперимент (серию опытов), то с большой вероятностью прогноз подтвердится. Вместе с тем, вы должны понимать, что не исключаются и "плохие" серии опытов, в которых некоторые частоты к 1 будут далеки от прогнозируемых (на рис. 3 и 4 такова третья частота). Но такие серии редки. В дальнейшем вы научитесь численно оценивать вероятность появления подобных "плохих" экспериментов.

Итак, мы поняли закономерность, которой подчиняется распределение значений св. Тм: они почти равномерно распределяются по всем участкам сегмента [0;120]. На рис. 3 условно изображено подобное распределение. Более точно изобразить его затруднительно из-за большого числа значений (к = 150).

Точный наглядный образ даёт гистограмма (рис. 4). Напомню, как она строится. Над каждым промежутком А/, строится прямоугольник, площадь которого равна соответствующей относительной частоте Si =к1/к (в нашем примере все Si « 1/8) и, следовательно, высота прямоугольника вычисляется по формуле hj =Sj/Atj =kj/(k-Atj) (в нашем примере все /г, ^1/(8-15) = 1/120). Характерная особенность гистограммы св. Тм - её верхние основания проходят близко от прямой h = 1/120 (рис. 4). Не забудьте важную особенность любой гистограммы - сумма площадей её "столбиков" равна единице (почему?).

Пример 3 (продолжение). Случайная величина Тф - время между двумя произвольными соседними вызовами на АТС от 8 до 9 часов утра.

Допустим, что мы проделали статистическое исследование, такое же, как в примере 2: каждый день фиксировали несколько значений св. и в течение месяца набрали к = 300 появившихся значений. Как мы уже отмечали, среди этих значений очень много малых (рис. 5). Поэтому при группировке надо делить интервал (0; 60) на достаточно мелкие части, например, на 20 трёхминутных промежутков А/, (или мельче). Частоты ki и относительные частоты kjk будут большими в первых интервалах и очень ма-

Рис.З

Рис.4

Рис.5

Рис.6

лыми, даже нулями в последних. Поэтому гистограмма будет иметь вид, условно показанный на рис. 6.

Заметим, - если проводить эксперимент в другое время суток, например, от 22 до 23 часов вечера, то распределение значений t(j) изменится, длительные промежутки между вызовами будут возникать чаще. Однако, общий характер распределения останется прежним - сначала густо, потом редко. "Горка" станет ниже и более пологой (нарисуйте вид гистограммы).

Контроль 3. На рис. 4 высота третьего "столбика" гистограммы равна h3 «1/150. Сколько значений с.в. Тм появилось в третьем промежутке Ах3? Определите приблизительно число значений х(/) с.в. Тм, появившихся в каждом из промежутков Ах,, г = 1,2,...,8 и заполните таблицу 1.

Указание. Частоты kt найдите приближённо по рисунку 4 так, чтобы их распределение соответствовало площадям St "столбиков" гистограммы. Проконтролируйте правильность ваших частот суммированием.

4. Распределение вероятностей с.в. ТМ

Ближайшая наша цель - получить картину распределения не частот, а вероятностей. Для этого надо увеличивать число опытов к и следить за изменением гистограмм, предельное положение которых и покажет, как распределены вероятности.

Пример 2 (окончание). Взгляните ещё раз на рис. 4. Изображённая на нём гистограмма получена (условно) в результате серии из £ = 150 опытов над с.в. Тм и отражает распределение частот ki9i = 1,2,...,8 в этой серии.

Рис. 7 Рис. 8

Если провести другую серию с тем же числом опытов, то возникнут иные частоты и вид гистограммы несколько изменится (рис. 7). Однако характер распределения частот в обеих сериях будет сходным - высоты "столбиков" гистограммы будут примерно одинаковыми, близкими к /2 = 1/120.

Можете ли вы предсказать, как будут изменяться гистограммы, если неограниченно увеличивать число опытов и проводить серии из 300, 450, 600 опытов и т. д. Думаю, сможете, - вы скажете, что верхние основания столбиков станут приближаться к прямой линии h = 1/120 и в пределе сольются с ней (рис. 8). Верно. А почему так произойдёт? Поясню на примере первого "столбика".

Площадь первого "столбика" равна относительной частоте события А = (тм <е [0; 15)) - "ждал менее 15 сек.", т. е. s, = А,/150. Если увеличивать число опытов к -> оо 5 то относительные частоты к} /к события А будут меняться и, по закону стабилизации частот, будут приближаться к вероятности р(л), т. е. kjk—^—>р(л)*). Вероятность эту легко рассчитать, учитывая равномерность распределения частот: с ростом к они уравниваются, т. е. к} ~ к2 «...«£8 ~k/S, значит, kjk—^-»1/8 и р(л)=1/8. Высоты первого "столбика" с ростом к будут приближаться к 1/120, что следует из А, = s, /д/, = кх /(к • Л/,) « l/(8 • 15) = l/l20. Это рассуждение проходит для любого "столбика" - все высоты приближаются к одному числу 1/120, а верхние основания "столбиков", следовательно, приближаются к прямой h = 1/120. •

Ступенчатая функция f*(x), график которой составляют верхние основания гистограммы, называется статистической плотностью распределения частот, её график выделен на рис. 7 жирными "ступеньками". Предельная функция f(x) называется плотностью распределения вероятностей (рис. 8). Общие определения этих функций будут даны позже (п. 6). Для св. Тм формула плотности распределения получена выше:

(1)

Замечание. У вас может возникнуть вопрос: о распределении каких вероятностей речь? Взгляните на рис. 7 и 8 и сравните первые "столбики". Площадь "столбика" гистограммы равна относительной частоте события А = (тм е [0; 15)) - "ждал менее 15 сек.". Площадь соответствующего "столбика" на рис. 8 равна пределу этой частоты, т. е. вероятности того же события. Вот и получается, что график функции f(x) отражает распределение вероятностей событий (тм е Л/,), / = 1,2,...,8. Все эти вероятности одинаковы и равны 1/8. Распределение вероятностей строго равномерное, в то время, как распределение частот почти равномерное (случайное). •

*) Напоминаю, - стрелочкой ———> обозначается вероятностный предельный переход. В нашем примере - реальное приближение относительных частот kjk к вероятности р(л) при неограниченном увеличении числа опытов к -> °° (см. лек. 1, п. 2).

Неслучайность предельной функции. Обращаю ваше внимание на очень важный факт: гистограмм у с.в. много, а предельная функция f(x) одна. Выше мы получили эту функцию (р)-предельным переходом (к-><*>) от гистограмм при неизменном разбиении сегмента [0; 120] на 8 равных частей. Если бы мы разбивали основной промежуток не на восемь, а на любое другое число "интервальчиков" Atn то гистограммы изменили бы число "столбиков", но их верхние основания по-прежнему приближались бы к прямой h = 1/120.

Можно сказать, что статистические функции распределения (как и гистограммы) отражают свойства с.в. приближённо, на них влияют случайные факторы эксперимента и способ группировки. Предельная функция не зависит от этих факторов, она однозначно и объективно представляет свойства самой с.в.

Как найти предельную функцию? В данном примере нам удалось найти функцию f(x), благодаря равномерности распределения частот по основному промежутку значений с.в. Если равномерности не будет, то задача отыскания (р) -предела сильно осложнится. Придётся подбирать аналитическое выражение функции f(x), график которой "похож" на гистограммы, а затем проверять, удачен ли подбор, используя сложные вероятностно-статистические методы (оценка правдоподобия гипотез), понятие о которых вы получите в конце курса (лек. 13).

Контроль 4. На рис. 4 изображена гистограмма, полученная после проведения серии из £ = 150 опытов над с.в. Тм и группировки результатов по восьми промежуткам Ах,, / = 1,2,...,8. Изобразите вид гистограммы после проведения £' = 300 опытов и группировки результатов по шестнадцати равным промежуткам Ах', / = 1,2,..., 16. Выделите график статистической функции распределения частот f*(x). К какой предельной линии будет приближаться этот график при неограниченном увеличении числа опытов i'^oon группировки по тем же интервалам Ах. ?

5. Распределение вероятностей с.в. ТФ

Пример 3 (окончание). Итак, мы провели статистический эксперимент над с.в. Тф и набрали к = 300 значений. Сгруппировали их по двадцати промежуткам: At} =[0;3), At2 =[3;б), At20 =[57;60]. Посчитали частоты kt и относительные частоты kjk. Нашли высоты hi =ki/(k-Ati) "столбиков" гистограммы и построили её (рис. 6). Поскольку среди появившихся значений с.в. очень много малых, то гистограмма имеет вид быстро падающей "горки".

Увеличим число опытов, например до к = 450. Сгруппируем новые появившиеся значения по тем же двадцати промежуткам и построим но-

вую гистограмму. Она будет несколько отличаться от предыдущей, но характер "падающей горки" сохранится (рис. 9).

Если продолжать увеличение числа опытов к -> °о, то, как мы уже знаем, верхние основания гистограмм будут приближаться к "ступенькам" графика некоторой предельной функции /| (х) (на рис. 9 "ступеньки" выделены). Однако, если по-другому провести группировку, например, разбить основной промежуток [0;60] не на 20, а на 40 равных "интервальчиков" Atn то предельная функция /2(х), будет иметь не 20, а 40 "ступенек".

Чтобы снять "плюрализм" предельных функций, давайте одновременно с увеличением числа опытов к -> °о станем измельчать интервалы Atf -> 0. Например, после к = 450 опытов будем группировать значения по 40 "интервальчикам" длины Att = 1,5, после к = 600 опытов - по 60 "интервальчикам" длины Att =1, после к = 750 опытов - по 120 интервалам длины Atf = 0,5 и т. д.*) Нетрудно согласиться, что после достаточно большого числа опытов ступеньки гистограммы сольются с некоторой кривой линией - плавно и быстро падающей "горкой" (рис. 11). Это будет график предельной функции f(x) - плотности распределения вероятностей с.в. Тф, не зависящей от случайностей эксперимента и способа группировки. •

Формула предельной функции f(x) для с. в. Тф известна:

(2)

О том, как в этой формуле подбирается параметр Л, узнаете в лек. 11.

Подбор предельной функции. Вас, конечно, беспокоит вопрос: "откуда взялась формула (2) "? Могу показать рассуждение, которое к ней подводит.

На рис. 11 видно, что предельная функция f(x) убывает с ростом х и быстро приближается к нулю. Спросим себя: какие известные нам элементарные функции обладают подобными свойствами? Вспомним экспоненту у = е~х,хе [0;оо) (рис. 12). Срав-

Рис. 9 Рис. 10 Рис. 11

*) При этом надо следить, чтобы в каждый попадало все больше и больше наблюдений.

нивая рис. 11 и 12, видим, что нам нужна несколько иная функция, которая быстрее убывает, нежели экспонента и которая гораздо "выше" в начале. Но мы умеем преобразовывать графики. "Сожмём" экспоненту у = ех, приблизив все её точки к оси ОХ, например, в три раза: для этого вместо х поставим Зх и получим у = е~3х (рис. 12).

"Поднимем" теперь график функции у = е~3х по оси OY, умножая все ординаты, например, на 3, получим функцию у = 3е~х\ график которой (рис. 13) становится "похожим" на график нашей предельной функции f(x) (рис. 11). Множитель Я = 3 в данном рассуждении, конечно, условен.

У вас может, конечно, возникнуть вопрос: а почему мы выбрали именно показательную функцию, а не какую-то другую, обладающую тем же свойством быстрого убывания? Ответ: практика убеждает, что другая функция не будет так хорошо моделировать данное распределение, как показательная.

Контроль 5. На рис. 14 показана гистограмма некоторой св. Нарисуйте предположительный вид графика предельной функции. Подберите множитель Я в формуле (2), моделирующей предельную функцию f(x). Постройте график этой функции. Сравните его с предполагаемым. Близки?

Указание. Вид гистограммы (рис. 14) подсказывает, что надо "расширить" и "опустить" экспоненту - отдалить её точки от оси OY в два раза дальше и приблизить к оси ОХ в два раза ближе. Значит, À = 0,5. При построении модели функции распределения учтите, что

Рис. 12 Рис. 13

Рис. 14

6. Плотность распределения

Мы только что подробно разобрали два примера, в которых перешли от гистограмм к ступенчатым функциям f*(x) и далее к предельной функции f(x). Теперь надо распространить эту процедуру на произвольную непрерывную св., т. е. зафиксировать её в абстрактных терминах. Так мы придём к двум фундаментальным понятиям математической статистики и теории случайных величин (определения 1 и 2).

Определение 1. Статистической плотностью распределения св. X с множеством значений [а\Ъ\ (или (а;b), (а;<*>), (-оо; + оо) и др.) называется функция f*(x), которая определяется в результате следующих практических действий:

1) проводится серия из к опытов над св. X и фиксируются появившиеся значения

2) основной промежуток [а\Ъ\ разбивается на непересекающиеся промежутки Ах,, / = 1,2,...,m и затем вычисляются относительные частоты к;/к появления значений св. X в каждом Ах,;

3) значения функции f*(x) на каждом промежутке Ах, постоянны и определяются так:

(3)

Дополнение 1. Данное определение имеет смысл не только для непрерывных св. Все операции, указанные в нём, могут быть выполнены для дискретной св. с одним уточнением: на промежутки Ах, придётся разбивать сегмент Ьс -£\ X +£\. Это замечание относится и к непрерывной св., множество значений которой не ограничено (а,Ъ = оо). Гистограмма и график статистической плотности f*(x) дискретной св. показаны на рис 15."

Почему f*(x) — "плотность " ? Почему использован физический термин? Посмотрите на рис. 14: в каждом промежутке Ах, условно выделены точки - значения св., попавшие в этот промежуток. Вы видите, что чем больше точек в Ах, (их число ki), тем больше относительные частоты kjk, тем больше hi = kj(k• Ах,) - высоты "ступенек" гистограммы, которые и являются значениями функции f*(x), хеДх,. Следовательно, величина f*(x) характеризует густоту, плотность появившихся в Ах, значений св.:

Рис. 15

*) В литературе функция f*(x) обычно продолжается на всю числовую прямую: f*(x) = 0, х £ [а; Ь].

чем больше f*(x), тем гуще, плотнее заполняют промежуток Ах, значения xw.

Свойства функции f*(x) сформулируем в предположении, что множество значений с.в - сегмент [a;b].

1 °. f*(x) - ступенчатая функция, определённая на [а\Ъ\ ;

2°. f*(x)— неотрицательная функция: /*(*)> 0, хе [а;Ь] ;

3°. f*(x) - интегрируемая на [а; б], как всякая ступенчатая функция, и её интеграл равен единице:

Другими словами, сумма площадей всех "столбиков" гистограммы равна единице (свойство аддитивности интеграла):

(4)

(сумма всех частот ki равна числу появившихся в эксперименте значений х(/), т. е. равна числу опытов к.

Определение 2. Плотностью распределения вероятностей непрерывной св. X с множеством значений [a;b] называется вероятностный предел*) статистической плотности при неограниченном увеличении числа опытов к -> °о и измельчении промежутков Дх,. -> 0:

(5)

Эту предельную функцию мы будем называть иногда функцией-плотностью. В литературе она называется дифференциальной функцией распределения. Называют её также и законом распределения.

Смысл равенства (5). Данное определение нельзя назвать строго математическим, ибо операция (р) -предельного перехода от f*(x) к f(x) связана с последовательностью экспериментов над св. X, а в реальности их нельзя осуществить бесконечно. В определении, в сущности, зафиксирован эмпирический (опытный) факт "стабилизации" статистических функций f*(x) - в сериях с очень большим числом опытов они мало отличаются друг от друга. Следовательно, можно считать, что с ростом к -> °° и уменьшением всех Дх,. -> О значения функций f*(x) в точке X неограниченно приближаются к какому-то чис л у f(x). Но это смысл и строго математического понятия предела.

*) Строго говоря, надо добавить: "если этот предел существует.

Здесь возникает законный вопрос: как найти функцию f(x) ? В отличие от строго математического предела, вероятностный предел нельзя считать однозначно определённым. Здесь математики обычно довольствуются каким-то удобным приближением - функцией f(x), имеющей достаточно простое аналитическое выражение и "близкой" к f*(x) при больших к. Мы уже имели дело с подобной задачей в несложных конкретных примерах 2 и 3. В лекции 11 займёмся ею более фундаментально.

Свойства функции-плотности f(x). Предельные функции могут быть очень разнообразными, но все они обладают двумя общими свойствами, вытекающими из их связи с гистограммами и статистическими функциями f*(x). Сформулируем свойства, опять же, для св., множество значений которых сегмент [а;Ь].

1 °. f(x) - неотрицательная функция: f(x) > О, х е [а; Ь] ;

2°. f(x) - интегрируемая функция и её интеграл равен единице:

Отметим здесь же, что во всех практически важных и часто возникающих задачах предельная функция непрерывна. Однако, надо знать, что встречаются и разрывные.

Дополнение 2. В отличие от определения 1, определение 2 не имеет смысла для дискретных св., потому что для них вероятностный предел (5) в точках х} - значениях д.с.в. - не существует. Это легко понять с помощью рис. 15 - на нём условно изображена гистограмма д.с.в., имеющей 5 значений, построенная для некоторого разбиения. Площадь каждого "столбика" равна относительной частоте kjk, а высота (значение статистической функции /*) равна kj/kAxj (см. (3)). С ростом числа опытов к относительные частоты kjk приближаются к конечному числу pj - вероятности соответствующего значения д.с.в., и поэтому с уменьшением Дх, -> О высоты "столбиков" будет расти до бесконечности ("столбики" сужаются и неограниченно вытягиваются вверх)."

Дополнение 3. Кроме функции-плотности f(x) существуют иные характеристики распределения вероятностей непрерывной с.в. X. Можно использовать первообразную f(x) = \f(x)dx. Согласно геометрическому смыслу интеграла от неотрицательной функции, значение f(x) есть площадь подграфика функции f(x) в пределах от а до х (рис. 16). Но эта площадь равна вероятности появления в

Рис. 16

опыте значений с.в. x, попадающих в промежуток (а;х\ (см. следующий п. 7). Следовательно, функцию f(x) можно определить так: f(x) = р(х < х) - она тоже показывает распределение вероятностей с.в. x. Функцию эту называют интегральной функцией (или функцией распределения, - см. п. 14.3), a f(x) - дифференциальной функцией. Строгое определение непрерывной св., о котором говорилось в начале лекции, требует непрерывности именно интегральной функции распределения вероятностей f(x) и, более того, дифференцируемости этой функции.

Контроль 6. С.в. L - размер детали, изготавливаемой автоматическим станком (контроль 2). Нарисуйте предположительный вид графика статистической плотности f*(x) и графика плотности f(x) с.в. L. Какое свойство подграфика этих функций должно соблюдаться?

7. Задача о попадании н.с.в. в заданный интервал

Одна из основных практических задач, которая решается с помощью функции-плотности f(x), следующая.

Задача. Изучается непрерывная с.в. X, область значений которой - промежуток [a;b] (или (a;b), (я;<*>), (-оо; + оо) и др.) и плотность распределения которой известна - f(x). Исследователя интересует некоторый участок возможных значений {a\ß)a [a;b]. Как ему узнать вероятность события А, состоящего в том, что при выполнении опыта появится значение X с.в. X, попадающее в интервал (а;0)1 Событие А, как вы помните, обозначается так: A = (Xe(a;ß)).

Замечание. Задача эта неоднократно возникала раньше при изучении дискретных св.. Вспомните вопрос о вероятности появления суммы очков 6, 7 или 8 при подбрасывании двух игральных костей (лек. 5, п. 1). Вспомните практически важную задачу о попадании в заданный интервал биномиальной св., - задача эта была решена формулой Муавра-Лапласа (лек. 4, п. 8).

Решение даёт простая формула

(7)

Прежде чем обосновывать формулу, давайте оценим её эффективность на примерах.

Пример 4. Какова вероятность того, что после спуска в метро и выхода на платформу мы будем ждать поезда не более полминуты?

Вопрос сформулирован на обыденном языке. Переведённый на теоретический язык, он превращается в задачу: какова вероятность того, что с.в. Тм примет в опыте значение t, попадающее в промежуток [0;30]?

Функция-плотность для с.в. Тм известна - (1): f(x) = 1/120, хе[0;120]. Применяем формулу (7):

Прогноз. В среднем, из четырёх поездок в метро один раз мы будем ждать поезда не долго (не более 30 секунд), а три раза - долго. Не забудьте ограничение, при котором сделан прогноз: учитываются поездки, которые происходят в период нормального режима движения поездов -через две минуты.

Пример 5. Автоматический станок штампует детали заданного размера /0. Стандартом допускается отклонение размера / от заданного не более, чем на величину S. Какова вероятность появления стандартной детали?

Перед нами св. L - размер детали, область значений которой (/0 - s; /0 +£), s > 6 (контроль 2). Формула (7) принимает вид:

В отличие от предыдущего примера, функция-плотность f(x) для св. L нам не известна. Поэтому мы не можем сейчас довести решение до конца. В лекции 11 вы узнаете, как можно определить эту функцию, какой вид примет записанный выше интеграл и как его вычислять. •

Обоснование формулы (7).

Рис. 17

1. На рис. 17 изображён условно график функции-плотности f(x) произвольной св. X и показан интервал (a\ß). Изобразим над этим участком график некоторой статистической её плотности "близкой" к f(x). Точки а и ß можно считать включёнными в число точек, разбивающих основной промежуток [a; b] на "интервальчики" Ах, при группировке и построении гистограмм.

2. Очевидно, площадь S гистограммы над (а; ß) равна относительной частоте к0/к события (Хе {a;ß)) (число к0 значений св. X, появившихся в (а; ß) равно сумме частот значений, появившихся в "интервальчиках" Ах,, составляющих (а; /?)), т. е.

S — A^q /к.

3. Если число опытов к неограниченно увеличивается и Ах, ^0, то график функции f*(x) приближается к графику f(x). Следовательно, пло-

щадь S гистограммы приближается к площади подграфика f(x), которая равна интегралу, т. е.

4. В этих же условиях, согласно закону стабилизации частот, относительные частоты события (х е (а; ß)) приближаются к вероятности этого события:

5. Сравнивая последние два соотношения и учитывая единственность предела*), приходим к формуле (7). •

Контроль 7. На рис. 14 высоты "столбиков" гистограммы равны, соответственно, 0,60; 0,25; 0,08; 0,04; 0,03. Определите относительную частоту попадания с.в. на участок [1;3]. Определите вероятность этого события.

Указание. Напоминаю, - плотность распределения вероятностей определена в контрольном упражнении 5 так: f(x) = 0,5 • <Г0,5 v.

8. Парадоксы нулевых вероятностей

В заключение лекции - несколько слов для любознательных о неожиданных следствиях формулы (7).

Парадокс 1. Если плотность распределения с.в. x есть непрерывная функция f(x), то вероятность любого возможного значения х0 с.в. x равна нулю:

(8)

Обоснование.

1. Введём события а = (х = х0) и в = (х е[х0,х0 + Ах]), где Ах - любое небольшое приращение аргумента функции f(x), не выводящее х0+Лх за пределы множества значений с.в. x.

2. Почти очевидно, что р(а)<'Р(в). Обоснуем это неравенство формально. Согласно эмпирическому определению вероятности, имеем:

*) Оперируя с вероятностным пределом, мы пользуемся привычными свойствами пределов, которые считаем справедливыми и для вероятностной сходимости (лек. 1, п. 2, примечание 2). Это, конечно, "не строго" в математическом смысле и поэтому подобные рассуждения мы называем "обоснованием", а не "доказательством". Однако, это правомерный в науке приём аргументации "по аналогии", и он особенно полезен в учебном курсе.

где к0 - частота появления значения х0 в серии из к опытов, а к' - частота появления значений св., попадающих в сегмент [х0,х0 + Ах].

Далее идёт цепочка логических следствий:

3. Покажем, что

Используя формулу (7) и теорему Лагранжа, преобразуем нашу вероятность так:

Устремим Ах -> О и с учётом того, что х0 < с < х0 + Ах, и непрерывности функции f(x), получим

Теперь можно перейти к пределу в равенстве Р(2?) = Дс)-Дх, и в результате получим

4. Используя теорему о сохранении знака неравенства в пределе и неотрицательность вероятности, окончательно получаем:

Обсуждение. В чём парадоксальность следствия? Оно утверждает, что возможное событие имеет нулевую вероятность. Этот вывод резко противоречит вашему опыту и интуиции, - ведь нулевую вероятность должны иметь именно невероятные, невозможные события.

Интуиция эта сформировалась классической моделью. Вспомните определение р(А) = т/п, где знаменатель п - число всех равновозможных исходов опыта, а числитель m - число исходов, благоприятствующих появлению события А. Если А - возможное событие, оно обязательно появится при каком-то исходе (группа исходов полна), поэтому m > О и Р(А)>0.

Как же разрешается парадокс? Причина его в том, что свойства вероятности, справедливые для случаев конечной группы исходов опыта, переносятся на случаи бесконечного множества исходов. Т. е. парадокса просто

*) Здесь использована теорема о предельном переходе в неравенствах, которую мы считаем справедливой и для вероятностных пределов.

**) Здесь предельный переход обычный - функциональный, а не вероятностный.

нет! В ситуациях, в которых применимо классическое определение, любое возможное событие имеет положительную вероятность. Если же классическое определение не применимо, точнее, - если "количество" всех равновозможных исходов*) опыта бесконечно, то вероятности этих исходов нулевые.

Но может быть, несмотря на всю логичность рассуждений, у вас остаётся психологическая неудовлетворённость? Ведь при каждом выполнении опыта какой-то исход появится. Как же его вероятность нулевая? Чтобы окончательно рассеять ваши сомнения, приведу пример.

Представьте, что вы купили один билет лотереи. Зная немного теорию вероятностей, вы зададите себе вопрос - какова вероятность выигрыша? Вы понимаете, что вероятность зависит от общего числа билетов п и от числа выигрышных m. Эти сведения организаторы лотерей обычно держат в секрете. Допустим, вам удалось узнать, что лотерея содержит очень-очень много билетов, ну - миллион, 106 билетов, из которых выигрывают 10. После этого вы, наверное, выбросите ваш билет. Так? Ну, а теперь представьте, что лотерея содержит бесконечное "число" билетов. Какова вероятность вашего выигрыша?

Данный пример приводит нас к важному выводу: следует различать теоретическую возможность появления события и практическую. Событие может быть теоретически возможным, но ожидать его появления при реальном выполнении опыта не имеет смысла. Действовать, исходя из предположения возможности появления этого события, неразумно.

Придадим этому выводу форму ещё двух парадоксов.

Парадокс 2. Пусть опыт имеет бесконечное число исходов. Если вероятность некоторого события равна нулю, то в любой конечной серии опытов оно не появится ни разу.

Парадокс 3. Если X - непрерывная св., то в любой конечной серии опытов все появившиеся её значения разные.

Контроль 8. Перед выходом на перрон станции метро вы загадали, что поезд подойдёт ровно через 30 сек. Какова вероятность этого события? Может ли это событие произойти? Аргументируйте свой ответ.

9. Упражнения

1. С помощью эксперимента установлено, что орудие поражает цель примерно 40 раз из 100 выстрелов. Определите наиболее вероятное число попаданий при залпе из 5 таких орудий. Какую св. введёте для решения этой задачи? Дискретная она или непрерывная? Почему?

*) Напоминаю, в нашем курсе исходы - это равновозможные, несовместимые события опыта (лек. 1, п. 7).

2. В условиях предыдущего упражнения постройте ряд распределения и многоугольник распределения введённой вами св. Какие прогнозы можете сделать? Оцените расположение математического ожидания, потом рассчитайте его точно. Сделайте то же для дисперсии и среднего квадратического отклонения. Выполняется ли правило трёх сигм?

3. Определите параметр а, при котором функция f(x) = а/л/х, хе [l;9], будет плотностью распределения вероятностей некоторой св. Постройте график этой плотности. Какие значения св. будут появляться в опыте чаще, какие реже (укажите участки)? Во сколько раз реже? Оцените вероятность появления значений, меньших 4, и рассчитайте эту вероятность точно.

4. При экспериментальном исследовании св. Тл - время непрерывной работы электролампы до выхода её из строя - получен нижеследующий группированный статистический ряд (временные промежутки даны в часах):

Таблица 2

Продолжительность жизни лампы

Число ламп

Продолжительность жизни лампы

Число ламп

950-1000

2

1550-1600

28

1000-1050

2

1600-1650

25

1050-1100

3

1650-1700

21

1100-1150

6

1700-1750

16

1150-1200

7

1750-1800

12

1200-1250

12

1800-1850

8

1250-1300

16

1850-1900

6

1300-1350

20

1900-1950

3

1350-1400

24

1950-2000

2

1400-1450

27

2000-2050

1

1450-1500

29

2050-2100

1

1500-1550

29

Всего

300

Постройте гистограмму (примите интервал в 50 часов за единицу). Сделайте прогнозы. Определите промежуток, в который будут попадать значения св. Тл с вероятностью, большей, чем 0,8.

5. К какому классу относится св. Тл (дискретная или непрерывная)?

Каково множество её значений? Границы этого множества размыты или нет? Как вы думаете, однотипны ли распределения св. Тл и Li Что у них общего? Нарисуйте предположительный вид графика предельной функции f(x) св. Тл. Попробуйте подобрать аналитическое выражение этой функции.

ЛЕКЦИЯ 10

ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ Н.С.В.

В предыдущей лекции мы построили математическую модель случайной величины - функцию f(x) хе [a;b]*) которую назвали плотностью распределения. Каждая такая функция обладает двумя характеристическими свойствами: 1°.

Имея модель с.в. - функцию f(x), мы можем теперь абстрагироваться от конкретики опыта, с которым связана св., и отождествлять её с функцией-плотностью. В дальнейшем будем изучать именно модели св., - различные типы функций-плотностей.

Функция-плотность f(x) содержит всю вероятностную информацию о св., - в частности, она указывает область возможных значений с.в. и распределение вероятностей появления этих значений на разных участках.

Так, например, модель св., показанная на рис. 1, говорит нам, что в левой части промежутка [a;b] значения с.в. появляются чаще, чем в правой. Точнее, - на интервале (я, ; Д) значения с.в появляются, примерно, в четыре раза чаще, чем на (а2;ß2), потому что левая заштрихованная площадь раза в четыре больше правой.

Для конкретной с.в. процесс отыскания функции-плотности бывает весьма сложным, - надо провести несколько сот опытов над св., по результатам этих опытов построить статистическую функцию-плотность f*(x), после чего перейти к (/?)- пределу и получить f(x). Особенно сложен последний этап, - этой проблемы мы коснёмся в следующей лекции.

В данной лекции займёмся более простой задачей определения числовых характеристик, обобщённо отражающих некоторые важные особенности распределения вероятностей с.в. Предстоит обобщить на непрерывные с.в. понятия математического ожидания и дисперсии, знакомые вам для случая дискретной с.в. (лек. 5). Вы узнаете также некоторые новые характеристики (моду, медиану, скошенность, эксцесс).

Рис. 1

*) Вместо [a; b] могут стоять (а; b), или [а; °о), или (-©о; оо) 9 или др.

1. Математическое ожидание

Определение 1. Математическим ожиданием (или средним значением) непрерывной случайной величины X, заданной плотностью распределения f(x) хе [я; б], называется число M = М(х), которое вычисляется по формуле

(1)

Как обычно, допускаются бесконечные границы а,Ь = °о, Сходимость интеграла предполагается абсолютная.

Аналогия. Обратите внимание на аналогию (1) с формулой

(2)

определяющей математическое ожидание дискретной с.в. (лек. 5, п. 6, (3)). В формуле (1) вместо последовательности xi дискретных значений с.в. стоят значения х, которые непрерывно "пробегают" промежуток [a; b] ; вместо вероятностей pi - функция-плотность f(x), которая тоже задаёт распределение вероятностей на [a;b]; вместо суммы - интеграл.

Аналогия эта отражает глубокую связь между двумя, на первый взгляд, принципиально различными классами с.в. - дискретными и непрерывными. Сейчас вы увидите эту скрытую связь, - мы построим последовательность дискретных с.в. Хп, приближающихся с ростом п к с.в. X, и формула (1) закономерно появится, как предел формул (2).

Обоснование формулы (1). Пусть X - непрерывная с.в. и её плотность распределения f(x) - непрерывная функция на [а;Ь]. Разобьём [a;b] на п мелких (можно равных) промежутков Ах,, Ах2, Ахп и вычислим вероятности Pi появления значений с.в. X на этих промежутках (на каждом Лх, применим к интегралу теорему о среднем):

Каждая вероятность /?,. численно равна площади sf прямоугольника с основанием Лх, и высотой /(£) (рис. 2).

Используя найденные вероятности, введём дискретную с.в. Хп так:

Таблица 1

Рис. 2

Согласны ли вы, что св. Хп "близка" к X ? Ведь её значения £ е àx, густо заполняют промежуток [a;b] (в силу малости Лх,), а характер распределения вероятностей pj этих значений тот же, что и у св. x. Это наглядно видно на рис 2: левые вероятности св. хп больше правых (р3 = /(£3)-Дх3 =S3 >Sfl_3 = f(^n_3)- Ахп_3 = pn_3), так же> как и у св. x. Термин "близка", конечно, требует уточнения, но строгая формализация усложнила бы рассуждения, а главное, затемнила бы их смысл.

Очевидно, чем мельче все Лх,, и чем, следовательно, больше их число я, тем "ближе" св. хп к X. И логично определить математическое ожидание св. X, как предел математических ожиданий св. Хп при п оо. В итоге, получаем формулу (1):

Здесь вам надо вспомнить определение интеграла: сумма является интегральной суммой функции f(x) = x- f(x) на сегменте [а;Ь]; при п^оо все Лх, неограниченно измельчаются и, в силу непрерывности функции f(x), а с нею hf(jc), её интегральные суммы стремятся к интегралу.

Пример 1. Вычислим математическое ожидание св. Тм - время ожидания поезда в метро (лек. 9, п. 2). Плотность распределения вероятностей этой св. нами определена (лек. 9, (1)):

Применяем формулу (1) и получаем:

Св. Тм - конкретная с.в, связанная с определённым опытом. Далее в качестве примеров будем рассматривать абстрактные модели с.в. - функции-плотности.

Пример 2. Рассмотрим абстрактную с.в. Si, функция-плотность которой задана так (советую проверить выполнение свойств 1° и 2°):

Применяем формулу (1) и вычисляем интеграл, интегрируя по частям:

Рис. 3 Рис. 4

Вывод 1. В обоих примерах значение M совпало с серединой промежутка [a;b] (рис. 3, 4). Нетрудно показать, что для тех св. Хс, график функции-плотности f(x) которых симметричен относительно прямой, проходящей через середину промежутка [а;Ь], их математическое ожидание совпадает с серединой этого промежутка, т. е. справедлива формула

(3)

Пример 3. Рассмотрим "несимметричную" св. z, плотность распределения вероятностей которой задана так (проверьте её свойства):

Её график - часть параболы (рис. 5). Вычислим M(z), интегрируя степенные функции:

Вывод 2. Математическое ожидание "несимметричной" св. оказалось немного сдвинутым в сторону более вероятных значений (в данном примере - влево). Сдвиг небольшой, ибо левые вероятности чуть больше правых.

Смысл числа м(х). Вы видите, что математическое ожидание M непрерывной св. располагается в зоне наиболее вероятных значений. Число M(х) указывает ориентировочно, какие значения св. X следует "ожидать " чаще при повторении опыта.

Смысл тот же, что и для дискретных св. Вместе с тем, надо отдавать себе отчёт в приблизительности этого вывода. И помнить, что он справедлив часто, но не всегда (пример 1).

В примере 3 вероятности появления значений св. z на разных участках одинаковой длины (эти вероятности равны соответствующим площадям, - рис. 5) мало отличаются друг от друга и поэтому при многократном повторении опыта значения св. z могут появляться на этих участках почти одинаково часто. Правда, при очень большой серии опытов левые значения должны возникать чуть чаще правых. На это и указывает небольшой сдвиг числа м(х) влево от середины отрезка [0;3].

Если бы M было сильно сдвинуто влево, мы могли бы предполагать, что левые значения св. гораздо более вероятны, чем правые. График функции-плотности f(x) такой св. мог иметь отчётливо выраженный "горб" в районе, указываемом именно числом M. Такова, например, св.,

Рис. 5

график функции-плотности которой показан на рис. 1 (покажите на рис. 1 место, где, предположительно, располагается M).

Вы должны знать, что существуют "двугорбые", называемые бимодальными (и даже полимодальные) св., - они возникают, когда статистический материал разнороден. Здесь наш вывод не работает.

Итак, число м(х) - это одно из значений с.в. X, среднее (но не срединное!), точнее - усреднённое значение, вычисленное с учётом вероятностей всех значений (иногда его называют средним взвешенным). Значения с.в. с большими вероятностями будут "притягивать" среднее значение М{х) к себе. Поэтому-то оно зачастую и располагается в зоне более вероятных значений.

Общий же статистический смысл М(х) тот же, что и для дискретных св., - приближённо среднее арифметическое значений св., появившихся в результате большой серии опытов.

Контроль 1. Непрерывная с.в. y задана плотностью распределения f(x) = 2х, хе [0;1]. Проверьте выполнение двух условий, которым должна подчиняться эта функция. Нарисуйте её график и, учитывая его вид, сделайте предположение о месте точки M(y) на отрезке [0;1]. Вычислите математическое ожидание точно. Подтвердилось ли предположение?

2. Дисперсия

Напомню смысл термина "дисперсия" (разброс). Посмотрите на рис. 6 и 7: на них условно изображены значения двух с.в. I, и 12) появившиеся в эксперименте.

Рис. 6 Рис. 7

У какой с.в разброс значений больше? Думаю, вы уверенно ответите, - у первой. Значения этой с.в. широко разбросаны от М(Х,), а у второй они сгущаются около точки М(Х2), далёкие - редки.

В случае дискретной с.в. степень разбросанности значений определяется, как вы знаете (лек. 5, п. 7, (3)) числом D = D(x), которое называется дисперсией и вычисляется по формуле

(3)

Из этой формулы видно, что число D увеличивается, если у с.в. X есть далёкие от M значения (велики разности (х, -М), тем более велики их квадраты), и если эти значения появляются в опытах достаточно часто (не малы вероятности р., а с ними и слагаемые (х, -М)2 • /?,).

Как и раньше, в случае математического ожидания (1), заменяем в (3) дискретные значения х, непрерывной переменной х, вероятности pt -функцией-плотностью, сумму - интегралом и получаем:

Определение 2. Дисперсией непрерывной с.в. X, плотность распределения которой задана функцией f(x) хе [a;b], называется число D = D(x), которое вычисляется по формуле*)

(4)

где M = М(х) - математическое ожидание с.в. X, определяемое формулой (1). Границы а и b могут быть бесконечными.

Смысл формулы (4). Обоснование формулы (4) точно такое же, как и формулы (1): строится последовательность дискретных с.в. Хп, приближающихся к непрерывной с.в. X, и формула (4) получается, как предел формул (3). Поскольку непрерывную с.в. X можно моделировать дискретной с.в. Хп с достаточно большим номером, то степень разбросанности её значений можно характеризовать дисперсией этой дискретной св., т. е. числом D[Xn). Но D[Xn)~D(x), следовательно, формула (4) тоже характеризует разброс с.в. X. Проиллюстрируем этот вывод. Пример 4. Вычислим дисперсию с.в. Тм (рис. 3):

Дисперсия оказалась очень большой, потому что далёкие от M = 60 значения с.в. Тм появляются в эксперименте так же часто, как и все другие.

Пример 5. Изменим св., укоротив промежуток её значений: f(x) = l, хе [0;l] (рис. 8). (Кстати, можете ли вы ответить, почему изменились значения функции?) Разброс значений с.в. резко уменьшился (максимальное их отклонение от математического ожидания M стало равным 0,5, тогда как у с.в. Тм - 60, правда, при этом увеличились вероятности). Дисперсия новой с.в. 7j0;1] тоже должна значительно уменьшиться. Вычисляем:

Как видите, число о, определяемое формулой (4), действительно, характеризует степень разбросанности значений с.в.

Рис. 8

*) Как и для дискретной с.в. (п. 5.7), дисперсия непрерывной с.в. измеряется в квадратных единицах.

Другая формула. Формула (4) допускает видоизменение, удобное для вычислений. Проследите за следующими преобразованиями:

В правой части последнего равенства второй интеграл есть математическое ожидание с.в. X (формула (1)), а третий равен единице, по свойству функции-плотности, следовательно

(5)

Если ввести новую с.в. X2, считая, что в тех опытах, где с.в. X принимает значение х, с.в. X2 принимает значение х2, то формулу (5) можно записать короче и она станет удобнее для запоминания:

(5')

Последняя формула*) была справедлива и для дискретных с.в. (лек. 5, (12)). Проиллюстрируем ценность формулы (5').

В предыдущих примерах 4 и 5 мы могли сравнить степень разброса с.в. Тм и с.в. 7[0;1] без вычислений, - по виду графиков плотности (рис. 3, 8) было очевидно, что у первой с.в. разброс значительно больше, нежели у второй. Но бывает, что без вычислений это сделать затруднительно.

Сравните, например, с.в. Si (пример 2, рис. 4) и с.в. Z (пример 3, рис. 5), - у какой разброс больше? Не очевидно. Максимальное отклонение значений с.в. от среднего чуть больше у второй, но "зона" её левых значения "короче". Вероятности правых её значений, в целом, чуть меньше, чем у с.в. Si, но левых - немного больше. Проведём расчёт.

Какую формулу выберем для расчёта, - (4 или (5)? Сравним обе:

Очевидно, второй интеграл легче. Применяя к нему дважды метод интегрирования по частям (достройте эти вычисления сами), получаем:

Рассчитаем дисперсию второй с.в. Формулы (4) и (5) приводят к интегралам:

*) Формулу (5) следовало бы строже обосновать для непрерывных св., но мы не знаем, какой вид будет иметь функция-плотность с.в. X2, входящая в формулу (6). Для решения этой вспомогательной задачи нужны значительные знания (см. 2, глава 9), которых мы не касаемся в данном курсе.

И здесь второй интеграл проще. Раскрываем в нём скобки и вычисляем три степенных интеграла (советую проследить за вычислениями; обратите внимание на подробность записи каждого расчётного этапа, - она облегчает вычисления и уменьшает вероятность ошибки):

Вот теперь можно сравнить дисперсии точно, - они получились очень близкими, вторая чуть-чуть больше, на четыре сотых.

Контроль 2. Две св. X, и Х2 имеют один и тот же промежуток значений [0;l], но разные распределения вероятностей появления этих значений: /| (х) = 2х и /2 (х) = 4х3. Проверьте выполнение двух общих требований к функции-плотности. Постройте графики этих функций и по виду оцените расположение средних значений М, и М2 на промежутке [0;1]. Вычислите М, и М2 точно. Оправдалось ли предположение? Как думаете, у какой св. дисперсия меньше и намного ли? Рассчитайте £>, и D2 точно (какой формулой выгоднее пользоваться, (4) или (5)?).

Отв.: Мх - 0,67; М2 = 0,8; D, - 0,05; D2 - 0,03.

3. Среднее квадратическое отклонение

Формула (4) содержит квадрат и по этой причине нередко даёт очень большие значения D (как у св. Тм) или, наоборот, очень маленькие (как у св. 7[0;1]). Извлечём квадратный корень из дисперсии: <т, = д/д" = Vi200 ^35, g2 = ^D~2 = д/l/12 « V0'08 ~ °>29 • Вы видите, что очень большое значение первой дисперсии значительно уменьшилось (на два порядка), а очень малое второй - увеличилось. Новые числа <т, и а2 попрежнему характеризуют разброс с. в. - первое значительно больше второго.

Ещё одно преимущество, полученное после извлечения корня, -уравнялись размерности св. X и её новой характеристики а (прежняя характеристика разброса D имеет размерность квадрата св., как это видно из формулы (4)).

Определение 3. Средним квадратическим отклонением непрерывной св. X (кратко, - с.к.в.) называется число <т = <т(х), которое получается извлечением квадратного корня из дисперсии D = D(X)9T. е.

(6)

Особой практической ценностью числа а является то, что с его помощью можно нередко (но не всегда!) представить

ориентировочно диапазон всех практически возможных значений изучаемой с.в. X. На практике нередко оказывается, что промежуток (a,b) значений с.в. X "близок" к интервалу (М-За; М + 3<т), - его называют трёхсигмовым интервалом. Условимся в таких случаях писать:

[а;Ъ)«(М-За; М + За). (7)

Как используют эту оценку? Пусть изучается с.в. X, у которой не известен весь спектр значений (a,b). Проводят несколько десятков опытов над с.в. X, по их результатам определяют приближённо M и а (лек. 6, (1), (2), (3)) и трёхсигмовый интервал [М-За\ М + Зсг) принимают за (a,b). Эту оценку вам придётся делать при выполнении лабораторной работы.

Наилучшим образом оценка (7) выполняется для класса нормально распределённых св., которые мы будем подробно изучать в следующей лекции (лек. 11, п. 8), а также для св., "близких" к нормальным, а они-то и возникают часто на практике. Для них эта оценка уточняется так:

{а;Ь)з(М-За; М + За), (7')

но значения с.в. крайне редко (с очень малой вероятностью) выходят за пределы трёхсигмового интервала. Определение этой вероятности р для различных классов с.в. и будет одной из наших задач в следующей лекции.

Для св., "далёких" от нормальных, оценка (7) не работает.

Пример 6. Рассмотрим абстрактную с.в. Si, функция-плотность которой f(x) = 0,5 sin X, а значения составляют промежуток [a; b] = [0; к\. Математическое ожидание данной "симметричной" с.в. M = (л/2) « 1,57. Дисперсия вычисляется по формуле (5') повторным интегрированием по частям (это делалось в предыдущем разделе):

Среднее квадратическое отклонение о = 4d ^ д/0,46 ^ 0,68. Трёхсигмовый интервал покрывает промежуток значений с.в. (рис. 9) и значительно отличается от него:

Рис. 9

Контроль 3. В условиях контроля 2 найдите с.к.о. для с.в. X,. Постройте трёхсигмовый интервал и сравните его с множеством значений с.в. Хх. Можно ли утверждать, что справедливо (7) или (8)? Какова вероятность выхода значений с.в. хх за пределы трёхсигмового интервала?

4. Свойства математического ожидания и дисперсии (линейные операции над с.в.)

В дальнейшем (лек. 12, п.п. 5, 7) нам придётся использовать приём представления с.в. X в виде суммы более "простых" с.в. X, и возникнет задача определения математического ожидания и дисперсии суммы. Эта задача легко решится с помощью свойств числовых характеристик, которые будут установлены ниже. Напомню, что такое сумма с.в. (лек. 7, п. 6).

Определение 4. Суммой с. в. Хх, Х2,..., Хп, связанных с одним и тем же опытом, называется с.в. X, связанная с тем же опытом и принимающая при выполнении опыта значение X = X, + х2 +...+хп, где X, - значения с.в. X,, появившиеся в этом же опыте (/ = 1,2,п)*). Обозначение: X = X, + Х2 +... + Хп, или

Пример 7. Опыт состоит в подбрасывании трёх игральных костей. Дискретная с.в. X - сумма выпавших очков, она может принимать значения от 3 до 18. Эту с.в. X можно представить в виде суммы более простых с.в следующим образом. Введём три св.: X, - число очков, выпавших на первой кости, Х2— на второй, Хъ - на третьей. Все эти св., как и с.в. X, связаны с одним и тем же опытом - подбрасыванием трёх костей одновременно. Очевидно, значение х, которое принимает при проведении опыта с.в. X, складывается из значений х,, х2, х3, которые принимают с.в X,, Х2 и Х3. Следовательно, X = Хх + Х2 + Хъ.

Заметьте, - каждая с.в. xt (/ = 1,2,3) может принимать 6 значений, а сумма x принимает 16 значений. Ряд распределения суммы x можно составить, рассчитав классическим способом вероятности появления в сумме 3-х, 4-х, 18-ти очков. Советую проделать это и вспомнить метод расчёта вероятностей, с которого мы начинали. После этого можно рассчитать значения м(х) и d(x) по соответствующим формулам (2) и (3). Чуть ниже вы убедитесь, что этого можно достичь гораздо легче.

Пример 8. Возьмём теперь две непрерывные с.в. Yx и 72, распределённые, например, равномерно на сегменте [0; 1], и попробуем их сложить. Эти с.в. абстрактные, - мы не знаем конкретного опыта, с которым они связаны. Но знаем, что в этом опыте с.в. Yx может принять любое

*) Сумма с.в. X', и Х2 может оказаться не случайной, а детерминированной величиной, - например, если Х2 = —Х1, то она при любом выполнении опыта принимает одно и то же значение 0.

значение ^,е[0;1]9 и в этом же опыте с.в. Y2 тоже может принять любое значение ^2е[0;1]. Значит, согласно определению 4, значения суммы Y = YX + Y2 - это множество чисел вида ух +у2, ух,у2 g [0;l] и, следовательно, числа эти заполняют сегмент [0; 2]. А вот найти функцию-плотность суммы св., зная функции-плотности слагаемых (/|(у) = 1, f2(y) = \9 ye [0;l]), мы не сумеем, - это сложная задача, требующая новых знаний, которых мы не касаемся в данном курсе (см. [2, гл. 9]). И тем не менее, вы сейчас сможете найти числовые характеристики суммы св., даже не зная её плотности, но зная свойства M и D.

Два первых свойства M и D:

Математическое ожидание (дисперсия) суммы нескольких с.в. равно сумме их математических ожиданий (дисперсий, если слагаемые св. независимые).

Для дискретных с.в. эти свойства были доказаны в лек. 7 (п. 7, п. 9). Для непрерывных с.в. мы здесь не сможем их доказать, т. к. не сумеем определить функцию-плотность суммы с.в. Придётся поверить.*) Следует заметить, что свойство 1° представляет собой одну из важнейших теорем теории вероятностей, - оно носит название теоремы сложения математических ожиданий. Аналогично, свойство 2°- теорема сложения дисперсий. Эти теоремы позволяют при решении инженерных задач обходиться без знания функции-плотности суммы св. и довольствоваться знанием числовых характеристик суммы св.. На практике знание неполной информации, которую несут числовых характеристики св., оказывается важнее знания полной информации, заключённой в функции-плотности. Об этой практической ценности числовых характеристик говорилось раньше.

Применим эти свойства к предыдущим двум примерам. Вычислим M и D для с.в. X, - число очков на первой кости. Поскольку вероятности всех её значений =1,2,...,6 одинаковы и равны =1/6, то согласно формулам (2) и (5'), получаем

Поскольку Х1=Х2=Х39 то М(ХХ) = М(Х2) = М(Х3) = 3,5 и, по свойству 1°, получаем М(х) = М(Хг)+ М(Х2)+М(Х3) = 3 • 3,5 = 10,5. Аналогично рассчитывается дисперсия D(X) = 3 • (35/12) = 35/4 = 8,75.

*) Доказательство можно найти в [2, гл. 8, п. 8.2], но учтите, что для его понимания нужны дополнительные знания из этой и предыдущей глав книги [2].

Если вы строили ряд распределения св. x и вычисляли м(х) и d(x), то у вас должно было получиться то же самое, только с большими затратами времени и труда.

Во втором примере расчёт ещё проще:

Напомню, что значения м(г[01]) = 0,5 и £)(г[0.1]) = 1/12 были определены во втором разделе данной лекции.

В дальнейшем нам понадобится ещё одна простая операция над случайными величинами - умножение св. на число.

Определение 5. Произведением случайной величины X на число Л называется новая св. ÄX, которая принимает в опыте значение Ах, в то время, когда св. X принимает значение х.

Из определения следует, что для дискретной св. X её ряд распределения отличается от св. ÀX только значениями, а не вероятностями (таблицы 1, 2).

Таблица 1 Таблица 2

В частности, если св. X, (число очков на первой кости) умножить, например, на Л = 0,5, то св. 0,5Х, будет принимать значения X, = 0,5; х2 = 1; х3 = 1,5; х4 =2; х5 = 2,5; х6 = 3, а вероятности значений останутся те же, что и у св. X, - pi = 1/6.

Для непрерывных св. легко определить возможные значения св. ах: если значения св. x составляют сегмент [a;b]9 то значения св. ах заполнят сегмент [Яа\ЯЬ] (он увеличится, если \Я\ > 1, и уменьшится, если \Я\ < 1). Функция-плотность f(x) св. x тоже немного изменится и для св. ÄX примет вид (чуть ниже поясню, почему):

(9)

График функции fÀ(x) получается из графика f(x) его "растяжением" (если |Л| > 1) в я раз и "опусканием" к оси ох тоже в я раз. Это преобразование для случая я = 2 показано на рис. 10, 11. С помощью рисунков можно понять, почему так должно произойти, т. е. почему функция-плотность св. ях должна иметь вид (9). Поясню.

На рис. 10 показан небольшой отрезок значений св. x (его начало в точке х) и заштрихована соответствующая ему площадь, величина которой равна вероятности по-

Рис. 10 Рис. 11

явления в опыте этих значений (согласно смысла функции-плотности). Этому отрезку соответствует в 2 раза больший отрезок значений с.в. 2Х, показанный на рис. 11 (его начало в точке 2х). Вероятность появления в опыте этих значений та же (согласно определения 5), значит вторая заштрихованная площадь должна равняться первой. Поскольку основание второй площади в 2 раза больше, чем у первой, то её "высота" должна быть в 2 раза "ниже". Если уменьшать длину первого отрезка, устремляя её к нулю, то длина соответствующего ему второго отрезка тоже устремится к нулю. Первая площадь*) в пределе превратится в отрезок, длина которого равна значению функции-плотности f(x) с.в. X в точке x, а вторая площадь - в отрезок /2(2х), т. е. в пределе получится f(x) = 2f (2х), что равносильно (9).

В частности, если с.в. Y = Тт] умножить, к примеру, на число Я = 3, то промежуток значений с.в. ЗУ расширится в 3 раза и станет [0;з], а график её функции-плотности "опустится" к оси ОХ (рис. 12, 13). Сама функция ф) примет вид (9), т. е. f3(x)=(l/3)f(x/3). Но /(х/з) = 1, ибо функция / равна единице на отрезке [0; 1] и (хе [0;з]=> {х/з)е [0; 1]). Значит,

Рис. 12 Рис. 13

Свойства, связанные с операцией умножения на число, следующие:

3°. м{лх) = Л-М{х);

4°. d(ax) = à2d(x) (интересно, - почему появился квадрат?); 5°. ст{ах) = Яа{х).

Нетрудно убедиться в справедливости свойств для дискретных св.:

(теперь понятно, откуда "выскочил" квадрат).

Если X - непрерывная с.в. с множеством значений [a; b] и плотностью f(x), то с.в. АХ будет иметь множество значений [Яа; Äb] и функцию-плотность (9). Вычислим математическое ожидание м(Ях)и дисперсию о(Ях) по соответствующим формулам (1) и (5), используя при вычислении интегралов метод замены переменной.

Вычисление d(àx) проведите сами.

*) Имеется в виду, конечно, первая заштрихованная фигура, площадь которой в пределе станет нулём.

Примечание. На основании определений 4 и 5 можно составлять линейные комбинации с.в. - ЛХХХ +Л2Х2 +... + ЛпХп (линейные функции нескольких св.). В разделе 2 мы использовали квадрат с.в. X2. А нельзя ли ввести операцию извлечения корня из с.в. - 4x1 Можно, но, конечно, не для всех с.в. Более того, можно ввести самое общее понятие произвольной функции (р от одной или нескольких с.в. - <р(Х19Х2,...,Хп) и поставить те же задачи, которые решались в данном разделе: найти числовые характеристики функции от св.; найти закон распределения функции с.в. В общем виде это сложные задачи, их решение можно найти в [2, гл. 8, 9]. Следует подчеркнуть, что здесь не праздное обобщение, его требует практика. Простейший пример: на вход технического устройства поступает случайное воздействие X, оно подвергается функциональному преобразованию ср и на выходе появляется с.в. Y = ç(x), требуется найти числовые характеристики с.в. 7, или закон её распределения.

Контроль 4. Хх = Х2 = 7]0;1]. Определите множество значений с.в. 7 = 0,5Х, -2Х2 и найдите m(y), d(y) и <t(y).

5. Медиана. Мода

Наряду с математическим ожиданием m - средним взвешенным значением с.в. - в вероятностных расчётах используются и другие средние - медиана и мода.

Определение 6. Медианой с.в. X (непрерывной или дискретной) называется такое её значение х = хт, для которого выполняется равенство

р{Х<хт) = р{Х>хт) = \/2. (10)

Смысл числа хт легко понять с помощью графика функции-плотности f(x) (рис. 14). Вертикаль, проходящая через точку х = хт, делит подграфик функции f(x) на две равновеликие части (потому и "медиана"). Дискретные с.в. не всегда имеют медиану (постарайтесь сами привести пример).

Определение 7. Модой непрерывной с.в. X называют то её значение х = Мх (оно может быть не одно), в котором функция-плотность достигает локального максимума. Модой дискретной с.в. называют то её значение, которое более вероятно, чем соседние.

Рис. 14

Рис. 15

На рис. 14 мода лежит левее медианы: Мх<хт. Если функция-плотность f(x) имеет симметричный одногорбый график (рис. 15), то все средние значения совпадают:

Пример 9. Непрерывная с.в. X распределена на промежутке [0;2] по закону прямоугольного треугольника, т. е. её функция-плотность имеет вид f(x) = ax, хе [0;2]. Найти коэффициент а и все средние значения — хт, Мх и M.

Решение. Как определить параметр а ? Вы помните, что функция f(x) может моделировать с. в. только при условии, что площадь её подграфика равна единице. Из этого условия и найдём а:

Итак, функция-плотность с.в. X задаётся функцией f(x) = 0,5x, хе [0;2].

Моду легко определить по графику (рис. 16), где видно, что наибольшее значение функция f(x) принимает в крайней точке х = 2. Значит, Мх = 2. Из графика видно также, что медиана хт лежит между точками х = 1 и х = 2. Определим её значение из условия (10)

Любопытно, где лежит математическое ожидание Ml Ясно, что близко от медианы хт, но правее или левее? Надо считать.

Оказалось, левее. Чуть-чуть. •

Контроль 5. Плотность распределения с.в. Z задана функцией f(x) = a\A + 2x-x2\ хе[0;3]. Найдите параметр а. Постройте график функции-плотности и определите с его помощью ориентировочное расположение моды Мх. Как вам кажется, - где лежит медиана хт, правее или левее Мх ? Почему? Определите хт точно. Где лежит математическое ожидание M ? Определите его точно.

Рис. 16

6. Система числовых характеристик

Математическое ожидание M и дисперсия D - две самых важных для вероятностных расчётов (прогнозов) числовых характеристики св. Эти числа, в сущности, обобщённо характеризуют особенности графика функции-плотности f(x), которая является абстрактной моделью св..

Напомню смысл M и D. Число M, вообще говоря, указывает ориентировочно ту область промежутка [а; Ь], в которой располагаются более вероятные значения св. и над которой график функции f(x) нередко (но не всегда, - рис. 16) имеет "горб" (рис. 17, 18).

Число D характеризует степень разбросанности значений св. от её среднего значения M. Величина D зависит от длины промежутка [à; Ь] и от того, насколько малы вероятности далёких от M значений св., т. е. насколько "низок" график функции f(x) у "краёв" промежутка [à; b]. Очевидно, дисперсия D(2X) значительно больше, чем D(x) (рис. 17, 18), точнее, - в 4 раза больше, т. к. В(2Х) = 22 D(X), согласно 4-му свойству дисперсии (см. п. 4).

Есть и другие особенности св. (графика её функции-плотности f(x), которые бывает необходимо оценить числом. Посмотрите на рис. 19, - вы видите три сходных распределения - 1, 2, 3, из которых первое симметричное, второе и третье - нет. Третье, очевидно, более асимметрично, нежели второе. Как оценить числом степень асимметрии? Посмотрите теперь на рис. 20, - как оценить степень островершинности двух изображённых распределений? Ответы узнаете чуть ниже.

Существует стройная система характеристик св. (их называют моментами), которая включает M, D, характеристики асимметрии, островершинности и многие другие. Эта система задаётся следующими двумя определениями.

Определение 8. Начальным моментом к-го порядка (£ = 1,2,,,,) непрерывной св., заданной плотностью распределения f(x) хе [а;Ь], называется число ak9 которое вычисляется по формуле

(11)

Рис. 17 Рис. 18

Рис. 19

Рис. 20

Для дискретной с.в. это число вычисляется по схожей формуле

(11')

Определение. 9. Центральным моментом к -го порядка (к = 1,2,...) непрерывной св., заданной плотностью распределения f(x) хе [а;Ь], называется число juk, которое вычисляется по формуле

(12)

Для дискретной с.в. это число вычисляется по схожей формуле

(12')

Примечание 1. Иногда в теоретических рассуждениях (лек. 12, п. 2, (1)) используются так называемые абсолютные начальные или центральные моменты. Например, из формулы (12) получается абсолютный центральный момент Ск так:

(12-)

Примечание 2. Следует иметь в виду, что есть св., которые не имеют некоторых моментов. В лек. 5, п. 6 был пример дискретной с.в. с бесконечным множеством значений, у которой нет 1-го начального момента, потому что для неё ряд (l Г) при к = 1 расходится. Непрерывная с.в. с функцией-плотностью f(x) = а/(\ + х2), хе (-оо; + оо) (распределение Коши) не имеет математического ожидания (интеграл (11) для неё не сходится абсолютно) и абсолютный начальный момент Щ получается бесконечным:

Итак, формулами (11) и (12) определены последовательности начальных а19а29...9ак9... и центральных моментов jul9ju29...9juk9.... Это и есть система разнообразных числовых характеристик с.в.

Вы, конечно, заметили, что формула (11) похожа на математическое ожидание (1), а формула (12) - на дисперсию (4). Более того, M - это и есть первый начальный момент, a D - второй центральный:

ах = M, ju2=D.

Каждый другой момент ак и /ик несёт какую-то свою часть информации о с.в. Мы не будем здесь выяснять, что это за информация, каков её смысл (как делали ранее для M и D). Остановимся только на двух центральных моментах ju3 и //4, - они как раз и характеризуют заинтересовавшие нас асимметрию и островершинность св..

Контроль 6. Распределение 7j0;1] задаётся функцией-плотностью /"(*) = 1, хе [0;1]. Вычислите значения а]9 а29 ju]9 ju2.

7. Асимметрия. Эксцесс

Асимметрия. Третий центральный момент определяется формулой

(13)

Если бы мы вычисляли ju3 для различных св., то заметили бы, что у симметричных распределений ju3 =0 (кривая 1 на рис. 19). У кривых, у которых "горб" сдвинут вправо, ju3 <0 (кривые 2 и 3 на рис. 19), причём, значение ju3 тем меньше (по модулю - больше), чем больше сдвиг. У кривых, чей "горб" сдвинут влево, ju3 >0 (кривая 4 на рис. 19). Конкретных расчётов здесь делать не будем, потому что вычисления интеграла в формуле (13) затруднительны из-за куба и требуют много времени.

Почему? Попробую объяснить вам, почему значения ju3 зависят от степени скошенности графика функции-плотности f(x).

Разобьём интеграл (13) на два слагаемых так:

Не замечаете ли вы, что первое слагаемое отрицательно (интеграл /, < 0), а второе - положительно ( /2 > 0)? Ведь, в первом интеграле хе[а;М], следовательно,

X < M => х- M < О => {х- M f < О ^> {х-M f • f(x)< 0 ^> J {x-Mff(x)dx < 0, ( f(x)> 0).

Для второго интеграла аналогичная цепочка приводит к /2 > 0.

Если график функции f(x)xe[a;b] симметричен относительно прямой х = М (при этом M = (a+b)/2, рис. 21), то оба интеграла равны по абсолютной величине -|/, i = /2 (рис. 22) и, следовательно, ju3 = -|/, | + /2 = 0.

Если же "горб" графика функции f(x) сдвинут вправо от середины отрезка [а;Ь]

Рис. 21 Рис. 23

Рис. 22 Рис. 24

(рис. 23), то вероятности "правых" значений с.в. больше, чем вероятности "левых", и, согласно смыслу числа М, оно тоже сдвигается вправо от середины отрезка [а;Ь]. Но тогда длина отрезка [а\М] больше, чем длина отрезка [а;М]. Отсюда следует, что подынтегральная функция первого интеграла /,, определённая на [а;М], имеет "больше" отрицательных значений, нежели подынтегральная функция второго интеграла /2 (она определена на [а; М]) имеет значений положительных (рис. 24). Именно по этой причине "отрицательность" первого интеграла /, перевесит "положительность" второго, т. е. |/,| > /2 (на рис. 24 первая заштрихованная площадь 5, =|/,| больше второй S2 =/2) и, в результате, окажется //3 = -|/, | + /2 < 0.

Данное рассуждение, конечно, не строго математическое, - оно логично, но использует неопределённые термины и апеллирует к интуиции. Его цель - убедить, объяснить причины факта.

Обычно степень асимметрии с.в. измеряют несколько иным числом, а именно, - //3 делят на куб среднего квадратического отклонения а для того, чтобы получить безразмерную величину (ju3 имеет размерность куба св.). Полученная таким образом новая характеристика скошенности обозначается Sk (от английского skew - "косой") и носит название коэффициента асимметрии:

(14)

Эксцесс. Четвёртый центральный момент определяется формулой

(15)

Чем более острый "горб" имеет график функции-плотности f(x) с.в. X, тем большее значение //4 даёт формула (15). Следовательно, число //4, действительно, характеризует степень островершинности распределения X. Его тоже делают безразмерным, деля на а4 и, кроме того, вычитают 3 (сейчас поясню). Получается характеристика островершинности ("крутости") распределения X, которую называют эксцессом и обозначают ех:

(16)

В формуле (16) число 3 вычитается из отношения ja J а4 потому, что для часто встречающихся в практических исследованиях нормальных распределений (о них упоминалось в п. 3 и мы будем подробно исследовать этот класс с.в в следующей лекции) отношение juja4=3. Следовательно, эксцесс, оп-

Рис. 25

ределённый формулой (16), позволяет сравнивать распределения по степени островершинности с нормальным, для которого ех = О. Кривые, более крутые, чем нормальная кривая (она выделена на рис. 25), обладают положительным эксцессом, менее крутые - отрицательным.

Контроль 6. Распределение 7j0;1] задаётся функцией-плотностью /(*) = 1, хе [0;1]. Скажите, не вычисляя, каково значение его 3-го центрального момента и какой знак эксцесса. Почему? Постройте график функции (х-М)3 f(x) и покажите с помощью графика значения |/,| и

12. Вычислите значения //3, ju4, ст, Sk, ех.

8. Упражнения

1. Плотность распределения св. x задана функцией f(x) = ax2, хе[0;2]. Определите параметр а и постройте график функции f(x). Учитывая вид графика, выскажите предположение, - где расположено математическое ожидание М = М(х)? Рассчитайте его точно. Как вы думаете, - какова вероятность Р(Х<М), больше или меньше половины? Рассчитайте её точно. Где лежит медиана хт, - правее или левее M ? Рассчитайте её ТОЧНО. Где расположена МОДа Мх ? Отв.: 3/8; 3/2; 27/б4; Щ - 1,59; 2.

2. Плотность распределения св. x задана функцией f(x) = я(5-х)2,хе [1;5]. Определите параметр а и постройте график функции f(x). Где расположено среднее значение M = м(х)1 Рассчитайте его точно. Больше или меньше половины вероятность Р(х>м)? Рассчитайте её точно. Определите два других средних значения - медиану и моду.

3. Св. x задана плотностью распределения f(x) = 2х, хе[0;1]. Приблизьте св. x дискретной св. Х4 (о том, как это делается, см. п. 1): разбейте [0,l] на 4 равные части Ах,, рассчитайте вероятности pi =р(Хе Ах,), значения £ св. Х4 выберите серединами отрезков Ах,, и запишите ряд распределения св. Х4. Нарисуйте многоугольник распределения св. Х4 и оцените расположение математического ожидания м(х4). Вычислите точно м(х4) и М(х), - близки ли они? Приблизьте таким же образом св. x дискретной св. xs и вычислите m(xs)- приближается ли оно к м(х)?

4. Сравните по степени разброса значений две св: 7]0;1], с плотностью распределения f(x) = 1, хе [0;l], и св. x из предыдущей задачи, для которой f(x) = 2х, хе [0;l]. У какой из этих св. разброс больше и почему? Вычислите точно дисперсии и с.к.о. данных св., - оправдалось ли ваше предположение?

5. С.в. Si задана функцией-плотностью f(x) = 0,5 sin x, хе[0;;г]. Сравните разброс с.в. 7[0;1] и с.в. Si.

6. С.в. Z задана плотностью f(x) = (l/12)(4 + 2x-x2), хе[0;3]. Сравните разброс с.в. Si и Z.

7. С.в. X подчинена закону Симпсона ("закону равнобедренного треугольника"), - это значит, что её плотность имеет вид f(x) = 1-|х|, хе [-l;l] (рис. 26). Какой интервал, двухсигмовый или трёхсигмовый покрывает её значения?

Указание. При вычислении дисперсии разбейте интеграл на два интеграла, учитывая, что функция f(x) задаётся двумя формулами: f(x) = * +1, если *е[-1;0], и f(x) = 1 - x, если x е [0; 1].

8. Распределение с.в. X задано на сегменте [-l;l] двумя аналитическими выражениями: f(x) = (2/3)(x + l), если хе [-1;0,5], и /(x) = 2(l-x), если хе [0,5;1]. Постройте график функции f(x) хе [-l;l]. Оцените без вычислений расположение среднего значения M и величину <т, запишите свои оценки. Вычислите M, D и а. Что вы оценили более точно - M или al Какой интервал, - двухсигмовый или трёхсигмовый - покрывает значения с.в. XI

Указание. При расчёте дисперсии надо сделать в интегралах подстановку x - M = t, она упростит вычисления.

9. Распределение с.в. Y имеет вид, изображённый на рис. 27. Составьте аналитическое выражение функции f(x). Оцените расположение M. Рассчитайте его точно. Как вы думаете, у какой с.в дисперсия больше, у с.в. Y или у с.в. X из предыдущей задачи? Рассчитайте d(y) точно. Каким интервалом, двухсигмовым или трёхсигмовым покрываются значения с.в. Yl

Указание. При определении аналитического выражения функции f(x) используйте уравнение прямой, проходящей через две точки:

10. X - св., заданная в упражнении 7 (рис. 26). Определите промежуток значений с.в. 1,5Х и нарисуйте график её функции-плотности. Составьте аналитическое выражение этой функции.

11. Y - св., заданная в упражнении 9 (рис. 27). Определите промежуток значений с.в. 0,25Х и нарисуйте график её функции-плотности.

Рис. 26

Рис. 27

12. Определите промежуток значений с.в. 1,5Х + 0,257 (X и Y - св., заданные в упражнениях 7 и 9). Найдите M, D и сг этой с.в.

13. Распределение с.в. Х2 показано на рис. 28. Найдите её дисперсию D и среднее квадратическое отклонение а, используя свойства операций над с.в.

14. Класс св., распределённых по закону Симпсона с параметром я, задаётся функцией-плотностью f(x) = (l/a)(l-(\x\/a)\ хе [-а;а] (одна из таких функций с параметром а = \ показана на рис. 26). Нарисуйте графики функций с параметрами а = 2 и а = 0,5. Найдите числовые характеристики М, £>, <т, //3, Sfc, //4, £v данного класса с.в. при произвольном значении параметра а. Оцените степень островершинности распределений при а = 2 и ö = 0,5.

15. С.в. X задана плотностью распределения f(x) = 0,5х, хе [0;2] (рис. 18). Найдите начальные и центральные моменты 1-го, 2-го, 3-го и 4-го порядков. Определите степень скошенности и степень крутости данной с.в.

Отв.: 4/3; 2; 3,2; 16/3; 0; 2/9; -8/135; 16/135. Указание. Используйте формулы, выражающие центральные моменты через начальные: /и2 = а2 -а], /и3 = аъ - Ъаха2 +2а\, //4 = а4 -Аахаъ +6а2а2 -Ъа\.

16. Докажите, что для любой непрерывной с.в. её центральный момент первого порядка равен нулю.

17. С.в. X распределена на сегменте [0;l] по закону прямоугольного треугольника, т. е. f(x) = ax, xe[0;l]. Определите параметр а и постройте график функции-плотности. Найдите М, £>, а и Sk данного распределения. Отв.: 2/3 ; l/l8; l/blï; -2V2/5.

18. Случайные величины, подчинённые закону Лапласа, имеют плотность распределения вида f(x) = Ae~À^, Я>0, хе(-оо; + оо). С.в. L распределена по закону Лапласа с параметром Я = 1 (рис. 29). Определите коэффициент А. Сравните с.в. L и с.в. X из упражнения 7 (закон Симпсона): а) у какой из них больше разброс значений? б) у какой больше островер-

Рис.28

Рис. 29

шинность? Найдите M, D, а и S'A: для обоих распределений. Оцените вероятность появления значений с.в. L вне трёхсигмового интервала.

Отв.: для L — А - 0,5; M =0; а = л/2; £х =3.

19. Опыт состоит в стрельбе по мишени. С.в. S, связанная с этим опытом, принимает значения, равные расстоянию s от точки попадания до центра мишени. Известно, что эта с.в. хорошо моделируется законом Релея с функцией-плотностью f(s) = Ase~h2s\ se [0;+ где параметр h зависит от качества стрельбы, - чем больше h, тем точнее стрельба (рис. 30), а множитель А определяется известным образом по свойству функции-плотности. Будем считать h = 1 (график функции f(x) = Ase~s показан на рис. 30). Найдите коэффициент А, моду МХ9 математическое ожидание MS9 дисперсию Ds. Найдите вероятность того, что расстояние от точки попадания до центра мишени окажется меньше моды. Отв.: 2; I/V2; 4kJ1\ (4-л-)/4; 0,393.

20. В двух отделах учреждения находятся по два компьютера, -старый и новый. Старые в 2-3 раза чаще выходят из строя. В первом отделе замечено, что вероятность выхода из строя старого компьютера за определённый период времени равна /?, = 0,6, а второго - р2 = 0,3. Во втором отделе - ръ =0,7, рА =0,2. Рассмотрите две св.: X, - число работающих компьютеров в 1 -м отделе, Х2 - во втором (точнее, - число компьютеров каждого отдела, не вышедших из строя за определённый период времени). Составьте ряд распределения каждой св., оцените их числовые характеристики M, D, а и Sk (у какой с.в. они больше?), и рассчитайте их точно. Сделайте выводы. Отв.: Мх = 1,1; D, = 0,45; ох = 0,67; ju3 = -0,036; Sk = -0,12.

21. Орудие три раза стреляет в мишень. Вероятность попадания при каждом выстреле равна 0,4. Случайная величина X - число попаданий. К какому классу относится данная св.? Составьте её ряд распределения. Оцените расположение среднего значения M, знак и степень скошенности. Рассчитайте числовые характеристики M, £>, а и Sk. Отв.: 1,2; 0,72; о,85; 0,24.

Рис. 30

ЛЕКЦИЯ 11

ТИПЫ СЛУЧАЙНЫХ ВЕЛИЧИН

(равномерные, показательные, нормальные)

Если вы внимательно изучали предыдущие лекции, то могли заметить сходство, однотипность некоторых примеров св., - сходство распределений их вероятностей, сходство графиков функций-плотностей f(x) (рис. 1,2, 3).

Однотипные св. постоянно возникают в практических задачах. Поэтому часто встречающиеся типы св. были выделены и исследованы. Результаты абстрактного исследования (формулы) позволяют быстро анализировать разнообразные конкретные ситуации.

В данной лекции мы рассмотрим три важнейших типа св.: равномерные (рис. 1), показательные (рис. 2) и нормальные (рис. 3)*). Как всегда, будем начинать с примеров, которые помогут выделить типовое свойство рассматриваемых св. Затем уточним это свойство, определив функцию-плотность f(x).

Исследование каждого типа св. состоит в ответе на три вопроса. Как меняется график плотности f(x) при изменении параметров св.? Какой вид принимают формулы для вычисления числовых характеристик? Какой вид приобретает формула вероятности попадания св. в заданный интервал (а\0)1 Если помните, эти же вопросы ставились при исследовании дискретных св. - биномиальной и Пуассоновской (лек. 7, 8).

Для понимания вычислений, которых в лекции много, потребуется знание свойств показательной функции и умение находить пределы и интегралы.

Рис. 1

Рис. 2

Рис. 3

*) Вы, конечно, понимаете, что есть много других типов св. С некоторыми из них вы познакомитесь в разделе упражнений, а также при выполнении лабораторной работы.

1. Равномерные с.в. (типовое свойство)

Пример 1. Вспомните св. Тм - время ожидания поезда в метро (лек. 9, п. 2-4). Если провести большую серию опытов, то значения св. Тм будут появляться одинаково часто (почти!) на всех равных участках промежутка [0;120], ибо нет причины, по которой какой-то участок имел бы предпочтение. Статистическая плотность f*(x) св. Тм имеет вид ступеньчатой функции (рис. 4), а предельная функция - константа f(x) = 1/120 (рис. 5). •

Рис. 4 Рис. 5

Пример 2. Представьте вертикально закреплённый на оси диск, который может свободно вращаться (рис. 6). Длина окружности диска равна единице (одному метру, например). На окружности диска отмечена точка О (начало отсчёта) и нанесена равномерная шкала -1 мм, 2мм, Змм, 999мм (на рис. 6 шкала растёт вверх). Напротив горизонтального диаметра укреплена неподвижная стрелка ничтожно малой ширины.

Проведём следующий опыт: крутнём диск вниз и, дождавшись, когда вращение закончится, отметим на окружности точку М, которая остановится против стрелки (это может быть точка, отмеченная на шкале, или точка между делениями шкалы). Точке M соответствует число х, равное длине дуги О AM (напоминаю, шкала растёт вверх). Число х может быть рациональным (если точка M совпадёт с каким-то делением шкалы или с его долей), может быть иррациональным. Т. е. число х может быть любым из "сплошного" промежутка [0; 1). Следовательно, в условиях рассматриваемого опыта нами определена непрерывная случайная величина со значениями из полусегмента [0;l). Обозначим её через Я[0;1).

Если провести опыт много раз, то отмеченные точки M заполнят окружность диска почти равномерно*), а соответствующие им числа х (значения св.) так же равномерно заполнят промежуток [0; l). Причина та же - нет факторов, которые больше влияли бы на появление точки M в

Рис. 6

*) Само собой разумеется, что диск "правильный", - однородный, центрированный и пр.

каком-то участке окружности диска, нежели в других участках той же длины.

Гистограмма, статистическая плотность f*(x) и плотность f(x) с.в. 7?[01) имеют вид (рис. 7, 8), сходный с Тм (рис. 4, 5), - они лишь "уже" и "выше". •

Пример 3 (обобщённый). Опыт состоит в том, что на промежутке [a;b] выбирается случайным образом точка x. Механизм выбора может быть разным, но никакая точка не должна иметь "предпочтения" перед другими. Ясно, что получается непрерывная с.в. R[a.b]9 однотипная с предыдущими. Её функция-плотность f(x)=n показана на рис. 9. Константа с определяется из основного свойства функции-плотности (площадь подграфика функции f(x) равна единице):

Итак, типичное свойство рассмотренных св.: при многократном повторении опыта значения с.в равномерно заполняют промежуток [a;b] ([0;120], [0;l)).

Определение 1. Случайная величина X называется равномерной (или равномерно распределённой) на промежутке [a;b] (или [a;b\ (a\b\ (a\b)\ если её плотность распределения есть константа, т. е.

(1)

Равномерные с.в. нередко встречаются в механике, как случайные углы поворота деталей механизмов. В современной вычислительной технике с.в. 7?[01] ("случайное число от 0 до 1") используется, как элемент, из которого путём определённых преобразований можно построить непрерывную с.в. с любым распределением вероятностей.

Контроль 1. В условиях опыта, описанного в примере 2, введите другую с.в. Rç - угол ç (меньший), который составит фиксированный радиус СО с горизонтальным диаметром СМ после остановки диска (рис. 6). Каково множество значений с.в. Rç? Будет ли Rç

Рис. 7 Рис. 8

Рис. 9

равномерной с.в.? Почему? Запишите аналитическое выражение функции-плотности f(x) и постройте её график.

2. Исследование равномерного распределения

(зависимость от параметров, числовые характеристики, попадание в интервал)

Как было сказано во введении к лекции, исследование каждого типа с.в. состоит в решении трёх задач (они перечислены в заголовке раздела).

Задача 1. Какова динамика изменения графиков функции-плотности (1) при изменении равномерных св.?

Решение. Равномерные с.в. различаются между собой промежутками значений [а;Ь]. Функция (1) и её график зависят от двух параметров а и Ъ. Постараемся представить, как меняется график плотности (1) при изменении этих параметров.

Закрепим а = 0 и станем увеличивать Ъ -> <*>. Поскольку площади подграфиков любой функции-плотности должны оставаться равными единице, а сами подграфики равномерных с.в. представляют собой прямоугольники, то их высоты h = c убывают и h-с- (1//) —^ >О (рис. 10). Если а Ф 0, картина та же. •

Таким образом, с помощью рис. 10 наглядно обозревается совокупность всех равномерных с.в. (точнее, - их моделей).

Задача 2. Определить числовые характеристики произвольной равномерно распределённой с.в. X, заданной функцией-плотностью (1).

Решение. Математическое ожидание с.в. X совпадает со серединой промежутка [a; b] (рис. 9), в силу симметрии графика f(x) относительно прямой, проходящей через эту середину (лек. 10, п. 1). Этот же результат получается из общей формулы математического ожидания (лек. 10, (1)), применённой к равномерной плотности (1):

Итак,

(2)

Рис. 10

Дисперсия равномерной с.в. X зависит от длины промежутка [a;b]: чем больше его длина /, тем больше разброс значений с.в. Точное значение DR вычислим по общей формуле (лек. 10, (5)):

Итак,

(3)

Среднее квадратическое отклонение тоже оценивает разброс значений с.в. и вычисляется как корень из дисперсии:

(4)

М, D и а — главные характеристики св., они несут основную информацию и часто используются для решения практических задач. Другие характеристики (мода, медиана, скошенность и др.) используются реже, поэтому скажу о них сжато.

Моды равномерное распределение не имеет. Медиана совпадает с MR. С кошенность (асимметрия) равна нулю, - опять же, в силу симметрии графика f(x). Эксцесс (плосковершинность) должен быть отрицательным и одинаковым для всех равномерных св., ибо график f(x) абсолютно "плоский" - отрезок прямой линии. Можете сами вычислить эксцесс точно. Для этого посчитайте сначала 4-й центральный момент juA по формуле (8), лек. 10:

После этого используйте формулу эксцесса (лек. 10, (ю)):

Применение формул (2), (3), (4). Из общих формул легко получить значения числовых характеристик для различных св.:

Оценка интервала значений. Область значений [а; Ъ\ любой равномерной с.в. покрывается двухсигмовым интервалом (М-2а; М + 2а). Это значит, что М-2а<а<Ь<М + 2а. Для с.в. Тм эти неравенства получаются так:

M-2a = 60-2VT^-60-2-35 = -10<(^ = 0)<(è = 120)<60 + 2VÏ2ÔO-60 + 2-35 = 130

Для с.в. Ä[0;1] её область значений [0;l] покрывается даже односигмовым интервалом (М-ст; М + а) (проверьте сами).

Причина, по которой двухсигмовый интервал всегда покрывает [a;b], состоит в том, что для равномерных с.в. а всегда немного больше половины максимального отклонения А (рис. 11)-

и, следовательно,

Неравенство Ь<М + 2а устанавливается аналогично.

Задача 3. Какова вероятность события, состоящего в том, что при выполнении опыта над равномерной с.в. XR появится значение, принадлежащее заданному интервалу (а;0) a [a;b\l

Решение простое, ибо проста функция f(x) (константа). Общая формула (лек. 9, п. 7, (7)) легко даёт ответ:

Итак, задачу решает формула

(5)

Искомая вероятность численно равна площади подграфика функции-плотности f(x) над интервалом (a;ß). •

Контроль 2. Определите M, D и а с.в. Tç (контроль 1).

Проверьте расчётом, покрывает ли двухсигмовый интервал все значение св.? Определите вероятность того, что с.в. Tç примет значение а) острого угла; б) острого угла, большего 60°? Изобразите полученные вероятности в виде площадей на подграфике функции-плотности.

Рис. 11

3. Показательные с.в., их связь с потоком событий

Пример 4. Вспомним с.в. Т - интервал времени между двумя соседними вызовами на АТС (лек. 9, п. 2, 3, 5). Опыт здесь состоит в том, что на АТС выбирается случайно какой-то телефонный разговор и

фиксируется промежуток времени от момента, когда поступил этот вызов, до момента следующего за ним вызова. Заметьте, - фиксируется не длительность разговора, а промежуток времени, протекший между соседними вызовами. Выбор разговора ограничивается определённым периодом суток, например, от 8 до 9 часов утра.

Если провести опыт много раз, набрать статистический материал, сгруппировать его и построить гистограмму, она будет выглядеть как ступенчатая "падающая горка" (рис. 12), потому что среди появившихся значений св. Т будет много малых (распределение этих значений условно показано на оси ОХ, рис. 13). График предельной функции f(x) - плавно "падающая горка" (рис. 13). Аналитическое выражение этой функции имет вид f(x) = Л-е~А\ А>0, хе [0;+ <*>). О том, как подбирается эта формула, мы вели речь в лек. 9, п. 5. Как подбирается параметр Л, - узнаете чуть позже.

Если провести серию опытов в другое время суток, например, от 23 до 24 часов ночи, то распределение появившихся значений св. изменится -длительные интервалы будут чаще. Но общий характер распределения останется прежним - сначала гуще, потом реже. График функции f(x) сохранит вид "падающей горки", но будет более пологим (рис. 14). •

Определение 2. Непрерывная св. X называется показательной (показательно распределённой), если её функция-плотность имеет вид

(6)

где Л>0 - параметр, принимающий своё значение для каждой конкретной св. данного типа.

Чтобы данное определение было корректным, надо проверить выполнение двух свойств функции-плотности (лек. 9, п. 6):

1°. /(jc)>09Vxe [0; + оо).

Действительно, показательная функция всегда положительна: е~Лч > О, Vx, VA, а при умножении на число Л > О знак функции сохраняется.

Рис. 12 Рис. 13 Рис. 14

Вычислим несобственный интеграл (не забудем, что X > 0):

Типовое свойство показательных с.в. можно описательно сформулировать так: при выполнении большой серии опытов над с.в. её значения появляются более часто в начале промежутка [0; + °о)^ а далее густота значений постепенно убывает.*) Степень быстроты убывания может быть разной - от очень быстрой до очень-очень медленной. Экспоненциальный характер убывания определяется функцией (6). Следует отметить, что убывание "вогнутое" и при медленном убывании (малое Л) вогнутость функции f(x) может быть очень слабо заметной.

Связь с потоком событий. Пример 4 есть частный случай гораздо более общей ситуции. Отдельный вызов на АТС - это элемент потока вызовов, следующих друг за другом с разными интервалами. Подобные потоки событий возникают в многообразных ситуациях - очереди в билетные кассы, ремонтные мастерские, справочные бюро, парикмахерские и т.п. В лекции 8 вы познакомились с простейшим, Пуассоновским потоком. Если в таком простейшем потоке рассматривается обобщённая с.в. интервал времени между произвольными соседними событиями потока, то её распределение моделируется функциями вида (6). Это утверждение можно вывести теоретически и оно подтверждается практикой. Тем самым, точно описывается класс опытов, в которых гарантировано появление показательных распределений.

Контроль 3. С.в. X имеет показательное распределение с параметром À = 1/3. Запишите функцию-плотность f(x) и постройте её график (учтите е~х «0,37). Вычислите вероятности попадания значений с.в. X в интервалы (0;l), (1;2), (2;3), (l 0; 11). Соблюдается ли закономерность, характерная для показательных распределений?

4. Исследование показательного распределения

Задача 1. Как меняется график функции-плотности (6) при изменении параметра Л от 0 до + оо ?

*) Существуют и другие с.в. со сходным (но не идентичным, не экспоненциальным) свойством убывания густоты значений, - например, распределение Парето.

Решение. Рассмотрим отдельно два случая: а) Я возрастает от 1 до + оо ; б) Я убывает от 1 до 0.

а) При Я = 1 функция (6) принимает вид ух =е~х9х>0, её график - экспонента (рис. 15). Увеличим Я = 3. График функции у3 = Зе~3х был построен раньше, в лек. 9, п.

3., рис. 13. Напомню: он получался двумя преобразованиями экспоненты: 1) ух=е~х переходит в у2=е~3\ при этом все точки экспоненты приближаются к оси ОХ в три раза ближе, экспонента "сжимается"; б) у2=е~3х переходит в у3=3е~3х и все ординаты графика у2 увеличиваются в три раза, он "поднимается" (рис. 15). В результате, получается более крутой график, быстро приближающийся к оси ОХ при увеличении х.

Ясно, что при дальнейшем увеличении Я = 4;5;... график функции-плотности (6) будет становиться всё круче и круче и будет очень быстро приближаться к оси ОХ.

б) Станем теперь уменьшать Я от 1 до 0. Возьмём Я = 1/3.

Преобразования экспоненты аналогичные: 1) ух переходит в у4=е 3, при этом все точки экспоненты удаляяются от оси ОХ в 3 раза дальше, экспонента "растягивается"; 2) у4 переходит в у5=-е3, все ординаты уменьшаются в три раза, приближаясь к оси ОХ (рис. 16). Получается график функции-плотности (6) - пологая "горка", близкая к оси ОХ и медленно к ней приближающаяся с ростом х.

Ясно, что при дальнейшем уменьшении Я = 1/4; 1/5;... графики функции (6) будут опускаться к оси ОХ и очень медленно снижаться при X —> оо. •

Рис. 15

Рис. 16

Вывод. Представьте теперь динамику в целом. При очень больших значениях параметра Л график показательного распределения (6) - очень крутая "горка", вогнутая, очень быстро "падающая" к оси ОХ и затем выравнивающаяся почти горизонтально, почти сливающаяся с осью ОХ при X -> оо. При уменьшении Л "горка" становится всё более пологой. После перехода через Л = 1 и дальнейшего уменьшения Л^О "горка" делается низкой и очень-очень пологой, почти горизонтальной, оставаясь тем не менее, вогнутой.

Итак, в одной динамичной картине мы обозрели все возможные показательные распределения.

Задача 2. Определить числовые характеристики любой показательно распределённой св., заданной функцией-плотностью (6).

Решение. Математическое ожидание будем отыскивать по общей формуле (лек. 10, (1)), используя определение несобственного интеграла:

Для вычисления определённого интеграла применим формулу интегрирования по частям

Продолжим отыскание M, которое принимает вид:

Для нахождения первого предела применяем правило Лопиталя, поскольку имеем неопределённость вида

второй предел равен нулю, ибо знаменатель неограниченно растёт. Получаем:

В итоге, приходим к очень простой формуле

(7)

Математическое ожидание показательно распределённой с.в. есть число, обратное её параметру Я.

На рис. 15 Я = 3 и M = 1/3, на рис. 16 Я = 1/3 и М = 3. Вывод: чем круче "горка", тем ближе к нулю M, чем более она полога, тем дальше от нуля M.

Дисперсию будем отыскивать по второй общей формуле (лек. 10, (5)), учитывая найденное выше значение M:

Для вычисления определённого интеграла придётся дважды интегрировать по частям (проделайте это сами). В результате, получим:

Пределы находятся без труда:

Возвращаясь к дисперсии, окончательно получаем:

(8)

На рис. 15 D = l/9, на рис. 16 D = 9. Вывод: чем круче "горка", тем меньше дисперсия, меньше разбросанность значений св.; чем более пологая "горка", тем больше дисперсия, больше разброс значений с.в.

Среднее квадратическое отклонение есть корень из дисперсии, значит,

(9)

Замечательное свойство показательных распределений: у всех св., распределённых по показательному закону, математическое ожидание совпадает со средним квадратическим отклонением.

Заметьте, - это свойство необходимое, но не достаточное. Тем не менее, оно часто используется на практике для решения вопроса, правдоподобна ли гипотеза о том, что полученные в серии опытов значения некоторой с.в. распределяются по показательному закону.

Признак п. с. в. Если оценки М* и о*, вычисленные по статистическому материалу, близки, это веский довод (не гарантия!) в пользу показательного распределения. Пример будет чуть ниже.

Мода любой показательной св., очевидно, равна нулю.

Скошенность (асимметрия) положительна, ибо вершина графика функции-плотности (6) всегда сдвинута в крайнюю левую точку промежутка [0; + °о). Точное вычисление скошенности трудоёмко. Если хотите, проведите эти вычисления самостоятельно. Я лишь намечу вам путь. Третий центральный момент:

Вы видите, что интеграл разбивается на четыре интеграла (после применения формулы куба разности), каждый из которых придётся брать так же, как и раньше, -несколько раз применяя формулу интегрирования по частям. Если не допустите при этом ошибок, то должны получить ju3=2/ä3.В итоге, скошенность окажется равной

(10)

Интересно получилось, — у всех показательных св. скошенность одинакова. Медиану и эксцесс вычислять не будем из-за длинного процесса интегрирования. Ясно, что ех > 0, ведь, вершина графика функции (6) всегда острая. •

Задача 3. Какова вероятность попадания значений показательной с.в. X в заданный промежуток (a;ß)a [0; + <*>)?

Решение.

Решает задачу формула

(11)

В частности, если ß = оо или а = 0, получаем формулы

(11')

(11'')

Контроль 4. С.в. X имеет показательное распределение с параметром Я = 2. Запишите выражение функции-плотности f(x) и нарисуйте эскиз её графика. Постройте график преобразованием экспоненты. Вычислите M, D и а. Найдите вероятности попадания с.в. X в интервалы (1;2), (0;2). Сделайте статистические прогнозы.

5. Приложение результатов исследования

Раньше у нас уже возникал вопрос: как отыскивать параметр Я показательно распределённой св.? После проведённого исследования можно дать простой ответ.

Статистический смысл параметра Д. Как его отыскивать? Запишем формулу (7) так: Я = —. Математическое ожидание M можно найти приближённо, если провести серию из большого числа к опытов над св., зафиксировать появившиеся значения х(1), х(2), х(к), и вычислить их среднее арифметическое:

Следовательно, приближённое значение Я даётся формулой

(12)

Вывод 1. Параметр Я показательной с.в. X - это число, обратное её математическому ожиданию М. Он может быть приближённо найден из серии опытов над с.в. X делением единицы на среднее арифметическое значений, появившихся в этой серии опытов.

Если с.в. X порождается простейшим потоком событий, то число, обратное среднему значению св., даёт среднее число событий потока в единицу времени - интенсивность потока. Например, если после эксперимента над с.в. Тф (промежуток времени между произвольными двумя соседними вызовами на АТС) получилось среднее значение М* = 5 сек., или, что то же, М*=1/12 мин., это значит, что на единичном промежутке времени в одну минуту укладывается 12 пятисекундных интервалов, т. е. среднее число событий потока в минуту Я = 12, интенсивность потока равна 12.

Вывод 2. Если показательная с.в. X порождается Пуассоновским потоком событий, то её параметр Я равен среднему числу событий потока в единицу времени. Эта величина называется интенсивностью потока.

Пример 4 (продолжение). После того, как установлено значение параметра Я показательной с.в. X, можно легко решать практические задачи. Вычислим, к примеру, вероятность того, что интервал времени между соседними вызовами на АТС окажется а) меньше 5 сек.\ б) от 5 до 10 сек.; в) больше 10 сек.; г) больше 1 мин.

Применяем формулы (1 Г), (l 1), (1 Г) и получаем:

Прогнозы. Если произвольно выбирать два соседних вызова на АТС, то примерно в шести случаях их десяти промежуток времени между ними окажется меньше пяти секунд, в двух - от пяти до десяти секунд, в одном - более десяти секунд и практически никогда не превысит одной минуты.

Пример 5. Рассмотрим с.в. Тл - время работы радиолампы до выхода её из строя. Ясно, что для разных ламп это время разное - от очень малого (лампа может выйти из строя сразу после включения) до очень большого (несколько тысяч часов).

Если проверить много ламп, замеряя время работы каждой, получим статистический материал - значения t{]\ t{2\ t(k) будут как-то распределяться на промежутке [0;fmax], где tmax - максимальное время работы проверенных ламп, например, fmax=1000 часов. Заметить здесь закономерность (где гуще, где реже) трудно. Может показаться, что значения распределяются равномерно, и тогда за функцию-плотность вы примете f(x) = 1/1000, хе [0; 1 ООО]. Но это будет грубая, кустарная прикидка.

Более достоверную информацию могут дать числовые характеристики. Посчитаем статистическое среднее и статистическое квадратическое отклонение (лек. 6, (6), (8), (9')):

И мы увидим, что M « сг*. Т. е. выполняется статистический признак показательного распределения, установленный в предыдущем разделе. Следовательно, распределение Тл правильнее оценивать, как

показательное. Но, как было отмечено ранее (см. лек. 8, п. 4) надо сознавать, что это ещё не факт*), а только гипотеза и она нуждается в дополнительной проверке. Эту проверку мы здесь не можем провести.

Определим функцию-плотность, - рассчитаем, чему равен параметр Я в формуле (6). Допустим, что среднее время работы ламп получилось М*^400 часов. Тогда, согласно формуле (12), Я = 1/400 и плотность распределения с.в. Тл имеет вид:

*) В данной ситуации специалисты по теории надежности часто любят оперировать не показательым распределением, а распределением Вейбулла.

График этой функции почти параллелен оси ОХ и визуально не отличим от прямой линии (рис. 17). Именно поэтому мы и могли ошибиться, приняв распределение за равномерное. Лишь очень далеко от начала координат график заметно опустится - в точке х = 400 значение функции /(400) станет примерно в три раза меньше начального /(о) = 1/400. Действительно,

Вогнутость графика тоже совсем не заметна. Её можно обнаружить с помощью тонкого математического метода - вспомните признак вогнутости из дифференциального исчисления: /*(*)> 0. В нашем случае

Имея функцию-плотность, давайте теперь решим какую-нибудь практическую задачу. Определим, к примеру, какая часть ламп проработает больше 600 часов. Используем формулу (1 Г):

Прогноз. Из каждых 100 ламп примерно 22 лампы проработают более 600 часов, остальные 88 ламп - менее. •

Заметьте, - практически ценный вывод получен теоретически. И замечательно, что практика подтверждает подобные прогнозы. Подчеркнём также, - чтобы делать достоверные прогнозы, надо хорошо понимать теорию. Если бы мы моделировали св. тл равномерной плотностью f(x) = 1/1000, хе [0;1000], то применяя формулу (5), получили бы р\гЁ е [б00;1000])= 400/600 = 0,4. Результат в два раза больше предыдущего.

Существенная ошибка в прогнозе.

Контроль 5. Представьте следующий опыт. В момент открытия некоей сберегательной кассы вы начинаете фиксировать время подхода клиентов и делаете это в течение какого-то промежутка времени, к примеру, от 8 до 11 часов утра. (Клиенты, прибывшие до открытия, не учитываются). Затем выбирается случайным образом какой-то клиент и определяется промежуток времени от его прихода до прихода следующего за ним клиента. Как проверить гипотезу о показательном распределении данной св.? Задайте сами правдоподобную интенсивность потока клиентов, определите функцию-плотность и рассчитайте вероятность того, что этот промежуток не будет больше 5 минут?

Рис. 17

6. Нормальные с.в.

Мы подошли к самому важному классу случайных величин -нормально распределённым с.в. Их роль определяется двумя обстоятельствами: они широко распространены в природе и результаты их исследования позволяют решать многие задачи математической статистики, что вы увидите в следующей лекции.

Что же характерно для нормальных св.? Какова особнность распределения на (а; Ъ) их значений, появляющихся в большой серии опытов? Если у равномерных с.в. значения появлялись одинаково часто на всех равных участках интервала (a; b)9 у показательных - гуще в начале интервала, то значения нормальных с.в. появляются чаще в средней части (a; b) и значительно реже - по краям. Существенна также симметрия распределения частот (не абсолютная, конечно).

Примеры. Вспомним с.в. L - размер детали, производимой автоматическим станком. Размеры конкретных деталей колеблются около планового размера /0, на который настроен станок. Понятно, что чаще должны появляться детали, размер / которых близок к /0, далёкие - значительно реже.

Гистограмма и предельная функция-плотность f(x) должны иметь вид, изображённый на рис. 18. В силу того, что по краям промежутка (a;b) значения / появляются значительно реже, нежели в его средней части, высоты крайних столбиков гистограммы очень малы и функция f(x) вогнута по краям.

Представьте теперь два станка, которые производят однотипную деталь, причём, один хорошо отрегулирован, другой плохо. Понятно, что второй станок будет чаще выдавать брак, - у него больше разброс значений, больше дисперсия. График функции-плотности для него будет "ниже" и "шире", чем для первого (рис. 19), но общий характер распределения сохранится.

Такой же характер распределения имеет рост (вес) людей - он колеблется около некоторого среднего значения, большие отклонения редки. Ошибки различных измерений группируются около истинного значения измеряемой величины, большие ошибки редки. Многие другие

Рис. 18

Рис. 19

процессы в природе и технике приводят к подобному распределению, -потому оно и названо нормальным. •

Плотность распределения вероятностей всех подобных с.в. хорошо моделируется, как доказывает практика, функциями вида

(13)

Абстрактное определение класса этих с.в. таково:

Определение 3. Случайная величина X называется нормальной, или нормально распределённой, если её функция-плотность f(x) может быть задана формулой Гаусса (13), где а е (- оо; + оо) и а > 0.

Формула (13) появилась неожиданно. Может быть, вы думаете: почему она имеет такой сложный вид? Как и прежде, в случае показательных с.в. (лек. 9, п. 5), можно провести рассуждение, которое довольно естественно приведёт к этой формуле и сделает понятной её структуру.

Подбор предельной функции. Мы поняли, что график функции-плотности f(x) нормальной с.в. имеет вид колоколообразной кривой, - он симметричен и дважды перегибается, а по краям вогнут (рис. 19).

Спросим себя: какие из несложных элементарных функций имеют отмеченные особенности графика? На рис. 20 показаны две такие функции: у] =е~х и у2 = ——-. Обе они чётные (графики симметричны), а исследование по второй производной (проведите его сами) даёт две точки перегиба и вогнутость по краям. Какая из этих функций лучше моделирует характер распределения вероятностей нормальных св.? Опыт (практические эксперименты) доказывает, что первая, - у второй крайние значения убывают не достаточно быстро.*) Итак, выбираем функцию ух =е~х. Она может быть плотностью распределения, если площадь её подграфика равна единице (лек. 9, п. 6, (6)). Площадь эта - известный интеграл Пуассона, значение которого тоже известно:

Значит, плотностью может быть функция

Рис. 20

*) Однако, есть процессы, которые лучше моделируются функцией, подобной второй, - точнее, функцией у = \/{л:• (l + х2)) (распределение Коши).

График этой функции получается из графика функции ух-е х~ умножением всех её ординат на \/4к ~ 0,56, т. е. уменьшением всех ординат примерно в 2 раза (рис. 20).

Теперь надо сделать из функции /, класс подобных функций, графики которых "уже" и "выше" (или "шире"и "ниже"), чем график функции /,. Такое преобразование мы выполняли (лек. 9, п. 5): надо вместо х поставить Ах и умножить функцию на Я, получатся функции вида Я-/\{Ях). В нашем случае:

Механизм действия преобразования при Я = 2 показан на рис. 21: каждая точка M графика функции /, (х) приближается к оси ОХ в два раза ближе, а затем поднимается над осью ОХ в два раза выше. График функции

становится "уже" и "выше", чем график функции f\(x). При Я = 1/2 происходит обратное - "расширение"и "опускание" графика функции /, (х).

Проверим, не изменилась ли после преобразования площадь подграфика. Вычислим интеграл

Площадь подграфика не изменилась.

Расширим класс функций /д(х), заменяя х на (х-а). График функции fÀ(x) (рис. 22) сдвинется при этом вдоль оси ОХ на величину а (если а > 0, - сдвиг вправо, если а < 0, -влево). Площадь подграфика, очевидно, не изменится. В итоге получим широкий класс функций, зависящих от двух параметров Я и а, графики которых имеют необходимый "колоколообразным вид:

Рис. 21

Рис. 22

Остаётся заметить, что параметр Я удобно брать в виде Л = 1/(0^/2), тогда а окажется средним квадратическим отклонением нормально распределённой с.в.Х, -это вы увидите чуть позже. Другой параметр а оказывается математическим ожиданием этой св., - и это выведем позже.

Вот так и приходим к формуле (и).

Замечание. Надо понимать, что мы не вывели, не "доказали" формулу (13). Мы лишь провели некое рассуждение, которое помогло нам

представить возможный путь возникновения этой формулы. "Открыл" её великий немецкий математик Карл Гаусс (1777-1855), исследуя случайные величины, получающиеся в результете различных измерений. Поэтому нормальные св. часто называют Гауссовскими (распределениями Гаусса), формулу (13) - формулой Гаусса, а график функции (13) - колоколом Гаусса.

Функция Гаусса. Функцию (13) при а = 0 и а = 1 называют функцией Гаусса и обозначают ç(x). Она задаёт так называемое стандартное нормальное распределение:

(Г)

Функция эта принадлежит классу функций fÀ(x) при Я = l/V2. Её график получается небольшим "расширением" и "опусканием" (коэффициент Я « 0,7) графика функции fx (х). Значения этой неэлементарной функции затабулированы (см. таблицу приложения 1). Вы встречались с ней в лекции 4, п. 4, - она помогала решать задачу Бернулли при большом количестве опытов (вскоре вы сможете понять, - почему). Там же было подробно рассказано о свойствах этой функции и об особенностях таблицы её значений.

Контроль 6. Обладает ли распределение, задаваемое функцией у — 0,5 sin х, х е [0; тг] характерными особенностями нормального? Почему?

Задаёт ли нормальное распределение функция у = 0,25 • е"(0,25л)2 ? Почему? Как нужно исправить эту функцию, чтобы она стала плотностью распределения некоторой нормальной св.? Определите параметры исправленной плотности и нарисуйте эскиз графика.

7. Исследование нормального распределения

Задача 1. Какова динамика изменения "колокола Гаусса" (графика функции (13)) в зависимости от изменения параметров а и al

Решение. Зафиксируем в (13) а = 0, функция-плотность примет вид

(14)

Соответствующий "колокол" расположится над началом координат (рис. 23), его "высота" - /(о)

Рис. 23

Станем уменьшать второй параметр а, устремляя его к нулю. При этом множитель —\= будет увеличиваться и стремиться к бесконечности.

Высота "колокола" будет расти (рис. 24) и сам он будет сужаться, ибо растёт множитель—=, входящий в показатель функции (14).

Если увеличивать а -> оо 5 то и "колокол" теряет высоту, одновременно раздаваясь в ширину.

Теперь зафиксируем второй параметр <т и станем изменять а. Если а > О и а -> +оо 5 то "колокол" будет сдвигаться вправо вдоль оси ОХ, не меняя формы. Это преобразование показано на рис. 22. Если а < О, "колокол" сдвигается влево. •

Замечания "про сигму". Установленная выше динамика изменения "колокола" согласуется со смыслом среднего квадратического отклонения а. Как вы помните, величина а определяет степень разбросанности значений с.в. X, появляющихся в серии опытов. Если <т мало, разброс мал, - "колокол" узкий и высокий. Большое а, разброс велик, - "колокол" широкий и низкий. Кроме этого, а указывает расположение точек перегиба "колокола" - это точки с абсциссами ±<т (рис. 23). В этом нетрудно убедиться с помощью второй производной (можете провести исследование на перегиб сами).

Задача 2. Вычислить числовые характеристики нормальной с.в. XN, заданной функцией-плотностью (13).

Решение, а) Математическое ожидание нормальной с.в. должно совпадать с точкой максимума функции-плотности, в силу симметрии её графика, т. е.

(15)

Этот факт можно установить строго, применяя к XN общую формулу, определяющую математическое ожидание произвольной непрерывной с.в. X (лек. 10, (1)):

Для нормальной с.в. XN формула принимает вид:

Рис. 24

Интеграл кажется очень сложным, однако, подстановкой —= = t [х = сгл/27 + a; dx = a^2tdt\ он сводится к двум более простым (подробные выкладки проведите сами):

Второй интеграл есть интеграл Пуассона, равный л[к, а первый оказывается нулём, как всякий интеграл от нечётной функции в симметричных пределах. Окончательно получаем:

б)Дисперсия. Общая формула дисперсии (лек. 10, (4)):

Для нормальной с.в. дисперсия принимает вид:

Та же подстановка упрощает интеграл (выкладки проведите сами):

Применяя далее формулу интегрирования по частям

и полагая

получаем:

Второе слагаемое равно 4к. Вычислим первое:

Окончательно,

(16)

в) Среднее квадратическое отклонение - это корень из дисперсии:

(17)

г) Центральные моменты (лек. 10, п. 6, (8)) нормальной с.в. X N определяются интегралом

который той же подстановкой x = о 42t + а сводится к более простому интегралу:

(18)

Если s - нечётно, то подынтегральная функция tse~' тоже нечётная и, значит, интеграл от неё равен нулю. Получается, что любой центральный момент нечётного порядка нормальной с.в. XN равен нулю:

(19)

Если s - чётное, то, интегрируя по частям, придём к формуле:

Вернёмся к формуле (18) и поставим в ней {s-2) вместо s, получим:

Сравнивая правые части последних двух формул, видим, что они отличаются только множителем (s-\)a2. Следовательно, получается рекуррентное соотношение

Чтобы его использовать, вычислим сначала //0:

Подставим s = 2 и ju0=\ в рекуррентное соотношение, - получим: ju2 =(2-\)a2ju0 =<72. Итак, 2-й центральный момент (дисперсия) определяется формулой, которую мы уже знаем:

(20)

Подставляем в рекуррентное соотношение s = 4 и //2 = о2, получаем 4-й центральный момент:

(21)

Аналогично находим 6-й и последующие чётные моменты.

(22)

д) Эксцесс (степень островершинности) находится через 4-й центральный момент по общей формуле (лек. 10, п. 6, (К))):

Эксцесс нормального распределения получается нулевым:

(23)

е) Асимметрия ( степень скошенности) находится через третий центральный момент (он равен нулю) по общей формуле (лек. 10, п. 6, (9)):

Асимметрия нормального распределения получается нулевой:

(24)

Задача 3. Пусть с некоторым опытом связана св. X, распределённая по нормальному закону (13) с параметрами а и о. Найти вероятность события, состоящего в том, что после проведения опыта св. X примет значение х, не выходящее за пределы заданного промежутка [a;ß].

Решение. Любую подобную задачу решает общая формула (лек. 9, п. 7, (7)):

В применении к нормальной св., для которой плотность распределения задаётся функцией (13), общая формула принимает вид:

X — Cl

Сделаем в интеграле обычную подстановку, чуть её изменив:-= t

. Отсюда x = ot + a; dx = adt. Пересчитаем пределы интегрирования: если х = а, то / = ——- ; если х = ß, то / = ——-. С новой переменной t наш интеграл принимает вид:

Для вычисления последнего интеграла применим формулу Ньютона-Лейбница. Учтём, что первообразной для подынтегральной функции е 2 является интеграл с переменным верхним пределом

Но это ведь известная нам функция Лапласа (лек. 4, п. 8. {л))9 с помощью которой мы решали вторую задачу Бернулли. Эта функция и помогает получить удобную для вычислений формулу:

(25)

Формула (25) часто применяется к промежуткам, симметричным относительно математического ожидания а. Для таких случаев ей следует придать более простой и удобный вид.

Задача 3'. Вычислить вероятность попадания нормально распределённой с.в. X в симметричный промежуток [a-l;a + l].

Решение. Формула (25) для нашего промежутка принимает вид:

Упростим её, используя свойство нечётности функции Лапласа, -Ф(-х) = Ф{х):

(25')

Пример. Цех завода изготовляет шарики для подшипников, заданный размер которых 10 мм, а фактический размер случаен и распределён по нормальному закону с параметрами а = 10(мм), а = 0,41 (мм). При контроле бракуются все шарики, не проходящие в круглое отверстие диаметра d}= 10 J мм, а также шарики, проходящие через отверстие диаметра d2 = 9,3 мм. Найти процент шариков, которые будут браковаться.

Решение. Имеем нормальную с.в. ld - диаметр шарика. Опыт, с которым связана наша св., можно трактовать так: из партии шариков, выпущенных за смену, выбирается наудачу один шарик и измеряется его диаметр d.

Нас интересует событие а = (lcj <£ [9,3; 10,7]). Оно дополнительное к событию l = (Ld е [9,3;10,7]), значит, P(a) = \-p(ä).

Событие а состоит в том, что с.в. ld принимает значение из симметричного промежутка [Ю-0,7; 10+ 0,7], и для вычисления его вероятности можно использовать формулу (25') при а = 10 и / = 0,7:

Значение функции Лапласа найдём по таблице приложения 3: Ф(1,71)«0,46.

Вероятность брака (событие А),в итоге, читается так:

р{А) = 1 - Р(1) - 1 - 2Ф(1,71) - 1 - 2 • 0,46 = 1 - 0,92 = 0,08.

Ответ: браковаться будут около 8% шариков. •

Контроль 7. Нарисуйте эскиз графика функции-плотности стандартной нормально распределённой с.в. Хст. Как изменится график плотности нормальной с.в. X с параметрами а = 5, а = 21 Почему? Нарисуйте эскиз. Покажите абсциссы точек перегиба. Чему равна дисперсия той и другой св.? Как она влияет на "колокол Гаусса"? Как вы считаете, какая из вероятностей больше - р(Хсп е[а-а;а + а]) или Р(Х е [а - а; а + а]) ? Почему? Рассчитайте эти вероятности точно.

8. Правило "трёх сигм". Оценка ошибки

В предыдущей лекции (лек. 10, п. 3) было высказано предположение, что с помощью среднего квадратического отклонения а можно оценивать промежуток {a\ß) всех практически возможных значений различных с.в. так:

{а; b)~{М- За; M + За). (26)

Там же мы убедились в справедливости этого предположения для некоторых конкретных примеров. Было сказано также, что оценку ошибки проведём в следующей, т. е. в данной лекции. Выполняю обещание. Инструмент, с помощью которого это можно сделать, создан - формулы (11) и (25). Оценку ошибки будем проводить отдельно для каждого класса распределений. Для равномерных св., как было показано в п. 2, соотношение (26) не выполняется, но справедливо включение:

(я;б)е(М-2сг;М + 2сг).

Проведём оценку для показательных распределений.

Задача 4. Найти вероятность события, состоящего в том, что в опыте над показательной с.в. ХП9 параметр которой Л, значение с.в. выйдет за пределы трёхсигмового интервала (М -За;М + За).

Решение. Выше (п. 4, (7), (9)) было установлено для показательных св., что M = а, следовательно, наш трёхсигмовый интервал принимает вид:

Поскольку показательная св. Xп принимает только положительные значения, то их выход за пределы трёхсигмового интервала означает выход за пределы правого края, т. е. появление события (Х>4а). Рассчитаем вероятность этого события по формуле (11'), учтя, что а = 1/Л ((9)):

Итак,

(27)

Прогноз. Вероятность оказалась не пренебрежимо малой. Примерно в двух опытах из ста значения показательной св. Xп будут выходить за пределы трёхсигмового интервала (как когда-то для геометрических распределений, - лек. 5, п. 9).

Вывод 1. С учётом неотрицательности св. Х.{, соотношение (26) принимает вид (a;b)~ [0;4<т). И можно считать (с возможной ошибкой в 2%), что полусегмент [0; 4а) представляет область практически возможных значений показательной св. Х.{.

Задача 5. Найти вероятность события, состоящего в том, что в опыте над нормально распределённой св. XN, параметры которой а и <т, значения св. XN выйдут за пределы трёхсигмового интервала

{М-За\М + За).

Решение. Нас интересует событие А = (Х g (M - За; X + За)). Дополнительным к нему событием будет событие А =(Х е(М - За; M + За)). Найдём вероятность дополнительного события А. Применим формулу (25') и используем таблицу значений функции Лапласа (приложение 3):

Искомую вероятность найдём с помощью формулы

(28)

Прогноз. Вероятность практически нулевая. Из тысячи опытов над нормальной св. XN примерно в трёх значение св. может выйти за пределы трёхсигмового интервала.

Вывод 2. Область практически возможных значений нормальной св. XN совпадает с трёхсигмовым интервалом. Соотношение

(26) выполняется для них с погрешностью 0,3%.

Итак, установлено, что соотношение (26) выполняется с очень большой вероятностью для нормальных с.в. и с большой вероятностью для показательных (попробуйте самостоятельно оценить ошибку для Пуассоновского распределения). Практика показывает, что так же хорошо оно выполняется и для многих других возникающих в работе исследователей распределений, ибо они часто близки к нормальному. На этом основании выведено правило, которое позволяет прогнозировать область практически возможных значений с.в. Этим правилом широко пользуются в практических исследованиях. В частности, на этом правиле основан метод проверки качества измерительных приборов в метрологии.

Правило "трёх сигм" (обобщённое [2, с. 290; 3, с. 120]).

Если в результате статистического исследования некоторой случайной величины X установлено её математическое ожидание M и среднее квадратическое отклонение о (или их оценки М* и о*), то можно с большой уверенностью*) считать, что при выполнении опыта над с.в. X её значения не выйдут за пределы трёхсигмового интервала (М - За; M + За) (или интервала

Оценка ошибки правила "трёх сигм". Для равномерных с.в. правило справедливо со стопроцентной надёжностью, т. е. всегда. Для показательных - с надёжностью р = 0,98, т. е. ошибка составляет 2%. Ошибка мала, но не пренебрежимо мала. Показательные распределения -одни из наименее благоприятных для применения правила "трёх сигм". Для нормальных с.в. надёжность р = 0,997, ошибка 0,3% на порядок меньше, чем для показательных. Столь же мала эта ошибка и для многих других распределений, возникающих в практической работе инженера.

Полезно знать, что применение этого правила никогда не даст ошибку, больше 11%, ибо в теории вероятностей строго доказано [3, с. 401], что для любой с.в. X справедливо неравенство

Предостережение. Надо сознавать, что использовение правила трёх сигм требует известной осторожности. Существуют распределения, к которым оно просто не применимо, например, -распределение Коши (см. сноску в п. 6). Эти с.в. не имеют математического ожидания (а значит, и с.к.о.), вычисление которого приводит к расходящемуся несобственному интегралу (см. лек. 10, п. 6,

*) В строгих математических курсах [1, с. 114] это правило обычно формулируется только для нормальных с.в. Вместо фразы "с большой уверенностью" пишут "с практической достоверностью", что значит: "с вероятностью 0,9973 ". Фраза "с большой уверенностью" (наряду с отсутствием указания на допустимые классы с.в) делает это правило менее определённым, но, благодаря этому, шире приложимым, что оправдывается его практической пользой.

примечание 1). Нельзя его применять при решении инженерных задач, требующих очень высокой точности. Так, для материалов современной электронной и космической техники выдерживается точность и надёжность изготовления, значительно превосходящая трёхсигмовый допуск.

В заключение сформулируем ещё два простых и широко используемых статистиками правила, связанных с правилом "трёх сигм".

Быстрая оценка а. Чтобы по результатам серии опытов над с.в. X быстро оценить среднее квадратическое отклонение <т, достаточно взять максимальное отклонение появившихся значений с.в. от математического ожидания M (или от его оценки М* и поделить его на три. Разумеется, объём выборки должен быть не малым.

Признак не нормального распределения. Если в серии опытов значения с.в. часто выходят за пределы трёхсигмового интервала (М-3<т;М + 3<т), то весьма вероятно, что с.в. распределена не по нормальному закону.

Контроль 8. Серия из нескольких десятков опытов над некоторой с.в. дала ряд значений, минимальное из которых 1, максимальное 7. Значения распределены примерно симметрично относительно середины промежутка [l;7] и значительно гуще около его середины. Оцените M и а. Запишите предпологаемый вид функции-плотности. Рассчитайте вероятность того, что в опыте над исследуемой с.в. её значение выйдет за переделы двухсигмового интервала (М - 2а; M + 2а).

9. Упражнения

1. Св. X распределена равномерно на промежутке [0;10]. Чему равны её числовые характеристики - М, Д a, Sk, ех, мода, медиана?

Проверьте, покрывается ли все значения с.в. X двухсигмовым интервалом (М - 2а; M + 2а) ? Запишите функцию-плотность. Определите вероятность того, что в опыте над с.в. X появится значение, которое а) будет принадлежать интервалу (8,12); б) отклонится от M не более, чем на 2.

2. С.в. X распределена по показательному закону с параметром X = 0,1. Запишите функцию-плотность f(x) и проверьте выполнение двух её общих свойств (лек. 9, п. 6). Нарисуйте эскиз её графика. В какой точке значение функции-плотности равно 0,1? Чему равно /(ю)? Чему равны M, Д <т, Sk ? Вычислите вероятности появления в опыте значений с.в. X, а) принадлежащих интервалу (1;4); б) меньших единицы; в) больших десяти. С какой вероятностью значения с.в. X попадают в односигмовый интервал? В какой интервал вида (0;b) будут попадать значения с.в. X с

вероятностью, большей, чем 0,9? При каком условии функция-плотность данной абстрактной с.в. X может моделировать распределение вероятностей конкретной с.в. Тф1

3. С.в. X распределена по нормальному закону с параметрами а = Ъ и (т = 1. Запишите формулу функции-плотности данной с.в. и постройте эскиз её графика. Каково максимальное значение этой функции? Какие точки х будут точками перегиба? За пределы какого интервала не должно выйти основание нарисованного вами "колокола"? Постройте график функции-плотности точнее, используя таблицу значений функции Лапласа. Оцените по графику вероятность появления в опыте значений с.в. X, принадлежащих промежутку (3,5). Рассчитайте эту вероятность точно. Определите числовые характеристики - М, Мх, хт, Д <т, Sk, ех.

4. Известно, что с.в. X распределена равномерно, а также, что её математическое ожидание равно 4 и дисперсия равна 3. Оцените промежуток её возможных значений, а затем найдите его точно. Запишите формулу функции-плотности и постройте её график. Оцените по графику вероятность появления в опыте значения с.в. из интервала (4,б), а затем найдите её более точно.

5. Изучается с.в. X, связанная с неким потоком событий. Проведена большая серия опытов, зафиксированы появившиеся значения и вычислено их среднее арифметическое, которое оказалось равным 5. Оцените М, er, ju2, ju3. Определите вероятности появления в опыте значений, а) меньших 2 ; б) больших 10; в) принадлежащих интервалу (2; 10).

6. Докажите, что если с.в. X распределена по показательному закону, то вероятность Р(Х < М) не зависит от величины параметра X. Какая вероятность больше - Р(Х<М) или Р(Х>М)? Обоснуйте ваше предположение геометрически, а затем проведите вычисления.

7. С.в. X распределена нормально с параметрами а = 10, а = 5. Оцените интервал, симметричный относительно М, в который с надёжностью р = 0,9 можно гарантировать попадание с.в. X в результате опыта. Найдите этот интервал более точно.

8. С.в. X распределена по нормальному закону с математическим ожиданием M = 10. Вероятность того, что в результате опыта с.в. X примет значение из интервала (10,20), равна 0,3. Какова вероятность попадания с.в. X в интервал а) (0;10); б) (0;5)?

9. Автобусы некоторого маршрута идут в часы "пик" с интервалом 5 минут. Рассчитайте вероятность того, что пассажир, подошедший к остановке, будет ожидать очередного автобуса а) менее одной минуты; б)

более трёх минут; в) от одной до трёх минут. Какую с.в. вы введёте для решения этой задачи? К какому классу св. она относится? Почему?

10. Цех завода изготовляет шарики для подшипников. Номинальный размер шариков d0 = 5 мм, а фактический диаметр шарика - случайная величина D. Статистически определено среднее квадратическое отклонение этой св. - оно равно ad = 0,05 мм. При контроле бракуются все шарики, диаметр которых отличается от номинального больше, чем на 0,1 мм. Рассчитайте, какой процент шариков, в среднем, будет отбраковываться. К какому типу св. относится D. Почему? Отв.: 4,6%.

11. Цена деления шкалы измерительного прибора равна 1мм. При визуальном измерении некоторой величины за приближённое её значение берётся ближайшее целое деление шкалы. Как часто будет появляться ошибка, а) меньшая 0,5 мм ; б) меньшая 0,2 мм ; в) большая 0,8 мм ? Какую св вы введёте для решения задачи? К какому типу св. она относится? Почему?

12. Однородная проволока длиной 1м растягивается за концы и рвётся. Расстояние от точки разрыва до левого конца проволоки есть, очевидно, случайная величина. К какому типу она относится? Почему? Определите вероятность того, что точка разрыва окажется в средней части проволоки на расстоянии не более 10 см от её середины.

13. При работе электронной вычислительной машины время от времени возникают неисправности (сбои). Поток сбоев можно считать простейшим (Пуассоновским). Установлено, что среднее число сбоев за сутки равно 1,5. Произошёл сбой. Рассчитайте вероятность того, что после этого сбоя машина проработает без сбоев а) более суток; б) менее 8 часов; в) от двух до десяти часов.

ЛЕКЦИЯ 12

ПРИЛОЖЕНИЯ ФОРМУЛЫ ГАУССА

В предыдущей лекции была отмечена особая роль нормальных (Гауссовских) распределений в теории случайных величин и её приложениях. Математический инструментарий, построенный при их исследовании (формулы Гаусса и Лапласа), позволяет решать многие практические задачи.

В данной лекции мы рассмотрим задачи, связанные с часто встречающимися биномиальными распределениями, и задачу о точности и надёжности оценок гп* и £>* математического ожидания и дисперсии произвольной с.в. Последняя задача не раз возникала прежде. Теперь её решение становится возможным, потому что эти оценки оказываются нормально распределёнными с.в. В заключение оценим ошибку от замены вероятности частотой.

Теоретической базой, позволяющей широко использовать закон Гаусса, является так называемая "центральная предельная теорема", где указаны условия, при выполнении которых появляются нормальные распределения. С этого и начнём.

1. Почему нормальные с.в. распространены в природе?

Вы уже знаете, что нормальные с.в. часто возникают при исследовании разнообразных природных процессов - во всех естественных науках (физике, химии, биологии), в технических, социальных (экономика, социология). Интересно - почему? В чём причина?

Причина понята, как ни удивительно, математиками. Оказывается, если с.в. X получается в результате суммирования большого числа с.в. Xj, каждая из которых мало влияет на результат, то распределение с.в. X близко к нормальному. Формулировка эта упрощена с целью выпукло выделить суть: сумма большого числа малых случайных влияний*) даёт эффект нормального распределения. Это и происходит в природе: колебания веса, размеров и других характеристик представителей органического и неорганического мира вызываются суммарным воздействием огромного множества факторов, среди которых нет доминирующего.

*) Здесь можно добавить, - влияния не только случайные по величине, а и по направлению, разнонаправленные.

Обращаю внимание на возможную ошибку восприятия слов. Читая вышеприведённую формулировку, вы можете подумать, что слагаемые Xt должны быть малыми с.в. Однако, сказано иное: слагаемые Xi мало влияют на результат, т. е. значения с.в. Xt сами по себе могут быть большими, но их колебания, влияющие на изменения значений суммы X, должны быть все "одного порядка". В следующем разделе лекции это будет пояснено примером.

В инженерной практике нормальные с.в. постоянно возникают в экспериментах, связанных с необходимостью оценивать ошибки - ошибки измерений, ошибки стрельбы, ошибки выполнения команд автоматизированным устройством, ошибки вывода космического корабля в заданную точку пространства, отклонения выходных параметров сложных технических устройств от номинала и пр., и пр. Эксперименты свидетельствуют, что все эти ошибки являются случайными величинами, распределёнными по закону Гаусса. И теперь понятно, - почему. Потому что каждое отклонение результата опыта от планируемого вызывается множеством малых случайных влияний. Рассмотрим этот эффект подробнее.

Пример 1. Некоторое тело взвешивается на точных, аналитических весах.*) Ясно, что полученный в опыте вес будет чуть отличаться от истинного веса х0**), и ошибка определится разностью Ах = х - х0, которая может быть как положительной, так и отрицательной. Если повторить взвешивание того же (или другого) тела, то появится другое значение веса X и чуть другая ошибка Дх' = х'-х0. Следовательно, ошибка является случайной величиной -