Закон больших чисел определение. Закон больших чисел

Закон больших чисел

Практика изучения случайных явлений показывает, что хотя результаты отдельных наблюдений, даже проведенных в одинаковых условиях, могут сильно отличаться, в то же время средние результаты для достаточно большого числа наблюдений устойчивы и слабо зависят от результатов отдельных наблюдений. Теоретическим обоснованием этого замечательного свойства случайных явлений является закон больших чисел. Общий смысл закона больших чисел- совместное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая.

Центральная предельная теорема

Теорема Ляпунова объясняет широкое распространение нормального закона распределения и поясняет механизм его образования. Теорема позволяет утверждать, что всегда, когда случайная величина образуется в результате сложения большого числа независимых случайных величин, дисперсии которых малы по сравнению с дисперсией суммы, закон распределения этой случайной величины оказывается практически нормальным законом. А поскольку случайные величины всегда порождаются бесконечным количеством причин и чаще всего ни одна из них не имеет дисперсии, сравнимой с дисперсией самой случайной величины, то большинство встречающихся в практике случайных величин подчинено нормальному закону распределения.

Остановимся подробнее на содержании теорем каждой из этих групп

В практических исследованиях очень важно знать, в каких случаях можно гарантировать, что вероятность события будет или достаточно мала, или как угодно близка к единице.

Под законом больших чисел и понимается совокупность предложений, в которых утверждается, что с вероятностью, как угодно близкой к единице (или нулю), произойдет событие, зависящее от очень большого, неограниченно увеличивающегося числа случайных событий, каждое из которых оказывает на него лишь незначительное влияние.

Точнее, под законом больших чисел понимается совокупность предложений, в которых утверждается, что с вероятностью, как угодно близкой к единице, отклонение средней арифметической достаточно большого числа случайных величин от постоянной величины -средней арифметической их математических ожиданий, не превзойдет заданного как угодно малого числа.

Отдельные, единичные явления, которые мы наблюдаем в природе и в общественной жизни, часто проявляются как случайные (например, регистрируемый смертный случай, пол родившегося ребенка, температура воздуха и др.) вследствие того, что на такие явления действует много факторов, не связанных с существом возникновения или развития явления. Предсказать суммарное действие их на наблюдаемое явление нельзя, и они различно проявляются в единичных явлениях. По результатам одного явления нельзя ничего сказать о закономерностях, присущих многим таким явлениям.

Однако давно было замечено, что средняя арифметическая числовых характеристик некоторых признаков (относительные частоты появления события, результатов измерений и т. д.) при большом числе повторений опыта подвержена очень незначительным колебаниям. В средней как бы проявляется закономерность, присущая существу явлений, в ней взаимно погашается влияние отдельных факторов, которые делали случайными результаты единичных наблюдений. Теоретически объяснить такое поведение средней можно с помощью закона больших чисел. Если будут выполнены некоторые весьма общие условия относительно случайных величин, то устойчивость средней арифметической будет практически достоверным событием. Эти условия и составляют наиболее важное содержание закона больших чисел.

Первым примером действия этого принципа и может служить сближение частоты наступления случайного события с его вероятностью при возрастании числа испытаний – факт, установленный в теореме Бернулли (швейцарский математик Якоб Бернулли (1654- 1705)).Теорема Бернулл является одной из простейших форм закона больших чисел и часто используется на практике. Например, частоту встречаемости какого-либо качества респондента в выборке принимают заоценку соответствующей вероятности).

Выдающийся французский математик Симеон Денни Пуассон (1781- 1840) обобщил эту теорему и распространил ее на случай, когда вероятность событий в испытании меняется независимо от результатов предшествующих испытаний. Он же впервые употребил термин «закон больших чисел».

Великий русский математик Пафнутий Львович Чебышев (1821 - 1894) доказал, что закон больших чисел действует в явлениях с любой вариацией и распростаняется также на закономерность средней.

Дальнейшее обобщение теорем закона больших чисел связано с именамиА.А.Маркова, С.Н.Бернштейна, А.Я.Хинчина и А.Н.Колмлгорова .

Общаясовременная постановка задачи, формулировка закона больших чисел, развитие идей и методов доказательства теорем, относящихся к этому закону, принадлежит русским ученым П. Л. Чебышеву, А. А. Маркову и А. М. Ляпунову .

НЕРАВЕНСТВО ЧЕБЫШЕВА

Рассмотрим сначала вспомогательные теоремы: лемму и неравенство Чебышева, с помощью которых легко доказывается закон больших чисел в форме Чебышева.

Лемма (Чебышев).

Если среди значений случайной величины Х нет отрицательных, то вероятность того, что она примет какое-нибудь значение, превосходящее положительное число А, не больше дроби, числитель которой - математическое ожидание случайной величины, а знаменатель -число А:

Доказательство. Пусть известен закон распределения случайной величины Х:

(i = 1, 2, ..., ), причем значения случайной величины мы считаем расположенными в возрастающем порядке.

По отношению к числу А значения случайной величины разбиваются на две группы: одни не превосходят А, а другие больше А. Предположим, что к первой группе относятся первые значений случайной величины ().

Так как , то все члены суммы неотрицательны. Поэтому, отбрасывая первые слагаемых в выражении получим неравенство:

Поскольку

,

то

что и требовалось доказать.

Случайные величины могут иметь различные распределения при одинаковых математических ожиданиях. Однако для них лемма Чебышева даст одинаковую оценку вероятности того или иного результата испытания. Этот недостаток леммы связан с ее общностью: добиться лучшей оценки сразу для всех случайных величин невозможно.

Неравенство Чебышева .

Вероятность того, что отклонение случайной величины от ее математического ожидания превзойдет по абсолютной величине положительное число , не больше дроби, числитель которой - дисперсия случайной величины, а знаменатель -квадрат

Доказательство. Поскольку случайная величина, которая не принимает отрицательных значений, то применим неравенство из леммы Чебышева для случайной величины при :


что и требовалось доказать.

Следствие. Поскольку

,

то

- другая форма неравенства Чебышева

Примем без доказательства факт, что лемма и неравенство Чебышева верны и для непрерывных случайных величин.

Неравенство Чебышева лежит в основе качественных и количественных утверждений закона больших чисел. Оно определяет верхнюю границу вероятности того, что отклонение значения случайной величины от ее математического ожидания больше некоторого заданного числа. Замечательно, что неравенство Чебышева дает оценку вероятности событиядля случайной величины, распределение которой неизвестно, известны лишь ее математическое ожидание и дисперсия.

Теорема. (Закон больших чисел в форме Чебышева)

Если дисперсии независимых случайных величин ограничены одной константой С, а число их достаточно велико, то как угодно близка к единице вероятность того, что отклонение средней арифметическойэтих случайных величин от средней арифметической их математических ожиданий не превзойдет по абсолютной величине данного положительного числа , каким бы малым оно ни было:

.

Теорему примем без доказательства.

Следствие 1. Если независимые случайные величины имеют одинаковые, равные , математические ожидания, дисперсии их ограничены одной и той же постоянной С, а число их достаточно велико, то, сколько бы мало на было данное положительное число , как угодно близка к единице вероятность того, что отклонение средней арифметической этих случайных величин от не превзойдет по абсолютной величине .

То, что за приближенное значение неизвестной величиныпринимают среднюю арифметическую результатов достаточно большого числа ее измерений, произведенных в одних и тех же условиях, можно обосновать этой теоремой. Действительно, результаты измерений являются случайными, так как на них действует очень много случайных факторов. Отсутствие систематических ошибокозначает, что математические ожидания отдельных результатов измерений одинаковые и равны . Следовательно, по закону больших чисел средняя арифметическая достаточно большого числа измерений практически будет как угодно мало отличаться от истинного значения искомой величины.

(Напомним, что ошибки называются систематическими, если они искажают результат измерения в одну и ту же сторону по более или менее ясному закону. К ним относятся ошибки, появляющиеся в результате несовершенства инструментов (инструментальные ошибки), вследствие личных особенностей наблюдателя (личные ошибки) и др.)

Следствие 2 . (Теорема Бернулли.)

Если вероятность наступления события А в каждом из независимых испытаний постоянна, а их число достаточно велико, то сколь угодно близка к единице вероятность того, что частота появления события как угодно мало отличается отвероятности его появления:

Теорема Бернулли, утверждает, что если вероятность события одинакова во всех испытаниях, то с увеличением числа испытаний частота события стремится к вероятности события и перестает быть случайной.

На практике сравнительно редко встречаются опыты, в которых вероятность появления события в любом опыте неизменна, чаще онаразная в разных опытах. К схеме испытаний такого типа относится теорема Пуассона:

Следствие 3 . (Теорема Пуассона.)

Если вероятность появления события в -омиспытании не меняется, когда становятся известными результаты предыдущих испытаний, а их число достаточно велико, то сколь угодно близка к единице вероятность того, что частота появления события как угодно мало отличается отсредней арифметической вероятностей :

Теорема Пуассона утверждает, что частота события в серии независимых испытаний стремится к среднему арифметическому его вероятностей и перестает быть случайной.

В заключение заметим, что ни одна из рассмотренных теорем не дает ни точного, ни даже приближенного значения искомой вероятности, а указывается лишь нижняя или верхняя граница ее. Поэтому, если требуется установить точное или хотя бы приближенное значение вероятностей соответствующих событий, возможности этих теорем весьма ограничены.

Приближенные значения вероятностей при больших значениях можно получить только с помощью предельных теорем. В них или на случайные величины налагаются дополнительные ограничения (как это имеет место, например, в теореме Ляпунова), или рассматриваются случайные величины определенного вида (например, в интегральной теореме Муавра-Лапласа).

Теоретическое значение теоремы Чебышева, являющейся весьма общей формулировкой закона больших чисел, велико. Однако если мы будем применять ее при решении вопроса о возможности применить закон больших чисел к последовательности независимых случайных величин, то при утвердительном ответе теорема часто будет требовать, чтобы случайных величин было гораздо больше, чем необходимо для вступления в силу закона больших чисел. Указанный недостаток теоремы Чебышева объясняется общим характером ее. Поэтому желательно иметь теоремы, которые точнее указывали бы нижнюю (или верхнюю) границу искомой вероятности. Их можно получить, если наложить на случайные величины некоторые дополнительные ограничения, которые для встречающихся на практике случайных величин обычно выполняются.

ЗАМЕЧАНИЯ О СОДЕРЖАНИИ ЗАКОНА БОЛЬШИХ ЧИСЕЛ

Если число случайных величин достаточно велико и они удовлетворяют некоторым весьма общим условиям, то, как бы они ни были распределены, практически достоверно, что средняя арифметическая их сколь угодно мало отклоняете а от постоянной величины - - средней арифметической их математических ожиданий, т. е. является практически постоянной величиной. Таково содержание теорем, относящихся к закону больших чисел. Следовательно, закон больших чисел - одно из выражений диалектической связи между случайностью и необходимостью.

Можно привести очень много примеров возникновения новых качественных состояний как проявления закона больших чисел, в первую очередь среди физических явлений. Рассмотрим один из них.

По современным представлениям газы состоят из отдельных частиц- молекул, которые находятся в хаотическом движении, и нельзя точно сказать, где в данный момент будет находиться, и с какой скоростью будет двигаться та или иная молекула. Однако наблюдения показывают, что суммарное действие молекул, например давление газа на

стенку сосуда, проявляется с поразительным постоянством. Оно определяется числом ударов и силой каждого из них. Хотя первое и второе является делом случая, приборы не улавливают колебаний давления газа, находящегося в нормальных условиях. Объясняется это тем, что благодаря огромному числу молекул даже в самых небольших объемах

изменение давления на заметную величину практически невозможно. Следовательно, физический закон, утверждающий постоянство давления газа, является проявлением закона больших чисел.

Постоянство давления и некоторых других характеристик газа в свое время служило веским аргументом против молекулярной теории строения вещества. Впоследствии научились изолировать сравнительно небольшое число молекул, добиваясь того, чтобы влияние от дельных молекул еще оставалось, и тем самым закон больших чисел не мог проявиться в достаточной степени. Тогда удалось наблюдать колебания давления газа, подтверждающие гипотезу о молекулярном строении вещества.

Закон больших чисел лежит в основе различных видов страхования (страхование жизни человека на всевозможные сроки, имущества, скота, посевов и др.).

При планировании ассортимента товаров широкого потребления учитывается спрос на них населения. В этом спросе проявляется действие закона больших чисел.

Широко применяемый в статистике выборочный метод находит свое научное обоснование в законе больших чисел. Например, о качестве привезенной из колхоза на заготовительный пункт пшеницы судят по качеству зерен, случайно захваченных в небольшую мерку. Зерна в мерке немного по сравнению со всей партией, но во всяком случае мерку выбирают такой, чтобы зерен в ней было вполне достаточно для

проявления закона больших чисел с точностью, удовлетворяющей потребности. Мы вправе принять за показатели засоренности, влажности и среднего веса зерен всей партии поступившего зерна соответствующие показатели в выборке.

Дальнейшиеусилия ученых по углублению содержания закона больших чисел былинаправлены па получен наиболее общих условий применимостиэтого закона к последовательности случайных величин. В этом направлении долго не было принципиальных успехов. После П. Л. Чебышева и А. А. Маркова только в 1926 г. советскому академику А. Н. Колмогорову удалось получить условия, необходимые и достаточные для того, чтобы к последовательности независимых случайных величин был применим закон больших чисел. В 1928 г. советский ученый А. Я. Хинчин показал, что достаточным условием применимости закона больших чисел к последовательности независимых одинаково распределенных случайных величин является существование у них математического ожидания.

Для практики исключительно важно полностью выяснить вопрос о применимости закона больших чисел к зависимым случайным величинам, так как явления в природе и обществе находятся во взаимной зависимости и взаимно обусловливают друг друга. Много работ посвящено выяснению ограничений, которые необходимо наложить

на зависимые случайные величины, чтобы к ним можно было применить закон больших чисел, причем наиболее важные принадлежат выдающемуся русскому ученому А. А. Маркову и крупным советским ученым С. Н. Бернштейну и А. Я. Хинчину.

Основной результат этих работ состоит в том, что закон больших чисел приложим к зависимым случайным величинам, если только сильная зависимость существует между случайными величинами с близкими номерами, а между случайными величинами с далекими номерами зависимость достаточно слаба. Примерами случайных величин такого типа являются числовые характеристики климата. На погоду каждого дня заметно влияет погода предыдущих дней, причем влияние заметно ослабевает с удалением дней друг от друга. Следовательно, многолетняя средняя температура, давление и другие характеристики климата данной местности в соответствии с законом больших чисел практически должны быть близки к своим математическим ожиданиям. Последние являются объективными характеристиками климата местности.

В целях экспериментальной проверки закона больших чисел в разное время были произведены следующие опыты.

1. Опыт Бюффона . Монета брошена 4040 раз. Герб выпал 2048 раз. Частость его выпадения оказалась равной 0,50694 =

2. Опыт Пирсона . Монета брошена 12 000 и 24 000 раз. Частость выпадения герба в первом случае оказалась равной 0,5016, в Втором - 0,5005.

З. Опыт Вестергаарда . Из урны, в которой было поровну белых и черных шаров, получено при 10 000 извлечений (с возвратом очередного вынутого шара в урну) 5011 белых и 4989 черных шаров. Частость белых шаров составила 0,50110 = (), а черных - 0,49890.

4. Опыт В. И. Романовского . Четыре монеты брошены 21160 раз. Частоты и частости различных комбинаций выпадения герба и решетки распределились следующим образом:

Комбинации числа выпадений герба и решки

Частоты

Частости

Эмпирические

Теоретические

4 и 0

1 181

0,05858

0,0625

3 и 1

4909

0,24350

0,2500

2 и 2

7583

0,37614

0,3750

1 и 3

5085

0,25224

0,2500

1 и 4

0,06954

0,0625

Итого

20160

1,0000

1,0000

Результаты экспериментальных проверок закона больших чисел убеждают нас в большой близости опытных частостей вероятностям.

ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА

Нетрудно доказать, что сумма любого конечного числа независимых нормально распределенных случайных величин также распределена по нормальному закону.

Если независимые случайные величины не распределены по нормальному закону, то можно наложить на них некоторые весьма нежесткие ограничения, и их сумма будет все-таки распределена нормально.

Эту задачу поставили и решили в основном русские ученые П. Л. Чебышев и его ученики А. А. Марков и А. М. Ляпунов.

Теорема (Ляпунов).

Если независимые случайные величины имеютконечные математические ожидания и конечные дисперсии , число их достаточно велико, а при неограниченном возрастании

,

где - абсолютные центральные моменты третьего порядка, то сумма их с достаточной степенью точности имеет распределение

(Фактически мы приводим не теорему Ляпунова, а одно из следствий из нее, так как этого следствия вполне достаточно для практических приложений. Поэтому условие , которое названо условием Ляпунова, является более сильным требованием, чем необходимо для доказательства собственно теоремы Ляпунова.)

Смысл условия состоит в том, что действие каждого слагаемого (случайной величины) невелико по сравнению с суммарным действием их всех. Многие случайные явления, встречающиеся в природе и в общественной жизни, протекают именно по такой схеме. В связи с этим теорема Ляпунова имеет исключительно большое значение, а нормальный закон распределения является одним из основныхзаконов в теории вероятностей.

Пусть, например, производится измерение некоторой величины . Различные уклонения наблюдаемых значений от истинного ее значения (математического ожидания)получаются в результате воздействия очень большого числа факторов, каждый из которых порождает малую ошибку , причем . Тогда суммарная ошибка измерения является случайной величиной, которая по теореме Ляпунова должна быть распределена по нормальному закону.

При стрельбе из орудия под влиянием очень большого числа причин случайного характера происходит рассеяние снарядов на некоторой площади. Случайные воздействия на траекторию снаряда можно считать независимыми. Каждая причина вызывает лишь незначительное изменение траектории по сравнению с суммарным изменением под воздействием всех причин. Поэтому следует ожидать, что отклонение места разрыва снаряда от цели будет случайной величиной, распределенной по нормальному закону.

По теореме Ляпунова мы вправе ожидать, что, например, рост взрослого мужчины является случайной величиной, распределенной по нормальному закону. Эта гипотеза, как и рассмотренные в предыдущих двух примерах, хорошо согласуется с наблюдениями.В подтверждение приведем распределение по росту 1000 взрослых рабочихмужчини соответствующие теоретические численности мужчин, т. е. число мужчин, которые должны иметь рост указанных групп, если исходить из предположения о распределении роста мужчин по нормальному закону.

Рост, см

количество мужчин

экспериментальные данные

теоретические

прогнозы

143-146

146-149

149-152

152-155

155-158

158- 161

161- 164

164-167

167-170

170-173

173-176

176-179

179 -182

182-185

185-188

Более точного совпаденияэкспериментальных данных с теоретическими трудно было ожидать.

Можно легко доказать как следствие теоремы Ляпунова -предложение, которое будет необходимо в дальнейшем для обоснования выборочного метода.

Предложение.

Сумма достаточно большого числа одинаково распределенных случайных величин имеющих абсолютные центральные моменты третьего порядка, распределена по нормальному закону.

Предельные теоремы теории вероятностей, теоремы Муавра-Лапласа объясняют природу устойчивости частоты появлений события. Природа эта состоит в том, что предельным распределением числа появлений события при неограниченном возрастании числа испытаний (если вероятность события во всех испытаниях одинакова) является нормальное распределение.

Система случайных величин.

Рассмотренные выше случайные величины были одномерными, т.е. определялись одним числом, однако, существуют также случайные величины, которые определяются двумя, тремя и т.д. числами. Такие случайные величины называются двумерными, трехмерными и т.д.

В зависимости от типа, входящих в систему случайных величин, системы могут быть дискретными, непрерывными или смешанными, если в систему входят различные типы случайных величин.

Более подробно рассмотрим системы двух случайных величин.

Определение. Законом распределения системы случайных величин называется соотношение, устанавливающее связь между областями возможных значений системы случайных величин и вероятностями появления системы в этих областях.

Пример. Из урны, в которой находятся 2 белых и три черных шара вынимают два шара. Пусть - число вынутых белых шаров, а случайная величина определяется следующим образом:


Составим таблицу распределения системы случайных величин :

Поскольку - вероятность того, что белых шаров не вынуто (значит, вынуто два черных шара), при этом , то

.

Вероятность

.

Вероятность

Вероятность - вероятность того, что белых шаров не вынуто(и, значит, вынуто два черных шара), при этом , тогда

Вероятность - вероятность того, что вынут один белый шар (и, значит, один черный), при этом , тогда

Вероятность - вероятность того, что вынуто два белых шара (и, значит, ни одного черного), при этом , тогда

.

Таким образом, ряд распределения двумерной случайной величины имеет вид:

Определение. Функцией распределения системы двух случайных величин называется функция двух аргументов F ( x , y ) , равная вероятности совместного выполнения двух неравенств X < x , Y < y .


Отметим следующие свойства функции распределения системы двух случайных величин:

1) ;

2) Функция распределения является неубывающей функцией по каждому аргументу:

3) Верно следующее:

4)


5) Вероятность попадания случайной точки ( X , Y ) в произвольный прямоугольник со сторонами, параллельными координатным осям, вычисляется по формуле:


Плотность распределения системы двух случайных величин.

Определение. Плотностью совместного распределения вероятностей двумерной случайной величины ( X , Y ) называется вторая смешанная частная производная от функции распределения.

Если известна плотность распределения, то функция распределения может быть найдена по формуле:

Двумерная плотность распределения неотрицательна и двойной интеграл с бесконечными пределами от двумерной плотности равен единице.

По известной плотности совместного распределения можно найти плотности распределения каждой из составляющих двумерной случайной величины.

; ;

Условные законы распределения.

Как было показано выше, зная совместный закон распределения можно легко найти законы распределения каждой случайной величины, входящей в систему.

Однако, на практике чаще стоит обратная задача – по известным законам распределения случайных величин найти их совместный закон распределения.

В общем случае эта задача является неразрешимой, т.к. закон распределения случайной величины ничего не говорит о связи этой величины с другими случайными величинами.

Кроме того, если случайные величины зависимы между собой, то закон распределения не может быть выражен через законы распределения составляющих, т.к. должен устанавливать связь между составляющими.

Все это приводит к необходимости рассмотрения условных законов распределения.

Определение. Распределение одной случайной величины, входящей в систему, найденное при условии, что другая случайная величина приняла определенное значение, называется условным законом распределения .

Условный закон распределения можно задавать как функцией распределения так и плотностью распределения.

Условная плотность распределения вычисляется по формулам:

Условная плотность распределения обладает всеми свойствами плотности распределения одной случайной величины.

Условное математическое ожидание.

Определение. Условным математическим ожиданием дискретной случайной величины Y при X = x (х – определенное возможное значение Х) называется произведение всех возможных значений Y на их условные вероятности.

Для непрерывных случайных величин:

,

где f ( y / x ) – условная плотность случайной величины Y при X = x .

Условное математическое ожидание M ( Y / x )= f ( x ) является функцией от х и называется функцией регрессии Х на Y .

Пример. Найти условное математическое ожидание составляющей Y при

X = x 1 =1 для дискретной двумерной случайной величины, заданной таблицей:

Y

x 1 =1

x 2 =3

x 3 =4

x 4 =8

y 1 =3

0,15

0,06

0,25

0,04

y 2 =6

0,30

0,10

0,03

0,07

Аналогично определяются условная дисперсия и условные моменты системы случайных величин.

Зависимые и независимые случайные величины.

Определение. Случайные величины называются независимыми , если закон распределения одной из них не зависит от того какое значение принимает другая случайная величина.

Понятие зависимости случайных величин является очень важным в теории вероятностей.

Условные распределения независимых случайных величин равны их безусловным распределениям.

Определим необходимые и достаточные условия независимости случайных величин.

Теорема. Y были независимы, необходимо и достаточно, чтобы функция распределения системы ( X , Y ) была равна произведению функций распределения составляющих.

Аналогичную теорему можно сформулировать и для плотности распределения:

Теорема. Для того, чтобы случайные величины Х и Y были независимы, необходимо и достаточно, чтобы плотность совместногораспределения системы ( X , Y ) была равна произведению плотностей распределения составляющих.

Практически используются формулы:

Для дискретных случайных величин:

Для непрерывных случайных величин:

Корреляционный момент служит для того, чтобы охарактеризовать связь между случайными величинами. Если случайные величины независимы, то их корреляционный момент равен нулю.

Корреляционный момент имеет размерность, равную произведению размерностей случайных величин Х и Y . Этот факт является недостатком этой числовой характеристики, т.к. при различных единицах измерения получаются различные корреляционные моменты, что затрудняет сравнение корреляционных моментов различных случайных величин.

Для того, чтобы устранить этот недостаток применятся другая характеристика – коэффициент корреляции.

Определение. Коэффициентом корреляции r xy случайных величин Х и Y называется отношение корреляционного момента к произведению средних квадратических отклонений этих величин.

Коэффициент корреляции является безразмерной величиной. Для независимых случайных величин коэффициент корреляции равен нулю.

Свойство: Абсолютная величина корреляционного момента двух случайных величин Х и Y не превышает среднего геометрического их дисперсий.

Свойство: Абсолютная величина коэффициента корреляции не превышает единицы.

Случайные величины называются коррелированными , если их корреляционный момент отличен от нуля, и некоррелированными , если их корреляционный момент равен нулю.

Если случайные величины независимы, то они и некоррелированы, но из некоррелированности нельзя сделать вывод о их независимости.

Если две величины зависимы, то они могут быть как коррелированными, так и некоррелированными.

Часто по заданной плотности распределения системы случайных величин можно определить зависимость или независимость этих величин.

Наряду с коэффициентом корреляции степень зависимости случайных величин можно охарактеризовать и другой величиной, которая называется коэффициентом ковариации . Коэффициент ковариации определяется формулой :

Пример. Задана плотность распределения системы случайных величин Х и независимы. Разумеется, они также будут и некоррелированы.

Линейная регрессия.

Рассмотрим двумерную случайную величину ( X , Y ), где X и Y – зависимые случайные величины.

Представим приближенно одну случайную величину как функцию другой. Точное соответствие невозможно. Будем считать, что эта функция линейная.

Для определения этой функции остается только найти постоянные величины a и b .

Определение. Функция g ( X ) называется наилучшим приближением случайной величины Y в смысле метода наименьших квадратов , если математическое ожидание

Принимает наименьшее возможное значение. Также функция g ( x ) называется среднеквадратической регрессией Y на X .

Теорема. Линейная средняя квадратическая регрессия Y на Х вычисляется по формуле:

в этой формуле m x = M ( X случайной величины Y относительно случайной величины Х. Эта величина характеризует величину ошибки, образующейся при замене случайной величины Y линейной функцией g ( X ) = a Х + b .

Видно, что если r = ± 1, то остаточная дисперсия равна нулю, и, следовательно, ошибка равна нулю и случайная величина Y точно представляется линейной функцией от случайной величины Х.

Прямая среднеквадратичной регрессии Х на Y определяется аналогично по формуле: Х и Y имеют в отношении друг друга линейные функции регрессии, то говорят, что величины Х и Y связаны линейной корреляционной зависимостью .

Теорема. Если двумерная случайная величина ( X , Y ) распределена нормально, то Х и Y связаны линейной корреляционной зависимостью.

Е.Г. Hикифорова


БОЛЬШИХ ЧИСЕЛ ЗАКОН

общий принцип, в силу к-рого совместное случайных факторов приводит при нек-рых весьма общих условиях к результату, почти не зависящему от случая. Сближение частоты наступления случайного события с его вероятностью при возрастании числа испытаний (подмеченное сначала, по-видимому, на азартных играх) может служить первым примером действия этого принципа.

На рубеже 17 и 18 вв. Я. Бернулли доказал теорему, утверждающую, что в последовательности независимых испытаний, в каждом из к-рых наступления нек-рого события Аимеет одно и то же значение верно соотношение:

при любом - число появлений события в первых писпытаниях, - частота появлений. Эта Бернулли теорема была распространена С. Пуассоном на случай последовательности независимых испытаний, где вероятность появления события Аможет зависеть от номера испытания. Пусть эта вероятность для k-го испытания равна и пусть


Тогда Пуассона теорема утверждает, что

при любом Первое строгое этой теоремы было дано П. Л. Чебышевым (1846), метод к-рого полностью отличен от метода Пуассона и основан на нек-рых экстремальных соображениях; С. Пуассон выводил (2) из приближенной формулы для указанной вероятности, основанной на использовании закона Гаусса и в то время еще строго не обоснованной. У С. Пуассона впервые встречается и термин "закон больших чисел", к-рым он назвал свое обобщение теоремы Бернулли.

Естественное дальнейшее обобщение теорем Бернулли и Пуассона вознпкает, если заметить, что случайные величины можно представить в виде суммы

независимых случайных величин, где , если Апоявляется в А--м испытании, и - в противном случае. При этом математич. ожидание (совпадающее со средним арифметическим математич. ожиданий ) равно рдля случая Бернулли и для случая Пуассона. Другими словами, в обоих случаях рассматривается отклонение среднего арифметического величин Х k от среднего арифметического их математич. ожиданий.

В работе П. Л. Чебышева "О средних величинах" (1867) было установлено, что для независимых случайных величин соотношение

(при любом ) верно при весьма ^бщих предположениях. П. Л. Чебышев предполагал, что математич. ожидания все ограничены одной и той же постоянной, хотя из его доказательства видно, что достаточно требования ограниченности дисперсий

или даже требования

Таким образом, П. Л. Чебышев показал возможность широкого обобщения теоремы Бернулли. А. А. Марков отметил возможность дальнейших обобщений и предложил применять название Б. ч. з. ко всей совокупности обобщений теоремы Бернулли [и в частности, к (3)]. Метод Чебышева основан на точном установлении общих свойств математич. ожиданий и на использовании так наз. Чебышева неравенства [для вероятности (3) оно дает оценку вида


эту границу можно заменить более точной, разумеется при более значительных ограничениях, см. Бернштейна неравенство ]. Последующие доказательства различных форм Б. ч. з. в той или иной степени являются развитием метода Чебышева. Применяя надлежащее "урезание" случайных величин (замену их вспомогательными величинами именно: , если где - нек-рые постоянные), А. А. Марков распространил Б. ч. з. на случаи, когда дисперсии слагаемых не существуют. Напр., он показал, что (3) имеет место, если при нек-рых постоянных и всех и

Практика изучения случайных явлений показывает, что хотя результаты отдельных наблюдений, даже проведенных в одинаковых условиях, могут сильно отличаться, в то же время средние результаты для достаточно большого числа наблюдений устойчивы и слабо зависят от результатов отдельных наблюдений.

Теоретическим обоснованием этого замечательного свойства случайных явлений является закон больших чисел . Названием "закон больших чисел" объединена группа теорем, устанавливающих устойчивость средних результатов большого количества случайных явлений и объясняющих причину этой устойчивости.

Простейшая форма закона больших чисел, и исторически первая теорема этого раздела - теорема Бернулли , утверждающая, что если вероятность события одинакова во всех испытаниях, то с увеличением числа испытаний частота события стремится к вероятности события и перестает быть случайной.

Теорема Пуассона утверждает, что частота события в серии независимых испытаний стремится к среднему арифметическому его вероятностей и перестает быть случайной.

Предельные теоремы теории вероятностей, теоремы Муавра-Лапласа объясняют природу устойчивости частоты появлений события. Природа эта состоит в том, что предельным распределением числа появлений события при неограниченном возрастании числа испытаний (если вероятность события во всех испытаниях одинакова) является нормальное распределение.

Центральная предельная теорема объясняет широкое распространение нормального закона распределения. Теорема утверждает, что всегда, когда случайная величина образуется в результате сложения большого числа независимых случайных величин с конечными дисперсиями, закон распределения этой случайной величины оказывается практически нормальным законом.

Теорема, приведенная ниже под названием "Закон больших чисел " утверждает, что при определенных, достаточно общих, условиях, с увеличением числа случайных величин их среднее арифметическое стремится к среднему арифметическому математических ожиданий и перестает быть случайным.

Теорема Ляпунова объясняет широкое распространение нормального закона распределения и поясняет механизм его образования. Теорема позволяет утверждать, что всегда, когда случайная величина образуется в результате сложения большого числа независимых случайных величин, дисперсии которых малы по сравнению с дисперсией суммы, закон распределения этой случайной величины оказывается практически нормальным законом. А поскольку случайные величины всегда порождаются бесконечным количеством причин и чаще всего ни одна из них не имеет дисперсии, сравнимой с дисперсией самой случайной величины, то большинство встречающихся в практике случайных величин подчинено нормальному закону распределения.

В основе качественных и количественных утверждений закона больших чисел лежит неравенство Чебышева . Оно определяет верхнюю границу вероятности того, что отклонение значения случайной величины от ее математического ожидания больше некоторого заданного числа. Замечательно, что неравенство Чебышева дает оценку вероятности события для случайной величины, распределение которой неизвестно, известны лишь ее математическое ожидание и дисперсия.

Неравенство Чебышева. Если случайная величина x имеет дисперсию, то для любого e > 0 справедливо неравенство , где M x и D x - математическое ожидание и дисперсия случайной величины x .

Теорема Бернулли. Пусть m n - число успехов в n испытаниях Бернулли и p - вероятность успеха в отдельном испытании. Тогда при любом e > 0 справедливо .

Центральная предельная теорема. Если случайные величины x 1 , x 2 , …, x n , … попарно независимы, одинаково распределены и имеют конечную дисперсию, то при n ® равномерно по x (- ,)

Обнаруженный на большом и разнообразном материале феномен стабилизации частот появления случайных событий поначалу не имел какого-либо обоснования и воспринимался как чисто эмпирический факт. Первым теоретическим результатом в этой области стала опубликованная в 1713 г. знаменитая теорема Бернулли, положившая начало законам больших чисел.

Теорема Бернулли по своему содержанию является предельной теоремой, т. е. утверждением асимптотического смысла, говорящим, что будет с вероятностными параметрами при большом числе наблюдений. Прародительницей всех современных многочисленных утверждений такого типа является именно теорема Бернулли.

На сегодня представляется, что математический закон больших чисел является отражением некоторого общего свойства многих реальных процессов.

Имея желание придать закону больших чисел возможно больший охват, отвечающий далеко еще не исчерпанным потенциальным возможностям применения этого закона, один из крупнейших математиков нашего столетия А. Н. Колмогоров следующим образом сформулировал его суть: закон больших чисел - «общий принцип, в силу которого совокупное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая».

Таким образом, закон больших чисел имеет как бы две трактовки. Одна - математическая, связанная с конкретными математическими моделями, формулировками, теориями, и вторая - более общая, выходящая за эти рамки. Вторая трактовка связана с нередко отмечаемым на практике феноменом образования в той или иной степени направленного действия на фоне большого числа скрытых либо видимых действующих факторов, внешне такой непрерывности не имеющих. Примерами, связанными со второй трактовкой, является ценообразование на свободном рынке, формирование общественного мнения по тому или иному вопросу.

Отметив эту общую трактовку закона больших чисел, обратимся к конкретным математическим формулировкам этого закона.

Как мы уже сказали выше, первой и принципиально самой важной для теории вероятностей является теорема Бернулли. Содержание этого математического факта, отражающего одну из важнейших закономерностей окружающего мира, сводится к следующему.

Рассмотрим последовательность не связанных между собой (т. е. независимых) испытаний, условия проведения которых воспроизводятся неизменно от испытания к испытанию. Результатом каждого испытания является появление или непоявление интересующего нас события А.

Эту процедуру (схему Бернулли), очевидно, можно признать типичной для многих практических областей: «мальчик - девочка» в последовательности новорожденных, ежедневные метеорологические наблюдения («был дождь - не был»), контроль потока выпускаемых изделий («нормальное - дефектное») и т. д.

Частость появления события А при п испытаниях (т А -

частота появления события А в п испытаниях) имеет с ростом п тенденцию к стабилизации своего значения, это эмпирический факт.

Теорема Бернулли. Выберем любое сколь угодно малое положительное число е. Тогда

Подчеркнем, что математический факт, установленный Бернулли в определенной математической модели (в схеме Бернулли), не следует смешивать с эмпирически установленной закономерностью устойчивости частот. Бернулли не удовольствовался только утверждением формулы (9.1), но, учитывая потребности практики, дал оценку присутствующего в этой формуле неравенства. К такой трактовке мы еще обратимся ниже.

Закон больших чисел Бернулли был предметом исследований большого числа математиков, стремившихся уточнить его. Одно из таких уточнений было получено английским математиком Муавром и в настоящее время носит название теоремы Муавра - Лапласа. В схеме Бернулли рассмотрим последовательность нормированных величин:

Интегральная теорема Муавра - Лапласа. Выберем какие-либо два числа х { и х 2 . При этом х, х 7 , тогда при п -» °°

Если в правой части формулы (9.3) переменную х х устремить к бесконечности, то полученный предел, зависящий только от х 2 (индекс 2 при этом можно убрать), будет представлять собой функцию распределения, она называется стандартным нормальным распределением, или законом Гаусса.

Правая часть формулы (9.3) равна у = F(x 2) - F(x x). F(x 2) -> 1 при х 2 -> °° и F(x ,) -> 0 при х, -> За счет выбора достаточно большого

X] > 0 и достаточно большого по абсолютной величине X] п получим неравенство:

Принимая во внимание формулу (9.2), мы можем извлечь практически достоверные оценки:

Если достоверность у = 0,95 (т. е. вероятность ошибки 0,05) может показаться кому-то недостаточной, можно «перестраховаться» и построить немного более широкий доверительный интервал, используя упоминавшееся выше правило трех сигм:

Этому интервалу соответствует очень высокий уровень доверия у = 0,997 (см. таблицы нормального распределения).

Рассмотрим пример, состоящий в бросании монеты. Пусть мы бросили монету п = 100 раз. Может ли случиться, что частость р будет сильно отличаться от вероятности р = 0,5 (в предположении симметричности монеты), например будет равна нулю? Для этого надо, чтобы герб не выпал ни разу. Такое событие теоретически возможно, однако мы уже рассчитывали подобные вероятности, для данного события она окажется равной Эта величина

чрезвычайно мала, ее порядок - число с 30 нулями после запятой. Событие с такой вероятностью смело можно считать практически невозможным. Какие же отклонения частоты от вероятности при большом числе опытов практически возможны? Используя теорему Муавра - Лапласа, мы отвечаем на этот вопрос так: с вероятностью у = 0,95 частость герба р укладывается в доверительный интервал:

Если ошибка в 0,05 кажется не малой, надо увеличить число опытов (бросаний монеты). При увеличении п ширина доверительного интервала уменьшается (к сожалению, не так быстро, как нам хотелось бы, а обратно пропорционально -Jn). Например, при п = 10 000 получим, что р лежит в доверительном интервале с доверительной вероятностью у = 0,95: 0,5 ±0,01.

Таким образом, мы разобрались количественно в вопросе о приближении частости к вероятности.

Теперь найдем вероятность события по его частости и оценим ошибку этого приближения.

Пусть мы произвели большое число опытов п (бросали монету), нашли частость события А и хотим оценить его вероятность р.

Из закона больших чисел п следует, что:

Теперь оценим практически возможную ошибку приближенного равенства (9.7). Для этого воспользуемся неравенством (9.5) в форме:

Для нахождения р по р надо решить неравенство (9.8), для этого его надо возвести в квадрат и решить соответствующее квадратное уравнение. В результате получим:

где

Для приближенной оценки р по р можно в формуле (9.8) р справа заменить нар или же в формулах (9.10), (9.11) считать, что

Тогда получим:

Пусть в п = 400 опытах получено значение частости р = 0,25, тогда при уровне доверия у = 0,95 найдем:

А если нам нужно знать вероятность точнее, с ошибкой, скажем, не больше 0,01? Для этого надо увеличить число опытов.

Полагая в формуле (9.12) вероятность р = 0,25, приравняем величину ошибки заданной величине 0,01 и получим уравнение относительно п:

Решая это уравнение, получим п ~ 7500.

Рассмотрим теперь еще один вопрос: можно объяснить полученное в опытах отклонение частости от вероятности случайными причинами или же это отклонение показывает, что вероятность не такова, какой мы ее предполагали? Иными словами, подтверждает опыт принятую статистическую гипотезу или, наоборот, требует ее отклонить?

Пусть, например, бросив монету п = 800 раз, мы получим частость появления герба р = 0,52. У нас возникло подозрение, что монета несимметричная. Обоснованно ли такое подозрение? Чтобы ответить на этот вопрос, будем исходить из предположения, что монета симметричная (р = 0,5). Найдем доверительный интервал (при доверительной вероятности у = 0,95) для частости появления герба. Если полученное в опыте значение р = 0,52 укладывается в этот интервал - все в норме, принятая гипотеза о симметрии монеты не противоречит опытным данным. Формула (9.12) при р = 0,5 дает интервал 0,5 ± 0,035; полученное значение р = 0,52 укладывается в этот интервал, значит, придется «очистить» монету от подозрений в несимметрии.

Аналогичными методами пользуются для того, чтобы судить: случайны или «значимы» различные отклонения от математического ожидания, наблюдаемые в случайных явлениях. Например, случайно был получен недовес в нескольких образцах расфасованных товаров или он указывает на систематический обман покупателей? Случайно повысился процент выздоровлений у больных, применявших новый препарат, или это связано с действием препарата?

Нормальный закон играет особенно важную роль в теории вероятностей и ее практических приложениях. Выше мы уже видели, что случайная величина - число появлений некоторого события в схеме Бернулли - при п -» °° сводится к нормальному закону. Однако имеет место гораздо более общий результат.

Центральная предельная теорема. Сумма большого числа независимых (или слабо зависимых) случайных величин, сравнимых между собой по порядку своих дисперсий, распределена по нормальному закону независимо от того, каковы были законы распределения слагаемых. Приведенное утверждение - это грубая качественная формулировка центральной предельной теории. У этой теоремы много форм, различающихся между собой условиями, которым должны удовлетворять случайные величины, чтобы их сумма с увеличением числа слагаемых «нормализовалась».

Плотность нормального распределения Дх) выражается формулой:

где а - математическое ожидание случайной величины Х с = V7) - ее стандартное отклонение.

Для вычисления вероятности попадания х в пределы интервала (х 1? х 2) используется интеграл:

Так как интеграл (9.14) при плотности (9.13) не выражается через элементарные функции («не берется»), то для вычисления (9.14) пользуются таблицами интегральной функции распределения стандартного нормального распределения, когда а = 0, а = 1 (такие таблицы имеются в любом учебнике по теории вероятностей):

Вероятность (9.14) с помощью уравнения (10.15) выражается формулой:

Пример. Найти вероятность того, что случайная величина X, имеющая нормальное распределение с параметрами а , а, отклонится от своего математического ожидания по модулю не более чем на За.

Пользуясь формулой (9.16) и таблицей функции распределения нормального закона, получим:

Пример. В каждом из 700 независимых опытов событие А происходит с постоянной вероятностью р = 0,35. Найти вероятность того, что событие А произойдет:

  • 1) точно 270 раз;
  • 2) меньше чем 270 и больше чем 230 раз;
  • 3) больше чем 270 раз.

Находим математическое ожидание а = пр и стандартное отклонение:

случайной величины - числа появлений события А:

Находим центрированное и нормированное значение X:

По таблицам плотности нормального распределения находим f(x):

Найдем теперь Р ш (х, > 270) = Р 700 (270 F(1,98) = = 1 - 0,97615 = 0,02385.

Серьезный шаг в исследованиях проблематики больших чисел был сделан в 1867 г. П. Л. Чебышевым. Он рассмотрел весьма общий случай, когда от независимых случайных величин не требуется ничего, кроме существования математических ожиданий и дисперсий.

Неравенство Чебышева. Для сколь угодно малого положительного числа е выполняется неравенство:

Теорема Чебышева. Если х х, х 2 , ..., х п - попарно независимые случайные величины, каждая из которых имеет математическое ожидание E(Xj) = ci и дисперсию D(x,) =), причем дисперсии равномерно ограничены, т. е. 1,2 ..., то для сколь угодного малого положительного числа е выполняется соотношение:

Следствие. Если а,= аио, -о 2 , i = 1,2 ..., то

Задача. Сколько раз надо бросить монету, чтобы с вероятностью не меньшей, чем у - 0,997, можно было утверждать, что частость выпадения герба будет находиться в интервале (0,499; 0,501)?

Предположим, что монета симметричная, р - q - 0,5. Применим теорему Чебышева в формуле (9.19) к случайной величине X - частоте появления герба в п бросаниях монеты. Выше мы уже показывали, что X = Х х + Х 2 + ... +Х„, где X t - случайная величина, принимающая значение 1, если выпал герб, и значение 0, если выпала решка. Итак:

Запишем неравенство (9.19) для события, противоположного событию, указанному под знаком вероятности:

В нашем случае [е = 0,001, cj 2 = /?-р)]т - число выпадений герба в п бросаниях. Подставляя эти величины в последнее неравенство и учитывая, что по условию задачи должно выполняться неравенство, получим:

Приведенный пример иллюстрирует возможность использования неравенства Чебышева для оценок вероятностей тех или иных уклонений случайных величин (а также связанных с вычислением этих вероятностей задач типа этого примера). Достоинством неравенства Чебышева является то, что оно не требует знания законов распределений случайных величин. Разумеется, если такой закон известен, то неравенство Чебышева дает слишком грубые оценки.

Рассмотрим этот же пример, но используя тот факт, что бросание монеты является частным случаем схемы Бернулли. Число успехов (в примере - число гербов) подчиняется биномиальному закону, а при большом п этот закон можно в силу интегральной теоремы Муавра - Лапласа представить нормальным законом с математическим ожиданием а = пр = п? 0,5 и со стандартным отклонением а = yfnpq - 25=0,5л/л. Случайная же величина - частость выпадения герба - имеет математическое ожидание = 0,5 и стандартное отклонение

Тогда имеем:

Из последнего неравенства получаем:

Из таблиц нормального распределения находим:

Видим, что нормальное приближение дает число бросаний монеты, обеспечивающее заданную погрешность в оценивании вероятности герба, в 37 раз меньшее в сравнении с оценкой, полученной с использованием неравенства Чебышева (но неравенство Чебышева дает возможность подобных расчетов и в том случае, когда мы не владеем информацией о законе распределения изучаемой случайной величины).

Рассмотрим теперь прикладную задачу, решаемую с помощью формулы (9.16).

Задача о конкуренции. Две конкурирующие железнодорожные компании имеют по одному поезду, курсирующему между Москвой и Санкт-Петербургом. Эти поезда оборудованы примерно одинаково, отправляются и прибывают также примерно в одно и то же время. Предположим, что п = 1000 пассажиров независимо и наугад выбирают себе поезд, поэтому в качестве математической модели выбора поезда пассажирами используем схему Бернулли с п испытаниями и вероятностью успехар = 0,5. Компания должна решить вопрос, сколько мест предусмотреть в поезде с учетом двух взаимно противоречивых условий: с одной стороны, не хочется иметь пустые места, с другой - не хочется, чтобы появились недовольные отсутствием мест (в следующий раз они предпочтут конкурирующие фирмы). Разумеется, можно предусмотреть в поезде п = 1000 мест, но тогда заведомо будут пустые места. Случайная величина - число пассажиров в поезде - в рамках принятой математической модели с использованием интегральной теории Муавра - Лапласа подчиняется нормальному закону с математическим ожиданием а = пр = п /2 и дисперсией а 2 = npq = п/4 последовательно. Вероятность того, что на поезд придет более s пассажиров, определяется соотношением:

Зададим уровень риска а , т. е. вероятность того, что придет более s пассажиров:

Отсюда:

Если а - корень риска последнего уравнения, который находится по таблицам функции распределения нормального закона, то получаем:

Если, например, п = 1000, а = 0,01 (такой уровень риска означает, что число мест s будет достаточным в 99 случаях из 100), то х а ~ 2,33 и s = 537 мест. При этом если обе компании примут одинаковые уровни риска а = 0,01, то два поезда будут иметь в общей сложности 1074 места, 74 из которых будут пустыми. Аналогично можно вычислить, что 514 мест было бы достаточно в 80% всех случаев, а 549 мест - в 999 из 1000 случаев.

Подобные соображения применимы и в других задачах о конкурирующем обслуживании. Например, если т кинотеатров соперничают из-за одних и тех же п зрителей, то следует принять р = -. Получим,

что число мест s в кинотеатре должно определяться соотношением:

Общее число пустых мест при этом равно:

Для а = 0,01, п = 1000 и т = 2, 3, 4 значения этого числа приближенно равны соответственно 74, 126, 147.

Рассмотрим еще один пример. Пусть поезд состоит из п - 100 вагонов. Вес каждого вагона - случайная величина с математическим ожиданием а - 65 т и средним квадратическим ожиданием о = 9 т. Локомотив может везти поезд, если его вес не превышает 6600 т; в противном случае приходится подцеплять второй локомотив. Нужно найти вероятность того, что этого делать не придется.

весов отдельных вагонов: , имеющих одно и то же математическое ожидание а - 65 и одну и ту же дисперсию d - о 2 = 81. По правилу математических ожиданий: Е(х) - 100 * 65 = 6500. По правилу сложения дисперсий: D(x ) = 100 х 81= 8100. Извлекая корень, найдем среднее квадратическое отклонение. Для того чтобы один локомотив мог везти поезд, нужно, чтобы вес поезда X оказался предельным, т. е. попал в пределы интервала (0; 6600). Случайную величину х - сумму 100 слагаемых - можно считать распределенной нормально. По формуле (9.16) получим:

Отсюда следует, что локомотив «справится» с поездом приблизительно с вероятностью 0,864. Уменьшим теперь число вагонов в поезде на два, т. е. возьмем п = 98. Подсчитывая теперь вероятность того, что локомотив «справится» с поездом, получим величину порядка 0,99, т. е. практически достоверное событие, хотя для этого пришлось убрать всего два вагона.

Итак, если мы имеем дело с суммами большого числа случайных величин, то можно использовать нормальный закон. Естественно, при этом возникает вопрос: сколько нужно сложить случайных величин, чтобы закон распределения суммы уже «нормализовался»? Это зависит от того, каковы законы распределения слагаемых. Бывают такие замысловатые законы, что нормализация наступает только при очень большом числе слагаемых. Но эти законы придумывают математики, природа же, как правило, специально не устраивает таких неприятностей. Обычно на практике для того, чтобы можно было пользоваться нормальным законом, бывает достаточно пяти-шести слагаемых.

Быстроту, с которой «нормализуется» закон распределения суммы одинаково распределенных случайных величин, можно проиллюстрировать на примере случайных величин с равномерным распределением на интервале (0, 1). Кривая такого распределения имеет вид прямоугольника, что уже непохоже на нормальный закон. Сложим две такие независимые величины - получим случайную величину, распределенную по так называемому закону Симпсона, графическое изображение которого имеет вид равнобедренного треугольника. Тоже не похоже на нормальный закон, но уже лучше. А если сложить три такие равномерно распределенные случайные величины, получится кривая, состоящая из трех отрезков парабол, весьма похожая на нормальную кривую. Если же сложить шесть таких случайных величин, получится кривая, не отличающаяся от нормальной. На этом основан широко применяемый метод получения нормально распределенной случайной величины, датчиками же равномерно распределенных (0, 1) случайных чисел оснащены все современные ЭВМ.

В качестве одного из практических способов проверки этого рекомендуется следующий способ. Строим доверительный интервал для частоты события с уровнем у = 0,997 по правилу трех сигм:

и если оба его конца не выходят за рамки отрезка (0, 1), то можно пользоваться нормальным законом. Если же какая-нибудь из границ доверительного интервала оказывается за переделами отрезка (0, 1), то нормальным законом пользоваться нельзя. Однако в некоторых условиях биномиальный закон для частоты некоторого случайного события, если он не стремится к нормальному, то может стремиться к другому закону.

Во многих приложениях в качестве математической модели случайного опыта используется схема Бернулли, в которой число испытаний п велико, случайное событие довольно редко, т. е. р = пр не мало, но и не велико (колеблется в интервале О -5- 20). В этом случае имеет место предельное соотношение:

Формула (9.20) называется пуассоновским приближением для биномиального закона, так как вероятностное распределение в ее правой части называется законом Пуассона. Говорят, что пуассоновское распределение является вероятностным распределением для редких событий, так как оно имеет место, когда выполняются пределы: п -»°°, р -»0, но X = пр оо.

Пример. Дни рождения. Какова вероятность Р т (к) того, что в обществе из 500 человек к человек родились в день Нового года? Если эти 500 человек выбраны наугад, то можно применить схему Бернулли с вероятностью успеха Р = 1/365. Тогда

Расчеты вероятностей для различных к дают следующие величины: Р у = 0,3484...; Р 2 = 0,2388...; Р 3 = 0,1089...; Р 4 = 0,0372...; Р 5 = 0,0101...; Р 6 = 0,0023... Соответствующие приближения по формуле Пуассона при X = 500 1/365 = 1,37

дают следующие величины: Ру = 0,3481...; Р 2 = 0,2385...; Р ъ = 0,1089; Р 4 = 0,0373...; Р 5 = 0,0102...; Р 6 = 0,0023... Все ошибки лишь в четвертом десятичном знаке.

Приведем примеры ситуаций, где можно использовать закон редких событий Пуассона.

На телефонной станции неправильное соединение происходит с малой вероятностью р, обычно р ~ 0,005. Тогда формула Пуассона позволяет найти вероятность неправильных соединений при заданном общем числе соединений п ~ 1000, когда Х = пр =1000 0,005 = 5.

При выпечке булочек в тесто кладут изюм. Следует ожидать, что благодаря размешиванию частота булок с изюминками будет приблизительно подчиняться распределению Пуассона Р п (к, X), где X - плотность изюма в тесте.

Радиоактивное вещество испускает я-частицы. Событие, заключающееся в том, что число й-частиц, достигающих в течение времени t заданного участка пространства, принимает фиксированное значение к, подчиняется закону Пуассона.

Число живых клеток с измененными хромосомами под действием рентгеновских лучей следует распределению Пуассона.

Итак, законы больших чисел позволяют решать задачу математической статистики, связанную с оцениванием неизвестных вероятностей элементарных исходов случайного опыта. Благодаря этим знаниям мы делаем методы теории вероятностей практически содержательными и полезными. Законы больших чисел позволяют также решать задачу получения информации о неизвестных элементарных вероятностях и в другой форме - форме проверки статистических гипотез.

Рассмотрим более подробно формулировку и вероятностный механизм решения задач проверки статистических гипотез.