Закон больших чисел
(
ЗБЧ
) в
теории вероятностей
— принцип, описывающий результат выполнения одного и того же эксперимента много раз. Согласно закону,
среднее значение
конечной выборки из фиксированного распределения близко к
математическому ожиданию
этого распределения.
Другими словами, чем больше объём выборки, тем чаще проводятся измерения какого-либо параметра, тем выше вероятность, что результаты окажутся близки к ожидаемым.
Закон больших чисел важен, поскольку он гарантирует устойчивость для средних значений некоторых
случайных событий
при достаточно длинной серии экспериментов.
Важно помнить, что закон применим только тогда, когда рассматривается большое количество испытаний.
Содержание
Примеры
Например, рассмотрим бросок шестигранной игральной кости, на которой с равной вероятностью может выпасть одно из чисел 1, 2, 3, 4, 5 или 6. Следовательно, математическое ожидание одного броска равно
Согласно закону больших чисел, при большом количестве бросков их среднее значение, вероятно, будет близким к 3,5, при этом точность будет возрастать по мере увеличения числа бросков.
Из закона больших чисел следует, что эмпирическая вероятность успеха в серии
испытаний Бернулли
сходится к теоретической вероятности. Для случайной величины Бернулли математическое ожидание представляет собой теоретическую вероятность успеха, а среднее значение
таких переменных (если они независимы и одинаково распределены) является относительной частотой.
Например, бросок правильной монеты — это испытание Бернулли. При одном броске теоретическая вероятность выпадения «орла» равна
. Поэтому, согласно закону больших чисел, доля «орлов» при большом количестве испытаний «должна быть» примерно
. В частности, доля «орлов» после
бросков сходится к
, при
.
Хотя доля орлов (и решек) стремится к
, почти наверное модуль разности количества орлов и решек станет большим, когда число бросков будет неограниченно возрастать. То есть при увеличении числа бросков вероятность того, что модуль разницы будет невелик, идёт к нулю, а отношение модуля разницы к общему числу бросков почти наверное стремится к нулю:
История
Итальянский математик
Джероламо Кардано
(1501—1576) был страстным любителем азартных игр. «Побочным продуктом» его любви к игре в кости стала книга «Об азартных играх» (
итал.
De Ludo alea
, 1563), содержащая формулировку закона больших чисел. В ней Кардано заявил, что точность эмпирической статистики, как правило, улучшается с количеством испытаний.
В 1713 году
Якоб Бернулли
изложил правила подсчёта вероятности для сложных событий и дал первый вариант «закона больших чисел», разъясняющего, почему частота события в серии испытаний не меняется хаотично, а в некотором смысле стремится к своему предельному теоретическому значению (то есть вероятности).
Следует также отметить работы
С. Д. Пуассона
(1781—1840), доказавшего более общую, чем у
Якоба Бернулли
, форму закона больших чисел.
П. Л. Чебышёв
получил общую формулировку закона больших чисел: если математические ожидания серии случайных величин и квадраты этих математических ожиданий ограничены в совокупности, то среднее арифметическое этих величин с ростом сходится по вероятности к среднему арифметическому для их математических ожиданий.
А. А. Марков
доказал вариант закона больших чисел для некоторых распространённых типов зависимых величин.
В XX веке исследования Чебышёва и Маркова продолжили
А. Я. Хинчин
и
А. Н. Колмогоров
. Они показали, что если случайные величины не только независимы, но и одинаково распределены, то существование у них математического ожидания является
необходимым и достаточным условием
для применимости закона больших чисел.
Варианты
Рассмотрим последовательность независимых в совокупности случайных величин
,
интегрируемых по Лебегу
, которые имеют одинаковые распределения, следовательно, и одинаковые математические ожидания
.
Обозначим через
среднее арифметическое рассматриваемых случайных величин:
Независимость в совокупности случайных величин может быть заменена попарной независимостью в обоих вариантах закона
.
Ниже описаны два различных варианта закона больших чисел. Их называют
усиленным законом больших чисел
и
слабым законом больших чисел
. Разница между усиленной и слабой формой связана с выбором способа сходимости.
Слабый закон
Слабый закон больших чисел (
теорема Бернулли
, сформулирована
Я. Бернулли
, опубликована в 1713 году
) гласит, что среднее значение выборки сходится по вероятности к
математическому ожиданию
:
при
То есть
выполняется
Интерпретируя данный результат, получаем, что слабый закон утверждает, что для любых ненулевых указанных границ, независимо от того, насколько они малы, при достаточно большой выборке вероятность того, что среднее значение выборки будет близко к
математическому ожиданию
, очень высока в пределах этих границ.
Как говорилось ранее, слабый закон применим в случае независимых одинаково распределенных случайных величин, имеющих
математическое ожидание
. Однако он может применяться и в некоторых других случаях. Например, дисперсия может быть разной для каждой случайной величины в выборке, а математическое ожидание оставаться константой. Если дисперсии ограничены, то закон также применим, как показал Чебышёв ещё в 1867 году. Доказательство Чебышёва работает до тех пор, пока дисперсия среднего числа первых
значений не стремится к нулю при
.
Усиленный закон
Усиленный закон больших чисел утверждает, что при определённых условиях с вероятностью единица происходит неограниченное сближение средних арифметических последовательности случайных величин с некоторыми постоянными величинами.
Пусть
— последовательность случайных величин и
.
Говорят, что последовательность
удовлетворяет усиленному закону больших чисел, если существует такая последовательность
, что вероятность соотношения:
, при
равна 1.
Другая формулировка, равносильная предыдущей, такова: последовательность
удовлетворяет усиленному закону больших чисел, если
вероятность одновременного выполнения всех неравенств
стремится к 1 при
.
Таким образом, здесь рассматривается поведение всей последовательности сумм в целом, в то время как в обычном законе больших чисел речь идет лишь об отдельных суммах.
Если последовательность
удовлетворяет усиленному закону больших чисел, то она удовлетворяет и обычному закону больших чисел с теми же самыми
, то есть
, при
,
.
Обратное может быть неверно. Например, если случайные величины
независимы и принимают при
два значения
с вероятностью
каждое, то для них выполняется обычный закон больших чисел с
, но ни при каких
не выполняется усиленный закон больших чисел.
Теорема Колмогорова
В случае независимых слагаемых наиболее известными являются условия приложимости усиленного закона больших чисел, установленные А. Н. Колмогоровым: достаточное — для величин с конечными дисперсиями, и необходимое и достаточное — для одинаково распределённых величин (заключающееся в существовании математического ожидания величин
). Теорема Колмогорова для случайных величин с конечными дисперсиями утверждает, что из условия
(1)
вытекает приложимость к последовательности
усиленного закона больших чисел с
. В терминах дисперсий условие (
) оказывается наилучшим в том смысле, что для любой последовательности положительных чисел
с расходящимся рядом
можно построить последовательность независимых случайных величин
с
, не удовлетворяющую усиленному закону больших чисел.
Различия между слабым законом и усиленным законом
Слабый закон утверждает, что для заданного большого
среднее значение
, вероятно, будет близко к
. Таким образом,
может происходить бесконечно много раз, хотя и сколь угодно редко. (Для всех
не обязательно выполняется
).
Усиленный закон показывает, что
почти наверное не произойдёт. Это означает, что с вероятностью 1 мы имеем, что
выполняется неравенство
для достаточно больших
.
Ниже приведены три примера симметричных распределений, в каждом примере математического ожидания эти распределения не имеют, усиленный закон больших чисел (сходимость почти всюду) не имеет места, но слабый закон выполнен: среднее случайных величин сходится по вероятности к константе, центру симметрии их распределения.
Пусть
— экспоненциально распределённая случайная величина с параметром 1. Случайная величина
не имеет математического ожидания, задаваемого интегралом Лебега, но используя условную сходимость и интерпретацию интеграла как
интеграла Дирихле
, являющегося
несобственным
интегралом Римана
, можно сказать:
Пусть
— геометрическое распределение с вероятностью
. Случайная величина
не имеет математического ожидания в обычном смысле, поскольку бесконечный ряд не является
абсолютно сходящимся
, но используя
условную сходимость
можно сказать:
Если функция распределения случайной величины равна
то она не имеет математического ожидания, но слабый закон выполняется.
Равномерный закон больших чисел
Пусть
— некоторая функция, которая определена и непрерывна по переменной
. Тогда для любого фиксированного
последовательность
будет последовательностью независимых и одинаково распределённых случайных величин, такой, что выборочное среднее этой последовательности сходится по вероятности к
.
Равномерный закон больших чисел описывает условия, при которых сходимость равномерна по
.
Если:
компактно,
непрерывна при каждом
для почти всех
и измеримой функции от
в каждом
,
существует доминирующая функция
такая, что
и
для всех
,
тогда
непрерывна в
и
Борелевский закон больших чисел
Борелевский закон больших чисел, названный в честь
Эмиля Бореля
, гласит, что если эксперимент повторяется много раз независимо при одинаковых условиях, то доля раз, когда любое указанное событие происходит, приблизительно равна вероятности появления события в каком-либо конкретном испытании; чем больше число повторений, тем лучше приближение. Точнее, если
обозначает событие, о котором идет речь,
— вероятность его появления, а
— число раз, когда
встречается в первых
испытаниях, тогда с вероятностью 1
Пусть
— случайная величина с конечным математическим ожиданием
и конечной ненулевой дисперсией
. Тогда для любого действительного числа
выполняется
Доказательство слабого закона
Рассмотрим бесконечную последовательность
независимых и одинаково распределённых случайных величин с конечным математическим ожиданием
. Нас интересует сходимость по вероятности
Теорема
при
Доказательство с использованием неравенства Чебышёва, предполагающего конечную дисперсию
Предположение о конечной дисперсии
не является обязательным. Большая или бесконечная дисперсия замедляет сходимость, но ЗБЧ выполняется в любом случае.
Это доказательство использует предположение о конечной дисперсии
(для всех
). Независимость случайных величин не предполагает корреляции между ними, мы имеем
Математическое ожидание последовательности
представляет собой среднее значение выборочного среднего:
Используя неравенство Чебышёва для
, получаем
Это неравенство используем для получения следующего:
При
выражение стремится к 1.
Теперь по определению сходимости по вероятности мы получим:
при
.
Доказательство с использованием сходимости характеристических функций
Jennrich, Robert I. (1969). «Asymptotic Properties of Non-Linear Least Squares Estimators».
The Annals of Mathematical Statistics
.
40
(2): 633—643. doi:
.
Wen, L.
. Am. Math. Month, 1991.
Литература
Чистяков В. П.
Курс теории вероятностей. —
М.
: Наука, 1982.