Решения
- 1 year ago
- 0
- 0
В математической статистике и теории принятия решений байесовская оценка решения — это статистическая оценка , минимизирующая апостериорное математическое ожидание функции потерь (то есть апостериорное ожидание потерь ). Иначе говоря, она максимизирует апостериорное математическое ожидание функции полезности . В рамках теории Байеса данную оценку можно определить как оценку апостериорного максимума .
Предположим, что неизвестный параметр имеет априорное распределение . Пусть — оценка параметра , основанная на некоторых измерениях , и пусть — квадратичная функция потерь , а байесовский риск параметра — это , где математическое ожидание берётся по распределению : это определяет функцию риска как функцию от . Тогда байесовской оценкой будет называться такая оценка , которая минимизирует байесовский риск среди всех прочих оценок. Равнозначно оценка, минимизирующая апостериорные ожидаемые потери для каждого x , также минимизирует байесовский риск и таким образом является байесовской оценкой.
В случае некорректного априорного распределения оценка, минимизирующая апостериорное ожидание потерь для каждого x , называется обобщённой байесовской оценкой .
Наиболее часто используемой функцией риска для байесовской оценки является функция среднеквадратичной ошибки (в англоязычной литературе обозначаемая как MSE). MSE определяется как
где математическое ожидание берётся по совместному распределению и .
Если использовать MSE как функцию риска, то байесовская оценка неизвестного параметра — это просто среднее апостериорного распределения :
Это известно как оценка минимальной среднеквадратичной ошибки. Байесовский риск, в этом случае, это апостериорная дисперсия.
В тех случаях, когда нет веских причин предпочесть одно априорное распределение вероятности над другим, для простоты используется cопряжённое априорное распределение . Оно определяется как априорное распределение, принадлежащее некоторому параметрическому семейству, чьё результирующее апостериорное распределение также принадлежит этому семейству. Это важное свойство, поскольку байесовская оценка, а также его статистические характеристики ( дисперсия , доверительный интервал и т. д.) могут быть получены из апостериорного распределения.
Оно, в частности, применимо в последовательном оценивании, где апостериорное распределение текущих измерений используется как априорное в следующем измерении. С каждой новой итерацией таких измерений апостериорное распределение обычно становится всё более сложным, и часто байесовская оценка не может вычислена без использования численных методов .
Несколько примеров сопряжённых априорных распределений:
Функции риска выбираются в зависимости от того, как измеряется интервал между оценкой и неизвестным параметром. MSE наиболее часто используемая функция риска, в первую очередь из-за её простоты. Тем не менее, иногда используются и альтернативные функции риска. Далее идут несколько примеров таких альтернатив. Далее апостериорная обобщённая функция распределения обозначена как .
( ):
До сих пор предполагалось, что априорное распределение — это истинное вероятностное распределение, так как
Однако, порой это может быть слишком жестким требованием. Например, не существует такого распределения (покрывающего всё множество R вещественных чисел), для которого каждое вещественное число было бы равновозможным. Однако же, в некотором смысле, такое распределение кажется естественным выбором для , то есть для априорного распределения, не отдающего предпочтения некоторому фиксированному значению неизвестного параметра. По прежнему можно определить функцию , но это уже не будет корректным вероятностным распределением, так как оно имеет бесконечную массу.
Такие меры множества являются некорректными априорными распределениями .
Использование некорректных априорных распределений означает, что байесовский риск не определён (так как данное априорное распределение, по факту, не является вероятностным распределением и мы не можем взять Математическое ожидание от него). Следовательно, неверно говорить о байесовской оценке минимизирующей байесовский риск. Как бы то ни было, можно вычислить апостериорное распределение как
Не стоит забывать, что Теорема Байеса применима только к корректным распределениям, и значит не представляется возможным использование её здесь. Тем не менее, нередко встречаются случаи, когда для результирующего апостериорного распределения будет допустимы такие вероятностные распределения. В этом случае, апостериорные ожидаемые потери
хорошо определены и конечны. Напомним, что для корректного распределения байесовские оценки минимизируют апостериорные потери. Когда априорное распределение некорректно, оценка минимизирующая апостериорное ожидание потери называется обобщённой байесовской оценкой .
Байесовские оценки, полученные эмпирическим методом Байеса, называются эмпирическими байесовскими оценками . Этот метод позволяет использовать вспомогательные данные в разработке байесовской оценки. Их можно получить эмпирически, путём наблюдения за смежными параметрами. Это делается исходя из предположения, что оцениваемые параметры берутся из одних и тех же априорных данных. Например, если произвести независимые наблюдения за разными параметрами, то иногда можно улучшить эффективность оценки конкретного параметра путём использования данных из других наблюдений.
Существуют параметрические и непараметрические методики эмпирических байесовских оценок. Параметрические предпочтительнее, потому что более применимы и более аккуратны на небольших объёмах данных.
Байесовские правила, имеющие конечный байесовский риск обычно являются допустимыми. Далее приведены некоторые примеры теорем о допустимости.
В то же время, обобщённое байесовское правило часто не определяет байесовский риск в случае некорректного априорного распределения. Эти правила часто недопустимы и подтверждение их допустимости может вызвать затруднения. Для примера, обобщённая байесовская оценка сдвига параметра θ, основанная на выборке с нормальным распределением, недопустима для . Этот парадокс известен как парадокс Штайна.
Сайт Internet Movie Database использует специальную формулу для расчёта и сравнения рейтингов фильмов пользователями. Следующая байесовская формула изначально использовалась для расчёта взвешенного среднего показателя для Топ-250 фильмов, впрочем с тех пор формула изменилась:
где:
Подход IMDB гарантирует, что фильм, оцененный несколько сот раз исключительно оценкой 10 не сможет подняться в рейтинге выше, чем, например, фильм «Крёстный отец», со средней оценкой 9.2 от более чем 500,000 пользователей.