Interested Article - Статистика (функция выборки)

Статистика измеримая числовая функция от выборки , не зависящая от неизвестных параметров распределения элементов выборки.

Определение

Пусть задана случайная выборка наблюдений . Как правило, поскольку речь идёт о задачах математической статистики , распределение элементов этой выборки известно исследователю не полностью (например, содержит неизвестные числовые параметры).

Статистикой называется произвольная измеримая функция выборки , которая не зависит от неизвестных параметров распределения.

Условие измеримости статистики означает, что эта функция является случайной величиной , то есть определены вероятности её попадания в интервалы и другие борелевские множества на прямой.

Наиболее содержательный аспект данного понятия, отличающий его от прочих случайных величин, зависящих от выборки, заключается в том, что от неизвестных параметров эта функция не зависит, то есть исследователь может по имеющимся в его распоряжении данным найти значение этой функции, а, следовательно — основывать на этом значении оценки и прочие статистические выводы.

Пример

Предположим, что имеется числовая выборка , элементы которой имеют нормальное распределение . Допустим, что значение параметра ( математического ожидания ) известно, то есть это некоторое конкретное число, а значение среднеквадратичного отклонения неизвестно (и его требуется оценить). Для этого может быть использована следующая статистика:

Однако если значение параметра также неизвестно, то данная функция не является статистикой. В этом случае её по-прежнему можно исследовать теоретически (например, доказывать, что математическое ожидание равно ), однако вычислить её числовое значение нельзя, поэтому для получения непосредственных статистических выводов она не может быть использована. В этом случае оценка параметра строится другим способом (см. ниже).

Ниже приведены примеры некоторых часто используемых статистик. Все они предполагают, что наблюдения являются числовыми, .

В последние годы активно развивается также .

Статистики, используемые для оценки моментов (выборочные моменты)

  • Выборочное среднее :
  • Выборочная дисперсия :
    .
  • Несмещённая оценка дисперсии:
  • Выборочный момент -го порядка (выборочное среднее — момент первого порядка):
    .
  • Выборочный центральный момент -го порядка (выборочная дисперсия — центральный момент второго порядка):
    .
  • Несмещённые оценки центральных моментов:
    ;
    ;
    .

Выборочный коэффициент асимметрии

Выборочный коэффициент асимметрии :

.

Если плотность распределения симметрична, то . Если левый хвост распределения «тяжелее», то , если «тяжелее» правый хвост — то .

Выборочный коэффициент асимметрии используется для проверки распределения на , а также для грубой предварительной проверки на нормальность . Он позволяет отвергнуть, но не позволяет принять гипотезу нормальности.

Выборочный коэффициент эксцесса

Выборочный коэффициент эксцесса :

.

Нормальное распределение имеет нулевой эксцесс: .

Если хвосты распределения «легче», а пик «острее», чем у нормального распределения, то .

Если хвосты распределения «тяжелее», а пик более «приплюснутый», чем у нормального распределения, то .

Выборочный коэффициент эксцесса часто используется для грубой предварительной проверки на нормальность . Он позволяет отвергнуть, но не позволяет принять гипотезу нормальности.

Статистики, связанные с эмпирическим распределением

Эмпирическое распределение случайной величины , построенное по случайной выборке , есть функция:

.

При любом фиксированном значение можно рассматривать как статистику.

Порядковые статистики

Порядковые статистики основаны на вычислении вариационного ряда , который получается из исходной выборки путём упорядочивания её элементов по возрастанию:

.

Значение называется -й порядковой статистикой.

  • Выборочный - квантиль при :
  • Размах выборки:
    .
  • Выборочная медиана :
    .

Ранговые статистики

Значение называется рангом элемента выборки , если .

Ранговой статистикой называется любая статистика, которая является функцией от рангов элементов , а не от их значений . Переход от значений к их рангам позволяет строить непараметрические статистические критерии , которые не опираются на априорные предположения о функции распределения выборки. Они имеют гораздо более широкую область применения, чем .

Средний ранг

Аналогом выборочного среднего является средний ранг:

Линейные ранговые статистики

Многие используемые на практике ранговые статистики принадлежат семейству линейных ранговых статистик, либо асимптотически приближаются к линейным при . в общем случае имеет вид:

,

где — произвольная заданная числовая матрица размера .

Литература

  • Вероятность и математическая статистика: Энциклопедия / Под ред. Ю. В. Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
  • Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
  • Лекционные курсы НОЦ/ Математический институт им. В. А. Стеклова РАН (МИАН). – М.: МИАН, 2009. Вып. 14: Лекции по асимптотической теории ранговых критериев / Чибисов Д. М. – 176 с.

Ссылки

Источник —

Same as Статистика (функция выборки)