Interested Article - Критерий знаков
- 2021-05-31
- 1
В математической статистике критерий знаков используется при проверке нулевой гипотезы о равенстве медианы некоторому заданному значению (для одной выборки) или о равенстве нулю медианы разности (для двух ). Это непараметрический критерий , то есть он не использует никаких данных о характере распределения, и может применяться в широком спектре ситуаций, однако при этом он может иметь меньшую мощность , чем более специализированные критерии.
Описание метода для двух выборок
Рассмотрим две непрерывно распределенные случайные величины X и Y , и пусть нулевая гипотеза выполняется, то есть медиана их разности равна нулю. Тогда . Иными словами, каждая из случайных величин равновероятно больше другой.
Рассмотрим пару связных выборок . Будем считать, что в выборке нет элементов, для которых (иначе уберем эти элементы из выборки). Построим статистику w , равную числу элементов в выборке, при которых . При выполнении нулевой гипотезы, эта величина имеет биномиальное распределение : .
Для применения критерия необходимо вычислить «левый хвост» биномиального распределения до w : . Согласно критерию, при уровне значимости :
- против двусторонней альтернативной гипотезы
-
- если , то нулевая гипотеза отвергается;
- против альтернативы
-
- если , то нулевая гипотеза отвергается;
- против альтернативы
-
- если , то нулевая гипотеза отвергается;
Пример задачи
Первая выборка — это значения некоторой характеристики состояния пациентов, записанные до лечения. Вторая выборка — это значения той же характеристики состояния тех же пациентов, записанные после лечения.
Порядок элементов (в данном случае пациентов) в выборках и объёмы выборок обязаны совпадать. Такие выборки и называются связанными .
Требуется выяснить, является ли лечение эффективным, то есть имеется ли значимое отличие в состоянии пациентов до и после лечения, или различия чисто случайны.
Заданы две выборки одинаковой длины .
Дополнительные предположения:
- обе выборки ;
- выборки связные, то есть элементы соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).
Нулевая гипотеза .
Если в выборке имеются случаи , то их следует исключить из выборки, уменьшив число наблюдений. Статистика критерия — это число w элементов в выборке, при которых .
Ссылки
- // MachineLearning.ru.
- от 29 сентября 2017 на Wayback Machine // STAT 415 Intro Mathematical Statistics. Penn State University.
- 2021-05-31
- 1