Interested Article - Критерий Вальда — Вольфовица
- 2020-08-29
- 2
Критерий Вальда — Вольфовица ( тест периодов , тест прогонов , критерий серий Вальда-Вольфовица ), названный в честь статистиков Абрахама Вальда и , представляет собой непараметрический статистический тест, который проверяет гипотезу о случайности для двух последовательностей данных одинаковой длины. Точнее, данный критерий можно использовать для проверки нулевой гипотезы о том, что элементы двух последовательностей взаимно независимы.
Определение
Прогон последовательности — это максимальный непустой сегмент последовательности, состоящий из соседних равных элементов. Если последовательность действительно случайна, то прогонов не должно быть слишком мало, но и не должно быть слишком много.
Например, последовательность длиной в 22 элемента
- + + + + − − − + + + − − + + + + + + − − − −
состоит из 6 прогонов, 3 из которых состоят из «+», а остальные из «−». Тест прогонов основан на нулевой гипотезе о том, что каждый элемент в последовательности независимо берется из одного и того же распределения.
Согласно нулевой гипотезе, количество прогонов в последовательности из N элементов является случайной величиной , условное распределение которой, учитывая наблюдение N + положительных значений и N − отрицательных значений ( N = N + + N − ), является приблизительно нормальным, при этом математическое ожидание , дисперсия .
Эти параметры не предполагают, что положительные и отрицательные элементы имеют равные вероятности появления, а только предполагают, что элементы
независимы и одинаково распределены
. Если количество прогонов
значительно
выше или ниже ожидаемого, гипотеза о статистической независимости элементов может быть отклонена.
Применение
Тест прогонов может быть использован, чтобы проверить:
- Случайность распределения данных в последовательности. Таким образом данные проверяются на предмет стационарности или отсутствие корреляции во временном ряду или другой последовательности , особенно если распределение признака неизвестно. Нулевая гипотеза здесь заключается в том, что последовательные значения некоррелированы. Данные выбираются из последовательности в порядке их следования: знаком «+» отмечаются данные равные или превышающие медиану ; знаком «–» — данные меньшие медианы.
- Насколько хорошо функция соотносится с датасетом . Данные, превышающие значение функции, отмечаются знаком «+», остальные данные отмечаются знаком «–». В этом случае тест прогонов , учитывающий знаки, но не расстояния, является дополнением к критерию хи-квадрат , который учитывает расстояния, но не знаки — обе контрольные величины асимптотически независимы друг от друга.
Пример проверки на случайность распределения данных
Рассмотрим последовательность
13 3 14 14 1 14 3 8 14 17 9 14 13 2 16 1 3 12 13 14
Отнесем каждое значение данной последовательности к одной из 2 групп («+» или «–») с учетом того больше оно или меньше медианы = 13
0 -10 1 1 -12 1 -10 -5 1 4 -4 1 0 -11 3 -12 -10 -1 0 1
+ - + + - + - - + + - + + - + - - - + +
При N + = 11 и N - = 9 получается r = 13 прогонов.
R приблизительно нормально распределено с математическим ожиданием и дисперсией .
В этом случае контрольная величина z рассчитывается как .
При уровне значимости 0,05 нулевая гипотеза H 0 отвергается, если |z| > 1,96. Это не наш случай.
Результат: нулевая гипотеза не отвергается. Элементы выборки, по-видимому, выбраны случайным образом.
Поскольку тест прогонов не является параметрическим тестом, то к результату следует относиться с осторожностью. Например, при уровне достоверности 90% нулевая гипотеза может быть отвергнута, однако параметрический показывает, что значения данного числового ряда не распределены нормальным образом!
Связанные критерии
Критерий Вальда-Вольфовица, первоначально предложенный для использования с двумя выборками (последовательностями) , впоследствии был расширен для использования с несколькими выборками.
Примечания
- N — это количество элементов, а не количество прогонов.
- N + — это количество элементов с положительными значениями, а не количество положительных прогонов.
- N - — это количество элементов с отрицательными значениями, а не количество отрицательных прогонов.
Ссылки
- . Дата обращения: 9 января 2023. 26 ноября 2022 года.
- . Дата обращения: 9 января 2023. 9 января 2023 года.
-
Wald, Abraham; Wolfowitz, Jacob (Jun., 1940).
.
The Annals of Mathematical Statistics
.
11
(2): 147—162.
doi
:
.
JSTOR
.
{{ cite journal }}
: Проверьте значение даты:|date=
( справка ) -
Wald, Abraham; Wolfowitz, Jacob (Dec., 1943).
.
The Annals of Mathematical Statistics
.
14
(4): 378—388.
doi
:
.
JSTOR
.
{{ cite journal }}
: Проверьте значение даты:|date=
( справка ) - Barton, DE; David, FN (1957). "Multiple runs". Biometrika . 44 (1—2): 168—178. doi : .
- Magel, RC; Wibowo, SH (1997). "Comparing the Powers of the Wald–Wolfowitz and Kolmogorov–Smirnov Tests". Biometrical Journal . 39 (6): 665—675. doi : .
- Sprent P, Smeeton NC (2007) Applied Nonparametric Statistical Methods, pp. 217–219. Boca Raton: Chapman & Hall/ CRC.
- Alhakim, A; Hooper, W (2008). "A non-parametric test for several independent samples". Journal of Nonparametric Statistics . 20 (3): 253—261. CiteSeerX . doi : .
Внешние ссылки
- Kandethody M. Ramachandran, Chris P. Tsokos. Chapter 12. Nonparametric Tests / Projects for Chapter 12 / 12B. Randomness Test (Wald–Wolfowitz Test) // (англ.) . — Elsevier Academic Press, 2009. — P. 653. — 824 p. — ISBN 978-0-12-374848-5 .
- Кобзарь, А. И. . Глава 4. Проверка гипотез о значениях параметров распределений / 4.3. Критерии тренда и случайности / 4.3.9. Критерии ранговой корреляции / 4.3.9.1. Критерий Вальда-Волфовитца // . — Физматлит, 2006. — С. 539. — 816 с. — ISBN 978-5-9221-0707-5 .
- 2020-08-29
- 2