Interested Article - P-значение
![](https://wafarin.com/images/000/672/672832/1.jpg?105158)
![](https://cdn.wafarin.com/avatars/e138a894a90e463ca0157ab708db5256.gif)
- 2021-02-16
- 1
P-значение ( англ. P-value ) , p-уровень значимости, p-критерий — вероятность получить для данной вероятностной модели распределения значений случайной величины такое же или более экстремальное значение статистики (среднего арифметического, медианы и др.), по сравнению с ранее наблюдаемым, при условии, что нулевая гипотеза верна.
Особенностью P-значений является их неустойчивость на эквивалентных выборках , что может стать препятствием для воспроизводимости результатов эксперимента . Альтернативы использованию P-значений включают такие методы, как статистика оценки и коэффициент Байеса .
Формальное определение и процедура тестирования
![](/images/000/672/672832/1.jpg?rand=669210)
Пусть статистика , используемая при тестировании некоторой нулевой гипотезы . Предполагается, что если нулевая гипотеза справедлива, то распределение этой статистики известно. Обозначим функцию распределения . P-значение чаще всего (при проверке правосторонней альтернативы) определяется как:
—
При проверке левосторонней альтернативы,
В случае двустороннего теста p-значение равно:
Если p(t) меньше заданного уровня значимости, то нулевая гипотеза отвергается в пользу альтернативной. В противном случае она не отвергается.
Преимуществом данного подхода является то, что видно при каком уровне значимости нулевая гипотеза будет отвергнута, а при каких принята, то есть виден уровень надежности статистических выводов, точнее вероятность ошибки при отвержении нулевой гипотезы. При любом уровне значимости больше
нулевая гипотеза отвергается, а при меньших значениях — нет.Критика
Использование p -значений для проверки нулевых гипотез в работах по медицине, естественным наукам подвергается критике со стороны многих специалистов. Отмечается, что их использование нередко приводят к ошибкам первого рода ( false positive ) . В частности, журнал Basic and Applied Social Psychology (BASP) в 2015 году вовсе запретил публикацию статей, в которых используются p -значения. Редакторы журнала объяснили это тем, что провести исследование, в котором получено p < 0,05 не очень сложно, и такие низкие значения p слишком часто становятся оправданием для низкопробных исследований .
Неправильная интерпретация P-значений
Широко распространено мнение о том, что P-значения часто неверно интерпретируются и неправильно используются . Одна из практик, подвергшихся особой критике, заключается в принятии альтернативной гипотезы для любого P-значения, номинально меньшего 0,05 без других подтверждающих доказательств. Хотя P-значения полезны при оценке того, насколько несовместимы данные с данной статистической моделью, необходимо также учитывать контекстуальные факторы, такие как «дизайн исследования, качество измерений, внешние доказательства изучаемого явления и обоснованность предположений, лежащих в основе анализа данных» . Еще одна проблема заключается в том, что P-значение часто неверно понимается как вероятность того, что нулевая гипотеза верна . Некоторые специалисты предложили заменить P-значения на альтернативные метрики доказательности , такие как доверительный интервал , или коэффициент Байеса , однако продолжается острая дискуссия о возможности применения таких альтернатив . Другие специалисты предложили убрать фиксированные пороговые значения значимости и интерпретировать P-значения как непрерывные величины, характеризующие величину доказательств, направленных против правдоподобия нулевой гипотезы .
См. также
Примечания
- .
- .
- .
- .
- .
- .
- Douglas H. Johnson. (англ.) // Journal of Wildlife Management . — Wiley-VCH , 1999. — Vol. 3 , no. 63 . — P. 763—772 . 10 июня 2018 года.
- Chris Woolston. (англ.) // Nature News. — 2015-03-05. — Vol. 519 , iss. 7541 . — P. 9—9 . — doi : . 28 февраля 2015 года.
- (англ.) // Scientific American : magazine. — Springer Nature , 2015. — 16 April. 21 апреля 2015 года.
- Goodman S. N. Toward evidence-based medical statistics. 1: The P value fallacy (англ.) // (англ.) (: journal. — 1999. — Vol. 130 , no. 12 . — P. 995—1004 . — doi : . — .
- ↑ Wasserstein, Ronald L.; (англ.) (. The ASA's statement on p-values: context, process, and purpose (англ.) // (англ.) (: journal. — 2016. — Vol. 70 . — P. 129—133 . — doi : .
- Colquhoun, David. An investigation of the false discovery rate and the misinterpretation of p-values (англ.) // (англ.) (: journal. — 2014. — Vol. 1 . — P. 140216 . — doi : .
- Lee, Dong Kyu. Alternatives to P value: confidence interval and effect size (англ.) // (англ.) (: journal. — 2017. — 7 March (vol. 69 , no. 6). — P. 555—562 . — ISSN . — doi : . — . — PMC .
- Ranstam, J. (англ.) // (англ.) (: journal. — 2012. — August (vol. 20 , no. 8). — P. 805—808 . — doi : . 30 декабря 2017 года.
- Perneger, Thomas V. Sifting the evidence: Likelihood ratios are alternatives to P values (англ.) // BMJ: British Medical Journal : journal. — 2001. — 12 May (vol. 322 , no. 7295). — P. 1184 . — ISSN . — . — PMC .
- Royall, Richard. The Likelihood Paradigm for Statistical Evidence // (англ.) . — P. 119—152. — doi : . 30 декабря 2017 года.
- Schimmack, Ulrich (неопр.) . Replicability-Index (30 апреля 2015). Дата обращения: 7 марта 2017. 7 марта 2017 года.
- Marden, John I. Hypothesis Testing: From p Values to Bayes Factors (англ.) // Journal of the American Statistical Association : journal. — 2000. — December (vol. 95 , no. 452). — P. 1316 . — doi : .
- Stern, Hal S. A Test by Any Other Name: Values, Bayes Factors, and Statistical Inference (англ.) // (англ.) (: journal. — 2016. — 16 February (vol. 51 , no. 1). — P. 23—29 . — doi : . — . — PMC .
- Murtaugh, Paul A. In defense of p-values (неопр.) // Ecology. — 2014. — March (т. 95 , № 3). — С. 611—617 . — doi : .
- Aschwanden, Christie (неопр.) . FiveThirtyEight (7 марта 2016). Дата обращения: 5 марта 2018. 17 июня 2016 года.
- Amrhein, Valentin; Korner-Nievergelt, Fränzi; Roth, Tobias. (англ.) // (англ.) (: journal. — 2017. — Vol. 5 . — P. e3544 . — doi : . 7 июля 2017 года.
- Amrhein, Valentin; Greenland, Sander. (англ.) // Nature Human Behaviour : journal. — 2017. — Vol. 1 . — P. 0224 . — doi : .
Литература
- Cumming, G. Replication and p intervals: p values predict the future only vaguely, but confidence intervals do much better : [ англ. ] // en . — 2008. — Vol. 3, no. 4. — P. 286—300. — doi : .
- Cumming, G. // ICOTS-8 Conference Proceedings : Data and context in statistics education: towards an evidence-based society : [ англ. ] / C. Reading (Ed.). — International Association for Statistical Education : International Statistical Institute , 2010. — ISBN 978-90-77713-54-9 .
- en . Aligning statistical and scientific reasoning: Misunderstanding and misuse of statistical significance impede science : [ англ. ] // Science . — 2016. — Vol. 352, no. 6290. — P. 1180—1181. — doi : .
- Halsey, L. G. The fickle P value generates irreproducible results : [ англ. ] / L. G. Halsey, D. Curran-Everett, S. L. Vowler [et al.] // Nature Methods . — 2015. — Vol. 12, no. 3. — P. 179—185. — doi : .
- Nuzzo, R. Statistical errors: P values, the “gold standard” of statistical validity, are not as reliable as many scientists assume : [ англ. ] // Nature . — 2014. — Vol. 506, no. 7487. — P. 150—152. — doi : .
- Taroni, F. Statistical hypothesis testing and common misinterpretations: Should we abandon p-value in forensic science applications? : [ англ. ] / F. Taroni, A. Biedermann, S. Bozza // en . — 2016. — Vol. 259 (February). — P. e32-e36. — doi : .
Ссылки
- (неопр.) . Презентации к лекциям . ИОГен РАН . Дата обращения: 13 июня 2016.
![](https://cdn.wafarin.com/avatars/e138a894a90e463ca0157ab708db5256.gif)
- 2021-02-16
- 1