Interested Article - Квантиль

Кванти́ль в математической статистике — значение, которое заданная случайная величина не превышает с фиксированной вероятностью . Если вероятность задана в процентах, то квантиль называется процентилем или перцентилем (см.).

Например, фраза «90-й процентиль массы тела у новорожденных мальчиков составляет 4 кг» означает, что 90 % мальчиков рождаются с весом, меньшим либо равным 4 кг, а 10 % мальчиков рождаются с весом, большим либо равным 4 кг.

Определение

Рассмотрим вероятностное пространство ( Ω , F , P ) {\displaystyle (\Omega ,\;{\mathcal {F}},\;\mathbb {P})} и P X {\displaystyle \mathbb {P} ^{X}} вероятностная мера , задающая распределение некоторой случайной величины X {\displaystyle X} . Пусть фиксировано α ( 0 , 1 ) {\displaystyle \alpha \in (0,\;1)} . Тогда α {\displaystyle \alpha } -квантилем (или квантилью уровня (порядка) α {\displaystyle \alpha } ) распределения P X {\displaystyle \mathbb {P} ^{X}} называется число x α R {\displaystyle x_{\alpha }\in \mathbb {R} } такое, что

P ( X x α ) α , {\displaystyle \mathbb {P} (X\leqslant x_{\alpha })\geqslant \alpha ,}
P ( X x α ) 1 α . {\displaystyle \mathbb {P} (X\geqslant x_{\alpha })\geqslant 1-\alpha .}

В некоторых источниках (например, в англоязычной литературе) k {\displaystyle k} q {\displaystyle q} -квантилем называется квантиль уровня k / q {\displaystyle k/q} , то есть ( k / q ) {\displaystyle (k/q)} -квантиль в предыдущих обозначениях.

Замечания

F X ( x α ) = α , {\displaystyle F_{X}(x_{\alpha })=\alpha ,}
где F X {\displaystyle F_{X}} функция распределения P X {\displaystyle \mathbb {P} ^{X}} .
  • Очевидно, для непрерывных распределений справедливо следующее широко использующееся при построении доверительных интервалов равенство:
P ( x 1 α 2 X x 1 + α 2 ) = α . {\displaystyle \mathbb {P} \left(x_{\frac {1-\alpha }{2}}\leqslant X\leqslant x_{\frac {1+\alpha }{2}}\right)=\alpha .}
  1. составляем вариационный ряд значений V 0 V 1 V N 1 {\displaystyle V_{0}\leqslant V_{1}\leqslant \dots \leqslant V_{N-1}} (выборка имеет объём N {\displaystyle N} ), а также считаем, что V N = V N 1 {\displaystyle V_{N}=V_{N-1}} (это необходимо при вычислении 100 % квантили по приводимым ниже формулам);
  2. находим величину K = α ( N 1 ) {\displaystyle K=\lfloor \alpha \cdot (N-1)\rfloor } ;
  3. сравниваем K {\displaystyle K} и α N {\displaystyle \alpha \cdot N} :
a) если K + 1 < α N {\displaystyle K+1<\alpha N} , то полагаем x α = V K + 1 {\displaystyle x_{\alpha }=V_{K+1}} ;
б) если K + 1 = α N {\displaystyle K+1=\alpha N} , то полагаем x α = ( V K + V K + 1 ) / 2 {\displaystyle x_{\alpha }=(V_{K}+V_{K+1})/2} ;
в) если K + 1 > α N {\displaystyle K+1>\alpha N} , то полагаем x α = V K {\displaystyle x_{\alpha }=V_{K}} .
Заданный таким образом α {\displaystyle \alpha } -квантиль удовлетворяет приведенному выше определению.
В некоторых случаях (при большом объёме выборки и эмпирическом распределении, близком к непрерывному) вместо равенства K + 1 = α N {\displaystyle K+1=\alpha N} можно использовать приближённое сравнение | K + 1 α N | < 1 / N {\displaystyle |K+1-\alpha N|<1/N} (это позволит, например, квантиль уровня 1/3 представлять как 0,33…333 при компьютерной обработке данных).

Медиана и квартили

Квантили нормального распределения
  • 0,25-квантиль называется первым (или нижним) кварти́лем (от лат. quarta — четверть);
  • 0,5-квантиль называется медианой (от лат. mediāna — середина) или вторым кварти́лем ;
  • 0,75-квантиль называется третьим (или верхним) кварти́лем .

Интеркварти́льным размахом ( англ. Interquartile range) называется разность между третьим и первым квартилями, то есть x 0 , 75 x 0 , 25 {\displaystyle x_{0{,}75}-x_{0{,}25}} . Интерквартильный размах является характеристикой разброса распределения величины и является робастным аналогом дисперсии . Вместе, медиана и интерквартильный размах могут быть использованы вместо математического ожидания и дисперсии в случае распределений с большими выбросами, либо при невозможности вычисления последних.

Дециль

Деци́ль характеризует распределение величин совокупности, при котором девять значений дециля делят её на десять равных частей. Любая из этих десяти частей составляет 1/10 всей совокупности. Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля, от 90 % наибольших величин, лежащих выше дециля.

Так же, как в случае моды и медианы, у интервального вариационного ряда распределения каждый дециль (и квартиль) принадлежит определённому интервалу и имеет вполне определённое значение .

Процентиль

p {\displaystyle p} проценти́лем называют квантиль уровня α = p / 100 {\displaystyle \alpha =p/100} . Соответственно, медиана является 50-м процентилем, а первый и третий — 25-м и 75-м процентилями соответственно.

В целом, понятия квантиль и процентиль взаимозаменяемы, так же, как и шкалы исчисления вероятностей — абсолютная и процентная.

Процентили также называются перцентилями или центилями .

Квантили стандартного нормального распределения

Вероятность (уровень квантили), % 99,99 99,90 99,00 97,72 97,50 95,00 90,00 84,13 50,00
Квантиль (округлённый до тысячных) 3,719 3,09 2,326 1,999 1,96 1,645 1,282 1 0

См. также

Примечания

  1. . — ГЭОТАР-Медиа, 2008. — С. 44. — 354 с.
  2. Фролов А. Н. Краткий курс теории вероятностей и математической статистики: учебное пособие для СПО. — СПб. : Лань, 2021. — С. 189. — 316 с. — ISBN 978-5-8114-8343-3 .
  3. Шмойлова Р. А., Минашкин В. Г., Садовникова Н. А. Практикум по теории статистики. — 3-е изд. — М. : Финансы и статистика, 2011. — С. 130—131. — 416 с. — ISBN 9785279032969 .
  4. Большев Л. Н. , Смирнов Н. В. Таблицы математической статистики. — 3-е изд.. — М. : Наука , 1983. — С. 136. — 416 с.

Ссылки

Same as Квантиль