Из определения легко получить
моменты
распределения хи-квадрат. Если
, то
,
.
В силу
центральной предельной теоремы
, при большом числе степеней свободы распределение случайной величины
может быть приближено нормальным
. Более точно
Если
и
— независимы, тогда
. Если
и
не являются независимыми, тогда
не обязано быть распределено по закону хи-квадрат.
Вариации и обобщение
Дальнейшим обобщением распределения хи-квадрат является так называемое
, возникающее в некоторых задачах статистики.
Квантили
Квантиль — это число (аргумент), на котором функция распределения равна заданной, требуемой вероятности. Грубо говоря, квантиль — это результат обращения функции распределения, но есть тонкости с разрывными функциями распределения.
История
Критерий
был предложен
Карлом Пирсоном
в 1900 году
. Его работа рассматривается как фундамент современной математической статистики. Предшественники Пирсона просто строили графики экспериментальных результатов и утверждали, что они правильны. В своей статье Пирсон привёл несколько интересных примеров злоупотреблений статистикой. Он также доказал, что некоторые результаты наблюдений за рулеткой (на которой он проводил эксперименты в течение двух недель в
Монте-Карло
в 1892 году) были так далеки от ожидаемых частот, что шансы получить их снова при предположении, что рулетка устроена добросовестно, равны одному из 10
29
.
Общее обсуждение критерия
и обширную библиографию можно найти в обзорной работе Вильяма Дж. Кокрена
.
Приложения
Распределение хи-квадрат имеет многочисленные приложения при статистических выводах, например при использовании
критерия хи-квадрат
и при оценке дисперсий. Оно используется в проблеме оценивания среднего нормально распределённой популяции и проблеме оценивания наклона линии
регрессии
благодаря его роли в
распределении Стьюдента
. Оно используется в
дисперсионном анализе
.
Далее приведены примеры ситуаций, в которых распределение хи-квадрат возникает из нормальной выборки:
Для любого числа
p
между 0 и 1 определено
p
-значение
— вероятность получить для данной вероятностной модели распределения значений случайной величины такое же или более экстремальное значение статистики (среднего арифметического, медианы и др.), по сравнению с наблюдаемым, при условии верности нулевой гипотезы. В данном случае это распределение
. Так как значение
функции распределения
в точке для соответствующих степеней свободы дает вероятность получить значение статистики
менее экстремальное
, чем эта точка,
p
-значение можно получить, если отнять от единицы значение функции распределения. Малое
p
-значение — ниже выбранного уровня значимости — означает
статистическую значимость
. Этого будет достаточно, чтобы отвергнуть нулевую гипотезу. Чтобы различать значимые и незначимые результаты, обычно используют уровень 0,05.
В таблице даны
p
-значения для соответствующих значений
у первых десяти степеней свободы.
Степени свободы (
df
)
Значение
1
0,004
0,02
0,06
0,15
0,46
1,07
1,64
2,71
3,84
6,63
10,83
2
0,10
0,21
0,45
0,71
1,39
2,41
3,22
4,61
5,99
9,21
13,82
3
0,35
0,58
1,01
1,42
2,37
3,66
4,64
6,25
7,81
11,34
16,27
4
0,71
1,06
1,65
2,20
3,36
4,88
5,99
7,78
9,49
13,28
18,47
5
1,14
1,61
2,34
3,00
4,35
6,06
7,29
9,24
11,07
15,09
20,52
6
1,63
2,20
3,07
3,83
5,35
7,23
8,56
10,64
12,59
16,81
22,46
7
2,17
2,83
3,82
4,67
6,35
8,38
9,80
12,02
14,07
18,48
24,32
8
2,73
3,49
4,59
5,53
7,34
9,52
11,03
13,36
15,51
20,09
26,12
9
3,32
4,17
5,38
6,39
8,34
10,66
12,24
14,68
16,92
21,67
27,88
10
3,94
4,87
6,18
7,27
9,34
11,78
13,44
15,99
18,31
23,21
29,59
p
-значение
0,95
0,90
0,80
0,70
0,50
0,30
0,20
0,10
0,05
0,01
0,001
Эти значения могут быть вычислены через
квантиль
(обратную функцию распределения) распределения хи-квадрат
. Например, квантиль
для
p
= 0,05
и
df = 7
дает
=
14,06714 ≈ 14,07
, как в таблице сверху. Это означает, что для экспериментального наблюдения семи независимых случайных величин
при справедливости нулевой гипотезы «каждая величина описывается нормальным стандартным распределением с медианой 0 и стандартным отклонением 1» значение
можно получить лишь в 5 % реализаций. Получение большего значения обычно можно считать достаточным основанием для отбрасывания этой нулевой гипотезы.
В таблице дано округление до сотых; более точные таблицы для большего количества степеней свободы см., например, здесь
.
Pearson K.
On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling
(англ.)
// Philosophical Magazine, Series 5. —
Vol. 50
,
no. 302
. —
P. 157—175
. —
doi
:
.
Cochran W. G.
(англ.)
// Annals Math. Stat. — 1952. —
Vol. 23
,
no. 3
. —
P. 315—345
.
10 апреля 2020 года.
от 18 ноября 2013 на
Wayback Machine
Table B.2. Dr. Jacqueline S. McLaughlin at The Pennsylvania State University. Этот источник, в свою очередь, ссылается на:
R. A. Fisher and F. Yates
, Statistical Tables for Biological Agricultural and Medical Research, 6th ed., Table IV. Два значения были исправлены, 7,82 на 7,81 и 4,60 на 4,61.
(неопр.)
. Дата обращения: 19 ноября 2019.
16 февраля 2021 года.
(неопр.)
. Дата обращения: 29 января 2020.
26 января 2020 года.