Interested Article - Степени свободы (теория вероятностей)

Количество степеней свободы — это количество значений в итоговом вычислении статистики , способных варьироваться. Иными словами, количество степеней свободы показывает размерность вектора из случайных величин, количество «свободных» величин, необходимых для того, чтобы полностью определить вектор.

Количество степеней свободы может быть не только натуральным , но и любым действительным числом, хотя стандартные таблицы рассчитывают p-value наиболее распространённых распределений только для натурального числа степеней свободы.

Степени свободы распределений

Хи-квадрат

Если случайные величины Z 1 ; ; Z n {\displaystyle Z_{1};\ldots ;Z_{n}} независимы и все имеют стандартное нормальное распределение ( Z N ( 0 ; 1 ) {\displaystyle Z\sim {\mathcal {N}}(0;1)} ), то тогда говорят, что случайная величина X {\displaystyle X} , являющаяся суммой квадратов стандартных нормальных величин в количестве n {\displaystyle n} штук, имеет распределение хи-квадрат с n {\displaystyle n} степенями свободы ( χ n 2 {\displaystyle \chi _{n}^{2}} ):

X = i = 1 n Z i 2 χ n 2 {\displaystyle X=\sum \limits _{i=1}^{n}Z_{i}^{2}\sim \chi _{n}^{2}}

t -распределение Стьюдента

Если случайная величина Z {\displaystyle Z} имеет стандартное нормальное распределение ( Z N ( 0 ; 1 ) {\displaystyle Z\sim {\mathcal {N}}(0;1)} ), случайная величина X {\displaystyle X} имеет распределение хи-квадрат с n {\displaystyle n} степенями свободы ( χ n 2 {\displaystyle \chi _{n}^{2}} ) и Z {\displaystyle Z} и X {\displaystyle X} независимы (их корреляция равна нулю), то случайная величина T = Z X n {\displaystyle T={\frac {Z}{\sqrt {\frac {X}{n}}}}} имеет распределение Стьюдента с n {\displaystyle n} степенями свободы ( t n {\displaystyle t_{n}} ):

T = N ( 0 ; 1 ) χ n 2 n t n {\displaystyle T={\frac {{\mathcal {N}}(0;1)}{\sqrt {\frac {\chi _{n}^{2}}{n}}}}\sim t_{n}}

Распределение Фишера—Снедекора

Если случайная величина X 1 {\displaystyle X_{1}} имеет распределение хи-квадрат с n {\displaystyle n} степенями свободы, а случайная величина X 2 {\displaystyle X_{2}} имеет распределение хи-квадрат с m {\displaystyle m} степенями свободы, то случайная величина F = X 1 / n X 2 / m {\displaystyle F={\frac {X_{1}/n}{X_{2}/m}}} имеет распределение Фишера—Снедекора с n {\displaystyle n} и m {\displaystyle m} степенями свободы ( t n {\displaystyle t_{n}} ):

F = χ n 2 / n χ m 2 / m F n ; m {\displaystyle F={\frac {\chi _{n}^{2}/n}{\chi _{m}^{2}/m}}\sim \mathrm {F} _{n;m}}

  • Если m {\displaystyle m\rightarrow \infty } , то F n ; m = χ n 2 / n χ m 2 / m χ n 2 {\displaystyle F_{n;m}={\frac {\chi _{n}^{2}/n}{\chi _{m}^{2}/m}}\rightarrow \chi _{n}^{2}} .
  • Если возвести случайную величину, имеющую распределение Стьюдента с m {\displaystyle m} степенями свободы, в квадрат, то она будет иметь распределение Фишера—Снедекора с 1 {\displaystyle 1} и m {\displaystyle m} степенями свободы:

( t m ) 2 = ( N ( 0 ; 1 ) χ m 2 m ) 2 = ( N ( 0 ; 1 ) ) 2 ( χ m 2 m ) 2 = χ 1 2 χ m 2 / m = χ 1 2 / 1 χ m 2 / m F 1 ; m {\displaystyle (t_{m})^{2}=\left({\frac {{\mathcal {N}}(0;1)}{\sqrt {\frac {\chi _{m}^{2}}{m}}}}\right)^{2}={\frac {{\bigl (}{\mathcal {N}}(0;1){\bigr)}^{2}}{\left({\sqrt {\frac {\chi _{m}^{2}}{m}}}\right)^{2}}}={\frac {\chi _{1}^{2}}{\chi _{m}^{2}/m}}={\frac {\chi _{1}^{2}/1}{\chi _{m}^{2}/m}}\sim \mathrm {F} _{1;m}}

Теория вероятностей

Пусть X i {\displaystyle X_{i}} — одномерная случайная величина . Тогда будут верны следующие утверждения о количестве степеней свободы :

  • Случайная величина S 2 = i ( X i X ¯ ) 2 n 1 {\displaystyle S^{2}={\frac {\sum \limits _{i}(X_{i}-{\bar {X}})^{2}}{n-1}}} распределена по закону χ 2 {\displaystyle \chi ^{2}} с ( n 1 ) {\displaystyle (n-1)} степенями свободы (при этом часто под S 2 {\displaystyle S^{2}} подразумевают выборочную дисперсию σ ^ 2 {\displaystyle {\hat {\sigma }}^{2}} ).
  • Исходя из вышеуказанных обозначений, можно утверждать, что случайная величина X X ¯ S 2 n {\displaystyle {\frac {X-{\bar {X}}}{\sqrt {\frac {S^{2}}{n}}}}} имеет распределение Стьюдента с n 1 {\displaystyle n-1} степенями свободы ( t n 1 {\displaystyle t_{n-1}} ) .
  • Случайная величина X E ( X ) σ ^ 2 n {\displaystyle {\frac {X-\mathbb {E} (X)}{\sqrt {\frac {{\hat {\sigma }}^{2}}{n}}}}} распределена по закону χ 2 {\displaystyle \chi ^{2}} с n {\displaystyle n} степенями свободы.
  • Случайная величина X E ( X ) σ X 2 n {\displaystyle {\frac {X-\mathbb {E} (X)}{\sqrt {\frac {\sigma _{X}^{2}}{n}}}}} распределена по стандартному нормальному закону ( N ( 0 ; 1 ) {\displaystyle {\mathcal {N}}(0;1)} ), где σ X 2 {\displaystyle \sigma _{X}^{2}} — истинная дисперсия случайной величины X {\displaystyle X} .

Замена случайной величины X ¯ ( X 1 ; ; X n ) {\displaystyle {\bar {X}}(X_{1};\ldots ;X_{n})} на её истинное математическое ожидание даёт прибавку в одну степень свободы по следующей причине. Рассмотрим случайную величину ξ k = X k X ¯ {\displaystyle \xi _{k}=X_{k}-{\bar {X}}} . Далее, i = 1 n ξ i = i = 1 n ( X i X ¯ ) = i = 1 n X i i = 1 n X ¯ = n X ¯ n X ¯ = 0 {\displaystyle \sum \limits _{i=1}^{n}\xi _{i}=\sum \limits _{i=1}^{n}(X_{i}-{\bar {X}})=\sum \limits _{i=1}^{n}X_{i}-\sum \limits _{i=1}^{n}{\bar {X}}=n{\bar {X}}-n{\bar {X}}=0} . Следовательно, имеется n {\displaystyle n} штук зависимых случайных величин. Поэтому n 1 {\displaystyle n-1} штук величин независимы, поэтому в формуле с X ¯ {\displaystyle {\bar {X}}} в числителе на одну степень свободы меньше, чем в формуле с истинным матожиданием.

Регрессионный анализ

В регрессионном анализе при использовании метода наименьших квадратов сопоставляются наблюдения Y i {\displaystyle Y_{i}} с расчётными значениями Y ^ i {\displaystyle {\hat {Y}}_{i}} (полученными из уравнения регрессии). Если Y ¯ {\displaystyle {\bar {Y}}} — это арифметическое среднее всех наблюдений, то в соответствии с многомерной теоремой Пифагора имеет место равенство:

i ( Y i Y ¯ ) 2 T S S = i ( Y ^ i Y ¯ ) 2 E S S + i ( Y i Y ^ ) 2 R S S {\displaystyle \underbrace {\sum \limits _{i}(Y_{i}-{\bar {Y}})^{2}} _{TSS}=\underbrace {\sum \limits _{i}({\hat {Y}}_{i}-{\bar {Y}})^{2}} _{ESS}+\underbrace {\sum \limits _{i}(Y_{i}-{\hat {Y}})^{2}} _{RSS}}

При этом T S S {\displaystyle TSS} (Total Sum of Squares) распределён как χ 2 {\displaystyle \chi ^{2}} с ( n 1 ) {\displaystyle (n-1)} степенями свободы, E S S {\displaystyle ESS} (Estimated Sum of Squares; не путать с Error!) распределён как χ 2 {\displaystyle \chi ^{2}} с одной степенью свободы, R S S {\displaystyle RSS} (Residual Sum of Squares; не путать с Regression!) распределён как χ 2 {\displaystyle \chi ^{2}} с ( n 2 ) {\displaystyle (n-2)} степенями свободы.

См. также

Same as Степени свободы (теория вероятностей)