Interested Article - Множественный коэффициент корреляции

Множественный коэффициент корреляции - Характеризует тесноту линейной корреляционной связи между одной случайной величиной и некоторым множеством случайных величин. Более точно, если (ξ 1 2 ,...,ξ k ) - случайный вектор из R k , тогда коэффициент множественной корреляции ρ ξ 1 ξ 2 , , ξ k {\displaystyle \rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k}}} между ξ 1 и ξ 2 ,...,ξ k численно равен коэффициенту парной линейной корреляции между величиной ξ 1 и её наилучшей линейной аппроксимацией M ( ξ 1 | ξ 2 , , ξ k ) {\displaystyle M(\xi _{1}|\xi _{2},\ldots ,\xi _{k})} по переменным ξ 2 ...,ξ k , которая представляет собой линейную регрессию ξ 1 на ξ 2 ,...,ξ k .

Свойства

Множественный коэффициент корреляции обладает тем свойством, что при условии

M ξ 1 = M ξ 2 = = M ξ k = 0 {\displaystyle M\xi _{1}=M\xi _{2}=\ldots =M\xi _{k}=0} когда ξ 1 = β 2 ξ 2 + β 3 ξ 3 + + β k ξ k {\displaystyle \xi _{1}^{*}=\beta _{2}\xi _{2}+\beta _{3}\xi _{3}+\cdots +\beta _{k}\xi _{k}} - это регрессия ξ 1 на ξ 2 ,...,ξ k ,

среди всех линейных комбинаций переменных ξ 2 ,...,ξ k переменная ξ 1 будет иметь максимальный коэффициент корреляции с ξ 1 * , совпадающий с ρ ξ 1 ξ 2 , , ξ k {\displaystyle \rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k}}} . В этом смысле множественный коэффициент корреляции является частным случаем . При k = 2 множественный коэффициент корреляции по абсолютной величине совпадает с коэффициентом парной линейной корреляции ρ 12 между ξ 1 и ξ 2 .

Вычисление

Множественный коэффициент корреляции вычисляется с помощью корреляционной матрицы R = { ρ i , j } , i , j = 1 , , k {\displaystyle \mathbf {R} =\left\{\rho _{i,j}\right\},i,j=1,\ldots ,k} по формуле

ρ ξ 1 ξ 2 , , ξ k 2 = 1 | R | R 11 {\displaystyle \rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k}}^{2}=1-{\frac {\left\vert R\right\vert }{R_{11}}}} ,

где | R | {\displaystyle \left\vert R\right\vert } - это определитель корреляционной матрицы, а R 11 {\displaystyle R_{11}} - это алгебраическое дополнение элемента ρ 11 = 1 ; здесь 0 ρ ξ 1 ξ 2 , , ξ k 1 {\displaystyle 0\leqslant \rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k}}\leqslant 1} . Если ρ ξ 1 ξ 2 , , ξ k = 1 {\displaystyle \rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k}}=1} , тогда с вероятностью 1 значения ξ 1 совпадают с линейной комбинацией ξ 2 ,...,ξ k , следовательно, совместное распределение ξ 1 2 ,...,ξ k лежит на гиперплоскости в пространстве R k . С другой стороны, при ρ ξ 1 ξ 2 , , ξ k = 0 {\displaystyle \rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k}}=0} все парные коэффициенты корреляции ρ 12 = ρ 13 = ... = ρ 1k = 0 равны нулю, следовательно, значения ξ 1 не коррелируют с величинами ξ 2 ,...,ξ k . Верно и обратное утверждение. Множественный коэффициент корреляции можно также вычислить по формуле

ρ ξ 1 ξ 2 , , ξ k 2 = 1 σ ξ 1 ξ 2 , , ξ k 2 σ 1 2 {\displaystyle \rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k}}^{2}=1-{\frac {\sigma _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k}}^{2}}{\sigma _{1}^{2}}}} ,

где σ 1 2 {\displaystyle \sigma _{1}^{2}} - это дисперсия ξ 1 , а σ ξ 1 ξ 2 , , ξ k 2 = M ( ξ 1 ( β 2 ξ 2 + β 3 ξ 3 + + β k ξ k ) ) 2 {\displaystyle \sigma _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k}}^{2}=M(\xi _{1}-(\beta _{2}\xi _{2}+\beta _{3}\xi _{3}+\cdots +\beta _{k}\xi _{k}))^{2}} - дисперсия ξ 1 относительно регрессии.

Выборочный множественный коэффициент корреляции

Выборочным аналогом множественного коэффициента корреляции служит величина r 1 2 , , k = 1 s 1 2 , , k 2 s 1 2 {\displaystyle r_{1\bullet 2,\ldots ,k}={\sqrt {1-{\frac {s_{1\bullet 2,\ldots ,k}^{2}}{s_{1}^{2}}}}}} , где s 1 2 , , k 2 {\displaystyle s_{1\bullet 2,\ldots ,k}^{2}} и s 1 2 {\displaystyle s_{1}^{2}} - это оценки для σ ξ 1 ξ 2 , , ξ k 2 {\displaystyle \sigma _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k}}^{2}} и σ 1 2 {\displaystyle \sigma _{1}^{2}} , полученные по выборке объема n . Для проверки нуль-гипотезы об отсутствии взаимосвязи используется распределение статистики r 1 2 , , k {\displaystyle r_{1\bullet 2,\ldots ,k}} . При условии, что выборка взята из многомерного нормального распределения , величина r 1 2 , , k 2 {\displaystyle r_{1\bullet 2,\ldots ,k}^{2}} будет обладать бета-распределением с параметрами k 1 2 , n k 2 {\displaystyle {\frac {k-1}{2}},{\frac {n-k}{2}}} , если ρ ξ 1 ξ 2 , , ξ k = 0 {\displaystyle \rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k}}=0} . Для случая ρ ξ 1 ξ 2 , , ξ k 0 {\displaystyle \rho _{\xi _{1}\bullet \xi _{2},\ldots ,\xi _{k}}\neq 0} тип распределения r 1 2 , , k 2 {\displaystyle r_{1\bullet 2,\ldots ,k}^{2}} известен, но практически не используется ввиду его громоздкости.

См. также

Литература

  • Крамер Г. Математические методы статистики, пер. с англ., 2 изд., М., 1975;
  • Кендалл М., Стьюард А. , Статистические выводы и связи, пер. с англ., М., 1973.

Same as Множественный коэффициент корреляции