Множественный коэффициент корреляции
- Характеризует тесноту линейной корреляционной связи между одной
случайной величиной
и некоторым множеством случайных величин. Более точно, если (ξ
1
,ξ
2
,...,ξ
k
) - случайный вектор из
R
k
, тогда коэффициент множественной корреляции
между ξ
1
и ξ
2
,...,ξ
k
численно равен коэффициенту парной линейной корреляции между величиной ξ
1
и её наилучшей линейной аппроксимацией
по переменным ξ
2
...,ξ
k
, которая представляет собой
линейную регрессию
ξ
1
на ξ
2
,...,ξ
k
.
Свойства
Множественный коэффициент корреляции обладает тем свойством, что при условии
когда
- это регрессия ξ
1
на ξ
2
,...,ξ
k
,
среди всех
линейных комбинаций
переменных ξ
2
,...,ξ
k
переменная ξ
1
будет иметь максимальный коэффициент корреляции с ξ
1
*
, совпадающий с
. В этом смысле множественный коэффициент корреляции является частным случаем . При
k
= 2 множественный коэффициент корреляции по абсолютной величине совпадает с коэффициентом парной линейной корреляции
ρ
12
между ξ
1
и ξ
2
.
Вычисление
Множественный коэффициент корреляции вычисляется с помощью корреляционной матрицы
по формуле
,
где
- это
определитель
корреляционной матрицы, а
- это
алгебраическое дополнение
элемента
ρ
11
= 1 ; здесь
. Если
, тогда с вероятностью 1 значения ξ
1
совпадают с линейной комбинацией ξ
2
,...,ξ
k
, следовательно, совместное распределение ξ
1
,ξ
2
,...,ξ
k
лежит на
гиперплоскости
в пространстве
R
k
. С другой стороны, при
все парные коэффициенты корреляции
ρ
12
=
ρ
13
= ... =
ρ
1k
= 0 равны нулю, следовательно, значения ξ
1
не коррелируют с величинами ξ
2
,...,ξ
k
. Верно и обратное утверждение. Множественный коэффициент корреляции можно также вычислить по формуле
,
где
- это дисперсия ξ
1
, а
- дисперсия ξ
1
относительно регрессии.
Выборочный множественный коэффициент корреляции
Выборочным аналогом множественного коэффициента корреляции служит величина
, где
и
- это оценки для
и
, полученные по выборке объема
n
. Для проверки нуль-гипотезы об отсутствии взаимосвязи используется распределение статистики
. При условии, что
выборка
взята из многомерного
нормального распределения
, величина
будет обладать
бета-распределением
с параметрами
, если
. Для случая
тип распределения
известен, но практически не используется ввиду его громоздкости.