В теории вероятностей и статистике ковариация является мерой совместной изменчивости двух случайных величин. Если большие значения одной переменной в основном соответствуют большим значениям другой переменной, и то же самое верно для меньших значений (то есть переменные имеют тенденцию одинаковой направленности) — ковариация положительна. При отрицательной ковариации большие значения одной переменной в основном соответствуют меньшим значениям другой и наоборот (то есть переменные имеют тенденцию противоположной направленности). Величину ковариации труднее интерпретировать, поскольку она не нормирована и, следовательно, зависит от размерности величин. Нормализованная версия ковариации —
коэффициент корреляции
— своей величиной показывает силу линейной зависимости.
Содержание
Определение
Пусть
— две случайные величины, определённые на одном и том же
вероятностном пространстве
. Тогда их ковариация определяется следующим образом:
Пусть
— выборка
объёма
,
— выборка
объёма
и они порождены случайными величинами, определёнными на одном и том же
вероятностном пространстве
. Тогда выборочным коэффициентом ковариации является средняя величина произведений отклонений значений от средних значений соответствующих выборок
:
,
где средние значения выборок (также называемые выборочными средними) определяют по формулам:
,
.
Если раскрыть скобки и воспользоваться формулой для выборочного среднего, то:
По абсолютному значению ковариации
нельзя судить о том, насколько сильно величины взаимосвязаны
, так как масштаб ковариации зависит от их
дисперсий
.
Значение ковариации можно нормировать, поделив её на произведение
среднеквадратических отклонений
(квадратных корней из дисперсий) случайных величин. Полученная величина называется
коэффициентом корреляции Пирсона
, который всегда находится в интервале от −1 до 1:
, где
— среднеквадратическое отклонение.
Соответственно,
.
Случайные величины, имеющие нулевую ковариацию, называются
некоррелированными
.
Независимые
случайные величины всегда некоррелированы. Обратное утверждение не всегда выполняется. Оно справедливо для нормально распределенных случайных величин.