Интуитивно, если каждая мера измеряет распределение «грунта» по метрическому пространству
М
,
то расстояние Васерштейна измеряет минимальную
стоимость
преобразования одного распределения грунта в другое,
в простейшем случае предполагается,
что стоимость прямо пропорциональна количеству грунта и расстоянию, на которое его надо перетащить.
Название «метрика Васерштейна» было предложено
Добрушиным
в 1970 году,
в честь
(
англ.
), который рассматривал её в 1969 году.
Для
р
≥ 1, пусть
Р
p
(
М
) обозначает совокупность всех вероятностных мер
μ
на
M
с
конечным
p
-м моментом
:
то есть для некоторой (а значит и для любой) точки
х
0
в
М
, имеем
Тогда
p
-я метрика Васерштейна
W
р
(
μ
,
ν
) между двумя вероятностными мерами
μ
и
ν
в
Р
p
(
М
) определяется как
где Γ(
μ
,
ν
) обозначает совокупность всех мер по
M
×
M
с
маргинальными (частными) распределениями
μ
и
ν
для первого и второго параметров соответственно.
(Множество мер Γ(
μ
,
ν
) также называют совокупность всех спариваний
μ
с
ν
.)
Свойства
Сходимость в этой метрике
эквивалентна слабой сходимости мер плюс сходимость первого
p
-го момента.
Дуальное определение
W
1
является частным случаем теоремы двойственности
Канторовича
— Рубинштейна (1958): если
μ
и
ν
имеют
ограниченный
носитель, то
где супремум берётся по всем 1-
липшицевым
функциям
f
.
Для любого
p
≥ 1, метрическое пространство (
P
p
(
М
),
W
р
) является
сепарабельным
и
полным
, если (
М
,
d
) сепарабельно и полнo
.