Interested Article - Размерность Вапника — Червоненкиса

Размерность Вапника — Червоненкиса или VC-размерность — это характеристика семейства алгоритмов для решения задачи классификации с двумя классами, характеризующая сложность или ёмкость этого семейства. Это одно из ключевых понятий в теории Вапника-Червоненкиса о статистическом машинном обучении, названное в честь Владимира Вапника и Алексея Червоненкиса .

Сами Вапник и Червоненкис предпочитают называть эту величину комбинаторной размерностью , так как выяснилось, она была известна алгебраистам еще до открытия их теории машинного обучения .

Определение

Пусть задано множество X {\displaystyle X} и некоторое семейство индикаторных функций (алгоритмов классификации, решающих правил) F = { f ( x , α ) } {\displaystyle {\mathcal {F}}=\{f(x,\alpha)\}} , где x X {\displaystyle x\in X} — аргумент функций, α {\displaystyle \alpha } — вектор параметров, задающий функцию. Каждая такая функция f ( x , α ) {\displaystyle f(x,\alpha)} сопоставляет каждому элементу множества X {\displaystyle X} один из двух заданных классов. VC-размерностью семейства F {\displaystyle {\mathcal {F}}} называется наибольшее число h {\displaystyle h} , такое, что существует подмножество из h {\displaystyle h} элементов множества X {\displaystyle X} , которые функции из F {\displaystyle {\mathcal {F}}} могут разбить на два класса всеми возможными способами. Если же такие подмножества существуют для сколь угодно большого h {\displaystyle h} , то VC-размерность полагается равной бесконечности.

VC-размерность можно обобщить и на случай семейства функций { g ( x , α ) } {\displaystyle \{g(x,\alpha)\}} , принимающих действительные значения. Его VC-размерность определяется как VC-размерность семейства индикаторных функций { I ( g ( x , α ) > β ) } {\displaystyle \{I(g(x,\alpha)>\beta)\}} , где β {\displaystyle \beta } пробегает область значений функций g {\displaystyle g} .

Примеры

Как пример, рассмотрим задачу о разбиении точек на плоскости на два класса прямой линией — это так называемый линейный классификатор . Множество из любых трёх точек, не лежащих на одной прямой, может быть разделено прямой линией на два класса всеми возможными способами ( 2 3 = 8 {\displaystyle 2^{3}=8} способами, на рисунке ниже показаны три из них), но множества из четырёх и более точек — уже нет. Поэтому VC-размерность линейного классификатора на плоскости равна трём.

Примеры разделения трёх
точек на два класса
Разделение невозможно
для этих четырёх точек

В общем случае, VC-размерность линейных классификаторов в n {\displaystyle n} -мерном пространстве равна n + 1 {\displaystyle n+1} .

См. также

Ссылки

Примечания

  1. Hastie, T., Tibshirani R., Friedman J. Chapter 7.9. Vapnik–Chervonenkis Dimension // . — 2nd ed. — Springer-Verlag, 2009. — 746 p. — ISBN 978-0-387-84857-0 . .

Same as Размерность Вапника — Червоненкиса