Interested Article - Вероятностный классификатор

Вероятностный классификатор — классификатор , который способен предсказывать, если на входе заданы наблюдения, распределение вероятностей над множеством классов, а не только вывод наиболее подходящего класса, к которому наблюдения принадлежат. Вероятностные классификаторы обеспечивают классификацию, которая может быть полезна сама по себе или когда классификаторы собираются в ансамбли .

Типы классификации

Формально, «обычный» классификатор — это некоторое правило или функция , которая назначает наблюдению x класс меток ŷ :

{\hat {y}}=f(x)

Наблюдения берутся из некоторого множества X (например, множество всех документов , или множество всех изображений ), в то время класс меток образует конечное множество Y , определённое до тренировки классификатора.

Вероятностные классификаторы обобщают понятие классификаторов — вместо функций они являются условными вероятностями $\Pr(Y\vert X)$ , что значит, что для данного $x\in X$ классификатор назначает вероятности для всех $y\in Y$ (и сумма этих вероятностей равна единице). «Жёсткая» классификация может затем быть осуществлена с помощью правила принятия оптимальных решений .

{\hat {y}}=\operatorname {\arg \max } _{y}\Pr(Y=y\vert X)

то есть предсказанный класс — это класс с наибольшей вероятностью.

Бинарные вероятностные классификаторы называются в статистике также моделями. В эконометрике вероятностный классификатор в общем случае называется дискретным выбором .

Некоторые классификационные модели, такие как наивный байесовский классификатор, логистическая регрессия и многослойные перцептроны (когда они тренируются с подходящими функциями потерь ) естественным образом являются вероятностными. Другие модели, такие как методы опорных векторов , вероятностными не являются, но , превращающие их в вероятностные классификаторы.

Порождающая и условная тренировки

Некоторые модели, такие как модель логистической регрессии тренируются условно — они оптимизируют условную вероятность $\Pr(Y\vert X)$ непосредственно на тренировочном наборе ( минимизация эмпирического риска ). Другие классификаторы, такие как наивный байесовский классификатор, являются тренированными классификаторами — во время тренировки находятся условное по классам распределение $\Pr(X\vert Y)$ и априорный класс $\Pr(Y)$ , а условное распределение $\Pr(Y\vert X)$ получают с помощью байесовского правила .

Калибрация вероятности

Не все модели классификации естественным образом вероятностны, а те, которые вероятностны по своей природе, в частности, наивные байесовские классификаторы, деревья решений и методы бустинга , дают искажённые распределения вероятностей . В случае деревьев решений , когда Pr( y | x ) является пропорцией тренировочных выборок с меткой y в листе, которым x заканчивается, это искажение распределения возникает ввиду того, что обучающие алгоритмы, такие как C4.5 или деревья классификации и регрессии ( англ. Classification and regression trees , CART) в явном виде стремятся получить однородные листья (давая вероятности, близкие к нулю или единице, а потому сильное смещение ), в то время как для оценки пропорции используется лишь несколько экземпляров (высокая дисперсия ) .

Может быть определено масштабирование с помощью калибровочного графика (называемого также диаграммой надёжности ). Калибровочный график показывает пропорцию элементов в каждом классе для дорожек предсказанной вероятности или показателя (такого как искривлённое распределение вероятностей или «расстояния до гиперплоскости » (со знаком) в методе опорных векторов). Отклонения о тождественной функции указывают на плохо калиброванный классификатор, для которого предсказанные вероятности или показатели не могут быть использованы в качестве вероятностей. В этом случае можно использовать метод превращения этих показателей в должным образом класс вероятностей.

Для двоичного случая общим подходом является применение , который обучает модель логистической регрессии по показателям . Альтернативный метод с использованием обычно лучше метода Платта, если доступен достаточно большой набор тренировлчных данных .

В случае можно использовать сведение к двоичным задачам с последующей одномерной калибровкой по алгоритму, как описано выше, а потом применением алгоритма попарного объединения Гесте и Тибширани .

Вычисление вероятностной классификации

Обычно используемые функции потерь для вероятностной классификации — логистическая функция потерь и между предсказанным и истинным распределением вероятностей. Первая из этих функций обычно используется для тренировки логистических моделей.

Метод, используемый для назначения показателей парам предсказанных вероятностей и актуальных дискретных исходов, так что различные методы предсказания можно было бы сравнить, называется .

Примечания

, с. 348.
, с. 39–40.
, с. 43.
↑ .
, с. 609–616.
, с. 61–74.
, с. 694–699.
, с. 451–471.

Литература

Trevor Hastie, Robert Tibshirani, Jerome Friedman. . — 2009. от 26 января 2015 на Wayback Machine
- В 219 выйдет перевод книги «Основы статистического обучения: интеллектуальный анализ данных, логический вывод и прогнозирование», Тревор Хасти, Роберт Тибширани, Джером Фридман, издательство «ДИАЛЕКТИКА»
Christopher M. Pattern Recognition and Machine Learning. — Springer, 2006. — (Information Science and Statistic).
- Книга «Распознавание образов и машинное обучение», Кристофер М. Бишоп, будет издана издательством «ДИАЛЕКТИКА» в 2019
Alexandru Niculescu-Mizil, Rich Caruana. Predicting good probabilities with supervised learning // . — 2005. — ISBN 0-387-31073-8 . — doi : .
Bianca Zadrozny, Charles Elkan. Obtaining calibrated probability estimates from decision trees and naive Bayesian classifiers // . — San Francisco, CA: Morgan Kaufmann, 2001.
John Platt. // Advances in large margin classifiers. — 1999. — Т. 10 , вып. 3 .
Bianca Zadrozny, Charles Elkan. Transforming classifier scores into accurate multiclass probability estimates // . — 2002. — ISBN 1-58113-567-X . — doi : .
Trevor Hastie, Robert Tibshirani. Classification by pairwise coupling // . — 1998. — Т. 26 , вып. 2 . — doi : .

[_0cdc3fb7c8c92704-1] , с. 348.

[_4edabc7ebd9ea239-2] , с. 39–40.

[_c526fbac1160051b-3] , с. 43.

[_2a306d48294e1b22-4] .

[_1f28e712e3317c27-5] , с. 609–616.

[_02fb1e0c5750cdf1-6] , с. 61–74.

[_72062cfc9b59a073-7] , с. 694–699.

[_1f2b7dd25ee0d07a-8] , с. 451–471.

Машинное обучение и data mining
Задачи	Задача классификации Обучение без учителя Обучение с частичным привлечением учителя Регрессионный анализ AutoML Ассоциативные правила Выделение признаков Обучение признакам Обучение ранжированию Грамматический вывод Онлайновое обучение
Обучение с учителем	Метод k-ближайших соседей Наивный байесовский классификатор Дерево решений Метод опорных векторов Линейная регрессия Логистическая регрессия Перцептрон Ансамблевое обучение Бэггинг Бустинг Random forest Метод релевантных векторов
Кластерный анализ	Метод k-средних Метод нечёткой кластеризации Иерархическая кластеризация EM-алгоритм BIRCH CURE DBSCAN OPTICS Mean-shift
Снижение размерности	Факторный анализ Метод главных компонент CCA ICA LDA Неотрицательное матричное разложение t-SNE
Структурное прогнозирование	Графовая вероятностная модель Байесовская сеть Скрытая марковская модель
Выявление аномалий	Метод k-ближайших соседей Локальный уровень выброса
Графовые вероятностные модели	Байесовская сеть Марковская сеть Скрытая марковская модель
Нейронные сети	Ограниченная машина Больцмана Самоорганизующаяся карта Функция активации Сигмоида Softmax Радиально-базисная функция Метод обратного распространения ошибки Глубокое обучение Многослойный перцептрон Рекуррентная нейронная сеть Долгая краткосрочная память Управляемый рекуррентный блок Свёрточная нейронная сеть U-Net Автокодировщик
Обучение с подкреплением	Марковский процесс Уравнение Беллмана Жадный алгоритм Q-обучение
Теория	Теория Вапника — Червоненкиса Дилемма смещения–дисперсии Теория вычислительного обучения Минимизация эмпирического риска Оккамово обучение PAC learning Статистическая теория обучения
Журналы и конференции	JMLR

Interested Article - Вероятностный классификатор

Содержание

Типы классификации

Порождающая и условная тренировки

Калибрация вероятности

Вычисление вероятностной классификации

Примечания

Литература

Same as Вероятностный классификатор

Вероятностный алгоритм

Общероссийский классификатор объектов административно-территориального деления

Общероссийский классификатор территорий муниципальных образований

Классификатор

Общероссийский классификатор единиц измерения

Классификатор

Общероссийский классификатор территорий муниципальных образований

Классификатор административно-территориальных объектов

Общероссийский классификатор видов экономической деятельности

Классификатор объектов административно-территориального устройства Украины

Наивный байесовский классификатор

Классификатор адресов Российской Федерации

Общероссийский классификатор предприятий и организаций

Классификатор

Общероссийский классификатор профессий рабочих, должностей служащих и тарифных разрядов

Общероссийский классификатор продукции

Классификатор

The title for the last searches