Interested Article - Размещение патинко
- 2020-12-02
- 1
Размещение патинко ( англ. pachinko allocation , PAM ) — метод тематического моделирования , применяемый в машинном обучении и обработке естественного языка , позволяющий обнаружить скрытую тематическую структуру в коллекции документов . От более ранних методов (например, LDA ) алгоритм отличается тем, что моделирует корреляции между темами в дополнение к корреляциям слов, задающих темы. PAM превосходит LDA по гибкости и выразительной силе . Впервые метод описан, реализован и применён для обработки текстов на естественном языке, однако, может быть использован и в других областях, например, для задач биоинформатики . Своё название получил благодаря популярным в Японии игровым автоматам патинко , в которых реализована игра, напоминающая пинбол на доске Гальтона .
История
Впервые размещение патинко было описано Ли Вэем и Эндрю Маккаллумом в 2005 году . В 2007 году Ли, Маккаллумом и Дэвидом Мимно идея была обобщена до иерархического размещения патинко . В том же году Маккаллум и его коллеги предложили ввести в PAM непараметрическое байесовское распределение, основанное на модификации (HDP) . Алгоритм реализован в Java -библиотеке с открытым исходным кодом .
Модель
Для изображения порождающей модели строится ациклический орграф, в котором вершинами являются слова и темы, причём слова могут быть только листьями. Тогда «трёхуровневая» модель — это LDA , а «двухуровневая» модель — Дирихле-мультиномиальное распределение [ уточнить ] .
См. также
- Вероятностное латентное семантическое индексирование (PLSI) — тематическая модель, предложенная Томасом Хоффманом в 1999 году .
- Латентное размещение Дирихле — обобщение pLSI, предложенное Дэвидом Блеем, Эндрю Ыном и Майклом Джорданом в 2002 году .
Примечания
- Blei, David . Дата обращения: 4 октября 2012. Архивировано из 2 октября 2012 года.
- ↑ Li, Wei; Blei, David; McCallum, Andrew. (неопр.) . — 2007. 3 октября 2012 года.
- Li, Wei; McCallum, Andrew. (англ.) // Proceedings of the 23rd : journal. — 2006. 17 января 2012 года.
- Mimno, David; Li, Wei; McCallum, Andrew. (англ.) // Proceedings of the 24th : journal. — 2007. 20 июня 2013 года.
- Hofmann, Thomas. (неопр.) // Proceedings of the Twenty-Second Annual International SIGIR Conference on Research and Development in Information Retrieval. — 1999. 14 декабря 2010 года.
- Blei, David M.; Ng, Andrew Y.; Journal of Machine Learning Research : journal. — 2003. — January ( vol. 3 ). — P. pp. 993—1022 . — doi : . 1 мая 2012 года. ; Lafferty, John. (англ.) //
- 2020-12-02
- 1