Interested Article - CRISP-DM

CRISP-DM ( англ. Cross-Industry Standard Process for Data Mining ) — наиболее распространённая методология по исследованию данных .

Модель жизненного цикла исследования данных в методологии состоит из шести фаз, а стрелки обозначают наиболее важные и частые зависимости между фазами. Последовательность этих фаз строго не определена. Как правило в большинстве проектов приходится возвращаться к предыдущим этапам, а затем снова двигаться вперед .

Первая версия этой методологии была представлена на четвёртом по счёту мероприятии CRISP-DM SIG Workshop в Брюсселе в марте 1999 года , а пошаговая инструкция была опубликована годом позже .

Жизненный цикл исследования данных

Фазы цикла исследования данных:

  1. Понимание бизнес-целей ( Business Understanding )
  2. Начальное изучение данных ( Data Understanding )
  3. Подготовка данных ( Data Preparation )
  4. Моделирование ( Modeling )
  5. Оценка ( Evaluation )
  6. Внедрение ( Deployment )

Последовательность фаз не является строгой и перемещается вперед и назад между различными фазами, как это всегда требуется. Стрелки на диаграмме процесса указывают на наиболее важные и частые зависимости между фазами. Внешний круг на диаграмме символизирует циклический характер самого интеллектуального анализа данных. Процесс интеллектуального анализа данных продолжается после развертывания решения. Уроки, извлеченные в ходе процесса, могут вызвать новые, часто более целенаправленные бизнес-вопросы, а последующие процессы интеллектуального анализа данных извлекут пользу из опыта предыдущих.

Примечания

  1. Shearer C., The CRISP-DM model: the new blueprint for data mining , J Data Warehousing (2000); 5:13—22.
  2. www.kdnuggets.com. Дата обращения: 14 сентября 2016. 16 января 2017 года.
  3. . www.kdnuggets.com. Дата обращения: 14 сентября 2016. 8 февраля 2017 года.
  4. . www.kdnuggets.com. Дата обращения: 14 сентября 2016. 1 августа 2016 года.
  5. Óscar Marbán, Gonzalo Mariscal and Javier Segovia (2009); от 30 апреля 2013 на Wayback Machine . In Data Mining and Knowledge Discovery in Real Life Applications, Book edited by: Julio Ponce and Adem Karahoca, ISBN 978-3-902613-53-0 , pp. 438—453, February 2009, I-Tech, Vienna, Austria.
  6. Pete Chapman (1999); от 14 июля 2015 на Wayback Machine .
  7. Pete Chapman, Julian Clinton, Randy Kerber, Thomas Khabaza, Thomas Reinartz, Colin Shearer, and Rüdiger Wirth (2000); (недоступная ссылка) .

Ссылки

  • . Интуит.
Источник —

Same as CRISP-DM