Interested Article - Scikit-learn

scikit-learn (ранее известная, как scikits.learn , а также известная как sklearn ) — библиотека , предназначенная для машинного обучения , написанная на языке программирования Python и распространяемая в виде свободного программного обеспечения .

В её состав входят различные алгоритмы, в том числе предназначенные для задач классификации , регрессионного и кластерного анализа данных, включая метод опорных векторов , метод случайного леса , алгоритм усиления градиента, метод k-средних и DBSCAN . Библиотека была разработана для взаимодействия с численными и научными библиотеками языка программирования Python NumPy и SciPy .

Обзор

Проект scikit-learn первоначально был разработан под наименованием scikits.learn французским ученым в области данных в рамках программы Google Summer of Code . Наименование проекта происходит от его предназначения — "SciKit" (SciPy Toolkit (набор инструментов SciPy), разрабатываемое и распространяемое отдельно стороннее расширение для библиотеки SciPy .

Первоначальная кодовая база была позже переписана другими разработчиками. В 2010 году участники проекта Фабиан Педрегоса, Гаэль Вароко, Александр Грэмфор и Винсент Миш из Французского национального института исследований в информатике и автоматике расположенного на плато Сакле во Франции , взяли на себя руководство проектом и 1 Февраля 2010 года выпустили первую публичную версию библиотеки. В ноябре 2012 года библиотека scikit-learn, также как и библиотека , были охарактеризована как "хорошо поддерживаемая и популярная" scikit библиотека. В 2019 году библиотека scikit-learn стала одной из самых популярных библиотек машинного обучения на сайте GitHub .

Реализация

Библиотека scikit-learn в основном написана на языке программирования Python и широко использует библиотеку NumPy для высокопроизводительных операций линейной алгебры и работы с массивами.

Часть основных алгоритмов написана на языке программирования Cython для улучшения производительности. Метод опорных векторов реализован с помощью обертки написанной на Cython для библиотеки ; логистическая регрессия и линейная машина опорных векторов реализованы с помощью похожей обертки для библиотеки . Следует отметить, что в таких случаях, расширение подобных методов с помощью языка программирования Python может быть невозможно.

Библиотека scikit-learn хорошо взаимодействует со множеством других программных библиотек языка Python, например такими как Matplotlib и для визуализации данных, NumPy для векторизации массивов , Pandas для работы с объектами DataFrame, SciPy и прочими.

Хронология

Библиотека scikit-learn была изначально разработана Дэвидом Курнапо в качестве проекта в рамках программы Google Summer of Code в 2007 году. Позднее в этом же году, Мэтью Бручер присоединился к проекту и начал использовать его как часть своей научной работы. В 2010 году в проект был вовлечен Французский национальный институт исследований в области информатики и автоматики и в конце января 2010 года была выпущена первая публичная версия (v0.1 beta).

  • Август 2013 года. scikit-learn 0.14
  • Июль 2014 года. scikit-learn 0.15.0
  • Март 2015 года. scikit-learn 0.16.0
  • Ноябрь 2015 года. scikit-learn 0.17.0
  • Сентябрь 2016 года. scikit-learn 0.18.0
  • Июль 2017 года. scikit-learn 0.19.0
  • Сентябрь 2018 года. scikit-learn 0.20.0
  • Май 2019 года. scikit-learn 0.21.0
  • Декабрь 2019 года. scikit-learn 0.22.0
  • Май 2020 года. scikit-learn 0.23.0
  • Январь 2021 года. scikit-learn 0.24
  • Сентябрь 2021 года. scikit-learn 1.0
  • Декабрь 2022 года.  scikit-learn 1.2

Инструменты scikit-learn

Ссылки

  1. Fabian Pedregosa; Gaël Varoquaux; Alexandre Gramfort; Vincent Michel; Bertrand Thirion; Olivier Grisel; Mathieu Blondel; Peter Prettenhofer; Ron Weiss; Vincent Dubourg; Jake Vanderplas; Alexandre Passos; David Cournapeau; Matthieu Perrot; Édouard Duchesnay (2011). . Journal of Machine Learning Research . 12 : 2825—2830.
  2. . NumFOCUS. Дата обращения: 25 октября 2021. 4 июня 2023 года.
  3. Dreijer, Janto . Дата обращения: 3 февраля 2023. Архивировано из 7 ноября 2020 года.
  4. . scikit-learn.org . Дата обращения: 3 февраля 2023. 6 ноября 2020 года.
  5. Eli Bressert. . — O'Reilly, 2012. — P. 43.
  6. (амер. англ.) . The GitHub Blog . GitHub (24 января 2019). Дата обращения: 17 октября 2019. 7 ноября 2020 года.
  7. . scikit-learn.org . Дата обращения: 27 февраля 2017. 29 апреля 2017 года.
  8. . scikit-learn . Дата обращения: 6 ноября 2018. 3 февраля 2023 года.
  9. . scikit-learn . Дата обращения: 5 мая 2019. 3 февраля 2023 года.
  10. . scikit-learn . Дата обращения: 7 июня 2020. 3 февраля 2023 года.
  11. . scikit-learn . Дата обращения: 7 июня 2020. 3 февраля 2023 года.
  12. , Дата обращения: 8 февраля 2021
  13. , Дата обращения: 24 сентября 2021

Внешние ссылки

  • — официальный сайт Scikit-learn


Источник —

Same as Scikit-learn