Interested Article - MNIST (база данных)

База данных MNIST (сокращение от «Modified National Institute of Standards and Technology» ) — объёмная база данных образцов рукописного написания цифр. База данных является стандартом, предложенным Национальным институтом стандартов и технологий США с целью калибрации и сопоставления методов распознавания изображений с помощью машинного обучения в первую очередь на основе нейронных сетей . Данные состоят из заранее подготовленных примеров изображений, на основе которых проводится обучение и тестирование систем . База данных была создана после переработки . Создатели базы данных NIST, в свою очередь, использовали набор образцов из Бюро переписи населения США , к которому были добавлены ещё тестовые образцы, написанные студентами американских университетов . Образцы из набора NIST были нормализированы, прошли сглаживание и приведены к серому полутоновому изображению размером 28x28 пикселей .

База данных MNIST содержит 60000 изображений для обучения и 10000 изображений для тестирования . Половина образцов для обучения и тестирования были взяты из набора NIST для обучения, а другая половина — из набора NIST для тестирования .

Производились многочисленные попытки достичь минимальной ошибки после обучения по базе данных MNIST, которые обсуждались в научной литературе. Рекордные результаты указывались в публикациях, посвящённых использованию свёрточных нейронных сетей , уровень ошибки был доведён до 0,23 % . Сами создатели базы данных предусмотрели несколько методов тестирования . В оригинальной работе указывается, что использование метода опорных векторов позволяет достичь уровня ошибки 0,8 % .

Качество результата и развитие подходов

В некоторых работах отмечают высокие результаты систем, построенных на ансамблях из нескольких нейронных сетей; при этом качество распознавания цифр для базы MNIST оказывается сравнимым с уровнем человека, а для других задач распознавания, в частности, для дорожных знаков — даже в два раза лучше .

На оригинальных страницах создателей отмечаются ошибки в 12 % при использовании простых линейных классификаторов без предварительной обработки .

В 2004 году система LIRA, использующая трёхслойный перцептрон Розенблатта , получила уровень ошибки 0,42 % .

Проводились исследование на обучении по системе MNIST с использованием случайных искажений. В качестве искажений вводились аффинные или упругие преобразования . Иногда такие системы достигали хороших показателей, в частности имеются публикации про уровень ошибки 0,39 % .

В 2011 был достигнут уровень ошибок 0,27 % при использовании нейронных сетей . В 2013 появились публикации о достижении ошибки 0,21 %, используя регуляризацию нейронных сетей (через разрывы соединений ) .

Позднее применение одиночной свёрточной нейронной сети позволило улучшить качество до уровня ошибки 0,31 % . Самый лучший результат на одиночной свёрточной нейронной сети показала система, полученная после 74 эпох обучения — 0,27 % . Однако ансамбль из пяти свёрточных нейронных сетей позволил добиться 0,21%-го уровня ошибок . В 2018 году исследователи, использующие Random Multimodel Deep Learning (RMDL), сообщили об ошибке в размере 0,18 процента, улучшив предыдущий наилучший результат: новый ансамбль, метод глубокого обучения для классификации .

Сопоставление систем

В таблице собраны примеры результатов машинного обучения в различных системах классификации изображений:

Тип Структура Искажения Предварительная обработка Ошибка (%)
Линейный классификатор Одноуровневый перцептрон Нет Нет 12
Линейный классификатор Попарный линейный классификатор Нет Выравнивание 7.6
Метод k ближайших соседей K-NN с нелинейной деформацией (P2DHMDM) Нет Shiftable edges 0.52
Обработка остатков на базе признаков Хаара Нет Признаки Хаара 0.87
Нелинейный классификатор 40 PCA + квадратичный классификатор Нет Нет 3.3
Метод опорных векторов Виртуальная система опорных векторов , deg-9 poly, 2-pixel jittered Нет Выравнивание 0.56
Нейронная сеть 2-уровневая сеть 784-800-10 Нет Нет 1.6
Нейронная сеть 2-уровневая сеть 784-800-10 Упругие деформации Нет 0.7
Глубокая нейронная сеть 6-уровневая сеть 784-2500-2000-1500-1000-500-10 Упругие деформации Нет 0.35
Свёрточная нейронная сеть 6-уровневая сеть 784-40-80-500-1000-2000-10 Нет Расширение данных для обучения 0.31
Свёрточная нейронная сеть 6-уровневая сеть 784-50-100-500-1000-10-10 Нет Расширение данных для обучения 0.27
Свёрточная нейронная сеть Ансамбль из 35 CNN-сетей, 1-20-P-40-P-150-10 Упругие деформации С нормализацией 0.23
Свёрточная нейронная сеть Ансамбль из 5 CNN-сетей, 6-уровней 784-50-100-500-1000-10-10 Нет Расширение данных для обучения 0.21
30 моделей случайного глубокого обучения (RDL) (10 CNN, 10 RNN и 10 DNN) Нет Нет 0.18

См. также

Примечания

  1. . Vision Systems Design . Дата обращения: 17 августа 2013. 21 сентября 2013 года.
  2. Gangaputra, Sachin . Дата обращения: 17 августа 2013. 21 сентября 2013 года.
  3. Qiao, Yu (2007). Дата обращения: 18 августа 2013. 11 февраля 2018 года.
  4. Platt, John C. (англ.) // Advances in Neural Information Processing Systems : journal. — 1999. — P. 557—563 . 4 марта 2016 года.
  5. LeCun, Yann . Дата обращения: 17 августа 2013. 7 апреля 2021 года.
  6. Kussul, Ernst; Tatiana Baidyk. Improved method of handwritten digit recognition tested on MNIST database (англ.) // Image and Vision Computing : journal. — 2004. — Vol. 22 , no. 12 . — P. 971—981 . — doi : .
  7. Zhang, Bin; Sargur N. Srihari. (англ.) // (англ.) : journal. — 2004. — Vol. 26 , no. 4 . — P. 525—528 . — doi : . — . 25 июля 2021 года.
  8. Cires¸an, Dan; Ueli Meier; Jürgen Schmidhuber. (англ.) // 2012 IEEE Conference on Computer Vision and Pattern Recognition : journal. — 2012. — P. 3642—3649 . — ISBN 978-1-4673-1228-8 . — doi : . — arXiv : . 17 октября 2016 года.
  9. LeCun, Yann; Léon Bottou; Yoshua Bengio; Patrick Haffner. (англ.) // Proceedings of the IEEE 86 : journal. — 1998. — Vol. 86 , no. 11 . — P. 2278—2324 . — doi : . 30 ноября 2016 года.
  10. Kussul, Ernst; Tatiana Baidyk. (англ.) // Image and Vision Computing : journal. — 2004. — Vol. 22 . — P. 971—981 . — doi : . 21 сентября 2013 года.
  11. Ranzato, Marc’Aurelio; Christopher Poultney; Sumit Chopra; Yann LeCun. (англ.) // Advances in Neural Information Processing Systems : journal. — 2006. — Vol. 19 . — P. 1137—1144 . 22 марта 2016 года.
  12. Ciresan, Dan Claudiu; Ueli Meier; Luca Maria Gambardella; Jürgen Schmidhuber. (англ.) // 2011 International Conference on Document Analysis and Recognition (ICDAR) : journal. — 2011. — P. 1135—1139 . — doi : . 22 февраля 2016 года.
  13. Wan, Li; Matthew Zeiler; Sixin Zhang; Yann LeCun; Rob Fergus (2013). Regularization of Neural Network using DropConnect . International Conference on Machine Learning(ICML).
  14. Romanuke, Vadim . Дата обращения: 16 ноября 2016. 16 ноября 2016 года.
  15. Romanuke, Vadim Дата обращения: 24 ноября 2016. 24 ноября 2016 года.
  16. Romanuke, Vadim Дата обращения: 24 ноября 2016. 24 ноября 2016 года.
  17. Romanuke, Vadim. (англ.) // Research Bulletin of NTUU “Kyiv Polytechnic Institute” : journal. — 2016. — Vol. 6 . — P. 29—34 . — doi : .
  18. Kowsari, Kamran; Heidarysafa, Mojtaba; Brown, Donald E.; Meimandi, Kiana Jafari; Barnes, Laura E. (3 мая 2018). Дата обращения: 10 мая 2018. 18 мая 2018 года.
  19. . Дата обращения: 11 декабря 2016. 7 апреля 2021 года.
  20. Keysers, Daniel; Thomas Deselaers; Christian Gollan; Hermann Ney. (неопр.) // EEE Transactions on Pattern Analysis and Machine Intelligence. — 2007. — August ( т. 29 , № 8 ). — С. 1422—1435 . 4 марта 2016 года.
  21. Kégl, Balázs; Róbert Busa-Fekete. (неопр.) // Proceedings of the 26th Annual International Conference on Machine Learning. — 2009. — С. 497—504 . 20 декабря 2016 года.
  22. DeCoste and Scholkopf, MLJ 2002
  23. Patrice Y. Simard; Dave Steinkraus; John C. Platt. (англ.) // Document Analysis and Recognition, 2003. Proceedings. Seventh International Conference on : journal. — IEEE, 2003. — doi : . 22 декабря 2015 года.
  24. Ciresan, Claudiu Dan; Dan, Ueli Meier, Luca Maria Gambardella, and Juergen Schmidhuber. Deep Big Simple Neural Nets Excel on Handwritten Digit Recognition (англ.) // Neural Computation : journal. — 2010. — December ( vol. 22 , no. 12 ). — doi : . — arXiv : .

Литература

Ссылки

  • — The home of the database
  • — A JavaScript implementation of a neural network for handwritten digit classification based on the MNIST database
Источник —

Same as MNIST (база данных)