Для свободной кроссплатформенной библиотеке компьютерного зрения CCV разработан новый классификатор изображений, обученный в свёрточной нейроной сети. Впервые классификатор такого уровня и модели (детектор лиц, детектор автомобилей, детектор пешеходов) выпущены под свободной лицензией.
Один из разработчиков CCV, китайский программист Лю Лю (Liu Liu) пишет, что за последние полтора года произошёл настоящий прорыв в алгоритмах глубокого обучения, а особенно — в области классификации изображений на основе свёрточных нейронных сетей. «Для библиотеки, рассчитанной на работу в самых современных реализациях, было бы обидно не реализовать грамотный классификатор изображений после более года прорывных исследований, опубликованных на эту тему», — говорит он. Тем более, что среди свободных библиотек есть совсем немного реализаций такого классификатора: Caffe, OverFeat и cuda-convnet, да к тому же все они под научными лицензиями. Разумеется, ситуацию нужно было исправлять.
В результате, Лю Лю потратил пять месяцев — и всё-таки сделал классификатор достойного качества ccv_convnet.c, который включён в комплект новой версии CCV 0.6.
Классификатор обучали на наборе данных ILSVRC 2010 из 1000 классов, с вероятностью ошибки top-1 36,83% и вероятностью ошибки top-5 16,25%, что близко к проприетарным классификаторам высшего класса (лучший в мире классификатор Clarifai показал на наборе ILSVRC 2013 вероятность ошибки top-5 11,19%).
Классифактор и сопутствующие модели опубликованы под международной лицензией Creative Commons Attribution 4.0.
Испытать классификатор в работе можно на сайте DoComputersDream.org и через RESTful-интерфейс.
Автор: alizar