Библиотека компьютерного зрения CCV 0.6 с новым классификатором изображений

от автора

Для свободной кроссплатформенной библиотеке компьютерного зрения CCV разработан новый классификатор изображений, обученный в свёрточной нейроной сети. Впервые классификатор такого уровня и модели (детектор лиц, детектор автомобилей, детектор пешеходов) выпущены под свободной лицензией.

Один из разработчиков CCV, китайский программист Лю Лю (静水铭室) пишет, что за последние полтора года произошёл настоящий прорыв в алгоритмах глубокого обучения, а особенно — в области классификации изображений на основе свёрточных нейронных сетей. «Для библиотеки, рассчитанной на работу в самых современных реализациях, было бы обидно не реализовать грамотный классификатор изображений после более года прорывных исследований, опубликованных на эту тему», — говорит он. Тем более, что среди свободных библиотек есть совсем немного реализаций такого классификатора: Caffe, OverFeat и cuda-convnet, да к тому же все они под научными лицензиями. Разумеется, ситуацию нужно было исправлять.

В результате, Лю Лю потратил пять месяцев — и всё-таки сделал классификатор достойного качества ccv_convnet.c, который включён в комплект новой версии CCV 0.6.

Классификатор обучали на наборе данных ILSVRC 2010 из 1000 классов, с вероятностью ошибки top-1 36,83% и вероятностью ошибки top-5 16,25%, что близко к проприетарным классификаторам высшего класса (лучший в мире классификатор Clarifai показал на наборе ILSVRC 2013 вероятность ошибки top-5 11,19%).

Классифактор и сопутствующие модели опубликованы под международной лицензией Creative Commons Attribution 4.0.

Испытать классификатор в работе можно на сайте DoComputersDream.org и через RESTful-интерфейс.

ссылка на оригинал статьи http://habrahabr.ru/post/217319/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *