Проект Naptha: применение компьютерного зрения на всех изображениях в браузере

от автора

Naptha — очень полезное расширение для браузера Chrome, которое автоматически распознаёт текст на всех картинках, загружаемых из интернета. С помощью этого расширения можно редактировать текст на картинках, выделять, копировать и переводить его. Это незаменимое расширение для копирования текста с отсканированных документов, фотографий, постеров, диаграмм, графиков, скриншотов и даже комиксов.

Идея создания такого расширения родилась из комикса xkcd, в котором обыгрывались сайты, не позволяющие произвольно выделять текст на своих веб-страницах.

По иронии, сайт с комиксами xkcd тоже можно отнести к числу таких «нарушителей», потому что он не позволяет выделять текст внутри комиксов! Расширение Naptha исправляет этот недостаток.

Разработчики Naptha говорят, что используемый в расширении алгоритм Stroke Width Transform способы распознавать в качестве текста даже бессвязные загогулины. Эту особенность можно рассматривать в качестве бага или фичи.

Кстати, Naptha работает для любых файлов, в том числе картинок на HDD: нужно просто перетащить нужное изображение в окно браузера.

ссылка на оригинал статьи http://habrahabr.ru/post/220471/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *