Мы разрабатываем Eleven — сервис автоматического перевода речи в текст и плагин для Skype. Сервис связывается со Skype во время звонка, обрабатывает голосовой разговор и возвращает пользователю в текстовом виде в течение 5-7 секунд. Текстовый лог разбит на привычные блоки: ваши слова и слова вашего собеседника. Связь со Skype нужна для определения начала и конца разговора.
Идея распознавания речи не нова, и в мире ведётся интенсивная разработка сервисов по голосовому набору с весьма разнообразным функционалом. Наш же продукт предназначен для фрилансеров — разработчиков и дизайнеров — и направлен на повышения удобства в их работе.
Как это работает
Всё очень просто: режем ваш голос и отправляем на сервер по HTTP. Обратно получаем ответ и сохраняем его в облаке. Сам плагин подключается к Скайпу и отслеживает начало и окончание разговора. Но мы думаем, лучше один раз увидеть.
Почему мы делаем это
Неприятная ситуация:
— Работа требует изменений.
— А раньше нельзя было сказать?
— Я говорил.
— Пруф?
Фрилансеры часто сталкиваются с проблемой забытой задачи. После показа результата заказчику выясняется, что некоторые детали не точны. Дело в том, что неподготовленный человек может держать в памяти не более 3-4 пунктов. Мелочи со временем в памяти не удерживаются совсем. Eleven решает очень актуальную задачу — фиксирует факт переговоров.
Ах да. Засмотренный нами до дыр ролик, который мы показываем на всех презентациях, подаривший нам название.
www.youtube.com/embed/G2Y0oqZOyl0
ссылка на оригинал статьи http://habrahabr.ru/company/eleven/blog/200524/
Добавить комментарий