Krisp запускает ИИ-инструмент для преобразования акцента в реальном времени

от автора

Krisp, компания, наиболее известная своим приложением для шумоподавления, запускает новый инструмент на основе ИИ, который должен преобразовывать акцент говорящего в американский английский в режиме реального времени. Этот инструмент работает как виртуальный микрофон, изменяя звучание голоса в приложениях для видеоконференций, таких как Zoom, Microsoft Teams, Google Meet и Webex.

Krisp утверждает, что AI Accent Conversion может изменить чей-то акцент с задержкой в 200 мс, которую он называет «незаметной задержкой в разговоре», сохраняя при этом естественный голос говорящего. В демоверсии, которой поделилась компания, инструмент, похоже, неплохо справляется с тем, чтобы сделать чью-то речь похожей на американскую, но речь звучит немного роботизированно.

В настоящее время инструмент поддерживает более 17 индийских диалектов. Krisp заявляет, что в будущем планируется добавить другие английские акценты, например филиппинский.

Krisp впервые внедрила этот инструмент в агентствах колл-центров перед его более широким выпуском.

«Как человек с акцентом, я часто замечал, что людям трудно понять меня, даже когда я свободно владею английским», — говорит в пресс-релизе Арто Минасян, соучредитель и президент Krisp. «Дело не в предвзятости — это просто реальность общения. На быстро меняющихся совещаниях даже небольшие недоразумения могут замедлить принятие решений, вызвать повторения и снизить общую эффективность».

AI Accent Conversion запускается в бета-версии, и пользователи без подписки могут использовать его до 60 минут в день. Также есть бизнес-план за 15 долларов в месяц для неограниченного использования.

Krisp — не единственная компания, использующая ИИ для изменения чьего-либо акцента. Компания Teleperformance SE, занимающаяся колл-центрами, уже начала внедрять инструмент на базе ИИ, который «смягчает» акцент индийских работников, согласно Bloomberg. Но у ИИ сомнительная репутация, когда дело касается расы и этнической принадлежности, а генерация голоса с помощью ИИ сама по себе является риском.

Источник


ссылка на оригинал статьи https://habr.com/ru/articles/894842/