Мы очень подробно рассказывали про наш детектор голоса на Хабре тут и тут. Не вижу смысла повторяться, просто очень кратко опишу, что стало лучше:
-
В некоторых сценариях он стал до 2-3 раз быстрее. ONNX вообще отрабаытывает за ~200ns на 1 чанк. Скорость теперь измеряется уже наносекундах =);
-
Сильно выросло качество (в этот раз мы проилюстрировали это на публичных датасетах) и насколько мы знаем среди сопоставимых публичных решений (отсутствие какой-либо формы DRM, стриминг, скорость, очень малый чанк 30ms) аналогов нет;
-
Теперь ONNX модель также поддерживает аудио и в 8 kHz;
Вот как-то так, изменения огромные, но сказать больше особо и нечего.
ссылка на оригинал статьи https://habr.com/ru/post/695738/
Добавить комментарий