
Популярная платформа синтеза речи ElevenLabs объявила о запуске раннего доступа к локальному деплою своих моделей. Это радикальный шаг для сервиса, который раньше работал исключительно в облаке: теперь инференс и обработка аудио смогут выполняться целиком внутри инфраструктуры клиента, не отправляя данные на внешние серверы. Разработчики представили сразу два варианта развертывания.
Версия On-Premise ориентирована на стандартные серверы с мощными GPU для высокопроизводительных задач. Вторая версия, On-Device, создана специально для edge-устройств и систем на базе NPU, ARM-чипов или бюджетных видеокарт, что открывает путь к внедрению качественного ИИ-голоса в гаджеты, автомобили и бытовую технику.
Обе версии поддерживают более чем 30 языков и предлагают гибкость в вопросах приватности. Лицензионная валидация и телеметрия сделаны опциональными, что позволяет использовать модели даже в полностью изолированных цифровых контурах (air-gapped), где безопасность данных является приоритетом. Кроме того, клиенты смогут тонко настраивать систему под специфические диалекты и редкие языки.
Официальный запуск намечен на первую половину 2026 года, но запись в лист ожидания открыта уже сейчас. Что касается экономики проекта, ElevenLabs переходит на индивидуальную тарификацию: стоимость будет складываться из цены лицензии и фактического объема использования. Это превращает технологию из облачного API в гибкий корпоративный инструмент для глубокой интеграции.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 300 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
ссылка на оригинал статьи https://habr.com/ru/articles/1025742/