Google продолжает расширять доступ к модели для генерации видео — Veo, теперь доступному для большего числа клиентов Google Cloud, пишет TechCrunch. Во вторник компания объявила о запуске приватного предпросмотра Veo для пользователей платформы Vertex AI, предназначенной для разработки искусственного интеллекта.
Выпущенный в апреле, Veo способен создавать видеоклипы в разрешении 1080p с изображениями животных, объектов и людей продолжительностью до шести секунд при частоте 24 или 30 кадров в секунду. Google отмечает, что Veo умеет воспроизводить различные визуальные и кинематографические стили, включая пейзажные съёмки и таймлапсы, а также вносить правки в уже созданные материалы. Кроме того, Veo поддерживает маскирование для изменений в конкретных областях видео и способен объединять фрагменты видео в более длительные проекты.
Уоррен Баркли, старший директор по управлению продуктом в Google Cloud, объяснил задержку с выпуском API: «С момента анонса Veo наши команды усовершенствовали и укрепили модель для корпоративных клиентов на Vertex AI». На сегодняшний день пользователи могут создавать видео в 720p с соотношением сторон 16:9 (альбомная) или 9:16 (портретная). Google планирует продолжать совершенствовать Veo, аналогично улучшению других моделей, таких как Gemini на Vertex AI.
Veo конкурирует с ведущими моделями генерации видео, такими как Sora от OpenAI, а также моделями от Adobe, Runway, Luma и Meta. Однако, как и все современные ИИ, Veo не безупречен. В видео, созданных Veo, объекты могут появляться и исчезать без объяснений, а физические аспекты часто искажаются, например, автомобили могут необъяснимо резко развернуться задом наперёд.
Veo обучался на большом количестве видеоматериалов, что является стандартной практикой для генеративных моделей ИИ. Google не раскрывает точные источники данных, но утверждает, что Veo «возможно» обучался на «некотором» контенте YouTube в соответствии с соглашениями с создателями платформы. Компания также подчёркивает, что обучение моделей проводится на общедоступных источниках данных, что, по её мнению, подпадает под понятие «добросовестного использования».
Google постепенно интегрирует Veo в большее число своих приложений и сервисов. В мае Veo был представлен в Google Labs для тестовой группы, а в сентябре — интегрирован с YouTube Shorts, позволяя создателям генерировать фоны и шестисекундные видеоклипы. Однако конкуренты, такие как Runway и OpenAI, активно привлекают продюсеров и креативные агентства своими инструментами, что создаёт давление на Google в области генеративного ИИ.
Чтобы не пропустить анонс новых материалов подпишитесь на «Голос Технократии» — мы регулярно рассказываем о новостях про AI, LLM и RAG, а также делимся полезными мастридами и актуальными событиями.
ссылка на оригинал статьи https://habr.com/ru/articles/863506/
Добавить комментарий