По информации издания The Information, Google может представить свою версию концепции large action model (LAM), подобную той, что разрабатывает компания Rabbit, уже в декабре. Новый инструмент, который предположительно получил кодовое название «Project Jarvis», будет выполнять задачи для пользователей, такие как «сбор информации, покупка товара или бронирование авиабилета», сообщили три источника, знакомые с проектом.
«Project Jarvis» будет работать на основе будущей версии Google Gemini и использовать только веб-браузер Chrome. Инструмент нацелен на помощь пользователям в автоматизации повседневных веб-задач, выполняя такие действия, как анализ скриншотов, нажатие на кнопки или ввод текста. По данным The Information, в текущей версии выполнение каждого действия занимает «несколько секунд».
Google не единственная компания, разрабатывающая подобные инструменты. Microsoft работает над функцией Copilot Vision, которая позволит пользователям общаться с ИИ на открытых веб-страницах. Apple Intelligence, по слухам, также сможет воспринимать контент на экране и выполнять команды пользователя сразу в нескольких приложениях. Компания Anthropic недавно представила ИИ-модель, которая способна работать с компьютером за пользователя. Известно, что OpenAI также работает над подобной функцией.
The Information отмечает, что планы Google по демонстрации Jarvis в декабре могут измениться. Компания рассматривает возможность выпуска инструмента для ограниченного числа тестировщиков, чтобы найти и устранить ошибки перед более широким запуском.
ссылка на оригинал статьи https://habr.com/ru/articles/853846/
Добавить комментарий