Всё, что надо знать о медленной, но умной OpenAI Strawberry

от автора

OpenAI выпустили вчера свою долгожданную модель o1 (также известную как Strawberry), первую модель компании, способную к рассуждению.

Если пропустили, а вникать лень, то вот собрал со всех уголков основное:

  • Основная фишка — новые модели могут решать более сложные задачи в областях науки и программирования. Но им требуется больше времени на ответ. В ходе обучения они совершенствуют процесс размышления, пробуют различные стратегии и осознают свои ошибки.

  • Интересно, что разработчики говорят о том, что «мы стремимся к тому, чтобы будущие версии думали часами, днями и даже неделями». Звучит странно, вроде хочется ответ получить побыстрей, но тут логика такая, что чем дольше модель ворочает нейромозгами, тем ответ качественней. Сейчас o1 думает несколько секунд.

  • Первая «превью»-модель уже интегрирована в чат-бот ChatGPT и API.

  • Также выпущена облегченная модель o1-mini, ориентированная конкретно на программирование.

  • Сейчас новые модели доступны пользователям платных пакетов ChatGPT Plus и Team, но o1-mini планируется включить и в бесплатную версию чат-бота.

  • В неделю можно отправить 30 сообщений в старшую версию o1-preview, 50 сообщений в маленькую o1-mini.

  • Новая модель — не замена gpt-4o во всех задачах. Лучше использовать её, чтобы посчитать что-то или закодить — модель справляется с олимпиадными задачами по математике и программированию на уровне золотых медалистов международного тура. По физике в сложных тестовых заданиях, устойчивых к решению с использованием поисковика Google, она сравнима с PhD-level студентом.

  • Пока нет связи с интернетом, там она искать не умеет.

  • В preview-версии могут быть баги, полноценная модель уже есть, её тестируют и выкатят позднее.

  • Промпты для новой модели можно использовать простые — o1 всё понимает, нет необходимости в обширных объяснениях


ссылка на оригинал статьи https://habr.com/ru/articles/843180/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *