Помните Claude Mythos? Ту самую модель Anthropic, которая в апреле находила уязвимости во всех основных ОС и браузерах, хотя её даже не учили этому специально. Тогда компания просто отказалась её выпускать. Доступ дали только Apple, Google, Microsoft и ещё паре гигантов, чтобы те успели залатать собственные дыры
Так вот, вчера её выпустили. Называется Claude Fable 5
Это буквально та же модель, что и Mythos. Единственное отличие это «поводок»: вопросы по кибербезопасности и биологии автоматически уходят на старую Opus 4.8. Всё остальное — код, агенты, исследования работает на полную. Anthropic говорит, что ограничение срабатывает меньше чем в 5% сессий. То есть с вероятностью 95% вы общаетесь с тем самым «опасным» Mythos
Что заявляют:
-
Обгоняет Opus 4.8 больше чем на 10% на ряде бенчмарков. Opus 4.8, на минуточку, вышел месяц назад
-
Stripe говорит, что модель сделала миграцию большой Ruby-кодовой базы, на которую у команды ушло бы два месяца
-
Восстанавливает исходный код веб-приложения по скриншотам
-
Прошла Pokemon FireRed почти без обвязки, а предыдущие Claude не могли даже с подсказками
Главное: до 22 июня модель включена в подписки Pro, Max, Team и Enterprise без доплаты. Потом, судя по всему, появятся отдельные кредиты. Так что окно, чтобы погонять её на своих задачах бесплатно, меньше двух недель
Получается, год все спорили, рискнут ли лаборатории выпустить свои «самые страшные» модели. Рискнули. Просто надели намордник и понадеялись, что никто его не снимет — джейлбрейк, кстати, за 1000+ часов bug bounty так и не нашли
Уже попробовали? Делитесь впечатлениями в комментариях — особенно если нашли, где у «намордника» слабые места 🙂
ссылка на оригинал статьи https://habr.com/ru/articles/1045648/