Claude Mythos, Java 26 и пещерный человек с 16 000 звёзд на GitHub

от автора

Девятый выпуск еженедельных IT-новостей от OpenIDE. Неделя получилась немного легковатой по новостям, но кое-что интересное нашлось. Дайджест также доступен в формате видео.

Мила Йовович выпустила open-source ИИ-инструмент

Актриса в соавторстве с разработчиком и, судя по коммитам, Claude (куда же без него) собрала тулзу для долгосрочной памяти агентов. Суть: агент не забывает контекст из прошлых разговоров и не заставляет каждый раз заново всё объяснять. На SWE-benchmark инструмент набрал 100%.

Сам инструмент, как по мне не суть. Кому интересно можете поткать его самостоятельно. Интереснее прецедент: если раньше известные люди выпускали энергетики, чипсы и бургерные, то теперь — open-source репозитории! Первый такой кейс в сфере ИИ на моей памяти)

Anthropic показали Claude Mythos — и сразу сказали: в паблик не выпустят

На SWE-bench Pro Opus набирает 53,4%, Mythos — 77,8%. По меркам бенчмарков разрыв большой.

В публичный доступ модель не пойдёт. Вместо этого Anthropic создали консорциум Project Glowswing, куда вошли AWS, Google, Microsoft, Nvidia, Cisco, Apple. Официальный аргумент: модель слишком хорошо находит эксплойты в open-source инфраструктуре — даже без специальных знаний. Anthropic утверждают, что с помощью Mythos уже нашли десятки реальных багов в таких проектах, как FFmpeg и Linux. Корпорациям из консорциума выдали доступ именно с этой целью — проверить собственные системы и написать патчи.

Параллель напрашивается сама: в 2019 году OpenAI выпустили GPT-2 и сразу объявили, что полную версию публиковать не будут — слишком опасно. Потом опубликовали. Сейчас читать это заявление просто смешно) Вероятно, через несколько лет история с Mythos будет выглядеть так же.

Большая распаковка Java 26

На этой неделе выпустил большую статью про Java 26: взял реальный проект, обновил его, поигрался с новыми фичами на практике. Если ещё сидишь на Java 8 или 11 — самое время посмотреть, что поменялось. По традиции, статья также доступна в формате видео.

Инженер Google выбросил три месяца ИИ-кода и начал заново

Три месяца агенты писали dev-тулы под SQLite практически без контроля. В итоге инженер посмотрел на результат и выкинул всё — кодовую базу стало невозможно поддерживать. Потом переписал сам, уже в режиме парного программирования с агентом.

На самом деле, все эти истории от передовых западных лабараторий про команды агентов, которые самостоятельно строят production-ready решения, очень сильно расходятся с той реальностью, в которой я живу. Я не знаю ни одного человека, который смог бы «оседлать» команду из агентов, знаю единицы тех, кто пишет Skills и использует MCP, и кучу людей, которые до сих пор копируют/вставляюи код из бразуера в IDE.

И, кажется, моя реальность близка к реальности многих разработчиков:

CaveMan — самый простой способ экономить токены

Репозиторий с 16 000+ звёзд на GitHub: скилл для Claude Code, который заставляет агента отвечать как пещерный человек. Без артиклей, без вступлений, без «конечно, я помогу тебе исправить». По тестам из репозитория: вместо 69 токенов — 19 на конкретном примере.

Звучит как шутка, но механика понятна. Большинство токенов в ответах агента — вежливая вода, а не содержание. Убери воду — получишь то же самое, но дешевле. Автор добавил несколько уровней интенсивности, включая режим на китайском: иероглифическое письмо компактнее по токенам, чем латиница, и это давно известная история в области токенизации.

Кстати, я сам вчера упёрся в лимиты Claude Code прямо во время подготовки к материалу про Java 26. Так что тема актуальная. Но русского языка пока что нет.

State of Java — открылся опрос

JPoint и Joker запустили второй ежегодный State of Java — опрос про версии, фреймворки, инструменты, деплой и всё, что связано с Java-разработкой прямо сейчас.

В прошлом году Кирилл Толкачёв рассказывал о результатах на докладе, там были забавные случаи: разработчики выбирали технологии, которых не существует) В этом году добавили отдельный блок про AI-инструменты.

Уже сейчас OpenIDE позволяет разрабатывать проекты на Java, Spring, Python, Go, JavaScript и TypeScript! А поддержка Docker и 300+ плагинов доступны абсолютно бесплатно в маркетплейсе. Пробуйте российскую IDE в деле и подписывайтесь на нас в Telegram или Max, чтобы не пропустить свежие обновления и полезные материалы.

ссылка на оригинал статьи https://habr.com/ru/articles/1023450/