Opus 4.7, Codex управляет ПК, TTS от Google, бренд кроссовок «переобулся» в ИИ-компанию

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя вышла плотной: Anthropic выкатила Opus 4.7 и Claude Design, OpenAI прокачала Codex до компьютерного агента. Открытые TTS от Google и генератор картинок от Baidu. Бренд кроссовок теперь ИИ-компания, а ИИ-кавер «Седой ночи» от Канье топ-2 Shazam.

Всё самое важное — в одном месте. Поехали!

📋 В этом выпуске:

🧠 Модели и LLM

Claude Opus 4.7 — новый флагман Anthropic
Открытая Qwen 3.6 35B-A3B

🎨 Генеративные нейросети

Gemini 3.1 Flash TTS — 70+ языков, аудио-теги прямо в тексте, есть бесплатный тир
ERNIE Image от Baidu — открытый генератор картинок, запускается на 24 ГБ
Взлом SynthID — исследователь убрал водяной знак Google с точностью 91%

🔧 AI-инструменты и платформы

Бесплатное приложение Gemini для macOS
Codex от OpenAI теперь управляет вашим ПК
Claude Design — инструмент для прототипов, презентаций и макетов

🧩 AI в обществе и исследованиях

Разработчик заставил OpenClaw писать доносы про уклонение от налогов
Allbirds: бренд кроссовок продал обувь за $39 млн и купил GPU на $50 млн
«Седая ночь» от ИИ-Канье: топ-2 глобального Shazam
Биксонимания — девушка придумала болезнь, в которую поверили нейросети

🧠 Модели и LLM

❯ Claude Opus 4.7 — новый флагман Anthropic

Anthropic выпустили Claude Opus 4.7 — самую сильную из публично доступных моделей компании. Модель прокачали в тяжёлых задачах: длинные кодовые пайплайны, сложные многошаговые цепочки, агентная работа.

По SWE-bench Pro результат вырос с 53,4% до 64,3% относительно Opus 4.6. Ранние тестеры отмечают, что теперь можно делегировать задачи, которые раньше требовали постоянного надзора, потому что модель стала валидировать ответы перед отправкой.

Что ещё изменилось:

Vision. Модель теперь видит изображения втрое чётче — до 3,75 МП. Скриншоты, схемы, плотные таблицы — всё это агенты теперь читают без потерь.
Новый уровень рассуждений xhigh. Добавили ступень между high и max — для задач, которым нужно думать подольше. В Claude Code он теперь стоит по умолчанию.
Task Budgets (бета). Ограничитель токенов на одну задачу — чтобы модель не уходила в бесконечный цикл на простом запросе.
Память. Лучше держит контекст в длинных многосессионных сценариях.

Цена API та же — $5 / $25 за миллион токенов. Есть нюанс: новый токенизатор на том же тексте может тратить до 35% больше токенов.

Ещё одно предупреждение от Anthropic: модель интерпретирует инструкции буквально. Промпты, заточенные под 4.6, могут давать неожиданный результат.

🔗 Официальный анонс 🔗 Попробовать в Claude

❯ Qwen 3.6 35B-A3B — открытая MoE от Alibaba

Alibaba выпустила Qwen 3.6 35B-A3B — MoE-модель с 35 млрд параметров, из которых на каждый токен активируются только и 3 млрд. За счёт этого она быстрее и дешевле других моделей сопоставимого размера.

В коде обходит Qwen 3.5 27B dense, особенно заметен прирост в агентном кодинге и рассуждении. Модель видит картинки и работает с ними. На ряде vision-тестов результаты сопоставимы с Claude Sonnet 4.5 или выше.

Веса открытые, лицензия Apache 2.0, контекст 262k токенов. Unsloth уже сделали GGUF — в 4-битном режиме запускается локально на 23 ГБ ОЗУ и Mac.

🔗 Блог Qwen 🔗 Веса на Hugging Face 🔗 GGUF от Unsloth 🔗 Версия без цензуры

🎨 Генеративные нейросети

❯ Gemini 3.1 Flash TTS — новая TTS от Google

Google выпустили Gemini 3.1 Flash TTS. Главная фишка — audio tags прямо в тексте: пишете [cough] или [whispers], и модель вставляет кашель или переходит на шёпот. Всего 200+ таких тегов. Они только на английском, но работают, даже если сам текст на другом языке.

Поддерживает 70+ языков, 30 готовых голосов. Google позиционируют модель для аудиокниг, подкастов и голосовых агентов. Всё автоматом маркируется SynthID-водяным знаком.

Доступна в превью через Google AI Studio и Vertex AI. В AI Studio можно тестировать бесплатно.

🔗 Блог Google 🔗 Google Cloud — гайд по промптингу 🔗 Попробовать в AI Studio

❯ ERNIE Image от Baidu — открытый генератор картинок

Baidu открыли ERNIE Image — генератор картинок на 8B параметров. Архитектура проще, чем у Flux: текст и изображение обрабатываются в одном трансформере сразу, без параллельных веток.

Главная сильная сторона — рендеринг текста внутри картинки: постеры, UI, сторибординг, многоязычные подписи.

В комплекте идёт Prompt Enhancer — лёгкая модель, которая разворачивает короткий промпт в подробное описание. Можно запускать и без неё. Есть Turbo-версия на 8 шагов, на H200 генерирует за 11 секунд.

Запускается на 24 ГБ VRAM, веса под лицензией Apache 2.0.

🔗 Блогпост Baidu 🔗 Веса на Hugging Face 🔗 Код на GitHub 🔗 Демо

❯ Взлом водяного знака SynthID

Исследователь Алош Денни опубликовал reverse-SynthID — открытый проект для удаления водяного знака SynthID из изображений Gemini.

SynthID — невидимая метка Google в ИИ-генерациях, которая не видна глазу. Именно её ищут детекторы.

Всё просто: он взял прогнал чёрные и белые фоны через модель, вытащил шаблон скрытого шума и упаковал в словарь. Дальше этот словарь вычитается из нужной картинки. По заявленным метрикам визуальное качество почти не страдает.

Оговорка: шаблон зависит от разрешения, под каждое нужен свой профиль. Автор уже зовёт комьюнити пополнять базу пулл-реквестами.

Сам факт публикации бьёт по идее, что водяные знаки надёжно отделяют ИИ-контент.

🔗 GitHub — reverse-SynthID 🔗 GitHub — reverse-SynthID-text

🔧 AI-инструменты и платформы

❯ Бесплатное приложение Gemini для macOS

Google выпустили нативное приложение Gemini для macOS. Работает на macOS 15 Sequoia и выше, бесплатно.

Вызывается через Option + Space поверх любого окна. ИИ-ассистент умеет анализировать ваш экран. Вы можете прямо во время работы открыть чат, показать сложную таблицу и попросить составить формулу. Или спросить, как вырезать фон в открытом Photoshop.

🔗 Блог Google 🔗 Скачать Gemini для Mac

❯ Codex от OpenAI теперь управляет компьютером

OpenAI выкатили крупное обновление Codex. Главный апгрейд — computer use: агент видит экран, двигает курсор и работает через GUI. Несколько агентов могут работать параллельно, не отбирая фокус у пользователя.

Что ещё появилось:

Встроенный браузер: комментарии прямо на элементах страницы, точечные инструкции агенту. Пока для localhost, полноценный веб обещают позже.
Генерация картинок через gpt-image-1.5 прямо внутри воркфлоу.
90+ плагинов: Jira, GitLab, Microsoft 365, Notion, Slack и другие.
Память запоминает предпочтения и контекст между сессиями.
Автоматизации по расписанию: агент сам просыпается, подтягивает контекст и собирает список задач на день.

Computer use пока только на macOS. Память и персонализация для пользователей из EU и UK появятся позже.

🔗 Официальный анонс

❯ Claude Design — инструмент для прототипов и макетов

Anthropic выпустили Claude Design на базе Opus 4.7. Генерирует прототипы интерфейсов, лендинги, презентации и маркетинговые материалы.

Механика чуть отличается от привычных генераторов: сначала заполняете анкету: жанр, экраны, настроение, палитра. Только после получаете 4 варианта черновиков на выбор. Дальше дорабатываете через инлайн-правки и слайдеры.

Инструмент читает дизайн-файлы компании и автоматически применяет дизайн-систему к новым проектам. Готовый результат экспортируется одним кликом в Canva, PDF, PPTX, HTML.

Доступно в research preview для подписчиков Pro, Max, Team и Enterprise. Для Enterprise по умолчанию выключено — включает администратор.

Акции Figma упали на 7,5% сразу после анонса.

🔗 Официальный анонс 🔗 Попробовать

🧩 AI в обществе и исследованиях

❯ Разработчик сделал из OpenClaw доносчика

Чел настроил OpenClaw-агента на очень необычную задачу: мониторить соцсети и собирать посты, где люди хвастаются неуплатой налогов с крипты, ставок или наличных — и автоматически отправлять их в IRS Whistleblower Office.

IRS платит информаторам 15–30% от взысканных сумм. Автор рассчитывает заработать $500 тысяч в год и уже якобы отправил 4 250 репортов.

Сработает ли схема — вопрос. Программа IRS квалифицирует кейс только если сумма спора превышает $2 млн, а информация «специфична и достоверна». Данные из публичных постов исторически не проходят этот порог. Налоговые юристы уже разобрали кейс и говорят прямо: «нашёл твит — получил 30%» так не работает.

🔗 Пост 🔗 IRS

❯ Allbirds продала кроссовки и купила GPU

Allbirds — обувная компания, которую на IPO в 2021 году оценивали в $4 млрд. Она договорилась продать все активы и название American Exchange Group за $39 млн. Это примерно 1% от пика.

Публично компания остаётся на бирже и переименовывается в NewBird AI. Но уже с новым планом: взять $50 млн конвертируемого финансирования и стать провайдером GPU-as-a-Service, то есть закупить железо и сдавать его в аренду стартапам.

На новости акции в моменте подскочили более чем в шесть раз за день. Аналитики называют это классическим AI-хайп сценарием: у команды нет опыта в облачной инфраструктуре, стратегии пока нет, а сделка ещё ждёт одобрения акционеров и закрытия в Q2 2026.

Получается, переобулись.

🔗 Reuters 🔗 Fortune 🔗 CNN

❯ ИИ-кавер «Седой ночи» с голосом Канье — топ-1 мирового Shazam

Турагент из Ижевска сделал ИИ-кавер «Седой ночи» с синтетическим голосом Канье Уэста. По его словам, на всё ушло три минуты. Видео со склейкой из концертных кадров набрало 6 млн просмотров и разлетелось по соцсетям.

Трек Silver Night залетел на первое место глобального чарта Shazam Top 200.

Но дальше интереснее. На стриминги трек появился уже под именем Bad Style & Tender May — без указания автора и без денег ему. Создатель публично обвинил в перезаливе бывшего продюсера «Ласкового мая» Андрея Разина. Тот в Instagram подтвердил причастность к релизу.

Теперь вокруг трека, который «никто не пел», идёт спор о правах и роялти.

🔗 Shazam Global Top 200

❯ Биксонимания — болезнь, которой не существует

Шведская исследовательница из Гётеборгского университета придумала несуществующую болезнь биксониманию — якобы розовение век от долгого сидения за экраном. Загрузила фейковые препринты на научные площадки и стала ждать.

Чтобы проверить, насколько внимательно LLM читают источники, в статьях оставили кучу подсказок: в благодарностях значилась «Академия Звёздного флота на борту Энтерпрайза», спонсором — «Фонд Сайдшоу Боба по части продвинутого мошенничества», а в тексте прямо написали «Вся статья выдумана».

Не помогло. Copilot назвал биксониманию «редким и интригующим состоянием». Gemini выдавал советы по лечению и отправлял к офтальмологу. Perplexity сгенерировал статистику из воздуха: болезнь поражает 1 из 90 000 человек. ChatGPT тоже не устоял.

Но главное не это. Индийские авторы опубликовали в рецензируемом журнале Cureus статью, где процитировали фейковый препринт как реальный источник. Публикацию потом отозвали — но факт остался: выдуманный диагноз успел пройти через цепочку научного цитирования.

🔗 Nature

❯ Тема недели: синий экран смерти

20 апреля 1998 года на выставке COMDEX во время презентации Windows 98 Билл Гейтс и его помощник Крис Капоссела попытались продемонстрировать технологию Plug and Play. При подключении сканера система моментально вылетела в BSOD (Синий экран смерти) на глазах у огромной толпы.

Это самый честный момент в истории Microsoft. «Наверное, поэтому мы пока не выпускаем Windows 98» — такая реакция была у Гейтса, и она стала эталоном антикризисного пиара, а сам BSOD — главным визуальным кодом эпохи.

❯ Заключение

На этой неделе главный инфоповод — Anthropic: новый флагман Opus 4.7 и сразу отдельный продукт для дизайнеров. OpenAI ответили апгрейдом Codex до полноценного компьютерного агента. Google и Alibaba открыли новые модели для голоса и картинок.

Но интереснее смотреть на периферию. Производитель кроссовок меняет GPU на обувь и взлетает на 600%. Турагент из Ижевска делает мировой хит за три минуты. Выдуманная болезнь просачивается в рецензируемый журнал. ИИ-агент превращается в доносчика.

Инструменты становятся мощнее, но самые показательные истории недели — не про бенчмарки. Они про то, что происходит, когда эти инструменты попадают в руки обычных людей.

До встречи в следующем выпуске!

Новости, обзоры продуктов и конкурсы от команды Timeweb.Cloud — в нашем Telegram-канале ↩

ссылка на оригинал статьи https://habr.com/ru/articles/1025062/