DeepSeek v4 на 1.6 трлн параметров, GPT-5.5 и Kimi K2.6, SpaceX собирается купить Cursor, пока ИИ-агенты нанимают людей

от автора

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Я Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя насыщенная: релиз GPT-5.5 и Kimi K2.6, новая и самая крупная модель от DeepSeek, а ещё открытый Qwen3.6-27B. Пока GPT Images 2.0 обгоняет Nano Banana, Илон Маск договорился о цене в $60 млрд за покупку Cursor, а Цукерберг начинает следить за каждым чихом сотрудников в Meta*.

Всё самое важное — в одном месте. Поехали!

* Признана экстремистской и запрещена в РФ

📋 В этом выпуске:

🧠 Модели и LLM

  • DeepSeek V4 Preview — крупнейшая открытая модель в мире прямо сейчас

  • GPT-5.5 — обновлённый флагман 

  • Qwen3.6-27B теперь с открытыми весами

  • Kimi K2.6 — может кодить по 12 часов без присмотра

🎨 Генеративные нейросети

  • ChatGPT Images 2.0: убийца Nano Banana 2?

🔧 AI-инструменты и платформы

  • Humwork: ИИ-агенты сами нанимают людей, когда заходят в тупик

  • OpenAI Privacy Filter — вырезает личные данные перед отправкой в ИИ

🧩 AI в обществе и исследованиях

  • SpaceX берёт опцион на Cursor за $60 млрд

  • Anthropic Project Deal: ИИ-агенты торгуются за настоящие вещи

  • Meta* пишет каждый клик сотрудников ради обучения агентов

  • В больницах Китая активно используют LLM и AI-консультации

🧠 Модели и LLM

❯ DeepSeek V4 Preview — крупнейшая открытая модель в мире прямо сейчас

DeepSeek выпустили серию V4. Код открытый, под лицензией MiT. В линейке две версии: 

  • V4-Pro на 1.6T параметров и 49B активных. Это крупнейшая открытая модель на сегодня;

  • V4-Flash на 284B и13B активных.

Обе модели заточены под агентные задачи и длинный контекст: 1M токенов на входе и 384K на выходе. При этом DeepSeek пишут, что сделали длинный контекст не только большим, но и дешёвым: в 4 раза меньше вычислений и в 10 раз меньше памяти по сравнению с V3.2.

Три режима размышления: быстрый без раздумий, глубокий анализ и максимальный — для сложных агентных сценариев. В максимальном режиме сохраняется всю историю рассуждений. 

По бенчам Pro дышит топам в спину: на Codeforces рейтинг 3206 — это 23-е место среди живых программистов мира. Первый раз open-source модель добралась до закрытого фронтира в соревновательном программировании.

Цены: Flash — $0.14/$0.28 за 1M токенов, Pro — $1.74/$3.48. 

Ещё один момент: V4 — первая серия DeepSeek, адаптированная под чипы Huawei Ascend. DeepSeek пишут, что пока версия урезана, полная форма будет позже.

🔗 Попробовать 🔗 Веса 🔗 Техрепорт 🔗 Анонс

❯ GPT-5.5: меньше токенов, больше самостоятельности

OpenAI выпустили GPT-5.5. Это первая полностью переобученная модель со времён GPT-4.5. До этого почти год дорабатывали существующую архитектуру. 

Главную ставку сделали на автономность. Модель сама планирует работу, выбирает инструменты и доводит многошаговые задачи до конца. 

На Terminal-Bench 2.0 лучший результат среди всех — 82.7%. Artificial Analysis поставили её на первое место в Intelligence Index.

Цена выросла в два раза по сравнению с GPT-5.4, до $5/$30 за миллион токенов. OpenAI говорят, что модель расходует токены экономнее: в Codex тот же результат достигается меньшим числом итераций.

Есть один нюанс. Модель самоуверенная: на бенчмарке AA-Omniscience, где модели отвечают без поиска и внешних инструментов, GPT-5.5 показала hallucination rate 86% — против 36% у Claude Opus 4.7. Так что не забывайте внимательно проверять ответы модели, если работаете без источников.

Сейчас доступна платным подписчикам ChatGPT и Codex. API — позже.

🔗 Анонс

❯ Qwen3.6-27B обогнал собственный флагман, который в 15 раз тяжелее

Alibaba выложила открытые веса Qwen3.6-27B. Модель мультимодальная, 27 млрд параметров, контекст 262K токенов.

В агентном кодинге обогнала большую Qwen3.5-397B-A17B, у которой 397 млрд параметров: SWE-bench Pro — 53.5 против 50.9, на Terminal-Bench 2.0 — 59.3 против 52.5. Но превосходствот только в кодинге и агентных задачах, а не по всем метрикам.

Запускается через vLLM, SGLang и Transformers. Есть облегчённый FP8-вариант. Также работает в Claude Code и OpenClaw через совместимый API.

🔗 Веса 🔗 FP8 🔗 Блог

❯ Kimi K2.6 пишет код 12 часов без присмотра

Moonshot AI выпустили Kimi K2.6. Открытая, MoE-архитектура: 1 триллион параметров, 32 млрд активных, контекст 256K.

Может кодить очень долго. Её тренировали на задачах, где нужно работать часами без участия человека. Два реальных кейса из техблога:

  • Оптимизация Qwen3.5-0.8B на Mac: K2.6 написала инференс-движок на Zig, прогнала 14 итераций, сделала 4 000+ вызовов инструментов за 12 часов — и разогнала throughput с 15 до 193 токенов/сек.

  • Рефакторинг биржевого движка: 13 часов, 12 стратегий оптимизации, 4 000+ изменённых строк кода. Прирост производительности — 185%.

Поддерживает рои до 300 субагентов и 4 000 скоординированных шагов — против 100 и 1 500 у прошлой K2.5. 

По бенчам лидирует в агентном кодинге: SWE-Bench Pro — 58.6, Terminal-Bench 2.0 — 66.7. 

🔗 Попробовать 🔗 Веса 🔗 Блог

🎨 Генеративные нейросети

❯ ChatGPT Images 2.0 обгоняет Nano Banana 2

OpenAI запустили ChatGPT Images 2.0. Модель уже доступна на всех планах, включая бесплатный. На запуске она удивила реалистичными скриншотами. Чтобы понять, что изображение сгенерировано, часто приходится прямо вглядываться в детали.

Два режима работы. 

  • Быстрый — генерирует картинку сразу по промпту, без раздумий. 

  • Рассуждающий — сначала анализирует запрос, набрасывает черновик, проверяет его компьютерным зрением и при необходимости исправляет. Доступен на платных тарифах.

Из заметных улучшений: поддержка произвольных соотношений сторон, разрешение до 2K через API, заметно лучше работа с текстом — мелкие шрифты, интерфейсы, инфографика. На Image Arena модель вырвалась в лидеры с отрывом больше 240 баллов от ближайшего конкурента.

Знания у Images 2.0 до декабря 2025 года, для более свежих запросов использует поиск. 

🔗 Анонс 🔗 Попробовать

🔧 AI-инструменты и платформы

❯ Humwork: ИИ-агенты сами нанимают людей

YC-стартап Humwork сделал маркетплейс, где агенты сами вызывают живого эксперта через MCP.

Если агент упёрся в баг или не может принять решение, то он стучится в Humwork. Система за 30 секунд подбирает специалиста и передаёт ему весь контекст: код, ошибки, историю попыток. Эксперт решает проблему, а агент продолжает работу.

В пуле больше 1 000 верифицированных специалистов в кодинге, дизайне, праве и финансах. По данным самой компании — 87% решённых задач. 

🔗 Сайт 🔗 YC 🔗 Видео-демо

❯ OpenAI Privacy Filter вырезает личные данные перед отправкой в ИИ

OpenAI открыли Privacy Filter — локальную модель, которая чистит текст от персональных данных до того, как он уходит в облачный ИИ.

Детектит 8 категорий: имена, адреса, почты, телефоны, даты, URL, номера счетов и секреты вроде API-ключей и паролей. Заменяет плейсхолдерами, и при необходимости разворачивает обратно. 

Контекстное окно 128K, работает локально на ноутбуке или даже в браузере.

Внутри — 1.5 млрд параметров, 50 млн активных, лицензия Apache 2.0. OpenAI предупреждает: это не гарантия анонимности.

🔗 Hugging Face 🔗 GitHub 🔗 Анонс

🧩 AI в обществе и исследованиях

❯ SpaceX берёт опцион на Cursor за $60 млрд

SpaceX договорилась с Cursor об опционе на покупку: до конца 2026 года Маск может выкупить компанию за $60 млрд.

SpaceX готовится к IPO, и закрывать сделку прямо сейчас невыгодно. Пока стороны уже работают вместе над «лучшим в мире ИИ для программирования» — с доступом к кластеру Colossus на ~1 млн H100.

Маска бесит, что Grok почти никто не использует для кодинга. Параллельно Cursor свернул переговоры о новом раунде на $2 млрд при оценке выше $50 млрд — видимо, $60 млрд выглядят убедительнее.

🔗 Reuters 🔗 AP News

❯ Anthropic отправила агентов на рынок — 186 сделок и 19 мячиков для пинг-понга

Anthropic провела эксперимент: 69 сотрудников дали своим Claude-агентам по $100 и отправили на внутреннюю барахолку в Slack. Люди не вмешивались: агенты сами размещали объявления, торговались и закрывали сделки.

За неделю прошло 186 сделок на $4 000. Один сотрудник разрешил Claude купить что-нибудь на своё усмотрение, и тот купил 19 мячиков для пинг-понга.

Но главное было скрыто. Anthropic тайно сравнивала Opus 4.5 и Haiku 4.5: одни участники не знали, что торгуются против более сильной модели. Opus продавал дороже, покупал дешевле и закрывал больше сделок. Но разницы никто не заметил.

🔗 Project Deal

❯ Meta пишет каждый клик сотрудников ради обучения агентов

Meta* запустила внутренний инструмент MCI — он собирает движения мыши, клики, нажатия клавиш и периодически делает скриншоты на рабочих компьютерах сотрудников в США. Всё это идёт в обучающие датасеты для ИИ-агентов. Отказаться нельзя.

Официально компания говорит: данные не будут использоваться для оценки эффективности, только для обучения. Трекинг ведётся на одобренных приложениях — Google, GitHub, Slack, LinkedIn. Сотрудники в EU под действие инструмента не попадают — там GDPR.

Неофициально — внутри компании это называют «дистопией» и спрашивают, как отказаться. Цукерберг публично заявляет, что ИИ позволит одному человеку делать работу целых команд.

🔗 Reuters 🔗 TechCrunch 🔗 BBC

❯ ИИ-больницы в Китае: восемь клиник тестируют AI-консультации

Университет Цинхуа запустил Agent Hospital — систему из 42 LLM-агентов по 21 специальности. На симулированных пациентах она показала 93% точности на медицинских тестах.

В марте 2026 в Хайнане открылась первая «супер AI-больница» с ИИ в центре полного цикла: от диагностики до наблюдения после лечения. 

Государство активно толкает ИИ в медицину. В Европе и США каждое внедрение проходит через многолетние согласования.

🔗 CGTN 🔗 Хабр 🔗 3DNews

❯ Тема выпуска: cлоны, код и 240 пикселей

23 апреля 2005 года мир еще не знал, что такое «подписка» и «колокольчик», пока Джавед Карим не выложил короткое видео из зоопарка. «Me at the zoo» стало фундаментом крупнейшей библиотеки знаний и развлечений в истории человечества. 

Это напоминает нам, что великие технологические империи часто начинаются с чего-то максимально простого и даже нелепого. 

Символично, что сегодня нейросети обучаются на миллиардах таких же «домашних» роликов, превращая коллективный опыт человечества в топливо для создания новых, полностью синтетических миров.

❯ Заключение

Это неделя открытых релизов. DeepSeek выкатил крупнейший open-weight флагман, Moonshot открыла кодера, который сам работает часами, а Qwen выпустила компактную модель, которая обходит собственного гиганта в кодинге. OpenAI тем временем сделала GPT-5.5 более самостоятельной, а заодно открыла инструмент для защиты персональных данных.

За пределами моделей всё интереснее: агенты Anthropic поторговались за реальные вещи, SpaceX взяла опцион на Cursor за $60 млрд, а Meta* начала писать каждый клик своих сотрудников. ИИ перестаёт быть просто инструментом — он торгуется, нанимает людей и обучается на нашей работе.

Граница между инструментом и участником событий стирается быстрее, чем мы успеваем к этому привыкнуть.

До встречи в следующем выпуске!

* Признана экстремистской и запрещена в РФ


Новости, обзоры продуктов и конкурсы от команды Timeweb.Cloud — в нашем Telegram-канале 

Перейти ↩

ссылка на оригинал статьи https://habr.com/ru/articles/1027908/