О чём говорили на ICLR 2026? Репортаж AIRI о поездке на конференцию в Рио

Конференции в науке об ИИ очень любят и ждут. Подача работы на какое‑либо мероприятие из верхушки рейтинга CORE обычно престижнее, чем подача её же в журнал первого квартиля. В «большую тройку» главных конференций года принято включать NeurIPS, ICML и ICLR. Последняя обычно проходит раньше двух других — в этом году она прошла в конце апреля в Рио‑де‑Жанейро.

Мы посетили ICLR 2026 вместе с коллегами из AIRI и рассказываем, чем запомнилась нашим исследователям эта командировка.

Прошедшее мероприятие стало 14 событием в серии. ICLR, вообще, относитеьно молодая конференция, если сравнивать с её соседями по «тройке», которые стартовали ещё в 80-х годах. Такой успех связан с тем, что, начавшись как конференцию по выучиванию внутренних представлений данных (ICLR расшифровывается как International Conference on Learning Representations), серия быстро расширила спектр своих интересов на всё глубокое обучение. Список тем, которые покрывала прошедшая ICLR 2026, выглядит внушительно и, кажется, затрагивает вообще всё машинное обучение (а для тех, которые не затрагивает, стоит приписка non‑exhaustive).

Другой немаловажный фактор — география событий серии. В самом её начале мероприятия проходили преимущественно в США и Канаде, но с 2020 года организаторы начали отходить от этого правила, назначая местом проведения самые разные точки земного шара. Например, в 2023 году конференция прошла в Руанде — о том, как это было, можно узнать их хабра нашего коллеги Александра Коротина. В 2026 же серия впервые добралась до южноамериканского континента и осела в Рио‑де‑Жанейро.

Рост продолжается — на церемонии открытия оргкомитет поделился разной интересной статистикой. Так, в этом году число сабмитов приблизилось к рекордным 19 тысячам, из которых было принято чуть более 5 тысяч. Но при этом доля принятых статей практически не изменилась за прошедшие несколько лет и составляет чуть более 27 процентов.

Занятно, что число рецензентов, привлечённых к работе, даже превысило число статей:

Вопрос с рецензиями, к слову, в этом году весьма болезненный, поскольку в области сейчас кризис: всё больше статей и рецензий пишутся с помощью LLM, и в ML‑сообществе пытаются нащупать способ, как с этим жить. Организаторам ICLR 2026 пришлось массово проверять рецензии и статьи на наличие сгенерированного контента, выявлять галлюцинации вроде ссылок на несуществующие публикации и вводить новые правила, регулирующие использование ИИ в процессе создания научных статей. В конечном итоге программный комитет отклонил около 2% всех сабмитов.

Ситуацию усугубил инцидент на платформе OpenReview, который произошёл прошлой осенью. Из‑за ошибки в API сайта любой человек мог связать рецензию с аккаунтом, её написавшим. Оргкомитет ICLR выпустил сообщение, в котором пообещал санкции всем, кто будет использовать такую информацию для сведения счётов, но некоторые рецензенты всё же начали менять свои оценки, из‑за чего конференция временно заморозила такую возможность.

Но здесь, в стенах выставочного комплекса Риосентро, расположенного в районе Жакарапегуа, об этих проблемах вспоминать не хотелось — и организаторы приложили к этому все усилия. Гостей на открытии встречала атмосфера настоящего бразильского карнавала!

Всего конференция длилась пять дней: три дня на основной трек и два дня на воркшопы. Это не так много, как может показаться, учитывая, что, например, конференция AAAI 2026 при меньшем числе принятых статей длилась целых восемь дней. Из‑за этого ICLR 2026 оказалась очень насыщенной, а многие испытывали муки выбора из‑за того, что устные и постерные сессии шли в параллели.

Как уже отмечалось выше, охват тем ICLR 2026 невероятно широкий и одному человеку не под силу обозреть всё и сразу. Поэтому мы попросили наших коллег, работающих в разных направлениях, поделиться своими впечатлениями, отметить понравившиеся статьи и обозначить важные, на их взгляд, тренды.

Дарья Пугачёва

старший научный сотрудник команды «Обобщаемые системы ИИ»

На протяжении всего мероприятия меня не покидало ощущение, что в бытовом плане организаторы не рассчитали, сколько реально будет участников. Здание конференции располагалось в удалении от основной инфраструктуры, а единственным вариантом пообедать служил фудкорт из привозных вагончиков — в обеденные часы к ним выстраивались внушительные очереди. Неформальное мероприятие провели в саду, однако из‑за плоского рельефа происходящее на сцене было видно только стоящим в первых рядах; за едой и напитками — всё те же длинные очереди.

Постерная сессия вызвала смешанные чувства. С одной стороны — много пространства, свежий воздух, ощущение простора. С другой — ряды постеров располагались на расстоянии нескольких метров друг от друга, люди терялись в масштабе залов, а обойти их целиком было физически затруднительно.

Из положительного — само здание. Сочетание индустриального брутализма и природных мотивов: центральный дворик с пальмами и деревьями, зелёные лужайки, мирно прогуливающиеся птицы, прудик с водной растительностью, канал с мостиком и отдыхающими в нём цаплями. Всё это создавало красивую и умиротворяющую атмосферу, располагавшую к общению и нетворкингу.

Если говорить о том, что обсуждают больше всего в плане науки, то это, конечно же, агенты. Люди продолжают думать над тем, как лучше выстраивать инфраструктуру для их оценки и обучения. Простых сценариев в виде одношагового взаимодействия с пользователем явно недостаточно, поэтому появляются бенчмарки, которые всё больше вовлекают в оценку взаимодействие со средой или симуляцию такого взаимодействия. Уделяется внимание автоматизации проверки и генерации заданий, придумываются новые метрики оценки. По представленным работам можно выделить несколько устойчивых трендов.

Автоматическая генерация задач вместо ручной разметки. Одно из главных узких мест в развитии агентов — данные. Размечать тысячи многошаговых сценариев вручную дорого, медленно, а главное — аннотатор ограничен собственной фантазией и не покроет длинный хвост возможных ситуаций. Решение, которое набирает популярность, — это позволить агенту самому исследовать среду и порождать задания на основе обнаруженных состояний.

К примеру, в работе AUTOPLAY (Ramrakhya et al., Apple) агент «играет» с мобильными и десктопными интерфейсами, фиксирует достигнутые состояния и формулирует задачи в обратном направлении: от результата к инструкции. Таким способом авторам удалось сгенерировать порядка 20 тысяч задач, покрывающих сценарии, которые человек просто не придумает. Похожую философию (не подгонять агента под статичные данные, а дать ему учиться через взаимодействие) развивает работа “Don’t Just Fine-tune the Agent, Tune the Environment” (Lu et al.), где авторы предлагают сместить фокус с дообучения на фиксированных траекториях к динамическому exploration в настраиваемой среде. Вместо supervised fine‑tuning на записанных демонстрациях агент обучается через активное исследование, а сама среда адаптируется, чтобы создавать задачи нужной сложности и давать агенту более информативный сигнал.

Унификация сред и инфраструктуры обучения. Второй тренд — стандартизация. Существующие среды для обучения агентов фрагментированы: разные интерфейсы, несовместимые форматы наблюдений. Фреймворк GEM (Alibaba) делает для языковых агентов то же, что OpenAI Gym когда‑то сделал для классического RL — предлагает унифицированный интерфейс с набором из 24 сред, асинхронной генерацией опыта и поддержкой инструментов (Python‑интерпретатор, веб‑поиск, MCP).

Оценка работы агентов. Третий тренд — переосмысление метрик. Бинарное «решил / не решил» перестаёт устраивать сообщество. Бенчмарк VitaBench (Han et al.) оценивает агентов на задачах из реальных приложений, где нужно комбинировать взаимосвязанные инструменты и обрабатывать неоднозначные запросы. Важно, что оценивается не только финальный результат, но и качество промежуточных шагов на основе графа связей инструментов: насколько адекватно агент декомпозирует задачу, выбирает инструменты, обрабатывает ошибки. Это движение от pass/fail к нюансированной оценке процесса рассуждения — и оно перекликается с тем, как в обучении (GEM, AUTOPLAY) функция награды тоже становится более структурированной.

В совокупности эти работы рисуют цельную картину: сообщество системно выстраивает инфраструктуру агентного AI — от генерации данных через активное взаимодействие с окружением в унифицированных средах обучения до комплексных процессных бенчмарков.

Алексей Староверов

старший научный сотрудник команды «Воплощенные агенты»

Я бы отдельно отметил для себя награду test of time — её вручают авторам статей, которые оказали важное влияние на область «в долгую». В этом году среди таких работ были «Continuous Control with Deep RL» про DDPG и «Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks». Эти примеры хорошо показывают, что долгосрочная ценность исследования определяется не только результатом в момент публикации, но и тем, как работа меняет язык, инструменты и базовые представления области спустя годы.

Еще одним сильным впечатлением стали демонстрации роботов, которые обучались с применением RL в симуляторах и были успешно перенесены в реальность. Это хорошо отражает практический поворот робототехнического направления: важным становится не столько качество алгоритма в абстрактной постановке, сколько его возможность быть использованным в реальности. В этом контексте reinforcement learning в робототехнике выглядит особенно актуальным для масштабируемых сред, автономного сбора данных и переноса навыков.

Например, вот как обращается с мячом робот, привезённый Booster Robotics:

Как я уточнил у авторов, робот был обучен в IsaacSim с помощью PPO и вообще не использовал реальные демонстрации. На вход модели подавались joint space и координаты мяча, полученные с камеры через CV‑алгоритм. Благодаря тому, что стратегия не работает напрямую с изображением, она получается компактной и может запускаться onboard на самом роботе.

На воркшопах особенно заметными были темы Robotic Learning with Autonomous Data и Robotic World Models. Они показывали, что важная часть сообщества сейчас рассматривает роботов как системы, которые должны учиться более самостоятельно. Автономные данные здесь выглядят ключевым направлением: вместо того чтобы полностью полагаться на заранее собранные датасеты или ручную разметку, робот должен уметь получать опыт, выбирать полезные ситуации и улучшать поведение за счет взаимодействия со средой.

Тема Robotic World Models дополняет это направление: world models дают способ не только предсказывать динамику, но и строить более осмысленное внутреннее представление среды, целей и последствий действий. В контексте робототехники такой подход может быть основой для планирования, оценки поведения и более надежного goal conditioning. В совокупности у меня осталось ощущение, что будущее робототехники будет тесно связано с автономным опытом, симуляцией, world models и RL, который работает и в бенчмарках, и в более сложных embodied‑системах.

Самым важным личным и эмоциональным моментом конференции для меня стала встреча с Sergey Levine. Его лекция уже была одним из главных событий недели, но еще сильнее меня впечатлило то, что произошло после неё. Он остался и открыто, терпеливо и подробно отвечал на вопросы студентов.

Другое яркое впечатление не связано с ICLR 2026 напрямую — это концерт моей любимой группы The Weeknd, который прошёл в те же дни и на который я сумел попасть. Я нахожу забавным и красивым тот факт, что в этой поездке я встретился сразу с двумя своими кумирами: одним из научной области и одним из музыкальной.

Данил Сивцов

инженер-исследователь из команды «Вычислительный интеллект»

После поездки я сел разбирать приглянувшиеся мне статьи и выделил для себя четыре важных направления. Кратко расскажу, какие методы там были придуманы.

1 — Сжатие KV-кэша

Удаление неважных токенов:

LookaheadKV [https://arxiv.org/abs/2603.10899] — добавляет LoRA‑модули с обучаемыми «lookahead‑токенами», которые предсказывают важность каждого токена для будущего ответа. Удаление токенов во время prefill использует обученный сигнал, а не эвристики внимания.
ThinKV [https://arxiv.org/abs/2510.01290] — гибридная стратегия квантования и удаления на уровне ризонинга. Сжимает KV‑кэш, рассматривая chain‑of‑thought как последовательность отдельных мыслей с разной степенью важности. Важные мысли остаются в полной точности, менее важные квантуются, а наименее важные удаляются.

Offload:

FreeKV [https://arxiv.org/abs/2505.13109] — полный KV‑кэш хранится на CPU, а top‑k страницы подгружаются на GPU. Выбор предыдущего шага можно переиспользовать (query‑векторы соседних токенов близки) через speculative retrieval, с коррекцией при падении similarity.
IceCache [https://arxiv.org/abs/2604.10539] — полный KV‑кэш выгружается на CPU в M‑DCI индекс, Multi‑level Dynamic Continuous Indexing. Query‑вектор извлекает top‑k наиболее релевантных KV‑страниц обратно на GPU на каждом шаге декодирования.

2 — Разреженное внимание

QuoKA [https://arxiv.org/abs/2602.08722] — training‑free sparse attention для chunked prefill. Сохраняет Query с низким cosine similarity к среднему query, так как именно они сильнее всего влияют на логиты внимания, затем выбирает Keys, наиболее согласованные с ними. Даёт 3x сокращение TTFT и на 88% меньше KV‑пар на одну оценку attention.

3 — Спекулятивное декодирование

Group Tree Optimization [https://arxiv.org/abs/2509.22134] — в существующих подходах draft‑модель обычно обучают генерировать одну наиболее вероятную цепочку токенов, но во время декодирования проверяется не одна цепочка, а дерево возможных продолжений. Вводят Draft Tree Reward (ожидаемое число принятых токенов) и учат RL с таргетом, идейно выведенным из PPO.
Hierarchical Speculative Decoding (Overcoming Joint Intractability) [https://arxiv.org/abs/2601.05724] — lossless‑верификация: метод проверяет draft‑дерево иерархически, чтобы увеличить ожидаемое число принятых токенов, но при этом не исказить распределение target‑модели. Интеграция в EAGLE-3 даёт более 12% прироста эффективности.

4 — Повторное использование структуры reasoning

Retrieval‑of‑Thought [https://arxiv.org/abs/2509.21743] — сохраняет reasoning‑шаги из уже решённых задач в виде графа и переиспользует их для новых запросов. До 40% меньше output tokens, до 82% меньшую latency и до 59% меньшую стоимость без падения качества
Reasoning with Sampling [https://arxiv.org/abs/2510.14901] — показывает, что reasoning можно усиливать без RL дообучения: вместо обновления весов метод использует MCMC‑like power sampling, который итеративно улучшает ответы, опираясь только на likelihood самой base‑модели. Подход не требует дополнительного обучения или отдельного верификатора. На MATH500, HumanEval и GPQA он почти достигает или иногда превосходит RL‑posttraining/GRPO‑бейзлайны в single‑shot режиме.

Как видно из перечисленного, в основном идёт развитие в рамках существующих направлений (спекулятивный декодинг, оптимизация KV кешей, оптимизация квадратичного внимания). Из относительно новых идей — работы по переиспользованию структуры ризонинга.

Михаил Селезнёв

научный сотрудник из команды «Прикладное NLP»

Так как я занимаюсь темой безопасности AI‑систем, на ICLR 2026 искал в первую очередь статьи из этой области. Просмотрев более 45 постеров, могу выделить три главных направления работ: 1) демонстрация конкретных примеров небезопасности, 2) систематизация оценивания AI систем, 3) методы улучшения безопасности. Рассмотрим их чуть подробнее:

Демонстрация конкретных примеров небезопасности (в широком смысле). Всё не предугадать, но есть важные концептуальные примеры. Например, языковые модели способны на стратегический обман и нечестность. Иными словами, не всегда достаточно просто «спросить» модель, чтобы убедиться, что она поведёт себя желаемым образом (“Strategic Dishonesty Can Undermine AI Safety Evaluations of Frontier LLMs, Beyond Prompt-Induced Lies: Investigating LLM Deception on Benign Prompts”). Далее, часто проявляют неустойчивость агентские системы (“Agent Misalignment: Measuring the Propensity for Misaligned Behavior in LLM Agents, When Benign Inputs Lead to Severe Harms: Eliciting Unsafe Unintended Behaviors of Computer-Use Agents, Inherited Goal Drift: Contextual Pressure Can Undermine Agentic Goals”). Наконец, alignment (согласованность) моделей не всегда обобщается на демографические меньшинства (“The Selective Safety Trap: How LLM Scaling and Alignment Fails to Generalize Across Minority Demographics”). В целом, примеры находятся повсеместно. Стоит отметить повторяющийся паттерн: даже если языковая модель достаточно безопасна согласно типовым бенчмаркам, AI‑агент на её основе всё ещё может быть небезопасным, так как происходит значительный сдвиг распределения.
Систематизация оценивания AI‑систем. Тут предлагаются новые наборы данных (“TamperBench: Systematically Stress-Testing LLM Safety Under Fine-tuning and Tampering”), или, что даже важнее, методологии проведения оценок. Новые методологии могут быть лучше с точки зрения уменьшения шума и роли случайности (“Don’t Pass@K: A Bayesian Framework For Large Language Model Evaluation, On Randomness of Agentic Evals, Calibrated Predictive Lower Bounds on Time To Unsafe Sampling in LLMs”), или позволяют детектировать data contamination — случаи, где модель обучена на тестовых данных и за счёт этого получает завышенную оценку (“CoDeC: Detecting Data Contamination in LLMs via In-Context Learning”). Это растущий сегмент, в прошлые годы статей было заметно меньше. Он критичен, так как ненадёжные пайплайны оценки ведут к неверным выводам и неэффективной трате ресурсов и человеко‑часов.
Методы улучшения безопасности. Логично, что найдя и численно охарактеризовав примеры нежелательного поведения, люди ищут способы их убрать. Много работ, которые просто модифицируют процесс preference optimization (дообучения предпочтениям) или отфильтровывают небезопасные данные для обучения. Примечательно, что нередко используются техники механистической интерпретируемости (“Steering Language Models with Weight Arithmetic, Matched Data, Better Models: Target Aligned Data Filtering with Sparse Autoencoders, What’s In My Human Feedback? Learning Interpretable Descriptions of Preference Data”). Интересно также было увидеть, как переиспользовали идеи оценки новизны/неопределённости для уменьшения reward hacking (взлома награды) в обучении с подкреплением: “From Curiosity to Caution: Mitigating Reward Hacking for Best-of-N with Pessimism; Universal Value-Function Uncertainties”.

Проблему безопасности нельзя сформулировать конкретно и кратко, и единого изящного решения у неё нет. На практике модификации обучения, фильтрация данных, использование оценок неопределённости могут комбинироваться, но в статьях это чаще всего не изучается — ввиду сложности комбинированного решения и дороговизны/длительности экспериментов. Поэтому я люблю статьи, в которых предлагаются простые решения — из простых кирпичиков составить надёжный пайплайн значительно легче.

Поездка для исследователей нашего Института на ICLR 2026 вышла насыщенной и плодотворной. На основном треке мы представили 31 статью, полный их список можно посмотреть у нас в канале. На воркшопах было представлено 24 работы.

Очень здорово быть частью мировой науки об ИИ!

ссылка на оригинал статьи https://habr.com/ru/articles/1036752/