Sakana AI представила Sheaf-ADMM: новый взгляд на координацию агентов через призму топологии

от автора

На конференции ICML 2026 в Сеуле Sakana AI покажет сразу 11 работ. Одна из самых необычных — Sheaf-ADMM, где авторы предлагают взглянуть на координацию агентов иначе, объединив распределённую оптимизацию и алгебраическую топологию.

В чём идея?

Вместо монолитной нейросети авторы рассматривают интеллект как распределённую систему. Сложная задача разбивается на перекрывающиеся локальные подзадачи — каждый агент видит лишь свой фрагмент и не может решить задачу в одиночку.

Агенты действуют через итеративный процесс, вдохновлённый ADMM (Alternating Direction Method of Multipliers):

  1. Локальное решение — агент предлагает решение для своей части.

  2. Согласование с соседями — агенты обмениваются информацией и сглаживают противоречия на пересекающихся границах.

  3. Накопление «обид» — если согласия нет, конфликт запоминается (через двойственные переменные) и влияет на следующие раунды переговоров.

Ключевое новшество — использование клеточных пучков (cellular sheaves) из теории топологии. Вместо жёсткого требования полного согласия между агентами, пучок определяет, в каких именно проекциях их состояния должны совпадать. Это делает систему гораздо более гибкой.

Что на практике?

Авторы проверили подход на трёх задачах, где информация жёстко ограничена:

  • Multi-Agent Sudoku: каждый агент видел только строку, столбец или блок 3×3. Sheaf-ADMM решил 93% задач, тогда как обычный message-passing baseline — лишь 11%.

  • Image Classification (MNIST, сдвиг размера холста): обычная CNN падала до 11% точности, метод Sakana AI сохранял 86%.

  • Maze Pathfinding: Sheaf-ADMM достиг точности baseline, но использовал 5-мерный канал коммуникации вместо 42-мерного.

Прозрачность вместо чёрного ящика

Пожалуй, самое интересное для практиков — координация в Sheaf-ADMM полностью интерпретируема. В отличие от стандартных архитектур, где всё спрятано в hidden states, здесь можно наблюдать, как локальные агенты «спорят», корректируют решения и приходят к общему результату.

Вопросы к методу

В сообществе уже обратили внимание на потенциальные проблемы:

  • ADMM традиционно требует выпуклых подзадач, но здесь агенты — нейросети (невыпуклые). В работе не до конца раскрыты вопросы выбора шага и сходимости.

  • Остаётся открытым вопрос масштабирования на большие гетерогенные системы и работу в условиях шума.

Тем не менее, сама постановка задачи — создание децентрализованной, интерпретируемой и эффективной координации агентов — выглядит крайне перспективно.


Ссылки по теме:

ссылка на оригинал статьи https://habr.com/ru/articles/1055800/