
Группа исследователей из Института патологии Университетской клиники Кельна опубликовала в Nature Medicine рассказ про систему SPARK — связку ИИ-агентов, которая сама придумывает биомаркеры рака по обычным гистологическим срезам. Работу представили под руководством Юри Толкача, старшего врача института.
SPARK устроен как конвейер из четырех связанных модулей: генерация идей, их уточнение, перевод в код и верификация параметров. Гипотезы генерировала OpenAI o1, в код их переводила Claude 3.5 Sonnet от Anthropic — модели выглядят старыми, но дело в том, что эксперимент авторы ставили еще в январе-феврале 2025, и до публикации в Nature Medicine работа прошла стандартный для журнала цикл рецензирования. Сами авторы отмечают, что архитектура SPARK не привязана к конкретным моделям и легко адаптируется под более новые — в том числе открытые.
Никакого дообучения моделей под задачу не требуется — система рассуждает на естественном языке и сама собирает методы анализа. За один цикл генерации (около двух часов) она выдала 500 уникальных гипотез. Каждая идея раскладывается на несколько измеримых параметров — 99,2% из них Claude скомпилировал в работающий Python-код. После фильтрации повторов и неэффективных параметров осталось 1115 интерпретируемых признаков. По данным самих авторов, разработка и реализация всего конвейера обошлись примерно в 4000 евро.
На обычных гистологических срезах SPARK работает на уровне лучших специализированных моделей: распознает подтипы и гормональные характеристики опухолей, наличие вируса папилломы при раке ротоглотки и нестабильность ДНК при колоректальном раке — с точностью, сопоставимой или выше, чем у коммерческих инструментов. Но интереснее то, что система нашла признаки, которых у патологов раньше не было. Например, «зональные» метрики, описывающие активный фронт опухоли — там, где она перестраивает окружающую ткань. И реконструкция временной последовательности развития опухоли по одному статичному срезу: какие клетки приходят первыми, какие появляются позже. Например, в аденокарциноме легкого ранние «роли» занимают сами опухолевые клетки, фибробласты и макрофаги, а нейтрофилы подтягиваются к поздним стадиям.
Авторы выложили в открытый доступ весь код, параметры и интерактивный справочник по найденным признакам. Ограничения они проговаривают честно: все когорты ретроспективные, материал — операционный, не биопсийный, и до клинического применения нужна валидация на больших разноплановых выборках. Отдельно отмечают, что не стали делать систему полностью автономной — то есть такой, которая сама прогоняла бы свои гипотезы через валидацию и переписывала задачу, — потому что подобный цикл слишком дорог. Но как демонстрация возможностей SPARK показывает, что современные агентные связки уже способны выдавать гипотезы для большой клинической задачи — даже на отставших на год моделях.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть«, где я рассказываю про ИИ с творческой стороны.
ссылка на оригинал статьи https://habr.com/ru/articles/1032212/