ИИ PRET определяет 18 типов рака по 8 слайдам без переобучения

Команда Hong Kong University of Science and Technology (HKUST) под руководством Ли Сяомэн представила ИИ-систему PRET (Pan-cancer Recognition without Example Training) — она распознает 18 типов рака по гистологическим слайдам, причем для каждой новой задачи модели достаточно от одного до восьми размеченных примеров, без дообучения. Работа опубликована в Nature Cancer.

Сейчас ИИ-патология упирается в масштабирование. Большинство моделей настраиваются под один конкретный тип рака, требуют тысяч размеченных снимков и отдельной тренировки под каждую новую задачу — скрининг, определение подтипа или сегментацию (очерчивание границ опухоли на снимке). Между тем в мире ежегодно ставят около 20 млн новых онкодиагнозов, а патологов не хватает даже в богатых системах здравоохранения, не говоря о регионах с базовой медицинской инфраструктурой. Команда HKUST в своем анонсе формулирует PRET именно как ответ на это узкое место — универсальную модель, которая не требует нового раунда обучения под каждый кейс.

PRET переносит в гистологию подход, хорошо знакомый по большим языковым моделям — in-context learning, или обучение в контексте. Когда ChatGPT на лету подхватывает формат ответа по одному-двум примерам в промпте, он не переобучается, а использует эти примеры как опору для текущего запроса. PRET работает так же: чтобы распознать новый тип рака или решить новую диагностическую задачу, модели показывают от одного до восьми эталонных слайдов прямо во время работы, и веса при этом не меняются. По сути это первый серьезный перенос идеи обучения на малом числе примеров в патологоанатомическую диагностику.

Команда протестировала PRET на 23 международных бенчмарках, охватывающих 18 типов рака, с данными из Китая, США и Нидерландов. В 20 из 23 задач модель обошла существующие специализированные алгоритмы, в 15 из них значение AUC (метрика качества классификации, где 1,0 — идеал, а 0,5 — случайное угадывание) превысило 0,97. В скрининге колоректального рака PRET показала AUC 1,00, в сегментации плоскоклеточного рака пищевода — 0,9954. Самый выразительный результат — детекция метастазов в лимфоузлах: по восьми эталонным слайдам модель достигла AUC 0,9871, тогда как средний AUC у панели из 11 врачей-патологов на тех же данных составил около 0,81.

Есть важные оговорки. PRET пока остается исследовательским прототипом: результаты получены на отобранных бенчмарках и требуют проверки в реальной клинической практике, где слайды отличаются качеством окраски, сканерами, техническими артефактами и долей редких случаев. Дальше авторы планируют расширить систему на предсказание мутаций и прогнозирование исходов — и там придется отдельно проверять, хватает ли обучения на малом числе примеров для задач, требующих более глубокого понимания биологии опухоли, а не только визуального распознавания паттернов.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть«, где я рассказываю про ИИ с творческой стороны.

ссылка на оригинал статьи https://habr.com/ru/articles/1026788/