
Исследователи из Бостонской детской больницы, Гарвардского университета и OpenAI заново разобрали 376 случаев редких генетических болезней у детей, которые специалисты годами не могли решить, — и с помощью модели o3 Deep Research нашли зацепки, приведшие к 18 новым диагнозам. Это 4,8% — почти каждый двадцатый случай из тех, что раньше заходили в тупик. Работа опубликована в журнале NEJM AI 18 июня: сейчас o3 уже считается устаревшей моделью, но медицинские исследования ведутся долго и на момент начала эксперимента она была передовой.
Для каждого случая команда собирала обезличенное досье: симптомы ребенка на стандартизированном медицинском языке, заметки врачей, возраст, пол и — главное — список генетических вариантов-кандидатов из его ДНК с пометками из публичных баз вроде ClinVar о том, какие из них уже считаются опасными. Чаще всего в досье были данные не только ребенка, но и обоих родителей — это помогает понять, унаследована проблема или возникла впервые. По этим данным o3 предлагала самое вероятное объяснение болезни и показывала ход рассуждений. Дальше подключались люди: минимум двое экспертов проверяли каждую версию модели по тому же стандарту, что и клинические лаборатории. Диагноз засчитывали только если специалисты соглашались с вариантом, его признавали болезнетворным, отдельная сертифицированная лаборатория подтверждала находку, а результат возвращали семье.
Результаты сильно разошлись по четырем группам пациентов:
-
нарушения развития нервной системы: 100 случаев, 10 диагнозов (10,0%);
-
нейромышечные болезни: 61 случай, 4 диагноза (6,6%);
-
внезапная необъяснимая смерть детей: 200 случаев, 2 диагноза (1,0%);
-
ранний психоз у детей и подростков: 15 случаев, 2 диагноза (13,3%).
Семь из 18 диагнозов оказались, по сути, переоткрытиями: опасный вариант уже значился в открытых базах данных, но не попал в ту карту пациента, которую изучала команда. Это показывает, что дело часто не в нехватке знаний, а в том, что данные о больном разбросаны по разным базам с несовместимыми форматами, и собрать их вместе вручную тяжело даже специалисту.
Иногда модель вытаскивала то, чего во входных данных вообще не было. В одном случае раннего психоза o3 заметила цепочку плохо прочитанных участков на 22-й хромосоме, связала ее с сердечными, иммунными, неврологическими и психиатрическими особенностями ребенка и предположила, что в этом месте генома не хватает целого фрагмента, — состояние, известное как синдром ДиДжорджи. Догадку подтвердило повторное прочтение генома. В других случаях болезнь объяснялась поломками сразу в двух генах там, где одного оказывалось мало.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
ссылка на оригинал статьи https://habr.com/ru/articles/1049428/