«Нобелевский» ИИ AlphaFold предсказывал форму белка. Теперь его обучили замечать движение

от автора

Исследователи из Института науки и технологий Австрии (ISTA) и их зарубежные коллеги научились дополнять AlphaFold3 экспериментальными данными таким образом, чтобы тот предсказывал не одну застывшую форму белка, а целый набор его возможных конформаций. Работа опубликована в Nature Biotechnology.

AlphaFold — ИИ-инструмент, который произвел революцию в структурной биологии и принес создателям Нобелевскую премию по химии 2024 года. Он предсказывает трехмерную структуру белка по его аминокислотной последовательности с поразительной точностью. Но обучали его на статичных снимках из рентгеновской кристаллографии: такие структуры составляют около 85% базы Protein Data Bank. Из-за этого модель сводит подвижную молекулу к одной доминирующей форме, хотя на деле белки постоянно меняют конформацию — пространственную форму, которую молекула принимает, изгибаясь и поворачиваясь вокруг своих химических связей, — и эти движения критичны для их работы.

Команда не переобучала модель с нуля, а взяла готовый AlphaFold3 как основу и стала подсказывать ему результаты реальных измерений — данные ядерного магнитного резонанса (ЯМР), рентгеновской кристаллографии и крио-электронной микроскопии — прямо в процессе генерации структуры. В итоге модель выдает ансамбль конформацию, который согласуется с экспериментом лучше, чем одиночное предсказание.

На практике такие ансамбли нарушают ограничения по межатомным расстояниям реже, чем структуры, которые традиционно получают методом ЯМР, и вскрывают альтернативные формы, незаметные в обычных моделях: например, у белка β2-микроглобулина метод нашел конформации, которые стандартные процедуры упускали. Любопытно, что в основу подхода легло то, что раньше считали помехой. «В отличие от статичных кристаллографических структур, на которых обучали AlphaFold, структурная размытость — это и есть тот сигнал, который мы ищем», — поясняет руководитель работы Алекс Бронштейн.

Цель авторов — превратить прототип в стандартный инструмент и приблизить появление «экспериментально осведомленных» моделей, которые исходят из того, что белок существует не в одной форме, а в виде ансамбля. По их словам, это должно помочь в моделировании крупных белковых комплексов и в инверсном дизайне белков — проектировании последовательности под заранее заданную трехмерную форму, что важно для биоинженерии и поиска лекарств.

P.S. Поддержать меня можно подпиской на канал сбежавшая нейросеть, где я рассказываю про ИИ с творческой стороны.

ссылка на оригинал статьи https://habr.com/ru/articles/1053600/