Школьная игра с ИИ переросла в исследование о проблеме решения задач ИИ по структурной бионформатике

от автора

В журнале PLOS One международная группа учёных из Сколтеха, Института науки и технологий (Австрия) и Окинавского института науки и технологий (Япония) опубликовала статью о противостоянии ИИ и человека в биоинформатике в одном образовательном проекте, рассказали информационной службе Хабра в пресс-службе Сколтеха. По исследованию, ИИ от DeepMind не решила задачу структурной биоинформатики. До этого ИИ, принадлежащий Google, решил задачу в предсказании структур белков. Нерешенная задача может быть свидетельством, ставящим под вопрос гипотезу о возможности ИИ «выучить физику» белков.

В 2014 году Google приобрёл DeepMind, после чего ИИ показывал выдающиеся результаты во многих играх: от шахмат до го и StarCraft 2. Далее система добралась до реальной задачи — предсказания структуры белков по аминокислотной последовательности. После решения AlphaFold структуры белков по аминокислотной последовательности в 2021 году было предположение о конце структурной биоинформатики.

По словам научного руководителя, старшего преподавателя Центра молекулярной и клеточной биологии Сколтеха Дмитрия Иванкова, исследователи решили проверить AlphaFold на другой типичной для структурной биоинформатики задаче. Задача заключается в предсказании изменения стабильности белка вследствие одиночной мутации. Сама задача выглядит так: берётся известный белок, в него вносится минимально возможное изменение и выясняется, будет ли полученный мутант стабильнее или нестабильнее и насколько.

С этой задачей AlphaFold не справился: предсказания ИИ никак не согласуются с известными экспериментальными данными. Иванков оговаривается, что создатель AlphaFold не утверждал пригодность ИИ для чего‑то, кроме предсказания структуры белков по аминокислотной последовательности. И как сказал старший преподаватель Центра молекулярной и клеточной биологии Сколтеха, «ряд оптимистов ожидал прорыва и здесь».

Предсказывать изменение стабильности белка после мутации важно с практической точки зрения. Например, для того, чтобы перебором мутаций находить устойчивые к высоким температурам варианты белков с полезными свойствами.

Заключение авторов статьи говорит, что в существующем виде ИИ не панацея, он отлично справился с важнейшей проблемой структурной биоинформатики, занимавшей учёных 50 лет, но остаётся много других нерешённых проблем. Например, предсказание структур комплексов белков с малыми молекулами, ДНК или РНК, мутаций в белке и их влияния на энергию связывания с другими молекулами, белковый дизайн: какая нужна последовательность, чтобы сделать белок с некоторыми желаемыми свойствами, к примеру, катализатор, который может стать элементом крошечной «молекулярной фабрики».

Исследование косвенно опровергает гипотезу, что AlphaFold кроме усвоения всех накопленных человечеством структур белков и операций с ними может каким‑то образом выучить саму фундаментальную физику белков. Однако по этой логике программе не составило бы труда сопоставить две очень похожие структуры с точки зрения стабильности, но это оказалось ИИ не под силу.

Этот довод дополняет озвученные сомнения касательно «знания физики»: AlphaFold предсказывает некоторые структуры, у которых боковые группы ориентированы так, как будто к ним привязан ион цинка. Но программа получает на вход только аминокислотную последовательность белка, то есть «незримый цинк» в результатах ощущается лишь постольку, поскольку в обучающих данных были аналогичные структуры белков, связанные с этим ионом. Без него предсказанная ориентация боковых групп физически некорректна.

Кроме того, AlphaFold предсказывает одиночную структуру витиеватой цепи, выглядящую для учёного правдоподобно, однако только если мысленно достроить ещё две такие же цепи и переплести их вместе, иначе эта конструкция несостоятельна с точки зрения физики.

Получается, программа запомнила и воспроизвела соответствующую структуру, вычлененную из составной конструкции, и законами физики она себя при этом не ограничивает.

Первый автор статьи, аспирант Сколтеха Марина Пак, рассказала, что исследование выросло из «игрушечного» проекта с участниками Школы молекулярной и теоретической биологии. Проект назывался «Игры с АльфаФолд».

Как только AlphaFold выложили в открытый доступ, учёные из лаборатории установили его на сколтеховский суперкомпьютер «Жоре». Одна из игр заключалась в сопоставлении эффекта мутации с предсказаниями AlphaFold для структуры исходного и мутантного белка.


ссылка на оригинал статьи https://habr.com/ru/articles/727188/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *