ИИ научился конструировать белки против рака — и его раздают даром

от автора

Biohub — биомедицинское подразделение Chan Zuckerberg Initiative, фонда Марка Цукерберга и Присциллы Чан, — выложил открытую «мировую модель биологии белков» и раздает ее любой лаборатории бесплатно, под лицензией MIT. Громкой эту новость делает не сам факт релиза, а результат: белки, которые модель сконструировала против раковых мишеней, уже сработали в лабораторных экспериментах. По сути это движок, который проектирует молекулы под конкретную болезнь — и делает это за дни там, где у ученых уходили годы.

В основе лежит ESMC — модель, обученная примерно на 2,8 млрд белковых последовательностей со всего древа жизни, от бактерий из глубокого грунта до белков человеческого тела. Логика обучения предельно простая: предсказывать, какую аминокислоту эволюция поставит следующей. Поскольку эволюция сохраняет белки, которые хорошо справляются со своей работой, в этих закономерностях зашиты физические правила того, как белки сворачиваются и слипаются друг с другом.

И здесь возникает мостик к лекарствам: огромная их часть устроена именно как замок и ключ — молекула находит в организме конкретный белок, виновный в болезни, и прицельно садится на него, выключая или меняя его работу. Сконструировать такой белок-«прилипалу» (биндер) — значит собрать рабочее ядро будущего препарата. Усвоив правила сворачивания, модель не достает готовый биндер из базы, а конструирует новый с нуля и сама оценивает, насколько прочно он сядет на мишень. За эту работу отвечает второй компонент связки, ESMFold2.

Biohub утверждает, что ESMFold2 точнее AlphaFold 3 от Google DeepMind предсказывает позу связывания в комплексах антитело-антиген — а это одна из самых важных задач для разработки лекарств. Команда проверила модель на пяти мишенях из онкологии и иммунологии — среди них EGFR, PD-L1 и CTLA-4. Доля удачных попаданий составила от 36 до 88% для компактных минибиндеров и от 15 до 29% для конструкций на основе антител, и связывание подтвердили в пробирке. При этом один кандидат-биндер обычно разрабатывают три-четыре года, а здесь компьютерный поиск занял дни.

Важная оговорка: это еще не лекарства. На выходе получаются молекулы-кандидаты, а не готовая терапия — впереди проверки на безопасность и клинические испытания. В карточке модели прямо написано, что предсказания нужно подтверждать экспериментально, а для клинического или терапевтического применения без дополнительной валидации модель не предназначена.

Тогда в чем польза, если до таблетки далеко? В том, что модель бьет по самому медленному и дорогому этапу — раннему поиску кандидата. Она сужает круг вариантов, повышает долю попаданий и переносит первичный перебор в компьютер, экономя месяцы экспериментов. Второй козырь — открытость: пока коммерческие платформы продают доступ, Biohub раздает инструменты даром. Сюда же относится третий компонент, ESM Atlas — карта из 6,8 млрд белков и 1,1 млрд предсказанных структур, крупнейшее на сегодня применение ИИ к биологии белков. Фактически это «сырье» для будущих открытий в любой лаборатории.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

ссылка на оригинал статьи https://habr.com/ru/articles/1041440/