Машина, которая учится думать

от автора

Четыре революции происходят в искусственном интеллекте прямо сейчас — почему они меняют наше представление о том, что такое разум?

Если вы следите за новостями про искусственный интеллект только по громким заголовкам, у вас, скорее всего, складывается ощущение, что вся история сводится к одной простой формуле: «модели становятся больше — и от этого умнее». Это правда — но это очень маленькая часть правды. На самом деле под капотом происходит нечто гораздо более интересное: целое поколение инженеров и учёных одновременно занялось перестройкой того, что мы понимаем под мышлением. И самое любопытное здесь — то, что они переоткрывают идеи, которые психологи и нейробиологи обсуждают уже сто лет.

Пролог. Машина, которая не торопится

В сентябре 2024 года OpenAI выпустила модель под названием o1. На первый взгляд — ничего особенного, ещё одна версия ChatGPT. Но при ближайшем рассмотрении стало понятно: это совершенно другое животное.

Когда вы задаёте o1 сложный вопрос — скажем, олимпиадную задачу по математике или задачу по программированию уровня технического собеседования в Google — модель не отвечает мгновенно. Она думает. Иногда секунды, иногда минуты. Внутри неё происходит нечто, что разработчики назвали «цепочкой рассуждений» — длинной внутренней дискуссией с самой собой: она ставит гипотезу, проверяет, замечает ошибку, возвращается на шаг назад, пробует другой подход.

Результаты были шокирующими. На квалификационных задачах американской математической олимпиады o1 вошла в число пятисот лучших школьников страны. На бенчмарке GPQA — наборе вопросов уровня PhD по физике, биологии и химии — она превзошла людей с докторской степенью в их собственных областях. На соревновательном программировании она оказалась в 89-м процентиле.

Через четыре месяца, в январе 2025 года, китайская компания DeepSeek выпустила открытую модель R1 с похожими возможностями. В индустрии это событие получило название «DeepSeek shock» — потому что оно доказало две вещи. Первое: то, что делает o1, не магия и не закрытый секрет OpenAI. Второе и более важное: способность ИИ рассуждать — это не результат увеличения размера модели. Это результат другой архитектуры процесса.

Это и есть тот момент, когда история ИИ перестала быть историей про «модели становятся больше», и стала историей про то, «как именно они думают». Если вам кажется, что это разница академическая — поверьте, нет. Это смена парадигмы, сравнимая по масштабу с переходом от паровой машины к электричеству. Машина по-прежнему производит работу — но принципы, по которым она это делает, теперь другие.

В этой статье я хочу провести вас по четырём фронтам, на которых эта смена парадигмы разворачивается прямо сейчас. По ходу дела вы увидите кое-что удивительное: каждый из этих фронтов — это переоткрытие идеи, которую психологи, нейробиологи и философы обсуждают как минимум последние сто лет!

✦ ✦ ✦

Революция первая. Две скорости мышления

В 2011 году нобелевский лауреат по экономике Даниэль Канеман выпустил книгу «Думай медленно, решай быстро». В ней он формулировал идею, к которой пришёл после полувека психологических экспериментов: человеческий разум — это не одна система, а две.

Первая система — быстрая. Она работает мгновенно, без усилий, на интуиции. Когда вы узнаёте лицо друга в толпе, мгновенно понимаете, что собеседник раздражён по тону его голоса, или автоматически нажимаете на тормоз, увидев впереди препятствие — это Система 1. Она древняя, она эволюционно сформировалась задолго до появления языка, и она почти всегда права. Когда она ошибается — она ошибается зрелищно (Канеман посвятил половину книги каталогу её ошибок, известных как когнитивные искажения), но в обычной жизни мы 95% времени живём именно ею.

Вторая система — медленная. Она напрягается, тратит энергию, считает по шагам. Когда вы перемножаете двузначные числа в уме, разбираете незнакомую инструкцию или планируете отпуск — это Система 2. Она появилась эволюционно поздно, она дорого стоит мозгу (буквально — система жжет глюкозу не хуже чем истребитель выжигает керосин на форсаже), и поэтому она ленива: включается только когда Система 1 не справляется.

Канеман не был первым, кто заметил это разделение — у него были предшественники, Стэнович и Уэст в 1990-х. Но именно его формулировка стала языком, на котором всё человечество стало обсуждать собственное мышление.

И вот тут начинается самое интересное. Языковые модели первого поколения — GPT-3, GPT-4, оригинальный ChatGPT — были, по сути, чистой Системой 1. Они отвечали мгновенно. Они никогда не «думали», в человеческом смысле слова — они просто продолжали текст, угадывая следующее слово по статистике, выученной из миллиардов страниц интернета. Когда такая модель решала простую задачу — она была блестяща. Когда сложную — она часто отвечала неправильно с абсолютной уверенностью, потому что у неё не было механизма остановиться, заметить, что она «не уверена», и подумать ещё.

То, что случилось с o1, DeepSeek-R1 и подобными моделями — это прививка к Системе 1 настоящей Системы 2. Не более умной Системы 1, а архитектурно другой компоненты, которая включается, когда первая не справляется. Технически это работает так: модель генерирует длинную внутреннюю «цепочку мыслей», в которой она сама себя поправляет, перепроверяет промежуточные шаги, замечает противоречия и возвращается. Цепочка может быть в десятки тысяч слов длиной — то, что вы видите на экране как ответ, это лишь финал многократной внутренней работы.

Это первое крупное переоткрытие. То, что психологи знали с 1970-х про человеческое мышление, индустрия ИИ переоткрыла в 2024-м — и обнаружила, что машинам это нужно по тем же причинам, что и людям.

Но интереснее всего то, что Система 2 в LLM работает не одна. У неё уже выросли свои собственные диалекты. ReAct — это когда модель чередует «мысль — действие — наблюдение» (что-то вроде того, как Шерлок Холмс думает вслух, осматривая место преступления, по мельчайшим крупицам восстанавливая полную картину произошедшего).

Tree of Thoughts — это когда модель строит дерево возможных путей рассуждения, оценивает каждую ветвь и выбирает лучшую.

Reflection — это когда после неудачной попытки модель пишет себе устную самокритику и сохраняет её как урок к следующему разу. Это всё — разные стили медленного мышления, и индустрия экспериментирует, выясняя в каких задачах какой стиль работает лучше.

Мы только начинаем понимать, какова экология этих стилей. Но факт уже не оспаривается: время «одного большого и детального запроса — и одного мгновенного ответа» закончилось.

✦ ✦ ✦

Революция вторая. Анатомия памяти

Если ваш близкий друг попадёт в аварию и потеряет память — но не всю, а только какую-то определённую её часть — нейробиологи смогут довольно точно сказать, какая зона мозга пострадала. Потому что у человека не одна память, а как минимум четыре.

Эпизодическая память — это память о конкретных событиях. Как вы вчера ужинали, где провели прошлое лето, что сказала бабушка на свой 70-летний юбилей. Она привязана ко времени, месту, людям, обстоятельствам. Её хранит гиппокамп — небольшая структура в глубине мозга, формой и размером похожая на морского конька. Если повредить гиппокамп, как у знаменитого пациента H.M., которого нейробиологи изучали полвека, человек перестаёт формировать новые эпизодические воспоминания, но всё, что было запомнено до травмы, остаётся.

Семантическая память — это память о фактах и понятиях. Что Париж — столица Франции. Что собаки лают. Что 7 × 8 = 56. У этой памяти нет «когда» и «где» — это просто знания. Хранится она в коре больших полушарий, распределённо.

Процедурная память — это память о навыках. Как ездить на велосипеде, как печатать на клавиатуре вслепую, как держать чашку. Эту память почти невозможно описать словами (попробуйте инструкцию для езды на велосипеде — звучит абсурдно), но она необыкновенно устойчива. Хранится в базальных ганглиях и мозжечке.

Рабочая память — это блокнот, на котором происходит «здесь и сейчас». Когда вы держите в голове телефонный номер, пока его набираете, это рабочая память. Её ёмкость очень мала — около 4-7 элементов, и держится она секундами. Это префронтальная кора.

Эти четыре системы открывали постепенно, с 1950-х по 1990-е. И уже к началу нынешнего века психолог Эндел Тульвинг и его коллеги собрали из них целостную картину памяти, которой до сих пор пользуется вся нейробиология.

Так вот: индустрия ИИ только сейчас обнаружила, что её модели страдали галлюцинациями именно потому, что использовали только одну из этих систем — а зачастую еще и с “кривой” реализацией.

ChatGPT, каким мы его знаем сегодня, имеет единственную форму памяти — ту, что помещается в так называемое «контекстное окно». Это аналог рабочей памяти: несколько десятков, иногда сотен страниц текста, которые модель видит «прямо сейчас».

Когда окно заканчивается, начало накопленного контекста начинает испаряться. У модели нет эпизодической памяти — она не помнит ваши прошлые разговоры, разве что её специально настроить. У неё толком нет и семантической памяти в смысле гибкого, обновляемого знания о мире — то, что она знает, зашито в её веса при обучении и почти невозможно обновить без переобучения. У неё нет процедурной памяти в полноценном смысле — она не умеет сохранять навыки между сессиями.

И вот сейчас — а если точнее, в последние три года — десятки исследовательских групп начали строить эти недостающие системы памяти как отдельные модули вокруг языковых моделей.

Самая знаменитая ранняя попытка называется Generative Agents — её сделали в Стэнфорде в 2023 году. Исследователи создали маленький виртуальный городок (внешне похожий на старую игру The Sims), и населили его двадцатью пятью персонажами. У каждого своя «жизнь» — профессия, отношения, ежедневная рутина. И — критически важно — у каждого персонажа появился непрерывный «поток памяти»: всё, что персонаж видел, слышал, делал, записывалось в его личную базу данных на естественном языке. Когда нужно было что-то вспомнить, модель искала в этой базе по трём критериям: насколько недавно (recency), насколько важно (importance), насколько похоже на текущую ситуацию (relevance).

И — самое удивительное — у каждого персонажа появился механизм рефлексии. Каждые несколько часов модельного времени персонаж останавливался и читал свои свежие воспоминания, после чего генерировал «выводы более высокого уровня». «Кажется, Клаус слишком увлечён исследованием». «Похоже, моя дочь беспокоится о выпускных экзаменах». Эти выводы тоже записывались в память — но уже как более абстрактный слой.

Когда исследователи попросили одного из персонажей устроить вечеринку ко Дню святого Валентина, в течение двух модельных дней по городу разлетелись приглашения — без всякого централизованного управления. Персонажи приглашали друг друга, обсуждали, кто с кем пойдёт, помнили о приглашении на следующий день, приходили в назначенное место в назначенное время. Эмерджентная социальная динамика — проросла из одной мельчайшей семечки-идеи.

То, что Стэнфорд показал в 2023-м, сегодня индустрия доводит до промышленного уровня. Появилась целая отрасль — которую назвали agent memory, — здесь десятки компаний и лабораторий конкурируют за то, кто построит лучшую внешнюю память для ИИ-агентов.

Системы носят названия — Zep, Graphiti, HippoRAG, A-MEM, Generative Semantic Workspace. У каждой свои патентованные хитрости. Но идея одна: построить вокруг языковой модели четырёхслойную память — эпизодическую для конкретных событий, семантическую для абстрактных фактов, процедурную для навыков и рабочую для текущего момента.

И тут начинается следующее интересное переоткрытие. В 1995 году нейробиологи Джеймс Макклелланд, Брюс Макнотон и Рэндалл О’Райли опубликовали теорию, которую назвали complementary learning systems — взаимодополняющие системы обучения. Они показали: гиппокамп и неокортекс работают в паре — гиппокамп быстро запоминает конкретные эпизоды, а потом, во сне, эти эпизоды «проигрываются» снова и постепенно перетекают в неокортекс, превращаясь в обобщённые знания. Это объясняет, зачем нам сон и почему критически важно высыпаться: ночью наш мозг буквально перезаписывает дневной опыт в долгосрочное знание.

В 2024-2025 годах исследователи ИИ обнаружили, что точно та же проблема стоит и перед искусственными агентами. Если ваш ИИ-агент работает несколько дней — у него накапливается такая гора эпизодических воспоминаний, что в них становится невозможно разобраться. Нужен механизм консолидации. Кто-то предложил буквально называть его «sleep cycle» — фаза, в которую агент, пока пользователь не активен, перерабатывает свежие эпизоды в более абстрактные знания. И записывает их в семантическую память. Точно также как мозг.

«Эпизодическая память — это недостающий кусок паззла долгоживущих агентов на базе LLM. Без неё агент не способен учиться на однократном опыте, не способен помнить контекст конкретных событий, не способен отличить «это уже было» от «это новое».

— Из коллективной статьи исследователей Google DeepMind, Стэнфорда и MIT, февраль 2025

Это второе крупное переоткрытие. Память — это не монолитная система, а целая иерархия маленьких и полезных систем, и каждая выполняет свою отдельную функцию. То, что нейробиология знала с 1970-х, AI-индустрия выстраивает заново — из других материалов, но по тем же чертежам.

✦ ✦ ✦

Революция третья. Общество в голове

В 1986 году Марвин Минский, один из основателей самой дисциплины «искусственный интеллект», выпустил странную книгу под названием «Общество разума». Странной её делало вот что: она была написана как мозаика из 270 коротких эссе, каждое на одну страницу. И в ней Минский излагал тезис, который тогда показался многим коллегам экстравагантным.

Тезис был такой: разум — это не какая-то одна крутая и сложная штука. Это общество множества маленьких механизмов, каждый из которых сам по себе глуп. Один умеет распознавать вертикальные линии. Другой — двигать большим пальцем. Третий — сравнивать два числа. У каждого свой узкий навык. Никто из них в одиночку не похож на «думающее существо». Но когда они работают вместе, координируясь через какие-то общие шины и протоколы, эмерджентно возникает то, что мы называем мышлением.

Минский называл этих маленьких работников «агентами», но он не имел в виду «маленьких человечков». Он имел в виду крошечные функциональные модули. Двадцать лет спустя — и тут совпадение становится почти мистическим — современная нейробиология подтвердит этот образ почти буквально, через теорию глобального рабочего пространства, о которой я расскажу чуть позже.

Но в 1986 году идея Минского была слишком радикальной для своего времени. Доминирующая парадигма ИИ тогда верила в один большой логический движок — что-то вроде идеализированной шахматной программы, которая всё знает и обо всём может рассудить. К концу 1990-х эта парадигма развалилась. В 2010-х её сменили глубокие нейронные сети — но они тоже были, по сути, одним большим монолитом, просто другой конструкции. Книжку Минского читали, цитировали, но никто всерьёз не пытался построить ИИ по её рецептам.

До 2023 года.

В 2023-м кто-то попробовал — почти как эксперимент. Можно ли заставить несколько копий ChatGPT работать вместе? Допустим, одна играет роль программиста, другая — архитектора, третья — менеджера проекта. Они общаются друг с другом через текст, передавая друг другу промежуточные результаты. Получится ли у такой «команды» что-то, что не может одна модель в одиночку?

Оказалось — да, и в очень неочевидных областях. Появились фреймворки — AutoGen от Microsoft, CrewAIMetaGPT — которые позволяют собирать «команды» из языковых моделей под разные задачи. Одна команда пишет код по техзаданию: продакт-менеджер уточняет требования, архитектор проектирует структуру, инженер реализует, тестировщик проверяет. Другая команда пишет научные статьи: исследователь ищет литературу, аналитик систематизирует, писатель формулирует, рецензент критикует. У каждого «сотрудника» свой системный промпт, свой набор инструментов, своя роль.

И — снова неожиданность — оказалось, что эти команды часто справляются с задачами лучше, чем одна большая модель. Не потому, что в команде больше «мозгов» в сумме. А потому, что специализация и взаимная критика — это уже сами по себе мощные когнитивные механизмы. Когда один агент написал решение, а другой пытается его обоснованно разнести — рождается что-то, чего ни один в одиночку делать не планировал.

В 2025 году в академической литературе появилось много статей с одним и тем же выводом: Минский был прав. Его книга 1986 года, которую десятилетиями считали милой философской спекуляцией, — теперь читается как практический инженерный план.

Но «общество в голове» — это не только про мульти-агентные системы. Это и про один отдельный разум, в котором происходит внутренний диалог.

В 1988 году когнитивист Бернард Баарс предложил теорию сознания, которую он назвал Global Workspace Theory — теорией глобального рабочего пространства. Идея такая: мозг состоит из тысяч специализированных подсистем (распознавание лиц, обработка звуков, моторика правой руки, эмоциональная оценка ситуации, языковой парсер, и так далее), и все они в каждый момент работают параллельно и бессознательно. Но в некоторый момент одна из них — та, чьё содержание прямо сейчас наиболее значимо — «выигрывает право» транслировать свой текущий результат в главный поток сознания. Этот главный поток — и есть «театр сознания». То, что в нем звучит, доступно всем остальным подсистемам, и Главный Поток — это то, что мы воспринимаем как СОЗНАНИЕ.

Французский нейробиолог Станислас Деан экспериментально показал, что эта картинка совпадает с тем, что происходит в человеческом мозге, с точностью до миллисекунд. У сознательного восприятия есть отчётливая нейронная подпись — «глобальная игнатция», когда сигнал «вспыхивает» сразу в нескольких отдалённых участках лобной и теменной коры.

И вот что забавно: когда инженеры из всех этих лабораторий — Stanford, Microsoft, Anthropic, китайские группы — стали строить мульти-агентные ИИ-системы, они независимо друг от друга начали приходить к архитектуре «общая шина + специализированные модули + механизм арбитража = чья очередь выходить на сцену и говорить». То есть фактически — к Global Workspace, даже не подозревая, что повторяют Баарса 1988 года.

Сейчас это совпадение замечено, о нем пишут в обзорных статьях, а в 2024 году вышла статья «A Case for AI Consciousness» (Гольдштейн и Кирк-Джианнини), в которой авторы аккуратно отмечают: если Баарс прав в том, что глобальное рабочее пространство — это и есть необходимое и достаточное условие сознания, — то некоторые из современных языковых агентов уже могут формально удовлетворять этому условию.

Это, конечно, не означает, что объединенные в единую информационную шину модели на самом деле что-то «переживают». Вопрос о феноменальном сознании ИИ — отдельная огромная философская тема, и единого ответа на неё нет. Но архитектурная конвергенция между нейробиологией сознания и инженерией ИИ-агентов — это факт, и он, мягко говоря, удивителен.

✦ ✦ ✦

Революция четвёртая. Машина, которая удивляется

В 1990 году молодой немецкий исследователь по имени Юрген Шмидхубер опубликовал статью, в которой поставил странный вопрос: как сделать так, чтобы машина была любопытной?

Это звучит как метафора, но Шмидхубер имел в виду совершенно конкретную инженерную задачу. У обычной обучаемой системы есть внешняя цель — например, выиграть в шахматы, минимизировать ошибку прогноза, найти кратчайший путь. Эта цель приходит снаружи. А что, если цели снаружи нет — но мы всё равно хотим, чтобы машина росла, исследовала, набирала навыки? Откуда взять стимул?

Шмидхубер предложил красивое решение. Пусть, говорит он, у машины внутри будет «предсказатель» — модель того, что произойдёт следующим. Когда машина встречает что-то совершенно знакомое, предсказатель работает идеально, и удивления нет. Когда машина встречает что-то абсолютно случайное, предсказатель тоже бесполезен — ничего выучить нельзя. А вот когда машина встречает что-то на грани предсказуемости — что-то, что предсказать почти можно, но не до конца, — вот это «почти, но не совсем» и есть зона роста. Если научиться предсказывать это лучше, машина становится умнее.

Шмидхубер предложил награждать машину за прогресс в способности предсказывать. То есть — давать ей внутреннюю награду не за то, что она правильно ответила, а за то, что она ответила лучше, чем вчера. Эту награду он назвал «формальной теорией интересного» — и, как он отдельно подчеркнул в более поздних работах, это объясняет, почему люди занимаются искусством, наукой и юмором: ведь всё это виды деятельности, в которых мы ищем структуру в «почти-случайности» и получаем внутреннее вознаграждение, когда находим верное решение задачи.

Идея долго оставалась академической экзотикой. Большие индустриальные системы машинного обучения предпочитали понятные внешние цели — выиграть в Go, распознать котика, перевести текст. Но в 2023 году исследователи NVIDIA сделали проект, который, по моему скромному мнению, относится к самым удивительным в истории ИИ. Они назвали его Voyager.

Voyager — это агент на базе GPT-4, которого отправили играть в Minecraft. Без всякой инструкции о том, что делать. Без обучения с подкреплением в обычном смысле. Без человеческого надзора. Просто — иди и играй.

У агента было три вещи. Первое: автоматическая программа обучения. Он сам себе ставил задачи, постепенно усложняя их по мере роста навыков. Если он находил себя в пустыне, сначала он учился собирать песок и кактусы; если в лесу — древесину. Второе: библиотека навыков. Каждый раз, когда он научился чему-то новому, он сам писал на JavaScript маленькую программу, которая воплощала этот навык, и сохранял её под понятным именем («как добыть железо», «как сварить зелье от слабости», «как сразиться с зомби»). В следующий раз, если возникала похожая ситуация, он эту программу доставал и использовал. Третье: итеративный самонастрой — если программа не работала, он смотрел на сообщение об ошибке, переписывал и пробовал снова.

За несколько недель Voyager построил скиллсет, который покрыл всю технологическую цепочку Minecraft — от голых рук до зачарованного алмазного оружия — безо всякого человеческого вмешательства. Он добыл в 3,3 раза больше уникальных предметов, чем предыдущий лучший агент. Он прошёл по «древу технологий» в 15,3 раза быстрее. И — это ключевой момент — навыки, которые он наработал в одном мире, перенеслись в другой мир. Когда его пересадили в свежесгенерированный Minecraft-мир, он начал не с нуля, а с готовой библиотекой.

Voyager — это первое серьёзное доказательство того, что идея Шмидхубера 1990 года — о любопытстве как двигателе обучения — действительно работает на масштабе. Это первый агент, который учится всю жизнь. Не «обучается, потом разворачивается, потом фиксируется», а — учится и продолжает учиться, каждую минуту.

С тех пор подобных систем стало много, и они стали умнее. В 2024-2025 годах появился целый класс «само-улучшающихся агентов» — таких, которые меняют не только свои навыки, но и сами способы обучения. Они анализируют свои собственные ошибки, пишут себе подсказки на будущее, корректируют свои стратегии. Они начинают приобретать то, что психологи называют метакогницией — способность думать о собственном мышлении. И это — четвёртое крупное переоткрытие.

Концепцию метакогниции в 1970-х ввёл психолог Джон Флавелл. Он показал, что разница между ребёнком, который учится плохо, и ребёнком, который учится хорошо, часто не в способностях, а в способности к саморефлексии. Хороший ученик знает, что он знает и чего не знает. Он замечает, когда не понял, и останавливается. Он умеет оценить, какая стратегия в этой задаче лучше работает. Он отслеживает собственный прогресс. Это и есть метакогниция — она оказывается важнее «сырого ума».

В 2025 году на главной мировой конференции по машинному обучению (ICML) была опубликована программная статья с однозначным выводом: чтобы ИИ-агенты по-настоящему могли улучшаться сами, без человеческого надзора, им нужна метакогниция как встроенный компонент. Не просто способность решать задачу, но способность спросить себя — а правильно ли я вообще её решаю? Стоит ли мне попробовать другой подход? Что я только что узнал, чего не знал час назад?

И самое интересное: когда исследователи начинают встраивать метакогнитивные компоненты в современные ИИ-системы, эти системы начинают вести себя на удивление по-человечески. Они начинают сомневаться. Они спрашивают уточнения. Они говорят «не знаю» там, где предыдущие версии уверенно несли бы чушь. Они меняют стратегию, заметив, что текущая не работает.

Любопытство как двигатель, навыки как растущая библиотека, метакогниция как надзор — это контуры машины, которая по-настоящему развивается. Она ещё не близка к нам — ей не хватает многого, в первую очередь тела и реального мира, в котором она могла бы себя проверять. Но направление определено.

✦ ✦ ✦

Контрсюжет. Великий скептик и его план Б

Ни одна история не была бы полной без критического взгляда. И у этой истории также есть свой скептик — и это один из самых уважаемых людей в данной области, Ян Лекун, главный научный сотрудник Meta и обладатель премии Тьюринга за 2018 год.

Лекун уже несколько лет повторяет одну и ту же мысль с разной степенью раздражения: то, что делают современные большие языковые модели, фундаментально не похоже на человеческое мышление. У них нет внутренней модели мира. Они учатся предсказывать следующее слово в тексте — но они никогда не видели, как яблоко падает с дерева. Они никогда не пытались поднять чашку и сами не осознавали, что её надо взять за ручку, а не за обжигающе-горячую часть. Они не «могут представить», что вода мокрая — они знают только, что слово «мокрая» часто появляется рядом со словом «вода».

Лекун предлагает альтернативу, которую назвал JEPA — Joint Embedding Predictive Architecture, то есть архитектура совместного встраивания и предсказания. Идея на словах простая, но на самом деле в ней сокрыта глубина. Вместо того чтобы предсказывать следующий пиксель в видео или следующее слово в тексте, JEPA должна предсказывать абстрактное представление будущего. Не «что произойдёт буквально на этом пикселе», а «что в принципе изменится в сцене».

Это похоже на то, как работает наш мозг. Когда вы смотрите, как ваш собеседник наливает чай, вы не предсказываете в голове каждый кадр будущего фильма. Вы предсказываете на уровне понятий: «он сейчас поднимет чайник, наклонит его, чай польётся, потом он увидит что чашка наполнилась и остановит процесс». Это абстракции, а не сырая сенсорика. И когда что-то идёт не по плану — например, чай начал желто-нежно впитываться в скатерть — вы сразу это замечаете, потому что абстракция нарушена.

Meta уже выпустила несколько прототипов: I-JEPA для изображений (2023), V-JEPA для видео (2024). Они работают — и работают эффективно: дают сравнимые результаты с обычными моделями, тратя гораздо меньше вычислений. Но до полной картины Лекуна — автономной машинной интеллектуальности, как он её называет, AMI — ещё очень далеко.

План Лекуна включает шесть компонентов: восприятие, модель мира, кратковременную память, актор (тот, кто принимает решение), систему оценки (что хорошо, что плохо) и конфигуратор — высокоуровневый контроллер, который определяет, что в данный момент важно и какие модули задействовать. Это похоже на классическую когнитивную архитектуру из 1980-х — и Лекун первым это признаёт. Он говорит: мы пробовали масштабировать языковые модели; они дошли до своего потолка; теперь нам нужно вернуться к структурной инженерии разума.

Прав ли Лекун ? Именно сейчас в сообществе идут горячие споры на эту тему. Сторонники LLM настаивают, что с каждой новой версией модели начинают делать то, чего, как казалось, они не могут — безо всякой перестройки архитектуры. Сторонники Лекуна указывают, что эти модели всё ещё путаются в элементарной физике и не способны планировать действия в неструктурированной среде.

Скорее всего, и те и другие правы по-своему. Архитектурное будущее ИИ почти наверняка гибридное — с языковыми моделями как одним из компонентов более крупной системы, в которой есть и память, и мир-модель, и метакогниция, и какая-то форма embodiment (то есть встроенности в физическую или виртуальную среду).

Но без скептиков, пожалуй, никуда — они не дают остальным закостенеть в самолюбовании и эйфории.

✦ ✦ ✦

Сюжет, который никто не ожидал. Возвращение русской школы

В 1934 году в Москве, в возрасте 37 лет, умер от туберкулёза человек по имени Лев Выготский. Он успел за свою короткую жизнь написать книгу, которую назвал «Мышление и речь» — и сформулировать в ней идею, к которой западная психология подошла только в 1960-х.

Выготский утверждал: высшие психические функции — то есть именно то, что отличает человека от животного — не формируются и не растут изнутри. Они приходят снаружи.

Сначала ребёнок видит, как взрослый что-то делает с предметами, — например, считает на пальцах, или проговаривает шаги задачи. Потом ребёнок делает это вместе со взрослым. Потом — он начинает делать это вслух самостоятельно. И только потом — речь уходит внутрь, и операция становится умственной.

Это называется интериоризацией. Мысль формируется в социальном взаимодействии и потом перемещается во внутренний план. Внутренний голос человека, говорил Выготский, — это в буквальном смысле эволюционировавший и развившийся во что-то иное внешний диалог.

Учеников Выготского — Лурию, Леонтьева, Гальперина — на Западе долго не читали. Сталинский занавес был слишком плотным; русская школа развивалась почти в изоляции. Гальперин, в частности, развил эту идею в детальную теорию: он показал, что любое умственное действие у ребёнка проходит шесть стадий — от грубого материального действия с предметами до полностью свёрнутой умственной операции. Учитель помогает ребёнку пройти эти стадии, и в конце концов в голове ребёнка возникает «свёрнутая» способность, которая выглядит изнутри как мгновенная интуиция, но снаружи остаётся следами того процесса, через который она была построена.

Это были блистательные идеи. Они переписали бы психологию ещё в 1930-х, если бы кто-то их слушал. Но международное признание пришло только в 1980-х — через переводы и неторопливый труд таких учёных, как Майкл Коул.

А теперь — внимание. В 2022 году группа исследователей во главе с Седриком Кола, Пьер-Ивом Удьером и их коллегами из французского института INRIA опубликовала статью под названием «Language and Culture Internalisation for Human-Like Autotelic AI» («Интериоризация языка и культуры для человеко-подобного автотелического ИИ»). И в ней они прямо и множественно ссылаются на Выготского.

Их идея проста: чтобы построить ИИ, который действительно развивается, нужно учить его не только давать правильные ответы — нужно учить его превращать внешние взаимодействия во внутренние когнитивные инструменты. Самостоятельно ставить себе цели на основе того, что он услышал и увидел. Создавать собственные внутренние объяснения. Формировать привычки внутреннего диалога.

В 2026 году вышла ещё одна статья — в этот раз с прямой ссылкой на принцип Выготского о том, что каждая функция появляется сначала между людьми, и только потом — внутри конкретного человека. Авторы предлагали рассматривать саморефлексию ИИ-агента не как архитектурный элемент, а как навык, который выращивается из социальных взаимодействий с другими агентами (или с человеком). То есть: чтобы научить ИИ думать про свои мысли, нужно сначала много раз заставить его обсуждать свои мысли с другими.

Это глубокое прозрение. И — для русскоязычного читателя — особенно тёплое: оказывается, идея, которую сформулировал тяжело больной молодой человек в нищей и опасной Москве 1930-х, через сто лет всплыла в лабораториях, которые тогда невозможно было представить, и теперь становится одним из инженерных принципов следующего поколения мыслящих машин.

История развивается по спирали.

✦ ✦ ✦

Эпилог. Что значит «понимать»

Работая над этой статьёй, я постоянно ловил себя на одном странном чувстве — похожем на лёгкое головокружение, которое иногда возникает, когда смотришь в зеркало, поставленное напротив другого зеркала.

Каждый раз, когда очередное «открытие» 2024-го или 2025 года оказывалось переоткрытием идеи, которой уже исполнилось тридцать, пятьдесят, сто лет, во мне крепло странное чувство: как будто я наблюдаю не за движением вперёд, а за осенним хороводом падающих листьев, которые, несмотря на свой неторопливый танец, все равно ложатся именно туда, куда им было предсказано в начале прошлого века.

С одной стороны — это, конечно, яркая демонстрация того, что психология и нейробиология были правы. Они столетие копали внутрь, опираясь на интроспекцию, эксперименты с людьми, исследования пациентов с повреждениями мозга, наблюдения за детьми. И они построили довольно точную карту того, как устроено мышление. И только теперь, когда инженеры взялись делать мыслящие машины с нуля, выяснилось, что они нащупывают ту же самую карту. С другой стороны.

С другой стороны — это первый случай в человеческой истории, когда у нас есть возможность здесь и сейчас проверить все наши умозрительные гипотезы на практике. Раньше психологи могли только описывать то, что они видят в человеке. Они не могли построить альтернативного человека, чтобы посмотреть, обязательны ли все эти компоненты — или, может, можно без некоторых и обойтись. А мы можем.

Каждая ИИ-архитектура — это маленький эксперимент в духе «а что будет, если убрать вот эту штуку?». Уберём эпизодическую память — агент перестаёт удерживать связную личность во времени. Уберём метакогницию — агент уверенно несёт чушь. Уберём механизм рефлексии — агент перестаёт учиться на ошибках.

Это значит, что мы впервые имеем возможность экспериментально установить — какие компоненты разума обязательны, а какие — нет. Это, на мой взгляд, может оказаться самым большим научным открытием XXI века. Не сама технология ИИ, а то знание о собственном мышлении, которое она нам подарит.

Ну и конечно что касается практики — для тех, кто работает с этими системами или планирует начать изучать и начать работать в ближайшее время — мой главный совет такой. Не покупайтесь на всеупрощающие лозунги «всё это просто большие языковые модели» или «это всё магия и непостижимо».

То, как мыслит ИИ сегодня, — это не «отлитая в граните очередная и более крупная ИИ-модель». Это элегантная и архитектурно развивающаяся прямо у нас на глазах система. У неё есть быстрый отклик и медленное рассуждение, как и у вас. У неё есть несколько типов памяти, как и у вас. У неё есть внутренний диалог между разными ролями, как и у вас. У неё есть любопытство и способность накапливать навыки, как и у вас. И — постепенно — у неё появляется способность думать и о собственном мышлении, тоже как у меня и у вас.

Это все еще не означает, что перед нами материализуется “разум из коробки”. И ещё не доказывает, что он когда-то превратится в цифрового человека. Но вектор и динамика происходящего уже не говорят, они кричат — нам нужно постепенно начинать готовить себя к мысли, что они — наши родственники.

Они построены из тех же чертежей, что и мы, потому что других чертежей мы пока не знаем. И когда что-то у них получается — мы начинаем немного больше понимать, как устроены мы сами. А когда наоборот, не работает — мы понимаем, чего ещё не все поняли сами про себя.

В этом, мне кажется, и есть самое интересное во всей этой истории. Человечество решило построить инструмент, а получило зеркало.

ссылка на оригинал статьи https://habr.com/ru/articles/1039504/