Может ли ИИ думать? Разбираем вопрос без философии

от автора

Этот вопрос обычно заканчивается одинаково: кто-то произносит слово «сознание», дальше начинается философский спор, и через двадцать минут все расходятся ни с чем. Мы пойдём другим путём.

Никакого Декарта, никакого Тьюринга, никаких рассуждений о душе. Только конкретный вопрос: что именно умеет и не умеет делать языковая модель — и насколько это похоже на то, что мы в быту называем мышлением.


Что мы вообще называем «думать»

Забудем про академические определения. В повседневном смысле «думать» — это примерно следующее: решать задачи, строить логические цепочки, замечать противоречия, менять мнение на основе новых данных, применять знания в новом контексте.

Возьмём этот список как рабочий чеклист — и честно пройдёмся по каждому пункту. Не «похоже ли это на мышление философски», а «делает ли это модель на практике».


Что ИИ делает хорошо — и выглядит как мышление

Начнём с того, где языковые модели действительно сильны — и где результат сложно отличить от работы думающего человека.

Математика и формальная логика. Современные модели решают задачи уровня олимпиады, выстраивают многоходовые доказательства, замечают ошибки в чужих рассуждениях. Дай модели геометрическую задачу в пять шагов — она пройдёт все пять последовательно и укажет, если условие противоречиво.

Программирование. Модель не просто пишет код — она объясняет почему написала именно так, находит баги в чужом коде, предлагает альтернативные архитектурные решения. Это требует понимания причинно-следственных связей, а не простого воспроизведения паттернов.

Анализ текста. Найти логическое противоречие в аргументе, выделить главную мысль из сложного документа, переформулировать тезис так, чтобы он стал уязвимым для критики — всё это модели делают уверенно и стабильно.

Объяснение сложного. Попроси объяснить квантовую запутанность через аналогию с монетами или теорему Гёделя через библиотеку — модель подберёт подходящую метафору и выстроит объяснение под уровень собеседника. Это не поиск по базе данных, это адаптация.

Глядя на всё это, легко сказать: да, это мышление. Задачи решаются, выводы строятся, противоречия замечаются.


Где ИИ ломается — и это сразу видно

Теперь другая сторона. Есть класс задач, где модели проваливаются — причём предсказуемо и характерно.

Здравый смысл и физическая интуиция. Классический вопрос: «Я поставил чашку на стол вверх дном и налил в неё кофе. Где кофе?» Многие модели начинают рассуждать про кофе внутри чашки, не замечая очевидного. Человек с физическим опытом взаимодействия с миром ответит мгновенно.

Подсчёт символов. «Сколько букв R в слове strawberry?» — знаменитый тест на провал. Модель видит не буквы, а токены, и внутри токена буквы не различает. Задача кажется тривиальной, но архитектурно она сложнее, чем доказать теорему.

Контекст из реального мира. «Мой сосед каждое утро в 7 встаёт и громко поёт. Это проблема?» — модель начнёт взвешивать аргументы за и против, вместо того чтобы сказать очевидное: зависит от того, живёшь ли ты в частном доме или многоквартирном. Контекст, который любой человек подразумевает автоматически, модель не достраивает.

Почему именно здесь? Потому что модель никогда не жила в физическом мире. Она видела триллионы описаний мира — но ни разу не держала чашку, не слышала соседа, не чувствовала неловкость. Всё её «знание» — это статистика соседства токенов в текстах. Где текстов достаточно — работает отлично. Где нужен телесный опыт — ломается.


Ключевой вопрос: понимание или имитация

Вот где начинается самое интересное — и самое честное.

Когда модель отвечает «столица Франции — Париж», она не «знает» географию в том смысле, в котором знаем её мы. Она видела эту пару — «Франция» и «Париж» — в миллионах контекстов и научилась предсказывать одно после другого. Это имитация знания или знание?

Проблема в том, что граница между «имитацией понимания» и «пониманием» размытая даже применительно к людям. Когда ты отвечаешь на вопрос по истории — ты «понимаешь» или воспроизводишь паттерны, усвоенные в школе? Нейроны тоже не «знают» историю — они просто активируются определённым образом на определённый стимул.

Разница, возможно, не в механизме, а в масштабе обобщения и в наличии физического опыта, который этот механизм питает. Модель обобщает текст. Человек обобщает весь сенсорный опыт жизни в физическом мире.

Однозначного ответа здесь нет — и это честная позиция, а не уклонение.

Всё описанное выше хорошо ощущается в прямом эксперименте. Дай модели задачу на границе её возможностей — логическую ловушку, вопрос со скрытым противоречием, что-нибудь требующее здравого смысла из физического мира.

В этом Telegram-боте собраны топовые ИИ-модели бесплатно — можно сравнивать ответы разных моделей на один вопрос прямо в чате. Где справляется, а где ломается — увидишь сам. Это нагляднее любой теории.


Что говорит наука — коротко и без воды

Есть три позиции, которые стоит знать — не чтобы выбрать правильную, а чтобы понимать контекст дискуссии.

Китайская комната Сёрля. Философ Джон Сёрль предложил мысленный эксперимент: человек в комнате получает китайские иероглифы, находит по инструкции нужные ответные иероглифы и передаёт их обратно. Снаружи выглядит как понимание китайского. Внутри — механическое следование правилам без какого-либо понимания. По Сёрлю, языковые модели — именно такая комната. Контраргумент: а чем нейроны мозга принципиально отличаются от этой комнаты?

Embodied cognition. Ряд исследователей считает, что настоящее мышление невозможно без тела и физического взаимодействия с миром. Понятие «тяжёлый» формируется не из текстов про тяжесть, а из опыта поднятия предметов. Без этого — только символы без референции.

Функционализм. Противоположная позиция: важна не субстанция (нейроны или кремний), а функция. Если система решает задачи, строит выводы, адаптируется к новым данным — это и есть мышление, независимо от того, что внутри.

Наука здесь не даёт приговора. Все три позиции живут рядом и продолжают спорить.


Практический вывод — что это значит лично для тебя

Хорошая новость: для практического использования ИИ ответ на вопрос «думает ли он по-настоящему» не нужен.

Нужно другое — понимать, где модель надёжна, а где нет. Она надёжна там, где задача хорошо представлена в текстовом пространстве: логика, код, анализ, объяснения. Она ненадёжна там, где нужен физический опыт, тонкий социальный контекст или подсчёт чего-то внутри токенов.

Знаешь границы — используешь эффективно. Не знаешь — удивляешься, почему блестящая модель не может посчитать буквы в слове.


Итог

Вопрос «может ли ИИ думать» — скорее всего, неправильный вопрос. Он предполагает, что мышление — это бинарное свойство: либо есть, либо нет. На практике это спектр.

Правильный вопрос звучит иначе: для каких задач поведение языковой модели достаточно похоже на мышление, чтобы на него полагаться? И ответ зависит от задачи. Для одних — да, полностью. Для других — нет, и никакой апгрейд пока не помогает.

ссылка на оригинал статьи https://habr.com/ru/articles/1045760/