Что происходит между запросом пользователя и ответом языковой модели?
За последние несколько лет большие языковые модели совершили настоящую революцию. Сегодня они способны писать код, анализировать документы, помогать в исследованиях, создавать тексты и решать сложные задачи.
Однако подавляющее большинство современных AI‑приложений имеют практически одинаковую архитектуру:
Запрос → Prompt → LLM → Ответ
Вся интеллектуальная работа фактически сосредоточена внутри языковой модели, а внешняя система лишь подготавливает запрос и отображает результат.
Такой подход хорошо работает для большинства задач, но оставляет открытым фундаментальный инженерный вопрос:
Что должно происходить между получением запроса пользователя и генерацией ответа?
Именно исследованию этого вопроса посвящён проект PAD+ AI.
Что такое PAD+ AI
PAD+ AI — это открытая исследовательская когнитивная архитектура, работающая поверх современных языковых моделей.
Проект не создаёт собственную LLM и не пытается конкурировать с существующими моделями. Напротив, он рассматривает языковую модель как один из компонентов более сложной системы принятия решений.
Вместо прямой передачи пользовательского запроса в LLM система проводит его через последовательность независимых когнитивных фаз. На каждом этапе анализируется определённый аспект обработки: безопасность, намерение пользователя, память, личность, эмоциональное состояние, стратегия генерации, проверка утверждений, обновление внутреннего состояния системы и многое другое.
В результате ответ формируется не одним вызовом модели, а последовательностью взаимосвязанных инженерных процессов.
Чем PAD+ AI отличается от большинства проектов вокруг LLM
Сегодня большинство проектов развивается в одном из нескольких направлений:
-
интерфейсы для общения с языковыми моделями;
-
AI‑агенты;
-
RAG‑системы;
-
автоматизация рабочих процессов;
-
интеграция нескольких моделей.
PAD+ AI исследует другое направление.
Главный объект исследования — когнитивная архитектура, внутри которой языковая модель становится лишь исполнительным механизмом генерации текста.
В центре внимания находятся вопросы:
-
какие внутренние состояния должна иметь система;
-
как должна работать долговременная память;
-
как обеспечить наблюдаемость процесса принятия решений;
-
каким образом можно проверять собственные утверждения;
-
как организовать эволюцию состояния системы между диалогами;
-
как сделать архитектуру полностью модульной и расширяемой.
Архитектура проекта
Основой PAD+ AI является когнитивный Pipeline.
Каждый запрос проходит через последовательность этапов обработки. На уровне реализации pipeline включает 24 фазы, объединённые в укрупнённые этапы:
Safety → Intent → Retrieve → Generate → Truth → Remember → Evolve → Emit
Ниже приведён реальный порядок выполнения фаз:
-
Safety — проверка безопасности запроса.
-
Intent — анализ намерения пользователя.
-
RAG — извлечение информации из векторной базы знаний.
-
Knowledge Graph — обработка графа знаний, концептов и связей.
-
Episodic — извлечение эпизодической памяти (история взаимодействий).
-
Semantic — извлечение семантической памяти (факты и концепты).
-
Emotion — анализ текущего эмоционального состояния.
-
Persona — актуализация личности.
-
Roots — сверка с фундаментальными принципами системы.
-
Identity — формирование идентичности ответа.
-
Generate — генерация ответа языковой моделью.
-
Truth Loop — проверка утверждений ответа.
-
Save Episode — сохранение текущего эпизода в память.
-
Emotion Update — обновление эмоционального состояния.
-
Consolidation — консолидация краткосрочной памяти в долговременную.
-
Procedure Success — обработка успешного выполнения процедуры.
-
Persona Evolution — эволюция личности на основе взаимодействия.
-
Events Broadcast — рассылка событий подписанным компонентам.
-
Health — мониторинг состояния системы.
-
Reflection — самоанализ завершённого цикла.
-
Dreams — фоновая обработка и ассоциативное связывание знаний.
-
Metrics — сбор метрик производительности.
-
Response Guard — защита и финальная проверка ответа.
-
Anti‑Loop Guard — предотвращение повторяющихся циклов запросов (блокирует запрос при >3 повторений подряд).
Каждая фаза представляет собой самостоятельный программный модуль со своей ответственностью, интерфейсом и возможностью независимого развития.
Многоуровневая память
В PAD+ AI память представляет собой не единое хранилище, а целую экосистему специализированных компонентов.
Архитектура включает:
-
RAG‑память на PostgreSQL с использованием pgvector — векторный поиск по документам;
-
Эпизодическую память — история взаимодействий с пользователем;
-
Семантическую память — факты, концепты и обобщённые знания (выполняет роль, которую в ранних версиях называли «памятью фактов»);
-
Память личности (Persona) — устойчивые черты и стиль общения;
-
Память личности пользователя (User Persona) — модель предпочтений пользователя;
-
Корневую память (Roots) — неизменяемые фундаментальные принципы системы;
-
Систему гигиены памяти (Memory Hygiene) — очистка и дедупликация устаревших записей.
Каждый уровень решает собственную задачу.
Эпизоды общения постепенно преобразуются в устойчивые знания, а затем могут становиться частью фундаментальных принципов системы.
Такой подход позволяет разделять краткосрочный опыт, долговременные знания и неизменяемые основания поведения.
Emotion Engine
Эмоциональная модель построена на шестимерной системе PAD+.
Используются следующие параметры:
-
Pleasure;
-
Arousal;
-
Dominance;
-
Curiosity;
-
Confidence;
-
Social Connection.
В рамках проекта эмоции не рассматриваются как попытка имитации человеческих чувств.
Они используются исключительно как инженерный механизм управления поведением системы.
Текущее эмоциональное состояние влияет на стиль ответа, уровень детализации, уверенность формулировок и стратегию взаимодействия. Система включает механизмы естественного затухания (decay) эмоций с течением времени.
Truth Loop
После получения ответа работа системы не заканчивается.
Следующий этап — Truth Loop.
Из текста автоматически выделяются отдельные утверждения (claims), которые сопоставляются с внутренними знаниями системы.
Для проверки используются:
-
семантическая память;
-
Roots;
-
другие доступные источники знаний.
Полученные результаты используются механизмом Response Guard и при необходимости позволяют добавить отметку о степени уверенности или предупредить пользователя о возможной недостоверности отдельных утверждений.
Система не гарантирует обязательное уведомление пользователя при низкой уверенности — результат проверки передаётся в Response Guard и может быть включён в метаданные ответа или отображён как дисклеймер.
X‑Ray — наблюдаемость когнитивной архитектуры
Одной из ключевых особенностей PAD+ AI является система X‑Ray.
Практически все современные AI остаются «чёрным ящиком»: пользователь видит только итоговый ответ.
X‑Ray делает процесс обработки полностью наблюдаемым.
Для каждого запроса фиксируются:
-
прохождение всех фаз Pipeline;
-
продолжительность выполнения каждой фазы;
-
выбранные стратегии;
-
изменения эмоционального состояния;
-
результаты Truth Loop;
-
диагностическая информация;
-
ошибки и деградации.
X‑Ray — это не журнал событий, а полноценная система трассировки когнитивной архитектуры, позволяющая анализировать внутреннюю работу проекта практически в реальном времени.
Persona — инженерная модель личности
Одной из особенностей PAD+ AI является наличие отдельной системы личности.
Persona включает:
-
устойчивые черты;
-
стиль общения;
-
систему ценностей;
-
параметры эволюции.
Личность обновляется на основе взаимодействий, сохраняя при этом стабильное ядро. Механизм Persona Evolution позволяет системе адаптироваться к пользователю, не теряя фундаментальных характеристик.
Это позволяет отделить долгосрочные характеристики системы от текущего состояния диалога.
Impulse Research Program — платформа когнитивных экспериментов
Отдельного внимания заслуживает исследовательская программа Impulse, которая существует в проекте как платформа для когнитивных экспериментов.
Она описывает четыре независимых направления мышления (импульса):
-
ПОНЯТЬ (Understand) — аналитический, стремление понять;
-
УЛУЧШИТЬ (Improve) — прагматический, стремление улучшить;
-
ЗАЩИТИТЬ (Protect) — оборонительный, сохранение целостности;
-
СОЗДАТЬ (Create) — генеративный, исследование нового.
Экспериментальный пайплайн Impulse построен по 4-фазной схеме: Understand → Decide → Act → Meta. Импульс подаётся через файл data/current_impulse.txt перед запуском пайплайна.
На данный момент в рамках программы проведено 4 задокументированных эксперимента:
-
I-002 — сравнение импульсов ПОНЯТЬ / УЛУЧШИТЬ / ЗАЩИТИТЬ / СОЗДАТЬ;
-
I-003 — конфликт импульсов;
-
I-004 — конфликтующие импульсы (СОЗДАТЬ + ЗАЩИТИТЬ);
-
I-005 — [проведён, документация в репозитории].
Impulse Core (4 измерения + прайминг‑механизм) — реально существующая и работающая подсистема, но в контексте экспериментов, а не production‑пайплайна. Дорожная карта включает эксперименты I-006 — I-010.
HEALER — подсистема диагностики и восстановления
HEALER является подсистемой диагностики и восстановления системы.
В версии v4.0 HEALER существует как отдельный проект, интегрированный в репозиторий PAD+ AI. Он имеет собственную кодовую базу (
healer/,aethon/), собственный CI и собственные тесты. HEALER не является встроенным компонентом пайплайна, а сосуществует в том же репозитории как самостоятельный проект.
Используя информацию X‑Ray, система анализирует завершённые сеансы работы и обнаруживает потенциальные проблемы.
Контролируются:
-
медленные этапы Pipeline;
-
ошибки выполнения;
-
деградация стратегий;
-
нестабильность провайдеров;
-
нарушения последовательности фаз.
В зависимости от выбранного режима HEALER может только фиксировать проблему, рекомендовать изменение или автоматически применять корректирующие действия.
Provider Manager
PAD+ AI не привязан к одной языковой модели.
Архитектура поддерживает работу с несколькими провайдерами через единый интерфейс.
Среди поддерживаемых сервисов:
-
OpenRouter;
-
GigaChat;
Provider Manager обеспечивает централизованное управление моделями, механизмы переключения между ними при возникновении ошибок или недоступности отдельных сервисов, а также централизованное хранение и шифрование пользовательских API‑ключей.
Технологический стек
Проект реализован с использованием современных инструментов разработки.
Backend
-
Python 3.11+
-
FastAPI
-
Uvicorn
-
Pydantic
Frontend
-
React 18
-
Vite
-
Tailwind CSS
Хранилища
-
PostgreSQL (с pgvector)
-
Supabase
Инфраструктура
-
Docker
-
Render
-
GitHub Actions
Что уже реализовано
На момент публикации проект включает:
-
когнитивный Pipeline из 24 фаз;
-
систему X‑Ray с полной трассировкой;
-
HEALER (как отдельный проект в репозитории);
-
многоуровневую память (RAG, эпизодическая, семантическая, Roots, персона, гигиена);
-
Impulse Research Program (4 задокументированных эксперимента);
-
Persona с механизмом эволюции;
-
Emotion Engine (6-мерная модель PAD+);
-
Truth Loop;
-
Anti‑Loop Guard;
-
Provider Manager;
-
более 130 API‑эндпоинтов;
-
React‑интерфейс управления;
-
более 400 автоматизированных тестов.
Проект активно развивается, а архитектура продолжает расширяться новыми компонентами и исследовательскими возможностями.
Для кого создаётся PAD+ AI
Проект ориентирован прежде всего на специалистов, интересующихся инженерными архитектурами вокруг языковых моделей.
Он может быть полезен:
-
разработчикам AI‑систем;
-
исследователям когнитивных архитектур;
-
специалистам по LLM;
-
разработчикам RAG;
-
инженерам, занимающимся агентными системами;
-
специалистам по наблюдаемости и диагностике AI.
Открытое тестирование
PAD+ AI развивается как открытая исследовательская платформа.
Проект открыт для внешнего тестирования, поскольку именно независимая обратная связь позволяет проверить устойчивость архитектурных решений и найти направления для дальнейшего развития.
Особый интерес представляют:
-
тестирование когнитивного Pipeline;
-
анализ работы X‑Ray;
-
проверка многоуровневой памяти;
-
исследование Truth Loop;
-
тестирование HEALER;
-
проверка взаимодействия с различными LLM‑провайдерами;
-
эксперименты в рамках Impulse Research Program;
-
поиск архитектурных и логических ошибок;
-
предложения по развитию проекта.
Если вам интересны современные когнитивные архитектуры, наблюдаемость внутренних процессов AI, долговременная память, инженерные модели личности и эмоций или построение модульных систем поверх языковых моделей, буду рад любой обратной связи, замечаниям, Pull Request и результатам тестирования.
Демо проекта
https://pad‑plus‑ai.onrender.com
Репозиторий GitHub
https://github.com/Ovladimirovich/pad‑plus‑ai
PAD+ AI не претендует на создание искусственного сознания и не позиционируется как замена существующим языковым моделям. Это открытая инженерная платформа, исследующая, какой может быть когнитивная архитектура вокруг современных LLM, если рассматривать модель не как всю систему целиком, а как один из её компонентов.
ссылка на оригинал статьи https://habr.com/ru/articles/1055242/