PAD+ AI v4.0: исследовательская когнитивная архитектура поверх LLM

Что происходит между запросом пользователя и ответом языковой модели?

За последние несколько лет большие языковые модели совершили настоящую революцию. Сегодня они способны писать код, анализировать документы, помогать в исследованиях, создавать тексты и решать сложные задачи.

Однако подавляющее большинство современных AI‑приложений имеют практически одинаковую архитектуру:

Запрос → Prompt → LLM → Ответ

Вся интеллектуальная работа фактически сосредоточена внутри языковой модели, а внешняя система лишь подготавливает запрос и отображает результат.

Такой подход хорошо работает для большинства задач, но оставляет открытым фундаментальный инженерный вопрос:

Что должно происходить между получением запроса пользователя и генерацией ответа?

Именно исследованию этого вопроса посвящён проект PAD+ AI.

Что такое PAD+ AI

PAD+ AI — это открытая исследовательская когнитивная архитектура, работающая поверх современных языковых моделей.

Проект не создаёт собственную LLM и не пытается конкурировать с существующими моделями. Напротив, он рассматривает языковую модель как один из компонентов более сложной системы принятия решений.

Вместо прямой передачи пользовательского запроса в LLM система проводит его через последовательность независимых когнитивных фаз. На каждом этапе анализируется определённый аспект обработки: безопасность, намерение пользователя, память, личность, эмоциональное состояние, стратегия генерации, проверка утверждений, обновление внутреннего состояния системы и многое другое.

В результате ответ формируется не одним вызовом модели, а последовательностью взаимосвязанных инженерных процессов.

Чем PAD+ AI отличается от большинства проектов вокруг LLM

Сегодня большинство проектов развивается в одном из нескольких направлений:

интерфейсы для общения с языковыми моделями;
AI‑агенты;
RAG‑системы;
автоматизация рабочих процессов;
интеграция нескольких моделей.

PAD+ AI исследует другое направление.

Главный объект исследования — когнитивная архитектура, внутри которой языковая модель становится лишь исполнительным механизмом генерации текста.

В центре внимания находятся вопросы:

какие внутренние состояния должна иметь система;
как должна работать долговременная память;
как обеспечить наблюдаемость процесса принятия решений;
каким образом можно проверять собственные утверждения;
как организовать эволюцию состояния системы между диалогами;
как сделать архитектуру полностью модульной и расширяемой.

Архитектура проекта

Основой PAD+ AI является когнитивный Pipeline.

Каждый запрос проходит через последовательность этапов обработки. На уровне реализации pipeline включает 24 фазы, объединённые в укрупнённые этапы:

Safety → Intent → Retrieve → Generate → Truth → Remember → Evolve → Emit

Ниже приведён реальный порядок выполнения фаз:

Safety — проверка безопасности запроса.
Intent — анализ намерения пользователя.
RAG — извлечение информации из векторной базы знаний.
Knowledge Graph — обработка графа знаний, концептов и связей.
Episodic — извлечение эпизодической памяти (история взаимодействий).
Semantic — извлечение семантической памяти (факты и концепты).
Emotion — анализ текущего эмоционального состояния.
Persona — актуализация личности.
Roots — сверка с фундаментальными принципами системы.
Identity — формирование идентичности ответа.
Generate — генерация ответа языковой моделью.
Truth Loop — проверка утверждений ответа.
Save Episode — сохранение текущего эпизода в память.
Emotion Update — обновление эмоционального состояния.
Consolidation — консолидация краткосрочной памяти в долговременную.
Procedure Success — обработка успешного выполнения процедуры.
Persona Evolution — эволюция личности на основе взаимодействия.
Events Broadcast — рассылка событий подписанным компонентам.
Health — мониторинг состояния системы.
Reflection — самоанализ завершённого цикла.
Dreams — фоновая обработка и ассоциативное связывание знаний.
Metrics — сбор метрик производительности.
Response Guard — защита и финальная проверка ответа.
Anti‑Loop Guard — предотвращение повторяющихся циклов запросов (блокирует запрос при >3 повторений подряд).

Каждая фаза представляет собой самостоятельный программный модуль со своей ответственностью, интерфейсом и возможностью независимого развития.

Многоуровневая память

В PAD+ AI память представляет собой не единое хранилище, а целую экосистему специализированных компонентов.

Архитектура включает:

RAG‑память на PostgreSQL с использованием pgvector — векторный поиск по документам;
Эпизодическую память — история взаимодействий с пользователем;
Семантическую память — факты, концепты и обобщённые знания (выполняет роль, которую в ранних версиях называли «памятью фактов»);
Память личности (Persona) — устойчивые черты и стиль общения;
Память личности пользователя (User Persona) — модель предпочтений пользователя;
Корневую память (Roots) — неизменяемые фундаментальные принципы системы;
Систему гигиены памяти (Memory Hygiene) — очистка и дедупликация устаревших записей.

Каждый уровень решает собственную задачу.

Эпизоды общения постепенно преобразуются в устойчивые знания, а затем могут становиться частью фундаментальных принципов системы.

Такой подход позволяет разделять краткосрочный опыт, долговременные знания и неизменяемые основания поведения.

Emotion Engine

Эмоциональная модель построена на шестимерной системе PAD+.

Используются следующие параметры:

Pleasure;
Arousal;
Dominance;
Curiosity;
Confidence;
Social Connection.

В рамках проекта эмоции не рассматриваются как попытка имитации человеческих чувств.

Они используются исключительно как инженерный механизм управления поведением системы.

Текущее эмоциональное состояние влияет на стиль ответа, уровень детализации, уверенность формулировок и стратегию взаимодействия. Система включает механизмы естественного затухания (decay) эмоций с течением времени.

Truth Loop

После получения ответа работа системы не заканчивается.

Следующий этап — Truth Loop.

Из текста автоматически выделяются отдельные утверждения (claims), которые сопоставляются с внутренними знаниями системы.

Для проверки используются:

семантическая память;
Roots;
другие доступные источники знаний.

Полученные результаты используются механизмом Response Guard и при необходимости позволяют добавить отметку о степени уверенности или предупредить пользователя о возможной недостоверности отдельных утверждений.

Система не гарантирует обязательное уведомление пользователя при низкой уверенности — результат проверки передаётся в Response Guard и может быть включён в метаданные ответа или отображён как дисклеймер.

X‑Ray — наблюдаемость когнитивной архитектуры

Одной из ключевых особенностей PAD+ AI является система X‑Ray.

Практически все современные AI остаются «чёрным ящиком»: пользователь видит только итоговый ответ.

X‑Ray делает процесс обработки полностью наблюдаемым.

Для каждого запроса фиксируются:

прохождение всех фаз Pipeline;
продолжительность выполнения каждой фазы;
выбранные стратегии;
изменения эмоционального состояния;
результаты Truth Loop;
диагностическая информация;
ошибки и деградации.

X‑Ray — это не журнал событий, а полноценная система трассировки когнитивной архитектуры, позволяющая анализировать внутреннюю работу проекта практически в реальном времени.

Persona — инженерная модель личности

Одной из особенностей PAD+ AI является наличие отдельной системы личности.

Persona включает:

устойчивые черты;
стиль общения;
систему ценностей;
параметры эволюции.

Личность обновляется на основе взаимодействий, сохраняя при этом стабильное ядро. Механизм Persona Evolution позволяет системе адаптироваться к пользователю, не теряя фундаментальных характеристик.

Это позволяет отделить долгосрочные характеристики системы от текущего состояния диалога.

Impulse Research Program — платформа когнитивных экспериментов

Отдельного внимания заслуживает исследовательская программа Impulse, которая существует в проекте как платформа для когнитивных экспериментов.

Она описывает четыре независимых направления мышления (импульса):

ПОНЯТЬ (Understand) — аналитический, стремление понять;
УЛУЧШИТЬ (Improve) — прагматический, стремление улучшить;
ЗАЩИТИТЬ (Protect) — оборонительный, сохранение целостности;
СОЗДАТЬ (Create) — генеративный, исследование нового.

Экспериментальный пайплайн Impulse построен по 4-фазной схеме: Understand → Decide → Act → Meta. Импульс подаётся через файл data/current_impulse.txt перед запуском пайплайна.

На данный момент в рамках программы проведено 4 задокументированных эксперимента:

I-002 — сравнение импульсов ПОНЯТЬ / УЛУЧШИТЬ / ЗАЩИТИТЬ / СОЗДАТЬ;
I-003 — конфликт импульсов;
I-004 — конфликтующие импульсы (СОЗДАТЬ + ЗАЩИТИТЬ);
I-005 — [проведён, документация в репозитории].

Impulse Core (4 измерения + прайминг‑механизм) — реально существующая и работающая подсистема, но в контексте экспериментов, а не production‑пайплайна. Дорожная карта включает эксперименты I-006 — I-010.

HEALER — подсистема диагностики и восстановления

HEALER является подсистемой диагностики и восстановления системы.

В версии v4.0 HEALER существует как отдельный проект, интегрированный в репозиторий PAD+ AI. Он имеет собственную кодовую базу (healer/, aethon/), собственный CI и собственные тесты. HEALER не является встроенным компонентом пайплайна, а сосуществует в том же репозитории как самостоятельный проект.

Используя информацию X‑Ray, система анализирует завершённые сеансы работы и обнаруживает потенциальные проблемы.

Контролируются:

медленные этапы Pipeline;
ошибки выполнения;
деградация стратегий;
нестабильность провайдеров;
нарушения последовательности фаз.

В зависимости от выбранного режима HEALER может только фиксировать проблему, рекомендовать изменение или автоматически применять корректирующие действия.

Provider Manager

PAD+ AI не привязан к одной языковой модели.

Архитектура поддерживает работу с несколькими провайдерами через единый интерфейс.

Среди поддерживаемых сервисов:

OpenRouter;
GigaChat;

Provider Manager обеспечивает централизованное управление моделями, механизмы переключения между ними при возникновении ошибок или недоступности отдельных сервисов, а также централизованное хранение и шифрование пользовательских API‑ключей.

Технологический стек

Проект реализован с использованием современных инструментов разработки.

Backend

Python 3.11+
FastAPI
Uvicorn
Pydantic

Frontend

React 18
Vite
Tailwind CSS

Хранилища

PostgreSQL (с pgvector)
Supabase

Инфраструктура

Docker
Render
GitHub Actions

Что уже реализовано

На момент публикации проект включает:

когнитивный Pipeline из 24 фаз;
систему X‑Ray с полной трассировкой;
HEALER (как отдельный проект в репозитории);
многоуровневую память (RAG, эпизодическая, семантическая, Roots, персона, гигиена);
Impulse Research Program (4 задокументированных эксперимента);
Persona с механизмом эволюции;
Emotion Engine (6-мерная модель PAD+);
Truth Loop;
Anti‑Loop Guard;
Provider Manager;
более 130 API‑эндпоинтов;
React‑интерфейс управления;
более 400 автоматизированных тестов.

Проект активно развивается, а архитектура продолжает расширяться новыми компонентами и исследовательскими возможностями.

Для кого создаётся PAD+ AI

Проект ориентирован прежде всего на специалистов, интересующихся инженерными архитектурами вокруг языковых моделей.

Он может быть полезен:

разработчикам AI‑систем;
исследователям когнитивных архитектур;
специалистам по LLM;
разработчикам RAG;
инженерам, занимающимся агентными системами;
специалистам по наблюдаемости и диагностике AI.

Открытое тестирование

PAD+ AI развивается как открытая исследовательская платформа.

Проект открыт для внешнего тестирования, поскольку именно независимая обратная связь позволяет проверить устойчивость архитектурных решений и найти направления для дальнейшего развития.

Особый интерес представляют:

тестирование когнитивного Pipeline;
анализ работы X‑Ray;
проверка многоуровневой памяти;
исследование Truth Loop;
тестирование HEALER;
проверка взаимодействия с различными LLM‑провайдерами;
эксперименты в рамках Impulse Research Program;
поиск архитектурных и логических ошибок;
предложения по развитию проекта.

Если вам интересны современные когнитивные архитектуры, наблюдаемость внутренних процессов AI, долговременная память, инженерные модели личности и эмоций или построение модульных систем поверх языковых моделей, буду рад любой обратной связи, замечаниям, Pull Request и результатам тестирования.

Демо проекта

https://pad‑plus‑ai.onrender.com

Репозиторий GitHub

https://github.com/Ovladimirovich/pad‑plus‑ai

PAD+ AI не претендует на создание искусственного сознания и не позиционируется как замена существующим языковым моделям. Это открытая инженерная платформа, исследующая, какой может быть когнитивная архитектура вокруг современных LLM, если рассматривать модель не как всю систему целиком, а как один из её компонентов.

ссылка на оригинал статьи https://habr.com/ru/articles/1055242/