PAD+ AI v4.0: исследовательская когнитивная архитектура поверх LLM

от автора

Что происходит между запросом пользователя и ответом языковой модели?

За последние несколько лет большие языковые модели совершили настоящую революцию. Сегодня они способны писать код, анализировать документы, помогать в исследованиях, создавать тексты и решать сложные задачи.

Однако подавляющее большинство современных AI‑приложений имеют практически одинаковую архитектуру:

Запрос → Prompt → LLM → Ответ

Вся интеллектуальная работа фактически сосредоточена внутри языковой модели, а внешняя система лишь подготавливает запрос и отображает результат.

Такой подход хорошо работает для большинства задач, но оставляет открытым фундаментальный инженерный вопрос:

Что должно происходить между получением запроса пользователя и генерацией ответа?

Именно исследованию этого вопроса посвящён проект PAD+ AI.


Что такое PAD+ AI

PAD+ AI — это открытая исследовательская когнитивная архитектура, работающая поверх современных языковых моделей.

Проект не создаёт собственную LLM и не пытается конкурировать с существующими моделями. Напротив, он рассматривает языковую модель как один из компонентов более сложной системы принятия решений.

Вместо прямой передачи пользовательского запроса в LLM система проводит его через последовательность независимых когнитивных фаз. На каждом этапе анализируется определённый аспект обработки: безопасность, намерение пользователя, память, личность, эмоциональное состояние, стратегия генерации, проверка утверждений, обновление внутреннего состояния системы и многое другое.

В результате ответ формируется не одним вызовом модели, а последовательностью взаимосвязанных инженерных процессов.


Чем PAD+ AI отличается от большинства проектов вокруг LLM

Сегодня большинство проектов развивается в одном из нескольких направлений:

  • интерфейсы для общения с языковыми моделями;

  • AI‑агенты;

  • RAG‑системы;

  • автоматизация рабочих процессов;

  • интеграция нескольких моделей.

PAD+ AI исследует другое направление.

Главный объект исследования — когнитивная архитектура, внутри которой языковая модель становится лишь исполнительным механизмом генерации текста.

В центре внимания находятся вопросы:

  • какие внутренние состояния должна иметь система;

  • как должна работать долговременная память;

  • как обеспечить наблюдаемость процесса принятия решений;

  • каким образом можно проверять собственные утверждения;

  • как организовать эволюцию состояния системы между диалогами;

  • как сделать архитектуру полностью модульной и расширяемой.


Архитектура проекта

Основой PAD+ AI является когнитивный Pipeline.

Каждый запрос проходит через последовательность этапов обработки. На уровне реализации pipeline включает 24 фазы, объединённые в укрупнённые этапы:

Safety → Intent → Retrieve → Generate → Truth → Remember → Evolve → Emit

Ниже приведён реальный порядок выполнения фаз:

  1. Safety — проверка безопасности запроса.

  2. Intent — анализ намерения пользователя.

  3. RAG — извлечение информации из векторной базы знаний.

  4. Knowledge Graph — обработка графа знаний, концептов и связей.

  5. Episodic — извлечение эпизодической памяти (история взаимодействий).

  6. Semantic — извлечение семантической памяти (факты и концепты).

  7. Emotion — анализ текущего эмоционального состояния.

  8. Persona — актуализация личности.

  9. Roots — сверка с фундаментальными принципами системы.

  10. Identity — формирование идентичности ответа.

  11. Generate — генерация ответа языковой моделью.

  12. Truth Loop — проверка утверждений ответа.

  13. Save Episode — сохранение текущего эпизода в память.

  14. Emotion Update — обновление эмоционального состояния.

  15. Consolidation — консолидация краткосрочной памяти в долговременную.

  16. Procedure Success — обработка успешного выполнения процедуры.

  17. Persona Evolution — эволюция личности на основе взаимодействия.

  18. Events Broadcast — рассылка событий подписанным компонентам.

  19. Health — мониторинг состояния системы.

  20. Reflection — самоанализ завершённого цикла.

  21. Dreams — фоновая обработка и ассоциативное связывание знаний.

  22. Metrics — сбор метрик производительности.

  23. Response Guard — защита и финальная проверка ответа.

  24. Anti‑Loop Guard — предотвращение повторяющихся циклов запросов (блокирует запрос при >3 повторений подряд).

Каждая фаза представляет собой самостоятельный программный модуль со своей ответственностью, интерфейсом и возможностью независимого развития.


Многоуровневая память

В PAD+ AI память представляет собой не единое хранилище, а целую экосистему специализированных компонентов.

Архитектура включает:

  • RAG‑память на PostgreSQL с использованием pgvector — векторный поиск по документам;

  • Эпизодическую память — история взаимодействий с пользователем;

  • Семантическую память — факты, концепты и обобщённые знания (выполняет роль, которую в ранних версиях называли «памятью фактов»);

  • Память личности (Persona) — устойчивые черты и стиль общения;

  • Память личности пользователя (User Persona) — модель предпочтений пользователя;

  • Корневую память (Roots) — неизменяемые фундаментальные принципы системы;

  • Систему гигиены памяти (Memory Hygiene) — очистка и дедупликация устаревших записей.

Каждый уровень решает собственную задачу.

Эпизоды общения постепенно преобразуются в устойчивые знания, а затем могут становиться частью фундаментальных принципов системы.

Такой подход позволяет разделять краткосрочный опыт, долговременные знания и неизменяемые основания поведения.


Emotion Engine

Эмоциональная модель построена на шестимерной системе PAD+.

Используются следующие параметры:

  • Pleasure;

  • Arousal;

  • Dominance;

  • Curiosity;

  • Confidence;

  • Social Connection.

В рамках проекта эмоции не рассматриваются как попытка имитации человеческих чувств.

Они используются исключительно как инженерный механизм управления поведением системы.

Текущее эмоциональное состояние влияет на стиль ответа, уровень детализации, уверенность формулировок и стратегию взаимодействия. Система включает механизмы естественного затухания (decay) эмоций с течением времени.


Truth Loop

После получения ответа работа системы не заканчивается.

Следующий этап — Truth Loop.

Из текста автоматически выделяются отдельные утверждения (claims), которые сопоставляются с внутренними знаниями системы.

Для проверки используются:

  • семантическая память;

  • Roots;

  • другие доступные источники знаний.

Полученные результаты используются механизмом Response Guard и при необходимости позволяют добавить отметку о степени уверенности или предупредить пользователя о возможной недостоверности отдельных утверждений.

Система не гарантирует обязательное уведомление пользователя при низкой уверенности — результат проверки передаётся в Response Guard и может быть включён в метаданные ответа или отображён как дисклеймер.


X‑Ray — наблюдаемость когнитивной архитектуры

Одной из ключевых особенностей PAD+ AI является система X‑Ray.

Практически все современные AI остаются «чёрным ящиком»: пользователь видит только итоговый ответ.

X‑Ray делает процесс обработки полностью наблюдаемым.

Для каждого запроса фиксируются:

  • прохождение всех фаз Pipeline;

  • продолжительность выполнения каждой фазы;

  • выбранные стратегии;

  • изменения эмоционального состояния;

  • результаты Truth Loop;

  • диагностическая информация;

  • ошибки и деградации.

X‑Ray — это не журнал событий, а полноценная система трассировки когнитивной архитектуры, позволяющая анализировать внутреннюю работу проекта практически в реальном времени.


Persona — инженерная модель личности

Одной из особенностей PAD+ AI является наличие отдельной системы личности.

Persona включает:

  • устойчивые черты;

  • стиль общения;

  • систему ценностей;

  • параметры эволюции.

Личность обновляется на основе взаимодействий, сохраняя при этом стабильное ядро. Механизм Persona Evolution позволяет системе адаптироваться к пользователю, не теряя фундаментальных характеристик.

Это позволяет отделить долгосрочные характеристики системы от текущего состояния диалога.


Impulse Research Program — платформа когнитивных экспериментов

Отдельного внимания заслуживает исследовательская программа Impulse, которая существует в проекте как платформа для когнитивных экспериментов.

Она описывает четыре независимых направления мышления (импульса):

  • ПОНЯТЬ (Understand) — аналитический, стремление понять;

  • УЛУЧШИТЬ (Improve) — прагматический, стремление улучшить;

  • ЗАЩИТИТЬ (Protect) — оборонительный, сохранение целостности;

  • СОЗДАТЬ (Create) — генеративный, исследование нового.

Экспериментальный пайплайн Impulse построен по 4-фазной схеме: Understand → Decide → Act → Meta. Импульс подаётся через файл data/current_impulse.txt перед запуском пайплайна.

На данный момент в рамках программы проведено 4 задокументированных эксперимента:

  • I-002 — сравнение импульсов ПОНЯТЬ / УЛУЧШИТЬ / ЗАЩИТИТЬ / СОЗДАТЬ;

  • I-003 — конфликт импульсов;

  • I-004 — конфликтующие импульсы (СОЗДАТЬ + ЗАЩИТИТЬ);

  • I-005 — [проведён, документация в репозитории].

Impulse Core (4 измерения + прайминг‑механизм) — реально существующая и работающая подсистема, но в контексте экспериментов, а не production‑пайплайна. Дорожная карта включает эксперименты I-006 — I-010.


HEALER — подсистема диагностики и восстановления

HEALER является подсистемой диагностики и восстановления системы.

В версии v4.0 HEALER существует как отдельный проект, интегрированный в репозиторий PAD+ AI. Он имеет собственную кодовую базу (healer/, aethon/), собственный CI и собственные тесты. HEALER не является встроенным компонентом пайплайна, а сосуществует в том же репозитории как самостоятельный проект.

Используя информацию X‑Ray, система анализирует завершённые сеансы работы и обнаруживает потенциальные проблемы.

Контролируются:

  • медленные этапы Pipeline;

  • ошибки выполнения;

  • деградация стратегий;

  • нестабильность провайдеров;

  • нарушения последовательности фаз.

В зависимости от выбранного режима HEALER может только фиксировать проблему, рекомендовать изменение или автоматически применять корректирующие действия.


Provider Manager

PAD+ AI не привязан к одной языковой модели.

Архитектура поддерживает работу с несколькими провайдерами через единый интерфейс.

Среди поддерживаемых сервисов:

  • OpenRouter;

  • GigaChat;

Provider Manager обеспечивает централизованное управление моделями, механизмы переключения между ними при возникновении ошибок или недоступности отдельных сервисов, а также централизованное хранение и шифрование пользовательских API‑ключей.


Технологический стек

Проект реализован с использованием современных инструментов разработки.

Backend

  • Python 3.11+

  • FastAPI

  • Uvicorn

  • Pydantic

Frontend

  • React 18

  • Vite

  • Tailwind CSS

Хранилища

  • PostgreSQL (с pgvector)

  • Supabase

Инфраструктура

  • Docker

  • Render

  • GitHub Actions


Что уже реализовано

На момент публикации проект включает:

  • когнитивный Pipeline из 24 фаз;

  • систему X‑Ray с полной трассировкой;

  • HEALER (как отдельный проект в репозитории);

  • многоуровневую память (RAG, эпизодическая, семантическая, Roots, персона, гигиена);

  • Impulse Research Program (4 задокументированных эксперимента);

  • Persona с механизмом эволюции;

  • Emotion Engine (6-мерная модель PAD+);

  • Truth Loop;

  • Anti‑Loop Guard;

  • Provider Manager;

  • более 130 API‑эндпоинтов;

  • React‑интерфейс управления;

  • более 400 автоматизированных тестов.

Проект активно развивается, а архитектура продолжает расширяться новыми компонентами и исследовательскими возможностями.


Для кого создаётся PAD+ AI

Проект ориентирован прежде всего на специалистов, интересующихся инженерными архитектурами вокруг языковых моделей.

Он может быть полезен:

  • разработчикам AI‑систем;

  • исследователям когнитивных архитектур;

  • специалистам по LLM;

  • разработчикам RAG;

  • инженерам, занимающимся агентными системами;

  • специалистам по наблюдаемости и диагностике AI.


Открытое тестирование

PAD+ AI развивается как открытая исследовательская платформа.

Проект открыт для внешнего тестирования, поскольку именно независимая обратная связь позволяет проверить устойчивость архитектурных решений и найти направления для дальнейшего развития.

Особый интерес представляют:

  • тестирование когнитивного Pipeline;

  • анализ работы X‑Ray;

  • проверка многоуровневой памяти;

  • исследование Truth Loop;

  • тестирование HEALER;

  • проверка взаимодействия с различными LLM‑провайдерами;

  • эксперименты в рамках Impulse Research Program;

  • поиск архитектурных и логических ошибок;

  • предложения по развитию проекта.

Если вам интересны современные когнитивные архитектуры, наблюдаемость внутренних процессов AI, долговременная память, инженерные модели личности и эмоций или построение модульных систем поверх языковых моделей, буду рад любой обратной связи, замечаниям, Pull Request и результатам тестирования.

Демо проекта

https://pad‑plus‑ai.onrender.com

Репозиторий GitHub

https://github.com/Ovladimirovich/pad‑plus‑ai

PAD+ AI не претендует на создание искусственного сознания и не позиционируется как замена существующим языковым моделям. Это открытая инженерная платформа, исследующая, какой может быть когнитивная архитектура вокруг современных LLM, если рассматривать модель не как всю систему целиком, а как один из её компонентов.

ссылка на оригинал статьи https://habr.com/ru/articles/1055242/