Почему Claude Code и Codex не ускоряют команду: у компании нет общей памяти

В январе я написал на Хабре статью про Claude Code и ИИ-агентов для разработки. Она собрала почти 200 тысяч просмотров и нормальный такой спор про вайбкодинг в комментах. Тогда главный вопрос был: «Могут ли нейронки писать нормальный код?» Сейчас, я думаю, такой вопрос уже не стоит.

За последние месяцы я проводил консультации по ИИ-трансформации для бизнесов разных размеров в России и за рубежом. Картина везде примерно одна: компания компенсирует сотрудникам траты на Claude Code, Codex и Cursor, но в среднем не видит сильного прироста производительности, а сотрудники жалуются, что «ИИ плохо работает» и ему нужно постоянно объяснять одно и то же.

Причина в том, что все «знания» хранятся локально в маркдаун файлах на ноутбуках сотрудников. Каждому приходится заново объяснять бизнес задачи, копипастить результаты экспериментов и добавлять одни и те же правила написания кода. В результате полезная инфа оказывается всегда неполной и размазанной по людям.

Если вы выдали сотрудникам доступ к Claude, но не собираете знания об их работе, процессах, решениях и ошибках в одном месте, вы многое теряете.

Эта статья про следующий этап эволюции AI-нейтив компаний: централизованное хранение контекста.

Что на самом деле остаётся у компании

У любой ИИ-инфраструктуры есть три слоя.

Слой	Примеры	Кто владеет
Вычисления модели	OpenAI, Anthropic, OpenRouter, локальные модели	поставщик
Рабочий инструмент	Claude Code, Codex, Cursor, OpenCode, скилы	инструмент
Контекст компании	решения, процессы, ошибки, спецификации, клиенты	вы

Первые два слоя можно заменить. Сегодня вы используете Claude Code, завтра Codex. Модели тоже меняются: OpenAI, Anthropic, OpenRouter, китайские модели, локальный запуск.

А вот контекст остаётся вашим активом.

Если агент не знает, как устроен продукт, какие решения уже принимались, где лежат данные, какие слова нельзя использовать в коммуникации и почему год назад отказались от красивой идеи, он будет уверенно генерировать ерунду. Не потому что модель тупая — она гораздо умнее всех нас. А потому что вы дали ей неполную карту мира.

Как выглядит хаос на практике

Сильные сотрудники быстро заводят себе локальную память: CLAUDE.md или AGENTS.md, заметки с правилами проекта, инструкции для повторяемых задач, файлы с решениями, ошибками и «не делай так больше», куски документации, которые они каждый раз подсовывают агенту.

И получается странная ситуация: у одного сотрудника тот же самый агент умнее другого, а у кого-то каждый день начинается с объяснения очевидных вещей баден-баден.

Один человек уже десять раз объяснил агенту, почему нельзя делать X. Другой человек в соседней команде завтра попросит своего агента сделать ровно X. Агент радостно сделает, потому что в его мире этого урока никогда не было.

Фиксанули проблему для одного типа задач — отвалилось где-то в другом месте. Починили локальную инструкцию одного сотрудника — компания всё равно ничего не выучила.

Вот в этом и боль: знания не накапливаются на уровне организации.

Собираем контекст: гитхаб репо с маркдаун файлами

Самый простой способ начать собирать контекст — общий приватный репозиторий. По образу и подобию любимого набора скиллов gstack можно обернуть это в skill, а также настроить автообновление локальной копии и создание PR с добавлением новых знаний.

Тут нужна важная оговорка. Я не предлагаю слить все md файлы в одну папку и радоваться. Собирать надо не сырые чаты, не личные заметки и не секреты, а выжимки: решения, уроки, процессы, карты проектов, важные ограничения. Через проверку, права доступа и понятную политику импорта.

Иначе вместо «мозга компании» получится утечка компании.

Конечно, для хранения контекста исторически используют Confluence или Notion. Но их редко обновляют, информация неполная и быстро устаревает, а интеграция с агентами оставляет желать лучшего. Напишите в комментарии, если у вас в компании реально полная база знаний, куда вы или ваш агент часто заходите.

Почему файлов быстро становится мало

Markdown-файлы хорошо работают, пока их немного. Быстро их станет десятки, а-то и сотни тысяч.

С этим тоже можно работать: через индексы, через теггирование и пролинковку между файлами.

Но в какой-то момент вы упрётесь: агент будет либо читать слишком много файлов и тратить на это большую часть контекста, оставляя меньше места под полезную работу. Либо искать слишком узко, не находя нужное и повторяя старые ошибки.

Это одна из главных проблем управления контекстом. Большое окно контекста не решает её полностью. Если вы загрузили в него мусор, вы просто заняли много места мусором.

В идеале, нужен слой поиска и памяти, который:

ищет не только по оглавлению, ключевым словам, но и по смыслу (RAG и эмбеддинги)
возвращает короткий ответ со ссылками на источники
понимает связи между людьми, проектами, решениями и задачами
разделяет контекст по доступам
помогает находить устаревшие и противоречивые факты
позволяет нескольким агентам пользоваться одной и той же памятью.

А это уже пахнет отдельным self-hosted продуктом. Про один такой я вам и расскажу.

Немного истории: локально Claude, на сервере OpenClaw — контекст опять размазан

Если в январе 2026 вы были подключены к интернету, вы заметили волну хайпа вокруг проекта OpenClaw, сделавший AI агента проактивным: случился сдвиг парадигмы от «я напишу агенту, он ответит» к «агент сам мне напишет».

Таких always-on агентов запускают на сервере, чтобы у них была возможность работать 24/7. В результате получается фрагментация контекста: опять часть у вас на ноуте, а часть на сервере. Поэтому инвестировав много времени в настройку Claude Code, люди забивали на OpenClaw / Hermes Agent, обзывая их тупыми и бесполезными.

Централизованная память позволит также между ними шерить контекст. Поэтому у подобных решений вы часто увидете «память для OpenClaw / Hermes», хотя очевидно, что подключить ее можно куда угодно.

Требования к нормальной общей памяти: права доступа, ссылки на источники, короткие ответы, обновление знаний, поиск противоречий. GBrain — один из проектов, который это решает.

GBrain — централизованный контекст на стеройдах

GBrain — один из самых интересных проектов в этой области, созданным Garry Tan — главой Y Combinator. Его предыдущий проект — gstack (набор промптов, оцифровавший опыт акселлератора YC) — один из часто используемых мной, особенно когда я хочу начать новый проект или добавить фичу в существующий.

Идея в том, чтобы поставить над вашими файлами слой поиска, связей и синтеза. Markdown остаётся читаемым источником правды, а GBrain индексирует его, строит связи, даёт агентам поиск и умеет собирать ответ с ссылками на источники, а также правильно складывать новую инфу. Бенчмарки для красноглазиков можно посмотреть тут.

Подключается GBrain через MCP, также имеет свой skill. Вот тут офф гайд о том, как все засетапить.

Появляется новая категория инструментов, которые соревнуются не в том, «какая модель умнее», а в том, насколько хорошо они достают нужную память.

Уже есть и другие решения: OpenBrain, Engram, Mem0, Zep, Letta, LangMem, TencentDB Agent Memory. Не думаю, что сейчас есть смысл объявлять победителя. Важнее другое: рынок быстро понял, что контекст — это все, что у нас остается. Поэтому важно выбрать что-нибудь и начать внедрять, а не ждать, когда ваш любимый Confluence добавит нужные вам агентские фичи.

Ниже я расскажу о киллер-фичах GBrain, из-за которых я его полюбил.

Важные фичи GBrain: селф-хостед

У меня есть сервер под все свои проекты. Развернул там инстанс в докере по офф гайду, подключил Postgres и эмбеддинги от OpenAI. Выдал доступы локальном Codex и серверному Hermes — вот и всё. Магия началась.

Важные фичи GBrain: OAuth доступ

Много проектов? Много уровней доступа? Не хочется смешивать рабочее и личное?

В Obsidian терминологии это называлось vault. У GBrain это source.

Несколько моих source для примера:

Рабочий, чтобы можно было выдать туда доступ коллегам и шерить знания с ними, а не пересылать папки с md файлами.
Под каждый пет проект, чтобы партнеры тоже могли читать/писать.
Семейный (агент жены тоже должен быть в теме, сколько у нас денег)
И один секретный — подробности на ютубе.

Если у вас контекст пока в гитхабе, можно, конечно, распилить его между несколькими репозиториями, но пахнет костылём, не правда ли?

Важные фичи GBrain: синтез новых знаний

Одно дело положить все в одно место. Другое научиться доставать оттуда инфу самыми передовыми способами. Но можно ли по текущим знаниям понять что-то новое?

Да, конечно. Подключите и попросите gbrain найти пробелы в знаниях — он задаст вопросы — вы ответите — станет умнее вместе с вашим агентом. Также есть режим LSD (lateral synaptic drift), который находит далекие друг от друга идеи и «сталкивает» их друг с другом, позволяет найти неочевидные инсайты.

Я часто закидываю примерно такой промпт:

Изучи, что у нас уже известно по этому проекту, и задай мне важные вопросы.

Агент не просто исполняет задачу, а помогает найти дырки в вашей карте мира: какие решения не записаны, какие факты устарели, какой инсайт я в лоб не вижу.

Что делать дальше?

Соберите по коллегам все их локальные md файлы по проекту
Положите в общее репо или лучше в GBrain
Раздайте доступы
Замкните фидбек-луп, улучшая базу знаний после каждого использования

Модель можно сменить. Рабочий инструмент можно сменить. Cursor сегодня, Codex завтра, что-то новое через месяц.

Но если вы правильно сохраняете контекст, каждый следующий агент стартует умнее предыдущего. Если нет — у вас просто много дорогих вкладок с амнезией.

Не оставайтесь позади. Если вы или ваши сотрудники уже работают с ИИ-агентами, начните собирать контекст в одном месте уже сегодня. Через год это будет во всех AI-нейтив плейбуках.

Больше про агентов и AI-трансформацию у меня в тг канале.

ссылка на оригинал статьи https://habr.com/ru/articles/1043734/