
В январе я написал на Хабре статью про Claude Code и ИИ-агентов для разработки. Она собрала почти 200 тысяч просмотров и нормальный такой спор про вайбкодинг в комментах. Тогда главный вопрос был: «Могут ли нейронки писать нормальный код?» Сейчас, я думаю, такой вопрос уже не стоит.
За последние месяцы я проводил консультации по ИИ-трансформации для бизнесов разных размеров в России и за рубежом. Картина везде примерно одна: компания компенсирует сотрудникам траты на Claude Code, Codex и Cursor, но в среднем не видит сильного прироста производительности, а сотрудники жалуются, что «ИИ плохо работает» и ему нужно постоянно объяснять одно и то же.
Причина в том, что все «знания» хранятся локально в маркдаун файлах на ноутбуках сотрудников. Каждому приходится заново объяснять бизнес задачи, копипастить результаты экспериментов и добавлять одни и те же правила написания кода. В результате полезная инфа оказывается всегда неполной и размазанной по людям.
Если вы выдали сотрудникам доступ к Claude, но не собираете знания об их работе, процессах, решениях и ошибках в одном месте, вы многое теряете.
Эта статья про следующий этап эволюции AI-нейтив компаний: централизованное хранение контекста.
Что на самом деле остаётся у компании
У любой ИИ-инфраструктуры есть три слоя.
|
Слой |
Примеры |
Кто владеет |
|---|---|---|
|
Вычисления модели |
OpenAI, Anthropic, OpenRouter, локальные модели |
поставщик |
|
Рабочий инструмент |
Claude Code, Codex, Cursor, OpenCode, скилы |
инструмент |
|
Контекст компании |
решения, процессы, ошибки, спецификации, клиенты |
вы |
Первые два слоя можно заменить. Сегодня вы используете Claude Code, завтра Codex. Модели тоже меняются: OpenAI, Anthropic, OpenRouter, китайские модели, локальный запуск.
А вот контекст остаётся вашим активом.

Если агент не знает, как устроен продукт, какие решения уже принимались, где лежат данные, какие слова нельзя использовать в коммуникации и почему год назад отказались от красивой идеи, он будет уверенно генерировать ерунду. Не потому что модель тупая — она гораздо умнее всех нас. А потому что вы дали ей неполную карту мира.
Как выглядит хаос на практике
Сильные сотрудники быстро заводят себе локальную память: CLAUDE.md или AGENTS.md, заметки с правилами проекта, инструкции для повторяемых задач, файлы с решениями, ошибками и «не делай так больше», куски документации, которые они каждый раз подсовывают агенту.
И получается странная ситуация: у одного сотрудника тот же самый агент умнее другого, а у кого-то каждый день начинается с объяснения очевидных вещей баден-баден.
Один человек уже десять раз объяснил агенту, почему нельзя делать X. Другой человек в соседней команде завтра попросит своего агента сделать ровно X. Агент радостно сделает, потому что в его мире этого урока никогда не было.
Фиксанули проблему для одного типа задач — отвалилось где-то в другом месте. Починили локальную инструкцию одного сотрудника — компания всё равно ничего не выучила.
Вот в этом и боль: знания не накапливаются на уровне организации.
Собираем контекст: гитхаб репо с маркдаун файлами
Самый простой способ начать собирать контекст — общий приватный репозиторий. По образу и подобию любимого набора скиллов gstack можно обернуть это в skill, а также настроить автообновление локальной копии и создание PR с добавлением новых знаний.
Тут нужна важная оговорка. Я не предлагаю слить все md файлы в одну папку и радоваться. Собирать надо не сырые чаты, не личные заметки и не секреты, а выжимки: решения, уроки, процессы, карты проектов, важные ограничения. Через проверку, права доступа и понятную политику импорта.
Иначе вместо «мозга компании» получится утечка компании.
Конечно, для хранения контекста исторически используют Confluence или Notion. Но их редко обновляют, информация неполная и быстро устаревает, а интеграция с агентами оставляет желать лучшего. Напишите в комментарии, если у вас в компании реально полная база знаний, куда вы или ваш агент часто заходите.
Почему файлов быстро становится мало
Markdown-файлы хорошо работают, пока их немного. Быстро их станет десятки, а-то и сотни тысяч.
С этим тоже можно работать: через индексы, через теггирование и пролинковку между файлами.
Но в какой-то момент вы упрётесь: агент будет либо читать слишком много файлов и тратить на это большую часть контекста, оставляя меньше места под полезную работу. Либо искать слишком узко, не находя нужное и повторяя старые ошибки.
Это одна из главных проблем управления контекстом. Большое окно контекста не решает её полностью. Если вы загрузили в него мусор, вы просто заняли много места мусором.
В идеале, нужен слой поиска и памяти, который:
-
ищет не только по оглавлению, ключевым словам, но и по смыслу (RAG и эмбеддинги)
-
возвращает короткий ответ со ссылками на источники
-
понимает связи между людьми, проектами, решениями и задачами
-
разделяет контекст по доступам
-
помогает находить устаревшие и противоречивые факты
-
позволяет нескольким агентам пользоваться одной и той же памятью.
А это уже пахнет отдельным self-hosted продуктом. Про один такой я вам и расскажу.
Немного истории: локально Claude, на сервере OpenClaw — контекст опять размазан
Если в январе 2026 вы были подключены к интернету, вы заметили волну хайпа вокруг проекта OpenClaw, сделавший AI агента проактивным: случился сдвиг парадигмы от «я напишу агенту, он ответит» к «агент сам мне напишет».
Таких always-on агентов запускают на сервере, чтобы у них была возможность работать 24/7. В результате получается фрагментация контекста: опять часть у вас на ноуте, а часть на сервере. Поэтому инвестировав много времени в настройку Claude Code, люди забивали на OpenClaw / Hermes Agent, обзывая их тупыми и бесполезными.
Централизованная память позволит также между ними шерить контекст. Поэтому у подобных решений вы часто увидете «память для OpenClaw / Hermes», хотя очевидно, что подключить ее можно куда угодно.
Требования к нормальной общей памяти: права доступа, ссылки на источники, короткие ответы, обновление знаний, поиск противоречий. GBrain — один из проектов, который это решает.
GBrain — централизованный контекст на стеройдах
GBrain — один из самых интересных проектов в этой области, созданным Garry Tan — главой Y Combinator. Его предыдущий проект — gstack (набор промптов, оцифровавший опыт акселлератора YC) — один из часто используемых мной, особенно когда я хочу начать новый проект или добавить фичу в существующий.
Идея в том, чтобы поставить над вашими файлами слой поиска, связей и синтеза. Markdown остаётся читаемым источником правды, а GBrain индексирует его, строит связи, даёт агентам поиск и умеет собирать ответ с ссылками на источники, а также правильно складывать новую инфу. Бенчмарки для красноглазиков можно посмотреть тут.
Подключается GBrain через MCP, также имеет свой skill. Вот тут офф гайд о том, как все засетапить.
Появляется новая категория инструментов, которые соревнуются не в том, «какая модель умнее», а в том, насколько хорошо они достают нужную память.
Уже есть и другие решения: OpenBrain, Engram, Mem0, Zep, Letta, LangMem, TencentDB Agent Memory. Не думаю, что сейчас есть смысл объявлять победителя. Важнее другое: рынок быстро понял, что контекст — это все, что у нас остается. Поэтому важно выбрать что-нибудь и начать внедрять, а не ждать, когда ваш любимый Confluence добавит нужные вам агентские фичи.
Ниже я расскажу о киллер-фичах GBrain, из-за которых я его полюбил.
Важные фичи GBrain: селф-хостед
У меня есть сервер под все свои проекты. Развернул там инстанс в докере по офф гайду, подключил Postgres и эмбеддинги от OpenAI. Выдал доступы локальном Codex и серверному Hermes — вот и всё. Магия началась.
Важные фичи GBrain: OAuth доступ
Много проектов? Много уровней доступа? Не хочется смешивать рабочее и личное?
В Obsidian терминологии это называлось vault. У GBrain это source.
Несколько моих source для примера:
-
Рабочий, чтобы можно было выдать туда доступ коллегам и шерить знания с ними, а не пересылать папки с md файлами.
-
Под каждый пет проект, чтобы партнеры тоже могли читать/писать.
-
Семейный (агент жены тоже должен быть в теме, сколько у нас денег)
-
И один секретный — подробности на ютубе.
Если у вас контекст пока в гитхабе, можно, конечно, распилить его между несколькими репозиториями, но пахнет костылём, не правда ли?
Важные фичи GBrain: синтез новых знаний
Одно дело положить все в одно место. Другое научиться доставать оттуда инфу самыми передовыми способами. Но можно ли по текущим знаниям понять что-то новое?
Да, конечно. Подключите и попросите gbrain найти пробелы в знаниях — он задаст вопросы — вы ответите — станет умнее вместе с вашим агентом. Также есть режим LSD (lateral synaptic drift), который находит далекие друг от друга идеи и «сталкивает» их друг с другом, позволяет найти неочевидные инсайты.
Я часто закидываю примерно такой промпт:
Изучи, что у нас уже известно по этому проекту, и задай мне важные вопросы.
Агент не просто исполняет задачу, а помогает найти дырки в вашей карте мира: какие решения не записаны, какие факты устарели, какой инсайт я в лоб не вижу.
Что делать дальше?
-
Соберите по коллегам все их локальные md файлы по проекту
-
Положите в общее репо или лучше в GBrain
-
Раздайте доступы
-
Замкните фидбек-луп, улучшая базу знаний после каждого использования
Модель можно сменить. Рабочий инструмент можно сменить. Cursor сегодня, Codex завтра, что-то новое через месяц.
Но если вы правильно сохраняете контекст, каждый следующий агент стартует умнее предыдущего. Если нет — у вас просто много дорогих вкладок с амнезией.
Не оставайтесь позади. Если вы или ваши сотрудники уже работают с ИИ-агентами, начните собирать контекст в одном месте уже сегодня. Через год это будет во всех AI-нейтив плейбуках.
Больше про агентов и AI-трансформацию у меня в тг канале.
ссылка на оригинал статьи https://habr.com/ru/articles/1043734/