Личный агент за вечер: разведка Claude Managed Agents глазами не‑разработчика

от автора

Раз отовсюду — «агенты, агенты, я всю работу отдал AI‑агентам, а сам чилю на Бали» — собрал себе одного. Пробую, делюсь впечатлениями.

Сразу обещание: это не пошаговая инструкция. Это история одного вечера и выводы — куда  оно движется и стоит ли уже сейчас этим заниматься.

Зачем мне вообще агент

Спросить что‑то у ChatGPT — уже давно не экзотика. Мне уже привычно взаимодействовать с AI по рабочим вопросам, планировать, придумывать. Сейчас как ни откроешь мессенджер — всюду: «автоматизировал работу через агента», «агент сам пишет код», «агент готовит отчёты по утрам». Кто‑то отвечает на письма за себя. Кто‑то ищет работу. Кто‑то делает рутину, к которой не хочется возвращаться.

Надо разобраться — если есть что‑то, что облегчит мою рутину, почему бы не воспользоваться? Например, хочется читать за обедом интересующие статьи, но не хочется продираться через весь мессадж‑сёрфинг.

Вот же оно. Простая, проверяемая задача для агента. Дать ему пять источников, попросить раз в неделю‑другую читать их за меня и присылать сводку за обедом. Что важно, кого читать, что я мог пропустить.

Я выбрал Claude Managed Agents — Anthropic запустила это в апреле в открытую бету, обещая что‑то про «низкий порог входа». Решил проверить буквально.


Почему именно Managed Agents от Anthropic

Для первого касания, разведки хочется чего‑то доступного — без поднятия серверов и настроек. Значит, managed‑сервис. А если managed — то Claude: он мой основной рабочий инструмент, доволен результатами, логично развиваться в одной экосистеме. Если не получится или не будет ожидаемых результатов — пойду в другую сторону.

Claude Managed Agents — Anthropic в апреле запустила это в открытую бету, обещая, что «от прототипа до запуска — за дни». Звучит как обещание низкого порога входа. Это и хочу проверить — как обычный пользователь, не как разработчик, без терминала и Python.

Закинул деньги на API Anthropic и в путь.

platform.claude.com, нашёл в боковом меню «Managed Agents → Quickstart». Тут у нас, десяток готовых шаблонов прямо на главном экране.

Главный экран Managed Agents Quickstart — десять готовых шаблонов под разные сценарии

Главный экран Managed Agents Quickstart — десять готовых шаблонов под разные сценарии

Такой реальный Quickstart, готовые конфигурации под конкретные сценарии. Deep researcher — глубокий ресёрч с цитированием. Field monitor — еженедельная сводка по теме. Incident commander — обработка алертов из Sentry с тикетом в Linear и веткой в Slack. Sprint retro facilitator — синтез ретро из задач Linear в готовый документ. И ещё несколько в том же духе.

Anthropic явно показывает карту того, под что заточен продукт. Конкретные сценарии вместо общих обещаний.

Мне для моего дайджеста ближе всего Field monitor — он буквально про мою задачу: «еженедельная сводка изменений в выбранной области». Беру его за основу. Дальше посмотрим, насколько он подойдёт и что придётся подкручивать.


Setup за 20 минут — как казалось

Кликнул на Field monitor. Открылся YAML конфиг агента — model, system prompt со списком шагов, инструменты. В system prompt вижу: ищет посты в arXiv, Hacker News, известных блогах, кластеризует по темам, для каждого кластера пишет короткий синтез + 2–3 источника + «so what» линию. И записывает результат страницей в Notion.

Шаблон Field monitor — YAML с system prompt, MCP-сервером Notion и набором инструментов

Шаблон Field monitor — YAML с system prompt, MCP‑сервером Notion и набором инструментов

Почти моя задача. Только мне не нужен arXiv и Notion, нужен LangChain blog и просто markdown‑файл. Хорошо, поправлю.

И тут первое удивление — YAML напрямую отредактировать нельзя. Поля только для просмотра, не для редактирования. Зато справа панель чата. То есть менять конфиг можно только через диалог с агентом‑помощником, который сам отредактирует YAML за меня.

Странно. С другой стороны — наверное, так и задумано. Если правишь руками, легко сломать структуру, по которой агент потом работает. А он в момент выполнения не сможет переспросить «что вы тут имели в виду». Получается осознанный компромисс — теряем удобство прямого редактирования, зато гарантируем что конфиг останется валидным.

Накидал в чат что хочу изменить: убрать arXiv и lobste.rs, добавить мои источники, заменить запись в Notion на markdown‑файл, не нужны MCP‑серверы. Console обработал — YAML обновился. Вижу новое имя: AI Agents Field Digest. Источники мои. Шаг 5 — запись в /home/agent/digests/digest-YYYY-MM-DD.md.

YAML напрямую отредактировать нельзя — только через диалог с агентом-помощником

YAML напрямую отредактировать нельзя — только через диалог с агентом‑помощником

Создал агента. Дальше environment — контейнер где он будет работать. Думал увижу что‑то техническое: настройки сети, ресурсов. А Console задаёт вопрос:

«Этому агенту нужно ходить на несколько внешних сайтов (Anthropic, OpenAI, LangChain, Hacker News). Какие сетевые правила?»

Три кнопки: Unrestricted / Limited to required hosts / Something else.

Console сам прочитал system prompt, вытащил домены и предложил выбор человеческим языком

Console сам прочитал system prompt, вытащил домены и предложил выбор человеческим языком

Это второе удивление. Console сам прочитал мой system prompt, вытащил оттуда домены и предложил выбор человеческим языком. Не «настройте network policies в YAML», а нормальный вопрос с понятными вариантами. Как, в некотором смысле причастный к UX — это сильно.

Выбрал Limited. Console показал curl с готовым конфигом environment — те же 5 доменов, networking type «limited», allow_package_managers false. Всё аккуратно собрано за меня.

Каждый шаг в Console сопровождается готовым curl — это и есть Console-first подход

Каждый шаг в Console сопровождается готовым curl — это и есть Console-first подход

Хорошо. Агент есть, environment есть. Третий шаг — Start session.

В правой панели появилась кнопка Test run. Нажимаю. Console предлагает написать первое сообщение для агента. Пишу:

«Сгенерируй сегодняшний дайджест по AI‑агентам и managed agents за последние 7 дней. Кластеризуй по темам, по 2–3 предложения на кластер со ссылками на источники, сохрани как markdown с датой.»

Console отвечает:

«Агент получил ваш запрос и сейчас начнёт работать. Сессия running. Можете смотреть поток событий справа.»

Жду.


И тут начались сложности

Минута. Две. Пять. На экране всё ещё «Session running…». Справа — event‑панель, в которой пусто. Ни одного события.

Console пишет «Session running...» — а в реальности агент ничего не делает, событие user.message не отправлено

Console пишет «Session running…» — а в реальности агент ничего не делает, событие user.message не отправлено

Думаю — может, проблема с UI? Может, события пишутся, а до меня не доезжают? Перезагружаю страницу.

И выпадаю на главный экран Quickstart. Куда делась моя сессия — непонятно.

Иду в сайдбар, нахожу раздел Sessions. Открываю — она там. Статус Idle. Создана 16 минут назад. И в углу баланс — минус 77 центов.

Открываю саму сессию. Внутри — пусто. «No events yet. Events will appear here as they occur.»

18 минут спустя — сессия в статусе Idle, никаких событий, минус 77 центов с баланса

18 минут спустя — сессия в статусе Idle, никаких событий, минус 77 центов с баланса

Сижу. Смотрю на экран. Не понимаю. Деньги списались. Никакого результата. Никаких событий. Что вообще произошло?

Тыкаю по интерфейсу — Transcript, Debug, фильтры. Везде пусто. Открываю боковое меню Events, Environments — там моя сессия и мой environment, но что внутри произошло — нигде не видно. Как будто запустил программу, а где её состояние смотреть — не показывают.

В правом верхнем углу замечаю кнопку — Ask Claude. Раньше не обращал внимания. Нажимаю. Открывается сайдбар с четырьмя готовыми вопросами:

  • Identify errors

  • Analyze performance

  • Trace conversation flow

  • Suggest improvements

Логично. Claude помогает разобраться с тем, что делал Claude. В разведке это очень удобно.

Кликаю Identify errors. Helper отвечает:

“Session never executed. Status idle, events empty, token usage 0. Creating a session only provisions the container — the agent won’t do anything until it receives an event to kick it off.”

Перевожу для себя: сессия никогда не запускалась. Я нажал Test run, увидел «running», Console написал «агент начнёт работать», контейнер поднялся — но никакого user.message в сессию не пошло. Запуск был обещанием, не реальностью.

Helper тут же предлагает решение: отправить event программно — через Python SDK или curl.

Уже почти полез в Python — установить пакет, написать пять строк кода. Я не программист, но curl‑команды копировать умею. Но остановился разобраться: неужели нет способа взаимодействовать с сессией прямо в UI? Решаю ещё раз посмотреть UI повнимательнее — может, есть что‑то, что я пропустил.

В правом верхнем углу, рядом с Ask Claude, замечаю кнопку Actions. Раньше не заходил. Открываю dropdown:

  • Send interrupt

  • Send event…

  • Archive session

Helper говорит «только через SDK или curl», а в меню Actions есть кнопка Send event — продукт развивается быстрее доков

Helper говорит «только через SDK или curl», а в меню Actions есть кнопка Send event — продукт развивается быстрее доков

То есть отправить event в сессию можно прямо через UI. Без SDK, без curl, без Python. Просто в Console. Helper про неё не знал. Документация отстаёт от реального UI.

Нажимаю Send event. Открывается окно для сообщения. Пишу тот же запрос про дайджест. Отправляю.

Status сменился на Running. В transcript начали появляться события: user.message, agent.message, потом первый tool_use.

После Send event сессия наконец перешла в Running, и появились первые события

После Send event сессия наконец перешла в Running, и появились первые события

Внизу появилось поле «Send a message to the agent» — то есть после первого реального event UI меняется, добавляется чат с агентом. Этого поля раньше не было.

Запустилось.


Пока агент работает — самое время отвлечься на контекст. Куда я вообще попал.


Пауза — куда я попал

Пока агент работает свои несколько минут — самое время понять, куда я вообще зашёл.

На рынке агентов сейчас три принципиально разных подхода. Это не сравнение продуктов, это сравнение философий. И от выбора философии зависит, что в итоге получишь и сколько потратишь на это сил.

Managed‑сервисы — то, что я выбрал. Вендор крутит агентов на своих серверах. Ты описываешь агента — что он должен делать, какими инструментами пользоваться — а инфраструктуру поднимает вендор. Платишь за использование. Минимум технического долга, максимум зависимости от одного поставщика. Кроме Claude Managed Agents сюда же относятся AWS Bedrock Agents и OpenAI Assistants API.

Self‑hosted — open‑source агенты, которые ставишь у себя. На VPS, на личном сервере, в корпоративном дата‑центре. Полный контроль, данные не покидают периметр, ничего никому не отдаёшь. Зато вся ответственность — на тебе: настройка, обновления, безопасность. Главный игрок здесь — OpenClaw, под триста тысяч звёзд на GitHub, огромное сообщество. Из недавнего сильно вырос Hermes Agent от Nous Research — релиз в феврале 2026, фокус на персистентную память (агент «помнит» между сессиями).

Frameworks — не готовый агент, а набор библиотек, из которого собираешь своего. Это не «запустил сервис и начал пользоваться», а «сел и написал код». Полная гибкость, всё под контролем, но требует разработчика. Главный известный — LangChain и его старший брат для агентов LangGraph.

Это всё звучит абстрактно. Удобная аналогия — мир CRM‑систем.

Облачный CRM (managed): заходишь на сайт вендора, регистрируешься, начинаешь работать. Вендор отвечает за серверы, бэкапы, обновления. Платишь подписку. Когда нужно нестандартное — упираешься в платформу.

Корпоративный CRM on‑prem (self‑hosted): скачиваешь дистрибутив, ставишь у себя в дата‑центре, держишь штат админов. Полный контроль, данные не покидают периметр компании. Вся ответственность — твоя.

Самописная CRM на фреймворках (frameworks): берёшь библиотеки и собираешь систему под уникальные процессы. Максимум гибкости, максимум усилий — не только построить, но и поддерживать.

Не «один лучше другого» — каждый подход под свою задачу. Хочешь быстро попробовать без техдолга — managed. Важна приватность данных и полный контроль — self‑hosted. Встраиваешь агентов в существующий продукт — фреймворки.

Что любопытно — Anthropic явно сокращают разрыв с self‑hosted‑конкурентами. За последний месяц они добавили в managed‑вариант persistent memory, outcomes для самооценки результата, multi‑agent orchestration. Это всё фичи, которые раньше были аргументом в пользу OpenClaw и Hermes. Темп развития заметный.

Так. Возвращаемся к моей сессии. Я в managed‑категории, агент уже что‑то делает. Что именно?


Когда агент заработал

Status — Running. Первое событие — agent.message. Агент проговаривает свой план:

“I’ll search all sources in parallel now.”

Сразу непривычно. Это не «выполняю запрос» и не молчаливое выполнение — агент описывает что собирается сделать. Дальше — tool_use, пять одновременно. По одному web_fetch на каждый источник: Claude blog, Anthropic engineering, OpenAI blog, LangChain blog, Hacker News API.

И — ошибка. Один из пяти упал.

Один запрос упал — агент не остановился, переформулировал стратегию и сделал второй раунд успешно

Один запрос упал — агент не остановился, переформулировал стратегию и сделал второй раунд успешно

В debug‑режиме видно причину: url_not_accessible на OpenAI blog. Что‑то с их стороны, не у меня. Жду что будет дальше.

Дальше — самое интересное. Агент не повторил запрос. Не выдал ошибку и не остановился. В следующем сообщении говорит:

“Good data from the index pages. Now let me fetch the key recent articles and HN…”

И запускает второй раунд из пяти параллельных запросов — уже по конкретным статьям, не по index‑страницам. На этот раз без ошибок.

Это и есть разница между агентом и обычным скриптом. Скрипт упал бы на ошибке OpenAI или повторил тот же запрос. Агент посмотрел что получил, что не получил, переформулировал стратегию — и пошёл дальше. Это поведение с обратной связью.

Ещё одна тонкая вещь в логах — Hacker News. Первый запрос пошёл на обычную HTML‑страницу. Но HN — это JavaScript‑сайт, и в ответ агент получил пустую обёртку без данных. Распознал что данных нет, и попробовал другим способом — через программный интерфейс HN. То есть не только «что упало — пропустим», но и «что вернулось неполным — попробуем по‑другому».

Третий раунд — самый длинный. Агент думает 54 секунды. Потом начинает писать:

“I have rich, detailed content from all sources. Now let me compile and write the digest…”

Делает bash — создаёт директорию /home/agent/digests. Делает write — пишет markdown‑файл. Снова bash — копирует файл в outputs. И финальное сообщение:

“Digest written to /home/agent/digests/digest-2026-05-10.md (and copied to outputs). Here’s the summary of what I found and how it clustered…”

Дальше — короткое summary четырёх кластеров прямо в чате.

Весь путь работы агента — 3 минуты, 51 событие, 93 цента

Весь путь работы агента — 3 минуты, 51 событие, 93 цента

Статус сессии — Idle. Завершилось.

Общая статистика: 3 минуты активной работы, 51 событие, 93 цента. Это конечно не «час за обедом», это меньше четырёх минут от моей задачи до готового результата — если бы не первый провал с Test run, всё уложилось бы минут в десять.

Хорошо. Файл написан. Где он?


А где результат?

Финальное сообщение от агента короткое — summary четырёх кластеров. Понятно что нашёл, понятно как сгруппировал. Но это только сводка. Где сам файл — полный markdown с цитатами и ссылками?

Иду в раздел Files в сайдбаре Console. Пусто. Это, оказывается, другой Files — для документов, загруженных через workspace API, не для файлов из сессии.

Возвращаюсь в сессию. В transcript есть событие Write с путём /home/agent/digests/digest-2026-05-10.md. Кликаю по нему просто из любопытства. И — в transcript‑блоке открывается JSON с полным содержимым файла. Весь markdown — внутри события Write, в поле input.content.

Клик на событие Write — и в JSON-блоке раскрывается полный текст дайджеста

Клик на событие Write — и в JSON‑блоке раскрывается полный текст дайджеста

То есть доступ есть, просто не очевидно где искать. Не отдельная кнопка «Download digest», не вкладка «Output files» — а кликнуть по техническому событию в transcript и распарсить JSON глазами. Если бы не нажал из любопытства — не нашёл бы.

Это самый странный момент Console. Финальное сообщение агента — короткое summary. Полный документ — внутри JSON‑события. Между ними нет очевидного моста. Для разработчика, который привык лазить в логи — норма. Для пользователя, который пришёл «получить дайджест» — путаница.

Альтернативно: кнопка Download сверху скачивает весь JSON‑лог сессии — там тот же файл, просто в более раздутом контексте. Или можно вытянуть программно через API — агент копию заранее положил в /mnt/session/outputs/.

Та же история, что с Send event — продукт удобен тем, кто работает с ним из кода.

Окей. Файл нашёл. Что внутри?


Что в итоге написал агент

Открываю файл — markdown в нормальном рендере.

Так выглядит результат — 1309 слов, 4 кластера, 8 источников. Дайджест за 93 цента

Так выглядит результат — 1309 слов, 4 кластера, 8 источников. Дайджест за 93 цента

1309 слов, четыре кластера, восемь источников. Каждый кластер — заголовок‑формулировка, синтез, «so what» в отдельной строке, ссылки на источники. Структура — ровно та, что я просил в system prompt.

Что зацепило, по убыванию.

Первое — стиль соответствует промпту. Я просил «не „5 постов про X“, а формулировку — что меняется в области». Агент так и сделал. Первый кластер называется «Build → Test → Deploy → Monitor → Govern is becoming the shared vocabulary for production agents». Не «посты про lifecycle», а констатация тренда — и потом синтез одним абзацем что это значит.

Второе — «so what» в каждом кластере. Я просил по предложению «что это значит для практика» — агент выдал. Не «разбирайтесь сами», а готовая интерпретация для меня: если ты ещё думаешь про «agent as a single task» — ты уже отстал от того, как работают продакшен‑команды. Это прочитанная неделя индустрии, не агрегатор ссылок.

Третье — честность про пропуски. OpenAI Blog (тот, что упал в первом раунде) помечен как (inaccessible this window). Агент не выдумал контент, который не смог получить, а явно отметил пропуск. Плюс в конце документа отдельная секция «Noise this window (skipped)» — что отфильтровал как шум. Эта честность дороже многих метрик качества.

Бонусом — отдельный мини‑раздел «кого читать»: три имени людей, чьи посты вызвали самое активное обсуждение за неделю. Harrison Chase, Vivek Trivedy/Sydney Runkle, @ClaudeDevs. Карта, кто формирует разговор в области. Это то, что мне руками не собрать.

Стоимость одного такого дайджеста — 93 цента за три минуты работы. За обедом я не успею прочесть все источники, а агент справился — и это меньше стоимости кофе.

Окей. Что я понял?


Что я понял за этот вечер

Один вечер. Один агент. $1.70 за всю разведку, включая первую попытку, которая не запустилась.

Получил живой опыт того, как сейчас выглядит личное использование AI‑агентов (Managed Agents) — глазами не‑разработчика, который пришёл с конкретной задачей и хочет получить результат.

Порог входа реальный

Гипотеза, с которой я начал — что личных кейсов Managed Agents мало именно из‑за порога входа — за этот вечер подтвердилась. Но не так, как я ожидал.

Я думал — порог из‑за технической сложности. Нужно знать API, разбираться с конфигами, понимать как устроена инфраструктура. Оказалось — нет. Console достаточно простой, шаблоны готовые, security‑вопросы заданы по‑человечески. И даже без шаблона можно через диалог создать агента под задачу. Технически Managed Agents — действительно «опишите агента, мы поднимем инфраструктуру».

Порог в другом — в продуктовой философии. Managed Agents спроектированы как B2B‑инструмент. Ты не «пользуешься агентом» — ты строишь продукт с агентом внутри. Console — зона прототипирования, не зона работы. Дальше предполагается код, SDK, curl, своё приложение, в котором агент — мотор.

Все мои затыки укладываются в эту логику:

  • Отправить событие скрыт в Actions — для разработчика очевидно, для пользователя нет

  • Helper Ask Claude не знал про UI‑фичу — продукт развивается быстрее доков для разработчиков

  • Файл результата виден только через клик по техническому событию в transcript — для разработчика норма

Личное использование в этом продукте просто не предусмотрено. Не плохо реализовано — а не входит в дизайн.

Но результат — качественный

И в этом главный баланс. Когда агент запустился — он работает действительно хорошо.

Агент выполнил задачу, дайджест за 93 цента, который я бы не написал руками за полчаса. Recovery после ошибки — не «упал, разбирайся сам», а «вижу что не получил, попробую иначе». Распознавание JS‑сайта и переключение на API. Честная пометка про источник, который не смог достать. Это уже не «чат‑бот с поиском в гугле», это новое поведение.

И Anthropic явно работают над снижением порога. За последний месяц добавили память между сессиями, самооценку результата, multi‑agent. Ask Claude встроен прямо в Console — попытка дать пользователю инструмент для разбора своих же сессий. Security‑вопрос в человеческой форме. Они движутся в правильную сторону — просто продукт пока в начале пути.

Куда это идёт — обёртки

Если порог входа — это продуктовое решение Anthropic, а не недоработка, то снимать его будут не сами Anthropic. Им незачем — их аудитория это разработчики, и для них Console работает как надо.

Personal use агентов придёт через обёртки. Через Telegram‑боты, веб‑приложения, мобильные приложения, в которых Managed Agents — невидимый мотор под капотом. Между управляемой инфраструктурой и конечным пользователем встанет кто‑то, кто скроет сложность.

Я — пользователь. Я хочу, чтобы дайджест сам появлялся в моём Telegram‑канале каждый понедельник к обеду. Не Send event в Actions — просто пришло, открыл, прочитал. Эта дистанция — между Managed Agents и пользователем — это рынок, который сейчас открывается. Не «сделайте Console удобнее» — а слой приложений поверх.

Через год‑два таких приложений будет много. И в них будет легче зайти, чем сейчас в Console.

Ещё один момент. Такого агента можно использовать в реальном деле, не боясь, что за это заблочат твой аккаунт в Claude. Вся ответственность за безопасность — на стороне Anthropic. Для продукта на стадии беты — разумное решение.

Что дальше

Этого агента можно апгрейдить. Обернуть в Telegram‑доставку и расписание. Раз в неделю, по утрам, в мой канал. Дополнить ссылками на другие ресурсы, чтоб картина была полнее. Это упирается только в цену.

Параллельно интересно попробовать другие подходы — Claude Code или self‑hosted Hermes. Но это уже другие истории.

Даже если ты не разработчик — стоит сейчас понимать, как это работает изнутри. Потому что обёртки появятся скоро, и они будут использовать ровно ту же модель, которую мы сегодня разобрали.

А пока — у меня есть дайджест за прошлую неделю. И понимание, что за всеми барьерами реально стоит интересный, взрослый инструмент. Волна изменений — того, как мы потребляем информацию — уже идёт. Managed Agents встроится в неё, если кто‑то построит правильную обёртку.


Автор: Виталий Туров

Пишу про практики работы с AI в Telegram-канале «Я и мой друг робот» — про мульти-агентные системы, визуализацию данных и реальные автоматизации: https://t.me/mewithrobot

ссылка на оригинал статьи https://habr.com/ru/articles/1034934/