OpenAI: Codex автоматизировал всю дата-платформу – 600 ПБ, 70 000 датасетов и 3500 юзеров

OpenAI официально подтвердила, что её внутренняя платформа данных – система, на которой крутятся обучение моделей, пайплайны безопасности, продуктовая аналитика и финансовая отчётность, – переведена под управление автономных агентов на базе Codex.

Платформа обслуживает более 3500 внутренних пользователей и управляет свыше 600 петабайт данных, распределённых по примерно 70 000 датасетов. Под капотом – высоконагруженные Kafka-потоки, распределённые Apache-Spark-джобы и оркестрация тысяч воркфлоу. И теперь за всем этим в реальном времени следят ИИ-агенты.

“Наш внутренний дата-агент получает не просто дамп схем или экспорт BI-каталога. Он оперирует определениями таблиц, владельцами, документацией, историей запросов, лайнэджем, дашбордами, правами доступа и продакшен-кодом, который генерирует данные”, – пояснила Эмма Танг, лид платформы данных OpenAI.

Когда пайплайн ломается, агент не ждёт, пока проснётся инженер. Он сам исследует сбой, дебажит, а в ряде случаев – чинит ещё до того, как человек откроет дашборд. Объёмы событий в стриминговых системах OpenAI выросли примерно в 50 раз за год, и ручные реакции перестали успевать. Агенты же превращают эксплуатацию в непрерывный процесс: системы наблюдают за своим состоянием, рассуждают о происходящем и действуют.

Codex, который изначально задумывался как ассистент для программистов, теперь ведёт себя как исполнительный слой. Число его еженедельных пользователей перевалило за 3 миллиона, и значительная доля активности вышла за рамки кодинга – планирование, документация, операционная работа.

Самый показательный пример – внутренний релиз-агент. Он управляет обновлениями систем на Apache Spark: катит изменения постепенно, проверяет стабильность часами или днями, генерирует пул-реквесты и уведомляет команды на ревью. Другой агент работает как непрерывный дежурный – вместо того чтобы рыться в Slack-тредах и ранбуках, он мгновенно достаёт релевантный контекст (прошлые фиксы, эскалационные пути, известные сценарии отказов) и применяет его к новым инцидентам.

Венкат Венкатарамани, вице-президент по инфраструктуре приложений OpenAI, отмечает: “Кодирование операционных знаний в агенты делает нас устойчивее, если эти знания остаются явными, версионированными, протестированными и просматриваемыми. И делает нас хрупкими, если Codex превращается в устную традицию с красивым интерфейсом”.

Тем временем на рынке разворачивается битва агентных платформ. Anthropic продвигает Claude Code и Cowork, позиционируя ИИ как коллаборатора на всём жизненном цикле софта. На SWE-bench последние публичные модели Anthropic показывают 60+% на верифицированных задачах (внутренние варианты – выше). Но OpenAI парирует свежими бенчмарками: на Terminal-Bench 2.0 её агент набирает 77,3% против 65,4% у Claude. По словам компании, это отражает превосходство в детерминированной логике, фактическом поиске и оркестровке множества инструментов.

При этом Эмма Танг подчёркивает: “Люди часто думают, что сложно подключиться к Snowflake или Databricks и накинуть сверху модель. Это лёгкая часть. Сложная – сделать реальность данных компании читаемой для агента: какие таблицы каноничны, как определены метрики, где живёт бизнес-логика, кто владелец, какие права доступа”.

OpenAI уже использует агентов для генерации сотен пул-реквестов при крупных миграциях. А последние апдейты Codex позволяют ему напрямую управлять компьютером (видеть экран, двигать курсор, взаимодействовать с приложениями), запускать нескольких агентов параллельно и продолжать задачи дни и недели благодаря персистентным тредам и памяти.

Риски, впрочем, тоже сохраняются. Венкатарамани признаёт: система может быть эффективной, но стать опасной, если люди перестанут понимать её логику. “Нет замены человеку с фундаментальным пониманием систем. Наша цель – дать таким людям агентов и контекст, чтобы они быстрее восстанавливались после действительно новых сбоев”.

Наконец, OpenAI делает ставку не просто на интеллект, а на аптайм. Победителем в следующей главе ИИ станет не тот, кто обучит самую умную модель, а тот, кто сможет непрерывно запускать свои системы. И похоже, Codex-агенты уже прокладывают этот путь.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 300 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

ссылка на оригинал статьи https://habr.com/ru/articles/1024834/