Harness вокруг LLM: что я понял за полтора года ежедневной работы
—
от автора
—
от автора
Полтора года в Claude Code, несколько релизов моделей, десятки экспериментов с командой в Kaiten. Всё это время я ждал, что главным рычагом качества будет очередной релиз модели. Оказалось, ровно наоборот: смена модели даёт заметный, но ограниченный прирост, а каждый новый…
—
от автора
Введение. Role-Play LLM ботВсе началось как шутка. Я сидел с друзьями и подумал: а вот было бы прикольно внедрить разные модели нейросетей в один чат и заставить их думать, что они реальные люди и работают в корпорации.Весь смысл был в…
—
от автора
Microsoft с GitHub запустили официальный экзамен на знание и умение пользоваться ИИ‑агентами. В рамках теста под названием Exam GH-600 Agentic AI Developer (beta) за 120 минут нужно показать умения управлять ИИ‑агентами, их памятью и остальными инструментами (ИИ-агенты, рабочие процессы Copilot, интеллектуальный жизненный цикл разработки программного обеспечения…
—
от автора
AI API ключ для нейросетей: единый доступ к ИИ-моделям через один интерфейсБизнесу, разработчикам и продуктовым командам уже недостаточно подключить одну нейросеть и считать задачу закрытой. Для текста лучше подходит одна модель, для кода — другая, для изображений — третья, для…
—
от автора
Эта часть про то, как я пилю бэкенд, учусь на этом и получаю эмоциональные качели.СодержаниеМини флэшбэкAI в делеПознаниеОбучение боемЧто я понялВыводыДля начала, напомню о себе: «у меня свой бизнес, а в IT, я так, для души». Шутка. В общем, после 12…
—
от автора
Полгода я использовал Claude, GPT и Cursor как основной инструмент для написания Rust-кода в проде. Не как «помощник для бойлерплейта», а как полноценного второго разработчика на монолите примерно в 80 тысяч строк (бэкенд обработки потоковых данных, tokio, sqlx, немного unsafe…
—
от автора
Согласно расследованию Guardian, технологические компании Кремниевой долины массово вычищают мидл-менеджеров — а не джунов и кодеров, как ожидалось от ИИ-чистки. По данным платформы Revelio Labs, к концу 2025 года в США открытых вакансий мидл-менеджеров стало на 42% меньше, чем в пиковом…
—
от автора
Исследователи из Карнеги-Меллон под руководством Дэвида Брамли выпустили ExploitBench — бенчмарк из 41 уязвимости в движке V8, который работает внутри Chrome, Edge и Node.js. На нем прогнали девять фронтир-моделей. Закрытая модель Anthropic — Claude Mythos Preview — довела до рабочего эксплойта…
—
от автора
Привет! Меня зовут Владимир Суворов, я Senior Data Scientist в Страховом Доме ВСК и core-разработчик нашей библиотеки машинного обучения OutBoxML.Ссылки на проект на GitHub и в Telegram. О том, как мы проектируем такие системы, какие инженерные принципы используем и как…
—
от автора
Когда человеку говорят:“Сделайте кнопку”он представляет себе: обработчик клика форму пару строчек кода Когда это слышит программист — он напрягается.Потому что за словом “кнопка” часто скрывается: изменение бизнес-процесса отчёты согласования десятилетнее легаси и фраза “раньше в DOS было удобнее” Со временем…