-
Модель Claude Fable 5 от Anthropic возглавила обновленный лидерборд DeepSWE — бенчмарка по кодингу от стартапа Datacurve. На самых сложных, «длинных» инженерных задачах она набрала 70% pass@1 и формально стала первой. Вот только идущую следом GPT-5.5 от OpenAI (67%) она обошла всего…
-
В поисках универсального SDK…
Привет Хабр! Наконец нашёл немного времени для написания статьи. Это моя первая статья на хабре, так что, извиняйте если что… Цель статьи — показать проблемы при разработке SDK и найти попробовать архитектуру, которая минимизирует проблемы управления памятью, упрощает биндинги для разных языков и сохраняет производительность.…
-
Новая эффективность: как оценивать работу ИТ-команд в 2026 году
Тема эффективности в IT не теряет актуальности, и обсуждения последнее время становятся только горячее. Несмотря на зрелость индустрии в целом, кажется, до сих пор нет единого и стандартизированного понимания о том, что считать по-настоящему эффективной работой. Для многих компаний разработка…
-
Журналисты обнаружили датасеты с 22 млн охраняемых музыкальных записей, которыми обучали Suno, Udio и ИИ‑модели Google
Редакция The Atlantic в рамках проекта AI Watchdog обнаружила четыре крупных базы данных с музыкальными треками, которые, по данным издания, использовались для обучения музыкальных генераторов на основе ИИ. Два крупнейших датасета содержат 12 и 9 млн треков соответственно, ещё два набора — около 100 тысяч каждый. Все базы доступны для публичного…
-
Почему ваш GitHub — лучший лендинг, который можно сделать
Как README превращается в PR-актив: структура, нарратив, quickstartКогда кто-то впервые сталкивается с техническим продуктом, он открывает репозиторий. Инфлюенс, которому прислали питч, инвестор после дежурного «посмотрите наш продукт» делает то же самое, и разработчик, который наткнулся на тред в X, идёт…
-
От мешевых аватаров к искусственному интеллекту в Second Life: как я построил ИИ‑агентов для виртуального мира
Всем привет!Хочу рассказать историю одного проекта, который начался более пяти лет назад с создания мешевых аватаров для Second Life, а спустя годы неожиданно привёл меня к разработке ИИ‑агентов, способных жить и взаимодействовать с пользователями внутри виртуального мира.Но эта статья не столько про бизнес или метавселенные, сколько про инженерные задачи, которые…
-
CrowdStrike, 19 июля 2024: как off-by-one в валидаторе за 78 минут уронил 8,5 млн Windows-машин
Самый дорогой software-failure в истории — ~$5,4 млрд прямого ущерба. А причина — баг из первой главы учебника по тестированию: рассинхрон «20 против 21 параметра» во внутреннем валидаторе. Разбираем timeline, root cause и — главное — три отдельных провала QA,…
-
SDET как эволюция QA, или почему автотестов больше недостаточно
Привет, Хабр! Меня зовут Антон Фоломкин, я SDET-инженер в Orion soft. В этой статье я хочу поделиться опытом формирования экспертизы в тестах, которая называется SDET. Проблема качественного тестирования стоит сегодня достаточно остро. Все мы видим сырые продукты, невыловленные баги в…
-
Повесть самокатных лет, часть 1 — Авито, Озон и кастомный Kugoo S3
и все они по своему правыНесмотря на почти повсеместную нелюбовь как государства (вспомните законы оо обязательной регистрации, введение понятия СИМ и так далее) так и простых жителей России к самокатам, они все же понемногу становятся неотъемлемой частью городской инфраструктуры.И если арендные самокаты перестали устраивать, а хочется…
-
Как мы построили распределённый мониторинг аптайма
В прошлый раз я писал про рекурсивную задачу мониторинга: кто мониторит монитор? Если Prometheus упал — вы не видите ничего, и самое коварное тут в том, что отвалившийся мониторинг внешне неотличим от идеальной стабильности. Та статья заканчивалась честно и немного…