SavePearlHarbor — Страница 4 — Ещё одна копия хабора

Fable 5 стала первой в бенчмарке по кодингу DeepSWE. Всего на 3% лучше GPT-5.5 за вдвое большую цену

Июн 19, 2026

—

от автора

Модель Claude Fable 5 от Anthropic возглавила обновленный лидерборд DeepSWE — бенчмарка по кодингу от стартапа Datacurve. На самых сложных, «длинных» инженерных задачах она набрала 70% pass@1 и формально стала первой. Вот только идущую следом GPT-5.5 от OpenAI (67%) она обошла всего…

В поисках универсального SDK…

Июн 19, 2026

—

от автора

admin

Привет Хабр! Наконец нашёл немного времени для написания статьи. Это моя первая статья на хабре, так что, извиняйте если что… Цель статьи — показать проблемы при разработке SDK и найти попробовать архитектуру, которая минимизирует проблемы управления памятью, упрощает биндинги для разных языков и сохраняет производительность.…

Новая эффективность: как оценивать работу ИТ-команд в 2026 году

Июн 19, 2026

—

от автора

admin

Тема эффективности в IT не теряет актуальности, и обсуждения последнее время становятся только горячее. Несмотря на зрелость индустрии в целом, кажется, до сих пор нет единого и стандартизированного понимания о том, что считать по-настоящему эффективной работой. Для многих компаний разработка…

Журналисты обнаружили датасеты с 22 млн охраняемых музыкальных записей, которыми обучали Suno, Udio и ИИ‑модели Google

Июн 19, 2026

—

от автора

admin

Редакция The Atlantic в рамках проекта AI Watchdog обнаружила четыре крупных базы данных с музыкальными треками, которые, по данным издания, использовались для обучения музыкальных генераторов на основе ИИ. Два крупнейших датасета содержат 12 и 9 млн треков соответственно, ещё два набора — около 100 тысяч каждый. Все базы доступны для публичного…

Почему ваш GitHub — лучший лендинг, который можно сделать

Июн 19, 2026

—

от автора

admin

Как README превращается в PR-актив: структура, нарратив, quickstartКогда кто-то впервые сталкивается с техническим продуктом, он открывает репозиторий. Инфлюенс, которому прислали питч, инвестор после дежурного «посмотрите наш продукт» делает то же самое, и разработчик, который наткнулся на тред в X, идёт…

От мешевых аватаров к искусственному интеллекту в Second Life: как я построил ИИ‑агентов для виртуального мира

Июн 19, 2026

—

от автора

admin

Всем привет!Хочу рассказать историю одного проекта, который начался более пяти лет назад с создания мешевых аватаров для Second Life, а спустя годы неожиданно привёл меня к разработке ИИ‑агентов, способных жить и взаимодействовать с пользователями внутри виртуального мира.Но эта статья не столько про бизнес или метавселенные, сколько про инженерные задачи, которые…

CrowdStrike, 19 июля 2024: как off-by-one в валидаторе за 78 минут уронил 8,5 млн Windows-машин

Июн 19, 2026

—

от автора

admin

Самый дорогой software-failure в истории — ~$5,4 млрд прямого ущерба. А причина — баг из первой главы учебника по тестированию: рассинхрон «20 против 21 параметра» во внутреннем валидаторе. Разбираем timeline, root cause и — главное — три отдельных провала QA,…

SDET как эволюция QA, или почему автотестов больше недостаточно

Июн 19, 2026

—

от автора

admin

Привет, Хабр! Меня зовут Антон Фоломкин, я SDET-инженер в Orion soft. В этой статье я хочу поделиться опытом формирования экспертизы в тестах, которая называется SDET. Проблема качественного тестирования стоит сегодня достаточно остро. Все мы видим сырые продукты, невыловленные баги в…

Повесть самокатных лет, часть 1 — Авито, Озон и кастомный Kugoo S3

Июн 19, 2026

—

от автора

admin

и все они по своему правыНесмотря на почти повсеместную нелюбовь как государства (вспомните законы оо обязательной регистрации, введение понятия СИМ и так далее) так и простых жителей России к самокатам, они все же понемногу становятся неотъемлемой частью городской инфраструктуры.И если арендные самокаты перестали устраивать, а хочется…

Как мы построили распределённый мониторинг аптайма

Июн 19, 2026

—

от автора

admin

В прошлый раз я писал про рекурсивную задачу мониторинга: кто мониторит монитор? Если Prometheus упал — вы не видите ничего, и самое коварное тут в том, что отвалившийся мониторинг внешне неотличим от идеальной стабильности. Та статья заканчивалась честно и немного…