Claude Code Antifraud: Колмогоров‑Смирнов и недетские аномалии на детской олимпиаде

от автора

Приходит ко мне как‑то знакомый с импортным за 300р. «Слушай, — говорит, — ты ж антифрод‑эксперт. Проверь, пожалуйста, школьную олимпиаду. У меня сын ходил, что‑то результаты странные». Триста за импортное — серьёзная заявка. Ну что ж, триста так триста. Погнали.

Дисклеймер: про Ханса Ниманна и о чем эта статья

В 2022 году 19-летний американский гроссмейстер Ханс Ниманн обыграл действующего на тот момент чемпиона мира Магнуса Карлсена в очной партии. Карлсен снялся с турнира, написав об этом в твиттере и намекнув на читерство. Chess.com опубликовал 72-страничный отчёт о статистических аномалиях в онлайн‑партиях Ниманна. Ниманн подал в суд иск на $100 млн.

Через год — мировое соглашение. Карлсен признал, что доказательств читерства Ниманна в очных партиях нет. Chess.com восстановил аккаунт Ханса. Никто не извинился. Никаких компенсаций публично выплачено не было.

Но по факту мировое означало одно: то, что выглядело как читерство, было гениальностью. Просто очень неожиданной для оппонентов.

В этой статье речь пойдёт не о читерстве. Читеров я ловлю 20 лет, я знаю, как оно выглядит, и в школьную олимпиаду его, конечно, никто не заносил. Речь пойдёт о гениальных преподавателях и их одарённых учениках. Об учителях, которые так выбиваются из статистики, что Колмогоров со Смирновым подпрыгнули бы. О распределениях дипломов, в которых каждый второй ребёнок — Ниманн.

В этой статье все имена вымышлены и все совпадения случайны — на этом настоял Claude, чтобы избежать юридических ирисков.

Дальше по тексту используется несколько терминов:

• ИЧО — индекс чудесной одарённости. Интегральная оценка одарённости учителей и их учеников на конкретной олимпиаде. От 0 до 100. Чем выше — тем гениальнее коллектив.

• ДПП — доля пострадавших призёров. Процент призовых мест, занятых учениками одарённых учителей. «Пострадавших» — потому что, если бы этих гениев на пьедестале не было, на их местах стояли бы другие дети, и некоторые из них автоматически передвинулись бы на ступеньку выше: участник стал бы призёром, призёр Д3 получил бы Д2, а Д2 стал бы победителем. ДПП — это не абстрактный процент. Это дети, которые из‑за чужой одарённости получили диплом чуть ниже, чем заслуживали.

Лошадью ходи!

Я двадцать лет проектирую антифрод‑системы для финтехов. Внутренний фрод, внешний фрод, транзакционный фрод, социнженерия, фишинг, вишинг, всеподряшинг.

Работа простая: смотришь на поток транзакций и говоришь «вот эти 0.3% выглядят как‑то иначе».

Распределения, лифты, KL‑дивергенции, изолейшнфоресты. Профдеформация — пользоваться этим в обычной жизни. В финтехах за это платят, в обычной жизни — импортное за 300.

Знакомый дал ссылку на сайт олимпиады — назовем ее «Золотой шлем». Олимпиада с историей, серьёзная, 3–10 классы. Проводит серьезная организация — назовем ее «Академия Доцента».

Я открыл реестры за четыре года: 2023-й, 2024-й, 2025-й, 2026-й.

Профдеформация — допил импортное за 300 и пошёл открывать юпитер‑ноутбук.

Claude Code и хобби‑аналитика по‑новому

Раньше такой проект был бы работой: распарсить пять PDF‑отчётов с реестрами, привести ФИО к одному регистру, написать пайплайн, написать стат. тесты, обернуть в матплотлиб, перерисовать графики эннадцать раз, потому что первый раз всегда уродливый.

По‑старому я бы убил на это недели четыре вечеров и выходных. Реалистично — закрыл бы проект к июню, в стол, потому что выводы пугают, а импортное уже кончилось.

Но это был эксперимент: оформил подписку на Claude Code и сделал то же самое за пару вечеров.

Здесь должен быть приложен промпт — обещаю, в комментариях разберём, что сработало, а что пришлось переделывать руками. Но промпт оказался неожиданно большим, не поместился.

Технически — да, это всё ещё python, pandas, scipy, sklearn. Но между «я знаю, что хочу увидеть KL‑дивергенцию по учителям с фильтром n≥5» и «у меня на экране красивый bubble‑chart с аннотациями» теперь нет четырёх недель. Есть пару часов с ChromaDB и pytest на фоне.

Это не статья про Claude Code. Но эта статья появилась благодаря Claude Code. Без него я бы её не написал. Сделал бы себе крестик в ежедневнике «разобраться с олимпиадой», как делал в 2020-м, 2022-м и 2024-м с другими пет‑проектами, которые так и не случились.

Теперь пет‑аналитика стала так же доступна, как добрая кола.

Это потенциально меняет правила.

Внимание — это все, что тебе нужно

Если уж писать на Хабр про LLM‑усиленный анализ — по закону жанра надо приложить схему. В качестве оммажа работе «Attention is All You Need» (Vaswani et al., 2017) архитектура исследования показана на рисунке. Слева — encoder‑пайплайн сбора данных. Справа — decoder‑пайплайн анализа. По центру наверху — cross‑attention: данные, собранные слева, скармливаются в клоткот справа.

Архитектура исследования

Архитектура исследования

Шаги 1–3 (левый стек, сбор данных, N=2 источника): реестры Олимпиады «Золотой шлем» с сайта оргкомитета + протоколы ВсОШ (разные источники, поиском) → парсинг PDF в CSV через клоткот → сбор контекста: отзывы родителей с одного популярного родительского форума, открытые упоминания об оргкомитете, легионеры ВсОШ.

Шаги 4–7 (правый стек, цикл N≈10 итераций): пишу промт для клоткота (методология — пороги, формула ИЧО, формула ДПП) → клоткот выполняет анализ → сверяю результаты глазами (валидация) → если что‑то выглядит не так, пишу уточняющий промт → получаю тех. репорт + графики. Этот цикл реально повторился около десяти раз (а может и больше), на каждом этапе что‑то добавлялось, что‑то убиралось — отсюда N≈10.

Шаги 8–10 (над правым стеком): финальный промт «разложи всё это в Хабр‑формат» → редактирование и фактчек руками (проверка ссылок, цифр, формулировок — то, что вы сейчас и читаете) → публикация.

Жёлтые блоки «Add & Norm (валидация)» — это структурные элементы. У трансформера они нормализуют активации между слоями; у меня — это шаг, на котором я валидирую то, что выдал клоткот. Стрелки циклов, идущие вниз — это feedback loop: «не нравится результат → уточняю промт → запускаю заново». В классическом трансформере это были skip‑connection‑ы (input + sublayer‑output). У меня — замкнутый цикл, потому что я не нейросеть и мне правда надо иногда возвращаться к началу.

Главный график: четыре года, один тренд, один шок

Вот картинка, ради которой всё.

Это ИЧО (индекс чудесной одарённости) — взвешенный композитный балл от 0 до 100, насколько распределение дипломов на олимпиаде отличается от случайного. Чем выше — тем более одарёнными (см. дисклеймер) оказываются её победители.

Формула — стандартный композитный скор из χ²‑статистики, ДПП (доли пострадавших призеров), KL‑дивергенции и веса конфликта интересов. Под капотом — те же методы, по которым банковский скоринг считает вероятность фрода.

2023: 9,3% — норма. Дети как дети.

2024: 5,7% — ещё спокойнее. Никаких аномалий, всё в зелёной зоне.

2025: 35,5% — внезапно средняя зона. Что‑то поменялось.

2026: 76,6% — критическая зона одарённости. Дети показывают такие результаты, что Магнус молча снимается с турнира.

Это не «методика стала строже». Одни и те же пороги, одни и те же возрастные группы. Изменился реестр победителей.

В банковских данных я такую картинку видел много раз. Она всегда означает одно: появился новый reward.

— Почему вы грабите банки?

— Потому что там деньги

© приписывают грабителю Вилли Саттону

Поведение всегда дрейфует туда, где деньги. Об этом тоже будет.

Как считается ИЧО — формула и компоненты

ИЧО — это не одно число, а взвешенный композит из четырёх. Каждая компонента смотрит на свою сторону задачи:

ИЧО = 0.25·C_stat + 0.30·C_dpp + 0.20·C_share + 0.25·C_conflict

Что внутри каждой компоненты:

  • C_stat (вес 0.25, количественная) — статистическая компонента. Доля субъектов в группе, для которых одновременно сработали два или более детектора из четырёх (χ², КС, KL, Isolation Forest). Чем выше — тем больше «красных» учителей в группе.

  • C_dpp (вес 0.3, количественная) — Доля пострадавших призёров. Главный вклад в ИЧО — именно эта метрика отвечает на вопрос «сколько детей реально пострадало». Формула в следующем разделе.

  • C_share (вес 0.2, количественная) — доля подозрительных дипломов от общего числа дипломов в группе. От 0 до 1, нормируется в шкалу 0–100.

  • C_conflict (вес 0.25, качественная) — конфликт интересов. Каждая публично подтверждённая роль фигуранта (организатор, составитель задач, главный проверяющий, член жюри одновременно с ролью учителя) добавляет вес. Оценивалась по открытым публикациям оргкомитета:

    • Доцент = 4 роли (организатор + составитель + проверяющий + учитель) = максимум;

    • Косой = 2 (учитель + муж организатора) = средний;

    • Учитель‑А = 2 (жюри + учитель собственных учеников).

    Это единственная компонента, которую алгоритм не считает — её ставлю руками по открытым источникам.

Количественные пороги, по которым алгоритм решает, относить ли субъекта к «подозрительно одаренным» (одни и те же для всех разрезов — это принципиально):

  • n ≥ 5 — иначе субъект исключён из расчётов (методологический порог);

  • KL > 0.08 — флаг внимания; > 0.20 — высокая дивергенция;

  • χ²: p < 0.05 — статистически значимо (★); p < 0.10 — пограничный сигнал (△);

  • Совпадение ★ + ещё один детектор (KL/КС/IF) — субъект попадает в группу «подозрительно одаренных». Один сигнал — не диагноз.

Если бы я подкручивал эти пороги в зависимости от того, кто оказался «под флагом» — это был бы мой собственный эпизод закона Гудхарта. Поэтому все четыре года считаются по одной и той же методике и в одной таблице.

ДПП — как считаются «пострадавшие призёры»

ДПП отвечает на конкретный вопрос: сколько детей получили диплом ниже, чем заслуживали, из‑за чужой одарённости.

Логика — каскадная. Если у «подозрительно одаренного» Д1 забрать диплом, на его место передвигается ребёнок, у которого был Д2, освобождая место для ребёнка с Д3, который, в свою очередь, освобождает место для участника без диплома. Один подозрительно одаренный Д1 сдвигает трёх детей. Один Д2 — двух. Один Д3 — одного.

Отсюда формула:

ДПП = [Дч1 + (Дч1 + Дч2) + (Дч1 + Дч2 + Дч3)] / [Д1 + Д2 + Д3]

где:

  • Д1, Д2, Д3 — общее число дипломов 1-й, 2-й и 3-й степени в группе;

  • Дч1, Дч2, Дч3 — число «подозрительно одаренных» дипломов соответствующих степеней, то есть полученных учениками флагнутых учителей;

  • Числитель — сумма сдвинутых дипломов: каждый подозрительный Д1 считается трижды (он сдвигает 3х детей), каждый Д2 — дважды, каждый Д3 — один раз.

Считаем за 2026 год:

3–4 классы: 39 подозрительно одаренных Д1; 25 — Д2; 31 — Д3; при 257 общих дипломах.

Подставляем: [39 + (39 + 25) + (39 + 25 + 31)] / 257 = (39 + 64 + 95) / 257 = 198 / 257 = 77%.

77% призовых мест в этой возрастной группе — пострадавшие.

В каких разрезах считалось

Аномалия редко лежит на поверхности — обычно она прячется в одном из срезов. Поэтому считал в шести параллельных разрезах одновременно:

  1. По годам — четыре года Олимпиады «Золотой шлем» (2023, 2024, 2025, 2026) и пять лет ВсОШ (2022–2026) независимо. Чтобы видеть динамику и не путать «появилось» с «было всегда».

  2. По возрастным группам — 3–4, 5–6, 7–8, 9–10 классы. Это естественные классы олимпиады. Один и тот же учитель может быть нормой в 5–6 и аномалией в 3–4.

  3. По учителям — основной разрез Олимпиады «Золотой шлем» за 2025–2026 гг. (когда оргкомитет стал публиковать ФИО учителя в реестре).

  4. По школам — основной разрез Олимпиады «Золотой шлем» за 2023–2024 гг. (учителя не указывались) и основной разрез ВсОШ.

  5. По регионам — применимо только к ВсОШ (на Олимпиаде «Золотой шлем» регион один — Москва).

  6. Агрегированный — все параллели вместе. Нужен, чтобы поймать слабые сигналы, которые не достают до стат. значимых в отдельной группе, но видны на общей выборке.

В каждом из разрезов работают одни и те же детекторы (χ², КС, KL, IF, Бенфорд‑аналог) с одними и теми же порогами. И только если сигнал стабильно появляется в нескольких разрезах одновременно — мы считаем его реальным.

Сначала контроль: а вдруг это просто методика кривая

Прежде чем рассказывать что‑то страшное, нужно проверить себя на чистых данных.

В банковской практике это называется бэктест на контрольной выборке.

Я взял ровно те же методы с теми же порогами и применил их к финалу Всероссийской олимпиады школьников по математике 2026 — далее «Тест-300».

Тест-300 (или «Тест 300 спартанцев») по некоторым данным появился в Спарте, где слабых неодарённых детей сбрасывали со скалы. Тест-300 позволяет проверить — существуют ли школы со спартанскими принципами подготовки олимпиадников.

ВсОШ — это серьёзная олимпиада: ≈500 финалистов, независимое жюри из разных регионов, шифрованная проверка работ, двадцатилетняя история, отдельные регламенты на каждый шаг. Если бы моя методика просто видела «гениев» там, где их нет, — она нарисовала бы похожую картину и тут.

ИЧО и ДПП: Олимпиада «Золотой шлем» 2026 vs финал ВсОШ-математики 2026 (Тест-300).

ИЧО и ДПП: Олимпиада «Золотой шлем» 2026 vs финал ВсОШ-математики 2026 (Тест-300).

ИЧО на ВсОШ: 14,0% — НИЗКИЙ. Один локальный сигнал по 9 классу (регион г. Москва). По 10 и 11 классам — ноль.

ДПП — 10,7% против 77% в Олимпиаде «Золотой шлем».

Это, кстати, очень красивая картинка с методологической точки зрения. Она означает: методика откалибрована. Она не «фолс‑флагит». Когда она видит гения — это, по крайней мере, не случайный шум.

ВсОШ — это, кажется, единственная олимпиада в стране, где одарённость не передаётся через одного учителя.

«У нас тут просто все так делают» — это не аргумент, если есть олимпиада, где так не делают.

ВсОШ в динамике 2022–2026: расширенный контроль

Я не остановился на одном 2026-м. Взял 5 лет финалов ВсОШ‑математики (2022–2026). Общая выборка — 2 395 строк‑наблюдений, 1 439 уникальных участников. Прогнал ту же методику по всем годам.

ИЧО по ВсОШ за 2022–2026 в динамике: ровная линия в зоне НИЗКАЯ. Никакой «критической одарённости».

ИЧО по ВсОШ за 2022–2026 в динамике: ровная линия в зоне НИЗКАЯ. Никакой «критической одарённости».

ИЧО агрегированно по годам — устойчиво в зоне НИЗКАЯ. Это не значит, что во ВсОШ нет шероховатостей. Точнее они есть, но локальные, точечные, не системные:

  • 9 класс, 2026, г. Москва — единственная статистически значимая аномалия по регионам (p=0.036). Доля победителей в группе из Москвы — 13.8% при норме 5.8%. Это сигнал по региону, не по конкретной школе или учителю.

  • Школа № 179 (одна из ведущих математических школ Москвы) — статистически значимо в агрегированном анализе по школам (p=0.017). Доля побед 13.8% при норме 5.8% в общей выборке.

  • Санкт‑Петербург 2022–2025 — устойчивая аномалия: Win‑rate превышает национальный средний в 1.5–2.5 раза четыре года подряд (p<0.01). В 2026-м эффект исчез. Это либо реальная концентрация сильных школ (ФМЛ № 239), либо приглашение региональных талантов на полный пансион — по одной только статистике различить нельзя.

Что важно: это не системно. Это не одни и те же школы во все годы, это «вот в этом году в этой параллели — выше нормы, в следующем — норма». Никакого ОПГ‑ядра, никакого совпадения четырёх детекторов на одних и тех же школах. Просто региональный шум, ожидаемый на выборке в ~500 финалистов.

Про «сильнейшие школы» — почему высокая доля побед не равна «подозрительной одаренности»

Школы вроде ФМЛ № 239, Лицея «Вторая школа», Школы № 179, СУНЦ МГУ, ЦПМ, Летово — это места, где конкурс при поступлении в 5-й или 7-й класс составляет 20–50 человек на место. Они отбирают сильнейших со всей страны. Естественно, что доля победителей у них выше среднего по выборке. Сильный отбор → сильные результаты. Это и есть базовая ставка для топ‑школ.

Поэтому я ищу не «у кого высокая доля побед», а «у кого высокая доля побед + есть конфликт интересов + есть KL‑аномалия + есть IF‑аутлайер». У школ из этого списка такого совпадения нет. У учителей‑фигурантов Олимпиады «Золотой шлем» — есть, причём сразу по нескольким сигналам.

Бенфорд‑аналог: почему он работает на ВсОШ и не работает на Олимпиаде «Золотой шлем»

Закон Бенфорда — это про распределение первой цифры в естественных числовых рядах (работает для многих рядов, но не для всех). В «честных» данных первая цифра — 30% единиц, 18% двоек, и так далее по убыванию до 4.6% девяток. Когда цифры придумывают — распределение сглаживается к равномерному 1/9 на каждую цифру.

На ВсОШ по математике баллы участников публикуются, и теоретически можно применить классический Бенфорд. Но есть нюанс: максимальный балл на финале — двузначное число ограниченное ≈40. Это значит, что первая цифра баллов покрывает не весь диапазон 0–9, а реально только 1–4 — причём с подавляющим доминированием 2 и 3 (40.5% и 35.5%), потому что большинство баллов в диапазоне 20–39.

Поэтому я использовал не классический Бенфорд, а его адаптацию: распределение первой и второй цифры баллов в конкретной школе или регионе сравнивается не с теоретическим распределением Бенфорда (которое здесь физически неприменимо), а с эмпирическим распределением по всей олимпиаде. Это и есть «Бенфорд‑аналог»: проверка на сглаживание относительно общего шаблона, а не относительно теоретической кривой. По сути это аналог хи‑квадрата и KL, которые я использую во всем исследовании.

Результат: 0 статистически значимых аномалий. Ни у одной школы, ни у одного региона. У Татарстана и Новосибирской области был выше нормы KL по второй цифре, но при n<25 значимости не хватает. Манипуляций с баллами не выявлено.

На Олимпиаде «Золотой шлем» этот тест неприменим в принципе: там баллы не публикуются, в открытом доступе есть только степени дипломов (Д1/Д2/Д3). Три категории — это не датасет для частотного анализа цифр.

Гипотеза легионеров — отдельная проверка

Когда смотришь на топ‑школы ВсОШ, сразу возникает контраргумент: «у них высокие результаты потому что они переманивают сильных учеников из других регионов». Эти ребята — «легионеры». По моей оценке во ВсОШ таких 230 человек из 643 многолетних участников (35.8%). То есть «легионеры» — это те, кто по данным ВсОШ в разные годы менял регион участия и школы. Они дают 24% общей выборки.

Гипотеза: если убрать легионеров, аномалии в топ‑школах исчезнут — вся их статистика держится на привлечённых звёздах. Проверяю в трёх сценариях.

A ≈ C ≠ B.

Это означает следующее: сценарий B даёт смещение базовой ставки ИЧО. Мы удалили самую результативную часть выборки — легионеры дают 59% всех побед при том, что составляют только 36% выборки. То есть на одного легионера в среднем побед примерно в 2.5 раза больше, чем на «оседлого». Получили артефакт «роста» ИЧО.

Сценарий C — корректная проверка. И он даёт почти ту же картинку, что и исходный A.

Внутри отдельных школ — да, легионеры существенно влияют на результат: в ЦПМ, СУНЦ МГУ, СУНЦ НГУ доля победителей + призеров падает на 12–15 п.п. при их исключении. Но это не аномалия, а объяснимое следствие политики приёма этих школ‑«магнитов». В исторически сильных школах (ФМЛ № 239, «Вторая школа», № 179) доля легионеров < 12% — на статистику этих школ почти не влияет.

Аномалия Санкт‑Петербурга 2022–2025 устойчива во всех трёх сценариях. Это реальный, не зависящий от легионеров сигнал. Но это уже отдельное расследование, не связанное с Олимпиадой «Золотой шлем».

Итог по контролю:

  • ИЧО ВсОШ во всех валидных сценариях — 14%-14,2%.

  • ИЧО Олимпиады «Золотой шлем» 2026 — 76,6%. Контраст не «76.6 vs 31.4», как могло бы показаться при наивном исключении легионеров, а 76.6 vs 14.0. В пять с половиной раз.

Методы проверки

Короткий курс матстатистики для тех, кто не каждый день с этим живёт. Потому что без этого дальше будет «мне показалось» и «я тут увидел».

Важная оговорка: для Олимпиады «Золотой шлем» доступны только степени дипломов (Д1/Д2/Д3) — баллы участников не публикуются. Поэтому применимы четыре метода (без Бенфорд‑аналога).

1. χ²‑критерий. Базовый школьный тест. По сути — сумма отклонений наблюдаемого распределения от ожидаемого. Сравниваешь распределение Д1/Д2/Д3 по призерам выбранного учителя с распределением по всей возрастной группе. Считаешь сумму квадратов отклонений, нормированную на ожидаемое. Получаешь p‑значение — вероятность случайно увидеть такое или большее отклонение: p<0.05 = статистически значимо; p<0.1 — пограничный сигнал. В этой статье — основной метод для Олимпиады «Золотой шлем».

2. Колмогоров‑Смирнов. Двусторонний тест на сходство эмпирических функций распределения. Сравниваю «лесенку» дипломов учителя с «лесенкой» по всей возрастной группе. КС видит сдвиги в форме, которые χ² иногда пропускает.

3. KL‑дивергенция. Информационная мера — сколько «лишних бит» нужно, чтобы описать одно распределение через другое. Чем больше — тем дальше распределения друг от друга. Пороги: 0.08 — флаг внимания, 0.2 — критическая дивергенция, 0.5+ — это уже комический жанр.

4. Isolation Forest. Машинное обучение без учителя. Ансамбль случайных деревьев изолирует точки. Аномальные точки изолируются быстрее. На вход подаются 10 признаков: доли Д1/Д2/Д3, средний уровень, лифт, KL, размер выборки и так далее. Не требует никакого априорного знания (или все‑таки требует — признаки же кто‑то придумывает).

5. Бенфорд‑аналог. ⚠ только для ВсОШ. Распределение первой/второй цифры баллов. Во многих естественных числовых рядах (но не во всех) первая цифра — 30% единиц, 18% двоек, по убыванию. Когда цифры придумывают, распределение сглаживается. На Олимпиаде «Золотой шлем» этот тест неприменим, потому что нет баллов — есть только итоговая степень диплома. На ВсОШ — норма. Баллы не нарисованы.

Чтобы признать кого‑то одарённым, нужно совпадение минимум двух детекторов. Это не «один тест и приговор» — это перекрёстная проверка.

А теперь то, ради чего всё это — одаренные учителя-2026

Распределение дипломов 2026, 3-4 классы. «Без аномалий» — контрольная группа из 78 учеников нормальных (не аномальных) педагогов. У двух педагогов (Доцент, Хмырь) — статзначимое смещение к Д1; ещё у троих (Учитель-Б, Косой, Балбес) — пограничный/малой выборки сигнал.

Распределение дипломов 2026, 3–4 классы. «Без аномалий» — контрольная группа из 78 учеников нормальных (не аномальных) педагогов. У двух педагогов (Доцент, Хмырь) — статзначимое смещение к Д1; ещё у троих (Учитель‑Б, Косой, Балбес) — пограничный/малой выборки сигнал.

«Без аномалий» — это контрольная категория: я удалил из выборки учеников всех пяти учителей‑фигурантов (двух статзначимых и трёх пограничных) и посмотрел, как выглядит распределение у остальных. Получилось Д1/Д2/Д3 = 12%/31%/57% — нормальная пирамида: единичные победы (Д1), прослойка дипломов 2-й степени (Д2), основная масса — дипломы 3-й степени (Д3).

Теперь по учителям:

n — это сколько учеников у учителя в выборке 2026;

p — p‑значение χ²‑теста;

 — статистически значимо (p<0.05);

 — пограничный сигнал.

Для маленьких выборок (n<5) χ² не применяется — это методологический порог.

Учитель‑Б выбывает из дальнейшей гонки — не дотянул первыми дипломами до одаренных звезд и слишком много Д3.

Две ★ — это статистически значимые отклонения. Четыре детектора одновременно подсветили эту парочку.

Два △ — пограничные, n маленькое (5–7), χ² на таких выборках не уверен, но KL и лифт всё равно выпирают.

В банковском мониторинге такие профили мы сводим в одну группу с ★ и помечаем «требует дополнительного анализа». В этой статье — оставляю как «триангуляция через смежные сигналы», без прямых выводов.

В банковских фрод‑мониторингах проценты вроде 55% Д1 у Хмыря называются специальным термином. Он непечатный.

Добавим еще одну статистику: лифт Д1 — во сколько раз чаще ученики конкретного учителя получают Д1 относительно среднего Д1 по группе.

Лифт Д1 у разных учителей. «×2» означает «дети этого учителя побеждают в два раза чаще средних».

Лифт Д1 у разных учителей. «×2» означает «дети этого учителя побеждают в два раза чаще средних».

Балбес ×2.25, Хмырь ×2.04, Доцент ×1.63, Косой ×1.60. В норме ×1.0.

«Ну так может, они просто выдающиеся преподаватели?» — спросит вежливый читатель.

Может. В России действительно есть выдающиеся преподаватели математики. Косой, например, классик — автор одного известного сборника олимпиадных задач, по которому полстраны олимпиадников училось. Доцент — выдающийся организатор математических кружков в Москве. Серьёзно, без иронии.

Это, кстати, тот же самый Косой, который муж Доцента, и который ведёт «кружки Косого и Доцента». Гениальный семейный подряд.

В банковской терминологии это называется отсутствие сегрегации обязанностей. В простой бытовой — «одна и та же тётка и кассир, и проверяющий, и аудитор». В олимпиадной — давайте посмотрим.

Тётя, тётя, тётя, тётя! Папина сестра…

Доцент, согласно открытым публикациям оргкомитета, на Олимпиаде «Золотой шлем» выполняет роли:

  1. Организатора олимпиады;

  2. Составителя задач;

  3. Главного проверяющего;

  4. Учителя 23 победителей и призеров в 2026 году (только 3–4 классы).

Сеть фигурантов «Академии Доцента» 2026: один человек с четырьмя ролями в центре, муж и коллеги вокруг.

Сеть фигурантов «Академии Доцента» 2026: один человек с четырьмя ролями в центре, муж и коллеги вокруг.

Шесть учителей «Академии Доцента» дали в 2026 году 105 призовых дипломов — это около трети всех 2026 года. На трёх самых результативных учителях — семейные или профессиональные связи. На остальных троих — должностная принадлежность к школе‑организатору. Все шестеро преподают в одном учреждении, готовят призёров одной олимпиады, которую сами же организуют и проверяют.

В порядке убывания результативности:

  1. Доцент — 48 призовых дипломов (15% от всех 2026 года). 23 победителя и призёра в 3–4 классах + ещё 25 в других параллелях. В 3–4 классах её ученики дают лифт ×1.93 от средней доли Д1 в группе. χ²‑тест помечает её распределение звёздочкой: p = 0.04, KL = 0.224. Если бы её ученики стабильно показывали ×1.1 от средней доли побед, я бы и слова не сказал. Многие достойные педагоги делают все четыре дела одновременно. У нас это нормально для маленьких научных кружков. Но они показывают ×1.63. χ²‑тест: p = 0.04 — вероятность увидеть такое распределение случайно — 4%.

  2. Косой — 23 призёра. Согласно справочной информации — муж Доцента, соавтор её совместных кружков. В 5–6 классах его ученики дают лифт ×2.00 при KL=0.179 — пограничный сигнал (△).

  3. Василий Алибабаевич — 13 призёров. Коллега по «Академии Доцента». В 3–4 классах 2026 — лёгкий флаг внимания (KL=0.083 на самом пороге); в 5–6 — норма.

  4. Митяй — 9 призёров. Коллега по «Академии Доцента». В 2025 году 8 его учеников показали 0% Д1 при норме 12%. В 2026 — практически норма.

  5. Трус — 7 призёров. Коллега по «Академии Доцента». В 2026 году распределение его учеников статистически не выделяется.

  6. Балбес — 5 призёров. Коллега по «Академии Доцента». Малая выборка (n=5), но лифт ×2.67 при KL=0.337 — это уже критическая дивергенция, не флаг.

Один человек организует олимпиаду, составляет к ней задачи, проверяет работы и обучает 48 победителей. Её муж обучает ещё 23. Четыре их коллеги — ещё 34. Около трети всех олимпиадных призёров 2026 года получили дипломы от одной педагогической сети из шести человек.

В банковском риск‑менеджменте это называется концентрационный риск — когда вся доходность портфеля держится на одной группе тесно связанных контрагентов. В банке такая конфигурация автоматически попадает на ручной контроль. В детской олимпиаде по геометрии — выдаются дипломы.

О гениальной педагогической школе

Прежде чем перейти к остальным фигурантам, давайте уделим минуту самой педагогической традиции. Про неё много пишут родители. Она, по их отзывам, — строгая, консервативная, выдержанная в лучших традициях советской школы.

Вот фрагмент с родительского форума (многолетняя тема о математическом кружке):

Родители описывают тесноту в помещении, специфическую манеру общения преподавателей с детьми и младшими школьниками, выходящими с занятий в слезах. — родительский отзыв с форума.

Это классическая закалка характера. Ребёнок плачет — значит, развивается. Современные изнеженные методички этому не учат.

А вот фрагмент из другой темы («История об Академии Доцента»):

В одной из тем описывается эпизод 2015 года: родители рассказывают, как вместо основной преподавательницы занятие вёл её супруг, который не представился, не объяснил, кто он такой, а на родительские вопросы реагировал в духе «не мешайте занятию». — родительский отзыв с форума.

Вот это академический фокус. Родители — мешают. Ребёнок 9 лет пришёл за знаниями, а не за развлечениями. Это и есть высокая планка. Не та московская мещанская мягкотелость, а настоящая олимпиадная школа.

В той же ветке родители делятся выводом, что после подобного опыта ребёнка к этому преподавателю они бы больше не привели. — родительский отзыв с форума

Ну так конечно. Не каждый родитель готов к глубокой математической традиции. Кому‑то комфортнее в детских кружках, где всех хвалят. Это нормально.

Оригинальные отзывы публично доступны с 2015 года. Это не моя оценка — это зафиксированная реакция родителей на педагогический стиль. Я только обращаю внимание на любопытное совпадение: учеников победителей и призеров у этой педагогической школы много — n=23+7=30 в 2026 году. Дети попадают именно к ним, несмотря на десятилетние публичные предупреждения от других родителей. Почему? Потому что эта школа даёт результат: лифт Д1 = ×1.63, p = 0.04. Характер закалили.

Хмырь: одарённость в другой школе или невыявленная связь?

Хмырь. χ²‑тест: p = 0.044. KL = 0.312 (критическая зона), лифт Д1 = ×2.04 — половина учеников побеждают.

В банковских антифрод‑мониторингах мы такие профили помечаем флажком «на ручной разбор». Потому что либо у человека уникальный талант, выходящий за пределы человеческой природы, либо где‑то баг в данных, либо где‑то факап в процессе. На ВсОШ таких профилей нет.

Про педагогический стиль Хмыря на родительский форум написано отдельной темой (июнь 2020 года, одна московская школа, кружок (название скрыто), выездной лагерь за рубежом, ныне — другая школа). Я приведу мнение родителей, которым я очень благодарен за то, что они потратили свой вечер, чтобы зафиксировать своё впечатление публично:

Родители из выездного образовательного лагеря пишут, что Хмырь с самого начала выделил группу «любимчиков» и работал в основном с ними, остальных детей систематически принижал. Уроки детям не нравились, толку, по их оценке, не было. — родительский форум

Я бы это перевёл на банковский: «индивидуальный подход к работе с клиентской базой с целевым выделением high‑value сегмента». В банках за это премии дают.

Родитель сообщает, что Хмырь уволился из одной из школ. Родитель предлагает желающим узнать подробности писать в личку. — там же

Это, конечно, проактивная фильтрация неподходящей аудитории. Сразу понятно, что у Хмыря высокие стандарты.

Далее идут эмоциональные оценки личности и квалификации педагога, которые я даже пересказывать не хочу, чтобы не утомлять модерацию Хабра. Кому интересно — найдёте сами по ключевым словам. — там же

Ну, обзывательства. Зато публично, на форуме. Родители имеют право на эмоции, особенно после того, как их ребёнок прошёл глубокий курс психологической закалки.

Среди отзывов встречается предположение, что Хмырь, имея психологическое образование, фактически ставит на детях эксперименты в исследовательских целях. — там же

Это, между прочим, очень амбициозная исследовательская программа. Если Хмырь действительно ведёт научную работу — мы должны его поддержать.

Ещё один родитель сетует на то, что после очевидных проблем с одной группой детей Хмырь продолжает работать в системе и переходит из школы в школу. — там же

Вот тут уже проявляется системная карьерная стабильность педагога. От школы к школе. От кружка к кружку. От лагеря к лагерю. Как у нас в банке хорошие риск‑менеджеры — карьерный лифт работает.

Заключительный аккорд ветки — массивный список претензий к стилю общения с детьми: крик, унижения, доведение до слёз, грубость. Родители фиксируют конкретные фразы, обращённые к 9-летним. — там же

Это, видимо, и есть та самая строгая консервативная методика, которая даёт лифт Д1 = 2.04.

Важно понимать: цитаты выше — это родительские впечатления, опубликованные в открытом доступе 6 лет назад. Это не часть моего статистического анализа. Это независимый контекст, который сам по себе ничего не доказывает, но который объясняет, почему дети у этих учителей побеждают чаще. Жёсткий отбор, жёсткая подача, жёсткая селекция любимчиков — всё это работает на результат. Консервативный подход к воспитанию даёт системный результат: минимум 50% Д1 у воспитанников.

В банковском антифроде мы такие профили помечаем флажком «на ручной разбор». Потому что либо у человека уникальный талант, выходящий за пределы человеческой природы, либо где‑то баг в данных, либо где‑то факап в процессе.

На ВсОШ таких профилей нет.

KL‑карта: четыре года роста

Чтобы убедиться, что я нашёл не случайный выброс за один год, посмотрим на все четыре года.

KL-дивергенция учителей и школ по годам. Цвет = уровень аномалии, размер = число учеников. Жирным шрифтом — подписи учителей/школ «Академии Доцента».

KL‑дивергенция учителей и школ по годам. Цвет = уровень аномалии, размер = число учеников. Жирным шрифтом — подписи учителей/школ «Академии Доцента».

2023: три точки по школе‑организатору «Академия Доцента» — АД (3–4, 5–6, 7–8). Все три — в зоне нормы. АД 7–8 классов (n=6, KL=0.08) формально касается порога флага внимания, но при такой выборке результаты статистически незначимы.

2024: две точки по школе АД. АД 3–4 (n=30, KL=0.064) — норма. АД 5–6 (n=14, KL=0.096) — лёгкий флаг внимания. То есть до 2025 года картина по «Академии Доцента» неотличима от обычной школы — никаких системных аномалий.

2025: появляются данные по учителям (раньше указывалась только школа). Сразу три фигуранта флагнутые: Доцент 3–4 (KL=0.095, лифт ×1.98), Василий Алибабаевич 3–4 (KL=0.139) и Митяй 3–4 (KL=0.386). Все три — учителя АД. χ² пока ни одну не помечает звёздочкой: n маленькие, p > 0.05.

2026: звёздный час. Десять точек в зоне внимания и критической зоне. Три статзначимые (★): Деточкин 5–6 (KL=0.79), Хмырь 3–4 (KL=0.411), Доцент 3–4 (KL=0.224). Семь пограничных (△). Из десяти аномалий — семь у учителей или коллег «Академии Доцента».

Это уже не один случайный учитель — это системный сдвиг 2025→2026 в одной сети корифеев.

Временной паттерн совместного роста аномалии указывает на изменение генерирующего процесса. Что‑то поменялось во входе, а не на выходе.

Какие разрезы попали под подозрение — а какие нет

KL-дивергенция против лифта Д1, 2023–2026. «Зона риска» в правом верхнем углу — KL>0.08 и лифт>1.4× одновременно. Жирным шрифтом — учителя/школы АД.

KL‑дивергенция против лифта Д1, 2023–2026. «Зона риска» в правом верхнем углу — KL>0.08 и лифт>1.4× одновременно. Жирным шрифтом — учителя/школы АД.

Заметили картину «зоны риска»? В правом‑верхнем квадранте (лифт > 1.4× И KL > 0.08) сконцентрировались шесть точек 2026 года и одна 2025-го. Из этих семи — пять учителей «Академии Доцента». До 2024 года в эту зону не попадает вообще никто.

Не все классы и не все годы оказались интересны. Картина по годам и параллелям:

Главный фокус — 3–4 классы 2026 года: шесть аномалий из восьми учителей с n≥5.

В 5–6 классах 2026 — один статистически значимый Деточкин (обратная аномалия) и один пограничный Косой.

В 7–8 классах 2026 — Доцент с KL=0.326. χ² на n=5 уже не выдаёт звёздочку, но KL и лифт всё равно выпирают.

В 9–10 классах — данных физически мало во всех годах, статистика не работает.

Почему именно 3–4 классы? Потому что это самая массовая группа и именно туда хлынул поток «одарённых» после расширения системы льгот на младшую школу. Старшие классы интересны меньше — для них есть ВсОШ, БВИ и другие более ценные траектории. Олимпиада «Золотой шлем» стала ценной именно как ранний пропуск в матшколу и путевки в летний лагерь. Но об этом позже.

Isolation Forest 2026: особое машинное мнение

Isolation Forest — это мнение алгоритма, который ничего не знает о людях. Он смотрит на распределения и выбрасывает «изолированные» точки — те, чьи признаки не похожи ни на что другое в выборке. Чем сильнее изолирована — тем аномальнее.

Прежде чем запустить алгоритм, надо честно ответить на два методологических вопроса: какие признаки давать на вход (чтобы IF искал именно «подозрительную одаренность», а не «аномалии по другим причинам») и что делать с маленькими выборками (чтобы n=5 сам по себе не делал учителя аутлайером).

Какие признаки считать «подозрительной одаренностью»

Я делю все признаки на две категории.

1. Признаки «подозрительной одаренности» — те, которые отражают, насколько распределение дипломов нелогично с точки зрения нормы. Если у учителя ученики получают Д1 в 3 раза чаще, чем у остальных, — это сигнал подозрительной одаренности. Если KL‑дивергенция от baseline в 5 раз выше типичной — это сигнал подозрительной одаренности. Чем выше значение признака, тем сильнее «нелогичность».

2. Прочие признаки — те, которые отражают «другие свойства» учителя/кружка, не связанные с «подозрительной одаренностью». Главные кандидаты — n (число призеров у учителя), p_d (доля дипломов учителя, от всех дипломов олимпиады). Это популярность кружка: учитель с n=20 не «более одарен», чем учитель с n=5. Если IF получит n на вход, он будет выкидывать в аутлаеры всех маленьких учителей просто потому, что они маленькие. Эти признаки я убрал из IF — в первой версии от Claude Code они там были, и это создавало шум.

Что делаем с маленькими выборками

Когда у учителя только 1-2-3 ученика в призерах, любая комбинация дипломов выглядит «уникально» в многомерном пространстве признаков. Если такой учитель случайно получил «3 из 3 Д3», у него лифт_д3 = 2, avg = 3.0, экстремальный KL — IF честно подсветит его как аномалию. Только это не «подозрительная одаренность», это статистический шум — n=3 при норме 22% Д1 даёт огромный разброс возможных распределений.

Я объединяю всех учителей с маленьким n в группы — отдельно по каждой параллели:

  • t1 — учителя с n=1 (по одному ученику)

  • t2 — учителя с n=2

  • t3 — учителя с n=3

  • t4 — учителя с n=4

Внутри группы все ученики собираются в один пул; считаются те же 10 фрод‑признаков на пуле. Группы играют роль «фоновых наблюдений»: они показывают, как выглядит «нормальный размах распределения» для большого количества небольших учителей в данной параллели. Учитель с n=23 теперь сравнивается не с одиночными учителями с n=1, а с агрегатом, представляющим «типичного небольшого преподавателя».

После группировки в 2026 году у меня 23 точки для IF:

  • 13 индивидуальных учителей с n≥5 — те, кого мы исследуем;

  • 10 групп t1, t2, t3, t4 по трём параллелям — где‑то не все уровни заполнены (например, в 3–4 классах нет учителей с ровно n=4).

В среднем получилось по 13,6 учеников на одну точку (учителя или группу).

Результаты IF 2026

Isolation Forest 2026 — 10 фрод-признаков. Слева: Д1% × средний уровень диплома (круг = индивидуальный учитель, ромб = группа маленьких; размер = число учеников). Справа: IF-score 23 точек, отсортированных по аномальности. Жирным шрифтом — учителя «Академии Доцента».

Isolation Forest 2026 — 10 фрод‑признаков. Слева: Д1% × средний уровень диплома (круг = индивидуальный учитель, ромб = группа маленьких; размер = число учеников). Справа: IF‑score 23 точек, отсортированных по аномальности. Жирным шрифтом — учителя «Академии Доцента».

За порог аутлайера ушли четыре точки:

  1. Деточкин (5–6 классы), IF‑score = -0.12 — самая глубокая изоляция. У 5 учеников: 0% Д3, 80% Д2, 20% Д1. Распределение, которого нет ни у кого. χ² помечает звёздочкой (p=0.029). Оба метода согласны.

  2. Хмырь (3–4 классы), IF‑score = -0.03 — 55% Д1 при норме 22%, χ²‑статистика=8.82. χ² помечает звёздочкой (p=0.044). Оба метода согласны.

  3. Балбес (3–4 классы), IF‑score =-0.02 — на самом краю порога. n=5, лифт ×2.67 — самый высокий лифт во всей выборке. χ² на пяти учениках уже не работает (n слишком мал), IF указывает на «экстремальный результат на маленькой группе».

  4. t3 (3–4 классы), агрегат из 4 учителей с n=3 каждый, IF‑score =-0.02 — обратная аномалия. 12 учеников совместно: 8.3% Д1 (при норме 22%), 75% Д3, avg=2.75. То есть эти 4 учителя стабильно выпускают учеников, которые получают Д3 заметно чаще обычного. Это не «одаренность» в «нашу» сторону — наоборот, недостаточный результат. Возможный сигнал — эти 4 учителя из обычных школ, чьи дети просто доходят до Д3 и не дальше.

Что IF не ловит — это интересно. Доцент 3–4 (★ по χ², p=0.040) имеет IF‑score +0.05 — комфортно в зоне нормы по IF. Почему? Её распределение (43.5% Д1, avg=1.74) не изолированно в признаковом пространстве: Косой 5–6 показывает 57% Д1, Хмырь — 55%, Балбес — 60%. То есть Доцент — крупный «крайний» сигнал по χ² (за счёт n=23), но не уникальный паттерн признаков. IF не выделяет её, потому что её шаблон встроен в общий АД‑кластер.

В банковском фрод‑мониторинге, когда формальное правило (χ²) и ML‑модель (IF) сходятся на одном клиенте — мы перестаём спорить и идём с проверкой. Здесь сходятся на двух: Деточкин и Хмырь. Третья ★ по χ² (Доцент 3–4) — это «крупный сигнал», который видит χ², но IF не выделяет, потому что её паттерн повторяется у её АД‑коллег. Это тоже сигнал — но другого типа: аномалия группы, а не одиночки.

Слепая зона Isolation Forest — контаминация кластера

Внимательный читатель заметил нестыковку. Из трёх ★ χ²‑фигурантов (Доцент 3–4, Хмырь 3–4, Деточкин 5–6) IF поймал двух — Деточкина и Хмыря. А Доцента 3–4 — нет, и комфортно поставил её в положительную зону с IF‑score = +0.05. Хотя у неё n=23 (самая большая выборка среди индивидов), KL=0.22, и χ² помечает звёздочкой.

Это не баг. Это фундаментальная особенность Isolation Forest и подобных unsupervised‑методов. И про неё стоит знать каждому аналитику, кто пробует ловить аутлайеры без supervised‑разметки. Особенно — в антифрод‑задачах.

Что произошло. IF работает по принципу «выкинуть точку, которая не похожа ни на что другое в выборке». Если у тебя один фигурант с уникальным паттерном — он торчит и выскакивает. А если у тебя группа фигурантов с похожими паттернами — они образуют свой собственный кластер в признаковом пространстве, и IF видит этот кластер как «второй нормальный режим». Чтобы изолировать точку внутри кластера, нужно много разрезов — а это значит, IF‑score становится высоким (нормальным).

Проверим. Берём z‑нормированное расстояние в признаковом пространстве (10 фрод‑признаков) между ключевыми точками 2026 года:

  • Доцент 3–4 ↔ Хмырь 3–4: z = 2.0

  • Доцент 5–6 ↔ Косой 3–4: z = 1.3

  • Косой 5–6 ↔ Доцент 5–6: z = 1.6

  • Балбес ↔ Косой 5–6: z = 2.0

Все «высокие‑Д1» учителя АД сидят в плотном кластере с типичными z‑расстояниями 1–3. Для сравнения:

  • Деточкин 5–6 ↔ ближайшая точка: z = 5.6 (одиночка — поэтому IF его и ловит)

  • Учитель‑Б 3–4 ↔ ближайшая точка: z = 4.0 (тоже одиночка, обратная аномалия)

Деточкин и Учитель‑Б имеют уникальные паттерны и IF их видит. АД‑кластер из «высоких‑Д1» — не видит.

Решение: измерять расстояние от baseline, а не изоляцию от других точек.

Берём чистый baseline (распределение без фигурантов), считаем для каждого учителя L2-расстояние от baseline в z‑нормированном пространстве 10 фрод‑признаков. Никакого обучения, никакого риска контаминации. Просто «насколько распределение этого учителя отклоняется от ожидаемого».

Сравнение методов. Y-ось обоих графиков: 23 точки 2026, отсортированные по L2-расстоянию от baseline (сверху — самые аномальные). Цвет столбцов — по топ-N L2 (красный — топ-4, оранжевый — топ-5..8). Слева: IF v3 score (отрицательный = аномально). Справа: L2-расстояние. Видно: оба метода согласны на Деточкине, Хмыре, Балбесе; но IF ошибочно ставит Доцента 3-4 в положительную зону, тогда как L2 уверенно помещает её в топ-4 аномалий.

Сравнение методов. Y‑ось обоих графиков: 23 точки 2026, отсортированные по L2-расстоянию от baseline (сверху — самые аномальные). Цвет столбцов — по топ‑N L2 (красный — топ-4, оранжевый — топ-5..8). Слева: IF v3 score (отрицательный = аномально). Справа: L2-расстояние. Видно: оба метода согласны на Деточкине, Хмыре, Балбесе; но IF ошибочно ставит Доцента 3–4 в положительную зону, тогда как L2 уверенно помещает её в топ-4 аномалий.

Ранжирование топ-8 меняется:

Сравнение методов. Y‑ось обоих графиков: 23 точки 2026, отсортированные по L2-расстоянию от baseline (сверху — самые аномальные). Цвет столбцов — по топ‑N L2 (красный — топ-4, оранжевый — топ-5..8). Слева: IF v3 score (отрицательный = аномально). Справа: L2-расстояние. Видно: оба метода согласны на Деточкине, Хмыре, Балбесе; но IF ошибочно ставит Доцента 3–4 в положительную зону, тогда как L2 уверенно помещает её в топ-4 аномалий.

Доцент 3–4 поднимается с восьмого места на четвёртое — туда, где она и должна быть с её χ² p=0.04. L2 видит её отклонение от нормы, не запутавшись в её АД‑коллегах с похожими шаблонами.

Урок для антифрод‑аналитиков

Если у вас задача «одиночный аутлайер на тысячу нормальных» — Isolation Forest, LOF, DBSCAN и подобные unsupervised‑методы прекрасно работают. Один уникальный паттерн торчит на фоне массы нормальных точек, алгоритм его выкидывает.

Но как только у вас сговор или систематическое поведение группы (несколько участников с похожими шаблонами) — эти методы начинают проваливаться. Они видят сговор как «нормальный кластер» рядом с основным. Деточкин‑одиночка ловится, АД‑сеть из шести человек — нет.

Что делать:

  • Использовать distance‑from‑known‑baseline методы (Mahalanobis, L2-к‑эталону, KL‑дивергенция) вместо изоляции‑среди‑точек. Они меряют отклонение от заранее известного «нормального» распределения и не зависят от того, сколько ещё фигурантов в выборке.

  • Иметь явный контрольный baseline. В нашем случае это распределение учеников без всех фигурантов. В банке — данные клиентов из проверенных чистых сегментов. Без явного baseline вы будете считать сговор «нормой».

  • Не доверять одному методу. Комбинировать формальные статтесты (χ², KS), unsupervised ML (IF, LOF), distance‑from‑baseline и доменную экспертизу. Те точки, которые помечают все методы — самый сильный сигнал.

В этой статье у нас три независимых сита: χ² (Доцент 3–4, Хмырь 3–4, Деточкин 5–6), IF (Деточкин, Хмырь, Балбес, t3 3–4), L2 от baseline (Деточкин, Хмырь, Балбес, Доцент 3–4). Деточкин и Хмырь попадают во все три — это самый сильный сигнал. Доцент 3–4 попадает в два из трёх (χ² + L2), но не в IF — что характерно для участника сговора, паттерн которого встроен в групповой кластер. Этот паттерн «два да — один нет» сам по себе — диагностический.

Лагерёк, ты наш лагерёк, запорошил тебя белый снежок

Есть железное правило антифрода: никто не жульничает просто так. И добавлю: никто не становится внезапно гениальным просто так. Всегда должен быть reward.

Если в 2023–2024 годах ученики Олимпиады «Золотой шлем» были как все, а в 2025–2026 годах внезапно стали выдающимися математиками, значит, в 2024-м что‑то поменялось в системе мотивации.

Скажем сразу: в этой истории нет благотворительности. Призовое место в Олимпиаде «Золотой шлем» открывает дипломанту несколько маленьких дверей:

  • Смену в лагере под Москвой — это филиал «Академии Доцента», бывший пионерлагерь, там ёлки и водохранилище;

  • Строчку в школьное портфолио учащегося;

  • Мастер‑классы, встречи со спикерами, бонусные программы партнёров и стажировки от образовательного проекта и смежных образовательных проектов — все, что так важно родителям и не менее важно организаторам.

  • Запись в реестре одарённых детей. Когда подрастут — до трёх баллов к ЕГЭ при поступлении в нескольких столичных технических вузов;

  • Памятные сувениры от «Академии Доцента».

Всё это прописано в Положении «Конкурсной программы» № (номер скрыт) от хх.хх.2024. Документ публичный, лежит на сайте оргкомитета. Олимпиада «Золотой шлем» — часть этой программы.

Можно ли сказать, что с 2024 года всё «расширилось»? Документально — нет. Программа работает с 2015, конкурс с 2017, лагерь при школе‑организаторе с 2007. Инфраструктура давно собрана и сидит в углу комнаты. Что именно поменялось в 2024 — внутренняя кухня учреждения и в публичное поле она не выносится. Но в наших таблицах цифры до 2024 и после — это два разных мира. Бывает.

Самое интересное здесь даже не пироги. Самое интересное — кто их печёт. Учредитель программы — школа АД. Организатор олимпиады — подразделение АД. Составитель задач — сотрудник АД. Проверяющий — сотрудник АД. Жюри — сотрудники АД. Лагерь для призёров — филиал АД. KPI «количество подготовленных победителей» — у АД. Учителя самих участников — сотрудники АД.

Это не сговор и даже не конфликт интересов. Это институциональная конструкция, в которую не закладывали что‑то разделять.

В риск‑менеджменте это называется Single Point of Trust (SPoT) — точка, где нет ни одного независимого контрольного контура. В платёжной системе такое стараются развалить ещё на этапе проектирования: тот, кто инициирует операцию, не должен её сам же проверять; тот, кто проверяет, не должен учить операторов.

В детской математической олимпиаде — всё в одном ведре. И ведро работает. Шесть преподавателей с одной кафедры приводят треть всех призёров года. Дети едут в лагерь, который принадлежит этой же организации. Все довольны. Все при деле. Все смотрят в одну сторону.

В банковской сфере есть проверенный механизм: когда любая программа с reward‑ом меняется, через 3–6 месяцев меняется и поведение целевой аудитории.

В 2021 году ставка Федрезерва в США была 0%. Деньги — практически бесплатные. Крупные ИТ‑компании набирали людей «небольшими городами»: Meta — 21 000 новых сотрудников, Google — десятки тысяч (NerdWallet с цитированием Layoffs.fyi). К концу 2023 года ставка ФРС выросла до 5.33% (Statista) и тех же людей уволили: только в 2023 году — 262 735 человек в техах согласно Layoffs.fyi (TechCrunch).

Поведение всегда следует за деньгами. Это тот самый закон Гудхарта: «Как только мера становится целью, она перестаёт быть хорошей мерой». Сформулирован в 1975 году по совершенно другому поводу, но работает везде.

Олимпиада «Золотой шлем» в 2024 году была хорошей мерой математических способностей. В 2026 году она ей быть перестала.

Контраргументы (которых я жду)

«Учителя селектируют лучших — поэтому у них больше побед». Если бы это объясняло картину, мы бы видели смещение к Д1 у всех учителей, ведущих сильные кружки. Мы видим его у четверых с одной школы. У других сильных педагогов в той же выборке — нормальные распределения, как у всех, как у ВсОШ. Селекция отвечает за уровень входа, а не за относительные пропорции Д1/Д2/Д3 внутри уже отобранных.

«n=11 — это слишком маленькая выборка для расчета p‑значений». Считать можно — если делать это правильно. Для n<5 я вообще не делаю выводов — это методологический порог отсечения. При n=11 (Хмырь) χ² работает корректно. Главное — четыре разных детектора (χ², КС, KL, IF) синхронно подсвечивают одних и тех же людей.

«А может, вы со своим питоном просто отобрали заметных людей?». Имена я не отбирал. У меня в выборке были все ≈80 учителей из реестра, по всем годам. Алгоритм сам выбрал тех, кто превышает пороги. То, что среди них оказались организатор олимпиады, её муж и её коллеги по школе‑организатору — это эмерджентное свойство данных, а не моё художественное решение.

Чем это всё плохо кончится

Я несколько раз слышал в обсуждениях родителей: «Ну, олимпиада, ну. Ну, кто‑то получил Д1 вместо Д3. Подумаешь».

Позвольте объяснить, подумаешь.

Во‑первых, это масштабируется. То, что один раз сработало — повторяется. Если родительская среда начинает понимать, что «правильный учитель» — это +20% к шансам попасть в матшколу, спрос на правильных учителей вырастет в разы. Кто‑то ответит на этот спрос. А потом ещё кто‑то. Это не остановится само.

Во‑вторых, это убивает остальные олимпиады. У каждой олимпиады есть бюджет доверия. Когда статистика по одной из них начинает выглядеть так — все остальные тоже под подозрением. Реальные победители ВсОШ, которые годами решали задачи, оказываются в одном ряду с теми, кому «подкрутили процентом». Олимпиада как институт перестаёт работать.

В‑третьих, это структурно невозможно расследовать изнутри. Если организатор, составитель задач и главный проверяющий — один и тот же человек, то жалобы рассматривает он же. В банках это называется отсутствие сегрегации обязанностей. Базовое требование уровня 1990 года.

Детский математический кружок в 2026 году имеет такую же управленческую гигиену, как российский банк в 1995-м.

Что в этом всём по‑настоящему интересно

Самое интересное не в том, что я что‑то нашёл. Самое интересное — как я это нашёл.

Ещё пять лет назад человеку, который хотел бы провести подобный анализ как хобби, нужно было быть:

  • Готовым потратить месяц жизни вечерами и выходными на парсинг, очистку, статистику, графики и форматирование;

  • Иметь профильное образование;

  • Иметь достаточно крепкий желудок, чтобы пройти через все этапы, не закрыв проект на середине.

В 2026 году пороговый барьер обрушился. Клоткот превращает четырёхнедельный марафон в двухдневный спринт. Это значит, что в ближайшие годы на Хабре появятся сотни таких проектов. Кто‑то найдёт аномалии в школьных рейтингах. Кто‑то — в распределении грантов. Кто‑то — в торгах ОФЗ. И не потому, что появятся новые аномалии, а потому, что появятся новые наблюдатели.

Раньше единственным наблюдателем за аномалиями была государственная контрольно‑ревизионная машина — медленная, перегруженная, выборочная. Теперь у каждого аналитика с любопытством и LLM под рукой есть возможность стать наблюдателем.

Это, на мой взгляд, пока самое недооценённое последствие LLM‑революции.

Что нужно делать оргкомитету

Я в эту аудиторию формально не пишу, потому что в комментариях скорее всего не появится ничего хорошего. Но всё‑таки.

  1. Сегрегация ролей. организатор ≠ составитель ≠ проверяющий ≠ учитель участника. Один человек — одна роль. В банках это базовое требование. В школьных олимпиадах должно быть тоже.

  2. Шифрованная проверка. ФИО и школа убираются с работы на этапе проверки. ВсОШ — десятилетиями так делает. Это технически несложно.

  3. Внешнее жюри. На олимпиаду одной школы приглашать жюри из других регионов. Каждый член жюри декларирует конфликт интересов до начала проверки.

  4. Микро‑статистика — публично. Распределение Д1/Д2/Д3 по школам и учителям должно публиковаться вместе с реестром. Это превентивный антифрод нулевой стоимости.

  5. Ретро‑аудит 2025 и 2026. Независимая комиссия пересчитывает работы воспитанников четырех флагнутых учителей. Не для наказания — для восстановления справедливости по другим призерам.

  6. Апелляции — завести как класс. На «Золотом шлеме» их нет. Ни в каком виде. Не «процесс непрозрачен», не «жалобы рассматривает тот же, кто проверял» — а просто нет: ни регламента, ни формы, ни сроков, ни адресата. Решение жюри окончательно ровно потому, что обжаловать его технически некуда. У ВсОШ апелляции есть с момента основания, с публичным регламентом. У олимпиады, которая раздаёт льготы и записи в реестр одарённых детей — нет. Это не баг. Это дизайн.

Я это написал. Оргкомитет, скорее всего, не прочитает. Дети, прибежавшие домой с Д3 вместо Д1, тоже не прочитают. Прочитаете вы.

Так что же это было?

Это была история про то, как один любитель математики применил банковские антифрод‑методы к школьной олимпиаде и нашёл там очень много гениальных учеников.

Эти гениальные ученики ходят к очень небольшому кругу одаренных учителей. Учителя — частично родственники друг другу. Главный из них — одновременно организует, составляет, проверяет и обучает участников. Все они — из одной и той же школы.

Корреляция этого с появлением материальных стимулов для победителей — поразительная.

Но это не история про читерство (см. дисклеймер). Это история про то, как страна нечаянно вырастила небольшое скопление педагогических гениев на одной маленькой кафедре. Я в это, конечно, искренне верю. И Магнус Карлсен тоже.

Все так делают

У Чехова в «Злоумышленнике» следователь допрашивает мужика Дениса, которого поймали за отвинчиванием гаек с железной дороги. На грузила. Для рыбалки.

— Для чего ты отвинчивал гайку?

— Коли б не нужна была, не отвинчивал бы.

— Да пойми же, гайками прикрепляется рельса к шпалам!

— Это мы понимаем… Мы ведь не все отвинчиваем… оставляем… Не без ума делаем… понимаем…

— В прошлом году здесь сошёл поезд с рельсов.

— Уж сколько лет всей деревней гайки отвинчиваем, и хранил господь, а тут крушение… людей убил… Ежели б я рельсу унёс или, положим, бревно поперёк ейного пути положил, ну, тогды, пожалуй, своротило бы поезд, а то… тьфу! гайка!

Денис не злодей и не идиот. Он искренне не видит проблемы. Гайка же. Сколько лет — и ничего. Все так делают.

Есть и бытовая версия — тётя Маша из ларька у метро, чуть‑чуть подкручивающая весы. Ущерб — 30 граммов творога за раз. Все знают, никто не ловит. Тётя Маша не считает это жульничеством — «ну все так делают».

Олимпиадные дипломы — это не гайки и не творог. Это сигнал ребёнку, что в мире, где он живёт, усилие конвертируется в результат честно. Что если он шесть месяцев решал задачи, потом получил Д3 — это и есть Д3. Не Д3, который мог бы быть Д1 при наличии «правильного» учителя.

Когда сигнал ломается на этом уровне — мы не получаем плохого олимпиадника. Мы получаем взрослого, который через десять лет так же подкручивает весы. Только уже не на 30 граммов творога, а на гос. тендере или на корпоративной финансовой отчётности.

Мелкое жульничество — это крупное жульничество в маленьком размере.

А гениальные дети — это просто проблема обзорной статистики до того, как они станут гениальными взрослыми.

P. S.

Если в вас сейчас проснулся коллега‑аналитик и хочется провалидировать результаты — все данные собраны из открытых публикаций оргкомитета олимпиады и финальных реестров ВсОШ. Ничего эксклюзивного, ничего инсайдерского. Всё лежит в открытом доступе.

Если вы — оргкомитет олимпиады или один из упомянутых учителей и хотите дать пояснения по поводу p = 0.04 и лифта Д1 = 1.63×: пишите в личку. Опубликую ваш ответ полностью и без редактуры.

И да: ребёнок знакомого в 2026 году получил Д3. Думаю, что он обрадовался и сказал: «Пап, я в следующем году буду решать ещё лучше». И я бы ему очень поверил. Просто хотелось бы, чтобы в следующем году «лучше» означало — лучше.

Пока оформлял, пришел заказ еще на одну олимпиаду — за 300. Ну что ж, 300, значит 300 — в следующей серии.

ссылка на оригинал статьи https://habr.com/ru/articles/1051116/