Возможно вы уже знаете, что в чарт «Яндекс Музыки» залетают треки, сгенерированные ИИ. Например, перепевка стихотворения Есенина «Сыпь, гармоника», которая сейчас на 16 месте чарта. Или трек «Ярмарка судеб» исполнителя Alena, который был даже спет в эфире телеканала Россия 1.
Мне нравились алгоритмы «Яндекс Музыки». Благодаря им в своё время я открыл много малоизвестных артистов, которых слушаю до сих пор. Но с появлением Suno, Lyria, Udio, алгоритмами рекомендаций Яндекса пользоваться стало невозможно. Мне то и дело подсовывались низкокачественные ИИ-треки.
В какой-то момент меня это достало. Я провёл своё расследование и получил неутешительные результаты. В базе «Яндекс Музыки» сейчас как минимум 140 тысяч ИИ-исполнителей. Ежемесячно они загружают больше 100 тысяч ИИ-треков, что составляет примерно 40% от всех загружаемых треков. А каждый 10-й трек в чарте – сгенерирован ИИ. И «Яндекс» ничего с этим не делает.
Краткое предисловие
Обычным будничным январским днём во время работы я слушал «Мою волну» на «Яндекс Музыке». В очередной раз алгоритмы мне подсунули ИИ-трек. То, что это нейрослоп было слышно отчётливо.
Потушив пожар в пятой точке, я пошёл общаться с техподдержкой «Яндекса». Мне хотелось понять, а планирует ли «Яндекс» как-то маркировать такую музыку?
Поскольку в техподдержке «Яндекс» уже внедрил ИИ, мне не сразу удалось пробиться к человеку. Когда всё же удалось, то у меня попросили ссылку на ИИ-исполнителей, которые мне попались, и всё… На мои вопросы техподдержка не ответила. А заявка на следующий день была автоматически закрыта.
Полная переписка с техподдержкой «Яндекса»




Маркировка ИИ-контента. Позиция «Яндекса» и государства.
Как выяснилось позже, «Яндекс» вообще не планировал добровольно заниматься маркировкой ИИ-музыки. Основная причина — деньги. Вот что сказал Арсений Козымаев, директор по контенту и партнёрствам «Яндекс Музыки» в дискуссии Института Музыкальных Инициатив:
Если трек нравится слушателям — он попадает в рекомендации, если нет — значит, трек не интересен аудитории. И это правило едино для всех — неважно, с помощью каких инструментов создаётся трек.
ИИ поможет музыкальной индустрии заработать больше денег. Мне нравится персональный подход Spotify, который размышляет о том, чтобы предложить пользователю генерировать собственную версию любимого трека прямо на площадке. Автор оригинала получит вознаграждение, а пользователь — версию трека, которую хочет послушать в моменте.
Такое публичное заявление — закономерность, ведь «Яндекс» доминирует среди музыкальных стримингов в России. А когда бизнес отказывался от 300% прибыли? Западные сервисы, которые добровольно маркируют ИИ-треки, недоступны для россиян. Можно делать то, что хочешь. Капитализм, счастье, зашибись!
Государство тоже не одобряет маркировку ИИ-контента. 15 апреля 2026 года профильный комитет Госдумы отклонил законопроект о маркировке ИИ-контента:
«Комитет не поддерживает, рекомендует отклонить», — сказал зампредкомитета Госдумы по информполитике Антон Горелкин на заседании комитета в среду.
По его словам, в случае принятия законопроекта «отмаркировать придётся 90% всего интернета, а мошенники, естественно, маркировать ничего не будут».
Отмечу, что я не против ИИ в целом. Как программист, я использую нейросети каждый день: на работе у меня корпоративная подписка на GitHub Copilot и Microsoft Copilot. Для пет-проектов сейчас я использую OpenCode с DeepSeek. В мои рабочие обязанности входит в том числе и внедрение агентов в наши приложения.
Пусть те, кому нравится ИИ-музыка, создают и слушают её сколько влезет. Но сложившуюся ситуацию считаю несправедливой ни по отношению к обычным группам и музыкантам, ни к слушателям. Если пользователю, например, не нравится электронная музыка, то он может отфильтровать плейлист. У любого стримингового сервиса есть такая возможность. С ИИ-треками так сделать не получается.
Расследование и его результаты
После того диалога с теходдержкой «Яндекса», я перестал включать «Мою волну» и слушал только несколько моих любимых групп. Это продолжалось примерно 2 месяца. За это время в одной запрещённой соцсети мне попадалось много рилсов от обычных музыкантов, которые так же как и я негодовали из-за засилья нейрослопа. В конце марта терпение закончилось и я начал делать браузерное расширение, которое бы автоматически маркировало ИИ-артистов, но об этом чуть позже.
Я изначально понимал, что браузерное расширение не может проводить глубокий анализ музыки и метаданных артиста на лету. Проверки должны осуществляться где-то в фоне, централизованно, а расширение будет просто использовать готовую базу ИИ-артистов. Поэтому я начал исследовать всех артистов на «Яндекс Музыке»: от самых новых до старых.
Первый этап проверки состоял в том, чтобы сверить релизы артистов на «Яндекс Музыке» с релизами в Deezer — единственной мне известной стриминговой платформой с маркировкой ИИ-музыки.

Я начал перебирать всех артистов одним за одним. На данный момент, проверено 5.7 млн. артистов. Из них, лишь у 19% есть хотя бы один релиз, поэтому в дальнейшем, я буду говорить только про этих исполнителей.
Сравнение с Deezer показало, что как минимум 7% артистов использовали ИИ при создании музыки.
Пояснение к диаграмме выше
— 100% не ИИ — артист был найден на Deezer и ни один из его релизов не был помечен как ИИ.
— Нужна доп. проверка — артист найден на Deezer, существующие на Deezer релизы не помечены как ИИ, но на «Яндексе» есть релизы, которые отсутствуют на Deezer.
— 100% ИИ — артист найден на Deezer и хотя бы один релиз помечен как ИИ.
— Нет на Deezer — профиль артиста не найден на Deezer.
Кажется, что 7% — это не так много. В абсолютных значениях это всего лишь 76.9 тыс. исполнителей. Но есть несколько «но»:
1. Эти 7% сейчас создают примерно треть всей новой музыки на «Яндексе».
2. Не все авторы загружают своё творчество на Deezer. Я бегло проверил категорию «Нет на Deezer» и обнаружил там много артистов с сгенерированной музыкой. Аналогичная ситуация с категорией «Нужна доп. Проверка». Далее я буду называть эти 2 категории «серой зоной».
Применяем машинное обучение
Чтобы разобраться со вторым «но» и найти ИИ-артистов в серой зоне, я решил применить машинное обучение. Поскольку у меня нет возможности анализировать 400 тысяч композиций, которые загружаются в «Яндекс» ежемесячно, то я решил использовать доступные метаданные вместе с моделью XGBoost. Для выявления признаков, я проанализировал информацию об артистах, лейблах, релизах и треках и обнаружил закономерности.
Как оказалось, одним из признаков ИИ-артистов являются частые релизы. Некоторые из артистов генерируют столько контента, что диву даёшься. Например, ИИ-исполнитель ниже загружает в среднем 90+ релизов в день (5465 релизов за 60 дней). Феноменальная продуктивность.

Другим важным признаком является принадлежность к определённым лейблам или коллаборации с артистами из таких лейблов. Пример такого лейбла — Context Collapse с 278 ИИ-артистами.
Всего же в модели использовались 15 признаков. Для обучения использовались метаданные 572 тыс. артистов. Из них 59 тыс. были подтверждены как ИИ, остальные 398 тыс. — не ИИ. Оставшиеся 114 тыс. использовались для оценки модели.
Матрица ошибок (confusion matrix) модели получилась следующая:
|
|
Предсказано как не ИИ |
Предсказано как ИИ |
|
Действительно не ИИ |
96 740 |
2784 |
|
Действительно ИИ |
423 |
14 370 |
Из всех, кого модель назвала ИИ, 83.77% действительно оказались ИИ. Из всех ИИ-артистов модель нашла 97.14%.
Все метрики модели
-
Precision: 0.8377
-
Recall: 0.9714
-
F1: 0.8996
-
MCC: 0.8867
-
AUC-ROC: 0.997
-
AUC-PR: 0.9841
-
Log loss: 0.0659
Применив модель к артистам из «серой» категории, получилось, что ещё около 64 тысячи исполнителей с высокой вероятностью (≥ 0.85) можно отнести к ИИ. Они, в свою очередь, добавили ещё 6% – 11% ИИ-треков ежемесячно.
По моим скромным подсчётам, получается, что на «Яндекс Музыке» сейчас примерно 140 тысяч ИИ артистов. И ежемесячно они загружают около 40% новой музыки.
Как с этим жить?
Выше я писал, что «Яндекс» не планирует маркировать ИИ-музыку. Я решил это сделать за них и написал браузерное расширение для Chrome и Firefox, которое маркирует ИИ-артистов на основе моих данных.
Также, если музыка ИИ-артиста попадётся в «Моей Волне», то треку автоматически будет поставлен дизлайк и он пропускается.
Расширение бесплатное. Если вы, как и я, часто слушаете музыку с компьютера, пока работаете, то оно может быть для вас полезным. Код лежит на GitHub под лицензией MIT — буду рад, если кому-то интересно поучаствовать в разработке. Если же вам интересно ещё больше технических подробностей проекта, то добро пожаловать в Telegram-канал.
Не знаю, изменится ли что-то от публикации этой статьи или от расширения. Я продолжу заниматься этим проектом. А вы теперь хотя бы осознаёте масштаб. Конспирологическая теория мёртвого интернета, возможно, не такая уж и теория и не конспирологическая.
ссылка на оригинал статьи https://habr.com/ru/articles/1036166/