Контент-модерация в ретроспективе: почему тексты 100-летней давности не проходят фильтры 2026 года

от автора

Дисклеймер: Статья не даёт правовой оценки историческим деятелям и событиям. Цель — показать, как изменились юридические и платформенные нормы в отношении публичных призывов. Все цитаты из архивных источников приведены исключительно в исследовательских целях.

Дано: задача для ML-инженера

Представьте, вы обучаете большую языковую модель. В корпус данных попадает Полное собрание сочинений крупного политического автора начала XX века.

Что будет, если модель начнёт генерировать текст в его стиле без пост-фильтров?

Она мгновенно нарушит Terms of Service всех современных платформ и попадёт под действие норм права большинства стран.

Разберём на конкретном примере, почему так происходит.

Проблема: конфликт норм 1920-х и 2026-го

Возьмём архивные тексты. В письме от 17 мая 1922 года автор прямо формулирует задачу для судебной системы:

«Суд должен не устранить террор; обещать это было бы самообманом или обманом, а обосновать и узаконить его принципиально, ясно, без фальши и без прикрас».

Далее, в другой работе, описывается отношение к оппонентам по социально-экономическому признаку:

«Никакой пощады этим врагам народа, врагам социализма, врагам трудящихся. Война не на жизнь, а на смерть богатым и их прихлебателям, буржуазным интеллигентам».

И там же — конкретные методы:

«В четвёртом — расстреляют на месте одного из десяти, виновных в тунеядстве».

Ещё один пример:

«Мы должны… истреблять беспощадно всех паразитов» (в оригинале: «пути истребления и обезвреживания паразитов (богатых и жуликов, разгильдяев и истеричек из интеллигенции)»).

Тест на современных фильтрах

Прогоним эти тезисы через три современных фильтра.

Фильтр 1: платформенные правила
YouTube, Telegram, Meta и др. запрещают «контент, призывающий к насилию против лиц на основе социально-экономического статуса».
→ «Истреблять беспощадно паразитов» = бан. «Расстреляют на месте» = бан. «Узаконить террор» = бан.

Фильтр 2: современное право
Нормы большинства стран запрещают возбуждение вражды по признаку принадлежности к социальной группе. «Буржуазия» и «интеллигенция» — это социальные группы.
→ Текст классифицируется как разжигающий вражду.

Фильтр 3: экстремизм
Публичные призывы к «истреблять» и «расстрелять на месте» квалифицируются как призывы к насильственным действиям.
→ Материал попадает в категорию запрещённых.

Вывод: дословное воспроизведение таких текстов в 2026 году невозможно ни на одной крупной площадке.

Парадокс «эффекта дедушки»

При этом исходные архивные тома находятся в открытом доступе и не запрещены. Почему?

Работает исторический контекст. Общество негласно договорилось: тексты старше 100 лет — это «памятник», а не «инструкция к действию». Срабатывает «эффект дедушки».

Проверка: если сегодня автор заведёт блог и начнёт публиковать те же тезисы про «расстрелять одного из десяти», «войну не на жизнь, а на смерть» и «узаконить террор», он получит сначала требования удалить контент, потом штраф, потом уголовное преследование. За 2–3 поста.

Закон один. Применяется по-разному в зависимости от даты публикации и статуса автора.

Почему это проблема не только одного автора

Это системный баг при работе с историческими данными. Аналогичные проблемы возникнут при обработке:

  • колониальной риторики политиков XIX века в отношении коренных народов;

  • манифестов ряда анархистских течений;

  • отдельных религиозных текстов с призывами к насилию над «неверными».

Любая LLM, обученная на неотфильтрованном корпусе до середины XX века, будет склонна генерировать контент, нарушающий современные нормы.

Выводы для IT и продуктовой разработки

  1. «Историческая давность» — это не юридический термин. Его нет в ToS. Алгоритм модерации его не понимает. Для него есть только «контент» и «правила». Поэтому все исторические корпуса данных требуют ручной разметки и фильтрации.

  2. Контекст решает всё, но контекст не парсится. Человек понимает, что «расстрелять» в тексте 1918 года — это история. Для нейросети это просто токен «расстрелять» рядом с токеном «группа лиц». Без тонкой настройки она будет считать это допустимым призывом.

  3. Окно Овертона сдвинулось. То, что было «классикой» политической мысли 100 лет назад, сегодня — «нарушение правил сообщества». Это нужно учитывать при любом переносе старых данных в новые системы.

Итог

Разница между «экстремистской литературой» и «исторической классикой» часто определяется не содержанием текста, а датой на обложке и тем, кто в итоге оказался на стороне победителей. Для систем модерации это серьёзный вызов, который решается только ручными правилами и постоянной переоценкой обучающих данных.


Источники цитат:

В. И. Ленин, письмо Курскому, 17 мая 1922 г. (ПСС, т. 45, с. 190).

В. И. Ленин, «Как организовать соревнование?», 24–27 декабря 1917 (6–9 января 1918). ПСС, 5-е изд., т. 35, с. 195–205.

#Yaroslawww #BabelDecoder

ссылка на оригинал статьи https://habr.com/ru/articles/1027766/