Американские издания судятся с OpenAI за кражу их контента

Разработчики ИИ помимо технологических проблем, сталкиваются с моральными и юридическими. Еще три новостные организации: The Intercept, Raw Story и AlterNet — подали в суд на OpenAI и Microsoft иск о нарушении авторских прав, включая удаление авторства, заголовков и других атрибутов защищённых авторскими правами при обучении ИИ. Издания подали раздельные иски в федеральный суд Манхэттена, однако в целом координируют свои усилия, работая через одну юридическую фирму. Все три издания производят оригинальный журналистский контент, занимаясь настоящей репортажной деятельностью — дорогой в содержании. В частности, The Intercept является одним из самых известных в мире изданий, специализирующихся на расследовательской журналистике, публикующих униальные журналистские расследования о событиях в США и других странах по всему миру.

В исках сказано, что ChatGPT воспроизводит «дословно или почти дословно защищенные авторским правом журналистские произведения, не предоставляя информацию об авторе, заголовках, авторских правах или условиях использования материалов».

Как указано в иске, по данным сайта Copyleaks, почти 60% ответов ChatGPT 3.5 содержат плагиат в той или иной форме, а более 45% содержат текст, идентичный уже существующему контенту.

В иске The Intercept говорится, что у OpenAI был выбор: давать языковым моделям при обучении задачу учитывать наличие у текстов источников и правообладателей, или же игнорировать их — и они сознательно сделали выбор в пользу второго.

Raw Story и AlterNet идут в своём иске дальше, утверждая, что OpenAI и Microsoft считали, что ChatGPT будет менее популярен и будет приносить меньший доход, если пользователи будут знать, что ответы ChatGPT не полностью оригинальны и нарушают чужие авторские права. Сознательность действий Microsoft и OpenAI подтверждает то, что они предлагают юридическую защиту своим платным пользователям, если на них подадут в суд за нарушение авторских прав при использовании Copilot или ChatGPT Enterprise.

«Raw Story считает, что новостные организации должны противостоять OpenAI, которые нарушением авторских прав в цифровую эпоху, наживаются на тяжелом труде журналистов, ставя под угрозу их рабочие места», — заявили в совместном заявлении Raw Story и генеральный директор AlterNet Джон Бирн. «Функционирующая демократия требует процветания и разнообразия новостных сайтов. Безответственные действия OpenAI, если их не остановить, приведут к дальнейшему уничтожению новостной индустрии, а вместе с ней и репортерской деятельности, критически важной для позитивных изменений в обществе».

Нам удалось получить короткий комментарий специально для Хабра от The Intercept; мы спросили о целях иска и прогнозах о том, сколько времени это займёт:

Наша позиция: они нарушили наши авторские права, создав этот продукт, и должны нам за это. Хотя суд и может занять много времени.

В иске Intercept в качестве ответчиков указаны как OpenAI, так и ее наиболее известный инвестор Microsoft, тогда как в совместном иске, поданном Raw Story и AlterNet, указана только OpenAI. Иск Raw Story и AlterNet исключил Microsoft из-за их партнерства с MSN, которое помогает финансировать их журналистские расследования. В остальном жалобы практически идентичны, и интересы всех трех торговых точек в исках представляет юридическая фирма Loevy & Loevy.

Иски, поданные в среду, являются последними в серии судебных исков против OpenAI по поводу предполагаемого нарушения авторских прав, включая декабрьский иск от New York Times, который потребовал от компании уничтожить всех чат-боты или удалить обучающие данные, содержащие материалы издания.

Иски The Intercept, Raw Story и AlterNet требуют возмещения убытков и своей доли прибылей OpenAI, в то время New York Times требует ответить за миллиарды долларов легального и реального ущерба.

В ответ юристы OpenAI подали ходатайство об отклонении некоторых частей иска и заявили, что их услуги не составляют серьезной конкуренции с газетой, поэтому о том, как будет развиваться и чем закончится дело пока судить рано.

Волна судебных исков отражает тревогу медиаиндустрии тем, что ИИ будет конкурировать с авторитетными издателями в качестве источника информации для интернет-пользователей, одновременно сокращая доходы от рекламы и подрывая качество онлайн-новостей. Генеративный ИИ уже наводнил Интернет недостоверной информацией и некачественными сайтами, имитирующими новостные агентства.

Одновременно с тем, несколько других издателей решили пойти другим путём, и вместо исков к OpenAI решили сотрудничать с ними. Международное издательство Axel Springer, владеющее немецкими изданиями Welt и Bild, а также Politico и Business Insider, заключили многолетнее соглашение, предоставляющее OpenAI доступ к его работам в обмен на нераскрытую сумму финансовой компенсации.

Третьим путём можно считать использование самими изданиями ИИ для производства контента. На этом уже попалcя BuzzFeed, Sports Illustrated тоже использовал поддельных ИИ-авторов вместо реальных журналистов.

Какое из трёх направлений: суды и требование открытости в использовании чужого контента, тихое сотрудничество за деньги с ИИ-провайдерами, а то и вовсе использование ИИ для производства контента самими лучше?

Если проанализировать отношения авторов контента, на котором обучается ИИ с контентом, которые они выдают, то картина вырисовывается однозначная:

С одной стороны, лучшие ответы, которые дают чатботы вроде ChatGPT, основаны на труде и творчестве реальных людей.
С другой, «ИИ-галлюцинации», полностью или частично вымышленные мусорные ответы, как раз являются «оригинальным творчеством» ИИ являются худшим, что в них есть.
Чем больше доля ИИ-вводных (контента, сгенерированного ИИ) в ИИ-результатах, тем сильнее будет идти смещение пропорции в сторону мусорного контента, ИИ-галлюционаций.

Используя тексты, произведённые трудом реальных людей (необязательно защищённый авторскими правами контент, но и user generated-контент, творчество людей в соцсетях и по всему интернету) без указания источников и вознаграждения авторов, ИИ-компании сами обедняют плодородную почву, на которой расцветает их продукт: если люди будут идти за информацией, которая требует журналистской, редакторской, авторской, расследовательской работы к чат-ботам вместо соответствущих профильных изданий, то, когда подобные издания существенно сократят масштабы своей репортёрской и расследовательской деятельности или просто вымурт из-за нехватки средств к существованию, то и ИИ будет больше нечем отвечать, кроме переваривания уже устаревшей информации и собственных галлюцинаций.

Текст: @EgorKotkin

P.S. Запрет на публикации о VPN уже дошёл до Хабра: доступ к нашей статье о начале действия этого запрета ограничен по геолокации. Печальная ирония российской действительности в том, что читать статьи про VPN становится можно только через VPN. Поэтому вы знаете, что делать:

Для оплаты зарубежными картами или криптовалютой: xeovo.com. Скидка 10% по промокоду HABR2023
Для оплаты рублями: VPNPay

Как оставаться на связи: на английском языке следить за обновлениями Xeovo VPN, включая работу над собственным приложением и разработку VPN для других стран с жестокой интернет-цензурой можно в соцсетях:

Ну и конечно подписывайтесь на блог Xeovo на Хабре.

ссылка на оригинал статьи https://habr.com/ru/articles/804589/

Американские издания судятся с OpenAI за кражу их контента

Комментарии

Добавить комментарий Отменить ответ