OpenAI не успела выпустить обещанный Media Manager к 2025 году

от автора

OpenAI не смогла предоставить обещанный инструмент отказа, запланированный к 2025 году. В мае компания заявила, что разрабатывает инструмент, позволяющий создателям указывать, как они хотят, чтобы их работы включались или исключались из обучающих данных AI. Однако спустя семь месяцев эта функция всё ещё не появилась.

Названный Media Manager, инструмент должен был «опознавать авторский текст, изображения, аудио и видео», как заявила OpenAI тогда, чтобы отражать предпочтения создателей «по нескольким источникам». Он предназначался для предотвращения критики компании и, возможно, для защиты OpenAI от юридических претензий, связанных с интеллектуальной собственностью.

Однако по словам знакомых с этим дела лиц, этот инструмент редко рассматривался как важный внутри компании.

«Я не думаю, что это было приоритетом», — сказал бывший сотрудник OpenAI. «Честно говоря, я не помню, чтобы кто-то работал над этим».

Член юридической команды OpenAI, который работал над Media Manager, Фред фон Лоэманн, перешёл в октябре на частичную консультационную роль. PR OpenAI подтвердило переход фон Лоэманна. OpenAI ещё не предоставила обновлений о прогрессе Media Manager, и компания пропустила самоустановленный срок внедрения инструмента к 2025 году.

Модели AI, такие как OpenAI, обучаются распознавать паттерны в наборах данных для создания предсказаний — например, что человек, откусывающий бургер, оставит след от укуса. Это позволяет моделям до некоторой степени понимать, как устроен мир, наблюдая за ним. ChatGPT может писать убедительные электронные письма и эссе, а Sora, видеогенератор OpenAI, может создавать относительно реалистичные видеоматериалы.

Возможность использовать примеры текста, фильмов и других материалов для создания новых работ делает AI чрезвычайно мощным. Но он также воспроизводящий. При определённых запросах модели — большинство из которых обучены на бесчисленных веб-страницах, видео и изображениях — создают почти точные копии этих данных, которые, несмотря на то, что они «публично доступны», не предназначены для такого использования.

Например, Sora может генерировать клипы с логотипом TikTok и популярными персонажами видеоигр. The New York Times заставила ChatGPT процитировать свои статьи дословно. Это, понятным образом, расстроило создателей, чьи работы были использованы для обучения AI без их разрешения. Многие обратились к юристам.

OpenAI ведёт борьбу с коллективными исками, поданными художниками, писателями, ютуберами, компьютерными учёными и новостными организациями, которые утверждают, что стартап незаконно обучался на их работах. Истцами являются авторы Сара Сильверман и Та Нехиси Коутс, визуальные художники и медиа-конгломераты, такие как The New York Times и Radio-Canada, среди прочих.

OpenAI заключила лицензионные соглашения с некоторыми партнёрами, но не все создатели считают условия привлекательными. Компания предлагает создателям несколько разовых способов отказаться от обучения AI. В прошлом сентябре компания запустила форму подачи заявок, позволяющую художникам отмечать свои работы для исключения из будущих обучающих наборов. Кроме того, OpenAI давно позволяет веб-мастерам блокировать её веб-краулинг-ботов от сбора данных с их доменов.

Однако создатели критиковали эти методы как хаотичные и недостаточные. Нет конкретных механизмов отказа для письменных работ, видео или аудиозаписей. А форма отказа для изображений требует отправки копии каждого изображения для удаления вместе с описанием, что является обременительным процессом.

В объявлении в мае OpenAI заявила, что Media Manager будет использовать передовые исследования в области машинного обучения, чтобы позволить создателям и владельцам контента сообщать OpenAI, чем они владеют». OpenAI, которая заявляла, что сотрудничает с регуляторами при разработке инструмента, надеялась, что Media Manager установит стандарт во всей индустрии AI.

OpenAI никогда публично не упоминала о Media Manager с тех пор. Пресс-секретарь сообщил, что инструмент всё ещё разрабатывается по состоянию на август, но не ответил на запрос комментария в середине декабря.

OpenAI не дала никаких указаний относительно того, когда Media Manager может быть запущен — или даже какие функции и возможности он может включать.

Предполагая, что Media Manager всё же появится, эксперты не уверены, что это успокоит опасения создателей — или решит юридические вопросы, связанные с использованием интеллектуальной собственности в AI.

Адриан Чайхан, адвокат по ИС в Stubbs Alderton & Markiles, отметил, что Media Manager, как он описан, является амбициозным предприятием. Даже такие крупные платформы, как YouTube и TikTok, сталкиваются с проблемами идентификации контента в масштабе. Смогла бы бы OpenAI действительно сделать это лучше?

«Обеспечение соблюдения юридически обязательных защит для создателей и потенциальных требований о компенсации представляет собой вызовы», — сказал Чайхан. «Особенно учитывая быстро развивающийся и потенциально разнородный юридический ландшафт в разных национальных и местных юрисдикциях».

Эд Ньютон-Рекс, основатель Fairly Trained, некоммерческой организации, которая сертифицирует компании AI на соблюдение прав создателей, считает, что Media Manager несправедливо перекладывает бремя контроля за обучением AI на создателей; не используя его, они, возможно, дают подразумеваемое согласие на использование своих работ.

«Большинство создателей даже не услышат о нём, не говоря уже о его использовании», — сказал он. «Но это всё же будет использоваться для защиты массовой эксплуатации творческих работ против воли создателей».

Майк Борелла, сопредседатель группы практики AI MBHB, указал, что системы отказа не всегда учитывают преобразования, которые могут быть внесены в работу, например, изображение, которое было уменьшено по размеру. Они также могут не учитывать распространённый сценарий, когда третьи платформы хранят копии контента создателей, добавил Джошуа Вайгенсберг, адвокат по ИС и медиа в Pryor Cashman.

«Создатели и владельцы авторских прав не контролируют и часто даже не знают, где их работы появляются в интернете», — сказал Вайгенсберг. «Даже если создатель скажет каждой платформе AI отказаться от обучения, эти компании, вероятно, всё равно продолжат обучение на копиях их работ, доступных на сторонних веб-сайтах и сервисах».

Media Manager может быть не особенно выгоден даже для OpenAI, по крайней мере с юриспруденческой точки зрения. Эван Эверист, партнёр в Dorsey & Whitney, специализирующийся на авторском праве, сказал, что хотя OpenAI могла бы использовать этот инструмент, чтобы показать судье, что она снижает использование контента, защищённого ИС, Media Manager, вероятно, не защитит компанию от убытков, если будет установлено, что она нарушила права.

«Владельцы авторских прав не обязаны заранее сообщать другим, что они не хотят, чтобы их работы нарушались», — сказал Эверист. «Основы закона об авторском праве по-прежнему применимы — то есть не брать и не копировать работы других людей без разрешения. Эта функция может больше касаться PR и позиционирования OpenAI как этичного пользователя контента».

В отсутствие Media Manager OpenAI внедрила фильтры — пусть и несовершенные — чтобы предотвратить воспроизведение обучающих примеров моделями. И в судебных процессах, с которыми она борется, компания продолжает утверждать защиту по принципу справедливого использования, заявляя, что её модели создают трансформирующие, а не плагиатные работы.

Суды могут решить, что AI компании имеет трансформирующую цель, следуя прецеденту, установленному примерно десять лет назад в деле издательской индустрии против Google. В тот раз суд постановил, что копирование миллионов книг для Google Books, своего рода цифрового архива, было допустимо.

OpenAI публично заявила, что невозможно обучать конкурентные модели AI без использования защищённых авторским правом материалов — авторизованных или нет.

«Ограничение обучающих данных только книгами общественного достояния и рисунками, созданными более века назад, может привести к интересному эксперименту, но это не обеспечит AI-системы, соответствующие потребностям сегодняшних граждан», — написала компания в январской заявке в Палату лордов Великобритании.

Если суды в конце концов объявят OpenAI победителем, Media Manager не будет иметь большого юридического значения. OpenAI, похоже, готова рискнуть этим — или пересмотреть свою стратегию отказа.

Источник


ссылка на оригинал статьи https://habr.com/ru/articles/871198/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *