В фотоархиве для обучения ИИ оказались частные медицинские фотографии

от автора

Журналисты издания Ars Technica рассказали историю девушки, которая нашла в открытом наборе изображений для обучения искусственного интеллекта свои медицинские фотографии. Девушка утверждает, что не давала согласие на публикацию изображений, а исследование набора данных показало, что в базе присутствуют тысячи таких фотографий.

Калифорнийская художница под псевдонимом Lapine рассказала в Twitter, что нашла в популярном фотоархиве LAION-5B, предназначенном для обучения искусственного интеллекта, свои медицинские фотографии. Художники пользуются базой данных для поиска своих работ и проверяют, использует ли их кто-то для обучения ИИ. Девушка произвела поиск по своей недавней фотографии и обнаружила, что в базе находятся её медицинские фотографии.

Lapine является носителем редкого генетического заболевания под названием конгенитальный дискератоз, которое также известно как синдром Цинссера-Коула-Энгмена. Заболевание влияет на кожу, кости, зубы и вызывает ороговение слизистых оболочек. В 2013 году девушка проходила серию операций по восстановлению контуров рта и челюсти. Хирург, проводивший операции, попросил тогда девушку позволить сделать фотографии под соглашением о том, что они не будут нигде публиковаться.

В 2018 году хирург, владевший фотографиями, умер от рака. Девушка считает, что после смерти врача кто-то получил доступ к его фотографиям и опубликовал их, а позже они оказались в базе данных. Lapine не захотела публично раскрывать свою личность, но журналисты Ars Technica отметили, что ознакомились с изображениями и подтвердили, что на фотографиях именно она. Вместе с этим представители издания обнаружили ещё тысячи медицинских фотографий в базе LAION-5B, которые могут нарушать этические нормы, а компании используют их для обучения ИИ и не подозревают об этом.

Представители фотоархива рассказали, что не хранят у себя изображения, а лишь ссылаются на открытые файлы в Сети. Поэтому администраторы не могут удалить изображения из базы, и для этого необходимо обратиться к тому, кто опубликовал фотографии в Интернете. Также lapine отметила, что считает недопустимым подобный сбор информации. Если данные оказались в Сети, то это ещё не значит, что их можно использовать для формирования датасетов.


ссылка на оригинал статьи https://habr.com/ru/articles/689538/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *