Сбор сведений из открытых источников: почему это рискованно, если выкачивается информация из чужих баз данных?

от автора

Собрать информацию о человеке или продукте с использованием высоких технологий стало делом техники. В прямом и переносном смысле слова. Однако такое выкачивание данных может стать поводом для судебного разбирательства. Почему это происходит — далее в материале.

Сайт как база данных

Нередко информация, систематизированная на сайте (каталог, соцсеть, маркетплейс), является официально созданной базой данных. Права на нее могут принадлежать компании-разработчику этого сайта. Соответственно, использовать многочисленные указанные материалы на коммерческой основе без разрешения их правообладателя — признается нарушением.

В 2017 году в российских судах началось слушание по делу ООО «В Контакте» против ООО «Дабл Дата».

«Дабл Дата» запустила несколько программ:

  • Поисковую систему (позволяет обнаружить нужный аккаунт человека и предоставить ссылку на него);

  • ПО для визуализации информации по ссылкам;

  • ПО, позволяющее обнаруживать «дубли» аккаунтов пользователей.

ООО «В Контакте» посчитало, что указанное программное обеспечение:

  • работает без надлежащего разрешения;

  • предназначено для скоринга;

  • нарушает их права на сформированную базу данных. 

Последовало обращение в суд.

Дело рассматривалось несколько лет, пройдя последовательно ряд инстанций.

В конечном счете — в Суде по интеллектуальным правам утвердили мировое соглашение между корпорациями.

Юристы-аналитики, разбирая решения СИП (хотя финальной позиции по ключевым вопросам не было), указывают на следующие важные детали:

1. Даже если информацию в базу данных сайта «скидывали» сами пользователи, то это не означает, что создатель (организатор) не имеет прав на эту БД.

2. Изготовителем базы данных считается лицо, вложившее серьезные ресурсы в создание продукта. 

Как найти грань между «можно обрабатывать» и «нельзя»?

Во-первых, свобода доступа к информации закреплена в Конституции. Отдельные факты (цена товара, их характеристика, общедоступные материалы и так далее) — не относятся к категории объектов авторского права.

Во-вторых, изготовитель базы данных получает на нее исключительное право, если в создание продукта были вложены финансовые, организационные или иные затраты.

В-третьих, субъект не может на систематической основе использовать существенную часть чужой базы данных без разрешения правообладателя. Это означает, например, что отдельные элементы или несущественную часть продукта — извлекать разрешено.

Грань между существенностью и несущественностью в этом случае очень тонкая. Она может проходить, например, по объемам извлечения: если используете неважные данные максимум из одного или двух профилей в соцсети, то это может считаться законным; если вы на коммерческой основе извлекаете данные из тысячи профилей, а потом анализируете их и предоставляете третьим лицам, — то это могут признать неправомерным действием.

В-четвертых, под юридической защитой оказывается структура созданной базы данных. 

Базовые правила выкачивания информации в автоматизированном режиме (парсинге)

Не стоит парсить:

  • Относимое к персональным данным (если разрешение прямо не прописано в законе);

  • Размещенный эксклюзивный контент.

При парсинге:

  • Отследите, что указывает владелец сайта в файле robots.txt (он определяет, какие разделы сайта разрешены для индексации поисковиками, а какие — нет);

  • Не направляйте частые запросы к системе (они могут быть расценены как атака).

А на западе кейсов, связанных с парсингом, не было?

Были.

Одно из значимых (и интересных) дел — противостояние соцсети LinkedIn против hiQ Labs.

Представители LinkedIn заявили, что их противники (конкуренты) собирают доступные данные пользователей. Чтобы это пресечь, соцсеть поставила блок на открытые страницы.

В суде ситуация развивалась так:

  • В первой инстанции — LinkedIn запретили ограничивать hiQ Labs по доступу к данным;

  • В апелляции — подобное решение было подтверждено (раз сами пользователи открыли свои страницы, то не стоит их ограничивать в подобном волеизъявлении).

Дело дошло до Верховного Суда, который направил кейс на пересмотр.

Мотивируя свое решение, ВС сослался на дело правоохранителя Роберта Ван Бюрена, который, пользуясь своим должностным положением, вошел в полицейскую базу данных и за взятку предоставил сведения другому о номерном знаке женщины-водителя. Суд посчитал, что в данном случае произошел незаконный неавторизованный доступ к защищенному компьютеру. То есть: полицейский имел полномочия по получению информации, но использовал он их для незаконной цели.

Апелляция, учтя подобное решение, посчитала, что к сайтам, размещенным в публичном поле, невозможно применить концепцию неавторизованного доступа. Доступ к открытым данным ограничивать не стали, нарушение профильного Закона не увидели.

Но компании, имеющие подобные сайты, без защиты не оставили: в пользовательском соглашении можно предусмотреть ограничения, за несоблюдение которых последует иск.

О сервисе Онлайн Патент:

Онлайн Патент — цифровая система № 1 в рейтинге Роспатента. С 2013 года мы создаем уникальные LegalTech‑решения для защиты и управления интеллектуальной собственностью. Зарегистрируйтесь в сервисе Онлайн‑Патент и получите доступ к следующим услугам:

ссылка на оригинал статьи https://habr.com/ru/articles/1034644/