Главное
Аналитика

Сбор сведений из открытых источников: почему это рискованно, если выкачивается информация из чужих баз данных?

МС
Максим Смоляров
Сбор сведений из открытых источников: почему это рискованно, если выкачивается информация из чужих баз данных?

Собрать информацию о человеке или продукте с использованием высоких технологий стало делом техники. В прямом и переносном смысле слова. Однако такое выкачивание данных может стать поводом для судебного разбирательства. Почему это происходит — далее в материале.

Сайт как база данных

Нередко информация, систематизированная на сайте (каталог, соцсеть, маркетплейс), является официально созданной базой данных. Права на нее могут принадлежать компании-разработчику этого сайта. Соответственно, использовать многочисленные указанные материалы на коммерческой основе без разрешения их правообладателя — признается нарушением.

В 2017 году в российских судах началось слушание по делу ООО «В Контакте» против ООО «Дабл Дата».

«Дабл Дата» запустила несколько программ:

  • Поисковую систему (позволяет обнаружить нужный аккаунт человека и предоставить ссылку на него);
  • ПО для визуализации информации по ссылкам;
  • ПО, позволяющее обнаруживать «дубли» аккаунтов пользователей.

ООО «В Контакте» посчитало, что указанное программное обеспечение:

  • работает без надлежащего разрешения;
  • предназначено для скоринга;
  • нарушает их права на сформированную базу данных. 

Последовало обращение в суд.

Дело рассматривалось несколько лет, пройдя последовательно ряд инстанций.

В конечном счете — в Суде по интеллектуальным правам утвердили мировое соглашение между корпорациями.

Юристы-аналитики, разбирая решения СИП (хотя финальной позиции по ключевым вопросам не было), указывают на следующие важные детали:

1. Даже если информацию в базу данных сайта «скидывали» сами пользователи, то это не означает, что создатель (организатор) не имеет прав на эту БД.

2. Изготовителем базы данных считается лицо, вложившее серьезные ресурсы в создание продукта. 

Как найти грань между «можно обрабатывать» и «нельзя»?

Во-первых, свобода доступа к информации закреплена в Конституции. Отдельные факты (цена товара, их характеристика, общедоступные материалы и так далее) — не относятся к категории объектов авторского права.

Во-вторых, изготовитель базы данных получает на нее исключительное право, если в создание продукта были вложены финансовые, организационные или иные затраты.

В-третьих, субъект не может на систематической основе использовать существенную часть чужой базы данных без разрешения правообладателя. Это означает, например, что отдельные элементы или несущественную часть продукта — извлекать разрешено.

Грань между существенностью и несущественностью в этом случае очень тонкая. Она может проходить, например, по объемам извлечения: если используете неважные данные максимум из одного или двух профилей в соцсети, то это может считаться законным; если вы на коммерческой основе извлекаете данные из тысячи профилей, а потом анализируете их и предоставляете третьим лицам, — то это могут признать неправомерным действием.

В-четвертых, под юридической защитой оказывается структура созданной базы данных. 

Базовые правила выкачивания информации в автоматизированном режиме (парсинге)

Не стоит парсить:

  • Относимое к персональным данным (если разрешение прямо не прописано в законе);
  • Размещенный эксклюзивный контент.

При парсинге:

  • Отследите, что указывает владелец сайта в файле robots.txt (он определяет, какие разделы сайта разрешены для индексации поисковиками, а какие — нет);
  • Не направляйте частые запросы к системе (они могут быть расценены как атака).

А на западе кейсов, связанных с парсингом, не было?

Были.

Одно из значимых (и интересных) дел — противостояние соцсети LinkedIn против hiQ Labs.

Представители LinkedIn заявили, что их противники (конкуренты) собирают доступные данные пользователей. Чтобы это пресечь, соцсеть поставила блок на открытые страницы.

В суде ситуация развивалась так:

  • В первой инстанции — LinkedIn запретили ограничивать hiQ Labs по доступу к данным;
  • В апелляции — подобное решение было подтверждено (раз сами пользователи открыли свои страницы, то не стоит их ограничивать в подобном волеизъявлении).

Дело дошло до Верховного Суда, который направил кейс на пересмотр.

Мотивируя свое решение, ВС сослался на дело правоохранителя Роберта Ван Бюрена, который, пользуясь своим должностным положением, вошел в полицейскую базу данных и за взятку предоставил сведения другому о номерном знаке женщины-водителя. Суд посчитал, что в данном случае произошел незаконный неавторизованный доступ к защищенному компьютеру. То есть: полицейский имел полномочия по получению информации, но использовал он их для незаконной цели.

Апелляция, учтя подобное решение, посчитала, что к сайтам, размещенным в публичном поле, невозможно применить концепцию неавторизованного доступа. Доступ к открытым данным ограничивать не стали, нарушение профильного Закона не увидели.

Но компании, имеющие подобные сайты, без защиты не оставили: в пользовательском соглашении можно предусмотреть ограничения, за несоблюдение которых последует иск.

Регистрация базы данных в Роспатенте
Подготовка - 2-3 дня
Экспертиза - 1-2  мес.
Срок действия бессрочно
МС
Максим Смоляров
Аналитика
2
+1
Аналитика
2

более 150 000 подписчиков

Ничего лишнего. Рассказываем, как заработать на интеллектуальной собственности, идеях и технологиях

Спасибо за подписку! Первое письмо уже идет к вам.