Скрапинг интернет-ресурсов: критерии законности

24 Ноября 2020
М.А. Грязева,
студентка 3 курса Юридического факультета МГУ им. М.В. Ломоносова
 

«Информация – кислород современного мира», - говорил Рональд Рейган. Действительно, информация является огромной ценностью, однако ее объем в настоящее время настолько велик, что человеку достаточно трудно собирать и обрабатывать ее вручную. Это обстоятельство послужило предпосылкой возникновения такого явления в цифровой среде, как скрапинг (парсинг) интернет-ресурсов.

Несмотря на широкое применение данного механизма1 вопрос о его законности остается довольно актуальным ввиду отсутствия его законодательного урегулирования. П.О. Сёмин пишет, что «на стыке скрейпинга и права возникают проблемы, связанные с интеллектуальной собственностью и персональными данными, договорным правом и особенностями его реализации в Интернете, преступлениями в сфере компьютерной информации, обязательствами из причинения вреда компьютерной технике как имуществу» [6, с. 60]. Поэтому в данной работе мы постараемся сформулировать критерии законности скрапинга на основе анализа зарубежной и отечественной практики.

Прежде всего необходимо разобраться с тем, что такое скрапинг. Скрапинг представляет собой «автоматизированный сбор информации с различных интернет-ресурсов, который осуществляется посредством использования специально разработанной компьютерной программы – бота» [4]. Данная программа не использует программный интерфейс сайта, а имитирует поведение человека. Она работает следующим образом: сначала осуществляется анализ сайта - страницы временно загружаются в память устройства пользователя целиком, чтобы впоследствии извлечь из них необходимую информацию. Далее происходит непосредственно краулинг (crawling) страниц, в ходе которого извлекаются нужные данные, и последним этапом является организация собранных данных.

Какие правовые проблемы могут здесь возникнуть?

1.

Скрапинг и интеллектуальные права

Как уже было сказано, данная программа извлекает определенные данные из сайта и копирует их на устройство пользователя2. Однако как сам сайт, так и информация на нем могут являться объектами авторских и смежных прав, поэтому их свободное использование может быть ограничено или вовсе запрещено. В связи с этим необходимо разобраться с тем, в каких случаях скрапинг будет нарушать интеллектуальные права.

В соответствии со п. 2 ст. 1260 Гражданского кодекса РФ (далее – ГК), составителю интернет-сайта принадлежат авторские права на подбор или расположение материалов3. Однако ранее было отмечено, что в результате скрапинга из сайта извлекается нужная пользователю информация, которая впоследствии организуется определенным образом. Другими словами, материалы подбираются и располагаются в ином порядке, чем на сайте-источнике. Отсюда можно сделать вывод, что скрапинг не посягает на авторские права составителя интернет-сайта.

Между тем на сайте могут располагаться материалы, являющиеся объектами авторских прав: фотографии, видео- и аудиозаписи, литературные произведения и т.д. Будет ли их извлечение нарушением? Ответ на данный вопрос зависит о того, как работает конкретная программа. Так, сохранение всего содержимого сайта на устройство пользователя не будет являться воспроизведением помещенных на нем произведений при наличии двух условий. Такое сохранение должно носить временный характер – с целью последующего извлечения необходимой информации (подп. 1 п. 2 ст. 1270 ГК), извлекаемая информация должна быть неохраняемой (например, цены на товары). Однако программу можно настроить так, чтобы она сохраняла в памяти устройства все данные даже после извлечения нужных материалов. В таком случае скрапинг нельзя признать законным.

Наконец, интернет-сайт может являться объектом смежных прав, а именно – базой данных. Но не на каждую базу данных распространяется исключительное право: необходимо, чтобы на ее создание были произведены существенные финансовые, материальные, организационные или иные затраты, которые презюмируются для владельцев сайтов, содержащих не менее 10 тысяч документов. Важно отметить, что такие затраты должны быть направлены непосредственно на создание баз данных, и, согласно доктрине spin-off4 (побочный продукт), охране не подлежат те базы данных, которые сформировались у компании в процессе осуществления основной деятельности и не потребовали самостоятельных инвестиций в поиск, сбор и проверку именно этих данных.

Кроме того, нарушением является не всякое извлечение материалов сайта, а лишь перенос всего содержания базы данных или существенной части составляющих ее материалов (абз. 2 п. 1 ст. 1334 ГК). При этом согласно п.3 ст. 1335.1 ГК запрещается также неоднократное извлечение или использование материалов, составляющих несущественную часть базы данных, если такие действия противоречат нормальному использованию базы данных и ущемляют необоснованным образом законные интересы изготовителя базы данных.

Таким образом, чтобы понять, нарушает ли скрапинг сайта право на базу данных, можно воспользоваться следующей схемой:

Хотелось бы отметить, что подобно роботам, осуществляющим скрапинг, работают поисковые системы, применительно к которым обычно употребляется термин «краулинг» (to crawl — ползать). При этом поисковые системы являются неотъемлемой частью сети Интернет, и сомнений в том, что их деятельность законна, не возникает. Отсюда вопрос: почему скрапинг (краулинг) поисковыми системами не является нарушением, а те же действия, осуществляемые другими программами, нередко признаются судами неправомерными?

Вероятно, это связано с тем, что поисковая система не извлекает материалов, как это обычно делает иная программа, а лишь предоставляет ссылки на нужную информацию. Так, А.С. Ворожевич пишет, что в случае, когда «программа ответчика подобно поисковику позволяет клиенту получить ссылки на профили конкретного пользователя в Сети», нарушения нет [1, с. 37]. Таким образом, можно сделать вывод, что предоставление программой в результате скрапинга ссылок на сайты-источники без непосредственного переноса соответствующих материалов на иное устройство не может рассматриваться как нарушение исключительных прав.

Возвращаясь к вопросу о законности использования базы данных, отметим, что ст. 1335.1 ГК содержит условия, при которых использование баз данных без разрешения правообладателя является правомерным5. Но важно подчеркнуть, что даже при наличии данных условий скрапинг может быть признан незаконным. О каких случаях идет речь?

Дело в том, что владелец сайта вправе устанавливать технические средства защиты сайтов, обход которых недопустим даже в том случае, если лицо вправе извлекать из базы данных материалы и осуществлять их последующее использование в соответствии с вышеприведенной статьей. Так, владелец сайта вправе запретить доступ на сайт с определенного IP-адреса. Распространенным средством защиты является также файл robots.txt, предназначенный для распознавания его программами, осуществляющими сбор информации, и содержащий запрет либо разрешение на осуществление таких действий. Его особенность состоит в том, что за несоблюдение таких правил не предусмотрена юридическая ответственности, они соблюдаются добровольно.

Возникает вопрос: какой смысл имеет использование владельцами сайта данного средства защиты, если соблюдение правил не обеспечивается принудительно? Важно понимать, что данный файл является одним из самых важных при оптимизации любого сайта. Программу, осуществляющую скрапинг, можно настроить таким образом, чтобы она соблюдала правила и ограничения, указанные в файле, с помощью чего можно избежать высокой нагрузки на сайт и ускорить процесс скачивания, поэтому роль данного средства защиты нельзя недооценивать.

Это значит, что ввиду того, что технически установить непреодолимые преграды всем видам скрапинга в настоящее время невозможно [2], программы нередко находят способы обхода таких средств защиты. Данный фактор также свидетельствует о неправомерности скрапинга.

2.

Скрапинг и пользовательские соглашения (terms and conditions)

Итак, мы разобрались с вопросом о том, в каких случаях использование баз данных является нарушением. Но представим, что у владельца сайта отсутствует смежное право. Значит ли это, что скрапинг неохраняемых баз данных априори является законным? На этот вопрос следует дать отрицательный ответ, так как законность скрапинга зависит и от иных факторов.

Обратимся к мировой судебной практике.

Показательным здесь является дело Ryanair Ltd. v. PR Aviation BV. Европейский суд признал скрапинг незаконным, указав, что владельцы сайтов вправе устанавливать ограничения пользования их сайтами в пользовательских соглашениях, несоблюдение которых является нарушением даже в случае, если сайт не будет признан базой данных6. Таким образом было отмечено, что пользовательские соглашения имеют большой вес и должны учитываться и при отсутствии смежных прав.

Данный вывод суда дает основание полагать, что пользовательские соглашения обязательны во всех случаях, и их несоблюдение лишает скрапинг правомерности. Однако такое решение представляется неоднозначным, и мнения судей здесь расходятся.

Так, в деле Linkedln v. Robocog Inc.7 суд признал нарушением действия ответчика, который регистрировался с помощью фейковых аккаунтов в социальной сети, чтобы получить доступ к определенной информации на сайте истца, ссылаясь в частности на то, что при регистрации он соглашался с пользовательскими соглашениями. Иная оценка пользовательского соглашения содержится в деле QVQ Inc. V. Resulty LLC8, где судом было отмечено, что так как в самом приложении Resultly, которое парсило сайт истца, нельзя ничего купить, и оно лишь отсылает пользователей к магазину, нарушения нет несмотря на наличие запрета на такой сбор информации в правилах сайта истца.

Таким образом, суды по-разному оценивают значение пользовательских соглашений. Тем не менее анализ данных решений позволяет сделать вывод о том, что несоблюдение пользовательских соглашений является основанием для признания скрапинга незаконным в том случае, если он осуществляется конкурентом сайта, в результате чего происходит «отток» пользователей от истца к ответчику. Такие действия расцениваются как недобросовестная конкуренция. В случае если ответчик не конкурирует с истцом и размещает изъятую информацию со ссылкой на источник, несоблюдение правил не будет являться нарушением. В таком случае скрапинг не только не вреден, но и полезен для владельца сайта (если, например, в результате данных действий он получил дополнительных посетителей, пришедших по ссылкам с новостного агрегатора). Такого же мнения придерживается П.О.Сёмин: «Если деятельность субъектов является взаимодополняющей, то есть смысл в том, чтобы признать скрейпинг правомерным, даже если он формально запрещен. Например, если компания агрегирует информацию о товарах с сайтов нескольких интернет-магазинов, но не продает товары сама, а перенаправляет пользователей на сайт интернет-магазина, то она действует и к своей выгоде, и к выгоде интернет-магазина, поэтому строго формальный подход к решению спора здесь не вполне оправдан» [5, с. 59].

Данный вывод представляется оправданным, но лишь при условии, что скрапинг не препятствует работе сайта, так как он повышает на него нагрузку и снижает скорость его работы. Поэтому помимо «переманивания» пользователей автоматический сбор информации может привести к возникновению значительных убытков от сбоя в работе сайта. Так, в 1999 г. компания Ebay подала иск против компании Bidder’s Edge9, так как ответчик осуществлял скрапинг со скоростью до 100 тысяч запросов в день, что составляло 1,53% от общего числа запросов к сайту. Суд принял меры по обеспечению иска, сославшись на то, что подобные действия привели к дополнительным расходам владельца сайта; само дело завершилось мировым соглашением.

Подводя итог, можно сделать вывод, что несоблюдение пользовательских соглашений не является основанием для признания скрапинга незаконным при отсутствии недобросовестной конкуренции и (или) убытков, вызванных сбоем в работе сайта. Иной подход может привести, в частности, к ограничению конкуренции на рынке. Так, Федеральная антимонопольная служба в решении по делу между ООО «Стафори» (ПО «Робот Вера») (заявитель) и ООО «Хэдхантер»10 указала, что действия последнего по блокировке заявителя привели к созданию препятствий для доступа на товарный рынок данных услуг, то есть к ограничению конкуренции на товарном рынке. Несмотря на то что в пользовательском соглашении ООО «Хэдхантер» содержался запрет на автоматизированный сбор информации, действия последнего были признаны нарушающими антимонопольное законодательство.

3.

Скрапинг и персональные данные

При скрапинге может собираться информация, относящаяся к определённым физическим лицам. Вопрос в том, относятся ли собираемые данные к персональным и правомерна ли их обработка.

Обращаясь к отечественной практике по данному вопросу, следует рассказать об известном споре социальной сети ВКонтакте и ООО «Дабл» о защите смежных прав истца как изготовителя баз данных пользователей сети ВКонтакте11. Программа ответчика собирала общедоступные персональные данные пользователей социальных сетей с целью проведения оценки их кредитоспособности в интересах банков. Вначале истцу было отказано в иске, апелляционная инстанция отменила это решение, а СИП отправил его на новое рассмотрение в первую инстанцию. В возражении ответчик ссылался, в частности, на то, что владельцы социальных сетей не могут приобретать монополию на данные пользователей сайтов и эта информация является общедоступной [3].

Вопрос о том, являются ли страницы в социальных сетях общедоступными источниками информации о персональных данных и допустим ли их сбор без согласия субъекта. Можно ли обосновывать такие действия ссылкой на п. 10 ст. 6 Федерального закона «О персональных данных»12, согласно которому обработка персональных данных, сделанных общедоступными самим субъектом этих данных или с его согласия, возможна?

В 2015 г. Европейский суд в деле Maximillian Schrems v. Data Protection Commissioner13 рассматривал информацию из публичного профиля социальной сети Facebook как персональные данные. То есть под защиту нередко попадают даже те сведения о пользователе, которые находятся в публичном доступе. Российская судебная практика и Роскомнадзор также исходят из того, что страницы в социальных сетях не являются общедоступными источниками персональных данных. Например, Арбитражный суд г. Москвы заявил, что «информация о субъекте (в том числе персональные данные), содержащиеся в социальных сетях (в сети Интернет), не может быть отнесена к персональным данным, сделанным субъектом общедоступными, поскольку социальные сети не являются источником общедоступных персональных данных»14.

В США мы можем увидеть противоположную позицию по данному вопросу. Так, в решении по делу LinkedIn против небольшой компании по анализу данных hiQ Labs (последняя осуществляла скрапинг данных из общедоступных профилей пользователей LinkedIn, используя их для консалтинга работодателей, чьи сотрудники выкладывали свои резюме на сайте) суд указал, что запрет сбора общедоступной информации создает угрозу ее свободному обмену, что является недобросовестной конкуренцией15. Таким образом, американский суд признал, что персональные данные, размещенные в социальных сетях, являются общедоступными, и помимо этого запретил социальной сети технически препятствовать скрапингу. Отметим, что практика по созданию технических средств защиты в России не запрещена, даже если у владельца сайта отсутствуют смежные права на базу данных.

На наш взгляд, при решении вопроса о том, нарушает ли скрапинг законодательство о персональных данных, нужно обращаться к п. 2 ст. 5 Федерального закона «О персональных данных», согласно которому «не допускается обработка персональных данных, несовместимая с целями сбора персональных данных». Как верно заметил П.О. Сёмин, «при решении этой проблемы акцент должен делаться … на последствиях обработки персональных данных». Таким образом, даже с признании персональных данных общедоступной информацией, скрапинг следует признавать незаконным, если данные действия приводят к негативным последствиям для этого пользователя. Другими словами, при определении правомерности/ неправомерности скрапинга принципиальным является вопрос о том, используются ли персональные данные в соответствии с целями их предоставления, и приводит ли скрапинг к негативным последствиям для субъекта.

Таким образом, скрапинг сайтов является законным, если при его осуществлении не происходит нарушений установленных законодательством запретов. Поэтому можно выделить следующие критерии законности скрапинга.

1.

Нет нарушения авторских прав на материалы сайта и смежных права на базу данных.

2.

Нет обхода технических мер защиты.

3.

Отсутствует недобросовестная конкуренция.

4.

Отсутствуют убытки от сбоя в работе сайта.

5.

Персональные данные используются в соответствии с целями их предоставления и не влекут негативных последствий для их субъекта.

Наличие всех этих факторов в совокупности свидетельствует о правомерности скрапинга. На наш взгляд, данные критерии позволяют обеспечить баланс между исключительными правами на результаты интеллектуальной деятельности, инвестициями создателей баз данных и необходимостью защиты персональных данных, с одной стороны, и правом на доступ к открытой информации и развитием технологий - с другой.

 


1 Например, с помощью скрапинга ритейлеры изучают сайты конкурентов, сравнивают цены на товары и корректируют впоследствии свои.

2 Отметим, что извлекаемая информация должна быть общедоступной, так как в ином случае неправомерность скрапинга очевидна.

3 Гражданский кодекс РФ (часть 4) от 18 декабря 2006 г. N 230-ФЗ [Электронный ресурс].

4 The British Horseracing Board Ltd and Others v. William Hill Organization Ltd (CJEU C-203/02, 2004).

5 Такое использование правомерно в целях, для которых база данных ему предоставлена, в любом объеме, если иное не предусмотрено договором; в личных, научных, образовательных целях в объеме, оправданном указанными целями, и в иных целях в объеме, составляющем несущественную часть базы данных.

6 Ryanair Ltd. v. PR Aviation BV (C-30/14, 2015).

7 Linkedln v. Robocog Inc. (Case № 14-00068 (N.D. Cal. 2014)).

8 QVC, Inc. v. Resultly, LLC (99 F. Supp. 3d 525 (2015).

9 EBay v. Bidder's Edge, 100 F. Supp. 2d 1058 (N.D. Cal. 2000).

10 Дело № 11/01/10-9/2019.

11Дело № А40-18827/17-110-180 // https://kad.arbitr.ru/Card/1f33e071-4a16-4bf9-ab17-4df80f6c1556

12 Федеральный закон от 27 июля 2006 г. N 152-ФЗ «О персональных данных» [Электронный ресурс].

13 Maximillian Schrems v. Data Protection Commissioner (Case C-362/14).

14 Дело А40-5250/2017 // http://kad.arbitr.ru/

15 HIQ Labs, Inc. v. Linkedin Corp (273 F. Supp. 3d 1099 (N.D. Cal.2017)).

Литература

1. Ворожевич А.С. Границы смежных прав // Интеллектуальная собственность. Авторское право и смежные права, № 11, 2019. С. 29-42.

2. Кульгин М. Можно ли защитить свой сайт от парсинга? Нет, и вот почему [Электронный ресурс] // URL: https://vc.ru/services/91769-mozhno-li-zashchitit-svoy-sayt-ot-parsinga-net-i-vot-pochemu

3. Орешин Е.И. Дело ВКонтакте VS Дабл об использовании общедоступных данных пользователей: позиция Дабл в Суде по интеллектуальным правам. [Электронный ресурс] // Закон.ру. 2018. 15 июня. URL: https://zakon.ru/blog/2018/6/15/delo_vkontakte_vs_dabl_ob_ispolzovanii_obschedostupnyh_dannyh_polzovatelej<...>

4. Рожкова М.А. Скрапинг / парсинг интернет-ресурсов – что это такое и законно ли это? [Электронный ресурс] // Закон.ру. 2019. 30 декабря. URL: https://zakon.ru/blog/2019/12/30/skraping__parsing_internet-resursov__chto_eto_takoe_i_zakonno_li_eto

5. Сёмин П.О. Авторские и смежные права при скрейпинге сайтов в сети Интернет// Интеллектуальная собственность. Авторское право и смежные права. 2019. № 11. С. 51-60.

6. Сёмин П.О. Big Data и интеллектуальная собственность: системное исследование скрейпинга в рамках общей методологии интернет-права // Журнал Суда по интеллектуальным правам, № 29, сентябрь 2020 г. С. 60-76.