Журнал Суда по интеллектуальным правам
Журнал Суда по интеллектуальным правам

Использование объектов авторских прав для обучения искусственного интеллекта1

Васильева А.С.
магистр Санкт-Петербургского политехнического университета Петра Великого, аспирант Санкт-Петербургского государственного экономического университета
11 ноября 2024

Решение проблемы правосубъектности искусственного интеллекта, его места и роли в общественных отношениях сейчас обсуждается повсеместно теоретиками и практиками. Пока однозначного решения представленной проблемы не найдено. В сфере авторских прав предлагаются варианты положения искусственного интеллекта от инструмента, т.е. объекта, до наделения технологии статусом автора произведения. Данная научная статья не ставит своей целью рассмотрение описанной проблемы. На генеративный искусственный интеллект, а именно об этом виде искусственного интеллекта говорится, когда обсуждаются вопросы правового положения искусственного интеллекта в творческой сфере, стоит смотреть не только как на нового автора объектов, но и как на реальную проблему для людей - создателей объектов интеллектуальной собственности. В чём выражается данная проблема? П.М. Морхат в своей докторской диссертации отмечает: «Могут также возникать проблемы, касающиеся нарушения авторских прав третьих лиц, когда юнит искусственного интеллекта самообучается с помощью данных, получаемых им, в том числе из интернета, а затем в каком-либо виде несанкционированно использует эти данные в процессе создания новых работ» [3, с. 170]. В последнее время авторы стали массово замечать, что при работе с новой технологией результаты содержат скомпилированные творческие работы, что недопустимо2. Если охарактеризовать проблему кратко, то она выражается в использовании объекта авторских прав без согласия правообладателя для обучения искусственного интеллекта. Универсального подхода в решении данной проблемы пока нет, однако Генеральная Ассамблея ООН отмечает, что государствам-членам рекомендуется внедрять необходимые меры для соблюдения авторских прав3. Предлагается рассмотреть несколько подходов к решению данной проблемы. Однако прежде чем перейти к этим подходам, нужно сформулировать определение понятия «обучение искусственного интеллекта».

В научном сообществе, равно как в отечественном и зарубежном законодательствe, пока нет устоявшегося определения понятия «обучение искусственного интеллекта». Однако попытки сформулировать это определение уже предпринимались. Так, под обучением искусственного интеллекта профессор компьютерных наук Национального университета Сингапура Мохан Канканхалли понимает процесс, когда машина учится на данных, которые ей поставляются4. Обучающие данные воспроизводятся и перерабатываются алгоритмами [6]. Обучение и настройка рассматриваются в качестве синонимов в технической литературе [5, с. 35]. Иным определением обучения является то, что это процесс, в ходе которого машина учится выполнять определённые задачи, основываясь на наборе данных и правил5. Определение набора данных теперь содержится в российском законодательстве, а именно в Указе Президента Российской Федерации от 10 октября 2019 г. № 490 (ред. от 15 февраля 2024 г.) «О развитии искусственного интеллекта в Российской Федерации» (вместе с «Национальной стратегией развития искусственного интеллекта на период до 2030 года») (далее – Указ № 490). Набор данных – состав данных, которые структурированы или сгруппированы по определённым признакам, соответствуют требованиям законодательства Российской Федерации и необходимы для разработки программ для электронных вычислительных машин на основе искусственного интеллекта. Для нашего исследования особенно важны те данные, которые являются объектами авторских прав. Также стоит отметить, что данные проходят разметку, под которой понимается этап обработки структурированных и неструктурированных данных, в процессе которого данным (в том числе текстовым документам, фото- и видеоизображениям) присваиваются идентификаторы, отражающие тип данных (классификация данных), и (или) осуществляется интерпретация данных для решения конкретной задачи, в том числе с использованием методов машинного обучения6. Обработка представляет собой использование данных, а в случае объектов авторских прав возможность их использовать принадлежит правообладателю.

На основе рассмотренных определений обучения искусственного интеллекта и с учётом терминологии обновлённого Указа № 490 под обучением искусственного интеллекта понимается процесс, в ходе которого человек учит (настраивает) искусственный интеллект выполнять задачи и получать результаты, сопоставимые с результатами интеллектуальной деятельности человека, посредством обработки наборов данных, включающих охраняемые авторскими правами произведения, которые воспроизводятся и перерабатываются в процессе генерации искусственным интеллектом новых результатов.

Далее предлагается перейти непосредственно к рассмотрению подходов к решению проблемы использования объектов авторских прав для обучения искусственного интеллекта.

1. Использование произведений, перешедших в общественное достояние

Возможно, выход представленной проблемы является достаточно простым. Разработчикам следует обучать искусственный интеллект на произведениях, перешедших в общественное достояние. Такой подход с правовой точки зрения является универсальным и не порождает сложных юридических задач. Ключевым остаётся лишь соблюдение личных неимущественных прав авторов, что уже сейчас не вызывает проблем для разработчиков. Так, при работе с новой технологией формируется ответ с указанием того, кто является автором7. Однако разработчики не согласны с таким подходом, так как результаты технологии не смогут отвечать современным потребностям общества8. Отсюда следует, что данный подход, хотя и приемлем для действующего законодательства, не может быть единственным, если общество стремится к развитию новых технологий и их внедрению в повседневную практику.

2. Свободное использование произведений

Другим подходом к решению поставленной проблемы является предложение по дополнению норм о свободном использовании и включению такого случая, как использование (воспроизведение и переработка) произведения с целью автоматизированного анализа для разработки и обучения искусственного интеллекта с исключением возможности использования произведения за пределами указанной цели и обязанностью удалить соответствующие копии при отпадании такой цели [1, с. 27]. Следовательно, в России этот подход будет применим только в случае конкретного законодательного закрепления. Однако в зарубежных странах такой вариант уже возможен сейчас. Например, в США распространён подход справедливого использования. В данном случае судьи определяют, когда действия по использованию произведения подпадает под справедливое использование. При определении справедливого использования произведения учитывается природа объекта, потенциал охвата рынка охраняемым авторским правом произведения и ряд других критериев9.

3. Заключение договора об отчуждении исключительного права для обучения искусственного интеллекта

Такой договор может быть применим в случае обучения новой технологии с учителем. При этом виде обучения существует набор тренировочных примеров, искусственный интеллект должен лишь продолжить уже известные ответы [4, с. 18]. Преимущество этого вида обучения заключается в прозрачности того, какие объекты авторских прав использовались для обучения. Однако при заключении договора об отчуждении исключительного права рекомендуется заключить соглашение о том, что автор или иное лицо согласно на изменение произведения, которое не связано с созданием нового произведения на основе имеющегося. Такая рекомендация основывается на том, что люди не знают заранее, как искусственный интеллект интерпретирует данные, что будет сгенерировано и будет ли созданный искусственным интеллектом результат переработанным объектом или нарушением права на неприкосновенность произведения.

Существенным плюсом данного подхода является то, что авторы или иные правообладатели получают определённую материальную выгоду от отчуждения исключительного права. Помимо этого, обучение искусственного интеллекта осуществляется прозрачно, так как понятно, на каких произведениях происходило обучение искусственного интеллекта. Это, в свою очередь, исключает риск возникновения исков к разработчикам технологии.

Недостатками рассматриваемого подхода выступают материальные затраты на сам процесс разработки искусственного интеллекта, включающего обучение, так как необходимо заключение большого количества договоров об отчуждении исключительного права. Также велика вероятность уменьшения вознаграждения по договору, так как требуется большое количество творческих работ. Это является негативным последствием для авторов, которые вкладывают определённые творческие усилия в создание объектов, которые в будущем могут быть скомпилированы во что-то новое, но отнюдь не творческое.

4. Лицензионный договор для обучения искусственного интеллекта

Ключевым преимуществом данного вида договора является установление баланса интересов между правообладателем объекта и разработчиками искусственного интеллекта. В случае заключения данного договора целью договора выступает использование охраняемого объекта для обучения искусственного интеллекта, что включает в себя использование в виде воспроизведения и переработки в ходе создания (генерации) искусственным интеллектом чего-либо. Российским гражданским законодательством предусмотрено несколько видов лицензий. Есть указание и на принудительную лицензию, однако такой вид неприменим для объектов авторских прав в России. Принудительное лицензирование известно не только в России, но и в США. В данной стране разрабатываются различные модели лицензирования. Принудительное лицензирование приемлемо для разработчиков новой технологии по причине уменьшения размера вознаграждения по договору, но в данном случае могут быть ущемлены личные неимущественные права авторов10. Стоит отметить, что данный зарубежный подход не должен применяться в России в будущем, так как неизвестно, как искусственный интеллект интерпретирует данные, понадобится ли именно этот объект принудительного лицензирования. Объекты авторских прав имеют большую связь с их создателем, выражают его творческие начала.

Российское гражданское законодательство указывает на существование двух основных видов лицензионных договоров: исключительная лицензия и неисключительная лицензия. Различие этих видов состоит в том, что в случае с исключительной лицензией за лицензиаром не сохраняется право выдачи лицензий другим лицам. Неисключительная лицензия, наоборот, сохраняет за лицензиаром право выдачи лицензий другим лицам. Как было указано ранее, обучение искусственного интеллекта включает использование объекта авторских прав в виде воспроизведения и переработки, поэтому возможно предоставлять по договору исключительной лицензии такой способ использования, как переработка. Воспроизведение и иные необходимые способы могут быть предоставлены по неисключительной лицензии. Выбор между исключительной и неисключительной лицензией остаётся за автором или иным правообладателем. Однако более целесообразным представляется заключение неисключительной лицензии. Во-первых, происходит сохранение права выдачи лицензий другим лицам. Именно это даёт основания полагать, что объект не будет использоваться исключительно в переработанном виде, а может использоваться другими лицами и другими способами. Во-вторых, лицензиат будет претерпевать меньшие финансовые расходы на выплату вознаграждения по договору, чем при исключительной лицензии11. Предполагается, что предметом данного договора станет предоставление права использования, например, фотографического произведения для обучения искусственного интеллекта (использование в виде воспроизведения и переработки), разметка объекта авторских прав, использование совместно с другими объектами авторских прав, включение объекта авторских прав в состав сложного объекта, а также более конкретизировано – включение в наборы данных, необходимых для разработки искусственного интеллекта. Лицензионный договор с таким предметом может быть положен в основу добросовестного использования объектов авторских прав для обучения новой технологии.

Стоит отметить, что неисключительная лицензия может быть заключена в упрощённой форме. Тогда указывается на открытую лицензию. Инициатива заключения данного договора исходит от лицензиара. В свою очередь, разработчик (компания-разработчик) присоединяется к условиям данной лицензии [2]. Лицензиар может предоставить лицензиату право на использование принадлежащего ему произведения для создания нового результата интеллектуальной деятельности12. Данное положение особенно важно в случае искусственного интеллекта, так как неизвестно, что будет сгенерировано в результате деятельности новой технологии.

Искусственный интеллект становится всё более востребованным в повседневной практике. Нельзя допустить случая, когда для обучения новой технологии используются наборы данных, полученные в противовес интересам авторов, правообладателей объектов авторских прав. Представленные в научной статье подходы решения проблемы использования объектов авторских прав для обучения искусственного интеллекта могут быть полезны, как для разработчиков генеративного искусственного интеллекта, так и для правообладателей объектов авторских прав.

Сноски

1 Научный руководитель Н.А. Даньшина, к.ю.н., доцент Высшей школы юриспруденции и судебно-технической экспертизы Гуманитарного института Санкт-Петербургского политехнического университета Петра Великого.

2 Авторы роликов на YouTube подали в суд на OpenAI за обучение на них ИИ. 6 августа 2024 г. // РИА НОВОСТИ. URL: https://ria.ru/20240806/openai-1964404112.html (дата обращения: 10 августа 2024 г.).

3 Использование возможностей безопасных, защищенных и надежных систем искусственного интеллекта для устойчивого развития: резолюция Генеральной Ассамблеи Организации Объединенных Наций N A/78/L.49 // Организация Объединенных Наций. URL: https://undocs.org/A/78/L.49 (дата обращения: 15 августа 2024 г.).

4 WIPO Conversation on intellectual property and frontier technologies – ninth session WIPO IP conv GE 24 Day 1 morning // WIPO. URL: https://webcast.wipo.int/video/WIPO_IP_CONV_GE_24_2024-03-13_AM_122112 (дата обращения: 15 августа 2024 г.).

5 Gaiko K. Обучение искусственного интеллекта: методы и алгоритмы. 11 ноября 2023 г. // vc.ru. URL: https://vc.ru/u/1417214-kirill-gaiko/911924-obuchenie-iskusstvennogo-intellekta-metody-ialgoritmy#:~:text=Обучение искусственного интеллекта (ИИ) -,использовать их для принятия решений (дата обращения: 18 августа 2024 г.).

6 О развитии искусственного интеллекта в Российской Федерации (вместе с «Национальной стратегией развития искусственного интеллекта на период до 2030 года»): Указ Президента Российской Федерации от 10 октября 2019 г. N 490: офиц. текст по состоянию на 15 февраля 2024 г. // Собрание законодательства Российской Федерации. – 14 октября 2019 г. – N 41. – Ст. 5700.

7 Cullen A., Davalos J. Open AI to Pay Axel Springer Tens of Millions to Use News Content. 13 December 2023. // Bloomberg. URL: https://www.bloomberg.com/news/articles/2023-12-13/openai-axel-springer-ink-deal-to-use-news-content-in-chatgpt (дата обращения: 10 августа 2024 г.).

8 «Impossible» to create Al tools like ChatGPT without copyrighted material, OpenAI says // The Guardian. URL: https://www.theguardian.com/technology/2024/jan/08/ai-tools-chatgpt-copyrighted-material-openai (дата обращения: 19 августа 2024 г.).

9 WIPO Conversation on intellectual property and frontier technologies – ninth session WIPO IP conv GE 24 Day 1 afternoon // WIPO. URL: https://webcast.wipo.int/video/WIPO_IP_CONV_GE_24_2024-03-13_PM_122128 (дата обращения: 14 августа 2024 г.).

10 Mawira B. US Copyright Office Considers Licensing Models for Generative Al Training. 26 January 2024 г. // Cryptopolitan. URL: https://www.cryptopolitan.com/us-copyright-office-on-licensing-models/ (дата обращения: 16 августа 2024 г.).

11 Лицензия при заключении лицензионного договора // Юрист компании. Практический журнал для юриста. URL: https://www.law.ru/article/20858-qqq-16-m6-29-06-2016-litsenziya-pri-zaklyuchenii-litsenzionnogo-dogovora (дата обращения: 20 августа 2024 г.).

12 Гражданский кодекс Российской Федерации. Часть 4: Федеральный закон от 18 декабря 2006 г. № 230-Ф3: офиц. текст по состоянию на 30 января 2024 г. // Российская газета. – 22 декабря 2006 г. – № 289.

Список литературы

1. Калятин В.О. Проблема машинного творчества в системе права: регулирование создания и использования результатов интеллектуальной деятельности с применением искусственного интеллекта, зарубежный опыт и российские перспективы / Руководитель авторского коллектива: В.О. Калятин // Доклад НИУ ВШЭ. – М.: Издательский дом Высшей школы экономики. – 2021. – 28 с. – С. 27.

2. Кузьменков М.Ю. Лицензионные соглашения, используемые при распространении программных пакетов машинного обучения // Актуальные проблемы российского права. – 2023. – № 11 (156). – С. 73-82.

3. Морхат П.М. Правосубъектность искусственного интеллекта в сфере права интеллектуальной собственности: гражданско-правовые проблемы: дис. ... док.юр.наук / Москва – 2018. – 420 с. – С. 170.

4. Николенко С., Кадурин А., Архангельская Е. Глубокое обучение. – СПб.: Питер. – 2018. – 480 с.: ил. – (Серия «Библиотека программиста») – С. 18.

5. Родзин С.И. Искусственный интеллект : учебное пособие / Таганрог: ИКТИБ ЮФУ. – 2015. – 148 с. – С. 35.

6. Чебодаева В.А. Контент, сгенерированный нейросетью: кто виноват и что делать? // Журнал Суда по интеллектуальным правам. Декабрь 2023. – № 4 (42). – С. 46-58.