Напомним, что на уровне Европейского союза два значимых для развития искусственного интеллекта изъятия из исключительных авторских прав закреплены в
ст. 3 и 4 Директивы 2019/790 Европейского парламента и Совета ЕС от 17 апреля 2019 г. «Об авторском праве и смежных правах в условиях единого цифрового рынка» (далее — Директива 2019 г.).
В соответствии со ст. 3 Директивы 2019 г., допускается воспроизведение и извлечение, осуществляемое исследовательскими организациями и организациями культурного наследия в научных целях для интеллектуального анализа текста и иных данных, к которым они получают правомерный доступ в рамках своей исследовательской деятельности.
Статья 4 Директивы допускает действия по воспроизведению и извлечению правомерно доступных произведений и других объектов для целей анализа текстов и данных. Рассматриваемым изъятием могут воспользоваться любые субъекты, а не только научно-исследовательские организации. При этом оно касается лишь тех данных, которые находятся в открытом доступе и в отношении которых правообладатели не установили ограничения с помощью машиночитаемых средств на их использование при обучении ИИ.
Схожие со ст. 3 и 4 Директивы 2019 г. исключения из авторских прав предусмотрены и в немецком законодательстве (ст. 44b (для коммерческих целей), 60d (для научных целей) Закона об авторских и смежных правах ФРГ). Интерес, при этом, представляет решение регионального суда Гамбурга от 27 сентября 2024 года (дело
№310 O 227/23) по делу Kneschke v. LAION.
В 2023 году немецкий фотограф Роберт Кнешке посредством приложения «Have I Been Trained?» (оно позволяет автору проверить, содержится ли его работа в популярных наборах данных для обучения ИИ) узнал, что его фотографии использовались при формировании датасета (набора данных) LAION-5B. Права на датасет принадлежат известной некоммерческой организации LAION
1. Именно её данные использовала Stability AI для обучения Stable Diffusion.
Датасет LAION-5B был составлен на основе набора данных организации Common Crawl, который включал в себя 5,85 млрд. пар «изображение – текст». Соответствующие пары составляли гиперссылки на изображения, доступные в Интернете, и информацию (включая текстовое описание) о соответствующих изображениях. При этом сами изображения не были включены в набор данных. LAION использовал гиперссылки из исходного набора данных и загрузил связанные с ними изображения с различных веб-сайтов. Посредством специальной программы сотрудники компании проанализировали корректность описания изображений, отфильтровали и удалили несовпадающие пары данных. Затем - перенесли оставшиеся гиперссылки и метаданные (включая описания изображений) в набор данных LAION 5B. LAION сделал набор данных доступным и бесплатным для обучения ИИ.
При создании набора данных LAION, действительно, загрузил и сохранил фотографии истца, которые были выставлены на сайте
www.bigstockphoto.com. Ответчик использовал только публично отображаемые версии, на которых был размещен водяной знак веб-сайта фотостока.
Суд при рассмотрении данного дела встал на сторону ответчика. Он заключил, что в соответствии с разделом 60d Закона об авторских и смежных правах ФРГ, ответчик действовал правомерно. Данная статья позволяет воспроизводить охраняемые произведения для анализа текста и данных в некоммерческих научных целях без согласия правообладателя.
Суд установил, что воспроизведение фотографий компанией LAION
может квалифицироваться как интеллектуальный анализ текста и данных. LAION загрузила фотографии и использовала программное обеспечение для анализа соответствия изображений и их описаний, а также для автоматической фильтрации несовпадающих пар и сбора информации о корреляциях между парами изображение-текст.
При этом суд заключил, что
создание набора данных для обучения AI можно считать научным исследованием, так как это фундаментальный шаг для генерации будущих знаний. LAION не преследовала коммерческих целей при разработке набора данных, так как предоставлял его общественности бесплатно. Организации, которые не предоставляют результаты исследований бесплатно или имеют аффилированность с компаниями, которые извлекают коммерческую выгоду из таких исследований, не могут полагаться на указанное исключение.
Суд не стал учитывать довод истца, о том, что использование фотографий для обучение ИИ предполагает не только извлечение скрытой информации из данных, но и использование интеллектуально-творческого выражения для создания сопоставимых и конкурирующих продуктов.
Как отметил суд, воспроизведение фотографий для создания и предоставления публичного доступа к набору данных не нарушило нормальное использование фотографий истцом и не нанесло необоснованного ущерба законным интересам истца. Возможное, но неясно предвидимое, последующее использование набора данных для обучения моделей ИИ, которые могут генерировать аналогичный контент, конкурирующий с работами правообладателя, не должно рассматриваться в контексте создания набора данных компанией LAION.
При этом суд указал, что воспроизведение фотографий в рассматриваемом ситуации не может быть квалифицировано в качестве временного или случайного использования (что также составляет изъятие из исключительных прав).