Как авторское право уничтожит нейросети

13 мая 2023, 13:26 🇷🇺 2 мин

Фото geralt/pixabay.com (Pixabay License)

В продолжение сегодняшней утренней реплики хотелось бы отметить, что за всем хайпом вокруг искусственного интеллекта в контексте генеративных нейросетей остается незамеченной важная проблема: как быть с авторским правом?

Для многих не очевидно, что любая новая единица контента, созданная на основе уже существующей, дает право автору использованной единицы обратиться к создателю новой как минимум за компенсацией. Да, можно взять гитару и спеть на кухне какой-нибудь хит, но как только вы выложите эту запись на YouTube, то площадка немедленно выявит совпадение и поступит с вашим роликом так, как считает нужным автор оригинального трека. Если с каверами все еще не так плохо, и можно добиться принудительного лицензирования, то с другими единицами контента так не получится.

Авторское право — область довольно мутная, прецедентов как таковых немного, большинство разбирательств заканчивается неким соглашением. Вспомните войны Qualcomm с Apple или Nokia, все они заканчивались договоренностями за пределами суда. Однако генеративные нейросети, которые создаются картинки и тексты на основе пользовательского запроса, открывают натуральный портал в ад. И будьте уверены — юристы уже потирают руки и постепенно готовятся к новому походу. Ибо по другому быть не может.

Ведь генеративные нейросети являются по сути сложными алгоритмами, которые могут создать что-то лишь на основе чего-то уже созданного. То есть по большому счету они не создают, а компилируют имеющиеся единицы контента. И вы будете смеяться, но у этих единиц контента есть авторы. Которые вряд ли давали свое разрешение на использование своего контента.

Если вам кажется, что это все передергивание и притягивание за уши, то вы ошибаетесь. Сегодня собрать доказательную базу под какой-нибудь конкретный кейс сложно, но в будущем, в котором Google собирается вшивать в генерированные картинки мета-данные, это станет сильно проще. Ведь если есть данные о генерации, значит, можно потребовать сообщить, на основе какого контента произошла эта генерация, давал ли автор этого контента свое разрешение на такое использование.

Самое смешное в том, что сгенерированная картинка имеет еще один элемент авторского права — ведь запрос, который вы вбили для получения результата, является вашим собственным контентом, который так же защищен авторским правом. С точки зрения закона нет никакой разницы между запросом подробным и простым — в любом случае это результат деятельности автора, то есть вас.

В результате картинки, которые сейчас выдаются нейросетями, тащат за собой шлейф нерешенных авторских проблем. Но есть и хорошие новости. Если юристы наконец-то выступят с коллективным иском (как это обычно бывает — с неопределенным количеством пострадавших) в защиту всех пользователей интернета, когда-либо закачивавших фотографии и картинки (а ведь нейросети на них обучаются), то ответчиком станут именно компании-разработчики.

Все это будет происходить в будущем, не завтра, но и не через 10 лет. Рано или поздно развитие генеративных нейросетей всецело будет зависеть от того, кому удастся скормить им больше референсов, то есть данных, то есть контента, то есть защищенных авторским правом единиц информации.

Хотя, разумеется, все может перейти на новый уровень, когда нейросетям начнут скармливать контент, сгенерированный нейросетями. Но об этом пока даже думать не хочется.