Писатели против OpenAI: луддизм или защита самих себя от ИИ?

21 сентября 2023, 11:44 🇺🇸 3 мин

Рано или поздно между разработчиками генеративных языковых моделей и профессиональными авторами текст, изображений и видео, которые используются разработчиками для «обучения», должны были возникнуть серьезные разногласия. Иски против OpenAI и подобных платформ были и раньше, но тут подтянули тяжелую артиллерию: с коллективным иском выступила Гильдия авторов и 17 писателей, включая Гришэма, Мартина и других уважаемых людей, не чуждых писательству. Претензия истцов заключается в том, что OpenAI использовала для обучения своего алгоритма произведения авторов без их на то согласия и без вознаграждения, а так как OpenAI получает коммерческую выгоду от своей генеративной языковой модели, то и копии, которая она использовала, являются «пиратскими».

История несколько глубже, чем может показаться на первый взгляд. У нас электронное книгоиздание развито совсем не так, как в США, и на условный Литрес попасть может далеко не каждый. В отличие от Amazon, где стало появляться огромное количество сгенерированных так называемым искусственным интеллектом текстов, подписанных авторами. Например, шестой и седьмой тома «Песни льда и пламени», в которых копировался стиль Джорджа Мартина, но, понятно, сам Мартин их не писал. И речь не только о художественной литературе, Джейн Фридман обнаружила на Amazon какие-то книги, в которых она была обозначена как автор, но, разумеется, никакого отношения к ним не имела. Забавно, что обнаружила она это, когда Google добавил эти сгенерированные вирши в ее авторский профиль. Автоматизация не щадит никого.

Конечно, в нашем с вами информационном пространстве новость об этом судебном иске подается совсем в ином ключе: старички-луддиты пытаются стрясти с разработчиков копеечку, мол, старичкам пора на покой, они свое заработали и просто боятся, что великий искусственный интеллект их заменит. Подобный вектор рассуждений обычно присущ тем, кто сам — как бы пафосно это не звучало — ничего не создал и не написал, кроме комментариев, конечно. Мы не знаем ни одного автора телеграм-каналов, кто не сталкивался с тем, что из его канала утаскивают посты. И далеко не все заемщики чужих текстов их хотя бы рерайтят. Такая вот у них дегенеративная языковая модель.

Если же посмотреть на эту историю в разрезе авторского права, то в текущем своем состоянии авторское право уже изжило себя. Об этом хорошо рассказано в ролике, который мы сняли на прошлой неделе. В нем разбиралась история о том, как девушка решила судиться с банком из-за того, что ее голос лег в основу голосовой модели, которой теперь может пользоваться кто угодно для озвучивания чего угодно. Нюанс лишь в том, что девушке той щедро заплатили, а вот авторам, чей контент использует условный Gigachat — нет.

Мы с вами стоим на границе двух эпох. За плечами эпоха, когда автор мог создать одно, может два произведения и спокойно жить на авторские отчисления всю жизнь. За примерами далеко ходить не надо: Харпер Ли 55 лет жила за счет роялти со своего романа «Убить пересмешника». И очень симптоматично, что в 2015 году, за год до своей смерти она опубликовала еще один роман — «Поющие в терновнике». К слову, наследники писательницы смогут еще 70 лет получать роялти.

Разумеется, перед разработчиками встает вопрос — использовать в своих дата-сетах контент, у которого срок действия авторских прав уже истек, и смириться с тем, что генерировать такая модель сможет тексты в стиле разве что Толстого и Достоевского. Либо окунуться с головой в риски судебных разбирательств, но переломить сложившуюся практику. Выбор на самом деле уже сделан, Microsoft, например, обещает клиентам юридическую защиту от преследования за нарушение авторских прав при использовании искусственного интеллекта. Так что нас с вами — простых пользователей — эта история вряд ли коснется. А вот юристам, у которых прямо праздник наступил, будем завидовать. Они выйдут единственными, кто в итоге заработает миллионы, если не миллиарды долларов.