Perplexity и битва за словари: можно ли сплагиатить слово «плагиат»?

Иски медиагигантов к разработчикам искусственного интеллекта стали почти рутиной. Но недавнее дело издателей Britannica и Merriam-Webster против Perplexity выделяется на общем фоне и может стать важным прецедентом для индустрии.

Обвинения стандартные: поисковый движок массово выкачивает контент с помощью веб-краулеров, лишая авторов трафика и доходов от рекламы, плюс может галлюцинировать, приписывая источнику несуществующие цитаты и нанося вред его репутации. В одном из примеров Perplexity дословно цитирует определение слова «плагиат» из Merriam-Webster. Истцы, ссылаясь на расследование Cloudflare, утверждают, что Perplexity игнорировала robots.txt и маскировала ботов под пользователей, а из-за этого спор из «добросовестного использования» может превратиться в дело о сознательном нарушении авторского права.

Вот здесь начинаются детали. Энциклопедические и словарные статьи — это, безусловно, авторский, но не уникальный по своей сути контент. Определения лежат в открытом доступе, на них можно ссылаться. Поэтому неожиданно выглядит нападка на Perplexity, который делает то же самое — приводит цитату со ссылкой на источник.

Авторское право в эпоху ИИ не урегулировано, прецедентов мало. Похожий кейс BBC против Apple, которые использовали ИИ для суммаризации новостей и искажали их, вообще не дошёл до суда — Apple свернули функцию и вернули только в последней iOS с дополнительными мерами предосторожности. Исход нынешнего спора может стать прецедентом и ответить на вопрос, где проходит грань между ссылкой на источник и подменой оригинала?

Поводом для иска, вероятно, послужило недавнее соглашение Anthropic, которая выплатит издателям более 1,5 миллиардов долларов за «пиратские» библиотеки при обучении моделей. Теперь все понимают, что нелицензионный контент токсичен и за него придётся платить. А издатели, похоже, уже начали идти за деньгами.

//Илья Власов