
Все началось год назад, когда трое авторов и журналистов подали против Anthropic коллективный иск в суд Калифорнии. В иске говорилось о том, что компания «намеренно загружала из интернета пиратские копии книг», которые впоследствии использовались для «осмысления и анализа выражений, защищенных авторским правом». Мировое соглашение, предложенное Anthropic, предполагает выплату по 3000 долларов за каждую из 500 тысяч книг, а также выплатит накопившиеся пени и уничтожит набор данных, содержащий материалы, полученные нелегально.
Проблема с авторским правом является фундаментальной для сервисов, в основе которых лежат LLM. Ведь обучать эти модели нужно на большом массиве данных, причем актуальных, и получается, что без использования объектов, защищенных авторским правом, никак не обойтись, будь то картинки, книги или видео. При этом в относительно лучшем положении находится компания Google, у которой есть отличный и потенциально неисчерпаемый источник для обучения Gemini: согласно пользовательскому соглашению, Google может использовать весь контент, публикуемый пользователями на YouTube, для обучения своей ИИ-модели. Ни OpenAI, ни Microsoft, ни Anthropic не могут похвастаться таким источником для обучения.
Впрочем, для Anthropic 1,5 миллиарда долларов хоть и ощутимая, но не критичная потеря: на прошлой неделе компания привлекла новые инвестиции на 13 миллиардов долларов, доведя тем самым свою оценку до 183 миллиардов долларов.