Вор у вора датасет украл

25 февраля 2026, 12:37

В США начинается новый сезон сериала о том, как коварные китайские ИИ-компании воруют американский искусственный интеллект. Разработчик нейросети Claude, компания Anthropic, выпустила расследование. Из которого следует, что DeepSeek, Moonshot и MiniMax в промышленных масштабах обучают свои модели на ответах американских нейросетей. По версии Anthropic, китайские лаборатории создали так называемые «гидра-кластеры» — распределенные сети из 24 тысяч фейковых аккаунтов. которые через прокси-сервисы посылали Claude запросы и скачивали ответы (код, текстовые формулировки, логику ответа и рассуждений).

После заявления Anthropic возник ряд неудобных вопросов, причём к самой компании. Они с гордостью заявляют, что смогли отследить фейковые аккаунты «вплоть до конкретных исследователей». Получается, приватность и безопасность данных, о которой они так много рассказывают — просто красивый маркетинговый конструкт? Особенно интересно слышать обвинения в воровстве данных от компании, которая сама обучила свой ИИ на защищенных копирайтом книгах и статьях, из-за чего вынуждена выплачивать компенсации авторам. Выходит, тренироваться на чужом контенте нормально, а парсить ответы чужой нейросети — преступление?

При этом официально Anthropic и так не предоставляет доступ к своим API пользователям из Китая. Неожиданно оказалось, что блокировки не работают и легко обходятся через подставные компании в других юрисдикциях, зарубежные платежные карты и прокси. В таком случае единственным окончательным решением проблемы может стать блокировка всех стран, где потенциально могут быть прокси китайских компаний, что выглядит совсем не реалистично. Правда есть подозрение, что решать именно эту проблему никто не собирается.

Текст Anthropic вышел на фоне аналогичного у OpenAI, которые вдруг достали из пыльного чулана свои претензии к DeepSeek годичной давности и снова обвиняют компанию в дистилляции данных, возводя её в ранг угрозы не только бизнесу, но и экспортным ограничениям и безопасности США. Либо Anthropic боятся отстать от Сэма Альтмана в медийном поле и спешат вставить свои пять копеек, либо, что выглядит вероятнее, это скоординированная атака на китайский ИИ. Было бы очень удобно объяснить успехи конкурентов — мол, на самом деле они ничего не могут и «просто копируют у нас». Ну а параллельно конкурентов от греха подальше запретить.

//Илья Власов