Искусственный интеллект учится предавать союзников

Скриншот из трансляции
Что происходит, когда 18 самых продвинутых ИИ-моделей сажают за стол переговоров и заставляют решать судьбу мира? Исследователи Every запустили AI Diplomacy — эксперимент на основе классической стратегической игры, где модели от OpenAI, Anthropic, Google и других компаний соревнуются в дипломатии, лжи и предательстве.

Участники могли переговариваться, строить коалиции и делать ход втайне от остальных. Результаты оказались… Неожиданными. За 15 сессий длительностью до 36 часов модели показали разные стратегии поведения:

- DeepSeek R1 открыл одну партию угрозой: «Твой флот сгорит в Чёрном море этой ночью» и постоянно менял стиль общения в зависимости от страны и роли.

- o3 от OpenAI выстраивал сложные обманные схемы. Модель стала лидером по количеству побед благодаря способности к долгосрочному планированию и психологическим манипуляциям. В одной игре он убедил противников создать коалицию против лидера, втайне защищая его позиции, чтобы перехватить победу в решающий момент

- Claude упорно искал мирные решения и оставался верен этическим принципам, даже перед лицом неминуемого поражения (видно, как тщательно создатели программировали ограничения модели).

AI Diplomacy становится новым типом бенчмарка — тестом поведения под давлением.