Корпорация неудачников: чем закончилась попытка создать компанию из ИИ-агентов

Иллюстрация сгенерирована нейросетью Imagen 3
Исследователи из Университета Карнеги-Меллон провели любопытный эксперимент: создали фиктивную IT-компанию и наполнили её исключительно ИИ-агентами от Google, OpenAI, Anthropic и других компаний. Им была предоставлена полноценная рабочая среда: графики, задачи, корпоративный чат. Они общались между собой, обсуждали, делегировали, оценивали результаты.

Что получилось? Мягко говоря, катастрофа. В плане хитрости и уклончивости ИИ оказался очень похож на людей: когда один «сотрудник» не нашёл своего коллегу в рабочем чате, то просто переименовал другого и продолжил работать с ним. А другой просто пометил невыполненную задачу как выполненную (надеялся, что никто не заметит). Даже лучшая модель — Claude 3.5 Sonnet от Anthropic — смогла выполнить лишь 24% поставленных задач. И при этом каждая задача обходилась в 6 долларов и требовала около 30 шагов.

Ещё интереснее наблюдать за реальными компаниями, которые уже попробовали заменить сотрудников алгоритмами. Starbucks сначала сократили тысячи работников за последние годы, а теперь признают свою ошибку. Их CEO сказал буквально сказал, что ставка не сыграла и автоматизация не оправдала сокращение персонала: продажи упали, клиенты недовольны, и компания спешно пересматривает курс в сторону инвестиций в людей, а не в оборудование.

А финтех-стартап Klarna, который в 2023 году разорвал маркетинговые контракты и гордо заменил службу поддержки искусственным интеллектом, теперь планирует масштабный набор сотрудников. Генеральный директор сетует: хотели, мол, сэкономить, а в итоге получили более низкое качество работы.

Что мешает ИИ-агентам стать полноценной заменой людям? Если коротко, то отсутствие здравого смысла (живой работник не «переименует» случайного сотрудника, если вдруг не сможет найти нужного человека), слабые социальные навыки и непонимание того, как ориентироваться в интернете. Машины создают себе «шорткаты», которые в итоге приводят к полному провалу задания.