ИИ впервые выполнил задачу длиной в миллион шагов без ошибок

Исследователи из Cognizant AI Lab заставили языковую модель выполнить задачу из более чем миллиона последовательных шагов без ошибок. Обычно даже самые продвинутые языковые модели начинают «галлюцинировать» или терять нить рассуждений через несколько сотен действий, из-за чего длинные цепочки задач не работают. Новая система MAKER доказала обратное, решив головоломку «Ханойская башня» с 20 дисками — задачу, требующую математической точности на протяжении более миллиона ходов. По данным авторов, это первый случай, когда LLM показала такую надежность на сверхдлинной дистанции.

Секрет успеха — в бюрократии и надзоре. Метод опирается на «экстремальную декомпозицию»: задача дробится на элементарные микро-шаги, каждый из которых выполняет отдельный ИИ-агент. Этих агентов заставили выполнять одну задачу, постоянно отчитываться о её выполнении и посылать результаты на проверку выше стоящим агентам. Им просто устроили корпоративный офис в миниатюре.

Чтобы исключить случайные сбои, система использует механизм голосования: несколько агентов параллельно предлагают решение для одного шага, и принимается только тот вариант, который набирает большинство. Если агент выдает странный или неправильно отформатированный ответ, система вешает на него «красный флаг» и запрашивает пересдачу. Для этого даже не понадобились дорогие флагманские модели — дешевые и быстрые модели вроде gpt-4.1-mini и gpt-oss-20B оказались выгоднее и надёжнее, чем дорогие флагманы.

Это значит, что вместо погони за увеличением количества параметров и стоимости инференса можно делать распределённые иерархические системы и добиваться лучших результатов. Этот подход назвали MDAP (массово декомпозированные агентные процессы). По мнению исследователей, он позволяет автоматизировать процессы уровня крупных корпораций, от сложной логистики до обработки налоговых деклараций.

//Илья Власов