
Система состоит из нескольких агентов: один разбивает запрос на задачи, другой ищет данные, третий анализирует, ещё один структурирует выводы. Примеры использования предлагают стандартные: анализ рынков, сравнение конкурентов, обзор научных публикаций. Система обещает выдавать SWOT-анализы, отчёты с трендами и академические обзоры со ссылками на источники. Хотя мы бы пользоваться им для этого, конечно, не рисковали.
Проблема даже не в том, что аналогичные функции уже есть у основных конкурентов — от ChatGPT до специализированных платформ вроде Perplexity. Очевидно, что они начали раньше, имеют больше ресурсов, давно получают обратную связь. Мы и не ожидали увидеть продукт «лучше», но хотя бы продукт, сделанный с пониманием, для кого это, и с учётом ошибок и фишек конкурентов.
Исследования у лидеров рынка могут занимать 10-30 минут и генерировать отчёты на десятки страниц. Гигачат работает быстрее — около минуты-двух. Результат больше напоминает стандартную выдачу нейропоиска (того же Perplexity), которая при этом генерируется мгновенно. Запросы «думать дольше» система настойчиво игнорирует. Так зачем нужно исследование на пару страниц, которое будет генериться насколько минут, если то же самое гораздо быстрее сделает Perplexity или даже российские конкуренты?
Критичнее другое: отсутствие прямых ссылок на источники в тексте. Более того, нормально оформленных источников хотя бы со сносками нет в принципе, их нужно самостоятельно вылавливать (при желании) из потока рассуждений модели. Спасибо, такого желания нет.
Отсюда вытекает и другая проблема — галлюцинации. А они присутствуют. Но они так-то везде есть, просто в других нейросетях можно пройти по ссылке на источник информации, которая вызвала сомнения, и проверить. А тут нельзя. Так какой анализ рынка мы с ним будем проводить? Разве что если рынок воображаемый.
В итоге получается знакомая картина: в Сбере сделали технологически интересное решение, но не подумали о продукте. Не понятно, кто будет пользоваться функцией, зачем, как её монетизировать и чем она хотя бы немного отличается в лучшую сторону от уже существующих аналогов. Пока это больше похоже на демонстрацию возможностей, чем на готовый к массовому использованию продукт.