Сегодня линию, которая отделяет минорный релиз от мажорного, проводят не учёные и архитекторы нейросетей, а маркетологи. У нас нет достоверных данных о том, какими технологиями в реальности располагает OpenAI, и, уж тем более о том, какие из них она сейчас предоставляет массовому пользователю. Судя по всему, эти множества пересекаются лишь частично.
Несмотря на слово «Open» в названии, секретности современной OpenAI могут позавидовать оборонные концерны. Тем не менее, как это часто бывает, открытых источников и высказываний руководителей компании вполне достаточно чтобы сделать некоторые выводы.
Итак, что мы имеем по факту:
- Ключевое изменение — это новый маршрутизатор, который на лету автоматически выбирает модель для обработки пользовательского запроса
- Улучшена способность строить цепочки рассуждений, разбивая решение задачи на логические шаги (reasoning)
- Улучшена мультимодальность и выполнение агентных задач
- Улучшена работа в режиме генератора программного кода
Все остальное является интеграциями с другими сервисами и улучшениями пользовательского интерфейса. При этом «старые» модели исчезли из доступа, а на новые nano и mini цены существенно снизили.
Получившие ранний доступ инфлюенсеры, как обычно, восторгались: «как мощны лапищи новой модели!» Однако, реальные пользователи встретили релиз весьма прохладно.
В первую очередь, оказалось, что новый маршрутизатор слишком часто и поспешно переключается на упрощённую модель, из-за чего ответы GPT-5 уступают по качеству прошлым моделям. Принудительный выбор модели исчез, так что предотвратить переключение можно с помощью добавления к запросу фраз типа «think hard» («подумай как следует»). Указывать модель разрешили лишь тем, кто платит 200 долларов месяц.
GPT-5 оказалась слабее в творческих задачах, существенно снизился навык одновременной обработки нескольких тем и связывания их воедино. Возросло количество «галлюцинаций» (которые корректнее называть конфабуляциями). Но больше всего пользователей огорчило снижение эмпатии. Новая модель отвечает сухо, лаконично и менее эмоционально. Зато почти все отмечают что скорость работы стала заметно выше.
Что мы имеем в итоге? Если использовать в качестве суммаризатора мозг, а не новую GPT-5, то можно заметить: почти все изменения направлены на то, чтобы снизить затраты на инференс (вывод ответов пользователю). На первый план выходит экономическая эффективность. Да, есть ряд других эволюционных или совсем косметических изменений, но они в этом релизе вторичны.
И если внимательно следить за высказываниями Альтмана, то о многом он говорил ранее. К примеру, о том, что вежливость и эмпатия в ответах стоит компании миллионы долларов. Которые, очевидно, кто-то должен заплатить.
Или, вот совсем недавно, он сказал, что они очень внимательно отслеживают эмоциональную привязанностью пользователей. Кто бы сомневался. Не в том, смысле, что кто-то в серьёз заботится о душевном здоровье собеседников нейросети. Нет, речь именно о том, что в какой степени эта привязанность и положение на рынке позволяют ухудшить качество продукта без риска получить сколько-нибудь заметный отток из набранных 700 млн пользователей.
Похоже, что в этот раз немного перестарались. Но удивляться этому, это примерно тоже самое, как удивляться тому, что на пакете с лапшой Роллтон изображён говяжий стейк, а внутри только лапша и пакетик с соевой моделью мяса лайт nano.