Релиз «рассуждающей» модели от Alibaba

Картинка из пресс-релиза команды Qwen
У нас продолжается неделя релизов — китайская компания Alibaba представила новую «рассуждающую» ИИ-модель QwQ-Max-Preview. Это случилось на фоне объявления компании о масштабных инвестициях в искусственный интеллект. Но обо всём по порядку.

QwQ-Max-Preview — это модель рассуждения в семействе Qwen, созданная на базе Qwen 2.5 Max. ИИ специализируется на математических задачах и программировании. Сама компания заявляет, что новинка «раздвигает границы глубокого мышления». Но они бы ничего другого и не сказали, конечно.

ИИ уже интегрирован в приложение Qwen Chat в виде функции «мышления» (thinking), которая позволяет модели демонстрировать процесс рассуждения при решении сложных задач. Пока модель находится в предварительной версии, но полная версия, а также открытый доступ к весам QwQ-Max и Qwen 2.5 Max ожидаются в ближайшее время.

Собственно, Alibaba просто остаются в русле релизов остальных компаний и выпускают свою «думающую» версию ИИ. Учитывая, насколько популярной стала их модель Qwen для дообучения (топ-10 моделек на арене Open LLM Leaderboard были основаны на Qwen, да и для обучения вчерашнего YaGPT 5 от Яндекса использовались их веса) — можно от «думающей» модели ожидать похожих результатов.

Что интересно, Alibaba также планирует выпустить упрощенные версии моделей QwQ для локального развертывания, on premise. Они будут лучше подходить для приложений, чувствительных к конфиденциальности, и отлично впишутся в пайплайн работы ИИ-интеграторов.

QwQ-Max-Preview вроде как уже обошла некоторые модели OpenAI в тестах LiveCodeBench (бенчмарк, тестирующий навыки ИИ в программировании). Ещё скоро выйдет приложение Qwen Chat для iOS и Android, сделав его доступнее для широкой аудитории. И это при том, что в Qwen уже есть бесплатная генерация картинок и видео, чем может похвастаться мало кто из конкурентов.

Всё это происходит на фоне анонсированных Alibaba масштабных инвестиций — более 52 миллиардов долларов в развитие облачных вычислений и искусственного интеллекта в течение следующих трех лет. Этот объём превышает общие расходы компании на ИИ и облачные технологии за прошедшее десятилетие. И это в дополнение к плану Банка Китая инвестировать триллион юаней в ИИ.