Новые модели Ernie от Baidu – очень интересно, но не сильно полезно

Иллюстрация сгенерирована нейросетью Imagen 3
Baidu представили 2 новых модели для своего ИИ-помощника — Ernie 4.5 (мультимодальную, которая понимает изображения, видео и аудио) и Ernie X1 (рассуждающую).

Baidu не новичок в сфере ИИ. Компания была одной из первых в Китае, запустившей платформу генеративного ИИ в 2023 году. Тогда они вызвали небольшой скандал из-за использования предварительно записанных видеороликов для демонстрации. Акции компании упали на 10%, и разрыв с OpenAI, Tencent, ByteDance, Alibaba и другими конкурентами усилился. Теперь Baidu решили громко заявить о себе выпуском двух новых передовых моделей.

Все пишут о том, что по бенчмаркам эти модели могут соперничать с GPT-4.5 от OpenAI, хотя их запуск обходится в 100 раз дешевле. Очередной прорыв от китайских компаний? Возможно, но пока довольно бесполезный для пользователей за пределами Китая.

Чтобы просто воспользоваться чат-ботом, придётся преодолеть кучу сложностей.
• Первое препятствие — необходимость в китайском номере телефона, без него о регистрации можно забыть. Даже если он у вас есть, но давно не пополнялся или не захочет подключаться к сети, зарегистрироваться не получится (мы проверили).
• Второе — интерфейс полностью на китайском языке.
• Третье — специфика модели, которая нацелена на локальный рынок, хуже работает с другими языками и может случайным образом переходить на китайский.

Новые модели Ernie, безусловно, имеют впечатляющие характеристики — улучшенное понимание контекста, мультимодальные возможности, работа с большими документами. Но правда в том, что аналогичный функционал уже доступен у конкурентов, которые не требуют китайского номера телефона и доступны на русском (привет, DeepSeek).

Бот может пригодиться бизнесу, разработчикам и исследователям по всему миру, которые приложат много усилий, чтобы разобраться и получить доступ к дешёвым моделям. Но вот популярным решением для массового пользователя он станет вряд ли.

Разве что когда модели выложат в открытый доступ и другие компании смогут запустить их на своих серверах. Или если компания решит сделать продукт более открытым — тогда мы обязательно расскажем об этом и поделимся результатами тестов.