Яндекс представил новую версию собственной языковой модели YandexGPT 2

Яндекс запустил YandexGPT 2. Новая языковая модель может решать больше различных типов задач, чем первая версия нейросети, а качество её ответов существенно улучшилось. Возможности YandexGPT 2 на конференции Practical ML Conf представил Алексей Гусаков, руководитель управления машинного интеллекта и исследований Яндекса.

YandexGPT 2 умеет адаптировать ответ под разные аудитории и переписывать его в других стилях и жанрах. Например, нейросеть может объяснить ребёнку сложный термин простыми словами или пересказать указ директора в виде понятного письма для внутренней рассылки сотрудникам. YandexGPT 2 способна анализировать любые тексты длиной до тысячи символов, которые пользователь добавит в запрос, отвечать на вопросы к ним и структурировать информацию.

Для оценки качества YandexGPT 2 обе версии модели отвечали на одинаковый набор запросов. Затем AI-тренеры Яндекса сравнили результаты с учётом множества параметров, включая точность, полноту, фактическую правильность, грамматическую и стилистическую корректность и другие. YandexGPT 2 отвечает лучше в 67% случаев.

Доля запросов разного типа, в которых YandexGPT 2 отвечает лучше предыдущей модели:

  • Генерация текста — 69%.
  • Пересказ и анализ текста — 68%.
  • Генерация идей — 66%.
  • Стилизация под определённую аудиторию или персонажа — 62%.
  • Фактовые запросы — 62%

Для создания YandexGPT 2 разработчики увеличили количество параметров модели и усовершенствовали процесс её обучения. Они усилили контроль за качеством исходных данных, дополнили датасет новыми примерами запросов и синтетическими данными — искусственно сгенерированными на основе реальной информации материалами. Подробный рассказ про обучение YandexGPT 2 опубликован в блоге Яндекса на Хабре.

YandexGPT 2 уже доступна в режиме Алисы «Давай придумаем» в приложении Яндекс, Яндекс Станциях, телевизорах с Алисой, Яндекс Браузере, на странице с результатами поиска и на ya.ru. В Поиске и Браузере чат с Алисой теперь можно развернуть на весь экран для более удобной работы.

О генеративной нейросети YandexGPT

YandexGPT — большая языковая модель, которую Яндекс запустил в мае 2023 года. Нейросеть умеет создавать и перерабатывать тексты, выполнять задания, предлагать новые идеи и учитывает контекст беседы с пользователем. Она кратко пересказывает тексты статей из интернета в Яндекс Браузере и на 300.ya.ru, обобщает информацию из отзывов о товарах в Поиске и на Маркете, помогает создавать описания товаров продавцам Маркета и не только. Нейросеть можно протестировать в собственном бизнесе — для этого нужно оставить заявку на доступ к API. База данных, на которых обучали YandexGPT 2, ограничена мартом 2023 года.