В чате с Алисой AI теперь можно создавать изображения с верными и более длинными надписями на русском языке. При генерации таких картинок разные нейросети зачастую допускают ошибки, потому что их обучают на открытых датасетах, в которых слабо представлен русский язык. Алиса AI научилась решать эту проблему: для создания изображений она стала использовать обновлённую модель Alice AI ART, которую Яндекс обучил на собственном масштабном датасете. Благодаря этому пользователи нейросети теперь могут создавать постеры, афиши и открытки с надписями на русском языке, а бизнес - рекламные материалы, лендинги, брошюры или презентации в Yandex AI Studio.
Для обучения модели команда Яндекса собрала датасет изображений с русскоязычными надписями и детальной разметкой текста, а также изменила архитектуру модели. После обновления нейросеть стала в 3 раза чаще генерировать картинки с корректным русскоязычным текстом: без ошибок или нечитаемых букв. Для этого достаточно использовать простые приёмы: заключать текст в кавычки, писать сложные слова заглавными буквами, разбивать длинные надписи на более короткие фразы.
Кроме того, на треть выросло общее качество генерации изображений - доля картинок без визуальных искажений, а также модель стала лучше понимать русский культурный код. Для этого её обучили на русскоязычных промптах и дополнили системой, которая преобразует общие запросы в более конкретные визуальные образы. Например, если написать в чате с Алисой AI «Изобрази русский народный ансамбль», нейросеть создаст изображение с гармонистами и балалаечниками, а по запросу «Традиционный русский праздничный стол» - картинку с икрой, соленьями и самоваром. Если попросить Алису AI создать иллюстрацию на космическую тему, модель добавит на картинку российских космонавтов.
Новая модель также стала доступна для бизнеса на платформе Yandex AI Studio. С помощью нового инструмента Image Generation Tool бизнес может использовать модель в сложных агентских сценариях, где генерация изображений - лишь один из шагов решения задачи. Например, ИИ-агент сможет автоматически создать изображения для карточек товаров на маркетплейсах, как только информация о них появится в корпоративной базе данных.