Авито выложили в открытый доступ модели, заточенные под электронную коммерцию

Авито поделился двумя моделями — текстовой A-Vibe и мультимодальной A-Vision, обученными на данных собственного портала. Компания заявляет, что вложила в них полмиллиарда рублей, в итоге добившись того, что модели понимают лексику объявлений и логику общения продавцов с покупателями в российском сегменте. Авито уже рассказывали нам о планах открыть модели в интервью, а теперь они доступны всем желающим на Hugging Face.

Большинство российских моделей создаются под задачи конкретных компаний — банковский скоринг, обработка юридических документов, генерация маркетинговых текстов. A-Vibe и A-Vision продолжают эту линию — они заточены под маркетплейсы, обучены на товарных описаниях, запросах клиентов и каталогах. Команда разработала собственный токенизатор для русского языка, что, по словам команды, ускоряет генерацию почти вдвое и делает результаты точнее зарубежных аналогов. Модели обрабатывают до 100 страниц текста за раз, поддерживают function calling для создания агентов. На платформе Авито они работают с марта.

A-Vibe, по данным компании, заняла первое место среди легких моделей в российских тестах MERA и RU Arena Hard, справляется с кодом и отраслевыми задачами. A-Vision работает с графиками, документами и схемами. Команда перевела на русский четыре международных бенчмарка и выложила их в открытый доступ, так что можно ожидать скорого появления метрик и сравнений с продуктами от российских конкурентов.

//Илья Власов