
Для того, чтобы результат суммаризации передавал все важные мысли оригинального материала и был лаконичным, разработчики дополнительно обучили нейросеть YandexGPT с помощью особого набора данных. Это десятки тысяч пар больших текстов и их сокращённых версий. Их подготовили редакторы внутренней краудсорсинговой платформы Яндекса и AI-тренеры компании. Функция тезисного пересказа впервые появилась 27 июня на сервисе 300.ya.ru.
Илья Шибанов, руководитель проектного офиса разработки Яндекс Браузера: «Тезисный пересказ в Яндекс Браузере работает на базе обновлённой нейросети. По сравнению с её представленной неделю назад версией количество качественных суммаризаций (полных, точных, лаконичных и отвечающих другим критериям оценки) увеличилось в 1,3 раза, а количество ошибок модели сократилось в 4 раза. Кроме того, скоро мы научим YandexGPT обобщать в виде тезисов тексты длиннее 30 тысяч знаков и работать с документами в формате PDF и DOCX».
YandexGPT умеет выделять главное в русскоязычных текстах длиной до 30 тысяч знаков. Для полного прочтения материала такого объёма обычно требуется 15-17 минут. Нейросетевой пересказ доступен в Яндекс Браузере для компьютеров (Windows, macOS, Linux) и смартфонов (iOS, Android).