
В основе Разговора лежит искусственный интеллект — технологии распознавания и синтеза речи Яндекса. Для оценки точности распознавания используют метрику WER (Word Error Rate) — она показывает, какую долю слов ML-модель расшифровала неправильно. С начала 2024 года WER ML-модели Разговора снизился с 7,10% до 6,27% (▼11,69%). Это стало возможным благодаря переходу на новую архитектуру и «псевдоразметке» — методу, при котором модель сама предварительно размечает большой объём данных, а лучшие результаты используются для дальнейшего обучения. Итоговое качество распознавания зависит от того, где происходит общение, есть ли фоновый шум, насколько чётко говорит собеседник и так далее.
Яндекс Разговор — это приложение, которое помогает в общении людям с особенностями слуха и речи. Если пользователь не слышит или слышит плохо, Разговор распознает речь собеседника и превратит её в текст на экране. А если есть сложности с произнесением — озвучит набранное сообщение. Это облегчает общение в разных жизненных ситуациях — например, в общественном транспорте, магазине или кафе.
В приложении есть готовые шаблоны сообщений. Они пригодятся, если нет времени набирать текст вручную. Среди самых популярных — шаблоны с просьбой говорить в телефон, повторить сказанное, уточнить место в очереди или следующую остановку. Также пользователи могут сами заранее заготовить фразы — например, перед визитом в банк или поликлинику.
Приложение Яндекс Разговор создали в 2015 году студенты базовой кафедры Яндекса в МФТИ. Оно доступно для устройств на платформах Android и iOS.
