Люди с особенностями слуха и речи воспользовались Яндекс Разговором свыше 1,3 млн раз с начала года

Фото RDNEStockproject/pexels.com
Речевые технологии на базе ИИ в Яндекс Разговоре с начала года помогли людям с особенностями слуха и речи провести 1,3 млн диалогов — на 49% больше, чем за весь 2024 год. А число уникальных пользователей приложения за год увеличилось более чем втрое, превысив 230 тыс. человек.

В основе Разговора лежит искусственный интеллект — технологии распознавания и синтеза речи Яндекса. Для оценки точности распознавания используют метрику WER (Word Error Rate) — она показывает, какую долю слов ML-модель расшифровала неправильно. С начала 2024 года WER ML-модели Разговора снизился с 7,10% до 6,27% (▼11,69%). Это стало возможным благодаря переходу на новую архитектуру и «псевдоразметке» — методу, при котором модель сама предварительно размечает большой объём данных, а лучшие результаты используются для дальнейшего обучения. Итоговое качество распознавания зависит от того, где происходит общение, есть ли фоновый шум, насколько чётко говорит собеседник и так далее.

Яндекс Разговор — это приложение, которое помогает в общении людям с особенностями слуха и речи. Если пользователь не слышит или слышит плохо, Разговор распознает речь собеседника и превратит её в текст на экране. А если есть сложности с произнесением — озвучит набранное сообщение. Это облегчает общение в разных жизненных ситуациях — например, в общественном транспорте, магазине или кафе.

В приложении есть готовые шаблоны сообщений. Они пригодятся, если нет времени набирать текст вручную. Среди самых популярных — шаблоны с просьбой говорить в телефон, повторить сказанное, уточнить место в очереди или следующую остановку. Также пользователи могут сами заранее заготовить фразы — например, перед визитом в банк или поликлинику.

Приложение Яндекс Разговор создали в 2015 году студенты базовой кафедры Яндекса в МФТИ. Оно доступно для устройств на платформах Android и iOS.