Книги в «Строках» озвучит MTS AI

25 января 2023, 05:37 🇷🇺 1 мин

новости операторов искусственный интеллект

ПАО «МТС» сообщает о старте проекта по озвучиванию до 10 000 произведений с помощью технологий искусственного интеллекта, запущенного MTS AI и книжным сервисом «Строки», на платформе которого доступны электронные и аудиоверсии книг и подкасты.

Создание аудиокниг из текстовых произведений MTS AI осуществит на основе возможностей собственной платформы для распознавания и синтеза речи Audiogram. В этом продукте используются нейронные сети, машинное обучение и технологии обработки естественного языка (NLP).

Платформа позволяет записывать аудиопроизведения в распространенном формате EPUB.

“В перспективе использование технологий синтеза речи позволит издательствам и электронным библиотекам существенного сократить время на подготовку аудиоверсии книги и снизить затраты на производство аудиоконтента. Команде MTS AI удалось добиться того, чтобы на подготовку первоначальной версии аудиокниг уходило 30-60 минут, тогда как студийная запись живым голосом занимает кратно больше времени, до нескольких дней с учетом технической обработки и монтажа”, — Дмитрий Буланцев, технический директор MTS AI.
“Формат аудиопотребления книжного контента очень удобен и становится все более популярным. При этом огромный объем книг — более 90% — не озвучены, их трансформация в аудиоформат традиционным способом заняла бы годы. Технологии искусственного интеллекта позволяют существенно ускорить, упростить и удешевить этот процесс. И значит огромное число произведений — как литературных, так и нонфикшн станут доступным в удобном аудиоформате,” — комментирует Евгения Рыкалова, руководитель книжного сервиса "Строки" от МТС.

Возможности платформы позволяют не только синтезировать речь, но и правильно расставлять ударения и паузы, воспроизводить интонации, характерные для текстов, в том числе, вопросительные, побудительные.

Технология MTS AI для озвучивания текстов и платформа для распознавания и синтеза речи Audiogram может использоваться не только для озвучивания книг, но и в образовательных процессах, в том числе, в EdTech, для подготовки аудиолекций, для озвучивания видео, статей, для создания материалов для людей с ограниченными возможностями, в том числе слабовидящих.