МИФИ собрал систему для анализа научных данных МИФИ собрал систему для анализа научных данных Amazon продал подписку дважды Amazon продал подписку дважды Пекин отвечает Пентагону его же оружием Пекин отвечает Пентагону его же оружием Google научилась генерировать видео на основе панорам с улиц Google научилась генерировать видео на основе панорам с улиц

Книги в «Строках» озвучит MTS AI

🇷🇺 1 мин
Иллюстрация с официального сайта MTS AI

ПАО «МТС» сообщает о старте проекта по озвучиванию до 10 000 произведений с помощью технологий искусственного интеллекта, запущенного MTS AI и книжным сервисом «Строки», на платформе которого доступны электронные и аудиоверсии книг и подкасты.

Создание аудиокниг из текстовых произведений MTS AI осуществит на основе возможностей собственной платформы для распознавания и синтеза речи Audiogram. В этом продукте используются нейронные сети, машинное обучение и технологии обработки естественного языка (NLP).

Платформа позволяет записывать аудиопроизведения в распространенном формате EPUB.

“В перспективе использование технологий синтеза речи позволит издательствам и электронным библиотекам существенного сократить время на подготовку аудиоверсии книги и снизить затраты на производство аудиоконтента. Команде MTS AI удалось добиться того, чтобы на подготовку первоначальной версии аудиокниг уходило 30-60 минут, тогда как студийная запись живым голосом занимает кратно больше времени, до нескольких дней с учетом технической обработки и монтажа”, — Дмитрий Буланцев, технический директор MTS AI.

“Формат аудиопотребления книжного контента очень удобен и становится все более популярным. При этом огромный объем книг — более 90% — не озвучены, их трансформация в аудиоформат традиционным способом заняла бы годы. Технологии искусственного интеллекта позволяют существенно ускорить, упростить и удешевить этот процесс. И значит огромное число произведений — как литературных, так и нонфикшн станут доступным в удобном аудиоформате,” — комментирует Евгения Рыкалова, руководитель книжного сервиса "Строки" от МТС.

Возможности платформы позволяют не только синтезировать речь, но и правильно расставлять ударения и паузы, воспроизводить интонации, характерные для текстов, в том числе, вопросительные, побудительные.

Технология MTS AI для озвучивания текстов и платформа для распознавания и синтеза речи Audiogram может использоваться не только для озвучивания книг, но и в образовательных процессах, в том числе, в EdTech, для подготовки аудиолекций, для озвучивания видео, статей, для создания материалов для людей с ограниченными возможностями, в том числе слабовидящих.