Видео, звук и голос в одном сервисе: ElevenLabs расширяет границы генеративного ИИ

23 ноября 2025, 04:15

ElevenLabs, один из крупнейших в мире стартапов в сфере генеративных голосовых моделей, открыл сервис для создания изображений и видеороликов. Площадка объединяет лучшие модели на рынке — от Veo и Sora до Kling, Wan и Seedance — и позволяет генерировать статику, видео и сториборды, а затем дорабатывать их внутри единой рабочей среды.

Новый сервис работает как мультимодальная студия: пользователь может создавать изображения, собирать из них видеоролики, апскейлить материалы и комбинировать несколько моделей в одном проекте. Но это не главное — компания понимает, что доступом к популярным моделям сегодня никого не удивишь, поэтому делает ставку на интеграцию со своей платформой и работу со звуком.

В сервис встроено бесшовное соединение визуала и аудио: готовый ролик можно сразу экспортировать в Studio, добавить озвучку с помощью клонированных голосов (или взять готовый из большой библиотеки), наложить музыку через ElevenMusic и вставить звуковые эффекты. Есть автоматическая синхронизация речи с движением губ через модели Veed или OmniHuman — нечастая фукция даже среди продвинутых ИИ-редакторов.

Мультимодальная платформа позволяет стартапу претендовать на более широкую аудиторию от маркетинга до видеопродакшна. На данный момент никто из конкурентов не даёт такую глубокую работу со звуком и голосом прямо внутри видеоредактора. Но есть и риски — рынок подобных сервисов очень конкурентный, а у пользователей выстроены свои пайплайны и оплачены подписки, так что переманить их будет непросто.

Google рассказали, сколько просмотров в день у YouTube Shorts

Подпишитесь на наш Telegram-канал @contentreview

ИИ месяц читал секретные письма, пока никто не смотрел

Щит заземлится в Директе

Стартап учит ИИ понимать видео в реальном времени

Видео, звук и голос в одном сервисе: ElevenLabs расширяет границы генеративного ИИ