
Новый сервис работает как мультимодальная студия: пользователь может создавать изображения, собирать из них видеоролики, апскейлить материалы и комбинировать несколько моделей в одном проекте. Но это не главное — компания понимает, что доступом к популярным моделям сегодня никого не удивишь, поэтому делает ставку на интеграцию со своей платформой и работу со звуком.
В сервис встроено бесшовное соединение визуала и аудио: готовый ролик можно сразу экспортировать в Studio, добавить озвучку с помощью клонированных голосов (или взять готовый из большой библиотеки), наложить музыку через ElevenMusic и вставить звуковые эффекты. Есть автоматическая синхронизация речи с движением губ через модели Veed или OmniHuman — нечастая фукция даже среди продвинутых ИИ-редакторов.
Мультимодальная платформа позволяет стартапу претендовать на более широкую аудиторию от маркетинга до видеопродакшна. На данный момент никто из конкурентов не даёт такую глубокую работу со звуком и голосом прямо внутри видеоредактора. Но есть и риски — рынок подобных сервисов очень конкурентный, а у пользователей выстроены свои пайплайны и оплачены подписки, так что переманить их будет непросто.