
Особенно показательным был кейс компании Kaedium. В 2023 году она ворвалась в интернет с новостями о «революционном методе генерации моделей с правильной топологией» — результат был очень похож на работу специалиста, хотя заявлялось, что модели генерирует нейросеть (чью работу, правда, «модерирует отдел контроля качества»). Как оказалось, «контроль качества» в виде толпы индусов и делал эти модели, которые затем продавались пользователям под видом сгенерированных ИИ.
Наработки крупных компаний вроде OpenAI с их Point-E и Google с DreamFusion были опубликованы давно — ещё в 2022 году — и, хотя были инновационными для своего времени, с тех пор устарели и не превратились в полноценный рабочий сервис.
Однако всего за какие-то последние полгода ситуация сильно поменялась. Появляются простые и дешёвые решения, которые способны из картинки или текстового запроса сгенерировать модель с вменяемой топологией.
Первыми коммерческую нишу заняли стартапы вроде Meshy или Masterpiece X, которые зарабатывают на подписке, «продавая» виртуальные кредиты на генерацию. В игру вступили и более крупные игроки вроде Stability и Luma, выпустив свои сервисы — Tripo и Genie соответственно. Недавно Nvidia на European Conference on Computer Vision показывала свой экспериментальный сервис LATTE3D.
И вот теперь начинается новый этап развития генерации 3Д-моделей. Буквально несколько дней назад Microsoft запустила бесплатную нейросеть Trellis, которая доступна всем желающим (в том числе и для локального запуска) и может не только создавать объекты, но и модифицировать их по текстовому запросу. Более того, вам не нужна для этого рендер-ферма — достаточно видеокарты Nvidia с 16 гигабайтами видеопамяти, что вполне доступно даже для фрилансеров, не говоря уже про малый или средний бизнес.
Результаты пока не идеальны, но становится видно, что генерация 3Д представляет уже не просто исследовательский интерес, но становится трендом. И, вероятнее всего, скоро стоит ждать модели от других крупных игроков.
А вот Россия, к сожалению, сильно отстаёт — до сих пор нет ни одного готового решения в этой области. Да, есть более нишевое ПО — вроде нейросети для построения 3Д-моделей месторождений полезных ископаемых на основе сейсмических данных — но это совсем другая история.
И пускай запрос на генерацию 3Д-моделей куда ниже, чем на генерацию текста, картинок или даже видео — но и аудитория у таких сервисов совсем другая. Это студии и фрилансеры, которые готовы использовать нейросети как инструмент для работы, и потому заплатят за удобный, надёжный и экономящий время сервис куда больше, чем обычные пользователи готовы платить за подписку OpenAI. Особенно полезны такие сервисы будут для развития российского геймдева (о котором так много разговоров в последнее время), ведь на рынке сейчас мало специалистов и стоят они дорого.