Нейросеть разглядела в космосе то, что люди упускали 35 лет Нейросеть разглядела в космосе то, что люди упускали 35 лет Что смотрят зумеры? Топ-3 сериалов и топ-3 фильмов Что смотрят зумеры? Топ-3 сериалов и топ-3 фильмов Wildberries предложил покупателям скинуться деньгами на свой бизнес Wildberries предложил покупателям скинуться деньгами на свой бизнес В России наблюдается взрывной рост продаж планшетов В России наблюдается взрывной рост продаж планшетов

В МТУСИ разработали алгоритм для генерации изображений нейросетями

Россия 1 мин
Фото cottonbrostudio/pexels.com

В настоящее время почти во всех сферах жизни человека все большее внедрение находят методы машинного обучения. При этом одними из самых эффективных и часто используемых на практике являются методы, базирующиеся на искусственных нейронных сетях (НС). Они позволяют обрабатывать изображения, видео- и аудиоданные.

Еще одним направлением развития НС является генерация текста и изображений по составленному пользователем запросу (промпту). НС научились создавать изображения, которые трудно отличить от реальных, созданных человеком, поэтому стали мощным рабочим инструментом при составлении рекламных слоганов, создании необычных рекламных баннеров.

Вследствие этого задача разработки алгоритма формирования запроса, позволяющего сгенерировать качественное изображение в разумные временные интервалы, становится особо актуальной. Сотрудники кафедры «Математическая кибернетика и информационные технологии» МТУСИ смогли ее решить.

«При разработке алгоритма составления промптов, позволяющих получить качественное изображение нейросетевыми онлайн-сервисами, определены факторы, приводящие к некорректным результатам генерации изображений посредством естественно-языковых, неформализованных запросов. Создана методика описания объекта, явления или процесса, для апробации разработанного алгоритма и определения его эффективности выбраны нейросетевые онлайн-сервисы «Шедеврум» и Kandinsky», — пояснил д.т.н, профессор кафедры МКиИТ МТУСИ Юрий Леохин.

Выбор НС определяется тем, что они являются отечественными разработками, которые ориентированы в первую очередь на русскоязычную аудиторию.

«Результаты проведенных экспериментов показали, что разработанный алгоритм формирования запроса к нейросетевым сервисам для генерации изображения позволяет получать более корректный результат по сравнению с обычным естественно-языковым запросом. Особенно это заметно на запросах, содержащих отрицательные частицы и предлоги, относительные прилагательные, предполагающие представление абстрактного понятия, и при использовании числительных», — отметил к.т.н, доцент кафедры МКиИТ МТУСИ Тимур Фатхулин.

В дальнейшем ученые планирует модифицировать и модернизировать разработанный алгоритм с учетом увеличивающегося функционала современных нейросетевых сервисов и рассмотреть возможность его применения для генерации текстового контента.