Еще одним направлением развития НС является генерация текста и изображений по составленному пользователем запросу (промпту). НС научились создавать изображения, которые трудно отличить от реальных, созданных человеком, поэтому стали мощным рабочим инструментом при составлении рекламных слоганов, создании необычных рекламных баннеров.
Вследствие этого задача разработки алгоритма формирования запроса, позволяющего сгенерировать качественное изображение в разумные временные интервалы, становится особо актуальной. Сотрудники кафедры «Математическая кибернетика и информационные технологии» МТУСИ смогли ее решить.
«При разработке алгоритма составления промптов, позволяющих получить качественное изображение нейросетевыми онлайн-сервисами, определены факторы, приводящие к некорректным результатам генерации изображений посредством естественно-языковых, неформализованных запросов. Создана методика описания объекта, явления или процесса, для апробации разработанного алгоритма и определения его эффективности выбраны нейросетевые онлайн-сервисы «Шедеврум» и Kandinsky», — пояснил д.т.н, профессор кафедры МКиИТ МТУСИ Юрий Леохин.
Выбор НС определяется тем, что они являются отечественными разработками, которые ориентированы в первую очередь на русскоязычную аудиторию.
«Результаты проведенных экспериментов показали, что разработанный алгоритм формирования запроса к нейросетевым сервисам для генерации изображения позволяет получать более корректный результат по сравнению с обычным естественно-языковым запросом. Особенно это заметно на запросах, содержащих отрицательные частицы и предлоги, относительные прилагательные, предполагающие представление абстрактного понятия, и при использовании числительных», — отметил к.т.н, доцент кафедры МКиИТ МТУСИ Тимур Фатхулин.
В дальнейшем ученые планирует модифицировать и модернизировать разработанный алгоритм с учетом увеличивающегося функционала современных нейросетевых сервисов и рассмотреть возможность его применения для генерации текстового контента.