Ответ GPT-4o от Google – аналог «Фотошопа» появится прямо в Gemini

Google запускает функцию редактирования изображений с помощью искусственного интеллекта прямо в приложении Gemini. Раньше она была доступна только на портале для разработчиков.

Теперь можно будет загрузить любое изображение и трансформировать его, просто описывая желаемые изменения текстом. Не проблема поменять цвет волос или причёску на своём фото, добавить шляпу кошке, превратить её в героя фильма, убрать водяные знаки с фотографии — и так далее. Сегодня это можно делать без знания Фотошопа.

Происходит своего рода восстановление справедливости — потому что Google выкатили этот инструмент раньше OpenAI, но не внедрили в массовый продукт, из-за чего им мало кто успел воспользоваться. Про отличия генерации Google от аналогичной у OpenAI мы уже писали.

Особенно впечатляет умение сохранять контекст между правками, которого пока нет у конкурентов — система помнит предыдущие изменения, умеет сохранять объекты (и даже лица) нетронутыми, что позволяет последовательно менять картинку до получения идеального результата. GPT-4o, например, существенно меняет лица после генерации.

Ещё одно отличие — из области безопасности: каждое сгенерированное (или отредактированное) изображение имеет невидимый цифровой знак SynthID. А ещё компания экспериментирует с добавлением видимой маркировки «ai» в углу изображения (как это и было в превью версии на портале для разработчиков).

Важно, что редактирование картинок не включили всем сразу — функцию с 30 апреля постепенно раскатывают пользователям в большинстве стран мира на 45 языках.

//Илья Власов