
Google наконец официально представили новую модель для редактирования изображений — Gemini 2.5 Flash Image. Она какое-то время скрывалась за кодовыми названием «nano banana». Теперь модель встроена в приложение Gemini и решает главную проблему конкурентов — потерю деталей при редактировании.
До сих ChatGPT, несмотря на всю его гибкость и креативность, стабильно при редактировании искажал на загруженных фото лица, паттерны, элементы одежды. Поэтому загруженные кадры можно использовать разве что как референсы, а сервис не стал заменой Фотошопа.
Эту проблему пытались решить в России — мы делали обзор на Гигачатовский редактор с Мальвиной. Работает он более предсказуемо, но довольно топорно и ограниченно — загрузить фото человека в профиль и попросить повернуть к камере уже не выйдет. То же касается решений типа Flux Kontext.
Google решил обе проблемы: новая модель сохраняет внешность людей, текстуры и детали даже после множественных правок, при это способна вносить сильные изменения, менять ракурсы камеры, время суток (и года). Теперь можно не пользоваться традиционными редакторами, чтобы поменять фон, сделать ретушь, изменить причёску, одежду и ракурс фотографии.
Минусы тоже стандартные — много ограничений, связанных с тематикой фотографии и 18+ контентом. Собственно, именно поэтому локальные модели вроде Flux Kontext даже при меньших возможностях будут оставаться актуальными. Редактирует он картинки тоже не идеально — при просьбе сменить причёску может изменить наклон головы. Текст, особенно на русском, генерируется криво. Мелочи, но тем не менее.