
Компания Google обновила чат-бот Gemini, добавив в него основанную на алгоритмах искусственного интеллекта (ИИ) функцию для обработки изображений. Данная функция помогает с высокой точностью контролировать процесс редактирования фотографий.
Обновление Gemini 2.5 Flash Image доступно всем пользователям приложения Gemini, а также разработчикам на платформах Gemini API, Google AI Studio и Vertex AI. Новый редактор обрабатывает изображения с высокой точностью на основе запросов простым естественным языком. Он сохраняет единообразие лиц, животных и другие детали, что не всегда под силу конкурирующим инструментам: например, если попросить ChatGPT или xAI Grok изменить на фотографии цвет чьей-то рубашки, на выходе можно получить искажённое лицо или изменения на фоне. Google Gemini 2.5 Flash Image уже завоевала признание пользователей — компания открыла доступ к ней на платформе LMArena под названием «nano-banana».
Это не отдельная модель ИИ, а встроенная функциональность существующей Gemini 2.5 Flash AI.
«Мы по-настоящему повысили качество работы с изображением, а также способность модели следовать инструкциям. Это обновление значительно улучшает процесс редактирования, делая его более органичным, а результаты работы модели — пригодными для любых целей», — рассказала ресурсу TechCrunch руководитель направления по генеративным визуальным моделям в Google DeepMind Николь Брихтова.
Модель обладает глубокими знаниями о мире и позволяет задавать в запросе несколько образцов — например, изображение дивана, гостиной и цветовой палитры можно совместить в едином ответе, сообщает 3dnews.ru.