Qué es Nano Banana y cómo funciona el nuevo editor de imágenes de Google

Desde hace algunos días, la herramienta “Nano Banana” ha captado la atención en el ámbito de la inteligencia artificial, destacándose por su capacidad en la generación y edición de imágenes. Recientemente se ha revelado que este producto es en realidad parte de Google y se denomina Gemini 2.5 Flash Image.

Al igual que otros generadores de imágenes, Nano Banana opera mediante prompts en lenguaje natural. No es necesario contar con habilidades de diseñador gráfico; simplemente se requiere describir brevemente lo que se desea, y el modelo se encarga de crear la imagen. Sin embargo, su diferenciador principal frente a la competencia radica en la calidad y consistencia de los resultados, que logran mantener un estilo, personaje u objeto a lo largo de múltiples ediciones, algo que anteriormente representaba un desafío para estos sistemas.

Un plátano en el camino de OpenAI

Actualmente, OpenAI lidera el sector de la generación de imágenes con inteligencia artificial, pero Google está decidido a reducir esta brecha con su nuevo modelo de edición visual. Este ha generado un gran revuelo en las redes sociales, no solo por su curioso nombre “Nano Banana” que circuló en plataformas especializadas como LMArena, sino también por demostrar que es un producto que supera las capacidades de sus competidores, apoyándose en “el conocimiento del mundo” que ofrece Gemini. Esto implica que no solo se limita a editar según instrucciones, sino que también comprende el contexto de las solicitudes.

Google ha señalado que \»un reto fundamental en la generación de imágenes es mantener la apariencia de un personaje u objeto en múltiples indicaciones y ediciones\». Esto hace referencia a las distorsiones comunes en generaciones pasadas, que no son tan antiguas (hace poco más de un año se veían manos con seis dedos). “Ahora puedes colocar el mismo personaje en diferentes entornos, mostrar un mismo producto desde múltiples ángulos en nuevos escenarios o generar recursos de marca consistentes, todo ello conservando el tema”, añade la compañía en un comunicado.

Avances significativos en edición visual

La evolución de la inteligencia artificial en la generación de imágenes ha sido notable, y Gemini 2.5 Flash Image se posiciona como un avance significativo en esta área. La capacidad de mantener la coherencia visual a través de diversas ediciones permite a los usuarios crear contenido más dinámico y atractivo, lo que puede ser especialmente útil en campos como el marketing y la publicidad. La herramienta promete transformar la manera en que se producen imágenes, facilitando la labor de los creativos y brindando resultados de alta calidad.

Con la llegada de este nuevo modelo, Google no solo busca competir con OpenAI, sino también establecer un nuevo estándar en la generación de imágenes mediante inteligencia artificial. La combinación de su tecnología avanzada y la comprensión contextual de Gemini podría redefinir las expectativas en el ámbito de la creación visual, abriendo nuevas posibilidades para los usuarios y profesionales del diseño.