En el mercado podemos encontrar un gran número de opciones a la hora de crear imágenes mediante Inteligencia Artificial. Sin embargo, las más populares son las de OpenAI, con ChatGPT Images y la de Google con Nano Banana.
Si no tienes la necesidad de utilizar la Inteligencia Artificial para generar imágenes, y no sabes cuál es mejor, ya te decimos nosotros y los rankings que analizan su rendimiento y precisión que Nano Banana de Google siempre ha estado muy por delante de ChatGPT Images.
Si bien es cierto que Google llegó tarde a la carrera de la IA, cuando lo hizo, superó a todos sus rivales por la derecha, incluyendo a todos los productos de OpenAI quien la popularizó a finales de 2022 con ChatGPT.
ChatGPT Image 2.0: el santo al razonamiento visual
Desde OpenAI se han dado cuenta que Google está haciendo un muy bien trabajo con su IA en todos los apartados, tanto a la hora de generar texto, como en la creación de imágenes e incluso en la generación de vídeos. Recordemos que la empresa de Sam Altman tiró la toalla con Sora, su IA para generar vídeos hace unas semanas.
Con el lanzamiento de ChatGPT Image 2.0, OpenAI se enfrenta directamente a Nano Banana 2 de Google (también conocido como Gemini 3.1 Flash Image). Esta nueva versión quiere suponer un antes y un después en la creación de imágenes mediante un proceso simple de traducción de texto a imagen (Images 2.0 Instant) y otro más completo que aplica razonamiento profundo (Images 2.0 Thinking).
La característica más llamativa de esta nueva versión de ChatGPT para crear imágenes, es la introducción de un paso de razonamiento previo a la creación. A diferencia de las versiones anteriores que interpretaban el prompt de forma literal y rápida, la versión 2.0 se detiene a «pensar» en la estructura de la imagen.
Según afirman desde OpenAI, este proceso permite que el modelo entienda composiciones complejas. Si, por ejemplo, un usuario solicita un diseño técnico o una interfaz de usuario (UI) con elementos específicos en coordenadas precisas, el sistema ya no se limita a distribuir los elementos por la imagen de forma aleatoria, construye la imagen basándose en una comprensión lógica de la disposición espacial.

