¿Qué es nuevo?
- Un rango estilístico mucho más amplio y una solicitud más receptiva.
- Una calidad de imagen mucho más alta (aumento de resolución de 2x) y un rango dinámico mejorado.
- Imágenes más detalladas.
- Es más probable que los detalles sean correctos.
- Menos texto no deseado.
- Mejora del rendimiento con la solicitud de imágenes.
- Soporte para el argumento –tile para el mosaico sin problemas (experimental).
- Soporte para las relaciones de aspecto –ar mayores de 2:1 (experimental).
- Soporte para –iw para pesar las solicitudes de imagen frente a las solicitudes de texto.
Estilos perfeccionados
El rango estético de Midjourney v5 es mayor y comprende con mayor precisión las solicitudes del usuario. En los últimos años, ha aumentado la importancia de mencionar el nombre del artista o movimiento. Si no se especifica un estilo, la red neuronal usará su configuración predeterminada para crear una salida fotorrealista. Calidad: Ahora hay el doble de resolución y un rango dinámico más amplio. Ahora se pueden crear imágenes de alta calidad al instante. En la versión 4, la solicitud se procesaba mientras el usuario esperaba que cada imagen fuera escalada a mano. A partir de ahora, al hacer clic en el botón Ampliar se cargará inmediatamente una versión más grande de la imagen. Detalle: Cuando se trata de pequeños detalles, la red neuronal sobresale. Por lo tanto, crea cinco dedos en cada mano y no agrega cientos de dientes. Los desarrolladores también afirman haber mejorado «drásticamente» el detalle facial. Esta nueva edición de Midjourney permitirá a los usuarios crear imágenes fotorrealistas, lo que puede confundir la capacidad de más de una persona para distinguir la realidad de la simulación. Hemos recorrido un largo camino en solo unos meses con Midjourney v4, y ahora podemos encontrar imágenes con un mayor nivel de detalle gráfico de lo que nunca hubiéramos anticipado.
Mejoras sustanciales
Con todas las noticias recientes sobre ChatGPT y otros grandes modelos de lenguaje, es fácil olvidar que sus primos: los generadores de imágenes por IA, todavía están mejorando. Uno de ellos puede haber descubierto cómo renderizar ojos y manos sin hacer que el sujeto parezca algo de una pesadilla. Sin embargo, los resultados todavía incomodan a algunas personas.
A principios de esta semana, el laboratorio de investigación Midjourney lanzó una versión beta para la versión 5 de su software de imágenes por IA de nombre homónimo. Según su anuncio a través de Twitter, la última versión agrega una mayor calidad de imagen, resultados más «diversos», una gama más amplia de estilos, texturas sin costuras y mucho más.


Los usuarios ya han publicado cientos de resultados impresionantes, y los sentimientos sobre las mejoras son mixtos. La mayoría está impresionada porque la IA de imágenes ha luchado para producir aspectos como sombras, reflejos, ojos y manos. A continuación, presentamos una imagen que creamos con Dall-E de OpenAI como ejemplo de donde la máquina tiene problemas.
La composición es algo incorrecta, y la sensación general es caricaturesca. La iluminación es totalmente incorrecta. Los ojos y las manos están mal deformados. Las piernas están llenas de artefactos, al igual que el recipiente de palomitas de maíz y el asiento junto al sujeto. Este resultado es uno de cuatro con problemas similares en diferentes grados.
La versión 5 de Midjourney parece haber mejorado en este aspecto, al menos a partir de los ejemplos que otros han compartido. Los resultados de simples indicaciones bordean el valle inquietante: lo suficientemente realistas como para pasar como fotos profesionales en muchos casos, pero aún con esa extraña calidad que no se puede definir. Aunque son increíblemente realistas, muchos han descrito las imágenes como espeluznantes.


Nuestro propio dijo: «Para ser honesto, me da más miedo que impresión» después de ver una serie de fotos de Midjourney V5 casi perfectas. El miedo es que alguien podría crear fácilmente una imagen falsa y hacerla pasar como auténtica.
Aparte del factor de incomodidad, comparado con la V4, la V5 de Midjourney ha mejorado dramáticamente la calidad. La diseñadora gráfica Julie Wieland ha usado Midjourney V4 (lanzado en noviembre pasado) durante algún tiempo y dice que la versión 5 tiene texturas de piel «increíblemente realistas». Los efectos de iluminación también son mucho mejores, incluyendo reflejos, brillos y sombras. Quizás lo más importante, la IA genera manos y ojos que parecen naturales la mayor parte del tiempo.


La diseñadora gráfica Julie Wieland ha expresado su satisfacción con la última versión del software de imágenes AI de Midjourney. Según Wieland, «los ojos son casi perfectos y ya no están deformados. Las manos son correctas la mayor parte del tiempo, con cinco dedos en lugar de 7-10 en una mano». Para ella, la versión 5 del software es como finalmente usar anteojos después de ignorar la mala vista durante demasiado tiempo. De repente, puedes ver todo en 4k; se siente abrumador pero también asombroso.
Midjourney también ha mejorado la resolución nativa de 512x512px a 1024x1024px, alineándola con Dall-E. Sin embargo, la versión 4 podía sobremuestrear para duplicar la resolución nativa. No es irrazonable esperar que la versión 5 use la misma técnica para producir imágenes de 2048x2048px, pero esto será para una actualización más adelante.


Es importante destacar que MidJourney solo ingresó a la escena de la inteligencia artificial hace un año. Muchas (no todas) de las imágenes que están inundando las redes sociales esta semana son sin editar. Anteriormente, Weiland utilizaba una combinación de técnicas para mejorar la calidad visual de Midjourney 4, incluyendo «outpainting» con Dall-E y retoques en Photoshop. La versión 5 promete menos edición posterior a la generación de las imágenes y quizás fotos perfectas en un futuro próximo. Esta posibilidad es emocionante pero también aterradora.