La nueva versión beta de Stable Diffusion XL

Do not index

canonical-url

Publish

Flag

🔥

23/06/2023 Lanzamiento de la versión estable de Diffusion XL 0.9

Stability AI ha puesto fin a la fase de pruebas beta y ha anunciado una nueva versión: SDXL 0.9. Esta versión se ha beneficiado de dos meses de pruebas y comentarios de la comunidad, y ofrece una serie de mejoras.

→ Clc AQUÍ para obtener más detalles sobre esta nueva versión

En el mundo de la inteligencia artificial y la generación de imágenes se está produciendo una revolución. Stable Diffusion XL, la última versión del modelo OpenSource, ofrece mejoras significativas con respecto a sus predecesores y podría incluso rivalizar con productos comerciales como Midjourney.

Sumerjámonos en este fascinante mundo para descubrir los últimos avances y el futuro de esta tecnología en rápida expansión.

Mejoras notables en Stable Diffusion XL

Calidad y fotografía

Lo primero que se nota en Stable Diffusion XL es la calidad superior de las imágenes que genera. En comparación con la versión 2.1, la nueva versión ofrece imágenes mucho más estéticas y fotorrealistas. Este avance tecnológico bien podría cambiar las reglas del juego en la industria de la generación de imágenes.

Generar texto en imágenes

Una de las novedades de Stable Diffusion XL es la posibilidad de generar texto sobre imágenes. Aunque los resultados no siempre son perfectos, Stability AI es el primer modelo de IA generativa que ofrece esta funcionalidad, lo que significa que las imágenes generadas son más expresivas y ricas.

Disponibilidad de la versión beta

Los más impacientes ya pueden probar la versión beta de Stable Diffusion XL a través de la interfaz web de DreamStudio o Clipdrop Y para los desarrolladores, no se preocupen: el código fuente se publicará en GitHub una vez finalizado el desarrollo

DreamStudio ofrece una prueba gratuita limitada, tras la cual tendrás que recargar tu cuenta: 5.000 generaciones de imágenes cuestan unos 10 dólares (lo que sigue siendo barato).

Posibles aplicaciones de Stable Diffusion XL

Industrias afectadas

Stable Diffusion XL tiene el potencial de transformar muchos sectores, incluidos el diseño gráfico y la arquitectura, y como señala Tom Mason, CTO de Stability AI, las capacidades de generación de imágenes de SDXL son impresionantes y podrían tener un gran impacto en estas industrias.

Comparación con Midjourney

Frente a la competencia de Midjourney v5, Stable Diffusion XL aguanta el tipo. El rendimiento de ambos modelos es comparable en determinados escenarios, y hay que tener en cuenta los puntos fuertes respectivos de cada uno. ¡La carrera por la mejor IA de generación de imágenes está en marcha!

Novedades en Stable Diffusion XL

Aumento del número de parámetros

Con 2.300 millones de paramecios, frente a los 900 millones de la versión 2.1, Stable Diffusion XL ha aumentado considerablemente su tamaño. También estan preparando una versión destilada para ofrecer una alternativa a los usuarios.

80 millones de imágenes retiradas para la versión 3

La versión 3 de Stable Diffusion XL se perfila como aún más prometedora, destacando la eliminación de 80 millones de imágenes a petición de los artistas. Este cambio demuestra la continua evolución del modelo y su capacidad para adaptarse a las preocupaciones éticas y las necesidades de los usuarios.

Límites y perspectivas

Máxima resolución y problemas persistentes

A pesar de estos avances, la resolución máxima de 512 x 512 píxeles sigue siendo la misma y persisten algunos retos, como la representación de los dedos y los pies en las imágenes generadas. Sin embargo, estas limitaciones no deben ensombrecer los progresos realizados.

Funciones Inpainting y Outpainting

Además de generar texto sobre imágenes, Stable Diffusion XL también es capaz de generar imágenes a partir de otras imágenes, y ofrece las funciones de entintado y despigmentado conocidas de DALL-E 2 (Inpainting y Outpainting). Sin embargo, estas funciones siguen estando limitadas a una resolución máxima de 512 x 512 píxeles, como en los modelos anteriores.

La visión del CEO de Stability AI sobre el futuro de la generación de imágenes por IA

Emad Mostaque, CEO de Stability AI, es optimista sobre el futuro de la generación de imágenes mediante AI. En una sesión de preguntas y respuestas en el servidor oficial Discord poco después del anuncio de SDXL, afirmó que la generación de imágenes mediante AI estaba casi terminada, y que para finales de año espera estar generando imágenes "precisas en píxeles" que no se distinguirán de las fotos reales.

Esta visión pone de relieve la rápida evolución de esta tecnología y las oportunidades que ofrecerá en los próximos años a diversas industrias, como el diseño gráfico y la arquitectura.

Apertura de la beta para Stable Diffusion XL