Table of Contents
- Mejoras notables en Stable Diffusion XL
- Calidad y fotografía
- Generar texto en imágenes
- Disponibilidad de la versión beta
- Posibles aplicaciones de Stable Diffusion XL
- Industrias afectadas
- Comparación con Midjourney
- Novedades en Stable Diffusion XL
- Aumento del número de parámetros
- 80 millones de imágenes retiradas para la versión 3
- Límites y perspectivas
- Máxima resolución y problemas persistentes
- Funciones Inpainting y Outpainting
- La visión del CEO de Stability AI sobre el futuro de la generación de imágenes por IA
Do not index
Do not index
canonical-url
Publish
Publish
23/06/2023 Lanzamiento de la versión estable de Diffusion XL 0.9
Stability AI ha puesto fin a la fase de pruebas beta y ha anunciado una nueva versión: SDXL 0.9. Esta versión se ha beneficiado de dos meses de pruebas y comentarios de la comunidad, y ofrece una serie de mejoras.
En el mundo de la inteligencia artificial y la generación de imágenes se está produciendo una revolución. Stable Diffusion XL, la última versión del modelo OpenSource, ofrece mejoras significativas con respecto a sus predecesores y podría incluso rivalizar con productos comerciales como Midjourney.
Sumerjámonos en este fascinante mundo para descubrir los últimos avances y el futuro de esta tecnología en rápida expansión.
Mejoras notables en Stable Diffusion XL
Calidad y fotografía
Lo primero que se nota en Stable Diffusion XL es la calidad superior de las imágenes que genera. En comparación con la versión 2.1, la nueva versión ofrece imágenes mucho más estéticas y fotorrealistas. Este avance tecnológico bien podría cambiar las reglas del juego en la industria de la generación de imágenes.
Generar texto en imágenes
Una de las novedades de Stable Diffusion XL es la posibilidad de generar texto sobre imágenes. Aunque los resultados no siempre son perfectos, Stability AI es el primer modelo de IA generativa que ofrece esta funcionalidad, lo que significa que las imágenes generadas son más expresivas y ricas.
Disponibilidad de la versión beta
Los más impacientes ya pueden probar la versión beta de Stable Diffusion XL a través de la interfaz web de DreamStudio o Clipdrop Y para los desarrolladores, no se preocupen: el código fuente se publicará en GitHub una vez finalizado el desarrollo
DreamStudio ofrece una prueba gratuita limitada, tras la cual tendrás que recargar tu cuenta: 5.000 generaciones de imágenes cuestan unos 10 dólares (lo que sigue siendo barato).
Posibles aplicaciones de Stable Diffusion XL
Industrias afectadas
Stable Diffusion XL tiene el potencial de transformar muchos sectores, incluidos el diseño gráfico y la arquitectura, y como señala Tom Mason, CTO de Stability AI, las capacidades de generación de imágenes de SDXL son impresionantes y podrían tener un gran impacto en estas industrias.
Comparación con Midjourney
Frente a la competencia de Midjourney v5, Stable Diffusion XL aguanta el tipo. El rendimiento de ambos modelos es comparable en determinados escenarios, y hay que tener en cuenta los puntos fuertes respectivos de cada uno. ¡La carrera por la mejor IA de generación de imágenes está en marcha!
Novedades en Stable Diffusion XL
Aumento del número de parámetros
Con 2.300 millones de paramecios, frente a los 900 millones de la versión 2.1, Stable Diffusion XL ha aumentado considerablemente su tamaño. También estan preparando una versión destilada para ofrecer una alternativa a los usuarios.
80 millones de imágenes retiradas para la versión 3
La versión 3 de Stable Diffusion XL se perfila como aún más prometedora, destacando la eliminación de 80 millones de imágenes a petición de los artistas. Este cambio demuestra la continua evolución del modelo y su capacidad para adaptarse a las preocupaciones éticas y las necesidades de los usuarios.
Límites y perspectivas
Máxima resolución y problemas persistentes
A pesar de estos avances, la resolución máxima de 512 x 512 píxeles sigue siendo la misma y persisten algunos retos, como la representación de los dedos y los pies en las imágenes generadas. Sin embargo, estas limitaciones no deben ensombrecer los progresos realizados.
Funciones Inpainting y Outpainting
Además de generar texto sobre imágenes, Stable Diffusion XL también es capaz de generar imágenes a partir de otras imágenes, y ofrece las funciones de entintado y despigmentado conocidas de DALL-E 2 (Inpainting y Outpainting). Sin embargo, estas funciones siguen estando limitadas a una resolución máxima de 512 x 512 píxeles, como en los modelos anteriores.
La visión del CEO de Stability AI sobre el futuro de la generación de imágenes por IA
Emad Mostaque, CEO de Stability AI, es optimista sobre el futuro de la generación de imágenes mediante AI. En una sesión de preguntas y respuestas en el servidor oficial Discord poco después del anuncio de SDXL, afirmó que la generación de imágenes mediante AI estaba casi terminada, y que para finales de año espera estar generando imágenes "precisas en píxeles" que no se distinguirán de las fotos reales.
Esta visión pone de relieve la rápida evolución de esta tecnología y las oportunidades que ofrecerá en los próximos años a diversas industrias, como el diseño gráfico y la arquitectura.
Written by