Stable Diffusion 3.5
Todo lo que necesita saber para comprender y utilizar Stable Diffusion 3.5
Stable Diffusion 3.5 es la última versión de las plantillas de generación de imágenes desarrolladas por Stability AI, lo que supone un bienvenido regreso de la empresa pionera en IA de código abierto.
Este conjunto de plantillas optimizadas destaca por su pronta fidelidad y personalización, y ofrece un rendimiento de primer nivel tanto en infraestructuras de hardware profesionales como de consumo.
Fiel a su filosofía de accesibilidad, stable Diffusion 3.5 se comparte con una licencia comunitaria que permite su uso gratuito para la investigación y las pequeñas empresas.
¿Qué es Stable Diffusion 3.5?
Stable Diffusion 3.5 es la nueva generación de modelos de IA texto-imagen lanzada por Stability AI el 22 de octubre de 2024. No se trata de un único modelo, sino de una familia de varios modelos diseñados para diferentes necesidades.
Estos nuevos modelos son más personalizables, potentes y versátiles que sus predecesores.
Destacan en la creación de imágenes diversas que representan mejor la variedad del mundo real, sin necesidad de indicaciones detalladas. Además, son capaces de generar una amplia gama de estilos artísticos, desde la fotografía al arte en 3D.
¿Cómo se utiliza Stable Diffusion 3.5?
Para probar y utilizar SD3 directamente en línea, puede utilizar la demo fal.ai o la demo Replicate.
Si desea instalar y utilizar Stable Diffusion 3.5 en su equipo, puede utilizar ComfyUI, que ofrece Worflows de ejemplo:
- Actualizar ComfyUI
- Descarga Stable Diffusion 3.5 Large o Stable Diffusion 3.5 Large Turbo en tu carpeta models/checkpoint.
- Descarga clip_g .safetensors, clip_l.safetensors, y t5xxl_fp16.safetensors a tu carpeta models/clip.
- Arrastra el flujo de trabajo a ComfyUI y ¡genera imágenes!
Imágenes creadas con Stable Diffusion 3.5
Estos son algunos ejemplos de imágenes generadas con Stable Diffusion 3.5
Stable Diffusion 3.5 en detalle
Los distintos modelos
- Stable Diffusion 3.5 Large: se trata de un modelo de 8.000 millones de parámetros que destaca por su rápida adherencia y su producción de imágenes de alta calidad, lo que lo hace idóneo para usuarios profesionales. Con una resolución de imagen de hasta 1 megapíxel, es ideal para crear imágenes vívidas y activos digitales para campañas de marketing y casos de uso corporativo similares.
- Stable Diffusion 3.5 Large Turbo: Se trata de una versión destilada del modelo Large que produce rápidamente imágenes de alta calidad en sólo cuatro pasos, reduciendo considerablemente el número de pasos sin comprometer la calidad de la imagen. Por tanto, es muy eficaz para flujos de trabajo de generación rápida.
- Stable Diffusion 3.5 Medium: Esta versión sólo tiene 2.500 millones de parámetros, pero con su arquitectura MMDiT-X y sus métodos de aprendizaje mejorados, puede producir eficazmente imágenes con una resolución de entre 0,25 y 2 megapíxeles, y está diseñada para funcionar «lista para usar» en hardware de consumo, al tiempo que ofrece un buen equilibrio entre calidad de imagen, velocidad de generación y facilidad de personalización.
Les Forces de SD 3.5
Stable Diffusion 3.5 Large aporta una serie de mejoras técnicas a la generación de imágenes de IA, gracias a su arquitectura de 8.000 millones de parámetros.
Calidad de imagen superior
Produce imágenes de 1 megapíxel de calidad excepcional, superando a los modelos anteriores de Stable Diffusion
Mejor cumplimiento de las instrucciones
El modelo interpreta las instrucciones complejas con mayor precisión.
Rendimiento
eficiente Está optimizado para funcionar en hardware de consumo estándar.
Estilos versátiles
Capaz de producir una amplia gama de estilos visuales, desde 3D y fotografía hasta pintura y arte abstracto.
Diversidad y adaptación
Genera imágenes representativas del mundo real, con diferentes estilos, colores de piel y rasgos, sin necesidad de extensas indicaciones.
Licencias y derechos de uso
Stability AI ha publicado Stable Diffusion 3.5 bajo su nueva licencia comunitaria, más permisiva que la versión anterior.
Esta licencia permite el uso libre en dos casos principales:
- Para investigación y uso no comercial.
- Para uso comercial por parte de particulares o empresas con una facturación anual inferior a 1 millón de dólares.
La licencia se aplica sin restricción al número de imágenes o soportes generados utilizando Diffusion 3.5 estable.
Los usuarios también conservan la propiedad de los soportes que generen con las plantillas, sin implicaciones restrictivas en materia de licencias.
Para organizaciones con una facturación anual superior a un millón de dólares, se requiere una licencia Enterprise de pago para uso comercial, que debe solicitarse y negociarse con Stability AI.
Stability AI también fomenta la creación, distribución y monetización de obras derivadas (ajustes, LoRA, optimizaciones, aplicaciones,...), siempre que los usuarios proporcionen una copia de la licencia comunitaria y muestren de forma destacada «Powered by Stability AI» en las interfaces o documentación asociadas.
Este nuevo enfoque de la concesión de licencias se ha diseñado para apoyar a la comunidad de código abierto, al tiempo que permite a Stability AI monetizar el uso de sus modelos por parte de grandes empresas.