Automatic1111, el manual completo

Aprenda a utilizar la interfaz gráfica más popular de Stable Diffusion

Automatic1111, el manual completo
Do not index
Do not index
canonical-url
Publish
Publish
Stabe Diffusion webui, más conocida como AUTOMATIC1111 o simplemente A1111, es la interfaz gráfica preferida por los usuarios avanzados de Stable Diffusion.
Es en esta plataforma donde suelen añadirse primero las nuevas funciones, gracias al compromiso inquebrantable de la comunidad de código abierto que respalda el proyecto.
Pero para los principiantes, AUTOMATIC1111 no siempre es fácil de usar. Su documentación sólo está disponible en inglés y a veces deja bastante que desear, y la multitud de funciones que ofrece la interfaz puede hacerla fácilmente confusa.
Esta guía tiene por objeto ayudarle a familiarizarse con la interfaz gráfica del AUTOMATIC1111. Pretende servir de tutorial, con numerosos ejemplos para ilustrar la utilidad o el funcionamiento de un parámetro.
No dude en marcarlo como favorito y utilizarlo también como manual de referencia: hojéelo, descubra lo que le ofrece y vuelva a él en cuanto lo necesite para explotar una función concreta.
📌
Si ya está familiarizado con la interfaz de Automatic1111 y desea aprender a utilizarla con la última versión de Stable Diffusion, también puede leer nuestro artículo sobre Stable Diffusion XL en Automatic1111

Descargar e instalar Automatic1111

Al igual que la propia Stable Diffusion, la interfaz de Automatic1111 se distribuye como código abierto y se comparte gratuitamente. La aplicación está disponible en github AUTOMATIC1111/stable-diffusion-webui y puede instalarse en Windows, Mac o incluso en máquinas virtuales como los blocs de notas de Google Colab. Sigue nuestros tutoriales de instalación para saber cómo instalarla según tus necesidades:
También puede utilizar versiones alojadas de Stable Diffusion con la interfaz web de Automatic. GRAVITY Diffus y RunDiffusion son dos soluciones populares de este tipo
notion image
La interfaz de Automatic1111 es tu puerta de entrada a la creación artística con IA. Aunque a primera vista la multitud de pestañas y opciones puede parecer intimidante, descubrirás rápidamente que cada elemento ha sido diseñado para que tu experiencia creativa sea más fluida y rica gracias a la inteligencia artificial.

1️⃣ La pestaña de texto a imagen

La pestaña txt2img (abreviatura de texto a imagen) es el punto de entrada a la interfaz y su punto de partida para generar imágenes con Stable Diffusion. Aquí es donde puede transformar una descripción de texto, el prompt una imagen visualmente compleja
Nada más abrir la interfaz, aparecerá esta pestaña:
notion image
Aquí puede seleccionar un modelo de Stable Diffusion (checkpoint), que actúa como "cerebro" de la IA, y que está almacenado en la carpeta models/Stable-Diffusion de su instalación. Si añade un nuevo modelo a esta carpeta, basta con pulsar el botón de actualización situado junto al menú desplegable para que se actualice la lista de modelos disponibles
El prompt es la descripción de la imagen que se quiere generar. Por ejemplo, puede utilizar como prompt la descripción 'un cuadro surrealista de un gato de Salvador Dalí' y la IA creará una imagen basada en esta descripción. También se puede especificar la anchura y la altura de la imagen, y el número de imágenes a generar
Ahora vamos a explorar en detalle todos los aspectos de esta pestaña de text-to-image, incluidos los parámetros de generación de imágenes, las opciones de aviso y las funciones
Aunque la interfaz se ha diseñado para que sea lo más intuitiva posible, el uso de la pestaña text-to-image requiere una cierta comprensión de los conceptos técnicos de la IA y la generación de imágenes. Intentaremos explicarle estos conceptos al mismo tiempo que utiliza Automatic1111

Uso básico

La pestaña conversión de texto a imagen de Automatic1111 ofrece una variedad de opciones que ajustar para crear imágenes a partir de texto. Cada una de estas opciones juega un papel específico en la forma en que se genera la imagen. Exploremos primero las opciones principales que necesitarás para generar tu primera imagen

Stable Diffusion Checkpoint

Situada en la parte superior izquierda de la pantalla, la opción Stable Diffusion Checkpoint le permite seleccionar el modelo que desea utilizar para la generación de imágenes. Se trata esencialmente de la "base de datos" y el "cerebro" de la IA. Diferentes modelos producirán imágenes de manera diferente y sabrán cosas diferentes. Si añade un nuevo modelo y no lo ve en la lista desplegable, puede utilizar el botón de refresh 🔃 para actualizar la lista
notion image
📌
Descubrir los modelos de Stable Diffusion: ¿qué son? ¿cómo se utilizan? ¿dónde encontrarlos?

Escribir prompts

Escribir prompts, tanto positivas como negativas, es una etapa crucial en el proceso de generación de imágenes.
Prompt: El campo Prompt el espacio para expresar tus ideas. Aquí es donde describes la imagen que quieres crear. El algoritmo de Stable Diffusion utiliza esta descripción para intentar producir una imagen que sea fiel a tu descripción, gracias a sus avanzadas capacidades de aprendizaje y reconocimiento de patrones
Prompt Negativo : El campo Negative Prompt es una herramienta adicional que afina el proceso de generación de su imagen. Aquí puede especificar lo que no desea en absoluto que aparezca en su imagen. Esto ofrece un mayor control y precisión sobre el resultado, permitiéndole evitar elementos no deseados en la imagen producida
Puedes escribir tus indicaciones en inglés natural o como una lista de etiquetas. El orden de las palabras en tu indicación es importante porque las palabras colocadas en primer lugar reciben automáticamente más énfasis. También puedes aumentar el énfasis en ciertas palabras o frases colocándolas entre paréntesis, o disminuirlo colocándolas entre corchetes.
notion image
📌
Para saber más sobre comoe escribir tus prompts, lea nuestros artículos sobre el Prompt Engineering

Tamaño de la imagen

El tamaño de las imágenes generadas, controlado por los parámetros width (anchura) y height (altura), tiene un impacto significativo en el resultado final
Algunos tamaños de imagen dan mejores resultados que otros porque se acercan más a los tamaños de imagen utilizados para los modelos de entrenamiento: 512x512 para la versión 1.5, 768x768 para la 2.1 y 1024x1024 para SDXL. (→ ver todos los formatos de imagen recomendados para SDXL)
Un mayor tamaño de imagen también requiere más memoria VRAM.
La doble flecha ⇅ invierte el valor para cambiar la orientación de la imagen (paisaje/horizontal o retrato/vertical).
notion image

Batch size et Batch count

La opción Batch size determina el número de imágenes que se generarán cada vez. Un valor más alto permite generar varias imágenes a la vez, lo que puede ser útil para probar diferentes avisos o parámetros. Sin embargo, tenga en cuenta que aumentar el tamaño del lote puede incrementar el consumo de VRAM.
El Batch count determina el número de veces que se ejecuta todo el proceso de generación de imágenes.
Generalmente, querrá cambiar el tamaño del lote porque es más rápido. Sólodebería necesitar utilizar Batch count si tiene problemas de memoria.
Una vez configuradas estas primeras opciones y escrito su prompt, pulse el botón el botón Generate: tras un breve retardo, su imagen estará lista (o sus imágenes si ha aumentado el lote). Una barra de progreso le permitirá seguir su generación y Automatic1111 mostrará también los renderizados intermedios
notion image
Si el lote contiene varias imágenes, también obtendrá una imagen adicional de miniaturas compuestas.
Para guardar una imagen en su almacenamiento local, primero seleccione la imagen haciendo clic en su miniatura en el marco derecho y, a continuación, haga clic en el botón 💾 Save
También puedes hacer clic con el botón derecho en la imagen para mostrar el menú contextual, que te permite guardar o copiar la imagen.
 
notion image
Todas las imágenes creadas con Automatic1111 también se guardan automáticamente en su disco duro, en el directorio /output de su instalación
Directorios e imágenes creados automáticamente en /outputs por Automatic1111
Directorios e imágenes creados automáticamente en /outputs por Automatic1111

Parámetros de generación de imágenes

Hay muchos otros parámetros disponibles en la pestaña txt2img - veamos cuáles son y cómo utilizarlos.
notion image

1. Sampling Steps

La opción Sampling Steps es crucial para determinar el esfuerzo que la IA dedicará a crear la imagen. Cada step (paso) corresponde a una pasada o "borrador" que la IA realiza para mejorar progresivamente la imagen de acuerdo con sus indicaciones. Muy pocos pasos darán como resultado una imagen borrosa, mientras que demasiados pasos pueden no proporcionar mucha mejora y aumentarán el tiempo necesario para generar la imagen. Un buen punto de partida suele ser 20 pasos

2. Sampling Method

El Sampling Method determina esencialmente el algoritmo utilizado por la IA para crear la imagen. Los distintos métodos pueden producir imágenes coherentes con un número diferente de pasos, y lo hacen de forma diferente. Los métodos Euler A, LMS o DPM++ 2M Karras suelen ser buenas opciones

3. CFG Scale

La Escala CFG es un parámetro que controla el equilibrio entre la "creatividad" de la IA y el respeto a tus indicaciones
Una CFG baja permite a la IA ignorar tus indicaciones y crear lo que quiera, mientras que una CFG alta le dice que siga tus instrucciones más estrictamente. Una CFG de 7 u 8 suele ser un buen punto de partida.
📌
Para entender mejor este parámetro y cómo utilizarlo para generar tus imágenes ,consulta nuestra guía Escala CFG

4. Seed

La Seed es un valor único que determina el contenido de la imagen generada. Si deja este valor en -1, lo que significa "seed aleatoria", obtendrá una imagen nueva y diferente cada vez - pero si utiliza un valor fijo y usa exactamente los mismos parámetros, obtendrá la misma imagen
El uso de una semilla fija le permite probar la influencia de una palabra clave en el prompt o en otra configuración comparando imágenes.
El botón Reciclar ♻️ situado a la derecha del campo Seed recupera automáticamente la Sedd de la última imagen generada.
También puede encontrar la Seed de una imagen generada en la metainformación de generación que aparece debajo de la imagen cuando la selecciona en la parte derecha de la pantalla:
notion image

5. Opciones adicionales de Seed

Existen opciones adicionales para Seed : Variation seed e Variation strength. Variation seed es un valor de seed adicional que puede utilizar, mientras que la Variation strength determina el grado de interpolación entre seed y seed de variación. Juntas, estas opciones le permiten crear variaciones que se aproximan a una imagen de partida.
La opción Resize seed from width/heigh es útil cuando desea redimensionar su imagen sin cambiar su contenido. Esta opción intenta mantener el contenido de la imagen al redimensionarla. Debe introducir el nuevo tamaño en las opciones principales de anchura y altura, y la anchura y altura de la imagen original en las opciones correspondientes Resize seed from. A continuación, introduzca la Seed original en el campo y establezca una Variation strength de 0.

Funciones adicionales

En esta sección, exploraremos las opciones avanzadas disponibles por defecto en la pestaña txt2img. Estas dos opciones se encuentran bajo la opción Método de muestreo y el control deslizante Pasos de muestreo :
notion image

Hires. Fix - Alta resolución

Esta opción aplica un upscaling automático a la imagen generada, una técnica utilizada para aumentar la resolución de una imagen sin sacrificar su calidad
Esta opción es especialmente importante con los modelos Stable Diffusion 1.5, ya que están optimizados para imágenes de baja resolución (512x512). Activa la Hires Fix, podrá aumentar la resolución final mediante varios parámetros. Si deja los valores predeterminados, se duplicarán las dimensiones de la imagen
notion image

Refinador

Esta función le permite utilizar un segundo Checkpoint que ocupará el lugar del elegido como Stable Diffusion checkpoint al final de la generación de la imagen
notion image
Esta función resulta especialmente útil cuando se utiliza el modelo complementario SDXL Refiner, diseñado para mejorar las imágenes generadas con el modelo base SDXL con más detalles finos.
Para utilizarlo, elija un punto decontrol (como el sd_xl_refiner) y elija el momento en el que debe tomar el lugar del checkpoint. Este momento se expresa en % del número de pasos (steps) definidos para la generación. El valor por defecto de 0,8 significa que para una generación con 30 pasos el Refiner Checkpoint se utilizará para los 6 últimos (30 - (0,8x30) = 30 - 24 = 6)

Los botones

En la parte superior derecha de la interfaz hay varios botones. El principal es, obviamente, el botón Generate, que inicia la generación de imágenes, pero los demás también son interesantes y útiles de conocer.

↙️ Parámetros de lectura

El botón Read the parameters rellenará todos los campos y configurará los parámetros de generación basándose en los de una imagen generada previamente (incluida la Seed).
Puede utilizarse de dos formas distintas:
  • Cuando el campo prompt está vacío, utiliza los parámetros de la última generación.
  • Cuando se rellena el campo prompt, lo interpreta y aplica los parámetros. Esta opción se puede utilizar, por ejemplo, para utilizar todos los parámetros de una imagen en Civitai.com con el botón Copy Generation Data”. También se puede utilizar para recuperar los parámetros de una imagen generada con Automatic1111 arrastrándola al campo prompt - que lo rellena con los datos de la imagen.

🗑️ Cesta

Este botón simplemente borra la consulta actual y la consulta negativa con un solo clic.
Tenga en cuenta que no se pone a 0 y no borra los demás parámetros.

Interrupt y Skip

Estos botones sustituyen al botón Generate durante la generación de imágenes.
Interrupt interrumpe todo el procedimiento de generación y devuelve sólo las imágenes ya generadas.
Skip simplemente detiene la generación de la imagen actual y continúa con el resto del lote.

Estilos predefinidos

Debajo de los botones ↙️ y 🗑️ se encuentra el selector de estilos predefinidos, que permite crear y utilizar estilos predefinidos en forma de palabras clave para indicaciones positivas y negativas. Los estilos existentes se muestran en el menú desplegable Styles (por defecto, no hay ninguno)
Elija uno o varios estilos para utilizarlos junto con su mensaje.
El botón 🖊️ situado a la derecha del selector le permite crear o modificar estilos que se añadirán al selector.

Modelos adicionales

Junto a los parámetros de Generation la interfaz dispone de una serie de pestañas para seleccionar plantillas y archivos de modelos o redes adicionales para modificar la generación de imágenes: checkpoints, hypernetworks, LoRA, LyCORIS,
notion image
Estos archivos pueden utilizarse para influir en la generación de imágenes y obtener imágenes con diferentes estilos y renders.

Acciones sobre imágenes

notion image
Una vez generadas las imágenes, puede realizar diversas acciones sobre ellas. Dispone de 6 botones (de izquierda a derecha)
  • 📁 (Open folder) abre la carpeta donde están almacenadas las imágenes
  • 💾 (Save) permite guardar una imagen descargándola. Si utiliza este botón mientras selecciona una cuadrícula de miniaturas, se guardarán todas las imágenes
  • 🗃️ (Save Zip) se utiliza para comprimir imágenes para su descarga
  • 🖼️ (Send to img2img) abre la pestaña img2img, colocando la imagen como imagen de origen
  • 🎨 (Send to inpainting) abre la pestaña img2img en modo inpaiting, colocando la imagen como imagen de origen
  • 📐 (Send to extras) abre la pestaña Extras colocando la imagen como imagen de origen

2️⃣ La pestaña image-to-image

La pestaña img2img (abreviatura de image-to-image) es el segundo componente principal de la interfaz de Automatic1111. Permite realizar una serie de acciones generativas con la IA utilizando una imagen de origen como punto de partida. Las principales acciones son la (re)generación de partes o elementos de una imagen (inpainting) y la transformación de imágenes
notion image

Comparación con la interfaz texto-imagen

A primera vista, la pes img2img se parece mucho a txt2img y algunos de los elementos de la interfaz son exactamente iguales y se utilizan

Modelo (Checkpoint)

El selector Stable Diffusion Checkpoint está siempre presente y permite elegir el modelo que se va a utilizar. De hecho, este elemento es permanente e independiente de la pestaña seleccionada. No cambia al cambiar de pestaña

Prompts y Botones de generación rápida

En la parte superior de la interfaz se encuentran los campos de prompts positivo y negativo y los mismos botones de text-to-image: el botón principal Generate, los 5 botones pequeños y el selector de Styles - Para saber cómo utilizarlos, consulte las explicaciones correspondientes en la primera parte de esta guía.
Aquí hay disponibles dos botones adicionales: Interrogate CLIP e Interrogate DeepBooru para obtener un texto descriptivo de una imagen:
  • Interrogate CLIP utilizará el mismo modelo utilizado para comprender los prompts para generar una descripción de la imagen.
  • Interrogate DeepBooru hace lo mismo, pero utilizando un modelo especializado en imágenes de anime.

Imágenes y acciones

La sección de la derecha, que muestra la(s) imagen(es) generada(s) y sus 6 botones de acción, es también la misma que la pestaña de text-to-image y funciona de la misma manera
La parte izquierda es muy diferente, y contiene la interfaz para las distintas funciones Generation image-to-image organizadas en 6 pestañas secundarias que vamos a revisar a continuación
notion image

img2img

La primera pestaña secundaria tiene el mismo nombre que la pestaña principal - esto a veces hace que las explicaciones sean un poco confusas, ya que hay dos pestañas img2img, pero tiene cierto sentido ya que es la pestaña secundaria seleccionada por defecto. Y también es la dedicada a la generación principal image-to-image: la generación de una imagen basada en otra
👀
Ejemplo de generaciones img2img
una imagen inicial generada mediante texto-a-imagen se pueden crear variaciones simplemente modificando la indicación de partida
Imagen de referencia
Imagen de referencia
Añadiendo ‘blond hair’
Añadiendo ‘blond hair’
Añadiendo “spacesuit”
Añadiendo “spacesuit”

Img2img básico

Veamos cómo utilizar esta pestaña para generar variaciones de una imagen de partida.
Image source
Elija una imagen de origen haciendo clic en el área de imágenes o arrastrando y soltando una imagen. Una vez definida, la imagen se mostrará en esta área.
Los botones Copy To situados justo debajo de la imagen le permiten utilizarla en una de las otras pestañas secundarias de img2img.
Prompts
Aunque el principio generación img2img es partir de una imagen y generar una nueva, puede definir indicaciones (positivas y negativas) que también se tendrán en cuenta e influirán en el resultado final.
Funcionan exactamente como en text-to-image.
Muchos otros parámetros son los mismos que para la generación de texto a imagen y funcionan de la misma manera: Sampling Method & Steps, dimensions (width & height), CFG Scale, Batch Count & Size, Seed,…
Para el tamaño de la imagen, puedes usar el botón 📐Autodetect para adoptar automáticamente las dimensiones de la imagen de origen, pero puedes cambiar las dimensiones si quieres redimensionar la imagen (ver más abajo)
También se dispone funciones adicionales restauración de caras y Tiling para img2img.
Denoising strength
Este parámetro es específico de la generación image-to-image ; de hecho, es uno de los parámetros principales de esta funcionalidad
Cuanto mayor sea su valor, más se desviará la generación de la imagen original: en 0, Stable Diffusion no cambiará nada de la imagen original, mientras que en A 1, la imagen se recreará casi por completo, sin tener en cuenta la fuente.
El valor por defecto de 0,7 es un buen punto de partida, pero puedes probar a variarlo ligeramente para adaptarlo a tus necesidades.
🧪
Experiencias al variar la Denoising strength
Tomemos una imagen inicial de un colibrí y veamos cómo Stable Diffusion la redibujará en un dragón (prompt: "A photorealistic illustration of a dragon”") con diferentes valores de Denoising Strength :
Imagen de referencia
Imagen de referencia
Denoising Strength 0,2
Denoising Strength 0,2
Denoising Strength 0,4
Denoising Strength 0,4
Denoising Strength 0,6
Denoising Strength 0,6
Denoising Strength 0,8
Denoising Strength 0,8
Denoising Strength 1
Denoising Strength 1

Redimensionamiento de imágenes

img2img también dispone de una serie de parámetros para cambiar el tamaño de las imágenes (Resizing).
notion image
Resize mode
Este parámetro indica como Stable Diffusion intentará conciliar las relaciones anchura/altura de la imagen de origen y la imagen que se va a generar cuando no sean idénticas. Veamos cómo modifica cada modo la imagen tomando una imagen rectangular y transformándola en un cuadrado.
Imagen de referencia
Imagen de referencia
Just Resize
Esta opción simplemente redimensiona la imagen para ajustarla a las dimensiones ampliándola o aplanándola.
notion image
Crop en resize
La imagen respetará las dimensiones recortando los bordes para mantener la proporción y luego redimensionando la imagen si es necesario.
notion image
Resize and fill
La imagen respetará las dimensiones añadiendo bordes para mantener la proporción y luego redimensionando la imagen si es necesario.
notion image
Just Resize (latent upscale)
imagen se ampliará utilizando la generación de IA para redibujarla a mayor tamaño. Con esta opción, recomendamos utilizar una Denoising Strenght superior a 0,5 para evitar que la imagen quede borrosa
notion image
En lugar de definir el tamaño de la nueva imagen especificando las dimensiones, también puede elegir Redimensionar por y especificar unaescala que se utilizará para ampliar o reducir la imagen
notion image

Sketch

Desde la pestaña Sketch, puedes utilizar un boceto o dibujo para esbozar tu nueva imagen. Aunque un poco simplista, la interfaz de bocetos te permite crear dibujos básicos o dibujar sobre una imagen existente para modificarla.

Dibujar un boceto

Para dibujar un boceto directamente en Automatic1111, empiece con una imagen "vacía" (un cuadrado blanco, por ejemplo, o un cuadrado negro). A continuación, puede dibujar sobre esta imagen con la herramienta lápiz, variando los colores y el grosor si es necesario.
 
 
Una vez que su boceto esté listo, sólo tiene que introducir un mensaje que describa el resultado final esperado y hacer clic en Generate.
notion image
Al igual que con la generación estándar img2img, se puede jugar con el Denoising Strenght para hacer que la IA respete más o menos el boceto inicial. Los demás parámetros de generación también están disponibles y funcionan como se ha explicado anteriormente
Aunque Sketch te permite crear composiciones e imágenes a partir de un boceto, te darás cuenta de que sigue siendo un poco limitado: o bien la Intensidad de eliminación de ruido es baja y la imagen se parecerá mucho (¿demasiado?) al boceto original, o bien aumentas el valor, pero entonces la IA puede tomarse muchas libertades y generar un resultado muy alejado de tu imagen. Si quieres un mayor control, tendrás que utilizar herramientas especiales llamadas Conrolleurs, por ejemplo la famosa ControlNet

Inpaint

Inpainting es las funciones más interesantes de image-to-image - quizás incluso LA función que hace que esta pestaña sea realmente útil
Inpainting consiste en (re)generar una o varias partes de la imagen de origen. Puede utilizarse para rectificar imperfecciones "cubriéndolas" y rehaciendo la zona afectada. También puede utilizarse para añadir elementos a una imagen o adaptarla a sus necesidades específicas.
Es esencialmente lo famoso Relleno Generativo de Photoshop o el nuevo Vary (Región) de Midjourney.

Modificar rápidamente una imagen

Supongamos que acabas de generar esta imagen en formato text-to-image. Te gusta bastante, pero lo que lleva en la mano derecha no parece gran cosa. Afortunadamente, vamos a poder utilizar el Inpainting para sustituirlo por una espada
Imagen de referencia
Imagen de referencia
La máscara de inpainting
La máscara de inpainting
La nueva imagen
La nueva imagen
El método paso a paso para realizar este tipo de cambios :
  1. Haga clic en el botón Enviar a Inpaint debajo de la imagen generada en la pestaña txt2img
  1. Haga clic en el pequeño 🖋️ y cubra el área de la imagen que desea redibujar con una máscara
  1. Indique en el aviso lo que debe generarse en la imagen y haga clic en Generar
Otros ejemplos de Inpainting:
Imagen de referencia
Imagen de referencia
La máscara de inpainting
La máscara de inpainting
La nueva imagen
La nueva imagen
Imagen de referencia
Imagen de referencia
La máscara de inpainting
La máscara de inpainting
La nueva imagen
La nueva imagen

Parámetros de Inpaiting

Además de los parámetros estándar ya explicados, Inpaiting tiene sus propios parámetros que puede utilizar para refinar la generación
notion image
Mask blur
Este es el nivel de desenfoque aplicado a los bordes de la máscara, para evitar bordes afilados alrededor del área modificada. En general, querrá utilizar un valor entre 4 y 8.
Mask mode
Esta opción cambia la forma de seleccionar el contenido a modificar: Stable Diffusion puede generar una zona de la imagen que corresponda a la máscara (Inpaint masked) o, por el contrario, generar todo el resto de la imagen (Inpaint not masked)
Masked content
Esta opción controla cómo se inicializa el contenido de la zona de máscara para la generación:
  • Fill: rellena con una versión extremadamente borrosa de la imagen
  • Original: utilizar la imagen no modificada (equivale a utilizar el clásico img2img en la zona enmascarada)
  • Latent noise: Como Fill pero añadiendo ruido aleatorio de píxeles
  • Latent nothing: Genera un fondo cercano al relleno, sin añadir ruido
A continuación se muestra cómo funciona cada modo de Masked content en la misma selección (es evidente que hay que rediseñar estos brazos):
Fill
Fill
Original
Original
Latent noise
Latent noise
Latent nothing
Latent nothing
Dependiendo de la opción que utilice , ajustar la Denoising Strenght (que se aplica al relleno obtenido): debe ser mayor para el modo Latent noise.
Inpaint area
Este ajuste determina el área de referencia utilizada para generar la nueva imagen.
Con el modo por defecto,Whole Picture, se utiliza toda la imagen como referencia, lo que garantiza una mayor coherencia con la imagen en su conjunto. Este ajuste es adecuado para todos los modos de Masked content
En el modo Only masked sólo se toma como referencia el área enmascarada. Además, esta área se redimensiona según las dimensiones y parámetros especificados en Resize to/by antes de la generación. Esto ofrece la posibilidad de mejorar la resolución del área enmascarada sin alterar las dimensiones de la imagen de origen
Only masked padding
Este ajuste determina el número de píxeles adicionales que se utilizarán como marcador para el modo de área Inpaint area : Only masked : el área enmascarada se ampliará en el número de píxeles elegido para intentar mantener una mayor coherencia con la imagen completa
Esta opción no tiene efecto en el modo Inpaint area : Whole picture.

Inpaint sketch

Inpaint sketch fusiona Inpainting y Sketch: te permite dibujar como si estuvieras en la pestaña sketch, pero regenerando sólo la parte que has dibujado
Todo lo que no está en el diseño permanece intacto.
Imagen de referencia
Imagen de referencia
Dibujar en Inpaint Skecth
Dibujar en Inpaint Skecth
La nueva imagen
La nueva imagen

Inpaint upload

Inpaint upload le permite utilizar una imagen de máscara en lugar de dibujarla en la interfaz.
Esto funciona exactamente de la misma manera que el inpainting estándar excepto que en lugar de dibujar la máscara, se elige una segunda imagen en el área Máscara - y ésta es la imagen que se utilizará como máscara
La imagen de la máscara debe ser en blanco y negro: el negro es la parte que no se modificará, el blanco es la parte que la IA volverá a dibujar. También debes utilizar una imagen con una relación de aspecto similar a la de la imagen de origen.
 

Batch

Esta última pestaña le permite realizar la generación img2img, o Inpainting en serie:
notion image
Para hace Inpainting en serie, debe especificar :
  1. Obligatorio: Un directorio en su ordenador con todas las imágenes de origen.
  1. Opcional: El directorio en el que guardar las imágenes generadas. Si deja este campo en blanco, las imágenes se guardarán en el directorio por defecto (outputs/img2img-images)
  1. Opcional: Un directorio en su ordenador que contenga las imágenes de máscara que se utilizarán para el inpainting. Necesita una imagen de máscara por cada imagen de origen, con el mismo nombre que la imagen de origen. Si deja este campo vacío, será img2img en serie

3️⃣ La pestaña Extras

Esta pestaña podría haberse llamado francamente Upscaling (Aumento de escala), ya que es esencialmente para lo que sirve.
El Upscaling es una técnica que consiste en aumentar la resolución de una imagen mediante algoritmos y IA que no sólo agrandan los píxeles de la imagen sino que además añaden detalle. Y para eso está la pestaña Extra de la interfaz de Automatic1111.
notion image

Upscaling básico

  1. En la pestaña Extra, seleccione Single image
  1. Cargar una imagen en zona Source
  1. Elija una escala de tamaño en Resize by : el tamaño de cada lado se multiplicará por la escala elegida
  1. Elija un upscaler - 1 R-ESRGAN 4x+ es un upscaler genérico de bastante alto rendimiento
  1. Haga clic en Generate para iniciar el upscaling - La imagen redimensionada aparecerá a la derecha.
Nota: Compruebe el resultado en resolución completa para identificar cualquier fallo generado por el upscaler que no sería visible en la versión reducida.

Parámetros del upscaling

Escala y dimensiones

Scale by / Scale to a se utilizan para definir el tamaño de la imagen final
La primera se utiliza para definir una escala (x2, x4, etc.) utilizada para redimensionar la imagen. Por ejemplo, con Resize by 4 una imagen de 1024 x 768 se ampliará a 4096 x 3072 (la altura y la anchura se multiplican por 4)
El segundo se utiliza para definir las dimensiones de los píxeles.
Cuando la opción Crop to fit está marcada en Scale a y la relación de aspecto no coincide con la imagen de origen, sus bordes se recortarán para que coincidan.

Upscalers

Automatic1111 te permite elegir entre varios algoritmos para el escalado.
Lanczos et Nearest son algoritmos matemáticos, sin IA, que dan resultados medios pero son rápidos y predecibles.
Los otros escaladores utilizan IA para crear una versión ampliada de la imagen, y puedes probar diferentes escaladores para ver cómo funcionan
En términos generales R-ESRGAN4x+ es una buena opción por defecto, excepto para las imágenes de anime, dibujos animados y comics, para las que se recomienda utilizar Upscalers específicos como R-ESRGAN 4x+ Anime6B.
Elija siempre un algoritmo en Upscaler 1
Si lo desea, también puede elegir una segunda, como Upscaler 2 se ampliará combinando las dos técnicas - el parámetro Upscaler 2 Visibility define entonces la importancia de la segunda en relación con la primera.

Restauración del rostro

Al escalar, también restaurar las caras.
Puede elegir entre dos opciones: GFPGAN o CodeFormer.
Aumente la Visibility de uno de los dos para activar la corrección. Para CodeFormer, también puede definir la fuerza de la corrección en weight (0: sin efecto / 1: efecto máximo).
No obstante, intente mantener los valores lo más bajos posible para que la estética de la imagen permanezca intacta.
 

4️⃣ La pestaña PNG Info

Varias interfaces para Stable Diffusion, incluida AUTOMATIC1111, añaden los parámetros de generación directamente a los archivos PNG generados, lo que resulta muy útil para recuperar los parámetros.
Si carga una imagen en el área Source, podrá obtener los parámetros directamente en el espacio.
notion image
Y si tu imagen procede de AUTOMATIC1111, los botones Send to a te permiten copiar estos ajustes en un instante en diferentes pestañas.
Se trata de una función especialmente útil si encuentra una imagen en Internet y desea comprobar si los parámetros y los detalles de generación siguen incluidos.
 

5️⃣ La pestaña Checkpoint Merger

AUTOMATIC1111 permite fusionar varios archivos de modelo (checkpoints).
Esta opción se utiliza generalmente para fusionar estilos de diferentes modelos. Sin embargo, el resultado de esta fusión no siempre es óptimo y puede dar lugar a imperfecciones. A menudo serán necesarios varios intentos variando los parámetros para obtener un modelo realmente utilizable.
Desde esta pestaña, puedes combinar hasta tres modelos para diseñar uno nuevo.
notion image
  1. Los modelos principales (A, B y C) son los modelos que usted selecciona de entre los modelos disponibles en su directorio de instalación (/stable-diffusion-webui/models/Stable-diffusion).
    1. El número de modelos que elija y la forma en que se fusionen dependerá del método de interpolación que seleccione.
  1. Interpolation Method : son 3 métodos de interpolación disponibles:
      • No interpolation : sólo se utiliza el modelo A, ideal para una simple conversión de archivos o para cambiar la VAE.
      • Weighted Sum : Combina los modelos A y B utilizando el multiplicador M (definido anteriormente) para el modelo B. La fórmula correspondiente es A * (1 - M) + B * M.
      • Add difference : Este método fusiona tres modelos utilizando el multiplicador M según la fórmula A + (B - C) * M.
  1. Puede generar el archivo en cualquier formato:
      • ckpt: Es el formato histórico de los puntos de control (no recomendado).
      • safetensors: Una innovación de Hugging Face - Este formato es especialmente seguro. A diferencia de los modelos ckpt, un modelo Saferensor no corre el riesgo de ejecutar código malicioso, aunque esté incrustado en el modelo.
  1. Copy config from
    1. Si uno de los modelos que desea fusionar tiene un archivo de configuración, al seleccionar esta opción podrá determinar qué configuración se conservará con el modelo fusionado.
  1. Bake in VAE
    1. Esta opción le permite sustituir su actual descodificador VAE por otro, permitiéndole optar por un descodificador más potente.
Una vez definidos los parámetros, el botón Merge inicia los cálculos de fusión

6️⃣ Pestaña Train

Esta pestaña se utiliza para entrenar modelos, LoRA e Hypernetwork con Automatic1111.
La creación y formación de modelos es un tema amplio y complejo que no trataremos en este manual.
Intentaremos compartir en el blog varios tutoriales sobre la creación de modelos a medida y el ajuste fino, utilizando Automatic1111 u otros métodos.
 

7️⃣ La pestaña Settings

Settings contiene un gran número de parámetros de configuración para la interfaz de Automático y la forma en que utilizará la Stable Diffusion. Algunas opciones sólo se refieren a la pantalla y la interfaz, otras tendrán más influencia en la propia generación de imágenes
Los ajustes están agrupados por funciones o temas, accesibles a través de la columna de la izquierda.
notion image
Estos son los principales parámetros que debes conocer para utilizar Automatic1111.
Cuando cambie uno o varios de estos ajustes, deberá hacer clic en el botón Apply Settings para aplicarlos. Algunos ajustes también requieren reiniciar la interfaz, lo que se hace con el botón Reload UI.

Saving Images/grids

Estos diferentes parámetros le permiten configurar cómo se guardan las imágenes generadas.
Por defecto, Automatic1111 está configurado para guardar imágenes en formato .png con un nombre de archivo que contiene un número único seguido de la semilla de la imagen y el prompt. Puede cambiar este nombre de archivo definiendo su Image filename pattern - En esta página detalladamente los parámetros disponibles

Paths for saving

También puede cambiar la ubicación donde se guardarán automáticamente las imágenes generadas (el Path)
Por defecto, las imágenes se guardarán en diferentes subdirectorios del directorio /outputs de tu instalación, dependiendo de la pestaña utilizada para generar la imagen (txt2img-images, img2img-images, etc.) Eres libre de modificar estos directorios si no te gusta la organización por defecto.

Saving to a directory

Estos parámetros definen si, además de los directorios definidos en Paths for saving, Automatic1111 generará un subdirectorio adicional. Esta opción se utiliza por defecto para crear un directorio con la fecha de generación

Upscaling

simplificar las cosas, la interfaz de Automatic1111 para el upscaling (en la pestaña Extra) no incluye todos los parámetros posibles para los diferentes upscalers ofrecen. Aquí es donde se agrupan estos parámetros avanzados
En principio, puedes mantener la configuración predeterminada; cámbiala sólo si sabes lo que haces o si necesitas o quieres experimentar con sus efectos.

Face restoration

Aquí puede seleccionar el modelo base que se utilizará para la Restauración de caras: utilizaun modelo adicional (CodeFormer o GFPGAN) en la imagen generada para reparar los defectos de las caras.
notion image
CodeFormer y su configuración por defecto (peso 0,5) es un buen punto de partida que debería satisfacerte
Marque la casilla Restore faces para utilizar Restauración de caras al generar imágenes
También puede añadir la casilla de verificación a los parámetros de generación, de modo que pueda elegir cada vez si desea o no utilizar la restauración de caras. Para ello, añada face_restoration a la lista Options in main UI - txt2img de parámetros de User Interface

Cómo funciona Face Restoration

Cuando marca Restore Faces, el modelo se utilizará para mejorar el renderizado de las caras y eliminar los fallos más comunes en las imágenes generadas por Stable Diffusion
Advertencia: Esta opción funciona para imágenes fotorrealistas, pero no se recomienda para dibujos de estilo anime o dibujos animados, ya que tiende a hacer que las caras parezcan un poco retocadas o suavizadas, así que utilízala con moderación y parsimonia
Una imagen generada sin restauración facial
Una imagen generada sin restauración facial
La misma imagen con restauración de caras
La misma imagen con restauración de caras

System

Esta sección agrupa una serie de parámetros relativos a la ejecución de Stable Diffusion en la consola de línea de comandos (también conocida como Terminal).
Una opción interesante es Automatic open webui in browser on startup: abre automáticamente Automatic1111 en tu navegador cuando lo lanzas desde la línea de comandos

API

Automatic1111 puede utilizarse mediante programación a través de una API REST.
Se trata de un uso avanzado que no trataremos aquí.

Training

Esta sección agrupa las opciones relativas al Training para la formación de nuevos modelos y redes complementarias.

Stable Diffusion

Una serie de opciones vinculadas a la utilización de modelos de Stable Diffusion.

Random Number generator source

Este parámetro define cómo seed de partida para las imágenes. La fuente seleccionada cambia radicalmente cómo se generan - usa la CPU para producir la misma imagen con diferentes proveedores de tarjetas de vídeo; usa NV para producir la misma imagen que con una tarjeta de vídeo NVidia

Tiling

La opción Tiling produce una imagen que puede repetirse horizontal y verticalmente, como papel pintado o azulejos
Una imagen generada sin la opción de Tiling
Una imagen generada sin la opción de Tiling
El mismo prompt con la opción Tiling activada
El mismo prompt con la opción Tiling activada
Vista previa de la imagen de fondo
Vista previa de la imagen de fondo
También puede añadir la casilla de verificación a los parámetros de generación, de modo que pueda elegir cada vez si desea o no utilizar tiling. Para ello, añada tiling a la lista Options in main UI - txt2img de parámetros de User Interface

Stable Diffusion XL

Aquí encontrará algunas opciones adicionales específicas de Stable Diffusion XL.

VAE

Una VAE es un tipo de red neuronal diseñada para convertir una imagen RGB convencional en una representación espacio latente, y viceversa. Esta representación de espacio latente es sobre la que opera Stable Diffusion durante la fase de muestreo. En el caso de txt2img, la VAE se utiliza para generar la imagen final una vez finalizado el muestreo. En el caso de img2img, la VAE se encarga del procesamiento de la imagen suministrada por el usuario antes del muestreo, y también produce la imagen final tras el muestreo.
Esta sección de los ajustes define varios parámetros para el uso de VAE's. A priori, querrá dejar la elección de VAE en Automatic - pero algunos checkpointsrecomiendan usar VAE's específicos para obtener los mejores resultados.

img2img

Esta sección permite configurar la generación de img2img así como una serie de elementos de la interfaz, como el color por defecto del lápiz para dibujar bocetos (Sketch initial brush color) o el color de la máscara para la máscara de inpainting (Inpaint mask brush color)

Optimización

Estos parámetros avanzados pueden utilizarse para optimizar la generación de imágenes, en particular ignorando el prompt negativo por los utlimos pasos (steps) de una imagen.

Compatibilidad

Estas opciones están pensadas para usuarios de versiones anteriores de Automatic1111, manteniendo la compatibilidad de los parámetros de la antigua generación.

Interrogar

Aquí encontrará los parámetros de las funciones Interrogate Clip e interrogate Deepbou, que se utilizan para describir las imágenes de origen en img2img.

Redes adicionales

Varios parámetros pueden modificarse para admitir y utilizar modelos y redes complementarios (Hypernetworks, LoRA, etc.)

Interfaz de usuario

Aquí puedes modificar la interfaz para adaptarla a tus necesidades y uso.

Quick settings

Puede elegir uno o varios parámetros para que se muestren en la parte superior, junto al menú de selección de Checkpoint Stable Diffusion. Por ejemplo, a algunos usuarios les gusta añadir el selector VAE.

Paramètres supplémentaires d’Hires Fix

notion image
Estas dos opciones añaden parámetros para la funcionalidad Hires Fix a la pestaña img2img:
notion image
  • Posibilidad de elegir un punto de control y/o un muestreador diferente para la ampliación.
  • Posibilidad de definir un aviso específico (positivo y negativo) para la ampliación.

Parámetros adicionales de generación

Los selectores Options in main UI text2img/img2img se utilizan para añadir opciones de generación para text2img o img2img.
Por ejemplo, puede añadir face_restoration y tiling para añadir casillas de verificación correspondientes a sus parámetros de generación de imágenes.
notion image

Infotexto

Estos parámetros definen qué información se incluirá en el infotexto (también conocido metadatos) y cómo puede leerse y utilizarse
El infotexto se muestra debajo de la imagen generada, pero también se añade a ésta para que pueda leerse y recuperarse en la pestaña Información PNG (o soltando la imagen en el campo de consulta)

Live previews

Aquí puede cambiar la forma en que Automatic1111 muestra el progreso de la generación de imágenes y muestra (o no) una vista previa de la imagen que se está generando.

Sampler parameters

Estos parámetros corresponden a los muestreadores (ssamplers) y su uso en la generación de imágenes

Postprocessing

Mediante estas opciones puede añadir operaciones adicionales que se realizarán en las imágenes generadas.
Hay dos operaciones posibles: l’upscaling y restauración de caras con CodeFormer o GFPGAN.
Tome estas opciones como una forma alternativa de llevar a cabo un Hires Fix o Face Restore.

Canva hotkeys

Los Canvas son las áreas en las que puedes dibujar, como el sketch o el inpaint en img2img.
Los siguientes atajos de teclado están definidos y pueden modificarse:
  • Zoom canvas: Pulse la tecla elegida y mueva el ratón para ampliar la imagen
  • Adjust brush size: Pulsa la tecla de ajuste y mueve el ratón para aumentar o disminuir el grosor de la pincelada
  • Moving the canva: Pulsa la tecla set y move para mover el área Canva en la pantalla
  • Full screen mode : amplía el área Canva la altura de la pantalla
  • eset zoom and canva posistion: devuelve el área Canva a su punto inicial y el zoom a 0

Defaults

Esta página le permite cambiar los valores por defecto utilizados para los parámetros de la interfaz.
Pulse View Changes para ver qué parámetros se han modificado con respecto a los valores predeterminados y, a continuación, pulse Apply para guardarlos en un archivo de configuración que se aplicará una vez reiniciada la interfaz

Cambiar el tamaño predeterminado de la imagen

Por defecto, Automatic1111 utiliza un tamaño de imagen de 512x512, pero si utilizas SDXL, probablemente querrás trabajar con 1024x1024 por defecto. A continuación te explicamos cómo hacerlo:
  1. En la pestaña txt2img, cambia los valores de anchura y altura a 1024px
  1. Vaya a la pestaña Settings y seleccione Defaults
  1. Haga clic en View changes. Deberían aparecer dos líneas indicando el cambio de 512 a 1024 para txt2img/Ancho/valor y txt2img/Alto/valor
  1. Haga clic en Apply
notion image

Sysinfo

Esta página le permite recuperar toda una serie de informaciones sobre su sistema y su instalación Automatic1111.

Actions

Esta página enumera una serie de acciones de mantenimiento que puedes llevar a cabo:
  • Request browser notificationsr: Activa la solicitud de autorización para que Automatic1111 pueda utilizar las notificaciones del navegador, por ejemplo, para avisarle de que se ha completado una generación
  • Download localization template: Permite descargar el archivo de plantilla que se utilizará para crear una traducción de la interfaz
  • Reload custom script bodies (No ui updates, No restart): Recarga datos de script sin reiniciar la UI
  • Unload SD checkpoint to free VRAM: Libera memoria eliminando checkpoints cargado previamente.
  • Reload the last SD checkpoint back into VRAM: Vuelve a cargar en memoria el último checkpoints utilizado

Licencias

Esta página muestra el texto completo de las licencias de las distintas bibliotecas y modelos utilizados por la interfaz Automatic1111.

8️⃣ La pestaña Extensions

Esta pestaña enumera las extensiones instaladas en su interfaz Automatic1111 y le permite añadir otras nuevas. Una serie de extensiones se instalan automáticamente con Automatic1111 (las built-in)
notion image

Instalación de extensiones

Desde el directorio Extensiones

forma más sencilla de instalar una extensión Automatic1111 es ir a la pestaña Disponible y hacer clic en el botón Cargar desde, que cargará la lista de extensiones disponibles
notion image
Para encontrarla más fácilmente, puede utilizar la función de búsqueda de su navegador (Ctrl/Cmd+F para buscar el nombre o una palabra clave)
También puede filtrar la lista mediante etiquetas y utilizar las opciones de clasificación de la parte superior de la lista.
Cuando haya encontrado su extensión, haga clic en el botón Install para instalarla.
Una vez que haya instalado la extensión o extensiones que deseaba, vuelva a la pestaña Install y haga clic en Apply and reload UI para que se tengan en cuenta las extensiones.

Desde una URL

También puede instalar una extensión introduciendo la dirección de su repositorio GIT en línea (dirección de Github o Gitlab) antes de hacer clic en Install.
notion image
Este método es útil cuando conoces la extensión y ya tienes su URL, ya que te ahorra tener que buscar en la (larga) lista de extensiones disponibles en la pestaña Available.

(Des)activación de extensiones

Desde la pestaña Installed también puede activar o desactivar extensiones en su interfaz marcando o desmarcando la casilla situada delante del nombre de la extensión
Utilice el botón Check for update para comprobar si tiene alguna extensión que actualizar.

Pague una vez para acceder de por vida a la generación de imágenes con Stable Diffusion y Diffus

🔥 Lifetime Deal con -60% 🔥

Aproveche la oferta

Written by