Img2img

Da Wiki AI.

Img2img è uno strumento in Stable Diffusion che genera nuove immagini a partire da un’immagine di input e un prompt di testo corrispondente. L’immagine di output conserva il colore originale e la composizione dell’immagine di input. Questo strumento può trasformare i disegni più semplici in capolavori visivamente sorprendenti.

Overview dell'interfaccia

  • Sketch: è un’opzione che permette di disegnare direttamente sul canvas dell’interfaccia utente. Questo può essere particolarmente utile quando si utilizza la funzione img2img, poiché consente di creare un’immagine di input personalizzata per la generazione dell’immagine. Si può caricare un’immagine di sfondo sul canvas e poi utilizzare lo strumento "Sketch" per disegnare o aggiungere dettagli.
  • Inpaint: è una funzione che consente di correggere piccoli difetti in un’immagine. Questo processo, implica l’uso di un modello di diffusione per rigenerare parti specifiche dell’immagine. Utilizzando lo strumento “pennello” si crea una maschera sull’area che si desidera rigenerare. Questa funzione può essere particolarmente utile per correggere specifiche aree senza dover rigenerare l’intera immagine.
  • Inpaintsketch: è una funzione che combina le funzionalità di “Sketch” e “Inpaint”. Permette di disegnare o schizzare direttamente sull’immagine di input e poi utilizzare la funzione “Inpaint” per rigenerare le parti dell’immagine che sono state modificate dallo schizzo. Per esempio, può servire quando si desidera fare piccole modifiche a un’immagine esistente senza dover rigenerarla.
  • Inpaint upload: è una funzione che permette di caricare una maschera di "inpainting" personalizzata, piuttosto che disegnarla direttamente nell’interfaccia utente. Questa può essere utile per creare una maschera più complessa o dettagliata per l’inpainting. Dopo aver caricato la maschera, Stable Diffusion la utilizzerà per determinare quali parti dell’immagine rigenerare.
  • Batch: è una funzione che permette di processare più immagini contemporaneamente. Può essere d'aiuto quando si desidera applicare la stessa operazione, come img2img, a un intero set di immagini.
  • Copy image to: Questa opzione permette di scegliere dove si desidera copiare l'immagine processata tra le diverse funzioni disponibili.
  • Soft inpainting: è una funzione che consente di rigenerare parti di un’immagine in modo più fluido e naturale. A differenza dell’inpainting standard, che utilizza una maschera binaria per determinare quali parti dell’immagine rigenerare, Soft Inpainting utilizza una maschera in scala di grigi per creare una transizione più morbida tra le aree rigenerate e il resto dell’immagine. Questo può portare a risultati più naturali, soprattutto quando si rigenerano aree complesse o dettagliate.
  • Resize mode
    • Just resize: Cambia solo le dimensioni dell'immagine senza modificarne le proporzioni.
    • Crop and resize: Ritaglia e cambia le dimensioni dell'immagine per adattarla a specifiche proporzioni.
    • Resize and fill: Cambia le dimensioni dell'immagine e riempie lo spazio aggiuntivo per mantenere le proporzioni originali.
    • Just resize (latent upscale): Modifica le dimensioni dell'immagine utilizzando una tecnica di upscaling che mantiene la qualità dell'immagine originale.

Funzionalità aggiuntive

Inpaint masked: Questa opzione significa che la funzione lavorerà per riempire o “dipingere” le aree mascherate dell’immagine. In altre parole, le aree mascherate dell’immagine saranno sostituite con nuovi pixel generati dall’algoritmo di inpainting. Inpaint not masked: Questa opzione indica che la funzione lavorerà sulle aree non mascherate, lasciando intatte le parti mascherate. Quindi, solo i pixel non mascherati dell’immagine saranno modificati dall’algoritmo di inpainting.

Sperimentazioni

Img2img

In questo caso, bisognerà inserire un'immagine all'interno dell'interfaccia. In seguito, si inserirà un prompt per determinare in che modo si vuole modificare l'immagine originale. In più, si possono cambiare i parametri che ritroviamo anche nella dashboard di Txt2img (Stable Diffusion). Sotto l'immagine che verrà generata apparirà un riassunto dei valori dei parametri inseriti.

Prompt: Robotic cat made of Glass

Sketch

In questo esperimento gli occhi del gatto sono stati colorati di azzurro per far comprendere al modello che l'immagine richiesta dovrà presentare non solo un gatto robotico di vetro, ma anche degli occhi luminosi con quel determinato colore.

Prompt: Robotic cat made of Glass

Inpaint

In questo caso, l'immagine originale viene rigenerata soltanto con le aree che si vogliono modificare/correggere. Inoltre, sarà necessario comporre un prompt con il risultato desiderato.

Prompt: Cat ears made of metal

Inpaint sketch

Questa funzione è servita per modificare il risultato generato dalla funzione "Inpaint". In questo caso, è stata disegnata sopra l'immagine una sciarpa rossa che dovrà fondersi al risultato precedente.

prompt: Red scarf