Modello di Diffusione Latente (LDM): differenze tra le versioni

Versione delle 10:38, 14 apr 2024

Nome: Modello di Diffusione Latente

Nome Inglese: Latent Diffusion Model

Sigla: LDM

Anno Di Creazione: 2021

Pubblicazione: The Theory of Stochastic Processes, with Particular Reference to Applications; Deep Unsupervised Learning using Nonequilibrium Thermodynamics; Diffusion Models Beat GANs on Image Synthesis; Classifier-Free Diffusion Guidance

Classe di modelli di rete neurale utilizzate per la generazione di immagini e video

Aggiunta di Rumore Gaussiano ad un'Immagine

Nel contesto della tua domanda, l'aggiunta di rumore gaussiano ad un'immagine comporta l'introduzione di variazioni casuali nei valori dei pixel di un'immagine, seguendo una distribuzione gaussiana. Questo tipo di rumore viene spesso utilizzato nell'elaborazione delle immagini per simulare condizioni reali o testare l'efficacia degli algoritmi di elaborazione delle immagini.

Il rumore gaussiano è caratterizzato dalla sua funzione di densità di probabilità, che segue una distribuzione gaussiana o normale. In parole semplici, ciò significa che i valori del rumore sono più probabili di raggrupparsi intorno al valore medio, con meno occorrenze di valori estremi più lontani dal valore medio.

Quando si aggiunge rumore gaussiano ad un'immagine in un processo di diffusione, l'intensità di ogni pixel viene modificata aggiungendo un valore casuale campionato da una distribuzione gaussiana. I parametri della distribuzione gaussiana, come media e deviazione standard, determinano le caratteristiche del rumore aggiunto all'immagine.

Il processo di diffusione si riferisce alla propagazione di questo rumore in tutta l'immagine, influenzando l'intensità di ogni pixel in modo casualizzato. Questo processo può essere utilizzato per vari scopi, inclusi le tecniche di denoising delle immagini, dove il rumore viene aggiunto intenzionalmente ad un'immagine per testare l'efficacia degli algoritmi di denoising.

In sintesi, l'aggiunta di rumore gaussiano in un processo di diffusione comporta l'iniezione di variazioni casuali nei valori dei pixel di un'immagine, seguendo una distribuzione gaussiana, per simulare o testare vari aspetti degli algoritmi di elaborazione delle immagini o delle condizioni del mondo reale.

Esempio Numerico

Supponiamo di avere un'immagine in scala di grigi rappresentata da una griglia di pixel 3x3 per semplicità. Ogni pixel ha un valore compreso tra 0 e 255, dove 0 rappresenta il nero e 255 il bianco.

Supponiamo inoltre che vogliamo aggiungere rumore gaussiano a questa immagine con una varianza \( \beta \).

Consideriamo un pixel con un valore originale normalizzato di \( x = 0.6 \), e \( \beta = 0.1 \).

Media e Varianza della Distribuzione

La media della distribuzione gaussiana rappresentante il rumore da aggiungere è calcolata come \( x \times \sqrt{1 - \beta} \). Questo valore viene moltiplicato per la radice quadrata di \(1 - \beta\), che rappresenta la quantità di rumore aggiunta al valore originale del pixel.

La varianza della distribuzione gaussiana rappresentante il rumore è determinata dal parametro \( \beta \).

Ora, calcoliamo questi valori:

Media della Distribuzione

La media \( \mu \) è \( 0.6 \times \sqrt{1 - 0.1} \approx 0.6 \times \sqrt{0.9} \approx 0.5692 \).

Varianza della Distribuzione

Supponiamo \( C = 1 \) per semplicità. \( \sigma^2 = \beta \times C = 0.1 \times 1 = 0.1 \).

Quindi, in questo esempio, la media della distribuzione gaussiana rappresentante il rumore da aggiungere al pixel è approssimativamente 0.5692, e la varianza della distribuzione è 0.1.

Links

On the Theory of Stochastic Processes, with Particular Reference to Applications (1949) Deep Unsupervised Learning using Nonequilibrium Thermodynamics (2015) Diffusion Models Beat GANs on Image Synthesis (2021) Classifier-Free Diffusion Guidance (2022)