Modello di Diffusione Latente (LDM): differenze tra le versioni
Nessun oggetto della modifica |
Nessun oggetto della modifica |
||
Riga 13: | Riga 13: | ||
Classe di modelli di rete neurale utilizzate per la generazione di immagini e video | Classe di modelli di rete neurale utilizzate per la generazione di immagini e video | ||
== Aggiunta di Rumore Gaussiano ad un'Immagine == | |||
Nel contesto della tua domanda, l'aggiunta di rumore gaussiano ad un'immagine comporta l'introduzione di variazioni casuali nei valori dei pixel di un'immagine, seguendo una distribuzione gaussiana. Questo tipo di rumore viene spesso utilizzato nell'elaborazione delle immagini per simulare condizioni reali o testare l'efficacia degli algoritmi di elaborazione delle immagini. | |||
Il rumore gaussiano è caratterizzato dalla sua funzione di densità di probabilità, che segue una distribuzione gaussiana o normale. In parole semplici, ciò significa che i valori del rumore sono più probabili di raggrupparsi intorno al valore medio, con meno occorrenze di valori estremi più lontani dal valore medio. | |||
Quando si aggiunge rumore gaussiano ad un'immagine in un processo di diffusione, l'intensità di ogni pixel viene modificata aggiungendo un valore casuale campionato da una distribuzione gaussiana. I parametri della distribuzione gaussiana, come media e deviazione standard, determinano le caratteristiche del rumore aggiunto all'immagine. | |||
Il processo di diffusione si riferisce alla propagazione di questo rumore in tutta l'immagine, influenzando l'intensità di ogni pixel in modo casualizzato. Questo processo può essere utilizzato per vari scopi, inclusi le tecniche di denoising delle immagini, dove il rumore viene aggiunto intenzionalmente ad un'immagine per testare l'efficacia degli algoritmi di denoising. | |||
In sintesi, l'aggiunta di rumore gaussiano in un processo di diffusione comporta l'iniezione di variazioni casuali nei valori dei pixel di un'immagine, seguendo una distribuzione gaussiana, per simulare o testare vari aspetti degli algoritmi di elaborazione delle immagini o delle condizioni del mondo reale. | |||
== Esempio Numerico == | |||
Supponiamo di avere un'immagine in scala di grigi rappresentata da una griglia di pixel 3x3 per semplicità. Ogni pixel ha un valore compreso tra 0 e 255, dove 0 rappresenta il nero e 255 il bianco. | |||
Supponiamo inoltre che vogliamo aggiungere rumore gaussiano a questa immagine con una varianza \( \beta \). | |||
Consideriamo un pixel con un valore originale normalizzato di \( x = 0.6 \), e \( \beta = 0.1 \). | |||
=== Media e Varianza della Distribuzione === | |||
La media della distribuzione gaussiana rappresentante il rumore da aggiungere è calcolata come \( x \times \sqrt{1 - \beta} \). Questo valore viene moltiplicato per la radice quadrata di \(1 - \beta\), che rappresenta la quantità di rumore aggiunta al valore originale del pixel. | |||
La varianza della distribuzione gaussiana rappresentante il rumore è determinata dal parametro \( \beta \). | |||
Ora, calcoliamo questi valori: | |||
==== Media della Distribuzione ==== | |||
La media \( \mu \) è \( 0.6 \times \sqrt{1 - 0.1} \approx 0.6 \times \sqrt{0.9} \approx 0.5692 \). | |||
==== Varianza della Distribuzione ==== | |||
Supponiamo \( C = 1 \) per semplicità. | |||
\( \sigma^2 = \beta \times C = 0.1 \times 1 = 0.1 \). | |||
Quindi, in questo esempio, la media della distribuzione gaussiana rappresentante il rumore da aggiungere al pixel è approssimativamente 0.5692, e la varianza della distribuzione è 0.1. | |||
[[File:Diffusion Models.png|miniatura|nessuno|600x600px|Diffusion Models]] | [[File:Diffusion Models.png|miniatura|nessuno|600x600px|Diffusion Models]] |
Versione delle 10:38, 14 apr 2024
Nome: Modello di Diffusione Latente
Nome Inglese: Latent Diffusion Model
Sigla: LDM
Anno Di Creazione: 2021
Pubblicazione: The Theory of Stochastic Processes, with Particular Reference to Applications; Deep Unsupervised Learning using Nonequilibrium Thermodynamics; Diffusion Models Beat GANs on Image Synthesis; Classifier-Free Diffusion Guidance
Classe di modelli di rete neurale utilizzate per la generazione di immagini e video
Aggiunta di Rumore Gaussiano ad un'Immagine
Nel contesto della tua domanda, l'aggiunta di rumore gaussiano ad un'immagine comporta l'introduzione di variazioni casuali nei valori dei pixel di un'immagine, seguendo una distribuzione gaussiana. Questo tipo di rumore viene spesso utilizzato nell'elaborazione delle immagini per simulare condizioni reali o testare l'efficacia degli algoritmi di elaborazione delle immagini.
Il rumore gaussiano è caratterizzato dalla sua funzione di densità di probabilità, che segue una distribuzione gaussiana o normale. In parole semplici, ciò significa che i valori del rumore sono più probabili di raggrupparsi intorno al valore medio, con meno occorrenze di valori estremi più lontani dal valore medio.
Quando si aggiunge rumore gaussiano ad un'immagine in un processo di diffusione, l'intensità di ogni pixel viene modificata aggiungendo un valore casuale campionato da una distribuzione gaussiana. I parametri della distribuzione gaussiana, come media e deviazione standard, determinano le caratteristiche del rumore aggiunto all'immagine.
Il processo di diffusione si riferisce alla propagazione di questo rumore in tutta l'immagine, influenzando l'intensità di ogni pixel in modo casualizzato. Questo processo può essere utilizzato per vari scopi, inclusi le tecniche di denoising delle immagini, dove il rumore viene aggiunto intenzionalmente ad un'immagine per testare l'efficacia degli algoritmi di denoising.
In sintesi, l'aggiunta di rumore gaussiano in un processo di diffusione comporta l'iniezione di variazioni casuali nei valori dei pixel di un'immagine, seguendo una distribuzione gaussiana, per simulare o testare vari aspetti degli algoritmi di elaborazione delle immagini o delle condizioni del mondo reale.
Esempio Numerico
Supponiamo di avere un'immagine in scala di grigi rappresentata da una griglia di pixel 3x3 per semplicità. Ogni pixel ha un valore compreso tra 0 e 255, dove 0 rappresenta il nero e 255 il bianco.
Supponiamo inoltre che vogliamo aggiungere rumore gaussiano a questa immagine con una varianza \( \beta \).
Consideriamo un pixel con un valore originale normalizzato di \( x = 0.6 \), e \( \beta = 0.1 \).
Media e Varianza della Distribuzione
La media della distribuzione gaussiana rappresentante il rumore da aggiungere è calcolata come \( x \times \sqrt{1 - \beta} \). Questo valore viene moltiplicato per la radice quadrata di \(1 - \beta\), che rappresenta la quantità di rumore aggiunta al valore originale del pixel.
La varianza della distribuzione gaussiana rappresentante il rumore è determinata dal parametro \( \beta \).
Ora, calcoliamo questi valori:
Media della Distribuzione
La media \( \mu \) è \( 0.6 \times \sqrt{1 - 0.1} \approx 0.6 \times \sqrt{0.9} \approx 0.5692 \).
Varianza della Distribuzione
Supponiamo \( C = 1 \) per semplicità. \( \sigma^2 = \beta \times C = 0.1 \times 1 = 0.1 \).
Quindi, in questo esempio, la media della distribuzione gaussiana rappresentante il rumore da aggiungere al pixel è approssimativamente 0.5692, e la varianza della distribuzione è 0.1.

Links
On the Theory of Stochastic Processes, with Particular Reference to Applications (1949) Deep Unsupervised Learning using Nonequilibrium Thermodynamics (2015) Diffusion Models Beat GANs on Image Synthesis (2021) Classifier-Free Diffusion Guidance (2022)