Rete Neurale Residua (ResNet): differenze tra le versioni

Da Wiki AI.
(Creata pagina con "Architettura di rete neurale, originariamente proposta nel [https://arxiv.org/abs/1512.03385 2015] in cui i pesi nei layer imparano una funzione residuale invece che la trasformazione finale. Questo permette ai gradienti di fluire meglio nelle architetture moldot profonde, risolvendo il problema dei gradienti che svaniscono o che esplodono e quindi aumentando l'accuratezza e la probabilità di convergenza del modello. Viene utilizzata per esempio nei transformer....")
 
Nessun oggetto della modifica
Riga 5: Riga 5:
=== Links ===
=== Links ===
[https://arxiv.org/abs/1512.03385 Deep Residual Learning for Image Recognition]
[https://arxiv.org/abs/1512.03385 Deep Residual Learning for Image Recognition]
[[Category:architettura]]

Versione delle 12:29, 1 apr 2024

Architettura di rete neurale, originariamente proposta nel 2015 in cui i pesi nei layer imparano una funzione residuale invece che la trasformazione finale. Questo permette ai gradienti di fluire meglio nelle architetture moldot profonde, risolvendo il problema dei gradienti che svaniscono o che esplodono e quindi aumentando l'accuratezza e la probabilità di convergenza del modello.

Viene utilizzata per esempio nei transformer.

Links

Deep Residual Learning for Image Recognition