Rete Neurale Residua (ResNet): differenze tra le versioni
(Creata pagina con "Architettura di rete neurale, originariamente proposta nel [https://arxiv.org/abs/1512.03385 2015] in cui i pesi nei layer imparano una funzione residuale invece che la trasformazione finale. Questo permette ai gradienti di fluire meglio nelle architetture moldot profonde, risolvendo il problema dei gradienti che svaniscono o che esplodono e quindi aumentando l'accuratezza e la probabilità di convergenza del modello. Viene utilizzata per esempio nei transformer....") |
Nessun oggetto della modifica |
||
Riga 5: | Riga 5: | ||
=== Links === | === Links === | ||
[https://arxiv.org/abs/1512.03385 Deep Residual Learning for Image Recognition] | [https://arxiv.org/abs/1512.03385 Deep Residual Learning for Image Recognition] | ||
[[Category:architettura]] |
Versione delle 12:29, 1 apr 2024
Architettura di rete neurale, originariamente proposta nel 2015 in cui i pesi nei layer imparano una funzione residuale invece che la trasformazione finale. Questo permette ai gradienti di fluire meglio nelle architetture moldot profonde, risolvendo il problema dei gradienti che svaniscono o che esplodono e quindi aumentando l'accuratezza e la probabilità di convergenza del modello.
Viene utilizzata per esempio nei transformer.