Rete Neurale Residua (ResNet)

Da Wiki AI.
Versione del 1 apr 2024 alle 12:28 di Alesaccoia (discussione | contributi) (Creata pagina con "Architettura di rete neurale, originariamente proposta nel [https://arxiv.org/abs/1512.03385 2015] in cui i pesi nei layer imparano una funzione residuale invece che la trasformazione finale. Questo permette ai gradienti di fluire meglio nelle architetture moldot profonde, risolvendo il problema dei gradienti che svaniscono o che esplodono e quindi aumentando l'accuratezza e la probabilità di convergenza del modello. Viene utilizzata per esempio nei transformer....")
(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)

Architettura di rete neurale, originariamente proposta nel 2015 in cui i pesi nei layer imparano una funzione residuale invece che la trasformazione finale. Questo permette ai gradienti di fluire meglio nelle architetture moldot profonde, risolvendo il problema dei gradienti che svaniscono o che esplodono e quindi aumentando l'accuratezza e la probabilità di convergenza del modello.

Viene utilizzata per esempio nei transformer.

Links

Deep Residual Learning for Image Recognition