Very deep convolutional networks for large-scale image recognition
Very deep convolutional networks for large-scale image recognition | |
---|---|
Data | 2015 |
Autori | Karen Simonyan, Andrew Zisserman |
URL | https://www.semanticscholar.org/paper/eb42cf88027de515750f230b23b1a057dc782108 |
Topic | Architettura della rete neurale profonda |
Citazioni | 91784 |
In questo lavoro si indaga l'effetto della profondità della rete convoluzionale sulla sua accuratezza nell'impostazione del riconoscimento di immagini su larga scala. Il contributo principale è una valutazione approfondita di reti di profondità crescente utilizzando un'architettura con filtri di convoluzione molto piccoli (3x3), che mostra che un miglioramento significativo rispetto alle configurazioni precedenti può essere ottenuto spingendo la profondità a 16-19 strati di peso. Queste scoperte sono state alla base della partecipazione all'ImageNet Challenge 2014, dove il team si è assicurato il primo e il secondo posto rispettivamente nelle classifiche di localizzazione e classificazione. Mostrano inoltre che le loro rappresentazioni si generalizzano bene ad altri set di dati, dove ottengono risultati all'avanguardia. Hanno reso pubblicamente disponibili i loro due modelli ConvNet più performanti per facilitare ulteriori ricerche sull'uso di rappresentazioni visive profonde nella visione artificiale.