Vision Transformer (ViT)
Vision Transformer (ViT) | |
---|---|
Nome Inglese | Vision Transformer |
Sigla | ViT |
Anno Di Creazione | 2021 |
Pubblicazione | An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale |
URL | |
Topic | Visione artificiale |
Archietttura di rete neurale per la visione artificiale, introdotta nel paper An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale by Dosovitskiy et al (Google) nel 2021.
E' un transformer di tipo encoder (BERT-like).
Molto interessanti i fine-tuning su huggingface.