LAION-5B: An open large-scale dataset for training next generation image-text models
LAION-5B: An open large-scale dataset for training next generation image-text models | |
---|---|
Data | 2022 |
Autori | Christoph Schuhmann et al. |
URL | https://www.semanticscholar.org/paper/e5c8960eb2ec034ffbd353ef39fd1cb541d3c7c9 |
Topic | Computer Vision |
Citazioni | 2051 |
LAION-5B è un set di dati su larga scala, composto da 5,85 miliardi di coppie immagine-testo filtrate da CLIP, di cui 2,32 miliardi contengono la lingua inglese. Questo dataset è stato creato per la formazione di modelli multimodali di nuova generazione, come CLIP, DALL-E, ALIGN, BASIC, GLIDE, Flamingo e Imagen. LAION-5B è stato utilizzato con successo per replicare e perfezionare modelli fondamentali come CLIP, GLIDE e Stable Diffusion.