LAION-5B: An open large-scale dataset for training next generation image-text models

Da Wiki AI.
LAION-5B: An open large-scale dataset for training next generation image-text models
Data 2022
Autori Christoph Schuhmann et al.
URL https://www.semanticscholar.org/paper/e5c8960eb2ec034ffbd353ef39fd1cb541d3c7c9
Topic Computer Vision
Citazioni 2051


LAION-5B è un set di dati su larga scala, composto da 5,85 miliardi di coppie immagine-testo filtrate da CLIP, di cui 2,32 miliardi contengono la lingua inglese. Questo dataset è stato creato per la formazione di modelli multimodali di nuova generazione, come CLIP, DALL-E, ALIGN, BASIC, GLIDE, Flamingo e Imagen. LAION-5B è stato utilizzato con successo per replicare e perfezionare modelli fondamentali come CLIP, GLIDE e Stable Diffusion.