LAION-5B: An open large-scale dataset for training next generation image-text models

LAION-5B: An open large-scale dataset for training next generation image-text models
Data	2022
Autori	Christoph Schuhmann et al.
URL	https://www.semanticscholar.org/paper/e5c8960eb2ec034ffbd353ef39fd1cb541d3c7c9
Topic	Computer Vision
Citazioni	2051

LAION-5B è un set di dati su larga scala, composto da 5,85 miliardi di coppie immagine-testo filtrate da CLIP, di cui 2,32 miliardi contengono la lingua inglese. Questo dataset è stato creato per la formazione di modelli multimodali di nuova generazione, come CLIP, DALL-E, ALIGN, BASIC, GLIDE, Flamingo e Imagen. LAION-5B è stato utilizzato con successo per replicare e perfezionare modelli fondamentali come CLIP, GLIDE e Stable Diffusion.