Pagina principale: differenze tra le versioni
Riga 88: | Riga 88: | ||
== Concetti == | == Concetti == | ||
=== Matematica === | |||
* [[Funzione Obiettivo (loss)]] | |||
=== Apprendimento === | === Apprendimento === | ||
* [[Few-shot learning]] | * [[Few-shot learning]] | ||
* [[Function Calling]] | * [[Function Calling]] | ||
* [[Fine-tuning]] | * [[Fine-tuning]] |
Versione delle 07:31, 5 mar 2024
Aiuto
- Linee Guida della Wiki AI Lab
- Guida utente: Una risorsa completa per i nuovi utenti di MediaWiki.
- Aiuto:Categorie_di_Wiki_AI_Lab: Guida alle categorie specifiche del Wiki AI Lab.
Architetture
Nome | Descrizione |
---|---|
Recurrent Neural Network (RNN) | Rete neurale ricorrente |
LSTM | Long Short-Term Memory, una forma di rete neurale ricorrente |
Generative Adversarial Networks (GAN) | Reti che imparano a generare nuovi dati simili a quelli su cui sono addestrate |
AutoEncoder (AE) | |
Variational AutoEncoder (RAE) | |
Reinforcement Learning From Human Feedback (RLHF) |
Modelli
Linguaggio Naturale
- GPT-4: La quarta generazione del modello di linguaggio GPT.
- GPT-3.5 Turbo: Predecessore di GPT-4, ancora ampiamente utilizzato.
- GPT-3.5 Turbo vs. GPT-4: Modelli a confronto.
- Mistral: Modello per la generazione di testo.
- Llama: LLM di Meta
- PaLM: LLM di Google
- Bard AI: Nome precedente dell'AI di Google, rinominata in Gemini nel Febbraio 2024
- Alpaca
Function Calling
Generazione Immagini
- Dall-e: Modello di OpenAI per la creazione di immagini.
- Midjourney: Principale competitor di Dall-e nella generazione di immagini
- Stable Diffusion: Generatore di immagini sviluppato da Stability AI
- Zero 1-to-3: Generazione immagini 3D da 1D
Generazione Video
- Sora: Modello OpenAI per la creazione di contenuti video.
Generazione Audio
- Magenta: Progetto di Google che mira a utilizzare l'apprendimento automatico per creare arte e musica.
Progetti
Nome | Descrizione |
---|---|
Magenta (Google) | Progetto di ricerca di Google su arte e musica tramite IA |
IKEVA-HAI (IULM AI Lab) |
Paper
NLP (Natural Language Processing)
- Language Models are Few-Shot Learners (2020)
- A Theory for Emergence of Complex Skills in Language Models (2023): Teorie sull'emergere di competenze complesse nei modelli di linguaggio.
- Why think step by step? Reasoning emerges from the locality of experience (2023)
- Functional Benchmarks for Robust Evaluation of Reasoning Performance, and the Reasoning Gap (29/02/2024)
Musica
MIDI
- DeepJ: Style-Specific Music Generation (2018)
- Automatic Stylistic Composition of Bach Chorales With Deep LSTM (2017)
- Harmonizing Music the Boltzmann Way (1994)
Text-to-Image
Universal Prompt Optimizer
- Universal Prompt Optimizer for Safe Text-to-Image Generation (2024): Ottimizzazione per la generazione sicura di immagini.
Dall-e
- Zero-Shot Text-to-Image Generation (2021): Generazione di immagini da testo senza esempi.
- Hierarchical text-conditional image generation with CLIP latents (2022): Seconda iterazione del modello di Dall-e
- Improving Image Generation with Better Captions (2023): Terza iterazione del modello Dall-e per la generazione di immagini.
Concetti
Matematica
Apprendimento
Esecuzione e Inferenza
- Quantizzazione: Riduzione della precisione dei numeri per accelerare l'esecuzione dei modelli.
- Metodi di Decoding: Tecniche per generare output dai modelli di linguaggio.
Benchmarking
Ragionamento negli LLM (Large Language Models)
Dataset
- Datasets for Large Language Models: A Comprehensive Survey
- Lakh MIDI Dataset: Dataset di file MIDI per la ricerca musicale.
Benchmarks
Modelli di Linguaggio
Benchmark Aggregati
Capacità di Ragionamento
- HellaSwag
- DROP
- WinoGrande - Sakaguchi et al., 2021
- Arc C
- PIQA - Bisk et al., 2020
- SIQA - Sap et al., 2019
- CommonsenseQA - Talmor et al., 2018
Conoscenza
- NaturalQuestions - Kwiatkowski et al.,2019
- TriviaQA - Joshi et al., 2017
Codice
Comprensione del Testo
Matematica
Embeddings
- MIRACL
- MTEB