Contributi di 193.206.116.167
Per 193.206.116.167 discussione blocchi registri
28 feb 2024
- 15:5315:53, 28 feb 2024 diff cron −4 A Theory for Emergence of Complex Skills in Language Models (2023) →Legge di Scaling Etichetta: Ripristino manuale
- 15:5215:52, 28 feb 2024 diff cron +4 A Theory for Emergence of Complex Skills in Language Models (2023) →Legge di Scaling
- 15:4915:49, 28 feb 2024 diff cron 0 A Theory for Emergence of Complex Skills in Language Models (2023) →Conclusioni
- 15:4915:49, 28 feb 2024 diff cron +1 323 A Theory for Emergence of Complex Skills in Language Models (2023) Nessun oggetto della modifica
- 15:4315:43, 28 feb 2024 diff cron +1 858 A Theory for Emergence of Complex Skills in Language Models (2023) Nessun oggetto della modifica
- 15:4115:41, 28 feb 2024 diff cron +1 743 N A Theory for Emergence of Complex Skills in Language Models (2023) Creata pagina con "Il paper, pubblicato il 29 luglio 2023, spiega che quando i modelli linguistici diventano più grandi e vengono addestrati su insiemi di dati più grandi, mostrano nuovi comportamenti interessanti. Questo è ciò che intendiamo per '''“Emergenza”'''. Due forme avanzate di emergenza sono l'apprendimento in contesto e l'apprendimento zero-shot. In queste situazioni, il modello può capire le istruzioni di un compito fornite come parte del testo di input e risolvere il..."
- 15:3315:33, 28 feb 2024 diff cron +73 Pagina principale →NLP
- 15:2515:25, 28 feb 2024 diff cron −1 Pagina principale →Modelli di Linguaggio
- 15:2215:22, 28 feb 2024 diff cron +67 Pagina principale →Benchmarking
- 15:2115:21, 28 feb 2024 diff cron −70 Pagina principale →Creazione e Valutazione di Benchmark IA: Processo e Principi
- 15:2115:21, 28 feb 2024 diff cron +71 Pagina principale →Benchmarks
- 14:5514:55, 28 feb 2024 diff cron +6 HellaSwag →Intro
- 14:5314:53, 28 feb 2024 diff cron −43 Mistral Nessun oggetto della modifica
- 14:5114:51, 28 feb 2024 diff cron +54 Discrete Reasoning Over Paragraphs (DROP) →Link
- 14:5014:50, 28 feb 2024 diff cron +5 Discrete Reasoning Over Paragraphs (DROP) →Intro
- 14:5014:50, 28 feb 2024 diff cron +6 MMLU →Intro
- 14:4914:49, 28 feb 2024 diff cron −12 AI2 Reasoning Challenge (Arc C) →Intro
- 14:4914:49, 28 feb 2024 diff cron +6 AI2 Reasoning Challenge (Arc C) →Intro
- 14:4914:49, 28 feb 2024 diff cron +225 AI2 Reasoning Challenge (Arc C) →Intro
- 14:4414:44, 28 feb 2024 diff cron +7 Adversarial Filtering (AF) Nessun oggetto della modifica
- 14:4314:43, 28 feb 2024 diff cron +2 617 N Adversarial Filtering (AF) Creata pagina con "L'Adversarial Filtering (AF) è una tecnica utilizzata per selezionare o generare dati per set di addestramento e test in modo che sfidino specificamente le capacità dei modelli di intelligenza artificiale (IA). Questo metodo è particolarmente utile per creare compiti di benchmark che testano capacità complesse come il ragionamento di senso comune, la comprensione del linguaggio naturale, e altre forme di intelligenza cognitiva che i modelli di IA trovano difficili...."
- 14:3314:33, 28 feb 2024 diff cron −21 Discrete Reasoning Over Paragraphs (DROP) →Introduzione
- 14:3114:31, 28 feb 2024 diff cron −34 MMLU →Intro
- 14:3014:30, 28 feb 2024 diff cron +99 AI2 Reasoning Challenge (Arc C) →Link
- 14:2914:29, 28 feb 2024 diff cron +2 AI2 Reasoning Challenge (Arc C) →Esempi
- 14:2914:29, 28 feb 2024 diff cron +313 AI2 Reasoning Challenge (Arc C) →Esempi
- 14:2514:25, 28 feb 2024 diff cron −263 AI2 Reasoning Challenge (Arc C) →Esempi
- 14:0714:07, 28 feb 2024 diff cron 0 HellaSwag →Esempi
- 14:0514:05, 28 feb 2024 diff cron +4 HellaSwag →Esempi
- 14:0514:05, 28 feb 2024 diff cron +25 HellaSwag →Esempi
- 14:0414:04, 28 feb 2024 diff cron +15 HellaSwag →Esempi
- 14:0414:04, 28 feb 2024 diff cron +2 HellaSwag →Link
- 14:0314:03, 28 feb 2024 diff cron +95 HellaSwag →Link
- 14:0214:02, 28 feb 2024 diff cron −3 HellaSwag →Esempi
- 14:0214:02, 28 feb 2024 diff cron +6 HellaSwag →Esempi
- 14:0114:01, 28 feb 2024 diff cron −1 HellaSwag →Esempi Etichetta: Ripristino manuale
- 14:0114:01, 28 feb 2024 diff cron +1 HellaSwag →Esempi
- 14:0114:01, 28 feb 2024 diff cron −8 HellaSwag →Esempi
- 13:5913:59, 28 feb 2024 diff cron +3 HellaSwag →Esempi
- 13:5913:59, 28 feb 2024 diff cron −7 HellaSwag →Esempi
- 13:5813:58, 28 feb 2024 diff cron −1 HellaSwag →Esempi
- 13:5813:58, 28 feb 2024 diff cron +12 HellaSwag →Esempi
- 13:5713:57, 28 feb 2024 diff cron +4 HellaSwag →Esempi
- 13:5613:56, 28 feb 2024 diff cron −8 HellaSwag →Esempi
- 13:5613:56, 28 feb 2024 diff cron +24 HellaSwag →Esempi
- 13:5513:55, 28 feb 2024 diff cron +5 HellaSwag →Esempi
- 13:5513:55, 28 feb 2024 diff cron +1 HellaSwag →Esempi
- 13:5413:54, 28 feb 2024 diff cron −2 HellaSwag →Esempi
- 13:5413:54, 28 feb 2024 diff cron +2 HellaSwag →Esempi
- 13:5413:54, 28 feb 2024 diff cron −301 HellaSwag →Esempi