Emergent Abilities of Large Language Models: differenze tra le versioni

Da Wiki AI.
Nessun oggetto della modifica
Nessun oggetto della modifica
 
Riga 7: Riga 7:
}}
}}


Questo articolo discute le capacità emergenti dei modelli linguistici di grandi dimensioni. Un'abilità è considerata emergente se non è presente in modelli più piccoli ma è presente in modelli più grandi. Pertanto, le capacità emergenti non possono essere previste semplicemente estrapolando le prestazioni di modelli più piccoli. L'esistenza di tale emergenza implica che un ulteriore aumento di scala potrebbe espandere ulteriormente la gamma di capacità dei modelli linguistici.
Questo articolo discute le [[Capacità Emergenti|capacità emergenti]] dei modelli linguistici di grandi dimensioni. Un'abilità è considerata emergente se non è presente in modelli più piccoli ma è presente in modelli più grandi. Pertanto, le capacità emergenti non possono essere previste semplicemente estrapolando le prestazioni di modelli più piccoli. L'esistenza di tale emergenza implica che un ulteriore aumento di scala potrebbe espandere ulteriormente la gamma di capacità dei modelli linguistici.


{{#seo:
{{#seo:

Versione attuale delle 12:06, 8 feb 2025

Emergent Abilities of Large Language Models
Data 2023
Autori Jason Wei, Yi Tay, Rishi Bommasani, Colin Raffel, Barret Zoph, Sebastian Borgeaud, Dani Yogatama, Maarten Bosma, Denny Zhou, Donald Metzler, Ed H. Chi, Tatsunori Hashimoto, O. Vinyals, P. Liang, J. Dean, W. Fedus
URL https://www.semanticscholar.org/paper/dac3a172b504f4e33c029655e9befb3386e5f63a
Topic Large Language Models
Citazioni 1936


Questo articolo discute le capacità emergenti dei modelli linguistici di grandi dimensioni. Un'abilità è considerata emergente se non è presente in modelli più piccoli ma è presente in modelli più grandi. Pertanto, le capacità emergenti non possono essere previste semplicemente estrapolando le prestazioni di modelli più piccoli. L'esistenza di tale emergenza implica che un ulteriore aumento di scala potrebbe espandere ulteriormente la gamma di capacità dei modelli linguistici.