Emergent Abilities of Large Language Models: differenze tra le versioni
Nessun oggetto della modifica |
Nessun oggetto della modifica |
||
Riga 7: | Riga 7: | ||
}} | }} | ||
Questo articolo discute le capacità emergenti dei modelli linguistici di grandi dimensioni. Un'abilità è considerata emergente se non è presente in modelli più piccoli ma è presente in modelli più grandi. Pertanto, le capacità emergenti non possono essere previste semplicemente estrapolando le prestazioni di modelli più piccoli. L'esistenza di tale emergenza implica che un ulteriore aumento di scala potrebbe espandere ulteriormente la gamma di capacità dei modelli linguistici. | Questo articolo discute le [[Capacità Emergenti|capacità emergenti]] dei modelli linguistici di grandi dimensioni. Un'abilità è considerata emergente se non è presente in modelli più piccoli ma è presente in modelli più grandi. Pertanto, le capacità emergenti non possono essere previste semplicemente estrapolando le prestazioni di modelli più piccoli. L'esistenza di tale emergenza implica che un ulteriore aumento di scala potrebbe espandere ulteriormente la gamma di capacità dei modelli linguistici. | ||
{{#seo: | {{#seo: |
Versione attuale delle 12:06, 8 feb 2025
Emergent Abilities of Large Language Models | |
---|---|
Data | 2023 |
Autori | Jason Wei, Yi Tay, Rishi Bommasani, Colin Raffel, Barret Zoph, Sebastian Borgeaud, Dani Yogatama, Maarten Bosma, Denny Zhou, Donald Metzler, Ed H. Chi, Tatsunori Hashimoto, O. Vinyals, P. Liang, J. Dean, W. Fedus |
URL | https://www.semanticscholar.org/paper/dac3a172b504f4e33c029655e9befb3386e5f63a |
Topic | Large Language Models |
Citazioni | 1936 |
Questo articolo discute le capacità emergenti dei modelli linguistici di grandi dimensioni. Un'abilità è considerata emergente se non è presente in modelli più piccoli ma è presente in modelli più grandi. Pertanto, le capacità emergenti non possono essere previste semplicemente estrapolando le prestazioni di modelli più piccoli. L'esistenza di tale emergenza implica che un ulteriore aumento di scala potrebbe espandere ulteriormente la gamma di capacità dei modelli linguistici.