InstructGPT: differenze tra le versioni
Nessun oggetto della modifica |
Nessun oggetto della modifica |
||
Riga 12: | Riga 12: | ||
|title=InstructGPT | |title=InstructGPT | ||
|title_mode=append | |title_mode=append | ||
|keywords= | |keywords=apprendimento automatico, modello linguistico, intelligenza artificiale, elaborazione del linguaggio naturale, PNL, apprendimento per rinforzo, feedback umano, OpenAI, GPT-3 | ||
|description= | |description=InstructGPT è un modello di linguaggio di OpenAI rilasciato nel 2022. Con soli 1.3 miliardi di parametri, ottiene risultati migliori di GPT-3 (175B parametri) grazie all'apprendimento per rinforzo da feedback umano (RLHF). | ||
}} | }} |
Versione attuale delle 16:26, 17 ago 2024
InstructGPT | |
---|---|
Nome Inglese | InstructGPT |
Sigla | InstructGPT |
Anno Di Creazione | 2022-01-27 |
Versione Corrente | |
URL | https://github.com/openai/following-instructions-human-feedback |
Pubblicazione | InstructGPT: Training Language Models to Follow Instructions with Human Feedback |
URL Pubblicazione | https://arxiv.org/pdf/2203.02155 |
Modello di OpenAI rilasciato nel 2022 che utilizzando RLHF ottiene voti più elevati con soli 1.3B di parametri rispetto a GPT-3 da 175B di Parametri