InstructGPT: differenze tra le versioni

Versione attuale delle 16:26, 17 ago 2024

InstructGPT
Nome Inglese	InstructGPT
Sigla	InstructGPT
Anno Di Creazione	2022-01-27
Versione Corrente
URL	https://github.com/openai/following-instructions-human-feedback
Pubblicazione	InstructGPT: Training Language Models to Follow Instructions with Human Feedback
URL Pubblicazione	https://arxiv.org/pdf/2203.02155

Modello di OpenAI rilasciato nel 2022 che utilizzando RLHF ottiene voti più elevati con soli 1.3B di parametri rispetto a GPT-3 da 175B di Parametri

@@ Riga 12: / Riga 12: @@
              |title=InstructGPT
              |title_mode=append
-             |keywords="apprendimento automatico, modello linguistico, intelligenza artificiale, elaborazione del linguaggio naturale, PNL, apprendimento per rinforzo, feedback umano, OpenAI, GPT-3"
+             |keywords=apprendimento automatico, modello linguistico, intelligenza artificiale, elaborazione del linguaggio naturale, PNL, apprendimento per rinforzo, feedback umano, OpenAI, GPT-3
-             |description="InstructGPT è un modello di linguaggio di OpenAI rilasciato nel 2022. Con soli 1.3 miliardi di parametri, ottiene risultati migliori di GPT-3 (175B parametri) grazie all'apprendimento per rinforzo da feedback umano (RLHF)."
+             |description=InstructGPT è un modello di linguaggio di OpenAI rilasciato nel 2022. Con soli 1.3 miliardi di parametri, ottiene risultati migliori di GPT-3 (175B parametri) grazie all'apprendimento per rinforzo da feedback umano (RLHF).
              }}