InstructGPT: differenze tra le versioni

Da Wiki AI.
(Creata pagina con "Categoria:Modello")
 
Nessun oggetto della modifica
 
(3 versioni intermedie di 2 utenti non mostrate)
Riga 1: Riga 1:
{{Template modello
|NomeInglese=InstructGPT
|Sigla=InstructGPT
|AnnoDiCreazione=2022-01-27
|URL=https://github.com/openai/following-instructions-human-feedback
|Pubblicazione=InstructGPT: Training Language Models to Follow Instructions with Human Feedback
|URLPubblicazione=https://arxiv.org/pdf/2203.02155
}}Modello di [[OpenAI]] rilasciato nel 2022 che utilizzando [[Apprendimento per rinforzo da feedback umano|RLHF]] ottiene voti più elevati con soli 1.3B di parametri rispetto a [[GPT-3]] da 175B di Parametri
[[Categoria:Modello]]
[[Categoria:Modello]]
{{#seo:
            |title=InstructGPT
            |title_mode=append
            |keywords=apprendimento automatico, modello linguistico, intelligenza artificiale, elaborazione del linguaggio naturale, PNL, apprendimento per rinforzo, feedback umano, OpenAI, GPT-3
            |description=InstructGPT è un modello di linguaggio di OpenAI rilasciato nel 2022. Con soli 1.3 miliardi di parametri, ottiene risultati migliori di GPT-3 (175B parametri) grazie all'apprendimento per rinforzo da feedback umano (RLHF).
           
            }}

Versione attuale delle 16:26, 17 ago 2024

InstructGPT
Nome Inglese InstructGPT
Sigla InstructGPT
Anno Di Creazione 2022-01-27
Versione Corrente
URL https://github.com/openai/following-instructions-human-feedback
Pubblicazione InstructGPT: Training Language Models to Follow Instructions with Human Feedback
URL Pubblicazione https://arxiv.org/pdf/2203.02155

Modello di OpenAI rilasciato nel 2022 che utilizzando RLHF ottiene voti più elevati con soli 1.3B di parametri rispetto a GPT-3 da 175B di Parametri