InstructGPT: differenze tra le versioni
(Creata pagina con "Categoria:Modello") |
Nessun oggetto della modifica |
||
| (3 versioni intermedie di 2 utenti non mostrate) | |||
| Riga 1: | Riga 1: | ||
{{Template modello | |||
|NomeInglese=InstructGPT | |||
|Sigla=InstructGPT | |||
|AnnoDiCreazione=2022-01-27 | |||
|URL=https://github.com/openai/following-instructions-human-feedback | |||
|Pubblicazione=InstructGPT: Training Language Models to Follow Instructions with Human Feedback | |||
|URLPubblicazione=https://arxiv.org/pdf/2203.02155 | |||
}}Modello di [[OpenAI]] rilasciato nel 2022 che utilizzando [[Apprendimento per rinforzo da feedback umano|RLHF]] ottiene voti più elevati con soli 1.3B di parametri rispetto a [[GPT-3]] da 175B di Parametri | |||
[[Categoria:Modello]] | [[Categoria:Modello]] | ||
{{#seo: | |||
|title=InstructGPT | |||
|title_mode=append | |||
|keywords=apprendimento automatico, modello linguistico, intelligenza artificiale, elaborazione del linguaggio naturale, PNL, apprendimento per rinforzo, feedback umano, OpenAI, GPT-3 | |||
|description=InstructGPT è un modello di linguaggio di OpenAI rilasciato nel 2022. Con soli 1.3 miliardi di parametri, ottiene risultati migliori di GPT-3 (175B parametri) grazie all'apprendimento per rinforzo da feedback umano (RLHF). | |||
}} | |||
Versione attuale delle 16:26, 17 ago 2024
| InstructGPT | |
|---|---|
| Nome Inglese | InstructGPT |
| Sigla | InstructGPT |
| Anno Di Creazione | 2022-01-27 |
| Versione Corrente | |
| URL | https://github.com/openai/following-instructions-human-feedback |
| Pubblicazione | InstructGPT: Training Language Models to Follow Instructions with Human Feedback |
| URL Pubblicazione | https://arxiv.org/pdf/2203.02155 |
Modello di OpenAI rilasciato nel 2022 che utilizzando RLHF ottiene voti più elevati con soli 1.3B di parametri rispetto a GPT-3 da 175B di Parametri