InstructGPT
| InstructGPT | |
|---|---|
| Nome Inglese | InstructGPT |
| Sigla | InstructGPT |
| Anno Di Creazione | 2022-01-27 |
| Versione Corrente | |
| URL | https://github.com/openai/following-instructions-human-feedback |
| Pubblicazione | InstructGPT: Training Language Models to Follow Instructions with Human Feedback |
| URL Pubblicazione | https://arxiv.org/pdf/2203.02155 |
Modello di OpenAI rilasciato nel 2022 che utilizzando RLHF ottiene voti più elevati con soli 1.3B di parametri rispetto a GPT-3 da 175B di Parametri