O1: differenze tra le versioni
(Creata pagina con "Modello linguistico di grandi dimensioni introdotto da OpenAI a fine 2024. Utiliza il Reinforcement Learning nella fase di training, e Chain of Thought durante l'inferenza, ponendosi all'apice di numerosi benchmark. == Collegamenti == https://openai.com/index/learning-to-reason-with-llms/ https://arxiv.org/pdf/2412.14135 Categoria:Modello") |
Nessun oggetto della modifica |
||
Riga 4: | Riga 4: | ||
== Collegamenti == | == Collegamenti == | ||
[https://cdn.openai.com/o1-system-card.pdf Official System Card] | |||
https://openai.com/index/learning-to-reason-with-llms/ | https://openai.com/index/learning-to-reason-with-llms/ | ||
https://arxiv.org/pdf/2412.14135 | https://arxiv.org/pdf/2412.14135 | ||
[[Categoria:Modello]] | [[Categoria:Modello]] |
Versione attuale delle 07:39, 4 gen 2025
Modello linguistico di grandi dimensioni introdotto da OpenAI a fine 2024.
Utiliza il Reinforcement Learning nella fase di training, e Chain of Thought durante l'inferenza, ponendosi all'apice di numerosi benchmark.