O1: differenze tra le versioni

Da Wiki AI.
(Creata pagina con "Modello linguistico di grandi dimensioni introdotto da OpenAI a fine 2024. Utiliza il Reinforcement Learning nella fase di training, e Chain of Thought durante l'inferenza, ponendosi all'apice di numerosi benchmark. == Collegamenti == https://openai.com/index/learning-to-reason-with-llms/ https://arxiv.org/pdf/2412.14135 Categoria:Modello")
 
Nessun oggetto della modifica
 
Riga 4: Riga 4:


== Collegamenti ==
== Collegamenti ==
[https://cdn.openai.com/o1-system-card.pdf Official System Card]
https://openai.com/index/learning-to-reason-with-llms/
https://openai.com/index/learning-to-reason-with-llms/


https://arxiv.org/pdf/2412.14135
https://arxiv.org/pdf/2412.14135
[[Categoria:Modello]]
[[Categoria:Modello]]

Versione attuale delle 07:39, 4 gen 2025

Modello linguistico di grandi dimensioni introdotto da OpenAI a fine 2024.

Utiliza il Reinforcement Learning nella fase di training, e Chain of Thought durante l'inferenza, ponendosi all'apice di numerosi benchmark.

Collegamenti

Official System Card

https://openai.com/index/learning-to-reason-with-llms/

https://arxiv.org/pdf/2412.14135