O1

Da Wiki AI.
Versione del 1 gen 2025 alle 20:59 di Alesaccoia (discussione | contributi) (Creata pagina con "Modello linguistico di grandi dimensioni introdotto da OpenAI a fine 2024. Utiliza il Reinforcement Learning nella fase di training, e Chain of Thought durante l'inferenza, ponendosi all'apice di numerosi benchmark. == Collegamenti == https://openai.com/index/learning-to-reason-with-llms/ https://arxiv.org/pdf/2412.14135 Categoria:Modello")
(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)

Modello linguistico di grandi dimensioni introdotto da OpenAI a fine 2024.

Utiliza il Reinforcement Learning nella fase di training, e Chain of Thought durante l'inferenza, ponendosi all'apice di numerosi benchmark.

Collegamenti

https://openai.com/index/learning-to-reason-with-llms/

https://arxiv.org/pdf/2412.14135